Skip to content

Daily

  • Published on
    2026년의 실시간 음성·영상은 더 이상 'WebRTC를 직접 짠다'의 게임이 아니다. AI 음성 에이전트가 폭발하면서 LiveKit이 사실상 표준 인프라로 올라섰고, Pion은 Go 진영의 핵심 엔진으로 자리잡았다. Daily·100ms·Twilio Video·AWS Chime SDK는 매니지드 진영을 분점하고, Janus·mediasoup·Jitsi는 자가 호스트 SFU의 세 갈래로 굳어졌다. WHIP/WHEP가 RTMP를 대체하는 새 표준이 됐고, Cloudflare Realtime이 엣지에서 WebRTC를 던졌다. OpenAI Realtime API가 WebRTC를 1등 시민으로 받기 시작하면서 음성 에이전트 스택의 그림이 완전히 바뀌었다. 이 글은 인프라 지도·SFU 대 MCU·코덱(Opus/VP8/AV1/H.264)·매니지드 대 자가 호스트·WHIP/WHEP 인제스트·LiveKit Agents로 AI 음성 봇 만들기·Pion으로 SFU 피어 한 조각 짜기까지 — 2026년 5월 기준으로 정리한 결정 프레임워크다.