필사 모드: 스마트 스피커 & 음성 비서 2026 — Apple HomePod + Apple Intelligence Siri / Alexa Plus (Claude) / Google Gemini Live / Sonos Era / KAKAO Mini / NUGU / Clova 심층 가이드
한국어2026년 봄의 스마트 스피커 시장은 5년 만에 가장 큰 변곡점을 지나고 있다. 2020년대 초반의 "스마트 스피커는 끝났다"는 분위기가 거짓말처럼 사라지고, 빅테크 4사 (Apple, Amazon, Google, Sonos)가 모두 자체 LLM을 거실에 밀어 넣는 중이다. Apple Intelligence가 깊어진 Siri는 2026년 봄 iOS 18.4 / homepodOS 18.4와 함께 정식 풀어졌고, Amazon Alexa Plus는 2025년 GA 이후 1년 만에 월 19.99달러 (프라임 회원 월 5달러) 모델로 자리잡았다. Google Assistant는 Nest 디바이스에서 Gemini Live로 강제 교체되는 중이고, Sonos는 2024년의 악명 높은 S2 앱 리디자인 사태에서 겨우 회복했다.
이 글은 2026년 5월 기준 스마트 스피커, 음성 비서, 휴대용 스피커, 헤드폰, 그리고 그 뒤의 오디오 AI 기술 (Lyria 2, AudioSet, RAVE)까지 한 번에 정리한다. 한국과 일본의 로컬 생태계도 빠뜨리지 않는다.
1. 2026년 스마트 스피커 지도 — 미국 빅테크 / 한국 / 일본 / 오디오 3사
스마트 스피커를 한 줄로 묶기 어려운 이유는 카테고리가 네 갈래로 갈렸기 때문이다.
- 미국 빅테크 4사 — Apple HomePod, Amazon Echo / Echo Show, Google Nest, Sonos Era
- 한국 — KAKAO Mini, SK NUGU, KT Genie, NAVER Clova Friends
- 일본 — Sony LF-S50G (단종), JBL Japan, Yamaha MusicCast, Onkyo Smart Speaker
- 오디오 3사 + 빈티지 스타일 — JBL Authentics, Marshall, Pure, Bang & Olufsen
| 축 | 대표 모델 | AI 비서 | 강점 | 약점 |
| --- | --- | --- | --- | --- |
| 미국 빅테크 | HomePod 2, Echo Show 10, Nest Audio, Sonos Era 300 | Siri / Alexa Plus / Gemini Live / Sonos Voice | 생태계 락인 강함 | 한국·일본 로컬 서비스 약함 |
| 한국 | NUGU Candle, KAKAO Mini C, KT Genie One, Clova Friends | NUGU / 헤이카카오 / 지니 / 클로바 | 한국어 NLU, IPTV 통합 | 글로벌 음악 서비스 약함 |
| 일본 | Yamaha MusicCast 50, JBL Link Portable JP | Alexa JP / Google JP | 일본 가전 통합 (라쿠텐 등) | 자체 비서 거의 없음 |
| 오디오 3사 | JBL Authentics 200, Marshall Acton III, Bang & Olufsen Beosound | 멀티 (Alexa + Google) | 사운드 품질 | 가격 |
이 글은 각 카테고리의 대표 제품과 음성 비서를 하나씩 짚어 나간다.
2. Apple HomePod 2 + mini + Apple Intelligence Siri — 2026 봄에 드디어 깊어졌다
Apple의 스마트 스피커는 두 모델뿐이다. HomePod 2세대 (2023년 1월 출시, 299달러) 와 HomePod mini (2020년, 99달러). 2026년 5월 기준 신형은 없고, 대신 소프트웨어가 모든 것을 바꿔 놓았다.
WWDC 2024에서 발표된 Apple Intelligence는 처음에 iOS 18.1 (2024년 10월) 과 18.2 (12월) 로 부분 출시되었고, Siri의 "온디바이스 LLM" 통합은 계속 미뤄지다가 2026년 봄 iOS 18.4 / iPadOS 18.4 / homepodOS 18.4 사이클에서 드디어 풀어졌다. 핵심 변화 세 가지.
- 화면 인식 (Onscreen Awareness) — Siri가 현재 보고 있는 화면의 컨텍스트를 이해한다. 예를 들어 메시지 앱에서 "이 주소 캘린더에 넣어줘"라고 하면 화면의 주소를 자동으로 파싱한다. HomePod에는 화면이 없으므로 이 기능은 iPhone 연동을 통해서만 작동한다.
- 인앱 액션 (In-App Actions) — App Intents 프레임워크를 통해 앱 내부 액션을 Siri가 호출할 수 있다. "Notes에서 어제 회의록 찾아서 슬랙 채널에 보내줘" 같은 다단계 명령이 가능해졌다.
- 개인 컨텍스트 (Personal Context) — Siri가 메일, 메시지, 캘린더, 사진을 모두 인덱싱한 온디바이스 시맨틱 인덱스에서 정보를 끌어온다. "지난번에 엄마가 보내준 항공편 번호 뭐였지?" 같은 질문이 작동한다.
HomePod에서 Apple Intelligence는 iPhone과 페어링된 상태에서 핸드오프 형태로 동작한다. HomePod 자체는 16GB 정도의 RAM과 A8 (mini) / S7 (2세대) 칩으로는 3B 파라미터급 온디바이스 모델조차 못 돌린다. 따라서 거의 모든 LLM 호출은 iPhone Private Cloud Compute 서버로 넘어간다.
| 모델 | 가격 | 칩 | 사운드 | Apple Intelligence |
| --- | --- | --- | --- | --- |
| HomePod 2 (2023) | 299달러 | S7 | 4인치 우퍼 + 5개 빔포밍 트위터 | iPhone 페어링 시 가능 |
| HomePod mini (2020) | 99달러 | S5 | 풀레인지 1개 + 패시브 라디에이터 | 동일 |
루머상 HomePod 3세대 또는 "FaceTime이 가능한 HomePod with display"가 2026년 가을~2027년 봄 사이 발표될 것으로 보이지만, 2026년 5월 시점에서는 공식 발표가 없다.
3. Amazon Alexa Plus (with Claude) — 2025년 GA, 월 19.99달러
Amazon이 2024년 2월에 발표하고 2025년 봄에 GA로 푼 Alexa Plus는 음성 비서 시장의 가장 큰 변화다. 핵심 두 가지.
첫째, 백엔드 LLM이 Claude (Anthropic) 다. Amazon은 2023년 9월과 2024년 3월에 Anthropic에 총 40억 달러를 투자했고, Trainium2 칩 위에서 Claude를 돌리는 형태로 Alexa Plus를 구성했다. 일부 라우팅은 Amazon의 자체 Nova 모델로 분기하지만, 복잡한 reasoning은 Claude로 간다.
둘째, 구독 모델이다. Alexa Plus는 월 19.99달러 (프라임 회원은 월 5달러 또는 일부 시점에서는 무료 혜택 제공). 기존 무료 Alexa는 그대로 남아 있지만, "긴 멀티턴 대화", "스마트 홈 다단계 시퀀스", "이메일 요약" 같은 기능은 Plus 전용이다.
Alexa Plus가 잘 하는 것.
- 다단계 스마트 홈 — "내가 외출 모드 누르면 거실 불 끄고 에어컨 26도로 맞추고 룸바 돌려"를 한 번에 설정한다. 기존 Alexa Routines를 자연어로 만든다.
- 컨텍스트 유지 — "이번 주말 시카고 호텔 추천해줘" → "그중에 풀 있는 데만" → "그중에 200달러 이하만" 같은 다단계 필터링이 가능하다.
- Echo Show의 시각 출력 — 화면이 있는 Echo Show 10 / 15 / 21에서 응답을 카드 형태로 보여준다.
| 모델 | 가격 | 화면 | 주요 용도 |
| --- | --- | --- | --- |
| Echo Dot 5 | 49.99달러 | 없음 | 침실, 기본 |
| Echo Show 8 (3rd gen) | 149.99달러 | 8인치 | 주방, 비디오 통화 |
| Echo Show 10 | 249.99달러 | 10.1인치 회전 | 거실 |
| Echo Show 15 / 21 | 279.99 / 399.99달러 | 15 / 21인치 | 벽걸이 가족 허브 |
Amazon이 안 풀어준 것 한 가지. Claude를 Alexa Plus 백엔드로 쓰면서도, Amazon은 공식 문서에서 "Claude"라는 단어를 거의 쓰지 않는다. "Anthropic 모델을 포함한 여러 모델"이라는 추상적인 표현을 선호한다. 이는 Amazon Nova / Titan과의 정치적 균형 때문으로 보인다.
4. Google Gemini Live — Nest에서 Google Assistant 대체
Google은 2024년 후반부터 "Hey Google" 음성 비서를 Gemini Live로 점진 교체 중이다. 2025년에 픽셀폰과 안드로이드 14+ 디바이스에서 먼저, 2025년 말~2026년 초에 Nest Audio / Nest Mini / Nest Hub Max로 확대되었다.
Gemini Live의 강점은 "정말 자연스럽게 끊지 않고 대화하는" 음성 인터페이스다. 이전 Google Assistant는 한 문장 듣고 답하고 끝났지만, Gemini Live는 사용자가 말하는 중간에 말을 끊고 들어가거나, "잠깐, 다시 말해줄래" 같은 메타 발화를 처리한다.
| 모델 | 가격 | 화면 | 비서 | 강점 |
| --- | --- | --- | --- | --- |
| Nest Mini (2nd gen) | 49달러 | 없음 | Gemini Live | 침실 보조 |
| Nest Audio | 99달러 | 없음 | Gemini Live | 음악 |
| Nest Hub (2nd gen) | 99달러 | 7인치 | Gemini Live | 침대 옆, 수면 트래킹 |
| Nest Hub Max | 229달러 | 10인치 + 카메라 | Gemini Live | 주방, 가족 캘린더 |
문제는 Google이 "Assistant → Gemini Live" 전환을 강제로 밀어붙이면서, 기존 Routine과 일부 Smart Home 디바이스 통합이 깨졌다는 점이다. 2025년 한 해 동안 Nest 커뮤니티 포럼은 "내 라이프엑스 전구가 안 켜진다", "내 Nest Routine이 사라졌다"는 글로 가득했다. 2026년 1월 패치로 대부분 복구되었지만, 사용자 신뢰는 한 번 깨졌다.
5. Sonos Era 300 + S2 앱 + 2024 디자인 사태
Sonos는 2023년 5월 Era 100과 Era 300을 출시했다. Era 300은 449달러로, Dolby Atmos를 지원하는 최초의 무선 스마트 스피커다. 6개의 드라이버 (4개 트위터 + 2개 우퍼) 가 위, 옆, 앞으로 사운드를 쏜다. Apple Music이 2023년 후반에 Dolby Atmos를 Sonos Era 300에서 정식 지원하면서, 이 모델은 "공간 음향 거실 스피커"의 표준이 되었다.
그러나 Sonos는 2024년 5월에 "S2 앱을 완전히 다시 디자인했다"는 발표와 함께 역사상 최악의 소프트웨어 사태를 겪었다. 새 앱은 다음 기능을 통째로 빼먹고 릴리스되었다.
- 음악 재생 큐 편집
- 알람 / 슬립 타이머
- 로컬 라이브러리 인덱싱 (PC에 저장된 FLAC 파일 등)
- 스피커 그룹 저장
- 일부 접근성 기능 (스크린 리더)
2024년 5월부터 12월까지 7개월 동안 Sonos 커뮤니티는 "내 100만 원짜리 스피커가 못 쓰는 물건이 됐다"는 글로 도배되었다. CEO Patrick Spence가 2024년 10월에 공식 사과문을 냈고, 2024년 12월에 이사회가 그를 해임했다. 후임 CEO Tom Conrad는 2025년 한 해 동안 빠진 기능을 단계적으로 복구했다. 2026년 5월 시점에서 S2 앱은 거의 모든 핵심 기능을 회복했지만, 한 번 잃은 신뢰는 완전히 돌아오지 않았다.
| Sonos 모델 | 가격 | Atmos | 비고 |
| --- | --- | --- | --- |
| Sonos One SL | 219달러 | 없음 | 음성 비서 없음 |
| Era 100 | 249달러 | 없음 | One의 후속 |
| Era 300 | 449달러 | 있음 (6 드라이버) | 거실 표준 |
| Beam (Gen 2) | 499달러 | 있음 (가상) | TV 사운드바 |
| Arc Ultra | 999달러 | 있음 (9.1.4) | 프리미엄 사운드바 |
| Sub (Gen 4) | 799달러 | 없음 (서브우퍼) | 페어링 전용 |
6. Sonos Ace 헤드폰 — 2024년 5월의 첫 시도
Sonos는 2024년 5월 Sonos Ace를 출시했다. 449달러, 무선 액티브 노이즈 캔슬링 오버이어 헤드폰. 이는 Sonos가 거실 스피커가 아닌 개인용 오디오 제품을 만든 첫 시도다.
Ace의 차별점은 "TV 사운드 스왑" 기능이다. Sonos Beam이나 Arc 사운드바에 페어링하면, TV 사운드를 그대로 헤드폰으로 옮길 수 있다. 가족이 자는 동안 영화를 보거나, 게임 사운드를 본인만 듣고 싶을 때 유용하다. Apple Music의 공간 음향도 지원한다.
문제는 출시 타이밍이 S2 앱 사태와 정확히 겹쳤다는 것이다. Ace를 페어링하려면 새 S2 앱이 필요했는데, 그 앱이 망가져 있었기 때문에 출시 직후 리뷰가 처참했다. 2025년 가을부터 S2 앱이 안정화되면서 Ace의 평가도 회복되었다.
비교 대상.
| 헤드폰 | 가격 | ANC | 공간 음향 | 비고 |
| --- | --- | --- | --- | --- |
| Sonos Ace | 449달러 | 있음 | Apple Music 공간 음향 | Sonos 사운드바 페어링 |
| AirPods Max (2024 USB-C) | 549달러 | 있음 | Apple Spatial Audio | 애플 전용 |
| Bose QC Ultra Headphones | 429달러 | 있음 (업계 최강) | Bose Immersive Audio | ANC 최강 |
| Sony WH-1000XM5 | 399달러 | 있음 | Sony 360 Reality Audio | 가성비 |
7. 한국 — KAKAO Mini / NUGU (SKT) / KT Genie / NAVER Clova
한국 스마트 스피커 시장은 2017~2019년에 폭발적으로 자랐다가 2020년 이후 거의 정체되었다. 2026년 시점에서 4사 모두 신제품 출시가 끊겼고, 대신 통신사 IPTV / 셋톱박스 / 스마트홈 허브 형태로 명맥을 유지한다.
- KAKAO Mini — 2017년 출시, 카카오 i 비서. 2023년 이후 신모델 없음. 카카오톡 음성 메시지, 멜론 음악, 카카오 T 호출 정도가 강점. 카카오 i가 2024년에 카카오 i Cloud / KoGPT로 백엔드를 일부 교체했지만 스피커에 풀린 건 늦었다.
- SK NUGU — 2016년 출시, 가장 오래된 한국 스마트 스피커. 2020년대 들어 "NUGU Candle" 같은 무드등 일체형 제품과 SK Btv 셋톱박스의 보이스 리모컨으로 옮겨갔다. SKT가 2024년에 자체 LLM "에이닷"을 출시하면서 NUGU 음성 백엔드를 에이닷으로 통합 중이다.
- KT Genie — KT 올레tv (Genie TV) 의 보이스 리모컨이 사실상 주력. 독립형 스피커 "기가지니"는 2022년 이후 신모델이 없다. 2024년부터 GiGA Genie에 KT의 자체 LLM "믿:음 (Mi:dm)" 일부 기능이 들어가기 시작했다.
- NAVER Clova Friends — Brown, Sally 같은 라인프렌즈 캐릭터 디자인으로 인기를 끌었지만, NAVER는 2022~2023년에 Clova 사업 정리에 들어갔다. 일부 기능은 NAVER의 HyperCLOVA X 기반 "Clova X" 서비스로 이전되었지만, 스피커 자체는 사실상 EOL.
한국 사용자에게 권장하는 조합 (2026년 5월 기준):
| 용도 | 추천 |
| --- | --- |
| IPTV 음성 리모컨 | SK Btv, KT Genie TV, LG U+ tv 셋톱 (각 통신사 표준) |
| 거실 음악 + 글로벌 | Sonos Era 100/300 + Apple Music 또는 멜론 (한국 라이선스) |
| 침실 보조 | Echo Dot 5 (영어 + 한국어 부분 지원) 또는 Nest Mini |
| 진짜 한국어 비서 | 솔직히 스피커보다 핸드폰 - 에이닷, 갤럭시 빅스비, Clova X 앱 |
8. 일본 — Sony LF-S50G 종료, JBL Japan, Yamaha MusicCast
일본 시장은 한국보다 더 정체되어 있다. 자체 음성 비서는 거의 없고, Alexa Japan과 Google Assistant Japan이 외산 디바이스 (Echo, Nest, Yamaha, JBL) 에 얹혀 들어간다.
- Sony LF-S50G — 2017년 출시, Google Assistant 탑재. 2022년에 단종. Sony는 이후 스마트 스피커 카테고리를 사실상 포기했다.
- Yamaha MusicCast 50 / 20 — 무선 멀티룸 시스템. Alexa와 Google 모두 지원. 일본 가정의 "오디오 + 스마트홈" 조합에서 가장 흔하다.
- JBL Link Portable / JBL Authentics — 일본에서 정식 유통된다. Authentics 라인은 후술.
- Onkyo / Denon HEOS — Heritage 오디오 브랜드. 멀티룸 + 스마트 스피커 기능 일부 지원.
일본 NHK가 2023년부터 "라쿠텐 미니" 같은 자체 스피커를 시험했지만 상용화로 이어지지 못했다. 일본어 음성 비서는 Alexa JP가 가장 잘 한다는 평가다.
9. JBL Authentics 200 — Alexa + Google 동시 지원의 거의 유일한 케이스
JBL이 2023년에 출시한 Authentics 시리즈 (200 / 300 / 500) 는 빈티지 라디오 디자인 + 현대 스마트 스피커 기능을 결합한 라인이다. 가장 큰 특징은 Alexa와 Google Assistant를 동시에 지원하는 거의 유일한 스피커라는 점이다.
| 모델 | 가격 | 드라이버 | 비고 |
| --- | --- | --- | --- |
| Authentics 200 | 379달러 | 2 트위터 + 우퍼 + 패시브 라디에이터 | 데스크탑 |
| Authentics 300 | 449달러 | 동일 + 배터리 8시간 | 휴대 가능 |
| Authentics 500 | 699달러 | 3.1 스테레오 + Dolby Atmos | 거실 |
Authentics는 "내가 어느 생태계에 락인되고 싶지 않다"는 사용자에게 거의 유일한 선택지다. Alexa는 음악·쇼핑·스마트 홈에서, Google Assistant는 검색·캘린더에서 더 강한데, 둘 다 쓸 수 있다.
단점은 Apple HomeKit / AirPlay 2를 둘 다 지원하지 않는다는 점이다. iPhone 사용자라면 같은 가격대의 Sonos Era 100이나 HomePod mini 2개가 더 자연스럽다.
10. Marshall + Pure + 빈티지 스타일
Marshall은 영국의 기타 앰프 회사로, 2010년대 후반부터 Bluetooth 스피커 시장에 진입했다. 2026년 시점의 주력 라인.
- Marshall Acton III (2022) — 279달러. Bluetooth 5.2 + Wi-Fi 멀티룸. Alexa는 없고 본인 앱 "Marshall Bluetooth" 만 있다.
- Marshall Stanmore III (2022) — 399달러. 같은 디자인 언어, 더 큰 사이즈.
- Marshall Woburn III (2022) — 579달러. 가장 큰 모델, 거의 사운드바 대용.
- Marshall Middleton (2023) — 299달러. 휴대용 (배터리 20시간).
- Marshall Major V (2024) / Monitor III ANC (2023) — 헤드폰 라인.
Marshall은 음성 비서를 거의 신경 쓰지 않고 "사운드 + 디자인" 에 집중하는 전략이다. AirPlay 2와 Spotify Connect는 지원하므로, iPhone 사용자에게는 충분히 쓸 만하다.
Pure (영국 라디오 브랜드) 는 디지털 라디오 (DAB+) + Bluetooth + 스마트 스피커를 묶은 "Pure Evoke" 라인을 유지한다. 영국과 유럽에서 인기 있다. 한국·일본 정식 유통은 거의 없다.
Bang & Olufsen Beosound A1 (휴대), A5 (Wi-Fi), A9 (거실 플래그십) 라인은 디자인 프리미엄으로 자리잡고 있다. A9는 1만 달러를 넘는 가격대다.
11. 헤드폰 — AirPods Max / AirPods Pro 3 (루머) / Bose QC Ultra
스마트 스피커와 음성 비서를 다루면서 헤드폰을 빼놓을 수 없다. 2026년 봄 시점의 프리미엄 무선 헤드폰 4종.
- AirPods Max (USB-C 리비전, 2024년 9월) — 549달러. 2020년 오리지널 모델에서 단자만 USB-C로 바꾼 마이너 업데이트. H1 칩 그대로다. Apple Intelligence Siri의 핸드오프 대상으로는 가장 자연스럽지만, 2026년 가을에 H2 칩 + ANC 강화 모델 루머가 강하게 돈다.
- AirPods Pro 3 (루머) — 2026년 가을 출시 예상. H3 칩, 헬스 트래킹 (체온 측정), 청력 보조 (Hearing Aid) 기능 강화. 가격 249~279달러 예상.
- Bose QuietComfort Ultra Headphones (2023) — 429달러. 업계 최강 ANC. Bose Immersive Audio라는 공간 음향이 있지만 Apple Spatial Audio만큼 호환이 넓진 않다.
- Sony WH-1000XM5 (2022) → XM6 루머 — 현재 399달러, 가성비. XM6는 2026년 여름 발표 예상.
- Sennheiser Momentum 4 Wireless — 379달러, 사운드 품질 강점, ANC는 보통.
음성 비서 통합 측면에서는 AirPods Max가 Apple Intelligence Siri와 가장 자연스럽다. Bose는 "Bose Music" 앱에서 Alexa / Google Assistant를 선택해 페어링할 수 있지만, 깊이는 얕다.
12. 휴대용 — Sonos Move 2 / Bose SoundLink Max
휴대용 (배터리 + 휴대 손잡이) 스피커 카테고리에서 2026년 봄의 양강은 Sonos Move 2와 Bose SoundLink Max다.
- Sonos Move 2 (2023년 9월) — 449달러. Sonos S2 앱 페어링 (Wi-Fi 멀티룸) + Bluetooth 5.0 + 24시간 배터리. 거실에서 빼서 마당으로 가져갈 때 같은 그룹을 유지한다.
- Bose SoundLink Max (2024) — 399달러. 배터리 20시간, 사운드는 Bose 특유의 따뜻한 미드레인지. Bluetooth만 지원 (Wi-Fi 없음). USB-C 디지털 출력 지원.
- JBL Charge 6 (2024) — 199달러. 가성비. 20시간 배터리, IP68 방수, Wi-Fi 없음.
- JBL Boombox 3 (2022) — 499달러. 가장 큰 휴대용, 캠핑 / 파티용. 23시간 배터리, 22kg.
- Sony SRS-XV900 (2023) — 999달러. 거의 PA 시스템. 25시간 배터리, LED 조명까지.
| 휴대용 | 가격 | 배터리 | Wi-Fi | 비고 |
| --- | --- | --- | --- | --- |
| Sonos Move 2 | 449달러 | 24h | 있음 | Sonos 멀티룸 호환 |
| Bose SoundLink Max | 399달러 | 20h | 없음 | 사운드 우위 |
| JBL Charge 6 | 199달러 | 20h | 없음 | 가성비 |
| JBL Boombox 3 | 499달러 | 23h | 없음 | 거대, 파티용 |
| Marshall Middleton | 299달러 | 20h | 없음 | 디자인 |
13. AI 음악 — Lyria 2 (Google)
스마트 스피커 뒤에서 일어나는 진짜 변화는 "AI가 음악을 만든다"는 영역이다. Google DeepMind가 2025년 9월에 공개한 Lyria 2는 텍스트 프롬프트로 풀 트랙 음악을 생성하는 모델이다. Lyria 1은 2023년 12월에 발표된 YouTube Shorts용 짧은 트랙 생성이었지만, Lyria 2는 4분짜리 전곡, 멀티트랙 (드럼·베이스·보컬 분리), 그리고 24-bit 48kHz 출력을 지원한다.
Lyria 2가 2026년 시점에 풀린 곳.
- YouTube의 "Dream Track" 기능 (선택 크리에이터)
- Google AI Test Kitchen
- Vertex AI Studio (개발자용 API)
스마트 스피커 사이드에서는 아직 직접 통합되지 않았지만, Gemini Live에 "잔잔한 재즈 5분만 만들어줘"라고 하면 Lyria 2로 생성된 트랙을 재생하는 데모가 Google I/O 2025에서 공개되었다. 정식 상용화는 2026년 하반기 예상.
경쟁 모델.
- Suno AI v4 (2024) → v5 (2026 봄) — 가장 인기 있는 컨슈머 AI 음악 서비스. 월 10달러 / 30달러 플랜.
- Udio (2024) — 멀티트랙 분리에 강점.
- Stability Audio 2.0 (2024) — 오픈 가중치, 셀프 호스팅 가능.
- Meta AudioCraft / MusicGen — 연구용. 상용 서비스는 없음.
14. 신경 오디오 — AudioSet + RAVE
스마트 스피커가 "사용자 명령을 듣는" 인식 (recognition) 측면과 "음악을 만드는" 생성 (generation) 측면 뒤에는 신경망 오디오의 두 거대한 기둥이 있다.
AudioSet은 Google이 2017년에 공개한 대규모 오디오 이벤트 라벨링 데이터셋이다. 632개 클래스, 200만 개의 10초 클립이 YouTube에서 수집되었고, 이 위에서 학습된 PANN / YAMNet / VGGish 같은 모델이 환경 오디오 분류의 표준이 되었다. Alexa의 "유리 깨지는 소리 감지" (Alexa Guard) 같은 기능은 AudioSet 기반 분류기를 거의 그대로 쓴다.
RAVE (Realtime Audio Variational autoEncoder) 는 IRCAM의 Antoine Caillon이 2021년에 발표한 신경 오디오 합성 모델이다. 오디오 도메인에서의 VAE를 24~48kHz 실시간으로 돌릴 수 있게 만든 것이 핵심이고, 2024~2025년에 들어 Max/MSP와 Ableton Live에서 직접 쓸 수 있는 nn~ 외부 객체가 안정화되면서 실험 음악 / 라이브 코딩 / 인터랙티브 설치 작품에서 표준이 되어 가고 있다.
스마트 스피커 사용자가 직접 RAVE를 만나는 일은 거의 없지만, "AirPods Pro 3의 청력 보조 기능에서 환경음 분류에 RAVE 인코더가 들어간다"는 루머가 있다. 확정된 정보는 아니다.
기술적 비교.
| 도구 | 용도 | 출력 도메인 | 상용 사용 |
| --- | --- | --- | --- |
| AudioSet (PANN/YAMNet) | 분류 (recognition) | 라벨 | Alexa Guard, Nest 알람 감지 |
| RAVE | 합성 (generation) | 24~48kHz 실시간 | 실험 음악, 라이브 |
| Lyria 2 | 음악 생성 | 4분 트랙 | YouTube, Vertex AI |
| Suno v5 | 음악 생성 | 4분 트랙 | 컨슈머 직접 |
15. 누가 무엇을 골라야 하나 — 일반 / 가족 / 음악 우선 / 한국 / 일본
마지막으로 사용자 유형별 추천 조합을 정리한다.
- 일반 사용자 + iPhone — HomePod mini 2개 (스테레오 페어). 99달러 x 2 = 198달러. iPhone과 Apple Intelligence Siri가 끊김 없이 연동된다.
- 일반 사용자 + Android — Nest Audio 또는 Nest Mini 2nd gen. Gemini Live가 핸드폰과 동일하게 작동한다.
- 가족 (주방 + 화면) — Echo Show 8 또는 Nest Hub Max. Echo Show는 Alexa Plus 구독 시 진가가 나오고, Nest Hub Max는 카메라 + Gemini Live 조합이 강하다.
- 음악 우선 + Atmos — Sonos Era 300 + Apple Music 공간 음향. 거실에 한 대만 둔다고 하면 449달러로 가장 만족도 높다.
- 한국 사용자 — IPTV는 통신사 표준 (SK Btv, KT Genie TV, LG U+ tv) 보이스 리모컨. 거실 음악은 Sonos Era 100 + 멜론. 침실은 Echo Dot 5 (영어 기반 + 한국어 부분 지원).
- 일본 사용자 — Yamaha MusicCast 50 또는 Amazon Echo Show 8 (일본어). Alexa JP가 일본어 NLU에서 가장 자연스럽다.
- 휴대용 (캠핑·여행) — Bose SoundLink Max 또는 JBL Charge 6. Sonos Move 2는 비싸지만 집과 마당을 묶고 싶다면 유일한 선택.
- 헤드폰 — iPhone 사용자는 AirPods Max (또는 2026 가을 신형 대기), 나머지는 Bose QC Ultra 또는 Sony XM5/XM6.
전체 시장의 큰 그림은 이렇다. 2026년의 스마트 스피커는 "스마트홈 허브"보다 "LLM 음성 인터페이스"로 무게 중심이 옮겨졌다. Apple Intelligence Siri, Alexa Plus (with Claude), Gemini Live가 세 축이고, Sonos는 사운드 품질로 그 사이에서 차별화한다. 한국과 일본의 로컬 비서는 이번 사이클에서 거의 따라잡지 못했고, 대신 통신사 IPTV / 핸드폰 LLM (에이닷, Clova X, KT 믿:음) 으로 축이 옮겨갔다.
16. 참고 / References
- Apple Intelligence — https://www.apple.com/apple-intelligence/
- HomePod (Apple) — https://www.apple.com/homepod/
- HomePod mini (Apple) — https://www.apple.com/homepod-mini/
- Apple WWDC 2024 Keynote — https://developer.apple.com/wwdc24/
- Amazon Alexa Plus — https://www.aboutamazon.com/news/devices/new-alexa-generative-artificial-intelligence
- Echo Show lineup (Amazon) — https://www.amazon.com/echo-show
- Anthropic Amazon investment — https://www.anthropic.com/news/anthropic-amazon
- Google Gemini Live — https://gemini.google.com/
- Google Nest devices — https://store.google.com/us/category/connected_home
- Sonos Era 300 — https://www.sonos.com/en-us/shop/era-300
- Sonos Ace headphones — https://www.sonos.com/en-us/shop/ace
- Sonos app redesign apology (May 2024) — https://en.community.sonos.com/announcements
- JBL Authentics — https://www.jbl.com/authentics/
- Marshall Speakers — https://www.marshall.com/global/speakers
- Bose QuietComfort Ultra Headphones — https://www.bose.com/p/headphones/bose-quietcomfort-ultra-headphones/
- Bose SoundLink Max — https://www.bose.com/p/speakers/bose-soundlink-max-portable-speaker/
- AirPods Max (USB-C) — https://www.apple.com/airpods-max/
- Sony WH-1000XM5 — https://www.sony.com/electronics/headband-headphones/wh-1000xm5
- SK NUGU (Korean) — https://www.nugu.co.kr/
- KAKAO i (Korean) — https://kakao.ai/
- KT GiGA Genie (Korean) — https://gigagenie.kt.com/
- NAVER Clova — https://clova.ai/
- Yamaha MusicCast — https://www.yamaha.com/en/products/musiccast/
- Google Lyria — https://deepmind.google/technologies/lyria/
- Suno AI — https://suno.com/
- Udio — https://www.udio.com/
- AudioSet (Google Research) — https://research.google.com/audioset/
- RAVE / IRCAM ACIDS — https://github.com/acids-ircam/RAVE
- nn~ Max/MSP external — https://github.com/acids-ircam/nn_tilde
현재 단락 (1/190)
2026년 봄의 스마트 스피커 시장은 5년 만에 가장 큰 변곡점을 지나고 있다. 2020년대 초반의 "스마트 스피커는 끝났다"는 분위기가 거짓말처럼 사라지고, 빅테크 4사 (App...