블로그로 돌아가기
2026년 7월 4일 · 5분 소요

279가지 ElevenLabs 음성 도입: 팟캐스트를 위한 역대 최대 AI 음성 확장

DIALOGUE가 음성 라이브러리를 30가지 Gemini TTS에서 7개 언어 279가지 ElevenLabs 음성으로 확장했습니다. 억양 필터, 설명 라벨, CDN 즉시 미리듣기 탑재 — Gemini는 연구와 대본 생성에 계속 사용됩니다.

DIALOGUE는 이제 279가지 ElevenLabs 음성으로 제공됩니다 — 영어, 베트남어, 일본어, 한국어, 스페인어, 중국어, 프랑스어의 7개 언어에서 각 언어당 약 20개의 남성 및 여성 음성. 이 제품 역사상 최대 규모의 음성 확장으로, 기존 30가지 Gemini TTS 라이브러리를 대체합니다. 무엇이 바뀌었는지, 왜 바뀌었는지, 어떻게 사용하는지 소개합니다.

30가지에서 279가지로: 무엇이 바뀌었나

DIALOGUE가 출시되었을 때는 약 30가지의 Gemini TTS 음성 중에서 선택할 수 있었습니다 — 견고한 출발점이었지만 범위가 제한적이었습니다. 즉, 억양 선택지가 적고, 톤 옵션이 적으며, 호스트를 고를 때 추측이 필요했습니다.

새로운 ElevenLabs 라이브러리는 7개 언어 전체에서 엄선한 279가지 음성을 제공합니다. 각 언어마다 약 20개의 남성 및 여성 옵션이 있어, 실제로 서로 다르게 들리는 호스트를 페어링할 수 있습니다 — 두 목소리가 섞여 들리지 않게요.

이 확장은 단순한 숫자 이상의 의미를 가집니다. ElevenLabs 음성은 더 자연스러운 페이싱, 더 풍부한 감정 표현, 화자 간 더 명확한 구별을 제공합니다. 2인 호스트 팟캐스트 형식에서는 이것이 중요합니다 — 대본이 매번 알리지 않아도 청취자가 누가 말하고 있는지 알 수 있어야 합니다.

억양과 설명 라벨: 추측 대신 브라우징

대규모 카탈로그를 실용적으로 사용할 수 있게 하는 두 가지 새로운 기능:

억양 필터 칩. 음성 피커가 25가지 이상의 억양을 지원합니다 — 호주, 영국, 미국, 간사이, 서울 등. 칩을 탭하면 해당 억양에 맞는 음성으로 목록이 필터링됩니다. 억양별 브라우징은 모든 언어에서 작동하므로, 북부 또는 남부 억양의 베트남어 음성이나, 도쿄 또는 간사이 억양의 일본어 음성을 찾을 수 있습니다.

설명 라벨. 각 음성에는 직관적인 설명자가 태그되어 있습니다 — 차분함, 캐주얼, 자신감, 깊이감, 느긋함, 에너제틱, 따뜻함, 권위적 등. 이는 ElevenLabs가 공유 음성 라이브러리를 분류하는 데 사용하는 것과 동일한 라벨이며, 자유 텍스트 태그가 아닙니다. 음성 피커에 직접 표시되므로, 미리듣기를 재생하기 전에도 톤을 확인할 수 있습니다.

CDN에서의 즉시 미리듣기

이전에는 음성 미리듣기에 오디오 생성을 위한 왕복 요청이 필요했습니다 — 수십 개 옵션을 둘러볼 때 쌓이는 작은 지연. 이제 모든 음성에 미리 생성된 미리듣기 클립이 CDN에서 제공됩니다. 음성을 탭하면 즉시 들립니다. 대기 시간도, 스피너도 없습니다.

미리듣기는 모든 음성에서 동일한 표준 트랜스크립트를 사용하므로, 공정한 비교가 가능합니다 — 같은 단어, 같은 페이싱, 다른 목소리.

왜 ElevenLabs인가? Gemini는 어떻게 되나?

ElevenLabs가 선택된 데는 세 가지 이유가 있습니다:

  1. 음성 품질. ElevenLabs TTS는 특히 2인 호스트 팟캐스트에 필요한 대화 스타일에 대해 더 나은 운율을 가진, 더 자연스러운 음성을 지속적으로 생성합니다.

  2. 억양 다양성. ElevenLabs의 공유 음성 라이브러리는 Gemini TTS보다 언어 간 억양 다양성이 훨씬 뛰어나며, 이는 다국어 제품에 매우 중요합니다.

  3. 속도. ElevenLabs의 오디오 생성은 에피소드 제작을 지연시키지 않으면서 합성 단계를 처리할 수 있을 만큼 빠릅니다.

Gemini가 대체된 것은 아닙니다 — AI 연구, 주제 근거 수집, 대본 생성의 엔진으로 계속 사용됩니다. 텍스트 음성 변환 제공업체만 변경되었을 뿐입니다. Gemini가 팟캐스트를 쓰고, ElevenLabs가 목소리를 입힙니다.

새롭게 디자인된 음성 피커

음성 피커 UI는 대규모 카탈로그를 지원하기 위해 재구축되었습니다. 변경 사항은 다음과 같습니다:

  • 상단에 억양 필터 칩으로 원탭 브라우징
  • 사용량 기반 순위 — 사용한 음성이 먼저 표시됨
  • 휴대폰 화면에서도 잘 작동하는 레이아웃
  • 설명 라벨이 상세 보기 뒤에 숨지 않고 목록에 표시됨

목표는 279가지 음성을 부담스럽지 않고 관리 가능하게 만드는 것이었습니다. 억양으로 필터링하고, 라벨을 스캔하고, 미리듣기를 재생하고, 선택하세요.

여러분의 팟캐스트에 의미하는 것

더 많은 음성은 팟캐스트의 소리를 더 세밀하게 제어할 수 있음을 의미합니다. 여러 언어로 콘텐츠를 제작한다면, 호스트 톤을 일관되게 맞출 수 있습니다 — 사내 업데이트에는 따뜻하고 차분한 호스트 페어, 제품 출시에는 날카롭고 에너지 넘치는 페어. 에피소드를 현지화한다면, 단순히 성별을 맞추는 것이 아니라 언어를 넘어 비슷한 에너지를 지닌 음성 페어를 선택할 수 있습니다.

279가지 음성은 모든 가격 등급에서 이용 가능합니다 — 음성 페이월은 없습니다. 2개의 무료 에피소드로 시작해서 새로운 음성을 직접 들어보세요.


새로운 음성 라이브러리를 사용해보세요. 팟캐스트 만들기로 즉시 미리듣기와 함께 279가지 음성을 모두 둘러보세요 — 무료 시작, 카드 불필요.

C

작성자

Chandler Nguyen

Ad exec turned AI builder. Full-stack engineer behind DIALØGUE and other production AI platforms. 18 years in tech, 4 books, still learning.

나만의 팟캐스트를 만들어 보세요

어떤 주제나 문서든 개요 및 스크립트 검토를 포함해 프로 품질의 팟캐스트로 변환할 수 있습니다.

팟캐스트 만들기