推出 279 种 ElevenLabs 语音:播客 AI 语音史上最大规模扩展
DIALOGUE 已将语音库从 30 种 Gemini TTS 扩展至 279 种 ElevenLabs 语音,覆盖 7 种语言,支持口音筛选、描述标签和 CDN 即时试听 — Gemini 仍用于研究和稿件生成。
DIALOGUE 现搭载 279 种 ElevenLabs 语音 — 覆盖英语、越南语、日语、韩语、西班牙语、中文和法语,每种语言约 20 种男声和 20 种女声。 这是产品历史上最大规模的语音扩展,取代了原先的 30 种 Gemini TTS 语音库。本文将介绍变化内容、变化原因及使用方法。
从 30 种到 279 种:发生了什么变化
DIALOGUE 刚上线时,你大约有 30 种 Gemini TTS 语音可选 — 对于起步来说已经不错,但选择范围毕竟有限。这意味着口音选项较少、语气选项较少,选择主持人时难免需要凭感觉猜测。
全新的 ElevenLabs 语音库为你带来了覆盖全部 7 种语言的 279 种精选语音。每种语言约 20 种男声和 20 种女声可选,你可以搭配出真正有辨识度的主持人组合 — 而不是两种混在一起难以区分的声音。
这次扩展不仅仅是数字的增长。ElevenLabs 语音拥有更自然的节奏、更丰富的情感层次和更清晰的主持人辨识度。对于双人主持的播客格式来说,这非常重要 — 听众需要知道谁在说话,而不必每次都靠稿子来告知。
口音与描述标签:浏览代替盲选
两个新功能让大幅扩展的语音库依然好用:
口音筛选标签。 语音选择器现已支持 25 种以上口音 — 澳大利亚、英国、美国、关西、首尔等。点击标签,列表随即筛选出匹配该口音的语音。按口音浏览适用于所有语言,你可以找到带有北部或南部口音的越南语语音,或带有东京或关西语调的日语语音。
描述标签。 每种语音都标注了直观的描述词 — 沉稳、随性、自信、深沉、轻松、有活力、温暖、权威等。这些正是 ElevenLabs 用于分类其共享语音库的标签,而非自由文本标签。它们直接显示在语音选择器中,你甚至可以在试听之前就快速扫描出语音的基调。
CDN 即时试听
过去,语音试听需要发起一轮音频生成请求 — 浏览几十个选项时,这段小小的延迟会累积起来。如今,每种语音都有预先生成的试听片段,通过 CDN 提供。点击一种语音,立刻听到。无需等待,没有加载动画。
所有语音的试听都使用同一段标准文本,确保公平对比 — 相同的话语、相同的节奏、不同的声音。
为什么选择 ElevenLabs?Gemini 呢?
选择 ElevenLabs 出于三个原因:
-
语音质量。 ElevenLabs TTS 持续产出更自然的声音和更好的韵律感,尤其契合双人主持播客所需的对话风格。
-
口音多样性。 ElevenLabs 共享语音库在不同语言间的口音丰富程度远超 Gemini TTS,这对多语言产品至关重要。
-
速度。 ElevenLabs 的音频生成速度足够快,既能可靠地完成合成步骤,又不会拖慢单集制作节奏。
Gemini 并没有被替换 — 它依然是 AI 研究、话题调研和稿件生成的引擎。改变的只是文字转语音的供应商。Gemini 撰写播客,ElevenLabs 为它配音。
重新设计的语音选择器
语音选择器的界面已为支持更大规模的语料库而重建。变化包括:
- 顶部放置口音筛选标签,一键浏览
- 基于使用量的排序 — 你使用过的语音会优先显示
- 适配手机屏幕的移动端友好布局
- 描述标签在列表中直接可见,而非隐藏在详情视图后面
设计目标是让 279 种语音显得可管理而非令人望而生畏。按口音筛选、扫一眼标签、点一个试听、选定。
这对你的播客意味着什么
更多语音意味着你对播客听感的控制力更强。如果你跨语言制作内容,可以搭配出基调一致的主持人 — 内部通讯用温暖沉稳的主持人组合,产品发布用犀利有活力的组合。如果你做单集本地化,可以选出跨语言能量感一致的语音搭档,而不只是匹配性别。
279 种语音在所有定价档位均可用 — 没有语音付费墙。从免费 2 期开始,亲自聆听新的语音。
体验全新语音库。 创建一期播客,浏览全部 279 种语音,享受即时试听 — 免费起步,无需绑定卡片。
作者
Chandler NguyenAd exec turned AI builder. Full-stack engineer behind DIALØGUE and other production AI platforms. 18 years in tech, 4 books, still learning.