DIALOGUE 现在有多少种语音？

279 种 ElevenLabs 语音 — 7 种语言（英语、越南语、日语、韩语、西班牙语、中文和法语）每种语言约 20 种男声和 20 种女声。此次替换了原先的 30 种 Gemini TTS 语音库。

为什么从 Gemini TTS 转向 ElevenLabs？

ElevenLabs 提供更高的语音质量、更自然的表现力、口音更加多样化的更大共享语音库，以及更快的音频生成速度。Gemini 仍然是 AI 研究、话题调研和稿件生成的引擎 — 只是 TTS 供应商发生了变化。

口音筛选功能如何工作？

重新设计的语音选择器内置口音筛选标签 — 澳大利亚、英国、美国、关西、首尔以及其他 25 种以上口音。点击标签即可筛选出匹配该口音的语音。结合全新的描述标签（轻松、随性、沉稳、自信、深沉），几秒钟就能精准选到合适的语音，告别盲选。

语音试听还慢吗？

不慢了。语音试听现已通过 CDN 提供，实现即时播放 — 无需等待音频生成。每种语音都有预生成试听片段，点击即加载。

返回博客

2026年7月4日 · 5分钟阅读

推出 279 种 ElevenLabs 语音：播客 AI 语音史上最大规模扩展

DIALOGUE 已将语音库从 30 种 Gemini TTS 扩展至 279 种 ElevenLabs 语音，覆盖 7 种语言，支持口音筛选、描述标签和 CDN 即时试听 — Gemini 仍用于研究和稿件生成。

DIALOGUE 现搭载 279 种 ElevenLabs 语音 — 覆盖英语、越南语、日语、韩语、西班牙语、中文和法语，每种语言约 20 种男声和 20 种女声。 这是产品历史上最大规模的语音扩展，取代了原先的 30 种 Gemini TTS 语音库。本文将介绍变化内容、变化原因及使用方法。

从 30 种到 279 种：发生了什么变化

DIALOGUE 刚上线时，你大约有 30 种 Gemini TTS 语音可选 — 对于起步来说已经不错，但选择范围毕竟有限。这意味着口音选项较少、语气选项较少，选择主持人时难免需要凭感觉猜测。

全新的 ElevenLabs 语音库为你带来了覆盖全部 7 种语言的 279 种精选语音。每种语言约 20 种男声和 20 种女声可选，你可以搭配出真正有辨识度的主持人组合 — 而不是两种混在一起难以区分的声音。

这次扩展不仅仅是数字的增长。ElevenLabs 语音拥有更自然的节奏、更丰富的情感层次和更清晰的主持人辨识度。对于双人主持的播客格式来说，这非常重要 — 听众需要知道谁在说话，而不必每次都靠稿子来告知。

口音与描述标签：浏览代替盲选

两个新功能让大幅扩展的语音库依然好用：

口音筛选标签。 语音选择器现已支持 25 种以上口音 — 澳大利亚、英国、美国、关西、首尔等。点击标签，列表随即筛选出匹配该口音的语音。按口音浏览适用于所有语言，你可以找到带有北部或南部口音的越南语语音，或带有东京或关西语调的日语语音。

描述标签。 每种语音都标注了直观的描述词 — 沉稳、随性、自信、深沉、轻松、有活力、温暖、权威等。这些正是 ElevenLabs 用于分类其共享语音库的标签，而非自由文本标签。它们直接显示在语音选择器中，你甚至可以在试听之前就快速扫描出语音的基调。

CDN 即时试听

过去，语音试听需要发起一轮音频生成请求 — 浏览几十个选项时，这段小小的延迟会累积起来。如今，每种语音都有预先生成的试听片段，通过 CDN 提供。点击一种语音，立刻听到。无需等待，没有加载动画。

所有语音的试听都使用同一段标准文本，确保公平对比 — 相同的话语、相同的节奏、不同的声音。

为什么选择 ElevenLabs？Gemini 呢？

选择 ElevenLabs 出于三个原因：

语音质量。 ElevenLabs TTS 持续产出更自然的声音和更好的韵律感，尤其契合双人主持播客所需的对话风格。
口音多样性。 ElevenLabs 共享语音库在不同语言间的口音丰富程度远超 Gemini TTS，这对多语言产品至关重要。
速度。 ElevenLabs 的音频生成速度足够快，既能可靠地完成合成步骤，又不会拖慢单集制作节奏。

Gemini 并没有被替换 — 它依然是 AI 研究、话题调研和稿件生成的引擎。改变的只是文字转语音的供应商。Gemini 撰写播客，ElevenLabs 为它配音。

重新设计的语音选择器

语音选择器的界面已为支持更大规模的语料库而重建。变化包括：

顶部放置口音筛选标签，一键浏览
基于使用量的排序 — 你使用过的语音会优先显示
适配手机屏幕的移动端友好布局
描述标签在列表中直接可见，而非隐藏在详情视图后面

设计目标是让 279 种语音显得可管理而非令人望而生畏。按口音筛选、扫一眼标签、点一个试听、选定。

这对你的播客意味着什么

更多语音意味着你对播客听感的控制力更强。如果你跨语言制作内容，可以搭配出基调一致的主持人 — 内部通讯用温暖沉稳的主持人组合，产品发布用犀利有活力的组合。如果你做单集本地化，可以选出跨语言能量感一致的语音搭档，而不只是匹配性别。

279 种语音在所有定价档位均可用 — 没有语音付费墙。从免费 2 期开始，亲自聆听新的语音。

体验全新语音库。 创建一期播客，浏览全部 279 种语音，享受即时试听 — 免费起步，无需绑定卡片。

作者

Chandler Nguyen

Ad exec turned AI builder. Full-stack engineer behind DIALØGUE and other production AI platforms. 18 years in tech, 4 books, still learning.

准备好创建自己的播客了吗？

将任何主题或文档转化为专业播客——生成音频前审核大纲和脚本。

立即创建播客