Retour au Blog
4 juillet 2026 · 5 min de lecture

279 voix ElevenLabs débarquent : la plus grande expansion de voix IA pour les podcasts

DIALOGUE a étendu sa bibliothèque vocale de 30 voix Gemini TTS à 279 voix ElevenLabs dans 7 langues, avec filtrage par accent, libellés descriptifs et aperçus instantanés servis depuis le CDN — Gemini reste utilisé pour la recherche et la génération des scripts.

DIALOGUE intègre désormais 279 voix ElevenLabs — environ 20 voix masculines et 20 voix féminines par langue en anglais, vietnamien, japonais, coréen, espagnol, chinois et français. Il s'agit de la plus grande expansion vocale du produit, remplaçant l'ancienne bibliothèque de 30 voix Gemini TTS. Voici ce qui a changé, pourquoi et comment l'utiliser.

De 30 à 279 voix : ce qui a changé

Lors du lancement de DIALOGUE, vous aviez le choix entre environ 30 voix Gemini TTS — un bon point de départ, mais une palette limitée. Cela signifiait moins de choix d'accents, moins d'options de ton et une part d'approximation dans le choix des animateurs.

La nouvelle bibliothèque ElevenLabs vous offre 279 voix sélectionnées dans les 7 langues. Chaque langue bénéficie d'environ 20 options masculines et 20 options féminines, pour que vous puissiez associer des animateurs qui sonnent vraiment différemment — pas deux voix qui se confondent.

Cette expansion ne se résume pas aux chiffres. Les voix ElevenLabs apportent un rythme plus naturel, une meilleure palette émotionnelle et une différenciation plus nette entre les locuteurs. Pour un format de podcast à deux animateurs, c'est essentiel — l'auditeur doit savoir qui parle sans que le script ne l'annonce à chaque fois.

Libellés d'accent et descriptifs : parcourir au lieu de deviner

Deux nouvelles fonctionnalités rendent le catalogue élargi exploitable à grande échelle :

Pastilles de filtrage par accent. Le sélecteur de voix prend désormais en charge plus de 25 accents — australien, britannique, américain, Kansai, Séoul et bien d'autres. Touchez une pastille et la liste se filtre sur les voix correspondant à cet accent. La navigation par accent fonctionne dans toutes les langues, vous permettant de trouver une voix vietnamienne avec un accent du nord ou du sud, ou une voix japonaise avec une inflexion de Tokyo ou du Kansai.

Libellés descriptifs. Chaque voix est étiquetée avec des descripteurs intuitifs — calme, décontracté, confiant, profond, détendu, énergique, chaleureux, autoritaire, et d'autres. Ce sont les mêmes libellés qu'ElevenLabs utilise pour catégoriser sa bibliothèque vocale partagée, pas des étiquettes en texte libre. Ils apparaissent directement dans le sélecteur de voix, pour que vous puissiez évaluer le ton avant même de lancer un aperçu.

Aperçus instantanés depuis le CDN

Auparavant, les aperçus vocaux nécessitaient un aller-retour pour générer l'audio — un petit délai qui s'accumulait en parcourant des dizaines d'options. Désormais, chaque voix dispose d'un extrait d'aperçu pré-généré servi depuis le CDN. Touchez une voix, écoutez-la immédiatement. Aucune attente, aucun spinner.

Les aperçus utilisent une transcription standard pour toutes les voix, pour des comparaisons équitables — mêmes mots, même rythme, voix différente.

Pourquoi ElevenLabs ? Et Gemini dans tout ça ?

ElevenLabs a été choisi pour trois raisons :

  1. Qualité vocale. ElevenLabs TTS produit de manière constante une parole au son plus naturel avec une meilleure prosodie, particulièrement adaptée au style conversationnel dont un podcast à deux animateurs a besoin.

  2. Diversité des accents. La bibliothèque vocale partagée d'ElevenLabs offre bien plus de variété d'accents à travers les langues que Gemini TTS, ce qui est crucial pour un produit multilingue.

  3. Rapidité. La génération audio d'ElevenLabs est suffisamment rapide pour assurer l'étape de synthèse sans ralentir la production des épisodes.

Gemini n'a pas été remplacé — il reste le moteur pour la recherche IA, l'ancrage thématique et la génération de scripts. Seul le fournisseur de synthèse vocale a changé. Gemini écrit le podcast ; ElevenLabs lui donne voix.

Sélecteur de voix repensé

L'interface du sélecteur de voix a été reconstruite pour prendre en charge le catalogue élargi. Les changements incluent :

  • Des pastilles de filtrage par accent en haut pour une navigation en un geste
  • Un classement basé sur l'utilisation — les voix que vous avez déjà utilisées apparaissent en premier
  • Une mise en page adaptée aux mobiles qui fonctionne sur les écrans de téléphone
  • Des libellés descriptifs visibles dans la liste, sans être cachés derrière une vue détaillée

L'objectif était de rendre 279 voix gérables, pas écrasantes. Filtrez par accent, parcourez les libellés, écoutez un aperçu, choisissez.

Ce que cela signifie pour votre podcast

Plus de voix signifie plus de contrôle sur le rendu sonore de votre podcast. Si vous produisez du contenu dans plusieurs langues, vous pouvez assortir les tons des animateurs de manière cohérente — un duo chaleureux et calme pour les mises à jour internes ; un duo incisif et énergique pour les lancements de produits. Si vous localisez vos épisodes, vous pouvez choisir des paires de voix qui portent une énergie similaire d'une langue à l'autre plutôt que de simplement les assortir par genre.

Les 279 voix sont disponibles à tous les niveaux de tarification — pas de mur payant pour les voix. Commencez avec 2 épisodes gratuits et découvrez les nouvelles voix par vous-même.


Essayez la nouvelle bibliothèque vocale. Créez un podcast et parcourez les 279 voix avec des aperçus instantanés — gratuit pour commencer, sans carte bancaire requise.

C

Rédigé par

Chandler Nguyen

Ad exec turned AI builder. Full-stack engineer behind DIALØGUE and other production AI platforms. 18 years in tech, 4 books, still learning.

Prêt à créer votre propre podcast ?

Transformez n'importe quel sujet ou document en podcast professionnel — avec révision du plan et du script avant l'audio.

Créer un podcast