Parmi les outils IA, ceux qui proposent la fonctionnalité de Text-to-Speech (ou Text to Voice) représentent un gain de productivité. On les utilise pour écouter ses sources, ou pour faire écouter son livrable en format audio.
Nous en avons sélectionné quatre, en accès gratuit ou freemium, parmi une vingtaine d’outils explorés.
Nous les avons choisis pour la qualité du son généré par IA, c’est-à-dire le plus proche possible de la voix humaine, et pour la richesse de ce qu’ils offrent déjà dans leur version gratuite.
ElevenLabs, le plus reconnu (freemium)
ElevenLabs (https://beta.elevenlabs.io/) est sans conteste celui qui produit la meilleure qualité de voix pour générer un livrable en contenu audio dans plusieurs langues.
C’est aussi le plus généreux dans sa version gratuite puisqu’il offre 10 000 signes/mois à lire (c’est la longueur moyenne d’un article de NETSOURCES), par extraits de 2500 signes maximum (espaces compris), que l’on peut télécharger au format MP3. Ce qui permet un usage régulier.
Surtout, dans la version gratuite, on peut :
● Choisir une voix de synthèse (Speech Synthesis) en version multilingue (huit langues) pour éviter l’accent américain d’un texte français, mais les chiffres sont parfois lus en anglais (même avec un texte français !) ;
● Composer une voix de synthèse dans le VoiceLab (on choisit le genre, le niveau d’accent, et même l’âge !) ;
● Accéder à la « bibliothèque », une nouvelle fonctionnalité avec des voix créées par les utilisateurs. La bibliothèque est intéressante car souvent ces outils sont alimentés par la même API, si bien qu’ils proposent le même catalogue de voix (on les reconnaît car elles ont le même nom sur différents outils !) .../...
Déjà abonné ? Connectez-vous...