Comme de nombreux domaines du traitement de l'information, le traitement automatique de la parole a été révolutionné par l'apprentissage profond. Dans cette présentation, j'aborderai divers problèmes liés à la génération de la parole par le biais de paradigmes tels que la synthèse vocale, l'amélioration de la voix et la conversion vocale. Je donnerai un aperçu de l'état de l'art de ces technologies et de leurs applications (robots vocaux, deepfakes, technologies d'assistance, etc.) Enfin, je présenterai quelques travaux récents réalisés à l'Institut MIAI visant à améliorer l'expressivité, la réactivité et la contrôlabilité des systèmes de génération de la parole.
Intervenants
Thomas HueberDirecteur de recherche au CNRS, Chercheur au GIPSA-lab (CNRS/Université Grenoble Alpes)
Rejouer le webinaire
Publié le 21 mars 2024
Mise à jour le 4 septembre 2025
Partager le lienCopierCopiéFermer la fenêtre modalePartager l'URL de cette pageJe recommande :Consultable à cette adresse :La page sera alors accessible depuis votre menu "Mes favoris".Arrêter la vidéoLire la vidéoCouper le sonLire l'audioChat : Une question ?Chatbot Robo FabricaStatistiques de trafic MatomoX (anciennement Twitter)