Comme de nombreux domaines du traitement de l’information, le traitement automatique de la parole a été révolutionné par l’apprentissage automatique profond (deep learning). Dans cette présentation, j’aborderai différents problèmes de génération de la parole au travers des paradigmes de synthèse à partir du texte (Text-to-Speech), de rehaussement et de conversion de la voix. Je présenterai un état de l’art sur ces technologies ainsi que leurs applications (voicebot, deepfake, aide au handicap, etc.). Je présenterai enfin quelques travaux menés récemment dans le cadre de l’institut MIAI visant à améliorer l’expressivité, la réactivité et la contrôlabilité des systèmes de génération de la parole.