C’est le pari du laboratoire français Kyutai, dirigé par Patrick Pérez, qui développe des modèles d’IA vocale open source capables de comprendre, répondre et traduire en temps réel.
0:12 Synthèse Vocale et IA Conversationnelle
0:18 Bienvenue à Qtai
0:39 L'Essence de Qtai
3:11 Compétition dans l'IA
4:12 Recherche vs Produits
5:47 Modèles et Ressources
8:13 Petits Modèles Spécialisés
10:41 Innovations de Moshi
12:30 Moshiviz et IA Multimodale
15:41 Open Source et Impact
16:46 Financement et Mécénat
21:25 Traduction Simultanée
25:29 Progrès en Synthèse Vocale
29:03 Optimisation et Économie d'Échelle
29:22 Perspectives Futures
32:36 Accessibilité et Valeur des Contenus
-------
Abonnez-vous au podcast 👉 https://mondenumerique.info/podcast












