Le laboratoire français d'IA Kyutai dévoile un modèle de traduction simultanée

Le laboratoire français de recherche en intelligence artificielle (IA) Kyutai, fondé par Xavier Niel, propriétaire du groupe Iliad, et Rodolphe Saadé, Pdg du transporteur maritime CMA CGM, a dévoilé jeudi 6 février son dernier modèle expérimental dédié à la traduction simultanée.

>> L'Indonésie veut devenir leader de la technologie de l'IA en Asie du Sud-Est

>> La Malaisie utilise l'IA pour lutter contre les fausses nouvelles en ligne

>> IA : sous la pression de Deepseek, OpenAI dévoile un nouvel outil pour ChatGPT

>> Sommet sur l'IA à Paris: coup d'envoi et premières annonces officielles


Baptisée "Hibiki" ("écho" en japonais), cette IA traduit les propos d'un utilisateur en temps réel du français vers l'anglais, comme le ferait "un interprète", a expliqué Neil Zeghidour, directeur de la modélisation chez Kyutai, qui compte également l'ancien patron de Google Eric Schmidt parmi son trio de cofondateurs.

Le modèle, qui peut fonctionner sur un téléphone sans avoir forcément accès à internet, réplique la voix de l'utilisateur, comme a pu le constater lors d'une démonstration.

"Vous ne pouvez pas le contrôler par du texte pour lui faire raconter ce que vous voulez", a toutefois précisé M. Zeghidour.

"Il ne peut traduire que quelque chose qui a vraiment été prononcé", a-t-il ajouté à l'heure où les images et enregistrements audio truqués grâce à l'intelligence artificielle pullulent sur internet, alimentant la désinformation.

Entraîné sur des données publiques, le modèle est disponible gratuitement en source ouverte, c'est-à-dire que son code est rendu public, afin que des chercheurs s'en saisissent ou encore des entrepreneurs qui souhaitent l'intégrer à des produits.

"L'idée c'est d'avoir un modèle qui puisse être utilisé lorsqu'on voyage, lors de visioconférences ou encore en cas de streaming", Hibiki étant capable de fournir des sous-titres en direct, a détaillé Neil Zeghidour.

Le laboratoire, dirigé par Patrick Pérez, avait présenté en juillet un premier modèle appelé "Moshi", dont le code a été téléchargé des millions de fois.

Moshi est une IA générative principalement vocale, c'est-à-dire que les utilisateurs interagissent avec elle uniquement en lui parlant, tandis que ses réponses se font à la fois à l'oral et à l'écrit.

Lancé en novembre 2023, le laboratoire à but non lucratif, qui compte une quinzaine de chercheurs, est financé à hauteur de 300 millions d'euros.

"Notre objectif est de faire avancer le domaine de recherche en publiant nos découvertes", a développé M. Zeghidour, ajoutant qu'un article scientifique accompagnait le lancement d'Hibiki.

AFP/VNA/CVN

Rédactrice en chef : Nguyễn Hồng Nga

Adresse : 79, rue Ly Thuong Kiêt, Hanoï, Vietnam

Permis de publication : 25/GP-BTTTT

Tél : (+84) 24 38 25 20 96

E-mail : courrier@vnanet.vn, courrier.cvn@gmail.com

back to top