Le monde des livres audio chamboulé par l’intelligence artificielle

L’intelligence artificielle (IA) a déjà commencé à transformer le monde des livres audio, avec la capacité de créer des enregistrements à la chaîne sans utiliser à chaque fois un narrateur humain. Une évolution qui inquiète les professionnels de la voix, dont l’activité se contracte.

>> Spotify lance ses propres livres audio sur sa plate-forme

De nombreux géants de la tech sont impliqués dans l’économie bourgeonnante des livres audio générés par logiciel. 
Photo : Unsplash/CVN

Tanya Eby pose sa voix sur des textes depuis 20 ans, à temps plein. En six mois, son carnet de commandes a fondu de moitié et beaucoup de ses collègues ont également vu leur activité ralentir.

“Ça semble logique que l’IA soit en train de nous affecter, dit-elle. Je pense que c’est le plan pour l’avenir : remplacer les employés afin de couper les coûts”.

Il n’existe pas de label IA identifié, mais selon plusieurs professionnels du milieu, des milliers de livres audio conçus à partir d’une banque de données vocales circulent déjà sur le marché.

Parmi les plus en pointe, DeepZen propose un tarif d’entrée qui peut diviser, au minimum, par quatre le coût de conception d’un “audiobook” par rapport à un projet classique. Cette petite société basée à Londres puise dans une base qu’elle a créée en enregistrant les voix de plusieurs acteurs, à qui l’on a demandé d’exprimer un registre d’émotions différentes.

“Nous avons signé un accord de licence avec toutes les voix que nous utilisons, indique Kamis Taylan, directeur général de DeepZen. Nous payons pour les enregistrements, (...) et nous versons des royalties à chaque fois que nous utilisons la voix pour un projet”.

“Les choses évoluent tellement vite qu’il y a beaucoup de nouveaux venus qui n’ont pas la même éthique”, et se servent de voix sans rémunérer leurs auteurs, alerte Tanya Eby.

“Il y a une zone grise”, exploitée par de nombreuses plateformes, abonde Kamis Taylan. “Ils prennent votre voix, la mienne, et cinq autres, ils créent une nouvelle voix et ils ne payent rien, en disant que cela n’appartient à personne”.

Toutes les sociétés se défendent de telles pratiques. La start-up texane Speechki propose, outre le recours à ses propres enregistrements, de se servir de voix tirées de banques de données existantes, explique le directeur général Dima Abramov. Cette seconde option passe par la signature d’un contrat qui comprend les droits d’utilisation, précise-t-il.

Selon plusieurs professionnels du milieu, des milliers de livres audio conçus à partir d’une banque de données vocales circulent déjà sur le marché. 
Photo : AFP/VNA/CVN

“Lien émotionnel”

Sollicitées sur le sujet, les cinq grandes maisons d’édition du marché américain n’ont pas donné suite. Mais selon des professionnels, plusieurs noms de l’édition traditionnelle recourent déjà à l’IA dite “générative“, c’est-à-dire capable de créer, sans intervention humaine, textes, images, vidéos ou voix, à partir de contenus existants.

“La narration professionnelle a toujours été essentielle à l’écoute sur Audible et le restera, indique une porte-parole du géant américain des livres audio, filiale d’Amazon. Cela dit, avec l’amélioration de la technologie, nous imaginons un avenir dans lequel l’interprétation humaine et le contenu généré (avec l’IA) pourront co-exister”.

Très investis dans l’IA, les géants de la tech sont impliqués dans l’économie bourgeonnante des livres audios générés par logiciel.

En début d’année, Apple a lancé une offre de “narration numérique”, destinée, selon la firme à la pomme, à “rendre la création de livres audio plus accessible à tous”, notamment “aux auteurs, indépendants et petits éditeurs”. Google propose un service similaire, décrit comme de l’“auto-narration”.

“Nous devons démocratiser l’industrie de l’édition, parce que, en l’état, seuls les noms les plus connus sont convertis en livres audio”, décrit Kamis Taylan.

“La narration synthétique ouvre la porte à tous les livres existants qui n’ont pas été enregistrés et à tous ceux à venir qui n’auraient jamais été convertis à cause des contraintes économiques”, selon Dima Abramov, qui estime à 5% actuellement le nombre de livres qui deviennent des “audiobooks”.

Cette croissance du marché va aussi bénéficier aux acteurs vocaux, affirme-t-il. “Ils feront plus d’enregistrements et gagneront plus d’argent”.

“Raconter des histoires, à la base, c’est permettre aux humains de se reconnecter avec leur humanité, estime Emily Ellet, responsable de l’Association des narrateurs professionnels de livres audio (PANA). La narration devrait rester entièrement humaine”.

Pour Tanya Eby, en l’état, la narration IA “manque de lien émotionnel. Il y a une vraie différence (avec les enregistrements classiques). Mais avec le temps, les auditeurs vont peut-être s’y habituer. Je crois que c’est d’ailleurs en train de se passer”. “J’aimerais quand même que les producteurs indiquent clairement aux utilisateurs qu’ils écoutent un produit généré par l’IA, dit-elle, qu’ils soient francs”.

AFP/VNA/CVN

Rédactrice en chef : Nguyễn Hồng Nga

Adresse : 79, rue Ly Thuong Kiêt, Hanoï, Vietnam.

Permis de publication : 25/GP-BTTTT

Tél : (+84) 24 38 25 20 96

E-mail : courrier@vnanet.vn, courrier.cvn@gmail.com

back to top