Des doubleurs poursuivent une société dont l’IA leur ressemble

L’été dernier, alors qu’ils se rendaient à un rendez-vous chez le médecin près de leur domicile à Manhattan, Paul Skye Lehrman et Linnea Sage écoutaient un podcast sur l’essor de l’intelligence artificielle et la menace qu’elle représentait pour les moyens de subsistance des écrivains, acteurs et autres professionnels du divertissement.

Le sujet était particulièrement important pour le jeune couple marié. Ils gagnaient leur vie en tant qu’acteurs de doublage et les technologies d’IA commençaient à générer des voix qui ressemblaient à de vraies voix.

Mais le podcast a eu une tournure inattendue. Pour souligner la menace de l’IA, l’animateur a mené une longue interview avec un chatbot parlant nommé Poe. Cela ressemblait à M. Lehrman.

“Il m’interrogeait sur les dangers de l’IA et les dommages qu’elle pourrait avoir sur l’industrie du divertissement”, a déclaré M. Lehrman. “Nous avons arrêté la voiture et sommes restés assis là, complètement incrédules, essayant de comprendre ce qui venait de se passer et ce que nous devions faire.”

M. Lehrman et Mme Sage poursuivent désormais en justice la société qui a créé la voix du robot. Ils affirment que Lovo, une start-up de Berkeley, en Californie, a utilisé illégalement des enregistrements de leurs voix pour créer une technologie capable de rivaliser avec leur travail vocal. Après avoir entendu un clone de la voix de M. Lehrman sur le podcast, le couple a découvert que Lovo avait également créé un clone de la voix de Mme Sage.

Le couple rejoint un nombre croissant d’artistes, d’éditeurs, de programmeurs informatiques et d’autres créateurs qui ont poursuivi en justice les fabricants de technologies d’IA, arguant que ces entreprises utilisaient leurs travaux sans autorisation pour créer des outils qui pourraient à terme les remplacer sur le marché du travail. (Le New York Times a poursuivi en justice deux de ces sociétés, OpenAI et son partenaire Microsoft, en décembre, les accusant d’utiliser ses articles de presse protégés par le droit d’auteur pour créer leurs chatbots en ligne.)

Dans leur plainte déposée jeudi devant le tribunal fédéral de Manhattan, le couple a déclaré que des employés anonymes de Lovo les avaient payés pour quelques clips vocaux en 2019 et 2020, sans révéler comment ces clips seraient utilisés.

Ils affirment que Lovo, fondée en 2019, viole la loi fédérale sur les marques et plusieurs lois nationales sur la protection de la vie privée en faisant la promotion de clones de leurs voix. Le procès demande le statut de recours collectif, M. Lehrman et Mme Sage invitant d’autres doubleurs à se joindre à lui.

“Nous ne savons pas combien d’autres personnes ont été touchées”, a déclaré leur avocat, Steve Cohen.

Lovo nie les allégations formulées dans la poursuite, a déclaré David Case, un avocat représentant la société. Il a ajouté que si toutes les personnes qui ont fourni des enregistrements vocaux à Lovo donnaient leur consentement, « alors il n’y a pas de problème ».

Tom Lee, le directeur général de la société, a déclaré dans un épisode de podcast l’année dernière que Lovo proposait désormais un programme de partage des revenus qui permettait aux acteurs de la voix d’aider la société à créer des clones vocaux d’eux-mêmes et de recevoir une part de l’argent gagné par ces clones.

Cette poursuite semble être la première du genre, a déclaré Jeffrey Bennett, avocat général du SAG-AFTRA, le syndicat qui représente 160 000 professionnels des médias dans le monde.

“Cette poursuite montrera aux gens – en particulier aux entreprises technologiques – qu’il y a des droits qui existent dans votre voix, qu’il existe tout un groupe de personnes qui gagnent leur vie en utilisant leur voix”, a-t-il déclaré.

En 2019, M. Lehrman et Mme Sage se présentaient comme doubleurs sur Fiverr, un site Web sur lequel les professionnels indépendants peuvent annoncer leur travail. Grâce à ce marché en ligne, il leur était souvent demandé de fournir du travail vocal pour des publicités, des publicités radio, des vidéos en ligne, des jeux vidéo et d’autres médias.

Cette année-là, Mme Sage a été contactée par une personne anonyme qui lui a payé 400 $ pour enregistrer plusieurs scénarios radiophoniques et lui a expliqué que les enregistrements ne seraient pas utilisés à des fins publiques, selon la correspondance citée par la poursuite.

“Ce sont des scripts de test pour les publicités radio”, a déclaré la personne anonyme, selon la plainte. “Ils ne seront pas divulgués à l’extérieur et seront uniquement consommés en interne, et ne nécessiteront donc aucun droit d’aucune sorte.”

Sept mois plus tard, une autre personne non identifiée a contacté M. Lehrman au sujet d’un travail similaire. M. Lehrman, qui travaille également comme acteur à la télévision et au cinéma, a demandé comment les clips seraient utilisés. La personne a déclaré à plusieurs reprises qu’ils ne seraient utilisés qu’à des fins de recherche et universitaires, selon la correspondance citée dans la plainte. M. Lehrman a reçu 1 200 $. (Il a fourni des enregistrements plus longs que Mme Sage.)

En avril 2022, M. Lehrman a découvert une vidéo YouTube sur la guerre en Ukraine racontée par une voix qui ressemblait à la sienne.

« C’est ma voix qui parle des armes dans le conflit ukraino-russe », a-t-il déclaré. « Je deviens blanc fantôme – la chair de poule sur mes bras. Je savais que je n’avais jamais prononcé ces mots dans cet ordre.

Pendant des mois, lui et Mme Sage ont eu du mal à comprendre ce qui s’était passé. Ils ont engagé un avocat pour les aider à retrouver qui avait réalisé la vidéo YouTube et comment la voix de M. Lehrman avait été recréée. Mais le propriétaire de la chaîne YouTube semblait être basé en Indonésie et ils n’avaient aucun moyen de retrouver la personne.

Puis ils ont entendu le podcast alors qu’ils se rendaient chez le médecin. Grâce au podcast « Deadline Strike Talk », ils ont pu identifier la source du clone vocal de M. Lehrman. Un professeur du Massachusetts Institute of Technology avait reconstitué le chatbot à l’aide de la technologie de synthèse vocale de Lovo.

Mme Sage a également trouvé une vidéo en ligne dans laquelle la société avait présenté sa technologie vocale aux investisseurs lors d’un événement à Berkeley début 2020. Dans la vidéo, un cadre de Lovo a montré une version synthétique de la voix de Mme Sage et l’a comparée à un enregistrement de sa vraie voix. Tous deux jouaient à côté d’une photo d’une femme qui n’était pas elle.

«J’étais dans leur vidéo de présentation pour collecter des fonds», a déclaré Mme Sage. L’entreprise a depuis levé plus de 7 millions de dollars et revendique plus de deux millions de clients à travers le monde.

M. Lehrman et Mme Sage ont également découvert que Lovo faisait la promotion de clones vocaux d’elle et de M. Lehrman sur son site Web. Après avoir envoyé à la société une lettre de cessation et d’abstention, la société a déclaré qu’elle avait supprimé ses clones vocaux du site. Mais M. Lehrman et Mme Sage ont fait valoir que le logiciel à l’origine de ces clones vocaux avait déjà été téléchargé par un nombre incalculable de clients de l’entreprise et pouvait toujours être utilisé.

M. Lehrman s’est également demandé si l’entreprise avait utilisé les voix du couple aux côtés de nombreuses autres pour construire la technologie de base qui pilote son système de clonage vocal. Les synthétiseurs vocaux acquièrent souvent leurs compétences en analysant des milliers d’heures de paroles, de la même manière que ChatGPT d’OpenAI et d’autres chatbots acquièrent leurs compétences en analysant de grandes quantités de texte extraites d’Internet.

Lovo a reconnu avoir entraîné sa technologie en utilisant des milliers d’heures d’enregistrement de milliers de voix, selon la correspondance dans le procès.

M. Case, l’avocat représentant Lovo, a déclaré que la société avait formé son système d’IA en utilisant l’audio d’une base de données d’enregistrements en anglais disponible gratuitement appelée Openslr.org. Il n’a pas répondu lorsqu’on lui a demandé si les enregistrements vocaux de M. Lehrman et de Mme Sage avaient été utilisés pour former la technologie.

“Nous espérons reprendre le contrôle de nos voix, de qui nous sommes, de nos carrières”, a déclaré M. Lehrman. “Nous voulons représenter les autres à qui cela est arrivé et ceux à qui cela arrivera si rien ne change.”

https://www.ctptimes.com

Be the first to comment

Leave a Reply

Your email address will not be published.


*