¿Qué se hace cuando la IA te quita la voz?

Reportajes Especiales - Business

Guardar

El verano pasado, cuando iba a una consulta médica cerca de su casa en Nueva York, Paul Skye Lehrman y Linnea Sage escuchaban un pódcast sobre el auge de la inteligencia artificial y la amenaza que implicaba para el sustento de escritores, actores y otros profesionales del entretenimiento.

El tema era de especial importancia para el joven matrimonio, pues se ganaban la vida como actores de doblaje, y las tecnologías de inteligencia artificial empezaban a generar voces que sonaban muy reales.

Pero luego el pódcast dio un giro inesperado. Para enfatizar la amenaza de la IA, el presentador realizó una larga entrevista con un chatbot de voz llamado Poe. Y sonaba igual a Lehrman.

"Estaba entrevistando a mi voz sobre los peligros de la inteligencia artificial y los daños que podría causar en la industria del entretenimiento", contó Lehrman. "Detuvimos el auto y nos quedamos allí sentados, sin poder creerlo, intentando entender qué acababa de pasar y qué debíamos hacer".

Lehrman y Sage demandaron a la empresa que creó la voz del chatbot. Afirman que Lovo, una empresa emergente de Berkeley, California, utilizó de manera ilegal grabaciones de sus voces para crear una tecnología capaz de competir con su trabajo vocal. Tras escuchar un clon de la voz de Lehrman en el pódcast, la pareja descubrió que Lovo también había creado un clon de la voz de Sage.

Esta pareja se suma a un número cada vez mayor de artistas, editores, programadores informáticos y otros creadores que han demandado a los fabricantes de tecnologías de inteligencia artificial, alegando que estas empresas utilizaron su trabajo sin permiso para crear herramientas que, en última instancia, podrían sustituirlos en el mercado laboral. (The New York Times demandó en diciembre a dos de estas empresas, OpenAI y su socio, Microsoft, por utilizar sus artículos periodísticos protegidos por derechos de autor para desarrollar sus chatbots en línea).

En su demanda, presentada en un tribunal federal de Manhattan el jueves, la pareja detalló que empleados anónimos de Lovo les habían pagado por unos cuantos fragmentos de grabaciones de sus voces en 2019 y 2020 sin revelar cómo se usarían.

Ambos afirman que Lovo, fundada en 2019, viola la ley federal de protección a las marcas registradas y varias leyes estatales de privacidad al promover clones de sus voces. Lehrman y Sage están invitando a otros actores de doblaje para que se unan a su demanda con el fin de volverla colectiva.

"No sabemos cuántas personas más se han visto afectadas", comentó su abogado, Steve Cohen.

Lovo niega las afirmaciones de la demanda, según David Case, el abogado que representa a la empresa, quien añadió que, si todas las personas que le proporcionaron grabaciones de voz a Lovo dieron su consentimiento, "entonces no hay ningún problema".

Tom Lee, el director ejecutivo de la empresa, comentó en un episodio de pódcast el año pasado que Lovo ahora ofrecía un programa de reparto de ingresos que les permitía a los actores de doblaje ayudar a la empresa a crear clones de sus voces y recibir una parte del dinero que ganaban esos clones.

La demanda parece ser la primera de su tipo, según Jeffrey Bennett, consejero general del Sindicato de Actores de Cine-Federación Estadounidense de Artistas de Radio y Televisión, que representa a 160.000 profesionales de los medios de comunicación en todo el mundo.

"Esta demanda les demostrará a las personas --sobre todo, a las empresas tecnológicas-- que tu voz tiene derechos, que hay todo un grupo de personas allá afuera que se gana la vida con su voz", indicó.

En 2019, Lehrman y Sage se promocionaban como actores vocales en Fiverr, un sitio web donde profesionales independientes pueden publicitar su trabajo. A través de este mercado en línea, a menudo les pedían trabajos de voz para anuncios publicitarios, comerciales para radio, videos en línea, videojuegos y otros medios.

Ese año, a Sage la contactó una persona anónima que le pagó 400 dólares por grabar varios guiones radiofónicos y le explicó que las grabaciones no se utilizarían con fines públicos, según la correspondencia citada en la demanda.

"Son guiones de prueba para anuncios de radio", le explicó la persona anónima, según la demanda. "No se divulgarán externamente, son solo para consumo interno, por lo que no requieren derechos de ningún tipo".

Siete meses después, otra persona no identificada se puso en contacto con Lehrman para realizar un trabajo similar. Lehrman, que también trabaja como actor de televisión y cine, preguntó cómo se utilizarían las grabaciones. Según la correspondencia citada en la demanda, la persona dijo varias veces que solo se utilizarían con fines académicos y de investigación. Lehrman cobró 1200 dólares. (Proporcionó grabaciones más largas que las de Sage).

En abril de 2022, Lehrman descubrió un video de YouTube sobre la guerra en Ucrania narrado por una voz que sonaba como la suya.

"Era mi voz la que hablaba sobre el armamento en el conflicto entre Rusia y Ucrania", relató Lehrman. "Me puse pálido, tenía la piel de gallina. Sabía que yo nunca había dicho esas palabras en ese orden".

Durante meses, Sage y él batallaron para entender qué había ocurrido. Contrataron a un abogado para que les ayudara a averiguar quién había hecho el video de YouTube y cómo se había recreado la voz de Lehrman. Pero la persona propietaria del canal de YouTube parecía estar en Indonesia y no tenían manera de encontrarla.

Luego escucharon el pódcast de camino a la consulta médica. A través del pódcast, "Deadline Strike Talk", pudieron identificar la fuente de la voz clonada de Lehrman. Un profesor del Instituto Tecnológico de Massachusetts había creado el chatbot con la tecnología de síntesis de voz de Lovo.

Sage y Lehrman también descubrieron que Lovo promocionaba clones de sus voces en su sitio web. Después de enviar a la empresa una carta de cese y desista, esta les aseguró que había retirado sus clones de voz del sitio. Pero Lehrman y Sage argumentaron que el software que impulsaba estos clones ya había sido descargado por incontables clientes de la empresa y podía seguir siendo utilizado.

Lehrman también cuestionó si la compañía había utilizado sus voces junto con muchas otras para desarrollar la tecnología central detrás de su sistema de clonación de voz. Los sintetizadores de voz suelen adquirir sus habilidades mediante el análisis de miles de horas de palabras habladas, del mismo modo que ChatGPT de OpenAI y otros chatbots aprenden de analizar grandes cantidades de texto sacado de internet.

Lovo reconoció que había entrenado a su tecnología con miles de horas de grabaciones de miles de voces, según la correspondencia incluida en la demanda.

Case, el abogado que representa a Lovo, dijo que la empresa entrenó a su sistema de inteligencia artificial con audios tomados de una base de datos de libre acceso que contiene grabaciones en inglés llamada Openslr.org. El abogado no respondió cuando se le preguntó si las grabaciones de Lehrman y Sage se habían utilizado para entrenar a la tecnología.

Los actores de doblaje Linnea Sage y Paul Lehrman en Nueva York, el 14 de mayo de 2024. (Elianel Clinton/The New York Times).

Los actores de doblaje Linnea Sage y Paul Lehrman en Nueva York, el 14 de mayo de 2024. (Elianel Clinton/The New York Times).

Guardar