Scarlett Johansson no es la voz de ChatGPT. Pero se parece demasiado OpenAI decide suspender la voz de Sky, que muchos confunden con la del personaje virtual de la película 'Her', y explica cómo hace hablar a la inteligencia artificial

Zigor Aldama Lunes, 20 de mayo 2024, 18:44

Que seamos capaces de interactuar con sistemas de inteligencia artificial de la forma más natural posible es uno de los mayores retos de quienes los desarrollan. Por eso, la voz es uno de los elementos clave: tanto en el reconocimiento de comandos como en la comunicación de resultados, para lo que es imprescindible un buen procesamiento del lenguaje natural. Si, además, la IA tiene una voz atractiva, mejor. Siri y Alexa, por ejemplo, han ido puliendo el tono robótico de sus voces femenina y masculina para hacerlas más naturales.

Pero puede que la última versión de ChatGPT se haya pasado de la raya, porque su asistente de voz, Sky, suena como Scarlett Johansson en el papel de asistente virtual de la película 'Her'. Teniendo en cuenta que la actriz no ha tenido nada que ver con el programa de OpenAI, el debate sobre la propiedad intelectual del material con el que se entrena la IA generativa ha vuelto a estallar. Aunque la empresa asegura que Johansson no tiene nada que ver con la voz de Sky, ayer decidió pausar el servicio, «uno de los más apreciados de los usuarios», y arrojar luz sobre cómo se genera la voz.

«Cada una de las cinco voces que se escuchan han sido cuidadosamente seleccionadas a través de un largo proceso que ha durado cinco meses y en el que se han involucrado actores de voz profesionales, agencias de talento, directores de cásting y consultores», explica OpenIA en un comunicado en el que hace hincapié en que quienes ponen la voz «son remunerados por encima de las tarifas del mercado, y lo seguirán siendo mientras se utilicen sus voces», tratando así de despejar los temores de los intérpretes que ven el peligro de ser sustituidos por la IA generativa.

Ampliar El personaje de Joaquin Phoenix se enamora de su asistente virtual.

La compañía no rehúye la polémica, y asegura que Sky «no imita la voz de Scarlett Johansson, sino que es la voz natural de otra actriz», aunque no revela de quién «para proteger su privacidad». Sí que detalla las cualidades que tiene, de acuerdo con los requerimientos para el trabajo: «Que pueda hablar múltiples idiomas, que suene atemporal, que resulte cercanas e inspire confianza, que sea carismática y rica en tonos, y que suene natural».

Siempre según la versión de OpenAI, se recibieron más de 400 currículos de voz y se hizo una criba para dar con 14 finalistas. Los cinco seleccionados grabaron sus muestras en septiembre del año pasado, y la IA genera el discurso con esos sonidos que dan voz al ChatGPT 4o. «Iremos añadiendo nuevas voces para responder mejor a los intereses y las preferencias de los usuarios», concluye OpenAI. De momento, ninguna será la que enamoró a Joaquin Phoenix.