OpenAI da a ChatGPT aptitud de hablar vía cinco voces diferentes

La startup de inteligencia artificial OpenAI va a implementar una función para su aplicación ChatGPT que le permite al chatbot responder a preguntas y comandos hablados con su propia voz.

Guardar

(Bloomberg) -- La startup de inteligencia artificial OpenAI va a implementar una función para su aplicación ChatGPT que le permite al chatbot responder a preguntas y comandos hablados con su propia voz.

A partir de las próximas dos semanas, los usuarios podrán elegir una voz en la aplicación del chatbot, entre cinco personajes con nombres como “Juniper”, “Breeze” y “Ember”. ChatGPT luego producirá un audio del texto que genera en esa voz; por ejemplo, leyendo en voz alta un cuento antes de dormir generado por IA. La función estará disponible para las personas que se suscriban al servicio ChatGPT Plus de OpenAI por US$20 al mes y para usuarios empresariales.

OpenAI lanzó su aplicación ChatGPT en mayo y ya ofrece una capacidad de voz a texto que permite a los usuarios hablar con el bot. Agregar una función de respuesta en audio podría crear la sensación de que las personas están en una conversación más humana. La compañía espera que la nueva función fomente el uso de su aplicación móvil sobre la marcha, poniéndola en competencia más estrecha con ofertas de asistentes personales como el asistente de Google, Siri de Apple Inc. o Alexa de Amazon.com Inc.

Entre las solicitudes, se le puede pedir al programa que hable sobre la historia de Disneyland mientras conduce hacia el parque temático, o pedirle la receta de un cóctel mientras busca ingredientes en la cocina. Durante una prueba de la herramienta, narró hábilmente una historia sobre una estrella de mar y un colinabo. Sin embargo, aunque ChatGPT puede componer letras de canciones, la aplicación se negará a cantar.

Las voces de ChatGPT suenan bastante humanas (aunque al escuchar muy atentamente se nota un tono un poco robótico). OpenAI dijo que trabajó con actores de voz para construir el modelo de inteligencia artificial de texto a voz que subyace a la función.

La compañía también dijo que en las próximas semanas los usuarios que pagan y los empresariales podrán acceder a una función de GPT-4 —uno de los modelos de IA que impulsa ChatGPT— en la que se puede presentar una imagen y una pregunta relacionada al respecto. Por ejemplo, será posible subir una imagen de gafas de sol rosadas y pedirle al chatbot que sugiera un atuendo que combine con ellas, o enviar una imagen de un problema matemático y solicitarle ayuda para resolverlo. La función, que OpenAI anunció anteriormente este año cuando presentó GPT-4, está disponible a través de la aplicación y el sitio web de ChatGPT.

Nota Original:OpenAI Gives ChatGPT Ability to Speak in Five Different Voices

More stories like this are available on bloomberg.com

©2023 Bloomberg L.P.

Guardar