ElevenLabs ya permite construir agentes de IA conversacionales compatibles con Gemini, GPT y Claude

Guardar

ElevenLabs ha anunciado que los desarrolladores ya pueden construir en la plataforma agentes conversacionales impulsados por Inteligencia Artificial (IA) generativa, que tienen características personalizables y son compatibles con Gemini, GPT y Claude.

Esta startup de 'software' utiliza la IA generativa enfocada a cuestiones relacionadas con la voz, como la clonación y la transición de texto a voz, y persigue el objetivo de eliminar las barreras lingüísticas de contenido.

La firma, que ya dispone de una herramienta de doblaje de IA y una aplicación de lectura con voces de actores de cine clásico, entre otras características, ha anunciado que ha puesto a disposición de los usuarios agentes de IA conversacionales.

Se trata de una característica que ya habían podido probar algunos usuarios, pero que ya pueden usar todas las personas interesadas en construir estos 'bots', personalizando tanto su tono de voz como la duración de las respuestas, entre otras variables.

En el desarrollo de estos agentes, ElevenLabs ha encontrado mayor dificultad en la integración de la base de conocimientos y la gestión de las interrupciones de los clientes, según ha confirmado el responsable de crecimiento de la empresa, Sam Sklar, a TechCrunch.

Por ese motivo, la firma ha decidido crear un canal concreto para que los desarrolladores puedan construir estos 'bots', lo que facilita su configuración y uso. Un vez se haya iniciado sesión en la cuenta de usuario, se puede elegir un idioma principal y un mensaje determinado para personalizar la experiencia del 'chatbot'.

Los desarrolladores también tienen que seleccionar un modelo de lenguaje grande (LLM, por sus siglas en inglés), esto es Gemini de Google, GPT de OpenaAI o Claude, de Anthropic; así como el nivel de creatividad de las respuestas y el límite de uso de los tokens.

Otras de las opciones configurables son la voz, la latencia, la estabilidad, los criterios de autentificación y la duración máxima de la conversación con el agente de inteligencia artificial.

Por otro lado, los usuarios tienen la posibilidad de añadir su propia base de conocimiento para impulsar el agente, como una url, un bloque de texto o un archivo; así como su propio LLM personalizado.

En este sentido, conviene recordar que el kit de desarrollo de 'software' (SDK, por sus siglas en inglés) de ElevenLabs es compatible con Python, JavaScript, React y Swift. Asimismo, para una mayor personalización, la compañía ofrece la interfaz de programación de aplicaciones (API) WebSocket.

Guardar