
ElevenLabs ha anunciado que los desarrolladores ya pueden construir en la plataforma agentes conversacionales impulsados por Inteligencia Artificial (IA) generativa, que tienen características personalizables y son compatibles con Gemini, GPT y Claude.
Esta startup de 'software' utiliza la IA generativa enfocada a cuestiones relacionadas con la voz, como la clonación y la transición de texto a voz, y persigue el objetivo de eliminar las barreras lingüísticas de contenido.
La firma, que ya dispone de una herramienta de doblaje de IA y una aplicación de lectura con voces de actores de cine clásico, entre otras características, ha anunciado que ha puesto a disposición de los usuarios agentes de IA conversacionales.
Se trata de una característica que ya habían podido probar algunos usuarios, pero que ya pueden usar todas las personas interesadas en construir estos 'bots', personalizando tanto su tono de voz como la duración de las respuestas, entre otras variables.
En el desarrollo de estos agentes, ElevenLabs ha encontrado mayor dificultad en la integración de la base de conocimientos y la gestión de las interrupciones de los clientes, según ha confirmado el responsable de crecimiento de la empresa, Sam Sklar, a TechCrunch.
Por ese motivo, la firma ha decidido crear un canal concreto para que los desarrolladores puedan construir estos 'bots', lo que facilita su configuración y uso. Un vez se haya iniciado sesión en la cuenta de usuario, se puede elegir un idioma principal y un mensaje determinado para personalizar la experiencia del 'chatbot'.
Los desarrolladores también tienen que seleccionar un modelo de lenguaje grande (LLM, por sus siglas en inglés), esto es Gemini de Google, GPT de OpenaAI o Claude, de Anthropic; así como el nivel de creatividad de las respuestas y el límite de uso de los tokens.
Otras de las opciones configurables son la voz, la latencia, la estabilidad, los criterios de autentificación y la duración máxima de la conversación con el agente de inteligencia artificial.
Por otro lado, los usuarios tienen la posibilidad de añadir su propia base de conocimiento para impulsar el agente, como una url, un bloque de texto o un archivo; así como su propio LLM personalizado.
En este sentido, conviene recordar que el kit de desarrollo de 'software' (SDK, por sus siglas en inglés) de ElevenLabs es compatible con Python, JavaScript, React y Swift. Asimismo, para una mayor personalización, la compañía ofrece la interfaz de programación de aplicaciones (API) WebSocket.
Últimas Noticias
Padilla sostiene que el fin del VIH como problema de salud pública está "más lejos que nunca" a nivel político

Fósiles revelan una especie de salamandra que medía 40 centímetros
Investigadores descubren en Tennessee la Dynamognathus robertsoni, una salamandra extinta de 40 centímetros, revelando su papel en la diversidad de especies de salamandras en los Apalaches

Alcaraz debuta con victoria en Queen's y avanza a octavos

Canadá entrega un nuevo paquete militar y préstamos a Ucrania por valor de más de 2.500 millones de euros
Canadá anuncia un paquete de ayuda militar y préstamos a Ucrania, refuerza sanciones contra Rusia y destaca la presión internacional a favor de un alto el fuego y la paz

Dani Carvajal: "Xabi Alonso no ha querido hacer una revolución, con sus matices, quiere ser continuista"
