
Meta presentó su próximo modelo de traducción de voz a texto, que será compatible con casi 100 idiomas, llamado SeamlessM4T. Esta tecnología busca minimizar las limitaciones lingüísticas y permitir el entendimiento simultáneo.
Este sistema también permitirá la tradición de texto a texto y de voz a voz, con una capacidad de reconocer 100 idiomas de entrada y generar resultados en 35 más de salida.
El lanzamiento de este modelo está enfocado en los desarrolladores, ya que esta licencia permite a los expertos colaborar y mejorar el modelo, allanando el camino para futuras innovaciones, por lo que por ahora no se trata de un producto de consumo para los usuarios.
Las novedades del modelo multilenguaje
Una característica notable que distingue a SeamlessM4T es su capacidad para identificar el code-switching, que es un fenómeno lingüístico en el que los hablantes cambian entre dos o más idiomas en una sola oración.
Esta característica es especialmente desafiante para los sistemas de inteligencia artificial, y la inclusión de esta posibilidad es un punto diferente frente a los sistemas actuales del mercado. Para demostrarlo, Meta informó que ya ha sido capaz de diferenciar entre hindi, telugu e inglés en una única oración, lo que promete una mayor exactitud en la traducción en situaciones del mundo real.

A diferencia de modelos de traducción anteriores, que dividían el proceso de traducción entre sistemas variados, SeamlessM4T realiza la tarea completa de traducción en un solo paso, lo que representa un avance en la eficiencia y precisión en el entendimiento automático y en tiempo real.
Otro elemento a destacar en el desarrollo de este modelo es su capacidad para identificar palabras tóxicas o sensibles, que según la compañía son aquellas que incitan al odio, la violencia, la profanidad o el abuso. De esta forma garantizan que la traducción no introduzca toxicidad que no estaba presente en el material original.
“Filtramos la toxicidad desequilibrada en los datos de entrenamiento. Si la entrada o la salida contenían cantidades diferentes de toxicidad, eliminábamos esa secuencia de aprendizaje”, publicó la compañía en su anunció.
Además, el equipo de investigación de Meta ha trabajado para mitigar el sesgo de género en las traducciones. SeamlessM4T es capaz de identificar y cuantificar este sesgo, asegurando que las traducciones sean equitativas y no introduzcan conceptos innecesarios.
Por ejemplo, el sistema es capaz de detectar si la persona dijo ‘doctora’ en español y de esa forma asignar un pronombre femenino en un idioma distinto sin una gramática de género equivalente si es necesario, ya que algunas lenguas no tienen en su estructura una distinción de género marcada, como el caso del inglés.

El lanzamiento de este nuevo modelo hace parte de los proyectos que viene mostrando la empresa en el campo de la inteligencia artificial. Hace un tiempo, la compañía presentó modelos y conjuntos de datos como No Language Left Behind y SpeechMatrix, que también permiten la traducción automática.
Estas últimas herramientas también han sido claves en la moderación eficiente del contenido en plataformas como Facebook e Instagram, donde se realizan publicaciones en grandes cantidades idiomas de idiomas.
Otro sistema de IA que ha mostrado Meta recientemente son AudioCraft, que es un código que permite la generación de texto a sonido y que también solo está disponible para desarrolladores. Sumado al acceso a su modelo de lenguaje más grande llamado Llama 2.
Últimas Noticias
Estados Unidos apuesta por la inteligencia artificial en las aulas, marcando un nuevo rumbo en la política educativa
La orden ejecutiva recién firmada por Donald Trump establece un plan ambicioso para incorporar la inteligencia artificial a la formación escolar, abriendo interrogantes sobre el acceso, la equidad y la implementación real en el sistema educativo

Conoce los mejores secretos de Google para tener el mejor SEO o posicionamiento en buscadores: guía para principiantes
Repetir palabras clave en exceso, ignorar los enlaces internos o descuidar la redacción son errores comunes que pueden afectar negativamente el desempeño SEO de una página

Apple mejora los AirPods: estas son las dos nuevas funciones para la grabación de audio y la calidad en llamadas
Fueron anunciadas en WWDC 2026 y estarán disponibles solo para tres modelos de estos audífonos

Administra servidores desde tu PC: aprende a instalar RSAT en Windows 11 paso a paso
Mejora la seguridad y productividad de tu equipo. La gestión remota con RSAT reduce riesgos y optimiza el tiempo de los administradores de sistemas

Meta apuesta por la superinteligencia: el nuevo laboratorio de Mark Zuckerberg busca superar la mente humana con inteligencia artificial
La compañía ha iniciado una reestructuración interna y un reclutamiento sin precedentes para crear un equipo de élite que desarrolle sistemas de inteligencia artificial capaces de realizar tareas más allá de las capacidades humanas
