Microsoft ha pasado los últimos dos años añadiendo nuevas y llamativas características de productividad a Teams, y ahora la empresa está revisando cómo funcionan los fundamentos gracias a la inteligencia artificial.
Todos los lectores en algún momento han estado en una llamada en la que alguien tiene una acústica deficiente que dificulta escucharlos, o ha visto a dos personas tratar de hablar al mismo tiempo creando un incómodo momento de “no, usted adelante por favor”.
Bueno, debido a estas situaciones, Microsoft ha implementado nuevas mejoras en la calidad de voz impulsadas por IA, en las que los contextos anteriormente mencionados deberían mejorar o incluso eliminar estas molestias diarias.
Sumando mejoras en la calidad del sonido en las llamadas
Microsoft está utilizando ahora modelos de aprendizaje automático para mejorar la acústica de la habitación en donde se encuentre la persona para que ya no suene como si se estuviera escondido en una cueva.
“Si bien hemos estado haciendo todo lo posible con el procesamiento de señales digitales para hacer un muy buen trabajo en Teams, ahora hemos comenzado a usar el aprendizaje automático por primera vez para construir la cancelación de eco donde realmente se puede reducir el eco de todos los diferentes dispositivos”, explica Robert Aichner, gerente principal de programas para la nube de conversación inteligente y comunicaciones en Microsoft, en una entrevista para The Verge.
Microsoft ha estado probando esto durante meses, midiendo sus modelos en el mundo real para garantizar que los usuarios de Teams se den cuenta de la reducción del eco y las mejoras en la calidad de las llamadas.
El fabricante de software utilizó 30.000 horas de habla para ayudar a entrenar a sus modelos, y capturó miles de dispositivos a través de una colaboración colectiva, donde se paga a los usuarios de Teams para grabar su voz y reproducir el audio desde su dispositivo.
“También simulamos unas 100 000 habitaciones diferentes. La acústica de la habitación juega un papel importante en la cancelación de eco”, dice Aichner para el citado medio. El resultado son grandes mejoras en la calidad del audio de las llamadas y una eliminación del eco que también permite a varias personas hablar al mismo tiempo. Se pueden ver todas las mejoras en el siguiente video:
Cómo funciona la nueva IA de Microsoft Teams
Si Teams detecta que el sonido está rebotando o reverberando en una habitación, lo que resulta en un audio poco profundo, el modelo también convertirá el audio capturado y lo procesará para que suene como si los participantes de Teams estuvieran hablando en un micrófono de corto alcance.
La parte más impresionante es la capacidad de las personas de interrumpirse entre sí en las llamadas de Microsoft Teams, sin la incómoda superposición en la que no se puede escuchar a la otra persona debido al eco.
Microsoft está implementando todas estas novedades en Teams, junto con las mejoras que ha realizado anteriormente con la supresión de ruido basada en IA. Todo el procesamiento se realiza localmente en los dispositivos cliente, en lugar de en la nube.
“Dijimos que queremos hacerlo en el cliente, porque la nube sigue siendo cara si quieres hacer todas las llamadas procesadas en la nube, y obviamente tendríamos que pasar ese costo al cliente”, explica Aichner a The Verge.
Eso significaría restringir potencialmente estas importantes mejoras de Teams a los clientes de pago, y la ruta en el dispositivo significa que características como la supresión de ruido están disponibles en el 90% de los dispositivos que utilizan Teams.
Todas estas nuevas mejoras de Microsoft Teams ya están disponibles, junto con algunas optimizaciones de pantalla en tiempo real para el texto en los vídeos y mejoras basadas en la IA en las restricciones de ancho de banda durante las llamadas de vídeo o de uso compartido de pantalla.
SEGUIR LEYENDO