Технологія продовжує зростати семимильними кроками, спираючись на кілька областей для вивчення нових можливостей і функцій. Одна з них - вміти «реконструювати» обличчя людини через фрагмент голосу.
Дослідження Speech2Face ,представлене в 2019 році на конференції Vision and Recovition Patterns, показало, що Штучний інтелект (AI) можерозшифрувати зовнішність людини за допомогою коротких аудіосегментів.
У статті пояснюється, що метою дослідників Те-Хён Он, Талі Декель, Чангіля Кіма, ІнбарМосері, Вільяма Фрімена та Майкла Рубінштейна програми досліджень і науки MIT є не реконструкція обличчя людей однаково, а зробити образ з фізичними характеристиками, які пов'язані з проаналізовано аудіо.
Щоб досягти цього, вони використовували, розробили та навчили глибоку нейронну мережу , яка проаналізувала мільйони відео, знятих з YouTube, де люди розмовляють. Під час навчання модель навчилася співвідносити голоси з обличчями, дозволяючи створювати зображення з фізичними ознаками, схожими на ораторів, включаючи вік, стать та етнічну приналежність.
Тренінг проводився під наглядом та з використанням узгодження облич та голосів інтернет-відео, без необхідності моделювати детальні фізичні характеристики обличчя.
Вони детально розповіли, що оскільки це дослідження може мати аспекти, чутливі до етнічної приналежності, а також приватності, це те, що до відтворення облич не додано жодних конкретних фізичних аспектів, і вони запевняють, що, як і будь-яка інша системамашинного навчання, вона з часом покращується, оскільки при кожному використанні збільшує свою бібліотеку знань.
Хоча показані тести показують, що Speeech2Face має велику кількість збігів між обличчями та голосами, він також мав деякі недоліки, де етнічна приналежність, вік чи стать не відповідали використовуваному вибірці голосу.
Модель призначена для представлення статистичних кореляцій, які існують між рисами обличчя з голосом. Слід пам'ятати, що AI вивчили через відео YouTube, які не представляють реальної вибірки населення в світі, наприклад, в деяких мовах він показує розбіжності з даними навчання.
У цьому сенсі саме дослідження рекомендує наприкінці своїх результатів, щоб ті, хто вирішив дослідити та модернізувати систему, розглянути ширший вибірку людей та голосів, щоб машинне навчання мало ширший репертуар відповідності та відтворення облич.
Програма також змогла відтворити голос у мультфільмах, які також мають неймовірну схожість з голосами проаналізованих аудіо.
Оскільки ця технологія також може бути використана для зловмисних цілей, відтворення обличчя залишається максимально наближеним до людини і не дає повних облич, оскільки це може бути проблемою для конфіденційності людей. Тим не менш, дивно, що технологія може зробити з аудіо зразків.
ПРОДОВЖУЙТЕЧИТАТИ:
Más Noticias
Esta es la manera más efectiva de quitar la grasa del horno con un solo producto
Si bien muchos recurren a productos comerciales, los remedios caseros son igual de efectivos y, en muchos casos, más seguros

¿Quién es Onelia Molina, la actual novia de Mario Irivarren? Edad, profesión, romances y todo sobre la chica reality
La chica reality está en el ojo de la tormenta a raíz del polémico video que han protagonizado Alejandra Baigorria y Mario Irivarren en la boda de la rubia

El Día de las madres y otras celebraciones en Perú para el mes de mayo
Te compartimos cuáles son las efemérides y días festivos que se celebran en Perú para este mes

Ni Petro ni Uribe, el cantante Heredero pidió a los políticos que no le envíen ni le pidan saludos: “No quiero enemigos”
El intérprete de ‘Coqueta’ se cansó de que lo quieran relacionar con el mandatario de los colombianos y con el expresidente paisa. Por eso, hizo un llamado a sus seguidores: “No puedo dividir al público”

La rectoría de la Universidad Nacional se pronunció sobre la masiva presencia de indígenas en la institución: “Llegaron más de los previstos”
A través de un comunicado, la Universidad Nacional autorizó en su campus de Bogotá la estadía de la minga indígena con el propósito de garantizar su derecho a la protesta
