- Sensores de ondas milimétricas pueden captar vibraciones de menos de 1 mm en los celulares y transcribir el audio captado a texto.
- Un modelo de inteligencia artificial logra transcripciones con un 50% de precisión en palabras desde 125 cm de distancia.
- Este método no se ve afectado por el ruido de fondo, pero enfrenta desafíos al aislar las vibraciones del teléfono.
Lo esencial: investigadores de Pennsylvania State University han demostrado que un sensor de ondas milimétricas, junto con un modelo de inteligencia artificial, puede captar las vibraciones de un celular y transcribir el audio de una conversación.
La técnica implica el uso de un sensor que opera entre 77 y 81 GHz, capaz de detectar movimientos de apenas 7 micrómetros, y aunque la transcripción generada es imperfecta, alcanza un 67% de precisión en caracteres.
Por qué importa: este método de espionaje podría significar un nuevo riesgo para la privacidad, dado que permite captar conversaciones sin necesidad de intervención física en los dispositivos. Aunque aún es limitado y enfrenta retos para aislar el sonido en presencia de otros movimientos, el avance señala posibles aplicaciones para espionaje en condiciones controladas.
Cómo funciona esta modalidad de ataque con IA y radares
El sistema conocido como mmWave-Whisper, desarrollado por Suryoday Basak y su equipo en la Universidad Estatal de Pensilvania, muestra cómo es posible capturar y transcribir conversaciones de teléfonos móviles usando un radar de ondas milimétricas comercial y un modelo avanzado de reconocimiento de voz.
Este enfoque emplea sensores que operan en el rango de 77 a 81 gigahercios para detectar las minúsculas vibraciones que emite el altavoz de un teléfono móvil al reproducir audio. Estas vibraciones, aunque apenas perceptibles (alrededor de 7 micrómetros), pueden captarse a distancias de hasta 125 cm, incluso en entornos ruidosos.
El radar funciona emitiendo pulsos de ondas electromagnéticas y detectando las ondas reflejadas al impactar con un objeto, en este caso, un teléfono móvil. Este proceso permite medir movimientos extremadamente pequeños, como las vibraciones del altavoz al transmitir la voz de una llamada.
Una vez que el radar captura estas vibraciones, un modelo de inteligencia artificial, en este caso el Whisper de OpenAI adaptado para el proyecto, transcribe la señal en texto. Aunque el audio resultante es de baja calidad y presenta un ruido significativo, el sistema ha logrado una tasa de precisión del 44,74 % en palabras y del 62,52 % en caracteres.
La implementación de mmWave-Whisper ha tenido que superar varios retos técnicos. Las vibraciones detectadas por el radar se encuentran casi al nivel del ruido base del sistema, lo que complica su aislamiento. Además, la señal de radar enfrenta interferencias por parte de osciladores de frecuencia y señales reflejadas que generan ruido en el audio capturado.
Para enfrentar estas dificultades, los investigadores utilizaron técnicas de corrección de errores estadísticos y seguimiento de variaciones de fase en la señal del radar. Estas técnicas permitieron identificar los micromovimientos y convertirlos en un flujo de audio que luego es transcrito.
Qué información puede espiar este ataque de los teléfonos móviles
La capacidad de capturar fragmentos de conversaciones representa una amenaza para la privacidad de los usuarios. Aunque el sistema tiene un nivel de precisión menor al de los modelos de reconocimiento de voz tradicionales, la posibilidad de captar palabras y frases aisladas es suficiente para comprometer información sensible. Esto es particularmente relevante en contextos donde se manejan datos personales, financieros o corporativos.
Estudios previos en el campo de la detección de audio por medio de radiofrecuencia se habían limitado a altavoces o a vocabularios reducidos. Sin embargo, mmWave-Whisper es el primer sistema en realizar transcripciones con un conjunto completo de palabras, demostrando su capacidad para trabajar con un vocabulario extenso y frases de diferente longitud.
Esta capacidad aumenta el potencial de uso malicioso, ya que permite que terceros puedan escuchar de forma encubierta conversaciones sin necesidad de micrófonos ni otros dispositivos de espionaje evidentes.
Cómo evitar este tipo de espionaje con radares e inteligencia artificial
La idea de que un radar pueda espiar nuestras conversaciones a través de las vibraciones de un celular genera preocupaciones sobre la seguridad de las llamadas telefónicas. Si bien la tecnología aún tiene limitaciones, como la baja tasa de precisión y la distancia relativamente corta de operación, su avance plantea la necesidad de tomar medidas preventivas frente al desarrollo de sistemas similares en manos criminales.
Entre las soluciones propuestas para protegerse contra este tipo de ataques se encuentra el blindaje de los teléfonos móviles. Materiales específicos podrían emplearse para cubrir las partes del dispositivo que emiten vibraciones, como el altavoz, y así reducir la posibilidad de detección.
Otra medida de defensa potencial es el desarrollo de tecnologías de interferencia de señal que puedan bloquear los intentos de escucha a través de radares, impidiendo la recopilación de datos de forma remota.