Un procesador fotónico podría aumentar la rapidez y la eficiencia energética de la IA

Guardar

Tras una década de investigación, científicos del MIT (Estados Unidos) y de otras instituciones internacionales han desarrollado un nuevo chip fotónico que permite realizar cálculos de aprendizaje automático con luz, siendo una alternativa más rápida y con mayor eficiencia energética para el desarrollo de la inteligencia artificial, tal y como se publica en 'Fotónica de la naturaleza'.

Los modelos de redes neuronales profundas que impulsan las aplicaciones de aprendizaje automático más exigentes de la actualidad se han vuelto tan grandes y complejos que están superando los límites del hardware informático electrónico tradicional. La clave de este nuevo modelo, es que anteriores dipositivos fotónicos presentaban alguas barreras.

En concreto, existen algunos tipos de cálculos de redes neuronales que un dispositivo fotónico no puede realizar, lo que requiere el uso de electrónica fuera del chip u otras técnicas que obstaculizan la velocidad y la eficiencia.

Sin embargo, este nuevo hardware fotónico supera estos obstáculos. Los investigadores demostraron que este procesador fotónico totalmente integrado puede realizar todos los cálculos clave de una red neuronal profunda de forma óptica en el chip.

Así, el dispositivo óptico pudo completar los cálculos clave para una tarea de clasificación de aprendizaje automático en menos de medio nanosegundo y logró una precisión de más del 92 por ciento: un rendimiento comparable al del hardware tradicional. El chip, compuesto de módulos interconectados que forman una red neuronal óptica, se fabrica mediante procesos de fundición comerciales, lo que podría permitir el escalado de la tecnología y su integración en la electrónica.

A largo plazo, el procesador fotónico podría conducir a un aprendizaje profundo más rápido y con mayor eficiencia energética para aplicaciones computacionalmente exigentes como el lidar, la investigación científica en astronomía y física de partículas, o las telecomunicaciones de alta velocidad.

"Hay muchos casos en los que no solo importa el rendimiento del modelo, sino también la rapidez con la que se puede obtener una respuesta. Ahora que tenemos un sistema de extremo a extremo que puede ejecutar una red neuronal en óptica, a una escala de tiempo de nanosegundos, podemos empezar a pensar en aplicaciones y algoritmos de un nivel superior", explica Saumil Bandyopadhyay visitante en el Grupo de Fotónica Cuántica e Inteligencia Artificial dentro del Laboratorio de Investigación en Electrónica (RLE) del MIT y que es el autor principal de un artículo sobre el nuevo chip.

En primer lugar, su sistema codifica los parámetros de una red neuronal profunda en luz. Luego, una serie de divisores de haz programables, que se demostraron en el artículo de 2017, realiza la multiplicación de matrices sobre esas entradas. Los datos pasan luego a NOFU programables, que implementan funciones no lineales al desviar una pequeña cantidad de luz hacia fotodiodos que convierten las señales ópticas en corriente eléctrica. Este proceso, que elimina la necesidad de un amplificador externo, consume muy poca energía. "Permanecemos en el dominio óptico todo el tiempo, hasta el final, cuando queremos leer la respuesta. Esto nos permite lograr una latencia ultrabaja", detalla Bandyopadhyay.

Lograr una latencia tan baja les permitió entrenar de manera eficiente una red neuronal profunda en el chip, un proceso conocido como entrenamiento in situ que normalmente consume una enorme cantidad de energía en hardware digital. "Esto es especialmente útil para sistemas en los que se realiza un procesamiento en el dominio de señales ópticas, como navegación o telecomunicaciones, pero también en sistemas que se desea aprender en tiempo real", matiza el experto.

Así, el sistema fotónico logró una precisión de más del 96 por ciento durante las pruebas de entrenamiento y más del 92 por ciento durante la inferencia, lo que es comparable al hardware tradicional. Además, el chip realiza cálculos clave en menos de medio nanosegundo. Todo el circuito se fabricó utilizando la misma infraestructura y los mismos procesos de fundición que se utilizan para producir chips informáticos CMOS. Esto podría permitir que el chip se fabricara a gran escala, utilizando técnicas probadas que introducen muy pocos errores en el proceso de fabricación.

Bandyopadhyay concluye que el objetivo principal de su trabajo futuro será ampliar el tamaño de su dispositivo e integrarlo con dispositivos electrónicos del mundo real, como cámaras o sistemas de telecomunicaciones. Además, los investigadores quieren explorar algoritmos que puedan aprovechar las ventajas de la óptica para entrenar sistemas más rápido y con una mejor eficiencia energética.

Guardar