Inteligencia artificial crea impresiones 3D con tan solo una frase del humano

Los prototipos que se conocen hasta el momento han tenido muchos errores

(Shutterstock)

Son muy conocidos los modelos de inteligencia artificial que producen imágenes y textos a pedido de los usuarios, los cuales se ven en una pantalla, pero ahora esos resultados se podrían materializar con un modelo llamado Shap-E.

La nueva inteligencia artificial generativa, que fue estudiada por investigadores de OpenAI, es capaz de crear objetos como modelos en 3D que pueden ser manipulados y renderizados en archivos que posteriormente podrían ser utilizados por diseñadores.

Pese a que Shap-E tiene gran potencial para producir imágenes de este tipo, estas aún tienden a presentar una baja resolución y algunos desperfectos como deformidad o baja resolución de las simulaciones. El estilo de modelado está lejos de la calidad necesaria para avanzar con el desarrollo de la los objetos virtuales simulados.

El nuevo modelo de IA generativa, cuyo código de programación está disponible en un repositorio de GitHub, aún no llega a crear imágenes en 3D comparables a la producción de un videojuego o al realismo de otros sistemas como el que se genera con el procesador de Unreal Engine 5, pero es un avance con respecto a otros modelos que solo producen contenido en dos dimensiones.

La inteligencia artificial conocida como Sharp-E permite crear modelos en 3D que pueden ser introducidos al sistema de una impresora 3D. (Captura)

En ese sentido, aún cuando solo tenga la capacidad de producir imágenes en 3D con una baja resolución y defectos, con unas pocas mejoras en la calidad, podría utilizarse para crear proyectos de impresión 3D y traer a la realidad un modelo creado enteramente por la inteligencia artificial usando las indicaciones entregadas por usuarios humanos.

Sin embargo, las capacidades actuales de los computadores siguen lejos de un nivel óptimo pues se espera que las creaciones de la inteligencias artificiales sean lo más rápidas posibles. En este caso, Shap-E termina su operación en aproximadamente 15 segundos en caso de que el dispositivo con el que se trabaje tenga un procesador gráfico poderoso como el NVIDIA V100.

En ese sentido, la posibilidad de que esta tecnología tenga usos prácticos en el corto plazo es complicada debido a su accesibilidad, la calidad actual y el estado en el que se encuentra.

Generación de objetos usando fotografías

A diferencia de Shap-E, la tecnología desarrollada por NVIDIA no tiene la capacidad de crear objetos animados en tres dimensiones. Su aplicación requiere de que un usuario le brinde una fotografía al modelo de inteligencia artificial llamado “GET3D”, que procesa la imagen y la convierte en una versión 3D de la misma.

(foto: Kaedim)

Según el anuncio de la compañía, los ingenieros entrenaron el modelo de IA usando 1 millón de imágenes. Utilizando varias GPU A100 Tensor Core, el equipo alcanzó su objetivo en dos días. Según la compañía, GET3D puede producir 20 objetos por segundo con una sola tarjeta gráfica, lo que facilitaría el trabajo de los artistas y productores de contenido.

“El mundo real está lleno de variedad: las calles están llenas de edificios únicos, con diferentes vehículos zumbando y diversas multitudes pasando. Modelar manualmente un mundo virtual 3D que refleje esto requiere mucho tiempo, lo que dificulta completar un entorno digital detallado”, menciona NVIDIA.

Esta tecnología podría servir entonces para facilitar el proceso del modelado en 3D de un objeto existente en el mundo real. Por ejemplo, se podría tomar la fotografía de un auto, ingresarla al sistema de la inteligencia artificial y tener una versión propia y modificable del mismo vehículo.