El aprendizaje automático (machine learning) es una disciplina que estudia cómo construir programas que puedan aprender comportamiento, partiendo de la observación de datos. Entonces, la computadora extrae patrones de éstos y así, se entrena un modelo.
En la experiencia de usuario sería básicamente que, por ejemplo, Instagram distinga una torta de un seno (4 años atrás, los confundió y censuró una publicación).
En este camino del aprendizaje automático, se realiza la convocatoria Data Challenge 2019. Se trata de la primera edición de un desafío destinado a la comunidad de ciencia de datos a nivel regional.
Propone entrenar un modelo de aprendizaje automático para categorizar productos, tomando solamente títulos (como pudieran ser "remera" o "consola", por ejemplo). Es organizada por Mercado Libre y nació, precisamente, de una problemática detectada en la plataforma.
"Encontramos que cuando un vendedor publica un producto en el sitio, no siempre lo cataloga de forma correcta. Eso dificulta la búsqueda por parte de otros usuarios", explica a Infobae Daniel Rabinovich, COO (director de operaciones) de la compañía, Head Global de Producto y Tecnología.
La plataforma tiene millones de publicaciones de productos y servicios. Si bien esta problemática fue resuelta por la compañía, el fin de la convocatoria es compartir datos para fomentar la comunidad de ciencia de datos a nivel regional.
"En el mundo de la tecnología el concepto de comunidad tiene un rol central, y las ciencias de datos no son la excepción. Estas comunidades suelen estar conformadas por diversos actores, como empresas, profesionales, universidades, investigadores, estudiantes, etc. Por otro lado, la materia prima de las ciencias de datos son, obviamente, los datos, los cuales suelen ser un recurso escaso", explica Rabinovich.
Entonces, bajo esa premisa y problemática, surgió una oportunidad: cómo generar valor en la comunidad de datos. "Por eso creamos Data Challenge. Ponemos a disposición nuestra plataforma y todas las publicaciones que tenemos disponibles, con el objetivo de realizar este desafío. Nuestros datos son un diferencial ya que se encuentran en español y portugués facilitando la participación de más personas de Latinoamérica", agrega.
El desafío Data Challenge 2019 está destinado a participantes de la Argentina, Uruguay, Brasil, Chile, Colombia y México. A una semana del lanzamiento, ya contaba con 1.000 inscriptos. El cierre de las inscripciones es el 21 de septiembre.
"Realmente estamos sorprendidos del interés y repercusión que está teniendo", señala Rabinovich. Respecto de los perfiles de los participantes, hay desde practicantes autodidactas que están dando sus primeros pasos en ciencias de datos, hasta ganadores de competencias internacionales de este tipo.
El cupo femenino, al momento, solo representa alrededor del 10% de los inscriptos. Desde la compañía dicen estar ocupándose de este desbalance que existe históricamente en el rubro tecnológico.
Cómo participar
Luego del proceso de inscripción, los participantes pueden descargarse un dataset (un conjunto de datos) para poder trabajar sobre sus predicciones. Con esa información, usando técnicas de aprendizaje automático y creatividad propia, los participantes deben entrenar sobre un modelo para predecir a qué categoría pertenece cada publicación.
Finalmente, podrán enviar sus predicciones y la performance será reflejada en la tabla de posiciones que definirá quiénes son los 5 ganadores. Según informan desde la compañía, hay alrededor del 97% de los participantes son latinoamericanos, de los cuales un 40% son argentinos, otro 40%, brasileros, y el resto se reparte entre los otros países de la región.
El premio: una cumbre de la inteligencia artificial
El primer y segundo premio de Data Challenge 2019 es un viaje a Khipu, el encuentro más prestigioso de inteligencia artificial. "Dado el prestigio del evento, ser admitido es difícil en términos de logros académicos requeridos. Por eso pensamos que sería bueno darle una oportunidad a otros perfiles, quizás sin tanto historial académico pero con gran capacidad como para ganar un desafío de este tipo", explica Rabinovich.
Khipu en su versión regional tendrá lugar en Montevideo, Uruguay, del 11 al 15 de noviembre. Por primera vez en la historia, la región contará con máximos exponentes de la inteligencia artificial. Por ejemplo, Yoshua Bengio, considerado uno de los padres de deep learning (una familia de técnicas avanzadas de IA), recientemente galardonado con el Premio Turing.
Además, estará presente Jeff Dean, quien lidera Google Brain, el equipo de investigación de IA de Google, entre muchos expositores de clase mundial.
"Muchas de esas personas me formaron sin saberlo. O sea, leí papers de Yoshua Bengio, hice cursos de Nando de Freitas (científico experto en machine learning), usé Tensorflow (una biblioteca de código abierto sobre aprendizaje automático) gracias a Martín Abadi, y PyTorch (biblioteca del estilo de Tensorflow) gracias a Soumith Chintala (científico que trabaja en algoritmos avanzados de IA en Facebook)", dice a Infobae Pablo Zivic, data science expert (experto en ciencia de datos) en Mercado Libre.
Zivic explica que el evento también está organizado por personas "súper" relevantes que hacen que el encuentro cobre muchísima tracción. Y esto se traduce de forma directa en el desarrollo de la comunidad local de aprendizaje automático.
"Hago paralelismo con lo que pasó con la comunidad de machine learning de África luego de que se organice Deep Learning Indaba. Este evento se organizó de manera similar a Khipu. A partir de esa conferencia y el talento que se desarrolló en África, Google abrió su primer Laboratorio de Inteligencia Artificial en África a principios de este año", finaliza Zivic.
MÁS SOBRE ESTE TEMA: