La evaluación en educación se vio obligada a cambiar rápidamente durante la pandemia, con el imperativo de digitalizar los exámenes. Y desde hace un año, la evaluación está en medio de una potencial disrupción aún mayor, con la llegada de una nueva generación de herramientas de inteligencia artificial. Esta vez, la disrupción puede afectar no solo cómo se lleva a cabo la evaluación, sino también qué se evalúa y por qué.
Un informe del fondo de inversión Emerge Education y la organización sin fines de lucro británica Jisc, analiza cómo la inteligencia artificial generativa impacta en la educación y, particularmente, en la evaluación de aprendizajes.
En noviembre del año pasado, ChatGPT irrumpió en escena y registró más de un millón de usuarios en cinco días. Rápidamente se convirtió en la más conocida de las herramientas de IA generativa. Puede decirse que ChatGPT es un parteaguas en el uso de la tecnología. Usa grandes modelos de aprendizaje para generar texto similar al humano basado en los extensos conjuntos de datos que se le han enseñado, y está continuamente aprendiendo y mejorando. ChatGPT ha sido acompañado por herramientas similares para tareas específicas, incluidos Bing y Google Bard, y herramientas de texto a imagen como DALL-E 2, mientras que Microsoft ha integrado dos herramientas de IA, Copilot y Business Chat, en Microsoft 365, disponibles en Word, Excel, PowerPoint, Outlook, Teams y más.
ChatGPT es capaz de producir ensayos de alta calidad con una mínima intervención humana, lo que genera preocupaciones sobre nuevas formas de plagio, integridad académica y la viabilidad de continuar utilizando ensayos como medio de evaluación. En el informe de Emerge y Jisc se refiere la experiencia de Paul Taylor, profesor de Informática de la Salud en UCL, que probó a ChatGPT con una pregunta de examen que había escrito para un curso sobre el uso de tecnología digital en atención médica y descubrió que la respuesta de la IA era “coherente, completa y se ciñe al tema, algo que los estudiantes a menudo no logran hacer”.
Si bien se considera que la evaluación basada en texto es el área de riesgo principal inmediato, el potencial de la Inteligencia Artificial para interrumpir la producción de medios a través de su capacidad para crear arte, video y audio convincentes amplía su alcance a gran parte del plan de estudios. Es un campo que se mueve rápidamente y estos problemas solo van a aumentar a medida que la IA se vuelve cada vez más sofisticada. Más allá de la integridad académica, existen preocupaciones sobre el sesgo inherente en los modelos de IA y el riesgo para la diversidad en el currículo. También existen preocupaciones ambientales, como la huella de carbono, que es un factor de riesgo creciente. Sin embargo, si bien el enfoque en el sector hasta ahora ha estado en los riesgos, esta tecnología también ofrece oportunidades.
Pero, continúan los autores, en lugar de continuar la imposible “carrera armamentista” para hacer que los ensayos sean a prueba de plagio, el surgimiento de la IA podría presentar a los educadores la oportunidad de crear técnicas de evaluación más auténticas y relevantes que se centren en el pensamiento crítico, la resolución de problemas y las habilidades de razonamiento.
ChatGPT, entonces, también podría apoyar los procesos de evaluación, reduciendo el tiempo y la carga de trabajo de la facultad para algunas tareas que actualmente requieren mucho tiempo, como generar preguntas de opción múltiple para bancos de preguntas. También podría apoyar la calificación y clasificación. Sin embargo, para aprovechar este potencial, el personal debe contar con el apoyo y el tiempo para rediseñar sus evaluaciones (y rediseñar el plan de estudios, ya que el diseño de la evaluación es parte del proceso de diseño curricular más amplio) y una mayor comprensión de las prestaciones de los sistemas y plataformas que tienen en su institución.