Como todos los años en el Perú, los estudiantes de medicina que desean obtener la residencia médica deben pasar por una serie de exámenes para obtener este grado profesional que, en muchos casos, resulta tener un grado de dificultad.
Antes de obtener el título de Residentes, los médicos deben rendir previamente un Examen Nacional de Medicina (ENAM) y sus calificaciones les facilitan elegir los centros de salud para desarrollar su Servicio Rural Urbano Marginal en Salud (SERUMS). Sin embargo, no todos logran obtener un resultado favorable, por lo que un investigador acudió a la tecnología para experimentar qué tan complicado resulta.
Así, Javier Flores Cohaila, docente investigador en educación médica de la Universidad Científica del Sur y autor principal del estudio, le consultó a ChatGPT y otros dispositivos de Inteligencia Artificial (IA) si es que pueden realizar el examen, pero haciéndose pasar por estudiantes de medicina peruanos. El resultado te sorprenderá.
Cabe destacar que el 43% de los egresados de medicina de todas las universidades del Perú inscritos al SERUMS desaprobaron el ENAM, según el estudio que analizó las notas desde el 2009 hasta el 2019.
¿ChatGPT logró aprobar el ENAM?
Tras la solicitud de Flores, se pudo comprobar que la inteligencia artificial de ChatGPT-4 (la versión más actualizada) logró aprobar el Examen Nacional de Medicina (ENAM) con un 86% de precisión, en la prueba del 2022.
“ChatGPT logró un puntaje de 17, y comúnmente sacar más de 15 en el ENAM es algo muy extraño. Además, el rendimiento de la inteligencia artificial aumentaba si se le daban especificaciones sobre cómo enfocar la pregunta. Por ejemplo, cuando se le indicó que ‘pretenda ser un médico de Perú’, ChatGPT solo se equivocó en 9 preguntas”, explicó Javier Flores Cohaila a la agencia Andina.
Resultados por encima del promedio
Según el investigador, el estudio se basó en los datos del ENAM 2022, que constaba de 180 preguntas de opción múltiple. Así, el resultado de la IA se comparó con una muestra de 1.025 estudiantes de medicina que rindieron el mismo examen.
El equipo de investigación analizó diversos factores como el tipo de pregunta, el conocimiento específico de Perú, la discriminación, la dificultad y la calidad de las preguntas, y el tema para determinar su impacto en las respuestas incorrectas.
Los resultados revelaron que ChatGPT obtuvo 156 respuestas correctas, mientras que otras aplicaciones similares de IA aprobaron con menos puntaje. Por ejemplo, BingAI con 148; GPT-3, 120; Bard, 120; y Claude, 118.
No se espera sustituir a un médico
Javier Flores Cohaila aclaró que esta investigación no busca comparar el coeficiente intelectual de los estudiantes de medicina con la IA, y que tampoco busca demostrar que la Inteligencia Artificial puede sustituir a un médico; ya que su trabajo va más allá de solo responder a preguntas.
“Ser médico, es mucho más que dar un examen de licenciamiento. Ser médico es el rol de comunicación que tenemos con los pacientes, la colaboración con otros profesionales de la salud, el liderazgo de la salud de la población, la promoción de la salud, etc.”, afirmó el investigador.
Sin embargo, adelantó que estos resultados podrían alentar a las universidades y grupos de investigación a ayudar con la educación médica.
ENAM 2023
Como se recuerda, el pasado 3 de diciembre se llevó a cabo en todo el Perú el ENAM 2023. Desde el 2006, esta prueba es un requisito obligatorio para postular al Sistema Nacional de Residentado Médico, por lo que otorga un puntaje.
Además, esta nota también representa un 70% de la calificación que se toma en cuenta para la distribución de las plazas del Servicio Rural Urbano Marginal de Salud, más conocido como el Serums.