El sorprendente bot de inteligencia artificial (IA) Chat GPT sigue acumulando proezas, pues luego de aprobar los exámenes de posgrado en Derecho y Economía hechos por las universidades estadounidenses de Minnesota y Pensilvania, ahora está cerca de pasar las pruebas necesarias para ejercer como médico en Estados Unidos.
Una investigación llevada a cabo por la revista especializada PLOS Digital Health, señala que el chatbot de OpenAI consiguió responder correctamente 60 % de las preguntas del USMLE (el Examen de Licencia Médica de los Estados Unidos, por sus siglas en inglés).
Justamente, 60 % es el requisito mínimo de aciertos que cualquier aspirante a doctor debe de obtener en la prueba. El USMLE está conformado por tres tipos de preguntas: tipo test justificando la respuesta, cuestionamientos sin justificar y de respuesta abierta.
Para probar a Chat GPT, se usaron 375 preguntas seleccionadas del examen aplicado en junio de 2022. Los resultados fueron revisados por dos médicos y las discrepancias sobre algunas de las cuestiones fueron evaluadas por un tercer doctor.
En este sentido, la IA alcanzó una media de respuestas acertadas de entre 52.4 % y 75 % en cada uno de los pasos que componen la prueba, una tasa de aciertos muy cercana a la que necesitan los aspirantes profesionales para comenzar a ejercer en EU.
A pesar de los buenos resultados, la investigación halló algunas limitaciones en la popular IA, pese a los esfuerzos para mejorarla que está llevando a cabo la startup encargada de crearla.
“Tiene limitaciones como un tamaño de casos limitado (solo fue testado con 350 preguntas). También representa un escenario limitado puesto que solo trabaja con textos. De hecho, se eliminaron 26 preguntas que contenían imágenes u otra información no textual (con la que ChatGPT no puede trabajar)”, explicó Alfonso Valencia, director de Ciencias de la vida en el Centro Nacional de Supercomputación de Barcelona.
Por otro lado, José del Barrio, jefe de la startup dedicada al desarrollo de soluciones basadas en IA Samaipata, comentó que este tipo de tecnología no es infalible, por lo que hay que tener cuidado con tomar en serio todas sus respuestas.
“Es muy fácil que se descontrolen y ofrezcan información que no es veraz o que puede resultar controvertida. Hay un riesgo, aunque sean muy buenos respondiendo preguntas y puedan parecer muy coherentes”, explicó.
Este tipo de estudios han demostrado que Chat GPT ha mejorado a pasos agigantados, pues incluso ya supera a otros modelos de lenguaje natural que fueron entrenados exclusivamente con información biométrica.