AlphaGeometry2 de DeepMind logra nivel de medalla de oro en la OIM

AlphaGeometry2 de DeepMind logra nivel de medalla de oro en la OIM

Foto: Sergio F Cara, Freepik

AlphaGeometry2, el nuevo modelo de inteligencia artificial desarrollado por DeepMind, logró un rendimiento equiparable al de un medallista de oro en la Olimpiada Internacional de Matemáticas (OIM). Esta mejora marca un avance significativo respecto a su versión anterior, AlphaGeometry, que el año pasado obtuvo un desempeño similar al de un medallista de plata en la competencia.

 

De acuerdo con un artículo publicado en arXiv, AlphaGeometry2 resolvió 84 % de los problemas de geometría propuestos en la OIM en los últimos 25 años, una mejora notable respecto al 54 % de precisión alcanzado por su predecesor. En contraste, equipos de India y China desarrollaron métodos que lograron un rendimiento similar al de los medallistas de oro, aunque en un subconjunto más reducido de problemas de geometría de la competencia.

 

Un modelo avanzado de resolución matemática

 

La OIM es una de las competencias de matemáticas más prestigiosas a nivel mundial y plantea problemas en cuatro áreas: geometría euclidiana, teoría de números, álgebra y combinatoria. Entre ellas, la geometría representa un desafío particular para la inteligencia artificial, ya que requiere pruebas rigurosas que respalden cada afirmación.

 

El modelo AlphaGeometry2 combina un sistema neurosimbólico con un modelo de lenguaje especializado, lo cual le permite razonar de manera abstracta y verificar automáticamente sus resultados. A diferencia de otras perspectivas basadas exclusivamente en redes neuronales, este sistema incluye un razonamiento matemático estructurado diseñado por humanos, lo que le ayuda a reducir errores y evitar respuestas incorrectas.

 

Para esta nueva versión, DeepMind incorporó el modelo de lenguaje de gran tamaño Gemini, mejorando su capacidad para manipular y analizar objetos geométricos en el plano. El sistema ahora puede mover puntos en una línea para cambiar la altura de un triángulo y resolver ecuaciones lineales con mayor precisión.

 

"Me imagino que no pasará mucho tiempo antes de que las computadoras obtengan la máxima puntuación en la OMI", afirmó Kevin Buzzard, matemático del Imperial College de Londres.

 

Además de AlphaGeometry2, DeepMind presentó AlphaProof, un sistema enfocado en la resolución de problemas de teoría de números, álgebra y combinatoria. Juntos, estos avances amplían las capacidades de la inteligencia artificial en el campo de las matemáticas y acercan a estos sistemas a niveles de resolución comparables a los de los mejores solucionadores humanos.

 

Futuras mejoras y próximos desafíos

 

Según los investigadores de DeepMind, futuras actualizaciones de AlphaGeometry2 incluirán la capacidad de abordar problemas que involucren desigualdades y ecuaciones no lineales. Estas mejoras serán fundamentales para que el sistema pueda "resolver completamente la geometría", según el artículo publicado en arXiv.

 

El próximo gran reto para estos sistemas de inteligencia artificial llegará en julio, cuando se celebre la Olimpiada Internacional de Matemáticas en Sunshine Coast, Australia. Una vez que los problemas sean publicados, las IA podrán analizarlos y medir su desempeño en comparación con los participantes humanos. Sin embargo, los sistemas no están autorizados a competir oficialmente ni pueden recibir medallas.

 

Un incentivo adicional en la carrera por mejorar estos modelos es el Premio de la Olimpiada Matemática de IA, el cual otorgará 5 millones de dólares al primer sistema de inteligencia artificial que logre una medalla de oro en la prueba general de la OIM. No obstante, para ser elegibles, los participantes deben ser de código abierto, una condición que los modelos de DeepMind aún no cumplen. (Notipress)

Notas Relacionadas