Un par de sistemas de inteligencia artificial desarrollados por Google DeepMind hicieron historia esta semana y se llevaron a casa una medalla de plata en la Olimpiada Internacional de Matemáticas (OMI). AlphaProof y AlphaGeometry 2 colaboraron para abordar seis problemas desafiantes de la prestigiosa competencia.
Cabe señalar que el sistema conjunto logró resolver cuatro de seis problemas y obtuvo 28 puntos de 42 puntos posibles, es decir, sólo un punto menos que el límite de oro.
Cabe destacar que la inteligencia artificial logró una puntuación perfecta en el problema más difícil del concurso, que sólo cinco concursantes pudieron resolver. Este notable logro coloca a la IA de DeepMind entre las mejores mentes matemáticas jóvenes del mundo.
«Lo que hace va mucho más allá de lo que pueden hacer las búsquedas de fuerza bruta, por lo que claramente sucede algo interesante cuando funciona». Él dijo El profesor Timothy Gores, medallista Fields y ex ganador de la medalla de oro de la OMI, es quien registró las respuestas de la IA.
Diferentes formas de resolver problemas.
Los dos sistemas utilizaron dos enfoques diferentes. El modelo de lenguaje AlphaProof, que combina el aprendizaje por refuerzo, abordó dos problemas de álgebra y un problema de teoría de números. Aprovecha las «matemáticas formales» para escribir pruebas matemáticas que puedan verificarse como programas, lo que permite que el sistema aprenda y mejore.
AlphaGeometry 2, por otro lado, se centró en problemas de geometría y resolvió sorprendentemente su problema en sólo 16 segundos. Su solución implicó un enfoque creativo que sorprendió incluso a los expertos humanos, demostrando la capacidad de la IA para pensar de forma innovadora.
“Ha habido algunos ejemplos legendarios de [computer-aided] “Guías más largas que Wikipedia. Este no es el caso: estamos hablando de resultados muy breves al estilo humano”. Agregado Profesor Gores.
Logros y limitaciones
Aunque la inteligencia artificial sobresale en algunas áreas, sufre en otras. En dos de las seis preguntas, los regímenes no lograron ningún progreso. Además, los sistemas de inteligencia artificial de Google requirieron cantidades variables de tiempo para resolver problemas, desde minutos hasta tres días.
A modo de ejemplo, mientras que a los competidores humanos se les da un plazo de nueve horas, la IA de DeepMind tardó tres días en resolver un problema particularmente difícil.
El profesor Gores reconoció que este logro iba “mucho más allá de lo que antes podían hacer las herramientas automatizadas de demostración de teoremas”, pero señaló una serie de reservas importantes.
«La principal ventaja es que el programa lleva mucho más tiempo que los competidores humanos», dijo. «Si los competidores humanos hubieran tenido esta cantidad de tiempo por problema, sin duda habrían recibido puntuaciones más altas».
También enfatizó la importancia de la intervención humana para traducir los problemas al lenguaje formal.
«¿Nos estamos acercando al punto en que los matemáticos ya no sean necesarios? Es difícil decirlo. Creo que todavía estamos a uno o dos pasos de eso», concluyó Gores.
Potencial futuro
A pesar de las limitaciones, el logro de Google DeepMind representa un gran paso adelante en las capacidades de razonamiento matemático de la IA.
El desarrollo de sistemas de inteligencia artificial capaces de abordar problemas matemáticos complejos podría tener implicaciones de gran alcance para diversos campos, desde la investigación científica hasta la educación.
Sobre el editor
Aman Tripathi Periodista y editor de noticias activo y con múltiples talentos. Ha cubierto noticias periódicas y de última hora para muchas publicaciones de noticias y medios de comunicación importantes, incluidos The Hindu, Economic Times, Tomorrow Makers y muchos más. Aman tiene experiencia en política, viajes y noticias tecnológicas, especialmente en el campo de la inteligencia artificial, algoritmos avanzados y blockchain, y tiene una gran curiosidad por todo lo relacionado con la ciencia y la tecnología.
More Stories
El código en los datos previos al entrenamiento mejora el rendimiento del LLM en tareas que no son de codificación
Un marco para resolver ecuaciones diferenciales parciales equivalentes puede guiar el procesamiento y la ingeniería de gráficos por computadora
Epiroc ha lanzado una nueva plataforma de perforación de producción de pozos largos