Inicio Inteligencia Artificial Reconocen la IA de Google y OpenAI en Olimpiada Internacional de Matemáticas

Reconocen la IA de Google y OpenAI en Olimpiada Internacional de Matemáticas

Los modelos de Google y OpenAI usaron lenguaje natural para resolver problemas matemáticos de nivel olímpico

Inteligencia artificial

Google y OpenAI anunciaron que sus modelos de inteligencia artificial alcanzaron puntuaciones equivalentes a medalla de oro en la Olimpiada Internacional de Matemáticas (IMO), una competencia global dirigida a estudiantes de preparatoria.

Este resultado representa un avance significativo en la capacidad de razonamiento matemático de los sistemas de IA, acercándolos a niveles comparables con los de los humanos.

Es la primera vez que modelos de IA superan el umbral de puntuación necesario para obtener medalla de oro en esta competencia, resolviendo cinco de los seis problemas presentados. A diferencia de enfoques anteriores que usaban lenguajes formales o cálculos extensos, tanto Google como OpenAI lograron estos resultados utilizando modelos de propósito general que procesan conceptos matemáticos en lenguaje natural.

DeepMind, unidad de inteligencia artificial de Google, trabajó directamente con la organización de la IMO para que sus modelos fueran evaluados oficialmente por el comité. En contraste, OpenAI no participó de manera oficial, pero informó que sus modelos alcanzaron una puntuación equivalente a oro en los problemas de este año, respaldando el resultado con calificaciones emitidas por tres medallistas externos de la IMO.

De acuerdo con Junehyuk Jung, profesor de matemáticas en la Universidad de Brown e investigador visitante en DeepMind, este logro sugiere que la IA podría estar a menos de un año de ser utilizada para resolver problemas matemáticos aún no resueltos en el ámbito académico. Según Jung, la capacidad de resolver problemas complejos de razonamiento en lenguaje natural abre nuevas posibilidades de colaboración entre humanos y sistemas de IA.

OpenAI alcanzó su resultado con un modelo experimental que utiliza un enfoque basado en ampliar significativamente el poder de cómputo en tiempo de prueba. Este método permite que el modelo razone durante más tiempo y procese múltiples líneas de pensamiento en paralelo. Aunque no se reveló el costo exacto del procesamiento requerido, investigadores de OpenAI lo calificaron como muy elevado.

Tanto OpenAI como Google coinciden en que estas capacidades de razonamiento podrían extenderse a otras disciplinas científicas, como la física. Jung, quien ganó una medalla de oro en la IMO en 2003, señaló que este tipo de avances puede tener implicaciones más allá de las matemáticas.

En la edición número 66 de la IMO, realizada en Sunshine Coast, Australia, participaron 630 estudiantes, de los cuales 67 (aproximadamente el 11 por ciento) obtuvieron medalla de oro. DeepMind ya había logrado una puntuación de medalla de plata el año pasado con modelos diseñados específicamente para matemáticas. Este año, Google utilizó un modelo de propósito general llamado Gemini Deep Think, presentado previamente en su conferencia anual de desarrolladores en mayo.

A diferencia de intentos anteriores, el modelo de Google resolvió los problemas completamente en lenguaje natural y dentro del límite oficial de 4.5 horas. Según una publicación del blog oficial, esto marca un cambio importante respecto a los métodos tradicionales que requerían lenguajes formales y procesos de cómputo prolongados.

Por su parte, OpenAI también desarrolló una versión experimental de sus modelos de razonamiento, aunque no planea lanzar una herramienta con ese nivel de capacidad matemática en los próximos meses, según indicó el investigador Alexander Wei en la red social X.

Este año fue la primera vez que la IMO colaboró oficialmente con desarrolladores de inteligencia artificial, permitiendo que algunos resultados fueran evaluados y certificados por el comité organizador. El presidente del consejo de la IMO, Gregor Dolinar, confirmó que las empresas podían publicar sus resultados a partir del lunes.

Google indicó que respetó la solicitud original del comité de no difundir resultados hasta que fueran verificados por expertos independientes y los estudiantes recibieran el reconocimiento correspondiente. OpenAI, que publicó sus resultados el sábado, aseguró haber recibido autorización de un miembro del consejo de la IMO para hacerlo tras la ceremonia de clausura.