Una reciente investigación de OpenAI y diversas instituciones asociadas ha revelado hallazgos sorprendentes sobre GPT-5, un modelo de inteligencia artificial que empieza a actuar menos como un sofisticado motor de búsqueda y más como ese brillante colega que te ayuda a resolver problemas complejos. En un estudio integral abarcando las áreas de matemáticas, física, biología y ciencias de la computación, los investigadores documentaron casos en los que el modelo no solo recuperó información, sino que también generó pruebas novedosas, identificó conexiones ocultas entre campos dispares y condensó meses de trabajo teórico en solo horas.
Uno de los hallazgos más llamativos es que GPT-5 logró resolver cuatro problemas matemáticos previamente no resueltos. Entre ellos se encuentra el Problema de Erdős #848, que había desconcertado a los matemáticos durante décadas. La contribución del modelo fue un análisis de estilo estabilidad que los matemáticos humanos habían pasado por alto, entrelazando capas de intuición humana y análisis automático.
Es importante enfatizar que esto no significa que la inteligencia artificial vaya a reemplazar a los científicos. Timothy Gowers, un medallista de Fields que participó en el estudio, compara las contribuciones de GPT-5 con las de un supervisor de investigación con amplios conocimientos: útil y, a veces, perspicaz, pero aún no al nivel de ser considerado coautor en la mayoría de los trabajos científicos.
La verdadera magia radica en lo que se ha denominado el «factor de compresión». Brian Spears, del Laboratorio Nacional de Lawrence Livermore, utilizó GPT-5 para modelar la propagación de quemado termonuclear en experimentos de fusión. Seis horas de trabajo colaborativo con la IA lograron lo que él estima que hubiera tomado seis meses de trabajo con un equipo de posdoctorados. Esto no solo representa un incremento en la eficiencia; sugiere un cambio fundamental en la manera en que podría conducirse la investigación.
Un aspecto notable del modelo es su capacidad para realizar una «búsqueda literaria profunda», que va mucho más allá de la simple coincidencia de palabras clave. Por ejemplo, identificó que un nuevo resultado en estimación de densidad era matemáticamente equivalente a trabajos sobre «conjuntos de Pareto aproximados» en optimización multiobjetivo, una conexión que los autores humanos habían pasado por alto debido a la diferencia terminológica entre los campos. Además, GPT-5 localizó soluciones a diez problemas de Erdős que habían permanecido «abiertos», incluyendo hallazgos en alemán de décadas pasadas.
A pesar de estos avances, el estudio también destaca las limitaciones del modelo. Experimentos realizados por Derya Unutmaz en inmunología evidencian tanto la promesa como los riesgos. Por un lado, GPT-5 identificó correctamente que el 2-desoxi-D-glucosa interfería en la glicosilación N-enlazada y no solo en la glucólisis en células T. No obstante, el modelo requería una supervisión humana constante para evitar afirmaciones exageradas y razonamientos defectuosos.
De manera similar, el trabajo de Christian Coester sobre algoritmos en línea revela que GPT-5 sobresale en subproblemas específicos y bien definidos, pero enfrenta dificultades ante preguntas teóricas más abiertas. Aunque logró producir un elegante contraejemplo utilizando el teorema de Chevalley-Warning, a menudo generaba argumentos erróneos para resultados más generales que debían ser corregidos por humanos.
Un patrón fascinante emergió en varias disciplinas: GPT-5 mejora drásticamente cuando se le proporciona un «andamiaje» adecuado. Alex Lupsasca descubrió que, tras trabajar primero en un problema más sencillo, el modelo pudo derivar simetrías complejas en ecuaciones de agujeros negros, reproduciendo meses de trabajo humano en minutos.
Sin embargo, no todas las historias son triunfantes. La experiencia de Venkatesan Guruswami y Parikshit Gopalan con «códigos evitadores de cliques» sirve como una advertencia crucial. Aunque GPT-5 proporcionó una prueba correcta para un problema que les había intrigado durante años, se dieron cuenta con vergüenza de que la misma prueba había sido publicada tres años antes. Este episodio destaca un desafío crítico en la investigación asistida por IA: asegurar la atribución adecuada cuando el modelo podría no identificar siempre sus fuentes.
Para los profesionales del campo de la IA, estos hallazgos sugieren que nos encontramos en un punto de inflexión. GPT-5 no es solo una versión mejorada de GPT-4; representa un cambio cualitativo en las capacidades. Tal vez lo más importante es que se revela que el camino hacia adelante no consiste en reemplazar la inteligencia humana, sino en crear nuevas formas de colaboración entre humanos e inteligencia artificial.
Los investigadores enfatizan que usar GPT-5 de manera efectiva requiere un profundo conocimiento del dominio. Es esencial saber cuándo el modelo está «alucinando», cuándo desafiar sus afirmaciones y cómo estructurar problemas adecuadamente. En resumen, cuanto mayor sea la comprensión en su campo, más valor se puede extraer de estos colaboradores de IA.
A medida que avanzamos, la pregunta es cómo adaptaremos nuestros flujos de trabajo, sistemas de atribución y nuestra comprensión de la creatividad misma para acomodar a estos nuevos colaboradores. Si estos primeros experimentos son indicativos, el futuro de la ciencia podría parecer menos una competición entre humanos y máquinas y más una colaboración entre lo mejor de ambos, trabajando juntos para expandir los límites del conocimiento.
vía: AI Accelerator Institute





