¿Estamos entrando en la era de la "matemática centauro"? ¿Cuánto duraría?
Recapitulación del episodio Gowers–ChatGPT 5.5 Pro (mayo de 2026) y su paralelo con el "ajedrez centauro" de Garry Kasparov.
Nota del autor: escribo esto como un ingeniero de software senior que vive, ya sin cuestionarla, su propia fase centauro. La cuestión sobre qué le ocurrirá a la matemática me toca como espectador interesado, no como practicante.
En 1997, tras perder contra Deep Blue, Garry Kasparov propuso una variante del ajedrez en la que un humano y una computadora jugarían juntos contra otro dúo análogo. Lo llamó centaur chess, y durante unos quince años los equipos mixtos dominaron tanto a humanos como a máquinas solos. Esa edad de oro terminó: las máquinas mejoraron al punto de que el humano ya no agregaba valor al dúo, y el formato declinó.
En la ingeniería de software, esa fase centauro ya no es prospectiva: los desarrolladores profesionales trabajan hoy de manera rutinaria con asistentes de IA, y la pregunta sobre el rol residual del humano en el dúo es objeto de debate activo, no de especulación. La matemática de investigación parece estar entrando en una transición análoga, aunque más reciente y con métricas de éxito menos objetivas. El episodio que sigue lo ilustra.
1. Qué ocurrió
El 8 de mayo de 2026, Sir Timothy Gowers —medallista Fields, titular de la cátedra de Combinatoria en el Collège de France— publicó en su blog el relato de un experimento. Tomó un conjunto de problemas abiertos planteados por el matemático Melvyn Nathanson en un artículo de marzo de 2026 sobre teoría aditiva de números y se los presentó a ChatGPT 5.5 Pro, sin instrucciones adicionales más allá del enunciado. En aproximadamente una hora de tiempo de cómputo distribuido en varias interacciones, el modelo produjo una mejora sustancial de las mejores cotas conocidas para uno de esos problemas, redactó el argumento como un preprint matemático estándar, y la prueba fue verificada por el propio autor del trabajo previo sobre el que el modelo se apoyó: Isaac Rajagopal, estudiante del MIT.
Gowers calificó el resultado como equivalente a "un capítulo razonable de una tesis de doctorado en combinatoria" y declaró que su aporte matemático personal había sido nulo: no intervino en la prueba, no diseñó prompts elaborados, no orientó al modelo hacia ninguna técnica específica. El interés del episodio reside en tres puntos. Primero, que el problema atacado era investigación auténtica, no un ejercicio cerrado. Segundo, que la idea clave introducida por el modelo fue calificada como original por el autor del marco previo. Tercero, que la verificación humana posterior confirmó la corrección no solo línea por línea, sino a nivel de ideas.
Las secciones que siguen reconstruyen el problema, el estado previo del conocimiento y la contribución específica del modelo, con creciente nivel de detalle técnico. Un lector puede detenerse en cualquiera de ellas habiendo obtenido una comprensión completa hasta ese nivel.
2. La pregunta, en términos llanos
Consideremos un conjunto de cuatro números enteros, por ejemplo el conjunto formado por 1, 3, 7 y 12. Si sumamos todos los pares posibles de elementos —incluyendo cada elemento consigo mismo— obtenemos diez sumas distintas: 2, 4, 6, 8, 10, 13, 14, 15, 19 y 24. Llamamos a este nuevo conjunto el conjunto suma. La pregunta básica de la combinatoria aditiva es cómo se relaciona el tamaño del conjunto original con el tamaño del conjunto suma.
Dos casos extremos ilustran la tensión. Si tomamos la progresión aritmética formada por 1, 2, 3 y 4, muchas sumas coinciden (1+4 y 2+3 dan ambas 5; 2+4 y 3+3 dan ambas 6) y el conjunto suma queda comprimido a apenas siete elementos. En el extremo opuesto, si elegimos los elementos de modo que ninguna suma de dos elementos se repita —lo que se llama un conjunto de Sidon—, el conjunto suma alcanza su tamaño máximo posible. El ejemplo del párrafo anterior, 1, 3, 7 y 12, es precisamente un conjunto de Sidon: las diez sumas son todas distintas, y diez es exactamente el máximo alcanzable cuando el conjunto original tiene cuatro elementos.
Nathanson planteó una variante que invierte la pregunta. Fijado el tamaño deseado del conjunto suma, ¿cuán compacto puede ser el conjunto original? Es decir, dentro de qué rango numérico puede vivir un conjunto que realice ese tamaño suma. El interés práctico es claro: cuanto más compacto sea el conjunto, más eficiente es la construcción. El interés teórico es que esa compacidad mide qué tan apretadas pueden estar las estructuras aditivas con un comportamiento prescrito.
El problema admite una versión generalizada: en lugar de sumar pares, sumar grupos de h elementos a la vez (con repetición permitida). Esto define el conjunto suma generalizado, y para h ≥ 3 la geometría del problema cambia sustancialmente. Es allí donde aparecieron las dificultades que motivaron la pregunta de Nathanson al modelo.
Lo que sigue se vuelve progresivamente más técnico. Quien prefiera dejar la matemática a un lado puede saltar al cierre.
3. El problema, formalizado
Sea A un conjunto finito de enteros no negativos con k elementos. El conjunto suma generalizado hA está formado por todas las sumas de h elementos de A, con repetición permitida.
Los tamaños posibles de hA están acotados entre dos extremos: las progresiones aritméticas producen el mínimo, del orden de hk; los conjuntos donde no hay coincidencias entre sumas de h elementos —llamados conjuntos Bh, la generalización natural de Sidon— producen el máximo, del orden de kh para h fijo. El conjunto de tamaños efectivamente realizables se denomina ℛ(h,k).
La función que Nathanson estudia, denotada N(h,k), es el menor diámetro suficiente para que, eligiendo el conjunto A apropiadamente dentro de los enteros entre 0 y N, se puedan realizar todos los tamaños posibles del conjunto suma generalizado. Es decir: N(h,k) mide qué tan compacto puede ser el "universo" donde habitan estos conjuntos sin perder la capacidad de generar cualquier tamaño admisible.
Estado previo del conocimiento sobre N(h,k):
Cota inferior (elemental). Un argumento de conteo muestra que N(h,k) no puede ser menor que algo del orden de kh. La razón es geométrica: si el universo es chico, no hay espacio para que el conjunto suma alcance los tamaños grandes.
Cota superior (Nathanson, Rajagopal). Para el caso h = 2, Nathanson había demostrado que N(2,k) está acotado por 2k − 1, una cota exponencial. Para h ≥ 3, Rajagopal extendió el resultado y obtuvo también una cota exponencial en k.
Entre la cota inferior polinómica y la cota superior exponencial había, por lo tanto, un gap enorme. Nathanson preguntó explícitamente si podía cerrarse, es decir, si N(h,k) admitía una cota superior polinómica. ChatGPT 5.5 Pro respondió afirmativamente para ambos casos.
4. El caso h = 2: cambiar el componente Sidon
La construcción de Nathanson para sumar pares combina tres ingredientes: un conjunto de Sidon, una progresión aritmética y un punto adicional próximo a la progresión. Variando los parámetros se realizan todos los tamaños intermedios del conjunto suma. El componente Sidon que aparece implícitamente en la prueba inductiva original de Nathanson está formado por potencias de 2 (1, 2, 4, 8, 16, ...), lo cual fuerza un diámetro del orden de 2k.
ChatGPT identificó que ese componente podía reemplazarse por un conjunto de Sidon más eficiente. Es un hecho clásico —construcciones de Singer (1938), Erdős–Turán (1941)— que existen conjuntos de Sidon de k elementos contenidos en un intervalo de diámetro del orden de k2, es decir, polinómico. Sustituyendo ese componente en la construcción de Nathanson, el modelo obtuvo una cota cuadrática para N(2,k).
Como la cota inferior trivial es también cuadrática, el problema queda esencialmente cerrado para h = 2: cota ajustada hasta constantes multiplicativas. El tiempo de cómputo declarado fue de 17 minutos para la construcción, más 2 minutos para la redacción como preprint.
Gowers observa que la idea —"usar un Sidon más eficiente"— resulta obvia una vez reformulada la prueba inductiva original para hacer explícito el componente Sidon. Es plausible que el modelo realizara internamente esa reformulación; resulta difícil determinarlo con certeza.
5. El caso h general: el obstáculo de Rajagopal
Para h ≥ 3, la situación es estructuralmente distinta. La construcción que Rajagopal desarrolló para caracterizar todos los tamaños posibles del conjunto suma combina dos series geométricas como bloques fundamentales, una con cero incluido y otra sin él, ambas formadas por potencias sucesivas de un entero m entre 2 y h.
Estos bloques tienen propiedades aritméticas controladas: pertenecen a clases Bm específicas, y los déficits respecto al máximo posible son funciones de grado conocido en el tamaño del bloque (lineal en un caso, cuadrática en el otro). Esto es lo que permite ensamblar todos los tamaños intermedios del conjunto suma a partir de combinaciones de bloques.
El problema operativo es el diámetro: los elementos de las series geométricas son del orden de mℓ —exponencialmente grandes respecto al tamaño del bloque—. Cualquier construcción combinada que herede esos componentes hereda también el diámetro exponencial. Eso es lo que produce la cota exponencial en k para N(h,k) en el régimen general.
La pregunta concreta que Gowers transmitió al modelo fue: ¿existen bloques alternativos, con las mismas propiedades aritméticas que las series geométricas pero con elementos de tamaño polinómico, no exponencial? Rajagopal mismo no veía cómo construirlos; a priori no era claro siquiera que pudiera hacerse.
6. La idea original: conjuntos disociados de orden alto
La contribución que Rajagopal calificó como original fue la elección del marco técnico. ChatGPT introdujo los conjuntos disociados de orden alto, una clase estructuralmente más fuerte que los conjuntos Bh y conocida en combinatoria aditiva pero no aplicada antes a este problema.
La definición intuitiva: un conjunto es k-disociado si no admite ninguna coincidencia aditiva no trivial entre sumas de hasta k elementos —no solo entre sumas de exactamente k elementos, que es lo que pide la condición Bk, sino entre sumas de cualquier longitud hasta k, incluyendo longitudes desiguales en cada lado. Es decir, la única manera de que una suma de s elementos coincida con una suma de s′ elementos (con s, s′ ≤ k) es que ambas sean reordenación una de la otra.
El hecho crucial es que existen construcciones de conjuntos h-disociados de r elementos contenidos en intervalos de diámetro del orden de rh —polinómico en r. La construcción explícita, debida a Bose–Chowla (1963), usa cuerpos finitos y propiedades de polinomios mínimos. Es decir: tomando r elementos cuidadosamente elegidos dentro de un cuerpo finito, se obtiene un conjunto cuyos elementos crecen polinómicamente pero cuya estructura aditiva es tan rígida como la de una serie geométrica.
A partir de un conjunto r-disociado de orden h2, el modelo construyó los bloques alternativos G y H que reemplazan las series geométricas de Rajagopal. La estructura es la siguiente: G consta del cero, los r elementos disociados originales, y los mismos r elementos multiplicados por m; H es análogo pero sin el cero.
La intuición de por qué funciona es la siguiente. Todas las coincidencias aditivas problemáticas en las series geométricas originales se derivan de combinar una o dos instancias de la relación elemental "m veces tal elemento es igual a tal otro". En los bloques nuevos esa misma relación aparece exactamente entre los pares construidos por diseño. La condición disociativa garantiza que no aparecen coincidencias espurias adicionales: cualquier relación aditiva no trivial entre sumas de hasta h elementos de G o H se traduciría en una relación entre los elementos disociados subyacentes, contradiciendo su definición. El orden disociativo h2 —y no simplemente h— es necesario porque los elementos de los nuevos bloques se forman como múltiplos de los elementos disociados, y esa duplicación efectiva hay que absorberla.
El paso final del argumento ensambla los bloques para todos los valores de m entre 2 y h mediante una construcción auxiliar en un espacio de dimensión 2(2h − 2), y luego proyecta esa estructura multidimensional a los enteros mediante un encaje de Freiman estándar. El resultado es una cota polinómica para N(h,k), con exponente del orden de h3.
Para h fijo, la cota es polinómica en k, lo cual cierra el gap exponencial-polinómico que era la pregunta original.
7. Qué queda abierto y qué significa
La nueva cota superior, con exponente del orden de h3, y la cota inferior trivial, con exponente h, acotan N(h,k) dentro del régimen polinómico, pero el exponente exacto sigue siendo desconocido. Determinarlo —y en particular ver si el exponente verdadero es lineal en h como sugiere la cota inferior— queda como problema abierto. El aporte del modelo no clausuró el problema; lo trasladó al interior de un régimen mucho más fino.
Sobre el significado del episodio mismo, Gowers es prudente. Distingue dos lecturas. En la más modesta, el modelo aplicó una técnica conocida en combinatoria aditiva a un problema donde la aplicación no era inmediata pero tampoco insondable. En la más fuerte, el modelo sostuvo una cadena de razonamiento técnico durante decenas de pasos, identificó dónde estaba la ineficiencia del argumento previo, eligió una herramienta de un dominio adyacente y diseñó la sustitución no trivial que resolvía el cuello de botella. Gowers se inclina por una posición intermedia y deja la cuestión filosófica abierta.
La observación que el propio Gowers destaca como más consecuente es metodológica, no matemática. Los problemas "abiertos pero abordables" —el insumo histórico para introducir a estudiantes de doctorado en la investigación— dejan de funcionar como tales si un LLM los resuelve en una hora. La frontera de lo que constituye una contribución original se desplaza, y los criterios para evaluar el trabajo matemático asistido por IA todavía no están establecidos.
8. Volviendo al centauro
En el episodio que acabamos de recapitular, el aporte humano fue, en palabras del propio Gowers, nulo en términos matemáticos: el modelo identificó el cuello de botella, eligió la herramienta y la aplicó. Lo que el humano aportó fue de otra naturaleza: seleccionó el problema, decidió qué papers cargar como contexto, validó el resultado, transmitió las preguntas a Rajagopal para verificación independiente. Es un trabajo de curaduría y juicio, no de matemática técnica. Si esa división del trabajo es estable —si el humano conserva un rol no marginal en el dúo durante un período significativo, como ocurrió con el centauro ajedrecístico entre 1998 y 2013—, o si será transitoria y los modelos absorberán también la curaduría y el juicio, es la pregunta abierta que el episodio plantea y que ni Gowers ni nadie está hoy en condiciones de responder.
1. Gowers, T. (8 de mayo de 2026). "A recent experience with ChatGPT 5.5 Pro." Blog de Gowers, gowers.wordpress.com. Con contribución de Isaac Rajagopal y los preprints generados por el modelo.