Monday, 15 de December de 2025
RSS Contacto
MERCADOS
Cargando datos de mercados...
Tecnología

La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato

La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato
Artículo Completo 793 palabras
En 2019 a un joven investigador llamado François Chollet se le ocurrió crear un benchmark para IA. La idea era como poco rarita, porque en 2019 no había prácticamente nada con lo que probar ese benchmark. En realidad Chollet se adelantó al futuro, porque aun faltaban tres años para que apareciera ChatGPT y se iniciara la fiebre por la IA.  Luego llegarían más y más benchmarks sintéticos para medir el rendimiento de las IAs, pero ARC-AGI era un benchmark distinto. Mientras que en muchos otros benchmarks la capacidad de memorización del modelo es crucial, aquí se ponía a prueba la capacidad de pensamiento abstracto y generalización de la IA. En Xataka Las IA se están volviendo muy listas. Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil Los problemas propuestos en ARC-AGI y su sucesor, ARC-AGI 2, constan en gran medida de puzzles visuales que son relativamente fáciles de resolver por los seres humanos, pero que hasta ahora eran casi imposibles para las máquinas. En los últimos dos años hemos ido viendo no obstante cómo los modelos de IA iban mejorando en comprensión abstracta y generalización, y poco a poco resolvieron más y más puzzles de ARC-AGI. ¿El problema? Gastaban un dineral para hacerlo.  Y ahí es donde entra GPT-5.2. La IA puede resolver casi todo. La pregunta es cuánto cuesta hacerlo El año pasado o3-preview logró resolver el 87% de ARC-AGI 1. El hito fue tan llamativo que hasta los propios responsables del benchmark publicaron un anuncio al respecto. Para lograrlo, eso sí, o3-preview ejecutó 100 tareas con un coste total de 456.000 dólares: cada una costó 4.560 dólares.  Fuente: ARC-AGI Prize Ayer se publicó GPT-5.2, la última versión del modelo fundacional de IA de OpenAI. Su rendimiento en otros benchmarks era excepcional, pero lo que realmente llama la atención es cómo se comportó en ARC-AGI 1. No por lograr resolver un 90,5% de los problemas con GPT-5.2 Pro (X-High), no, sino por cuánto costó cada tarea.  La cifra: 11,65 dólares por tarea. 390 veces menos que hace un año. De hecho una versión aún más barata, GPT-5.2 (X-High) logró un 86,2% con un coste de tan solo 0,96 dólares por tarea. Alucinante. ARC-AGI 2 sigue siendo un desafío para la mayoría de modelos, pero GPT-5.2 ha dado otro salto de calidad excepcional. Fuente: ARC-AGI Prize. Chollet y su equipo sabían que la IA acabaría superando su test ARC-AGI tarde o temprano, así que en marzo de 2025 publicaron ARC-AGI 2, la segunda versión de su benchmark, para ponérselo aún más difícil a las máquinas. Ese test es aún un verdadero desafío para la mayoría de modelos, que hasta ahora apenas habían resuelto un 38% de los problemas en el mejor de los casos (Claude Opus 4.5).  GPT-5.2 ha logrado resolver casi el 55%. Es un salto colosal. Y de nuevo, con un coste realmente sorprendente de 15,72 dólares por tarea. La tendencia es clara: la IA no solo está volviéndose mejor, sino que es cada vez más barata.  Eso son buenas noticias para todos, porque equilibran esa ya clara percepción de que el escalado no funciona tanto como en el pasado. Los saltos en rendimiento no son tan llamativos —aunque estas pruebas con ARC-AGI desmontan ese argumento—, pero sí lo son los saltos en cuanto a coste.  La carrera de la IA parece haber alcanzado un punto de inflexión. La verdadera pregunta no es si la IA logrará resolver un problema, sino cuánto costará resolverlo. Y la evolución de GPT-5.2 parece demostrar claramente algo crucial: que la IA cada vez resuelve más cosas a menor precio.  Eso es además algo crítico para una OpenAI que está en una situación económica delicada. Ahora que estamos más en una especie de meseta en cuanto a ganancias en rendimiento, lograr ser más baratos y eficientes es clave para el futuro de la empresa. Y parece que GPT-5.2, además de una respuesta a Gemini 3 Pro, es un paso claro en esa dirección. En Xataka | Hay una carrera en la que Anthropic le está ganando la partida a OpenAI: en la de ser rentable - La noticia La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato fue publicada originalmente en Xataka por Javier Pastor .
La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato

Con GPT 5.2 la pregunta no es ya si la IA puede resolver cosas. Es cómo de barato puede resolverlas

Sin comentariosFacebookTwitterFlipboardE-mail 2025-12-14T10:30:02Z

Javier Pastor

Editor Senior - Tech

Javier Pastor

Editor Senior - Tech Linkedintwitter9782 publicaciones de Javier Pastor

En 2019 a un joven investigador llamado François Chollet se le ocurrió crear un benchmark para IA. La idea era como poco rarita, porque en 2019 no había prácticamente nada con lo que probar ese benchmark. En realidad Chollet se adelantó al futuro, porque aun faltaban tres años para que apareciera ChatGPT y se iniciara la fiebre por la IA. 

Luego llegarían más y más benchmarks sintéticos para medir el rendimiento de las IAs, pero ARC-AGI era un benchmark distinto. Mientras que en muchos otros benchmarks la capacidad de memorización del modelo es crucial, aquí se ponía a prueba la capacidad de pensamiento abstracto y generalización de la IA.

En XatakaLas IA se están volviendo muy listas. Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil

Los problemas propuestos en ARC-AGI y su sucesor, ARC-AGI 2, constan en gran medida de puzzles visuales que son relativamente fáciles de resolver por los seres humanos, pero que hasta ahora eran casi imposibles para las máquinas. En los últimos dos años hemos ido viendo no obstante cómo los modelos de IA iban mejorando en comprensión abstracta y generalización, y poco a poco resolvieron más y más puzzles de ARC-AGI. ¿El problema?

Gastaban un dineral para hacerlo. 

Y ahí es donde entra GPT-5.2.

La IA puede resolver casi todo. La pregunta es cuánto cuesta hacerlo

El año pasado o3-preview logró resolver el 87% de ARC-AGI 1. El hito fue tan llamativo que hasta los propios responsables del benchmark publicaron un anuncio al respecto. Para lograrlo, eso sí, o3-preview ejecutó 100 tareas con un coste total de 456.000 dólares: cada una costó 4.560 dólares

Fuente: ARC-AGI Prize

Ayer se publicó GPT-5.2, la última versión del modelo fundacional de IA de OpenAI. Su rendimiento en otros benchmarks era excepcional, pero lo que realmente llama la atención es cómo se comportó en ARC-AGI 1. No por lograr resolver un 90,5% de los problemas con GPT-5.2 Pro (X-High), no, sino por cuánto costó cada tarea. 

La cifra: 11,65 dólares por tarea. 390 veces menos que hace un año.

De hecho una versión aún más barata, GPT-5.2 (X-High) logró un 86,2% con un coste de tan solo 0,96 dólares por tarea. Alucinante.

ARC-AGI 2 sigue siendo un desafío para la mayoría de modelos, pero GPT-5.2 ha dado otro salto de calidad excepcional. Fuente: ARC-AGI Prize.

Chollet y su equipo sabían que la IA acabaría superando su test ARC-AGI tarde o temprano, así que en marzo de 2025 publicaron ARC-AGI 2, la segunda versión de su benchmark, para ponérselo aún más difícil a las máquinas. Ese test es aún un verdadero desafío para la mayoría de modelos, que hasta ahora apenas habían resuelto un 38% de los problemas en el mejor de los casos (Claude Opus 4.5). 

GPT-5.2 ha logrado resolver casi el 55%. Es un salto colosal.

Y de nuevo, con un coste realmente sorprendente de 15,72 dólares por tarea. La tendencia es clara: la IA no solo está volviéndose mejor, sino que es cada vez más barata

Eso son buenas noticias para todos, porque equilibran esa ya clara percepción de que el escalado no funciona tanto como en el pasado. Los saltos en rendimiento no son tan llamativos —aunque estas pruebas con ARC-AGI desmontan ese argumento—, pero sí lo son los saltos en cuanto a coste. 

La carrera de la IA parece haber alcanzado un punto de inflexión. La verdadera pregunta no es si la IA logrará resolver un problema, sino cuánto costará resolverlo. Y la evolución de GPT-5.2 parece demostrar claramente algo crucial: que la IA cada vez resuelve más cosas a menor precio. 

Eso es además algo crítico para una OpenAI que está en una situación económica delicada. Ahora que estamos más en una especie de meseta en cuanto a ganancias en rendimiento, lograr ser más baratos y eficientes es clave para el futuro de la empresa. Y parece que GPT-5.2, además de una respuesta a Gemini 3 Pro, es un paso claro en esa dirección.

En Xataka | Hay una carrera en la que Anthropic le está ganando la partida a OpenAI: en la de ser rentable

Fuente original: Leer en Xataka
Compartir