Uncategorized

GPT-5 divide las opiniones entre desarrolladores de software

Amir Salihefendić, fundador de la startup Doist, escribió en un post en las redes sociales que ha estado usando GPT-5 en Cursor y lo ha encontrado “bastante decepcionante” y que “es especialmente malo en la codificación”. Dijo que el lanzamiento de GPT-4 se sentía como un “momento Llama 4”, refiriéndose al modelo de IA de Meta, que también había decepcionado a algunas personas en la comunidad de IA.

En X, el desarrollador Mckay Wrigley escribió que GPT-5 es un “modelo de chat cotidiano fenomenal”, pero cuando se trata de codificar, “continuará usando Claude Code + Opus”.


Foto de una idílica granja estadounidense con una pincelada de pintura blanca irregular en la parte superior.

Sus miembros han expresado opiniones racistas y antisemitas y han elogiado repetidamente a Adolf Hitler y al partido nazi. Su movimiento está creciendo, con cientos de miles de dólares recaudados.


Bueno pero no tanto

Otros desarrolladores describen GPT-5 como “exhaustivo”, a veces útil, pero a menudo irritante por su prolijidad. Wang, que se mostró satisfecha en general con el proyecto de codificación del frontend que asignó a GPT-5, afirma que notó que el modelo era “más redundante”. Está claro que podría haber dado con una solución más limpia o más corta”. Kapoor señala que la verbosidad de GPT-5 puede ajustarse, de modo que los usuarios pueden pedirle que sea menos parlanchín o incluso que haga menos razonamientos a cambio de un mejor rendimiento o un precio más barato.

Itamar Friedman, cofundador y CEO de la plataforma de codificación de IA Qodo, cree que algunas de las críticas a GPT-5 se deben a la evolución de las expectativas en torno a los lanzamientos de modelos de IA: “Creo que mucha gente pensó que la GPT-5 sería otro momento en el que mejoraría todo lo relacionado con la IA, debido a esta marcha hacia la inteligencia artificial general (IAG). Cuando, en realidad, el modelo mejoró en unas pocas subtareas clave”, afirma.

Friedman se refiere a antes de 2022 como “BCE” (Antes de la era de ChatGPT), cuando los modelos de IA mejoraban holísticamente. En la era posterior a ChatGPT, los nuevos modelos de IA suelen ser mejores en ciertas cosas. “Claude Sonnet 3.5, por ejemplo, era el modelo que dominaba la codificación. Y Google Gemini es realmente bueno en la revisión de código, para comprobar si el código es de alta calidad”, afirma Friedman.

OpenAI también ha recibido críticas por la metodología empleada para realizar sus pruebas de referencia y hacer afirmaciones sobre el rendimiento de GPT-5, aunque las pruebas de referencia varían considerablemente en el sector. SemiAnalysis, una empresa de investigación centrada en el sector de los semiconductores y la IA, observó que OpenAI solo ejecutó 477 de las 500 pruebas que se suelen incluir en SWE-bench, un marco relativamente nuevo de la industria de la IA para probar grandes modelos de lenguaje. Esto se refería al rendimiento general del modelo, no solo a la codificación.

La empresa de Altman defiende que siempre prueba sus modelos de IA en un subconjunto fijo de 477 tareas en lugar de las 500 completas de la prueba SWE-bench, porque esas 477 pruebas son las que la empresa ha validado en su infraestructura interna. McCallum también se refirió a la tarjeta del sistema de GPT-5, que señalaba que los cambios en la configuración de verbosidad del modelo pueden “provocar variaciones en el rendimiento de la evaluación”.

Kapoor afirma que las gigantes de IA se enfrentan en última instancia a difíciles compensaciones: “Cuando los desarrolladores de modelos entrenan nuevos modelos, también introducen nuevas restricciones y tienen que tener en cuenta muchos factores: cómo esperan los usuarios que se comporte la IA y cómo se desempeña en ciertas tareas como la codificación agencial, todo ello gestionando el costo. En cierto sentido, creo que OpenAI sabía que no rompería todos esos puntos de referencia, así que hizo algo que, en general, agradaría a un amplio abanico de personas”.

Artículo publicado originalmente en WIRED. Adaptado por Mauricio Serfatty Godoy.