Uncategorized

GPT-4.1: Los nuevos modelos de OpenAI son excelentes escribiendo código

OpenAI ha anunciado hoy el lanzamiento de una nueva familia de modelos de inteligencia artificial optimizados para sobresalir en codificación, a medida que intensifica sus esfuerzos por defenderse de la competencia cada vez más dura de empresas como Google y Anthropic. Los modelos están a disposición de los desarrolladores a través de la interfaz de programación de aplicaciones (API) de OpenAI.

OpenAI lanza tres tamaños de modelos

GPT 4.1, GPT 4.1 Mini y GPT 4.1 Nano. Kevin Weil, jefe de producto de OpenAI, ha declarado en una transmisión en vivo que los nuevos modelos son mejores que el modelo más utilizado de OpenAI, el GPT-4o, y mejores que su modelo más grande y potente, el GPT-4.5, en algunos aspectos.

GPT-4.1 obtuvo un 55% en SWE-Bench, una prueba de referencia muy utilizada para medir la destreza de los modelos de codificación. La puntuación es varios puntos porcentuales superior a la de otros modelos de OpenAI. Los nuevos modelos son “geniales codificando, son geniales siguiendo instrucciones complejas, son fantásticos construyendo agentes“, afirmó Weil.

La capacidad de los modelos de IA para escribir y editar código ha mejorado considerablemente en los últimos meses, lo que permite crear prototipos de software de forma más automatizada y mejorar las capacidades de los llamados agentes de IA. Rivales como Anthropic y Google han introducido modelos que son especialmente buenos escribiendo código.

La llegada de GPT-4.1 lleva semanas rumoreándose. Al parecer, OpenAI probó el modelo en algunas tablas de clasificación populares bajo el seudónimo de Alpha Quasar, según las fuentes. Algunos usuarios del modelo “sigiloso” informaron sobre impresionantes capacidades de codificación. “Quasar solucionó todos los problemas abiertos que tenía con otro código generado a través de LLM que estaba incompleto”, escribió una persona en Reddit.

8 veces más código

Todos los nuevos modelos pueden analizar ocho veces más código a la vez, lo que mejora su capacidad para introducir mejoras y corregir errores. Los nuevos modelos también son mejores a la hora de seguir instrucciones dadas por los usuarios, lo que reduce la necesidad de repetir comandos de diferentes maneras para obtener el resultado deseado. OpenAI presentó demostraciones de GPT-4.1 construyendo diferentes aplicaciones, incluida una aplicación de tarjetas para el aprendizaje de idiomas.

“Los desarrolladores se preocupan mucho por la codificación, y hemos estado mejorando la capacidad de nuestro modelo para escribir código funcional”, dijo Michelle Pokrass, que trabaja en el posentrenamiento de OpenAI, durante la transmisión en vivo del lunes. “Hemos estado trabajando para que siga diferentes formatos y explore mejor los repos, ejecute pruebas unitarias y escriba código que compile”.

GPT-4.1 es un 40% más rápido que GPT-4o, el modelo de OpenAI más utilizado por los desarrolladores. El costo de las consultas de los usuarios se ha reducido en un 80% en esta última versión, declara OpenAI.

En el livestream de hoy, Varun Mohan, CEO de Windsurf, una popular herramienta para la codificación de IA, expresó que la compañía había estado probando GPT-4.1 y encontró que el nuevo modelo era “60%” mejor que GPT-4o según sus propios puntos de referencia. “Hemos descubierto que GPT-4.1 tiene sustancialmente menos casos de comportamiento degenerado”, aclaró Mohan, señalando que el nuevo modelo pasa menos tiempo leyendo y editando archivos irrelevantes por error.

500 millones de usuarios activos semanales

En los últimos dos años, OpenAI ha convertido el febril interés por ChatGPT, el notable chatbot presentado por primera vez a finales de 2022, en un negocio en expansión que vende acceso a chatbots y modelos de IA más avanzados. En una entrevista de TED la semana pasada, Altman comentó que OpenAI tenía 500 millones de usuarios activos semanales, y que el uso estaba “creciendo muy rápidamente.”

OpenAI ofrece ahora una gran variedad de modelos con distintas capacidades y precios. El modelo más grande y potente de la empresa, llamado GPT-4.5, se lanzó en febrero, aunque OpenAI calificó el lanzamiento de “avance de investigación” porque el producto es aún experimental.