GPT-5.4, el nuevo modelo de OpenAI, puede ejecutar tareas en una computadora en nombre del usuario

OpenAI lanzó GPT-5.4, su primer modelo de inteligencia artificial (IA) con capacidades nativas de uso informático, lo que significa que el sistema puede operar una computadora en nombre del usuario y realizar distintas tareas dentro de diversas aplicaciones. Con estas funciones, el nuevo algoritmo representa, hasta ahora, la apuesta más sólida de la startup en el mercado de los agentes autónomos.

“GPT-5.4 integra lo mejor de nuestros avances recientes en razonamiento, codificación y flujos de trabajo de agencia en un único modelo de vanguardia. El resultado es un sistema capaz de realizar trabajos reales complejos con precisión, eficacia y eficiencia”, aseguró la compañía.

La prioridad de OpenAI no es crear una IA más potente, es convertirse en pilar de la economía

Sarah Friar, directora financiera de OpenAI, aseguró que la adopción de la IA en sectores críticos generará nuevos modelos económicos, tendencia que la startup pretende liderar.

En su versión estándar, la tecnología está disponible tanto para la API como para Codex, la herramienta de programación basada en IA desarrollada por la empresa. En una variante denominada GPT-5.4 Thinking, el sistema puede utilizarse desde ChatGPT. OpenAI también ofrece una edición avanzada conocida como GPT-5.4 Pro que, disponible en ChatGPT y la API, está diseñada “para quienes buscan el máximo rendimiento en tareas complejas”, según la firma.

Una de las características más destacadas de GPT-5.4 Thinking es que muestra de forma anticipada su proceso de razonamiento, lo que permite realizar ajustes mientras la respuesta se genera para obtener un resultado más personalizado, según las necesidades específicas del usuario. “Esto facilita guiar al sistema hacia el resultado exacto deseado sin tener que empezar de cero ni requerir múltiples iteraciones adicionales”, explica OpenAI. Esta función ya se encuentra disponible en las versiones web y Android de ChatGPT. Se espera que próximamente también llegue a la aplicación para iOS del chatbot.

De acuerdo con la empresa, GPT-5.4 Thinking también incorpora mejoras relevantes en tareas de investigación profunda en la web y en la gestión de memoria de contexto, características que permiten ofrecer respuestas más rápidas y de mayor calidad.

Por otra parte, desde la API o Codex, GPT-5.4 admite una ventana de contexto de hasta un millón de tokens, lo que otorga a los agentes de IA capacidades superiores para planificar, ejecutar y verificar tareas de largo plazo. “GPT-5.4 es nuestro modelo de razonamiento con mayor eficiencia en el uso de tokens hasta la fecha, ya que emplea una cantidad significativamente menor para resolver problemas en comparación con GPT-5.2, lo que se traduce en menores costos y mayores velocidades”, señalan los desarrolladores.

El sistema fue entrenado y diseñado para ejecutar diversas operaciones en una computadora de manera autónoma mediante código. OpenAI explica que la tecnología puede analizar la interfaz del equipo a través de capturas de pantalla. A partir de esa información, es capaz de ejecutar comandos físicos de teclado y ratón de forma lógica, imitando el comportamiento de una persona.

La compañía asegura que su nueva arquitectura obtuvo puntuaciones récord en pruebas de uso de computadoras. También alcanzó una evaluación del 83% en la prueba GDPval, un estándar diseñado por la propia empresa que mide capacidades para completar tareas relacionadas con trabajo del conocimiento.

OpenAI afirma que GPT-5.4 es menos propenso a cometer errores factuales o generar alucinaciones en comparación con sus sistemas más avanzados anteriores. El nuevo producto presenta 33% menos probabilidades de equivocarse al citar datos específicos, así como 18% menos margen de error en respuestas generales.

El equipo de desarrollo concluye que “junto con los avances en razonamiento general, codificación y trabajo de conocimiento profesional, GPT-5.4 permite construir agentes más confiables, flujos de trabajo de desarrollo más rápidos y resultados de mayor calidad”.

Related Posts

NVIDIA’s Vision For AI Factories – ‘Major Trend in the Data Center World’

Codex: La nueva herramienta para escribir código de OpenAI permite usar una computadora virtual en la web

What Is Rollovers as Business Startups?