Anthropic lanza Claude Opus 4.8, su modelo de IA “más honesto” hasta ahora

Anthropic lanzó Claude Opus 4.8, una actualización de su modelo insignia de inteligencia artificial que promete mejoras en rendimiento, razonamiento y colaboración para tareas complejas de programación, trabajo de conocimiento y ejecución de procesos mediante agentes autónomos. Uno de los principales atractivos de esta nueva versión es que mantiene el mismo precio y consumo de tokens en su configuración estándar respecto a su antecesor.

La compañía explicó que “Opus 4.8 se basa en Opus 4.7 con un juicio más agudo, mayor honestidad sobre su propio progreso y la capacidad de trabajar de forma independiente durante más tiempo que sus predecesores”.

Qué tan peligroso es en realidad Claude Mythos, el nuevo modelo de IA de Anthropic

Según Anthropic, Claude Mythos es capaz de identificar y explotar vulnerabilidades de día cero en los principales sistemas operativos y navegadores web, incluso a petición de usuarios sin conocimientos técnicos.

De acuerdo con las pruebas internas de la empresa, Claude Opus 4.8 supera en distintos parámetros tanto a modelos anteriores de Anthropic como a sistemas desarrollados por otros competidores en diversos indicadores de desempeño.

Por ejemplo, en tareas de codificación agéntica, el nuevo modelo alcanzó una puntuación de 69.2%, por encima de Opus 4.7, que obtuvo 64.3%; GPT-5.5, con 58.6%; y Gemini 3.1 Pro, con 54.2%. De manera similar, la actualización mostró un mejor desempeño en evaluaciones de razonamiento multidisciplinario. Sin apoyo de herramientas externas, el sistema consiguió un puntaje de 49.8%, cifra que supera por más de cinco puntos porcentuales a los modelos más avanzados de OpenAI y Google disponibles hasta ahora.

El equipo de Anthropic destacó que una de las mejoras más relevantes de Opus 4.8 es “la honestidad del modelo”. Según la empresa, el sistema fue entrenado para reconocer con mayor frecuencia anomalías durante sus procesos de trabajo y evitar afirmaciones sin evidencia suficiente. “Opus 4.8 tiene aproximadamente cuatro veces menos probabilidades que su predecesor de dejar pasar fallos en el código que ha escrito”, señalaron sus desarrolladores.

Entre las novedades también sobresale la incorporación de la función “flujos de trabajo dinámicos”, que permite a Claude Code planificar tareas y ejecutar cientos de subagentes en paralelo dentro de una sola sesión de larga duración. A ello se suma la integración del “modo rápido de Opus 4.8”, diseñado para trabajar hasta 2.5 veces más rápido.

El nuevo modelo también brinda mayor control sobre el gasto computacional. Según Anthropic, Claude Opus 4.8 está configurado por defecto con un nivel elevado de esfuerzo computacional que busca equilibrar la calidad de las respuestas con una experiencia de usuario satisfactoria. En tareas de programación, esta configuración consume una cantidad de tokens similar a la versión estándar de Opus 4.7, aunque con un rendimiento superior. Sin embargo, los usuarios pueden elegir entre los modos de esfuerzo “extra” o “máximo”, los cuales incrementan el consumo de tokens para obtener resultados más avanzados.

Related Posts

Spotify “resucitó” a artistas fallecidos con canciones generadas por IA sin ningún permiso

Meta cede ante los gobiernos y retira el cifrado de Instagram, aunque casi nadie lo había activado

Microsoft Project vs. Smartsheet: Which Tool Is Better?