El caso de Claude Fable 5 y cómo la Casa Blanca ya influye en qué modelos de IA llegan al público

Según tres personas al tanto del asunto, los responsables de la Administración Trump concluyeron el lunes las negociaciones con Anthropic sin levantar los controles de exportación que se impusieron la semana pasada a los modelos de IA más avanzados de la empresa, en respuesta a las preocupaciones sobre el jailbreaking, una técnica en la que se dan indicaciones para lograr que un modelo de IA obvie sus directrices de seguridad.

La administración sigue creyendo que existen formas de desactivar algunas de las medidas de seguridad de Claude Fable 5, de Anthropic, lo que permitiría a los usuarios acceder a las capacidades de ciberseguridad más potentes del modelo Mythos de la empresa, según afirmaron estas fuentes.

¿Exageraciones de la Casa Blanca?

Anthropic lleva días asegurando que las preocupaciones de la administración son exageradas, una postura que reiteró en las reuniones del grupo de trabajo celebradas en el Departamento de Comercio con investigadores gubernamentales del Centro para las Normas e Innovación en IA y de la Oficina del Director Nacional de Ciberseguridad, Sean Cairncross, según indicó una de las fuentes.

A las reuniones también asistió el secretario de Comercio, Howard Lutnick, quien se conectó mediante teleconferencia desde la cumbre del G7 en Évian, Francia. El propio Cairncross no participó, según la misma fuente.

Por parte de Anthropic, el cofundador y director de computación, Tom Brown, y la directora de relaciones externas, Sarah Heck, han liderado las conversaciones. El responsable de pruebas de penetración de Anthropic, Logan Graham, y el investigador sénior de seguridad, Nicholas Carlini, viajaron a Washington DC para las conversaciones.

“Ambas partes están trabajando con celeridad para resolver este asunto”, declaró un portavoz de Anthropic en un comunicado a WIRED. Un vocero de la Casa Blanca se negó a hacer comentarios.

No quedó claro de inmediato cómo podrían desarrollarse los próximos pasos. El Departamento de Comercio expresó su disposición a encontrar una forma de volver a poner Fable 5 en línea para su uso por parte de los consumidores, pero es probable que ello dependa de que Anthropic resuelva por completo las preocupaciones relacionadas con el jailbreak, de acuerdo con la misma fuente.

La voz de alarma

Las conversaciones de emergencia se han producido en un momento político delicado para Anthropic, que ya se encontraba inmersa en una prolongada disputa con el Pentágono sobre si sus modelos de IA podían utilizarse para determinadas aplicaciones militares.

La Administración Trump fue alertada por primera vez de las preocupaciones sobre el jailbreak la semana pasada. El director ejecutivo de Amazon, Andy Jassy, llamó directamente al secretario del Tesoro, Scott Bessent, para informarle de las supuestas vulnerabilidades, lo que contribuyó a alarmar a la Administración, según indicaron las fuentes. La conversación de Jassy con la Administración Trump fue publicada por primera vez por The Information.

Los funcionarios de la Casa Blanca, alarmados, encargaron a la Agencia de Seguridad Nacional de EE UU, NSA, que ayudara a analizar las vulnerabilidades. La NSA respondió que creía que, efectivamente, era posible eludir las medidas de seguridad de Fable 5, lo que llevó a la administración a imponer restricciones al modelo.

Lutnick habló entonces con el director ejecutivo de Anthropic, Dario Amodei, el viernes, mientras el Departamento de Comercio redactaba su carta para imponer controles de exportación a Fable 5. Durante el fin de semana, después de que Anthropic bloqueara el acceso al modelo para todos los usuarios, Lutnick mantuvo varias conversaciones telefónicas con Brown y Heck, según una persona con conocimiento de los hechos.

No está claro por qué Amazon, uno de los mayores inversionistas en Anthropic, dio la voz de alarma sobre Fable 5. “Como proveedor líder de servicios en la nube que atiende a un gran número de clientes de los sectores público y privado, no es raro que los gobiernos nos pidan asesoramiento sobre posibles riesgos de seguridad”, explica un portavoz de Amazon a WIRED. “Cuando se producen, no revelamos los detalles de estas conversaciones”.

Desacuerdo en materia de seguridad

En el centro de las conversaciones entre Anthropic y la administración se encuentra un desacuerdo sobre la gravedad de las preocupaciones relativas al jailbreak de Claude Fable 5.

En una entrada de blog publicada el viernes, Anthropic dio a entender que la administración exagera la gravedad de los riesgos potenciales. Algunos investigadores en ciberseguridad reiteraron esta postura ante los funcionarios el lunes, enviando una carta abierta en la que argumentaban que la medida de control de exportaciones adoptada contra Anthropic era injustificada.

¿Exageraciones de la Casa Blanca?

La voz de alarma

Desacuerdo en materia de seguridad

Related Posts

Malas noticias para los medios: el modo IA de Google remite cada vez más al propio Google

El nuevo Cybertruck de Tesla baja 10,000 dólares de precio y sube la autonomía

How Much Time Does it Take for Hackers to Crack My Password?