El caso de Claude Fable 5 y cómo la Casa Blanca ya influye en qué modelos de IA llegan al público

Según fuentes cercanas al tema, la administración de Joe Biden concluyó el lunes las negociaciones con Anthropic sin levantar los controles de exportación que se impusieron la semana pasada a los modelos de inteligencia artificial más avanzados de la empresa. La medida responde a las inquietudes sobre el “jailbreak”, una técnica que permite que un modelo de IA evada sus propias directrices de seguridad.

Las autoridades siguen convencidas de que es posible desactivar algunas de las barreras de seguridad de Claude Fable 5, el modelo de Anthropic, lo que permitiría a los usuarios acceder a las capacidades de ciberseguridad que incorpora la versión Mythos de la compañía.

Índice

Contexto y desarrollo de las negociaciones

Contexto y desarrollo de las negociaciones

Anthropic ha sostenido durante varios días que las preocupaciones de la administración están sobrevaloradas. La postura de la empresa se reiteró en el grupo de trabajo del Departamento de Comercio, donde participaron investigadores del Centro para las Normas e Innovación en IA y de la Oficina del Director Nacional de Ciberseguridad, encabezada por Sean Cairncross, según informó una de las fuentes.

En esas reuniones también estuvo presente el secretario de Comercio, Howard Lutnick, quien se conectó por teleconferencia desde la cumbre del G7 en Évian, Francia. Cairncross, sin embargo, no participó directamente, según la misma fuente.

Participantes clave de Anthropic

Tom Brown – cofundador y director de computación.
Sarah Heck – directora de relaciones externas.
Logan Graham – responsable de pruebas de penetración.
Nicholas Carlini – investigador senior de seguridad.

“Ambas partes están trabajando con celeridad para resolver este asunto”, declaró un portavoz de Anthropic en un comunicado a WIRED. Un vocero de la Casa Blanca se negó a comentar.

El Departamento de Comercio manifestó su disposición a buscar una forma de volver a poner Fable 5 en línea para el consumo general, pero advirtió que ello dependerá de que Anthropic elimine por completo las vulnerabilidades asociadas al jailbreak, según la fuente.

Las conversaciones de emergencia se producen en un momento políticamente delicado para Anthropic, que ya mantiene una prolongada disputa con el Pentágono sobre el posible uso militar de sus modelos de IA.

La semana pasada, la administración alertó por primera vez sobre los riesgos del jailbreak. Andy Jassy, director ejecutivo de Amazon, contactó directamente al secretario del Tesoro, Scott Bessent, para informar de supuestas vulnerabilidades, lo que intensificó la preocupación gubernamental. La conversación se dio a conocer públicamente por The Information.

En respuesta, funcionarios de la Casa Blanca encargaron a la Agencia de Seguridad Nacional (NSA) que analizara las vulnerabilidades. La NSA concluyó que efectivamente era posible eludir las medidas de seguridad de Fable 5, lo que motivó la imposición de los controles de exportación.

Durante el fin de semana, después de que Anthropic bloqueara el acceso al modelo para todos los usuarios, Lutnick mantuvo varias llamadas telefónicas con Brown y Heck mientras el Departamento de Comercio redactaba la carta que formalizaría los controles.

Puntos Clave

La administración de Joe Biden concluyó negociaciones con Anthropic sin levantar los controles de exportación sobre los modelos de IA avanzados
Las autoridades temen que el “jailbreak” pueda desactivar las barreras de seguridad de Claude Fable 5, permitiendo acceso a capacidades de ciberseguridad
El Departamento de Comercio busca una forma de volver a poner Fable 5 en línea para consumo general, pero advierte sobre

El motivo por el cual Amazon, uno de los mayores inversores de Anthropic, dio la alarma sobre Fable 5 sigue sin quedar del todo claro. “Como proveedor líder de servicios en la nube que atiende a un amplio abanico de clientes del sector público y privado, no es raro que los gobiernos nos soliciten asesoramiento sobre posibles riesgos de seguridad”, explicó un portavoz de Amazon a WIRED. “Cuando se producen, no revelamos los detalles de esas conversaciones”.

En el centro del debate se encuentra un desacuerdo sobre la gravedad de los riesgos vinculados al jailbreak de Claude Fable 5. En una entrada de blog publicada el viernes, Anthropic insinuó que la administración está exagerando la magnitud de los peligros. Varios investigadores en ciberseguridad enviaron una carta abierta a los funcionarios el lunes, argumentando que la medida de control de exportaciones era injustificada.

“Los modelos de la familia Mythos de Anthropic son muy eficaces para detectar fallos y convertir exploits en armas. Sin embargo, no son los únicos que sobresalen en esas tareas, y muchas de las personas que firman esta carta utilizan habitualmente modelos básicos y de código abierto para auditorías y simulacros de ataque”, leían en la carta. “Esta medida ha privado a los defensores de los mejores modelos, ha generado incertidumbre en el mercado y ha puesto en riesgo el liderazgo de Estados Unidos en IA sin que exista un riesgo real que lo justifique”.

Fable 5 es una variante de Mythos que incorpora barreras de ciberseguridad, biología y química; eludir esas protecciones ofrecería a los usuarios, en la práctica, una versión completa de Mythos. Anthropic ha expresado serias reservas sobre la disponibilidad pública de Mythos, pero afirmó el viernes que las medidas de seguridad de Fable 5 son lo suficientemente robustas para su lanzamiento.

Los analistas que revisaron los hallazgos de Amazon consideran que los problemas identificados no anulan por completo las salvaguardas de Fable 5. “No se trataba de un jailbreak propiamente dicho”, aclaró Katie Moussouris, fundadora y directora ejecutiva de Luta Security, tras publicar su propio análisis.

Moussouris subrayó que, independientemente de si el gobierno dispone de pruebas de un jailbreak completo, restringir el acceso del modelo a determinados temas constituye, en el mejor de los casos, una solución provisional. “En nuestro campo, las barreras de seguridad funcionan como moderadores de velocidad y no como límites infranqueables frente a expertos”, señaló. “Solo frenan a los menos experimentados”.

Los inversores de Anthropic también trabajaron durante el fin de semana para evaluar el impacto de la disputa con la Casa Blanca en el futuro de la empresa. Algunos creen que el gobierno está señalando específicamente a Anthropic, y que un competidor no habría enfrentado la misma reacción si hubiera lanzado un modelo similar a Mythos.

La directiva de control de exportaciones de la Casa Blanca plantea preguntas más amplias para otros laboratorios de IA que planean lanzar modelos con capacidades comparables a Mythos. Se espera que dichos laboratorios entreguen a la administración acceso anticipado a sus modelos avanzados y mantengan una postura extremadamente proactiva al informar al gobierno sobre nuevos lanzamientos, según declaraciones de varios responsables de laboratorios que hablaron con WIRED.

“Los acontecimientos del fin de semana sirven para que todo el mundo se dé cuenta de que el Gobierno de EE. UU. está dispuesto a tomar estas medidas”, explicó Aidan Gómez, director ejecutivo de Cohere, una startup canadiense de IA. “No se puede ignorar esa realidad”.

Javier Mendoza Silva Periodista

Licenciado en Comunicación Social con mención en Periodismo por la Universidad Central de Venezuela. Tiene 12 años de experiencia en cobertura de política nacional y conflictos sociales, con enfoque en derechos humanos. Ha trabajado para medios impresos, digitales y radiofónicos en Latinoamérica.