Trump obliga a Anthropic a retirar Fable 5 por presuntos motivos de seguridad nacional
Anthropic ha anunciado que desactivará dos de sus modelos de inteligencia artificial, Claude Fable 5 y Mythos 5, en cumplimiento de una directiva de control de exportaciones recibida el viernes por la tarde del gobierno de Estados Unidos, la cual se sustenta en supuestos motivos de seguridad nacional.
Esta medida, sin precedentes, intensifica el enfrentamiento entre la empresa y la administración Trump, que ya había impuesto a Anthropic una designación del Departamento de Defensa como “riesgo para la cadena de suministro”. Dicha clasificación prohibió de facto el uso de sus tecnologías por parte de agencias gubernamentales y contratistas, lo que llevó a la compañía a presentar demandas contra la administración.
Detalles del conflicto y la respuesta de Anthropic
Claude Fable 5, una versión del modelo Mythos con restricciones de seguridad, fue lanzado públicamente la semana pasada tras una fase limitada de prueba en abril. El objetivo del modelo era permitir a empresas y organizaciones aprovechar sus capacidades en ciberseguridad para reforzar defensas, al tiempo que se intentaba evitar su uso por ciberdelincuentes para crear herramientas de hacking.
En un blog publicado el viernes, Anthropic informó que recibió una carta del gobierno estadounidense a las 17:21 h (hora del este). La comunicación no especificaba los motivos exactos de la preocupación, pero la empresa interpretó que la autoridad había descubierto un método para eludir, o “desbloquear”, Fable 5. Según Anthropic, la técnica demostrada solo explotaba vulnerabilidades menores ya conocidas y podía ser replicada con otros modelos de acceso público sin necesidad de técnicas de evasión.
Anthropic sostuvo que ha implementado sólidas medidas de seguridad para reducir el riesgo de uso indebido de Claude Fable 5 y que la vulnerabilidad señalada por el gobierno es limitada, sin hacer que un atacante sea significativamente más peligroso que con cualquier otro modelo de IA. La compañía también señaló que, hasta la fecha, solo ha recibido pruebas verbales de un posible “jailbreak” limitado y no universal, que consiste en solicitar al modelo que analice y corrija un código fuente específico.
Los portavoces de la Casa Blanca y del Departamento de Comercio no respondieron de inmediato a la solicitud de comentarios de Wired.
El director ejecutivo de Anthropic, Dario Amodei, declaró en un ensayo político a principios de la semana su apoyo a un proceso gubernamental justo, estructurado y transparente que impida la publicación de modelos de IA inseguros. En la entrada del blog de la empresa, se argumentó que la orden de desactivar los modelos no se alinea con esos principios.
Mira tambien:
Deja una respuesta