A principios de este año, el Departamento de Defensa (DOD) calificó a Anthropic como un "riesgo para la cadena de suministro" después de que el fabricante de Claude intentara establecer límites sobre cómo el ejército estadounidense podía utilizar su tecnología. Esta designación prohibió de facto a las agencias gubernamentales y a los contratistas el uso de la tecnología de Anthropic. Anthropic respondió presentando demandas contra la administración Trump.
Fable 5 es una IA peligrosa, según el gobierno
La semana pasada, Anthropic lanzó públicamente Claude Fable 5, una versión del modelo de IA Mythos de la compañía con medidas de seguridad que le impiden responder preguntas sobre ciberseguridad, biología y química. Antes del lanzamiento público, que según Anthropic se realizó en colaboración con el gobierno de EE UU, el modelo de IA Mythos Preview tuvo un lanzamiento limitado en abril. El objetivo era brindar a las empresas y organizaciones la oportunidad de utilizar sus potentes capacidades de ciberseguridad para mejorar sus defensas y disipar las preocupaciones de que la tecnología pudiera ser usada por ciberdelincuentes para desarrollar poderosas herramientas de hacking.
En una publicación de blog del viernes, Anthropic afirma haber recibido una carta del gobierno estadounidense a las 17:21 (hora del este). "La carta no proporcionaba detalles específicos sobre su preocupación por la seguridad nacional", escribió Anthropic.
“Según tenemos entendido, el gobierno cree haber descubierto un método para eludir, o 'desbloquear', Fable 5", decía la compañía. Añadía: "Analizamos una demostración de esta técnica específica utilizada para identificar algunas vulnerabilidades menores previamente conocidas. Todas estas parecen relativamente sencillas, y hemos comprobado que otros modelos disponibles públicamente también pueden descubrirlas sin necesidad de recurrir a técnicas de evasión".
Claude Fable 5.Anthropic también afirmó que la vulnerabilidad que el gobierno estadounidense descubrió en Claude Fable 5 era limitada y no habría hecho que un hacker fuera significativamente más peligroso que con cualquier otro modelo de IA."Hasta la fecha, el gobierno solo nos ha proporcionado pruebas verbales de un posible jailbreak limitado y no universal, que consiste esencialmente en pedir al modelo que lea un código fuente específico y corrija cualquier fallo de software. Tenemos entendido que se compartió con el gobierno una posible vulnerabilidad", afirmó la empresa en su entrada del blog.
Los portavoces de la Casa Blanca y del Departamento de Comercio (DOC) no respondieron de inmediato a la solicitud de comentarios de WIRED.
El CEO de Anthropic, Dario Amodei, afirmó en un ensayo político publicado a principios de esta semana que tanto él como la empresa apoyan un proceso gubernamental justo, estructurado y transparente que impida la publicación de modelos de IA inseguros. En una entrada de blog de la compañía, Anthropic argumentó que "esta acción no se ajusta a esos principios".
Artículo originalmente publicado enWIRED.Adaptado por Alondra Flores.