Anthropic Reactiva Claude Fable 5 tras Levantar Controles | ai

Anthropic Restaura Claude Fable 5 Globalmente Tras Levantar EE.UU. los Controles de Exportación

El 30 de junio de 2026, Anthropic anunció el redespliegue de su modelo de IA avanzado, Claude Fable 5, después de que el gobierno de EE.UU. levantara los controles de exportación impuestos el 12 de junio. Las restricciones, que afectaban tanto a Fable 5 como al más potente Mythos 5, fueron desencadenadas por un informe de investigadores de Amazon que detallaba un método para eludir las salvaguardas de seguridad de Fable 5. Los controles de exportación de IA 2026 requirieron que Anthropic restringiera el acceso a ciudadanos extranjeros de inmediato, lo que llevó a una suspensión global de ambos modelos.

Antecedentes: ¿Qué Originó los Controles de Exportación?

El viernes 12 de junio, el gobierno de EE.UU. aplicó controles de exportación a Claude Fable 5 y Claude Mythos 5 bajo un nuevo marco de seguridad nacional. La orden se produjo después de que investigadores de Amazon descubrieran una técnica que podía hacer que Fable 5 identificara vulnerabilidades de software y, en un caso, produjera código que demostrara cómo explotar una vulnerabilidad. Aunque las pruebas de Anthropic confirmaron que muchos modelos menos capaces —incluidos Claude Opus 4.8, GPT-5.5 y Kimi K2.7— podían producir resultados similares, el gobierno actuó rápidamente para evitar un posible uso indebido.

Anthropic respondió suspendiendo el acceso a ambos modelos para todos los usuarios, ya que la fecha de vigencia inmediata de la orden no dejó tiempo para implementar sistemas de verificación de nacionalidad. Luego, la empresa trabajó estrechamente con el Centro de Innovación y Estándares de IA (CAISI) del Departamento de Comercio de EE.UU. para desarrollar salvaguardas mejoradas.

Cronología de Eventos y Actualizaciones de Salvaguardas

Anthropic lanzó Fable 5 y Mythos 5 el 9 de junio de 2026. Fable 5 fue diseñado con fuertes salvaguardas para uso general, mientras que Mythos 5 —con menos restricciones— se reservó para socios de confianza de Project Glasswing centrados en ciberseguridad defensiva. La directiva de control de exportaciones del 12 de junio siguió a los hallazgos de los investigadores de Amazon.

Durante las siguientes dos semanas, Anthropic entrenó un clasificador de seguridad mejorado que detecta y bloquea el comportamiento específico descrito en el informe de Amazon. El nuevo clasificador ahora bloquea la técnica de elusión reportada en más del 99% de los casos. Investigadores de CAISI han probado tanto las salvaguardas anteriores como las nuevas y las han confirmado como "extraordinariamente fuertes". Sin embargo, el nuevo clasificador también aumenta los falsos positivos durante tareas de codificación rutinarias, lo que Anthropic dice que continuará refinando.

Cómo Funcionan los Clasificadores de Seguridad

Anthropic utiliza un enfoque de defensa en profundidad con múltiples mecanismos de seguridad. Un componente clave son los clasificadores: sistemas automatizados de IA más pequeños que detectan cuando se le pide al modelo que realice tareas de ciberseguridad potencialmente dañinas. Estos clasificadores bloquean la respuesta del modelo a solicitudes peligrosas. La empresa establece deliberadamente un "margen de seguridad", bloqueando algunas solicitudes benignas para asegurarse de que las genuinamente dañinas sean capturadas. Para Fable 5, este margen se hizo mucho más grande que en cualquier lanzamiento anterior, aceptando más falsos positivos a cambio de una mayor seguridad.

Un Nuevo Marco Industrial para Evaluar los Jailbreaks de IA

El incidente destacó la falta de un estándar consensuado para evaluar los jailbreaks de IA (técnicas que eluden las salvaguardas de un modelo). Anthropic, en asociación con Amazon, Microsoft, Google y otros socios de Glasswing, ha comenzado a desarrollar un marco compartido para puntuar la gravedad de los jailbreaks en cuatro criterios:

Ganancia de capacidad: ¿Cuánto más allá de las herramientas existentes lleva el jailbreak al usuario?
Amplitud de la ganancia de capacidad: ¿Para cuántas tareas ofensivas distintas funciona la misma técnica?
Facilidad de armamento: ¿Cuánto esfuerzo humano se necesita para convertir el jailbreak en un ataque?
Descubribilidad: ¿Qué tan fácil es para alguien obtener la técnica?

Este marco tiene como objetivo ayudar a los desarrolladores de IA a priorizar hallazgos, priorizar correcciones y comunicar riesgos de manera consistente a gobiernos y socios de la industria. Anthropic también ha lanzado un nuevo programa HackerOne para que investigadores de seguridad envíen posibles jailbreaks cibernéticos. La iniciativa de estándares de la industria de seguridad de IA se espera que evolucione con comentarios de socios adicionales.

Colaboración Más Profunda con el Gobierno en Seguridad de IA de Frontera

Anthropic está fortaleciendo su colaboración con el gobierno de EE.UU., basándose en casi dos años de asociaciones preexistentes. La empresa se ha comprometido en cuatro áreas clave:

Acceso gubernamental previo al lanzamiento y evaluación: Proporcionar a socios designados acceso temprano a modelos y salvaguardas para pruebas independientes.
Intercambio rápido de información: Notificar a los homólogos gubernamentales sobre jailbreaks significativos o patrones de uso indebido y compartir nuevas salvaguardas.
Recursos dedicados para investigación conjunta: Ampliar el trabajo conjunto en seguridad de IA con equipos dedicados y asignaciones de cómputo.
Un estándar industrial común: Trabajar hacia un estándar voluntario compartido de seguridad y evaluación para los proveedores de modelos fronterizos.

Anthropic declaró que estas reglas deberían ser "codificadas en una regulación sólida y aplicadas por igual entre los desarrolladores de modelos fronterizos" para proporcionar certeza sobre el acceso a modelos potentes. Los avances de la regulación de IA en EE.UU. 2026 reflejan un impulso más amplio hacia una supervisión sistemática de las capacidades avanzadas de IA.

¿Qué Sigue para Fable 5 y Mythos 5?

Fable 5 estará disponible globalmente el 1 de julio de 2026 en la Plataforma Claude, Claude.ai, Claude Code y Claude Cowork. Para los planes Pro, Max, Team y Enterprise seleccionados, Fable 5 está incluido hasta el 50% de los límites de uso semanal hasta el 7 de julio, después de lo cual estará disponible mediante créditos de uso. El acceso en AWS, Google Cloud y Microsoft Foundry se está restaurando lo antes posible.

El acceso a Mythos 5 se ha restablecido para un conjunto de organizaciones estadounidenses tras la aprobación del gobierno el 26 de junio. Anthropic continúa coordinándose con el gobierno para expandir el acceso a socios nacionales e internacionales más amplios en el programa Glasswing.

Preguntas Frecuentes

¿Cuál fue la razón de los controles de exportación de EE.UU. sobre Claude Fable 5?

Los controles se aplicaron después de que investigadores de Amazon encontraran un método para eludir las salvaguardas de Fable 5, lo que le permitía identificar vulnerabilidades de software y producir código de explotación. El gobierno actuó bajo un nuevo marco de seguridad nacional para prevenir posibles usos indebidos de las capacidades avanzadas de ciberseguridad del modelo.

¿Están disponibles nuevamente Claude Fable 5 y Mythos 5?

Sí. Fable 5 está disponible globalmente desde el 1 de julio de 2026. El acceso a Mythos 5 se ha restablecido para organizaciones estadounidenses aprobadas, con planes de expandirse a socios internacionales en el programa Glasswing.

¿Qué salvaguardas se agregaron a Fable 5?

Anthropic entrenó un nuevo clasificador de seguridad que bloquea la técnica de elusión reportada en más del 99% de los casos. La empresa también amplió su margen de seguridad, bloqueando más solicitudes benignas para garantizar que las dañinas sean capturadas, y continúa refinando sus clasificadores.

¿Cuál es el nuevo marco industrial para jailbreaks?

Anthropic, Amazon, Microsoft, Google y otros socios están desarrollando un marco de consenso que puntúa los jailbreaks según la ganancia de capacidad, amplitud, facilidad de armamento y descubribilidad. Esto ayudará a estandarizar las respuestas a los hallazgos de seguridad de IA.

¿Cómo colaborará Anthropic con el gobierno de EE.UU. en el futuro?

Anthropic se ha comprometido a proporcionar acceso gubernamental previo al lanzamiento, intercambio rápido de información sobre salvaguardas, recursos dedicados para investigación conjunta y trabajar hacia un estándar de seguridad industrial común para modelos de IA fronterizos.

Anthropic Restaura Claude Fable 5 Globalmente Tras Levantar EE.UU. los Controles de Exportación

Antecedentes: ¿Qué Originó los Controles de Exportación?

Cronología de Eventos y Actualizaciones de Salvaguardas

Cómo Funcionan los Clasificadores de Seguridad

Un Nuevo Marco Industrial para Evaluar los Jailbreaks de IA

Colaboración Más Profunda con el Gobierno en Seguridad de IA de Frontera

¿Qué Sigue para Fable 5 y Mythos 5?

Preguntas Frecuentes

¿Cuál fue la razón de los controles de exportación de EE.UU. sobre Claude Fable 5?

¿Están disponibles nuevamente Claude Fable 5 y Mythos 5?

¿Qué salvaguardas se agregaron a Fable 5?

¿Cuál es el nuevo marco industrial para jailbreaks?

¿Cómo colaborará Anthropic con el gobierno de EE.UU. en el futuro?

Fuentes

Reader Poll

Story Timeline

Follow Discussion

Recommended for you

Artículos relacionados

EE.UU. bloquea acceso a IA de Anthropic tras alerta de Amazon

Anthropic desactiva Fable 5 y Mythos 5 tras prohibición de EE.UU.

EE.UU. prohíbe Fable 5 de Anthropic a nivel mundial

Plan EE.UU.-UE de socios de confianza para IA avanzada

Robo de IA: Anthropic Acusa a Firmas Chinas por $450M

Anthropic restaura acceso limitado al modelo Mythos 5

Social Discussion

Cookie Preferences