Beta Android Play Store Testar a app

Anthropic restaura Claude Fable 5 globalmente após EUA suspenderem controles

Anthropic restaura Claude Fable 5 globalmente após EUA suspenderem controles. Novas salvaguardas bloqueiam 99% dos jailbreaks. Estrutura do setor para segurança de IA anunciada.

Anthropic restaura Claude Fable 5 globalmente após EUA suspenderem controles
Facebook X LinkedIn Bluesky WhatsApp
de flag en flag es flag fr flag nl flag pt flag

Anthropic restaura Claude Fable 5 globalmente após EUA suspenderem controles de exportação

Em 30 de junho de 2026, a Anthropic anunciou a redistribuição de seu modelo avançado de IA, Claude Fable 5, depois que o governo dos EUA suspendeu os controles de exportação impostos em 12 de junho. As restrições, que afetaram tanto o Fable 5 quanto o mais poderoso Mythos 5, foram motivadas por um relatório de pesquisadores da Amazon detalhando um método para contornar as salvaguardas do Fable 5. Os controles de exportação de IA de 2026 exigiram que a Anthropic restringisse imediatamente o acesso a estrangeiros, levando à suspensão global de ambos os modelos.

Contexto: O que levou aos controles de exportação?

Na sexta-feira, 12 de junho, o governo dos EUA aplicou controles de exportação ao Claude Fable 5 e ao Claude Mythos 5 sob uma nova estrutura de segurança nacional. A ordem veio depois que pesquisadores da Amazon descobriram uma técnica que poderia fazer o Fable 5 identificar vulnerabilidades de software e, em um caso, produzir código demonstrando como explorar uma vulnerabilidade. Embora a Anthropic tenha confirmado que muitos modelos menos capazes – incluindo Claude Opus 4.8, GPT-5.5 e Kimi K2.7 – produziam resultados semelhantes, o governo agiu rapidamente para evitar uso indevido.

A Anthropic respondeu suspendendo o acesso a ambos os modelos para todos os usuários, já que a data de vigência imediata não deixou tempo para implementar sistemas de verificação de nacionalidade. A empresa então trabalhou em estreita colaboração com o Centro de Inovação e Padrões de IA (CAISI) do Departamento de Comércio dos EUA para desenvolver salvaguardas melhoradas.

Linha do tempo e atualizações de salvaguardas

A Anthropic lançou o Fable 5 e o Mythos 5 em 9 de junho de 2026. O Fable 5 foi projetado com fortes salvaguardas para uso geral, enquanto o Mythos 5 – com menos restrições – foi reservado para parceiros de confiança do Projeto Glasswing focados em segurança cibernética defensiva. A diretiva de controle de exportação em 12 de junho seguiu as descobertas dos pesquisadores da Amazon.

Nas duas semanas seguintes, a Anthropic treinou um classificador de segurança melhorado que visa e bloqueia o comportamento específico descrito no relatório da Amazon. O novo classificador agora bloqueia a técnica de bypass relatada em mais de 99% dos casos. Pesquisadores do CAISI testaram as salvaguardas anteriores e novas e confirmaram que são "extraordinariamente fortes". No entanto, o novo classificador também aumenta falsos positivos durante tarefas rotineiras de codificação, o que a Anthropic afirma que continuará a refinar.

Como funcionam os classificadores de segurança

A Anthropic usa uma abordagem de defesa em profundidade com múltiplos mecanismos de segurança. Um componente chave são os classificadores – sistemas automatizados de IA menores que detectam quando um modelo é solicitado a realizar tarefas de segurança cibernética potencialmente perigosas. Esses classificadores impedem o modelo de responder a solicitações perigosas. A empresa deliberadamente define uma "margem de segurança", bloqueando algumas solicitações benignas para garantir que as genuinamente perigosas sejam capturadas. Para o Fable 5, essa margem foi muito maior do que em qualquer lançamento anterior, aceitando mais falsos positivos em troca de maior segurança.

Uma nova estrutura do setor para avaliar jailbreaks de IA

O incidente destacou a falta de um padrão consensual para avaliar jailbreaks de IA – técnicas que contornam as salvaguardas de um modelo. A Anthropic, em parceria com Amazon, Microsoft, Google e outros parceiros Glasswing, começou a desenvolver uma estrutura compartilhada para classificar a gravidade do jailbreak com base em quatro critérios:

  • Ganho de capacidade: Até que ponto o jailbreak leva o usuário além das ferramentas existentes?
  • Amplitude do ganho de capacidade: Para quantas tarefas ofensivas distintas a mesma técnica funciona?
  • Facilidade de armamentização: Quanto esforço humano é necessário para transformar o jailbreak em um ataque?
  • Capacidade de descoberta: Quão fácil é para alguém obter a técnica?

Essa estrutura visa ajudar os desenvolvedores de IA a triar descobertas, priorizar correções e comunicar riscos de forma consistente a governos e parceiros do setor. A Anthropic também lançou um novo programa HackerOne para pesquisadores de segurança enviarem potenciais jailbreaks cibernéticos. A iniciativa de padrões da indústria de segurança de IA deve evoluir com feedback de parceiros adicionais.

Colaboração governamental mais profunda em segurança de IA de fronteira

A Anthropic está fortalecendo sua colaboração com o governo dos EUA, com base em quase dois anos de parcerias pré-existentes. A empresa se comprometeu com quatro áreas principais:

  • Acesso e avaliação governamental pré-lançamento: Fornecer a parceiros designados acesso antecipado a modelos e salvaguardas para testes independentes.
  • Compartilhamento rápido de informações: Notificar contrapartes governamentais sobre jailbreaks significativos ou padrões de uso indevido e compartilhar novas salvaguardas.
  • Recursos dedicados para pesquisa conjunta: Ampliar o trabalho conjunto em segurança de IA com equipes dedicadas e alocações de computação.
  • Um padrão comum do setor: Trabalhar em direção a um padrão voluntário compartilhado de segurança e avaliação para provedores de modelos de fronteira.

A Anthropic afirmou que essas regras devem ser "codificadas em uma regulamentação forte e aplicadas igualmente entre os desenvolvedores de modelos de fronteira" para fornecer certeza sobre o acesso a modelos poderosos. Os desenvolvimentos de regulamentação de IA nos EUA em 2026 refletem um esforço mais amplo para uma supervisão sistemática das capacidades avançadas de IA.

Próximos passos para Fable 5 e Mythos 5

O Fable 5 ficou disponível globalmente em 1º de julho de 2026 na Plataforma Claude, Claude.ai, Claude Code e Claude Cowork. Para planos Pro, Max, Team e Enterprise selecionados, o Fable 5 está incluído em até 50% dos limites de uso semanais até 7 de julho, após o que estará disponível via créditos de uso. O acesso na AWS, Google Cloud e Microsoft Foundry está sendo restaurado o mais rápido possível.

O acesso ao Mythos 5 foi restaurado para um conjunto de organizações dos EUA após aprovação governamental em 26 de junho. A Anthropic continua coordenando com o governo para expandir o acesso a parceiros domésticos e internacionais mais amplos no programa Glasswing.

Perguntas Frequentes

Qual foi o motivo dos controles de exportação dos EUA sobre o Claude Fable 5?

Os controles foram aplicados depois que pesquisadores da Amazon encontraram um método para contornar as salvaguardas do Fable 5, levando-o a identificar vulnerabilidades de software e produzir código de exploração. O governo agiu sob uma nova estrutura de segurança nacional para evitar o uso indevido das capacidades avançadas de segurança cibernética do modelo.

O Claude Fable 5 e o Mythos 5 estão disponíveis novamente?

Sim. O Fable 5 ficou disponível globalmente em 1º de julho de 2026. O acesso ao Mythos 5 foi restaurado para organizações dos EUA aprovadas, com planos de expandir para parceiros internacionais no programa Glasswing.

Quais salvaguardas foram adicionadas ao Fable 5?

A Anthropic treinou um novo classificador de segurança que bloqueia a técnica de bypass relatada em mais de 99% dos casos. A empresa também expandiu sua margem de segurança, bloqueando mais solicitações benignas para garantir que as perigosas sejam capturadas, e continua refinando seus classificadores.

O que é a nova estrutura do setor para jailbreaks?

A Anthropic, Amazon, Microsoft, Google e outros parceiros estão desenvolvendo uma estrutura consensual que classifica jailbreaks com base em ganho de capacidade, amplitude, facilidade de armamentização e capacidade de descoberta. Isso ajudará a padronizar as respostas a descobertas de segurança de IA.

Como a Anthropic colaborará com o governo dos EUA daqui para frente?

A Anthropic se comprometeu com acesso governamental pré-lançamento, compartilhamento rápido de informações sobre salvaguardas, recursos dedicados para pesquisa conjunta e trabalho em direção a um padrão comum de segurança do setor para modelos de fronteira de IA.

Fontes

Artigos relacionados

EUA Bloqueiam Acesso a IA da Anthropic Após Alerta da Amazon
Ai
AI relevance 100.0%

EUA Bloqueiam Acesso a IA da Anthropic Após Alerta da Amazon

Governo dos EUA bloqueia acesso aos modelos Fable 5 e Mythos 5 da Anthropic após falha de jailbreak. Veja como isso...

Proibição do Fable 5: Governo dos EUA Bloqueia IA Global
Ai
AI relevance 94.4%

Proibição do Fable 5: Governo dos EUA Bloqueia IA Global

O modelo Fable 5 da Anthropic continua proibido mundialmente após ordem de controle de exportação dos EUA. Cúpula do...

Plano EUA-UE de Parceiros Confiáveis para IA Explicado
Ai
AI relevance 88.9%

Plano EUA-UE de Parceiros Confiáveis para IA Explicado

EUA e UE discutem plano de parceiros confiáveis para modelos avançados de IA no G7 após restrições ao Anthropic....

Anthropic Desliga Fable 5 e Mythos 5
Ai
AI relevance 83.3%

Anthropic Desliga Fable 5 e Mythos 5

Anthropic desliga Fable 5 e Mythos 5 após proibição de exportação dos EUA por segurança nacional. A IA...

Anthropic libera acesso limitado ao modelo de IA Mythos 5
Ai
AI relevance 77.8%

Anthropic libera acesso limitado ao modelo de IA Mythos 5

Governo dos EUA concede autorização à Anthropic para restaurar acesso ao modelo de IA Mythos 5 para 100 parceiros...

Anthropic Acusa Empresas Chinesas de Roubo de IA de US$450M
Ai
AI relevance 72.2%

Anthropic Acusa Empresas Chinesas de Roubo de IA de US$450M

Anthropic acusa as empresas de IA chinesas DeepSeek, Moonshot AI e MiniMax de roubo de propriedade intelectual de...