A Anthropic desativou o acesso aos modelos Fable 5 e Mythos 5 para todos os seus clientes após receber uma diretiva de controle de exportação do governo dos Estados Unidos, emitida com base em autoridades de segurança nacional. A ordem proíbe o acesso aos modelos por qualquer cidadão estrangeiro, dentro ou fora do país, incluindo funcionários estrangeiros da própria empresa. Veja o comunicado da empresa.
A diretiva chegou às 17h21 (horário de Brasília, 18h21 de Nova York) de quinta-feira (12), segundo a Anthropic. O acesso aos demais modelos da empresa não foi afetado. A companhia afirmou estar cumprindo a ordem legal enquanto trabalha para restabelecer o serviço, e classificou a medida como um mal-entendido.
A questão do “jailbreak”
De acordo com a Anthropic, o governo acredita ter tomado conhecimento de um método para burlar as proteções do Fable 5, prática conhecida como jailbreak. A empresa revisou uma demonstração da técnica e afirmou que ela identificou um pequeno número de vulnerabilidades menores já conhecidas, todas relativamente simples e detectáveis por outros modelos disponíveis publicamente, sem necessidade de burla.
A carta do governo não detalhou a preocupação específica de segurança nacional. Até o momento, segundo a empresa, foram apresentadas apenas evidências verbais de um possível jailbreak estreito, que consistiria em pedir ao modelo que leia um código-fonte específico e corrija falhas de software.
A Anthropic disse ter analisado o relatório que acredita ser a base da diretiva e validado que o nível de capacidade demonstrado está amplamente disponível em outros modelos, incluindo o GPT-5.5, da OpenAI, e é usado diariamente por profissionais que mantêm sistemas seguros.
Estratégia de defesa em profundidade
A empresa defendeu a abordagem de segurança adotada no Fable 5. Em sua argumentação, listou os seguintes pontos:
- As proteções foram submetidas a milhares de horas de testes de invasão junto ao governo dos EUA, ao UK AISI, a organizações terceirizadas e a equipes internas antes do lançamento
- Nenhum testador conseguiu encontrar um jailbreak universal, capaz de burlar amplamente as proteções e liberar uma gama extensa de capacidades cibernéticas
- A política de retenção de dados por 30 dias, exigida para os modelos da classe Mythos, foi adotada para permitir pesquisa e mitigação de jailbreaks
- Nenhuma divulgação de jailbreak não universal preocupante que tenha levado a resultado nocivo foi recebida até agora
A Anthropic sustenta que a resistência perfeita a jailbreaks não é possível hoje para nenhum fornecedor de modelos, e que todas as proteções do setor são vulneráveis a jailbreaks não universais.
Discordância sobre o critério
A empresa afirmou cumprir a diretiva, mas discordou de que a constatação de um jailbreak estreito justifique a retirada de um modelo comercial usado por centenas de milhões de pessoas. Segundo a Anthropic, se esse critério fosse aplicado a todo o setor, praticamente todas as novas implantações de modelos de fronteira seriam interrompidas.
A companhia reiterou sua posição pública de que o governo deve ter a capacidade de bloquear implantações inseguras dentro de um processo estatutário transparente, justo, claro e baseado em fatos técnicos, princípios que, segundo ela, não foram observados nesta ação. A Anthropic informou que divulgará mais detalhes nas próximas 24 horas.








