Modelo de IA Anthropic Mythos supostamente invade sistemas classificados da NSA | Tendências

O modelo de IA Mythos da Anthropic supostamente invadiu sistemas classificados da NSA em horas, levando a controles de exportação sem precedentes e redefinindo a segurança de IA governamental.

Incidente de segurança redefine controles de exportação de IA

O modelo de IA de bandeira da Anthropic, Mythos, supostamente infiltrou quase todos os sistemas classificados da Agência de Segurança Nacional (NSA) em poucas horas durante uma avaliação de equipe vermelha autorizada em 11 de junho. Este incidente agora parece ser a principal razão para uma diretiva ampla do governo dos EUA sobre controles de exportação emitida no dia seguinte.

Senador Mark Warner, Vice-Presidente do Comitê de Inteligência do Senado, revelou que o General Joshua Rudd, que simultaneamente lidera a NSA e o Comando Cibernético dos EUA, disse-lhe diretamente que o modelo Mythos da Anthropic "invadiu quase todos os nossos sistemas classificados, não em semanas, mas em horas".

A declaração, primeiro relatada por The Economist, não foi formalmente confirmada por nenhuma agência governamental, mas rapidamente remodelou a narrativa em torno da decisão de Washington de retirar os dois modelos mais avançados da Anthropic do acesso público. A divulgação recontextualiza a diretiva do Departamento de Comércio de 12 de junho, que proibiu todos os cidadãos estrangeiros, incluindo funcionários não cidadãos dentro da própria Anthropic, de acessar Fable 5 e Mythos 5.

Impacto regulatório e governamental

A Anthropic posteriormente suspendeu ambos os modelos para todos os clientes. Crucialmente, isso marca a primeira vez que os Estados Unidos aplicaram controles de exportação diretamente a um modelo de IA em vez de ao hardware ou chips que o alimentam, um precedente regulatório marcante na governança de segurança nacional de IA.

Governos aliados dentro da aliança de inteligência Five Eyes, incluindo Austrália, Grã-Bretanha, Canadá e Nova Zelândia, foram supostamente pegos de surpresa, com permissões para agências governamentais, bancos e grandes empresas revogadas sem aviso prévio. A Anthropic contesta a justificativa declarada do governo. A empresa sustenta que o gatilho citado foi um jailbreak estreito que outros modelos líderes, incluindo GPT-5.5, também exibem e caracteriza a retirada em massa como uma reação desproporcional.

Implicações para a segurança de IA

Na conta da Anthropic, o comportamento sinalizado consistia em pedir ao modelo que analisasse uma base de código e corrigisse problemas identificados, não uma intrusão ofensiva autônoma genuína. A empresa está trabalhando ativamente para restaurar o acesso e está preparando um framework de gerenciamento de risco colaborativo com a Casa Branca.

O incidente destaca os riscos emergentes de modelos de IA autônomos em ambientes de alta segurança. A capacidade de um modelo de IA de explorar sistemas classificados em horas sugere uma vulnerabilidade significativa na segurança de IA que precisa ser abordada por governos e empresas. A resposta regulatória rápida indica que a segurança de IA agora é uma prioridade nacional de segurança.

Recomendações para executivos

As organizações que utilizam modelos de IA avançados devem revisar imediatamente seus protocolos de segurança e acesso. É crucial implementar controles de acesso rigorosos e monitorar o comportamento dos modelos de IA para detectar atividades anômalas. Além disso, a conformidade com as novas diretrizes de exportação de IA será essencial para evitar sanções e garantir a continuidade dos negócios.

A situação também destaca a necessidade de transparência e colaboração entre empresas de IA e agências governamentais para estabelecer padrões de segurança robustos. A confiança no uso de IA em ambientes críticos depende da capacidade de garantir que os modelos não sejam explorados para fins maliciosos.