Falha no SDK do Google Vertex AI permite sequestro de uploads de modelos via bucket squatting | Vazamento de dados

Falha crítica no SDK do Google Vertex AI para Python permite execução remota de código via técnica Pickle in the Middle. Unit 42 alerta para riscos em pipelines de IA sem exploração ativa confirmada.

Uma vulnerabilidade crítica identificada no SDK do Google Cloud Vertex AI para Python permite que atacantes sem acesso ao projeto da vítima sequestrem uploads de modelos de machine learning e executem código dentro da infraestrutura de serviço do Google. A falha, batizada de "Pickle in the Middle" pela equipe da Palo Alto Networks Unit 42, expõe riscos significativos para cadeias de suprimentos de IA e operações de MLOps em ambientes corporativos.

Descoberta e escopo

A vulnerabilidade foi descoberta e reportada através do programa de bug bounty do Google pela equipe de inteligência de ameaças da Palo Alto Networks, conhecida como Unit 42. O escopo do problema abrange especificamente o SDK do Vertex AI para Python, uma ferramenta essencial para desenvolvedores que integram modelos de aprendizado de máquina em aplicações empresariais. A falha reside na forma como o SDK processa arquivos de serialização Python (pickle) durante o upload de modelos para a infraestrutura de nuvem.

O ataque explora a confiança implícita que o SDK deposita nos arquivos recebidos, permitindo que um atacante com conhecimento prévio do nome do bucket de armazenamento (bucket squatting) injete código malicioso que é executado no momento em que o modelo é carregado ou processado pelo serviço de inferência do Google Cloud.

O que mudou agora

Até o momento, a Palo Alto Networks Unit 42 informou que não observou exploração ativa desta vulnerabilidade na natureza. No entanto, a natureza da falha permite execução remota de código (RCE) dentro da infraestrutura de serviço do Google, o que representa um risco de alta severidade. A descoberta marca um novo vetor de ataque focado especificamente na camada de orquestração de IA, diferenciando-se de ataques tradicionais de infraestrutura de nuvem.

Esta atualização é relevante para organizações que utilizam o Vertex AI para implantar modelos em produção, especialmente aquelas que gerenciam pipelines de treinamento e inferência automatizados. A ausência de exploração ativa oferece uma janela de oportunidade crítica para que equipes de segurança implementem mitigações antes que grupos criminosos explorem a falha em escala.

Vetor e exploração

O vetor de ataque baseia-se na técnica de "Pickle in the Middle", que combina a exploração de serialização insegura com a prática de bucket squatting em ambientes de nuvem. O pickle é um formato de serialização nativo do Python que permite a conversão de objetos complexos em fluxos de bytes. Infelizmente, o módulo pickle do Python não é seguro e pode executar código arbitrário durante a desserialização se o arquivo tiver sido manipulado.

Os atacantes podem criar um bucket de armazenamento com o mesmo nome que o bucket legítimo da vítima, aguardando que o SDK tente acessar o arquivo. Ao interceptar ou redirecionar o tráfego para o bucket controlado pelo atacante, o código malicioso embutido no arquivo de modelo é executado no contexto do serviço de serviço do Google Cloud.

Evidências e limites

As evidências técnicas indicam que a exploração não requer credenciais de acesso ao projeto da vítima, apenas conhecimento do nome do bucket e capacidade de controlar o conteúdo que será servido. Isso simplifica drasticamente a barreira de entrada para atacantes, transformando uma falha de configuração de nome de bucket em uma vulnerabilidade de execução de código.

Os limites da exploração estão atrelados à arquitetura específica do Vertex AI e às configurações de rede do projeto. No entanto, a capacidade de executar código dentro da infraestrutura de serviço do Google sugere que um atacante poderia potencialmente acessar outros recursos do projeto, exfiltrar dados ou utilizar a instância comprometida como pivô para ataques internos.

Impacto e alcance

O impacto potencial desta vulnerabilidade é amplo, afetando qualquer organização que utilize o SDK do Vertex AI para Python para gerenciar modelos de machine learning. Empresas de setores como finanças, saúde e varejo, que dependem de IA para tomada de decisão automatizada, estão particularmente expostas.

A execução de código na infraestrutura de serviço do Google pode comprometer a confidencialidade, integridade e disponibilidade dos modelos de IA implantados. Além disso, se o atacante conseguir escalar privilégios, pode haver implicações para dados sensíveis processados pelos modelos, levantando questões de conformidade com regulamentações como a LGPD.

Repercussão

A descoberta desta falha tem gerado atenção significativa na comunidade de segurança da informação, destacando os riscos emergentes na segurança de IA. A Palo Alto Networks Unit 42 enfatizou a importância de revisar as práticas de segurança em pipelines de MLOps e a necessidade de validar a integridade de todos os arquivos de modelo antes do upload.

Organizações que utilizam o Google Cloud devem considerar esta vulnerabilidade como uma prioridade alta em seus programas de gestão de riscos. A natureza da falha sugere que outras ferramentas de IA e frameworks de machine learning podem conter vulnerabilidades semelhantes, exigindo uma auditoria mais ampla das ferramentas de desenvolvimento e implantação.

Medidas de mitigação recomendadas

Para mitigar os riscos associados a esta vulnerabilidade, as organizações devem adotar as seguintes medidas imediatas:

Atualização do SDK: Verificar se há atualizações disponíveis para o SDK do Vertex AI para Python e aplicar patches assim que liberados pelo Google.
Validação de Arquivos: Implementar verificações de integridade e assinatura digital para todos os arquivos de modelo antes do upload.
Isolamento de Rede: Restringir o acesso aos buckets de armazenamento de modelos usando políticas de acesso baseadas em identidade e rede.
Monitoramento de Tráfego: Implementar monitoramento para detectar tentativas de acesso a buckets com nomes semelhantes ou tráfego incomum durante uploads de modelos.

O que os CISOs devem fazer imediatamente

Os CISOs e líderes de segurança devem priorizar a revisão dos processos de MLOps e garantir que as equipes de desenvolvimento estejam cientes dos riscos de serialização insegura. É fundamental estabelecer um protocolo de resposta a incidentes específico para ataques de cadeia de suprimentos de IA.

Além disso, recomenda-se a realização de testes de penetração focados em pipelines de IA para identificar vulnerabilidades semelhantes em outras ferramentas e frameworks utilizados pela organização. A comunicação com fornecedores de nuvem e parceiros de segurança também é essencial para manter-se atualizado sobre novas ameaças e mitigações.

Perguntas frequentes

Esta vulnerabilidade afeta apenas o Google Cloud? Atualmente, a falha foi identificada especificamente no SDK do Vertex AI para Python. No entanto, organizações devem avaliar se outras ferramentas de IA utilizam mecanismos de serialização semelhantes.

Existe exploração ativa confirmada? Até o momento, a Palo Alto Networks Unit 42 não relatou exploração ativa na natureza. A ausência de exploração não deve ser interpretada como segurança, mas como uma janela de oportunidade para mitigação.

Como posso verificar se meu ambiente está vulnerável? Verifique a versão do SDK do Vertex AI para Python em uso. Se estiver utilizando versões anteriores à correção, considere a atualização imediata ou a implementação de controles compensatórios de rede e monitoramento.

Isso impacta a conformidade com a LGPD? Sim, se a exploração resultar em acesso não autorizado a dados pessoais processados pelos modelos de IA, a organização pode estar sujeita a sanções regulatórias. A proteção de dados deve ser integrada aos processos de segurança de IA.