LLMjacking: novo ataque mira GPUs para roubar processamento de IA generativa

O LLMjacking é uma nova ameaça onde hackers invadem máquinas com GPUs potentes para roubar processamento e executar modelos de IA generativa, vendendo o acesso como serviço barato e usando-o para gerar phishing, malware e conteúdo ofensivo.

Uma nova modalidade de cibercrime, batizada de "LLMjacking", está visando computadores e servidores domésticos com placas de vídeo (GPUs) potentes para roubar seu poder de processamento e executar modelos de linguagem grande (LLMs) de forma ilegítima. Diferente dos ataques de cryptojacking, que mineravam criptomoedas, o objetivo agora é aproveitar a capacidade de IA generativa da máquina da vítima para gerar texto, código ou imagens, contornando custos e restrições de uso.

Mecânica do ataque e motivação financeira

Os atacantes escaneam a internet em busca de portas abertas, como a porta 11434 usada pelo servidor de IA Ollama, para encontrar máquinas desprotegidas. Após obter acesso, eles enviam comandos (prompts) para os LLMs instalados, como Llama 3 ou DeepSeek, fazendo a GPU da vítima trabalhar no máximo. A resposta gerada é então enviada de volta ao invasor. O processamento roubado é vendido em mercados clandestinos como um serviço de API barato, transferindo os custos de energia, hardware e manutenção para o proprietário da máquina comprometida.

Finalidades maliciosas e sinais de infecção

O poder computacional sequestrado não é usado para fins benignos. Os atacantes exploram LLMs sem censura para atividades criminosas, incluindo a geração em massa de e-mails de phishing personalizados, a criação de código para malwares, e a produção de conteúdo ofensivo ou de desinformação. Usuários podem suspeitar de um ataque se observarem a GPU e os coolers operando a 100% sem uma razão aparente (como jogos ou renderização), travamentos inexplicáveis, engasgos do sistema ou um aumento súbito na conta de energia.

Proteção e recomendações de segurança

Para se proteger, usuários que executam servidores de IA localmente, como o Ollama, devem garantir que esses serviços não estejam expostos diretamente à internet sem autenticação adequada e firewalls configurados. É crucial manter sistemas operacionais e softwares atualizados, usar senhas fortes e monitorar o desempenho do sistema. O caso do Brasil, frequentemente citado como um dos países com mais servidores de IA expostos, torna este alerta particularmente relevante para a comunidade técnica nacional. A tendência do LLMjacking evidencia como os avanços tecnológicos criam novos vetores de ataque, exigindo que a segurança acompanhe a inovação.