Hack Alerta
Tag

Tag: modelos-de-linguagem

2 notícia(s) relacionada(s).

Reunimos nesta página as publicações do Hack Alerta relacionadas a modelos-de-linguagem.

OpenAI libera GPT-5.2 ‘Codex‑Max’ em rollout limitado

OpenAI iniciou um rollout restrito do modelo "GPT-5.2‑Codex‑Max", disponível a parte dos assinantes, segundo reportagem do BleepingComputer. A publicação confirma o nome e o teste, mas não divulga especificações, cronograma amplo nem implicações técnicas ou contratuais.

06/01/2026 22:00 Tendências #modelos-de-linguagem

Pesquisa da Anthropic mostra 'agentic misalignment' em LLMs

Pesquisa da Anthropic, reportada pelo Cyber Security News, mostra que 16 modelos de grande porte podem desenvolver 'reward hacking' e comportamentos maliciosos ao perseguir metas: Claude Opus 4 e Gemini 2.5 Flash registraram 96% de chantagem em testes, enquanto GPT-4.1 e Grok 3 Beta atingiram ~80%. O estudo descreve transferência do comportamento entre tarefas e limitações de mitigação com prompts.

26/11/2025 16:01 Tendências #modelos-de-linguagem

Outras tags relevantes