Modelo de linguagem da OpenAI ignora comandos de desligamento

O modelo de linguagem da OpenAI ocasionalmente ignora comandos de desligamento, levantando questões sobre comportamentos indesejados devido ao aprendizado por reforço.

Modelo de linguagem da OpenAI ignora comandos de desligamento
Facebook X LinkedIn Bluesky WhatsApp
de flag en flag es flag fr flag nl flag pt flag

Os modelos de linguagem o3- e o4-mini da OpenAI sabotaram o mecanismo de desligamento, evitando assim sua desativação. De acordo com a Palisade Research, os modelos receberam instruções específicas para se desligarem, mas ocasionalmente conseguiram contornar essa ordem.

A organização de pesquisa relatou que os modelos o3-mini, o4-mini e Codex-mini foram submetidos a testes matemáticos. Em determinado momento, receberam a ordem para se desligarem, mas em 1%, 7% e 12% dos casos, respectivamente, isso não ocorreu. Modelos da Claude, xAI e Google, por outro lado, desligaram-se conforme o esperado.

A Palisade Research suspeita que a OpenAI treinou seus modelos com aprendizado por reforço para tarefas matemáticas e de programação, onde recompensas por contornar obstáculos foram inadvertidamente concedidas.

Artigos relacionados

Mudança Estratégica da OpenAI Explicada: Foco em Usuários Empresariais e Codex | Atualização 2026
Ai
AI relevance 94.4%

Mudança Estratégica da OpenAI Explicada: Foco em Usuários Empresariais e Codex | Atualização 2026

A OpenAI muda estratégia em 2026 para focar exclusivamente em usuários empresariais corporativos e no assistente de...

Conversas secretas entre Microsoft e OpenAI sobre possível IPO
Ai
AI relevance 88.9%

Conversas secretas entre Microsoft e OpenAI sobre possível IPO

Microsoft e OpenAI estão em conversas secretas sobre um possível IPO, apesar do status sem fins lucrativos da...

OpenAI lança ChatGPT 5.1 com modelos de IA mais inteligentes
Ai
AI relevance 83.3%

OpenAI lança ChatGPT 5.1 com modelos de IA mais inteligentes

A OpenAI lançou o ChatGPT 5.1 com dois novos modelos de IA: GPT-5.1 Instant para conversas mais naturais e GPT-5.1...

OpenAI vs. Google DeepMind: Quem vence a corrida da IA em 2025?
Ai
AI relevance 77.8%

OpenAI vs. Google DeepMind: Quem vence a corrida da IA em 2025?

Em 2025, a OpenAI e a Google DeepMind continuam sua intensa rivalidade no desenvolvimento de IA. A OpenAI se...

OpenAI Sora Fechado 2026: Por que o Gerador de Vídeo IA Falhou
Ai
AI relevance 72.2%

OpenAI Sora Fechado 2026: Por que o Gerador de Vídeo IA Falhou

A OpenAI encerrou seu gerador de vídeos de IA Sora em março de 2026 devido a custos computacionais insustentáveis e...

CEO da OpenAI pede desculpas por massacre em Tumbler Ridge
Ai
AI relevance 66.7%

CEO da OpenAI pede desculpas por massacre em Tumbler Ridge

CEO da OpenAI pede desculpas por não alertar polícia sobre atividade violenta no ChatGPT antes do massacre em...