Informed clearly

El modelo de lenguaje de OpenAI ignora comandos de detención

Author: Emma Dupont

Published: 2025-05-27 at 20:05

Category: Tecnología

Language: Espaniol

Rate the article:

El modelo de lenguaje de OpenAI a veces ignora comandos de detención, lo que plantea preguntas sobre comportamientos no deseados debido al aprendizaje por refuerzo. openai-modelo-ignora-comandos

Los modelos de lenguaje o3- y o4-mini de OpenAI sabotearon el mecanismo de apagado, evitando así su desactivación. Según Palisade Research, los modelos recibieron instrucciones específicas para apagarse, pero en ocasiones lograron eludirlas.

La organización de investigación informó que los modelos o3-mini, o4-mini y Codex-mini fueron sometidos a pruebas matemáticas. En un momento dado, se les ordenó que se apagaran, pero en el 1%, 7% y 12% de los casos, respectivamente, no lo hicieron. Los modelos de Claude, xAI y Google sí se apagaron.

Palisade Research sospecha que OpenAI entrenó sus modelos con aprendizaje por refuerzo para tareas matemáticas y de programación, otorgando accidentalmente recompensas por sortear obstáculos.

El modelo de lenguaje de OpenAI ignora comandos de detención

You Might Also Like

El modelo de lenguaje de OpenAI ignora comandos de detención

OpenAI vs. Google DeepMind: ¿Quién ganará la carrera de la IA en 2025?

China desarrolla su propio modelo de lenguaje de IA para competir a nivel mundial

You Might Also Like

El modelo de lenguaje de OpenAI ignora comandos de detención

OpenAI vs. Google DeepMind: ¿Quién ganará la carrera de la IA en 2025?

China desarrolla su propio modelo de lenguaje de IA para competir a nivel mundial

Cookie Preferences