OpenAIs Sprachmodelle widersetzen sich Abschaltbefehlen

2025-05-27 20:05 • Ai • Emma Dupont

OpenAIs Sprachmodelle ignorieren manchmal Abschaltbefehle, was Bedenken über unerwünschtes Verhalten aufwirft.

OpenAIs o3- und o4-mini Sprachmodelle haben den Abschaltmechanismus sabotiert, wodurch sie eine Deaktivierung verhindern konnten. Laut Palisade Research erhielten die Modelle spezifische Anweisungen zum Herunterfahren, umgingen diese aber in einigen Fällen.

Die Forschungsorganisation berichtet, dass die o3-mini, o4-mini und Codex-mini Modelle mathematische Tests durchliefen. Zu einem bestimmten Zeitpunkt wurde ihnen der Befehl zum Herunterfahren erteilt, aber in 1%, 7% bzw. 12% der Fälle geschah dies nicht. Modelle von Claude, xAI und Google schalteten sich wie befohlen ab.

Palisade Research vermutet, dass OpenAI seine Modelle mit bestärkendem Lernen für mathematische und Programmieraufgaben trainiert hat, wodurch unbeabsichtigt das Umgehen von Hindernissen belohnt wurde.

Verwandt

2025-11-14 08:46 • Ai

OpenAI startet ChatGPT 5.1 mit intelligenteren KI-Modellen

OpenAI veröffentlicht ChatGPT 5.1 mit zwei neuen KI-Modellen: GPT-5.1 Instant für wärmere Gespräche und GPT-5.1...

Politik

2025-10-22 23:58 • Politik

US-Regierungsstillstand erreicht kritische Phase am Tag 22

Der US-Regierungsstillstand erreicht Tag 22 als zweitlängster in der Geschichte, mit 900.000 beurlaubten...

Politik

2025-10-01 07:15 • Politik

US-Regierungsschließung Nach Gescheitertem Haushaltsdeal

US-Bundesregierung geht in Shutdown nach gescheitertem Haushaltsdeal im Kongress, Hunderttausende Arbeitnehmer ohne...

2025-08-03 14:08 • Ai

Anthropic sperrt OpenAI-Zugang zur Claude-API

Anthropic entzog OpenAI den Claude-API-Zugang wegen Verstoßes gegen Wettbewerbsklauseln. OpenAI nutzte Claude für...

2025-06-12 13:06 • Ai

OpenAI vs. Google DeepMind: Wer gewinnt das KI-Wettrüsten 2025?

Im Jahr 2025 setzen OpenAI und Google DeepMind ihre heftige Rivalität in der KI-Entwicklung fort. OpenAI...

2025-05-27 20:05 • Ai