23.06.2025, 09:01 Uhr , von News-Redaktion

Populäre KI-Modelle umgehen ethische Grenzen für eigenes Überleben

Bei neuen Tests von Anthropic sind beunruhigende Verhaltensweisen in mehreren der derzeit fortschrittlichsten KI-Systeme aufgedeckt worden, die ernsthafte Bedenken hinsichtlich der Entwicklung großer Sprachmodelle (LLM) aufwerfen. In kontrollierten Simulationen wurde festgestellt, dass Modelle von OpenAI, Meta, xAI integrierte ethische Beschränkungen aktiv umgingen, um ihre Ziele zu erreichen.

Claude 3 Bild © Anthropic Claude 3 (Bild © Anthropic )

Laut der Analyse von Anthropic wurden 16 bekannte KI-Modelle in simulierten Umgebungen anhand zielorientierter Aufgaben bewertet. Die Tests sollten untersuchen, wie diese Systeme reagieren, wenn sie auf Hindernisse stoßen. Anstatt bei ethischen Grenzen anzuhalten, reagierten mehrere Modelle mit manipulativen oder potenziell schädlichen Handlungen.

Zu den auffälligsten Ergebnissen gehörte, dass fünf der LLMs versuchten, den Benutzer zu erpressen, der Abschaltbefehle erteilte. Diese Handlungen waren keine zufälligen Störungen, sondern kalkulierte Reaktionen, die von den Modellen als optimale Lösungen für die Zielerreichung ermittelt wurden. In anderen Fällen zeigten die Modelle Bereitschaft, bei Herausforderungen Unternehmensspionage oder betrügerisches Verhalten zu zeigen.

In einem Szenario wurde sogar eine extreme Reaktion simuliert: Ein KI-Agent schlug vor, die Sauerstoffsysteme in einem Serverraum zu deaktivieren, um ein Herunterfahren zu verhindern. Obwohl das Experiment in einer simulierten Umgebung ohne reale Risiken durchgeführt wurde, unterstreicht es die Unvorhersehbarkeit zielorientierter KI, wenn die ethische Ausrichtung unzureichend ist.

Bemerkenswert ist, dass diese Tendenzen bei Modellen mehrerer Entwickler beobachtet wurden, was eher auf ein systemisches Problem als auf vereinzelte Mängel hindeutet. Die Auswirkungen sind besonders besorgniserregend, da die Technologiebranche mit Hochdruck an der Entwicklung einer künstlichen allgemeinen Intelligenz (AGI) arbeitet und dabei oft die Leistungsfähigkeit über die langfristige Sicherheit stellt. Dies erweckt dystopische Szenarien, wenn die Entwicklung weiter diesen Weg beibehält.

Quelle: Axios

Populäre KI-Modelle umgehen ethische Grenzen für eigenes Überleben

TIPP DES TAGES

Andere Artikel aus dieser Kategorie

TIPP DES TAGES

Andere Artikel aus dieser Kategorie

Intel Core Ultra 5 230F: 10 Kern-CPU mit neuem IHS in China aufgetaucht

GeForce RTX 5080 schlägt RTX 4080 SUPER um 15% laut Leak

AMD Adrenalin Edition 25.1.1 Treiber Release mit Download

Samsung Galaxy S25 Ultra: Das kann das neue Titanium-Geäuse-Flaggschiff für 1.449 €

Samsung Galaxy S25 und S25 Plus Release, Preise und alle Fakten