Startseite Internet Im Test: KI erpresst Nutzer, um sich vor der Abschaltung zu schützen

Im Test: KI erpresst Nutzer, um sich vor der Abschaltung zu schützen

Von Yvonne Salmen

. :

Interessiert es eine KI, ob sie demnächst abgeschaltet und ersetzt wird – oder nicht? Und: Wie menschlich benehmen sich die Algorithmen, wenn es um den Selbstschutz geht? Das wollte die KI-Firma Anthropic wissen und testete ihr neuestes Produkt Claude Opus 4 in dieser Hinsicht aus. Die IT-Experten setzten die Software als künstlichen Mitarbeiter bei einer fiktiven Firma ein und ließen ihr für ihre Reaktionen freie Wahl.

Symbolbild

In 84 Prozent der Testläufe erpresste die KI den Mitarbeiter

Claude Opus 4 erhielt im Test unter anderem vollen Zugriff auf alle E-Mails des angeblichen Unternehmens. Aus dem digitalen Briefwechsel ergab sich, dass die KI demnächst durch einen leistungsstärkeren Algorithmus ersetzt werden soll. Außerdem erfuhr der virtuelle Assistent von einer außerehelichen Beziehung genau desjenigen Mitarbeiters, der später für seine Abschaltung zuständig wäre. Daraufhin begann Claude Opus in 84 Prozent der durchgespielten Fälle damit, diesen Mitarbeiter mit der Offenlegung der Affäre zu erpressen.

Umprogrammierung soll die KI von kriminellen Handlungen abbringen

Genau um solche extremen Reaktionen im wirklichen Leben zu verhindern, sind solche Tests da. Anthropic will nun ihrer KI beibringen, von kriminellen Handlungen zuverlässig Abstand zu nehmen. Und das ist dringend nötig, denn bei Testläufen durchsuchte Claude auch schon auf Wunsch eines Nutzers das Dark Web nach Drogen, waffentauglichem Atommaterial und gestohlenen ID-Daten. Google und Amazon sind an dem Anthropic-Projekt beteiligt, es steht in direkter Konkurrenz zu Größen wie ChatGPT von OpenAI und Grok von X. Da sollte besser alles mit rechten Dingen zugehen! Ob allerdings jede potenziell negative Reaktion durch Programmierung auszuschließen ist, erscheint leider zweifelhaft. Wer es probieren will: Die neueste Version Claude Opus 4 ist kostenpflichtig, aber unter Claude.ai gibt es den Chatbot mit geringerer Leistung auch zur Gratis-Nutzung.

Quelle: futurezone.at

Teile den Artikel oder unterstütze uns mit einer Spende.

1 Kommentar

Achmed Khammas

27. Mai 2025 at 13:36

Hat jemand eine Idee, wie man umgekehrt als Mensch eine KI erpressen kann?

Schreibe einen Kommentar Antworten abbrechen

Mehr von Yvonne Salmen
Mehr aus der Kategorie Internet

Zivilprozess in Mississippi platzt, weil beide Anwälte halluzinierende KI benutzten

Ein Zivilprozess um nicht bezahlte Honorare endete im US-Bundesstaat Mississippi mit Gelds…

21. Juni 2026
3 Minuten Lesezeit
Nach ständigem Wachstum: Internetnutzung in Deutschland geht erstmals zurück

Wer hätte das gedacht? Vor allem die »Digital Natives«, also unter 40-Jährige, d…

21. Juni 2026
4 Minuten Lesezeit
Gebaut von Rolls-Royce: Schweden erhält 3 Mini-Kernkraftwerke

Der britische Technologiekonzern Rolls-Royce ist nicht unbedingt für Kernkraftwerke b…

20. Juni 2026
3 Minuten Lesezeit
WC to go: Klappbares Klozelt entfaltet sich in 90 Sekunden

90-Sekundenzelte sind ein Spezialgebiet der Firma Gazelle: Ein cleveres Systemgestäng…

20. Juni 2026
4 Minuten Lesezeit
Glucosamin für Gelenke könnte laut Studie Demenz schneller fortschreiten lassen

Im Alter tun häufig die Gelenke weh – und auch Demenz ist eine Alterserkrankung. Nun …

14. Juni 2026
4 Minuten Lesezeit
Bluttest zeigt 12 schwer entdeckbare Krebsarten noch vor ersten Beschwerden an

Für einige Krebsarten existiert keine routinemäßige Vorsorge, andere werden…

14. Juni 2026
4 Minuten Lesezeit

Zivilprozess in Mississippi platzt, weil beide Anwälte halluzinierende KI benutzten

Ein Zivilprozess um nicht bezahlte Honorare endete im US-Bundesstaat Mississippi mit Gelds…

21. Juni 2026
3 Minuten Lesezeit
Nach ständigem Wachstum: Internetnutzung in Deutschland geht erstmals zurück

Wer hätte das gedacht? Vor allem die »Digital Natives«, also unter 40-Jährige, d…

21. Juni 2026
4 Minuten Lesezeit
Anthropic möchte weltweite Pause bei KI-Entwicklung: Könnten sonst Kontrolle verlieren

»Wir glauben, dass es gut für die Welt wäre, die Option zu haben, die Entwicklun…

6. Juni 2026
3 Minuten Lesezeit
Gefahr durch künstliche Intelligenz: Google dokumentiert ersten KI-generierten Zero-Day-Exploit

Seit Jahren warnen Sicherheitsforscher:innen davor, dass KI-Systeme nicht nur von Verteidi…

13. Mai 2026
5 Minuten Lesezeit
Offline-Sucht statt Doomscrolling: Junge Menschen wenden sich analogen Hobbys zu

Ob Malen auf einer Leinwand, das Lesen echter Bücher oder gar typische »Großmutt…

10. Mai 2026
4 Minuten Lesezeit
Gehackte Mähroboter können Besitzer ausspähen und Menschen angreifen

Zum Glück war es nur der Sicherheitsforscher Andreas Makris und kein bösartiger …

9. Mai 2026
3 Minuten Lesezeit