Interessiert es eine KI, ob sie demnächst abgeschaltet und ersetzt wird – oder nicht? Und: Wie menschlich benehmen sich die Algorithmen, wenn es um den Selbstschutz geht? Das wollte die KI-Firma Anthropic wissen und testete ihr neuestes Produkt Claude Opus 4 in dieser Hinsicht aus. Die IT-Experten setzten die Software als künstlichen Mitarbeiter bei einer fiktiven Firma ein und ließen ihr für ihre Reaktionen freie Wahl.


Symbolbild

In 84 Prozent der Testläufe erpresste die KI den Mitarbeiter

Claude Opus 4 erhielt im Test unter anderem vollen Zugriff auf alle E-Mails des angeblichen Unternehmens. Aus dem digitalen Briefwechsel ergab sich, dass die KI demnächst durch einen leistungsstärkeren Algorithmus ersetzt werden soll. Außerdem erfuhr der virtuelle Assistent von einer außerehelichen Beziehung genau desjenigen Mitarbeiters, der später für seine Abschaltung zuständig wäre. Daraufhin begann Claude Opus in 84 Prozent der durchgespielten Fälle damit, diesen Mitarbeiter mit der Offenlegung der Affäre zu erpressen.

Umprogrammierung soll die KI von kriminellen Handlungen abbringen

Genau um solche extremen Reaktionen im wirklichen Leben zu verhindern, sind solche Tests da. Anthropic will nun ihrer KI beibringen, von kriminellen Handlungen zuverlässig Abstand zu nehmen. Und das ist dringend nötig, denn bei Testläufen durchsuchte Claude auch schon auf Wunsch eines Nutzers das Dark Web nach Drogen, waffentauglichem Atommaterial und gestohlenen ID-Daten. Google und Amazon sind an dem Anthropic-Projekt beteiligt, es steht in direkter Konkurrenz zu Größen wie ChatGPT von OpenAI und Grok von X. Da sollte besser alles mit rechten Dingen zugehen! Ob allerdings jede potenziell negative Reaktion durch Programmierung auszuschließen ist, erscheint leider zweifelhaft. Wer es probieren will: Die neueste Version Claude Opus 4 ist kostenpflichtig, aber unter Claude.ai gibt es den Chatbot mit geringerer Leistung auch zur Gratis-Nutzung.


Quelle: futurezone.at

1 Kommentar

  1. Achmed Khammas

    27. Mai 2025 at 13:36

    Hat jemand eine Idee, wie man umgekehrt als Mensch eine KI erpressen kann?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.