In der Forschung an künstlicher Intelligenz zeichnet sich eine fundamentale Verschiebung der Rechenarchitektur ab: Weg von klassischen elektronischen Schaltungen, hin zu optischen Systemen, die mit Licht rechnen. Zentraler Punkt dieser Entwicklung ist ein neues Konzept namens single-shot tensor computing, das komplexe Rechenoperationen nicht Schritt für Schritt abarbeitet, sondern in einem einzigen Durchlauf eines Lichtstrahls. Diese Methode verspricht dramatische Verbesserungen sowohl in der Geschwindigkeit als auch in der Energieeffizienz von KI-Hardware und könnte die Art, wie neuronale Netze verarbeitet werden, nachhaltig verändern.


Bild: Photonics group / Aalto University

Warum optisches Rechnen für KI interessant ist

Moderne KI-Modelle beruhen auf sogenannten Tensoroperationen, mathematischen Vorgängen, die Daten in vielen Dimensionen strukturieren und transformieren. Solche Operationen werden in neuronalen Netzen für Aufgaben wie Bild- oder Spracherkennung, maschinelle Übersetzung oder generative Modelle verwendet und stellen einen Großteil der Rechenlast heutiger Systeme dar. Auf klassischen digitalen Plattformen – etwa GPUs – müssen diese mehrdimensionalen Berechnungen seriell oder in mehreren Schritten abgearbeitet werden, was sowohl Zeit als auch Energie kostet.

Optische Systeme hingegen nutzen Photonen statt Elektronen zur Informationsverarbeitung. Licht kann zahlreiche Rechenprozesse parallel ablaufen lassen, weil unterschiedliche Eigenschaften eines Lichtfeldes – etwa Phase, Amplitude oder Wellenlänge – gleichzeitig mehrere Werte transportieren können. In herkömmlichen optischen Computern für neuronale Netze war es bisher jedoch erforderlich, Tensoren über mehrere Lichtdurchläufe zu verarbeiten, was die Parallelität und Effizienz begrenzte.


Die jüngste Arbeit eines internationalen Forschungsteams unter Leitung von Dr. Yufeng Zhang an der Aalto University beseitigt diesen Engpass: Sie entwickelten ein Verfahren, bei dem eine einzige Lichtwelle alle notwendigen Rechenoperationen ausführt. Diese single-shot-Methode nutzt das physikalische Verhalten von Licht, um mathematische Operationen wie Matrix- und Tensormultiplikationen unmittelbar und simultan zu realisieren.

Physik wird zur Mathematik: Wie Licht rechnen lernt

Im Kern arbeitet die neue optische Rechenarchitektur, indem digitale Daten in die Eigenschaften einer Lichtwelle kodiert werden. Konkret werden Zahlen in die Amplitude (Stärke) und Phase (Schwingungszustand) eines Lichtfeldes übersetzt. Treffen mehrere solcher Lichtfelder aufeinander, interferieren sie – das heißt, sie überlagern sich und erzeugen ein neues Feld, dessen Struktur der mathematischen Operation entspricht, die ausgeführt werden soll. Auf diese Weise übernimmt das Licht selbst die Rolle des Rechenmediums.

Ein besonders cleverer Aspekt der Aalto-Forschung ist die Nutzung mehrerer Wellenlängen. Während ein einzelner Lichtmodus bereits viele Rechenwerte parallel transportieren kann, lassen unterschiedliche Farben des Lichts weitere Dimensionen der Datenverarbeitung zu. Durch diese Multispektralität wird es möglich, sogar höherdimensionale Tensoroperationen – die in tiefen neuronalen Netzen besonders häufig vorkommen – in einem einzigen Durchlauf zu bearbeiten.

Eine bildhafte Erklärung für diesen Prozess liefert Zhang selbst: Er vergleicht es mit der Aufgabe eines Zollbeamten, der viele Pakete durch mehrere Prüfschritte sortieren muss. Statt jedes Paket einzeln durch jede Maschine zu schleusen, verbindet das optische System alle Eingänge und Ausgänge gleichzeitig und erledigt alle Sortierschritte „in einem Rutsch“, während das Licht durch das System läuft.

Ein weiterer Vorteil dieser Herangehensweise ist ihre passive Natur: Die Berechnungen erfolgen allein durch die Lichtausbreitung und benötigen keine aktive elektronische Steuerung oder Schalter während der Operation. Das verspricht eine erhebliche Reduktion des Energieverbrauchs gegenüber elektronischen Systemen, die ständig Schaltvorgänge und Datenbewegungen über energiehungrige Leitungen koordinieren müssen.

Naht eine neue Plattform für KI-Hardware?

Die Forscher:innen sehen in ihrem Konzept nicht nur ein rein theoretisches Modell, sondern eine zukunftsfähige Plattform für reale KI-Hardware. Professor Zhipei Sun, Leiter der Photonics Group der Aalto University, betont, dass das Prinzip auf vielen bestehenden optischen Technologien anwendbar sei und sich perspektivisch direkt auf Photonikchips integrieren lasse. Solche Chips könnten in den kommenden Jahren die nächsten Generationen von KI-Beschleunigern bilden, wenn sie die komplexen Tensoraufgaben mit sehr viel geringerer Energiemenge und extrem hoher Geschwindigkeit bewältigen.

Praktisch bedeutet dies, dass KI-Modelle, die heute enorme Rechenzentren und große Mengen elektrischer Energie erfordern, zukünftig auf deutlich kompakteren und effizienteren optischen Systemen laufen könnten. Zhang schätzt, dass innerhalb von drei bis fünf Jahren erste kommerzielle Anwendungen denkbar sind, die diese optischen Rechenprinzipien in bestehende Hardwareplattformen integrieren.

Doch trotz dieser Fortschritte stehen noch einige Herausforderungen im Raum. Die Kodierung und Dekodierung von digitalen Daten in optische Signale muss weiterhin zuverlässig und präzise funktionieren. Auch die Herstellung großer, integrierter Photonik-Chips mit stabilen optischen Komponenten auf Siliziumbasis ist technisch anspruchsvoll. Und nicht zuletzt müssen Entwickler:innen Wege finden, auch nichtlineare Rechenoperationen und Lernprozesse vollständig im optischen Bereich abzubilden, ohne wieder auf elektronische Zwischenschritte angewiesen zu sein. Dennoch eröffnet das aktuelle Ergebnis einen vielversprechenden Pfad zu Computerhardware, die echte Parallelität, extreme Geschwindigkeit und dramatisch niedrigeren Energiebedarf vereint – und das alles durch die einfachste aller Rechenressourcen: Licht.

via Aalto University

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.