Home » Technik » Künstliche Intelligenz: Google-Software erkennt Aufnahmeort von Fotos

Künstliche Intelligenz: Google-Software erkennt Aufnahmeort von Fotos

Künstliche Intelligenz ist ein wichtiges Thema für die IT-Branche. Unternehmen wie Apple, Google, Facebook und Microsoft entwickeln Produkte, die auf künstlicher Intelligenz beruhen (zum Beispiel Siri oder Cortana). Die Konkurrenz belebt die Innovation – die Unternehmen versuchen stets, die Konkurrenz zu übertreffen. Dabei sind sie auch immer auf der Suche nach neuen Talenten, die frisch von den Universitäten kommen. Für talentierte Studenten zahlen die Unternehmen auch gerne mal sechsstellige Summen als Signing Bonus. Ganz weit vorne dabei im Bereich KI ist Google. Der Suchmaschinengigant setzt zunehmend auf sogenannte neuronale Netzwerke, also Computersystemen, die ähnlich arbeiten wie das Gehirn eines Menschen. Dabei macht das Unternehmen beeindruckende Fortschritte. Unter anderem kann Googles Software inzwischen ziemlich gut einschätzen, an welchem Ort ein Foto aufgenommen wurde.

Foto: Cornell University

Foto: Cornell University

Computer analysiert Hinweise auf den Aufnahmeort

Vor wenigen Wochen trat Googles Software gegen den europäischen Meister im Brettspiel “Go” an und schlug ihn, in diesem Monat ist der Weltmeister an der Reihe. “Go” ist für die KI eine Herausforderung, da das Spiel deutlich flexibler ist als beispielsweise Schach. In letzterem Spiel gelten Computer bereits seit Jahrzehnten als menschlichen Gegnern überlegen.

Neben dem asiatischen Brettspiel brachten Google-Forscher von der Cornell University ihrer Software noch eine weitere beeindruckende Fähigkeit bei: Speist man ein Foto in das System ein, so ist der Computer zunehmend fähig, den Aufnahmeort des Bildes zu ermitteln.

Je nach Foto kann es für Menschen teilweise recht einfach sein, zu erkennen, wo ein Foto aufgenommen wurde. Typische Landschaftsformen und Vegetation sind ein Anhaltspunkt, aber besonders wirkungsvoll sind Dinge wie Gebäude oder Aufschriften auf Schildern. Das menschliche Gehirn bildet eine Vielzahl von Assoziationen und kann so oft Rückschlüsse auf den Aufnahmeort ziehen. Ein derartiges Vorgehen muss einer künstlichen Intelligenz erst beigebracht werden.

Flickr als Testplattform

Der Forscher Tobias Weyand und sein Team haben die Welt in 26.000 Areale in viereckiger Form unterteilt. Gegenden, in denen nur wenige Fotos aufgenommen werden, blieben dabei unberücksichtigt. Im Anschluss speisten sie mehr als 91 Millionen Fotos in das System ein, in deren Exif-Daten die geografische Position des Aufnahmeorts enthalten war. Das Programm, das die Forscher auf den Namen “PlaNet” tauften, erlernte so die Zuordnung der Bilder zum Aufnahmeort.

Ihr System testeten die Wissenschaftler anschließend mit Yahoos beliebter Fotoplattform Flickr. 2,3 Millionen Fotos wurden durch die Software begutachtet, und in 48 Prozent der Fälle gelang es, die Bilder dem richtigen Kontinent zuzuordnen. 28,4 Prozent der Bilder wurden auch im richtigen Land platziert, und bei 10 Prozent konnte auch die richtige Stadt ermittelt werden. 3,6 Prozent der Bilder verordnete die Software sogar im richtigen Block.

Im Duell mit menschlichen Gegnern gewinnt der Computer

Anschließend musste die nur 377 Megabyte große Software gegen echte Menschen antreten. Hierfür wurde das Browserspiel “Geoguessr” benutzt, bei dem der Nutzer mittels Google Street View an einen beliebigen Ort versetzt wird und ermitteln muss, wo er sich virtuell gesehen befindet. “PlaNet” musste gegen 10 reiseerfahrene Menschen antreten und konnte von 50 Runden 28 für sich entscheiden. Dabei wies der Computer eine durchschnittliche Abweichung von 1132 Kilometern vom Aufnahmeort auf, die menschlichen Gegner kamen auf 2321 Kilometer.

Die Software kann auch Fotos erkennen, die in Innenbereichen aufgenommen wurde. Allerdings bedient sie sich dabei eines Tricks. Anstatt des Bildes selber durchsucht die Software das Album, in dem das Bild abgelegt wurde und erkennt den Aufnahmeort dort gespeicherter Bilder, die Außenbereiche zeigen. Diese Art der Erkennung ist natürlich anfällig gegenüber seltsamen Sortierungsgewohnheiten menschlicher Benutzer.

via MIT Technology Review

Jetzt einen Kommentar zum Thema schreiben

Ihre E-Mail Adresse wird nicht veröffentlicht! Pflichtfelder sind markiert *

*

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>