DeuAq.com >> Leben >  >> Elektronik

DeepMind bringt seiner KI bei, mit Street View-Bildern durch Städte zu navigieren

Google ist kein Unbekannter darin, der KI beizubringen, wie ein Mensch zu lernen. Wir haben gesehen, wie sein KI-Team Methoden des kindlichen Lernens anwendet, um der KI zu helfen, ihre Umgebung zu verstehen, und ihr sogar dabei hilft, zu lernen, wie man geht oder erschafft. Jetzt arbeiten die Forschungsteams von Google jedoch daran, einer KI dabei zu helfen, sich an den Grundriss einer Stadt zu erinnern, so wie Menschen lernen, sich durch eine komplexe Umgebung zu navigieren.

DeepMind bringt seiner KI bei, mit Street View-Bildern durch Städte zu navigieren

Gegenwärtig navigieren Maschinen mithilfe von Karten durch eine Stadt. Verfolgen einer Route durch von Menschen kartierte Straßen, während Sie per GPS auf Kurs bleiben. Menschen und Tiere hingegen entziffern ihren Weg durch eine Stadt über Orientierungspunkte, erinnern sich, was sich um bestimmte Ecken oder an bestimmten festen Orten befindet, und erstellen eine mentale Karte eines Gebiets. Deshalb können Sie sich auch in Ihrer Heimatstadt zurechtfinden, ohne ständig auf Google Maps starren zu müssen. Selbst wenn fast alle Straßenlayouts geändert wurden, wüsstest du immer noch, wie du es zum Haus deiner alten Freunde oder zu den Zeitungsläden schaffst, bei denen du diese unzähligen Fußballaufkleber gekauft hast.

DeepMind bringt seiner KI bei, mit Street View-Bildern durch Städte zu navigieren

Einer KI beizubringen, sich den Grundriss einer Stadt ähnlich wie ein Mensch zu merken, ist keine einfache Aufgabe, aber es ist dem DeepMind-Team von Google zugefallen, genau das zu tun. DeepMind stoppte vor rollenden Stapeln von Servern durch einige Straßen und verwendete Bilder von Google Street View, um seiner KI zu helfen, die Straßen von New York City, Paris und London zu lernen. Durch das Gehen auf diesen virtuellen Straßen hoffte das Team, sich ein genaues Wissen über einen Teil der Stadt anzueignen.

Laut einem der Forscher, Piotr Mirowski, läuft die Navigation wirklich auf zwei Fragen hinaus:„Wo bist du? Und wie kommt man dahin, wo man hin will?“. Im Gespräch mit Inverse erklärt Mirowski, dass dieser Gedankengang für „ein Kind, das ohne Smartphone in einer Nachbarschaft spazieren geht, einen Vogel, der lernt, zu seinem Nest zurückzufliegen, oder einen Roboter“ zutrifft.

Siehe dazu Wie Google DeepMind wie ein Kind lernt:DeepMind verwendet Videos, um sich selbst etwas über die Welt beizubringen. Die Architekten lehren KI, Städte zu drucken

In einem von der Cornell University Library veröffentlichten Artikel erklärt das DeepMind-Team, wie sie einen Roboter dazu gebracht haben, sich ohne Karte oder GPS-Daten durch eine Stadt zu navigieren. Die neuronalen Netze der Test-KI sind im Grunde wie ahnungslose Touristen, die zum ersten Mal eine Stadt besuchen – sie haben kein Vorwissen, auf das sie sich stützen können. Indem Bilddaten in das neuronale Netzwerk einer KI eingespeist werden, kann sie sich ein Bild der Stadt und ihres Grundrisses erstellen und ihr dabei helfen, sich zu festgelegten Punkten zurechtzufinden.

„Wir trainieren das neuronale Netzwerk, um durch den Central Park, das West Village, Midtown und Harlem zu navigieren“, erklärt Mirowski. „Es ist in der Lage, sich eine Karte der Umgebung zu merken, ohne jemals eine Karte der Umgebung zu sehen. Dazu erkundet er anfangs zufällig ein Gebiet, erhält dann aber eine Belohnung, nachdem er ein Ziel erreicht hat. Es stellt eine Verbindung mit diesem [Belohnungs-] Signal und seiner Wahrnehmung her.“

Unnötig zu erwähnen, dass diese menschenähnliche Interpretation der Navigation wirklich beeindruckend ist. Wir sind jedoch noch ein Stück davon entfernt, dass es in der realen Nutzung eingeführt wird, da noch viele Probleme zu lösen sind. Beispielsweise muss das System jedes Mal neu trainiert werden, wenn es in eine neue Stadt gebracht wird, was zeigt, dass es immer noch nicht in der Lage ist, eine neue Stadt im Handumdrehen zu lernen – was es beispielsweise für ein autonomes Auto ziemlich schwierig macht, sich in einer unbekannten Stadt zurechtzufinden.

Sobald das DeepMind-Team jedoch in der Lage ist, die Navigationsfähigkeiten der KI aus einer Stadt beizubehalten und sie darüber informiert, wie sie eine neue, unbekannte Stadt versteht, könnten wir eine ganz neue Welle intelligenter autonomer Fahrzeuge sehen.