DeuAq.com >> Leben >  >> Elektronik

DeepMind hat seine KI darauf trainiert, StarCraft II zu spielen – und jetzt kann jeder dasselbe tun

Googles DeepMind ist nicht damit zufrieden, es mit Ataris Besten aufzunehmen und den Weltmeister des komplexen chinesischen Go-Spiels zu verprügeln, und hat seine KI auf StarCraft II eingestellt

Das KI-Unternehmen hat mit Blizzard, dem Schöpfer von StarCraft, zusammengearbeitet, um eine API zu entwerfen, mit der Forscher und Entwickler ihre KI-Programme in der komplexen Umgebung des Spiels trainieren können.

Diese Plattform wird ihnen insbesondere dabei helfen, ihre KI mit sogenannten „reinforcement learning-Techniken“ zu testen, bei denen es typischerweise darum geht, die KI Aufgaben wiederholen zu lassen, bis sie einen Fehler macht. Die KI lernt dann aus dem Fehler und versucht es erneut.

Sehen Sie sich die Hoffnungen des NHS an, mit der DeepMind-App jährlich 10.000 Leben zu retten. Die nächste Herausforderung von DeepMind? StarCraftII

Schließlich führt die KI genügend Züge aus, um den effektivsten Weg zu lernen, um die Aufgabe zu erledigen, die in diesem Fall das Abschließen des Spiels oder zumindest Minispiele innerhalb des Spiels sein wird.

„Die wissenschaftliche Mission von DeepMind ist es, die Grenzen der KI zu erweitern, indem Systeme entwickelt werden, die lernen können, komplexe Probleme zu lösen“, erklärten Oriol Vinyals, Stephen Gaffney und Timo Ewalds von DeepMind in einem Blogbeitrag. „Zu diesem Zweck entwerfen wir Agenten und testen ihre Fähigkeiten in einer Vielzahl von Umgebungen, vom speziell entwickelten DeepMind Lab bis hin zu etablierten Spielen wie Atari und Go.“

Der Beitrag fuhr fort, dass das Testen von „Agenten“ in Spielen, die nicht speziell für die KI-Forschung entwickelt wurden, und insbesondere in Spielen, in denen Menschen hervorragende Leistungen erbringen, entscheidend für die Verbesserung der KI-Leistung ist.

Blizzard fügte hinzu:„Wir erkennen die Anstrengungen an, die Forscher im Laufe der Jahre unternommen haben, um die KI mit dem ursprünglichen StarCraft voranzubringen. Mit der StarCraft II-API stellen wir Forschern, Spielern und Bastlern leistungsstarke Tools zur Verfügung, um das Spiel als Plattform zu nutzen, um den Stand der KI-Forschung weiter voranzutreiben. Diese API bietet der Community auch eine Sandbox, mit der sie experimentieren kann, indem sie sowohl lernbasierte KI als auch geskriptete KI verwendet, um neue Tools zu entwickeln, von denen die StarCraft II- und KI-Community profitieren können.“

Die Version wird als SC2LE bezeichnet und enthält eine Reihe von Tools, von denen DeepMind hofft, dass sie die KI-Forschung beschleunigen werden. Dazu gehören:

    Eine von Blizzard entwickelte API für maschinelles Lernen, die zum ersten Mal die Veröffentlichung von Tools für Linux beinhaltet.

    Ein Datensatz anonymisierter Spielwiederholungen, der in den kommenden Wochen von 65.000 auf mehr als eine halbe Million ansteigen wird.

    Eine Open-Source-Version des Toolsets von DeepMind, mit der Forscher Blizzards Feature-Layer-API mit ihrer eigenen KI verwenden können.

    Eine Reihe einfacher Minispiele, mit denen Forscher ihre KI bei bestimmten Aufgaben testen können.

Die Forschungsergebnisse wurden auch in einem gemeinsamen Papier veröffentlicht, das mehr Details über die Umgebung von StarCraft II enthält und enthüllt, wie sich die KI in ersten Tests geschlagen hat, in denen sie Minispiele spielte und überwacht wurde, während sie daraus lernte Wiederholungen.

Die Partnerschaft wurde ursprünglich im November vorgestellt. DeepMind sagte damals:„Ein Agent, der StarCraft spielen kann, muss eine effektive Nutzung des Gedächtnisses, die Fähigkeit, über einen langen Zeitraum zu planen, und die Fähigkeit, Pläne auf der Grundlage neuer Informationen anzupassen, demonstrieren.“ Dies stellt eine erhebliche Herausforderung für die KI dar, da Computer in der Vergangenheit Schwierigkeiten hatten, mit der gleichen Anzahl von „Aktionen pro Minute“ Schritt zu halten, wie Menschen beim Spielen solcher Spiele.

DeepMind nennt diese Lektionen „Lehrplan“-Szenarien, und jedes wird zunehmend komplexere Aufgaben sein, um „Forschern auf jedem Niveau zu ermöglichen, einen Agenten zum Laufen zu bringen und verschiedene Algorithmen und Fortschritte zu bewerten.“