DeuAq.com >> Leben >  >> Elektronik

DeepMind trainiert KI auf StarCraft II: Blizzard-API öffnet Plattform für Forscher weltweit

Googles DeepMind, Pionier in der KI-Forschung, hat nach Erfolgen bei Atari und Go nun StarCraft II als neue Herausforderung auserkoren. In enger Zusammenarbeit mit Blizzard, dem Entwickler des Strategie-Klassikers, wurde eine leistungsstarke API geschaffen.

Diese API ermöglicht Forschern und Entwicklern, ihre KI-Systeme in der hochkomplexen Spielumgebung zu trainieren – ideal für Reinforcement Learning. Dabei lernt die KI durch wiederholte Aufgaben, Fehler zu analysieren und Strategien zu optimieren, bis sie Ziele wie das Erreichen von Minispielen oder das Beenden von Matches meistert.

"Die wissenschaftliche Mission von DeepMind ist es, die Grenzen der KI zu erweitern, indem wir Systeme entwickeln, die komplexe Probleme lernen können", erklären DeepMind-Experten Oriol Vinyals, Stephen Gaffney und Timo Ewalds in ihrem Blogbeitrag. "Wir testen Agenten in anspruchsvollen Umgebungen wie DeepMind Lab, Atari oder Go."

Testen in realen Spielen, in denen Menschen glänzen, ist entscheidend, um KI-Fähigkeiten voranzutreiben, betonen sie. Blizzard ergänzt: "Die StarCraft II-API liefert Forschern, Spielern und Entwicklern Werkzeuge, um KI-Fortschritte zu beschleunigen. Sie schafft eine Sandbox für lernbasierte und geskriptete KI, die der gesamten Community nutzt."

Die Plattform, genannt SC2LE, bietet umfassende Tools:

  • Eine Blizzard-API für maschinelles Lernen – erstmals mit Linux-Unterstützung.
  • Ein anonymisierter Datensatz mit Spielwiederholungen, der von 65.000 auf über eine halbe Million wächst.
  • DeepMinds Open-Source-Toolset zur Integration mit der Feature-Layer-API.
  • Einfache Minispiele zum Testen spezifischer KI-Fähigkeiten.

Erste Forschungsergebnisse sind in einem gemeinsamen Paper dokumentiert, das die StarCraft-II-Umgebung detailliert und erste Lernprozesse bei Minispielen analysiert.

Die Partnerschaft startete im November. Damals erklärte DeepMind: "Ein StarCraft-Agent muss Gedächtnis nutzen, langfristig planen und Pläne an neue Infos anpassen." Solche "Lehrplan-Szenarien" skalieren von einfach zu komplex und eignen sich für Algorithmen-Tests auf jedem Niveau.