DeuAq.com >> Leben >  >> Elektronik

Nvidia und Cornell: Maschinelles Lernen verwandelt Hunde in Katzen – Das innovative MUNIT-Framework

Wir werden zunehmend geschickter darin, KI-Systeme zu trainieren, um Bilder und Videos zu manipulieren: von gefälschten Zitaten bis hin zu surrealen Szenenwechseln. Es war nur eine Frage der Zeit, bis diese Technologie auf Internetstars wie Katzen und Hunde trifft.

Ein Forschungsprojekt von Nvidia und der Cornell University demonstriert dies beeindruckend: Ein Video eines Huskys wird so bearbeitet, dass der Hund nahtlos in vier verschiedene Katzenrassen "übersetzt" wird – jede mit der identischen Kopfbewegung des Originals.

WEITER LESEN: KI versus maschinelles Lernen

Das MUNIT-Framework (Multimodal Unsupervised Image-to-Image Translation) markiert einen Meilenstein in der Bild-zu-Bild-Übersetzung. Es übertrifft Vorgänger, indem es mehr Flexibilität bietet: Aus einem Katzenbild entstehen mehrere Hunderassen und umgekehrt, wie Demonstrationsvideos zeigen.

"Bild-zu-Bild-Übersetzung transformiert Bilder von einer Domäne in eine andere – z. B. Katzen in Hunde oder Sommerlandschaften in Winteridyllen –, während die Struktur erhalten bleibt", erklärt Xun Huang, Hauptautor der Studie und Promovend an der Cornell University, gegenüber Alphr.

"Unser unsupervised Framework benötigt keine gepaarten Beispiele, lernt die Zuordnungen selbst und ist multimodal: Eine Katze kann in diverse Hunde verwandelt werden, statt nur einer 1:1-Zuordnung."

Nvidia und Cornell: Maschinelles Lernen verwandelt Hunde in Katzen – Das innovative MUNIT-Framework

Die Forscher wenden MUNIT weit über Haustiere hinaus an: Landschaften wechseln Jahreszeiten, Skizzen werden zu Schuhen oder Taschen, computergenerierte Straßen zu realen Szenen.

"Diese Methode erweitert die Bildbearbeitung enorm", betont Huang. "Statt deterministischer Ergebnisse wählen Sie aus einer Palette möglicher Ausgaben – und steuern den Stil per Referenzbild. Praktische Anwendungen reichen vom Design über Spiele und Filme bis zur Entwicklung autonomer Fahrzeuge."

Die noch etwas unheimlichen Ergebnisse erinnern an Sci-Fi-Szenarien, zeigen aber den Fortschritt unsupervised Bildmanipulation. Droht eine Erosion der visuellen Realität? Möglich. Doch schon jetzt sehen Sie, wie Ihr Hund als Katze wirkt.

Verwandte Themen: Neuronale Netzwerke als verwirrende Welten; KI mit kreativen Aussetzern.

Der Quellcode ist auf GitHub verfügbar. Entdeckt via Prosthetic Knowledge.