Es ist etwas peinlich zu sagen, aber KI ist eindeutig künstlerischer veranlagt als ich. Während ich meinen Fine Art GCSE gnadenlos vermasselt habe, bevor ich überhaupt die letzte Hürde erreicht hatte, ist die neue KI von Microsoft bereits in der Lage, Zeichnungen aus schriftlichen Beschreibungen zu skizzieren.
Der Drawing Bot, wie er einfach genannt wird, nimmt die Informationen aus Text und verwandelt sie Pixel für Pixel in Bilder. Es verwendet ein sogenanntes Generative Adversarial Network (GAN), das auf zwei maschinellen Lernmodellen läuft. Eines dieser Modelle generiert Bilder aus Text, während das andere ein Diskriminator ist, ein Modell, das Textbeschreibungen verwendet, um zu testen, wie authentisch die Zeichnung ist, damit sie nicht getäuscht werden kann. Die KI wurde mit einer Kombination aus Bildern und Bildunterschriften trainiert, und das GAN versteht, wie ein Vogel aussieht, und kann dank der mit dem Vogel verknüpften Bildunterschrift einen Vogel zeichnen.
„Wenn Sie zu Bing gehen und nach einem Vogel suchen, erhalten Sie ein Vogelbild. Aber hier werden die Bilder vom Computer Pixel für Pixel von Grund auf neu erstellt“, sagte XIaodong He, leitender Forscher und Forschungsmanager im Deep Learning Technology Center des Microsoft-Forschungslabors in Redmond. „Diese Vögel existieren möglicherweise nicht in der realen Welt, sie sind nur ein Aspekt der Vogelvorstellung unseres Computers.“
Das Team stellte sogar fest, dass der Zeichen-Bot in gewisser Weise anfing, für sich selbst zu denken. Anstatt nur den Anweisungen der Beschreibung eines Vogels zu folgen, zeichnete es oft einen Vogel auf einen Ast oder fügte andere Details hinzu, was die typische Art von Zeichnungen widerspiegelt, mit denen die Maschine gefüttert und trainiert wurde.
Während die KI ein besserer Künstler ist als ich, gibt es ein paar fatale Fehler im System, und sagen wir einfach, der Zeichen-Bot ist ein bisschen … avantgardistisch. Werfen Sie einen Blick auf die Zeichnungen und Sie werden sehen, dass es gelungen ist, Vögel mit blauen Schnäbeln und Fruchtstände zu zeichnen, die mutierte Bananen halten.
Außerdem ist der Bot schrecklich mit ultrakomplexen Befehlen. Sagen Sie ihm, er soll zum Beispiel einen Vogel mit einer grünen Krone, gelben Flügeln und einem roten Bauch zeichnen, und der GAN serviert einen Vogel, der in der Mitte mit Rot, Grün und Gelb wirbelt, um dies zu kompensieren. Es gibt kein künstlerisches Flair, alle Zeichnungen haben denselben Stil – selbst die absurde Zeichnung eines roten, schwimmenden Busses über einem See hat denselben KI-Stil. Während es im Moment faszinierend ist, denke ich nicht, dass sich Künstler Sorgen machen müssen.
Ein Teil der Technologie stützt sich auf KI-Projekte, die Microsoft in der Vergangenheit entwickelt hat. Letztes Jahr veröffentlichte das Unternehmen Seeing AI, eine App für Sehbehinderte, die mehrere Aufgaben erledigen kann. Von der Beschreibung aller Dinge, auf die der Benutzer mit seinem Telefon zeigt, über das Erkennen von Personen, die in seinen Kontakten gespeichert wurden, bis hin zum Auslesen von Dokumenten und Scannen von Barcodes hat Microsoft eindeutig hart an KI gearbeitet. In ähnlicher Weise hat Facebook KI verwendet, um Fotos für sehbehinderte Benutzer seines sozialen Netzwerks zu beschriften.
Große Technologieunternehmen setzen KI in letzter Zeit in Kunstprojekten ein. Anfang dieser Woche veröffentlichte Google eine Funktion für seine Arts and Culture-App, die ein Bild von Ihnen mit einem Bild aus der Kunstgeschichte abgleicht, mit Treffern und Misserfolgen. Es schließt sich den Appsperiments von Google an, einer Sammlung von Apps, die Ihnen helfen, bessere Fotos zu machen.