KI-fizierung und große Schatten – die Fotonews der Woche 18/2023

Wie Google aufholt, können nun auch Fotografen spüren und eine NGO muss den Umgang mit Generative-AI erst lernen. Große und kleine Kameras stehen auch an.

In Pocket speichern vorlesen Druckansicht 5 Kommentare lesen
Presse-Screenshot von Google Fotos, das den magischen Radierer zeigt.

"Vorschlag: Alle löschen". Google findet das offenbar in seinem selbst veröffentlichten Screenshot zum "Magischen Radierer" nicht einmal merkwürdig.

(Bild: Google)

Lesezeit: 8 Min.
Von
  • Nico Ernst
Inhaltsverzeichnis

Wenn das Schreiben einer eigentlich simplen Online-Nachricht viel länger dauert, als der Chefredakteur das gerne hätte – dann spielt der Autor wohl mehr mit dem neuen Produkt herum, als es der Nachrichtenwert hergeben würde. So geschehen in dieser Woche, als es um Google Fotos ging.

Dessen neue Suchfunktion ist zwar für unsere Accounts noch nicht freigeschaltet, aber die Anzeichen dafür, was da in den Tiefen der Rechenzentren passiert, sind deutlich sichtbar: Eine mächtige KI kann nicht nur Objekte, Personen und Aufschriften auf T-Shirts erkennen, sondern auch Orte anhand ähnlicher Fotos von anderen Nutzern nachträglich den Aufnahmen zuordnen. Wir haben das mit Aufnahmen des Metal-Festivals Wacken Open Air ausprobiert: Die charakteristische Bühne, der Schädel, sogar ein Gartenzwerg mit handgekrakelter Aufschrift "Wacken" wurde dem Event zugeordnet. Bands übrigens nicht, die könnten ja auch woanders gespielt haben.

c't Fotografie 3/24

Kunststück, mag da mancher sagen, ist halt Bilderkennung, GPS-Daten, dies das. Von wegen. Unsere eigenen Aufnahmen enthielten keinerlei Verschlagwortung, "Wacken" kam nicht im Dateinamen vor, und mit einem eigenen Account, der noch nie Google Fotos genutzt hatte, war alles nach Minuten erkannt. Also alles von jeglichen EXIF-Daten befreit, die Dateinamen unsortiert in Ziffern umgewandelt, in einen anderen Account geladen: Gleiches Ergebnis. Bei der Nachbehandlung mit Google Lens, was auch im Browser möglich ist, konnten sogar manch kryptische Band-Logos zumindest teilweise gelesen werden.

Das kann man irre praktisch finden, oder auch recht problematisch, denn: Die eigenen Fotos werden da ganz offensichtlich KI-fiziert und gegen alle anderen, die Google kennt, abgeglichen. Ob man das will, wird nicht gefragt, und die Einstellung, Orte ohne GPS-Daten zu erkennen, ist standardmäßig eingeschaltet. Wer unter photos.google.com das Zahnrad für die Einstellungen anklickt, kann das ändern, nur: Wer macht das schon? Und auch die Erklärungstexte dort unter "Fehlende Aufnahmeorte ungefähr bestimmen" weisen nicht auf KI-Training hin.

Das ist etwas anderes, als in einer bezahlten Cloud wie der von Adobe seine Bilder selbst mit Tags zu versehen. Google macht das mit allem, was man zum Beispiel mit einem Smartphone zwecks Datensicherung gleich bei Aufnahme auf die Server lädt. Wer sich ernsthaft mit Fotografie beschäftigt, kennt solche Mechanismen natürlich seit Jahren, verändert hat sich jedoch jetzt, dass das alle betrifft, die einen Google-Account besitzen. Nämlich schon mal alle, die ein Android-Smartphone nutzen. Andere Anbieter sind hier wohl kaum besser.

Richtig gruselig, so die Wortwahl eines Kollegen, wird das, wenn durch die erweiterte Suche die Klarnamen von Personen mit Orten oder Aktionen verknüpft werden. Das von Google zitierte Beispiel "Charlie vor der Golden Gate Brücke" ist harmlos, ersetzen Sie das mal durch einen viel privateren Ort und fügen ein Attribut für bestimmte oder fehlende Kleidung hinzu. Es ist unzweifelhaft, dass all das schon in den Indizes der KI steckt. Ob man das dann abrufen kann, oder ob es wie derzeit bei ChatGPT ein Katz-und-Maus-Spiel um das Umgehen von Sperren bei den Abfragen gibt, ist bei KI-Clouds wie allen natürlich noch ungeregelt. Das darf nicht lange so bleiben.

Was Generative-AI für Bilder bisher nicht konnte, wird nun zügig nachgerüstet. So ist das neue Modell DeepFloyd IF auf Beschriftungen in Bilder oder gleich das Erstellen von Logos trainiert; auch geübte Grafiker müssen sich nun also mit KI auseinandersetzen. Und gegen die dahinter liegende Datenbank LAION klagt ein Stock-Fotograf. Selbst dem oft als "Godfather of AI" bezeichneten Wissenschaftler Geoffrey Hinton wird das inzwischen so sehr zu viel, dass er bei Google gekündigt hat und vor den Folgen des unkontrollierten Einsatzes von KI sehr deutlich warnt.

Verantwortungsvollen Umgang mit KI-Bildern darf man eigentlich von einer NGO wie Amnesty International allein schon deswegen erwarten, weil es um ethische Standards geht. Und auch da ist jemand der Verlockung des schnell erzeugten und möglichst drastischen KI-Bildes erlegen. Von echter Polizeigewalt in Kolumbien war in einer Instagram-Story die Rede, nur waren die Bilder durch und durch KI-Fakes. Als Feigenblatt wurde per Bildunterschrift darauf hingewiesen, nur ist dennoch KI-Material als Bebilderung von echtem menschlichem Leid "unbeschreiblich unverantwortlich", wie ein Wissenschaftler einer anderen, nicht mal mit Amnesty konkurrierenden, NGO auf Twitter schrieb. Kann man kaum klarer formulieren.

KI-Bild von kolumbianischen Protesten

(Bild: Amnesty International)

Aber in all dem aktuellen Kuddelmuddel rund um KI gibt es auch Beispiele, wie man sinnvoll damit umgeht. Im nächsten, und wie alle hochheilig versprechen, letzten Teil der Filmreihe um Indiana Jones spielt der inzwischen 80-jährige Harrison Ford den Forscher durchaus noch selbst. Das muss betont werden, weil die Nachricht, dass eine jüngere Version von Indy auch mit KI erstellt wurde, manche auf die falsche Fährte zum volldigitalen Schauspieler führte.

Der verjüngte Harrison Ford im Trailer zum neuen Film.

(Bild: Lucasfilm, Screenshot: Heise Online)

Dabei wird in den Szenen, die kurz nach dem ersten Teil der Reihe spielen – keine Sorge, hier wird kein Inhalt gespoilert – nur Fords Gesicht per KI ersetzt. Und zwar, laut Regisseur James Mangold, auf Basis von hunderten Stunden Filmmaterial von Harrison Ford selbst. Seine Gestik und Mimik denkt sich die KI auch nicht aus, sie werden von der realen Person Ford gespielt. Das ist etwas völlig anderes als ein KI-Fake oder ein "digitaler Zwilling", den einige Personen des öffentlichen Lebens schon von sich erstellen haben lassen.

Und neu ist das auch nicht, nur nannte man das beim Film bisher schlicht nach dem Oberbegriff "CGI", also computergeneriertes Bild. Der aus der Serie "The Goldbergs" gefeuerte Schauspieler Jeff Garlin beispielsweise wurde schon 2021 häufig gedoubelt, und sein Gesicht später ersetzt, wie in diesem Artikel ganz am Ende zu lesen ist. Nur weil es heute auch KI genannt wird, ist die Aufregung um jede Anwendung der Technik nicht immer berechtigt. Und noch viel früher wurden Schauspieler per Special-Effects-Makeup mal mehr, mal weniger glaubwürdig verjüngt. Moment, hat hier jemand Photoshop gesagt? Eben. Die Frage ist immer, in welchem Kontext Technik angewandt wird, und ob bei der Darstellung von menschlichen Regungen auch Menschen eingesetzt wurden. Und nicht nur deren statistisch errechnete wahrscheinliche Reaktion.

Kaum vorhersehbar sind die Reaktionen im Markt der Smartphones, wenn Sonys in der kommenden Woche erwartetes Xperia 1 V tatsächlich als erstes Gerät den Stacked-CMOS-Sensor für seine Kamera erhält – und der so toll ist, wie Sony schon länger verspricht. Noch vor einem halben Jahr war erwartet worden, dass der zuerst in einem neuen iPhone steckt, Apple lässt sich ja gerne einmal neue Technologien von seinen Zulieferern exklusiv reservieren. Und noch spannender ist, ob und wann diese neuartige Bauform eines Sensors auch für große Kameras genutzt wird.

Da wirft einiges große Schatten voraus, um mal die nächsten fünf Euro in die Speicherkarten-Wortspielkasse einzuzahlen. Mehr als diese Schatten sind auch von mehreren sehr relevanten Vorstellungen großer Kameras, die in der nächsten Woche vielleicht erfolgen könnten, in dieser Kolumne noch nicht zu sehen, sorry dafür. Aber in der nächsten Ausgabe wird das dann ordentlich gewürdigt. Darauf muss man ja nicht unendlich warten. Wussten Sie übrigens, dass das mathematische Symbol für die Unendlichkeit eine liegende 8 ist? Ja? Gut, nächste Woche dann, warum das hier gerade wichtig war.

(keh)