+++Werbung+++
In einer Stanford-Studie sammelten Computer Details über Autos in Millionen von Bildern inklusive Marken und Modelle, die sie anschließend verarbeiteten. Die Aufgabenstellung lautete: Welcher Fahrzeugtyp steht überwiegend in republikanischen Wahlbezirken? Antwort: Es sind viertürige Pick-ups. Und in überwiegend demokratischen Wahlbezirken? Limousinen. Diese Schlussfolgerungen sind möglicherweise nicht besonders überraschend. Schließlich haben Marktforscher und Politologen solche Dinge seit Jahrzehnten studiert. All dies geschah und geschieht vor dem Hintergrund, um Sachverhalte wie Einkommen, politische Neigungen und Kaufgewohnheiten vorherzusagen.
Erstaunlich ist jedoch, wie neuerdings Forscher, die an einem ehrgeizigen Projekt an der Stanford University arbeiten, zu völlig neuen Ergebnissen kommen: Nämlich durch die Analyse von 50 Millionen Bildern und Standortdaten aus den Daten der Google Street View, dem Online-Dienst des US-amerikanischen Unternehmens Google Inc., der 360-Grad-Ansichten aus der Straßenperspektive darstellt.
„Auf einmal können wir die gleiche Art von Analyse von Bildern durchführen, die wir bisher mit Textanalysen machen konnten“, erklärt Erez Lieberman Aiden, ein Informatiker, der ein Genomforschungszentrum an der Baylor School of Medicine leitet.
Für Computer wie für Menschen sind Lesen und Beobachten zwei verschiedene Arten, die Welt zu verstehen, sagte Lieberman Aiden. Fakt ist: Texte sind für die Künstliche Intelligenz (KI) leichter zu handhaben, weil Wörter eigenständige und unterschiedliche Zeichen haben – 26 Buchstaben im Fall des englischen Alphabets. Dies kommt der Sprache der Computer viel näher als das freihändige Chaos der Bilder. Doch die Bilderkennungstechnologie – größtenteils von großen Technologieunternehmen entwickelt – hat sich in den letzten Jahren stark verbessert.
Das Stanford-Projekt gibt einen Einblick in das Potenzial. Durch die Information über Marken, Modelle und Baujahre der Fahrzeuge konnten Daten aus den Bildern herausgezogen werden. Indem diese Informationen dann mit anderen Datenquellen verknüpft wurden, war es möglich, Faktoren wie beispielsweise über die Umweltverschmutzung vorherzusagen.
„Diese Art von sozialer Analyse mithilfe von Bilddaten ist ein neues Werkzeug, um Einsichten zu gewinnen“, sagte Timnit Gebru, der das Stanford-Forschungsteam leitete. Das „Auto-Image-Projekt“ umfasste schließlich 50 Millionen Bilder von Straßenszenen aus Google Street View. In ihnen wurden 22 Millionen Autos identifiziert, und dann in mehr als 2.600 Kategorien wie Marken und Modelle klassifiziert, insgesamt in mehr als 39.000 Wahlbezirken.
Doch zuerst musste eine von Menschen organisierte Datenbank die KI-Software trainieren, um die Bilder zu verstehen. Die Forscher stellten dazu Hunderte von Menschen ein, um Autos in einer Stichprobe von Millionen von Bildern auszuwählen und zu klassifizieren. Einige der Online-Auftragnehmer erledigten einfache Aufgaben wie die Identifizierung der Autos in Bildern. Andere waren Autoexperten, die Nuancen wie zum Beispiel den subtilen Unterschied der Rücklichter der Honda-„Accords“ aus der Baureihe 2007 und 2008 kannten.
Sobald die Auto-Bild-Matrix hergestellt wurde, war seine Geschwindigkeit und Vorhersagegenauigkeit beeindruckend. In zwei Wochen wurden Fahrzeuge aus den 50 Millionen Bildern erfolgreich ein- bzw. zugeordnet. Diese Aufgabe würde einen menschlichen Experten erfordern, der bei 10 Sekunden pro Bild und mehr als 15 Jahre benötigte.
Es war eine technische Meisterleistung, diese enorme Anzahl an Fahrzeugbilder so detailliert zu identifizieren. Das Resultat dieses neuen Datensatzes an öffentlichen Sammlungen von sozioökonomischen und Umweltinformationen passte dann die Software an, um Muster und Korrelationen zu erkennen. Was das Stanford-Projekt zu einem Teil dessen macht, was Computerwissenschaftler als die breite Anwendung von Bilddaten betrachten.
Das Stanford-Auto-Projekt erzeugte eine Vielzahl von faszinierenden Verbindungen: Das System war in der Lage, Einkommens-, Rassen-, Bildungs- und Abstimmungsmuster auf Postleitzahlen- und Bezirksebene in Städten im ganzen Land genau vorherzusagen. Autoattribute (einschließlich Meilen pro Gallone) ergaben, dass die grünste Stadt der USA Burlington ist, während Casper, Wyoming, den größten CO2-Fußabdruck pro Kopf aufweist. Chicago ist die Stadt mit der höchsten Einkommensabgrenzung, mit großen Gruppen von teuren und billigen Autos in verschiedenen Stadtvierteln; Jacksonville, Florida, ist am wenigsten nach Einkommen getrennt; New York ist die Stadt mit den teuersten Autos und San Francisco hat den höchsten Anteil an ausländischen Autos.
Sollte diese Art von Forschung erweitert werden, wird sie rasch Fragen des Datenzugriffs und des Datenschutzes aufwerfen. Das Stanford-Projekt machte derzeit nur Vorhersagen über Bezirke und Nachbarschaften, nicht über Individuen. Bedenken hinsichtlich der Privatsphäre von Street View-Bildern wurden jedoch in Deutschland und anderswo laut. Google erklärte hingegen, dass es Anfragen von Forschern nach Zugriff auf große Mengen seiner Bilddaten von Fall zu Fall handhabe.