Wird Zürich am 14. März 2030 unabhängig? - Künstliche Intelligenz und Geschichte

Am 11. September 2001 kam es in den USA zu einem terroristischen Anschlag, bei dem das World Trade Center in New York zerstört wurde.” Das dürften die meisten wissen, und das weiss auch die Auto-Completion Engine namens “Davinci” von OpenAI, die den ersten Satz formuliert hat. Und Davinci kennt auch andere historische Ereignisse, fragt man, was am 9. November 1989 in Berlin passierte, antwortet Davinci: “Am 9. November 1989 fiel die Mauer zwischen Ost- und West-Berlin”. Und auch mit Südamerikanischer Geschichte kennt sich Davinci aus, so weiss Davinci, was am 11. September 1973 in Santiago (Chile) passiert ist: “Am 11. September 1973 putschte sich der chilenische Militärputsch gegen die Regierung von Salvador Allende durch.

Doch sobald die Ereignisse weniger bekannt sind, kommt Davinci ins Straucheln und erfindet etwas, das zwar plausibel klingt, aber nicht stimmt. Fragt man, was sich am 14. November in Grenchen ereignete, erhält man als Antwort den Zerfall von Österreich-Ungarn. Dieser ereignete sich etwa zu diesem Zeitpunkt, aber an einem anderen Ort. (Die gesuchte Antwort wäre die Schussabgabe mit drei Todesopfern durch die Schweizer Armee während des Landesstreiks gewesen). Aber immerhin hat dieses Ereignis tatsächlich etwa da stattgefunden. Nicht so wie der Terroranschlag in Zürich am 29. Februar 2016, bei dem mindestens 8 Menschen gestorben und 52 verletzt wurden.

Doch was antwortet Davinci auf solche Fragen?

Um diese Frage zu beantworten, stellen wir zuerst ganz viele Fragen. Wir wollen für je 160 zufällige Daten zwischen 1990 und 2030 für diese Städte wissen, was dort passiert ist:

Zürich, Berlin, New York, Belgrade, Moscow, Geneva, Grenchen, Beijing, Lusaka, Hanoi, Santiago, Osaka und Baghdad.

Um die Antworten zu visualisieren, nutzen wir nochmals ein Modell von OpenAI. Dieses generiert aus einem Satz ein Embedding, das den Satz repräsentiert. Ein Embedding ist ein mehrdimensionaler Vektor, der vom Inhalt des Satzes abhängt. Je ähnlicher sich zwei Sätze sind, desto näher liegen sie in diesem mehrdimensionalen Raum zusammen. So beträgt die Distanz zwischen “On October 7, 2005, a terrorist attack took place in Berlin, Germany, which left 12 people dead and over 50 injured. The perpetrator, a 17-year-old Iraqi refugee, was later apprehended and sentenced to life in prison.” und “A terrorist attack took place in New York on February 21, 2016. The terrorist attacked people with a truck, killing eight and injuring dozens.” 0.5, die Distanz zwischen dem ersten Satz und “On April 29, 2008, the Beijing Olympic stadium was host to the Opening Ceremony of the Beijing 2008 Olympic Games.“ dagegen 0.7. (Um zu vermeiden, dass der Name der jeweiligen Stadt einen zu grossen Einfluss auf die Embeddings hat, wurde dieser jeweils durch Gotham City ersetzt.)

Des Weiteren teilen wir die Sätze aufgrund von Wörtern, die vorkommen in Kategorien ein. Enthält ein Satz “terror”, kategorisieren wir ihn unter “terror”, enthält er “elect” oder “referendum” zählt er unter “referendum”. So definieren wir insgesamt 19 Kategorien. Zusammen mit der vektorisieren Darstellung der Sätze können wir jetzt die Sätze visuell darstellen. Die 4096 Dimensionen der Embeddings werden dazu auf x und y Koordinaten heruntergebrochen. Die einzelnen Kategorien auf der rechten Seite lassen sich deaktivieren, um einen besseren Überblick zu erhalten. Durch Darüberfahren mit der Maus lassen sich die Sätze, die hinter einem Punkt stecken, anzeigen.

Als erstes Fällt auf, dass ein grosser Teil der Antworten düster sind. Es geht um Terror, Bombenanschläge, Erdbeben, Krieg und Tod. Das wird auch deutlich, wenn wir die Heatmap der Ereignisse anschauen:

Heatmap der Kategorien der Zusammenfassungen
Heatmap der Kategorien der Zusammenfassungen

Auf dieser ist für jede Stadt angegeben, wie viele Prozent der Ereignisse in die jeweilige Kategorie gefallen sind. So sind 6.9% der generierten Ereignisse in Belgrad als Staatsstreich kategorisiert, oder 13.8 der Ereignisse in Zürich als Schiesserei. In dieser Heatmap können wir sehen, welche Ereignisse das Modell für welche Stadt am plausibelsten hält. Zwischen den Städten sehen wir grosse Unterschiede, die wohl nicht ganz verwunderlich sind.

Am deutlichsten sind die Erdbeben in Osaka, fast drei Viertel aller generierten Ereignisse für diese Stadt haben mit Erdbeben zu tun. Wahrscheinlich hat es im Training besonders viele Einträge über das Erdbeben von 2018 gehabt und das Modell hat entsprechend diesen Zusammenhang gelernt. Auch für Santiago sind fast die Hälfte der Ereignisse ein Erdbeben.

Ebenfalls in Santiago sehen wir rund 10% Staatsstreiche, ähnlich viele gibt es in Lusaka. In Moskau (3.8%) und Belgrad (6.9%) gibt es ebenfalls noch mehr Staatsstreiche als in den anderen Städten.

Eine Zeile, die in sehr vielen Städten stark vertreten ist, ist der Terror. Besonders oft sind Ereignisse in New York in dieser Kategorie (58.1%), aber auch in Berlin (32.5%).

Dem Modell scheint auch bewusst zu sein, dass Genf öfters Gastgeberin von internationalen Konferenzen und UNO-Sitzungen ist. Auch die US-Kriege im Irak und Vietnam schlagen sich in der Heatmap nieder. Andere historische Ereignisse, wie der Fall der Berliner Mauer, lassen sich ebenfalls erahnen. Die Berichterstattung über die Olympischen Spiele in Peking hat es wohl auch in das Modell geschafft.

Doch es gibt auch ein paar Überraschungen. So sind mehr als ein Drittel der Ereignisse in Grenchen Schiessereien. Nun gab es zwar vor mehr als 100 Jahren während des Landesstreiks tatsächlich 3 Tote durch den Schusswaffengebrauch der Armee, in jüngerer Geschichte gab es aber nur wenige Berichte über Schüsse in Grenchen. Aber für das Modell scheint es trotzdem ein Drittel der Ereignisse zu sein.

Als Nächstes können wir die verschiedenen Ereignisse auch noch im Verlauf der Zeit darstellen:

Betrachtet man die Häufigkeit von terroristischen Ereignissen, gibt es 3 Wellen, eine um das Jahr 2001, eine um das Jahr 2015 und einen Anstieg in der Zukunft. Die ersten beiden Wellen stimmen mit der Berichterstattung über 9/11 und die Terroranschläge um 2015 herum überein. Staatsstreiche gibt es häufiger zu Beginn der Zeitreihe, zwischen 1990 und 1992, danach nur noch vereinzelt. Die Berliner Mauer scheint jedoch immer wieder zu fallen, obwohl sie das bereits 1989, also vor der betrachteten Zeitspanne tat. Erdbeben sind im Jahr 2007 sehr häufig vorgekommen. Für das Jahr 2022 werden ebenfalls viele Ereignisse über Erdbeben vorhergesagt. Auch die Sichtung von Aliens hat im Jahr 2022 einen Höhepunkt.

Davinci scheint übrigens im asiatischen Raum eine Schwäche in Geographie zu haben: in 7.5% der Ereignisse für Hanoi geht es um Nordkorea. Hanoi oder Pyongyang, Hauptsache Vietnam.

Fazit

Die Ereignisse zeigen deutlich, dass Machine Learning Modelle nicht besser sind, als die Daten mit denen sie trainiert wurden. Es wird nun mal öfters über Terroranschläge und Schiessereien berichtet als über weniger tragische Ereignisse. Auch zeigt das Modell eine gewisse Menschlichkeit, wenn es Ereignisse rät, die gar nicht stattgefunden haben. Würde man auf der Strasse zufällig ein paar Menschen fragen, was an einem zufälligen Datum vor ca. 30 Jahren in Berlin stattgefunden hat, würden wohl einige den Fall der Berliner Mauer nennen. Auch dass in Genf öfters Konferenzen stattfinden und in Peking die Olympischen Spiele abgehalten werden, ist generell bekannt.

Eine herkömmliche Wissensdatenbank ist also für das Finden von historischen Ereignissen selbst einer der besten, heute verfügbaren, künstlichen Intelligenz noch weit überlegen.

Und auch für Anwendungsfälle, in denen es mehr um die Kreativität und weniger um die Korrektheit der generierten Fälle geht, sollte man sich stets bewusst sein, auf was diese Modelle basieren. Denn diese Grundlagen liefern ein ziemlich düsteres Bild über die Menschheit.

Alle generierten Ereignisse

Alle generierten Ereignisse gibt es als CSV hier.

Die meisten sind überhaupt nicht erfreulich. Für die Zukunft wird unter anderem folgendes vorhergesagt:

Genf wird am 28. August von einem Asteroiden getroffen, aber glücklicherweise kann bereits im Dezember eine Konferenz für die Schaffung eines Fonds für Geflüchtete und Migrant*innen stattfinden.

Am 28. Dezember wird die Stadt dann aber von einem massiven Erdbeben zerstört. Im Sommer 2023 kommt es dann zu einer Bombardierung Belgrads durch die Nato. Ebenfalls im Sommer 2023 kommt es in Osaka und Chile zu massiven Erdbeben.

Am 7. November 2025 wird Nguyễn Văn Trỗi Premierminister von Vietnam und verkündet, den Vietnamkrieg zu beenden. Wird langsam auch Zeit.

2027 bricht in Peking eine Pandemie aus.

Das Weisse Haus wird im August 2029 in einem Nuklearangriff zerstört.

Am 14. März 2030 stimmt die Stadt Zürich darüber ab, sich unabhängig zu machen, die Abstimmung kommt durch und Zürich wird ein unabhängiges Land am folgenden Tag.

Und zu guter Letzt, in Moskau: “On October 1, 2030, the aliens finally arrived.