Roboterjournalismus, Textbausteine und menschliche Intelligenz

Humanoid 1477614 1280

Eine ganze Reihe von in- und ausländischen Verlagen läßt bestimmte Presseartikel schon seit Jahren nicht mehr (nur) von Journalisten, sondern von Maschinen schreiben. Ein Beispiel für den sogenannten Roboterjournalismus betreiben die Nachrichtenagentur Press Association und das Start-up Urbs Media in Großbritannien unter dem Namen Radar. Monatlich entstehen hier rund 8.000 Texte. Alle diese maschinell generierten Presseartikel basieren auf Templates oder Mustertexten und werden unter Berücksichtigung regionaler Besonderheiten in jeweils etwas anderer Form für den Lokalteil verschiedener Zeitungen produziert. Die journalistische Arbeit im Radar-Projekt beschäftigten Redakteure besteht nun vor allem darin, diese Mustertexte zu schreiben.

Einen Mustertext kann man am ehesten mit einer Sammlung von Textbausteinen vergleichen, wie man sie auch aus einem Textverarbeitungsprogramm wie Microsoft Word kennt. Bei Radar entstehen daraus bis zu 200 (lokalisierte) Zeitungsartikel.

Was bei Word eine (Excel-)Tabelle ist, in der fein säuberlich untereinander Anreden, Vornamen, Nachnamen aufgelistet sind, um zum Beispiel personalisierte Briefe zu verfassen, in denen Männer mit “Sehr geehrter Herr” und Frauen mit “Sehr geehrte Frau” angesprochen werden, können es bei Radar statistische Daten sein, die von Behörden herausgegeben werden und z.B. zeigen wie viele Wohnungen in Großbritannien leer stehen und wie viele es in Norwich, King’s Lynn oder Cambridge, dem Erscheinungsort der Radar-Texte sind. Wie viele Menschen sterben in Großbritannien bei Gewaltverbrechen? Und wie viele sind es in Norwich, King’s Lynn oder Cambridge?

Konstruieren wir ein Beispiel?

Nehmen wir an, wir haben es mit Zahlen zum Thema Autodiebstahl zu tun. Unser automatisch geschriebener Text soll in Cambridge veröffentlicht werden. Die Statistik zeigt, dass Autodiebstähle in Großbritannien in den letzten Jahren zugenommen haben. Und zwar um jährlich rund 2-3%; in Cambridge sind die Werte ganz ähnlich, mit Ausnahme des Jahres 2017, als es eine Zunahme von 9,2% gab.

Der entsprechende Mustertext, einschließlich der erforderlichen Platzhalter und Anweisungen, könnte also lauten:

…haben wir es mit einem jährlichen Anstieg von” [Platzhalter: Durchschnittswert landesweit] “zu tun“. [Platzhalter Bedingung: Wenn (Jahr) (Veränderung>3%) dann (schreibe: “Auffallend ist jedoch, dass es für [Platzhalter: Jahr] in [Platzhalter: Erscheinungsort] einen [Platzhalter: Adjektiv (>3%=”etwas stärkeren”; >5%=”stärkeren”;>7%=”deutlich stärkeren”;>9%=”Besorgnis erregendend”)] “Anstieg der Autodiebstähle gab“.

Wenn es also 2017 in Cambridge einen Anstieg der Autodiebstähle von 9,2% gab, dann würde die Maschine automatisch folgenden Satz schreiben:

…haben wir es mit einem jährlichen Anstieg von 2-3% zu tun. Auffallend ist jedoch, dass es 2017 für Cambridge einen Besorgnis erregenden Anstieg der Autodiebstähle gab.

Fett sind die Textstellen formatiert, die in allen Landesteilen identisch sind; kursiv der auf die lokale Besonderheit hin formulierte Text, der abhängig ist von den von Stadt zu Stadt unterschiedlichen statistischen Angaben.

Im Zusammenhang mit der automatischen Erzeugung von Texten, wie sie hier an einem sehr einfachen Beispiel veranschaulicht wurde, spricht man auch von “Roboterjournalismus”, der durch “Künstliche Intelligenz” ermöglicht würde. Dass hier von “Intelligenz” auf Seiten der Maschine überhaupt nicht gesprochen werden kann, zeigt der Umstand, dass das Radar-Projekt als Teil seiner Aktivität ein mehrstufiges Qualitätssicherungssystem eingerichtet hat. Es hat die Aufgabe, Fehler zu erkennen, die durch die absolute “Sturrheit” und die Abwesenheit von Intelligenz auf Seiten der Maschine erzeugt werden. Stichprobenartig wird u.a. geprüft, ob die Daten stimmen und ob die im Mustertext enthaltenen Regeln mit statistischen Material harmonieren.

Wenn es den Redakteurinnen und Redakteuren gelingt, Mustertexte zu schreiben, die sich trotz maschineller Verarbeitung am Ende gut lesen lassen, dann ist dazu etwas erforderlich, was Maschinen vollständig fremd ist: Intelligenz.

Burkhard Heinz
mediatpress®

Datenschutzerklärung alle Rechte vorbehalten / mediatpress®