Archiv des Autors: ProfKorol

Über ProfKorol

Stefan Korol, Professor für Technikjournalismus an der Hochschule Bonn-Rhein-Sieg, Sankt Augustin bei Bonn.

ROBO-Journal: Das steckt hinter RJ

Das steckt hinter Roboterjournalismus

DANIEL SCHMITZ

Bei Umfragen, wird Roboterjournalismus als Gefahr für den Bereich „Journalismus“ gesehen. Worum es bei diesem Thema genau geht, erklären wir in diesem Artikel. Firmen wie AX Semantics haben sich auf die automatische Erstellung von Texten fokussiert. Ken Schwencke beschäftigte sich ebenfalls mit dem Thema und veröffentlichte den ersten Text, der nicht von Menschen geschrieben wurde. Allerdings ist nicht jedem bekannt, wie diese Technik genau funktioniert. In diesem Artikel werden alle Fragen zum genauen Ablauf geklärt.

Die Idee hinter Roboterjournalismus
Der Firma AX Semantics kam diese Idee vor acht Jahren. Damals war das Unternehmen im Bereich der Texterstellung tätig. „Unser heutiger CVO Frank Feulner hatte damals die Aufgabe, 300 Hotels zu betexten. Standort, Zimmer, Ausstattung, Pool, usw. hat er ausführlich in einer Liste erhalten. Er hat sich in Excel ein kleines Tool gebastelt, welches die erste Version von AX Semantics war und automatisch Hoteltexte geschrieben hat“ erzählt Felix Wunderwald, Head of Marketing bei AX Semantics. So entstand vor acht Jahren die erste Version von AX Semantics. Dadurch, dass ein Rechner seine Recherche effizienter durchführt als ein Journalist, der den Text bereits mehrfachgeschrieben hat, können KIs für solche Situationen eingesetzt werden.

Eingabe der Daten
Die Datenverarbeitung erfolgt automatisiert über die API. Ein Application Programming Interface (kurz API) ist eine Schnittstelle, welche die Software- und Hardwarekomponenten miteinander verbindet. So können Datenübertragungen für verschiedene Komponenten lesbar gemacht werden. Anschließend überträgt das System die Daten in die Cloud. Dabei entspricht jeder Datensatz einem Text. Alle eingegebenen Daten werden bereinigt, sodass die reinen Daten übrigbleiben, die für den Text benötigt werden. Zusätzlich werden die Informationen analysiert, dabei werden die Daten überprüft und verschiedene Häufigkeiten und Verbindungen aufgezeigt. Sollten drei Datenblöcke hochgeladen werden, so kann mit der Analyse gezeigt werden, wie häufig z.B. ein Hersteller vorkommt. Anschließend werden die Daten und die weitere Textverarbeitung vorbereitet. Alternativ kann das Webinterface genutzt werden. Dies verfügt über dieselben Eigenschaften, wie die Software auf dem Computer des Journalisten.

Daten alleine erzeugen noch keinen Text
„Wenn man die Grundaufgaben erledigt hat und die ersten Texte aus der Maschine kommen, geht es an das Optimieren der Texte. Dabei müssen alle Ebenen berücksichtigt werden, damit keine Fehler entstehen“ sagt Felix Wunderwald. Damit die automatisch erstellten Texte sich nicht von den anderen in der Redaktion unterscheiden, können die Journalisten entscheiden, in welchem Sprachstil der Text erstellt werden soll. Zusätzlich kann das Wording bestimmt werden. So können häufig genutzte Wörter in der Redaktion zum Einsatz kommen, damit der Text auf die Zielgruppe zugeschnitten ist. Übersetzen von einzelnen Begriffen ist möglich, darunter fallen zum Beispiel Markennamen. Zusätzlich kann der Redakteur eine Textstruktur festlegen, wodurch Stil und Keywords angegeben werden können. Der Journalist muss dabei jedes Wort selbst schreiben, nur so kann der Ton und der Stil gehalten werden. Daten, die in die Maschine geschrieben wurden, werden interpretiert und anschließend grammatikalisch passend in den Text geschrieben. Dazu wird im System oder dem Webinterface im „Writer“ der Text geschrieben. Im Text werden Punkte gesetzt, wodurch die Maschine weiß, welche Daten eingesetzt werden müssen. Während des Schreibens bekommt der Journalist eine Liveausgabe des Textes angezeigt. Unter dem Reiter „Transform“ kann der Redakteur Abhängigkeiten verknüpfen, so kann die Software erkennen, unter welchem Begriff weitere Daten gespeichert sind und kann diese im Text wiedergeben.

Gesetze der Grammatik werden eingehalten
Weder Daten allein, noch eine gezielte Textstruktur sind zielführend, wenn die grammatikalische Leistung nicht stimmt. Daher kann die Software, oder besser gesagt, die KI, verschiedene Grammatikformeln einsetzen, um einen möglichst logischen Text zu erstellen. Dabei stützen sie sich auf 27 verschiedenen Sprachen, so kann ein deutscher Text bspw. in einen englischen übersetzt werden. Artikel werden passend für die jeweiligen Personen und Nomen bestimmt. Zusätzlich werden Verben und Adjektive in die richtige Form gesetzt. Abschließend werden die Singular- und Pluralformen eingestellt. Es gibt die Möglichkeit, den Text auf eine bestimmte Wörteranzahl zu begrenzen.

 

Passend gemacht für die Veröffentlichung
Zum Abschluss überführt die KI den Text in das Format, welches von der Redaktion verwendet wird. So ist ein Klick vom Redakteur notwendig und der Artikel wird veröffentlicht. In Zukunft sollen KIs weiterentwickelt werden und eine schnellere Bedienung der Maschine erreicht werden. Nachdem die KI den Text fertig gestellt hat, wird dieser veröffentlicht, ein Nachlesen ist daher nicht mehr nötig.

ROBO-Journal: Vorwort

Liebe Leserinnen, liebe Leser!

Die Automatisierung und der daraus resultierende Verlust von Arbeitsplätzen ist eines der wesentlichen Themen unserer Zeit. Auch vor dem Journalismus macht dieser Wandel nicht Halt: Polizeimeldungen, Fußball-Spielberichte und Börsennews werden teilweise schon heute maschinell erstellt – „Roboterjournalismus“ nennt man das oder wissenschaftlich korrekt: Textgenerierung. Die Entwicklung der künstlichen Intelligenz führt dazu, dass immer mehr Texte von Maschinen geschrieben werden. Das erhöht den Output. Aber wie steht es um die Qualität? Welche Zugeständnisse müssen Leser, Hörer, Zuschauer, Online-User machen, um möglichst viel lesen, hören, sehen zu können? Wo werden schon welche Texte von Computern geschrieben? Was sagen Experten zu den weiteren Perspektiven. Wir haben Antworten auf diese Fragen gesucht – und gefunden!

Automatisch erstellte Texte sind heutzutage überall zu finden und kaum zu erkennen. Die wöchentliche Zusammenfassung der Fitness-App, die Produktbeschreibung auf einer Shoppingseite oder das Wetter der nächsten Woche — alle diese Texte haben eine Gemeinsamkeit: Sie sind von Robotern geschrieben worden, entstanden allein durch Daten und Zahlen.

 

Wo diese Technologie schon heute genutzt wird und welche Probleme sich daraus ergeben, wissen Antonia Heizmann und Victoria Wegmann. Sie zeigen auch auf, dass der Roboter manchmal schneller Fehler macht, als der Mensch sie korrigieren kann.
Geht die automatische Texterstellung also zu Lasten der Qualität oder ist sie eine weitere Facette des Fortschritts? Giuliano Roper hat einige Verlagshäuser nach ihrer Meinung dazu gefragt.
Je nachdem wie der Algorithmus den Text erzeugt, sind weitere Unterscheidungen möglich: Setzt er nur Daten in vorgefertigte Schablonen ein oder vermag er einzelne Textbausteine selbst zu einem logisch konsistenten Stück zusammenzusetzen? Daniel Schmitz hat das Wichtigste über die genaue Funktion einer Software zur Textgenerierung zusammengefasst.
Journalisten sollen zur Meinungsbildung der Bevölkerung beitragen, über wichtige aktuelle Geschehnisse informieren und kontroverse Themen einordnen. Publiziert ein Journalist falsche, womöglich rufschädigende Behauptungen oder gar Beleidigungen, drohen empfindliche Strafen. Bei automatisch generierten Texten besteht aus juristischer Sicht noch Nachholbedarf. Laura Zimmermann und Jennifer Kosch sind den rechtlichen Fragen im Roboterjournalismus auf den Grund gegangen.

Eine Frage stellt sich bei dem Ganzen jedoch immer: Und zwar, ob die automatische Textgenerierung zum Verlust von Arbeitsplätzen im Journalismus führen könnte. In einigen Nachrichtenagenturen und größeren Redaktionen ist die automatische Textgenerierung schon heute gängige Praxis. In einem Interview mit Jan Georg Plavec von der Stuttgarter Zeitung haben Johanna Schulze und Alexander Leitsch den Experten nach seiner Einschätzung gefragt. Obendrein berichtet der Journalist vom Redaktionsalltag mit seinem „Roboter-Kollegen“.
Funktioniert die Software fehlerfrei und sind alle juristischen Bedenken geklärt, ist es nur noch eine Frage des Preises, ob sich Roboterjournalismus lohnt. Schafft es eine Software mehr Texte von journalistischer Qualität zu niedrigeren Kosten zu erstellen als der Redakteur? Marc Bieschinski und Jannis Lindner zeigen am Beispiel der Firma Retresco, was eine Software zur redaktionellen Erstellung von Texten kostet.

Gute Unterhaltung mit vielen spannenden neuen Erkenntnissen wünschen Ihnen

Max Dittler und Christoph Vogels
Chefredaktion