RJ: Die Technik

 

 

 

Roboterjournalismus – Die Technik

So funktioniert die Texterstellung mit Hilfe einer künstlichen Intelligenz

DANIEL SCHMITZ

Bei Umfragen, wird Roboterjournalismus als Gefahr für den Bereich „Journalismus“ gesehen. Worum es bei diesem Thema genau geht, erklären wir in diesem Artikel. Firmen wie AX Semantics haben sich auf die automatische Erstellung von Texten fokussiert. Ken Schwencke beschäftigte sich ebenfalls mit dem Thema und veröffentlichte den ersten Text, der nicht von Menschen geschrieben wurde. Allerdings ist nicht jedem bekannt, wie diese Technik genau funktioniert. In diesem Artikel werden alle Fragen zum genauen Ablauf geklärt.

Die Idee hinter Roboterjournalismus
Der Firma AX Semantics kam diese Idee vor acht Jahren. Damals war das Unternehmen im Bereich der Texterstellung tätig. „Unser heutiger CVO Frank Feulner hatte damals die Aufgabe, 300 Hotels zu betexten. Standort, Zimmer, Ausstattung, Pool, usw. hat er ausführlich in einer Liste erhalten. Er hat sich in Excel ein kleines Tool gebastelt, welches die erste Version von AX Semantics war und automatisch Hoteltexte geschrieben hat“ erzählt Felix Wunderwald, Head of Marketing bei AX Semantics. So entstand vor acht Jahren die erste Version von AX Semantics. Dadurch, dass ein Rechner seine Recherche effizienter durchführt als ein Journalist, der den Text bereits mehrfachgeschrieben hat, können KIs für solche Situationen eingesetzt werden.

Neue Technik, neue Methode, neue Geschäftsfelder: Roboterjournalismus. Foto Pixabay, Montage Bieschinski

Eingabe der Daten
Die Datenverarbeitung erfolgt automatisiert über die API. Ein Application Programming Interface (kurz API) ist eine Schnittstelle, welche die Software- und Hardwarekomponenten miteinander verbindet. So können Datenübertragungen für verschiedene Komponenten lesbar gemacht werden. Anschließend überträgt das System die Daten in die Cloud. Dabei entspricht jeder Datensatz einem Text. Alle eingegebenen Daten werden bereinigt, sodass die reinen Daten übrigbleiben, die für den Text benötigt werden. Zusätzlich werden die Informationen analysiert, dabei werden die Daten überprüft und verschiedene Häufigkeiten und Verbindungen aufgezeigt. Sollten drei Datenblöcke hochgeladen werden, so kann mit der Analyse gezeigt werden, wie häufig z.B. ein Hersteller vorkommt. Anschließend werden die Daten und die weitere Textverarbeitung vorbereitet. Alternativ kann das Webinterface genutzt werden. Dies verfügt über dieselben Eigenschaften, wie die Software auf dem Computer des Journalisten.

Daten alleine erzeugen noch keinen Text
„Wenn man die Grundaufgaben erledigt hat und die ersten Texte aus der Maschine kommen, geht es an das Optimieren der Texte. Dabei müssen alle Ebenen berücksichtigt werden, damit keine Fehler entstehen“ sagt Felix Wunderwald. Damit die automatisch erstellten Texte sich nicht von den anderen in der Redaktion unterscheiden, können die Journalisten entscheiden, in welchem Sprachstil der Text erstellt werden soll. Zusätzlich kann das Wording bestimmt werden. So können häufig genutzte Wörter in der Redaktion zum Einsatz kommen, damit der Text auf die Zielgruppe zugeschnitten ist. Übersetzen von einzelnen Begriffen ist möglich, darunter fallen zum Beispiel Markennamen. Zusätzlich kann der Redakteur eine Textstruktur festlegen, wodurch Stil und Keywords angegeben werden können. Der Journalist muss dabei jedes Wort selbst schreiben, nur so kann der Ton und der Stil gehalten werden. Daten, die in die Maschine geschrieben wurden, werden interpretiert und anschließend grammatikalisch passend in den Text geschrieben. Dazu wird im System oder dem Webinterface im „Writer“ der Text geschrieben. Im Text werden Punkte gesetzt, wodurch die Maschine weiß, welche Daten eingesetzt werden müssen. Während des Schreibens bekommt der Journalist eine Liveausgabe des Textes angezeigt. Unter dem Reiter „Transform“ kann der Redakteur Abhängigkeiten verknüpfen, so kann die Software erkennen, unter welchem Begriff weitere Daten gespeichert sind und kann diese im Text wiedergeben.

 

Gesetze der Grammatik werden eingehalten
Weder Daten allein, noch eine gezielte Textstruktur sind zielführend, wenn die grammatikalische Leistung nicht stimmt. Daher kann die Software, oder besser gesagt, die KI, verschiedene Grammatikformeln einsetzen, um einen möglichst logischen Text zu erstellen. Dabei stützen sie sich auf 27 verschiedenen Sprachen, so kann ein deutscher Text bspw. in einen englischen übersetzt werden. Artikel werden passend für die jeweiligen Personen und Nomen bestimmt. Zusätzlich werden Verben und Adjektive in die richtige Form gesetzt. Abschließend werden die Singular- und Pluralformen eingestellt. Es gibt die Möglichkeit, den Text auf eine bestimmte Wörteranzahl zu begrenzen.

Passend gemacht für die Veröffentlichung
Zum Abschluss überführt die KI den Text in das Format, welches von der Redaktion verwendet wird. So ist ein Klick vom Redakteur notwendig und der Artikel wird veröffentlicht. In Zukunft sollen KIs weiterentwickelt werden und eine schnellere Bedienung der Maschine erreicht werden. Nachdem die KI den Text fertig gestellt hat, wird dieser veröffentlicht, ein Nachlesen ist daher nicht mehr nötig.