A Framework for Argument Mining and Evaluation (FAME)
Dieses DFG-geförderte Projekt entwickelt Verfahren zur automatischen Erkennung von Argumenten bzw. Argumentbestandteilen mit Hilfe von Technologien des Natural Language Processing. Ziel ist es, mit Hilfe dieser Verfahren eine logische Auswertung sowie eine inhaltsanalytische Messung des Gebrauchs von Argumenten in großen Kollektionen von Nachrichten- bzw. Social Media Texten möglich zu machen.
Zwei Perspektiven auf Argumentation haben in der jüngeren Vergangenheit gesteigerte Aufmerksamkeit von Seiten der Informatik erfahren:
a) die Auswertung natürlichsprachlicher Texte mit überwachten Lernverfahren zur Detektion und Klassifikation von Argumentbestandteilen und b) die formale Modellierung und Evaluierung von Argumenten.
Bislang haben sich beide Perspektiven weitgehend unabhängig voneinander entwickelt. Das Ziel des FAME-Projekts ist es, beide Forschungsperspektiven auf Argumentation miteinander zu vereinen. Dafür entwickeln wir ein Framework, das Ansätze des Argument Mining mit formaler Argument-Evaluation verbindet. Diese Verbindung ermöglicht uns die Auswertung tiefer semantischer Argumentstrukturen in natürlichsprachigem Text und neue Formen von Anfragen an Retrieval-Systeme.
Die Herausforderung für ein solches Framework besteht darin, Evaluierungsverfahren für formale Sprachen mit definierter, zugehöriger Semantik und NLP-Verfahren zusammenzubringen. Die dem Antrag zugrundeliegende Hypothese ist, dass kontrollierte natürliche Sprachen (Controlled Natural Languages, CNL) eine geeignete Verbindung beider Welten darstellen können. CNL werden in FAME als intermediäre Repräsentation von Argumentation benutzt. Als Untermenge von natürlichen Sprachen sind CNL einerseits lesbar und verständlich wie natürliche Sprachen und damit anschlussfähig an Verfahren der automatischen Sprachverarbeitung. Auf der anderen Seite besitzen bestimmte CNL eine wohl-definierte Semantik und können formal ausgewertet werden. CNL mit beiden solchen Eigenschaften existieren bereits. Ein prominentes Beispiel ist Attempto Controlled English (ACE). ACE besitzt es eine formale Semantik, mit der Aussagen in Discourse Representation Structures übersetzt und prädikatenlogisch ausgewertet werden können. Insofern ACE nicht primär zur Modellierung von Argumenten entwickelt wurde, werden wir im Rahmen des Projekts untersuchen, ob die Konstrukte der Sprache ausdrucksmächtig genug für unsere Zwecke sind oder ob wir Erweiterungen definieren müssen.
Im Projekt werden wir Argumentationen im öffentlichen, politischen Diskurs anhand von Nachrichtentexten und zugehörigen Nutzerkommentaren bezüglich einer Auswahl von fünf konkreten, kontroversen Sachverhalten modellieren und auswerten (z.B. Freihandelsabkommen). Durch die Modellierung konkreter empirischer Sachverhalte als CNL-Aussagen in einer Wissensbasis erweitern wir bisherige Ansätze des Argument Mining, welche sich bislang auf die Klassifikation von generischen, funktionalen Argumentbestandteilen (z.B. Prämisse und Konklusion) konzentrieren. Die Repräsentation von Argumenten in einer Wissensbasis in Kombination mit Modellen abstrakter Argumentation erlaubt uns wiederum komplexe Auswertungsmöglichkeiten, bei denen wir davon ausgehen, dass sie insbesondere für die Auswertung von Argumentstrukturen geeignet sind, wie sie in empirischer Kommunikation auftreten (unvollständige Argumente, unaufgelöste Widersprüche).