Das Projekt mit dem Originaltitel „Few-Shot Learning for Automated Content Analysis in Communication Science“ überträgt zwei in der Informatik entwickelte Methoden – das Few-Shot Learning und das Argument Mining – auf den Bereich der empirischen Kommunikationswissenschaft. Automatisierte Inhaltsanalysen (AIA) sollen so mit geringem Kodieraufwand auch große Datenmengen untersuchen können.
Das dafür notwendige Vorgehen und die technische Umsetzung werden im Rahmen einer exemplarischen Studie zu Positionen und Argumentmustern auf Twitter rund um die Covid-19 Pandemie entwickelt.
Das Projekt wird wissenschaftliche Publikationen, Best Practices sowie Software- und e-Learning Ressourcen bereitstellen, mit denen sich die Kommunikationswissenschaft diese neuen Technologien aus der Informatik erschließen und nach eigenen Facherfordernissen weiterentwickeln kann.
Für die Vermittlung dieser neuen Methoden setzt das Projekt ein Hauptaugenmerk auf den wissenschaftlichen Nachwuchs, für den im Rahmen von Methodenworkshops Datenkompetenzen zur Automatisierten Inhaltsanalysen vermittelt werden.
Die Inhaltsanalyse stellt eine der zentralen Methoden der empirischen Kommunikationswissenschaft dar. Die stetig steigende Menge und Verfügbarkeit öffentlicher digitaler Kommunikationsinhalte macht eine (Teil-)Automatisierung der Inhaltsanalyse zwingend notwendig.
In der Informatik sind in der jüngsten Vergangenheit zwei Bereiche intensiv beforscht worden, deren aktuelle Ergebnisse enormes Potenzial für die Automatisierte Inhaltsanalyse und damit auch zur Steigerung der Datenkompetenzen der Kommunikationswissenschaft insgesamt bergen: Mit vortrainierten Sprachmodellen auf Basis der neuronaler Transformernetze und darauf aufbauender Few-Shot-Textklassifikation wird es möglich, inhaltliche Kategorien mit vergleichsweise wenig Trainingsdaten zuverlässig zu identifizieren. Mit Verfahren des Argument Mining wird zudem die automatische Kodierung von Argumentbestandteilen und -positionen ermöglicht.
Damit werden zwei zentrale Desiderata derzeitiger inhaltsanalytischer Forschung adressiert: die Auswertung sehr großer Textmengen mit semantisch komplexen Kategorien.