Im Vorwort zur zweiten Auflage seines opus magnum zur Netzwerkgesellschaft* bekennt der Soziologe Manuel Castells, wie sehr die globale Finanzkrise von 2008 sein Verständnis zentraler gesellschaftlicher Transformationsprozesse in den letzten Dekaden verändert hat.
Zur Zeit durchleben wir mit der Corona-Pandemie ein ähnlich einschneidendes Ereignis, das in besonderem Maße in der vernetzten Kommunikation durch digitale Medien der "interactive society" (Castells) vermittelt wird.
Lange Zeit haben Forschende verschiedener Disziplinen die Austausch- und Kommunikationsprozesse der vernetzten Gesellschaft vor allem exemplarisch beschrieben, wobei sie mit zwei zentralen Herausforderungen konfrontiert waren:
Erstens mussten sie im Angesicht einer regelrechten Materialexplosion begründen, wieso sie ein bestimmtes Beispiel ausgewählt hatten und warum es für die beschriebenen Phänomene relevant war.
Zweitens galt es sicherzustellen, dass das flüchtige Medium Internet in irgendeiner Weise für eine nachfolgende Überprüfung ihrer Ergebnisse erreichbar blieb.
Aus frühen Anfängen (Screenshots anfertigen, Webseite speichern) entwickelte sich in den letzten Jahren ein zunehmend standardisiertes Verfahren, um Webinhalte zu bewahren - die Erzeugung von Webarchiven.
Diese sind ein neues Medium, das verspricht, einen Ausschnitt des Internets entweder im Hinblick auf das Nutzungserlebnis oder auf die Informationen, die er repräsentiert, für eine Befragung durch Forschende vorzuhalten. Die Erzeugung und Auswertung von Webarchiven liegt an der Schnittstelle verschiedener Disziplinen - von der Bibliotheks- und Archivwissenschaft bis zu den Kultur- und Sozialwissenschaften.
Lange ist Webarchiving einfach als Bestandteil von Langzeitarchivierung begriffen worden. So archivieren etwa fast alle Staatsbibliotheken und die Deutsche Nationalbibliothek die Webseiten staatlicher Einrichtungen. Mit dem Internet Archive (www.archive.org) befasst sich zudem eine unabhängige Stiftung damit, Teile des Internets für die Nachwelt zu bewahren.
Gegenüber solchen Versuchen einer "Bestandsdokumentation" hat in den vergangenen Jahre die planvolle Erzeugung von Webarchiven für spezifische, ereignisbezogene Forschungsfragen an Bedeutung gewonnen - etwa, um eine Wahl oder auch die Auswirkungen einer Naturkatastrophe zu dokumentieren.
Während bisher vor allem die qualitative Auswertung vorherrschte, diskutiert die Forschung zunehmend auch den Einsatz von Text Mining Verfahren wie Wortfrequenzanalysen, Topic Modeling oder Word Embeddings für die Analyse solcher Datenbestände.
Im Rahmen des Seminars wollen wir erarbeiten:
- was Webarchiving ist, in welchen Bereichen und für welche Forschungsfragen es derzeit eingesetzt wird;
- wie sich digital born-Medien von analogen Medien unterscheiden und welche Konsequenzen dies für ihren Charakter als historische Quellen hat;
- wie Webarchive mit Instrumenten wie webrecorder (https://github.com/webrecorder/webrecorder-desktop) selbst erstellt werden können;
- wie Webarchive jenseits der qualitativen Auswertung erschlossen und wie solche Zugänge mit traditionellen Methoden verbunden werden können.
Dazu werden wir im Laufe des Seminars selbst Webcrawls zu aktuellen Aspekten der Corona Pandemie initialisieren und auswerten.
Vorbehaltlich einer anderweitigen Regelung durch die Universität, wird das Seminar voraussichtlich nicht als Präsenzseminar stattfinden können. Es wird deshalb als eLearning-Angebot realisiert.
* Castells, Manuel. The Information Age - Economy, Society and Culture (1) - The Rise of the Network Society. 2. Aufl. Padstow: Blackwell 2010.
Infobild: Created by Matt Britt using data from the OPTE project. Released under the Creative Commons Attribution license version 2.5 <
http://creativecommons.org/licenses/by/2.5/> via
https://commons.wikimedia.org/wiki/File:Internet_map_1024.jpg