Verantwortung: Susanna Burghartz / Eric Decker
Referierende: Madeleine Herren / Susanna Burghartz / Eric Decker / Tobias Hodel
Digitalisierung ist auch in den Geschichtswissenschaften seit langem Realität. Seit Jahren florieren Projekte der digital humanities: Sie bilden ein dynamisches Feld, in dem interdisziplinäre und kollektive Forschungsformen an der innovativen Entwicklung von computergestützten Verfahren oder der Auswertung von digitalen Daten arbeiten. In solche Kooperationsformen sind auch das vom Europainstitut der Universität Basel und der Universität Zürich stammende Organisationsteam und die Referierenden des Panels eingebunden. Sie setzten sich das Ziel, neue digitale Instrumente vorzustellen und dabei einerseits nach möglichen Auswirkungen auf die historische Forschung zu fragen; andererseits danach, wie sich die Methode in der Geschichtswissenschaft praktisch verändert und welche neuen Möglichkeiten der Informationsgewinnung dabei entstehen können.
Im ersten Referat zeigte MADELEINE HERREN (Basel) anhand der Asia Chronicles & Directories (ACD), wie sich durch digitale Verarbeitungs- und Auswertungsverfahren im Bereich der Globalgeschichte neue Möglichkeiten der Erkenntnisgewinnung eröffnen. Die ACD, Verzeichnisse über sogenannte „foreign residents“ in Asien, waren ein wesentliches informationspolitisches Mittel zur Konstituierung transkultureller Gesellschaften in Ostastasien und in Zeiten des Nation Buildings eher eine Ausnahmeerscheinung. Die Quelle sei für vielerlei Forschungsrichtungen interessant, führte Herren aus: Sie inkludiert Akteure wie Handelsunternehmen, diplomatische Vertretungen oder „foreign residents“ und gibt Hinweise zu Rohstoffpreisen, klimatischen Gegebenheiten oder rechtlichen Rahmenbedingungen. Dieses Informationspotential hat das Interesse der Forschung geweckt, namentlich der Forschung, die mit digitalen Werkzeugen arbeitet, denn der Quellekorpus ist aufgrund seines Umfangs und dem wilden Durcheinander in seiner Struktur für analoge quantitative Auswertungen wenig geeignet. Methodologisches Ziel sind dialogfähige Metadaten, die neue Fragestellungen erlauben und Rückwirkungen auf die disziplinäre Entwicklung haben. Durch die Extraktion von Personendatensätzen mit Annotationsdaten und eine automatisierte Suche werden neue Nutzungsmöglichkeiten und Fragestellungen ermöglicht, die sich, zumindest für eine Globalgeschichte von unten, fruchtbar auswerten lassen: Konkret zeigen sich neue Erkenntnisse etwa zu den „foreign residents“, deren Erforschung bisher primär anhand von Internierten im Zweiten Weltkrieg stattfand.
In die lokale Perspektive wechselte SUSANNA BURGHARTZ (Basel) in ihrem Referat zum Basler Avisblatt, eine von 1729 bis 1845 über einen erstaunlich langen Zeitraum durchgehend und vollständig erhaltene Quelle. Die Avis- oder Intelligenzblätter waren reine Anzeigeblätter, die etwa Verkaufsofferten, Leihgesuche oder Lost & Found-Angaben enthielten, aber auch mit Ämterwahlen, Hinweisen zu Lotterien, kulturellen Veranstaltungen sowie jährlichen Informationen zu Todes- und Geburtszahlen angereichert waren. Es ist, anders als die ADC, eine bekannte Quelle, die aber aufgrund ihres Umfangs bisher kaum für Auswertungen genutzt wurde. Ausgehend von einem Forschungsdesiderat im Feld der Konsumgeschichte in der Schweiz wurde das Projekt Märkte auf Papier als digital history-Projekt konzipiert. Teil des Projekts war die vollständige Digitalisierung mit Volltexterkennung und maschinellem Lernen, um die Quelle möglichst tief zu erschliessen. Die Bewirtschaftung von Schnittstellen zwischen Geschichtswissenschaft und Informatik, exemplarisch an der Software-Plattform freizo aufgezeigt, generiere Spill Over-Effekte für beide Seiten, erklärte Burghartz. Konkret werden im Projekt der Basler Avisblätter mit Hilfe von IIIF-Technologie aus annotierten Digitalisaten strukturierte Daten für den Aufbau von Datenbanken generiert. Die serielle Quelle ist geeignet für die Bearbeitung durch digitale Instrumente. Die gewonnenen Langzeit-Datenreihen ermöglichten neue Erkenntnisse, etwa im Vergleich mit Intelligenzblättern anderer Kantone, die z.B. Unterschiede bei der Häufung obrigkeitlicher Meldungen zeigen. Der wahre Nutzen bestehe aber in der Entwicklung der aufgezeigten digitalen Instrumente, die sich für Textquellen verschiedenster Arten nutzen lassen.
Mit dem Beitrag von ERIC DECKER (Basel) wurde ein genauerer Blick auf die technischen Arbeitsweisen der digitalen Werkzeuge und die wesentlichen Vorgänge geworfen, bei denen die Datenschätze durch digitale Werkzeuge nutzbar und somit zu Datensätzen transformiert werden. Durch Formatierung und Segmentierung werden die Datensätze referenzierbar, damit auffindbar und sortierbar. Solche sortierbaren Einheiten sind zentral für Projekte wie die ACD oder die Avisblätter. Mit der Annotation, einem Prozess mit Automatisierungspotential, werden Wörtern oder Textteilen Werte zugeordnet, damit eine Einheit erkannt werden kann. Die Bereicherung aus einer eher technischen Warte liegt in der Aneignung und letztlich in der Beherrschbarkeit der riesigen Datenmengen. Durch die Beachtung von Standards wird die Normierung gewährleistet und ein hohes Nutzungspotential ermöglicht. Zudem werden Quellenkontext und eine eindeutige Referenzierbarkeit gewährleistet, etwa bei fehlenden Seiten.
Abschliessend fokussierte das Panel anhand des Referats von TOBIAS HODEL (Zürich) auf den Bereich der Handschriftenerkennung und neue Zugangsformen in diesem Bereich. Im e-Infrastrukturprojekt READ1 und der Transkriptionsplattform Transkribus wurden in den letzten Jahren handschriftliche Dokumente mit unterschiedlichen Automatisierungsprozessen aufbereitet. Durch maschinelles Lernen mit dem HTR-Verfahren ist in den vergangenen Jahren eine sprunghafte Verbesserung bei Algorithmen eingetreten: Konnten diese vor zwei Jahren kaum einen Text in deutscher Kurrentschrift erkennen, ist es nun möglich, ohne tiefergehende technische Kenntnisse selbst Handschriftenmodelle zu generieren, die genutzt werden können, um Transkriptionen zu erzeugen oder diese mit hoher Treffgenauigkeit zu durchsuchen, wobei sich auch Spill Overs für die Computerwissenschaft ergeben. Pro Handschrift muss dabei ein Training stattfinden. Auch Visualisierungsbestrebungen seien angedacht, so ist es anhand von Zeichenketten etwa möglich, die Häufigkeit gewisser Begriffe in gewissen Kontexten abzufragen und Verbindungen zu anderen Begriffen zu klären.
Das Panel profitierte davon, dass es Einblicke in die Entwicklung und die Arbeit von digitalen Werkzeugen aus ganz unterschiedlichen Zeiträumen, Region und Perspektiven gewährte und trotzdem die gemeinsamen Nenner und wesentlichen Mehrwerte herauskristallisierte. Es zeigte anhand der Erschliessung von unterschiedlichen Massenquellen auf, welche neuen Methoden in Entwicklung sind, welche neuen Resultate zu erwarten sein werden und wie sich die Möglichkeiten, Geschichte zu schreiben, teilweise verändern. Der Umstand, dass homogene Datensätze, die sich auf verschiedene Fragestellungen anwenden lassen, en vogue sind, scheint dabei nicht unproblematisch. Auch wenn der Homogenität von Daten nicht unbedingt ein gewisser Eurozentrismus inhärent sein muss, so ist eine kritische Betrachtung durchaus angebracht. Mit der sukzessiven maschinellen Weiterentwicklung muss der Fokus über homogenes Quellenmaterial hinaus vergrössert und ein Einbezug von sperrigen Daten ermöglicht werden. Dabei ist offen, wie viel Aufwand in diese Richtung als lohnend erachtet wird.
Anmerkungen
1 Recognition and Enrichment of Archival Documents (READ)
Panelübersicht
Herren, Madeleine: Die Asia Chronicles and Directories: eine Globalgeschichte von unten
Burghartz, Susanna; Decker, Eric: Zwischen Anekdote und Massenquelle. Bildgestützte Datenbanken als neue Erschliessungsmöglichkeit für historische Anzeigenblätter
Hodel, Tobias: Neues Lesen? Chancen der Handschriftenerkennung für die Geschichtswissenschaften
Dieser Panelbericht ist Teil der infoclio.ch-Dokumentation zu den 5. Schweizerischen Geschichtstagen