Historische Schätze digitalisiert: e-rara und e-manuscripta im Fokus

Hintergrund

Welche Gedanken machte man sich im 16. Jahrhundert über astronomische Phänomene? Worauf nahm eine Buss- und Bettags-Predigt um 1712 Bezug? Und haben Autoren auch früher schon Texte voneinander abgeschrieben? Um Antworten auf diese Fragen zu erhalten, muss man heute nicht mehr in die Bibliothek gehen und vorsichtig Seite um Seite in einem historischen Buch umblättern. Dank einer Initiative der ETH-Bibliothek sind diese Werke nun digital verfügbar. Und das nicht nur für Forschende, sondern auch für die breite Öffentlichkeit. 

Erfolg durch Kooperation

Erste Gedanken über eine digitale Bibliotheksplattform für alte Drucke machte man sich bei der ETH-Bibliothek bereits im Jahr 2007. Doch erst als sie sich Mitstreiter wie die Zentralbibliothek Zürich, die Universitätsbibliothek Basel, die Bibliothèque de Genève und die Universitätsbibliothek Bern ins Boot holte, kam wirklich Fahrt in das Projekt. Mithilfe von Fördermitteln aus dem Projekt Elektronische Bibliothek Schweiz (e-lib.ch) entstand die Plattform e-rara, welche 2010 lanciert wurde. Drei Jahre später folgte das Pendant für handschriftliche Dokumente: e-manuscripta. Mittlerweile beteiligen sich bei e-rara 26 und bei e-manuscripta neun Partnerbibliotheken und -institutionen. E-rara hat sich so zur ersten Adresse entwickelt, wenn es um die digitale Publikation Alter Drucke in der Schweiz geht. 

Mehrwert für Wissenschaft und Öffentlichkeit

Das zentrale Ziel von e-rara und e-manuscripta ist es, historische Werke zu digitalisieren und sowohl für die Wissenschaft und Lehre als auch für die breite Öffentlichkeit frei online zugänglich zu machen. Und das nach einheitlichen Qualitätsstandards. Darüber hinaus wollen die Partnerinstitutionen Folgendes erreichen und sicherstellen: 

  • Eine persistente Referenzierung der elektronischen Dokumente mittels Digital Object Identifier (DOI) der ETH-Bibliothek.
  •  Die konsequente Umsetzung einer Open-Access-Strategie.
  • Die Konzeption und Einführung neuer Services auf den Plattformen.
  • Den Schutz der wertvollen Werke, da diese nicht mehr so oft angefasst oder gar von einer Bibliothek zur nächsten transportiert werden müssen. 

Internationale Standards und offene Schnittstellen

Für Laien ist es natürlich spannend, wenn sie online in alten Büchern und Schriften blättern können. Für Personen aus der Lehre und Forschung stellt die Digitalisierung der Bestände jedoch eine wichtige Arbeitsgrundlage dar. So lassen sich die Werke nicht nur von überall auf der Welt anschauen, sondern können auch für computerbasierte Forschung genutzt werden. Texte können zum Beispiel online verglichen und mit speziellen Programmen analysiert werden. Dafür sorgen internationale Standards und offene Schnittstellen, die den maschinellen Zugang und den Austausch mit anderen Plattformen ermöglichen. 

Offene Schnittstellen ermöglichen auch die Datenübernahme in internationale Fachportale. So werden zum Beispiel Inhalte von e-rara in der großen französischen Plattform Gallica oder im von der Harvard University betriebenen SAO/NASA Astrophysics Data System (ADS) übernommen und stehen dort für die Recherche zur Verfügung. 

Open Data und Crowdsourcing

Mit den beiden Plattformen wird nationales Kulturgut zugänglich gemacht. Dabei sind bei e-rara fast alle Inhalte «Public Domain», also frei verfügbar. Das heißt, man kann sie als JPEG, PDF oder in einem anderen Dateiformat herunterladen bzw. über Social Media teilen. Und anders als bei einem physischen Werk kann man das digitale nach Belieben bearbeiten. So bietet die Plattform die Möglichkeit, den Kontrast oder die Helligkeit einer bestimmten Buchseite zu verändern. Zudem kann man in ein Bild hineinzoomen oder den gesamten Text nach Stichworten durchsuchen, sofern bei dem Werk der Volltext vorhanden ist. 

Das Besondere bei e-manuscripta ist, dass sie sich von einer reinen Präsentationsplattform hin zu einer Forschungs- und Editionsplattform entwickelt hat, die kollaboratives Arbeiten zulässt. So kann jede und jeder mithelfen, handschriftliche Dokumente wie Briefe, Karten oder Notizen zu entziffern und zu transkribieren. Diese Plattform, deren Geschäftsstelle von der Zentralbibliothek Zürich geführt wird, ist also zugleich ein Crowdsourcing-Projekt. 

Der freie Zugang auf der einen Seite und die Möglichkeit zur Mitarbeit auf der anderen, machen e-rara und e-manuscripta zu Paradebeispielen für Public Domain- und Open Data-Projekte. 

Interoperabilität und Infrastruktur

Wichtig war es den Trägerbibliotheken der beiden Plattformen, dass diese mit den gängigen Suchmaschinen kommunizieren können. Schließlich kann man nicht davon ausgehen, dass die Recherche erst auf der eigenen Website anfängt. Es ist anzunehmen, dass viele Suchen bei Google oder der Bibliotheksplattform Swisscovery starten. Deshalb sind alle Titel auch hier eingebunden und über Google erreichbar. 

Eine grundlegende Herausforderung für das immense Digitalisierungsvorhaben war der Aufbau der Infrastruktur, also die Beschaffung von Scan-Robotern und das Einrichten von Digitalisierungsstrassen. So haben sich die fünf Gründungspartner – neben der Beschäftigung mit ihren klassischen Aufgaben – in Digitalisierungsstandorte für das Projekt e-rara umgewandelt. Hier werden heute nicht nur die eigenen Altbestände digitalisiert, sondern auch die der anderen Schweizer Bibliotheken, welche sich dem Projekt angeschlossen haben, jedoch nicht über die notwendige technische Infrastruktur verfügen. 

Nutzerfreundliches Design und Technik

Die Plattform e-rara umfasst mittlerweile fast 99’000 Titel; bei e-manuscripta sind es über 149’000. Bei einer solchen Fülle an digitalisierten Inhalten spielt das Design eine wesentliche Rolle. Seine Aufgabe ist es, für Klarheit und Übersichtlichkeit zu sorgen. Da die Recherche im Vordergrund steht, erhält das Suchfeld einen prominenten Platz in der Bühne. Nutzer, die lieber stöbern, können sich durch übersichtlich angelegte Themen und Kollektionen klicken. Alle Werke lassen sich in unterschiedlichen Ansichten darstellen und die Bedienung ist so einfach wie intuitiv. Bei einem umfassenden Redesign erhielten die Plattformen 2022 ein neues Gesamterscheinungsbild mit zusätzlichen technischen Funktionen, welche die Nutzung verbessern und die Inhalte noch einfacher verwendbar machen. 

Technisch basieren die beiden Plattformen auf der Visual Library der semantics GmbH und der Walter Nagel & Co. KG. Für das Hosting ist die IT-Abteilung der ETH-Bibliothek zuständig. Ein zentraler Grund, weshalb e-rara und e-manuscripta auch optisch ähnlich daherkommen. Zudem wollte man mit einem einheitlichen Design natürlich die Verbindung zwischen den Plattformen kommunizieren. Daher arbeiteten die UX-Designer der zuständigen Agentur Eyekon AG, welche mit der Gestaltung des Interface beauftragt wurde, ein Design-System aus, welches sich bei beiden Websites durchgängig anwenden lässt. Dass die Seiten responsive sind, also auf allen Devices optimal dargestellt werden, versteht sich von selbst. 

Fazit und Ausblick

Die Plattformen e-rara und e-manuscripta haben die Erwartungen hinsichtlich der Digitalisierungsgeschwindigkeit sowie der Besucherzahlen von Anfang an übertroffen. Und die allgemeine Begeisterung hält an. Auch, weil sich die Plattformen stetig weiterentwickeln. Ein Beispiel: die Volltexterkennung. Dank Optischer Zeichenerkennung (OCR) wird diese schrittweise erweitert. So kamen allein im Jahr 2022 über 2.7 Mio. Seiten hinzu. Zudem sorgt die Implementierung des Tools TextLab bei e-rara dafür, dass man diese Texte auch nach Orten oder Namen durchsuchen sowie zusätzliche Informationen und Verknüpfungen mit anderen Texten nachvollziehen kann, was es einem wiederum ermöglicht, noch tiefgreifender zu recherchieren. 

Auch das Team von e-manuscripta arbeitet stetig an Optimierungen. So werden unter anderem bald maschinell erstellte Transkriptionen integriert werden können. Und auch in Zukunft werden die Partnerinstitutionen rund um die ETH-Bibliothek keine Mühen scheuen, neue Technologien und Services in ihre Plattformen einzubinden. 

Zahlen zu e-rara 2022: 

99.000 Titel 

1.8 Mio Visits 

845.000 Downloads 

12.7 Mio Seiten Volltext 

26 beteiligte Bibliotheken

 

Zahlen zu e-manuscripta 2022:

149.000 Titel 

900.000 Visits 

275.000 Downloads 

5.700 Transkriptionen 

 

(Dieser Artikel wurde zuerst auf der Website der Eyekon AG veröffentlicht)

News-Archiv
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006