Bericht zum Vortrag Oliver Götze: Wege in das Archivportal-D – Aktueller Stand der Datenlieferung und Perspektiven im Rahmen der neuen technischen DDB-Architektur
Oliver Götze stellte in seinem Vortrag den aktuellen Stand, den Weg ins Portal und dann Perspektiven des Archivportal-D vor. Das Archivportal stellt seit der Inbetriebnahme auf dem Deutschen Archivtag 2014 in Magdeburg den zentralen Einstiegspunkt zu Archivinformationen und Archivgut in Deutschland dar. Es ist der spartenspezifische Zugang innerhalb der Deutschen Digigitalen Bibliothek (DDB). Seit dem Projektende ist der Betrieb des Archivportals-D dauerhaft gesichert. Mit Stand Mai 2019 sind im Portal 14,3 Mio. Datensätze aus 83.000 Beständen von 164 Archiven eingestellt. Für das Archivportal standen von Anfang an nicht nur die Digitalisate im Mittelpunkt sondern auch die Bereitstellung der Daten in ihrer Mehrstufigkeit der Online-Repräsentanzen der Archive: also Informationen zu den Archiveinrichtungen, Beständeübersichten, Online-Findmittel und in der letzten Stufe digitalisiertes Archivgut, im Fokus. Im Portal gibt es einige für den Archivar etwas verwirrende Abweichungen in der Begrifflichkeit. So werden z.B. die Verzeichnungseinheiten als Objekte bezeichnet, wobei auch die Bestandsbeschreibungen Objekte sind. In der Deutschen Digitalen Bibliothek, welche ein übergreifendes Portal für Daten aus allen Kultursparten darstellt, sind die Archive mit mehr als 14 Millionen Objeten von insgesamt 24,5 Mio die mit Abstand größten „Objektlieferanten“.
Man muss aber eindeutig sagen, dass die Metadaten der Bibliotheken auch weniger in der DDB als vielmehr in den verschiedenen Online-Katalogen eingestellt sind. Wenn ich in der DDB die Filterabfrage auf die Objekte mit Digitalisaten reduziere, verändert sich dann das Bild entscheidend. Die Bibliotheken haben ca. 5,5 Mio von insgesamt 9,5 Mio Digitaklsiaten geliefert, während die Archive hier „nur“ ca. 934.000 beisteuerten. Aus diesen Zahlen lässt sich sehr deutlich die Priorität bei der bisherigen Zielsetzung als Datenlieferant ablesen.
Herr Götze beschränkte sich in seinem Vortrag aber natürlich auf die besondere archivische Sicht auf das Archivportal und ermunterte hier die Anwesenden sich auch als neuer Datenlieferant einzubringen. Selbstkritisch stellte er dar, dass es in der Vergangenheit beim Dateningest zu größeren Problemen und damit Verzögerungen gekommen ist. Vor allem bei größeren Datenmengen war dies der Fall. Nunmehr seien diese Probleme weitgehend gelöst und eine recht schnelle Einspielung der Daten möglich.
Wie kommt man nun ins Portal?
Zunächst muss das Archiv bei der DDB als eigenständige Institution registriert werden. Für die eindeutige Indentifizierung der Institution muss eine sogenannte ISIL-Nummer beantragt werden. Mit der DDB muss ein Kooperationsvertrag abgeschlossen werden. Dann werden Daten aus den Archivsystemen an die Fachstelle beim Archivportal geliefert. Die entsprechenden Mappingkonzepte werden im Prinzip bereits durch die verwendete Software und die Erschließungsangaben festgelegt. Man muss sich überlegen, welche Inhalte welchen Feldern in der Software zugeordnet werden. Die Fachstelle nimmt auch Daten in einem anderen Format als EAD (DDB), Hauptsache sie liegen in strukturierter Form vor. Schließlich werden die Daten nach einer Kontrolle der Daten ins System eingespielt. Die Schritte für den Anmeldeweg kann man auch auf den Seiten der DDB nachlesen.
Die Arbeitsschritte müssen nach Götze nicht unbedingt in dieser Reihenfolge eingehalten werden. Man kann zum Beispiel auch schon Daten ins Testsystem einspielen, bevor der Vertrag mit der DDB abgeschlossen wurden. Vor der Freischaltung ist dann jedoch der unterschriebene Vertrag zwingend notwendig. Im Vertrag mit der DDB wird auch die Weitergabe der Daten an die Europeana geregelt. Die Metadaten müssen allerdings mit einer CC0-Auszeichnung versehen sein. Das bedeutet, dass dann bei Zustimmung die beim Archivportal-D eingespielten Daten automatisch weiter gereicht werden. In der Deutschen Digitalen Bibliothek sind die Daten ebenfalls sichtbar, da das Archivportal nur ein Unterportal der DDB ist.
Wie oben angeführt wurden Prozesse und Tools in der Fachstelle beim Archivportal-D angepasst und verbessert. Seit Ende März 2019 ist der Ingest wieder möglich. Seitdem wurden 22 Archive neu in das Portal überführt. Probleme gibt es aber immer noch bei der Einspielung großer Datenmengen und bei Aktualisierungen bestehender Datengeber. Innerhalb der nächsten zwei Monate sollen aber auch diese Probleme behoben sein. Bereits jetzt ist eine deutliche Beschleunigung des Ingestvorganges zu verzeichnen. Die Einspielung von Daten kleinerer bis mittlerer Archive dauert nun nur noch wenige Minuten und die von sehr großen Datenmengen konnte wesentlich reduziert werden. So dauert es z.B. für das Landesarchiv Baden-Württemberg mit 5,3 Mio Objekte nun nur noch acht Stunden, statt wie bisher mehrere Wochen. Bei einem solch langen Ingestverfahren kann man sich leicht vorstellen, dass dieser nicht immer problemlos und fehlerfrei vonstatten ging. Beispielhaft stellte Herr Götze den kürzlichen durchgeführten Ingest des Archivs und der Kustodie der Hochschule für Bildende Künste Dresden (HfBK Dresden) vor. Dr. Simone Fugger von dem Rech stellte in ihrem Vortrag das Archiv und die Kustodie der HfBK Dresden näher vor.
In einem weiteren Abschnitt erläuterte Herr Götze die Aufbereitung und Validierung der Daten mit Hilfe des Data Preparation Tool. Das Tool erzeugt Objekt-Vorschauansichten im
Archivportal-Layout und wertet die Metadaten entsprechend aus. Das Tool erzeugt auch einen detaillierten Bericht, mit dem der Prozess nachvollzogen werden kann. Mit dem Testsystem wurde eine visuelle Validierung geschaffen: „Die Datengeber kennen ihre Daten am Besten“ so Götze. Vor der Weitergabe an das Produktivsystem können die Datengeber die Darstellung ihrer Daten im Testsystem begutachten und anschließend zur Veröffentlichung freigeben.
Aussicht
Im letzten Abschnitt gab Götze einen Ausblick auf die weiteren Entwicklungen beim Archivportal-D. So soll die Vorverarbeitung der Datenlieferungen weiter ausgebaut werden. Außerdem sollen verstärkt thematische Zugänge geschaffen werden.
Mit Fördermitteln der Deutschen Forschungsgemeinschaft (DFG) werden über Projekte die Voraussetzungen für verschiedene Portalzugänge geschaffen. Der Projektantrag für das Vorhaben mit dem Titel „Aufbau einer Infrastruktur zur Implementierung sachthematischer Zugänge im Archivportal-D am Beispiel des Themenkomplexes ‚Weimarer Republik‘” wurde von der DFG in vollem Umfang bewilligt. Dabei soll auf Projekte des Bundesarchivs und des Landesarchivs Baden-Württemberg als Datenbasis zugegriffen werden.
Außerdem wird die Darstellung des Archivportals selbst künftig moderner gestaltet. Die Dokumentation des Projektes, die in der Hochphase etwas vernachlässigt wurde, wird nun auf Vordermann gebracht. Schließlich wird an der Einbindung von Audio- und Videomaterial in das Portal gearbeitet.
An der Fachstelle beim Archivportal-D sind nunmehr bessere Voraussetzungen bei Technik und Workflow geschaffen, so dass die Archive schneller und einfacher mit Ihren Daten teilnehmen können. Die Sächsischen Archive sind aufgerufen die Zahl der bisher zehn datenliefernden Archive signifikant zu erhöhen.