Für eine Vielzahl von digitalen Diensten und Dienstleistungen wie Discovery Systeme, Electronic Resource Management, Forschungsdatenmanagement oder Digitalisierung müssen Bibliotheken heutzutage Metadaten in verschiedenen Formaten, z.B. Excel, KBART, MAB2, MARC 21, MODS und PICA, über diverse Schnittstellen (OAI, SPARQL, SRU, Z39.50, etc.) beziehen, aufbereiten und bereitstellen. Diese sich wiederholenden Prozesse des Datenmanagements werden auch als “Extract, Transform, Load” (ETL) bezeichnet: Extraktion der Daten aus verschiedenen Quellen, Transformation in ein geeignetes Schema und Laden in ein Zielsystem. “Catmandu”, ein data processing toolkit, unterstützt die Standardisierung dieser Prozesse mit offenen Modulen etwa für gängige bibliotheksspezifische Datenformate, Datenbanksysteme und Schnittstellen.
Das 2-stündige “Hands-On Lab” bietet eine Einführung in die Funktionalitäten von “Catmandu” mit praxisnahen Übungen. Der Schwerpunkt liegt dabei auf der effizienten Arbeit mit dem command line interface, das den schnellen Zugriff auf die vielen erprobten Funktionalitäten des toolkits ermöglicht. Die Teilnehmer*innen lernen, selbständig ETL-Prozesse mit “Catmandu” auszuführen und so von der fix language für die Transformation und Normalisierung etwa von Metadaten zu profitieren.
Die Veranstaltung richtet sich an Datenmanager*innen und Systembibliothekar*innen. Voraussetzung sind grundlegende Kenntnisse im Umgang mit der Kommandozeile und bibliotheksspezischen Datenformaten. Für die Übungen ist ein eigener Laptop mit der Software “VirtualBox” erforderlich. Eine virtuelle Maschine mit allen benötigten Software-Modulen wird zum Download bereitgestellt.
Felix Hemme1, Johann Rolschewski
21ZBW Kiel/Hamburg, Metadaten-Management, Kiel, Deutschland,
2Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Überregionale Bibliographische Dienste, Berlin, Deutschland
Tweet