S125: Aufbau eines produktiven Dienstes für die automatisierte Inhaltserschließung an der ZBW – ein Status- und Erfahrungsbericht

Bibliothekskongress 2022

Session: Indexieren und Sortieren (S125)

Aufbau eines produktiven Dienstes für die automatisierte Inhaltserschließung an der ZBW – ein Status- und Erfahrungsbericht
A. Kasprzik¹, M. Fürneisen¹
¹ZBW – Leibniz-Informationszentrum für Wirtschaft, Hamburg, Deutschland

Abstract Text: Die ZBW – Leibniz-Informationszentrum Wirtschaft betreibt seit 2016 eigene angewandte Forschung im Bereich Machine Learning mit dem Zweck, praktikable Lösungen für eine automatisierte oder maschinengestützte Inhaltserschließung zu entwickeln.
Seit 2020 wird an der ZBW eine Softwarearchitektur aufgebaut, die diese prototypischen Lösungen in einen produktiven Dienst überführt und mit den bestehenden Nachweis- und Informationssystemen verzahnt.
Sowohl die angewandte Forschung als auch die für dieses Vorhaben ("AutoSE") notwendige Softwareentwicklung sind direkt im Bibliotheksbereich der ZBW angesiedelt, werden kontinuierlich anhand des State of the Art vorangetrieben und profitieren von einem engen Austausch mit den Verantwortlichen für die intellektuelle Inhaltserschließung.
In diesem Vortrag berichtet das AutoSE-Team, wie weit wir in zwei Jahren mit dem Aufbau und der Integration der Softwarearchitektur gekommen sind. Wir stellen die erreichten Meilensteine vor und geben Erfahrungswerte weiter, die wir auf dem Weg dahin mitgenommen haben. Eines der Ergebnisse, das bis zum Ende der Pilotphase 2023 vorliegen soll, ist die Beschreibung eines tragfähigen Modells für den permanenten produktiven Betrieb des AutoSE-Dienstes, das regelmäßige Überprüfungen sowohl einzelner Komponenten als auch des Produktionsworkflows als Ganzes vorsieht und eine fortlaufende Weiterentwicklung der Architektur erlaubt.
Die Architektur basiert auf Open-Source-Software und die eingesetzten Machine-Learning-Komponenten werden in einer internationalen Zusammenarbeit mit der Finnischen Nationalbibliothek (NLF) weiterentwickelt und zur Nachnutzung in dem von der NLF entwickelten Werkzeugkasten Annif aufbereitet. NLF und ZBW haben bereits mehrere Tutorials zu Annif abgehalten: https://github.com/NatLibFi/Annif-tutorial. Wir diskutieren, welche Bedingungen gegeben sein müssen, um die darin enthaltenen Machine-Learning-Lösungen an einer Institution erfolgreich für die Inhaltserschließung einzusetzen.

Speakers: Anna Kasprzik