Session: Indexieren und Sortieren (S125)
Automatische Inhaltserschließung an der Deutschen Nationalbibliothek
S. Uhlmann1
1Deutsche Nationalbibliothek, Leipzig, Deutschland
Im Vortrag werden Ergebnisse der automatischen Indexierung deutschsprachiger Publikationen mit Schlagwörtern der Gemeinsamen Normdatei (GND) vorgestellt. In diesem Anwendungsfall stehen 1,3 Millionen GND-Schlagwörter für die Inhaltserschließung zur Verfügung, die automatisch den Publikationen zugeordnet werden können. Erfahrungen mit verschiedenen Algorithmen werden präsentiert, Unterschiede von lexikalischen versus lernenden Verfahren im Anwendungsfall GND herausgearbeitet und analysiert.
Desweiteren wird die technische Integration von Annif in den produktiven Workflow veranschaulicht: Von der Textbereitstellung und der Identifizierung der Sprache des Textes, zur Auswahl des geeigneten Annif-Verfahrens bis hin zur Aktualisierung des bibliographischen Datensatzes.
[1] http://annif.org/
Speakers: Sandro Uhlmann