conferences | speakers | series

S121: Who´s who in Normdaten? Maschinelle Verfahren in der Zuordnung von Personennormdatenverknüpfungen bei häufigen Namen

home

S121: Who´s who in Normdaten? Maschinelle Verfahren in der Zuordnung von Personennormdatenverknüpfungen bei häufigen Namen
Bibliothekskongress 2022

Session: Neues aus dem Netzwerk der GND (S121)

Who´s who in Normdaten? Maschinelle Verfahren in der Zuordnung von Personennormdatenverknüpfungen bei häufigen Namen
S. Grund1, A. Vorndran1
1Deutsche Nationalbibliothek, Frankfurt am Main, Deutschland

Abstract Text: Für Bibliotheksdaten wird es in einer immer stärker vernetzten Datenlandschaft wichtiger, kontrollierte Vokabulare zu nutzen, eindeutige Entitäten zu referenzieren und so Knotenpunkte und Links zu nutzen und zu schaffen. Vor diesem Hintergrund ist auch das stärkere Einbinden von Normdatenverknüpfungen in bibliothekarische Metadaten anzustreben. Bei in sich uneindeutigen Inhalten zeigt sich allerdings häufig eine Schwierigkeit der Zuordnung zu eindeutigen Entitäten.
Am Beispiel der Verknüpfung von Autor*innen mit häufigen Namen soll hier untersucht werden, wie verschiedene maschinelle Verfahren dazu eingesetzt werden können, bei mehreren namensgleichen Entitäten den korrekten Personennormdatensatz der Gemeinsamen Normdatei (GND) zu identifizieren.
Hierzu werden statistische Verfahren genutzt, die verschiedene weitere Metadatenbestandteile der Titeldaten namensgleicher Verfasser berücksichtigen und eine Einschätzung der Wahrscheinlichkeit einer Übereinstimmung zulassen. Beispielsweise können gleiche Sachgruppen, Verlage oder auch Co-Autorschaften bei mehreren Publikationen nützliche Hinweise auf die  Identität einer Person sein. Ergänzend werden maschinelle Lernverfahren für diesen Zweck erprobt, die durch Clusteringverfahren ähnliche Titel gruppieren oder über Klassifikationsverfahren die Zugehörigkeit zu einem bestimmten Normdatensatz einschätzen können.
Ist in einer Gruppe von als inhaltlich und strukturell ähnlich erkannter Publikationen eine der Namenseintragungen mit einer Verknüpfung zur GND versehen, kann diese ggf. für die weiteren Publikationen übernommen werden. Andernfalls kann der Personenname und die als zugehörig erkannten Publikationen als Grundlage für einen Personenvorschlagssatz dienen. Diese Vorschlagssätze bilden eine Vorstufe zu Personennormdatensätzen, bündeln verschiedene, zum größten Teil maschinell zusammengestellte, Informationen und können nach einer Prüfung in Personennormdatensätze überführt werden.

Tweet

Speakers: Angela Vorndran