Session: Neues aus dem Netzwerk der GND (S121)
Who´s who in Normdaten? Maschinelle Verfahren in der Zuordnung von Personennormdatenverknüpfungen bei häufigen Namen
S. Grund1, A. Vorndran1
1Deutsche Nationalbibliothek, Frankfurt am Main, Deutschland
Am Beispiel der Verknüpfung von Autor*innen mit häufigen Namen soll hier untersucht werden, wie verschiedene maschinelle Verfahren dazu eingesetzt werden können, bei mehreren namensgleichen Entitäten den korrekten Personennormdatensatz der Gemeinsamen Normdatei (GND) zu identifizieren.
Hierzu werden statistische Verfahren genutzt, die verschiedene weitere Metadatenbestandteile der Titeldaten namensgleicher Verfasser berücksichtigen und eine Einschätzung der Wahrscheinlichkeit einer Übereinstimmung zulassen. Beispielsweise können gleiche Sachgruppen, Verlage oder auch Co-Autorschaften bei mehreren Publikationen nützliche Hinweise auf die Identität einer Person sein. Ergänzend werden maschinelle Lernverfahren für diesen Zweck erprobt, die durch Clusteringverfahren ähnliche Titel gruppieren oder über Klassifikationsverfahren die Zugehörigkeit zu einem bestimmten Normdatensatz einschätzen können.
Ist in einer Gruppe von als inhaltlich und strukturell ähnlich erkannter Publikationen eine der Namenseintragungen mit einer Verknüpfung zur GND versehen, kann diese ggf. für die weiteren Publikationen übernommen werden. Andernfalls kann der Personenname und die als zugehörig erkannten Publikationen als Grundlage für einen Personenvorschlagssatz dienen. Diese Vorschlagssätze bilden eine Vorstufe zu Personennormdatensätzen, bündeln verschiedene, zum größten Teil maschinell zusammengestellte, Informationen und können nach einer Prüfung in Personennormdatensätze überführt werden.
Speakers: Angela Vorndran