Abstract Text: Die Deutsche Forschungsgemeinschaft (DFG) fördert seit 2015 mit dem Projekt OCR-D die Entwicklung von Werkzeugen für die Massendigitalisierung historischer Dokumente. Im Frühjahr 2021 begann die dritte und abschließende Phase. In dieser wird die automatische Generierung von Volltexten der VD 16, VD 17 und VD 18 konzeptionell und technisch in verschiedenen Bibliotheken und anderen Einrichtungen vorbereitet sowie implementiert. Die Verstetigung und Optimierung der OCR-D-Software wird begleitet von vier Projekten, die OCR-D in bestehende Anwendungen und Infrastrukturen implementieren, sowie von drei Modulprojekten, die OCR-D-Werkzeuge weiter optimieren.
Im Vortrag und der begleitenden Präsentation der OCR-D-Software werden der Projektstand, die Ziele sowie die Möglichkeiten und Funktionsweisen der Software vorgestellt. Im Fokus steht dabei, welche Möglichkeiten Bibliotheken mit digitalen Beständen geboten werden, effizient und mit niedrigen Fehlerquoten Volltexte ihrer Bestände zu generieren. OCR-D ist individuell für verschiedene Digitalisierungsworkflows nutzbar. Die Erstellung von Volltexten kann bedarfsgerecht skalierbar eingerichtet werden. Welche Möglichkeiten die Software für die unterschiedlichen Bedarfe in der diversen Bibliothekslandschaft bietet, wird ebenfalls Gegenstand des Vortrags sein.
OCR-D ist nicht nur eine Software, sondern eine Community von Expert:innen, Praktiker:innen und Entwickler:innen. Für diese Gemeinschaft werden verschiedene offene Kommunikationskanäle und Möglichkeiten geboten, teilzuhaben. Im zweiten Teil des Vortrages wird ein Einblick in unsere Community-Plattformen gegeben. So kann ein niedrigschwelliger Zugang dafür genutzt werden, auch für technisch nicht versierte Anwender:innen, Hilfe und Unterstützung bei der Implementierung der Software in der eigenen Bibliothek zu erhalten.