Transkribus: Programm zum Handschriften entziffern

Screenshot youtube.com Screenshot youtube.com

Die spanische >>Polytechnische Universität Valencia<< hat >>Transkribus<< ein Computerprogramm: Zum entziffern von schwer lesbaren Handschriften entwickelt. Denn besonders alte Handschriften sind schwierig zu lesen. Damit Texte Suchmaschinen erfassen können, müssen die Buchstaben von einen Programm erkannt werden.

>>Heise.de<<

„Historische Dokumente sind oftmals schwer zu lesen – schon Uromas Tagebuch bereitet heutigen Lesern einige Schwierigkeiten. Hier will die Software Transkribus helfen: Die Software erkennt alte handschriftliche Aufzeichnungen und wandelt sie in digitalen Text um, der sich viel einfacher lesen lässt. Egal ob mittelalterliche Texte oder Notizen aus dem zwanzigsten Jahrhundert – Transkribus verspricht eine Handschriftenerkennung, die immer besser wird. Gedacht ist die Software für Wissenschaftler, Archivare, aber auch für Laien. Die Software nutzt Algorithmen, die die TU Valencia und das Nationale Forschungszentrum in Athen erarbeitet haben. Es ist allerdings ausreichend Material nötig, um einen Text zu entziffern: „Der Brief vom Großvater kann noch nicht auf Knopfdruck transkribiert werden“, erklärte Projektleiter Günter Mühlberger von der Universität Innsbruck gegenüber der Deutschen Presse-Agentur. Das Programm sei in der Lage, eine Handschrift nach rund 100 Seiten (rund 20.000 Wörter) gut zu lesen. Je mehr Texte die HTR-Engine zum Entziffern bekommt, desto besser ist das Ergebnis. Mit dem „Keyword Spotting“ lasse sich in den Schriften gezielt nach Stichworten suchen, so Mühlberger. Als Export-Formate für den erkannten Text gibt es PDF, RTF, TEI und XML. Derzeit steht das Projekt vor zwei großen Herausforderungen: Zum einen benötigt die Software noch zu viele Daten, um Schrift in leicht lesbaren Text umzuwandweln. Zum anderen fehlt ein Netzwerk, um die vielen unterschiedlichen Schriften zusammenzuführen.“