Le portail suisse pour les sciences historiques

Workshop: Einführung in Theorie und Praxis der OCR mit neuronalen Netzwerken

31.08.2021 - 17:15 - 19:00 Add to calendar
Workshop

Optical Character Recognition (OCR), die automatische Texterkennung, ist eine der wichtigsten Methoden im Bereich der Retrodigitalisierung. Dadurch werden grosse Textmengen maschinell lesbar und durchsuchbar gemacht.
Insbesondere die Texterkennung von gedruckten historischen Dokumenten weist Erfolge auf, bleibt aber nach wie vor anspruchsvoll: Frakturschrift, Flecken auf den Seiten, durchscheinender Text sowie verschiedene Schriftgrössen führen dazu, dass ältere OCR-Systeme oft unverständliche und verstümmelte Texte extrahieren. Hier funktioniert die Textsuche anschliessend nur schlecht. Moderne auf neuronalen Netzwerken basierende OCR-Systeme schaffen neuerdings Abhilfe und sind in der Lage, Buchstaben zuverlässig und korrekt zu erkennen.
In unserem 90-minütigen Workshop erklären wir im ersten Teil die theoretischen und technischen Grundlagen von OCR, im zweiten Teil wenden wir uns der Praxis zu. Mit Hilfe des Tools «Transkribus» können die Teilnehmenden digitale Dokumente für die Texterkennung vorbereiten und erlernen zudem, wie das Trainieren eines eigenen Modells funktioniert.
Eine Teilnahme am Workshop ist mit vorangehender Anmeldung bis zum 24. August 2021 an diese Adresse möglich: jesko.reiling@zb.uzh.ch

Organisateurs: 
Zentralbibliothek Zürich, Produktionsmanagement Digitalisierung

Lieu de l'événement

Zentralbibliothek Zürich
Zähringerplatz 6
8001
Zürich

Contact

Jesko Reiling
Téléphone: 
044 268 31 74
Langues de l'évènement: 
Allemand

Informations supplémentaires sur l'événement

Coûts de participation

Prix de l'évènement: 
0.00 CHF

Inscription

Inscription via la personne de contact
Délai d'inscription: 
24.08.2021