OCR-Schriften

Terminus aus der Informatik (Computer Science) für alphanumerische Antiqua Schriften mit einer stark stilisierten Typometrie für die automatisierte optische Zeichenerkennung durch Codiergeräte oder Computer; maschinenlesbare Schriften. OCR steht für eng. »Optical Character Recognition«, eine Methode für die automatisierte »Optische Zeichenerkennung« innerhalb von Bildmotiven.

Die erste OCR-Schrift, die OCR-A, wurde 1968 im Auftrag der US-amerikanischen Regierung entwickelt. Sie ist eine Normschrift, die in der ANSI INCITS 17-1981, 1) DIN 66008 2) und ISO 1073-1 3) spezifiziert ist.

Da die Elektronische Datenverarbeitung (EDV) gescannte Texte als Grafiken wahrnimmt, basieren OCR-Schriften auf dem Prinzip der Mustererkennung. D.h., einzelne Buchstaben, Ziffern und Satzzeichen werden zuerst aus einem Gesamtmotiv, z.B. einem Reisepass oder einer ID-Card, extrahiert, um die Textinformation anschließend in einer textbasierten Software weiterverarbeiten zu können. Dazu vergleicht eine Software die einzelnen Zeichenmuster einer OCR-Schrift mit einer im System hinterlegten Mustermaske und erzeugt dann den jeweiligen Buchstaben bzw. das Satzzeichen.

Die ersten Anwendungen der OCR-A Schrift waren beispielsweise für die automatische Verarbeitung von gescannten Pässen, ID-Cards, KFZ-Zeichen oder Scheckformularen gedacht. 

OCR-Schriften wurden in den 1960er und 1970er Jahren als maschinenlesbare Schriften konzipiert. Die OCR-A wurde 1968 im Auftrag der US-amerikanischen Regierung, die OCR-B 1973 im Auftrag der European Computer Manufacturers Association (ECMA) entwickelt. Infografik: www.typolexikon.de
OCR-Schriften wurden in den 1960er und 1970er Jahren als maschinenlesbare Schriften konzipiert. Die OCR-A wurde 1968 im Auftrag der US-amerikanischen Regierung, die OCR-B 1973 im Auftrag der European Computer Manufacturers Association (ECMA) entwickelt.

1973 entwickelte die European Computer Manufacturers Association (ECMA), eine privatwirtschaftliche internationale Normungsorganisation zur Normung von Informations- und Kommunikationssystemen und Unterhaltungselektronik mit Sitz in Genf, 4) die OCR-B, die der Schweizer Schriftgestalter Adrian Frutiger (1928–2015) gestaltete. Diese OCR-Variante verfügte im Gegensatz zur OCR-A über eine natürlichere Typometrie und war nicht mehr so künstlich stilisiert. Die OCR-B ist ebenfalls eine Normschrift, die in der DIN 66009 und in der ISO 1073-2 spezifiziert ist.

Sowohl die OCR-A wie auch die OCR-B sind dicktengleiche Schriften und verfügen über ein Majuskeln und Minuskeln sowie Arabische Ziffern.

Die OCR-B von Adrian Frutiger (1928–2015) in der maschinenlesbaren Zone (MRZ) des deutschen Personalausweises. Quelle: BMI – Bundesministerium des Innern. Weiterführende Infos online beim Bundesamt für Sicherheit in der Informationstechnik unter www.bsi.bund.de (27.12.2019).
Die OCR-B von Adrian Frutiger (1928–2015) in der maschinenlesbaren Zone (MRZ) des deutschen Personalausweises. Quelle: BMI – Bundesministerium des Innern. Weiterführende Infos online beim Bundesamt für Sicherheit in der Informationstechnik unter www.bsi.bund.de (27.12.2019).

Bei Banken und Behörden kam kurzeitig auch eine OCR-H, eine Referenzschrift für handgeschriebene Blockschriften im Rahmen vorgegebener Felder von Formularen zur Anwendung. Die OCR-H war ebenfalls eine genormte Schrift, die in der DIN 66225 spezifiziert wurde. Sie verfügte nur über Majuskeln und Arabische Ziffern.

OCR-Schriften haben in der datenverarbeitenden Bürokommunikation ihre ursprüngliche Anwendung aufgrund moderner Technologien weitgehend verloren, da heute nahezu alle Schriften, auch Handschriften, mittels OCR-Software dekodiert werden können. 

Bei amtlichen Reisepässen, Personalausweisen, Führerscheinen oder beispielsweise bei Bankkreditkarten werden OCR-Schriften in speziellen »maschinenlesbaren Zonen« (MRZ) weltweit zum einheitlichen optischen Auslesen bis heute verwendet.

OCR-Schriften gibt es in unterschiedlichen Schrifttechnologien, beispielsweise als OpenType-Standard, sowohl kostenpflichtig als auch kostenfrei bei unterschiedlichen Font Foundries

Heute versteht man unter »OCR« Optical Character Recognition primär eine Software für die schriftunabhängige Texterkennung. 

© Wolfgang Beinert, www.typolexikon.de

Quellen / Literatur / Anmerkungen / Informationen / Tipps:   [ + ]

1.Anmerkung: InterNational Committee for Information Technology Standards (INCITS). Weiterführende Informationen online verfügbar unter www.incits.org (27.12.2019).
2.Anmerkung: Deutsche Institut für Normung e.V. (DIN). Weiterführende Informationen online verfügbar unter www.din.de (27.12.2019).
3.Anmerkung: International Organization for Standardization (ISO). Weiterführende Information online verfügbar unter unter www.iso.org (27.12.2019).
4.Anmerkung: Weiterführende Informationen zur ECMA online verfügbar unter www.ecma-international.org (27.12.2019).