Unicode

Unicode® ist ein weltweiter, plattformunabhängiger Zeichencodierungsstandard für Computer Software und Font Files, in dem langfristig für jedes Sinn tragende Schriftzeichen oder Textelement aller bekannten Schriftkulturen und Zeichensysteme, beispielsweise für Logogramme (z.B. Pictogramme, Ideogramme), Phonogramme (z.B. Syllabogramme, Alphabete) oder Sonderzeichen (z.B. Interpunktionszeichen), ein digitaler Code festgelegt wird, um die Verwendung unterschiedlicher und inkompatibler Kodierungen in verschiedenen Sprach- und Kulturkreisen zu beseitigen. Der Unicode® wird fortlaufend ergänzt.

Der Zeichenvorrat (Figurenverzeichnis) eines OpenType Fonts, also alle Glyphen eines Font Files, kann technisch betrachtet +/-65.000 Zeichen, z.B. Logogramme, Phonogramme oder Interpunktionszeichen, im Unicode®-Zeichencodierungsstandard umfassen. Frühere Font-Formate, beispielsweise PostSript® Type 1 Outline Fonts für Apple OS Classic® bzw. unter Windows® PFB, verfügen dagegen nur über eine 8-Bit-Belegung mit max. 256 Glyphen. Beispiel: Codierungsprinzip eines OpenType Font File nach Unicode.
Der Zeichenvorrat (Figurenverzeichnis) eines OpenType Fonts, also alle Glyphen eines Font Files, kann technisch betrachtet +/-65.000 Zeichen, z.B. Logogramme, Phonogramme oder Interpunktionszeichen, im Unicode®-Zeichencodierungsstandard umfassen. Frühere Font-Formate, beispielsweise PostSript® Type 1 Outline Fonts für Apple OS Classic® bzw. unter Windows® PFB, verfügen dagegen nur über eine 8-Bit-Belegung mit max. 256 Glyphen. Beispiel: Codierungsprinzip eines OpenType Font File nach Unicode.

Im Unicode® erhält jedes Zeichen einen speziellen Code. Beispielsweise wird die deutsche Minuskelligatur »ß« (kleines Eszett) ab Version 1.1.0 (Juni 1993) unter »Latin Small Letter Sharp S« (U+00DF) geführt, die Majuskelligatur »ẞ« (großes ESZETT) ab Version 5.1 (April 2008) unter »Latin Capital Letter Sharp S« (U+1E9E). 

Der gesamte Zeichenumfang von Unicode® ist in 17 Ebenen (Planes) gegliedert, welche jeweils 216 = 65.536 Zeichen umfassen. Sechs dieser Ebenen werden bereits verwendet, die restlichen sind für die fortlaufende Nutzung vorgesehen. Diese Verfahrensweise und Dokumentation ermöglicht eine einheitliche und klare Codierung und Decodierung von Zeichen jeglicher Art bei Computer Software und Font Files.

Initiiert wurde das Unicode-Projekt um 1984 u.a. von Dr. Joseph D. Becker (USA, Palo Alto Research Center, Xerox® PARC). Seit 1991 wird das weltweite Projekt von Mitgliedern des »Unicode Consortiums« in Mountain View in den USA 1 ) betreut. Die Mitgliedschaft rekrutiert sich aus Einzelmitgliedern, Firmen und Institutionen, die überwiegend aus der IT-Branche stammen, beispielsweise Adobe®, Apple®, Google®, IBM®, Microsoft® oder SAP®. 2 ) 3 )

Der Unicode® wurde von der Internationalen Organisation für Normung 4 ) in der ISO 10646 als »Universal Character Set« (UCS) definiert.

© Wolfgang Beinert, www.typolexikon.de

Share / Beitrag teilen:

Quellen / Literatur / Anmerkungen / Informationen / Tipps:   [ + ]

1.Weiterführende Informationen:  Website des Unicode Consortiums, online verfügbar unter http://www.unicode.org (27.10.2017).
2.Literaturempfehlung: Bergerhausen, Johannes und Siri Poarangan: Decodeunicode, Die Schriftzeichen der Welt, Verlag Hermann Schmidt Mainz, ISBN 978-3-87439-813-8. 22.
3.Weiterführende Informationen: selfhtml, Zeichenkodierung, online verfügbar unter https://wiki.selfhtml.org/wiki/Zeichenkodierung (27.10.2017).
4.Anmerkung: Die ISO International Organization for Standardization ist eine Internationale Standardisierungsorganisation mit Sitz in Vernier (Genf). Online verfügbar unter https://www.iso.org (27.10.2017).