Movatterモバイル変換

Unicode

aus Wikipedia, der freien Enzyklopädie

DerUnicode-Standard (Aussprachen:amerikanisches Englisch [ˈjuːnikoʊd],britisches Englisch [ˈjuːnikəʊd];dt. [ˈjuːnikoːt]) legt fest, wieSchrift elektronisch gespeichert wird, z. B. auf einem Computer oder Telefon. Der durch den Standard festgelegteZeichensatz enthält 154.998 Zeichen in der Version Unicode 16.0.^[1] DasUnicode-Konsortium hat dazu 168 moderne und alte Schriften berücksichtigt, wie auch Symbole,Emojis und nicht druckbare Steuerzeichen. DieISO bezeichnet den Standard als ISO 10646 und den Zeichensatz alsUniversal Coded Character Set (UCS).

Unicode muss für die Verarbeitung im Computer in Nullen und Einsen (Binärcode) übersetzt werden. Eine solche Umwandlung wird alsUnicode Transformation Format (UTF) bezeichnet. Durchgesetzt hat sich dabeiUTF-8. In einigen Fällen ist auch nochUTF-16 anzutreffen, speziell bei Betriebssystemen und Programmiersprachen, für die eine Verwendung von UTF-8 nicht so einfach ist.

Ver- sion	Veröffentlichung	Anzahl der		Erweiterungen
Ver- sion	Veröffentlichung	Schriftsysteme	Zeichen	Erweiterungen
1.0.0^[8]	Okt. 1991	024	7.161	Erste Version:Arabisch,Armenisch,Bengalisch,Bopomofo,Kyrillisch,Devanagari,Georgisch,Griechisch undKoptisch,Gujarati,Gurmukhi,Hangul,Hebräisch,Hiragana,Kannada,Katakana,Laotisch,Lateinisch,Malayalam,Oriya,Tamilisch,Telugu,Thailändisch undTibetisch;Währungszeichen
1.0.1^[9]	Juni 1992	025	28.359	Vereinheitlichte chinesisch-japanisch-koreanische Schriftzeichen (CJK-Schriftzeichen; siehe auchUnicodeblock Vereinheitlichte CJK-Ideogramme)
1.1^[10]	Juni 1993	024	34.233	Zusätzlichekoreanische Silbenzeichen, Entfernung dertibetischen Schrift aus dem Standard,^[11]Dingbats,langes s
2.0^[12]	Juli 1996	025	38.950	Neuer Unicodeblock für Hangeul-Silbenzeichen, Wiedereinführung der tibetischen Schrift^[11]
2.1^[13]	Mai 1998	025	38.952	Eurozeichen sowie ein Objektersetzungszeichen
3.0^[14]	Sep. 1999	038	49.259	Syrisches Alphabet,Thaana-Alphabet,singhalesische Schrift,birmanische Schrift,äthiopische Schrift,Cherokee-Alphabet,Cree-Schrift,Ogham,Runen,Khmer-Schrift,mongolische Schrift,Brailleschrift,Yi, zusätzliche CJK-Schriftzeichen
3.1^[15]	März 2001	041	94.205	Altitalisches Alphabet,gotisches Alphabet,Deseret-Alphabet,Notenschrift, weitere CJK-Schriftzeichen
3.2^[16]	März 2002	045	95.221	Baybayin,Hanunó'o,Buid-Schrift,Tagbanuwa-Schrift
4.0^[17]	April 2003	052	96.447	Limbu-Schrift,Tai Nüa,Linearschrift B,ugaritische Schrift,Shaw-Alphabet,Osmaniya-Schrift,kyprische Schrift
4.1^[18]	März 2005	059	97.720	Koptische Schrift (als eigenständig vom griechischen Alphabet),Tai Lü,Lontara,glagolitische Schrift,Nuschuri,Tifinagh-Schrift,Sylheti Nagari,Persische Keilschrift,Kharoshthi-Schrift
5.0^[19]	Juli 2006	064	99.089	N’Ko,balinesische Schrift,Phagpa-Schrift,phönizische Schrift,Keilschrift
5.1^[20]	April 2008	075	100.713	Sundanesische Schrift,Lepcha-Schrift,Ol Chiki,Vai-Schrift,Saurashtri-Schrift,Kayah Li,Rejang-Schrift,Cham-Schrift,lykische Schrift,karische Schrift,lydische Schrift,großes ß
5.2^[21]	Okt. 2009	090	107.361	Samaritanische Schrift,Lanna-Schrift,Fraser-Alphabet,Bamun-Schrift,javanische Schrift,Tai-Viet-Schrift,Meitei-Mayek,aramäische Schrift,altsüdarabische Schrift,avestische Schrift,parthische Schrift,Pahlavi-Schrift,Orchon-Runen,Kaithi-Schrift,ägyptische Hieroglyphen, zusätzliche CJK-Schriftzeichen
6.0^[22]	Okt. 2010	093	109.242	Batak-Schrift,Brahmi-Schrift,mandäische Schrift,Emoji
6.1^[23]	Jan. 2012	100	110.181	Meroitische Schrift,Sora-Sompeng,Chakma-Schrift,Sharada-Schrift,Takri-Schrift,Pollard-Schrift
6.2^[24]	Sep. 2012	100	110.182	Währungszeichen dertürkischen Lira
6.3^[25]	Sep. 2013	100	110.187	5 weiterebidirektionale Steuerzeichen mit Änderungen desUnicode-Bidi-Algorithmus,Variantenselektoren fürCJK-Kompatibilitätsideogramme, verbesserterhebräischer Wortumbruch undCJK-Zeilenumbruch
7.0^[26]	Juni 2014	123	113.021	Währungssymbole fürManat undRubel, Lautschriftzeichen fürTeuthonista und andere in der deutschenDialektologie verwendete Schriftzeichen, piktografische Symbole,Altnordarabische Schrift,Altpermische Schrift,Bassa-Schrift,Duployé-Kurzschrift,Elbasan-Schrift,Grantha-Schrift,Kaukasisch-Albanische Schrift,Khojki-Schrift,Khudabadi-Schrift,Linearschrift A,Mahajani-Schrift,Manichäische Schrift,Mende-Schrift,Modi-Schrift,Mro-Schrift,Nabatäische Schrift,Pahawh Hmong,Palmyrenische Schrift,Pau Cin Hau,Psalter-Pahlavi,Siddham,Tirhuta,Warang Citi
8.0^[27]	Juni 2015	129	120.737	Kleinbuchstaben desCherokee-Alphabets, 5771 weitere CJK-Zeichen, 41 weitere Emoji, Währungssymbol für dengeorgischen Lari, Ziffernformen für dasDuodezimalsystem, Schriftzeichen fürIcetot,Ahom-Schrift,Anatolische Hieroglyphen,Hatran-Schrift,Altungarische Schrift,Multani-Schrift,SignWriting
9.0^[28]	Juni 2016	135	128.172	Schriften fürOsage,Newari,Fulfulde,Swahili-Dialekt vonBaraawe, Warsh-Variante des Arabischen,Tangut (Xixia-Schrift), sowie 72 neue Emoji und 19 Symbole fürUltra High Definition Television
10.0^[29]	Juni 2017	139	136.690	Schriften fürGondi,Nüshu,Hentaigana, sowie 56 neue Emoji und dasBitcoin-Symbol
11.0^[30]	Juni 2018	146	137.374	Schriften fürDogri,Makassar-Sprache,Medefaidrin,Sogdische Sprache,Hanifi Rohingya,Gondi,Mtavruli, sowie 66 neue Emoji
12.0^[31]	März 2019	150	137.928	Schriften fürElymäisch,Nagari,Hmong und Miao, sowie 61 neue Emoji.
12.1^[32]	Mai 2019	150	137.929	Ein neues Zeichen für dieReiwa-Zeit wurde hinzugefügt.
13.0^[33]	März 2020	154	143.859	Schriften fürChoresmische Sprache, Dives Akuru, Khitan Small Script,Jesidisch, Creative-Commons-Lizenz-Symbole, sowie 55 neue Emoji.
14.0^[34]	Sep. 2021	159	144.697	Schriften für Cypro-Minoan, Old Uyghur, Vithkuqi, Tangsa,Toto, sowie 37 neue Emoji.
15.0^[35]	Sep. 2022	161	149.186	Schriften fürKawi, Nag Mundari, weitere Codeblöcke außerhalb der BMP.
15.1^[36]	Sep. 2023	161	149.813	627 weitere CJK-Schriftzeichen.
16.0^[37]	Sep. 2024	168	154.998	7 neue Schriften, 3995ägyptische Hieroglyphen, über 700 Zeichen aus Zeichensätzen historischer Computer.

Movatterモバイル変換

Geschichte

Versionen

Inhalt des Standards

Gliederung

Plane 0: Basic Multilingual Plane

Plane 1: Supplementary Multilingual Plane

Plane 2: Supplementary Ideographic Plane

Plane 3: Tertiary Ideographic Plane

Plane 14: Supplementary Special-purpose Plane

Plane 15 und 16: Supplementary Private Use Area

Codepunkte und Zeichen

PUA (Private Use Area privat nutzbarer Bereich)

Kodierung

Normalisierung

Sortierung

Normierungsinstitutionen

Kodierungskriterien

Standardisierte Teilmenge von Unicode für Europa

Verwendung auf Computersystemen

Codepunkt-Eingabemethoden

Direkte Eingabe auf Betriebssystemebene

Microsoft Windows

Apple macOS

Direkte Eingabe in spezieller Software

Microsoft Office und LibreOffice

Qt und GTK

Vim

Auswahl über Zeichentabellen

Codepunkt-Angaben in Dokumenten

Kritik

Schriftarten

Ersatzschriftarten

Siehe auch

Literatur

Weblinks

Unicode-Standard

Werkzeuge / Software

Einzelnachweise