Movatterモバイル変換


[0]ホーム

URL:


Zum Inhalt springen
WikipediaDie freie Enzyklopädie
Suche

Byte-Reihenfolge

aus Wikipedia, der freien Enzyklopädie

DieByte-Reihenfolge (englischbyte order oderendianness) bezeichnet in derInformatik die Speicherorganisation für einfache Zahlenwerte, in erster Linie die Ablageganzzahliger Werte (Integer) imArbeitsspeicher.

Die erstenRechnerarchitekturen haben die Darstellung mehrstelliger Zahlen aus dem Alltag entsprechend derKonvention desStellenwertsystems übernommen, zunächst für dezimal, dann auch für binär dargestellte Zahlen. In dieser Konvention beginnt dieNotation einer Zahl mit derZiffer an der höchstwertigen Stelle. Addition, Subtraktion und Multiplikation beginnen aber mit der niedrigstwertigen Ziffer, derEinerstelle.

Solange man innerhalb ähnlicher Rechnerarchitekturen blieb, musste man sich nicht um die Endianness kümmern, sie entsprach ja der gewohnten. Da die genannten drei mathematischen Grundfunktionen jedoch einenMaschinenzyklus früher starten können, wenn man die Bitreihenfolge umkehrt, haben in der Folge einige Hersteller ein entsprechendes Architekturprinzip erstellt. Das heißt: die Einerstelle wird an die Anfangsadresse gelegt, und die 3 genanntenAlgorithmen schreiten nach rechts in die höheren Stellen und Adressen fort. Diese Abweichung vom Gewohnten machte die BegriffsbildungEndianness erforderlich:

  • Beimbig-endian (wörtlich etwa: „großendigen“, siehe auch Abschnitt„Etymologie“) Format wird das höchstwertigeByte zuerst gespeichert, d. h. an der kleinsten Speicheradresse. Allgemein bedeutet der Begriff, dass bei zusammengesetzten Daten die höchstwertige (höchstrangige) Komponente zuerst genannt wird, wie etwa bei der deutschen Schreibweise der Uhrzeit: Stunde:Minute:Sekunde.
  • Beimlittle-endian (wörtlich etwa: „kleinendigen“) Format wird dagegen das niedrigstwertige Byte an der Anfangsadresse gespeichert, also die niedrigstwertige Komponente zuerst genannt, wie bei der herkömmlichen deutschen Datumsschreibweise: Tag.Monat.Jahr.

Im Sprachgebrauch werden die beiden Varianten in der Computertechnik oft auch nach den Herstellern vonMikroprozessoren benannt, die die jeweilige Variante in mehrerenProzessorfamilien verwenden bzw. verwendet haben: „Motorola-Format“ steht für big-endian, „Intel-Format“ für little-endian.

Werden Datenbitweise seriell übertragen, so ist zusätzlich dieBit-Reihenfolge festzulegen. Auch hier sind unterschiedliche Varianten anzutreffen:

  • Most-Signifikant-Bit-First (MSb), wenn das höchstwertige Bit eines Bytes zuerst übertragen wird, verwendet etwaI²C.
  • Least-Signifikant-Bit-First (LSb), in der das niedrigstwertige Bit eines Bytes zuerst übertragen wird, ist zum Beispiel fürRS-232[1] und Ethernet-Frames festgelegt.

Vereinbarungen

[Bearbeiten |Quelltext bearbeiten]

Folgende Aussagen, über die in der Literatur hochgradigerKonsens besteht, seien als Ausgangsbasis für die Diskussion und Definition der Sachverhalte explizit gemacht:

  • Der Arbeitsspeicher kennt einekleinste adressierbare Einheit, auch „Speicherstelle“ genannt. In diesem Artikel sei sie exemplarisch dasByte. Es besteht aus 8 Bits und sein Inhalt wird in diesem Artikel vorwiegend mit zweihexadezimalen Ziffern angegeben, wobei jede Ziffer für 4 Bits entsprechend einem Halbbyte (Nibble) steht. Die kleinste adressierbare Einheit könnte aber auch aus einer anderen Anzahl von Bits bestehen, oder, wenn die Maschine imDezimalsystem rechnet, eine Dezimalziffer beherbergen.
  • Die (Byte-)Adressen des Arbeitsspeichers sind nicht-negative ganze Zahlen.
  • Ein (einfaches)Datenfeld wird im Arbeitsspeicher in einem zusammenhängendenSpeicherbereich (einer lückenlosen Folge von Adressen) abgelegt, der eineAnfangs-(Byte-)adresse und eine (Byte-)Länge hat.
  • DieMaschinenbefehle adressieren ein Datenfeld über seine Anfangsadresse.[2] Ganz analog spielt inAssemblersprachen und inhöheren Programmiersprachen die Anfangsadresse die Rolle einesZeigers zum Datenfeld.
  • Das Byte an der Anfangsadresse wird häufig als daslinke, das an der Endadresse als dasrechte Byte bezeichnet (sieheBit-Reihenfolge). An diese Orientierung halten sich horizontale graphische Darstellungen von Datenfeldern sehr häufig, aber nicht immer.
  • Ein Byte innerhalb eines einfachen Datenfelds hat zu dessen Anfangsadresse einen (nicht-negativen) Abstand, der alsOffset bezeichnet wird.
  • Betrachtet werden numerische Daten, die im Speicher entsprechend einem Stellenwertsystem dargestellt sind. Bei einem solchen System kommt einer Ziffer neben ihrem Wert als einzelnem Zeichen noch ein (von ihrer Position innerhalb der ganzen Zahl abhängiger) Stellenwert zu, auch „Wertigkeit“ oder „Signifikanz“ genannt.
  • Die in Handbüchern und unten vorkommenden hexadezimalen Notationen3A4B5C6Dh oder0x3A4B5C6D bezeichnen einen Zahlwert, und zwar die Zahl 978.017.389, und nicht ihre Darstellung im Speicher, es sei denn, man meint die Speicherung3Ah4Bh5Ch6Dh. Will man eine andere Art der Speicherung derselben Zahl0x3A4B5C6D angeben, so muss man auf andere Notationen ausweichen, wie auf6Dh5Ch4Bh3Ah oder0x6D,0x5C,0x4B,0x3A.
  • Generell multipliziert einLinks-Shift eine Binärzahl mit einer Zweierpotenz, verschiebt also die Bits in Richtung „Big-End“ (= Richtungmost significant bit), und ein Rechts-Shift dividiert durch eine solche, verschiebt die Bits in Richtung „Little-End“ (= Richtungleast significant bit). Die Shift-Operationen induzieren eine eindeutige konsistente »Adressierung« von den Bytes auf die Bits (s. dazu den AbschnittAdressierung von Bits).[3] (Die links-rechts-Orientierung bei Shift-Instruktionen ist etwas Anderes und völlig unabhängig von derjenigen bei der Adressierung mitlinks = niedrige undrechts = hohe Adresse.)

Steigt bei einer im Speicher abgelegten Zahl die Wertigkeit einer Stelle mit der wachsenden Adresse, dann ist sie im Little-Endian-Format dargestellt.

Fällt bei einer im Speicher abgelegten Zahl die Wertigkeit einer Stelle mit der wachsenden Adresse, dann ist sie im Big-Endian-Format dargestellt.

Wird bei einem Computersystem eines dieser beiden Formate für die Speicherungnumerischer[4] Felder durchgehalten, so wird das erste alsLittle-Endian-, das zweite alsBig-Endian-System bezeichnet.

Beispiel: Speicherung einer 32-Bit-Ganzzahl in 4 Bytes

[Bearbeiten |Quelltext bearbeiten]
Byte-
Adresse
Big
Endian
Mixed
Endian
Little
Endian
100000A0B0D
100010B0A0C
100020C0D0B
100030D0C0A

Das Beispiel in der Grafik stellt die Ganzzahl 168.496.141 als 32-Bit-Integer-Wert dar (hexadezimal:0A0B0C0Dh), gespeichert in 4 Bytes ab einer angenommenenSpeicheradresse von10000:

  • Big-endian speichert168496141 = 0A0B0C0Dh in der Reihenfolge0Ah0Bh0Ch0Dh.
  • Little-endian speichert168496141 = 0A0B0C0Dh in der umgekehrten Reihenfolge der Bytes0Dh0Ch0Bh0Ah.

Einige ältere Systeme (z. B.PDP-11) speichern die Bytes auch in der Reihenfolge0Bh0Ah0Dh0Ch (abernicht als0Ch0Dh0Ah0Bh). Dies wird alsmixed-endian oder auchmiddle-endian bezeichnet.

Einige Systeme speichern sowohl big-endian als auch little-endian, was alsbi-endian bezeichnet wird.

Reihenfolge der Ziffern innerhalb von Zahlen in der Sprache

[Bearbeiten |Quelltext bearbeiten]

Auch die gewöhnliche Darstellung von (Dezimal-)Zahlen ist – im Sinne derLeserichtung der meisten europäischen Sprachen von links nach rechts –big-endian. Dies kommt dadurch zustande, dass die Ziffernreihenfolge derindisch-arabischen Zahlen bei den Schriften Mitteleuropas beibehalten wurde. Im Arabischen, das sich von rechts nach links liest, werden die Zahlen gleich geschrieben, d. h. für Zahlen unter 100 werden sie als „little-endian“ gelesen (für Zahlen ab 100 werden sie „big-endian“ gelesen). Auch im Deutschen werden die Zahlen von 13 bis 99 little-endian ausgesprochen: „Ein-und-Zwanzig“; die Eins als weniger wertige Stelle wird zuerst gesprochen (diese Reihenfolge gibt es auch inanderen Sprachen).

Ein Beispiel für Dezimalzahlen: In der gebräuchlichsten Darstellung(big-endian) wird die Dezimalzahl Eintausend-zweihundert-dreißig dargestellt als „1230“, wobei die „1“ die Wertigkeit 1000 hat, die „2“ die Wertigkeit 100 und die „3“ die Wertigkeit 10. In der „Little-Endian“-Darstellung ist es umgekehrt, so dass die Darstellung der Zahl „0321“ wäre (ausgesprochen vielleicht „Dreißig-Zweihundert-Eintausend“).

Kontexte des Byte-Reihenfolge-Problems

[Bearbeiten |Quelltext bearbeiten]

Das Problem der Byte-Reihenfolge betrifft solcheDatentypen, die aus mehreren Byte zusammengesetzt sind und vom jeweiligenProzessor direkt unterstützt werden, also hauptsächlich Ganzzahl- undGleitkommatypen, sowie Datentypen, die vom Prozessor effektiv als solche interne Datentypen behandelt werden, z. B.UTF-16.

Um dieses Problem beiUnicode-Zeichen zu umgehen, wird oft eineBytereihenfolge-Markierung (BOM) benutzt.Die Zeichenfolge "Die" (drei Zeichen, 6 Byte) mit BOM (ein Zeichen, 2 Byte) als UTF-16-Kodierung, in der Byte-Darstellung vonHex-Editoren (8 Byte) stellt sich für die beiden unterschiedliche Byte-Reihenfolgen etwa so dar:

Big Endian:

FE FF 00 44 00 69 00 65 | þÿ␣D␣i␣e

Little Endian:

FF FE 44 00 69 00 65 00 | ÿþD␣i␣e␣

Plattformübergreifende Darstellung von Zahlen

[Bearbeiten |Quelltext bearbeiten]

Um einen fehlerfreien Datenaustausch zwischen Computern verschiedener Plattformen zu ermöglichen, ist beiNetzwerkprotokollen immer die Byte-Reihenfolge festgeschrieben. Diese wird als „Network Byte Order“ bezeichnet. Die natürliche Byte-Reihenfolge des Systems wird demgegenüber als „Host Byte Order“ bezeichnet. Arbeitet das System nicht mit dieser Byte-Reihenfolge, so muss diese im Netzwerktreiber beziehungsweise zum Teil im Anwendungsprogramm entsprechend umgewandelt werden.

Im Falle des heute vornehmlich verbreitetenInternetprotokoll-Satzes entspricht dieNetwork Byte Order demBig-Endian-Format. Es existieren jedoch noch immer Protokolle, die eine andere Byte-Reihenfolge verwenden. Darüber hinaus gibt es Datentypen, die nicht oder nicht nur durch die Endianness charakterisiert sind, wie z. B. Gleitkommazahlen, bei deren Umwandlung auch Genauigkeitsverluste möglich sind.

In der auf den meistenBetriebssystemen angebotenenBSD-IP-Socket-API existieren zur Umwandlung der Byte-Reihenfolge sechs Funktionen:

Datentyp (Wortbreite)Umwandlung
Host-to-networkNetwork-to-host
double (64 bit)htond()ntohd()
long (32 bit)htonl()ntohl()
short (16 bit)htons()ntohs()

Die korrekte Umwandlung ist garantiert fürvorzeichenlose Ganzzahlen. Negative Ganzzahlen werden korrekt umgewandelt, wenn sie imZweierkomplement dargestellt sind und dieBitbreite übereinstimmt.

Auf Big-Endian-Maschinen sind diese Funktionen trivial, da Host- und Network-Byteorder identisch sind.

Für Programmierer von Netzwerkanwendungen empfiehlt sich die Verwendung dieser Funktionen, da sich derQuellcode dadurch auch auf andere Systeme übertragen lässt.

Die Auswahl der zur laufenden Hardware passendenImplementierung geschieht normalerweise implizit durch das Betriebssystem – im Notfall auch durch den Benutzer beimDownload.

Der Endianness-Typ einer Maschine lässt sich programmtechnisch wie folgt feststellen:

union{uint16_tsixteenBits;uint8_ttwoBytes[2];}test_endianness;test_endianness.sixteenBits=1<<15;// 0x8000, 32768if(test_endianness.twoBytes[0]!=0){// Das Programm läuft auf einer Big-Endian-Maschine.}else{// Das Programm läuft auf einer Little-Endian-Maschine.}

In derBitConverter-Klasse des.NET Framework gibt es das FeldIsLittleEndian,[5] das den Endianness-Typ (der laufenden Hardware) abzufragen gestattet.[6]

Byte-Order-Probleme können auch beim Austausch von Dateien sowie zum Teil beim Austausch von Datenträgern zwischen verschiedenen Plattformen auftreten. Hier muss entweder durch eindeutige Definition des entsprechenden Dateiformats beziehungsweise Dateisystems oder durch einen Kompatibilitätsmodus, der während des Ladens eine Erkennung und eventuelle Umwandlung durchführt, Abhilfe geschaffen werden.

Die Problematik der Darstellung von Daten auf unterschiedlichen Systemen und ihres Austauschs wird ganz allgemein adressiert von derDarstellungsschicht des OSI-Modells.

„Nuxi“

[Bearbeiten |Quelltext bearbeiten]

Scherzhaft wird das Problem verschiedenerEndianness unterschiedlicher Architekturen auch oft als NUXI-Problem bezeichnet: Wenn das Wort UNIX in zwei Zwei-Byte-Words (zwei 16-Bit-Register für „UN“ und „IX“) gespeichert wird, liegt es in einem Big-Endian-System als „UNIX“ im Speicher, in einem Little-Endian-System dagegen wegen der Vertauschung der Bytes in jedem Wort als „NUXI“ (auf 32-Bit-Systemen stünde dagegen „XINU“ in einem einzelnen 32-Bit-Register).

Wichtige Eigenschaften

[Bearbeiten |Quelltext bearbeiten]

Bei den ersten Mikroprozessoren waren dies nur 4 Bit (später dann lange Zeit 8 Bit). Der Adressbus ist aber bei diesen CPUs wesentlich breiter. Damit ergab sich die Notwendigkeit, Daten mit einem Befehl zu laden oder zu speichern, welche auf mindestens zwei gekoppelte Register verteilt waren. Um die Komplexität der CPU zu verringern (jede einzelne Transistorfunktion war noch teuer) war es einfacher, bei jeder Operation automatisch das niederwertige „Datenhäppchen“ zu laden, während dieser Speicheroperation konnte dann der Befehl weiter dekodiert und gegebenenfalls die weiteren Daten im nächsten Zyklus bearbeitet werden. Bei Großrechnern („main frames“) bestand dieses Problem weniger, da sie damals schon mit Datenbus-Breiten von 16 bis 48 Bit arbeiteten, diese also in einem einzigen Speicherzyklus laden konnten und somit die (Byte)-Reihenfolge keine Rolle spielte.

Big-Endian-Format

[Bearbeiten |Quelltext bearbeiten]
  1. Da die Maschineninstruktionen die Operanden bei ihrer kleinsten Adresse ansprechen, muss bei Operationen, deren Algorithmus an der niedrigstwertigen Stelle beginnt, auf diese durch eine Erhöhung der Anfangsadresse um die Operandenlänge–1 positioniert werden. Somit istAddieren,Subtrahieren undMultiplizieren geringfügig aufwändiger.
  2. Dividieren undVergleichen beginnen dagegen beim höchstwertigen Byte, sind deshalb marginal einfacher.
  3. DieselbenVergleichsoperationen können zum Vergleichen von (vorzeichenlosen) Big-Endian-Zahlen wie von kurzen Texten (2, 4 oder 8 Byte lang) genommen werden, da beide lexikographisch sortiert werden.
  4. Zum Vergleichen vonZeichenketten gibt es beimGroßrechnersystem IBM/370 den MaschinenbefehlCLCL (CompareLogicalCharacterLong) mit zwei (verschieden und beliebig) langen Speicheroperanden, der dielexikographische Ordnung implementiert.[7]
  5. Im Big-Endian-Format sindHexdumps von Zahlen leichter lesbar, da die Reihenfolge der Ziffern die gleiche ist wie in der üblichen Schreibweise desStellenwertsystems.

Little-Endian-Format

[Bearbeiten |Quelltext bearbeiten]
  1. Da die Maschineninstruktionen die Operanden bei ihrer kleinsten Adresse ansprechen, entfällt bei Operationen, deren Algorithmus an der niedrigstwertigen Stelle beginnt, so beiAddition,Subtraktion undMultiplikation, das initiale Inkrementieren mit der Operandenlänge. Diese Operationen sind somit geringfügig einfacher in der Hardware zu implementieren.
  2. Um auf einer Little-Endian-Maschine eine Zwei-Byte-Zahl in eine Vier-Byte-Zahl zu verwandeln, müssen lediglich zwei mit Null gefüllte Bytes am Ende angefügt werden, ohne dass sich die Speicheradresse ändert. Auf einer Big-Endian-Maschine muss der Wert zuvor im Speicher um zwei Bytes verschoben werden. Auch die umgekehrte Umwandlung gestaltet sich einfacher. Auf einer Little-Endian-Maschine werden einfach die höherwertigen Byte verworfen, ohne dass sich die Speicheradresse ändert.
  3. Dagegen ist die Implementierung von Operationen wie derDivision, deren Algorithmus an der höchstwertigen Stelle beginnt, marginal aufwändiger.
  4. Maschinenbefehle für das lexikographische Vergleichen von langen Texten fehlen bei manchen Maschinen und müssen durch Unterprogramme, wiememcmp()[8], ersetzt werden.

Beispiel für eine dezimale Little-Endian-Addition:

   717 + 0452   ----   7523   ====

(Probe:717+2540=3257)

Beispiel: Interpretation eines Hexdumps

[Bearbeiten |Quelltext bearbeiten]

Der Zweck einesDumps ist die eindeutige Darstellung des Speicherinhalts bspw. zur Fehleranalyse. Bei Maschinen, deren Speicherstelle (Byte) aus 8 Bits besteht, wird hierfür die Darstellung imHexadezimalsystem gewählt, bei dem die28 = 256 = 162 verschiedenen Inhalte eines Bytes in 2 Hexadezimalziffern ausgedrückt werden. DieserCodierung, die sowohl Binärwerte wie Maschineninstruktionen wie Dezimalwerte imBCD-Code unmittelbar abdeckt, wird üblicherweise eine Spalte beigegeben, die jedes einzelne Byte sofern möglich als alphabetisches Zeichen darstellt, so dass eventuell im Speicher vorhandene Texte leichter erkannt und lesbar werden.

Das folgende Beispiel zeigt, wie zwei aufeinander folgende Bytes (4 Halbbytes) in einem Hexdump mit dem lesbaren hexadezimalen Inhalta732zu interpretieren sind.

Hexdump2 vorzeichenlose 8-Bit-Binärzahlen1 vorzeichenlose 16-Bit-Binärzahl
BytesTextByte0: BitshexdezByte1: BitshexdezBitshexdez
Offset010123 45670123 45670123 4567 89ab cdef
lesbara732§2
big-endian
interne Bitfolge1010 01110011 00101010 0111 0011 0010
Interpretation1010 01112a7h167100011 0010232h50101010 0111 0011 00102a732h4280210
little-endian
interne Bitfolge1110 01010100 11001110 0101 0100 1100
Interpretation1010 01112a7h167100011 0010232h50100011 0010 1010 0111232a7h1296710

Besteht das Feld nur aus einem einzelnen Byte (8-Bit-Binärzahl mit oderohne Vorzeichen) oder einer Ansammlung davon (bspw. Text im CodeISO 8859) – in der Tabelle die Spalten „2 vorzeichenlose 8-Bit Binärzahlen“ –, dann unterscheidet sich die Interpretation bei den beiden Formaten big- oder little-endian nicht.Zwar ist zwischen den beiden Formaten dieinterne Reihenfolge der Bits pro Byte genauso gespiegelt wie die der Bytes pro Integer (s.Bitwertigkeit#Adressierung von Bits). Durch die Maßgaben der Hexadezimaldarstellung ist der Hexdump aber Byte für Byte vollkommen festgelegt, so dass sich big- oder little-endian nicht unterscheiden.

Besteht das Feld aus mehr als einem Byte, kommt bei little-endian die sogenannte „Intel-Konvention“[9] zum Zuge. Diese besagt, dass – anders als bei big-endian – das niederwertige Byte auf der niederen Speicheradresse abgelegt wird und die höherwertigen Bytes auf den nachfolgenden Speicheradressen. Im Ergebnis sind bspw. bei ganzzahligen Feldern der Länge 16, 32 oder 64 Bits die beiden Hexdump-Darstellungen byteweise Spiegelungen voneinander. Zur Verdeutlichung ist in der Tabelle bei den Spalten „1 vorzeichenlose 16-Bit Binärzahl“ der Inhalt des ersten der 2 Bytes mit einem Überstrich versehen.

Verwendung und Hardware-Beispiele

[Bearbeiten |Quelltext bearbeiten]

Big-endian

[Bearbeiten |Quelltext bearbeiten]

Das Formatbig-endian wurde z. B. eingesetzt bei derMotorola-6800- sowie derMotorola-68000- bzw. -Coldfire-Familie, den Prozessoren derSystem-z- undSun-SPARC-CPUs und demPower (bis Power7) undPowerPC.

Big-endian wird verwendet vonMainframe-Systemen (z. B.IBM-Mainframe) sowieMIPS-,SPARC-,Power-,PowerPC-,Motorola 6800/68k-,Atmel-AVR32-[10] undTMS9900-Prozessoren. Auch Alpha-Prozessoren lassen sich in diesem Modus betreiben, dies ist jedoch unüblich. Mit dem IBM POWER8 wurde die Power-Architektur (PAPR) auf little-endian umgestellt, jedoch kann der POWER8 ebenfalls noch im Big-Endian-Modus betrieben werden.[11]

PowerPC kann bei einigen Modellen auch auflittle-endian umgeschaltet werden sowie POWER8 vomLittle- in denBig-Endian-Modus umgestellt werden – IBM forciert jedoch seit dem POWER8 den Little-Endian-Modus.

Little-endian

[Bearbeiten |Quelltext bearbeiten]

DasLittle-Endian-Format wurde ursprünglich beim Prozessor6502, derNEC-V800-Reihe,PICmicro oder den Intel-x86-Prozessoren verwendet.

Auch heutigePC-Systeme (x86-kompatible) verwendenlittle-endian. Weitere sindAlpha,Altera Nios,Atmel AVR,IBM Power abPOWER8,RISC-V, mancheSH3/SH4-Systeme oderVAX. Dies sindTrue-Little-Endian-Systeme. Auch dieArm-Architektur verwendet standardmäßig Little-Endian. Arm-CPUs werden in Mikrokontrollern (beispielsweiseRP2040), Single-Board-Computern (Raspberry Pi) und den allermeisten Mobiltelefonen eingesetzt. Die Smartphone-BetriebssystemeAndroid undIOS[12] verwenden die Arm-Architektur und verwalten den Speicher im Little-Endian-Modus.

Im Gegensatz dazu stehen Architekturen, wie manche PowerPC-Varianten (u. a. 603, 740, 750), die nur als Little-Endian-Systeme konfiguriert werden können (s. u. bi-endian) und aus der Sicht des laufenden Programms dann little-endian verwenden, Werte im Speicher jedoch weiterhin im big-endian-Format ablegen. Bei Lade- und Speicheroperationen wird die Darstellung implizit umgewandelt. Bei der Softwareerstellung für diese Systeme muss dies gegebenenfalls berücksichtigt werden, z. B. bei derTreiber-Programmierung.

Mischvarianten (bi-endian)

[Bearbeiten |Quelltext bearbeiten]

Einige Prozessoren, z. B. bestimmte MIPS-Varianten und POWER/PowerPC (PAPR) sowie alle Alpha-Prozessoren, lassen sich zwischenlittle-endian undbig-endian umschalten.

AuchArm-Prozessoren (inkl. des IntelXScales) können bei Datenzugriffen sowohl inlittle- als auch inbig-endian betrieben werden; auf Code wird bei ARM-Prozessoren allerdings immer im Little-Endian-Format zugegriffen.

Die vonHewlett-Packard undIntel gemeinsam entwickelteItanium-Architektur „IA-64“ beherrscht ebenfalls beide Byte-Reihenfolgen, was zur Erleichterung derPortierung vonBetriebssystemen hatte dienen sollen (insbesondere zwischen HP-UX(big-endian) undWindows(little-endian)).

Dateiformate

[Bearbeiten |Quelltext bearbeiten]

Die typische Verwendung einer Byte-Reihenfolge in einer Prozessorarchitektur zur Ablage von Werten imArbeitsspeicher hat Einfluss auf die Byte-Reihenfolge von Werten imSekundärspeicher (oft Festplatten). Bei der Neuerstellung vonDateiformaten wurde die Byte-Reihenfolge der Zahlenwerte so gelegt, dass sie beim Speichern und Zurückladen vom Sekundärspeicher ohne Wandlung auskommen. MittelsSpeichervirtualisierung können Daten auf dem Sekundärspeicher sogar direkt vom Programm angesprochen werden.

Bedeutsam ist dies fürContainerformate mit einer allgemeinen Strukturdefinition. So wurde dasInterchange File Format (IFF) fürAmiga-Programme entworfen, und entsprechend diesemMotorola-68000-Prozessor wurden die Vier-Byte-Chunk-Längen im Motorola-Format big-endian abgelegt. Auf dem ebenfalls mit Motorola-Prozessoren arbeitendenMacintosh-Rechnern wurde dieses u. a. für das Audioformat AIFF übernommen.

Bei der Übernahme auf die Windows-Plattform mit Intel-Prozessoren wurden die Chunk-Längen umdefiniert auf das Vier-Byte Intel-Format little-endian und das neue allgemeine Containerformat alsResource Interchange File Format (RIFF) bezeichnet. Dieses RIFF-Dateiformat ist die Grundlage verbreiteter Dateiformate wie RIFF WAVE (*.wav-Dateien) für Audio undAudio Video Interleave (*.avi-Dateien) für Video.

Auch bei Dateiformaten ist es möglich, eine Definition zu entwickeln, die beide Byte-Reihenfolgen der Prozessorarchitekturen zulässt. So steht z. B. bei TIFF-Dateien (Tagged Image File Format) in den ersten zwei Bytes der Datei:

  • II für Intel-Format (little-endian) oder
  • MM für Motorola-Format (big-endian).

Nachfolgende Längen- und Offset-Werte in der Datei werden dann entsprechend kodiert.

Etymologie

[Bearbeiten |Quelltext bearbeiten]

Die Bezeichnungen gehen auf densatirischen RomanGullivers Reisen vonJonathan Swift zurück, in dem die Bewohner des LandesLiliput in zwei verfeindeten Gruppen leben: Die einen schlagen ihre Frühstücks-Eier am dicken, „großen“, englisch „big“, Ende auf und werden deshalb alsBig Ender bezeichnet, während dieLittle Ender die Eier am spitzen, „kleinen“, englisch „little“ Ende öffnen. Swift spielte damit auf die Abspaltung der englischen Kirche (Spitz-Ender) von der katholischen Kirche (Dick-Ender) an – in Zusammenhang mit der Byte-Reihenfolge wurde dies erstmals 1980 vonDanny Cohen in demAprilscherz-PaperOn Holy Wars and a Plea for Peace gebracht.[13]

Weblinks

[Bearbeiten |Quelltext bearbeiten]

Einzelnachweise und Anmerkungen

[Bearbeiten |Quelltext bearbeiten]
  1. MIL-STD-188-100, S. B-8, Abb. 3, 1972. oderDatei:MIL-STD-188-100 char struct for async comms 1972-11-15.svg
  2. Dies gilt vor allem für Maschinen, bei denen die Länge der Operandenim Maschinenbefehl codiert ist.
    Nicht in dieses Schema passen Maschinen wie dieIBM 1401, bei der sogenannte „Wortmarken“im Speicher die Ausdehnung der Speicheroperanden bestimmen. Solche Maschinen können – je nach Maschinenbefehl – ein aus (mehreren zusammenhängenden Speicherstellen bestehendes) Feld an seiner niedrigen oder seiner hohen Adresse ansprechen und zum anderen Ende hin abarbeiten; so adressiert beispielsweise der Addieren-Befehl der IBM 1401 die Operanden an der Einerstelle (bei dieser Maschine an der hohen Adresse) und arbeitet sich zur Wortmarke vor. Beim Dividieren-Befehl wird der Dividend an der höchstwertigen Stelle (der niedrigen Adresse) und der Divisor an der Einerstelle angesprochen.IBM 1410 Principles of Operation. (PDF; 22 MB) informatik.uni-stuttgart.de, S. 9; abgerufen am 3. November 2014.
  3. Dieser Zusammenhang zwischen Byte- und Bit-Reihenfolge wurde schon vonCohen (p. 3) hergestellt.
  4. DerVergleich vonZeichenketten durch Maschineninstruktionen oder die C-Funktionenmemcmp() undstrcmp() startet aufjeder Maschine amAnfangsbuchstaben der Zeichenkette und wertet damit die Stellen niedriger Adresse als höherrangig, agiert also im Big-Endian-Stil. Man nennt diese Übertragung der Ordnung von den einzelnen Bytes auf mehrstellige Felder, wenn sie bei der ersten Stelle beginnt, dielexikographische Ordnung. (strncmp. In:cppreference.com. Abgerufen am 26. März 2015 (englisch). )
    Die Erwähnung von Zeichenketten („Strings“) in der Literatur, z. B.Big and Little Endian C-style strings undByte Ordering, im Kontext der Endianness beschränkt sich häufig auf die Übertragungsweise.
  5. msdn.microsoft.com
  6. Obwohl bspw. derC- oder C++-Compiler selbstverständlich „wissen muss“, für welchen Endianness-Typ er kompiliert, gibt eskeine standardisierte#define-Konstante, die den Endianness-Typ abzufragen gestattet.ISO/IEC 14882:2014, auch bekannt alsC++14. iso.org; abgerufen am 21. Mai 2016.
  7. Damit der potentiell sehr viele Maschinenzyklen umfassende Befehl denHauptprozessor nicht monopolisiert, ist er unterbrechbar konzipiert und kann nach einemHardwareinterrupt an der Stelle fortgesetzt werden, an der er unterbrochen worden ist. (SieheESA/390 principles of operation, chapter 7-44 General InstructionsSA22-7201-08 ESA/390 Principles of Operation. In:boulder.ibm.com. Ehemals imOriginal (nicht mehr online verfügbar); abgerufen am 25. Juni 2014 (englisch).@1@2Vorlage:Toter Link/publibfp.boulder.ibm.com(Seite nicht mehr abrufbar.Suche in Webarchiven) )
  8. memcmp. In:cppreference.com. Abgerufen am 6. März 2014 (englisch). 
  9. Gerd Küveler, Dietrich Schwoch:Informatik für Ingenieure und Naturwissenschaftler: PC- und Mikrocomputertechnik, Rechnernetze. 5. Auflage.Band 2. Vieweg, reprint: Springer-Verlag, 2007,ISBN 978-3-8348-9191-4 (google.de). 
  10. AVR32 Architecture Document. (PDF; 5,1 MB) Atmel, November 2007
  11. Jeff Scheel:Little endian and Linux on IBM Power Systems. Answers to yourfrequently asked questions. In:IBM Developer. 16. Juni 2016, abgerufen am 14. Juli 2019 (englisch). 
  12. Is iOS guaranteed to be little-endian? Abgerufen am 30. März 2024 (englisch). 
  13. On Holy Wars and a Plea for Peace
Abgerufen von „https://de.wikipedia.org/w/index.php?title=Byte-Reihenfolge&oldid=254995150
Kategorie:
Versteckte Kategorie:

[8]ページ先頭

©2009-2025 Movatter.jp