Pour les articles ayant des titres homophones, voirBitte etBite.
Lebit est l'unité la plus simple dans un système denumération, ne pouvant prendre que deux valeurs, désignées le plus souvent par leschiffres0 et1. Un bit peut représenter aussi bien une alternativelogique, exprimée parfaux etvrai, qu'un « chiffrebinaire »,binary digit en anglais, dont le motbit, qui signifie « morceau », est aussi l'abréviation.
Dans lathéorie de l'information, un bit est la quantité minimale d'information transmise par un message, et constitue à ce titre l'unité de mesure de base de l'information eninformatique. La quantité d'information effectivement transmise s'exprime enshannons, et ne peut dépasser la taille du message en bits.
Les systèmesnumériques traitent exclusivement des informations réduites en bits, en général associés dans des groupes de taille fixe appelésbytes (/bait/).
Le mot « bit » est lacontraction des mots anglaisbinary digit, qui signifient « chiffre binaire », avec un jeu de mots surbit, « petit morceau ». On en doit la popularisation àClaude Shannon, qui en attribue l'invention àJohn Tukey[1].
Le bit ouélément binaire est l'élément constitutif du système de numération binaire[2]. Ce système, le plusanalytique de tous les systèmes de numération, puisqu'il décompose les nombres en éléments indivisibles, est à la base de presque tous les systèmesinformatiques[3].
Notations des valeurs
Contexte
Valeurs
Logique
faux
vrai
non
oui
Numérique
0
1
Un bit ne peut prendre que deux valeurs. Enlogique (algèbre de Boole), ces valeurs sontfaux etvrai, ou quelquefoisnon etoui. Enarithmétique, ce sont0 et1.
De nombreux moyens techniques permettent de coder une information binaire. Lapolarisation magnétique, lacharge électrique servent au stockage, lecourant ou latension électriques, l'intensité lumineuse sont couramment utilisés pour la transmission. L'essentiel est de distinguer avec une très bonne fiabilité les deux états de manière à limiter les erreurs. La correspondance entre chacun des deux états et une valeur du bit correspondant est affaire de convention. UnInterrupteur peut être soitouvert, soitfermé pour coder0 ou1 ; l'autre état code l'autre valeur. Il en va de même pour la tension ou le courant électriques, la polarisation magnétique, la lumière allumée ou éteinte.
Selon lathéorie mathématique de l'information de Shannon, lorsque l'on reçoit l'information correspondant à l'occurrence d'un évènement ayant 1 chance sur 2 de se produire, on reçoitun bit d'information.
Exemple - Pile ou face :
Lors du tir à pile ou face de l'engagement d'un match de football, quand l'arbitre indique que la pièce est tombée sur pile, il transmet un bit d'information aux 2 capitaines des équipes en compétition, parce qu'avant cette annonce, la probabilité d'obtenir l'un ou l'autre résultat était égale.
Le nom de l'unité élémentaire d'information est leshannon, symbole Sh[4].
Dans un encodage idéal de l'information, tout bit (élément binaire) porterait un shannon d'information. Ce n'est pas le cas, parce que les informations environnant un bit dans un flux peuvent affecter sa probabilité d'avoir l'une ou l'autre valeur. L'information contenue dans un flux den bits est au maximum den shannons. Elle est en général moindre, parce que toutes les combinaisons ne correspondent pas à des messages valides de probabilité égale.
Exemple - bit de parité :
Pour assurer une détection d'erreur, on transmet volontairement des informations excédentaires, qui se déduisent des données transmises. Un des systèmes les plus simples consiste à coder sur 8 bits un mot de 7 bits, le huitième, appelébit de parité, étant calculé de telle sorte que le nombre total de 1 dans l'ensemble soit toujours soit pair, soit impair, selon la convention en vigueur.
Un tel ensemble de 8 bits n'a que 27 valeurs possibles, et transporte 7 et non 8 shannons.
Outre ces redondances volontaires, introduites dans le but de corriger les erreurs de transmission, les encodages contiennent une part de répétition que l'on conserve parce qu'elles facilitent le traitement desdonnées numériques.
Exemple - Nombre en virgule flottante :
En informatique, on code souvent les grandeurs en nombres àvirgule flottante. La normeIEEE 754 fixe, pour le codage sur 32 bits, un encodage qui détermine 4 286 578 689 valeurs valides sur les 232, soit 4 294 967 296 possibles.
Un nombre envirgule flottante de 32 bits apporte ainsi 31,997 et non 32 shannons d'information.
En outre, les communications humaines contiennent une part involontaire de répétition, qui peut être partiellement réduite par l'analyse statistique. Lacompression de données vise à rapprocher le nombre de bits d'un message de la quantité d'information qu'il transmet, élevant ainsi le nombre de shannons par bit.
Lorsqu'on ne se préoccupe pas de l'efficacité de l'encodage, un bit et un shannon sont pratiquement équivalents.
Si on souhaite renoncer à cette correspondance éventuellement trompeuse entre l'unité de codage et celle d'information, on peut exprimer la quantité d'information ennats, basés sur lelogarithme naturel et non comme le bit sur le logarithme en base 2. Un nat est égal à un shannon multiplié par le logarithme naturel de 2, soit environ 0,7.
Il ne faut pas confondre un bit avec unbyte, mot anglais qui se prononce/bait/ et se traduit parmultiplet[5],suite de bits. En informatique, le byte est généralement une suite de 8 bits, ce qui dans ce cas fait unoctet. Quand le nombre d'éléments binaires qui le compose est différent, cela est normalement précisé. On peut ainsi trouver les formes « doublet », « triplet », et plus généralement, « n-uplet »[6].
Comme tous les symboles d'unités, il est invariable en nombre et ne prend pas la marque du pluriel. On écrira par exemple : 2 kbit = 2 × 103 bit.
b
L'IEEE donne dansIEEE 1541(en)b comme symbole d'unité pourbit. Cette convention est fréquemment utilisée en informatique, mais leSystème international d'unités, dont le bit ne fait pas partie, utilise déjàb pour une autre unité, lebarn, dans un domaine spécialisé différent[7]. D'autre part,bit est déjà l'abréviation debinary digit il y a peu de raison de l'abréger encore.
B
Les textes cités de la CIE et de l'IEEE donnentB comme abréviation pour lebyte. La CIE, comme l'Union internationale des télécommunications acceptento pour octet au lieu debyte. Le termeoctet est plus précis, ne dépend pas d'une base matérielle, et est plus courant dans les pays francophones.
Dans le Système international d'unités, le symbole d'une unité s'écrit en minuscules sauf si son nom provient de celui d'une personne ont un symbole abrégé en majuscule[8].
Hors Système international d'unités,B désigne lebel ; mais on n'utilise que son sous-multiple ledécibel (dB), qu'il est peu probable de confondre avec undécibyte, puisqu'on n'emploie que des multiples du byte en télécommunications et en informatique.