Binäärisen ja desimaalisen tavun ero kasvaa yksiköiden kasvaessa
Tavu (engl.byte) ontietotekniikassa käytettävä mittayksikkö sellaiselle tallennuskapasiteetille, joka on riippumaton tallennetundatan tyypistä. Tavua kerrannaisineen käytetään ilmoittamaantietokoneenkeskusmuistin taimassamuistin tallennuskapasiteetin määrä. Tavu on pienin tietokoneen muistiosoitteella suoraan osoitettava yksikkö.[1] Se on myös yleinen tietotyyppiohjelmointikielissä.
Tavun koko onde facto kahdeksanbittiä.IEC standardissa IEC 80000-13:2008 käytäntö on myös kirjattu.[2]
Aiemmissa tietokonejärjestelmien arkkitehtuureissa käytettiin myös kuuden, seitsemän, yhdeksän, kymmenen ja kahdentoista bitin tavuja.[3]IBM S/360 vaikutti tavun standardoimiseen kahdeksaksi bitiksi.[4]Epäselvyyksien ehkäisemiseksi kahdeksan bitin tavusta käytetään muun muassa tietoliikenteessä nimeäoktetti (lyh.o).[5] Termipuolitavu (engl.nibble) tarkoittaa nimensä mukaisesti puolikasta tavua eli käytännössä neljän bitin jonoa.
Kahdeksan bitin tavuun voidaan tallentaa kokonaisluku väliltä 0–255 (28 arvoa). Tavun sisällön merkitys voidaan tulkita usealla tavalla, esimerkiksi yhtenä kirjaimena tietyssämerkistössä. Tavun sisältö ilmoitetaan useinheksadesimaalijärjestelmässä.
Tavu lyhennetään tyypillisestit[6] (vain suomenkielinen lyhenne), mutta toinen yleinen ja täysin pätevä tapa, myös suomenkielisessä tekstissä, on kansainvälinen tavun yksikköB[6] (varsin usein käytetään virheellisesti lyhennettäb, joka on bitin lyhenne).
Englanniksi tavua kutsutaan nimelläbyte, joka on muunnos sanastaengl.bite (suom.”haukkaisu”). Puolitavu sen sijaan on englanniksinibble (suom.”näykkäisy”).Suomessa termiksi on muodostunuttavu lähinnä siksi, että kahdesta tai useammastatavusta muodostuu – tietokoneen tyypistä riippuen –sana (engl.word).
Tavun monikertoina ei tulisi käyttääSI-järjestelmän mukaisia kymmenkantaisia kerrannaisyksiköitä kuten kilo-, mega- ja giga-, vaanbinäärijärjestelmän mukaisiakahden potensseja kibi-, mebi-, gibi- ja niin edelleen, koska ne ovat yksiselitteisiä.
Binäärikantaisten yksiköiden lyhenteet ovat Ki, Mi, Gi ja niin edelleen.Kibitavu (KiB) on 210 = 1 024 tavua,mebitavu (MiB) 220 = 1 048 576 tavua jagibitavu (GiB) 230 = 1 073 741 824 tavua. Binäärikerrannaisyksiköt sisältyvätIEC:n vuonna 1998 hyväksymään standardiin.[7]
Eri kerrannaisyksiköitä käytetään laajasti sekaisin: yleensä tietokoneiden keskusmuistin kapasiteetti ilmoitetaan kahden potensseina sekä kiintolevyjen kapasiteetti ja tiedonsiirron nopeudet kymmenen potensseina, mutta tästäkin säännöstä on paljon poikkeuksia. Lisäksi kilotavusta käytetään tavallisesti lyhennettäk.Uusien binääripohjaisten monikertojen lyhenteiden käyttö ei ole levinnyt laajalle.
JEDEC-standardissa on lisäys käytössä olevan käytännön dokumentoimiseksi.[8]
Lisäksi eräissä tapauksissa jälkiliiteB on jätetty pois ja käytetään vain lyhenteitäK,M jaG.
»In English, the name byte, symbol B, is used as a synonym for octet. Here byte means an eight-bit byte. However, byte has been used for numbers of bits other than eight. To avoid the risk of confusion, it is strongly recommended that the name byte and the symbol B be used only for eight-bit bytes.»
»The definitions of kilo, giga, and mega based on powers of two are included only to reflect common usage. IEEE/ASTM SI 10-1997 states "This practice frequently leads to confusion and is deprecated." Further confusion results from the popular use of the megabyte representing 1 024 000 bytes to define the capacity of the 1.44-MB high-density diskette. An alternative system is found in Amendment 2 to IEC 60027-2:Letter symbols to be used in electrical technology – Part 2.»