Git on suunniteltuPOSIX-yhteensopiville käyttöjärjestelmille (mukaan lukienLinux jamacOS). Se toimii myösMicrosoft Windowsilla; virallinen asennuspaketti perustuuMinGW MSYSiin ja sisältää myös tyypillisiä POSIX-ympäristöjen apuohjelmia, kutenBash-komentotulkin jaOpenSSH-asiakasohjelman. Git voidaan asentaa Windowsiin myösCygwin-järjestelmän osana. Unix-suunnittelufilosofian mukaisesti Git ei ole yksittäinen sovellusohjelma, vaan koostuu suuresta joukosta pienempiä sovelluksia, joista kukin toteuttaa yksittäisiä toimintoja.
Gitin sanotaan olevan kolmannen sukupolven versionhallintajärjestelmä, joka toimii hajautetusti ja seuraa muutosjoukkoja.[6]Muita vastaavia versionhallintajärjestelmiä ovatMercurial jaGNU Bazaar.[6]
Gitin alkuperäinen kehittäjäLinus Torvalds kertoo hajautetun järjestelmän eduksi, että politikointi käyttäjäoikeuksista poistuu: jokaisella käyttäjällä on oma tietovarasto (engl.repository).[7] Hajautettu versionhallinta mahdollistaa myös helpot ja luotettavatvarmuuskopiot ja henkilökohtaisten kokeellisten tietovarastojen käytön.[7] Aiemmissa järjestelmissä muutoksien yhdistäminen (engl.merge) oli monimutkainen operaatio.[7]
Linux-ytimen versionhallintaan käytettiin vuonna 2002 käyttöön otettuaBitMoverin suljetun lähdekoodinBitKeeper-ohjelmistoa.[8]BitMover antoi BitKeeperin ilmaiseen käyttöön avoimen lähdekoodin projekteille, mutta sen ehtoja ja ratkaisua kritisoitiin.[8][7] BitKeeper käytti hajautettua mallia, joka inspiroi projekteja kutenGNU Arch,Darcs jaMonotone.[8]
Vuonna 2005Andrew Tridgell pyrki tekemään BitKeeperiä käyttävän ohjelmantakaisinmallinnuksella, joka oli vastoin BitKeeperin käyttöehtoja.[7] Torvalds yritti sovitella Tridgellin ja BitMoverinLarry McVoyn välillä, mutta päättivät lopettaa BitKeeperin käytön.[7][9]Katsottuaan vaihtoehtoja Torvalds päätti kirjoittaa oman hajautetun versionhallintajärjestelmän korvaajaksi, koska Linux-ytimen kehitystiimin tarpeet täyttävääavoimen lähdekoodin järjestelmää ei tuolloin ollut olemassa.[7][10] Kehityshetkellä olemassa olleissa muissa järjestelmissä oli omat ongelmansa kutentiedostojen uudelleennimeämisen seuranta ja suorituskyky.[7]
Torvalds inhosi keskitettyä mallia kutenSubversionissa ja kehotti katsomaan vaihtoehtoja kuten Monotonea.[11][12]Torvalds kritisoi Monotonea eräistä seikoista kuten tavasta käyttää ”tietokanta per kehittäjä” -mallia eikä ”tietokanta per lähdekoodipuu” -mallia.[13][14] Myös Monotonen suorituskyky oli yksi vaikuttava tekijä: suorituskyky oli yksi keskeisistä vaatimuksista ja Monotone oli huomattavan hidas Linux-ytimen tiedostomäärällä.[13][8][15]
Torvalds kertoo aloittaneensa Gitin kehityksen 3. huhtikuuta 2005 viimeisen BitKeeperillä tehdyn ytimen version 2.6.12-rc2 julkaisun jälkeen.[16]Itseään tukeva (engl.self-hosting) Gitistä tuli noin päivässä: suuri osa kehitystyöstä ei ollut ohjelmakoodin kirjoittamista vaan tietojen käsittelyn suunnittelua.[7] Itseään tukevana pidetään kuitenkin 7. huhtikuuta tehtyä tallennusta.[17]Ensimmäinen muutoksien yhdistäminen Linux-ytimeen Gitillä tapahtui 17. huhtikuuta 2005.[18] Ensimmäinen Gitillä ylläpidetty Linux-ytimen julkaisu oli versio 2.6.12 kesäkuussa 2005.[19]
Torvalds on kertonut, että koska on käyttänyt BitKeeperiä pitkään toimintamalli vain seuraisi BitKeeperin mallia eikä sen teknisiä yksityiskohtia: Torvalds tietoisesti pyrki välttämään BitKeeperin kloonin tekemistä.[20][10]
Torvalds ilmoitti 27. heinäkuuta 2005 Gitin ylläpidon siirtymisestäJunio Hamanolle, joka oli innokas kehittäjä.[21][8]
Varhaiset Git-komennot olivat vaikeaselkoisia, jotka kehittyivät Hamanon kehittäessä työkaluja.[7][8]
”Git” tarkoittaa brittiläisessä slangissa hölmöä tai hyödytöntä henkilöä tai jääräpäistä henkilöä.[22][23] Linus Torvalds sanoi ”Olen itsekeskeinen paskiainen, joten nimeän kaikki projektit itseni mukaan. Ensin Linux, nyt git.” (”I'm an egotistical bastard, and I name all my projects after myself. First Linux, now git.”).[24]Kehityksen alkuvaiheissa nimeä kuvailtiin seuraavasti:[25]
»Linus Torvalds nimesi ohjelmiston ”gitiksi” kun hän loi ensimmäisen version. Hänen mukaansa kyseessä on ”tyhmä sisällönseurantaohjelmisto”, jota voidaan kuvailla mieltymysten mukaan:
Satunnainen äännettävissä oleva kolmikirjaiminen nimi, jota olemassa oleva Unix-ohjelma ei käytä. Se, että se voidaan virheellisesti lausua kuten ”get”, on ehkä asiaan kuuluvaa.
Tyhmä. Halveksittava ja kamala. Yksinkertainen. Valitse suosikkisi slangisanakirjasta.
”Globaali Informaatio-Trakkeri”: Kun olet hyvillä mielin ja se sattuu toimimaan. Enkelikuoro laulaa ja valo täyttää huoneen.
”Goddamn Idiotic Truckload of sh*t”: Kun se ei toimi.»
Git suunniteltiin olemaan mahdollisimman nopea (Linux-ytimeen tulee valtava määrä muutoksia), tukemaan hajautettua työskentelyä, ja estämään datan virheellisyys sekä katoaminen. Sen oli myös kyettävä hallitsemaan Linuxin valtavaa kokoluokkaa, toisin kuin monet muut järjestelmät, jotka eivät skaalaudu isojen hakemistopuiden hallintaan. Git suunniteltiin myös eri kehityshaarojen tehokkaaseen ja helppoon hyödyntämiseen.
Git on suunniteltuUnix-filosofian mukaiseksi ”työkalusarjaksi”: Gitissä on joukko ohjelmia, joista kukin tekee yhden tietyn asian hyvin.[26]
Useimmissa muissa versionhallintajärjestelmissä on seurattuSource Code Control Systemin (SCCS) ”ajatusmallia”: niissä eräät toiminnot ovat olleet rivikohtaisella toiminnolla ja ylemmän tason ”näkymä” on puuttunut.[27] Gitissäblame-toiminto on laajempi jaannotate taaksepäin yhteensopivuuden vuoksi muista järjestelmistä tulevia varten.[28][29]
Tiedostojen uudelleennimeäminen Gitissä onimplisiittistä: sitä ei nimenomaisesti seurata vaan se tulee ”automaattisesti”.[27] VanhemmanCVS:n yleisenä heikkoutena pidetään sen tapaa tunnistaa koko päivityshistoria tiedoston nimen mukaan, jolloin tiedoston siirtäminen tai uudelleennimeäminen ei ole mahdollista joko keskeyttämättä tai uudelleennimeämättä sen historiaa, tehden siitä virheellistä. Useimmat uudemmat versionhallintajärjestelmät antavat tiedostoille oman pysyvän nimensä (tiedostojärjestelmissä käytetyn ”inoden” kaltaisen).[30] Git ei käytä tämänkaltaisia tunnisteita,[30][31] silläkoodia joudutaan välillä paloittelemaan tai yhdistelemään uudelleennimeämisen lisäksi.[32] Tämän ylöskirjaaminen pelkkänä uudelleennimeämisenä jäädyttäisi historian jälleen virheelliseksi, mistä johtuen Git tunnistaa uudelleennimeämiset automaattisesti tallennehistoriaa selaamalla sen sijaan, että se kirjattaisiin jo tallennushetkellä.[33] (Yksinkertaistettuna versionN jokin tiedosto on uudempi kuinN-1:n. KunN-1:stä ei löydy kyseisen nimistä tiedostoa, Git etsii tiedostoa joka löytyy vain tästä versiosta, ja on sisällöltään mahdollisimman samanlainen uudempaan verrattuna.) Tämä vaatii kuitenkin luonnollisesti enemmänsäikeitä (kuormittaen sitenprosessoria) sekä monenlaisia asetuksia kontrolloimaanheuristiikkaa.
Gitin on myös päätetty olevan seuraamatta tyhjiä hakemistoja. Tästä syystä pelkkien hakemistojen seuraamiseen on kansioon luotava aina vähintään yksi tyhjä tiedosto (esim..gitignore).[34]
Gitissä lähes jokainen operaatio onpaikallinen: tämä mahdollistaa työskentelyn myös ilman jatkuvaa verkkoyhteyttä.[35] Paikallisen lisäksi voi käyttää jaettua verkkolevyä (kutenNFS) tai palvelinta (HTTP, SSH ja Git-protokollat).[36][37] Tietovarastoon voi liittää muita tietovarastoja, joihin viitataan lyhyillä nimillä (kutenorigin, joka on oletusnimi tietovarastolle, josta olet kloonannut).[38] Esimerkiksi eri kehittäjien tietovarastoista voi hakea muutoksia omaan tietovarastoon (sekä paikallisesti että verkon kautta).[38]
Gitin tietovarasto tukee useita lähdekoodipuita (worktree).[39] Uusi lähdekoodipuu on ”linkitetty puu” eikä ”pääpuu” kuteninit- taiclone-komennolla tehdessä.[39]
Kaikelle Gitissä säilötylle lasketaantarkistussummaSHA-1tiivistefunktiolla jolla muutokseen viitataan: tämän johdosta on mahdotonta muuttaa minkään tiedoston sisältöä ilman että versiohallinta tietää siitä, jolloin et voi kadottaa tietoa tai menettää tietoa korruptoitumiselle.[35]Torvaldsin mukaan ajatus sisällönosoittamistekniikasta on lainattu Monotonesta.[15][17]Gitin käyttämä sisällönosoittaminen ja tapa säilöä tietoa objekteissa (muutostiedostojen sijaan) mahdollistaa minkä vain sisällön tallentamisen Gitissä.[40]
Torvalds on kertonut kääntyneensä Bitkeeperin kehittäjän Larry McVoyn kannalle siinä, että ”kirsikan poimiminen” (engl.cherry picking, tiettyjen muutoksien valinta) on väärä toimintamalli, joka viittaa tiettyjen henkilöiden olevan ”ylhäällä” ja toisten ”alhaalla”: Linux-ytimen kehitys on entistä enemmän ”verkkomalli”, jossa Torvalds on vain ”keskeinen henkilö” eikä ”päällimmäinen”.[14] Git tukee eri toimintamalleja versiohallinnassa kuten keskitetty työmalli,integraationhoitajamalli jahyväntahtoinen diktaattorimalli, joissa muutokset etenevät yhden tai useamman tietovaraston kautta.[41] Tiettyjen muutoksien valinta on mahdollistagit cherry-pick -komennolla.[42]
Gitissä haarojen (branch) tekeminen ja niiden välillä vaihtaminen (switch,checkout) ovat nopeita ja se kannustaa toimintamalleihin, joissa haarautumista ja yhdistämistä (merge) tehdään paljon.[43][44][45] Monissa versionhallintatyökaluissa haarojen tekeminen ja yhdistäminen on vaativa toimenpide, joka voi vaatia uuden kopion lähdekoodeista, joka on hidasta suurissa projekteissa.[43]
Haaran vaihtamisen yhteydessä Git pyrkii varmistamaan ettei tietoja kadoteta ja huomauttaa, jos työkopiossa on tallentamattomia muutoksia: muutokset voi tallettaa (commit) tai vaihtoehtoisesti säilöä (stash) jos muutokset eivät ole valmiita talletettavaksi.[46][47] Haaran vaihdossa Git pyrkii palauttamaan viimeisimmän talletuksen tilan.[46] Säilö (stash) toimiipinon kaltaisella periaatteella, jossa muutoksia säilötään päälle ja niitä haetaan päältä: lisäksi voi viitata suoraan haluttuun muutokseen jonka haluaa palauttaa päällimmäisenä olevan sijaan.[47]
Muutoksien yhdistäminen tukee erilaisia menetelmiä:resolve,recursive jaoctopus, joista viimeisessä voi olla useita lähteitä yhdistettävänä.[48] Uudempi menetelmä onort, jossa käytetään samoja konsepteja, mutta suorituskyky on parempi.[49][50]Jos haaraan yhdistetään muutoksia, jotka ovat lähdekoodipuussa suoraan edellä voidaan suorittaa ”pikakelaus” (”fast-forward”) eli vain päivitetään viittaamaan uudempaan ilman varsinaista yhdistysoperaatiota.[46]Samaan kohtaan kohdistuvat muutokset voivat aiheuttaa konfliktin, jossa ohjelma ei automaattisesti pysty päättelemään mikä on oikea lopputulos.[48][46] Konfliktin ratkaisuksi voidaan muokataan työversiossa olevaa lähdekoodia, johon on merkitty eri versioiden muutokset.[46]
Git tukee alimoduulien (submodule) tallentamista osana laajempaa projektia: käyttökohde on erikseen seurattavat projektit jotka voivat riippua toisistaan.[51][52]Projekti voi riippua toisista projekteista, joita käytetään myös toisissa projekteissa.[53] Lähdekoodin kopiointi jokaiseen projektiin joka käyttää sitä on työlästä ja vaikeuttaa päivittämistä.[53] Alimoduulilla voi viitata suoraan toiseen projektiin ilman sen kopioimista.[53] Alimoduuli viittaa tiettyyn talletukseen tietovarastossa.[53]
Alipuu (subtree) tekee vastaavan kuin alimoduuli eli sallii toisen tietovaraston sijoittamisen toisen alle, mutta ei käytä erillistä seurantaa sen hakemistopuulle.[53][54]Yksinkertaistettuna alipuu on kopio toisesta tietovarastosta kun taas alimoduuli on vain viittaus toiseen tietovarastoon.[55]
Git käyttää nykyisinSHA-1-tiivistefunktiota tiedostojen seurantaan.[56] Git siirtyi versiossa 2.13.0 vahvennettuun SHA-1:een, joka ei ole haavoittuvainen vuonna 2017 julkaistulleSHAttered-hyökkäykselle.[57]Siirtyminen uudempaanSHA-2 standardiin on työn alla.[56][58]
Olioiden tallennus Gitissä on yksinkertaistettuna "vain"suunnattu syklitön verkko, jossa on kourallinen eri oliotyyppejä, joihin viitataan tiivisteellä.[59]
Git tallettaa tietoa useisiin objekteihin.[60]Tiedostoihin viitataan niiden sisällöstä lasketullatiivisteellä.[60] Tiedoston siirtäminen eri hakemistoon tai sen nimen muuttaminen ei muuta sen tiivistettä, mutta hakemiston sisältöä luetteloivan hakemisto-objektin tiiviste muuttuu.[60] ”Commit”-objekti sisältää tietovaraston tilanteen tietyllä ajanhetkellä.[60] ”Commit”-objekti sisältää metatietoa kuten tekijän ja aikaleiman, tiivisteen hakemistopuusta sekä edellisen talletuksen tiivisteen (tai useamman talletuksen muutoksien yhdistämisen tapauksessa).[60] Näillä tiedoilla Git voi tuottaa tietovarastossa olevien tiedostojen tilan kullekin tallennukselle ja voi havaita mitä tietovarastossa on muuttunut.[60]
Muutos tiedoston sisältöön muuttaa sen omaa tiivistettä, tiedoston sisältävän hakemiston tiivistettä ja tietovaraston tilaan viittaavaa tiivistettä.[60]
Git tukeedigitaalista allekirjoittamista ja sen tarkistamistaGPG:llä.[61][60] Kehittäjät voivat allekirjoittaa yksittäisen muutoksen (commit -S) tai koko tietovaraston tilan (engl.signed tag,tag -s) ja tiivisteiden käytöllä havaitaan mikäli tietovarasto ei ole sama kuin on allekirjoituksella vahvistettu.[61][60]
Git ei itse käsittele käyttäjäoikeuksia, vaan siihen käytetään olemassa olevia työkaluja kutenSSH,tiedostojärjestelmän asetukset,käyttäjäoikeuslistat (ACL) ja muita tekniikoita.[62]Linux-ytimen versiohallinnassa käytetäängitolite-ohjelmaa oikeuksien hallintaan.[63]
Torvaldsin mukaan järjestelmän etuna on helpot ja luotettavat varmuuskopiot.[7] Gitiä on sanottu varmuuskopiointijärjestelmäksi itsessään ja käytetty muun muassatietokannoille.[66][67]
Tietojen eheyden ja oikeellisuuden tarkistamiseen ongit fsck -komento.[68] Lisäksi git tekee taustalla useita asioita ylläpidollisiin tarkoituksiin.[69]
Suurien tietovarastojen kanssa toimintaan on lisätty osittainen kloonaaminen sekä "harva checkout" (git sparse-checkout): näillä ominaisuuksilla haetaan paikalliseksi vain osa tietovaraston objekteista ja työkopiosta käytetään vain osa, joka on tyypillsesti rajattu tiettyihin alihakemistoihin.[70][71] Tyypillisesti tietovarasto Gitissä sisältää kaiken tiedon ja koko historian: osittaisella kloonilla voidaan rajata käyttö tiettyyn alihakemistoon.[72]
Suurien referenssimäärien (haarat ja tagit) käyttöä varten Gitiin on lisätty vaihtoehtoinen tallennusmuoto "reftable". Reftable nopeuttaa viittauksien hakua sekä tarkistamista, että objektiin on olemassa viittaus.[73][74][75]
Gitille on tehty useitagraafisen käyttöliittymän sovelluksia.[81] Gitille on tehty myösSQL-rajapinta.[82] GitWeb on Gitin mukana tuleva verkkoselaimella käytettävä käyttöliittymä.[83] cgit on käytössä Linux-ytimen versiohallintapalvelimella.[84]
Tietovarastojen siirtämiseksi Subversionista Gitiin on olemassa muun muassaEric S. Raymondin reposurgeon sekä git-svn työkalut.[85] Gitissä on eräitä valmiita komentoja tietojen hakemiseen muista järjestelmistä kuten Subversionista, Mercurialista, Bazaarista ja Perforcesta.[86][87]
Microsoft on julkaissutGit Virtual File System (GVFS) -projektin laajojen projektien hallintaan.[88][89] Projekti mahdollistaa osan lähdekoodeista näkyvän virtuaalisesti osana tietovarastoa (repository) varsinaisen latauksen tapahtuessa kun tiedostoa tarvitsee käsitellä.[88]
Nimi muutettiin muotoonVFS for Git jotta se ei sekoituGNOME-projektin GVFS:n kanssa.[90]
Eclipse Foundationin mukaan Git oli käyttäjäyhteisössä tehdyn kyselyn perusteella suosituin versionhallintajärjestelmä vuonna 2014.[91]RhodeCoden mukaan Git oli vuonna 2016 usealla eri mittaustavalla selkeästi suosituin versionhallintajärjestelmä.[92] StackOverflow:n kyselyssä vuonna 2018 Git oli selkeästi suosituin versionhallintajärjestelmä.[93]
hajautettu periaate helpottaa toimintaa heikkojen verkkoyhteyksien kanssa, eri aikavyöhykkeillä ja joustavampi työtapa: kyky toimia useiden tietovarastojen (engl.repository) kanssa
haarojen ja muutosten yhdistäminen tapahtuu hetkessä ja paikallisesti sekä kyky muistaa jo yhteen liitettyjä muutoksia
kokoontumisalue (engl.staging) mahdollistaa useiden muutoksien kokoamisen muutosjoukoksi
paras markkinointikampanja: Torvaldsilla on suuri vaikutus
GitHub levisi harrastekäytöstä ammattikäyttöön ja lisäsi sosiaalisen median ominaisuuksia
Gitiä on alettu vuoteen 2009 mennessä hyödyntää Linuxin ohella lukuisissa korkean profiilin ohjelmistohankkeissa kuten:Perl,GNOME,Qt,Samba,Kannettava tietokone jokaiselle lapselle ja GooglenAndroid-käyttöjärjestelmä. Vuonna 2020GCC siirtyi käyttämään gitiä versiohallintaan.[95] Ars Technican mukaanMicrosoft käyttää nykyisin GitiäWindowsin lähdekoodien hallintaan.[96]
Hajautetun versionhallintajärjestelmän avulla kehitys on siirtynyt parempaan kehitysmalliin: Linux-ytimen kehitys on skaalautunut tuhansien ihmisten yhteiseen kehitystyöhön.[97]
Gitiä on kritisoitu vaikeudesta, jota on parannettu kehittämällä työkaluja.[7][8] Vaikeuden on sanottu johtuvan joustavuudesta ja olevan joustavan järjestelmän synnynnäinen piirre.[100] Osa vaikeudesta on peräisin erilaisesta kokemustaustasta.[7]
Gitin mukana tulee suuri joukko työkaluohjelmia ja komentoja, joista pieni osa riittää normaalikäytössä.[97]
Gitin julkaisuissa vX.Y.0 ovat ”ominaisuusversioita” ja vX.Y.Z ”ylläpitoversioita”.[101] Ennen Gitin versiota v1.9.0 vX.Y.Z olivat ”ominaisuusversioita” ja vX.Y.Z.W ”ylläpitoversioita”.[101]
↑abMatthew McCullough & Jon Loeliger: Chapter 1. Introduction (Version Control with Git, 2nd Edition) oreilly.com. ”Git immediately borrowed the idea from Monotone, according to Linus.” Viitattu 8.11.2019. (englanniksi)
↑abMarti, Don: Linus on Linux: The Linus Torvalds Interview Part 2 ("Linus talks about the process of managing kernel developer commits, selecting a revision control system and how he personally uses git.") Linux Magazine. 26.4.2009. Arkistoitu Viitattu 28.4.2009. (englanniksi)