Google Inc. edoAlphabet edoGoogle izenarekin soilik ezaguna,Internetekobilatzailearen garapena duenenpresa da. 2015. urtetikAlphabet Inc. enpresaren adarra da. Enpresak Interneten presentzia handia du eta bere arloan nagusitasun handia duten zenbait aplikazioren jabe da.
Europako Batzordeak enpresa teknologiko erraldoiekin 2023an osatu duen zerrendan sartu zuen (Alphabet,Amazon,Apple,ByteDance,Meta etaMicrosoft). Enpresa horiek merkataritza elektronikoari buruzko 2022an ezarritako arau berriak bete beharko zituzten Europan. Bruselak «atezain digital» gisa identifikatu ditu enpresa horiek, uste baitu nahikoa indar badutela merkatuaren oreka baldintzatzeko.[1]
NASDAQburtsa indizean kotizatzen duGOOG izenpean. Googlen negozioa publizitatetik dator. 2019anYouTube plataformarekin bakarrik 15000 milioi dolar irabazi zituen.[2]
Google enpresa1998 urtean sortu zen. Bere sortzaileakLarry Page etaSergey Brin izan ziren. SortzaileakStanfordeko Unibertsitateko Konputazio Zientzietan doktoretzako ikasleak ziren garai hartan eta gaur egun lehendakaria eta teknologia alorreko presidentea dira, hurrenez hurren.
Hasiera bateanBackRub izena eman zioten proiektu bat garatu zuten. Bilatzaile bat zen hau ere etaJava etaPython lengoaietan idatzita zegoen. Arkitektura sinplea zuen. Alde batetik, bilatzaileakLinux sistema eragilea zutenSun Ultra etaIntel Pentium makinen gainean ibiltzen zen eta, bestalde,bilatzailearen datu basea Sun etxeko "Ultra II" izeneko ordenagailu batean kokatuta zegoen eta disko gogorrak 28GBeko edukiera zuen.
Gerora Google izena jarri zioten bainaStanfordeko Unibertsitatean (Kalifornia,Ameriketako Estatu Batuak) erabiltzen zenez, unibertsitateko domeinuaren azpian zegoenhttp://google.stanford.edu helbidean hain zuzen ere.www.google.com domeinua 1997an erregistratu zuten eta Google Inc. enpresa 1998an sortu zen.
Arkitektura
Googlen, beste bilatzaileetan ez bezala, elkar konektatutakoPC arruntak erabiltzen ditu hasieratik.Zerbitzari handiak erabiltzean sor daitezkeen arazoak (karga handiko momentuetan, erantzuna moteldu daitekeelarik) ekidin nahian. Hori dela eta, sistema banatu bat erabiltzen du Googlek, gainera irtenbide honek hedagarritasun handiagoa ematen du, kostuak gutxituz aldi berean.[3][4]
Googlek ez du informazioa publiko egin, baina estimatzen da2006an 4.500 zerbitzari zituela clusterretan mundu osoan zehar banatuta.
Erabiltzen dituztenordenagailuek errendimendu handia eskaintzen dute. Izan ere, ordenagailu hauek estimatzen da % 90-eko eraginkortasuna dutela. Hau da, Googlek erabiltzen dituen ordenagailuei etekin handia ateratzen die.
Enpresak egitura nagusia galderak erantzuteko prestatua dago, indize eta dokumentuen atzipenak gehienetan irakurketak dira. Eguneraketak ez dira ohikoak irakurketen aldean. Gainera, eguneraketa bat segurtasunez egin daiteke, berau egiten ari den bitartean galdera bat etortzen bada urrutiko beste zerbitzari batera birbideratu daitekeelako. Printzipio honek datu-baseen sendotasun zorrotza alde batetara uzten du, baina eraginkortasuna hobetzen du.
Bilatzailean egiten den eskaera bakoitza modu independente batean tratatzen da. Era honetan bertako makinek paraleloan exekuta ditzakete eskaera guztiak, aldi berean.
Zerbitzari motak
Jarraian Google osatzen duten zerbitzari nagusiak azaltzen dira:
DNS zerbitzariak: erabiltzailearenDNS eskaera bat zerbitzatzen du, modu adimentsu bateanmunduan zehar karga banaketa eginez. Eskaera egin den tokitik gertuen dagoen zerbitzariak erantzungo dio.
Web zerbitzariak: eskaera baten exekuzioa koordinatzen du eta emaitza gisaHTML orri bat sortzen du.
Informazio biltze zerbitzariak:web osoa miatzen eta bertako indize eta dokumentuak eguneratzen ari dira une oro, balio bat emanez orri bakoitzari Googlerenalgoritmo baten arabera.
Indize zerbitzariak: zerbitzari bakoitzak indize sarrera multzo bat du. Indize lista bat itzultzen du. Disko edukiera txikiagoa duten arrenCPU errendimendu hobea behar dute makina hauek. Dokumentuzerbitzariekin batera sakonago aztertuko ditugu behean.
Dokumentu zerbitzariak: bertan dokumentuak gordetzen dira. Dokumentu bakoitza dozenaka zerbitzaritan gordetzen da. Zerbitzari hauekdisko edukiera handia behar dute.
Iragarki zerbitzariak:iragarkiak azaltzeaz arduratzen dira,AdWords etaAdSense zerbitzuak ematen dituzte.
Ortografia zerbitzariak: gomendioak ematen ditu galderari buruz.
Arkitektura logikoa
Googlek zerbitzariak egitura fraktalean banatzen ditu,googleplex izena eman diotena. Hau da, ordenagailu bakar baten ezaugarriak cluster osoaren antzekoak dira, clusterrenak datu zentroenak eta datu zentroenak Googleren egitura orokorrenarena (hainbat datu zentro).
Galdera baten prozesamendua
PageRank sistemaren funtzionamendua
Erabiltzaileak galdera bat egiten duenean (adib:http://www.google.com/search?q=wikipedia) lortu behar duen lehenengo gauza web zerbitzariarenIP helbidea da. www.google.com makinaren izena IP helbide konkretu batengatik aldatu behar da. Jasaten dituen galdera pilari aurre egitekowebzerbitzaria ez da bakarra eta hainbat cluster ditu banatuta munduan zehar. Cluster bakoitzak bere barnean ehunaka makina ditu eta munduan zehar banatuta daude.
Karga banaketa egitekoDNS zerbitzuan oinarritzen da, erabiltzaile bakoitzarigeografikoki gertuen dagoen clusterrak erantzungo diolarik. Modu honetan galdera egiten duenetik erantzuna jasotzen duen arterako denbora (ingelesezround-trip time) txikitzea lortzen da.
Behin IP helbidea erabiltzaileak duela,web nabigatzaileakHTTP eskaera bat bidaltzen dio clusterrari, bakarrari. Momentu honetatik aurrera cluster honek bakarrik tratatuko du erabiltzailearen eskaera. Cluster bakoitzean karga banaketa hardwarean oinarritutako sistema baten bidez egiten da.Hardwarean oinarritutako protokolo batek ikusten du zein Google Web Zerbitzari (GWS,Google Web Server) dagoen libre eta horien artean banatzen du eskaera. Eskaera jaso ondoren GWS makina batek koordinatzaile lanak egingo ditu eta erantzunaHTML orri batean sartuko du, erabiltzailearen nabigatzaileak erakutsi dezan.
Eskaera bat bi zati nagusitan banatzen da: lehenengoan, indize zerbitzariek parte hartzen dute eta bigarrenean dokumentu zerbitzariek, indize zerbitzariek emandako emaitzekin.
Indize zerbitzariek alderantzikatutako indize bat kontsultatzen dute. Egindako galderako hitzak hartu eta hainbatdokumenturekin parekatzen dituzte. Orduan, indize zerbitzariek esanguratsuak diren dokumentuak hartzen dituzte. Gainera, dokumentu bakoitzari duen garrantziaren araberako balio bat ematen zaio. Zenbaki hauek erantzunak zein ordenatan erakutsiko duen baldintzatuko du.
Erabiltzen diren datuentamaina ikaragarrian dago bilaketaren zailtasuna. Dokumentu gordinek hainbat hamarnakaterabyteko (TB) edukiera dute, batere konprimitu gabe. Beraz, modu eraginkorrean atzitzeko alderantzikatutako indizeak erabiltzen dira. Indize hauek ere, bere baitan hainbatterabyteeko edukiera dute. Zorionez, galdera erraz paralelizatu daiteke indizea hainbat zatitan eginez (index shards), eta bakoitzak dokumentuaren zorizko zati bat aztertuko du. Zati bakoitza makina batek (edo gutxi batzuek) zerbitzatzen du eta indize orokorrak sarrera bat du makina (edo makina talde) bakoitzeko. Azken finean, galdera bakoitza makina batera doa. Indize zerbitzari honek karga banaketa egiten du.
Makina batek huts egiten badu, aurretik karga banaketa egin denez, makina hau zerbitzutik kanpo geratuko da eta berpizten saiatuko da, osorik edo zati batean gutxienez. Huts egiteak irauten duen bitarteansistemaren ahalmena gutxitu egingo da, makina horrek (edo horiek), ordezkatzen zuten proportzioan. Hala ere, zerbitzuak erabilgarri egoten jarraituko du, eta indizea guztiz erabilgarri egoten jarraituko da.
Galderaren tratamenduko lehenengo zati honen emaitza ordenatutako dokumentuen identifikadore lista bat da (docids, izena eman diotena). Eta bigarren zatia emaitza hauetatik abiatuko da.
Bigarren fasean, dokumentu zerbitzariek (docservers) hartzen dute parte. Dokumentu zerbitzari hauek Web osokorako atzipena izan behar dute. Atzipena ez da zuzenekoa eta gordetzen denaWebaren kopia bat da, latentzia txikiko atzipena izan dezan. Gainera, erreplikazioak errendimendua eta eskuragarritasuna eskaini behar duenez, Google-k dozenaka kopia gordetzen ditu bere clusterretan barrena.
Aurreko fasean bezala, zati honetan ere lana banatzeko estrategia erabiltzen da. Dokumentuak zoriz banatzen dira zerbitzarien artean, helburu bakoitzeko hainbatzerbitzari errepikatu daude erantzuna emateko prest eta lana bideratzea karga banaketa bidez egiten da.
Bi fase nagusi hauez gain beste hainbat lan egiten ditu Googlekowebzerbitzariak galdera bat jasotzen duenean. Hala nola, galdera zuzentzaile ortografiko bati bidaltzen dio baita iragarki zerbitzu bati ere, egoki bada iragarkiak jar ditzan. Azkenean, fase guztiak bukatu direnean Google web zerbitzariakHTML orri bat sortzen du eta erabiltzailearen nabigatzailera bidaltzen du
Hasierako hardwarea
Google-k erabili zuen lehenengo hardwareaStanfordeko Unibertsitatean zegoen eta ondorengo ezagugarriak zituen:
2 prozesagailuko Sun Ultra II 200 MHz eta 256 MB memoria RAM.
2 ordenagailu 2 prozesagailukoa bakoitza. Prozesagailuak Pentium II Server 300 MHz, 512 MB RAM eta 9GB disko gogor ordenagailu bakoitzak.
IBM-k emandako F50 IBM RS/6000, 4 prozesagailukoa, 512 MB memoria eta 8 x 9 GB disko gogor.
2 kutxa gehigarri, 3 x 9 GB disko gogor eta 6 x 4 GB disko gogor, hurrenez hurren. Hauek Sun Ultra IIra lotuta zeuden.
IBMek emandako kutxa bat disko gehigarriekin, 8 x 9 GB.
Beraiek egindako kutxa bat. Bertan 10 x 9 GB SCSI disko gogorrak gordetzeko.
Egungo hardwarea
Gaur egun Googlek makina askoz konplexuagoak erabiltzen ditu, hasierakoarekin konparatuta. Hala ere, PC arruntetan oinarritzen da.PC arrunt hauek multzokatu egiten ditu rack-etan. Eta rack hauekclusterrak osatzen dituzte. Egoitza nagusiakKalifornian,Atlantan,Dublinen,Oregonen etaBelgikan ditu eta bertan gordetzen dira Googleen ordenagailu hauek.
Googlek erabiltzen dituenrack-etan 40tik 80raordenagailu egoten dira. Ordenagailuak x86 arkitekturako zerbitzariak dira eta prezio/errendimendu erlazioa hobesten denez, ordenagailuaren ezaugarri gehienak erdi-mailako PC baten antzekoak dira. Aldiz,disko gogorrak bereziak erabiltzen dituzte, datu andana gordetzeko.
HainbatCPU generazio aldi berean lanean daude, prozesagailu bateko Intel Celeron (533 MHz), Intel Pentium III dual (1.4 GHz)... Zerbitzari bakoitzak 80 GB-eko IDE disko gogor bat edo gehiago du. Orokorrean indize zerbitzariek dokumentuzerbitzariek baino disko gogor edukiera txikiagoa dute CPU lan gehiago egin behar dutelako. Ordenagailu bakoitzak 2-4 GB memoria nagusia du.Rack barruan dauden zerbitzariak 100Mbps biEthernet switchen bidez konektatuta daude etarack guztiak elkar konektatzekogigabiteko konexioak erabiltzen dira.
Gastuak kalkulatzerakoan PCetan oinarritutako sistemak askoz merkeagoak dira zerbitzari dedikatuak baino. Adibide bat ematearren, Googlek erabiltzen duenrack batek 278.000dolarretako kostua izan dezake, ondorengo ezaugarriekin:
176 2-GHz Xeon,
176 GB RAM,
7 TB disko edukiera.
Aldiz, zerbitzari batek 758.000 $ balio ditu eta ezaugarri hauek ditu:
8 2-GHz Xeon,
64 GB RAM,
8 TB disko edukiera.
Ondorioz, multiprozesadorekozerbitzaria 3 bat aldiz garestiagoa da, 22 aldiz CPU gutxiago du eta 3 aldiz memoria gutxiago du, antzeko disko edukierarekin. Zerbitzarien gastua altuagoa da banda-zabalera eta fidagarritasun hobea eskaintzen dutelako. Baina, Googlek ez ditu hain ezaugarri zorrotzak behar.
Merkeak izanda hainbat arazo sortzen dira P-etan oinarritutakorack-etan. Hala ere, Google prestatuta dago akats hauei aurre egiteko modu eraginkorrean eta inongo pertsonaren esku hartzerik gabe.
Kableak
Google enpresakzuntz optikoa duten kableak hedatu ditu munduan zehar, horietako kable nagusi batzuk Euskal Herritik igarotzen dira.[5]
Googlek informazioa gordetzeko bere fitxategisistema propioa garatu du. Fitxategi sistema honiGoogle File System (GFS) izena eman diote. GFS egokia da, informazio datu handiak sistema banatu batean gordetzeko. GFSk sistema banatuetakoaplikazioek bezala, eraginkortasuna, hedagarritasuna, berrerabilpena eta eskuragarritasuna ditu helburu.
Sortu behar diren datuak ehunka (edo milaka)ordenagailu arruntetan gorde behar dira. Hori dela eta, posible da ordenagailu hauetako batzuek huts egitea (eta huts egitetik berreskuratu ezin izatea). Baina, birtualki kalitatea bermatu beharra dago. Berreskuratu ahal izateko monitorizazio jarraitua, errore detekzioa, akatsekiko tolerantzia eta berreskuratze automatikoa sistemaren barnean egon behar dira.
Bestalde, gorde beharreko datuak ikaragarri handiak dira, erabiltzaile arrunten fitxategiekin alderatuz. HainbatTerabyteetako (TB) fitxategiak gorde behar dira eta hauek modu berezi batean tratatu behar dira eraginkorra izango bada. Nahiz eta 100MB baino txikiagoak direnfitxategiak onartu behar diren, hauek atzitzeko ez dute inolako optimizaziorik erabiltzen.
GFSak hainbat makinatan daude. Horietako handienek 1000 nodo eta 300 TBetako datuak gordetzeko ahalmena dute. Makina hauek modu konkurrentean ehunka erabiltzailek atzitzen dute makina ezberdinetatik.
Interfazea
GFSek erabiltzen dueninterfazea ohikoa da. Fitxategiak hierarkikoki banatuta daude eta helbidearekin (path-name) identifikatzen dira. Fitxategi hauek ohikoak diren eragiketak onartzen dituzte; irakurri, idatzi, sortu, ezabatu, iriki, itxi...
Horretaz gain, GFSeksnapshot etarecord append eragiketak ahalbidetzen ditu.Snapshot eragiketak fitxategi baten kopiak sortzen ditu etarecord append eragiketak berriz, hainbat bezerokfitxategi berdinean batera informazioa txertatzea ahalbidetzen du beti ere atomizitatea bermatuz.
Interfazea euskaraz
Googlebilatzailearen interfazea euskaraz jar daiteke. Horrek eragina du bilaketetan. Adibidez 'Donostia Wikipedia' bilatuz gero erdarazko interfazearekin edo euskarazko interfazearekin emaitza oso bestelako da.
Interfazea euskaraz jartzeko, honakoURL helbideak erabil daitezke:
Fitxategiak nagusia denkonputagailu batean eta hainbat morroitan banatzen dira. Konputagailu bakoitzakLinux zerbitzari bat du eta erabiltzaile mailako prozesu bat sortzen du.
Fitxategiak tamaina finkoko zati edochunk-etan zatitzen dira. Fidagarritasuna bermatzeko zati horietako bakoitza hainbat zerbitzaritan gordetzen da, zerbitzari haueichunservers deitzen zaie.
Zerbitzari nagusiakfitxategi sistemaren informazio guztia gordetzen du, hala nola, baimenak, zati bakoitzaren kokapena... Periodikoki zerbitzari nagusiachunk zerbitzariekin komunikatzen da beraien uneko egoera ezagutu eta beharra egonez gero informazioaren eguneraketa bat egiteko.
Chunk edo zatien tamaina
GFSen sortzaileek chunk bakoitza 64MBekoa izatea erabaki zuten, hau ohiko fitxategi-sistemen blokeen tamaina (1024 KB) baino askoz handiagoa da.
Tamaina honek hainbat abantaila eskaintzen ditu. Lehenik, bezeroa etazerbitzari nagusiaren arteko elkarrekintza murrizten du, idazketa eta irakurketa prozesuetan chunkaren kokapena jakiteko zerbitzari nagusiari egin beharreko eskaerak gutxitzen baititu. Bigarrenik, bezero eta zerbitzari nagusiaren arteko eskaerak gutxiago izanik, sareko trafikoa gutxitzen da. Eta azkenik, zerbitzari nagusiakchunk edo zatien inguruan gorde behar duen informazioa gutxiago da, zati kopurua txikiagoa izanik horien guztien informazioa jakitekobyte gutxiago gorde behar baitira.
Bestalde blokeen tamaina hain handia izateak baditu bere desabantailak. Sarritan gertatuko da, fitxategi batek bloke bakarra izatea. Bezero kopuru handi batek fitxategi hori eskuratu nahi badu, bloke osoa lortu beharko dute eta horren ondorioz bloke hori gordetzen duen chunk zerbitzariaren gainkarga sor daiteke. Hau saihesteko,chunk edo zati erreplikak hainbat zerbitzaritan gordetzen dira, lan karga banatu ahal izateko.
Sendotasuna
Fitxategien gaineko aldaketak atomikoak dira. Ekintza hauekzerbitzari nagusiak soilik gauzatzen ditu horrela atomizitatea eta zuzentasuna bermatzen direlarik.
Fitxategi baten aldaketaren ondoren, fitxategiaren egoera egin den aldaketa hori arrakastatsua edo edo okerra izan denaren araberakoa da.Fitxategiaren zati bat sendoa izango da baldin eta bezero guztiekinformazio berdina ikusten badute, irakurtzen ari diren erreplika desberdina izanda ere.
Aldaketa bat arrakastatsua eta konkurrenteki inolakointerferentziarik gabe egin bada, aldatutako blokea definitua dagoela esaten da eta honek sendoa izatea inplikatzen du: uneoro bezero guztiek aldaketak egindakoa ikusiko dute. Konkurrenteki egiten diren aldaketek, blokea definitu gabe bezala uzten dute baina sendoa izaten jarraitzen du: bezero guztiek informazio bera ikusiko dute, baina ez da ziurtatzen aldaketa guztiek egindakoa islatuko denik. Arrakastatsua izan ez den aldaketa batek, bloke bat sendotasunik gabe uzten du: bezero desberdinek informazio desberdina ikus dezakete.
Hutsegite tolerantzia
Zerbitzariek izan ditzaketen arazoen aurrean,sistemak erantzunak ematen jarraitzeko bi estrategia nagusi erabiltzen dituzte: berreskuratze azkarra eta erreplikazioa.
Berreskuratze azkarraren funtsa, zerbitzari nagusia etachunkserverrak beraien egoera berreskuratzeko diseinatuak daudela da, berdin izanik zein arrazoirengatik huts egin duten, hau da, gai dira huts egin duten une berean zuten egoera berdinean berriro lanean hasteko.
Erreplikazioari esker, zati edochunk bakoitza hainbat chunserverretan erreplikatzen da. Zerbitzari nagusia arduratzen da sortuta dauden erreplikak klonatu eta zati bakoitza kopuru egoki batean mantentzeaz hainbatchunserverretan, hauetakoren batek edo batzuek huts egiten badutechunk edo zati horiek eskuragarri egon daitezen.
Horretaz gain,zerbitzari nagusiaren egoeraren erreplika ere egiten dira. Zerbitzari honen erregistro fitxategiak (log) hainbat makinatan gordetzen dira. Aldaketa batcommit bezala onartuko da baldin eta zerbitzari nagusiaren erreplika guztietako erregistrofitxategien edukia erreplika guztietako disko lokaletan idatzi izan bada.
Bilaketa bat egiterakoanmilisegundo batzuetan ebatzi behar da. Bilaketa modu eraginkor batean egiteko Google etxeakPageRank izenarekin batailatu duen teknologia bat erabiltzen du. Honek algoritmo bat inplementatzen du.Algoritmo honetan 2000 miloi sarrera eta 500 miloi aldagai izaten dira kontuan.
Googlek erakusten dituen webguneen ordenamendua egiteko erabiltzen den algoritmoa da: sekretua eta sarri aldatua. Bilaketa egin ostean algoritmo honek hainbat baldintza interpretatzen ditu erabiltzaileari emaitzak nola erakutsi erabakitzeko. Interneteko guneen kalitate eta kantitatea neurtzeko balio du eta SEOaren (posizonamnetuaren) oinarrietako bat da. Arazoa baina, algoritmoak ordenamentua ezartzeko erabiltzen dituen printzipioetan dago. Ez daude inon argi zehazturik zein diren printzipio hauek, baina Googleren hitzetan “Webgune batek jasotzen dituen esteka kopurua eta hauen kalitatea da PageRankak kontuan hartzen duena; web garrantzitsuenak beste guneetan loturak jasotzen dituztenak baitira”. Horregatik, gainontzeko web orrialdeetan linkak jasotzeak dirudi duela garrantzia handiena Googleren ordenamenturako. Halere, beste lehentasun batzuk ere kontuan hartzen ditu, webgunea zenbatero eraberritzen den esaterako. Honelako jarrerak saritzeaz gain, beste jarrera desegoki batzuk penalizatzeko balio dute eta webguneak rankinean behera egitea ekar dezakete. Hau guztia kontuan hartuta Googlek rankina osatzen du 1etik 10erako eskalan:[7]
● PR0: orrialdea ebaluatu gabe dago edo penalizatua izan da.
● PR1: orrialdea indexatua izan da eta “egokia” da.
● PR2: orrialdea interesgarria da, potentziala du.
● PR3: orrialdea bere ingurukoen artean nagusienetakoa da (Donpostre.com, Cajadecarton.es, Laboresymanualidades…)
● PR4: bere lehiakideak baino gorago dago, hemendik aurrerakoak oso orrialde garrantzitsuak dira jada (Serpadres.com, Webtaller.com, Gratisjuegos.org…)
● PR5: orrialde hauek lehen postuetan agertzea gainontzekoek baino errazago dute, oso kontsolidatuak dira (Games.es, Bodas.net, Deusto…)
● PR6, PR7 eta PR8: autoritate baldintzaezinak dira beren lehiakideen artean (El Corte Inglés, Barcelona.com, Museo del Prado…)
● PR9 eta PR10: soilik nagusienetan nagusienak (Google, Adobe, Youtube…)
2022an Europako Batzordeak merkataritza elektronikoa arautzeko bi lege onartu zituen zehazki Interneteko atari handiek merkatuan duten abusuzko praktikak murrizteko eta lehia orekatzeko:Zerbitzu Digitalen Araua (ZDA) etaMerkatu Digitalen Araua (MDA). Lege horiek aukera ematen diote batzordeari isunak jartzeko, uste badu enpresa batek merkatuaren lehia askea oztopatzen duela. Monopolio jarduna duela berretsiko lukeen ikerketa txostenik gabe zigortzeko ahalmena ematen dio, gainera.[9]
Europako Batzordeak irizpide batzuk ezarri ditu enpresa bat «atezain digitala» den edo ez ebazteko. Esaterako, azken hiru urteetan 7.500 milioi euroko fakturazioa izatea Europako Batasuneko herrialdeetan, edo gutxienez 45 milioi erabiltzaile aktibo izatea, eta 10.000 enpresa erabiltzaile. Sei betetzen dituzte baldintza horiek guztiak:Alphabet,Amazon,Apple,ByteDance,Meta etaMicrosoft.[9]
Merkataritza elektronikoaren arauak debekatu egiten die enpresei beren zerbitzuen bidez eskuratutako datuak beste zerbitzuekin lortutakoekin bateratzea. Alegia, Metak ezingo duFacebook bidez etaWhatsapp bidez lortutakoa bateratu. Era berean, ezingo dituzte erabiltzaileak behartu konpainiaren aplikazio jakin batzuk beren gailuetan instalatuta izatera. Eta finantza erakundeek ordainketa zerbitzu alternatiboak eskaini ahal izango dituzte, halaber. Araua urratuz gero, urteko sarreren %20rainoko isunak jaso ditzakete enpresek.