Movatterモバイル変換


[0]ホーム

URL:


Edukira joan
WikipediaEntziklopedia askea
Bilatu

Datu zientzia

Wikipedia, Entziklopedia askea

Datu zientzia edodatuen zientzia jakintza erauztekometodo zientifikoak,prozesuak etasistemak uztartzen dituendisziplinarteko alorra da.Datuen errepresentaziotikestrategia berrien sormenerako baliabideak lortzeko erabiltzen da.

Historia

[aldatu |aldatu iturburu kodea]

1962an,John W. Turkey-k "Datu zientzia" terminoa aurretik aipatu zuen bere"The Future of Data Analysis" artikuluan,estatistika matematikoaren bilakaera bat azaltzean. Bertan, lehenengoz definitu zuen datuenanalisia: "Datuak aztertzeko prozedurak, prozeduren emaitzak interpretatzeko teknikak, datuen azterketa errazagoa, zehatzagoa eta zuzenagoa egiteko berauen bilketarenplanifikazio moduak, eta datuen azterketan aplikatzen denmakineria etaMatematika-estatistiken emaitzak.". 1997an"Exploratory Data Analysis" argitaratu zuen datuen erabileran enfasi handiagoa jarri behar zela argudiatuz, bertan,eredu estatistikoetanhipotesi berriak probatzeko iradoki zuen.

Peter Naur

Datu zientzia, sortu berri dendiziplinatzat hartu da orokorrean, bainaPeter Naurzientifikodaniarrak kontzeptu hau erabili zuen hirurogeigarren hamarkadan,konputazio zientziaren ordez. Alegia, 1974an"Concise Survey of Computer Methods" liburua argitaratu zuen, non behin eta berriz kontzeptuaren aipamena egiten du. Honek arlo akademikoan libreki erabiltzea eta hedatzea sortarazi zuen.

1996an, lehendabizi datu zientzia terminoa aipatu zenKoben,Japonian, egindako konferentzia batean.International Federation of Classification Societies (IFCS) taldeko partaideen arteko hitzaldia izan zen,"Datu zientzia, sailkapena eta erlazionatutako metodoak" izena zuena.

2002ko apirilean, Committee on Data for Science and Technology-k (CODATA)Data Science Journal-en argitalpena hasi zuen, datu-sistemen deskribapen arazoetara, aplikazioetara eta lege-arazoetara bideratuta. Geroago, 2003ko urtarrilean,Kolonbiako UnibertsitateakThe Journal of Data Science argitaratzen hasi zen, hainbat datu zientzialarik ideiak partekatzea eta haienperspektibak plazaratzea eskaintzen zuenplataforma izan zena.

2009an, Research Center for Dataology and Data Science-eko Yangyong Zhu eta Yun Xiongikertzaileek,“Introduction to Dataology and Data Science” argitaratu zuten.Natur-zientziekin etagizarte-zientziekin alderatuta, datu zientziaksaretikinformazioa eskuratzea eta azterketa helburu duela adierazi zuten.

IEEE Task Force on Data Science and Advanced Analytics 2013an sustatu zuten, ostera, bere lehenengo nazioartekokonferentzia 2014an egin zen. 2015ean Springer-ekInternational Journal on Data Science and Analytics argitara eman zuen datu zientzietako lan originalak argitaratzeko.

Aplikazioak

[aldatu |aldatu iturburu kodea]

Marketinan

[aldatu |aldatu iturburu kodea]

Netflixek,multimedia edukia ematen duen enpresaestatubatuarrak,algoritmoen bidez erabiltzaileak duen kontsumo ohitura aztertzen duen plataforma eskaintzen die bere 120 milioi erabiltzaileei. Identifikatzeko zein diren bilatzen dituzten edukiak eta interesezkoa izan dezaketena determinatzeko. Metatzen den informazio guztia zehazki aztertua izateko erabiltzen da, erabiltzailearengandik ikasteko eta gomendio zuzenak eman ahal izateko.

Gobernantzan

[aldatu |aldatu iturburu kodea]
Open Data Euskadi (logoa)

Eusko Jaurlaritzak konpromisoa hartu du bere esku dauden datu publikoak irekitzeko, eta hauek biltzen eta eskaintzen dituenOpen Data Euskadiwebgunea publikatu zen 2010ean. Alegia, Jaurlaritzaren eta bere menpeko erakundeen datu-irekien ataria.Administrazio publikoko datuak formatu berrerabilgarrietan irekitzea da sustatu nahi dena, gizarte-balioa sortzea eta herri-administrazioa eraginkorragoa eta gardenagoa lortzeko helburuarekin. Beste herri-administrazio batzuekin lankidetzan dagoen plataforma ere bada, esaterako,Espainiako Gobernuaren etaEuropar Batasunaren datu-katalogoetan ere publikatzen ditu bere datu-multzoak. Herritarren parte-hartzea metodo aberasgarritzat hartzen dute, datu-irekien eta informazio publikoaren berrerabilpenaren inguruko zenbaitlehiaketa, ekitaldi eta ikastaro antolatuz.[1]

Osasunean

[aldatu |aldatu iturburu kodea]

Osasun arloan datu-iturburuheterogeneo anitzekgaixoekin,gaixotasunekin etaosasun-zentroekin erlazionatutako informazio kantitate handiak deskribatzen dituzte. Analisi sakon eta egoki baten ondorioz, garrantzizko erabilgarritasuna izan dezakeena sanitarioentzat.Historia-klinikoek etamedikuntza-dispositiboek, osasun-datuak eskaintzen dituzte aurrerago erabakiak hartzera eramaten dutenak eta datu horien ikerketa egoki baten euskarriak gaixoei osasun-zerbitzu hobekiago bat bermatzen du.Informazio-analisi teknika berriek baliabide sanitarioak modu eraginkorragoan erabiltzea baimendu dute, baitasintometatik abiatuta gaixotasunak aurresatea edo gaixoari txostena automatikoki egitea ere.

Finantzan

[aldatu |aldatu iturburu kodea]

Norbanakoen premiak etamerkatuaren egungo egoera zein den aztertu dezake datuen zientziak. Sektore zehatz batean lehian daudenenpresa ugari daude eta ezinbestekoa dute jakitea zer den momentu orobezero potentzialek nahi dutena.Internet bidezko bilaketek edo egindako galdeketek bezeroari buruzko informazioa eskuratzea egiten dute, zer eta zein neurritanproduktua behar duten enpresei jakiten ahalbidetzen dute, datu hauen prozesaketa batek merkatuanhazkunde ekonomikoak sorraraziz.

Datu zientzialaria

[aldatu |aldatu iturburu kodea]

Datu zientzian jarduten den jakitunari datu zientzialaria deritzo.Master in Data Science masterraren arabera, estatistikoen,informatikarien eta sormenerako pentsatzailearen nahasketa da, hurrengo trebetasunekin:

  • Hainbatdatu-basetatik baliozko informazioa erauzteko, biltzeko eta prozesatzekoa.
  • Bere ondorioak eta emaitzak datu zientzialariak ez direnei komunikatzeko, bistaratzeko eta ulertarazteko gaitasuna.
  • Datuetan oinarritutakosoluzioak sortzeko,kostuak murrizteko etamozkinak handiagotzeko gaitasuna.
  • Maila guztietako etaindustria guztietako datuetan oinarritutako proiektuei aurre egiteko ahalmena.

Proposatzen zaizkion auziei erantzuna emateko gai izan behar da. Horretarako, datu zientzialari batek jarraitzen duen prozesua hurrengo urratsetan labur daiteke:

  1. Datuak erauzi, edozein bolumenetakoak, haien iturria edozein dela ere.
  2. Datuak iragazi, emaitzetan oztopa dezaketenak ezabatu.
  3. Datuak prozesatumetodo estatistikoak erabiliz. Esaterako,erregresio ereduak, hipotesi-probak,inferentzia-estatistikoa, etab.
  4. Behar izatekotansaiakuntza gehigarriak diseinatu
  5. Ikerketan esanguratsuak diren datuen bistaratzegrafikoak sortu.

Estatistikandoktorea denNathan Yau-k zehaztu zuen: datu zientzialariaAPIak, datu-baseak, eta datuen erauzketak egiten ikasi behar duen estatistikoa da.Programatzen ikasi beharko duendiseinatzailea, eta adierazgarriak diren datuen lorpena etaanalisia egiten jakin behar duenkonputologoa da.

Erlazionatutako alorrak

[aldatu |aldatu iturburu kodea]

Big Data

[aldatu |aldatu iturburu kodea]

Datu zientziaren etaBig Dataren arteko desberdintasunak adieraziko dira hurrengo taulan[2].

Datu zientzia vs Big Data
Datu zientziaBig Data
Erabilpen zientifikora

bideratutako datuak

Datu-bolumen handiak
Teknikak biltzen dituen

alor espezializatua

Datu-iturri desberdinek

sortutako zenbait datu-mota

Big Data erabili negozio

erabakietarako

Abiaduragatik, bolumenagatik

aniztasunagatik bereiztua

Erabakiak hartzeko euskarriaNegozio-prozesuak optimizatzeko

Datu meatzaritza

[aldatu |aldatu iturburu kodea]

Datu zientziaren etadatu meatzaritzaren arteko desberdintasunak adieraziko dira hurrengo taulan[3].

Datu zientzia vs Datu meatzaritza
Datu zientziaDatu meatzaritza
ArloaTeknika
Ikasketa zientifikoaNegozio prozesua
Diziplina anitzekoaAzpimultzoa
Eredu anitzeko datuakDatu egituratutak
Analisi soziala eta

aurresateko modeloen kreazioak

Joeren bilaketa

Erreferentziak

[aldatu |aldatu iturburu kodea]
  1. Vasco, Eusko Jaurlaritza-Gobierno. «Open Data Euskadi, Eusko Jaurlaritzaren datu irekiak - Euskadi.eus» opendata.euskadi.eus (Noiz kontsultatua: 2019-11-21).
  2. (Ingelesez)«Big Data vs Data Science - How Are They Different ?» EDUCBA 2018-02-17 (Noiz kontsultatua: 2019-11-21).
  3. (Ingelesez)«9 Awesome Difference Between Data Science Vs Data Mining» EDUCBA 2018-03-04 (Noiz kontsultatua: 2019-11-21).

Kanpo estekak

[aldatu |aldatu iturburu kodea]
Autoritate kontrola

"https://eu.wikipedia.org/w/index.php?title=Datu_zientzia&oldid=8565575"(e)tik eskuratuta
Kategoriak:

[8]ページ先頭

©2009-2025 Movatter.jp