Statistiko estasscienco pri la metodoj por kolekti, analizi kaj interpreti empiriajnnombrajn donitaĵojn kaj por prezenti la rezultojn. Tio fariĝas komplike, kiam la donitaĵoj kaj la interdependoj ne estas tute konataj, estas neprecizaj aŭ tro multenombraj por esti detale traktataj. Statistiko estas rimedo por komparisciencan teorion kun la reala mondokaj por serĉi novajn interrilatojn por nova teorio.
Fojfoje oni renkontas la vortonstatistiko (minuskle kaj ofte plurale) ankaŭ por bazajstatistikaĵoj: statistikaj datumoj,tabeloj kaj aliaj statistikaj datum-prezentoj. Tio imitas uzadon en iuj gentaj lingvoj, sed en Esperanto tia malpreciza uzado impresas nenature, eĉ misgvide, kaj estas evitinda.
Ladedukta statistiko, kiu dediĉas sin al la generado de lamodeloj, deduktoj kaj antaŭdiroj asociitaj al la fenomenoj studataj konsiderante lahazardecon de la observoj. Oni ĝin uzas pormodeli regulojn en la datumoj kaj ĉerpi konkludojn. Ĉi tiuj deduktaĵoj povas preni la formon de respondoj al demandoj se/ne (provo de hipotezo), alpreno de nombraj karakterizaĵoj,prognozoj de futuraj observoj, priskriboj de asocio (korelacio) aŭ modelado de rilatoj inter variabloj. Aliaj teknikoj de modelado estasanova,serioj de tempo kajminado de datumoj.
Ambaŭ branĉoj apartenas al laaplikita statistiko. Estas ankaŭ disciplino nomatamatematika statistiko, kiu referencas al la teoriaj bazoj de la materio. La vorto «statistikoj» ankaŭ aludas al la rezulto apliki algoritmon statistikan al aro de datumoj, kiel enekonomiaj,kriminalaj statistikoj, inter aliaj.
La germana terminoStatistik, kiu estis unue enkondukita deGottfried Achenwall (1749), referencis origine al la analizo dedatumoj de laŜtato, tio estas, la "scienco de la ŝtato" (ankaŭ nomataaritmetika politiko laŭ ĝia rekta traduko).[1] La terminostatistiko akiris la signifon de kolektado kaj klasifikado de datumoj nur en la 19a jarcento. Ĉi tiun koncepton enkondukis angloJohn Sinclair.
La verko de Bernoulli nomeArs Conjectandi estis la unua verko kiu temas priProbablo-teorio kiel ĝi kompreneblas aktuale.
Formalaj studoj pri dedukta statistiko datiĝas el arabajmatematikistoj kajkriptografoj, dum laIslama Orepoko inter la 8-a kaj la 13-a jarcentoj.Al-Ĥalil (717–786) verkis laLibron de Kriptografiaj Mesaĝoj, kiu enhavas unu el la unuaj uzoj depermutaĵoj kajkombinaĵoj, por listigi ĉiujn eblajnarablingvajn vortojn kun kaj sen vokaloj.[2] La verko deAl-Kindi nomeManuskripto pri Deĉifrado de Kriptografiaj Mesaĝoj havigis detalan priskribon kiel uzi analizon pri frekvencoj por deĉifriĉifritajn mesaĝojn, havigante fruan ekzemplon de dedukta statistiko pordekodigi. Ibn Adlan (1187–1268) poste faris gravan kontribuon al la uzado de montrogrando en analizo pri frekvencoj.[2]
La termino 'statistiko' estis enkondukita fare de la itala fakulo Girolamo Ghilini en 1589 reference al tiu scienco.[3][4] La plej frua verko enhavanta statistikojn en Eŭropo datiĝas el 1663, pro la publikigo de la verkoNatural and Political Observations upon the Bills of Mortality deJohn Graunt.[5] Fruaj aplikaĵoj de statistika pensaro temis pri la bezonoj de ŝtatoj bazi sian politikon sur demografiaj kaj ekonomiaj datumoj, kaj el tio devenas la etimologio de statistiko elŝtato. La alrigardo de la fako statistiko ampleksiĝis en la komenco de la 19-a jarcento por inkludi la kolektadon kaj analizon de ĝeneralaj datumoj. Nuntempe, statistiko estas amplekse uzata en politiko, aparte regado, negocado, kaj naturaj kaj sociaj sciencoj. Malfacile oni povas nun atenti gazetaron aŭ televidan novaĵprogramon netrafinte statistikojn.
Carl Friedrich Gauss faris gravajn kontribuojn al la probablistikaj metodoj kondukantaj al statistiko.
La matematikaj fundamentoj de statistiko disvolviĝis el studoj prihazardludoj inter matematikistoj kielGerolamo Cardano,Blaise Pascal,Pierre de Fermat, kajChristiaan Huygens. Kvankam la ideo deprobablo estis jam pritraktita en antikva kaj mezepoka juro kaj filozofio (kiel ĉe la verkaro deJuan Caramuel), laprobabloteorio kiel matematika fako formiĝis nur en la plej frua komenco de la 17-a jarcento, partikulare en la postmorta verko de Jacob Bernoulli nomeArs Conjectandi.[6] Tiu estis la unua libro en kiu la temoj de hazardludoj kaj de probableco (kiuj postulis opinion, pruvaron kaj argumentojn) estis kombinitaj kaj submetitaj al la matematika analizo.[7][8] La metodo de "malplej nombraj kvadratoj" estis por la unua fojo priskribita deAdrien-Marie Legendre en 1805, kvankamCarl Friedrich Gauss supozeble uzis ĝin unu jardekon antaŭe, nome en 1795.[9]
La moderna fako de statistiko aperis fine de la 19-a kaj komenco de la 20-a jarcentoj en tri etapoj.[10] La unuan ondon, fine de la jarcento, enkondukis la verkaroj deFrancis Galton kajKarl Pearson, kiuj transformis statistikon en rigore matematika fako uzebla por analizoj, ne nur en scienco, sed ankaŭ en ekonomio kaj politiko. La kontribuoj de Galton inkludis la enkondukon de la konceptoj denorma devio,korelacio,analizo de regreso kaj la aplikadon de tiuj metodoj al la studo de la varieco de homaj trajtoj — alto, pezo kaj eĉ longo de okulharoj inter aliaj.[11]
Karl Pearson, fondinto de la matematika statistiko.
Pearson disvolvis la korelacian koeficienton de Pearson difinita per produkt-momanto,[12] lametodon de momantoj por la kongruigo de distribuaĵoj al montraĵoj kaj laPearson distribuon, inter multaj aliaj konceptoj.[13] Galton kaj Pearson fondisBiometrika nome la unua scienca gazeto pri matematika statistiko kajbiostatistiko (tiam nomita biometrio), kaj la laste menciita fondis la unuan universitatan statistikan departementon en la mondo nome en laUniversitato-Kolegio de Londono.[14]
La duan ondon, de la 1910-aj kaj la 1920-aj jaroj, iniciatisWilliam Sealy Gosset, kaj atingis sian kulminon en la alrigardoj fare deRonald Fisher, kiu verkis la lernolibrojn kiuj difinos la akademian fakon en universitatoj tra la tuta mondo. La plej gravaj publikaĵoj de Fisher estis lia ŝlosila artikolo de 1918 nomeThe Correlation between Relatives on the Supposition of Mendelian Inheritance (Korelacio inter parencoj pri supozoj de mendela heredo) kiu estis la unua verko kiu uzis la poste tre utilan statistikan terminon,varianco), lia klasika verko de 1925 nomeStatistical Methods for Research Workers (Statistikaj metodoj por esploristoj) kaj lia verko de 1935 nomeThe Design of Experiments (Dezajno de eksperimentoj),[15][16][17] en kiu li disvolvis rigorajn modelojn por dezajno deeksperimentoj.
Ronald Fisher estis grava disvolvanto de statistiko.
Fisher kreis la konceptojn de "sufiĉeco" kaj "komplementa statistiko", ladiskriminantan analitikon de Fisher kaj la "informaron de Fisher".[18] Li ankaŭ stampis la terminon "nula hipotezo" dum la eksperimento de la "Sinjorino tegustumanta", kio "estas neniam pruvita aŭ establita, sed ĝi estas eble dispruvita, laŭ la daŭro de la eksperimentado".[19][20] En sia libro de 1930 nomeThe Genetical Theory of Natural Selection (La genetika teorio de natura selektado), li aplikis statistikon al variajbiologiaj konceptoj kiel la "principo de Fisher"[21] (kion A. W. F. Edwards nomis "probable la plej fama argumento enevolucia biologio") kaj la "modelo de natura selektado pere de masklornamo de Fisher",[22][23][24][25][26][27] koncepto priseksa selektado pri pozitiva reenfuĝa efiko troviĝanta enevolucio.
La fina ondo, kiu ĉefe konsistis el rafinado kaj ekspansio de pli fruaj disvolviĝoj, aperis el la kunlabora verkado inter Egon Pearson kaj Jerzy Neyman en la1930-aj jaroj. Ili enkondukis la konceptojn de eraroj "Tipo II", "statistika povo" kajkonfidintervaloj. Jerzy Neyman en 1934 montris, ke tavoligita hazarda montraĵaro estas ĝenerale pli bona metodo de ĉirkaŭkalkulado ol la celita (kvota) montraĵaro.[28]
Aktuale, statistikajn metodojn oni aplikas en ĉiaj fakokampoj, kiuj postulas decidfaradon, por atingi akuratajn inferencojn el kolektita korpuso de datumoj kaj por decidfarado antaŭ necerteco bazite sur statistika metodologio. La uzado de modernajkomputiloj ebligis faradon de grandskalaj statistikaj komputadojn kaj ebligis ankaŭ novajn metodojn kiuj estis nepraktike plenumeblaj permane. Statistiko plue estas areo de aktiva esplorado, por ekzemplo por la problemo kiel analizidatumaregon (anglebig data).[29]
Christiaan Huygens donis la unuan sciencan traktadon de la fako
La metodoj statistika-matematikaj emerĝis de la teorio deprobablo, kiu datiĝas de la mesaĝado inter Blaise Pascal kaj Pierre de Fermat (1654).Christiaan Huygens (1657) donis la unuan sciencan traktadon de la fako. LaArs coniectandi (postmorta,1713) de Jakob Bernoulli kaj laDoktrino de ebloj (1718) deAbraham de Moivre studis la disciplinon kiel branĉo de la matematikoj. En la moderna erao, la laboro deAndrej Kolmogorov estis kolono en la formulado de la fundamenta modelo de probablo-teorio, kiu estas uzita tra la statistiko.
Hodiaŭ la uzo de la statistiko etendiĝis for de ĝiaj originoj kiel servo al laŜtato aŭ al la registaro. Personoj kaj organizoj uzas statistikon por kompreni datumojn kaj preni decidojn en sociaj kaj naturaj sciencoj, medicino, negocoj kaj aliaj areoj. La statistiko estas komprenita ĝenerale ne kiel sub-areo de la matematikoj sed kiel malsama scienco «aliancita». Multajuniversitatoj havas akademiajn fakojn de matematiko kaj statistiko aparte. La statistiko instruas en fakoj tiel diversaj kielpsikologio,eduko kajpublika sano.
Regresa statistiko estas unu el aro da statistikaj metodoj tre uzataj por analizi rilaton de dependa variablo al unu aŭ pluraj aliaj nedependaj variabloj. Pli specife, regreso helpas komprenigi, kiel tipa valoro de dependa variablo ŝanĝas, kiam unu el la nedependaj variabloj varias, dum la aliaj nedependaj variabloj restas senŝanĝaj. Regresanalizo estas vaste uzata por prognozo kaj antaŭvido, kiam la laborkampo proksimiĝas alartefarita intelekto.
Granda aro da teĥnikoj por trakti analizojn estis realigitaj. Konataj metodoj, kiel la lineara regreso kaj la metodo de kvadrataj minimumoj, estas parametraj regresoj, ĉar ilia regresofunkcio, kiu bildigas la problemon, estas difinita per finia nombro da nekonataj parametroj, kiuj estas laŭtaksataj el la datenoj. Neparametraj regresoj estas malpli konataj, kaj rilatas al teĥnikoj, kiuj permesas regresojn ligitajn al specifa aro da funkcioj, kun okazeble nefiniaj dimensioj.
Statistika mekaniko, unu el la pilieroj de la modernafiziko, priskribas kiel makroskopaj observoj (kieltemperaturo kajpremo) estas rilataj al mikroskopaj parametroj kiuj fluktuas averaĝe. Ĝi konektas termodinamikajn kvantojn (kielvarmokapacito) al mikroskopa konduto, dum, enklasika termodinamiko, la nura disponebla eblo estus la mezuro kaj tabeligo de tiaj kvantoj por variaj materialoj.[30]
↑"Statistik" enDigitales Wörterbuch der deutschen Sprache
↑2,02,1 (1 November 2011) “An Account of Early Statistical Inference in Arab Cryptology”,The American Statistician65 (4),p. 255–257.doi:10.1198/tas.2011.10191. 123537702.
↑ (2014) “The emergence of statistical science”,Śląski Przegląd Statystyczny12 (18),p. 76–77.doi:10.15611/sps.2014.12.04.
↑Willcox, Walter (1938) "The Founder of Statistics".Review of the International Statistical Institute 5(4): 321–328. JSTOR 1400906
↑J. Franklin,The Science of Conjecture: Evidence and Probability before Pascal, Johns Hopkins Univ Press. 2002
↑Schneider, I. (2005). Jakob Bernoulli,Ars Conjectandi (1713). En I. Grattan-Guinness (eld.),Landmark writings in Western Mathematics, 1640-1940 (pp. 88-103).
↑Box, JF (Februaro 1980). “R.A. Fisher and the Design of Experiments, 1922–1926”, 'The American Statistician'34 (1),p. 1–7.doi:10.2307/2682986.
↑Yates, F (June 1964). “Sir Ronald Fisher and the Design of Experiments”, 'Biometrics'20 (2),p. 307–321.doi:10.2307/2528399.
↑ (1966) “The Influence of Fisher's "The Design of Experiments" on Educational Research Thirty Years Later”,American Educational Research Journal3 (3),p. 223–229.doi:10.3102/00028312003003223. 145725524.
↑OED quote:1935 R.A. Fisher,The Design of Experiments ii. 19, "We may speak of this hypothesis as the 'null hypothesis', and the null hypothesis is never proved or established, but is possibly disproved, in the course of experimentation."
↑Fisher|1971|loc=Chapter II.The Principles of Experimentation, Illustrated by a Psycho-physical Experiment, Section 8. "The Null Hypothesis"
↑ (1998) “Natural Selection and the Sex Ratio: Fisher's Sources”,American Naturalist151 (6),p. 564–569.doi:10.1086/286141. 40540426.
↑Fisher, R.A. (1915) The evolution of sexual preference. Eugenics Review (7) 184:192
↑Fisher, R.A. (1930)The Genetical Theory of Natural Selection.(ISBN 0-19-850440-3)
↑Edwards, A.W.F. (2000) Perspectives: Anecdotal, Historical and Critical Commentaries on Genetics. The Genetics Society of America (154) 1419:1426
↑Andersson, M. kaj Simmons, L.W. (2006)Sexual selection and mate choice. Trends, Ecology and Evolution (21) 296:302
↑Gayon, J. (2010)Sexual selection: Another Darwinian process. Comptes Rendus Biologies (333) 134:144
↑ (1934) “On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection”, 'Journal of the Royal Statistical Society'97 (4),p. 557–625.doi:10.2307/2342192.
↑ Tolman, R. C. (1938). The Principles of Statistical Mechanics. Dover Publications.ISBN 9780486638966.
↑ Balescu, Radu (1975). Equilibrium and Non-Equilibrium Statistical Mechanics. John Wiley & Sons.ISBN 9780471046004.
↑ La terminostatistika mekaniko estas foje uzata por referenci nur alstatistika termodinamiko. Tiu artikolo sekvas la larĝan rigardon. Laŭ kelkaj difinoj,statistika fiziko estas eĉ pli larĝsenca termino kun statistikaj studoj de ajna tipo de fizika sistemo, sed ĝi estas ofte komprenita kiel sinonimo kun statistika mekaniko.
Best, Joel (2001). Damned Lies and Statistics: Untangling Numbers from the Media, Politicians, and Activists. University of California Press.ISBN 0-520-21978-3.
Hacking, Ian (1990). The Taming of Chance. Cambridge University Press.ISBN 0-521-38884-8.
Lindley, D. V. (1985). Making Decisions (2a eldono). John Wiley & Sons.ISBN 0-471-90808-8.
Stigler, Stephen M. (1990). The History of Statistics: The Measurement of Uncertainty before 1900. Belknap Press/Harvard University Press.ISBN 0-674-40341-X.
Tijms, Henk (2004). Understanding Probability: Chance Rules in Everyday life. Cambridge University Press.ISBN 0-521-83329-9.
Volle, Michel (1984). Le métier de statisticien (2a eld.). Económica.ISBN 2-7178-0824-8. rete
Bernard Delmas, Statistique descriptive pour l’économie et la gestion, Presses Universitaires du Septentrion, 2009 (ISBN 978-2-7574-0074-6).
Olivier Martin, L'enquête et ses méthodes : l'analyse de données quantitatives, Paris, Armand Colin, 2005 puis 2009.
Michel Volle, Histoire de la statistique industrielle, Economica, 1982,ISBN 2-7178-0520-6, rete.
Georges Hostelet, Le concours de l’analyse mathématique à l’analyse expérimentale des faits statistiques, Paris, Hermann, Actualités Scientifiques et Industrielles, no 585), 1937, 70 pp.
Stéphanie Dupays, "Déchiffrer les statistiques économiques et sociales" Ed. Dunod, 2008,ISBN 2-10-051584-5
Alain Desrosières, La politique des grands nombres : histoire de la raison statistique, Paris, La Découverte, 2000 (ISBN 978-2-7071-6504-6) (2004). La política de los grandes números. Ed. Melusina.ISBN 84-933273-5-2.
Anders Hald, A History of Mathematical Statistics, New-York, Wiley, 1998 (ISBN 0-471-17912-4)
David Salsburg, The Lady Tasting Tea : How statistics revolutionized science in the twentieth century, Holt McDougal, mai 2002, 1e éd. (ISBN 978-0-8050-7134-4)