fordeling
Fordeling er en oversikt over frekvensene for alle verdiene på envariabel. Man skiller mellom observertestatistiske fordelinger (frekvens- eller hyppighetsfordelinger) og teoretiske fordelinger (sannsynlighetsfordelinger).
Faktaboks
- Uttale
fordeling
I et statistisk materiale der det for hvert individ (hver observert enhet) er observert ett eller flere kjennetegn, som alder, inntekt eller lignende, kan man for eksempel finne fordelingen av individene etter alder. Man deler inn materialet i aldersklasser og teller hvor mange individer det er i hver klasse.
Fordelingen kan angis i absolutte tall, relative tall (andel) eller prosent. Det kan også settes opp en toveisfordeling etter for eksempel alder og kjønn, en treveisfordeling etter tre kjennetegn, og så videre.
Statistiske mål
En fordeling kan karakteriseres ved ulike statistiske mål:
- etgjennomsnitt kan angi hvor tyngdepunktet eller kanskje den mest typiske verdi i fordelingen ligger
- etspredningsmål antyder hvor tett eller spredt observasjonene ligger rundt gjennomsnittet.
Vanlige gjennomsnittsmål er detaritmetiske middeltall, som er summen av observasjonene delt på antallet, ogmedianen eller midttallet, som ligger midt i det observerte materialet. Medianen er altså den midterste verdien når vi ordner observasjonene etter stigende verdi.
Blant spredningsmålene erstandardavviket (engelskstandard deviation) det vanligste. Kvadratet av standardavviket kallesvariansen. Denne finner man ved å ta differensen mellom observert verdi og gjennomsnitt for alle observasjonene,kvadrere disse differensene og dele summen av dem med antall individer.
Eksempel
Følgende tabell viser fordelingen av alder blant innbyggerne i Norge i 2003:
Alder | Antall | Relative tall (andel) | Prosent |
---|---|---|---|
0–9 år | 601 119 | 0,132 | 13,2 |
10–19 år | 581 289 | 0,128 | 12,8 |
20–29 år | 579 679 | 0,127 | 12,7 |
30–39 år | 697 355 | 0,153 | 15,3 |
40–49 år | 634 556 | 0,139 | 13,9 |
50–59 år | 585 481 | 0,129 | 12,9 |
60–69 år | 361 907 | 0,080 | 8,0 |
70–79 år | 305 803 | 0,067 | 6,7 |
over 80 år | 205 063 | 0,045 | 4,5 |
Til sammen | 4 552 252 | 1,000 | 100 |
For et slikt materiale ordnet i en klasser, kan man finne tilnærmede verdier av disse målene. Ved å henføre antallene til midtpunktene i klasseintervallene, er det aritmetiske gjennomsnittet av personenes alder tilnærmet lik
[(601 119 × 5) + (581 289 × 15) + (579 679 × 25) + (697 355 × 35) + (634 556 × 45) + (585 481 × 55) + 361 907 × 65) + (305 803 × 75) + (205 063 × 85)]/4 552 252 = 38,5 år.
Medianen, den midterste verdien når personene ordnes etter alder, ligger i klasseintervallet 30−39 år, nær 37 år. Variansen blir tilnærmet lik
[601 119 × (5 − 38,5)² + 581 289 × (15 − 38,5)² + ... + 205 063 × (85 − 38,5)²]/4 552 252 = 527,4.
Standardavviket blir dermed 23 år.
Istatistisk metodelære definerer man teoretiske fordelinger som angir sannsynligheter for de forskjellige verdiene (eller intervaller av verdier) av enstokastisk variabel. For eksempel sannsynligheten for at alderen til en tilfeldig valgt person skal falle i bestemte intervaller på skalaen. Eksempler er denbinomiske fordelingen ognormalfordelingen. Se ogsåmålefeil.
Det defineres også teoretiske statistiske mål på fordelingers midtpunkt og spredning; forventningsverdien, som tilsvarer det aritmetiske gjennomsnittet (sestatistisk forventning), og det teoretiske standardavviket.
Les mer i Store norske leksikon
Litteratur
- Lillestøl, Jostein:Sannsynlighetsregning og statistikk, 5. utg., 1997
- Sverdrup, Erling:Lov og tilfeldighet, b. 1, 2. utg., 1973
Kommentarer (1)
skrevsiv camilla michaelsen
Kommentarer til artikkelen blir synlig for alle. Ikke skriv inn sensitive opplysninger, for eksempel helseopplysninger. Fagansvarlig eller redaktør svarer når de kan. Det kan ta tid før du får svar.
Du må være logget inn for å kommentere.
Fagansvarlig forSannsynlighetsteori
