Bijrekenen en in dewiskunde is hetgemiddelde of degemiddelde waarde een begrip dat veelvuldig voorkomt. Het bekendste is hetrekenkundig gemiddelde: desom van een aantalgetallen gedeeld door het aantal getallen.
In destatistiek wordt het begrip gemiddelde veel gebruikt. We moeten hierbij onderscheiden of het om de gehelepopulatie gaat of om eensteekproef daaruit.
In de statistiek wordt het populatiegemiddelde van een kenmerkende grootheid vaak aangeduid met deGriekse letter
. Voor een eindige populatie is het populatiegemiddelde niets anders dan het rekenkundig gemiddelde van alle populatiewaarden.
Bijaselecte trekking van een waarde
van die grootheid uit de populatie, is dekansverdeling van
de populatieverdeling, met als gevolg dat deverwachtingswaarde van
gelijk is aan het populatiegemiddelde.
Heeft
een discrete verdeling metkansfunctie
, dan is de verwachtingswaarde gedefinieerd door:

Als
een continue verdeling heeft metkansdichtheid
, dan is de verwachtingswaarde gedefinieerd door:

Het is echter vaak onmogelijk om het populatiegemiddelde te bepalen. Is men bijvoorbeeld geïnteresseerd in het gemiddelde gewicht van deSumatraanse neushoorn, dan kan men dat gewoon bepalen, omdat er nog maar zo'n 250 van zijn. Bij muskieten ligt dat echter heel anders. Er zijn er gewoon te veel om ze allemaal te kunnen onderzoeken. In zo'n geval nemen statistici hun toevlucht tot eensteekproef om door de berekening van het steekproefgemiddelde eenschatting te krijgen van het populatiegemiddelde.
Het steekproefgemiddelde is het rekenkundige gemiddelde van de steekproef. Als de steekproefuitkomst bestaat uit de
elementen
, dan is het steekproefgemiddelde het getal:

In de theorie is men niet zozeer geïnteresseerd in de uitkomsten, maar in het stochastisch gedrag van de steekproef. De steekproef bestaat uit de
stochastische variabelen
en het steekproefgemiddelde is de variabele:

Het steekproefgemiddelde
wordt vaak gebruikt om iets te zeggen over het populatiegemiddelde
. Het wordt dan opgevat als een realisatie van het steekproefgemiddelde
. Daar zitten echter een paar haken en ogen aan. Als de steekproefaselect was, is het steekproefgemiddelde een goede benadering, of schatting, van het populatiegemiddelde. Dan zijn de steekproefelementen
onderling onafhankelijk engelijkverdeeld, b.v. als
, zodat, mits
bestaat:

Als bovendien
, geldt ook:

Hoe goed deze benadering is, hangt nog van vele factoren af, zoals van de steekproefomvang en de onderliggende verdeling. Wanneer het aantal proeven voldoende is, is daarmee voor de steekproef eenwet van de grote aantallen bepaald. Er zijn verdelingen die geen populatiegemiddelde bezitten, omdat de bovenstaande integraal niet bestaat.
Gelukkig kunnen we vaak veronderstellen dat de onderliggende verdelingnormaal is. Dan speelt naast de verwachtingswaarde alleen destandaardafwijking een rol, waarvan we de waarde ook uit de steekproef kunnen schatten.
Onderwerpen uit de beschrijvende statistiek