Movatterモバイル変換


[0]ホーム

URL:


Naar inhoud springen
Wikipediade vrije encyclopedie
Zoeken

Kwantiel

Uit Wikipedia, de vrije encyclopedie

In destatistiek is eenkwantiel een getal dat eenmultiset van getallen verdeelt in twee delen: het deel met de kleinere en het deel met de grotere getallen. De verzameling kan een concrete of abstractepopulatie zijn of de uitkomsten van eensteekproef. Voor het getal0<p<1{\displaystyle 0<p<1}, en een verzameling met omvangT{\displaystyle T}, verdeelt hetp{\displaystyle p}-kwantiel de verzameling in een deel met de kleinere waarden met omvangpT{\displaystyle p\cdot T} en een deel met de grotere waarden met omvang(1p)T{\displaystyle (1-p)\cdot T}. Een bekend kwantiel is demediaan, het 0,5-kwantiel, dat het midden is van de rij van in volgorde van grootte geplaatste getallen.

Spraakgebruik

[bewerken |brontekst bewerken]

De specifiekere termenpercentiel,deciel enkwartiel worden in de praktijk ook gebruikt voor de betreffende delen van dedataset. Bij een verdeling in tien delen bijvoorbeeld zijn er negen deelpunten, de decielend1,,d9{\displaystyle d_{1},\ldots ,d_{9}}, maar worden de tien delen ook wel aangeduid als decielen. Het eerste deciel bestaat dan uit de 10% van de populatie die volgens de gekozen ordening de kleinste zijn, de volgende 10% kleinsten vormen het tweede deciel en er is een tiende deciel van de 10% grootste. De genoemde percentages kunnen niet altijd exact gerealiseerd worden, maar worden zo goed mogelijk benaderd. Daarbij is het gebruik het minimum als ondergrens en het maximum als bovengrens te nemen. Deze worden dan officieus alsd0{\displaystyle d_{0}} end10{\displaystyle d_{10}} aangeduid.

Meerdere variabelen

[bewerken |brontekst bewerken]

Bij een dataset met meerdere variabelen met waarden in een geordende verzameling (zoals getallen) kan een populatie met betrekking tot verschillende variabelen geordend worden. Voor bijvoorbeeld een dataset met de inkomens en vermogens van huishoudens kan gekeken worden naar het gemiddelde inkomen per inkomensdeciel en het gemiddelde vermogen per vermogensdeciel. Voor de samenhang tussen beide variabelen kan ook naar het gemiddelde vermogen per inkomensdeciel gekeken worden.[1]

Definitie

[bewerken |brontekst bewerken]

Voor eenordinaal kenmerkX{\displaystyle X} van een abstracte populatie gegeven door eenkansverdeling is het getalxp{\displaystyle x_{p}} eenp{\displaystyle p}-kwantiel als:

P(Xxp)p{\displaystyle P(X\leq x_{p})\geq p}

en

P(Xxp)1p{\displaystyle P(X\geq x_{p})\geq 1-p}

In het bijzonder kunnen er dus meerderep{\displaystyle p}-kwantielen bestaan. Om eenduidigheid af te dwingen wordt door sommige auteurs het gemiddelde van de mogelijke waarden die als kwantiel in aanmerking komen, als kwantiel gedefinieerd.

In termen van deverdelingsfunctieFX{\displaystyle F_{X}} vanX{\displaystyle X} zijn de bovenstaande eisen:

FX(xp)p{\displaystyle F_{X}(x_{p})\geq p}

en

limxxpFX(x)p{\displaystyle \lim _{x\uparrow x_{p}}F_{X}(x)\leq p}

Bij eencontinue stochastische variabeleX{\displaystyle X} met strikt stijgende verdelingsfunctieFX{\displaystyle F_{X}} is hetp{\displaystyle p}-kwantiel de eenduidigexp{\displaystyle x_{p}} waarvoor geldt:

FX(xp)=p{\displaystyle F_{X}(x_{p})=p},

oftewel

xp=FX1(p){\displaystyle x_{p}=F_{X}^{-1}(p)}

Voor een concrete populatie of een steekproef, bestaande uitn{\displaystyle n} getallenx1,,xn{\displaystyle x_{1},\ldots ,x_{n}}, waaronder mogelijk gelijke, wordt hetp{\displaystyle p}-kwantielxp{\displaystyle x_{p}} bepaald door de eisen:

Hier geldt hetzelfde als in eendiscrete verdeling: als twee aangrenzende uitkomsten aan de eisen voldoen, neemt men het gemiddelde van beide als kwantiel.

In een abstracte of concrete populatie is een kwantiel eenparameter van de populatie. In een steekproef is een kwantiel eenschatting van het overeenkomstige kwantiel in de populatie waaruit de steekproef getrokken is.

Voorbeelden

[bewerken |brontekst bewerken]

Het 0,20-kwantielx0,20{\displaystyle x_{0{,}20}} in eenexponentiële verdeling met parameter 1 wordt bepaald door de vergelijking:

0,20=F(x0,20)=1ex0,20{\displaystyle 0{,}20=F(x_{0{,}20})=1-e^{-x_{0{,}20}}},

waaruit volgt:

x0,20=ln(0,80)=ln(5)ln(4){\displaystyle x_{0{,}20}=-\ln(0{,}80)=\ln(5)-\ln(4)}


Het 0,2-kwantiel van de (geordende) dataset van 9 data:

2,3,5,7,8,9,11,12,15{\displaystyle 2,3,5,7,8,9,11,12,15}

is het getal 3. Er zijn 2, dus ten minste 0,2×9=1,8 getallen kleiner dan of gelijk aan 3 en er zijn 8, dus ten minste 0,8×9=7,2 getallen groter dan of gelijk aan 3.

Van de dataset:

2,3,5,7,8,9,11,12,15,20{\displaystyle 2,3,5,7,8,9,11,12,15,20}

met 10 data voldoen zowel 3 als 5 aan de eisen. Het 0,2-kwantiel kwantiel is dus (3+5)/2 = 4. Het getal 4 scheidt de dataset mooi in een deel van 2 en een deel van 8 getallen.

Formule

[bewerken |brontekst bewerken]

Als de dataset een eindige populatie of een steekproefuitkomst betreft vann{\displaystyle n} elementen, is hetp{\displaystyle p}-kwantiel het "element" met alsrangnummer in de geordende data:

pn+12{\displaystyle pn+{\tfrac {1}{2}}}

Het woord "element" staat tussen aanhalingstekens, want niet altijd is dit rangnummer eengeheel getal. Als kwantiel wordt dan het gemiddelde van de omliggende elementen gekozen.

Speciale kwantielen

[bewerken |brontekst bewerken]

De kwantielen die behoren bij een verdeling in 2, 4, 10 of 100 delen hebben een aparte naam.Bij een verdeling in:

Bronnen, noten en/of referenties
Overgenomen van "https://nl.wikipedia.org/w/index.php?title=Kwantiel&oldid=66167832"
Categorie:

[8]ページ先頭

©2009-2025 Movatter.jp