Movatterモバイル変換

Aller au contenu

Échantillonnage (statistiques)

Modifier les liens

Un article de Wikipédia, l'encyclopédie libre.

Page d’aide sur l’homonymie

Pour les articles homonymes, voirÉchantillonnage.

Cet article est uneébauche concernant lesprobabilités et lastatistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations desprojets correspondants.

Exemple d'échantillonnage aléatoire

Enstatistique, l'échantillonnage — ou lesondage^{[réf. nécessaire]} — désigne les méthodes de sélection d'un sous-ensemble d'individus (unéchantillon) à l'intérieur d'unepopulation pour estimer les caractéristiques de l'ensemble de la population. Cette méthode présente plusieurs avantages : une étude restreinte sur une partie de la population, un moindre coût, une collecte des données plus rapide que si l'étude avait été réalisé sur l'ensemble de la population, la réalisation de contrôles destructifs, etc.

Les résultats obtenus constituent un échantillon. Sur un échantillon, on peut calculer différents paramètres statistiques de position (moyenne, etc.) ou de dispersion (écart type, etc.) issus de la statistique descriptive, de la même manière que l'on peut déterminer des paramètres statistiques d'une population par son recensement exhaustif.

On peut également déduire des propriétés de la population à partir de celles de l'échantillon parinférence statistique. D'après laloi des grands nombres, plus la taille de l'échantillon augmente, plus ses propriétés seront proches de celle de la population. En particulier, on peut estimer une probabilité sur les individus d'une population par la fréquence observée sur un échantillon si sa taille est suffisamment grande. Par ailleurs, une moyenne ou une proportion dans une population peuvent être estimés par unintervalle de confiance. Cette démarche est employée dans le cadre dessondages d'opinions ou lecontrôle statistique de la qualité.

La « fluctuation d'échantillonnage » désigne la variabilité des résultats provenant de la prise d'échantillon. Plus la taille des échantillons est grande, moins il y a de fluctuation due à l'échantillonnage. La « distribution d'échantillonnage » d'un paramètre statistique regroupe toutes les valeurs possibles de ce paramètre sur l'ensemble de tous les échantillons d'une certaine taille qui pourraient être prélevés dans la population.

On peut procéder de différentes manières pour collecter les données de l'échantillon, il existe en effet plusieurs méthodes d'échantillonnage.

L'Échantillonnage aléatoire simple : le tirage des individus de l'échantillon est aléatoire, c'est-à-dire que chaque individu a la même probabilité d'être choisi, et simple, c'est-à-dire que les choix des différents individus sont réalisés indépendamment les uns des autres.

L'Échantillonnage systématique : le premier individu est choisi de manière aléatoire, puis les suivants sont déterminés à intervalle régulier. Par exemple, dans un verger, on choisit au hasard le7^e pommier, puis les 27^e,47^e,67^e, etc.

L'Échantillonnage stratifié : on subdivise la population en plusieurs parties avant de prendre l'échantillon^[1].

L'Échantillonnage par quotas : la composition de l'échantillon doit être représentative de celle de la population selon certains critères jugés particulièrement importants. On utilise cette méthode pour réaliser lessondages d'opinions^{[réf. nécessaire]}.Jacques Dupâquier pour sa grande étude sur ladémographie française utilise avec des ajustements letrigramme TRA, rassemblant la première lettre dupatronyme des sujets de l'échantillon^[2]. Cette méthode fut préconisée également pour l'échantillonnage desarchives publiques jusqu'en 2014 où il est préconisé que seule la méthode systématique doit être retenue, le tri à partir de l'alphabet ou de la chronologie doit être abandonné^[3].

Références

[modifier |modifier le code]

↑Statistique théorique et appliquée, Tome 1 : Statistique descriptive et bases de l'inférence statistique -3^e édition, Pierre Dagnelie
↑Jacques DUPÂQUIER, « L'enquête des 3 000 familles »,Annales de démographie historique,n^o 107,‎2004,p. 7-18(lire en ligne)
↑DIAF, Circulaire : Cadre méthodologique pour l'évaluation, la sélection et l'échantillonnage des archives publiques, juillet 2014.

v ·m

Index du projet probabilités et statistiques

Théorie des probabilités

Bases théoriques

Principes généraux	Axiomes des probabilités Espace mesurable Probabilité Événement Tribu Indépendance Variable aléatoire Espérance Variables iid
Convergence de lois	Théorème central limite Loi des grands nombres Lemme de Borel-Cantelli
Calcul stochastique	Marche aléatoire Chaîne de Markov Processus stochastique Processus de Markov Martingale Mouvement brownien Équation différentielle stochastique

Lois de probabilité

Lois continues	Loi exponentielle Loi normale Loi uniforme Loi de Student Loi de Fisher Loi du χ²
Lois discrètes	Loi de Bernoulli Loi binomiale Loi de Poisson Loi géométrique Loi hypergéométrique

Mélange entre statistiques et probabilités

Intervalle de confiance

Interprétations de la probabilité

Bayésianisme

Théorie des statistiques

Statistiques descriptives

Bases théoriques	Une statistique Caractère Échantillon Erreur type Intervalle de confiance Fonction de répartition empirique Théorème de Glivenko-Cantelli Inférence bayésienne Régression linéaire Méthode des moindres carrés Analyse des données Corrélation
Tableaux	Tableau de contingence Tableau disjonctif complet Table de Burt
Visualisation de données	Histogramme Diagramme à barres Graphique en aires Diagramme circulaire Treemap Boîte à moustaches Diagramme en violon Nuage de points Graphique à bulles Diagramme en cascade Graphique en entonnoir Diagramme de Kiviat Corrélogramme Graphique en forêt Diagramme branche-et-feuille Heat map Sparkline
Paramètres de position	Moyenne arithmétique Mode Médiane Quantile Quartile Décile Centile
Paramètres de dispersion	Étendue Écart moyen Variance Écart type Déviation absolue moyenne Écart interquartile Coefficient de variation
Paramètres de forme	Coefficient d'asymétrie Coefficient d'aplatissement

Statistiques inductives

Bases théoriques	Hypothèse nulle Estimateur Signification statistique Sensibilité et spécificité Courbe ROC Nombre de sujets nécessaires Valeur p Contraste (statistiques) Statistique de test Taille d'effet Puissance statistique
Tests paramétriques	Test d'hypothèse Test de Bartlett Test de normalité Test de Fisher d'égalité de deux variances Test d'Hausman Test d'Anderson-Darling Test de Banerji Test de Durbin-Watson Test de Goldfeld et Quandt Test de Jarque-Bera Test de Mood Test de Lilliefors Test de Wald Test T pour des échantillons indépendants Test T pour des échantillons appariés Test de corrélation de Pearson
Tests non-paramétriques	Test U de Mann-Whitney Test de Kruskal-Wallis Test exact de Fisher Test de Kolmogorov-Smirnov Test de Shapiro-Wilk Test de Chow Test de McNemar Test de Spearman Tau de Kendall Test Gamma Test des suites de Wald-Wolfowitz Test de la médiane Test des signes ANOVA de Friedman Concordance de Kendall Test Q de Cochran Test des rangs signés de Wilcoxon Test de Sargan

Application
Économétrie Mécanique statistique Jeu de hasard Biomathématique Biostatistique Mathématiques financières

Portail des probabilités et de la statistique

Ce document provient de « https://fr.wikipedia.org/w/index.php?title=Échantillonnage_(statistiques)&oldid=221715149 ».

Statistiques

Catégories cachées :

[8]ページ先頭

©2009-2026 Movatter.jp