Enstatistique, l'échantillonnage — ou lesondage[réf. nécessaire] — désigne les méthodes de sélection d'un sous-ensemble d'individus (unéchantillon) à l'intérieur d'unepopulation pour estimer les caractéristiques de l'ensemble de la population. Cette méthode présente plusieurs avantages : une étude restreinte sur une partie de la population, un moindre coût, une collecte des données plus rapide que si l'étude avait été réalisé sur l'ensemble de la population, la réalisation de contrôles destructifs, etc.
On peut également déduire des propriétés de la population à partir de celles de l'échantillon parinférence statistique. D'après laloi des grands nombres, plus la taille de l'échantillon augmente, plus ses propriétés seront proches de celle de la population. En particulier, on peut estimer une probabilité sur les individus d'une population par la fréquence observée sur un échantillon si sa taille est suffisamment grande. Par ailleurs, une moyenne ou une proportion dans une population peuvent être estimés par unintervalle de confiance. Cette démarche est employée dans le cadre dessondages d'opinions ou lecontrôle statistique de la qualité.
La « fluctuation d'échantillonnage » désigne la variabilité des résultats provenant de la prise d'échantillon. Plus la taille des échantillons est grande, moins il y a de fluctuation due à l'échantillonnage. La « distribution d'échantillonnage » d'un paramètre statistique regroupe toutes les valeurs possibles de ce paramètre sur l'ensemble de tous les échantillons d'une certaine taille qui pourraient être prélevés dans la population.
On peut procéder de différentes manières pour collecter les données de l'échantillon, il existe en effet plusieurs méthodes d'échantillonnage.
L'Échantillonnage aléatoire simple : le tirage des individus de l'échantillon est aléatoire, c'est-à-dire que chaque individu a la même probabilité d'être choisi, et simple, c'est-à-dire que les choix des différents individus sont réalisés indépendamment les uns des autres.
L'Échantillonnage systématique : le premier individu est choisi de manière aléatoire, puis les suivants sont déterminés à intervalle régulier. Par exemple, dans un verger, on choisit au hasard le7e pommier, puis les27e,47e,67e, etc.
L'Échantillonnage stratifié : on subdivise la population en plusieurs parties avant de prendre l'échantillon[1].
L'Échantillonnage par quotas : la composition de l'échantillon doit être représentative de celle de la population selon certains critères jugés particulièrement importants. On utilise cette méthode pour réaliser lessondages d'opinions[réf. nécessaire].Jacques Dupâquier pour sa grande étude sur ladémographie française utilise avec des ajustements letrigramme TRA, rassemblant la première lettre dupatronyme des sujets de l'échantillon[2]. Cette méthode fut préconisée également pour l'échantillonnage desarchives publiques jusqu'en 2014 où il est préconisé que seule la méthode systématique doit être retenue, le tri à partir de l'alphabet ou de la chronologie doit être abandonné[3].