Sélection de l'échantillon dans la recherche quantitative

Les chercheurs quantitatifs sont souvent intéressés par la possibilité de faire des généralisations sur des groupes plus larges que leurs échantillons d’étude. Bien qu’il existe des cas où les chercheurs quantitatifs s’appuient sur des échantillons non probabilistes (par exemple, lors de recherches exploratoires ou d’évaluation), les chercheurs quantitatifs ont tendance à s’appuyer sur des techniques d’échantillonnage probabiliste. Les objectifs et les techniques associés aux échantillons probabilistes diffèrent de ceux des échantillons non probabilistes. Nous allons explorer ces objectifs et techniques uniques dans cet article.

Introduction à la sélection d’échantillons dans la recherche quantitative

L’objectif principal de l’échantillonnage est d’obtenir un échantillon représentatif, ou une petite collection d’unités ou de cas à partir d’une collection ou d’une population beaucoup plus grande, de sorte que le chercheur puisse étudier le plus petit groupe et produire des généralisations précises sur le plus grand groupe. Les chercheurs se concentrent sur des techniques spécifiques qui permettront d’obtenir des échantillons hautement représentatifs (c’est-à-dire des échantillons qui ressemblent étroitement à la population). Les chercheurs quantitatifs ont tendance à utiliser un type d’échantillonnage basé sur des théories de probabilité issues des mathématiques, appelé échantillonnage probabiliste.

Échantillonnage non probabiliste

L’échantillonnage non probabiliste est une technique d’échantillonnage dans laquelle chaque unité d’une population n’a pas une probabilité spécifiable d’être sélectionnée. En d’autres termes, l’échantillonnage non probabiliste ne sélectionne pas ses unités dans la population d’une manière mathématiquement aléatoire. Par conséquent, les échantillons non aléatoires produisent souvent des échantillons qui ne sont pas représentatifs de la population. Cela signifie également que notre capacité à en tirer des conclusions générales est très limitée.

Types de techniques d’échantillonnage non probabiliste

Echantillon aléatoire, accidentel ou de convenance

Une procédure d’échantillonnage dans laquelle un enquêteur sélectionne des cas de n’importe quelle manière qui convient pour les inclure dans l’échantillon. L’échantillonnage aléatoire peut produire des échantillons inefficaces et très peu représentatifs et n’est donc pas recommandé. Lorsqu’un chercheur sélectionne au hasard des cas qui lui conviennent, il peut facilement obtenir un échantillon qui représente très mal la population. De tels échantillons sont bon marché et rapides ; cependant, les erreurs systématiques qui se produisent facilement les rendent pires que l’absence totale d’échantillon.

Échantillonnage par quotas

L’échantillonnage par quotas est une amélioration par rapport à l’échantillonnage aléatoire. Dans l’échantillonnage par quotas, le chercheur commence par identifier les catégories de personnes concernées (par exemple, les hommes, les femmes, les moins de 30 ans, les plus de 30 ans), puis décide du nombre de personnes appartenant à chaque catégorie. Ainsi, le nombre de personnes dans les différentes catégories de l’échantillon est fixe.

Manifester un objectif ou un jugement

L’échantillonnage raisonné est un type d’échantillonnage acceptable dans des situations particulières. Il utilise un jugement d’expert pour sélectionner les cas ou sélectionne les cas dans un but spécifique. L’échantillonnage raisonné est le plus souvent utilisé lorsqu’il est nécessaire de mesurer une population difficile d’accès.

Échantillonnage en boule de neige

L’échantillonnage en boule de neige (également appelé échantillonnage par réseau, par chaîne de référence ou par réputation) est une méthode d’identification et d’échantillonnage des cas dans un réseau. Elle commence par un ou quelques individus ou cas et se développe sur la base de liens avec les cas initiaux.

Échantillonnage probabiliste

Technique d’échantillonnage dans laquelle chaque unité d’une population a une chance spécifique d’être sélectionnée. La raison de l’utilisation de l’échantillonnage probabiliste est de générer un échantillon qui est représentatif de la population dont il est tiré. Cela signifie plutôt que la plupart des échantillons aléatoires seront proches de la population la plupart du temps, et que la probabilité qu’un échantillon donné soit exact peut être calculée.

Le jargon de l’échantillonnage aléatoire

Élément d’échantillonnage

Un élément d’échantillonnage est l’unité d’analyse ou le cas dans une population à mesurer.

Population

Le grand ensemble des éléments d’échantillonnage d’une étude est la population ou l’univers. Malheureusement, ce n’est pas si simple. Le chercheur novice doit comprendre qu’une population est un concept abstrait. Comment une population peut-elle être un concept abstrait, alors qu’il y a un nombre donné de personnes à un moment donné ? Sauf dans le cas de petites populations spécifiques, vous ne pouvez jamais geler une population pour la mesurer. Parce qu’une population est un concept abstrait, sauf dans le cas de petites populations spécialisées (par exemple, tous les étudiants d’un cours de génie mécanique à l’université « Y » au printemps 2000), un chercheur doit estimer la population. En tant que concept abstrait, la population a besoin d’une définition opérationnelle. Ce processus est similaire à l’élaboration de définitions opérationnelles pour les concepts à mesurer. Un chercheur opérationnalise une population en élaborant une liste spécifique qui se rapproche étroitement de tous les éléments de la population. Il s’agit d’une base de sondage (dont nous parlerons plus tard).

Population cible

Elle fait référence à l’ensemble spécifique de cas que vous voulez étudier et dispose d’un cadre d’échantillonnage qui fonctionne.

Taux d’échantillonnage

La proportion d’échantillonnage est déterminée en divisant la taille de l’échantillon par la population totale. Par exemple, si une population compte 50 000 personnes et qu’un chercheur tire 5 000 personnes pour l’échantillon, le ratio d’échantillonnage sera de 0,10 (5 000/50 000).

Cadre d’échantillonnage

Un chercheur opérationnalise une population en établissant une liste spécifique qui se rapproche de tous les éléments de la population. Il s’agit d’une base de sondage. Vous pouvez choisir parmi de nombreux types de bases de sondage : annuaires téléphoniques, dossiers de permis de conduire, etc. Dresser la liste des éléments d’une population semble simple. Mais c’est souvent difficile car il n’y a pas forcément une bonne liste d’éléments dans une population. Un bon cadre d’échantillonnage est crucial pour un bon échantillonnage. Une inadéquation entre la base de sondage et la population définie conceptuellement peut être une source d’erreur majeure. De même qu’un décalage entre les définitions théorique et opérationnelle d’une variable crée une mesure invalide, un décalage entre la base de sondage et la population entraîne un échantillonnage invalide. À quelques exceptions près, les bases de sondage sont presque toujours inexactes.

Paramètre

Un paramètre est toute caractéristique vraie d’une population. Les paramètres sont déterminés lorsque tous les éléments d’une population sont mesurés.
Le paramètre de population n’est jamais connu avec une précision absolue pour les grandes populations, les chercheurs doivent donc l’estimer à partir d’échantillons. En d’autres termes, ils utilisent les informations de l’échantillon pour déduire des choses sur la population.

Statistiques

Dans le contexte de la théorie de l’échantillonnage et de cette discussion, une statistique est toute caractéristique d’un échantillon qui peut être utilisée pour déduire un paramètre de la population.

Pourquoi au hasard ?

Les échantillons aléatoires sont plus susceptibles de produire un échantillon qui représente réellement la population, par rapport aux échantillons non aléatoires. En d’autres termes, elle permet aux chercheurs de faire des hypothèses ou des généralisations précises à partir de l’échantillon vers la population étudiée.
L’échantillonnage aléatoire permet au chercheur de calculer statistiquement le rapport entre l’échantillon et la population, c’est-à-dire la taille de l’erreur d’échantillonnage.
Définition de l’erreur d’échantillonnage : Une définition non statistique de l’erreur d’échantillonnage est l’écart entre les résultats d’un échantillon et un paramètre de la population dû à des processus aléatoires.
Moins de ressources sont nécessaires – temps et coût : s’il est mené correctement, un échantillon aléatoire peut produire des résultats qui peuvent être utilisés pour prédire avec précision des paramètres au sein de la population, et ce, à une fraction du coût d’une enquête sur l’ensemble de la population. Par exemple, combien de temps et d’argent cela coûterait-il d’enquêter sur l’ensemble de la population des États-Unis ? Comparez ce chiffre à ce que coûterait en temps et en argent une enquête auprès d’un échantillon de 2 000 résidents américains.
Précision : Les résultats d’un échantillon probabiliste bien conçu et soigneusement exécuté produiront des résultats aussi précis, sinon plus, que ceux obtenus en essayant d’atteindre chaque personne de la population entière.

Types de techniques d’échantillonnage probabiliste

Simple aléatoire

Dans l’échantillonnage aléatoire simple, le chercheur élabore un cadre d’échantillonnage précis, sélectionne des éléments du cadre d’échantillonnage selon une procédure mathématiquement aléatoire, puis localise l’élément exact qui a été sélectionné pour être inclus dans l’échantillon.

Échantillonnage systématique

Les articles sont sélectionnés au hasard en utilisant un intervalle d’échantillonnage. L’intervalle d’échantillonnage (c’est-à-dire que Kth est un nombre) indique au chercheur comment sélectionner les éléments d’une base de sondage en sautant des éléments de la base avant d’en sélectionner un pour l’échantillon. Par exemple, un chercheur dispose d’une liste de 1 000 éléments dans sa population. Supposons que la taille de l’échantillon soit de 100. Dans ce cas, le chercheur sélectionnera tous les 10 cas. Pour ce faire, deux astuces doivent être suivies : premièrement, la base de sondage doit avoir les éléments ordonnés de manière aléatoire et deuxièmement, le point de départ (le point auquel le premier élément est sélectionné pour être inclus dans l’échantillon) doit être déterminé de manière aléatoire.

Échantillonnage stratifié

Dans l’échantillonnage aléatoire stratifié, un chercheur divise d’abord la population en sous-populations (strates : définies comme une caractéristique de la population. Par exemple, féminin et masculin) sur la base d’informations complémentaires. Après avoir divisé la population en strates, le chercheur tire un échantillon aléatoire de chaque sous-population. En général, l’échantillonnage stratifié produit des échantillons qui sont plus représentatifs de la population que l’échantillonnage aléatoire simple si les informations sur les strates sont exactes.

Échantillonnage par strates

L’échantillonnage en grappes répond à deux problèmes : Les chercheurs ne disposent pas d’une bonne base de sondage pour une population géographiquement dispersée et le coût pour atteindre un élément échantillonné est très élevé. Au lieu d’utiliser une seule base de sondage, les chercheurs utilisent un plan d’échantillonnage qui comporte plusieurs étapes et grappes. Une grappe est une unité qui contient des éléments d’échantillonnage final mais qui peut être traitée temporellement comme un élément d’échantillonnage lui-même. En d’autres termes, le chercheur échantillonne des grappes de manière aléatoire, puis des éléments de grappe sélectionnés de manière aléatoire ; cela présente un grand avantage pratique. Il peut créer une bonne base de sondage pour les grappes, même s’il est impossible d’en créer une pour les éléments échantillonnés. Une fois que le chercheur a obtenu un échantillon de grappes, la création d’une base de sondage pour les éléments de chaque grappe devient plus facile à gérer. Un deuxième avantage pour les populations géographiquement dispersées est que les éléments de chaque groupe sont physiquement plus proches les uns des autres. Cela peut conduire à des économies dans l’emplacement ou la portée de chaque élément.

Quelle doit être la taille d’un échantillon ?

La meilleure réponse à cette question est : « Cela dépend ! » De quoi cela dépend-il ?

Le type d’analyse des données que le chercheur prévoit (descriptive, régression multiple).
La précision de l’échantillon pour les besoins du chercheur (erreur d’échantillonnage acceptable).
Les caractéristiques de la population (homogène ou hétérogène, grande ou petite). En principe, pour les tailles d’échantillon, plus la population est petite, plus le ratio d’échantillonnage doit être grand pour obtenir un échantillon précis. Les populations plus importantes permettent des ratios d’échantillonnage plus faibles pour des échantillons de qualité égale. En effet, à mesure que la taille de la population augmente, les avantages en termes de précision de la taille de l’échantillon sont réduits. Pour les petites populations (moins de 1 000), un chercheur a besoin d’une grande proportion d’échantillonnage (environ 30 %). Pour des populations moyennement grandes (10 000), une proportion d’échantillonnage plus faible (environ 10%) est nécessaire pour avoir la même précision. Pour les grandes populations (plus de 150 000), des taux d’échantillonnage plus faibles (environ 1%) peuvent être très précis. Pour l’échantillonnage de très grandes populations (plus de 10 000 000), la précision peut être atteinte en utilisant des ratios d’échantillonnage minuscules (0,025%).

Tirer des conclusions

Le but de l’échantillonnage est de permettre au chercheur de tirer des conclusions de l’échantillon pour la population. Ce qu’il faut retenir, c’est que les échantillons probabilistes sont plus susceptibles, par rapport aux échantillons non probabilistes, de donner des échantillons représentatifs de la population. En d’autres termes, un chercheur qui souhaite tirer des conclusions sur la population à partir de son échantillon doit toujours essayer de produire un échantillon qui est similaire à la population. Si l’échantillon n’est pas similaire ou représentatif de la population dont il a été tiré, la capacité à faire des déductions précises est fortement compromise.

Dois-je toujours utiliser une technique d’échantillonnage probabiliste ?

NON ! La réponse est un peu plus compliquée que cela. D’ailleurs, s’il était si facile de déterminer la technique d’échantillonnage d’une étude, pourquoi y en aurait-il tant à choisir ? La réponse courte à cette question est : cela dépend. Cela dépend de nombreux facteurs. Il sera plus facile de répondre à cette question en classe, mais voici une règle générale : Choisissez une technique qui s’adapte bien à votre studio, votre budget et votre temps. Mais n’oubliez jamais que, quel que soit le travail accompli dans la conception de la recherche, la collecte des données, les essais pilotes ou la préparation, un échantillon mal constitué peut être inutile lorsqu’on essaie de généraliser à des populations plus importantes.

Sélection de l’échantillon dans la recherche quantitative