Guide du Recensement de la population, 2016
Annexe 1.8 ‒ Évaluation de l'impact de la mise à jour des données du Recensement de 2016 sur la langue
Après avoir été informé d'anomalies, pour certaines régions du Québec, dans les données linguistiques du Recensement de 2016 diffusées le 2 août dernier, Statistique Canada a mené une investigation approfondie afin d'identifier leurs sources.
Lors du recensement, Statistique Canada effectue un suivi auprès des ménages ayant rempli partiellement le questionnaire du recensement. Dans le cadre du Recensement de 2016, Statistique Canada a développé un programme informatique pour effectuer certaines étapes reliées à cette opération. C'est dans ce programme informatique qu'une erreur a été identifiée, affectant les questionnaires de langue française.
Les questions linguistiques du recensement sont les seules questions pour lesquelles les choix de réponse diffèrent entre les versions française et anglaise. La version française du questionnaire du recensement donne préséance au français dans le libellé des questions et dans les choix de réponse. Ceci ne touche que les questions du recensement sur la langue maternelle, sur la langue parlée à la maison et sur la connaissance des langues officielles. L'exemple qui suit illustre cette différence pour ce qui est de la langue parlée le plus souvent à la maison. C'est cette particularité qui n'a pas été prise en compte par le nouveau programme informatique utilisé dans le suivi de la non-réponse partielle en 2016.
Description de la figure
Cette figure bilingue montre la question 8 a) du questionnaire du Recensement de la population de 2016. La partie gauche de la figure affiche la question en français qui se lit comme suit : « Quelle langue cette personne parle-t-elle le plus souvent à la maison ». Les catégories de réponses sont « Français; Anglais; Autre langue – précisez ». La partie droite de la figure affiche la question en anglais qui se lit comme suit : « What language does this person speak most often at home ». Les catégories de réponses sont « English; French; Other language – specify ».
L'erreur qui en a découlé a entraîné une attribution erronée de réponses aux questions linguistiques du recensement pour environ 61 000 personnes, principalement au Québec. Elle s'est traduite par une surestimation de la croissance de l'anglais au Québec entre 2011 et 2016, tant comme langue maternelle que comme langue d'usage à la maison.
Après avoir corrigé ces erreurs d'attribution, Statistique Canada a mené un examen approfondi afin de s'assurer qu'aucune autre question du recensement n'ait été affectée par une erreur, et que les logiciels utilisés n'affectent pas d'autres variables. De plus, Statistique Canada a révisé en profondeur les multiples étapes de vérification et de contrôle des données.
Les résultats de ces analyses et les corrections apportées sont décrits ci-dessous.
Conséquence potentielle sur les autres variables
Après avoir décelé l'erreur dans l'attribution des réponses aux questions linguistiques, Statistique Canada a mené un examen exhaustif des systèmes, programmes et procédures d'estimation afin de déterminer si cette erreur avait eu une incidence négative sur la qualité des estimations de toutes les autres variables. À la suite de cet examen, Statistique Canada a conclu que l'incidence de cette erreur sur les estimations de toutes les autres variables était négligeable.
Pour les variables du Recensement de 2016, la grande majorité des réponses ont été obtenues directement des répondants au moyen du questionnaire du recensement ou par couplage d'enregistrements avec les fichiers administratifs. Par exemple, 99 % des réponses sur le lieu de naissance provenaient directement des répondants et 95 % des valeurs de revenu provenaient de données administratives de qualité élevée (y compris des données fiscales de l'Agence du revenu du Canada)Note 1Note 2. L'attribution erronée de certaines réponses à des questions sur la langue peut uniquement avoir eu une incidence sur l'estimation de la proportion restante des enregistrements qui nécessitaient une imputation dans le cadre du processus d'imputation par donneur. Dans le cadre de ce processus, les valeurs manquantes ou invalides d'un répondant (enregistrement receveur) sont remplacées par celles d'autres répondants ayant des caractéristiques semblables (enregistrement donneur). L'attribution erronée de certaines réponses à des questions sur la langue peut avoir eu une incidence sur l'estimation de cet enregistrement de l'une ou l'autre des deux façons suivantes :
- Un enregistrement receveur dont la variable linguistique a été codée incorrectement a été imputé à partir d'un enregistrement donneur. Dans ce cas, un autre enregistrement donneur ayant une valeur différente aurait pu être sélectionné, si la variable linguistique de l'enregistrement receveur avait été codée correctement.
- Un enregistrement receveur dont la variable linguistique a été codée correctement a été imputé à partir d'un enregistrement donneur. Dans ce cas, il est possible que l'enregistrement donneur ait été sélectionné incorrectement, en partie en raison du fait que la variable linguistique de l'enregistrement donneur a été codée incorrectement.
Dans ce processus d'imputation par donneur, les enregistrements donneurs sont sélectionnés en fonction d'un pointage indiquant le degré de similitude entre l'enregistrement donneur et l'enregistrement receveur. Habituellement, un enregistrement donneur est sélectionné au hasard parmi plusieurs enregistrements donneurs ayant un pointage semblable. Il importe de souligner que cette sélection aléatoire entraîne une variabilité dans le cadre du processus d'imputation par donneur et que toute nouvelle exécution du système d'imputation par donneur d'une même variable pourrait produire des estimations légèrement différentes.
Statistique Canada a mené une analyse afin de déterminer si l'erreur relative aux variables linguistiques a eu une incidence sur les résultats du processus d'imputation par donneur. Tout d'abord, toute incidence possible de l'erreur sur les résultats serait atténuée selon les facteurs suivants :
- Dans le choix de donneurs pour l'imputation, ce ne sont pas toutes les variables qui utilisent les variables linguistiques dans le choix de donneurs pour l'imputation. Le revenu, l'immigration, l'identité ethnoculturelle et autochtone, la mobilité et l'immigration ainsi que la langue de travail étaient les seuls thèmes à faire appel aux variables linguistiques lors du processus d'imputation. L'âge et le sexe, le type de logement, la famille, l'état matrimonial et la situation dans le ménage n'ont pas été touchés, puisqu'aucune variable linguistique (ou aucune des variables susmentionnées) n'a été utilisée pour choisir des enregistrements donneurs pour l'imputation.
- Très peu de cas ayant fait l'objet d'une imputation ont été affectés par cette erreur d'attribution des variables linguistiques. Le tableau 1 démontre que, parmi les cas ayant été affectés, la plupart des variables qui utilisaient la langue pour sélectionner les enregistrements donneurs ont été imputées moins de 1 000 fois.
- Les enregistrements touchés étaient concentrés au Québec et étaient répartis entre de nombreuses municipalités (subdivisions de recensement ou SDR) du Québec et non concentrés dans une municipalité précise de la province.
- La langue n'est qu'une des nombreuses variables utilisées dans le processus d'imputation par donneur. Selon les variables imputées, les variables de sélection de l'enregistrement donneur sont l'âge, le sexe, la géographie, les variables des données administratives couplées (p. ex., le lieu de naissance provenant des fichiers de données administratives couplées sur l'immigration, d'autres variables (p. ex., le statut d'immigrant) et la langue. Les caractéristiques d'un enregistrement donneur sont couplées aux caractéristiques d'un donneur auxquelles elles correspondent le mieux pour chacune de ces variables. Puisque de multiples variables sont utilisées, l'incidence d'une erreur relative à l'une de ces variables est considérablement réduite.
- De toutes les variables, la langue est une variable de sélection importante dans le choix de l'enregistrement donneur puisqu'elle permet d'établir une distinction entre les langues immigrantes, les langues autochtones et les langues officielles. Parce que l'erreur dans l'attribution de la langue est due au codage incorrect entre les deux langues officielles, l'importance de l'erreur est plus petite que si elle avait touché les langues immigrantes ou les langues autochtones.
- Les enregistrements donneurs dont les autres caractéristiques sont similaires ont aussi tendance à contenir des renseignements semblables ou identiques pour les variables imputées, ce qui atténue l'incidence de l'utilisation d'un enregistrement donneur différent.
Variable | Question | Nombre d'enregistrements touchés imputés | Pourcentage de la population totale (%) |
---|---|---|---|
Canada | |||
Revenu | Données administratives couplées | 1 940 | 0,01 |
Lieu de naissance | Q12 | 340 | 0,00 |
Citoyenneté | Q13 | 300 | 0,00 |
Statut d'immigrant | Q14 | 250 | 0,00 |
Année d'immigration | Q15 | 410 | 0,00 |
Catégorie d'admission | Données administratives couplées | 160 | 0,00 |
Origine ethnique | Q17 | 2 220 | 0,03 |
Groupe autochtone | Q18 | 610 | 0,01 |
Minorité visible | Q19 | 1 000 | 0,01 |
Statut d'Indien inscrit ou des traités | Q20 | 620 | 0,01 |
Membre d'une Première Nation ou d'une bande indienne | Q21 | 790 | 0,01 |
Mobilité, fondée sur une période d'un an | Q22 | 910 | 0,01 |
Mobilité, fondée sur une période de cinq ans | Q23 | 980 | 0,01 |
Lieu de naissance du père | Q24a | 630 | 0,01 |
Lieu de naissance de la mère | Q24b | 690 | 0,01 |
Langue de travail | Q45 | 710 | 0,01 |
Québec | |||
Revenu | Données administratives couplées | 1 760 | 0,02 |
Lieu de naissance | Q12 | 320 | 0,02 |
Citoyenneté | Q13 | 280 | 0,01 |
Statut d'immigrant | Q14 | 230 | 0,01 |
Année d'immigration | Q15 | 370 | 0,02 |
Catégorie d'admission | Données administratives couplées | 150 | 0,01 |
Origine ethnique | Q17 | 2 070 | 0,11 |
Groupe autochtone | Q18 | 580 | 0,03 |
Minorité visible | Q19 | 930 | 0,05 |
Statut d'Indien inscrit ou des traités | Q20 | 560 | 0,03 |
Membre d'une Première Nation ou d'une bande indienne | Q21 | 740 | 0,04 |
Mobilité, fondée sur une période d'un an | Q22 | 840 | 0,04 |
Mobilité, fondée sur une période de cinq ans | Q23 | 910 | 0,05 |
Lieu de naissance du père | Q24a | 580 | 0,03 |
Lieu de naissance de la mère | Q24b | 640 | 0,03 |
Langue de travail | Q45 | 650 | 0,03 |
Note : Le nombre d'enregistrements imputés est non pondéré et arrondi. Les pourcentages de la population totale sont calculés à l'aide des estimations pondérées pour toutes les variables, sauf le revenu. Source : Statistique Canada, Recensement de la population, 2016. |
Dans le cadre de son analyse, Statistique Canada a exécuté à nouveau certaines étapes du processus d'imputation, en premier lieu dans le but d'évaluer le degré de variabilité des estimations inhérente au processus d'imputation, et en second lieu pour évaluer l'importance de la variation découlant de la nouvelle imputation des enregistrements touchés par l'erreur d'attribution aux variables linguistiques. Si l'importance de la variation découlant de la nouvelle imputation des enregistrements touchés par l'erreur d'attribution était faible par rapport à la variabilité des estimations inhérente au processus d'imputation, cela signifierait que l'incidence de l'erreur d'attribution sur les estimations était négligeable.
Le tableau 2 illustre, de façon globale, la variabilité causée par le système d'imputation à l'égard des estimationsNote 3. Le tableau met l'accent sur les résultats pour le Québec, où la plupart des cas d'anomalies ont été relevés. Il porte uniquement sur les variables pour lesquelles les variables linguistiques ont été utilisées pour choisir les enregistrements donneurs pendant l'imputation. On y affiche les valeurs moyennes pour l'ensemble des SDR, selon la taille, pour certains indicateurs de revenu et d'identité ethnoculturelle (revenu total médian, salaires médians, proportion de la population ayant une identité autochtone, proportion de minorités visibles, proportion d'immigrants et proportion d'origine ethnique des îles BritanniquesNote 4)Note 5. Lorsque les données sont imputées à nouveau pour l'ensemble des SDR, les estimations peuvent augmenter ou diminuer. Par exemple, pour une SDR comptant de 20 000 à 99 999 habitants; lorsque la valeur du revenu total a augmenté, elle a augmenté en moyenne de 16 $; lorsqu'elle a diminué, elle a diminué en moyenne de 15 $. Ces données illustrent la faible variabilité des estimations qui découle de l'imputation par donneur.
Le tableau 3 montre l'effet de corriger seulement les enregistrements dont l'attribution des variables linguistiques a changéNote 6. Pour les SDR de cette catégorie de taille; lorsque l'estimation du revenu a augmenté, elle a augmenté en moyenne de 3 $; lorsqu'elle a diminué, elle a diminué en moyenne de 4 $. Ainsi, la variation découlant de la correction de l'erreur d'attribution et de la nouvelle imputation des résultats est minime et dans les limites de la variabilité inhérente au processus d'imputation. Cette variation a donc une incidence négligeable sur les résultats. Il en a été de même pour les SDR de différentes catégories de taille et pour les autres variables pour lesquelles des variables linguistiques ont été utilisées pour sélectionner les donneurs lors de l'imputationNote 7.
L'analyse de l'incidence possible de l'erreur survenue lors de l'attribution des réponses aux questions linguistiques du Recensement de 2016 sur les estimations des autres variables a permis de conclure que l'erreur a eu une incidence très négligeable. Ce résultat était à prévoir, compte tenu du fait que la vaste majorité des enregistrements ont été obtenus directement des répondants ou des données administratives couplées, et que très peu de répondants ont vu leurs estimations touchées par l'erreur d'attribution de la variable linguistique.
Toutefois, dans certains cas, les variables sur la langue maternelle, la langue parlée à la maison ou la connaissance des langues officielles ont été utilisées pour modifier de manière déterministe les réponses incohérentes relatives aux variables sur la langue de travail et la connaissance de langues tierces (p. ex., si une personne indique qu'elle parle l'espagnol le plus souvent à la maison, l'espagnol doit également être une des réponses fournies pour la connaissance de langues tierces). À cause de cette dépendance directe, les variables sur la langue de travail et la connaissance de langues tierces ont été traitées à nouveau pour le Recensement de 2016 à l'aide les variables corrigées sur la langue maternelle, la langue parlée à la maison et la connaissance de langues officielles.
Compte tenu de ces résultats, il n'est pas nécessaire de recalculer les estimations autres que linguistiques du Recensement de 2016.
Taille de la population de la SDR | Valeurs provenant d'une imputation | Valeurs provenant d'une autre imputation | Variation moyenne due à l'imputation | Moyenne des variations positives | Moyenne des variations négatives |
---|---|---|---|---|---|
Revenu total médian ($) | |||||
250 à 9 999 | 30 128 | 30 129 | −3 | 69 | −67 |
10 000 à 19 999 | 36 958 | 36 952 | −10 | 20 | −22 |
20 000 à 99 999 | 36 478 | 36 477 | −5 | 16 | −15 |
100 000 et plus | 34 469 | 34 468 | 2 | 13 | −8 |
Salaires et traitements médians ($) | |||||
250 à 9 999 | 28 534 | 28 530 | 2 | 97 | −96 |
10 000 à 19 999 | 35 725 | 35 722 | −1 | 29 | −32 |
20 000 à 99 999 | 35 606 | 35 607 | −2 | 12 | −16 |
100 000 et plus | 33 957 | 33 955 | 1 | 6 | −5 |
Proportion ayant déclaré une identité autochtone (%) | |||||
250 à 9 999 | 7,0 | 7,0 | 0,00 | 0,20 | −0,30 |
10 000 à 19 999 | 2,1 | 2,1 | 0,00 | 0,04 | −0,06 |
20 000 à 99 999 | 1,3 | 1,3 | 0,00 | 0,02 | −0,01 |
100 000 et plus | 1,6 | 1,6 | 0,00 | 0,01 | 0,00 |
Proportion de minorités visibles (%) | |||||
250 à 9 999 | 0,8 | 0,8 | 0,00 | 0,15 | −0,18 |
10 000 à 19 999 | 4,5 | 4,5 | 0,00 | 0,01 | −0,01 |
20 000 à 99 999 | 6,2 | 6,2 | 0,00 | 0,01 | −0,01 |
100 000 et plus | 10,3 | 10,3 | 0,00 | 0,00 | 0,00 |
Proportion d'immigrants (%) | |||||
250 à 9 999 | 2,6 | 2,6 | 0,00 | 0,15 | −0,23 |
10 000 à 19 999 | 9,0 | 9,0 | 0,00 | 0,00 | −0,01 |
20 000 à 99 999 | 10,5 | 10,5 | 0,00 | 0,01 | −0,01 |
100 000 et plus | 14,5 | 14,5 | 0,00 | 0,00 | 0,00 |
Proportion ayant déclaré des origines ethniques des îles Britanniques (%) | |||||
250 à 9 999 | 8,4 | 8,4 | 0,00 | 0,39 | −0,40 |
10 000 à 19 999 | 11,7 | 11,7 | 0,02 | 0,09 | −0,09 |
20 000 à 99 999 | 8,7 | 8,7 | 0,01 | 0,07 | −0,05 |
100 000 et plus | 8,0 | 8,0 | 0,00 | 0,02 | −0,01 |
Note : L'analyse porte sur les SDR comptant une population de 250 habitants et plus. Les nombres dans les cellules du tableau représentent la valeur moyenne pour les SDR selon la taille de la population. Population dans les ménages privés seulement. En ce qui a trait aux variables liées au revenu, l'analyse se limite à la population âgée de 15 ans et plus et vivant dans des logements privés. Pour les variables ethnoculturelles, l'analyse se limite à la population vivant dans des logements privés et aux personnes hors famille de recensement, aux familles monoparentales et aux personnes en couple (avec ou sans enfants). Source : Statistique Canada, Recensement de la population, 2016, analyse expérimentale. |
Taille de la population de la SDR | Valeurs espérées (avant les corrections aux enregistrements contenant des erreurs d'attribution de la variable linguistique) | Valeurs espérées (après les corrections aux enregistrements contenant des erreurs d'attribution de la variable linguistique) | Variation moyenne | Moyenne des variations positives | Moyenne des variations négatives |
---|---|---|---|---|---|
Revenu total médian ($) | |||||
250 à 9 999 | 30 133 | 30 129 | −3 | 24 | −31 |
10 000 à 19 999 | 36 957 | 36 955 | −2 | 3 | −6 |
20 000 à 99 999 | 36 477 | 36 477 | 0 | 3 | −4 |
100 000 et plus | 34 470 | 34 469 | 0 | 2 | −1 |
Salaires et traitements médians ($) | |||||
250 à 9 999 | 28 535 | 28 536 | 1 | 44 | −41 |
10 000 à 19 999 | 35 726 | 35 726 | 0 | 8 | −8 |
20 000 à 99 999 | 35 609 | 35 607 | −2 | 5 | −6 |
100 000 et plus | 33 955 | 33 956 | 0 | 3 | −2 |
Proportion ayant déclaré une identité autochtone (%) | |||||
250 à 9 999 | 7,0 | 7,0 | 0,00 | 0,17 | −0,07 |
10 000 à 19 999 | 2,1 | 2,1 | 0,00 | 0,01 | 0,00 |
20 000 à 99 999 | 1,3 | 1,3 | 0,00 | 0,01 | −0,01 |
100 000 et plus | 1,6 | 1,6 | 0,00 | 0,00 | 0,00 |
Proportion de minorités visibles (%) | |||||
250 à 9 999 | 0,8 | 0,8 | 0,00 | 0,08 | 0,00 |
10 000 à 19 999 | 4,5 | 4,5 | 0,00 | 0,00 | −0,01 |
20 000 à 99 999 | 6,2 | 6,2 | 0,00 | 0,00 | 0,00 |
100 000 et plus | 10,3 | 10,3 | 0,00 | 0,00 | 0,00 |
Proportion d'immigrants (%) | |||||
250 à 9 999 | 2,6 | 2,6 | 0,00 | 0,13 | −0,06 |
10 000 à 19 999 | 9,0 | 9,0 | 0,00 | 0,00 | −0,01 |
20 000 à 99 999 | 10,5 | 10,5 | 0,00 | 0,00 | 0,00 |
100 000 et plus | 14,5 | 14,5 | 0,00 | 0,00 | 0,00 |
Proportion ayant déclaré des origines ethniques des îles Britanniques (%) | |||||
250 à 9 999 | 8,4 | 8,4 | −0,02 | 0,25 | −0,30 |
10 000 à 19 999 | 11,7 | 11,7 | −0,02 | 0,02 | −0,06 |
20 000 à 99 999 | 8,7 | 8,7 | −0,01 | 0,02 | −0,02 |
100 000 et plus | 8,0 | 8,0 | −0,01 | 0,01 | −0,01 |
Note : L'analyse porte sur les SDR ayant une population de 250 habitants et plus. Les nombres dans les cellules du tableau représentent la valeur moyenne pour les SDR selon la taille de la population. Population dans les ménages privés seulement. Pour les variables liées au revenu, l'analyse se limite à la population âgée de 15 ans et plus et vivant dans des logements privés. Pour les variables ethnoculturelles, l'analyse se limite à la population vivant dans des logements privés et aux personnes hors famille de recensement, aux familles monoparentales et aux personnes en couple (avec ou sans enfants). Source : Statistique Canada, Recensement de la population, 2016, analyse expérimentale. |
La pondération de l'échantillon du questionnaire détaillé du recensement vise à extrapoler ses résultats à l'ensemble de la population. La pondération se fonde sur plusieurs caractéristiques recueillies pour l'ensemble de la population. Plus spécifiquement, le poids des ménages dans l'échantillon du questionnaire détaillé est calculé de sorte que la somme de poids de ces ménages corresponde aux chiffres de population pour plusieurs caractéristiques. Cette technique se nomme calage des poids.
Le calage des poids assure la cohérence et diminue la variance des estimations des caractéristiques du questionnaire détaillé corrélées aux caractéristiques de calage. Le calage des poids est effectué indépendamment pour les aires géographiques appelées aires de pondérationNote 8. Jusqu'à 200 caractéristiques de population peuvent être utilisées pour effectuer le calage des poids d'une aire de pondération. En moyenne, une centaine de caractéristiques sont retenues.
Parmi les caractéristiques affectées par l'erreur dans les données linguistiques, seule la « connaissance des langues officielles » (c.-à-d. français seulement, anglais seulement, français et anglais, ni français ni anglais) est utilisée au calage. Des corrections sur les données linguistiques ont été apportées pour environ 61 000 personnes. Toutefois, la « connaissance des langues officielles » ne nécessitait pas de correction pour tous ces particuliers. Des corrections à la « connaissance des langues officielles » ont été apportées pour un peu plus de 36 000 personnes dont la très grande majorité (95 %) est passée de la catégorie « Français et anglais » à « Français seulement ». Puisque ces corrections concernaient principalement les personnes ayant une connaissance du français, elles s'avéraient plus importantes dans certaines aires de pondération du Québec.
Les estimations des aires de pondération les plus affectées par ces corrections ont été évaluées. Les poids originaux ont été calculés à partir de la « connaissance des langues officielles » avant les corrections. L'évaluation a déterminé si ces poids pouvaient être utilisés pour produire des estimations précises des caractéristiques du questionnaire détaillé en termes de biais et de variance d'échantillonnage. L'incidence sur les estimations est plus facilement détectable dans les variables corrélées à la « connaissance des langues officielles » telles que des variables socioculturelles ou d'autres variables portant sur les langues qui n'ont pas été utilisées au calage.
Les données sur la langue maternelle (c.-à-d. français, anglais ou une autre langue), qui étaient disponibles pour l'ensemble de la population, ont été utilisées comme variable d'essai pour étudier la précision des estimations. Cette variable est corrélée à la « connaissance des langues officielles », et a fait l'objet de corrections. Des estimations pour les quatre aires de pondération les plus affectées par les corrections ont été produites pour les deux catégories de la « langue maternelle » les plus affectées (c.-à-d. français et anglais), après correction de cette variable. Des estimations ont premièrement été produites à l'aide des poids originaux, puis à l'aide des poids de calage aux chiffres de population de la « connaissance des langues officielles » après la correction de la variable, de même qu'aux chiffres de population des autres caractéristiques aussi utilisées pour le calcul des poids originauxNote 9.
Afin d'étudier l'impact sur le biais des estimations, des statistiques-t (c.-à-d. la différence entre l'estimation d'un total et le chiffre de population divisée par l'erreur type de l'estimation du total) ont été calculées à l'aide des deux ensembles de poids. Puis, une statistique-t a été calculée pour la différence entre les deux estimations (c.-à-d. l'estimation avec les poids originaux moins l'estimation avec les poids corrigés, divisée par l'erreur-type de cette différence). Le tableau 4 présente l'ensemble des statistiques-t.
Langue maternelle | Ville prédominante dans l'aire de pondération | Statistique-t | ||
---|---|---|---|---|
Différence entre l'estimation calculée à l'aide des poids originaux et le chiffre de population | Différence entre l'estimation calculée à l'aide des poids corrigés et le chiffre de population | Différence entre les deux estimations | ||
Français | Coaticook | 1,92 | 1,75 | 1,62 |
Anglais | Coaticook | -0,51 | -0,31 | -1,49 |
Français | Rivière-du-Loup | 1,15 | 1,02 | 0,93 |
Anglais | Rivière-du-Loup | -0,87 | -0,72 | -0,99 |
Français | Trois-Rivières | -0,79 | -0,80 | 0,24 |
Anglais | Trois-Rivières | -0,41 | -0,37 | -0,63 |
Français | Drummondville | 1,55 | 1,64 | -1,19 |
Anglais | Drummondville | -0,60 | -0,70 | 1,30 |
Source : Statistique Canada, Recensement de la population, 2016, analyse expérimentale. |
Les valeurs absolues des statistiques-t des estimations fondées sur les poids originaux ainsi que celles fondées sur les poids corrigés sont inférieures à 2. Ceci indique que le biais des estimations n'est pas significatif, quel que soit l'ensemble de poids utilisé. Les valeurs absolues des statistiques-t sur les différences entre les deux estimations sont également inférieures à 2. Ceci indique que les deux estimations ne sont pas significativement différentes.
Pour évaluer l'impact sur la variance d'échantillonnage des estimations, les erreurs-types ont été calculées selon les deux scénarios de pondération. Les résultats sont présentés au tableau 5.
Langue maternelle | Ville prédominante dans l'aire de pondération | Erreurs-types | |
---|---|---|---|
Estimation avec poids originaux | Estimation avec poids corrigés | ||
Français | Coaticook | 166 | 163 |
Anglais | Coaticook | 140 | 137 |
Français | Rivière-du-Loup | 87 | 85 |
Anglais | Rivière-du-Loup | 60 | 59 |
Français | Trois-Rivières | 137 | 137 |
Anglais | Trois-Rivières | 92 | 91 |
Français | Drummondville | 101 | 101 |
Anglais | Drummondville | 72 | 72 |
Source : Statistique Canada, Recensement de la population, 2016, analyse expérimentale. |
Les erreurs-types des estimations calculées à l'aide des poids corrigés sont très comparables à celles des estimations calculées à l'aide des poids originaux. Ceci indique que l'utilisation des poids originaux n'altérerait pas négativement la variance d'échantillonnage des estimations.
Les estimations de la langue maternelle ont été calculées après la correction des données pour les aires de pondération les plus affectées. L'évaluation démontre que l'utilisation des poids originaux n'altère pas l'exactitude des estimations en termes de biais et de variance d'échantillonnage. Dans les aires géographiques faisant l'objet de moins de corrections, l'impact des corrections devrait être encore moins perceptible. Comme les autres caractéristiques utilisées lors du calage, la « connaissance des langues officielles » n'est pas systématiquement retenue dans toutes les aires de pondération. En se fondant sur les résultats de l'évaluation ci-dessus, on conclut que la correction des poids n'est pas nécessaire pour assurer l'exactitude des estimations de l'échantillon du questionnaire détaillé.
Notes
- Date de modification :