Rapport technique sur les peuples autochtones, Recensement de la population, 2016
3. Traitement des données

L'étape de traitement des données du Recensement de 2016 a débuté par la conversion des réponses en données significatives. Cette partie du cycle d'enquête comportait six activités principales :

  1. réception et enregistrement
  2. imagerie et saisie des données
  3. contrôles
  4. codage
  5. contrôle et imputation
  6. pondération.

Pour obtenir des renseignements généraux sur le traitement des données, veuillez vous reporter au Guide du Recensement de la population, 2016, 98-304-X au catalogue.

3.1 Codage des réponses écrites à la question sur l'appartenance à une Première Nation ou à une bande indienne

À la question portant sur l’appartenance à une Première Nation ou à une bande indienne, les réponses ont été codées en fonction d'une liste de plus de 600 Premières Nations et bandes indiennes. La proportion de réponses obtenues au moyen d'un codage automatisé était de 73,2 %. Les autres réponses ont été codées au moyen d’une application interactive. Cette application comprenait plusieurs fichiers de référence, notamment un fichier prévoyant différentes orthographes pour les noms de Premières Nations et de bandes indiennes et les codes correspondants, ainsi qu'un fichier renfermant des codes géographiques pour les réserves indiennes, le nom de ces réserves et le nom des Premières Nations ou des bandes indiennes affiliées à ces réserves.Note 1

3.1.1 Contrôle et imputation des variables autochtones

Après la saisie des données, le contrôle initial et les opérations de codage, les données ont été traitées jusqu'à l'étape du contrôle final et de l'imputation. Le contrôle final a permis de détecter les réponses non valides et les incohérences, ainsi que les questions sans réponse. L'imputation a remplacé les réponses manquantes, non valides ou incohérentes par des valeurs plausibles. Lorsqu'elle est effectuée judicieusement, l'imputation peut améliorer la qualité des données en remplaçant les non-réponses par des réponses plausibles et comparables à celles que l'on aurait obtenues si les répondants avaient répondu aux questions. Elle offre également l'avantage de produire un ensemble complet de données.

L'imputation des données du recensement a été réalisée selon la méthode du plus proche voisin. Cette méthode est très répandue pour le traitement des non-réponses aux questions. Elle permet de remplacer l'information manquante, non valide ou incohérente relativement à un répondant par les valeurs fournies par un autre répondant qui lui est similaire. Les règles d'identification du répondant correspondant le mieux au non-répondant peuvent varier en fonction des variables à imputer. Les méthodes d'imputation par donneur ont des propriétés intéressantes et, de façon générale, ne nuisent pas à la répartition des données comme le font de nombreuses autres techniques d'imputation. L’imputation par la méthode du plus proche voisin permet d’assurer la cohérence des données (voir le chapitre 8 du Guide du Recensement de la population, 2016, 98-304-X au catalogue).

En 2016, les variables relatives à l'immigration, à la citoyenneté, au lieu de naissance, à l'origine ethnique ou à l’ascendance autochtone, au groupe de population ou à la minorité visible, au groupe autochtone, au statut d'Indien inscrit ou des traités, et à l'appartenance à une Première Nation ou à une bande indienne ont été traitées ensemble, les liens entre ces variables ayant été clairement définis à l'avance. L'imputation par donneur pour les renseignements manquants concernant ces variables a été faite à l'aide d'un même donneur pour toutes les variables, dans la mesure du possible.

Un même donneur, qui n'était pas un enfant d'une famille de recensement, a été utilisé pour tous les répondants exigeant une imputation qui n'étaient pas non plus des enfants d'une famille de recensement. Dans le cas des enfants d'une famille de recensement pour lesquels une imputation était nécessaire, on a utilisé, en ordre de préférence, un donneur de la même famille de recensement, un donneur hors de cette famille de recensement, ou un donneur selon une règle déterministe. En conséquence, les enregistrements imputés étaient cohérents à l'interne et fondés sur des réponses complètes réelles, plutôt que sur des réponses de donneurs multiples qui pourraient avoir déclaré des renseignements incohérents.

Les faibles taux de non-réponse aux questions et de réponses non valides, ainsi que les faibles taux d'imputation correspondants pour les variables autochtones (c.-à-d. celles portant sur le groupe autochtone, le statut d'Indien inscrit ou des traités, et l’appartenance à une Première Nation ou bande indienne — voir le tableau 2 ), n'ont pas eu une grande incidence globale sur la qualité des données.

Tableau 2
Taux d'imputation des questions sur le groupe autochtone, le statut d'Indien inscrit ou des traités, et l'appartenance à une Première Nation ou à une bande indienne, Canada, provinces et territoires, Recensement de 2016
Sommaire du tableau
Le tableau montre les résultats de Taux d'imputation des questions sur le groupe autochtone. Les données sont présentées selon Région (titres de rangée) et Groupe autochtone
(Question 18)
, Statut d'Indien inscrit ou des traités
(Question 20) et Appartenance à une Première Nation ou à une bande indienne
(Question 21), calculées selon pourcentage unités de mesure (figurant comme en-tête de colonne).
Région Groupe autochtone
(Question 18)
Statut d'Indien inscrit ou des traités
(Question 20)
Appartenance à une Première Nation ou à une bande indienne
(Question 21)
pourcentage
Canada 1,1 1,4 1,8
Terre-Neuve-et-Labrador 2,2 2,3 3,3
Île-du-Prince-Édouard 1,7 1,9 2,6
Nouvelle-Écosse 1,2 1,6 2,4
Nouveau-Brunswick 1,3 1,5 2,0
Québec 1,2 1,3 1,6
Ontario 0,9 1,3 1,7
Manitoba 1,1 1,6 2,1
Saskatchewan 1,2 1,7 2,3
Alberta 1,2 1,6 2,1
Colombie-Britannique 1,1 1,4 1,9
Yukon 0,8 1,4 2,6
Territoires du Nord-Ouest 1,9 2,6 5,6
Nunavut 1,2 1,5 2,1

3.2 Pondération

La pondération a été effectuée de façon que les résultats représentent l’ensemble de la population. De ce fait, on a attribué à chaque ménage un poids de sondage égal à l'inverse de sa probabilité de sélection dans l'échantillon. Dans les unités de collecte (UC) où des agents recenseurs ont mené des interviews sur place et où 100 % des ménages ont dû remplir un questionnaire détaillé, ce poids était égal à 1. Dans les UC ne faisant pas l’objet d’un recensement par interview, ce poids était en général égal à 4.

Dans les UC faisant l’objet d’un recensement par interview, on a tenu compte de la non-réponse au questionnaire détaillé en effectuant l’imputation. Les données des ménages qui n'ont répondu à aucune question ont été imputées à l'aide des données d'un ménage répondant du même type d'UC. Tous les ménages privés de ces UC qui ne faisaient pas partie de réserves indiennes et d'établissements indiens partiellement dénombrés ont conservé leur poids de sondage de 1 aux fins d'estimation. Les autres ménages privés et les ménages collectifs se sont vu attribuer un poids final nul et n’ont donc pas contribué aux estimations.

Dans les UC ne faisant pas l’objet d’un recensement par interview, on a appliqué plusieurs ajustements au poids et on a utilisé une méthode d'imputation différente.

Vous pouvez trouver de plus amples renseignements sur la pondération au chapitre 9 du Guide du Recensement de la population, 2016.

Note

Signaler un problème sur cette page

Quelque chose ne fonctionne pas? L'information n'est plus à jour? Vous ne trouvez pas ce que vous cherchez?

S'il vous plaît contactez-nous et nous informer comment nous pouvons vous aider.

Avis de confidentialité

Date de modification :