Recensement de 2011 : Normes et lignes directrices relatives à la confidentialité et à la qualité des données (version publique)
Pratiques relatives à la qualité des données

La section ci-après décrit les méthodes utilisées pour restreindre la diffusion de données du recensement de qualité inacceptable.

Mesures de la qualité des données

Indicateurs de la qualité des données

Des indicateurs de la qualité des données sont liés à toutes les régions géographiques normalisées du lieu de résidence sur lesquelles des données sont diffusées. Dans l'environnement de base de données du recensement, les indicateurs de la qualité des données consistent en un champ numérique à cinq chiffres. Dans les produits électroniques parcourus à l'aide de Beyond 20/20, ces indicateurs sont affichés en utilisant un code numérique à cinq chiffres (exemple : 0 2 1 0 0). Dans le site Web du recensement, les utilisateurs peuvent reconnaître les régions incomplètement dénombrées à l'aide de signes conventionnels.

Les réserves indiennes et les établissements indiens incomplètement dénombrés

En 2011 et dans les recensements antérieurs, le dénombrement n'a pas été complété dans certaines réserves indiennes et certains établissements indiens, suite à la non-participation. Les règles de qualité des données exigent que l'on identifie ces réserves indiennes et ces établissements incomplètement dénombrés, et qu'on les retire des produits. De plus, les régions géographiques à niveaux supérieurs comprenant ces régions doivent être identifiées dans les produits. Ces indicateurs de niveaux supérieurs sont inclus automatiquement dans les tableaux de sortie en  format Beyond 20/20, CSV et fichiers plats. Pour une liste des réserves indiennes et des établissements indiens incomplètement dénombrés, les utilisateurs peuvent consulter la section du matériel de référence sur le site Web du recensement.

Bien que les données du recensement ne soient pas disponibles pour les réserves indiennes et les établissements indiens incomplètement dénombrés, les régions elles-mêmes sont comprises dans les hiérarchies géographiques normalisées de la base de données du recensement.

Taux de réponse globaux

On détermine les taux de réponse globaux pour chacune des régions géographiques du recensement. Ces régions sont identifiées dans la base de données selon le taux de non‑réponse. Les régions qui présentent un taux de non-réponse égal ou supérieur à 25 % sont supprimées des totalisations. Les régions géographiques qui présentent un taux de non-réponse égal ou supérieur à 5 %, mais inférieur à 25 % ont été regroupées en deux catégories et sont marquées d'un indicateur distinct selon que le taux de non-réponse se situe entre 5 % et 10 %, ou entre 10 % et 25 %. Ces régions géographiques ne sont pas supprimées, mais sont marquées d'un indicateur dans les totalisations. On fournit un indicateur numérique avec l'identificateur de région pour indiquer des données de faible qualité dans les produits électroniques.

Indicateur d'erreur dans les chiffres de population et des logements

À la suite de la diffusion des chiffres de population et des logements, des erreurs sont occasionnellement relevées dans les données. Il est impossible d'apporter des changements aux données du recensement présentées. Les utilisateurs peuvent toutefois obtenir les modifications aux chiffres de population et des logements touchant les subdivisions de recensement et d'autres niveaux géographiques en consultant la section consacrée au Recensement de 2011, de 2006 ou de 2001 dans le site Web de Statistique Canada à l'adresse www.statcan.gc.ca.

Indicateur de qualité des données sans objet (indicateur relatif à la qualité des données‑échantillon [20 %])

Le quatrième code numérique de l'indicateur de qualité des données de cinq chiffres dans la base de données ne s'applique pas pour le Recensement de 2011 et est automatiquement remis à zéro pour chaque région géographique. La valeur résidant dans la base de données est un paramètre fictif pour des raisons d'ordre historique; en 2006 et pour les recensements antérieurs, les cinq chiffres s'appliquaient, le quatrième chiffre était l'indicateur relatif à la qualité des données-échantillon (20 %).

Indicateur d'ajustement du chiffre de population de 2006

Les utilisateurs qui souhaitent comparer les données du Recensement de 2011 avec celles des recensements antérieurs doivent tenir compte des modifications qui peuvent être apportées aux limites des régions géographiques d'un recensement à un autre. Afin de faciliter les comparaisons, les chiffres du Recensement de 2006 ont été ajustés au besoin en fonction des modifications apportées aux limites entre le Recensement de 2006 et celui de 2011. Les chiffres de 2006 qui ont été corrigés, ainsi que les régions créées depuis 2006, telles que les nouvelles municipalités constituées (subdivisions de recensement) et les nouvelles localités désignées, sont eux aussi marqués d'un indicateur. La plupart de ces indicateurs ont toutefois pour objet de signaler des modifications de limites.

Le tableau ci-après décrit la zone d'indicateur de la qualité des données et son contenu. Prenez note qu'un zéro dans l'un ou l'autre des cinq chiffres est la valeur implicite pour l'indicateur correspondant et signifie qu'aucune mesure relative à la qualité des données n'est requise.

Indicateurs de la qualité des données – Recensement de 2011
Caractère numérique Description Indicateur Description des indicateurs
1er (0XXXX) Indicateur de dénombrement partiel 0 Valeur implicite.
1 Réserve indienne ou établissement indien partiellement dénombré (supprimées).
2 Ne comprend pas les données du recensement pour une ou plusieurs réserves indiennes ou établissements indiens partiellement dénombrés.
2e (X0XXX) Indicateur relatif à la qualité des données 0 Valeur implicite.
1 Indice de la qualité des données indiquant, pour le questionnaire du recensement abrégé (données intégrales [100 %]), un taux global de non-réponse supérieur ou égal à 5 %, mais inférieur à 10 %.
2 Indice de la qualité des données indiquant, pour le questionnaire du recensement abrégé (données intégrales [100 %]), un taux global de non-réponse supérieur ou égal à 10 %, mais inférieur à 25 %.
3 Indice de la qualité des données indiquant, pour le questionnaire du recensement abrégé (données intégrales [100 %]), un taux global de non-réponse supérieur ou égal à 25 % (supprimées).
3e (XX0XX) Indicateur d'erreur dans les chiffres de population et des logements 0 Valeur implicite.
1 Il y a une erreur dans les chiffres de population et des logements de 2011 pour cette région. Pour obtenir de plus amples renseignements, veuillez consulter la section des données sur les chiffres de population et des logements du fichier « Notes ».
2 En 2006, les chiffres de population et/ou des logements sont erronés pour cette subdivision de recensement. Étant donné qu'il n'est pas possible d'apporter des changements aux données de 2006 présentées dans ces tableaux, les données de 2006 doivent être utilisées avec prudence. Pour obtenir de plus amples renseignements, veuillez consulter la section des données sur les chiffres de population et des logements du fichier « Notes ».
3 Les chiffres de population et/ou des logements de 2011 et de 2006 pour cette région sont erronés. Étant donné qu'il n'est pas possible d'apporter des changements aux données du recensement présentées dans ces tableaux, ces données doivent être utilisées avec prudence. Pour obtenir de plus amples renseignements, veuillez consulter la section des données sur les chiffres de population et des logements du fichier « Notes ».
4e (XXX0X) Sans objet 0 Valeur implicite.
5e (XXXX0) Indicateur de rajustement des chiffres de population de 2006 0 Valeur implicite.
1 Chiffre de 2006 rajusté; la plupart de ces rajustements sont le résultat de modifications des limites.

Nota : Les indicateurs de la qualité des données ne s'appliquent pas aux chiffres de population et des logements.

Veuillez consulter le document des Normes et lignes directrices relatives à la confidentialité et à la qualité des données de 2006 (version publique) pour le tableau des indicateurs pour les années de recensement antérieures.

Autres méthodes de suppression relatives à la qualité des données

Les méthodes de suppression mentionnées jusqu'à maintenant sont suffisantes pour supprimer les régions pour lesquelles la qualité des données est inacceptable et pour signaler les données de qualité inférieure dans la plupart des produits de données du recensement. Toutefois, le secteur qui établit les spécifications ou le secteur chargé de la production peut demander que des règles de suppression additionnelles en raison de la qualité des données soient appliquées pour certains produits : par exemple, en augmentant les seuils de population appliqués ou en supprimant des répartitions ou des cellules. Il s'agit de règles de suppression qui s'appliquent à des produits en particulier; elles ne font donc pas partie des systèmes de suppression automatisés. Dans tous les cas, il est nécessaire d'utiliser un processus manuel.

Calcul de statistiques d'ordre

Les variables, dont les valeurs sont des nombres entiers, une médiane (ou autre quantile) est calculée au moyen d'interpolations linéaires afin de donner une décimale à la variable, même si la variable est un nombre entier. Ceci est effectué afin de donner une idée de la position relative de l'enregistrement de la médiane parmi les enregistrements de même valeur (la médiane). Une valeur de 23,46 veut dire que l'enregistrement du milieu (la médiane) démontre Âge = 23 et 46 % des enregistrements avec Âge = 23 se trouvent à la gauche du milieu. Par exemple, l'ensemble suivant {23, 23, 23, 23, 23, 23, 23, 23, 23} (la médiane est en caractère gras) donne 23,11 comme médiane calculée/déclarée.

Règle sur la qualité des données pour la diffusion des données relatives à la population de 100 ans et plus

Les données sur la population âgée de 100 ans et plus ne peuvent être diffusées en année d'âge. Pour les demandes personnalisées qui exigent une ventilation plus détaillée que celle des produits de données normalisés, dans lesquels on groupe la population âgée de 100 ans et plus, la seule ventilation détaillée possible est comme suit, et ne peut être fournie que pour « Canada » :

Population totale âgée de 100 ans et plus
100 ans à 104 ans
105 ans à 109 ans
110 ans et plus

Règles relatives à la qualité des données pour la diffusion des données sur les couples de même sexe et de sexe opposé

Les questionnaires du Recensement de 2011 et de l'Enquête nationale auprès des ménages de 2011 ont utilisé, pour la première fois, une réponse précise sur les liens entre les membres du ménage afin de déterminer le nombre de couples mariés de même sexe. L'analyse des données sur les couples mariés de même sexe a montré qu'une surestimation de ce type de familles et d'état matrimonial a pu survenir. Le Recensement de 2011 montre un total de 64 575 couples de même sexe au Canada, dont 21 015 sont des couples mariés. À l'échelle nationale, l'écart de la surestimation de ces deux chiffres varie entre 0 et 4 500.

Les niveaux géographiques tels que le Canada, les provinces, les territoires et les régions métropolitaines de recensement (RMR) affichent des chiffres généralement plus élevés, donc on s'attend à ce que la surestimation potentielle soit relativement petite ; toutefois, il faut quand même interpréter les données avec prudence.

À un niveau géographique moins élevé, la même surestimation potentielle peut être relativement importante, alors non seulement faut-il interpréter les données avec prudence, mais, certaines règles de suppression limitent leur publication. Ces règles s'appliquent aux données du Recensement de 2011 et aux données de l'Enquête nationale auprès des ménages de 2011.

Premièrement, la ventilation des données sur les couples de même sexe ou les couples de sexe opposé selon la situation conjugale, c.-à -d. s'ils sont mariés ou vivant en union libre, ne doit pas être diffusée pour des régions géographiques autres que le Canada, les provinces, les territoires et les RMR.

Deuxièmement, les données qui identifient les couples de même sexe ou les couples de sexe opposé (au total, couples mariés ou vivant en union libre) pour toutes les régions où la population compte moins de 5 000 habitants (tel qu'établi lors du Recensement de 2011 pour les ménages privés) ne doivent pas être diffusées.

En résumé,

  • Toutes les données pour les couples de même sexe ou les couples de sexe opposé pour le Canada, les provinces, les territoires et les régions métropolitaines de recensement (RMR) peuvent être diffusées, toutefois elles doivent être interprétées avec prudence.
  • Les données sur les couples de même sexe ou les couples de sexe opposé peuvent être diffusées pour d'autres régions géographiques si leur population compte 5 000 habitants ou plus, à condition que la ventilation selon la situation conjugale (couples mariés ou vivant en union libre) ne soit pas incluse.
  • Aucunes données identifiant les couples de même sexe ou les couples de sexe opposé ne peuvent être diffusées pour les régions comptant une population de moins de 5 000 habitants.
Date de modification :