Chapitre 3 – Pratiques relatives à la confidentialité

Suppression de régions pour les données sur les caractéristiques du revenu

La règle de suppression des régions consiste à remplacer les données sur les caractéristiques du revenu par un « x » dans le cas des régions géographiques dont la population et/ou le nombre de ménages est inférieur à un seuil déterminé.

Si une totalisation de l'ENM contient des données quantitatives sur le revenu (p. ex., le revenu total, les salaires), des données qualitatives fondées sur les notions de revenu (p. ex., état du faible revenu avant impôt) ou des données dérivées fondées sur les variables quantitatives du revenu (p. ex., les indices) pour des personnes, des familles ou des ménages, la règle suivante s'applique : les données sur les caractéristiques du revenu sont remplacées par un « x » pour les régions dans lesquelles la population est inférieure à 250 ou dans lesquelles le nombre de ménages privés est inférieur à 40. Le seuil de ménage privé ne s'applique pas aux totalisations fondées sur les géographies du lieu de travail.

Ajustement des estimations sur le lieu de travail pour des raisons de confidentialité

Il est possible d'obtenir des estimations personnalisées du lieu de travail pour les îlots de diffusion. Ces estimations seront rajustées pour renforcer le caractère confidentiel des données. De fait, toutes les estimations de la population active occupée ayant un lieu de travail habituel ou ayant travaillé à domicile seront arrondies à un multiple de 5. Cet ajustement sera cependant contrôlé. Cela signifie que les agrégats (totaux) des estimations rajustées de population ajustés pour les aires de diffusion seront toujours inférieurs ou supérieurs de moins de 5 unités des valeurs réelles.

Ajustement des estimations de la population de jour pour des raisons de confidentialité

Les estimations de la population de jour seront déterminées en ajoutant à la population résidant dans un secteur donné les travailleurs qui résident ailleurs, mais qui travaillent dans le secteur en question, puis en soustrayant du résultat obtenu les travailleurs qui résident dans le secteur, mais qui travaillent ailleurs. Le nombre de travailleurs est fondé sur la population active occupée ayant un lieu de travail habituel ou ayant travaillé à domicile. Les estimations de la population de jour seront rajustées afin de mieux protéger le caractère confidentiel des données par une méthode d'arrondissement contrôlé des estimations à un multiple de 5.

Prévention de la divulgation

Il faut également tenir compte des risques de divulgation directe ou par recoupements au moment de déterminer le contenu des produits. L'évaluation du risque nécessite la prise en considération d'un certain nombre de facteurs. Les données détaillées relatives aux diverses variables, le recoupement des variables et l'échelon géographique selon lequel les données sont réparties auront tous une incidence sur le niveau de risque. Par exemple, il se peut que la production de totalisations indiquant le nombre de pièces que compte le logement et la tranche de valeur détaillée du logement selon diverses caractéristiques des membres du ménage ne pose pas de risque de divulgation dans le cas de grandes régions géographiques, mais que ce risque augmente pour les unités géographiques de niveau inférieur.

La méthode la plus largement utilisée pour prévenir la divulgation consiste à définir le contenu qui convient à un niveau géographique donné. Il est aussi possible de définir des seuils de population croissants ou de procéder à des suppressions manuelles, au besoin. Étant donné que ces méthodes sont liées aux exigences propres des divers produits, elles ne sont pas appliquées par les systèmes de suppression automatisés.

Totalisation du Recensement de l'agriculture

Les données du Recensement de l'agriculture et de l'Enquête nationale auprès des ménages (ENM) sont appariées en utilisant l'information géographique et les caractéristiques des exploitants agricoles (c.-à-d. l'âge et le sexe). Le taux d'appariement s'établit à 95 % environ et on effectue une pondération afin de tenir compte des cas de non-appariement. Il est possible d'obtenir des données sur tous les membres des ménages dont un des membres est un exploitant agricole.

Les données du Recensement de l'agriculture comprennent le type de ferme, les ventes agricoles, les superficies des terres de culture et les nombres de têtes de bétail, tandis que l'ENM fournit des données socioéconomiques, y compris la scolarité, le revenu et la profession des familles et des membres du ménage. Les produits normalisés dont l'élaboration est prévue d'avance sont offerts à l'échelle provinciale seulement.

Les produits personnalisés sont disponibles aux niveaux provinciaux. Les données sont soumises à un arrondissement aléatoire et à une suppression des valeurs inférieures à un seuil précisé pour assurer la protection de la confidentialité. Les suppressions sont effectuées manuellement dans le cas des cellules comportant une valeur inférieure à un seuil déterminé.

Les totalisations sont toutes vérifiées à l'interne par le personnel du Recensement de l'agriculture.

Fichiers de microdonnées à grande diffusion (FMGD)

Les produits FMGD de l'ENM de 2011 consisteront en deux fichiers de microdonnées : le fichier des particuliers et le fichier hiérarchique. Le fichier des particuliers contiendra les enregistrements d'environ 3 % de la population canadienne et le fichier hiérarchique contiendra les enregistrements de 1 % de la population dans les ménages privés.

Les fichiers de microdonnées sont uniques parmi les produits de l'ENM car ils sont les seuls qui permettent aux utilisateurs d'avoir accès aux données non agrégées. Les FMGD sont donc de puissants outils de recherche. Chaque fichier comprend un grand nombre de variables. Les utilisateurs peuvent regrouper et manipuler ces variables en fonction de leurs besoins en données et de leurs exigences en matière de recherche. Des totalisations qui ne sont pas incluses dans d'autres produits de l'ENM peuvent être créées, ou des relations entre les variables peuvent être analysées en utilisant divers outils d'analyse.

Les fichiers de microdonnées à grande diffusion (FMGD) de l'ENM permettent d'accéder rapidement à une vaste base de données sociales et économiques concernant le Canada et sa population. Ils consistent en échantillons de réponses anonymes au questionnaire de l'ENM (formules N1, N2). Les FMGD contiennent des informations statistiques sur les Canadiens, les familles et les ménages auxquels ils appartiennent et les logements dans lesquels ils vivent et permettent aux chercheurs d'étudier les relations entre ces univers.

Statistique Canada est tenu de protéger la confidentialité des données qu'il recueille. Étant donné la nature même d'un fichier de microdonnées, diverses mesures sont mises en place afin de respecter cet engagement. Le Comité de la diffusion des microdonnées examine toutes les demandes concernant la diffusion de microdonnées.

Les données pour de petites régions géographiques ne seront pas disponibles dans ces fichiers. L'utilisateur trouvera l'information uniquement pour certaines régions métropolitaines de recensement, les provinces et les territoires. Les données variables sont agrégées afin de préserver la confidentialité, tout en fournissant le plus de détails possibles pour maintenir la valeur analytique du fichier. Certaines des valeurs de variables sensibles sont supprimées parce que si on les combinait, on pourrait les utiliser pour révéler l'identité d'une personne, d'une famille ou d'un ménage. En outre, toutes les variables quantitatives de valeurs en dollars sont assujetties à un arrondissement aléatoire et on leur attribue une valeur plafond et une valeur plancher.

Date de modification :