Normes et lignes directrices relatives à la confidentialité et à la qualité des données (version publique)

Règles relatives à la confidentialité (non-divulgation)

La présente section décrit les diverses règles de suppression utilisées pour garantir la confidentialité (ou non-divulgation) de l'identité et des caractéristiques des répondants. Toutes les données du recensement sont assujetties à des règles de suppression.

Suppression des régions pour les régions géographiques normalisées1 et non normalisées

La suppression des régions a pour objet d'éliminer toutes les données sur les caractéristiques pour les régions géographiques dont la population est inférieure à un seuil donné.

Le seuil de population défini pour toutes les régions normalisées1 ou les regroupements de régions normalisées, sauf les îlots, les côtés d'îlot et les régions définies selon le code postal, est de 40. Par conséquent, aucune caractéristique ou donnée totalisée n'est diffusée pour les régions comptant moins de 40 habitants.

Dans le cas des régions définies selon le code postal à six caractères (région de tri d'acheminement – unité de distribution locale [RTA-UDL]), des régions géocodées et des régions normalisées constituées d'îlots, de côtés d'îlot ou d'UDL, le seuil de population est établi à 100 personnes. Par conséquent, aucune caractéristique ou donnée totalisée ne doit être diffusée si la population totale de la région est inférieure à 100 habitants. En général, la population des îlots et des côtés d'îlot urbains (un côté d'une rue, situé entre deux intersections consécutives) est trop faible pour respecter les seuils de population établis. Les données relatives aux regroupements d'îlots ou de côtés d'îlot dont la population est supérieure au seuil fixé peuvent être extraites à l'aide d'un tableau personnalisé.

Ces seuils de population sont appliqués aux données du Recensement de 2011 et à celles de tous les recensements antérieurs.

Arrondissement aléatoire

Tous les chiffres présentés dans les totalisations du recensement font l'objet d'un arrondissement aléatoire, qui consiste à transformer les chiffres bruts en chiffres arrondis aléatoirement. Cette mesure réduit les risques de divulgation de l'identité des répondants dans les totalisations.

Tous les chiffres sont arrondis à un multiple de 5, ce qui signifie que tous les chiffres se termineront par un 0 ou par un 5. L'algorithme d'arrondissement aléatoire utilisé permet de contrôler les résultats et d'arrondir le chiffre des unités selon une fréquence prédéterminée comme le montre le tableau 2.1 suivant. Prenez note que les chiffres se terminant par un 0 ou par un 5 ne sont pas modifiés.

Fréquence de l'arrondissement aléatoire
Valeurs de l'unité Arrondies à un chiffre se terminant par 0 Arrondies à un chiffre se terminant par 5
1 4 fois sur 5 1 fois sur 5
2 3 fois sur 5 2 fois sur 5
3 2 fois sur 5 3 fois sur 5
4 1 fois sur 5 4 fois sur 5
5 Jamais Toujours
6 1 fois sur 5 4 fois sur 5
7 2 fois sur 5 3 fois sur 5
8 3 fois sur 5 2 fois sur 5
9 4 fois sur 5 1 fois sur 5
0 Toujours Jamais

L'algorithme d'arrondissement aléatoire se sert d'une valeur de départ aléatoire pour déclencher le processus d'arrondissement pour les tableaux. Lorsque ces routines sont appliquées, il est possible que le même chiffre dans le même tableau soit arrondi vers le haut dans une exécution et vers le bas dans une autre en raison de la méthode utilisée pour amorcer le processus.

Prévention de la divulgation pour les statistiques

Les statistiques (moyenne, erreur-type, somme, médiane, centile, ratio ou pourcentage) ne sont pas arrondies aléatoirement. Toutefois, l'inclusion des statistiques dans les tableaux où figurent également les chiffres à partir desquels elles ont été calculées peut se solder par la divulgation de l'identité des répondants. Pour éviter ce problème, on applique des méthodes de suppression pour les statistiques ou des calculs statistiques spéciaux.

Suppression de statistiques

Dans le cas de toutes les variables quantitatives, les statistiques sont supprimées si le nombre d'enregistrements réel à partir duquel elles ont été calculées est inférieur à 4.

Calculs statistiques spéciaux

  1. La valeur prise par la statistique n'est jamais arrondie, sauf dans le cas des fréquences.
  2. Toutes les statistiques fondées sur un classement par ordre des valeurs (médianes, centiles) sont calculées de la façon habituelle et ne sont jamais arrondies. Le minimum ou le maximum d'une statistique n'est jamais diffusé.
  3. Lorsqu'on précise une somme pour l'âge, le programme multiplie alors la moyenne non arrondie du groupe en question par la fréquence arrondie. Autrement, si une somme spécifiée est pour une variable autre que l'âge, le programme arrondit la somme réelle.

Lorsqu'il faut faire une division (moyennes, pourcentages, ratios, etc.), le programme doit appliquer la règle énoncée au point 3) tant au numérateur qu'au dénominateur avant d'effectuer la division.

Nota : Les statistiques fondées sur un classement par ordre des valeurs, telles que la médiane et les centiles, sont toujours calculées au moyen d'interpolations linéaires. Ces statistiques ne sont donc pas fiables dans le cas de cellules comportant de faibles valeurs. C'est pourquoi aucune autre règle relative à la confidentialité ne leur est appliquée.

Nota : La moyenne d'un âge n'est pas modifiée par l'arrondissement, parce que le numérateur correspond au produit de la moyenne réelle multipliée par la fréquence arrondie, et que le dénominateur correspond à la fréquence arrondie. Les deux fréquences s'annulent l'une l'autre de sorte que la moyenne réelle n'est pas modifiée.

1. Pour obtenir de plus amples renseignements sur les régions géographiques normalisées, consultez le Dictionnaire du recensement.

Page précédente | Page suivante