Recensement de 2011 : Normes et lignes directrices relatives à la confidentialité et à la qualité des données (version publique)
Règles relatives à la confidentialité (non-divulgation)

La présente section décrit les diverses règles utilisées pour garantir la confidentialité (ou non-divulgation) de l'identité et des caractéristiques des répondants. Toutes les données du recensement sont assujetties à des règles (de non-divulgation).

Suppression des régions pour les régions géographiques normaliséesNote de bas de page 1 et non normalisées

La suppression des régions a pour objet d'éliminer toutes les données sur les caractéristiques pour les régions géographiques dont la population est inférieure à un seuil donné.

Le seuil de population défini pour toutes les régions normaliséesNote de bas de page 1 ou les regroupements de régions normalisées, sauf les îlots, les côtés d'îlot et les régions définies selon le code postal, est de 40. Par conséquent, aucune caractéristique ou donnée totalisée n'est diffusée pour les régions comptant moins de 40 habitants.

Dans le cas des régions définies selon le code postal à six caractères (région de tri d'acheminement – unité de distribution locale [RTA-UDL]), des régions géocodées et des régions normalisées constituées d'îlots, de côtés d'îlot ou d'UDL, le seuil de population est établi à 100 personnes. Par conséquent, aucune caractéristique ou donnée totalisée ne doit être diffusée si la population totale de la région est inférieure à 100 habitants. En général, la population des îlots et des côtés d'îlot urbains (un côté d'une rue, situé entre deux intersections consécutives) est trop faible pour respecter les seuils de population établis. Les données relatives aux regroupements d'îlots ou de côtés d'îlot dont la population est supérieure au seuil fixé peuvent être extraites à l'aide d'un tableau personnalisé.

Ces seuils de population sont appliqués aux données du Recensement de 2011 et à celles de tous les recensements antérieurs.

Veuillez consulter la section Règles d'agrégation minimales des codes postaux pour les règles supplémentaires applicables aux données relatives aux codes postaux.

Règles d'agrégation minimales des codes postaux

En plus des règles de confidentialité concernant la diffusion des données du recensement auprès des ménages assorties des codes postaux, les règles suivantes s'appliquent aux codes postaux. Ces règles s'inscrivent dans le cadre de la clause 03.01 (n) de l'Entente de licence commerciale concernant l'utilisation des codes postaux à des fins autres que la correspondance conclue entre Statistique Canada et la Société canadienne des postes.

  • Toutes les demandes doivent comprendre des lots d'au moins deux codes postaux. Seuls les codes postaux dont le second caractère est un zéro (codes postaux ruraux) font exception.
  • On doit attribuer aux groupes de codes postaux un numéro ou une classification unique (p. ex., K1A 0T6, 0T7, 0T8 = Région personnalisée 1); selon les modalités du contrat mentionné ci-dessus, les clients ne peuvent pas recevoir de listes de codes postaux, seul le nom mentionné dans la requête du client peut être utilisé.
  • Toutes les autres règles de confidentialité pour les extractions personnalisées s'appliquent, conformément à la Suppression des régions pour les régions géographiques normalisées et non normalisées.

En outre, l'avertissement qui suit doit être inclus dans toutes les demandes de codes postaux personnalisées :

Avis de non-responsabilité concernant la validation du code postal : Statistique Canada ne fait aucune déclaration et n'offre aucune garantie concernant l'exactitude des données relatives aux codes postauxMO soumis à Statistique Canada.

Ces règles s'appliquent aussi aux demandes de codes postaux historiques.

Arrondissement aléatoire

Tous les chiffres présentés dans les totalisations du recensement font l'objet d'un arrondissement aléatoire, qui consiste à transformer les chiffres bruts en chiffres arrondis aléatoirement. Cette mesure réduit les risques de divulgation de l'identité des répondants dans les totalisations.

Tous les chiffres sont arrondis à un multiple de 5, ce qui signifie que tous les chiffres se termineront par un 0 ou par un 5. L'algorithme d'arrondissement aléatoire utilisé permet de contrôler les résultats et d'arrondir le chiffre des unités selon une fréquence prédéterminée comme le montre le tableau suivant. Prenez note que les chiffres se terminant par un 0 ou par un 5 ne sont pas modifiés.

Fréquence de l'arrondissement aléatoire
Valeurs de l'unité Arrondies à un chiffre se terminant par 0 Arrondies à un chiffre se terminant par 5
1 4 fois sur 5 1 fois sur 5
2 3 fois sur 5 2 fois sur 5
3 2 fois sur 5 3 fois sur 5
4 1 fois sur 5 4 fois sur 5
5 Jamais Toujours
6 1 fois sur 5 4 fois sur 5
7 2 fois sur 5 3 fois sur 5
8 3 fois sur 5 2 fois sur 5
9 4 fois sur 5 1 fois sur 5
0 Toujours Jamais

L'algorithme d'arrondissement aléatoire se sert d'une valeur de départ aléatoire pour déclencher le processus d'arrondissement pour les tableaux. Lorsque ces routines sont appliquées, il est possible que le même chiffre dans le même tableau soit arrondi vers le haut dans une exécution et vers le bas dans une autre en raison de la méthode utilisée pour amorcer le processus.

Prévention de la divulgation pour les statistiques

Les statistiques (moyenne, erreur-type, somme, médiane, centile, ratio ou pourcentage) ne sont pas arrondies aléatoirement. Toutefois, l'inclusion des statistiques dans les tableaux où figurent également les chiffres à partir desquels elles ont été calculées peut se solder par la divulgation de l'identité des répondants. Pour éviter ce problème, on applique des méthodes de suppression pour les statistiques ou des calculs statistiques spéciaux.

Suppression de statistiques

Dans le cas de toutes les variables quantitatives, les statistiques sont supprimées si le nombre d'enregistrements réel à partir duquel elles ont été calculées est inférieur à 4.

Calculs statistiques spéciaux

  1. La valeur prise par la statistique n'est jamais arrondie, sauf dans le cas des fréquences.
  2. Toutes les statistiques fondées sur un classement par ordre des valeurs (médianes, centiles) sont calculées de la façon habituelle et ne sont jamais arrondies. Le minimum ou le maximum d'une statistique n'est jamais diffusé.
  3. Lorsqu'on précise une somme pour l'âge, le programme multiplie alors la moyenne non arrondie du groupe en question par la fréquence arrondie. Autrement, si une somme spécifiée est pour une variable autre que l'âge, le programme arrondit la somme réelle.

Lorsqu'il faut faire une division (moyennes, pourcentages, ratios, etc.), le programme doit appliquer la règle énoncée au point 3) tant au numérateur qu'au dénominateur avant d'effectuer la division.

Nota : Les statistiques fondées sur un classement par ordre des valeurs, telles que la médiane et les centiles, sont toujours calculées au moyen d'interpolations linéaires. Ces statistiques ne sont donc pas fiables dans le cas de cellules comportant de faibles valeurs. C'est pourquoi aucune autre règle relative à la confidentialité ne leur est appliquée.
Nota : La moyenne d'un âge n'est pas modifiée par l'arrondissement, parce que le numérateur correspond au produit de la moyenne réelle multipliée par la fréquence arrondie, et que le dénominateur correspond à la fréquence arrondie. Les deux fréquences s'annulent l'une l'autre de sorte que la moyenne réelle n'est pas modifiée.
Date de modification :