Traitement du Recensement de 2011

Au cours des deux premières semaines de mai 2011, 80 % des ménages canadiens ont reçu une lettre ou un questionnaire du recensement par la poste alors que les 20 % restants ont reçu leur questionnaire d’un intervieweur. On a demandé aux répondants de répondre aux questions du recensement en ligne ou de retourner par la poste le questionnaire papier rempli.

La phase suivante du processus du recensement a commencé dès le 3 mai puisque les ménages pouvaient choisir de remplir leur formulaire en ligne aussitôt qu’ils recevaient leur questionnaire papier. Cette phase a enclenché le processus de conversion en données significatives des réponses d’environ 13,5 millions de ménages. Cette étape du cycle du recensement est connue comme la phase de traitement et comporte les activités principales suivantes :

Réception et enregistrement – mai à juillet 2011

Le personnel du traitement des données de Gatineau, au Québec, est responsable de l’enregistrement des questionnaires du recensement remplis. Postes Canada en assure l’enregistrement initial en lisant les codes à barres par la fenêtre des enveloppes-réponses. 

Dans le cadre du Recensement de 2011, Postes Canada a livré les questionnaires papier retournés par la poste au Centre des opérations des données alors que les questionnaires électroniques ont été transmis directement à Statistique Canada, à Ottawa. Les questionnaires électroniques ont été enregistrés automatiquement et les questionnaires papier ont été vérifiés en balayant le code à barres au recto du questionnaire.

Au fur et à mesure que les activités de collecte ont diminué, on a passé à l’étape suivante des activités de traitement en ce qui concernait les questionnaires papier enregistrés.

Imagerie et saisie des données – mai à juillet 2011

Le Recensement de 2011 saisissait automatiquement les données en ayant recours à des technologies de saisie automatisée plutôt qu’à la saisie manuelle au clavier.

Étapes de l’imagerie

La préparation de documents – les questionnaires retournés par la poste sont retirés des enveloppes et préparés pour le balayage en étant débarrassés de tout corps étranger, comme les trombones et les agrafes. Les formulaires sous forme de carnet sont séparés en feuilles isolées.

Le balayage – en utilisant des scanneurs à grande vitesse, les questionnaires papier sont convertis en images numériques (photos).

La saisie automatisée des données – la reconnaissance optique des marques et la reconnaissance intelligente des caractères sont utilisées pour extraire les données des répondants. Lorsque les systèmes sont incapables de reconnaître l’écriture, la correction des données est faite par l’opérateur.

La vérification à la sortie – aussitôt que les questionnaires ont franchi toutes les étapes susmentionnées, les questionnaires papier sont retirés du système. La vérification à la sortie est un processus d’assurance de la qualité qui fait en sorte que les images et les données saisies sont d’une qualité telle que les questionnaires papier ne sont plus nécessaires.

Contrôles automatisés – mai à juillet 2011

Certains contrôles d’intégralité automatisés simulant ceux qu’aurait fait un intervieweur lors de recensements précédents sont faits à ce stade pour vérifier l’intégralité, la cohérence et la couverture des données. Des réponses multiples pour un ménage peuvent être reçues et signalées pour des vérifications interactives subséquentes si une erreur a été relevée.

Suivi des questionnaires rejetés au contrôle – mai à juillet 2011

Lorsqu’une réponse manquante ou non valable est trouvée, une vérification interactive peut être utilisée pour résoudre le problème en examinant manuellement les données saisies et les images numérisées (lorsqu’elles sont disponibles) pour aider à déterminer la réponse appropriée. Lorsque cela est nécessaire, les données des questionnaires des ménages rejetées sont transmises au bureau de soutien à la collecte pour un suivi. Les données sont transmises de nouveau vers le Centre des opérations des données et réintégrées dans le système pour traitement subséquent des données.

Codage automatisé – mai à octobre 2011

Le questionnaire du recensement renferme des questions où il est demandé de cocher des réponses dans une liste de même que des questions où il est demandé au répondant d’écrire les réponses dans les cases prévues à cette fin. Ces réponses écrites devaient être converties en codes numériques avant d’être totalisées pour la diffusion. Au Recensement de 2011, toutes les réponses écrites du questionnaire ont été soumises à un codage automatisé et assisté par ordinateur qui assignait à chacune des questions un code numérique à l’aide des fichiers de référence, des listes de codes et des classifications types de Statistique Canada. Des fichiers de référence ont été construits pour le processus d’appariement automatisé à partir de réponses reçues lors de recensements antérieurs. Des codeurs spécialement formés et des experts se chargeaient de résoudre les cas où il était impossible d’attribuer automatiquement un code numérique.

Le codage s’est appliqué aux variables suivantes :

  • Lien avec la Personne 1
  • Langue parlée à la maison
  • Langue maternelle

En 2011, on s’attendait à ce que plus de 13 millions de réponses écrites soient codées et à ce qu’environ 85 % d’entre elles le soient automatiquement.

Contrôle et imputation – septembre 2011 à septembre 2012

Les données recueillies lors de toute enquête ou de tout recensement contiennent des omissions et des incohérences, que ce soit parce que le répondant a sauté une question ou parce qu’une erreur s’est produite lors du traitement. Par exemple, un répondant peut oublier de répondre à une question. Le personnel du recensement peut mal coder les réponses ou commettre d’autres erreurs durant le traitement.

Une fois la saisie, le contrôle initial et les opérations de codage terminés, les données sont traitées jusqu’à l’étape du contrôle final et de l’imputation. Le dernier processus de contrôle détecte les erreurs et la phase d’imputation les corrige. La phase de contrôle et d’imputation est importante parce que :

  • Les utilisateurs ont absolument besoin de données cohérentes, particulièrement pour les données qui servent d’estimations officielles à des fins législatives et administratives.
  • Si les cas de réponses non valables ou manquantes n’étaient pas traités, les utilisateurs devraient totaliser des données incomplètes ou établir leurs propres estimations, qui ne concorderaient pas avec d’autres résultats.
  • Plusieurs utilisateurs de données ne souhaitent pas rectifier ou totaliser des données incomplètes.
  • Des données valables sont nécessaires pour les besoins de traitement. Par exemple, la composition de la famille est construite à partir des renseignements fournis par les répondants sur le sexe, l’âge, l’état matrimonial, le lien avec la Personne 1, etc. Si ces données sont manquantes ou incohérentes, les caractéristiques de la famille ne peuvent pas être compilées.

Glossaire

listage/livraison – désigne la livraison (plutôt que l’envoi postal) des questionnaires à 20 % des logements au Canada par les intervieweurs du recensement.

recensement – un portrait statistique du Canada. Le recensement recueille des données démographiques, sociales et économiques sur les personnes, les unités de logement et les exploitations agricoles au Canada.

registre de visite (RV) – document utilisé par les intervieweurs dans les secteurs de listage/livraison pour consigner des renseignements sommaires sur chaque logement. Il y a un RV pour chaque unité de collecte.

unité de collecte (UC) – un petit secteur géographique utilisé pour délimiter les  secteurs traitables pour la collecte des données du recensement. Dans les régions éloignées, il s’agit de l’unité dont un intervieweur est responsable. Il y a eu 47 000 unités de collecte pour le Recensement de 2011.