Statistique Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Avertissement Consulter la version la plus récente.

Contenu archivé

L'information indiquée comme étant archivée est fournie aux fins de référence, de recherche ou de tenue de documents. Elle n'est pas assujettie aux normes Web du gouvernement du Canada et elle n'a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

7. Contre-vérification des dossiers

7.1 Échantillonnage

7.2 Traitement et classification

7.2.1 Traitement

7.2.2 Classification

7.3 Collecte des données

7.3.1 Environnement

7.3.2 Opérations

7.3.3 Dépistage

7.3.4 Statistiques en matière de collecte

7.4 Estimation

7.1 Échantillonnage

La population cible, qui comprend toutes les personnes qui auraient dû être dénombrées au Recensement de 2006, est formée à partir de six sources (bases de sondage) présentées dans le tableau 7.1.1. Les cinq premières bases sont utilisées pour l'estimation du sous‑dénombrement dans les dix provinces tandis que les estimations pour les trois territoires sont calculées grâce aux échantillons de la dernière base seulement.

Un problème qui se pose avec l'utilisation des bases de sondage multiples est la possibilité qu'une personne soit incluse dans plus d'une base. Par exemple, une personne qui est incluse dans la base des immigrants pouvait être au Canada en mai 2001 avec un permis de travail et aurait été dénombrable au Recensement de 2001. Elle serait donc à la fois dans la base des immigrants, et dans celle du recensement si elle était dénombrée ou dans celle des personnes omises si elle était omise. Il est donc important d'identifier tous les cas de chevauchement de base, sinon les estimations produites risquent d'être trop élevées puisque les personnes se trouvent à être comptées deux fois dans les bases de sondage. Autant que possible ce chevauchement est identifié lors de la construction des bases de sondage, mais une partie est également identifiée plus tard en utilisant l'information fournie par les répondants.

Un autre problème est qu'aucune des cinq premières bases de sondage ne couvre les personnes émigrées ou hors pays lors du Recensement de 2001 qui sont revenues durant la période intercensitaire (« Canadiens de retour dans une province »). Selon les estimations démographiques, on estime cette population à 210 406 personnes. À ce nombre s'ajoutent 12 817 personnes de retour des territoires dans les provinces et 4 955 provenant des réserves indiennes ou établissements indiens partiellement dénombrés en 2001 et dénombrés en 2006. Les estimations de l'erreur de couverture ne couvrent pas ces populations estimées à 228 178 personnes.

La répartition de l'échantillon a été effectuée en deux étapes. Premièrement, l'échantillon national a été attribué aux provinces en utilisant une combinaison d'une répartition proportionnelle afin d'obtenir la même variance pour toutes les estimations provinciales du taux de sous‑dénombrement et d'une répartition optimale, de façon à établir l'estimation nationale du taux de sous-dénombrement affichant la variance la moins élevée. Deuxièmement, on a déterminé la répartition des échantillons provinciaux en fonction des strates. Cette répartition a été déterminée grâce à la méthode de répartition optimale, basée sur les taux historiques de sous‑dénombrement (en 2001, on tenait également compte du surdénombrement mais ce n'est pas le cas en 2006), les taux historiques de non-réponse et la taille de la strate. La seule exception réside dans la base de données des personnes omises, puisque toutes les personnes considérées comme des personnes omises lors de la CVD de 2001 ont été choisies. Il convient de souligner que la répartition n'est qu'approximativement optimale étant donné que des hypothèses ont été avancées à propos de la taille de certaines populations, notamment le nombre prévu de naissances et d'immigrants intercensitaires. L'échantillon total attribué était de 69 602 (67 664 dans les provinces et 1 938 dans les territoires) personnes réparties parmi les bases. Le tableau 7.1.1 présente la répartition de l'échantillon selon les bases de sondage. Le tableau 7.1.2 présente la répartition de l'échantillon par strate pour toutes les provinces.

Le tableau 7.1.3 présente la répartition par strates pour tous les territoires.

Étant donné que la répartition de l'échantillon est tributaire des hypothèses à propos de la taille de certaines populations, notamment le nombre prévu de naissances et d'immigrants intercensitaires, la taille réelle de l'échantillon pour l'échantillon provincial des naissances, des immigrants et des résidents non permanents n'est pas connue tant que tous les échantillons ne sont pas prélevés. Ce n'est pas le cas pour ce qui est de l'échantillon des territoires. Le tableau 7.1.4 indique la taille finale de l'échantillon pour chaque province et territoire. L'échantillon de la CVD de 2006 était formé de 67 813 personnes dans les provinces et de 1 938 personnes dans les territoires. Par ailleurs, 84 522 personnes ayant un poids de un ont contribué aux estimations territoriales.

Le plan d'échantillonnage varie d'une base à l'autre selon la nature de la liste utilisée. Dans la base du Recensement 2001, le plan d'échantillonnage est un plan stratifié à un seul degré. La population est stratifiée par province de résidence, sexe, âge et état matrimonial. Les personnes dénombrées au Recensement de 2001 dans des réserves indiennes forment des strates séparées. Comme décrit précédemment, nous avons utilisé une répartition optimale pour sélectionner l'échantillon dans chaque strate. L'échantillon est réparti entre dans chacune des strates afin d'observer le plus de cas de personnes omises possible.

Les fractions de sondage ne sont pas les mêmes dans chaque strate. On a recours à des fractions de sondage plus élevées pour les sous-groupes où l'on prévoit un sous-dénombrement important ou un taux de dépistage plus faible, ceci dans le but de rendre le plan de sondage plus efficace. Par exemple, tout comme la CVD de 2001, on a attribué une probabilité d'être choisis plus grande aux hommes célibataires âgés de 20 à 24 ans en 2006, car on a observé lors des CVD précédentes que le sous-dénombrement est toujours plus important dans cette strate. En raison de l'intérêt accru pour les études sur les populations autochtones, les tailles des échantillons dans les strates provinciales pour les personnes dénombrées au Recensement de 2001 dans des réserves indiennes ont été doublées par rapport à 2001.

La base des personnes omises est une base de sondage conceptuelle puisqu'il n'existe pas de liste de toutes les personnes omises au Recensement de 2001. L'échantillon de cette base est constitué de tous les cas classés « omis » lors de la CVD de 2001. L'échantillon n'est pas stratifié comme tel quoiqu'il y ait une stratification implicite, car les cas omis en 2001 proviennent de bases et de strates différentes.

Pour la base des naissances, on obtient une copie des enregistrements de naissances de la statistique de l'état civil, pour la période intercensitaire. La base est ensuite stratifiée par province de résidence de la mère. Les échantillons provinciaux sont sélectionnés systématiquement après un tri par date de naissance de l'enfant.

On construit la base des immigrants grâce aux dossiers de l'immigration de Citoyenneté et Immigration Canada. Cette base est stratifiée par province. En 2006, il n'y a pas, comme en 2001, de stratification par année pour les trois provinces où se dirigent la majorité des immigrants (Québec, Ontario et Colombie-Britannique). Les échantillons provinciaux sont sélectionnés systématiquement après un tri par année d'immigration.

La base des résidants non permanents (détenteurs de permis et revendicateurs de statut de réfugié) est construite grâce aux dossiers de Citoyenneté et Immigration Canada. Les dossiers sont regroupés par province. Contrairement à 2001, pour le Québec, l'Ontario et la Colombie‑Britannique, des strates contenant, d'une part, les détenteurs de permis pour étudiants ou de permis ministériel, d'autre part, les détenteurs de permis de travail et en dernier lieu, les revendicateurs de statut de réfugié, n'ont pas été créés. Les échantillons provinciaux sont sélectionnés systématiquement après un tri par types de permis et statut de réfugié afin de s'assurer d'une bonne représentativité pour chacun de ces groupes.

La méthodologie pour les territoires a été changée en 2006. Comme pour les CVD précédentes, les bases de sondage des trois territoires sont formées à partir de leurs fichiers d'assurance‑santé respectifs. Quelques dossiers d'autres sources ont également été ajoutés pour le Territoire du Yukon afin d'améliorer la couverture de la base. Par la suite, les personnes listées sur les bases de sondage de chacun des territoires sont appariées de façon exacte par nom, sexe et âge à la base de données des réponses du Recensement de 2006 (BDR). Une vérification manuelle est également exécutée. Les personnes appariées sont classées dénombrées et un poids de 1 leur est associé. Par la suite, on stratifie par âge et sexe les personnes non classées dénombrées. Des échantillons à un degré sont tirés dans chaque strate de façon systématique après un tri par géographie.

Après la sélection des échantillons, l'étape suivante est la préparation de l'échantillon qui consiste à vérifier la qualité de l'information pour les différentes variables d'intérêt, soient géographiques ou démographiques. Par exemple, on procède à la vérification de la qualité des noms et à la validité des dates de naissance. Les adresses sont standardisées afin de faciliter le traitement ultérieur. Afin de mettre à jour l'information géographique, en particulier pour l'échantillon du recensement et des omis dont l'information date de 2001, on procède à un appariement aux fichiers d'Impôt sur le revenu des particuliers de l'Agence de revenu du Canada de 2000 à 2005. On vérifie également si des personnes sélectionnées sont décédées à l'aide de ces fichiers et des données de l'état civil.

7.2 Traitement et classification

7.2.1 Traitement

L'objectif du traitement est :

  1. de déterminer si chaque personne choisie (PC) faisait partie de la population cible du recensement;
  2. de déterminer si chaque PC a été dénombrée lorsqu'elle faisait partie de la population cible du recensement;
  3. de fournir davantage de renseignements pour l'ajustement de la non-réponse.

Le résultat du traitement est enregistré dans une classification attribuée aux PC, aux fins d'estimation et de totalisation (voir section 7.4 et section 9).

La majeure partie des travaux pour le traitement impliquait d'effectuer des recherches dans la version de la CVD de la base de données des réponses du Recensement de 2006 (CVD BDR) pour déterminer si la PC avait été dénombrée à une des adresses associées à elle-même. Les adresses ont été obtenues de sources variées incluant :

  • la base de sondage pour les adresses de sélection;
  • des mises à jour des adresses à partir des dossiers fiscaux;
  • l'interview téléphonique assistée par ordinateur (ITAO) (voir la section 7.3);
  • des appariements avec la CVD BDR en utilisant la date de naissance et le sexe de la PC et des membres de son ménage, ou, le nom, le code postal ou le numéro de téléphone des PC.

La CVD BDR est une version antérieure de la base de données des réponses du Recensement de 2006 qui était disponible avant la fin du traitement du recensement. Il y a quelques différences mineures entre la CVD BDR et les versions ultérieures des bases de données du recensement. En particulier, la CVD BDR, une base des données des personnes, comprend tous les enregistrements du recensement pour les personnes sauf trois exceptions. La première exception concerne les enregistrements du recensement imputés dans le cadre des imputations de ménages au complet (IMC). Le deuxième groupe concerne les enregistrements du recensement avec des noms invalides ou incomplets, ou des dates de naissance invalides ou incomplètes. Ce groupe est également connu comme étant les « dénombrement incomplets ». Le troisième groupe se rapporte à tous les enregistrements du recensement qui ont été ajoutés tardivement, après le début du traitement de la CVD.

La première étape, suite à la préparation de l'échantillon, a été de traiter toutes les PC avec les adresses disponibles provenant de la base de sondage et des données fiscales afin d'effectuer des recherches dans la CVD BDR pour trouver chaque PC. Il y a eu deux résultats. Lorsque la PC a été trouvée, la classification « dénombrée » a été généralement attribuée et aucun autre traitement n'a été requis. Les PC qui ont par la suite été identifiées comme décédées avant le recensement constituent une exception. Lorsque la PC n'a pas été trouvée, le cas a été envoyé à la collecte. Les opérations de recherche dans la CVD BDR se sont poursuivies pendant la collecte. La disponibilité des interviews d'ITAO a permis de déterminer si la PC faisait partie de la population cible du recensement ou non. Dans l'affirmative, les données d'ITAO ont permis de pousser plus loin les recherches.

La recherche a été faite à la fois de façon automatisée et manuelle par le personnel du bureau. La recherche automatisée a été effectuée en premier comme suit: pour les adresses obtenues d'un appariement avec la CVD BDR, il y avait un questionnaire du recensement correspondant. D'abord, nous avons calculé le taux de similarité entre le questionnaire du recensement et les données de la CVD. Lorsque ce taux était au-dessus d'un seuil préétabli, on pouvait automatiquement conclure que la PC avait été dénombrée à cette adresse. Si tel était le cas, ni cette adresse ni les autres adresses de cette PC ne devaient être traitées par le personnel du bureau. Les programmes informatiques ont aussi identifié si une adresse était un double d'une autre adresse. Ces adresses en double n'ont pas été traitées.

Pour la recherche manuelle, le personnel de bureau a utilisé de nombreux outils. Il y avait des suggestions de questionnaires du recensement ou d'unités de collecte du recensement appariés à l'adresse. Le personnel pouvait également effectuer des recherches dans la CVD BDR fondés sur des paramètres flexibles. Des annuaires téléphoniques électroniques ont aussi été utilisés. Les résultats de la recherche manuelle ont été automatiquement contrôlés afin de réduire au minimum les erreurs. Un fichier comprenant les résultats de recherche a ensuite été produit. Ce sont les données de ce dossier qui ont été utilisées pour classer les PC.

7.2.2 Classification

Le traitement fournit l'information visant à déterminer quelles PC sont :

  • « listées »;
  • « mobiles »;
  • incluses dans la « population cible du recensement »;
  • « dénombrées »;
  • « omises ».

Certaines PC se retrouvent dans trois ou quatre de ces catégories. D'autres PC ne font partie d'aucun de ces groupes. Ceci sera expliqué plus en détail plus loin dans cette section. La « population cible du recensement » inclut le groupe des personnes listées à la section 2.2. Une PC est considérée « hors champ » si elle ne fait pas partie de la population cible du recensement. Chaque PC classée « hors champ » se voit attribuer une raison pour la classification, tels que: décès, émigration, représentée par une autre base de sondage. Pour classer une personne comme décédée, elle doit apparaître dans les fichiers de mortalité de l'état civil. Les PC classées dans la population cible du recensement sont soit « dénombrées », soit « omises ». Une PC est considérée « dénombrée » si elle est dans la CVD BDR. La classification « omises » est attribuée aux PC dans la population cible du recensement qui ne sont pas dénombrées.

Les définitions de « listées » et « mobiles » dépendent de l'utilité des adresses et de l'information provenant de l'interview de l'ITAO pour déterminer la classification. Dans plusieurs cas, la collecte fournit une/des adresse(s) qui ne sont pas disponibles à partir d'autres sources. Pour d'autres cas, toutes les adresses obtenues pendant la collecte sont également disponibles à partir d'autres sources. Une PC était « listée » si elle avait été classée sans utiliser les données provenant de l'interview de l'ITAO; même si la collecte des données avait été effectuée, l'(les)adresse(s) obtenue(s) pendant l'interview n'ont pas été requises. Une PC était considérée « mobile » si son lieu de résidence habituel, tel que défini à la section 2.4, n'était disponible qu'à partir des données de la collecte. De plus, selon la définition, les PC qui ne font pas partie de la population cible du recensement, et qui sont donc classées hors champ, sont mobiles.

Les personnes choisies (PC) pour lesquelles il n'est pas possible de déterminer une ou plusieurs des caractéristiques a) à e) dans la liste ci-dessus sont considérées comme non-répondants. Il existe deux types de non-répondants :

  • une PC est « non identifiée » lorsqu'il est impossible de déterminer si elle est listée ou non;
  • une PC est « non dépistée » lorsqu'il est impossible de déterminer si elle est incluse ou non dans la population cible du recensement.

Le tableau 7.2 montre la répartition de l'échantillon selon la classification et la base de sondage. La classification est déterminée à partir de combinaisons spécifiques de caractéristiques a) à e). Les données des territoires sont divisées entre la strate appariée et les strates non appariées. Au départ, un échantillon total de 67 813 PC a été sélectionné dans les provinces. De ce nombre, 56 789 PC ont été classées comme étant « dénombrées », tandis que 5 431 ont été classées comme étant « omises » et 2 901 comme des non-répondants. Un ajustement pour la non-réponse est fait lors de l'estimation (voir section 7.4). Il est important de noter que la définition d'un non-répondant, pour la classification, et, par conséquent, pour l'estimation, diffère de la définition habituelle d'un non-répondant, selon la quelle la collecte de données est tentée, mais non terminée. Il en est ainsi parce que pour procéder à la classification, on utilise des données de plusieurs sources, dont une peut avoir trait à la collecte. Afin d'éviter la confusion, la section 7.3 sur la collecte fait référence à la « collecte terminée » plutôt qu'à la « réponse ».

Les PC « dépistées » sont les PC pour lesquelles il est possible de déterminer si elles sont incluses dans la population cible du recensement ou non. Aux fins d'estimation et de totalisation, les PC dépistées sont nos répondants. Étant donné que les noms, y compris ceux des membres du ménage, et les adresses sont disponibles dans la CVD BDR, et que les outils pour consulter la base de données sont suffisamment puissants, il est possible de vérifier si une PC est dénombrée à une adresse, même si celle-ci est vague. Ainsi, on s'assure que les PC sont classées dépistées seulement si nous savons si elles sont mobiles ou non, et si elles sont dénombrées ou non.

L'utilité de savoir si une PC est dénombrée va se soi. Les PC faisant partie de la population cible du recensement qui ne sont pas dénombrées, et donc classées omises, sont la base de l'estimation du sous-dénombrement. Nous voulions également classer les PC en se fondant sur les caractéristiques a) à c), afin de choisir les répondants les mieux appropriés pour représenter les non-répondants. Les définitions présentées précédemment impliquent que : 

  • Les PC non identifiées sont également non dépistées.
  • Les PC identifiées non dépistées sont non listées.
  • Les PC dénombrées non mobiles sont listées.
  • Les PC dénombrées mobiles sont non listées.

Nous avons aussi déterminé l'adresse du Jour du recensement (lieu de résidence habituel) de chaque PC dans la population cible du recensement. Elle constituait l'adresse où, selon les instructions du recensement, la PC devrait avoir été dénombrée. Si la PC a été dénombrée, l'adresse du dénombrement est considérée comme l'adresse du jour du recensement, en dépit d'autres renseignements qui ont peut-être soulevés des doutes à propos d'une bonne compréhension des instructions du recensement. 

Pour obtenir plus de renseignements sur la classification, consultez Diallo (2008).   

7.3 Collecte des données

7.3.1 Environnement

Les employés du bureau central (BC) d'Ottawa ont collaboré étroitement avec les employés de cinq bureaux régionaux (BR) de Statistique Canada en vue de la collecte des données au cours de l'étape d'enquête de la CVD. Les BR en question étaient ceux de Halifax, Sherbrooke, Toronto, Winnipeg et Edmonton. Les suggestions et recommandations formulées par les BR après la CVD de 2001 ont été prises en considération aux fins de la conception et du déroulement de l'enquête de 2006. Le BC était responsable de fournir une application d'interview téléphonique assistée par ordinateur (ITAO) répondant aux besoins de l'enquête et facile à utiliser pour les intervieweurs et les répondants.

L'attribution de l'échantillon aux BR était fondée sur l'estimation du BC quant au lieu de résidence de la personne choisie (PC) durant la période de collecte. Une fois qu'un cas était attribué à un BR, il ne pouvait pas être transféré à un autre BR même si la PC déménageait à l'extérieur de la région de collecte du BR. Le tableau 7.3.1 fait état des régions de collecte des BR et des chiffres de l'enquête.

Au total, 20 114 dossiers ont été envoyés à la collecte. La section 7.1 décrit les deux plans d'échantillonnage utilisés dans le cadre de la CVD pour les provinces et territoires. Le nombre de cas exigeant des mesures de collecte en ce qui a trait à l'échantillon des territoires était formé de 1 938 cas provenant des strates regroupant les cas n'ayant pas été appariés. Pour ce qui est de l'échantillon provincial, le nombre de cas exigeant des mesures de collecte n'a pas pu être déterminé tant que tous les dossiers n'ont pas été envoyés en vue d'une première tentative de traitement en vertu de laquelle la version CVD de la base de données des réponses (CVD BDR) a été consultée. Cette recherche a donné deux résultats. Lorsque la personne choisie était introuvable, le dossier était envoyé aux fins de la collecte. Il y a eu au total 8 453 cas de ce genre, qu'on appelle l'échantillon « régulier ». Un échantillon de 11 231 personnes choisies a été prélevé parmi les personnes choisies et trouvées, qu'on appelle l'échantillon « ajustement pour la non-réponse (ANR) ». Les résultats de la collecte pour l'échantillon ANR ont été utilisés pour établir une estimation d'un paramètre du modèle d'ajustement pour la non-réponse de la CVD décrit dans la section 7.4. Les employés des BR ne savaient pas si un cas était un cas ANR ou un cas régulier.

Les 20 114 cas envoyés au personnel sur le terrain représentent 28,4 % de l'échantillon de la CVD. La majeure partie de l'échantillon non envoyée aux fins de collecte vise les PC qui ont été retrouvées au moment de la première tentative de traitement de la CVD. Ces PC pouvaient être   classées comme dénombrées et aucune autre mesure n'était nécessaire. Le reste de l'échantillon non transmis à la collecte comprenait 729 PC décédées, les PC provenant de l'échantillon des naissances de 2006 non disponible à temps et 24 cas qui n'ont pas été envoyés pour d'autres raisons (p. ex., des cas de chevauchement des bases ou des renseignements insuffisants pour déterminer l'identité de la PC).

Il y avait trois versions du questionnaire d'enquête de la CVD : répondant, répondant substitut et personne décédée. Le questionnaire d'enquête de la CVD de 2006 mettait l'accent sur la collecte d'adresses, surtout dans le cas des PC et de leur lieu de résidence le Jour du recensement et au cours du mois de mai 2006. Le nom et les données démographiques ont été recueillis pour tous les membres du ménage en date du Jour de recensement. Les trois questions du Recensement de 2006 portant sur l'identité autochtone ont été ajoutées au questionnaire de la CVD pour la première fois. La collecte était effectuée par le biais d'un répondant substitut pour toute personne âgée de moins de 18 ans et pour les PC présumées décédées  Autrement, les répondants substituts ont été utilisés lorsque la PC n'était pas disponible durant la période visée par l'enquête ou lorsqu'elle était difficile à joindre.

Dans le cas des PC décédées, il était important de déterminer auprès du répondant substitut si la PC était décédée avant ou après le Jour du recensement ou le jour même du recensement. Différents questionnaires papier et questions de l'ITAO ont été utilisés selon la date du décès. Dans certains cas, on savait que la PC était décédée avant la collecte. Si deux sources (p. ex., les données fiscales et les statistiques de l'état civil) indiquaient le décès de la PC, le dossier de celle-ci n'était pas envoyé aux fins de collecte. Si l'une des sources indiquait le décès de la PC, le cas était soumis à la collecte avec une étiquette indiquant qu'il s'agissait d'une personne « présumée morte ».

La principale méthode de collecte des données d'enquête était l'ITAO. L'application ITAO a été conçue en bonne partie à partir des normes établies pour l'ensemble des questionnaires ITAO utilisés par Statistique Canada. Elle comporte divers modules interreliés et elle est accessible par l'intermédiaire de l'interface générique des BR. Les intervieweurs ont été affectés aux cas en fonction de la langue et en fonction des cas qui exigeaient une interview ou un dépistage.

L'enquête de la CVD de 2006 était une enquête multimodale. Il y avait des questionnaires papier dans les deux langues officielles pour les PC contactées et ayant demandé un questionnaire papier au lieu de fournir des renseignements par téléphone. Les PC que les BR n'ont pas réussi à contacter par téléphone ont reçu par le poste une trousse renfermant un questionnaire papier et celui-ci a été envoyé à la meilleure l'adresse établie par le BR. Les PC étaient priées de retourner leur questionnaire papier dûment rempli au BR. Enfin, les intervieweurs sur place ont obtenu quelques réponses au questionnaire papier. La saisie des données à partir des questionnaires papier a été effectuée dans les BR, au moyen du système ITAO. Toutes les activités de coordination nécessaires pour mettre en œuvre un système d'enquête multimodal séquentiel relevaient des gestionnaires des BR, en collaboration avec le BC. Contrairement à la CVD de 2001, il n'y a pas eu d'enquête de suivi.

Le dépistage était l'un des principaux aspects de la CVD de 2006. Le dépistage désigne les mesures prises pour trouver le numéro de téléphone et l'adresse des PC ou d'un répondant substitut. Dans le cadre de la préparation de l'échantillon, les cas ont fait l'objet d'un appariement avec les données fiscales en vue de fournir des données à jour sur les PC et les membres de leur ménage. Dans certains cas, ces données initiales de l'ITAO étaient désuètes ou incomplètes, c'est pourquoi un dépistage a été nécessaire.

7.3.2 Opérations

La collecte des données a donné lieu principalement à des interviews et à des activités de dépistage. Lorsque la collecte des données a débuté, 82,8 % des cas soumis aux fins de collecte ont été placés en attente d'interview et 17,2 % des cas ont été placés en attente de dépistage. Certains cas ont alterné entre les activités d'interview et de dépistage. Pour ce qui est des PC en attente de dépistage, aucun numéro de téléphone n'avait été trouvé pour la PC ou pour l'un des membres de sa famille. Lorsque des pistes de dépistage ont été trouvées, les cas ont été placés en attente d'interview. Lorsque toutes les pistes de dépistage étaient épuisées pour l'interview, les cas étaient mis en attente de dépistage.

Les données d'entrée de l'ITAO ont été téléchargées lorsque la préparation de l'échantillon et la première recherche de la version de la CVD BDR ont été complétées. La collecte des données a débuté dans les BR le 10 janvier 2007. La collecte active a pris fin le 15 juillet 2007. Au total, il y a eu 184 jours au cours desquels au moins un BR a recueilli activement des données et 16 984 questionnaires ont été remplis durant cette période. Entre le 16 et le 31 juillet 2007, il y a eu des activités de collecte passive et elles ont donné lieu au traitement de questionnaires papier retournés ou de dossiers de personnes qui téléphonaient au BR. Durant cette période, 112 questionnaires ont été remplis. Il convient de signaler également que, parmi les 16 984 questionnaires jugés complets par les BR, certains ont par la suite été jugés par le BC comme incomplets ou visant une PC erroné.

La collecte des données a été effectuée par deux équipes d'intervieweurs travaillant six ou sept jours par semaine. Les intervieweurs étaient informés des objectifs de l'enquête et du contexte de celle-ci et ils ont reçu un manuel de formation détaillé. Des interviews simulées ont été intégrées aux séances de formation au moyen de l'application ITAO. Un ordonnanceur d'appels attribuait les cas aux intervieweurs dans le cadre des opérations normales. Un intervieweur pouvait, à l'occasion, être affecté à la gestion de cas précis. Ainsi, il pouvait recevoir des appels ou faire des appels pour communiquer avec une personne préférant s'adresser dans une langue autre que le français ou l'anglais. Certains appels à l'étranger ont été effectués, surtout dans le cas des PC faisant partie du groupe des résidents non permanents (RNP) et ayant quitté le Canada. La gestion de la qualité des activités de collecte comprenait la surveillance des intervieweurs, les activités renouvelées de formation et les discussions à propos de questions précises soulevées par le BC se rapportant à la qualité des données dans les questionnaires remplis. Les gestionnaires des BR ont attribué des ressources à l'enquête tout en respectant les autres enquêtes réalisées dans la région. Les efforts soutenus en vue d'interviewer des personnes ayant initialement refusé de participer à l'enquête ont permis d'améliorer les taux de réponse.

Le tableau 7.3.2 indique la répartition dans le temps des cas envoyés aux BR par le BC. Les activités d'interview ont généralement débuté dans les BR au fur et à mesure de l'arrivée de nouveaux cas. Le total rajusté tient compte des cas qui ont été abandonnés par les BR par suite d'une demande du BC et ce, parce que les responsables du traitement du BC ont été en mesure de régler un cas soumis au personnel sur le terrain. Une telle situation peut être attribuable au fait que le décès d'une PC a été confirmé à partir des statistiques de l'état civil de 2005 et 2006 ou que la PC a été retrouvée dans la CVD BDR de 2006. Par ailleurs, certains cas ont été envoyés de nouveau à un BR lorsqu'un dossier traité initialement et retourné ne respectait pas les normes prévues en matière de qualité des données.

Les données d'enquête ont été transmises par voie électronique, des cinq BR au BC, tous les soirs, après la fin des interviews. Les rapports de transmission et les données d'enquête recueillies étaient examinés tous les matins par les employés du BC. Les cas jugés inappropriés en vue du traitement étaient réactivés et retournés au BR en vue d'un suivi.

Trois rapports de gestion détaillés ont été créés au BC pour documenter l'état d'avancement de l'enquête. L'un de ces rapports renfermait des statistiques sur les cas en voie de traitement au BR (cas non ouverts, cas terminés et cas ouverts mais non terminés). Le deuxième rapport renfermait des statistiques très détaillées à propos d'un certain nombre de résultats obtenus par les BR. Ce rapport était produit une fois par semaine. Le troisième rapport était un rapport d'étape établi en fonction de variables comme le type de cas, la base de sondage et la strate. Des prévisions du nombre de cas terminés ont été établies pour les BR, afin de les aider à atteindre leurs objectifs en matière de collecte.

Les données recueillies sur le terrain ont été analysées par le BC pour en assurer l'intégralité et l'exactitude. Les cas étaient rejetés lorsque certaines données étaient manquantes ou ambiguës pour certains champs clés ou si les données avaient été obtenues par erreur pour une personne autre que la PC. Les cas non rejetés ont été mis en lots en vue du traitement, de la façon décrite dans la section 7.2.

Chaque interview ITAO durait en moyenne 13 minutes. Le temps réel consacré à chaque cas était plus long en raison du nombre de tentatives de contact requises et de la quantité d'activités de dépistage nécessaires.

7.3.3 Dépistage

Le dépistage a été effectué par le BC et par les BR et il était essentiel pour assurer la réussite de la CVD. Pour ce qui est des 3 456 cas ayant débuté par le dépistage, on a retrouvé des pistes ayant donné lieu à des interviews dans 66 % des cas. Parmi les 16 658 cas ayant débuté en mode interview et qui ont nécessité du dépistage, le taux de dépistage était supérieur à 88 %. De nombreuses pistes utiles ont également été retrouvées pour ces cas. Dans l'ensemble, 11 339 des 16 944 cas traités (67 %) ont nécessité certaines activités de dépistage.

Pour accroître le taux de réponse, les gestionnaires des BR ont contacté des ministères et organismes provinciaux en vu d'obtenir des adresses et numéros de téléphone lorsqu'aucun contact n'avait été établi. Une fois que la collecte a débuté, le BC a été appelé à fournir des pistes aux fins du dépistage à l'aide de plusieurs fichiers administratifs d'envergure renfermant le nom et l'adresse, mais pas nécessairement le numéro de téléphone. Ces dossiers comprenaient les dossiers d'immatriculation des véhicules automobiles, les dossiers fiscaux, le remboursement de la TPS pour les habitations neuves et les changements d'adresse de la Société canadienne des postes. Des renseignements supplémentaires propres aux PC provenant des bases des immigrants et de la base des RNP ont été obtenus auprès de Citoyenneté et Immigration Canada, sur support papier. Les statistiques de l'état civil pour 2005 et 2006 ont également été consultées.

Les intervieweurs ont utilisé différents outils aux fins du dépistage, principalement les annuaires électroniques en ligne. Cependant, l'outil de dépistage le plus efficace était l'application ITAO proprement dite. Les données téléchargées dans cette application incluaient les adresses de la CVD BDR (provenant du Recensement de 2006 comme tel) et les anciens dossiers fiscaux. Dans les cas où le BR a obtenu une adresse de la part du BC, un site Web comme celui de Canada 411 était utilisé pour retrouver un numéro de téléphone. En cas d'échec, une trousse renfermant un questionnaire papier pouvait être envoyée à l'adresse. En comparant les adresses obtenues par le BC et par les BR grâce au dépistage, on a conclu que les fichiers d'envergure du BC offraient plus de données de dépistage uniques en leur genre et utiles. Il y a eu un chevauchement entre les deux activités étant donné que les adresses obtenues étaient souvent identiques ou très semblables.

Le taux de réponse était élevé, soit 84,2 % des 20 114 dossiers soumis aux fins de collecte. Ce taux a été obtenu grâce aux nombreuses activités de dépistage réalisées par le BC et par les BR. Un autre facteur de réussite résidait dans l'insistance des employés des BR pour ce qui est de téléphoner à une PC lorsqu'ils avaient le numéro de téléphone approprié, mais qu'il n'y avait pas de réponse. Le nombre médian de tentatives de contacts effectuées pour les cas terminés était de sept. Pour ce qui est des cas non terminés le nombre médian de tentatives de contacts était de 28. Ce nombre varie selon la province et le territoire, selon la base de sondage et selon les variables démographiques. Un cas peut donner lieu à un nombre élevé de tentatives de contacts même s'il n'a pas fait l'objet d'activités de dépistage.

Le tableau 7.3.3 indique le nombre de tentatives de contacts pour les cas terminés et non terminés, selon la base de sondage. Près de 222 400 appels ont été effectués pour les cas terminés et environ 104 300 appels ont été effectués pour les cas pour lesquels aucun questionnaire dûment rempli n'a été obtenu.

On s'attendait à ce que les mesures nécessaires pour contacter initialement une PC de l'échantillon ANR soient plus simples que pour une PC de l'échantillon régulier étant donné que les données initiales de contacts ITAO incluaient l'adresse la plus récente de la PC selon la BDR de la CVD. Cependant, de nombreux cas ANR ont exigé plus de tentatives de contacts que les personnes de l'échantillon régulier.

7.3.4 Statistiques en matière de collecte

On a surveillé de nombreuses statistiques tout au long de la période visée par la collecte des données, puis on a procédé à une analyse une fois la collecte terminée.

Le tableau 7.3.4.1 indique les taux d'achèvement provinciaux et territoriaux selon le type de cas, soit régulier ou ANR. Le tableau indique que le taux d'achèvement est plus élevé dans les cas ANR. On pouvait s'y attendre étant donné que les données initiales ITAO incluaient la plus récente adresse selon le Recensement de 2006. Ces PC devraient, selon une probabilité de près de 1, avoir été considérées comme des personnes dénombrées. La répartition des PC en ce qui a trait à l'échantillon régulier est différente. Dans le cas de l'échantillon de la CVD, les cas réguliers provenant en majorité des strates affichant une probabilité moins élevée que les PC soient incluses dans les personnes dénombrées et une probabilité plus élevée qu'elles soient considérées comme des personnes omises ou des personnes hors du champ de l'enquête. Les données des CVD antérieures montrent que ces personnes sont plus difficiles à joindre.

Le tableau 7.3.4.2 présente des statistiques sur les taux d'achèvement selon la base et selon le type de cas. Le taux de réponse est peu élevé pour les PC de la base des RNP parce qu'il semble que plusieurs RNP ont quitté le Canada avant l'expiration de leur permis. Il était souvent très difficile de retrouver ces PC ou un répondant substitut approprié, surtout dans le cas des RNP qui avaient un permis leur permettant d'étudier au Canada (le taux de traitement n'était que de 62 %).

Le tableau 7.3.4.3 présente des statistiques sur les taux d'achèvement par strate et par type de cas pour l'échantillon prélevé à partir des strates démographiques. Tel qu'indiqué dans la section 7.1, les strates démographiques ont été utilisées pour la base du Recensement de 2001 et pour les bases des territoires n'ayant pas fait l'objet d'un appariement.

Une autre statistique digne d'intérêt est le nombre de questionnaires remplis par des répondants substituts. La collecte a été effectuée auprès de répondants substituts dans le cas de toutes les personnes âgées de moins de 18 ans et des PC présumées décédées. Dans les autres cas, on a fait appel à un répondant substitut lorsque la PC n'était pas disponible durant la période de l'enquête ou qu'elle était difficile à joindre. Au total, 6 363 cas représentant 37,6 % de l'échantillon traité ont donné lieu à une interview auprès d'un répondant substitut approprié.

Le tableau 7.3.4.4 présente, pour l'ensemble du Canada et pour les provinces et territoires, le nombre de cas soumis à la collecte, le nombre de cas exigeant des mesures de dépistage, ainsi que le pourcentage de cas soumis à la collecte et exigeant des mesures de dépistage. Le taux de dépistage le plus élevé vise les provinces de l'Ontario et de la Colombie-Britannique et le Territoire du Yukon et le Nunavut.

La collecte a été effectuée de trois façons, soit l'ITAO, l'autodénombrement au moyen du questionnaire papier et les interviews personnelles au moyen du questionnaire papier. Au total, 94,1 % des 16 944 questionnaires dûment remplis ont été remplis au moyen de l'ITAO, 4,5 % des questionnaires ont été remplis au moyen du service d'autodénombrement et 1,4 % des questionnaires ont été remplis dans le cadre d'une interview sur place. Ces données montrent l'importance de l'approche multimodale. En l'absence d'autodénombrement et d'interviews en personne, le taux national de traitement aurait pu être inférieur à 80 %! La méthode de collecte varie selon la province et le territoire, ce qui peut être attribuable aux différentes méthodes opérationnelles utilisées dans les BR, aux différences en ce qui a trait aux caractéristiques des personnes demandant un questionnaire ou à une répartition démographique différente. L'autodénombrement était particulièrement important en Ontario (6,9 % des cas traités ont été effectués par voie d'autodénombrement) et en Colombie-Britannique (10,6 % des cas traités ont été effectués par voie d'autodénombrement).

7.4 Estimation

Les poids finaux des personnes choisies (PC) sont calculés à partir des poids initiaux. Le poids initial d'une PC de la base des personnes omises correspond au poids final qui lui a été attribué lors de la Contre-vérification des dossiers (CVD) précédente au moment où la PC avait été classée omise. Pour les PC des autres bases de sondage, les poids initiaux sont généralement attribués en fonction de l'inverse des probabilités de sélection dans l'échantillon, sauf pour les PC de la base des résidents non permanents. Pour ces dernières, le poids initial est plus élevé afin de tenir compte du petit nombre de résidents non permanents qui n'étaient pas sur la base de sondage au moment de la sélection de l'échantillon, ce qui était effectivement le cas pour une faible proportion de ces résidents. Les comptes exacts relatifs aux résidents non permanents ont été obtenus seulement après la sélection de l'échantillon. Les poids initiaux des PC ont été rajustés à ces comptes.

Pour réduire les biais, les poids initiaux des répondants devaient  être rajustés pour tenir compte de la non-réponse. Le poids des non-répondants a été redistribué parmi les répondants. Dans la mesure du possible, cette redistribution s'est faite en s'assurant que le poids des non-répondants qui présentent certaines caractéristiques a été redistribué parmi des répondants présentant les mêmes caractéristiques. Les caractéristiques (ou « métadonnées ») prises en compte sont : la strate du plan d'échantillonnage; une indication que la personne a remplit une déclaration de revenus pour l'année de référence précédent l'année du recensement qui donne une bonne indication que la personne est dans la population cible; et, finalement, s'il s'agit d'une PC listée, d'une PC mobile, ou d'une PC faisant partie de la population cible.

Les ajustements des poids ont été faits avec l'aide de StatMx, module du Système généralisé d'estimations (SGE) de Statistique Canada. Afin de pouvoir redistribuer le poids des non répondants, la CVD a été considérée comme un échantillon en trois phases où chaque phase correspondait à la sélection d'un échantillon imbriqué : sélection des personnes choisies (PC) parmi les bases de sondage, sélection des PC identifiées parmi les PC, et sélection des PC dépistées parmi les PC identifiées. Lorsque dans une strate on ne peut identifier un répondant qui présente les mêmes caractéristiques qu'un non-répondant, on regroupe la strate problématique avec une autre strate jugée semblable.

Après avoir rajusté les poids initiaux, on observe que traditionnellement l'estimation de personnes dénombrées dans les territoires est inférieure au chiffre comparable du recensement. Cette situation semble due à une sous-couverture de la population cible du recensement dans les fichiers d'assurance-santé. Pour pallier  cette sous-couverture, les poids des PC sélectionnées dans les territoires ont été rajustés afin que l'estimation du nombre de personnes dénombrées égale le chiffre comparable du recensement pour ce territoire.

Le tableau 7.4 présente la distribution pondérée des PC selon la classification et la base de sondage. On rappelle les définitions données à la section 7.2. Seules les PC trouvées dans la base de données de la CVD BDR sont classées dénombrées et cette base diffère de celle du recensement parce qu'elle n'inclut pas les imputations du recensement, ni les dénombrements ayant un nom manquant ou invalide ou une date de naissance incomplète ou invalide, ni les dénombrements inscrits après le début de la phase de traitement des données de la CVD. Les personnes de la population cible qui ne sont pas dans la base de données de la CVD sont classées omises. On estime le sous-dénombrement de la population du recensement par l'estimation du nombre (poids) des personnes omises moins le nombre de personnes exclues de la CVD BDR qui correspond au facteur X de l'extraction de données dans la section 9.

Enfin, pour le calcul de la variance des estimations, on détermine de façon approximative le plan d'échantillonnage de la CVD par un plan stratifié avec probabilités de sélection proportionnelles à la taille. Les tailles retenues sont celles qui reproduisent les poids finaux.

On peut obtenir plus de détails sur les méthodes d'estimation utilisées dans le cadre de la CVD de 2006 en consultant Théberge (2008).

   Page précédente | Table des matières | Page suivante