![]() |
||||||
|
Contenu archivéL'information indiquée comme étant archivée est fournie aux fins de référence, de recherche ou de tenue de documents. Elle n'est pas assujettie aux normes Web du gouvernement du Canada et elle n'a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous. |
||||||
|
8. Contre-vérification des dossiers8.1 IntroductionAprès chaque recensement depuis 1966, la Contre-vérification des dossiers (CVD) a permis d'évaluer le sous-dénombrement brut au recensement, c'est-à-dire d'estimer le nombre de personnes et de ménages omis lors du recensement. Les résultats de la CVD sont combinés à ceux des autres études sur la couverture pour calculer le sous-dénombrement net. Le sous-dénombrement de la population et des ménages est généralement considéré comme l'une des plus importantes sources d'erreurs touchant les données du recensement. Il introduit un biais négatif dans la mesure où les chiffres publiés par le recensement sous-estiment les vrais totaux de la population et des ménages. Le surdénombrement par contre, introduit un biais positif car les données du recensement surestiment alors les vrais totaux de la population et des ménages. Ces deux sources d'erreur peuvent également fausser les répartitions des caractéristiques de la population et des ménages estimées à partir des données du recensement si les personnes surdénombrées et omises ne possèdent pas les mêmes caractéristiques que les personnes dénombrées. Les principaux objectifs de la CVD de 2001 étaient :
L’établissement d’estimations du sous-dénombrement et du surdénombrement des familles de recensement, des familles économiques et des ménages ne faisait pas partie du champ initial des études sur la couverture du recensement de 2001. C’est pourquoi on ne dispose d’aucune donnée sur l’erreur de couverture pour ces populations. Au recensement de 1996, le sous-dénombrement des ménages était estimé à 2,49 % pour l’ensemble du pays et le taux de surdénombrement à 0,30 %, pour un taux de sous-dénombrement net de 2,19 %. Pour connaître les statistiques détaillées les plus récentes sur l’erreur de couverture des ménages, le lecteur peut consulter le tableau 10.3 du rapport technique du recensement de 1996 intitulé Couverture (no 92-370-XPB au catalogue). 8.2 Méthodologie – Préparation de l’échantillonLa population cible, qui comprenait toutes les personnes qui auraient dû être dénombrées au recensement de 2001, a été formée à partir de six sources ou bases de sondage. Les cinq premières bases ont été utilisées pour l'estimation du sous-dénombrement et du surdénombrement dans les dix provinces tandis que les estimations pour les trois territoires ont été calculées grâce aux échantillons de la dernière base seulement. En tout, on a choisi 60 653 personnes réparties parmi les bases. Le tableau 8.2 présente la répartition de l’échantillon selon les bases de sondage.
L'échantillonnage a été effectué indépendamment à l'intérieur de chaque base. Le plan d'échantillonnage variait d'une base à l'autre selon la nature de la liste utilisée. Les taux d'échantillonnage n'étaient pas uniformes à l'intérieur des bases. On a eu recours à des taux d'échantillonnage plus élevés pour les sous-groupes où l'on prévoyait un sous-dénombrement ou un surdénombrement important ou un taux de dépistage plus faible, ceci dans le but de rendre le plan d'échantillonnage plus efficace. Dans la base du recensement de 1996, le plan d'échantillonnage est à un degré avec stratification démographique et une répartition optimale basée sur les taux historiques de sous-dénombrement et de surdénombrement (ce qui est nouveau pour 2001), le taux de dépistage historique et la taille de la strate. La population était stratifiée par province de résidence, sexe, âge et état matrimonial. Les personnes dénombrées sur des réserves et établissements indiens et dans des logements collectifs au recensement de 1996 formaient des strates séparées. Un échantillon a alors été sélectionné dans chacune des strates ainsi formées afin d'observer le plus de cas de personnes non dénombrées possible. Les fractions de sondage n'étaient pas les mêmes dans chaque strate. Par exemple, lors de la sélection, tout comme en 1996, on a attribué une probabilité d'être choisi plus grande aux hommes célibataires âgés de 20 à 24 ans en 2001, car on avait observé lors des contre-vérifications des dossiers (CVD) précédentes que le sous-dénombrement et le surdénombrement sont toujours plus importants dans cette strate. La base des personnes omises est une base de sondage conceptuelle puisqu'il n'existe pas de liste de toutes les personnes non dénombrées au recensement de 1996. L'échantillon de cette base est constitué de tous les cas classés comme des « non dénombrés » lors de la CVD de 1996. L'échantillon n'est pas stratifié comme tel quoiqu'il y ait une stratification implicite car les cas non dénombrés en 1996 proviennent de bases et de strates différentes dans la CVD de 1996. Pour la base des naissances, on a obtenu une copie des enregistrements de naissances de la statistique de l'état civil, pour la période intercensitaire. La base a ensuite été stratifiée par province de résidence de la mère et année de naissance de l'enfant et un échantillonnage à un degré a été utilisé. On a construit la base des immigrants grâce aux dossiers de l'immigration de Citoyenneté et Immigration Canada. Cette base a été stratifiée par province. Pour les trois provinces où se dirigent la majorité des immigrants (le Québec, l'Ontario et la Colombie-Britannique), on a ensuite créé des strates selon l'année d'arrivée au Canada, c'est-à-dire une strate pour les immigrants arrivés entre 1996 et 1999, une deuxième pour ceux arrivés en 2000 et finalement, une dernière pour ceux arrivés en 2001. Pour chacune de ces deux bases, on a ensuite utilisé l'échantillonnage à un degré. La base des résidents non permanents a été créée à l'aide des dossiers de Citoyenneté et Immigration Canada. Cette base a été stratifiée par province. Pour le Québec, l'Ontario et la Colombie-Britannique, on a ensuite créé des strates renfermant d'une part les titulaires d'un permis de séjour pour étudiants ou d'un permis ministériel, d'autre part les titulaires d'un permis de travail, et en dernier lieu, les revendicateurs du statut de réfugié. Dans les autres provinces, où ces populations sont plus petites, il n'était pas possible de stratifier les bases de cette façon. Des échantillons à un degré ont été tirés dans les strates ainsi formées. Enfin, les bases de sondage des trois territoires ont été formées à partir des fichiers d'assurance-santé respectifs. Elles ont été stratifiées par âge, sexe et région (urbaine ou rurale pour le Yukon et les Territoires du Nord-Ouest, et Iqaluit ou non Iqaluit pour le Nunavut). Des échantillons à un degré ont été tirés dans chaque strate. Un problème qui se pose avec l'utilisation des bases de sondage multiples est la possibilité qu'une personne soit incluse sur plus d'une base. Par exemple, une personne qui est sur la base des immigrants pouvait être au Canada en mai 1996 avec un permis de travail et aurait été dénombrable par le recensement de 1996. Elle serait donc à la fois sur la base des immigrants, et sur celle du recensement si elle était dénombrée, ou sur celle des personnes omises si elle était non dénombrée. Il est donc important d'identifier tous les cas de chevauchement de base, sinon les estimations produites risquent d'être trop élevées puisque les personnes se trouvent à être comptées deux fois. Dans la mesure du possible, on identifie ces cas lors de la constitution des bases de sondage, mais cela peut également se faire plus tard, à partir de l'information fournie par les répondants. Un autre problème est qu'aucune des cinq premières bases du sondage (voir le tableau 8.2) ne couvre les personnes émigrées ou hors pays au recensement de 1996 qui sont revenues durant la période intercensitaire (« Canadiens de retour au pays »). On estime à 192 310 le nombre de ces personnes dont on n'a pas estimé le nombre de non dénombrées. Les estimations de l'erreur de couverture ne couvrent pas cette population. Cependant, en 2001, contrairement à 1996, la CVD a aussi considéré comme « Canadiens de retour » les personnes qui sont revenues dans une province après avoir habité dans un territoire (17 150) ou une réserve indienne ou un établissement indien partiellement dénombrés en 1996 (15 110) et dénombrés en 2001. 8.3 Méthodologie – Collecte des données8.3.1 Cadre de la collecte des donnéesLe personnel du bureau central (BC) à Ottawa a travaillé en étroite collaboration avec le personnel de cinq bureaux régionaux (BR) de Statistique Canada à la collecte des données pour l'étape de l'Enquête de la Contre-vérification des dossiers (CVD) de 2001. Ces bureaux étaient situés à Halifax, Sherbrooke, Toronto, Winnipeg et Vancouver. Pour attribuer les cas échantillonnés aux BR, le BC estimait au mieux l'endroit où la personne choisie (PC) résidait pendant la période de collecte. Une fois qu'un cas était attribué à un BR, il ne pouvait pas être transmis à un autre BR, même s'il était établi que la PC avait déménagé à l'extérieur de la région du BR. Des statistiques sur la charge de travail des BR sont présentées au tableau 8.3.1. La collecte a été principalement menée selon la méthode d'interview téléphonique assistée par ordinateur (ITAO). L'application utilisée a été élaborée conformément à nombre des normes établies pour toutes les enquêtes ITAO menées à Statistique Canada et comportait divers modules reliés entre eux. Les BR y avaient accès à l'aide de l'interface générale, laquelle permettait aux responsables des BR d'affecter les intervieweurs à des types de cas précis et de produire souvent des rapports sur l'état d'avancement. Les répondants qui ne voulaient pas prendre part à une interview téléphonique recevaient une version papier du questionnaire de l'Enquête de la CVD de 2001. Les PC devaient remplir et renvoyer ce questionnaire, dont les données étaient ensuite entrées sur clavier dans le système ITAO par un intervieweur. Le questionnaire de l'Enquête de la CVD servait à obtenir les adresses où la PC pouvait avoir résidé le jour du recensement et au cours du mois de mai 2001. Le nom et les données démographiques de tous les membres du ménage de la PC étaient recueillis. Les PC qui n'habitaient pas à leur domicile habituel en mai 2001 à cause de leurs études ou de leur travail devaient répondre à des questions additionnelles sur leurs adresses. Un ensemble de questions se rapportant à l'" exode des cervaux " étaient posées à une petite partie de l'échantillon de l'Enquête de la CVD. Les PC qui étaient décédées au moment de l'Enquête de la CVD étaient incluses dans le champ de l'étude, et l'interview était menée par personne interposée. On faisait également appel à des répondants substituts lorsque la PC était âgée de moins de 15 ans ou qu'elle était absente ou difficile à joindre pour toute la période d'enquête. La durée moyenne d'une interview ITAO était de 12 minutes.
8.3.2 Opérations de collecteLes données d'entrée pour l'interview téléphonique assistée par ordinateur étaient chargées en plusieurs vagues, en fonction du moment où la préparation des lots d'échantillons était terminée. Le tableau 8.3.2A présente la répartition dans le temps des 58 842 cas envoyés sur le terrain. Les bureaux régionaux (BR) commençaient généralement les interviews dès qu'ils recevaient les nouveaux cas; ils ont tenté de mener une interview dans tous les cas, à l'exception de 353 cas inclus dans l'échantillon du Nunavut. Étant donné que l'information attendue du Nunavut pour établir la base de sondage a été reçue plus tard que prévu, ces 353 cas ont été inclus dans l'Enquête de suivi de la Contre-vérification des dossiers, qui a été menée plus tard à l'aide d'un questionnaire papier (voir la section 8.3.5). Avant que les intervieweurs ne commencent le dépistage et les interviews, les personnes choisies (PC) résidant dans les territoires ont reçu une lettre les invitant à téléphoner à un BR pour une interview. Les 58 842 cas envoyés sur le terrain représentaient 97,1 % du nombre de cas inclus dans le Fichier de contrôle de l'échantillon. La majorité des 1 811 cas n'ayant pas été envoyés sur le terrain étaient des personnes choisies à partir de la base du recensement de 1996 qu'on croyait décédées (N = 1 068). En outre, environ 700 cas de PC dans l'échantillon des naissances de 2000 et 2001 n'étaient pas prêts à temps pour la collecte sur le terrain et ont été traités par le personnel du bureau central (BC). Enfin, 38 cas inclus dans la base des immigrants ont été jugés « hors du champ d'observation » et n'ont pas été envoyés sur le terrain pour cette raison. Tous les soirs, une fois les interviews terminées, les cinq BR transmettaient les données d'enquête par voie électronique au BC. Au matin, le personnel du BC examinait les rapports de transmission et les données recueillies. Les cas jugés impropres à tout traitement ultérieur étaient réactivés et retournés au BR pour que les données requises soient recueillies. Afin d'accroître les taux de réponse, les chefs des BR communiquaient avec des ministères et organismes gouvernementaux afin d'obtenir des adresses et numéros de téléphone dans les cas où aucun contact n'avait pu être établi. De plus, le BC fournissait aux BR des pistes d'adresses tirées de divers fichiers administratifs lors du processus de collecte des données. Des efforts soutenus visant à interviewer les personnes ayant d'abord refusé de participer à l'enquête ont également permis d'améliorer les taux de réponse.
Deux rapports de gestion détaillés portant sur l’état d’avancement de l’enquête étaient préparés par le BC. L’un d’eux présentait des statistiques sur les cas se trouvant dans les BR (cas non ouverts, cas terminés et cas ouverts mais non terminés). Le second rapport renfermait des données sommaires sur le nombre d’interviews terminées devant être traitées par le BC (voir la section 8.3.4). Ce rapport sommaire incluait également des projections quant aux cas que les BR auraient à terminer, qui visaient à les aider à atteindre leurs objectifs de collecte. Le BC vérifiait si les données recueillies sur le terrain étaient complètes et exactes. Les cas étaient rejetés si les données étaient insuffisantes ou si elles avaient été recueillies par erreur pour une personne autre que la PC. Les cas non rejetés étaient mis en lots, lesquels étaient ensuite acheminés à l’équipe du traitement de la Contre-vérification des dossiers au BC. 8.3.3 DépistageLe dépistage était un aspect essentiel de l'Enquête de la Contre-vérification des dossiers de 2001. Il s’agit du travail effectué, principalement par le personnel des bureaux régionaux, pour trouver l’adresse et le numéro de téléphone des personnes choisies (PC). Le tableau 8.3.3 montre que 59,8 % (51,9 % + 7,9 %) de tous les cas inclus dans l’Enquête de la CVD ont nécessité un dépistage. Il s’agit des cas où les renseignements initiaux fournis par le système d'interview téléphonique assistée par ordinateur (ITAO) n’ont pas permis de joindre la PC ni un répondant substitut acceptable. Selon ce tableau, dans 19 247 cas, le numéro de téléphone n’était pas fourni par le système ITAO et il a fallu commencer par un dépistage, alors que dans 39 595 cas (23 643 + 11 311 + 4 641), un numéro de téléphone était fourni par le système ITAO. Pour 11 311 cas, le numéro fourni n’a pas permis d’établir un contact, de sorte qu’il a fallu recourir au dépistage par la suite.
Aux fins du dépistage, les intervieweurs avaient recours à divers outils, les répertoires électroniques en ligne étant les plus utilisés. Toutefois, les pistes les plus utiles étaient fournies par l'application ITAO elle-même. En outre, le bureau central communiquait aux BR les numéros de téléphone et les adresses qu'il parvenait à obtenir. 8.3.4 Statistiques sur la collecteLe tableau 8.3.4 présente les taux d'achèvement obtenus dans le cadre de l'Enquête de la Contre-vérification des dossiers de 2001 pour les provinces et les territoires. Dans le cas du Nunavut, le taux s'établirait à 66,0 %, plutôt qu'à 45,1 %, si l'on incluait les cas traités lors de l'Enquête de suivi de la Contre-vérification des dossiers, ce qui porterait le taux d'achèvement national à 90,5 %.
8.3.5 Enquête de suivi de la Contre-vérification des dossiersL'Enquête de suivi (ES) de la Contre-vérification des dossiers de 2001 avait pour principal objectif de mener un suivi ou une seconde interview auprès d'un sous-ensemble de personnes choisies (PC) lors de l'Enquête de la Contre-vérification des dossiers (CVD). D'une part, l'ES consistait à obtenir d'autres adresses des personnes choisies qui, à la suite de la CVD, ne s'étaient révélées inscrites sur aucun des questionnaires du recensement de 2001. Il s'agissait des cas « non trouvés ». D'autre part, dans les cas de « décès non confirmé », cette enquête visait à confirmer la date du décès de la PC. C'est enfin dans le cadre de l'ES que des interviews ont été menées pour la première fois auprès d'un sous-ensemble de PC du Nunavut. Le tableau 8.3.5.1 donne un aperçu des principales activités liées à cette enquête.
L'ES de 2001 était une enquête papier et crayon menée par téléphone par le personnel du Bureau régional de Sherbrooke. Aux fins du dépistage, on s'est servi des pistes d'adresse obtenues grâce à l'appariement automatisé des données d'interview téléphonique assisée par ordinateur et des données d'entrée du Fichier de contrôle de l'échantillon avec la base de données du recensement de 2001 (voir la section 8.4). Afin de résoudre les cas restants, le personnel a consulté les adresses incluses dans le fichier d'impôt de 2000 pour le Nunavut et un fichier de numéros d'identification des personnes choisies, classés par nom de municipalité, pour le Yukon. Chaque semaine, le personnel du Bureau régional de Sherbrooke envoyait les cas terminés, ainsi qu'un rapport sur l'état d'avancement de la collecte des données, au bureau central, qui procédait à la saisie des données des questionnaires remplis et utilisait un programme du Système d'analyse statistique pour vérifier la validité et la cohérence des réponses. À partir de ces questionnaires contrôlés, l'équipe de traitement de la CVD a établi un fichier cumulatif en format texte visant à faciliter la classification des PC. Comme chaque questionnaire rejeté au contrôle était évalué individuellement, la vérification de la validité et de la cohérence des réponses en vue de la préparation du fichier destiné à l'équipe du traitement représentait une tâche qui prenait beaucoup de temps. De précieuses observations et recommandations pour l'ES de 2006 ont été obtenues à partir de deux sources : le rapport de compte rendu des intervieweurs et la séance de compte rendu des bureaux régionaux. Au total, 3 122 heures, soit environ 416 jours-personnes, ont été consacrées à l'ES de 2001 au Bureau régional de Sherbrooke. Cette enquête a obtenu un taux de réponse de 81,4 % (voir les tableaux 8.3.5.2 et 8.3.5.3). Dans 178 (80,2 %) des 222 cas de « décès non confirmé » envoyés sur le terrain, on a obtenu confirmation que la date du décès de la PC était antérieure au 15 mai 2001. Dans 39,5 % des cas « non trouvés » (1 656 cas sur 4 192), on a obtenu une nouvelle piste d'adresse pour la PC. Bien que le taux de réponse de l'ES de 2001 soit inférieur au taux obtenu en 1996 (87,3 %), il convient de souligner que cette enquête a atteint son principal objectif, qui était d'obtenir des renseignements additionnels sur l'adresse où habitaient les PC le jour du recensement. Pour obtenir une description plus détaillée de l'ES de 2001, voir Armstrong et coll. (2003).
8.4 Méthodologie – Traitement des adresses et classification des personnes choisiesLa phase du traitement des données de la Contre-vérification des dossiers (CVD) a pour but de classer chaque personne choisie (PC), c’est-à-dire de déterminer son statut. On utilise ensuite les résultats de cette classification lors du rajustement pour la non-réponse et de l’estimation (voir la section 8.5). Il s’agit principalement de déterminer si la PC faisait partie de la population cible du recensement et si elle a été dénombrée aux adresses recueillies, et de fournir d’autres informations nécessaires pour effectuer le rajustement pour la non-réponse. Ainsi, pour chaque PC, on vise à déterminer si elle peut ou non être classée en : a) personne « listée »; À titre de renseignement, une PC est « dénombrée » si elle est inscrite sur un questionnaire du recensement (formule 2 ou 3) et qu’il y a un enregistrement correspondant dans la base de données du recensement. La « population cible du recensement » comprend les groupes de personnes énumérées à la section 4.2 du présent document. Une PC est « mobile » si son adresse le jour du recensement est différente des autres adresses qui lui sont associées et qui ont été obtenues indépendamment de la collecte de la CVD. Arbitrairement, les personnes hors cible font partie des « mobiles ». Lorsqu'une PC peut être classée indépendamment de la collecte de la CVD, elle est dite « listée ». Par ailleurs, la classification des « omis » regroupe les personnes non dénombrées de la population cible. On constate que les PC non mobiles dénombrées sont listées et que les autres PC de la population cible sont non listées. Les PC pour lesquelles on ne peut déterminer une ou plusieurs des caractéristiques a) à d) sont considérées comme non répondantes. Plus précisément, on dit de la PC qu’elle est :
L’utilité de savoir si une PC est dénombrée va de soi : on veut aussi pouvoir classer les PC selon les caractéristiques a) à c) afin de choisir les répondants les mieux appropriés pour représenter les non-répondants. Pour la base de sondage du recensement et celle des omis, on constate que :
Pour les autres bases de sondage (excluant celle du recensement et celle des omis), on constate que :
On assigne à chaque unité échantillonnée classée comme étant hors cible la raison de cette classification, par exemple, décès, émigration ou unité déjà représentée par une autre base de sondage. On détermine aussi l’adresse au jour du recensement de chaque PC classée de la population cible, c’est-à-dire l’adresse où, selon les instructions du recensement, la PC devait être dénombrée. Si une PC de la population cible est dénombrée une seule fois, l’adresse du dénombrement est considérée comme l’adresse du jour du recensement, même si d’autres renseignements soulèvent des doutes quant à la bonne exécution des instructions. Afin de mesurer le surdénombrement, on compte aussi combien de fois les PC classées sont dénombrées et on détermine l’adresse des dénombrements superflus (dénombrements doubles ou triples, et dénombrements de personnes décédées ou émigrées). Pour éviter les doubles comptes, on vérifie aussi si les cas de surdénombrement repérés lors de la CVD sont dans le champ des deux autres enquêtes sur le surdénombrement, à savoir l’Étude par appariement automatisé (ÉAA) et l’Étude sur les logements collectifs (ÉLC). Les cas identifiés comme étant couverts par l’une ou l’autre de ces deux études sont alors exclus du cadre de la CVD et ne sont pas pris en considération pour la composante des estimations de la CVD portant sur le surdénombrement. Pour en arriver à ce classement, on consulte les registres de l’état civil (p. ex. dans le cas d’un décès), les renseignements obtenus dans le cadre de l’entrevue de la CVD et de l’enquête de suivi (p. ex. cas se rapportant à l’émigration), les bases de sondage (p. ex. cas de chevauchement de bases), ainsi que d’autres sources d’information telles qu’Internet. Cependant, la majeure partie du travail consiste à effectuer une recherche dans les documents du recensement afin de savoir si la PC est dénombrée à l’une des adresses lui étant associées. Les adresses associées à la PC proviennent de plusieurs sources : de l’adresse de sélection sur la base de sondage, des adresses mises à jour grâce aux dossiers fiscaux, des adresses obtenues lors de l’entrevue de la CVD et de l’enquête de suivi, et des adresses obtenues par appariement avec la base du recensement selon la date de naissance et le sexe de la PC et des membres de son ménage. Des programmes informatiques mettant à profit des informations comme le code postal de l’adresse à résoudre peuvent parfois à eux seuls permettre de déterminer qu’une adresse est le double d’une autre ou (avec un degré élevé de certitude) que la PC a été dénombrée à cette adresse. En général, le personnel affecté à la recherche ne voit pas les adresses qui sont résolues automatiquement, seulement celles qui ne le sont pas. Pour tenter de résoudre celles-ci, il se sert de formulaires électroniques qui, souvent, contiennent déjà des suggestions de questionnaires du recensement ou de secteurs de dénombrement pouvant correspondre à l'adresse. Ces suggestions proviennent des programmes informatiques mentionnés au début du paragraphe. Parfois le questionnaire du recensement correspondant à l’adresse à résoudre est trouvé parmi ces suggestions, mais sinon, on fait appel à d’autres outils tels que des bottins téléphoniques électroniques. On consigne les résultats des recherches sur les formulaires, qui sont ensuite contrôlés électroniquement afin de minimiser les erreurs. Un fichier renfermant les résultats des recherches pour chaque adresse est ensuite produit. À partir de ce fichier, on identifie les cas qui exigent une vérification plus approfondie, par exemple les cas de PC trouvée dénombrée à plus d’une adresse, de PC apparemment omise sur un questionnaire, ou de non-réponse. Ce fichier sert également à déterminer quelles unités feront l’objet de l'enquête de suivi (voir la section 8.3.5). Le tableau 8.4A présente la classification des PC de l'échantillon selon la base de sondage. Des 60 653 PC comprises dans l'échantillon, on constate que 3 164 (2 025 + 1 139) avaient été omises par le recensement de 2001 tandis que 50 521 (46 705 + 3 816) avaient été dénombrées. Afin de ne compter chaque PC qu’une fois, les « non-répondants » comprennent : les PC non identifiées, les PC non dépistées, les PC non contactées et les PC non classifiées, au sens restreint. On remarque que 3 776 PC étaient des non-répondants (329 + 2 899 + 541 + 7), cas qui devaient être compensés à la phase de l’estimation par le rajustement pour la non-réponse (voir la section 8.5).
Le tableau 8.4B présente les résultats de la CVD quant au surdénombrement. Le nombre total de cas repérés par la CVD se divise en trois catégories : les cas dans le champ de l’ÉAA, ceux dans le champ de l’ÉLC, et ceux qui ne peuvent être relevés que par la CVD. Ce ne sont que ces derniers cas de surdénombrement qui sont pris en considération dans les estimations globales du surdénombrement. Bien que la CVD permette de mesurer le surdénombrement déjà mesuré par l’ÉAA et par l’ÉLC, les résultats de la CVD sont beaucoup moins précis vu le petit nombre de cas observés. On peut obtenir des renseignements additionnels sur la classification de la CVD de 2001 en consultant Parenteau (2003).
8.5 Méthodologie – EstimationLes poids finaux des personnes choisies sont calculés à partir des poids initiaux. Ainsi, le poids initial d’une PC de la base des omis correspond au poids final qui lui avait été attribué lors de la Contre-vérification des dossiers (CVD) précédente (moment où la PC avait été classée comme étant omise). Il convient de noter qu’aux fins du recensement de 2001 les poids finaux de la CVD de 1996 ont été recalculés selon une méthodologie semblable à celle de 2001. Par ailleurs, la base des omis comprend un plus grand nombre de PC que celui identifié en 1996. En effet, selon la nouvelle définition, font partie de la base des « omis » les personnes qui en 1996 avaient été dénombrées sur une formule 4 (Fiche de questionnaire manquant ou incomplet), ou qui avaient été classées comme étant non répondantes mais qui vivaient dans un logement pour lequel une formule 4 avait été établie. Pour les PC sélectionnées dans les autres bases de sondage, les poids initiaux sont généralement égaux à l'inverse des probabilités de sélection dans l’échantillon, sauf pour les PC de la base des résidents non permanents. Pour ces dernières, le poids initial est plus élevé afin de tenir compte des résidents non permanents qui n’étaient pas sur la base de sondage au moment de la sélection de l’échantillon, ce qui était effectivement le cas pour une faible proportion de ces résidents. Les comptes exacts relatifs aux résidents non permanents ont été obtenus plus tard. Les poids initiaux doivent ensuite être rajustés pour tenir compte de la non-réponse. Le poids des non-répondants est redistribué aux répondants. Dans la mesure du possible, cette redistribution se fait en s’assurant que le poids des non-répondants qui présentent certaines caractéristiques est redistribué parmi des répondants présentant les mêmes caractéristiques. Les caractéristiques prises en compte sont : la strate du plan d’échantillonnage; une indication dans les données fiscales qui permet d’inclure la PC dans la population cible; et, finalement, s’il s’agit d’une PC listée, d’une PC mobile, ou d’une PC faisant partie de la population cible. Effectuée à l’aide du Système généralisé d’estimation (SGE), cette redistribution simule un échantillonnage en plusieurs phases chaque phase correspondant à la « sélection » d’une catégorie différente de PC : PC identifiée, PC contactée, PC dépistée et PC classifiée. Pour ce qui est de la base de sondage du recensement et celle des omis, l’ensemble des PC contactées constitue un sous-ensemble de l’ensemble des PC dépistées; c’est l’inverse pour les autres bases de sondage. L’ordre utilisé par le SGE varie donc selon la base de sondage. À chaque phase, une caractéristique de plus qu’à la phase précédente est prise en compte. Lorsqu’on ne peut identifier un répondant qui présente les mêmes caractéristiques qu’un non-répondant, on regroupe la strate problématique avec une autre strate jugée semblable. Traditionnellement, on observe que si aucun rajustement n'est fait, l’estimation du nombre de personnes dénombrées dans les territoires est inférieure au chiffre comparable du recensement, situation qui semble due à une sous-couverture de la base de sondage des territoires. Pour contrebalancer cette sous-couverture, on rajuste les poids des PC sélectionnées dans les territoires par un facteur faisant que l’estimation du nombre de personnes dénombrées égale le chiffre comparable du recensement, et ce, pour chacun des trois territoires. Une unité qui est répondante pour les fins de la mesure du sous-dénombrement ne l’est pas nécessairement pour les fins de la mesure du surdénombrement. En effet, il se peut qu’une unité soit classée comme étant dénombrée sans qu’une entrevue ait été complétée pour elle dans le cadre de la CVD ou sans que toutes les adresses lui ayant été associées aient été résolues. Les adresses non résolues ou non obtenues pourraient être à l’origine d’un surdénombrement. En conséquence, on applique deux facteurs additionnels de façon à gonfler la variable d’intérêt affichant les surdénombrements. Pour obtenir des renseignements additionnels à ce sujet, on peut consulter Théberge (2002). Le tableau 8.5A présente les chiffres pondérés de la classification de l’échantillon. Il convient de noter que ces chiffres ne tiennent compte ni des ajustements aux chiffres du recensement (voir le chapitre 7), ni des estimations du surdénombrement, lesquels ont une incidence sur le taux de sous-dénombrement net du recensement.
Les résultats pondérés de la CVD quant au surdénombrement sont présentés dans le tableau 8.5B.
Enfin, en ce qui a trait au calcul de la variance des estimations, une innovation importante touchant la CVD de 2001 a été le remplacement de la méthode des groupes aléatoires par des méthodes basées sur le plan d'échantillonnage, grâce au SGE. Selon ces méthodes, le plan d'échantillonnage de la CVD est approximé par un plan stratifié avec probabilités de sélection proportionnelles à la taille. Les tailles retenues sont celles qui reproduisent les poids finaux. On peut obtenir plus de détails sur les méthodes d'estimation utilisées dans le cadre de la CVD de 2001 en consultant Théberge et Liu (2003). 8.6 Méthodologie – Production des tableauxEn 2001, comme en 1996, on a préparé une série de tableaux qui ont été présentés au Comité fédéral-provincial-territorial de la démographie. Les estimations de l’erreur de couverture sont présentées dans les quatre séries suivantes :
Les statistiques présentées au tableau 5.1 et au chapitre 11 sont tirées de certains tableaux de la série A. Les estimations de l’erreur de couverture ont été
produites à l’aide du Système généralisé
d’estimation (SGE) de Statistique Canada et d’une série
de programmes écrits en SAS (Système d'analyse statistique).
La production d’estimations en parallèle selon ces deux
méthodes a permis de garantir la cohérence du calcul.
Les estimations des erreurs-types ont été produites au
moyen du SGE et du SAS. Des tableaux présentant les estimations
de l’erreur de couverture et de l'erreur-type ont été
élaborés à l’aide du SAS utilisé conjointement
avec Microsoft Excel. Cette méthode de production de tableaux
a permis de réduire considérablement le temps nécessaire
pour cette tâche par rapport à 1996. |
|
|||||