Document méthodologique sur les données linguistiques du Recensement de 2011

No 98-314-XWF2011051 au catalogue

Sommaire

L’examen des résultats tirés des données du Recensement de 2011 a montré que :

  • Les données du Recensement de 2011 sont jugées de bonne qualité. Cependant, les Canadiens ont été moins portés que lorsqu’ils ont rempli le questionnaire détaillé des recensements antérieurs à déclarer une langue autre que le français ou l’anglais comme seule langue maternelle, et plus enclins à déclarer plus d’une langue maternelle et plus d’une langue d’usage à la maison.
  • Ils ont également été plus portés que lorsqu’ils ont rempli le questionnaire abrégé lors des recensements antérieurs à déclarer une langue autre que le français ou l’anglais comme seule langue maternelle, et moins enclins à déclarer plus d’une langue maternelle.
  • On n’a pas observé de changement particulier dans la façon de répondre à la question sur la connaissance des langues officielles.
  • Les différences de tendances observées en ce qui a trait à la langue maternelle et la langue parlée à la maison n’ont pas été influencées par les changements dans la collecte et les méthodes de traitement des données du Recensement de 2011.
  • Les résultats d’analyse présentés dans ce document méthodologique montrent que les changements observés découlent en grande partie des modifications apportées au positionnement et au contexte des questions linguistiques dans le questionnaire du Recensement de 2011 par rapport aux recensements antérieurs.
  • Ces résultats montrent également que le questionnaire du Recensement de 2011, distribué à l’ensemble de la population, est un instrument de collecte hybride entre le questionnaire abrégé de 2006 distribué à 80 % de la population et le questionnaire détaillé de 2006 distribué à 20 % de la population.
  • Bien que les données du Recensement de 2011 soient jugées de bonne qualité, les analyses présentées dans ce document montrent que ces données tendent néanmoins à sous-estimer la part relative des langues maternelles autres que française ou anglaise et à surestimer celle des déclarations de plus d’une langue maternelle (réponses multiples) comparativement aux questionnaires détaillés de 2001 et 2006. En contrepartie, cette sous-estimation des langues « autres » est moins importante que celle observée à partir des données du questionnaire abrégé de 2001 et 2006. La surestimation des réponses multiples y est également moins forte.
  • Pour ce qui est de la langue parlée le plus souvent à la maison, les résultats présentés dans ce document méthodologique montrent que le questionnaire du Recensement de 2011 tend à produire davantage de réponses multiples et à sous-estimer la part des réponses uniques d’une langue autre (unique).
  • Les utilisateurs de données sont invités à la prudence dans l’évaluation des tendances se rapportant à la langue maternelle et à la langue parlée à la maison lors de la comparaison des données du Recensement de 2011 aux données des recensements antérieurs.

Introduction

Les données du recensement sur la langue permettent de brosser un portrait d’ensemble de la situation linguistique au pays à un moment précis dans le temps. Elles permettent également d’en suivre l’évolution lorsqu’on les compare avec celles des recensements antérieurs.

Une telle comparaison requiert qu’on tienne compte de tout changement pouvant survenir au cours de la période étudiée. La façon dont les Canadiens répondent aux questionnaires du recensement de la population ou à toutes autres enquêtes peut en effet être influencée par plusieurs facteurs, dont ceux liés à la méthodologie. Ainsi, le degré de comparabilité dans le temps des données linguistiques dépend, du moins en partie, des modifications qui peuvent survenir d’un recensement à l’autre en ce qui a trait, par exemple, au libellé et à l’emplacement des questions sur le questionnaire, à la couverture, à la collecte ou aux procédures de contrôle et d’imputation.

La méthodologie du Recensement de la population a connu des changements importants en 2011. Alors que les recensements précédents consistaient en un questionnaire abrégé que devaient remplir 80 % des ménages canadiens et d’un questionnaire détaillé que devaient remplir l’autre cinquième des ménages, le Recensement de 2011 consistait en un questionnaire unique de 10 questions que devaient remplir tous les ménages. Ce recensement a été suivi d’une enquête volontaire, l’Enquête nationale auprès des ménages, distribuée à un échantillon du tiers des ménages canadiens.

Pour la première fois en 2011, trois questions linguistiques (connaissance des langues officielles, langues parlées à la maison et langue maternelle) ont été posées dans le questionnaire du recensement distribué à tous les ménages canadiensNote 1. Dans les recensements précédents, le questionnaire abrégé ne contenait qu’une question sur la langue, soit « la première langue apprise à la maison dans l’enfance et encore comprise » (langue maternelle), alors que le questionnaire détaillé contenait, depuis 2001, cinq questions linguistiques, dont celle sur la langue maternelleNote 2.

Les données du Recensement de 2011 sur la langue sont jugées de bonne qualité. Toutefois, Statistique Canada incite les utilisateurs de données à faire preuve de prudence dans l’interprétation de l’évolution de la situation linguistique entre 2006 et 2011. Statistique Canada a en effet constaté des changements dans la façon dont les Canadiens ont répondu aux questions sur la langue maternelle et les langues parlées à la maison. Ceux-ci semblent en effet avoir été moins portés que dans les questionnaires détaillés des recensements antérieurs à déclarer une langue autre que le français ou l'anglais comme seule langue maternelle, et plus enclins à déclarer plus d'une langue maternelle et plus d'une langue d'usage à la maisonNote 3. La façon dont les Canadiens ont répondu à la question sur la langue maternelle est également différente de celle avec laquelle ils avaient répondu à cette question dans les questionnaires abrégés des recensements antérieursNote 4.

L’objectif du présent document méthodologique est de montrer que l’utilisation de questionnaires de recensement différents fait en sorte que les Canadiens répondent différemment aux questions sur la langue maternelle et les langues parlées à la maison. En particulier, l’analyse présentée semble confirmer que les changements observés résultent des modifications apportées au positionnement et au contexte des questions linguistiques dans le questionnaire du Recensement de 2011 par rapport à ceux des recensements antérieurs.

Ce document comporte deux parties. La première partie de ce document traite de l’influence du questionnaire du recensement sur la façon de répondre aux questions de langue. Elle montre d’abord en quoi le questionnaire du Recensement de 2011 se distingue de ceux de 2001 et 2006. Elle rappelle ensuite que l’effet d’un changement de questionnaire avait été démontré dans une série d’études effectuées dans la foulée des changements apportés au Recensement de 1991. Ces études avaient également montré que le questionnaire détaillé du recensement est plus précis notamment parce qu’il comporte moins de biais de réponse que le questionnaire abrégé. Finalement, cette première partie présente les différences dans la distribution des réponses aux questions sur la langue maternelle et les langues parlées à la maison entre 2006 et 2011 comparativement à la période intercensitaire précédente.

Dans la seconde partie de ce document, l’influence du changement de questionnaire sera démontrée par l’entremise de couplages d’enregistrements des mêmes répondants aux recensements de 2001 et 2006 selon qu’ils avaient répondu à des questionnaires similaires ou différents lors de ces deux recensements. Finalement, ce qui est observé par l’entremise de ces couplages entre les recensements de 2001 et 2006 permettra de comprendre comment les changements au Recensement de 2011 ont affecté la comparabilité des résultats par rapport aux questionnaires abrégé et détaillé de 2006.

Première partie. L’influence du questionnaire du recensement sur la façon de répondre aux questions sur la langue

a) Le questionnaire du Recensement de 2011 en comparaison de ceux de 2001 et 2006

Dans le questionnaire du Recensement de 2011 distribué à l’ensemble des ménages au Canada, deux questions linguistiques tirées du questionnaire détaillé du Recensement de 2006 (la connaissance des langues officielles et les langues parlées à la maison) ont été ajoutées à celle sur la langue maternelle, seule question linguistique à être posée dans le questionnaire abrégé de 2006.

En conséquence, l’ordre et le contexte dans lesquels apparaissent les questions linguistiques ont été altérés. Dans le questionnaire détaillé du Recensement de 2006, les questions linguistiques étaient précédées de questions démographiques (date de naissance, sexe, état matrimonial, lien avec la personne 1), de questions sur les activités de la vie quotidienne, le lieu de naissance, la citoyenneté et l’immigration. Sur le formulaire du Recensement de 2011, ces questions linguistiques n’étaient précédées que par les questions démographiques.

De plus, dans le questionnaire détaillé de 2001 et 2006 la question sur la langue maternelle était précédée, dans cet ordre, des questions sur la connaissance des langues officielles, la connaissance des langues non officielles et les langues parlées à la maison. La question sur la connaissance des langues non officielles n’a pas été posée au Recensement de 2011.

Le tableau 1 qui suit présente quelques informations sur les questionnaires de 2001 à 2011 et l’emplacement des questions linguistiques de base dans ceux-ci. Le libellé de la question sur la langue maternelle est demeuré le même en 2001, 2006 et 2011 :

Encadré 1

Quelle est la langue que cette personne a apprise en premier lieu à la maison dans son enfance et qu’elle comprend encore?

Si cette personne ne comprend plus la première langue apprise, indiquez la seconde langue qu’elle a apprise.

Fin de l’encadré 1.

Le tableau 1 rend compte du fait que le questionnaire de 2011 est différent du questionnaire abrégé (distribué à 80 % des ménages au pays) et du questionnaire détaillé (distribué à 20 % des ménages) des recensements antérieurs. D’une part, comme le questionnaire abrégé, il contient un nombre restreint de questions, soit dix, alors que le questionnaire abrégé de 2001 en compte sept et celui de 2006 en compte huit. Par contre, le Recensement de 2011 compte trois questions linguistiques au lieu d’une seule dans les questionnaires abrégés de 2001 et de 2006Note 5.

La lecture du tableau 1 permet de constater que le questionnaire du Recensement de 2011 est similaire au questionnaire abrégé par sa taille restreinte, mais s’en distingue en ce qu’il contient trois questions linguistiques au lieu d’une seule. Il est par ailleurs comparable au questionnaire détaillé en ce qu’il contient plus d’une question linguistique, soit trois, comparativement à quatre pour le questionnaire détaillé de 2001 et de 2006 (sans compter la question à deux volets sur la langue de travail). De plus, outre l’absence de la question sur la connaissance des langues non officielles en 2011, l’ordre des questions linguistiques est le même au Recensement de 2011 que dans les questionnaires détaillés de 2001 et 2006.

b) Études antérieures sur les différences de résultats à partir des questionnaires abrégé et détaillé

Depuis 1996, tant l’analyse que la diffusion de données statistiques sur la langue maternelle à partir des données censitaires ont été fondées quasi exclusivement sur les réponses tirées du questionnaire détaillé distribué à un échantillon de 20 % des ménages canadiens.

Bien que le libellé de la question sur la langue maternelle ait été le même dans les questionnaires abrégé et détaillé des recensements précédents, les données tirées des questionnaires abrégé et détaillé ont généralement présenté des différences importantes, en particulier à partir de 1991Note 6.

Par exemple, le nombre et la proportion des déclarations de plus d’une langue maternelle (réponses multiples) sont plus élevés lorsque la question sur la langue maternelle est posée dans le questionnaire abrégé que dans le questionnaire détaillé. Ainsi, en 1991, 1,2 % de la population ayant répondu au questionnaire détaillé avait déclaré plus d’une langue maternelle comparativement à 3,0 % de la population ayant rempli le questionnaire abrégé. En conséquence, les données tirées du questionnaire détaillé comportaient un effectif et une proportion plus élevée de réponses uniques touchant le français et, surtout, les langues non officielles. Lors de ce même recensement, 14,8 % de la population avait déclaré une langue maternelle unique autre que le français ou l’anglais dans le questionnaire détaillé comparativement à 12,6 % dans le questionnaire abrégé.

Depuis 1991, Statistique Canada a régulièrement mentionné que les différences entre les résultats des données tirées des questionnaires abrégé et détaillé étaient attribuables au fait que, dans le premier cas, la langue maternelle était la seule question posée alors que, dans le second cas, d’autres questions linguistiques étaient posées avant la question sur la langue maternelle.

Des travaux menés par Statistique Canada après les recensements de 1986Note 7 et de 1991 ont montré que les répondants avaient moins tendance à déclarer deux langues maternelles ou plus lorsqu’ils pouvaient d’abord faire état de leurs connaissances ou de leur utilisation des langues et que, par conséquent, la précision et l’exactitude des données sur la langue maternelle s’en trouvaient améliorées.

Les résultats observés lors du Recensement de 1991 et dans les recensements subséquents découlent de changements importants qui avaient été apportés au questionnaire détaillé comparativement à celui des recensements précédents. Non seulement les trois questions linguistiques des recensements précédents ont-elles été regroupées, on avait également modifié l’ordre d’apparition des questions linguistiques et effectué certains changements dans le libellé de quelques questions. De plus, le module de questions linguistiques a été élargi par l’ajout d’une nouvelle question sur la capacité de soutenir une conversation dans une autre langue que le français ou l’anglaisNote 8.

Ces changements ont fait en sorte qu’entre 1986 et 1991 la proportion de réponses multiples dans le questionnaire détaillé est passée de 3,4 % à 1,2 % à la question sur la langue maternelle, et de 4,6 % à 1,8 % à celle sur la langue parlée le plus souvent à la maisonNote 9.

Des études méthodologiques internesNote 10 effectuées par Statistique Canada à la suite du Recensement de 1991 ont révélé que les données sur la langue maternelle tirées du questionnaire détaillé étaient généralement plus précises en raison du fait qu’elles semblent mieux refléter la réalité et, par conséquent, qu’elles contiennent moins de biais de réponse attribuable à la structure du questionnaire.

Toutefois, dans le cas des petites unités géographiques et pour les groupes linguistiques très minoritaires, l’erreur due à l’échantillonnage est souvent supérieure à l’erreur découlant de ces biais de réponse. Dans ces cas particuliers, les données tirées du questionnaire abrégé s’avèrent plus fiables, malgré les biais de réponse qu’elles peuvent comporter.

D’autres études ont également été menées à la suite de ce même recensement afin d’examiner la qualité des données tirées du questionnaire abrégéNote 11. Par exemple, l’Étude de la contre-vérification des dossiers de 1991 permet de comparer les données d’un échantillon de réponse au recensement de 1991 avec celles d’autres sources de données, dont le recensement de 1986. Cette comparaison permet une analyse des incohérences entre les deux recensements. Autrement dit, elle permet d’examiner dans quelle mesure les mêmes répondantsNote 12 fournissent des réponses identiques ou non à une même question tirée de deux questionnaires.

Pour ce qui est de la question sur la langue maternelle, les résultats ont montré un niveau d’incohérence, et donc d’instabilité, très élevé (égal ou supérieur à 75 %) entre le Recensement de 1986 et de 1991 pour toutes les catégories de réponse multiple. Entre d’autres termes, cela signifie que lorsqu’un répondant fournit une réponse multiple lors d’un recensement, cette réponse sera différente dans 75 % des cas lors du recensement suivant. Les réponses uniques « Autre » comportaient quant à elles un niveau d’incohérence modéré (environ 22 % de changement de réponse) et les réponses uniques d’une des deux langues officielles un niveau plus faible (inférieure à 5 %)Note 13.

L’examen des taux d’incohérence des données sur la langue maternelle à partir de la contre-vérification des dossiers des recensements de 1981, 1986 et 1991 a montré que les réponses multiples à cette question sont très instables et peu fiables. Celles-ci demeurent instables même lorsqu’on parvient à diminuer leur nombre (comme ce fut le cas dans le questionnaire détaillé entre 1986 et 1991).

La distribution des réponses à la question sur la langue maternelle selon l’étude de couverture de 1991 a par ailleurs révélé que le questionnaire abrégé sous-estimait de façon importante la proportion de la population ayant une langue maternelle unique autre que le français ou l’anglaisNote 14 et surestimait de façon importante la proportion de réponses multiples.

L’un des volets de cette étude de couverture de 1991 comprenait une série de questions linguistiques autres que celles du recensement afin d’identifier avec le plus de précision possible la première langue apprise à la maison dans l’enfance et encore comprise par le répondant. Les résultats de cette étude ont alors été comparés avec ceux du recensement fournis par les mêmes répondants dans les questionnaires détaillé ou abrégé afin d’établir la cohérence des réponses entre les sources de données.

Les résultats de cette dernière étude ont démontré clairement que la distribution des réponses à la question sur la langue maternelle y était quasi identique à celle observée à partir des données du questionnaire détaillé, mais différente de celle observée à partir des données du questionnaire abrégé.

c) Différences de réponse aux questions sur la langue maternelle et les langues parlées à la maison entre 2006 et 2011 comparativement à la période intercensitaire précédente

Un premier aperçu des différences observées entre, d’une part, les données de 2001 et de 2006 tirées des questionnaires abrégé et détaillé et, d’autre part, les données du Recensement de 2011 est présenté au tableau 2. On y constate d’abord que la proportion des réponses multiples à la question sur la langue maternelle en 2001 et en 2006 est plus élevée à partir des données du questionnaire abrégé qu’à partir des données du questionnaire détaillé.

Lors du Recensement de 2006, 1,3 % de la population ayant répondu au questionnaire détaillé a déclaré plus d’une langue maternelle comparativement à 3,6 % de la population ayant rempli le questionnaire abrégé. De même, en 2001 et en 2006, la proportion des déclarations d’une autre langue que le français ou l’anglais dans le questionnaire abrégé est d’environ 4 points de pourcentage inférieurs à celle observée à partir des données du questionnaire détaillé.

Quant aux données du Recensement de 2011, la proportion de réponses multiples est supérieure à celle observée à partir des données du questionnaire détaillé, mais inférieure à celle observée à partir des données du questionnaire abrégé.

En ce qui a trait à la langue parlée à la maison, on constate que la proportion de réponses multiples, qui était de 1,8 % aux recensements de 2001 et 2006, a doublé pour se situer à 3,5 % en 2011. En revanche, la proportion des déclarations d’une langue « autre », qui s’était accrue de 1,4 point entre 2001 et 2006, est restée au niveau de 2006, soit 11,1 %.

Les tableaux A1.1 à A1.3 qui figurent en annexe présentent de façon détaillée les changements observés dans les distributions des réponses aux questions sur la langue maternelle et les langues parlées à la maison entre les recensements de 2001, 2006 et 2011.

Le tableau A1.1 révèle que le taux de croissance de la population ayant déclaré plus d’une langue maternelle dans le questionnaire détaillé du recensement a été de 3,1 % (11 625 personnes) au cours de la période 2001-2006 alors qu’il a plutôt été de 62,8 % (246 775 personnes) entre 2006 et le Recensement de 2011. En contrepartie, le taux de croissance de la population ayant déclaré une autre langue que le français ou l’anglais avait été de 18,2 % (945 600 personnes) au cours de la période 2001-2006 alors qu’il a été de 6,8 % (419 845) entre 2006 et 2011. À l'inverse, la croissance de la population ayant déclaré le français ou l’anglais comme langue maternelle a été plus importante au cours de la période 2006-2011 qu’au cours de la période intercensitaire précédente.

Le tableau A1.2 présente quant à lui la distribution de la population selon la langue maternelle à partir des données intégrales (100 %) des recensements de 2001, 2006 et les données du Recensement de 2011Note 15. En raison du fait que, comparativement au questionnaire détaillé, le questionnaire abrégé de 2001 et 2006 tend à produire une proportion plus élevée de réponses multiples et une proportion plus faible de réponses uniques d’une langue autre que le français ou l’anglais à la question sur la langue maternelle, il n’est pas étonnant de constater que l’évolution des réponses multiples entre 2006 et 2011 présente une tendance inverse à celle observée en utilisant les données tirées du questionnaire détaillé de 2001 et 2006.

Étant donné que Citoyenneté et Immigration Canada a dénombré à peu près le même nombre de nouveaux résidents permanents venus s’établir au Canada entre 2006 et 2011 (1 081 100) qu’entre 2001 et 2006 (1 060 350)Note 16 dont la langue maternelle est une autre langue que le français, l’anglais ou une langue autochtone, la croissance de la population ayant déclaré une langue « autre » entre 2006 et 2011 devrait être semblable à celle observée entre 2001 et 2006, ce qui n’est pas le cas, peu importe qu’on utilise les données du questionnaire abrégé ou détaillé.

Finalement, le tableau A1.3 en annexe présente l’évolution de la structure des réponses à la question à deux volets sur les langues parlées à la maison.

La comparaison des données de 2006 et 2011 sur la langue parlée le plus souvent à la maison révèle des tendances similaires à celles sur la langue maternelle à partir des données tirées du questionnaire détaillé de 2006. Toutefois, contrairement à la langue maternelle, la langue parlée le plus souvent à la maison par certaines sous-populations est plus susceptible de changer au cours de la vie, notamment en raison du phénomène des transferts linguistiquesNote 17 découlant de l’adoption de l’une ou l’autre des langues officielles à la maison.

Le tableau 2 a montré que que la proportion de la population ayant déclaré parler une autre langue que le français ou l’anglais le plus souvent à la maison est demeurée stable entre 2006 et 2011, soit 11,1 %. Selon le tableau A1.3 présenté en annexe, cette population s’est accrue de 201 735 personnes (ou 5,8 %), entre 2006 et 2011 alors qu’elle avait augmenté de 583 590 (ou 20,2 %) entre 2001 et 2006, soit une différence de près de 382 000 personnes.

Cette plus faible croissance du nombre de déclarations uniques d’une langue « autre » a été observée de pair avec une augmentation marquée tant du nombre que du pourcentage de réponses multiples à la question sur la langue parlée le plus souvent à la maison.

Le nombre de réponses multiples a crû de plus de 586 000 entre 2006 et 2011, comparativement à près de 48 000 entre 2001 et 2006. Ainsi, le nombre de personnes ayant déclaré parler plus d’une langue le plus souvent à la maison a plus que doublé entre 2006 et 2011, comparativement à une hausse de 9 % entre 2001 et 2006.

Les statistiques portant sur les langues parlées régulièrement (autre que celles parlées le plus souvent) à la maison, le cas échéant, permettent de constater la façon dont ont évolué les déclarations de langues d’usage à la maison entre 2006 et 2011 (tableau A1.3).

En général, la baisse marquée de la croissance des déclarations uniques d’une langue « autre » parlée le plus souvent à la maison semble avoir été compensée par une hausse marquée des déclarations multiples à cette même question en 2011 ainsi que par une plus forte croissance du nombre de personnes ayant déclaré une langue « autre » comme langue (secondaire) parlée régulièrement à la maison entre 2006 et 2011 (560 390) comparativement à celle observée entre 2001 et 2006 (217 665).

d) La connaissance des langues officielles et la première langue officielle parlée

Avant de poursuivre l’examen des réponses aux questions sur la langue maternelle et les langues parlées à la maison, il faut souligner ici que les données du Recensement de la population de 2011 sur la connaissance des langues officielles, c’est-à-dire la capacité autodéclarée de pouvoir soutenir une conversation en français et/ou en anglais, sont comparables aux données tirées des recensements antérieursNote 18. Il en va de même pour la variable de « première langue officielle parlée » (PLOP). Cette dernière est une variable dérivée, successivement, des réponses aux questions sur la connaissance des langues officielles, la langue maternelle et la principale langue d’usage à la maison.

Bien que la création de la variable de PLOP soit fondée sur l’information provenant de deux questions pour lesquelles on a constaté des différences dans la façon d’y répondre, la comparabilité des données de 2006 et 2011 sur la PLOP ne semble pas avoir été affectée. Un examen des données au niveau des subdivisions de recensement n’a pas révélé d’évolution inhabituelle des résultats.

De plus, la quasi-totalité des personnes qui avaient le français ou l’anglais comme PLOP il y a cinq ans avait toujours la même PLOP en 2011. Plus spécifiquement, 99 % des personnes qui avaient l’anglais comme PLOP en 2006, tout comme 97 % de celles qui avaient le français ont toujours cette langue comme première langue officielle parlée en 2011. Ce constat tient notamment au fait que les changements qui ont pu se produire au niveau de la langue maternelle ou de la langue parlée le plus souvent la maison n’ont pas ou très peu affecté l’orientation qui préexistait vers l’une ou l’autre des deux langues officielles en ce qui a trait à l’estimation de la première langue officielle parléeNote 19.

Deuxième partie. La cohérence des déclarations à la langue maternelle et à la langue parlée à la maison entre les recensements

En principe, la première langue apprise à la maison dans l’enfance et encore comprise au moment du recensement (langue maternelle) devrait être une caractéristique stable chez un individu. Sauf dans les rares cas où une personne ne comprend plus la première langue qu’elle a apprise, la langue maternelle ne devrait pas changer, quelles que soient les autres langues apprises plus tard au cours de la vieNote 20. Il y a donc lieu de s’attendre à ce que les déclarations de langue maternelle concernant les mêmes individus entre deux recensements consécutifs soient les mêmesNote 21.

En d’autres termes, si un même individu fournit pour lui-même ou pour un membre de son ménage une langue différente de celle fournie au recensement précédent, cela peut être dû au questionnaire lui-même plutôt qu’à un changement réel de langue. La seconde partie de ce document méthodologique tentera de confirmer cette hypothèse.

Pour ce faire, les réponses déclarées par les mêmes personnes aux recensements de 2006 et 2011 ont été comparées et ces résultats ont été examinés à la lumière de couplages d’enregistrements entre les recensements de 2001 et de 2006Note 22. Cette section présente les taux nets de changement de réponse et leur influence sur la répartition de la population par groupe linguistique.

L’examen des changements de réponse entre les recensements par l’entremise de couplages d’enregistrements se résume aux six cas de figure suivants :

  • Répondants aux questionnaires abrégés des recensements de 2001 et 2006
  • Répondants aux questionnaires abrégé de 2001 et détaillé de 2006
  • Répondants aux questionnaires détaillés de 2001 et 2006
  • Répondants aux questionnaires détaillé de 2001 et abrégé de 2006
  • Répondants au questionnaire abrégé de 2006 et au Recensement de 2011
  • Répondants au questionnaire détaillé de 2006 et au Recensement de 2011

Mentionnons d’entrée de jeu que, tous couplages d’enregistrements confondus, la stabilité des déclarations d’une langue officielle comme langue maternelle entre les recensements de 2001 et 2006 ou entre ceux de 2006 et 2011 chez un même répondant est supérieure à 95 %. Celle des déclarations d’une langue « autre » est de près de 80 % alors que celle des réponses multiples n’est que de 18 %.

a) Changements de réponse à la question sur la langue maternelle et répercussion sur la taille des groupes linguistiques

Les figures 1, 2 et 3 présentent les taux nets de changement de réponse pour les six types de jumelage d’enregistrements mentionnés précédemment, soit les quatre types de jumelage des enregistrements tirés des questionnaires abrégé et détaillé de 2001 et 2006, et les deux types de jumelage des enregistrements tirés des questionnaires abrégé et détaillé de 2006 avec le questionnaire unique de 2011.

Les taux nets de changement de réponse sont calculés en divisant le solde netNote 23 des changements de réponse sur la période intercensitaire pour une langue maternelle donnée par la population de cette langue maternelle en début de période. Les résultats sont présentés pour les langues maternelles suivantes : anglais, français, autre qu’anglais ou françaisNote 24. Ils sont présentés séparément pour le Canada, le Québec et le Canada hors Québec. Les différences entre le Québec et le reste du Canada sont suffisamment importantes pour que l’on distingue ces entités géographiquesNote 25.

En se concentrant tout d’abord sur la période 2001-2006, on constate que les taux nets de changement sont les plus faibles pour les répondants qui ont rempli le même questionnaire aux deux recensements et, plus particulièrement, lorsque ce questionnaire est le questionnaire détaillé. À l’échelle canadienne, les taux nets de changement de réponse pour les groupes de langue maternelle française ou anglaise sont effectivement nuls parmi la population ayant répondu aux questionnaires détaillés à la fois en 2001 et en 2006. Ce taux est très légèrement positif (1,4 %) pour les répondants de langue maternelle autre qu’anglaise ou française. La situation est similaire au Québec sauf pour un très faible taux de changement net de 1,5 % vers l’anglais. Dans le reste du Canada, on observe également un très faible taux de changement net de 1,6 %, mais cette fois vers le français.

Les figures 1, 2 et 3 présentent également des taux nets de changement très faibles pour les répondants qui ont rempli à la fois les questionnaires abrégés en 2001 et en 2006, ces taux étant cependant un peu plus élevés que dans le cas des répondants ayant répondu aux questionnaires détaillés lors des deux recensements. Pour l’ensemble du Canada, le taux net de changement est de 4,7 % pour ce qui est du groupe de langue maternelle autre que française ou anglaise et d’environ 1 % pour ce qui est des groupes de langue maternelle française et anglaise. Au Québec, les taux nets de changement se situent à 8,5 % pour le groupe de langue maternelle autre que française ou anglaise et à 5 % pour le groupe de langue maternelle anglaise. À l’extérieur du Québec, le taux net de changement atteint 6 % pour le groupe de langue maternelle française et 4,1 % pour celui de langue maternelle autre que française ou anglaise.

Ces observations corroborent le fait déjà établi que la langue maternelle est bien une caractéristique stable et que l’utilisation d’un même questionnaire assure la meilleure comparabilité des résultats dans le temps. De surcroît, le fait que les taux nets de changement soient plus faibles pour les répondants au questionnaire détaillé dans lequel la question sur la langue maternelle est la dernière d’une série de quatre questions linguistiques intégrées à une série de questions sociodémographiques, que pour ceux du questionnaire abrégé vient étayer la démonstration que le questionnaire détaillé permet de mieux saisir la langue maternelle que le questionnaire abrégé.

Les taux nets de changement de réponse à la langue maternelle sont tout autres lorsqu’il y a eu changement de questionnaire entre 2001 et 2006, et ce, tout particulièrement pour le groupe de langue maternelle autre que française ou anglaise. Ainsi, il y a 31,7 % plus de Canadiens qui ont déclaré une langue maternelle autre que le français ou l’anglais au questionnaire détaillé de 2006 parmi ceux qui avaient répondu au questionnaire abrégé de 2001. Inversement, on compte 20,4 % moins de Canadiens ayant déclaré une langue maternelle autre que le français ou l’anglais dans le questionnaire abrégé de 2006 parmi ceux qui avaient répondu au questionnaire détaillé de 2001. La même situation prévaut au Québec et dans le reste du Canada.

Ces résultats confirment ceux obtenus dans le cadre de travaux antérieurs menés sur les données des recensements de 1986 et de 1991 qui ont montré que le questionnaire abrégé tend à produire moins de déclarations d’une langue autre que le français ou l’anglais.

La différence entre le Québec et le reste du Canada tient à l’augmentation marquée des taux nets de changement de réponse à la question sur la langue maternelle chez le groupe de langue maternelle française à l’extérieur du Québec. Ainsi, 17,2 % plus de personnes ayant rempli à la fois le questionnaire abrégé de 2001 et le questionnaire détaillé de 2006 avaient déclaré le français comme langue maternelle en 2006 qu’en 2001. Inversement, parmi les personnes ayant rempli à la fois le questionnaire détaillé de 2001 et le questionnaire abrégé de 2006, on en comptait 8,8 % de moins qui avaient déclaré le français comme langue maternelle en 2006 qu’en 2001.

Autrement dit, on constate qu’une part importante des Canadiens de langue maternelle autre que française ou anglaise déclarent soit l’anglais soit le français, voire une réponse multiple, comme langue maternelle plutôt qu’une autre langue quand la question sur la langue maternelle est posée dans le questionnaire abrégé hors du contexte des autres questions linguistiques et sociodémographiques. Quant aux répondants de langue maternelle française hors Québec, une bonne part d’entre eux tend à déclarer plus souvent l’anglais comme langue maternelle que le français lorsqu’ils répondent au questionnaire abrégé plutôt qu’au questionnaire détaillé du recensement.

Qu’en est-il des taux nets de changement observés entre les recensements de 2006 et de 2011? Les figures 1, 2 et 3 montrent que, parmi les personnes ayant complété à la fois le questionnaire abrégé de 2006 et le Recensement de 2011, 15,8 % plus de personnes ont déclaré une autre langue que le français ou l’anglais en 2011 qu’en 2006. Étant donné que le questionnaire abrégé tend à produire moins de déclarations d’une langue autre que le français ou l’anglais, ce résultat donne à penser que le questionnaire du Recensement de 2011 a incité les répondants à déclarer davantage ces langues maternelles que lorsqu’ils ont rempli le questionnaire abrégé.

De la même façon, on compte 8,7 % plus de répondants à l’extérieur du Québec qui ont déclaré le français comme langue maternelle au Recensement de 2011 parmi ceux qui avaient répondu au questionnaire abrégé de 2006.

La situation s’inverse chez les répondants qui avaient rempli le questionnaire détaillé de 2006, quoique de façon moins marquée, puisque le groupe de langue maternelle autre que française ou anglaise perd au net 6,2 % de son effectif en 2011. En d’autres termes, ces mêmes personnes ont été moins portées à déclarer cette langue maternelle dans le questionnaire de 2011 que dans le questionnaire détaillé de 2006. Le taux net de changement pour le groupe de langue maternelle française hors Québec entre le questionnaire détaillé de 2006 et le Recensement de 2011 est quant à lui quasi nul.

Le changement de questionnaire en 2011 semble avoir induit une partie des Canadiens, tout particulièrement ceux de langue maternelle autre que française ou anglaise, à changer leur façon de répondre à cette question, une situation qui rend plus difficile la comparabilité des données avec celles du Recensement de 2006. Étant donné que la question sur la langue maternelle au recensement de 2011 était précédée de deux autres questions linguistiques, il semble cependant que la comparabilité est moins affectée entre le questionnaire détaillé de 2006 et le recensement de 2011 qu’entre celui-ci et le questionnaire abrégé de 2006.

À la lumière des résultats présentés, on peut supposer que l’effet du changement de questionnaire s’est aussi fait sentir chez les répondants dont on ne pouvait coupler les enregistrements entre les deux recensements, soit, au premier chef, les immigrants arrivés au cours de cette période. En faisant cette hypothèse, on peut supposer qu’on parvient à expliquer la majeure partie des différences entre les résultats du recensement de 2011 et ce qu’on aurait obtenu sans changement de questionnaire. En d’autres termes, tout porte à croire que les données tirées du Recensement de 2011 tendraient à sous-estimer les déclarations uniques d’une langue autre que le français ou l’anglais et à surestimer les réponses multiples (très instables), quoique dans une moindre mesure que le questionnaire abrégé par le passé, comparativement aux données du questionnaire détaillé.

b) Changements de réponse à la question sur la langue parlée le plus souvent à la maison

Contrairement à la langue maternelle, la langue parlée à la maison n’est pas nécessairement une caractéristique stable au cours du cycle de vie d’une personne. De nombreuses études ont montré que plusieurs personnes effectuent, au cours de leur vie, un « transfert » ou une « substitution » linguistique, c’est-à-dire qu’elles adoptent une langue à la maison différente de la première langue apprise à la maison dans l’enfance (langue maternelle), habituellement l’une des deux langues officielles.

Étant donné que la question sur la langue parlée le plus souvent à la maison n’a pas été posée dans le questionnaire abrégé des recensements de 2001 ou 2006, l’analyse qui suit ne peut donc se baser que sur deux types de couplage (soit entre le questionnaire détaillé de 2001 et celui de 2006, et entre le questionnaire détaillé de 2006 et le Recensement de 2011).

Mentionnons par ailleurs que, tout comme pour la langue maternelle, les déclarations de plus d’une langue parlée le plus souvent à la maison (réponse multiple) sont très instables d’un recensement à l’autre. Entre 2001 et 2006, seulement 17 % des personnes ayant fourni une réponse multiple en 2001 ont fourni la même réponse en 2006. Entre 2006 et 2011, cette proportion se situait à 27 %.

L’examen des taux nets de changement (figures 4, 5 et 6) de réponse (unique) pour la langue parlée le plus souvent à la maison révèle des résultats assez similaires à ceux pour la langue maternelle. Étant donné qu’il n’y a pas eu de changement de questionnaire entre 2001 et 2006, on observe de très faibles taux nets de changement dans les déclarations des personnes qui avaient répondu au questionnaire détaillé lors de ces deux recensements.

En revanche, on constate que 14 % moins de répondants ayant déclaré parler une langue autre que le français ou l’anglais (réponse unique) le plus souvent à la maison lors du Recensement de 2006 ont fait la même déclaration en 2011. On observe également environ 3 % moins de répondants hors Québec déclarant parler le plus souvent le français en 2011 qu’en 2006.

Ces résultats vont donc dans le même sens que ceux observés pour la langue maternelle chez les répondants qui avaient rempli le questionnaire détaillé en 2006. L’hypothèse pour l’expliquer est vraisemblablement du même ordre que pour la langue maternelle, à savoir que le fait de poser la question sur la langue parlée le plus souvent à la maison dans un contexte où plusieurs autres questions linguistiques et d’autres questions sociodémographiques sont présentes, comme c’est le cas du questionnaire détaillé, permet d’obtenir une réponse plus précise que lorsqu’elle n’est posée que dans le contexte de trois questions linguistiques. Cela reste toutefois à vérifier par des tests qualitatifs plus approfondis.

Conclusion

Bien que les données du Recensement de 2011 soient jugées de bonne qualité, on a observé des changements dans la façon dont les Canadiens ont répondu aux questions sur la langue maternelle et la langue parlée à la maison comparativement aux recensements antérieurs. On n’a pas observé de changement en ce qui a trait aux réponses à la question sur la capacité de soutenir une conversation en français ou en anglais.

Le présent document méthodologique a montré que ces changements découlent en grande partie des modifications apportées au positionnement et au contexte des questions linguistiques dans le questionnaire du Recensement de 2011 par rapport aux recensements antérieurs.

La comparaison des réponses des mêmes personnes aux questions sur la langue maternelle et la langue parlée le plus souvent à la maison lors de deux recensements consécutifs a clairement montré que lorsqu’on demande aux Canadiens de répondre à deux questionnaires identiques, on observe peu de changement net de réponse d’un recensement à l’autre.

Lorsqu’on leur demande de remplir un questionnaire différent de celui qu’ils ont rempli cinq ans plus tôt, on observe au contraire des changements de réponse importants, en particulier pour ce qui est du groupe de langue maternelle autre que française ou anglaise ou des déclarations multiples de langue maternelle et de langue parlée à la maison.

Tout comme les analyses antérieures déjà réalisées par Statistique Canada, celles présentées dans ce document ont par ailleurs montré clairement que les déclarations de plus d’une langue maternelle et de plus d’une langue parlée le plus souvent à la maison sont très instables d’un recensement à l’autre.

Les résultats présentés dans ce document ont montré que le questionnaire du Recensement de 2011 est un instrument de collecte hybride entre les questionnaires abrégés et détaillés des recensements antérieurs.

C’est pourquoi Statistique Canada invite les utilisateurs de données à la prudence dans l’évaluation des tendances se rapportant à la langue maternelle et à la langue parlée à la maison lors de la comparaison des données du Recensement de 2011 aux données des recensements antérieurs.

Annexe 1

Annexe 2

Couplage des recensements

Cette étude fait intervenir deux couplages de micro-données entre recensements. Un premier couplage a été réalisé entre les recensements de 2001 et 2006 et un deuxième couplage entre les recensements de 2006 et 2011.

La confidentialité des microdonnées a été assurée en conformité avec la Loi sur la statistique.

Le couplage 2001-2006 permet d’examiner les changements de réponse selon le questionnaire répondu en 2001 ou 2006, soit le questionnaire abrégé administré à 80 % des ménages et le questionnaire 2B administré à 20 % des ménages. Quatre comparaisons sont donc possibles, soit :

  • Comparaison du questionnaire abrégé en 2001 et abrégé en 2006 (abrégé – abrégé);
  • Comparaison du questionnaire abrégé en 2001 et détaillé en 2006 (abrégé – détaillé);
  • Comparaison du questionnaire détaillé en 2001 et abrégé en 2006 (détaillé – abrégé);
  • Comparaison du questionnaire détaillé en 2001 et détaillé en 2006 (détaillé – détaillé).

Le couplage 2006-2011 ne permet, quant à lui, que deux comparaisons puisqu’un seul questionnaire devait être rempli par tous les ménages en 2011 :

  • Comparaison du questionnaire abrégé en 2006 et du recensement de 2011 (abrégé – R);
  • Comparaison du questionnaire détaillé en 2006 et du recensement de 2011 (détaillé – R).

La méthode de couplage employée a été différente dans les deux couplages.

En 2001, on n’avait pas accès aux noms ni aux numéros de téléphone pour procéder à l’appariement des enregistrements (comme ce fut le cas pour le couplage entre 2006 et 2011). Ainsi, la méthode de couplage 2001-2006 s’est déroulée en deux étapes. La première a consisté à jumeler les répondants par méga-appariement à l’intérieur des divisions de recensement (DR), ce qui signifie la formation de paires d’individus dans les ménages sur la base des variables « date de naissance » et « sexe » uniquement, et de tenter de les apparier à toutes les autres paires d’individus à l’intérieur de la division de recensement. La seconde a consisté à apparier les individus par date de naissance et sexe par logement grâce à un fichier géographique qui permet d’identifier les numéros du ménage de 2001 et de 2006 associés à un même logement. Cette méthode en deux étapes ne permet pas d’apparier les personnes qui ont déménagé à l’extérieur de leur division de recensement depuis 2001 ni les personnes vivant seules à une adresse différente de celle de 2001.

La méthode de couplage 2006-2011 est plus élaborée que celle de 2001-2006 puisqu’on avait cette fois accès aux noms et aux numéros de téléphone des individus. Les méthodes utilisées pour apparier 2001 à 2006 ont encore une fois été utilisées, mais en combinaison avec plusieurs autres méthodes et sans se restreindre à la division de recensement (DR). Le but était d’apparier les bonnes personnes plutôt que d’obtenir le taux le plus élevé d’appariement. Dans ce contexte, les critères d’appariement ont été stricts afin de garantir un degré élevé de confiance dans les liens d’appariement obtenus. Le micro-appariement s’est déroulé en plusieurs phases, allant d’un niveau de géographie plus fin (couplage limité aux personnes vivant dans la même DR en 2006 et en 2011), puis élargissant le niveau géographique (ultimement jusqu’au niveau national) pour les cas n’ayant pas déjà été appariés. Ces méthodes ont ainsi permis d'apparier les migrants.

Population couplée et taux de couplage

Le couplage 2001-2006 a permis d’apparier 14 635 680 répondants, soit un taux de couplage de 49,4 %. Ce taux correspond au nombre de répondants couplés entre 2001 et 2006 divisé par la population totale en 2001 (la population en début de période). Le taux de couplage entre 2006 et 2011 a été de 71,4 %, ce qui correspond à 22 312 795 personnes couplées. La différence entre les deux couplages est attribuable à la méthode de couplage utilisée dans chaque cas. Le tableau A2.1 présente les populations totales couplées, les populations totales aux recensements pour chaque couplage selon le questionnaire utilisé et le taux de couplage. Ce tableau permet de constater que le taux de couplage à partir du questionnaire détaillé est légèrement supérieur au taux de couplage à partir du questionnaire abrégé, et ce tant dans le cas du couplage entre 2001 et 2006 que dans celui entre 2006 et 2011.

Le tableau A2.2 présente les populations des couplages selon le questionnaire utilisé à chaque recensement. Notons que la proportion des personnes couplées à partir du questionnaire abrégé et à partir du questionnaire détaillé est très semblable et correspond bien à la répartition originale des deux questionnaires distribués aux recensements, soit 80 % dans le cas du questionnaire abrégé et 20 % dans le cas du questionnaire détaillé.

Il est difficile d’évaluer avec précision dans quelle mesure les personnes couplées sont représentatives de l’ensemble de la population recensée. Une partie de la population présente en début et en fin de période ne peut être évidemment couplée : il s’agit des personnes qui ont quitté le pays ou celles qui sont décédées entre les deux recensements d’une part, et celles qui sont arrivées au pays ou qui sont nées durant cette même période d’autre part.

La comparaison des distributions par langue maternelle de la population couplée avec la population totale au recensement fournit une approximation de la représentativité de la population couplée selon la langue maternelle. Le tableau A2.3 laisse voir que les distributions par langue maternelle des populations couplées entre 2001 et 2006 sont semblables à celles du recensement de 2001Note 26. Entre autres, on constate que le pourcentage des réponses multiples est plus faible à partir du questionnaire détaillé qu’à partir du questionnaire abrégé que ce soit dans la population couplée ou dans la population totale recensée. On voit également que la population de langue maternelle « autre », tant dans la population totale que dans la population des personnes appariées, est plus importante à partir du questionnaire détaillé qu’à partir du questionnaire abrégé.

On note aussi un certain nombre de différences entre les distributions par langue maternelle dans la population des personnes appariées et dans la population totale recensée. D’après les données tirées du questionnaire abrégé, la proportion de réponses multiples est légèrement plus faible dans la population des personnes appariées que dans la population totale recensée. Une autre différence tient aux deux couplages à partir du questionnaire détaillé en 2001 dont les distributions par langue maternelle présentent des écarts non négligeables. La population des personnes appariées parmi celles ayant répondu aux questionnaires détaillés de 2001 et de 2006 compte un pourcentage plus faible de langue maternelle « autre » et un pourcentage plus élevé de langue maternelle française que la population des personnes appariées parmi celles ayant répondu au questionnaire détaillé en 2001 et abrégé en 2006, dont la distribution par langue maternelle s’apparente davantage à celle observée à partir du questionnaire détaillé du Recensement de 2001.

Quant au couplage 2006-2011, le tableau A2.4 rend compte du fait que la proportion de la population de langue maternelle « autre » en 2006 parmi la population des personnes appariées est de 14,4 % alors qu’au recensement correspondant ce pourcentage atteint 16 %. La différence de 1,6 point de pourcentage correspond, en termes relatifs, à un écart de 10 %. Un écart semblable s’observe pour la population ayant déclaré le français comme langue maternelle dans le questionnaire abrégé en 2006 (soit 22,9 % contre 21,4 % au Recensement de 2006).

La population des personnes de langue maternelle anglaise appariées est également surreprésentée par rapport au recensement correspondant dans les deux couplages tandis que la population des personnes de langue maternelle française appariées est sous-représentée en 2001, mais surreprésentée en 2006. La population « autre » couplée est sous-représentée par rapport au recensement correspondant sauf dans le cas du questionnaire détaillé de 2001 où elle est surreprésentée.

Plusieurs facteurs d’inclusion des répondants dans les couplages peuvent exercer une influence sur la représentativité de la population couplée : par exemple le lien avec la personne 1, le niveau d’éducation, la mobilité géographique ou le caractère récent de l’arrivée au pays dans le cas des immigrants.

Annexe 3

La figure A3.1 permet de constater que le taux net de changement de réponse multiple parmi les personnes ayant rempli le même questionnaire en 2001 et 2006 est beaucoup plus faible que chez ceux ayant rempli un questionnaire différent. Ce taux est également plus faible parmi la population ayant rempli un questionnaire détaillé.

On observe 77 % moins de déclarations de réponse multiple chez les personnes ayant répondu au questionnaire détaillé en 2006 après avoir répondu au questionnaire abrégé en 2001. À l’inverse, lorsque les personnes ont répondu au questionnaire détaillé en 2001 et qu’ils doivent remplir un questionnaire abrégé en 2006, le nombre de réponses multiples s’accroît de 158 %. L’ampleur de cette hausse nette s’explique en bonne partie par le fait que les réponses multiples sont beaucoup moins nombreuses dans le questionnaire détaillé que dans le questionnaire abrégé.

Quant aux taux nets observés entre 2006 et 2011, on constate que parmi les personnes ayant répondu au Recensement de 2011 après avoir répondu au questionnaire abrégé de 2006, le taux de réponse multiple diminue de 51 % alors qu’il s’accroît de 34 % parmi les personnes ayant répondu au questionnaire détaillé cinq ans auparavant. En d’autres termes, le Recensement de 2011 tend à surestimer les réponses multiples comparativement au questionnaire détaillé, mais permet de réduire l’incidence de ces réponses en comparaison du questionnaire abrégé.

Note aux lecteurs

Arrondissement aléatoire et répartitions en pourcentage : Afin de protéger le caractère confidentiel des renseignements recueillis lors du Recensement de 2011 tout en maintenant la qualité des résultats, on applique une méthode qui consiste à arrondir de façon aléatoire les valeurs présentées dans les cellules individuelles. Par conséquent, lorsque ces données sont totalisées ou regroupées, la valeur totale peut ne pas correspondre à la somme des valeurs individuelles, étant donné que le total et les totaux partiels sont arrondis séparément. De même, la somme des répartitions en pourcentage, qui sont calculées à partir de données arrondies, ne correspond pas nécessairement à 100 %.

En raison de l'arrondissement aléatoire, les chiffres et les pourcentages peuvent varier légèrement d'un produit du recensement à un autre, comme les documents analytiques, les faits saillants en tableaux et les tableaux thématiques.

Remerciements

Le présent document méthodologique a été rédigé par René Houle et Jean-Pierre Corbeil de la Division de la statistique sociale et autochtone de Statistique Canada en collaboration avec François Nault, directeur de la même division, ainsi que des membres du personnel du Secrétariat des domaines spécialisés du recensement, de la Division des opérations du recensement, de la Division de la diffusion et de la Division des communications de Statistique Canada.

Date de modification :