Longtemps parent pauvre de l’enseignement mathématique, les statistiques ne figurent plus qu’à l’état de trace dans les nouveaux programmes. Pourtant, la multiplication des données dans l’information rend, plus que jamais, indispensable leur compréhension.
À l’heure du big data et de l’intelligence artificielle, les possibilités d’automatisation de la collecte des données et de leur traitement se multiplient. Elles ne vont pas sans poser de réelles questions : politiques (que faire de ces données ?), économiques (comment et par qui sont-elles exploitées ?), juridiques (à qui appartiennent-elles ?). Des questions qu’il serait peut-être nécessaire d’intégrer dans une approche globale de la statistique.
L’enseignement des statistiques à l’abandon
Au collège et en Seconde, les élèves sont initiés à quelques outils de la statistique descriptive (moyenne, type…), qui sont abordés par le biais de l’écriture d’un programme simulant une expérience aléatoire – le lancer de dés reste un classique – et calculant la moyenne et l’écart type. Exit donc ce qui faisait dans les anciens programmes l’intérêt mathématique de l’enseignement des statistiques : l’échantillonnage – support des sondages – et les principes du contrôle de qualité. La réflexion sur les objectifs et interprétations des calculs statistiques est pauvre, réduite, en Seconde, à la « description verbale des différences entre deux séries statistiques en s’appuyant sur les indicateurs ou les représentations graphiques ». La statistique débouche très rapidement sur la seule notion qui semble intéresser vraiment les concepteurs des programmes : la fréquence, déjà étudiée en collège, qui, en lien avec la programmation sur ordinateur ou calculatrice, permet d’aborder la loi des grands nombres et d’introduire les probabilités.
En Première et Terminale, les contenus ont été très appauvris. Par ailleurs, depuis la réforme, tous les élèves n’ont pas accès à un enseignement de mathématiques. Le choix d’un enseignement de SVT ou SES sans mathématiques accroît les difficultés pour un élève qui aura du mal avec les outils les plus élémentaires de ces deux disciplines. Dans les nouveaux programmes de spécialité en mathématiques, les statistiques ont disparu en Terminale. En Première, si un chapitre y est consacré, il ne traite que de probabilités…
Lecture, interprétation, critique
Pour une réelle compréhension des enjeux, il ne suffit pas de confronter les élèves à des séries statistiques réelles, issues des sciences, de l’économie, de la sociologie pour produire du sens.
Les statistiques sont un outil de compréhension de la réalité sociale. En SES, en particulier, lire et manier les données publiées, notamment les « taux » qui apparaissent en permanence dans le débat public, les graphiques, les tableaux statistiques, les indices… constituent un objectif central et, en tant que tel, évalué au bac.
Les données inondent l’information mais ne sont pas toujours clairement expliquées ni comprises par tous de la même façon. Affirmer par exemple que la dépense publique représente 56 % du PIB ne veut tout simplement rien dire, même si le calcul est juste. Beaucoup comprendront qu’en conséquence la dépense privée n’est que de 44 %, ce qui est faux. Ce qui est dépensé par les uns (l’État) représente un revenu pour d’autres, conséquence, la dépense (notion plus ou moins abandonnée en comptabilité nationale) excède largement le PIB équivalent à l’ensemble des revenus versés en France. La comparaison très fréquente entre la dette publique et le PIB souffre de la même imprécision.
La formation du citoyen exige tout autant une capacité à décrypter l’information chiffrée. Savoir par exemple que les sondages par internet présentent d’énormes biais d’échantillonnage, que l’élaboration des questionnaires n’est jamais neutre… permet de faire du tri dans l’information, de relativiser et de contextualiser : des compétences nécessaires à l’exercice de la citoyenneté.
La réflexion sur les déterminismes sociaux et les trajectoires individuelles pose les mêmes difficultés de compréhension et d’interprétation des données. Les statistiques sur les écarts de réussite à l’école selon l’origine sociale peuvent être difficiles à comprendre et à accepter. La confusion entre régularité statistique et déterminisme absolu est fréquente. Souvent, les élèves estiment qu’il suffit de connaître un enfant d’ouvrier ayant connu une brillante carrière scolaire ou, à l’inverse, un enfant de médecin ayant suivi une filière professionnelle pour remettre en cause les données et les inégalités qu’elles révèlent. Par ailleurs, les statistiques sont interprétées, dans certains cas, comme une prédiction qui s’applique à tous les élèves, difficile à entendre pour des élèves issus des milieux populaires interdits ainsi, par les statistiques¸ de toute promotion sociale.
Epidémiologie et statistiques
Pour les sciences de la vie, les statistiques constituent aussi un outil puissant d’analyse. La compréhension, même sommaire, de la fabrication d’un modèle mathématique, construit sur la base de séries statistiques, utilisé en épidémiologie, est nécessaire à la participation au débat démocratique autour de la pandémie. Les notions d’hypothèses et de modélisation sont au cœur de ces polémiques, sans parler de la notion mathématique d’exponentielle…
De même que les indicateurs qui permettent d’estimer les marges d’erreur des résultats obtenus. La taille d’un échantillon de patients, sa composition selon divers paramètres (âge, sexe, état de santé au moment de l’infection, etc.) déterminent la fiabilité des résultats. Le caractère représentatif de l’échantillon dépend donc de nombreuses variables, et seule une étude statistique permet de déterminer sur quel échantillonnage s’appuyer pour vérifier une hypothèse.
Certains résultats peuvent être différents mais avec une marge d’erreur telle que la différence n’est pas significative. Les commentaires disséquant les avantages de telle ou telle politique sanitaire alors que les résultats ne sont pas significativement différents sont au mieux dénués d’intérêt, au pire dommageables.
Les notions de valeur et de différence significatives, l’esprit critique quant à la qualité des données et l’usage qui peut en être fait n’ont rien d’intuitif tant l’esprit humain cherche à conforter ses représentations davantage qu’à les mettre en question.
Les programmes scolaires devraient en tenir compte et les horaires s’adapter à une formation aux statistiques indispensables à des citoyens libres et conscients.
Attention aux « chiffres » Dire que le taux de chômage des jeunes de 15 à 24 ans est de plus de 20 %, peut laisser penser que plus de 20 % des jeunes sont au chômage, alors que 63 % d’entre eux ne sont pas actifs puisqu’ils sont scolarisés. Au total, seuls 7,4 % des 18-24 sont au chômage. Dire que 37 % des ouvriers ont voté RN aux dernières présidentielles et 36 % des retraités pour François Fillon n’a pas le même sens car si on s’intéresse aux inscrits, donc en prenant en compte les abstentionnistes bien plus nombreux chez les ouvriers que chez les retraités, 26,2 % des ouvriers ont voté RN et 31,3 % des retraités pour F. Fillon. Sans parler des non-inscrits, plus rares chez les retraités que chez les ouvriers, et difficiles à évaluer. Dire que le salaire moyen avoisine les 1 800 euros en 2018 est vrai mais insuffisant si on ne précise pas qu’il intègre les temps partiels. Il faut donc corriger cette donnée pour arriver au salaire moyen pour un équivalent temps plein, qui est de 2 369 €. C’est dans ces exercices que l’acquisition de la notion de moyenne pondérée est nécessaire. |
Article paru dans l’US Mag d’avril 2021 disponible en ligne
Le SNES-FSU propose des des outils, des analyses, des références, pour réfléchir à ses pratiques, décrypter votre quotidien professionnel. Vous trouverez sur ce site des témoignages, des travaux de chercheurs, des analyses des pratiques professionnelles etc.
Des remarques, des questions ?
Contactez nous : contenus@snes.edu et metier@snes.edu