
COURS DE STATISTIQUE, 2ÈME ANNÉE DES HUMANITÉS SCIENTIFIQUES
Edition 2025 / Enseignement primaire, secondaire et technique en RDC
PRÉLIMINAIRES
I. Présentation du cours 📜
Ce cours de statistique de deuxième année approfondit les méthodes de l’analyse descriptive et quantitative des données. S’appuyant sur les acquis de l’année précédente, le programme est conçu pour développer une maîtrise experte des paramètres de position et de dispersion, ainsi que des techniques de représentation graphique. Il vise à transformer l’élève en un analyste capable de mener une enquête statistique rigoureuse, d’interpréter critiquement des résultats et de communiquer ses conclusions de manière claire et professionnelle.
II. Objectifs généraux 🎯
L’objectif fondamental est de doter l’élève des compétences nécessaires pour synthétiser, analyser et comparer des distributions statistiques complexes. Au terme de ce cours, il devra être capable de calculer et d’interpréter l’ensemble des indicateurs de tendance centrale et de variabilité, de choisir la représentation graphique la plus pertinente pour chaque type de données, et d’appliquer ces outils à l’analyse de phénomènes concrets issus des sciences, de l’économie et de la sociologie.
III. Compétences visées 🧠
Ce programme vise à forger des compétences avancées en littératie statistique. L’élève apprendra à planifier et à exécuter les différentes phases d’une enquête, à calculer des paramètres pour des données groupées, à comparer l’homogénéité de différentes séries à l’aide du coefficient de variation, et à utiliser des outils informatiques pour le traitement et la visualisation des données.
IV. Méthode d’évaluation 📝
L’évaluation sera axée sur l’application pratique et l’analyse critique. Elle s’appuiera sur des études de cas où les élèves devront analyser des jeux de données réelles, des projets de mini-enquêtes menés en groupe, et des examens semestriels. Ces derniers comporteront des problèmes de synthèse exigeant la comparaison de distributions, comme l’analyse de la performance économique de deux secteurs d’activité dans la province du Kongo Central.
V. Matériel requis 💻
La maîtrise des concepts de ce cours est optimisée par l’usage d’outils technologiques. Une calculatrice scientifique avec des fonctions statistiques avancées est indispensable. L’accès régulier à un ordinateur équipé d’un logiciel tableur (tel que Microsoft Excel) est essentiel pour la manipulation de données, le calcul automatisé des paramètres et la création de graphiques de qualité.
PREMIÈRE PARTIE : FONDEMENTS DE LA STATISTIQUE DESCRIPTIVE
Cette partie établit les bases conceptuelles de la statistique descriptive et développe les compétences de collecte, d’organisation et de présentation des données. Elle initie les élèves aux méthodes d’enquête statistique, aux techniques de classification des données et aux principes de construction des tableaux statistiques, établissant les fondements nécessaires à l’analyse quantitative des phénomènes. 📊
CHAPITRE 1 : INTRODUCTION À LA STATISTIQUE
Ce chapitre consolide le vocabulaire et les concepts fondamentaux de la démarche statistique.
1.1 Définitions et domaines d’application de la statistique
La statistique est présentée comme une science de la décision en présence d’incertitude. Ses applications dans divers domaines en RDC sont mises en avant : santé publique, gestion des ressources naturelles, planification économique.
1.2 Population, échantillon et unité statistique
Les définitions de population, échantillon et unité statistique sont approfondies, en insistant sur l’importance de la représentativité de l’échantillon pour la validité des conclusions.
1.3 Variables statistiques et leurs types
La classification des variables (qualitatives, quantitatives discrètes et continues) est revue et appliquée à des exemples complexes.
1.4 Phases d’une enquête statistique
Les étapes d’une enquête statistique rigoureuse sont détaillées : définition des objectifs, élaboration du questionnaire, collecte des données, traitement et analyse, et enfin, interprétation des résultats.
CHAPITRE 2 : COLLECTE ET ORGANISATION DES DONNÉES
Ce chapitre se concentre sur les techniques de structuration des données brutes en vue de leur analyse.
2.1 Méthodes de collecte des données
Les avantages et inconvénients des différentes méthodes de collecte (questionnaires, entretiens, observations) sont discutés, ainsi que les sources de données secondaires comme les rapports de l’Institut National de la Statistique (INS) de la RDC.
2.2 Dépouillement et contrôle des données
Les techniques de dépouillement manuel ou informatisé sont présentées. L’étape cruciale du contrôle des données pour identifier et corriger les erreurs de saisie ou les incohérences est soulignée.
2.3 Classification et regroupement en classes
Les règles pour le regroupement de données quantitatives en classes (règle de Sturges, choix du nombre de classes, détermination de l’amplitude) sont formalisées pour permettre une représentation claire et non biaisée.
2.4 Construction des tableaux statistiques
La construction de tableaux de distribution de fréquences pour tous les types de variables est systématisée, en respectant les normes de présentation (titre, source, unités).
CHAPITRE 3 : EFFECTIFS ET FRÉQUENCES
Ce chapitre approfondit l’étude des mesures de base de la distribution des données.
3.1 Effectifs absolus et effectifs cumulés
La distinction entre effectif absolu et effectif cumulé (croissant et décroissant) est maîtrisée. Le calcul et l’interprétation des effectifs cumulés sont exercés.
3.2 Fréquences relatives et fréquences cumulées
Le calcul des fréquences relatives et cumulées est systématisé. Leur utilité pour comparer des distributions d’effectifs totaux différents est mise en évidence.
3.3 Densité de fréquence pour les classes
Pour les classes d’amplitudes inégales, la notion de densité de fréquence (ou de correction) est introduite comme une nécessité pour la construction correcte de l’histogramme.
3.4 Propriétés et vérifications des fréquences
Les propriétés fondamentales (la somme des fréquences relatives est égale à 1) sont utilisées comme un moyen de vérifier la cohérence des calculs.
CHAPITRE 4 : REPRÉSENTATIONS GRAPHIQUES
Ce chapitre perfectionne la compétence de communication visuelle de l’information statistique.
4.1 Diagrammes en bâtons et histogrammes
La construction de l’histogramme est détaillée, en insistant sur la représentation des effectifs par les aires des rectangles, particulièrement dans le cas de classes d’amplitudes inégales.
4.2 Diagrammes circulaires et semi-circulaires
Les règles de construction et les contextes d’utilisation appropriés pour les diagrammes circulaires et leurs variantes sont discutés.
4.3 Polygones des effectifs et des fréquences
Le polygone des fréquences et la courbe cumulative (ogive de Galton) sont construits et interprétés. L’ogive est présentée comme un outil graphique pour la détermination de la médiane et des quartiles.
4.4 Choix et construction des graphiques appropriés
Les élèves apprennent à choisir le type de graphique le plus pertinent en fonction de la nature de la variable et de l’objectif de la communication, en évitant les représentations trompeuses.
DEUXIÈME PARTIE : PARAMÈTRES DE POSITION ET ANALYSE DES DISTRIBUTIONS
Cette partie développe l’étude des caractéristiques de position des distributions statistiques, explorant les mesures de tendance centrale et leurs propriétés. Elle approfondit les techniques de calcul des moyennes, médiane et mode, et leur utilisation dans l’analyse et l’interprétation des données statistiques selon différents contextes. 🎯
CHAPITRE 5 : MESURES DE TENDANCE CENTRALE
Ce chapitre explore les différents indicateurs permettant de résumer une série de données par une seule valeur « typique ».
5.1 Mode et classe modale
Le mode est défini comme la valeur la plus fréquente. Pour les données continues, la classe modale est identifiée et le mode est déterminé par interpolation graphique ou par calcul.
5.2 Médiane et quartiles
La médiane, qui divise la série en deux, et les quartiles (Q1, Q3), qui la divisent en quatre, sont étudiés comme des indicateurs de position robustes.
5.3 Moyenne arithmétique simple et pondérée
Le calcul de la moyenne arithmétique est consolidé, en insistant sur la formule de la moyenne pour des données groupées.
5.4 Comparaison et choix des mesures de tendance centrale
Les avantages et inconvénients de chaque paramètre sont discutés. La moyenne est sensible aux valeurs extrêmes, la médiane y est insensible, et le mode est le seul applicable aux données qualitatives. Le choix dépend de la forme de la distribution et de l’objectif de l’analyse.
CHAPITRE 6 : CALCULS DE LA MOYENNE
Ce chapitre se focalise sur les différentes formes de moyennes et leurs propriétés.
6.1 Moyenne arithmétique des données brutes
La méthode de calcul pour une série simple est revue et appliquée à des cas concrets.
6.2 Moyenne des données groupées en classes
Le calcul de la moyenne pour des données continues groupées en classes est détaillé, en utilisant le centre de chaque classe comme valeur représentative.
6.3 Propriétés algébriques de la moyenne
Les propriétés de la moyenne (linéarité, nullité de la somme des écarts) sont démontrées et leur utilité pour simplifier les calculs est montrée.
6.4 Moyenne géométrique et moyenne harmonique
D’autres types de moyennes sont introduits pour des situations spécifiques : la moyenne géométrique pour les taux de croissance et la moyenne harmonique pour les vitesses moyennes.
CHAPITRE 7 : CALCULS DE LA MÉDIANE ET DES QUARTILES
Ce chapitre détaille les méthodes de détermination des quantiles.
7.1 Médiane des séries simples et groupées
Le calcul de la médiane est systématisé pour les données discrètes et continues.
7.2 Calcul par interpolation linéaire
La formule de l’interpolation linéaire pour le calcul de la médiane et des quartiles dans le cas de données groupées en classes est établie et appliquée.
7.3 Premier et troisième quartiles
Les méthodes de calcul de Q1 et Q3 sont détaillées, en parallèle de celles de la médiane.
7.4 Interprétation et applications des quartiles
Les quartiles sont utilisés pour décrire la répartition des données et pour identifier les valeurs atypiques. Ils sont à la base de la construction de la boîte à moustaches.
CHAPITRE 8 : ANALYSE ET COMPARAISON DES DISTRIBUTIONS
Ce chapitre utilise les paramètres de position pour caractériser et comparer des séries de données.
8.1 Comparaison de distributions par les paramètres de position
Des distributions sont comparées en analysant les différences entre leurs moyennes, médianes et modes.
8.2 Avantages et inconvénients de chaque mesure
Une synthèse est faite pour guider l’analyste dans le choix de l’indicateur le plus pertinent pour résumer ses données.
8.3 Distributions symétriques et asymétriques
La relation entre la moyenne, la médiane et le mode est utilisée pour caractériser la symétrie d’une distribution. Si moyenne = médiane = mode, la distribution est symétrique.
8.4 Applications à l’analyse de phénomènes concrets
Les compétences sont appliquées à l’analyse comparative de données, par exemple en comparant les résultats scolaires de deux écoles de la ville de Mbandaka.
TROISIÈME PARTIE : PARAMÈTRES DE DISPERSION ET VARIABILITÉ
Cette partie explore les mesures de variabilité et de dispersion des données statistiques, développant les concepts d’étendue, d’écart-type et de variance. Elle analyse les méthodes de calcul de ces paramètres et leur utilisation dans l’évaluation de l’homogénéité des distributions et la comparaison des séries statistiques. ↔️
CHAPITRE 9 : MESURES DE DISPERSION ABSOLUE
Ce chapitre introduit les indicateurs qui mesurent l’étalement des données dans la même unité que la variable.
9.1 Étendue et amplitude totale
L’étendue est rappelée comme la mesure la plus simple de la dispersion. Ses limites (sensibilité aux valeurs extrêmes) sont soulignées.
9.2 Écart interquartile et écart semi-interquartile
L’écart interquartile (Q3 – Q1) est présenté comme une mesure de dispersion robuste, car il n’est pas affecté par les valeurs extrêmes.
9.3 Écart moyen absolu
L’écart moyen absolu est défini comme la moyenne des valeurs absolues des écarts à la moyenne. Il donne une mesure de la dispersion moyenne des observations.
9.4 Applications et interprétations des mesures de dispersion
L’interprétation de ces mesures est centrale : elles quantifient le degré d’hétérogénéité d’une série et la représentativité des paramètres de tendance centrale.
CHAPITRE 10 : VARIANCE ET ÉCART-TYPE
Ce chapitre se concentre sur les mesures de dispersion les plus fondamentales en statistique.
10.1 Définition et propriétés de la variance
La variance est définie comme la moyenne du carré des écarts à la moyenne. Ses propriétés mathématiques, notamment la formule de Koenig-Huygens pour simplifier le calcul, sont étudiées.
10.2 Calcul de la variance des données brutes et groupées
Les méthodes de calcul de la variance sont détaillées pour les séries simples et pour les données groupées en classes.
10.3 Écart-type et ses propriétés
L’écart-type, racine carrée de la variance, est introduit. Son interprétation comme une « distance » typique des observations par rapport à la moyenne est mise en avant.
10.4 Formules simplifiées et méthodes de calcul
Des formules de calcul alternatives et des astuces, comme le changement d’origine et d’unité, sont présentées pour faciliter le calcul manuel de la variance.
CHAPITRE 11 : COEFFICIENT DE VARIATION
Ce chapitre introduit une mesure relative de la dispersion.
11.1 Définition du coefficient de variation
Le coefficient de variation (CV) est défini comme le rapport de l’écart-type à la moyenne, généralement exprimé en pourcentage.
11.2 Calcul et interprétation du coefficient de variation
Le CV mesure la dispersion relative des données. Un CV faible indique une série homogène, tandis qu’un CV élevé indique une forte dispersion.
11.3 Comparaison d’homogénéité entre distributions
Le CV, étant sans dimension, est l’outil idéal pour comparer la variabilité de deux séries qui n’ont pas la même unité ou le même ordre de grandeur.
11.4 Applications aux études comparatives
Le CV est appliqué pour comparer, par exemple, la variabilité des prix du cuivre (en dollars) et du maïs (en francs congolais) sur les marchés de Lubumbashi.
CHAPITRE 12 : ANALYSE DE LA VARIABILITÉ
Ce chapitre synthétise l’utilisation conjointe des différents indicateurs pour une analyse complète de la variabilité.
12.1 Interprétation des mesures de dispersion
Une discussion approfondie est menée sur ce que chaque mesure de dispersion révèle sur la structure d’un ensemble de données.
12.2 Relation entre paramètres de position et de dispersion
L’analyse conjointe de la moyenne et de l’écart-type permet de mieux comprendre la distribution des données.
12.3 Distributions normales et règle empirique
Pour les distributions en forme de cloche (loi normale), la règle empirique (68-95-99.7) est introduite pour interpréter l’écart-type en termes de proportion de données.
12.4 Applications pratiques de l’analyse de variabilité
L’analyse de la variabilité est appliquée à des problèmes de contrôle de qualité dans la production ou à l’évaluation du risque en finance.
QUATRIÈME PARTIE : APPLICATIONS PRATIQUES ET INTERPRÉTATION STATISTIQUE
Cette partie développe les compétences d’application pratique des outils statistiques dans des contextes réels et l’interprétation critique des résultats. Elle explore l’utilisation des technologies dans le traitement statistique, la présentation des résultats et les techniques de communication des analyses statistiques dans différents domaines d’application. 🚀
CHAPITRE 13 : ÉTUDES STATISTIQUES APPLIQUÉES
Ce chapitre met en œuvre la démarche statistique complète sur des cas concrets.
13.1 Application à des données économiques et sociales
Les élèves analysent des données réelles sur le chômage, l’inflation ou le niveau de vie, en calculant les indicateurs pertinents et en interprétant les résultats.
13.2 Analyse statistique de phénomènes scientifiques
La statistique descriptive est appliquée à des données expérimentales en biologie, chimie ou physique, pour résumer les résultats de mesures et évaluer leur variabilité.
13.3 Traitement de données démographiques
L’analyse de la structure par âge d’une population (pyramide des âges) ou le calcul de taux de natalité et de mortalité sont abordés à partir de données démographiques de la RDC.
13.4 Études de cas et projets statistiques
Les élèves mènent, en groupe, un projet statistique complet sur un sujet de leur choix, de la formulation de la problématique à la présentation finale des résultats.
CHAPITRE 14 : OUTILS INFORMATIQUES ET PRÉSENTATION
Ce chapitre se concentre sur l’utilisation des outils numériques pour l’analyse statistique.
14.1 Utilisation de tableurs pour les calculs statistiques
Les fonctions statistiques intégrées dans un tableur comme Excel sont utilisées pour automatiser le calcul des paramètres de position et de dispersion.
14.2 Construction de graphiques avec les outils informatiques
La création de graphiques de qualité professionnelle (histogrammes, diagrammes circulaires, boîtes à moustaches) à l’aide d’un tableur est enseignée.
14.3 Présentation et communication des résultats
Les règles pour une communication efficace des résultats statistiques sont présentées : clarté des graphiques, pertinence des commentaires, objectivité de l’interprétation.
14.4 Rédaction de rapports d’analyse statistique
La structure type d’un rapport statistique est détaillée, incluant l’introduction, la méthodologie, la présentation des résultats et la conclusion.
ANNEXES
Annexe I : Tables statistiques et formules de calcul 📊
Cette annexe regroupe un formulaire complet des formules de statistique descriptive et des tables numériques de référence qui seront utiles pour les cours ultérieurs.
Annexe II : Méthodes de construction des graphiques 📈
Un guide visuel rappelle les règles de construction pour chaque type de graphique statistique, assurant le respect des conventions et la clarté de la représentation.
Annexe III : Applications numériques et exercices types 🧮
Une série d’exercices corrigés est proposée, couvrant tous les chapitres du cours et servant de base pour l’entraînement et l’auto-évaluation.