
COURS DE STATISTIQUE, 1ÈRE ANNÉE DES HUMANITÉS SCIENTIFIQUES
Edition 2025 / Enseignement primaire, secondaire et technique en RDC
PRÉLIMINAIRES
I. Présentation du cours 📜
Ce cours de statistique constitue une introduction rigoureuse à la science de la collecte, de l’analyse, de l’interprétation et de la présentation des données. Conçu pour les élèves des humanités scientifiques, il vise à développer une pensée quantitative et critique, indispensable pour comprendre les phénomènes complexes dans les domaines scientifiques, économiques et sociaux. Le programme s’ancre dans des exemples concrets tirés de la réalité congolaise pour rendre les concepts directement applicables.
II. Objectifs généraux 🎯
L’objectif fondamental est de permettre à l’élève de maîtriser les outils de la statistique descriptive pour résumer et visualiser des ensembles de données. Au terme de ce cours, il devra être capable d’organiser des données brutes, de calculer les indicateurs de tendance centrale et de dispersion, de construire des représentations graphiques pertinentes et de s’initier aux concepts fondamentaux de la probabilité.
III. Compétences visées 🧠
Ce programme vise à forger des compétences analytiques solides. L’élève apprendra à définir une population et à choisir un échantillon représentatif, à construire et interpréter des tableaux et des graphiques statistiques, à choisir les paramètres de synthèse les plus appropriés pour décrire une distribution, et à appliquer les règles de base du calcul des probabilités pour modéliser des situations aléatoires simples.
IV. Méthode d’évaluation 📝
L’évaluation des acquis sera continue et orientée vers la résolution de problèmes. Elle comprendra des exercices d’application pour vérifier la maîtrise des techniques de calcul, des projets d’enquête statistique à petite échelle pour évaluer la démarche méthodologique, et des examens semestriels. Ces derniers intégreront des études de cas basées sur des données réelles, comme l’analyse de la production agricole d’une province ou l’étude de statistiques démographiques de la ville de Matadi.
V. Matériel requis 💻
Pour une assimilation efficace des concepts, ce cours requiert l’utilisation d’outils de calcul appropriés. Une calculatrice scientifique dotée de fonctions statistiques est indispensable. L’accès à un logiciel tableur (comme Microsoft Excel) est fortement recommandé pour le traitement de séries de données plus importantes et la construction de graphiques de qualité professionnelle.
PREMIÈRE PARTIE : INTRODUCTION À LA STATISTIQUE DESCRIPTIVE
Cette partie établit les fondements conceptuels de la statistique et développe le vocabulaire de base nécessaire à l’analyse des données. Elle présente les outils fondamentaux de collecte et d’organisation des données statistiques, initiant les élèves aux méthodes d’observation scientifique et à la rigueur méthodologique indispensable dans l’approche quantitative des phénomènes. 📊
CHAPITRE 1 : CONCEPTS FONDAMENTAUX DE LA STATISTIQUE
Ce chapitre introduit le langage et les concepts clés qui structurent la pensée statistique.
1.1 Définitions et terminologie statistique
La statistique est définie comme un ensemble de méthodes permettant de décrire quantitativement des ensembles nombreux. La distinction entre la statistique descriptive (résumer l’information) et la statistique inférentielle (généraliser à partir d’un échantillon) est établie.
1.2 Population et échantillon
La population est définie comme l’ensemble de tous les individus ou objets sur lesquels porte l’étude. L’échantillon est un sous-ensemble de la population, qui doit être représentatif pour permettre des conclusions valides.
1.3 Variables et caractères statistiques
Une variable statistique (ou caractère) est une caractéristique étudiée au sein de la population. La distinction fondamentale entre les variables qualitatives (décrivant une qualité, ex: couleur) et quantitatives (mesurant une quantité, ex: taille) est expliquée.
1.4 Modalités et valeurs
Les modalités sont les différentes formes que peut prendre une variable qualitative. Les valeurs sont les résultats numériques d’une variable quantitative. Les variables quantitatives sont elles-mêmes divisées en discrètes (valeurs isolées) et continues (valeurs dans un intervalle).
CHAPITRE 2 : COLLECTE ET ORGANISATION DES DONNÉES
Ce chapitre se concentre sur les étapes pratiques de l’acquisition et de la structuration des données brutes.
2.1 Méthodes de collecte des données
Les différentes méthodes de collecte sont présentées : le recensement (étude de toute la population), le sondage (étude d’un échantillon), l’observation directe et l’enquête par questionnaire.
2.2 Tableaux statistiques
Le tableau statistique est présenté comme l’outil principal pour organiser et synthétiser les données brutes. Sa structure (titre, colonnes, lignes, source) est normalisée pour assurer une lecture claire.
2.3 Effectifs et fréquences
L’effectif d’une modalité ou d’une valeur est le nombre de fois où elle apparaît. La fréquence (relative) est le rapport de cet effectif à l’effectif total, souvent exprimée en pourcentage pour faciliter les comparaisons.
2.4 Classes et regroupements
Pour les variables quantitatives continues ou discrètes à grand nombre de valeurs, la technique du regroupement en classes (intervalles) est enseignée pour simplifier l’analyse et la représentation des données.
CHAPITRE 3 : REPRÉSENTATIONS GRAPHIQUES ÉLÉMENTAIRES
Ce chapitre explore les techniques de visualisation qui permettent de communiquer l’information contenue dans les données de manière intuitive.
3.1 Diagrammes en barres et en bâtons
Le diagramme en bâtons est utilisé pour représenter des variables quantitatives discrètes, tandis que le diagramme en barres est utilisé pour les variables qualitatives. Les règles de construction (axes, légendes) sont précisées.
3.2 Diagrammes circulaires
Le diagramme circulaire (ou « camembert ») est utilisé pour visualiser la répartition des effectifs d’une variable qualitative, où l’angle de chaque secteur est proportionnel à la fréquence de la modalité.
3.3 Histogrammes simples
L’histogramme est la représentation graphique appropriée pour une variable quantitative continue regroupée en classes. L’aire de chaque rectangle y est proportionnelle à l’effectif de la classe.
3.4 Courbes des effectifs cumulés
La courbe des effectifs cumulés (ou polygone des fréquences cumulées) est construite pour visualiser la progression des effectifs et permet de déterminer graphiquement certains paramètres de position comme la médiane.
DEUXIÈME PARTIE : PARAMÈTRES DE TENDANCE CENTRALE
Cette partie développe les outils de mesure qui permettent de caractériser le centre d’une distribution statistique. Elle approfondit les concepts de moyenne, médiane et mode en tant qu’indicateurs essentiels pour décrire et comparer des ensembles de données, préparant ainsi les élèves à l’interprétation quantitative des phénomènes étudiés. 🎯
CHAPITRE 4 : LA MOYENNE ARITHMÉTIQUE
Ce chapitre se concentre sur le paramètre de tendance centrale le plus utilisé et le plus intuitif.
4.1 Définition et calcul de la moyenne simple
La moyenne arithmétique simple est définie comme la somme des valeurs d’une série divisée par le nombre de ces valeurs. Sa méthode de calcul pour des données brutes est enseignée.
4.2 Moyenne pondérée
La moyenne pondérée est introduite pour les situations où les valeurs ont des « poids » (coefficients) différents. C’est la méthode utilisée pour calculer la moyenne des notes dans un bulletin scolaire.
4.3 Propriétés de la moyenne arithmétique
Les propriétés mathématiques de la moyenne sont étudiées, notamment sa sensibilité aux valeurs extrêmes (aberrantes), ce qui constitue sa principale limite.
4.4 Applications et interprétations
La moyenne est appliquée pour calculer des indicateurs concrets, comme la production agricole moyenne par hectare dans la province du Kwilu ou le revenu mensuel moyen d’un ménage à Kinshasa.
CHAPITRE 5 : LA MÉDIANE
Ce chapitre présente la médiane comme une mesure de position robuste, moins sensible aux valeurs extrêmes que la moyenne.
5.1 Définition et détermination de la médiane
La médiane est définie comme la valeur qui partage une série statistique, ordonnée par ordre croissant, en deux sous-ensembles de même effectif.
5.2 Médiane pour les variables discrètes
La méthode de détermination de la médiane est détaillée, en distinguant le cas où l’effectif total est pair de celui où il est impair.
5.3 Médiane pour les variables continues
Pour les données groupées en classes, la médiane est déterminée par interpolation linéaire (calcul) ou graphiquement à l’aide de la courbe des effectifs cumulés.
5.4 Comparaison avec la moyenne
La comparaison entre la moyenne et la médiane permet d’obtenir des informations sur la symétrie de la distribution. Dans une distribution asymétrique, la médiane est souvent un meilleur indicateur de la tendance centrale.
CHAPITRE 6 : LE MODE ET AUTRES MESURES DE POSITION
Ce chapitre explore d’autres indicateurs qui complètent l’analyse de la tendance centrale et de la position au sein d’une distribution.
6.1 Définition et détermination du mode
Le mode est défini comme la modalité ou la valeur de la variable qui a l’effectif le plus élevé. C’est la seule mesure de tendance centrale applicable aux variables qualitatives.
6.2 Distributions unimodales et multimodales
Une distribution peut être unimodale (un seul mode), bimodale (deux modes) ou multimodale, ce qui peut révéler la présence de sous-populations hétérogènes.
6.3 Quartiles et déciles
Les quartiles (qui partagent la série en quatre parties égales) et les déciles (en dix parties égales) sont introduits comme des mesures de position qui permettent d’affiner la description de la distribution des données.
6.4 Rang et percentiles
La notion de percentile est généralisée pour situer une valeur donnée au sein de la distribution. Par exemple, être au 90e percentile signifie que 90% des observations ont une valeur inférieure.
TROISIÈME PARTIE : PARAMÈTRES DE DISPERSION
Cette partie introduit les mesures qui permettent d’évaluer la variabilité et l’homogénéité des données statistiques. Elle développe les concepts d’étendue, d’écart-type et de variance comme outils fondamentaux pour analyser la dispersion des observations autour des valeurs centrales, enrichissant ainsi l’analyse descriptive des distributions. ↔️
CHAPITRE 7 : MESURES SIMPLES DE DISPERSION
Ce chapitre présente des indicateurs de dispersion simples à calculer et à interpréter.
7.1 Étendue et amplitude
L’étendue (ou amplitude) est la mesure de dispersion la plus simple, définie comme la différence entre la valeur maximale et la valeur minimale de la série.
7.2 Écart interquartile
L’écart interquartile est défini comme la différence entre le troisième quartile (Q3) et le premier quartile (Q1). Il mesure la dispersion des 50% de valeurs centrales et est plus robuste que l’étendue.
7.3 Coefficient de variation
Le coefficient de variation est une mesure de dispersion relative, sans unité, qui exprime l’écart-type en pourcentage de la moyenne. Il permet de comparer la dispersion de séries de données ayant des unités ou des ordres de grandeur différents.
7..4 Interprétation des mesures de dispersion
L’interprétation de ces mesures est soulignée : une faible dispersion indique que les données sont homogènes et concentrées autour de la tendance centrale, tandis qu’une forte dispersion révèle une grande hétérogénéité.
CHAPITRE 8 : VARIANCE ET ÉCART-TYPE
Ce chapitre se concentre sur les deux mesures de dispersion les plus importantes et les plus utilisées en statistique.
8.1 Définition et calcul de la variance
La variance est définie comme la moyenne des carrés des écarts de chaque valeur par rapport à la moyenne arithmétique. Elle mesure la dispersion globale des données.
8.2 Écart-type et ses propriétés
L’écart-type est la racine carrée de la variance. Il a l’avantage d’être exprimé dans la même unité que la variable, ce qui facilite son interprétation comme une mesure de l’écart typique des valeurs par rapport à la moyenne.
8.3 Variance pour les données groupées
La méthode de calcul de la variance et de l’écart-type pour des données présentées sous forme de tableau d’effectifs ou regroupées en classes est détaillée.
8.4 Applications pratiques
L’écart-type est utilisé dans de nombreux domaines, par exemple en contrôle de qualité pour mesurer la régularité d’une production industrielle ou en finance pour évaluer la volatilité d’un actif.
CHAPITRE 9 : ANALYSE COMPARATIVE DES DISTRIBUTIONS
Ce chapitre synthétise les outils descriptifs pour comparer plusieurs séries de données.
9.1 Comparaison de moyennes et dispersions
La comparaison de plusieurs distributions se fait en analysant simultanément leurs paramètres de tendance centrale (pour comparer leur « niveau ») et leurs paramètres de dispersion (pour comparer leur « homogénéité »).
9.2 Standardisation des données
La technique de la standardisation (ou calcul du score Z) est introduite. Elle permet de comparer des valeurs issues de distributions différentes en les exprimant en nombre d’écarts-types par rapport à leur moyenne respective.
9.3 Coefficients de variation
Le coefficient de variation est rappelé comme l’outil privilégié pour comparer la dispersion relative de deux séries, par exemple pour déterminer si la production de café dans le Kivu est plus ou moins variable que la production de maïs dans le Kasaï.
9.4 Boîtes à moustaches
La boîte à moustaches (ou diagramme de Tukey) est présentée comme un outil de synthèse graphique extrêmement efficace. Elle représente sur un même diagramme la médiane, les quartiles et l’étendue, permettant une comparaison visuelle immédiate de plusieurs distributions.
QUATRIÈME PARTIE : INTRODUCTION AUX PROBABILITÉS
Cette partie constitue l’initiation aux concepts probabilistes fondamentaux en partant des situations concrètes pour développer progressivement les notions d’expérience aléatoire et de probabilité. Elle établit les bases mathématiques nécessaires à la compréhension des phénomènes aléatoires et prépare les élèves aux applications statistiques plus avancées des années suivantes. 🎲
CHAPITRE 10 : EXPÉRIENCES ALÉATOIRES ET ÉVÉNEMENTS
Ce chapitre introduit le vocabulaire et les concepts de base pour la modélisation du hasard.
10.1 Notion d’expérience aléatoire
Une expérience aléatoire est définie comme une expérience dont on ne peut pas prédire l’issue avec certitude, mais dont on connaît l’ensemble de tous les résultats possibles.
10.2 Univers et événements
L’univers (Ω) est l’ensemble de tous les résultats possibles d’une expérience aléatoire. Un événement est un sous-ensemble de l’univers. Les événements élémentaires, certains et impossibles sont définis.
10.3 Opérations sur les événements
Les opérations ensemblistes sont appliquées aux événements : l’union (A ou B), l’intersection (A et B) et le complémentaire (non A).
10.4 Diagrammes de Venn et représentations
Les diagrammes de Venn sont utilisés comme un outil visuel pour représenter les événements et les relations entre eux, facilitant la compréhension des opérations ensemblistes.
CHAPITRE 11 : PROBABILITÉ D’UN ÉVÉNEMENT
Ce chapitre formalise la notion de probabilité et établit ses règles de calcul.
11.1 Définition classique de la probabilité
Dans le cas d’équiprobabilité (où tous les résultats ont la même chance de se produire), la probabilité d’un événement est définie par la formule de Laplace : nombre de cas favorables divisé par le nombre de cas possibles.
11.2 Propriétés fondamentales
Les axiomes et propriétés de base d’une probabilité sont établis : une probabilité est un nombre compris entre 0 et 1, la probabilité de l’événement certain est 1, et celle de l’événement impossible est 0.
11.3 Probabilité d’événements composés
Les formules pour calculer la probabilité de l’union de deux événements et la probabilité de l’événement complémentaire sont démontrées.
11.4 Règles d’addition et de multiplication
Les règles fondamentales du calcul des probabilités sont présentées, notamment la règle d’addition pour les événements incompatibles et une introduction à la règle de multiplication pour les événements indépendants.
CHAPITRE 12 : APPLICATIONS ÉLÉMENTAIRES DES PROBABILITÉS
Ce chapitre met en pratique les concepts probabilistes à travers la résolution de problèmes concrets.
12.1 Problèmes de dénombrement simple
Des problèmes simples faisant appel au dénombrement direct des cas possibles et favorables sont résolus pour renforcer la compréhension de la formule de Laplace.
12.2 Tirages avec et sans remise
La distinction fondamentale entre un tirage avec remise (où les événements sont indépendants) et un tirage sans remise (où ils ne le sont pas) est illustrée à travers des exemples d’urnes.
12.3 Probabilités conditionnelles simples
La notion de probabilité conditionnelle est introduite de manière intuitive : c’est la probabilité qu’un événement A se réalise sachant qu’un événement B est déjà réalisé.
12.4 Arbres de probabilité
L’arbre de probabilité est présenté comme un outil de modélisation puissant pour représenter des expériences aléatoires se déroulant en plusieurs étapes et pour calculer les probabilités des événements finaux.
ANNEXES
Annexe I : Tables statistiques usuelles 📊
Cette annexe fournit des tables numériques de référence, comme la table de la loi normale centrée réduite, qui seront utiles pour les cours de statistique des années supérieures.
Annexe II : Formulaire de statistique descriptive 📝
Un résumé de toutes les formules importantes de la statistique descriptive est présenté, incluant les formules de calcul de la moyenne, de la variance, de l’écart-type et de la médiane pour les données brutes et groupées.
Annexe III : Méthodes de calcul des paramètres 🧮
Des fiches méthodologiques détaillent, étape par étape, les procédures de calcul des principaux paramètres statistiques, servant de guide pratique pour la résolution d’exercices.
Annexe IV : Utilisation de la calculatrice scientifique 📟
Cette section offre un guide d’utilisation des fonctions statistiques de base d’une calculatrice scientifique standard (saisie de données, calcul direct de la moyenne et de l’écart-type).
Annexe V : Symboles et notations statistiques ✒️
Un glossaire des symboles et notations mathématiques utilisés en statistique et en probabilités (Σ, x̄, σ, P(A), etc.) est fourni pour assurer une lecture fluide et sans ambiguïté des formules et des textes scientifiques.