COURS DE STATISTIQUE, 2ÈME ANNÉE, OPTION HUMANITÉS SCIENTIFIQUES
Edition 2025 / Enseignement primaire, secondaire et technique en RDC
📑 PRÉLIMINAIRES
0.1. Note pédagogique à l’usage de l’enseignant
Ce manuel de Statistique pour la deuxième année des Humanités Scientifiques opérationnalise rigoureusement les matrices du Programme Éducatif du Domaine d’Apprentissage des Sciences (Mathématiques), spécifiquement les codes MM4.12, MM4.13 et MM4.14. Le volume horaire alloué est d’une heure par semaine, ce qui impose une densité et une efficacité maximales dans la transmission des savoirs. L’enseignant privilégiera l’approche par compétences en ancrant les concepts théoriques dans des situations concrètes issues de l’environnement socio-économique de la République Démocratique du Congo, telles que la gestion démographique, l’analyse de la production agricole ou les relevés météorologiques.
0.2. Profil d’entrée et prérequis
L’accès à ce cours requiert la maîtrise des acquis du cycle précédent et de la première année des Humanités Scientifiques. L’élève doit posséder une aisance dans le calcul arithmétique et algébrique élémentaire, la manipulation des pourcentages et la lecture de graphiques simples. La compréhension des concepts de base tels que la population, l’individu, le caractère (qualitatif et quantitatif) et les effectifs simples est indispensable pour aborder l’analyse des fréquences cumulées et des paramètres de dispersion.
0.3. Compétences visées et profil de sortie
Au terme de cette année de formation, l’apprenant sera capable de traiter avec succès des situations faisant appel à l’organisation, la gestion et la caractérisation des données statistiques. Il maîtrisera le calcul et l’interprétation des effectifs et fréquences cumulés, la détermination des quartiles pour analyser la position des données, et l’évaluation de la dispersion via la variance et l’écart-type. Il développera un esprit critique face aux informations chiffrées, compétence essentielle pour la citoyenneté et la poursuite d’études supérieures scientifiques.
0.4. Méthodologie et matériel didactique
La méthodologie préconisée repose sur l’alternance entre l’exposé des concepts, la démonstration mathématique et l’application immédiate par des exercices. L’utilisation de la calculatrice scientifique est requise pour les calculs de variance et d’écart-type. L’enseignant exploitera des tableaux de données réelles (relevés de notes, enquêtes locales) pour contextualiser les apprentissages. L’intégration des outils informatiques (tableurs) est encouragée pour visualiser les diagrammes et automatiser les calculs statistiques complexes.
📊 PARTIE 1 : ORGANISATION ET REPRÉSENTATION DES DONNÉES STATISTIQUES
Cette première partie établit les fondements de l’analyse statistique descriptive. Elle structure la méthode de traitement de l’information brute pour la rendre intelligible et exploitable. L’élève apprendra à transformer des séries de données en tableaux structurés et en représentations graphiques pertinentes, conformément à la matrice MM4.12. L’objectif est de passer de l’observation chaotique à la synthèse visuelle et numérique organisée.
Chapitre 1 : Traitement des Effectifs et des Fréquences
Ce chapitre formalise la structuration des données par le biais des tableaux statistiques. Il introduit les concepts d’accumulation qui permettent de répondre à des questions de seuil (exemple : « combien d’élèves ont obtenu moins de la moyenne ? »).
1.1. Rappels sur les séries statistiques et dénombrement
L’analyse statistique débute par le dépouillement rigoureux des données brutes. Cette section consolide la distinction entre les caractères discrets (valeurs isolées) et continus (intervalles). L’élève apprend à dresser un tableau d’effectifs simples () associant chaque modalité à son nombre d’apparitions. Nous prenons pour exemple le recensement des essences d’arbres dans une concession forestière du Mai-Ndombe pour illustrer la construction de la distribution d’effectifs.
1.2. Calcul et interprétation des fréquences simples
La fréquence () mesure la part relative de chaque modalité dans l’ensemble de la population. Elle se calcule par le rapport de l’effectif partiel sur l’effectif total () et s’exprime souvent en pourcentage. Cette notion permet de comparer des populations de tailles différentes, comme les taux de réussite scolaire entre deux provinces distinctes, le Kwilu et le Kongo Central.
1.3. Les effectifs cumulés (Croissants et Décroissants)
L’effectif cumulé croissant d’une valeur est la somme des effectifs de cette valeur et de toutes celles qui lui sont inférieures. Inversement, l’effectif cumulé décroissant considère les valeurs supérieures ou égales. L’élève doit énoncer le principe de calcul et l’appliquer pour déterminer, par exemple, le nombre d’élèves ayant obtenu une note inférieure ou égale à un seuil donné dans une classe de l’Institut Kubama.
1.4. Les fréquences cumulées
Parallèlement aux effectifs, les fréquences cumulées () permettent d’analyser la répartition en termes de proportion globale. L’élève calcule la fréquence cumulée croissante pour connaître le pourcentage de la population situé en dessous d’une certaine valeur. Cette compétence est cruciale pour l’analyse des seuils de pauvreté ou des niveaux de précipitations agricoles.
Chapitre 2 : Représentations Graphiques des Séries Discrètes
La visualisation est un outil puissant pour la communication des résultats statistiques. Ce chapitre traite des diagrammes adaptés aux caractères qualitatifs et quantitatifs discrets.
2.1. Le diagramme en bâtons (ou segments)
Ce graphique représente les effectifs ou les fréquences par des segments verticaux dont la hauteur est proportionnelle à la valeur. L’élève apprendra à tracer ce diagramme dans un repère orthogonal, en plaçant les modalités sur l’axe des abscisses. Il est particulièrement adapté pour visualiser la répartition des notes entières dans une classe ou le nombre d’enfants par famille dans le village Kayi.
2.2. Le diagramme circulaire et semi-circulaire
Le diagramme circulaire (ou camembert) représente la totalité de la population par un disque. L’angle de chaque secteur est proportionnel à la fréquence de la modalité correspondante. L’élève doit maîtriser la formule de conversion : Angle = Fréquence × 360°. Ce type de graphique est idéal pour illustrer la répartition budgétaire d’une commune ou les parts de marché des réseaux de télécommunication.
2.3. Le diagramme en tuyaux d’orgue (Bandes)
Variante du diagramme en bâtons, le diagramme en bandes utilise des rectangles de largeur constante. Il permet une comparaison visuelle immédiate des effectifs. L’élève doit veiller à respecter l’échelle sur l’axe des ordonnées pour ne pas fausser l’interprétation visuelle des données, comme lors de la comparaison des productions de manioc entre différents territoires.
2.4. Le polygone des effectifs et des fréquences
En reliant les sommets des bâtons ou les milieux des sommets des bandes, on obtient le polygone des effectifs. Cette ligne brisée permet de visualiser l’évolution ou la tendance de la distribution. L’élève apprendra à fermer le polygone sur l’axe des abscisses pour représenter l’intégralité de l’effectif, une technique utile pour l’analyse des séries chronologiques simples.
Chapitre 3 : Représentations Graphiques des Séries Continues
Lorsque les données sont nombreuses et variées, elles sont regroupées en classes. Ce chapitre aborde les techniques graphiques spécifiques aux données continues, essentielles pour la matrice MM4.12.
3.1. L’Histogramme : principes et construction
L’histogramme est constitué de rectangles juxtaposés dont la surface est proportionnelle à l’effectif de la classe. Pour des classes de même amplitude, la hauteur est directement proportionnelle à l’effectif. L’élève devra tracer des histogrammes pour représenter, par exemple, la distribution des tailles des élèves d’une promotion ou les relevés pluviométriques mensuels.
3.2. Gestion des amplitudes inégales
Lorsque les classes ont des amplitudes différentes, la hauteur des rectangles de l’histogramme doit être corrigée. On utilise la densité de fréquence ou l’effectif rectifié (Effectif / Amplitude) pour assurer que la surface reste représentative. Cette subtilité technique est indispensable pour une représentation honnête des données économiques, comme la répartition des revenus.
3.3. Le diagramme cumulatif (Courbe des fréquences cumulées)
Ce graphique représente l’évolution des fréquences cumulées croissantes en fonction de la borne supérieure des classes. La courbe obtenue, toujours croissante, permet de lire graphiquement les fractiles (médiane, quartiles). L’élève construira cette courbe pour analyser la répartition des salaires dans une entreprise de Goma.
3.4. Interprétation des formes graphiques
Au-delà du tracé, l’élève doit interpréter l’allure des graphiques. Une distribution peut être symétrique, étalée à gauche ou à droite, unimodale ou bimodale. Cette analyse morphologique fournit des indices précieux sur la nature du phénomène étudié, comme l’homogénéité d’une production industrielle ou les disparités scolaires.
📉 PARTIE 2 : GESTION DES DONNÉES ET PARAMÈTRES DE POSITION
Cette partie se concentre sur la synthèse de l’information statistique par des valeurs numériques clés. Elle aborde spécifiquement les quartiles, compétence centrale de la matrice MM4.13, qui permettent de structurer la distribution et de positionner les individus les uns par rapport aux autres.
Chapitre 4 : La Médiane et les Paramètres Centraux
Bien que le programme mette l’accent sur les quartiles, la médiane en est la composante centrale. Ce chapitre assure la compréhension du « milieu » de la série statistique.
4.1. Définition et détermination de la Médiane ()
La médiane est la valeur qui partage la série statistique ordonnée en deux groupes de même effectif. Pour une série discrète, l’élève apprendra à identifier la médiane selon que l’effectif total est pair ou impair. Dans le cas d’une série continue, il utilisera l’interpolation linéaire ou la lecture graphique sur la courbe des fréquences cumulées.
4.2. Comparaison Médiane et Moyenne
Il est crucial de distinguer la médiane (paramètre de position) de la moyenne arithmétique (paramètre de dimension). L’élève analysera des situations où la moyenne est influencée par des valeurs extrêmes (salaires très élevés), alors que la médiane reste stable. Cette distinction est fondamentale pour l’analyse sociale.
4.3. Le Mode et la Classe Modale
Le mode est la valeur du caractère ayant l’effectif le plus élevé. Dans le cas continu, on parle de classe modale. L’élève identifiera le mode sur un histogramme (le rectangle le plus haut) et comprendra son utilité pour les fabricants (taille de vêtements la plus vendue, pointure la plus fréquente).
4.4. Les caractéristiques de la tendance centrale
Cette section synthétise l’usage des différents paramètres. La moyenne est adaptée aux calculs algébriques, la médiane aux distributions asymétriques, et le mode aux caractères qualitatifs. L’élève choisira le paramètre adéquat pour résumer une situation donnée, comme les notes d’une classe de l’Institut Ponio.
Chapitre 5 : Les Quartiles et la Partition des Données
Ce chapitre est le cœur de la matrice MM4.13. Il étend la notion de médiane pour diviser la population en quatre parties égales.
5.1. Définition et concept des Quartiles
Les quartiles sont les trois valeurs () qui partagent la série ordonnée en quatre groupes comprenant chacun 25% des effectifs. correspond à la médiane. L’élève doit restituer cette définition et comprendre que sépare les 25% inférieurs et les 75% inférieurs (ou délimite les 25% supérieurs).
5.2. Calcul des Quartiles pour une série discrète
L’élève apprendra à déterminer le rang des quartiles : pour et pour . Si le résultat n’est pas entier, on prend la valeur de rang immédiatement supérieur. L’application se fera sur des séries de notes ou de prix de modems, comme dans l’exemple du marché technologique.
5.3. Calcul des Quartiles pour une série groupée
Pour des données continues, la détermination des quartiles se fait par interpolation linéaire à l’intérieur de la classe quartiles, ou par lecture graphique sur le diagramme des fréquences cumulées. L’élève tracera l’histogramme des fréquences cumulées et situera à l’ordonnée 25% et à l’ordonnée 75%.
5.4. L’Intervalle et l’Écart Interquartile
L’intervalle interquartile contient les 50% centraux de la population. L’écart interquartile () mesure la dispersion de cette moitié centrale. L’élève calculera cet écart pour évaluer la concentration des données autour de la médiane, indépendamment des valeurs extrêmes.
Chapitre 6 : Diagrammes en Boîte et Analyse de Position
Ce chapitre exploite les quartiles pour visualiser la structure de la distribution et comparer des séries statistiques.
6.1. Construction du Diagramme en Boîte (Box-plot)
Le diagramme en boîte à moustaches est une représentation synthétique basée sur les cinq nombres résumés : Minimum, , Médiane, , Maximum. L’élève construira ce diagramme pour visualiser la position centrale et l’étalement des données, par exemple pour les distances parcourues par les élèves du C.S. Bompikiliki.
6.2. Interprétation de la boîte à moustaches
La longueur de la boîte représente l’écart interquartile. La position de la médiane dans la boîte indique la symétrie de la distribution centrale. L’élève apprendra à lire ce graphique pour déceler rapidement si les données sont concentrées ou dispersées, et si la distribution est biaisée vers les valeurs hautes ou basses.
6.3. Déciles et Centiles (Extension)
Par extension aux quartiles, les déciles ( à ) partagent la série en dix parties et les centiles en cent. Bien que le programme se focalise sur les quartiles, la notion de décile est utile pour comprendre des concepts comme les 10% les plus riches ou les seuils de réussite aux examens nationaux.
6.4. Comparaison de séries par les quartiles
L’utilisation conjointe des médianes et des écarts interquartiles permet de comparer deux populations. L’élève comparera, par exemple, la performance de deux classes (2ème A et 2ème B) en analysant le chevauchement de leurs diagrammes en boîte et la position relative de leurs médianes.
📉 PARTIE 3 : CARACTÉRISATION DE LA DISPERSION
Cette dernière partie aborde la matrice MM4.14. Une moyenne seule ne suffit pas à décrire une distribution ; il faut mesurer l’étalement des valeurs autour de cette moyenne. Ce module équipe l’élève d’outils mathématiques rigoureux pour quantifier la variabilité et l’homogénéité d’une série statistique.
Chapitre 7 : Mesures de Dispersion Absolue
Ce chapitre introduit les concepts élémentaires de dispersion basés sur les écarts entre les valeurs extrêmes ou par rapport à la centrale.
7.1. L’Étendue de la distribution
L’étendue est la différence entre la plus grande et la plus petite valeur observée (). C’est l’indicateur de dispersion le plus simple mais aussi le plus sensible aux valeurs aberrantes. L’élève calculera l’étendue des notes ou des précipitations pour avoir une première idée de la variabilité.
7.2. Les écarts à la moyenne
Pour comprendre la dispersion interne, on calcule la différence entre chaque valeur et la moyenne arithmétique . L’élève vérifiera la propriété fondamentale selon laquelle la somme algébrique des écarts à la moyenne est toujours nulle, ce qui nécessite l’introduction de la valeur absolue ou du carré pour créer un indicateur global.
7.3. L’Écart moyen arithmétique
L’écart moyen est la moyenne des valeurs absolues des écarts à la moyenne : . L’élève appliquera cette formule pour quantifier la distance moyenne des individus par rapport au centre de la distribution, dans des situations concrètes comme la production journalière d’une usine.
7.4. Limites des mesures simples
Cette section analyse les faiblesses de l’étendue (qui ignore les valeurs intermédiaires) et de l’écart moyen (difficile à manipuler algébriquement). Elle prépare l’élève à la nécessité d’introduire la variance, un outil mathématique plus puissant et plus stable pour l’inférence statistique.
Chapitre 8 : Variance et Écart-Type
Ce chapitre développe les outils standards de la statistique inferentielle et descriptive avancée, cœur de la compétence MM4.14.
8.1. Le concept de Variance ()
La variance est la moyenne des carrés des écarts à la moyenne : . L’élève doit comprendre que l’élévation au carré permet d’éliminer les signes négatifs et de donner plus de poids aux grands écarts. Il apprendra à calculer la variance pour des séries discrètes et groupées.
8.2. Formule de Koenig pour le calcul de la variance
Pour simplifier les calculs manuels, on utilise le théorème de Koenig : la variance est égale à la moyenne des carrés moins le carré de la moyenne (). L’élève s’exercera à utiliser cette formule computationnelle pour gagner du temps et de la précision lors des évaluations.
8.3. L’Écart-type () : Définition et calcul
La variance s’exprime dans l’unité de la variable au carré (ex: ), ce qui est difficile à interpréter. L’écart-type est la racine carrée de la variance (), ramenant l’indicateur à l’unité d’origine. L’élève calculera l’écart-type pour mesurer la dispersion réelle des notes ou des tailles autour de la moyenne.
8.4. Interprétation de l’Écart-type
Un faible écart-type indique une population homogène, resserrée autour de la moyenne. Un grand écart-type signale une population hétérogène. L’élève interprétera ces valeurs pour juger, par exemple, de la régularité des résultats d’un élève ou de la constance de la température dans une chambre froide.
Chapitre 9 : Applications et Comparaisons de Distributions
Ce chapitre final synthétise l’ensemble des acquis pour comparer des séries statistiques et prendre des décisions basées sur l’analyse des données.
9.1. Le Coefficient de Variation ()
Pour comparer la dispersion de deux séries ayant des moyennes différentes ou des unités différentes, on utilise le coefficient de variation : . L’élève calculera ce rapport pour déterminer laquelle de deux distributions est la plus homogène, par exemple entre les salaires en Francs Congolais et ceux en Dollars.
9.2. Comparaison des performances (Classe A vs Classe B)
En reprenant l’exemple de l’Institut de la Fraternité à Kikwit, l’élève comparera deux classes ayant la même moyenne mais des dispersions différentes. Il utilisera l’étendue, l’écart-type et les quartiles pour déterminer quelle classe a les résultats les plus réguliers et laquelle contient les élèves les plus en difficulté ou les plus brillants.
9.3. Analyse de la structure d’une population
L’élève utilisera les paramètres de position (Moyenne, Médiane) et de dispersion (Écart-type) pour décrire la forme d’une distribution (symétrique, étalée). Il appliquera cette analyse à des données démographiques, comme l’ancienneté des agents dans une entreprise de meubles, pour conseiller le chef du personnel.
9.4. Prise de décision basée sur la statistique
L’objectif ultime est d’utiliser ces outils pour décider. L’élève sera confronté à des problèmes où il devra choisir le meilleur fournisseur (livraisons les plus régulières), le meilleur trajet (temps de parcours le moins variable) ou la meilleure stratégie agricole, en se basant sur une analyse rigoureuse de la variance et de l’espérance mathématique.
📎 ANNEXES
A.1. Formulaire de Statistique Descriptive
Ce document regroupe de manière synthétique toutes les formules essentielles du cours : fréquences, moyenne arithmétique (simple et pondérée), position des quartiles, écart moyen, variance (définition et Koenig) et écart-type. Il sert de référence rapide pour la résolution des exercices.
A.2. Tables de référence et Jeux de Données
Cette annexe fournit des séries de données brutes issues du contexte congolais pour les exercices : relevés pluviométriques de Kisangani, production minière du Katanga, statistiques scolaires de Kinshasa. Elle inclut également des modèles de tableaux vides pour faciliter l’entraînement des élèves à la structuration des données.
A.3. Guide d’utilisation de la Calculatrice Scientifique
Une notice pratique expliquant les séquences de touches pour entrer des données statistiques (mode STAT), calculer la moyenne () et l’écart-type ( ou ) sur les modèles de calculatrices les plus courants en milieu scolaire (Casio, Sharp, etc.), permettant à l’élève de vérifier ses calculs manuels.
A.4. Modèles de Graphiques Statistiques
Des exemples clairs et annotés des principaux graphiques (histogramme, diagramme circulaire, diagramme en boîte, polygone des fréquences) sont présentés ici. Ces modèles servent de critères de qualité pour les productions graphiques des élèves, insistant sur la présence des titres, légendes, échelles et unités.