Average, median, range : les mots de statistiques que les apprenants comprennent mal

Average, median, range : les mots de statistiques que les apprenants comprennent mal

Un apprenant décrivait un graphique lors d'une tâche d'expression écrite : "The average salary in the company is forty thousand dollars, and the median is twenty-five thousand." Son tuteur l'a arrêté. "If the median is twenty-five thousand, then half the staff earn that or less. The average of forty thousand means the top earners are pulling the number up. That's a big story to tell — but only if you use the words correctly." L'apprenant avait noté les bons chiffres ; il n'avait simplement pas réalisé qu'average et median décrivent des idées différentes. Les deux mots ne sont séparés que de quelques lettres en anglais, mais d'un monde entier en signification.

Pourquoi c'est important

Les mots de statistiques se glissent dans les titres d'actualité, les retransmissions sportives, les réunions d'affaires, les descriptions de graphiques aux tests standardisés, et même les conversations ordinaires sur les salaires ou les prix de l'immobilier. Un journaliste dit : "On average, families spend X." Un ami dit : "The median home price in that neighborhood is too high for us." Un entraîneur dit : "Her range is huge — she scored anywhere from 5 to 25 points per game." Si vous confondez ces mots, vous décrivez les données de façon incorrecte. À un test d'expression écrite ou orale, cela vous coûte des points. En réunion, cela vous coûte votre crédibilité.

Le schéma

Les quatre mots de statistiques essentiels sont mean, median, mode et range. Chacun renvoie à une idée différente, et chacun a une expression du quotidien plus posée à laquelle l'associer.

Mean est le mot technique pour ce que la plupart des gens appellent the average (la moyenne). Pour calculer le mean, on add up (additionne) toutes les valeurs, puis on divide by (divise par) le nombre de valeurs. Pour l'ensemble 2, 4, 6, 8, 10, le mean est (2 + 4 + 6 + 8 + 10) ÷ 5 = 6. En anglais, the mean et the average sont généralement interchangeables : "The average score is six" et "The mean score is six" décrivent le même nombre. Average sonne un peu plus quotidien ; mean sonne un peu plus technique. Expressions utiles : on average, the average of, on a typical day.

Median est la middle value (valeur médiane) quand on trie les nombres du plus petit au plus grand. Pour 2, 4, 6, 8, 10, la médiane est 6. Pour 1, 3, 5, 7, la médiane est (3 + 5) ÷ 2 = 4 — quand la liste comporte un nombre pair de valeurs, on prend le mean des deux valeurs centrales. La médiane est connue pour résister aux valeurs extrêmes. Si une personne d'un petit bureau gagne dix millions de dollars, le salaire average bondit vers le haut ; le salaire median bouge à peine.

Mode est la valeur most frequent (la plus fréquente). Pour 2, 2, 3, 5, 5, 5, 7, le mode est 5. Un ensemble de données peut n'avoir no mode (toutes les valeurs apparaissent une fois), un seul mode, ou plusieurs modes (on parle de bimodal ou multimodal). Le mode est le héros du quotidien quand on parle de ce qui est le plus courant — réponses à un sondage, tailles de T-shirt, comptages de couleurs des yeux.

Range est le spread (l'étendue), calculé comme maximum minus minimum. Pour 2, 4, 6, 8, 10, le range est 10 − 2 = 8. Le range répond à la question Quelle est la largeur de la dispersion ? Ce n'est pas une valeur typique unique ; c'est une mesure de variabilité.

Deux autres expressions à connaître :

Outlier est une valeur très éloignée du reste. "The team's outlier is the new hire, who finishes twice as many tickets as anyone else." Les outliers tirent le mean mais pas la median.

Standard deviation est une mesure plus technique de la dispersion. Vous n'avez généralement pas besoin de la définir dans une phrase ordinaire, mais vous pourriez l'entendre dans une conférence scientifique.

Incorrect / Naturel / Pourquoi

Incorrect Naturel Pourquoi
The average is the middle value. The median is the middle value. Average (ou mean) est la somme divisée par le nombre ; la median est le milieu de la liste triée.
The mean salary is forty thousand, which is the most common. The mean salary is forty thousand; the most common (mode) is twenty-five thousand. La valeur la plus courante est le mode, pas le mean.
The range is the average of the highest and lowest. The range is the highest minus the lowest. Range est le max moins le min ; le milieu des deux serait une idée différente.
In average, families spend X. On average, families spend X. L'expression figée est on average, pas in average.
The mode is the second from the top. The mode is the most frequent value. Le mode concerne la fréquence, pas la position dans la liste triée.
The medium score is 75. The median score is 75. Le mot statistique est median, pas medium. (Medium signifie taille ou intensité moyenne, pas valeur médiane.)
The averages are 50, 60, and 70. The means are 50, 60, and 70. (or: The averages of the three groups are 50, 60, and 70.) Average peut être un nom, mais pour décrire plusieurs groupes, les deux formes marchent. Attention à la préposition : average of, pas averages from.
The range from 5 to 25 The range is 5 to 25 (or: the values range from 5 to 25) Le verbe range utilise from...to ; le nom range utilise is.
Median score equals to 80. Median score equals 80. (or: The median score is 80.) Equals ne prend pas to.

Situations courantes

Décrire un graphique à un test d'expression écrite. "The mean monthly rent in City A is $1,200, but the median is only $850. The gap suggests that a few very high rents are pulling the average up." C'est le genre de phrase qui rapporte des points. Les deux mots qui travaillent ensemble racontent une histoire : où vit la majorité des locataires (médiane) et à quel point les données sont biaisées (mean au-dessus de la médiane).

Conversation sur les salaires. "The average salary at this company is $80K, but I'd be more interested in the median if I were comparing offers." Chaque fois que quelques personnes gagnent beaucoup plus ou beaucoup moins que les autres, la médiane est le nombre typique le plus honnête. Ceux qui écrivent sur l'équité salariale s'appuient sur la médiane pour cette raison.

Discussion sportive. "Her scoring range this season was 5 to 25 points. The average was 14, but she had three twenty-plus games." Remarquez comment les trois statistiques — range, average, et les pics individuels — dressent le tableau ensemble.

Résultats d'un sondage en réunion. "The mode for favorite color was blue, with 35 percent of responses." Le mode est le choix naturel quand la variable est une catégorie (couleur, marque, taille de T-shirt), pas un nombre.

Conseil de préparation aux examens. "Don't worry about the highest mean score on the practice tests — focus on whether your median score is improving week to week." Quand vous avez quelques journées d'entraînement particulièrement bonnes ou mauvaises, la médiane montre la tendance plus honnêtement que le mean.

Si vous voulez ajouter le vocabulaire du changement par-dessus ces statistiques — décrire comment la médiane ou la moyenne a évolué entre deux périodes — Percent, percentage et percentage points : petits mots, grosses erreurs est l'étape suivante. Il s'associe naturellement aux statistiques, car les descriptions de graphiques combinent presque toujours les deux.

Erreurs fréquentes

  • Intervertir average et median. Ce ne sont pas la même chose. L'average est la somme divisée par le nombre. La median est la valeur centrale après tri.
  • Écrire ou dire medium quand on veut dire median. Medium décrit un niveau de taille, d'intensité ou de cuisson ("medium-rare steak"). Median est une statistique.
  • Utiliser the average of the highest and lowest comme définition de range. Le range est highest minus lowest. La moyenne de ces deux valeurs s'appelle parfois midrange, ce qui est différent.
  • Traiter mode comme un synonyme de typical. Le mode est la valeur la plus courante, même si elle n'apparaît que légèrement plus souvent que les autres.
  • Dire in average au lieu d'on average. L'expression figée anglaise est on average.
  • Oublier que la médiane peut être égale au mean. Dans un ensemble de données symétrique, elles coïncident. La différence compte quand les données sont biaisées.
  • Dire equals to après mean, median, mode ou range. Le verbe equals ne prend pas to : the mean equals 6.
  • Utiliser range comme verbe sans from...to. La forme nominale est the range is 5 to 25 ; la forme verbale est the values range from 5 to 25. Les mélanger donne the range from 5 to 25, qui n'est pas idiomatique.

Petit exercice

Pour l'ensemble de données 4, 6, 6, 8, 10, 20, répondez aux questions suivantes.

  1. What is the mean (the average)?
  2. What is the median?
  3. What is the mode?
  4. What is the range?
  5. Which value is the outlier, and what does it do to the mean compared with the median?

Résumé

L'anglais des statistiques se résume à quatre mots. Mean (ou average) est la somme divisée par le nombre. Median est la valeur centrale de la liste triée. Mode est la valeur la plus fréquente. Range est la plus haute moins la plus basse. Chacun raconte une histoire différente, et les utiliser ensemble — the mean is X, the median is Y, the range is Z — vous donne une description de graphique qui sonne sûre et exacte. Choisissez le bon mot pour la bonne idée, et les données parleront pour vous.


Envie de vous entraîner sur les nombres, les quantificateurs et les unités dans de vraies phrases d'examen ? Commencez à vous entraîner sur ExamRift.