Average, median, range: słowa statystyczne, które uczący się błędnie odczytują
Uczeń opisywał wykres w zadaniu pisemnym: "The average salary in the company is forty thousand dollars, and the median is twenty-five thousand." Korepetytor zatrzymał go. "Jeśli mediana to dwadzieścia pięć tysięcy, to połowa pracowników zarabia tyle albo mniej. Średnia czterdziestu tysięcy oznacza, że najlepiej zarabiający windują tę liczbę. To duża historia do opowiedzenia — ale tylko jeśli używasz słów poprawnie." Uczeń zapisał liczby dobrze; po prostu nie zdawał sobie sprawy, że average i median opisują różne pomysły. Te dwa słowa siedzą o kilka liter od siebie w angielskim, a w znaczeniu cały świat od siebie.
Dlaczego to ma znaczenie
Słowa statystyczne wkradają się do nagłówków gazet, transmisji sportowych, spotkań biznesowych, opisów wykresów na standardowych testach, a nawet swobodnych rozmów o pensjach albo cenach mieszkań. Reporter mówi: "On average, families spend X." Kolega mówi: "The median home price in that neighborhood is too high for us." Trener mówi: "Her range is huge — she scored anywhere from 5 to 25 points per game." Jeśli zamglisz te słowa razem, opisujesz dane niepoprawnie. Na teście pisemnym albo ustnym to kosztuje cię punkty. Na spotkaniu kosztuje cię wiarygodność.
Schemat
Cztery podstawowe słowa statystyczne to mean, median, mode i range. Każde wskazuje na inny pomysł, a każde ma spokojniejszy codzienny zwrot, z którym można je sparować.
Mean to techniczne słowo na to, co większość ludzi nazywa the average. Żeby obliczyć średnią (mean), dodajesz wszystkie wartości i dzielisz przez liczbę wartości. Dla zbioru 2, 4, 6, 8, 10 mean to (2 + 4 + 6 + 8 + 10) ÷ 5 = 6. W angielskim the mean i the average są zwykle wymienne: "The average score is six" i "The mean score is six" opisują tę samą liczbę. Average brzmi nieco bardziej codziennie; mean brzmi nieco bardziej technicznie. Przydatne zwroty: on average, the average of, on a typical day.
Median to middle value (wartość środkowa), gdy posortujesz liczby od najmniejszej do największej. Dla 2, 4, 6, 8, 10 mediana to 6. Dla 1, 3, 5, 7 mediana to (3 + 5) ÷ 2 = 4 — gdy lista ma parzystą liczbę wartości, weź średnią dwóch środkowych. Mediana słynie z tego, że opiera się skrajnym wartościom. Jeśli jedna osoba w małym biurze zarabia dziesięć milionów dolarów, średnia pensja skacze wysoko; mediana pensji ledwo się rusza.
Mode (moda) to most frequent value (najczęstsza wartość). Dla 2, 2, 3, 5, 5, 5, 7 moda to 5. Zbiór danych może mieć no mode (wszystkie wartości pojawiają się raz), jedną modę albo kilka mód (nazywane bimodal albo multimodal). Moda to codzienny bohater w mówieniu o tym, co najczęstsze — odpowiedzi w ankietach, rozmiary koszulek, liczba kolorów oczu.
Range (zakres, rozstęp) to spread (rozrzut), obliczany jako maximum minus minimum. Dla 2, 4, 6, 8, 10 rozstęp to 10 − 2 = 8. Rozstęp odpowiada na pytanie Jak szeroki jest rozrzut? To nie pojedyncza typowa wartość; to miara zmienności.
Dwa kolejne zwroty warte poznania:
Outlier to wartość daleka od reszty. "The team's outlier is the new hire, who finishes twice as many tickets as anyone else." Outliers ciągną mean, ale nie median.
Standard deviation (odchylenie standardowe) to bardziej techniczna miara rozrzutu. Zwykle nie musisz definiować jej w swobodnym zdaniu, ale możesz usłyszeć ją na wykładzie naukowym.
Wrong / Natural / Why
| Wrong | Natural | Dlaczego |
|---|---|---|
| The average is the middle value. | The median is the middle value. | Average (albo mean) to suma podzielona przez liczbę; median to środek posortowanej listy. |
| The mean salary is forty thousand, which is the most common. | The mean salary is forty thousand; the most common (mode) is twenty-five thousand. | Najczęstsza wartość to mode, nie mean. |
| The range is the average of the highest and lowest. | The range is the highest minus the lowest. | Range to max minus min; punkt środkowy tych dwóch byłby innym pomysłem. |
| In average, families spend X. | On average, families spend X. | Utrwalony zwrot to on average, nie in average. |
| The mode is the second from the top. | The mode is the most frequent value. | Moda dotyczy częstości, nie pozycji na posortowanej liście. |
| The medium score is 75. | The median score is 75. | Słowo statystyczne to median, nie medium. (Medium znaczy średni rozmiar lub natężenie, nie wartość środkowa.) |
| The averages are 50, 60, and 70. | The means are 50, 60, and 70. (albo: The averages of the three groups are 50, 60, and 70.) | Average może być rzeczownikiem, ale przy opisywaniu wielu grup obie formy działają. Uważaj na przyimek: average of, nie averages from. |
| The range from 5 to 25 | The range is 5 to 25 (albo: the values range from 5 to 25) | Czasownik range używa from...to; rzeczownik range używa is. |
| Median score equals to 80. | Median score equals 80. (albo: The median score is 80.) | Equals nie łączy się z to. |
Typowe sytuacje
Opisywanie wykresu na teście pisemnym. "The mean monthly rent in City A is $1,200, but the median is only $850. The gap suggests that a few very high rents are pulling the average up." To rodzaj zdania, które przynosi punkty. Te dwa słowa działające razem opowiadają historię: gdzie mieszka większość najemców (median) i jak skośne są dane (mean powyżej mediany).
Rozmowa o pensji. "The average salary at this company is $80K, but I'd be more interested in the median if I were comparing offers." Kiedy kilka osób zarabia znacznie więcej albo mniej niż pozostali, mediana jest uczciwszą liczbą typową. Ludzie, którzy piszą o równości płac, polegają z tego powodu na medianie.
Rozmowa sportowa. "Her scoring range this season was 5 to 25 points. The average was 14, but she had three twenty-plus games." Zwróć uwagę, jak wszystkie trzy statystyki — range, average i pojedyncze szczyty — razem malują obraz.
Wyniki ankiety na spotkaniu. "The mode for favorite color was blue, with 35 percent of responses." Moda to naturalny wybór, gdy zmienna to kategoria (kolor, marka, rozmiar koszulki), a nie liczba.
Rada przygotowująca do testu. "Don't worry about the highest mean score on the practice tests — focus on whether your median score is improving week to week." Gdy masz kilka nietypowo dobrych albo złych dni ćwiczeniowych, mediana pokazuje trend uczciwiej niż średnia.
Jeśli chcesz nałożyć na te statystyki rozmowę o zmianach — opisywanie, jak mediana albo średnia poruszyła się między dwoma okresami — Percent, percentage i percentage points: krótkie słowa, duże błędy to kolejny krok. Naturalnie pasuje do statystyki, bo opisy wykresów prawie zawsze łączą te dwa elementy.
Częste błędy
- Zamienianie average i median. To nie to samo. Średnia to suma podzielona przez liczbę. Mediana to wartość środkowa po posortowaniu.
- Pisanie albo mówienie medium, gdy masz na myśli median. Medium opisuje poziom rozmiaru, natężenia albo wysmażenia ("medium-rare steak"). Median to statystyka.
- Używanie the average of the highest and lowest jako definicji range. Range to highest minus lowest. Średnia tych dwóch wartości jest czasem nazywana midrange, co jest czymś innym.
- Traktowanie mode jako synonim typical. Moda to wartość najczęstsza, nawet jeśli pojawia się tylko nieznacznie częściej niż inne.
- Mówienie in average zamiast on average. Angielski utrwalony zwrot to on average.
- Zapominanie, że mediana może być równa średniej. W symetrycznym zbiorze danych pokrywają się. Różnica ma znaczenie, gdy dane są skośne.
- Mówienie equals to po mean, median, mode albo range. Czasownik equals nie łączy się z to: the mean equals 6.
- Używanie range jako czasownika bez from...to. Forma rzeczownikowa to the range is 5 to 25; forma czasownikowa to the values range from 5 to 25. Mieszanie ich daje the range from 5 to 25, co nie jest idiomatyczne.
Mini ćwiczenie
Dla zbioru danych 4, 6, 6, 8, 10, 20 odpowiedz na poniższe.
- What is the mean (the average)?
- What is the median?
- What is the mode?
- What is the range?
- Which value is the outlier, and what does it do to the mean compared with the median?
Podsumowanie
Statystyczny angielski sprowadza się do czterech słów. Mean (albo average) to suma podzielona przez liczbę. Median to wartość środkowa posortowanej listy. Mode to najczęstsza wartość. Range to najwyższa minus najniższa. Każde opowiada inną historię, a używanie ich razem — the mean is X, the median is Y, the range is Z — daje ci opis wykresu, który brzmi pewnie i dokładnie. Wybierz właściwe słowo do właściwego pomysłu, a dane przemówią za ciebie.
Chcesz ćwiczyć liczby, ilości i jednostki w prawdziwych zdaniach testowych? Zacznij ćwiczyć na ExamRift.
