Average, Median, Range: 학습자가 자주 헷갈리는 통계 단어들
한 학습자가 작문 과제의 차트를 묘사했습니다. "The average salary in the company is forty thousand dollars, and the median is twenty-five thousand." 강사가 말을 끊었습니다. "중앙값이 25,000이면, 직원의 절반이 그만큼 또는 더 적게 번다는 뜻이에요. 평균이 40,000이라는 건 상위 소득자들이 수치를 끌어올리고 있다는 뜻이고요. 그게 큰 이야기를 들려줍니다 — 단, 단어를 옳게 쓸 때만요." 학습자는 숫자는 제대로 적었습니다. 다만 average와 median이 서로 다른 발상을 묘사한다는 점을 몰랐을 뿐입니다. 두 단어는 영어에서 글자 몇 개 차이로 붙어 있지만, 의미는 전혀 다른 세계에 자리잡고 있습니다.
왜 중요한가
통계 단어는 뉴스 헤드라인, 스포츠 중계, 비즈니스 회의, 표준화 시험의 차트 묘사, 그리고 연봉이나 집값에 관한 가벼운 대화에까지 슬쩍 들어옵니다. 기자가 말합니다. "On average, families spend X." 친구가 말합니다. "The median home price in that neighborhood is too high for us." 코치가 말합니다. "Her range is huge — she scored anywhere from 5 to 25 points per game." 이 단어들을 뭉뚱그리면 데이터를 잘못 묘사하게 됩니다. 작문이나 말하기 시험에서는 점수를 잃고, 회의에서는 신뢰를 잃습니다.
패턴
핵심 통계 단어 넷은 mean, median, mode, range입니다. 각각이 다른 발상을 가리키고, 각각에 짝을 이룰 만한 차분한 일상 표현이 있습니다.
Mean은 대부분의 사람이 the average라고 부르는 것을 지칭하는 기술 용어입니다. 평균을 계산하려면 모든 값을 add up하고 값의 개수로 divide by합니다. 2, 4, 6, 8, 10이라는 집합의 mean은 (2 + 4 + 6 + 8 + 10) ÷ 5 = 6입니다. 영어에서 the mean과 the average는 보통 서로 바꿔 쓸 수 있습니다. "The average score is six"와 "The mean score is six"는 같은 수를 묘사합니다. Average는 살짝 더 일상적으로, mean은 살짝 더 기술적으로 들립니다. 유용한 표현으로는 on average, the average of, on a typical day가 있습니다.
Median은 가장 작은 값부터 가장 큰 값까지 정렬했을 때의 중앙값입니다. 2, 4, 6, 8, 10에서 median은 6입니다. 1, 3, 5, 7에서 median은 (3 + 5) ÷ 2 = 4입니다 — 목록의 값 개수가 짝수이면 가운데 두 값의 mean을 취합니다. Median은 극단값에 잘 흔들리지 않는 것으로 유명합니다. 작은 사무실에서 한 사람이 1,000만 달러를 번다면 average 연봉은 크게 뛰지만, median 연봉은 거의 움직이지 않습니다.
Mode는 가장 자주 나오는 값입니다. 2, 2, 3, 5, 5, 5, 7에서 mode는 5입니다. 데이터 집합에는 no mode(모든 값이 한 번씩 나타날 때), 하나의 mode, 또는 여러 mode가 있을 수 있습니다(bimodal 또는 multimodal이라 부릅니다). Mode는 무엇이 가장 흔한지를 말할 때 일상의 주인공입니다 — 설문 답변, 티셔츠 사이즈, 눈동자 색 통계 등에서요.
Range는 퍼짐으로, maximum minus minimum으로 계산합니다. 2, 4, 6, 8, 10의 range는 10 − 2 = 8입니다. Range는 *퍼짐이 얼마나 넓은가?*라는 질문에 답합니다. 단일한 대푯값이 아니라, 변동성의 척도입니다.
알아 두면 좋은 표현이 둘 더 있습니다.
Outlier는 나머지에서 멀리 떨어진 값입니다. "The team's outlier is the new hire, who finishes twice as many tickets as anyone else." 이상치는 mean을 끌고 가지만 median은 끌지 않습니다.
Standard deviation은 좀 더 기술적인 퍼짐 척도입니다. 평소 대화에서 굳이 정의할 필요는 없지만, 과학 발표에서 들을 수 있습니다.
틀린 표현 / 자연스러운 표현 / 이유
| 틀린 표현 | 자연스러운 표현 | 이유 |
|---|---|---|
| The average is the middle value. | The median is the middle value. | Average(또는 mean)는 합을 개수로 나눈 값이고, median은 정렬된 목록의 가운데입니다. |
| The mean salary is forty thousand, which is the most common. | The mean salary is forty thousand; the most common (mode) is twenty-five thousand. | 가장 흔한 값은 mode이지 mean이 아닙니다. |
| The range is the average of the highest and lowest. | The range is the highest minus the lowest. | Range는 최대 빼기 최소입니다. 두 값의 중간점은 다른 발상입니다. |
| In average, families spend X. | On average, families spend X. | 고정 표현은 in average가 아니라 on average입니다. |
| The mode is the second from the top. | The mode is the most frequent value. | Mode는 정렬된 목록의 위치가 아니라 빈도에 관한 것입니다. |
| The medium score is 75. | The median score is 75. | 통계 단어는 medium이 아니라 median입니다. (Medium은 중간 크기나 강도이지 중앙값이 아닙니다.) |
| The averages are 50, 60, and 70. | The means are 50, 60, and 70. (또는: The averages of the three groups are 50, 60, and 70.) | Average는 명사로 쓸 수 있지만, 여러 그룹을 묘사할 때는 두 형태 모두 가능합니다. 전치사를 보세요: average of이지 averages from이 아닙니다. |
| The range from 5 to 25 | The range is 5 to 25 (또는: the values range from 5 to 25) | 동사 range는 from...to를 쓰고, 명사 range는 is를 씁니다. |
| Median score equals to 80. | Median score equals 80. (또는: The median score is 80.) | Equals는 to를 취하지 않습니다. |
자주 쓰이는 상황
작문 시험의 차트 묘사. "The mean monthly rent in City A is $1,200, but the median is only $850. The gap suggests that a few very high rents are pulling the average up." 점수를 받게 해 주는 종류의 문장입니다. 두 단어가 함께 작동해 이야기를 전합니다 — 대부분의 세입자가 어디에 사는지(median), 그리고 데이터가 얼마나 치우쳐 있는지(median 위의 mean).
연봉 대화. "The average salary at this company is $80K, but I'd be more interested in the median if I were comparing offers." 몇몇 사람이 다른 모두보다 훨씬 많거나 적게 벌 때마다, median이 더 정직한 대푯값입니다. 임금 형평성을 다루는 사람들이 median에 기대는 이유입니다.
스포츠 잡담. "Her scoring range this season was 5 to 25 points. The average was 14, but she had three twenty-plus games." 세 통계 — range, average, 그리고 개별 최고치 — 가 함께 그림을 그리는 것을 보세요.
회의에서 설문 결과. "The mode for favorite color was blue, with 35 percent of responses." 변수가 범주(색, 브랜드, 티셔츠 사이즈)이고 숫자가 아닐 때, mode가 자연스러운 선택입니다.
시험 대비 조언. "Don't worry about the highest mean score on the practice tests — focus on whether your median score is improving week to week." 유난히 좋거나 나쁜 연습일이 며칠 있을 때, median이 mean보다 흐름을 더 정직하게 보여 줍니다.
이 통계들 위에 변화 표현을 얹고 싶다면 — 두 시점 사이에 median이나 average가 어떻게 움직였는지를 묘사하고 싶다면 — Percent, Percentage, Percentage Points: 작은 단어, 큰 실수가 다음 단계입니다. 차트 묘사는 거의 언제나 둘을 함께 쓰기 때문에 통계와 자연스럽게 짝을 이룹니다.
흔한 실수
- average와 median을 바꿔 쓰기. 둘은 같지 않습니다. Average는 합을 개수로 나눈 값입니다. Median은 정렬된 목록의 가운데 값입니다.
- median을 뜻하는 자리에 medium이라고 적거나 말하기. Medium은 크기, 강도, 익힘 정도의 수준을 묘사합니다("medium-rare steak"). Median은 통계입니다.
- range의 정의로 the average of the highest and lowest를 쓰기. Range는 highest minus lowest입니다. 두 값의 평균은 midrange라고도 부르는데, 그것과는 다릅니다.
- mode를 typical의 동의어로 다루기. Mode는 가장 흔한 값이며, 다른 값보다 살짝만 더 자주 나타나도 mode가 됩니다.
- on average 대신 in average라고 말하기. 영어 고정 표현은 on average입니다.
- median이 mean과 같을 수 있다는 점을 잊기. 대칭 데이터 집합에서는 둘이 일치합니다. 차이는 데이터가 한쪽으로 치우쳤을 때 중요해집니다.
- mean, median, mode, range 뒤에 equals to라고 말하기. 동사 equals는 to를 취하지 않습니다. the mean equals 6.
- range를 from...to 없이 동사로 쓰기. 명사 형태는 the range is 5 to 25이고, 동사 형태는 the values range from 5 to 25입니다. 둘을 섞으면 the range from 5 to 25가 되는데, 이는 자연스럽지 않습니다.
미니 연습
데이터 집합 4, 6, 6, 8, 10, 20에 대해 다음에 답해 보세요.
- mean(평균)은 무엇입니까?
- median은 무엇입니까?
- mode는 무엇입니까?
- range는 무엇입니까?
- 어느 값이 outlier이고, 그것이 median과 비교해 mean에 어떤 영향을 줍니까?
정리
통계 영어는 네 단어로 압축됩니다. Mean(또는 average)은 합을 개수로 나눈 값입니다. Median은 정렬된 목록의 가운데 값입니다. Mode는 가장 자주 나오는 값입니다. Range는 최대 빼기 최소입니다. 각각이 다른 이야기를 들려주며, 이들을 함께 써서 — the mean is X, the median is Y, the range is Z — 자신감 있고 정확하게 들리는 차트 묘사를 만들 수 있습니다. 옳은 발상에 옳은 단어를 고르면, 데이터가 학습자를 대신해 말해 줍니다.
실제 시험 문장 속에서 숫자, 수량 표현, 단위를 연습하고 싶다면? ExamRift에서 연습을 시작해 보세요.
