TOEIC 점수 해독: 10-990과 0-200이 실제로 의미하는 것

TOEIC 성적표를 보면서 왜 Listening과 Reading은 10-990 척도로 보고되는데 Speaking과 Writing은 각각 0-200 척도를 쓰는지 의아했다면, 혼자만 그런 것은 아닙니다. 두 척도는 임의로 정해진 것이 아닙니다 — 서로 다른 시험 형식, 서로 다른 통계 모델, 서로 다른 목적을 반영합니다 — 하지만 같은 성적표에 함께 실리기 때문에, 단일한 통합 숫자를 기대하는 응시자들을 종종 혼란스럽게 만듭니다.

이 가이드는 두 척도를 차례로 살펴보며, 원점수가 어떻게 척도 점수로 바뀌는지 설명하고, 성적표의 다른 모든 요소 — 측정의 표준오차(SEM), Abilities Measured 백분율, 인증서 색상 등급, Speaking 인증서의 Pronunciation과 Intonation 기술어 — 를 해독합니다.

두 시험, 두 척도

TOEIC은 하나의 시험이 아니라 두 개의 별개 평가입니다.

TOEIC Listening & Reading (L&R): 2시간 객관식 시험으로 Listening 100문항과 Reading 100문항, 10-990점으로 채점
TOEIC Speaking & Writing (S&W): 약 80분의 수행 시험으로 Speaking 11과제와 Writing 8과제, 각 파트가 0-200점으로 채점

응시자는 어느 쪽이든 독립적으로 볼 수 있습니다. 많은 기업 응시자는 L&R만 응시하며, 산출 기술을 입증해야 하는 학술·전문직 응시자는 별도 세션으로 S&W를 봅니다. 두 시험은 서로 다른 시기에 서로 다른 용도로 설계되었고, ETS는 통합 점수를 강제하지 않고 과거 척도를 유지했습니다.

왜 L&R은 10-990인가?

10-990 척도는 1979년 최초의 TOEIC 시험에서 유래했으며, 백분율처럼 보이지 않도록 채택되었습니다. 각 섹션(Listening, Reading)은 독립적으로 5-495 사이에서 5점 단위로 척도화되며, 두 섹션이 합산되어 총점이 됩니다. 0점을 받는 사람은 없습니다 — 찍기만 해도 0이 아닌 척도 점수가 산출되기 때문입니다.

왜 S&W는 0-200인가?

S&W 시험은 2006-2007년에 다른 채점 철학으로 출시되었습니다. 응답은 인간이 채점하고 과제 수가 더 적기 때문에, 0-200 척도의 10점 단위는 객관식 등화보다는 채점자 판단의 입도를 반영합니다. 두 척도를 따로 유지하는 이유는, 두 결과를 평균내면 매우 다른 근거 자료가 가려지기 때문입니다.

척도 점수가 도출되는 방식: 등화(Equating) 이야기

여러분의 원점수 — 맞힌 문항 수 — 는 성적표에 나타나는 숫자가 아닙니다. ETS는 **등화(equating)**라는 통계 절차를 적용해 시험 폼 간의 작은 난이도 차이를 보정합니다.

Form A의 Reading 섹션이 Form B보다 살짝 쉽다고 가정합시다. 두 폼이 단순 원점수로 채점되면 Form A를 본 응시자가 부당하게 유리해집니다. 등화는 각 폼의 원점수를 공통 척도로 매핑하여, 예컨대 Reading 400이라는 척도 점수가 어느 폼에 앉았든 같은 능력을 의미하도록 합니다.

그래서 이렇게 됩니다.

원점수는 보고되지 않습니다. 성적표에 "100점 만점에 87점"이라고 적히지 않습니다.
같은 원점수가 시행에 따라 다른 척도 점수를 낼 수 있습니다.
척도는 시간이 지나도 안정적입니다. 2020년의 750점과 2026년의 750점은 같은 영어 능력 수준을 나타냅니다. 특정 문제와 응시자 모집단은 다를지라도 말이죠.

L&R은 문항 반응 이론(IRT, Item Response Theory) 등화를 사용하며, 두 섹션 모두 KR-20 신뢰도 계수가 대략 0.90 이상입니다 — 같은 응시자가 평행 폼을 응시할 때 시험이 일관된 결과를 만들어낸다는 뜻입니다.

측정의 표준오차: 왜 '진점수(true score)'가 요동치는가

어떤 시험도 — TOEIC도, TOEFL도, IELTS도 — 완벽하게 정확한 능력 수준을 보고하지 못합니다. 모든 척도 점수에는 **측정의 표준오차(SEM, standard error of measurement)**가 따라붙으며, 이는 보고된 숫자 주위의 잡음 크기를 수치화합니다.

TOEIC L&R의 경우 SEM은 섹션당 약 ±25 척도 점수입니다. 즉 Listening 점수가 400으로 보고되었다면, 여러분의 '진점수'(무한 시행의 평균)는 약 68%의 확률로 375-425 사이에, 약 95%의 확률로 대략 350-450 사이에 있습니다.

실무에서 SEM이 의미하는 것

오늘 700점을 받고 다음 달 재시험에서 720점을 받았다면, 그 20점 상승은 거의 확실히 실제 향상이 아니라 측정 잡음입니다. 두 시행을 비교할 때의 **차이의 표준오차(SE_diff)**는 L&R 총점 척도에서 대략 ±35점입니다. 거친 경험칙은 다음과 같습니다.

관찰된 변화	해석
0-20점	잡음일 가능성 큼; 능력상 의미 있는 변화 없음
20-40점	모호함; 잡음일 수도, 소폭 향상일 수도
40점 이상	실제 능력 변화일 가능성 큼
70점 이상	상당한 변화, 거의 확실히 실제 향상

기업 채용 기준선이 응시자에게 목표 점수를 여유 있게 상회할 것을 요구하는 이유가 여기 있습니다. "최저 700"을 요구하는 회사는 695와 705가 통계적으로 구분되지 않는다는 사실을 알고 있으므로, 많은 인사 부서가 공표된 최저보다 30-50점 위에 내부 커트라인을 둡니다.

S&W의 SEM

S&W 점수가 10점 단위로 보고되는 이유는, 이보다 세밀한 구분을 뒷받침할 측정 정밀도가 없기 때문입니다. Speaking 140과 150은 진정으로 다른 수행 밴드를 의미하지만, Speaking 143은 통계적으로 무의미하므로 ETS는 그 수준으로 보고하지 않습니다.

TOEIC L&R 점수 범위와 그 의미

ETS 능력 기술어와 기업 활용 가이드에서 도출된, 총 L&R 점수에 대한 흔히 인용되는 해석은 다음과 같습니다.

총점	CEFR (근사)	실무 영어 능력
905-990	C1-C2	원어민에 가까운 업무 수행 능력; 복잡한 협상, 뉘앙스 있는 서면 의사소통, 기술 논의 가능
785-900	B2-C1	강한 업무 수행 능력; 회의에 자신 있게 참여, 전문 이메일 작성, 대부분의 비즈니스 콘텐츠 이해 가능
605-780	B1-B2	기능적 업무 수행 능력; 일상적 직장 상호작용과 표준 서신 처리 가능, 간헐적 공백
405-600	A2-B1	제한적 업무 수행 능력; 기본적 요구 전달, 단순 지시 이해, 추상적·기술적 주제에 어려움
255-400	A2	초급 능력; 예측 가능한 교환만 처리
10-250	A1	기초 정형 영어; 구(phrase) 수준의 이해와 산출

이 범위는 가이드라인이지 계약상 기준선이 아닙니다. 많은 고용주는 직무 기능에 따라 자체 커트라인을 발표합니다(예: 고객 서비스 600, 국제 영업 750, 임원직 850).

L&R 인증서 색상 등급

TOEIC L&R 응시자는 점수 밴드를 반영하는 색상 코드가 부여된 인증서를 받습니다. 일반적인 등급 체계는 다음과 같습니다.

색상	점수 범위	능력 요약
Gold	860-990	대부분의 업무 상황을 자신 있게 처리 가능
Blue	730-855	사회·직장 의사소통의 필요 충족 가능
Green	470-725	명확한 기초 대화 가능
Brown	220-465	제한적, 일상적 교환 처리 가능
Orange	10-215	기초 정형 영어만 가능

이 기준선은 널리 인용되지만 지역별로 달라질 수 있습니다. 각 ETS Preferred Network(EPN) — 해당 시장의 국가별 시행기관 — 는 인증서 표기에 일정한 재량을 가지며, 일부 국가에서는 밴드 경계가 소폭 다릅니다. 특정 커트라인이 중요하다면(예: 채용 담당자가 "Gold 레벨"을 요청했다면) 현지 EPN에 정확한 기준선을 확인하세요.

Abilities Measured 세부 내역

모든 L&R 성적표에는 Abilities Measured 섹션이 포함되어, 섹션별로 다섯 가지 기술 영역에서 맞힌 비율을 보고합니다. 이는 정말 유용한 진단 정보입니다 — 단일 척도 점수보다 훨씬 실행 가능한 지침이 됩니다.

Listening Abilities Measured

Can infer gist, purpose, and basic context based on information explicitly stated in short spoken texts (Parts 1-2 영역)
Can infer gist, purpose, and basic context based on information explicitly stated in extended spoken texts (Parts 3-4의 요지 문제)
Can understand details in short spoken texts (Part 2 세부 문제, Part 1 사진 세부)
Can understand details in extended spoken texts (Parts 3-4 세부 문제)
Can understand a speaker's purpose or implied meaning (화용적 이해; 의도, 어조, 간접 화법)

Reading Abilities Measured

Can locate and understand specific information in tables and passages (Parts 5-7 스캐닝)
Can connect information across multiple sentences in a single text and across texts (Parts 6-7 복합 지문 추론)
Can make inferences based on information in written texts (Part 7 함축 의미)
Can understand vocabulary in workplace texts (Part 5 어휘 문항)
Can understand grammar in workplace texts (Part 5 문법 형태)

Abilities Measured로 공부하기

전체 Listening 점수가 350인데 세부 문제에서 85%, 화용적·함축 의미에서 40%라면, 어디에 연습을 집중해야 할지 정확히 알 수 있습니다. 대부분의 응시자는 일반적인 전체 길이 모의고사를 반복하는 것보다 가장 약한 능력 영역을 집중 훈련할 때 가장 빠르게 향상됩니다.

TOEIC S&W 점수 범위와 기술어

Speaking과 Writing 척도는 각각 10점 단위로 0-200입니다. 각 파트는 자체 능력 기술어 밴드를 발표합니다.

Speaking 능력 밴드

Speaking 섹션은 11개 과제입니다. 과제 1-10은 각 0-3점으로 채점되고, 과제 11은 0-5점으로 채점되어 최대 원점수 40이 산출되며, 이후 0-200 척도로 변환됩니다. ETS는 8개 능력 기술어 밴드를 발표합니다.

척도 점수	능력 수준
190-200	최상위 숙달; 뉘앙스 있는 의견, 복잡한 통사, 원어민에 가까운 전달
160-180	숙달; 명확한 의견과 근거, 경미한 발음·문법 문제
130-150	효과적; 대체로 이해 가능, 약간의 머뭇거림과 제한된 범위
110-120	기능적; 예측 가능한 맥락에서 이해 가능, 잦은 멈춤
80-100	제한적; 짧은 구, 정형 표현에 크게 의존
60-70	기초; 따라가기 어려움, 심하게 제한된 어휘
40-50	최소; 단어와 암기 구문만
0-30	구어 영어로 의미 있는 기능 불가

Writing 능력 밴드

Writing 섹션은 8개 과제입니다. Q1-5는 0-3점, Q6-7은 0-4점, Q8은 0-5점으로 채점되어 다시 0-200 척도로 변환됩니다. ETS는 9개 능력 기술어 밴드를 발표합니다.

척도 점수	능력 수준
200	완전 숙달; 정교함, 잘 구성됨, 최소한의 오류
170-190	최상위 숙달; 강한 근거를 갖춘 확장된 의견
140-160	숙달; 간간이 오류가 있는 일관된 의견
110-130	효과적; 명확한 기초 의사소통; 제한된 범위
90-100	기능적; 단순 문장, 잦은 오류
70-80	제한적; 파편화된 아이디어, 심각한 문법 문제
50-60	최소; 구 수준의 쓰기만
40	기능 이전; 간신히 이해 가능
0-30	의미 있는 영어 쓰기 불가

Speaking 인증서의 Pronunciation과 Intonation

TOEIC Speaking 인증서의 특징 중 하나는, 숫자가 아니라 3단계 밴드로 표시되는 두 가지 하위 기술어가 포함된다는 점입니다.

Pronunciation: Low / Medium / High
Intonation and Stress: Low / Medium / High

이 레이블은 소리의 명료성(자음, 모음, 단어 강세)과 문장 수준 프로소디의 자연스러움(리듬, 음조 곡선, 강조 배치)에 대한 채점자 판단을 반영합니다.

Speaking 150을 받은 응시자는 다음처럼 받을 수 있습니다.

Pronunciation: Medium
Intonation: Medium

**180+**를 받은 응시자는 거의 언제나 둘 다 High를 받으며, 110 미만 응시자는 보통 최소한 하나에서 Low를 받습니다.

일부 고용주 — 특히 고객 대면이나 국제 의사소통 직무 — 는 이 기술어들을 특별히 봅니다. 하위 기술어에서 "High / High"를 받은 160 응시자가 "Medium / Low"를 받은 170 응시자보다 선호될 수 있습니다. 해당 직무에서는 어휘 범위보다 명료성이 더 중요하기 때문입니다.

S&W 점수 산출 방식

L&R과 달리 S&W 응답은 Online Network for Evaluation(ONE)을 통해 ETS 공인 채점관이 평가합니다. 각 응답은 보통 여러 채점자가 채점하며, 불일치는 조정(adjudication)을 통해 해결됩니다. Speaking 루브릭은 pronunciation, intonation and stress, grammar, vocabulary, cohesion, content relevance를 다루고, Writing 루브릭은 grammar, vocabulary, organization, relevance, task completion을 다루며 — 각각 과제 유형에 따라 다르게 적용됩니다. 채점자 점수는 합산된 뒤, 안정성 유지를 위해 주기적으로 갱신되는 변환표를 이용해 0-200 척도로 매핑됩니다.

백분위: 전 세계에서 당신의 위치

성적표에는 백분위 순위도 표시됩니다 — 여러분의 점수 이하로 득점한 전 세계 응시자의 비율이죠. ETS는 매년 5월 최근 3년 응시자 모집단을 바탕으로 이 표를 갱신합니다. 거친 참조점: 990은 99 백분위 이상, 900은 약 90, 800은 약 75, 700은 약 55, 500은 약 20 백분위입니다. 백분위는 경쟁적 선발(장학금, 국제 채용 풀)에서 중요하지만, 고용주의 절대 기준선을 바꾸지는 않습니다.

성적표 읽기: 실무 체크리스트

TOEIC 성적표를 받으면 다음 순서로 살펴보세요.

총점 — 목표와 SEM을 비교. 요구되는 최저보다 여유가 ±25보다 큰가?
섹션 점수 — 한 섹션이 다른 섹션을 끌어내리고 있는가? 그렇다면 다음 준비 라운드는 그쪽에 집중
Abilities Measured 백분율 — 10개(Listening 5 + Reading 5) 능력 영역 중 가장 약한 두 개 식별. 가장 높은 레버리지의 학습 목표
(S&W 전용) 능력 기술어 — 점수뿐 아니라 해당 밴드의 단락 수준 기술어 전체를 읽을 것. 기술어는 어떤 구체적 행동이 상위 밴드로 끌어올리는지 알려줍니다
(S&W 전용) Pronunciation / Intonation 레이블 — 어느 한쪽이 "Low"라면 표적화된 음성학·프로소디 연습이 일반적 말하기 연습보다 훨씬 빠른 가시적 향상을 만듭니다
백분위 순위 — 경쟁적 선발 맥락에서만 관련. 그 외에는 절대 점수에 집중

흔한 오해들

"Listening Abilities 세부 내역에서 87%를 받았으니 Listening 점수는 870이어야 한다." 아닙니다. Abilities Measured 백분율은 진단 범주 백분율이지, 척도 점수의 기반이 아닙니다. 척도 점수는 모든 문항에 대한 전면적 등화 IRT 모델을 반영하며, 문항 난이도에 따라 가중치가 부여됩니다.

"나는 720점, 친구는 740점을 받았으니 친구가 더 영어를 잘한다." 서로 ±35 이내에서는 점수가 통계적으로 구분되지 않습니다. 720과 740은 운영상 같은 점수입니다. 대략 70점 이상의 격차만이 실제 능력 차이를 안정적으로 반영합니다.

"다음 색상 등급 도달에 집중하겠다." 동기 부여용 목표로는 좋지만, 등급 경계는 이산적인 반면 능력은 연속적입니다. 855(Blue 최상단)는 기능적으로 860(Gold 최하단)과 동일합니다. 경계에서 색상을 과대평가하지 마세요.

결론

TOEIC이 두 개의 서로 다른 척도를 사용하는 이유는, 서로 다른 시기에 서로 다른 목적으로 구축된 두 개의 다른 시험이기 때문입니다. 두 척도 모두 엄정하게 등화되고, 합리적으로 신뢰할 수 있으며, 풍부한 진단 정보가 함께 제공됩니다 — 읽는 법만 안다면 말이죠. TOEIC 응시자가 기를 수 있는 가장 중요한 습관은, 첫 번째 읽기로 총점을 무시하고 곧장 Abilities Measured 세부 내역(L&R)이나 능력 기술어 단락(S&W)으로 향하는 것입니다. 실행 가능한 정보는 거기에 있습니다.

SEM을 이해하고, 목표 설정에 ±25를 반영하며, 시행 간 10점 변동에 휘둘리지 마세요 — 그것은 잡음입니다. 준비 사이클당 40-70점의 의미 있는 상승을 목표로 하고, 차별화되지 않은 전체 길이 연습보다 발목을 잡는 구체적 능력 영역을 집중 학습하세요.

점수를 의미 있게 끌어올릴 준비가 되셨나요? ExamRift은 능력 영역별 진단이 포함된 TOEIC L&R 적응형 전체 모의고사를 제공합니다 — 다섯 가지 Listening과 다섯 가지 Reading 능력 중 어느 것이 점수를 깎고 있는지 정확히 볼 수 있고, 가장 약한 영역을 표적화한 훈련을 할 수 있습니다. 모든 세션에는 AI가 생성한 어휘·기능 표현·해설 보충자료가 함께 제공되어, 각 문항이 집중된 학습의 순간으로 탈바꿈합니다. 오늘 무료 연습을 시작해 실제 실력을 확인해보세요.