TOEIC 分數解碼：10-990 同 0-200 實際代表咩

如果你睇過 TOEIC 分數報告，並且諗過點解 Listening 同 Reading 用 10-990 量表，而 Speaking 同 Writing 各自用 0-200 量表，你並唔係孤單。呢兩個量表並唔係隨意嘅 — 佢哋反映唔同嘅考試形式、唔同嘅統計模型同唔同嘅用途 — 但佢哋落喺同一份報告上，經常令期望睇到單一統一數字嘅應試者感到混淆。

本指南會講解兩個量表，解釋原始答案點樣變成 scaled 分數，並解碼報告上每一個其他元素：量度標準誤差（SEM）、Abilities Measured 百分比、證書顏色等級，以及 Speaking 證書上嘅 Pronunciation 同 Intonation 等級。

兩個考試、兩個量表

TOEIC 唔係一個考試，而係兩個獨立評估：

TOEIC Listening & Reading（L&R）：一個兩小時嘅選擇題考試，Listening 同 Reading 各 100 題，分數 10-990。
TOEIC Speaking & Writing（S&W）：一個大約 80 分鐘嘅表現型考試，包括 11 條 Speaking 任務同 8 條 Writing 任務，每一半分數 0-200。

應試者可以單獨考其中一半。好多公司應試者只考 L&R；需要證明產出技能嘅學術或者專業應試者就會喺另一場 session 考 S&W。呢兩個考試喺隔咗幾年後因應唔同用途設計，ETS 保留咗歷史量表，而冇將佢哋強行統一成一個分數。

點解 L&R 用 10-990？

10-990 量表源自 1979 年最初嘅 TOEIC 考試，揀呢個範圍係為咗避免畀人覺得係百分比。每個 section（Listening、Reading）獨立量化為 5-495，以 5 分為單位，兩者相加成為總分。冇人會攞 0 分，因為就算靠估都會產生非零嘅 scaled 分數。

點解 S&W 用 0-200？

S&W 喺 2006-2007 年推出，採用唔同嘅評分理念。回答係由人手評分，而任務數量較少，所以採用 0-200 嘅 10 分為單位嘅量表，反映嘅係評分員判斷嘅粒度，而唔係選擇題嘅 equating。兩個量表保持獨立，係因為將佢哋平均會掩蓋好唔同嘅底層證據。

Scaled 分數係點樣得出嚟：Equating 嘅故事

你嘅原始分數 — 即係答啱題目嘅總數 — 唔係出現喺分數報告上嘅數字。ETS 採用一個叫 equating 嘅統計過程，調整唔同試卷之間細微嘅難度差異。

假設 Form A 嘅 Reading section 比 Form B 容易少少。如果兩份試卷只係按原始計數評分，考 Form A 嘅應試者就有不公平優勢。Equating 解決呢個問題嘅方法係將每份試卷嘅原始分數對應到一個共同量表，等住一個 Reading 嘅 scaled 分數（例如 400 分）代表同樣嘅能力，無論你考嘅係邊份試卷。

呢個就解釋咗點解：

原始分數從唔報告。 你唔會喺報告上見到「100 題對 87 題」。
同樣嘅原始計數可以喺唔同場次產生唔同嘅 scaled 分數。
個量表隨時間保持穩定。 2020 年嘅 750 同 2026 年嘅 750 代表同等嘅英文能力水平，就算具體題目同應試者群體有所不同。

L&R 採用項目反應理論（Item Response Theory，IRT）嘅 equating，兩個 section 嘅 KR-20 信度系數約為 0.90 或以上 — 意思係當同一個應試者考唔同形式嘅試卷，個考試會產生一致嘅結果。

量度標準誤差：點解你嘅「真實分數」會浮動

冇任何考試 — 包括 TOEIC、TOEFL 或者 IELTS — 報告完全精確嘅能力水平。每個 scaled 分數都帶有 量度標準誤差（SEM），用嚟量化所報告數字周圍嘅噪音。

對於 TOEIC L&R，SEM 大約 每個 section ±25 scaled 分。咁意思係如果你報告嘅 Listening 分數係 400，咁你嘅「真實」分數（即係喺無限次應試嘅平均值）大約有 68% 機率會喺 375-425 之間，並有大約 95% 機率會喺 350-450 之間。

SEM 喺實際上代表咩

如果你今日考咗 700 分，下個月再考考咗 720 分，咁 20 分嘅升幅幾乎肯定係量度噪音，唔係真正嘅進步。比較兩次考試之間嘅 差異標準誤差（SE_diff） 喺整個 L&R 量表上大約係 ±35 分。簡單嘅經驗法則：

觀察到嘅變化	解讀
0-20 分	可能係噪音；能力冇實質變化
20-40 分	模糊不清；可能係噪音或者輕微進步
40+ 分	可能係能力嘅真實變化
70+ 分	顯著進步，幾乎肯定係真實

呢個就解釋咗點解公司招聘門檻通常要求應試者 以舒適嘅幅度 達標。一間要求「最低 700」嘅公司知道 695 同 705 喺統計上係冇分別嘅，所以好多 HR 部門會將內部標準訂喺所述最低分以上 30-50 分。

S&W 嘅 SEM

S&W 分數以 10 分為單位報告，係因為底層量度精度唔支援更細嘅區分。Speaking 嘅 140 同 150 分代表真正唔同嘅表現等級；而 143 嘅 Speaking 分數喺統計上冇意義，所以 ETS 唔報告到咁細嘅層次。

TOEIC L&R 分數範圍同代表意義

以下係 L&R 總分常見嘅解讀，源自 ETS 嘅能力描述同公司用法指引：

總分	CEFR（約）	實際英語能力
905-990	C1-C2	接近母語嘅工作能力；可處理複雜談判、細緻嘅書面溝通、技術討論
785-900	B2-C1	強嘅工作能力；可自信地參與會議、寫專業 email、理解大部分商業內容
605-780	B1-B2	功能性工作能力；可處理日常職場互動同標準書信，偶有理解差距
405-600	A2-B1	有限工作能力；可溝通基本需要、跟簡單指令，喺抽象或者技術話題上有困難
255-400	A2	初級能力；只可處理高度可預測嘅交流
10-250	A1	基本套語式英文；短語層面嘅理解同產出

呢啲範圍係指引，唔係合約上嘅門檻。好多僱主會根據工作職能公佈自己嘅標準（例如客戶服務 600、國際銷售 750、行政管理 850）。

L&R 證書顏色等級

考 TOEIC L&R 嘅應試者會收到一張帶顏色代碼嘅證書，反映分數等級。常見嘅等級結構係：

顏色	分數範圍	能力概述
Gold	860-990	可自信地處理大多數工作場合
Blue	730-855	可滿足社交同職場溝通需要
Green	470-725	可進行清晰嘅基本對話
Brown	220-465	可處理有限嘅日常交流
Orange	10-215	只可進行基本套語式英文

呢啲門檻被廣泛引用，但 可能因地區而異。每個 ETS Preferred Network（EPN）— 即係特定市場嘅國家管理者 — 對證書呈現有一定酌情權，部分國家嘅等級邊緣會有輕微差異。如果特定門檻對你重要（例如招聘經理要求「Gold 等級」），請向本地 EPN 確認準確門檻。

Abilities Measured 細項

每份 L&R 分數報告都包括一個 Abilities Measured 部分，報告你喺每個 section 五個技能範疇嘅答對百分比。呢個係真正有用嘅診斷資訊 — 比單一 scaled 分數更具行動性。

Listening Abilities Measured

能根據短篇口語文本中明確陳述嘅資訊推斷主旨、目的同基本背景（Part 1-2 範圍）。
能根據較長口語文本中明確陳述嘅資訊推斷主旨、目的同基本背景（Part 3-4 主旨題）。
能理解短篇口語文本中嘅細節（Part 2 細節題、Part 1 照片細節）。
能理解較長口語文本中嘅細節（Part 3-4 細節題）。
能理解說話者嘅目的或者隱含意義（語用理解；意圖、語氣、間接陳述）。

Reading Abilities Measured

能喺表格同文章中定位並理解特定資訊（Part 5-7 掃讀任務）。
能將單一文本內多個句子之間以及多個文本之間嘅資訊連結起嚟（Part 6-7 跨多文本推理）。
能根據書面文本中嘅資訊作出推斷（Part 7 隱含意義）。
能理解職場文本中嘅詞彙（Part 5 詞彙項目）。
能理解職場文本中嘅文法（Part 5 文法形式）。

用 Abilities Measured 嚟備試

如果你嘅整體 Listening 分數係 350，但細項顯示細節題答對 85%、語用/隱含意義答對 40%，你就確切知道喺邊度針對性練習。多數應試者透過鑽研最弱嘅能力範疇而非做通用嘅完整模擬試，進步得最快。

TOEIC S&W 分數範圍同等級描述

Speaking 同 Writing 量表各自為 0-200，以 10 分為單位。每一半都公佈自己嘅能力描述等級。

Speaking 能力等級

Speaking section 有 11 條任務。任務 1-10 各自評 0-3 分，任務 11 評 0-5 分，最高原始分數為 40，再轉換為 0-200 量表。ETS 公佈 8 個能力描述等級：

Scaled 分數	能力水平
190-200	高度熟練；細緻嘅意見、複雜嘅句法、近母語嘅表達
160-180	熟練；清晰嘅意見同推理，輕微嘅發音或者文法問題
130-150	有效；大致可理解，有啲猶豫同有限嘅範圍
110-120	功能性；喺可預測嘅情境中可理解，停頓頻繁
80-100	有限；短語、嚴重依賴套語式語言
60-70	基本；難以跟上、詞彙嚴重不足
40-50	最低限度；只能說出單字同記住嘅短語
0-30	喺英文口語上冇有意義嘅功能

Writing 能力等級

Writing section 有 8 條任務。Q1-5 評 0-3 分，Q6-7 評 0-4 分，Q8 評 0-5 分，再轉換為 0-200 量表。ETS 公佈 9 個能力描述等級：

Scaled 分數	能力水平
200	精通；精細、組織良好、極少錯誤
170-190	高度熟練；有強力支持嘅延伸意見
140-160	熟練；連貫嘅意見，偶有錯誤
110-130	有效；清晰嘅基本溝通；範圍有限
90-100	功能性；簡單句子、頻繁錯誤
70-80	有限；零碎嘅想法、嚴重文法問題
50-60	最低限度；只係短語層面嘅寫作
40	前功能性；勉強可理解
0-30	無法產出有意義嘅書面英文

Speaking 證書上嘅 Pronunciation 同 Intonation

TOEIC Speaking 證書嘅一個獨特之處，係納入兩個唔係以數字形式呈現嘅子等級，而係三層等級：

Pronunciation：Low / Medium / High
Intonation and Stress：Low / Medium / High

呢啲標籤反映評分員對你嘅發音清晰度（輔音、元音、重音）以及句子層面嘅韻律自然度（節奏、音調起伏、強調位置）嘅判斷。

一個 Speaking 攞 150 分 嘅應試者可能會收到：

Pronunciation：Medium
Intonation：Medium

一個 180+ 嘅應試者幾乎一定喺兩項都收到 High；而 110 分以下嘅應試者通常喺至少一項收到 Low。

某啲僱主 — 特別係面向客戶或者國際溝通職位 — 會具體睇呢啲等級。一個 160 分加「High / High」子等級嘅應試者，可能比一個 170 分加「Medium / Low」嘅應試者更受青睞，因為可理解性對職位嚟講通常比詞彙範圍更重要。

S&W 分數係點樣產生

同 L&R 唔同，S&W 回答透過 Online Network for Evaluation（ONE）由 ETS 認證嘅評分員 評估。每份回答通常由多個評分員打分，差異由仲裁解決。Speaking 評分標準涵蓋發音、語調與重音、文法、詞彙、銜接同內容切題程度；Writing 評分標準涵蓋文法、詞彙、組織、切題程度同任務完整度 — 每個都根據任務類型唔同地應用。評分員分數相加，再用一個定期更新嘅轉換表映射到 0-200 量表，以保持穩定性。

百分位排名：你喺全球嘅位置

你嘅分數報告亦會顯示百分位排名 — 即係全球應試者中喺你嘅分數或者以下嘅百分比。ETS 每年五月根據滾動三年嘅應試者群體更新呢啲表格。粗略嘅參考點：990 係 99 百分位以上、900 係大約 90 百分位、800 大約 75 百分位、700 大約 55 百分位、500 大約 20 百分位。百分位對競爭性選拔（獎學金、國際招聘池）有意義，但唔會改變僱主嘅絕對門檻。

解讀分數報告：實用清單

當你收到 TOEIC 分數報告，按以下次序逐步檢視：

總分 — 同你嘅目標同 SEM 比較。你高於最低要求嘅幅度係咪大過 ±25？
Section 分數 — 係咪有一個 section 拖低咗另一個？如果係，下一輪備試應該針對嗰個 section。
Abilities Measured 百分比 — 喺十個能力範疇（五個 Listening、五個 Reading）中識別出最弱嘅兩個。呢啲就係你嘅最高槓桿學習目標。
（只限 S&W）能力描述 — 讀返你個等級嘅完整段落描述，唔係淨係睇個分數。描述會話畀你聽具體咩行為可以將你推上去。
（只限 S&W）Pronunciation / Intonation 標籤 — 如果其中一項係「Low」，針對性嘅 phonics 同韻律練習會比通用嘅口語練習產生更快可見嘅進步。
百分位排名 — 只有喺競爭性選拔情境下先相關。否則，專注喺絕對分數上。

常見誤解

「我喺 Listening 細項攞咗 87%，咁我 Listening 分應該係 870 啦。」 唔係。Abilities Measured 百分比係診斷性嘅類別百分比，唔係你 scaled 分數嘅基礎。你嘅 scaled 分數反映嘅係跨所有題目嘅完整 equated IRT 模型，按題目難度加權。

「我考咗 720，我朋友考咗 740 — 佢英文好過我。」 喺 ±35 範圍內，分數喺統計上係無法區分嘅。720 同 740 喺操作上係同樣嘅分數。只有大約 70+ 分嘅差距先可靠地反映實際能力差異。

「我會專注衝去下一個顏色等級。」 係一個有激勵作用嘅目標，但等級邊界係離散嘅，而能力係連續嘅。一個 855（Blue 嘅頂部）功能上同 860（Gold 嘅底部）係相等嘅。唔好過度看重邊界上嘅顏色。

總結

TOEIC 採用兩個唔同量表，係因為佢係兩個唔同考試，喺唔同時間因應唔同目的而建立。兩個量表都經過嚴謹 equating、有合理嘅信度，並附帶豐富嘅診斷資訊 — 只要你識讀。TOEIC 應試者最重要嘅一個習慣，就係將總分作為第一步快速參考後即放低，直接去睇 Abilities Measured 細項（L&R）或者能力描述段落（S&W）。可行動嘅資訊就喺嗰度。

理解 SEM、將 ±25 納入你嘅目標設定，並且唔好追求兩次考試之間 10 分嘅波動 — 嗰啲都係噪音。瞄準每個備試週期 40-70 分嘅有意義增長，並研究阻住你嘅特定能力範疇，而唔係做冇針對性嘅完整模擬試。

準備有意義咁推進你嘅分數？ ExamRift 提供完整嘅 TOEIC L&R 適性模擬試，附帶每個能力範疇嘅診斷 — 等你清楚見到五項 Listening 同五項 Reading 能力中邊啲令你失分，並透過針對你最弱範疇嘅練習嚟改善。每節練習都附帶 AI 生成嘅詞彙、功能性短語同解釋補充教材，等每條題目都變成有針對性嘅學習時刻。今日就開始你嘅免費練習，睇下你嘅實際水平喺邊。