Giải mã điểm TOEIC: 10-990 và 0-200 thực sự có nghĩa gì

Giải mã điểm TOEIC: 10-990 và 0-200 thực sự có nghĩa gì

Nếu bạn từng nhìn vào phiếu điểm TOEIC và tự hỏi tại sao Listening và Reading được báo trên thang 10-990 trong khi Speaking và Writing mỗi bài dùng thang 0-200, bạn không đơn độc. Hai thang này không tùy tiện — chúng phản ánh các định dạng thi khác nhau, mô hình thống kê khác nhau, và mục đích khác nhau — nhưng chúng cùng đáp lên một phiếu điểm và thường làm thí sinh bối rối khi kỳ vọng một con số thống nhất.

Hướng dẫn này đi qua cả hai thang, giải thích cách câu trả lời thô trở thành điểm quy đổi, và giải mã mọi thành phần khác trên phiếu điểm của bạn: sai số đo chuẩn (SEM), phần trăm Abilities Measured, các bậc màu chứng chỉ, và các mức Pronunciation và Intonation trên chứng chỉ Speaking.

Hai bài thi, hai thang điểm

TOEIC không phải một bài thi mà là hai đánh giá riêng biệt:

  • TOEIC Listening & Reading (L&R): một bài thi trắc nghiệm hai giờ với 100 câu Listening và 100 câu Reading, chấm 10-990.
  • TOEIC Speaking & Writing (S&W): một bài thi thể hiện khoảng 80 phút với 11 tác vụ Speaking và 8 tác vụ Writing, mỗi nửa chấm 0-200.

Thí sinh có thể thi một nửa độc lập. Nhiều ứng viên doanh nghiệp chỉ thi L&R; ứng viên học thuật hay chuyên môn cần chứng minh kỹ năng sản sinh sẽ ngồi S&W trong buổi riêng. Hai bài thi được thiết kế cách nhau nhiều năm, cho các trường hợp sử dụng khác nhau, và ETS giữ nguyên các thang lịch sử thay vì ép một điểm thống nhất.

Tại sao 10-990 cho L&R?

Thang 10-990 có từ bài thi TOEIC gốc năm 1979 và được chọn để tránh hình thức phần trăm. Mỗi phần (Listening, Reading) được quy đổi độc lập 5-495 với bước 5 điểm, và hai phần cộng lại thành tổng. Không ai đạt 0, vì ngay cả đoán ngẫu nhiên cũng tạo ra điểm quy đổi khác 0.

Tại sao 0-200 cho S&W?

Bài thi S&W ra mắt 2006-2007 với triết lý chấm điểm khác. Phần trả lời được chấm bởi người, và số tác vụ nhỏ hơn, nên thang 0-200 với bước 10 điểm phản ánh độ tinh của phán đoán giám khảo hơn là equating trắc nghiệm. Hai thang được giữ riêng vì tính trung bình chúng sẽ che đi bằng chứng nền tảng rất khác nhau.

Điểm quy đổi được tạo ra như thế nào: Câu chuyện Equating

Điểm thô của bạn — số câu đúng — không phải là thứ xuất hiện trên phiếu điểm. ETS áp dụng một quy trình thống kê gọi là equating để điều chỉnh khác biệt nhỏ về độ khó giữa các đề.

Giả sử Form A có phần Reading hơi dễ hơn Form B. Nếu cả hai đề chỉ được chấm bằng đếm thô, ứng viên thi Form A sẽ có lợi thế không công bằng. Equating giải quyết bằng cách ánh xạ điểm thô của từng đề về một thang chung sao cho điểm quy đổi 400 ở Reading chẳng hạn, đại diện cho cùng một năng lực bất kể bạn ngồi đề nào.

Đó là lý do:

  • Điểm thô không bao giờ được báo. Bạn sẽ không thấy "87/100" trên phiếu điểm.
  • Cùng một số câu đúng có thể cho điểm quy đổi khác nhau qua các lần thi.
  • Thang điểm ổn định theo thời gian. 750 năm 2020 và 750 năm 2026 đại diện cho cùng trình độ tiếng Anh, dù câu hỏi cụ thể và nhóm ứng viên khác nhau.

L&R dùng equating Item Response Theory (IRT), với hệ số tin cậy KR-20 khoảng 0,90 trở lên cho cả hai phần — nghĩa là bài thi cho kết quả nhất quán khi cùng ứng viên thi các đề song song.

Sai số đo chuẩn: Tại sao "điểm thực" của bạn dao động

Không bài thi nào — không TOEIC, không TOEFL, không IELTS — báo cáo một mức năng lực chính xác tuyệt đối. Mỗi điểm quy đổi đi kèm sai số đo chuẩn (SEM), định lượng lượng nhiễu bao quanh con số được báo.

Với TOEIC L&R, SEM xấp xỉ ±25 điểm quy đổi mỗi phần. Điều này nghĩa là nếu điểm Listening được báo của bạn là 400, "điểm thực" (trung bình qua vô số lần thi) nằm trong khoảng 375-425 với xác suất khoảng 68%, và trong khoảng 350-450 với xác suất khoảng 95%.

SEM có nghĩa gì trong thực tế

Nếu bạn đạt 700 hôm nay và thi lại tháng sau đạt 720, mức tăng 20 điểm đó gần như chắc chắn là nhiễu đo, không phải cải thiện thực. Sai số chuẩn của hiệu (SE_diff) khi so sánh hai lần thi xấp xỉ ±35 điểm trên thang tổng L&R. Quy tắc kinh nghiệm sơ bộ:

Thay đổi quan sát Diễn giải
0-20 điểm Nhiều khả năng là nhiễu; không có thay đổi thực về năng lực
20-40 điểm Mơ hồ; có thể là nhiễu hoặc cải thiện vừa phải
40+ điểm Nhiều khả năng là thay đổi thực về năng lực
70+ điểm Đáng kể, gần như chắc chắn là cải thiện thực

Đó là lý do các ngưỡng tuyển dụng doanh nghiệp thường yêu cầu ứng viên đạt điểm mục tiêu vượt một khoảng thoải mái. Một công ty yêu cầu "tối thiểu 700" biết rằng 695 và 705 không phân biệt được về mặt thống kê, nên nhiều phòng nhân sự đặt ngưỡng nội bộ cao hơn 30-50 điểm so với mức tối thiểu công bố.

SEM cho S&W

Điểm S&W được báo theo bước 10 điểm vì độ chính xác đo lường nền tảng không hỗ trợ phân biệt tinh hơn. Một điểm Speaking 140 và 150 đại diện cho các dải thành tích thực sự khác nhau; một điểm Speaking 143 sẽ không có ý nghĩa thống kê, nên ETS không báo đến mức đó.

Dải điểm TOEIC L&R và ý nghĩa

Đây là diễn giải thường trích dẫn cho tổng điểm L&R, rút từ các mô tả trình độ của ETS và hướng dẫn sử dụng doanh nghiệp:

Tổng điểm CEFR (xấp xỉ) Khả năng tiếng Anh thực tế
905-990 C1-C2 Trình độ làm việc gần như bản ngữ; xử lý được đàm phán phức tạp, giao tiếp văn bản sắc thái, thảo luận kỹ thuật
785-900 B2-C1 Trình độ làm việc mạnh; tham gia tự tin trong họp, viết email chuyên nghiệp, hiểu hầu hết nội dung kinh doanh
605-780 B1-B2 Trình độ làm việc chức năng; xử lý tương tác công sở thường quy và thư từ tiêu chuẩn với vài chỗ thiếu
405-600 A2-B1 Trình độ làm việc hạn chế; truyền đạt nhu cầu cơ bản, theo hướng dẫn đơn giản, khó với chủ đề trừu tượng hay kỹ thuật
255-400 A2 Trình độ sơ cấp; chỉ xử lý được các trao đổi dự đoán được cao
10-250 A1 Tiếng Anh cơ bản theo công thức; hiểu và sản sinh ở mức cụm từ

Các dải này là hướng dẫn, không phải ngưỡng hợp đồng. Nhiều nhà tuyển dụng công bố ngưỡng riêng dựa trên chức năng công việc (ví dụ, 600 cho dịch vụ khách hàng, 750 cho kinh doanh quốc tế, 850 cho vị trí cấp cao).

Các bậc màu chứng chỉ L&R

Ứng viên thi TOEIC L&R nhận chứng chỉ có mã màu phản ánh dải điểm. Cấu trúc bậc phổ biến là:

Màu Dải điểm Tóm tắt trình độ
Gold 860-990 Xử lý hầu hết tình huống công việc tự tin
Blue 730-855 Đáp ứng nhu cầu giao tiếp xã hội và công sở
Green 470-725 Có thể thực hiện hội thoại cơ bản, rõ ràng
Brown 220-465 Xử lý các trao đổi hạn chế, thường quy
Orange 10-215 Chỉ tiếng Anh cơ bản theo công thức

Các ngưỡng này được trích dẫn rộng rãi nhưng có thể khác nhau theo khu vực. Mỗi ETS Preferred Network (EPN) — cơ quan quản lý quốc gia ở một thị trường — có một số quyền quyết định về cách trình bày chứng chỉ, và các biến thể nhỏ ở ranh giới dải xảy ra ở một số quốc gia. Nếu một ngưỡng cụ thể quan trọng với bạn (ví dụ, quản lý tuyển dụng yêu cầu "mức Gold"), hãy xác nhận ngưỡng chính xác với EPN địa phương.

Bảng phân tích Abilities Measured

Mỗi phiếu điểm L&R bao gồm mục Abilities Measured báo cáo tỷ lệ phần trăm đúng của bạn qua năm lĩnh vực kỹ năng trong mỗi phần. Đây là thông tin chẩn đoán thực sự hữu ích — hành động được hơn nhiều so với điểm quy đổi đơn lẻ.

Listening Abilities Measured

  1. Có thể suy luận ý chính, mục đích, và bối cảnh cơ bản dựa trên thông tin được nêu rõ trong bài nói ngắn (lãnh địa của Part 1-2).
  2. Có thể suy luận ý chính, mục đích, và bối cảnh cơ bản dựa trên thông tin được nêu rõ trong bài nói mở rộng (câu hỏi ý chính của Part 3-4).
  3. Có thể hiểu chi tiết trong bài nói ngắn (câu hỏi chi tiết Part 2, chi tiết ảnh Part 1).
  4. Có thể hiểu chi tiết trong bài nói mở rộng (câu hỏi chi tiết Part 3-4).
  5. Có thể hiểu mục đích hay ý nghĩa ngụ ý của người nói (hiểu ngữ dụng; ý định, giọng điệu, lời nói gián tiếp).

Reading Abilities Measured

  1. Có thể định vị và hiểu thông tin cụ thể trong bảng và đoạn văn (tác vụ quét Part 5-7).
  2. Có thể kết nối thông tin qua nhiều câu trong một văn bản và qua nhiều văn bản (suy luận qua bộ đa văn bản Part 6-7).
  3. Có thể đưa ra suy luận dựa trên thông tin trong văn bản (nghĩa ngụ ý Part 7).
  4. Có thể hiểu từ vựng trong văn bản công sở (mục từ vựng Part 5).
  5. Có thể hiểu ngữ pháp trong văn bản công sở (hình thức ngữ pháp Part 5).

Sử dụng Abilities Measured để học

Nếu tổng điểm Listening của bạn là 350 nhưng bảng phân tích cho thấy 85% ở câu hỏi chi tiết và 40% ở nghĩa ngụ ý/ngữ dụng, bạn biết chính xác nên nhắm vào đâu để luyện tập. Hầu hết ứng viên cải thiện nhanh nhất bằng cách luyện khu vực kỹ năng yếu nhất thay vì làm đề thử đầy đủ chung chung.

Dải điểm TOEIC S&W và mô tả

Thang Speaking và Writing mỗi bài chạy 0-200 với bước 10 điểm. Mỗi nửa công bố các dải mô tả trình độ riêng.

Dải trình độ Speaking

Phần Speaking có 11 tác vụ. Tác vụ 1-10 được chấm 0-3 mỗi tác vụ, và Tác vụ 11 chấm 0-5, tạo tối đa điểm thô 40, sau đó được chuyển sang thang 0-200. ETS công bố 8 dải mô tả trình độ:

Điểm quy đổi Trình độ
190-200 Thành thạo rất cao; ý kiến sắc thái, cú pháp phức tạp, thể hiện gần bản ngữ
160-180 Thành thạo; ý kiến và lập luận rõ ràng, vài lỗi phát âm hay ngữ pháp nhỏ
130-150 Hiệu quả; nhìn chung hiểu được với chút do dự và phạm vi hạn chế
110-120 Chức năng; dễ hiểu trong bối cảnh dự đoán được, ngắt quãng thường xuyên
80-100 Hạn chế; cụm từ ngắn, phụ thuộc nặng vào ngôn ngữ theo công thức
60-70 Cơ bản; khó theo dõi, từ vựng hạn chế nghiêm trọng
40-50 Tối thiểu; chỉ từ đơn lẻ và cụm từ thuộc lòng
0-30 Không thể hoạt động có ý nghĩa bằng tiếng Anh nói

Dải trình độ Writing

Phần Writing có 8 tác vụ. Q1-5 chấm 0-3, Q6-7 chấm 0-4, và Q8 chấm 0-5, cũng được chuyển sang thang 0-200. ETS công bố 9 dải mô tả trình độ:

Điểm quy đổi Trình độ
200 Thông thạo; tinh tế, tổ chức tốt, lỗi tối thiểu
170-190 Thành thạo rất cao; ý kiến mở rộng với hỗ trợ mạnh
140-160 Thành thạo; ý kiến mạch lạc với vài lỗi không thường xuyên
110-130 Hiệu quả; giao tiếp cơ bản rõ ràng; phạm vi hạn chế
90-100 Chức năng; câu đơn giản, lỗi thường xuyên
70-80 Hạn chế; ý tưởng rời rạc, vấn đề ngữ pháp nặng
50-60 Tối thiểu; viết ở mức cụm từ
40 Chưa đạt chức năng; gần như không thể hiểu
0-30 Không thể sản sinh tiếng Anh viết có ý nghĩa

Pronunciation và Intonation trên chứng chỉ Speaking

Một đặc điểm khác biệt của chứng chỉ TOEIC Speaking là bao gồm hai mô tả phụ không xuất hiện dưới dạng số mà dưới dạng dải ba cấp:

  • Pronunciation: Low / Medium / High
  • Intonation and Stress: Low / Medium / High

Các nhãn này phản ánh phán đoán của giám khảo về độ rõ của âm thanh bạn (phụ âm, nguyên âm, trọng âm từ) và độ tự nhiên của ngữ điệu cấp câu (nhịp điệu, đường cong cao độ, vị trí nhấn mạnh).

Một ứng viên đạt 150 ở Speaking có thể nhận:

  • Pronunciation: Medium
  • Intonation: Medium

Ứng viên đạt 180+ gần như luôn nhận High cả hai, trong khi ứng viên dưới 110 thường nhận Low ở ít nhất một.

Một số nhà tuyển dụng — đặc biệt trong vị trí tiếp xúc khách hàng hay giao tiếp quốc tế — nhìn cụ thể vào các mô tả này. Một ứng viên đạt 160 với "High / High" ở mô tả phụ có thể được ưu tiên hơn ứng viên 170 với "Medium / Low," vì khả năng dễ hiểu thường quan trọng với công việc hơn phạm vi từ vựng.

Điểm S&W được tạo ra như thế nào

Khác với L&R, phần trả lời S&W được đánh giá bởi giám khảo được ETS chứng nhận qua hệ thống Online Network for Evaluation (ONE). Mỗi câu trả lời thường được chấm bởi nhiều giám khảo với chênh lệch được giải quyết qua phân xử. Rubric Speaking bao gồm phát âm, ngữ điệu và trọng âm, ngữ pháp, từ vựng, liên kết, và mức độ liên quan nội dung; rubric Writing bao gồm ngữ pháp, từ vựng, tổ chức, liên quan, và hoàn thành tác vụ — mỗi tiêu chí áp dụng khác nhau theo loại tác vụ. Điểm giám khảo được cộng và sau đó ánh xạ sang thang 0-200 bằng bảng chuyển đổi được cập nhật định kỳ để duy trì ổn định.

Xếp hạng bách phân: Vị trí của bạn trên toàn cầu

Phiếu điểm của bạn cũng hiển thị xếp hạng bách phân — tỷ lệ phần trăm thí sinh trên toàn thế giới có điểm bằng hoặc thấp hơn của bạn. ETS cập nhật các bảng này mỗi tháng Năm dựa trên nhóm ứng viên luân phiên ba năm. Một số điểm tham chiếu sơ bộ: 990 là bách phân 99+, 900 khoảng bách phân 90, 800 khoảng 75, 700 khoảng 55, và 500 khoảng 20. Bách phân quan trọng cho tuyển chọn cạnh tranh (học bổng, nhóm tuyển dụng quốc tế) nhưng không thay đổi ngưỡng tuyệt đối của nhà tuyển dụng.

Đọc phiếu điểm: Danh sách kiểm tra thực hành

Khi bạn nhận phiếu điểm TOEIC, hãy làm theo thứ tự sau:

  1. Tổng điểm — so với mục tiêu và với SEM. Biên độ vượt ngưỡng yêu cầu có lớn hơn ±25 không?
  2. Điểm từng phần — có một phần đang kéo phần kia xuống không? Nếu có, vòng ôn luyện tiếp theo nên tập trung vào đó.
  3. Phần trăm Abilities Measured — xác định hai khu vực kỹ năng yếu nhất trong mười khu vực (năm Listening, năm Reading). Đây là mục tiêu học có đòn bẩy cao nhất.
  4. (Chỉ S&W) Mô tả trình độ — đọc toàn đoạn mô tả cho dải của bạn, không chỉ điểm. Mô tả cho bạn biết hành vi cụ thể nào sẽ đẩy bạn lên.
  5. (Chỉ S&W) Nhãn Pronunciation / Intonation — nếu một trong hai là "Low," luyện phonics và ngữ điệu có trọng tâm sẽ tạo lợi ích thấy rõ nhanh hơn luyện nói chung.
  6. Xếp hạng bách phân — chỉ liên quan nếu bạn ở trong bối cảnh tuyển chọn cạnh tranh. Ngược lại, tập trung vào điểm tuyệt đối.

Các hiểu sai thường gặp

"Tôi đạt 87% ở bảng Listening Abilities, nên điểm Listening của tôi phải là 870." Không. Phần trăm Abilities Measured là phần trăm theo loại chẩn đoán, không phải cơ sở của điểm quy đổi. Điểm quy đổi phản ánh toàn bộ mô hình IRT đã equate qua tất cả các mục, có trọng số theo độ khó.

"Tôi đạt 720, bạn tôi đạt 740 — cô ấy giỏi tiếng Anh hơn." Trong phạm vi ±35 của nhau, điểm không phân biệt được về mặt thống kê. 720 và 740 về mặt hoạt động là cùng một điểm. Chỉ khoảng cách 70+ điểm mới đáng tin cậy phản ánh khác biệt năng lực thực.

"Tôi sẽ tập trung đạt được bậc màu tiếp theo." Một mục tiêu tạo động lực, nhưng ranh giới bậc là rời rạc trong khi năng lực là liên tục. 855 (đỉnh Blue) về mặt chức năng giống hệt 860 (đáy Gold). Đừng đề cao màu quá mức ở ranh giới.

Tóm lại

TOEIC dùng hai thang khác nhau vì nó là hai bài thi khác nhau, được xây dựng vào các thời điểm khác nhau cho mục đích khác nhau. Cả hai thang đều được equating nghiêm ngặt, độ tin cậy hợp lý, và đi kèm thông tin chẩn đoán phong phú — nếu bạn biết cách đọc. Thói quen quan trọng nhất một ứng viên TOEIC có thể xây dựng là bỏ qua tổng điểm ở lần đọc đầu và thay vào đó đi thẳng đến bảng phân tích Abilities Measured (với L&R) hoặc đoạn mô tả trình độ (với S&W). Đó là nơi thông tin hành động được nằm.

Hiểu SEM, cộng thêm ±25 vào thiết lập mục tiêu, và đừng đuổi theo các dao động 10 điểm giữa các lần thi — chúng là nhiễu. Nhắm đến tăng có ý nghĩa 40-70 điểm mỗi chu kỳ ôn luyện, và học các khu vực kỹ năng cụ thể đang kìm hãm bạn thay vì làm đề thử đầy đủ không phân biệt.


Sẵn sàng thực sự nâng điểm có ý nghĩa? ExamRift cung cấp đầy đủ đề thi thử TOEIC L&R thích ứng với chẩn đoán theo từng khu vực kỹ năng — để bạn thấy chính xác cái nào trong năm kỹ năng Listening và năm kỹ năng Reading đang làm bạn mất điểm, và luyện bài tập nhắm mục tiêu giải quyết khu vực yếu nhất. Mỗi phiên luyện đều có tài liệu hỗ trợ AI tạo về từ vựng, cụm chức năng và giải thích biến mỗi câu hỏi thành khoảnh khắc học có trọng tâm. Bắt đầu luyện miễn phí hôm nay và xem bạn thực sự đứng ở đâu.