Skor TOEIC Dibongkar: Apa Arti Sebenarnya Skala 10-990 dan 0-200

Skor TOEIC Dibongkar: Apa Arti Sebenarnya Skala 10-990 dan 0-200

Jika kamu pernah melihat laporan skor TOEIC dan bertanya-tanya mengapa Listening dan Reading dilaporkan pada skala 10-990 sementara Speaking dan Writing masing-masing menggunakan skala 0-200, kamu tidak sendirian. Kedua skala bukan hal yang sembarangan — keduanya mencerminkan format tes yang berbeda, model statistik yang berbeda, dan tujuan yang berbeda — tetapi keduanya muncul pada laporan yang sama dan sering membingungkan kandidat yang mengharapkan satu angka terpadu.

Panduan ini menelusuri kedua skala, menjelaskan bagaimana jawaban mentah menjadi skor terskala, dan membedah setiap elemen lain di laporanmu: standard error of measurement (SEM), persentase Abilities Measured, tingkatan warna sertifikat, serta descriptor Pronunciation dan Intonation di sertifikat Speaking.

Dua Tes, Dua Skala

TOEIC bukan satu tes melainkan dua penilaian terpisah:

  • TOEIC Listening & Reading (L&R): tes pilihan ganda berdurasi dua jam dengan 100 soal Listening dan 100 soal Reading, dinilai 10-990.
  • TOEIC Speaking & Writing (S&W): tes performa sekitar 80 menit dengan 11 tugas Speaking dan 8 tugas Writing, setiap paruhnya dinilai 0-200.

Kandidat dapat mengambil salah satu paruhnya secara independen. Banyak kandidat korporat hanya mengambil L&R; kandidat akademik atau profesional yang perlu menunjukkan keterampilan produksi mengikuti S&W sebagai sesi terpisah. Kedua tes dirancang bertahun-tahun terpisah, untuk kasus penggunaan yang berbeda, dan ETS mempertahankan skala historis daripada memaksakan skor yang terpadu.

Mengapa 10-990 untuk L&R?

Skala 10-990 berasal dari tes TOEIC asli pada tahun 1979 dan dipilih untuk menghindari kesan persentase. Setiap bagian (Listening, Reading) diskalakan secara independen 5-495 dalam kelipatan 5 poin, dan keduanya dijumlahkan menjadi total. Tidak ada yang mendapat skor 0, karena bahkan menebak pun menghasilkan skor terskala bukan nol.

Mengapa 0-200 untuk S&W?

Tes S&W diluncurkan pada 2006-2007 dengan filosofi penilaian yang berbeda. Respons dinilai manusia dan jumlah tugasnya lebih kecil, sehingga skala 0-200 dalam kelipatan 10 poin lebih mencerminkan granularitas penilaian rater daripada equating pilihan ganda. Kedua skala dipisahkan karena merata-ratakannya akan menyembunyikan bukti dasar yang sangat berbeda.

Bagaimana Skor Terskala Dihasilkan: Kisah Equating

Skor mentahmu — hitungan soal yang kamu jawab benar — bukan yang muncul pada laporan skormu. ETS menerapkan proses statistik yang disebut equating yang menyesuaikan perbedaan kecil dalam tingkat kesulitan antarbentuk tes.

Anggap saja Form A memiliki bagian Reading yang sedikit lebih mudah dari Form B. Jika kedua form dinilai hanya dengan hitungan mentah, kandidat yang mengambil Form A akan memiliki keunggulan tidak adil. Equating mengatasi ini dengan memetakan skor mentah pada setiap form ke skala bersama sehingga skor terskala, misalnya 400 pada Reading, mewakili kemampuan yang sama terlepas dari form mana yang kamu ikuti.

Inilah sebabnya:

  • Skor mentah tidak pernah dilaporkan. Kamu tidak akan melihat "87 dari 100" pada laporanmu.
  • Hitungan mentah yang sama dapat menghasilkan skor terskala berbeda antaradministrasi.
  • Skala stabil sepanjang waktu. Sebuah 750 pada tahun 2020 dan 750 pada tahun 2026 mewakili tingkat kemampuan bahasa Inggris yang sama, meskipun soal spesifik dan populasi kandidat berbeda.

L&R menggunakan equating Item Response Theory (IRT), dengan koefisien reliabilitas KR-20 sekitar 0,90 atau lebih untuk kedua bagian — artinya tes menghasilkan hasil konsisten ketika kandidat yang sama mengambil form paralel.

Standard Error of Measurement: Mengapa "Skor Sebenarnya" Kamu Melompat-lompat

Tidak ada tes — baik TOEIC, TOEFL, maupun IELTS — yang melaporkan tingkat kemampuan yang benar-benar eksak. Setiap skor terskala membawa standard error of measurement (SEM), yang mengukur seberapa banyak noise yang mengelilingi angka yang dilaporkan.

Untuk TOEIC L&R, SEM kira-kira ±25 poin terskala per bagian. Ini berarti jika skor Listening yang dilaporkan padamu adalah 400, skor "sebenarnya" kamu (apa yang akan kamu rata-ratakan di antara administrasi tak terhingga) berada dalam 375-425 sekitar 68% dari waktu, dan dalam kira-kira 350-450 sekitar 95% dari waktu.

Apa Arti SEM dalam Praktik

Jika kamu meraih skor 700 hari ini dan mengambil tes lagi bulan depan dan meraih 720, kenaikan 20 poin itu hampir pasti adalah noise pengukuran, bukan peningkatan nyata. Standard error of difference (SE_diff) saat membandingkan dua administrasi adalah sekitar ±35 poin pada skala total L&R. Aturan praktis kasar:

Perubahan yang teramati Interpretasi
0-20 poin Kemungkinan noise; tidak ada perubahan kemampuan yang berarti
20-40 poin Ambigu; bisa noise atau peningkatan sedang
40+ poin Kemungkinan perubahan kemampuan yang nyata
70+ poin Substansial, hampir pasti peningkatan nyata

Inilah sebabnya ambang batas perekrutan korporat sering mensyaratkan kandidat memenuhi skor target dengan margin yang nyaman. Perusahaan yang mensyaratkan "minimum 700" tahu bahwa 695 dan 705 secara statistik tidak dapat dibedakan, sehingga banyak departemen HR menetapkan cut-off internal 30-50 poin di atas minimum yang dinyatakan.

SEM untuk S&W

Skor S&W dilaporkan dalam kelipatan 10 poin karena presisi pengukuran yang mendasarinya tidak mendukung perbedaan yang lebih halus. Skor Speaking 140 dan 150 mewakili band performa yang benar-benar berbeda; skor Speaking 143 tidak akan bermakna secara statistik, sehingga ETS tidak melaporkan ke tingkat itu.

Rentang Skor TOEIC L&R dan Artinya

Berikut adalah interpretasi yang umum dikutip untuk skor total L&R, ditarik dari descriptor kemahiran ETS dan panduan penggunaan korporat:

Skor Total CEFR (perkiraan) Kemampuan Bahasa Inggris Praktis
905-990 C1-C2 Kemahiran kerja nyaris penutur asli; dapat menangani negosiasi kompleks, komunikasi tulis bernuansa, diskusi teknis
785-900 B2-C1 Kemahiran kerja kuat; dapat berpartisipasi dengan percaya diri dalam rapat, menulis email profesional, memahami sebagian besar konten bisnis
605-780 B1-B2 Kemahiran kerja fungsional; dapat menangani interaksi rutin di tempat kerja dan korespondensi standar dengan kesenjangan sesekali
405-600 A2-B1 Kemahiran kerja terbatas; dapat mengomunikasikan kebutuhan dasar, mengikuti instruksi sederhana, kesulitan dengan topik abstrak atau teknis
255-400 A2 Kemahiran elementer; hanya dapat menangani pertukaran yang sangat dapat diprediksi
10-250 A1 Bahasa Inggris formulaic dasar; pemahaman dan produksi tingkat frasa

Rentang ini adalah panduan, bukan ambang batas kontraktual. Banyak employer mempublikasikan cut-off mereka sendiri berdasarkan fungsi pekerjaan (misalnya, 600 untuk customer service, 750 untuk sales internasional, 850 untuk peran eksekutif).

Tingkatan Warna Sertifikat L&R

Kandidat yang mengambil TOEIC L&R menerima sertifikat dengan kode warna yang mencerminkan band skor. Struktur tingkatan umum adalah:

Warna Rentang Skor Ringkasan Kemahiran
Gold 860-990 Dapat menangani sebagian besar situasi kerja dengan percaya diri
Blue 730-855 Dapat memenuhi kebutuhan komunikasi sosial dan kerja
Green 470-725 Dapat melakukan percakapan dasar yang jelas
Brown 220-465 Dapat menangani pertukaran rutin yang terbatas
Orange 10-215 Hanya bahasa Inggris formulaic dasar

Ambang batas ini dikutip luas tetapi dapat bervariasi menurut wilayah. Setiap ETS Preferred Network (EPN) — administrator nasional di pasar tertentu — memiliki sedikit keleluasaan atas presentasi sertifikat, dan variasi kecil pada tepi band terjadi di beberapa negara. Jika cut-off spesifik penting bagimu (misalnya, hiring manager meminta "level Gold"), konfirmasi ambang batas yang tepat dengan EPN lokalmu.

Rincian Abilities Measured

Setiap laporan skor L&R mencakup bagian Abilities Measured yang melaporkan persentase jawaban benarmu di lima area keterampilan per bagian. Ini adalah informasi diagnostik yang benar-benar berguna — jauh lebih actionable daripada skor terskala tunggal.

Listening Abilities Measured

  1. Dapat menyimpulkan inti pokok, tujuan, dan konteks dasar berdasarkan informasi yang dinyatakan eksplisit dalam teks lisan pendek (wilayah Part 1-2).
  2. Dapat menyimpulkan inti pokok, tujuan, dan konteks dasar berdasarkan informasi yang dinyatakan eksplisit dalam teks lisan yang lebih panjang (pertanyaan inti pokok Part 3-4).
  3. Dapat memahami detail dalam teks lisan pendek (pertanyaan detail Part 2, detail foto Part 1).
  4. Dapat memahami detail dalam teks lisan yang lebih panjang (pertanyaan detail Part 3-4).
  5. Dapat memahami tujuan pembicara atau makna implisit (pemahaman pragmatis; niat, nada, tuturan tidak langsung).

Reading Abilities Measured

  1. Dapat menemukan dan memahami informasi spesifik dalam tabel dan passage (tugas scanning Part 5-7).
  2. Dapat menghubungkan informasi lintas banyak kalimat dalam satu teks dan antarteks (penarikan kesimpulan lintas set multi-teks Part 6-7).
  3. Dapat membuat inferensi berdasarkan informasi dalam teks tulis (makna tersirat Part 7).
  4. Dapat memahami kosakata dalam teks kerja (item leksikal Part 5).
  5. Dapat memahami tata bahasa dalam teks kerja (bentuk gramatikal Part 5).

Menggunakan Abilities Measured untuk Belajar

Jika skor Listening keseluruhanmu 350 tetapi rinciannya menunjukkan 85% pada pertanyaan detail dan 40% pada makna pragmatis/implisit, kamu tahu persis di mana harus menargetkan latihan. Kebanyakan kandidat meningkat paling cepat dengan melatih area kemampuan terlemah mereka daripada melakukan tes latihan full-length generik.

Rentang Skor dan Descriptor TOEIC S&W

Skala Speaking dan Writing masing-masing berjalan 0-200 dalam kelipatan 10 poin. Setiap paruhnya mempublikasikan band descriptor kemahiran sendiri.

Band Kemahiran Speaking

Bagian Speaking memiliki 11 tugas. Tugas 1-10 masing-masing dinilai 0-3, dan Tugas 11 dinilai 0-5, menghasilkan maksimum mentah 40, yang kemudian dikonversi ke skala 0-200. ETS mempublikasikan 8 band descriptor kemahiran:

Skor Terskala Tingkat Kemahiran
190-200 Sangat mahir; opini bernuansa, sintaksis kompleks, delivery nyaris penutur asli
160-180 Mahir; opini dan penalaran yang jelas, masalah pronunciation atau tata bahasa kecil
130-150 Efektif; umumnya dapat dipahami dengan sedikit ragu dan jangkauan terbatas
110-120 Fungsional; dapat dipahami dalam konteks yang dapat diprediksi, jeda sering
80-100 Terbatas; frasa pendek, ketergantungan berat pada bahasa formulaic
60-70 Dasar; sulit diikuti, kosakata sangat terbatas
40-50 Minimal; hanya kata tunggal dan frasa yang dihafal
0-30 Tidak dapat berfungsi secara bermakna dalam bahasa Inggris lisan

Band Kemahiran Writing

Bagian Writing memiliki 8 tugas. Q1-5 dinilai 0-3, Q6-7 dinilai 0-4, dan Q8 dinilai 0-5, yang kemudian dikonversi ke skala 0-200. ETS mempublikasikan 9 band descriptor kemahiran:

Skor Terskala Tingkat Kemahiran
200 Penguasaan; canggih, terorganisasi baik, kesalahan minimal
170-190 Sangat mahir; opini yang dikembangkan dengan pendukung kuat
140-160 Mahir; opini yang koheren dengan kesalahan sesekali
110-130 Efektif; komunikasi dasar yang jelas; jangkauan terbatas
90-100 Fungsional; kalimat sederhana, kesalahan sering
70-80 Terbatas; ide terpotong-potong, masalah gramatikal berat
50-60 Minimal; hanya tulisan tingkat frasa
40 Pra-fungsional; nyaris tidak dapat dipahami
0-30 Tidak dapat memproduksi bahasa Inggris tulis yang bermakna

Pronunciation dan Intonation pada Sertifikat Speaking

Fitur khas dari sertifikat TOEIC Speaking adalah penyertaan dua sub-descriptor yang tidak muncul sebagai angka tetapi sebagai tiga tingkat band:

  • Pronunciation: Low / Medium / High
  • Intonation and Stress: Low / Medium / High

Label ini mencerminkan penilaian rater atas kejelasan bunyi-bunyimu (konsonan, vokal, word stress) dan kealamian prosodi tingkat kalimatmu (ritme, kontur pitch, penempatan penekanan).

Seorang kandidat yang meraih 150 pada Speaking mungkin menerima:

  • Pronunciation: Medium
  • Intonation: Medium

Kandidat yang meraih 180+ hampir selalu menerima High pada keduanya, sementara kandidat di bawah 110 biasanya menerima Low pada setidaknya salah satunya.

Beberapa employer — terutama di peran yang berhadapan dengan pelanggan atau komunikasi internasional — melihat descriptor ini secara khusus. Kandidat dengan 160 dan "High / High" pada sub-descriptor mungkin lebih disukai daripada kandidat 170 dengan "Medium / Low," karena intelligibility sering lebih penting untuk pekerjaan daripada jangkauan kosakata.

Bagaimana Skor S&W Dihasilkan

Berbeda dengan L&R, respons S&W dievaluasi oleh rater bersertifikat ETS melalui Online Network for Evaluation (ONE). Setiap respons biasanya dinilai oleh beberapa rater dengan ketidaksepakatan diselesaikan melalui ajudikasi. Rubrik Speaking mencakup pronunciation, intonation and stress, tata bahasa, kosakata, kohesi, dan relevansi konten; rubrik Writing mencakup tata bahasa, kosakata, organisasi, relevansi, dan task completion — masing-masing diterapkan berbeda menurut jenis tugas. Skor rater dijumlahkan dan kemudian dipetakan ke skala 0-200 menggunakan tabel konversi yang diperbarui secara berkala untuk mempertahankan stabilitas.

Peringkat Persentil: Posisi Kamu Secara Global

Laporan skormu juga menunjukkan peringkat persentil — persentase peserta tes di seluruh dunia yang meraih skor sama atau di bawah skormu. ETS memperbarui tabel ini setiap Mei berdasarkan populasi kandidat tiga tahun bergulir. Sebagai titik referensi kasar: 990 adalah persentil ke-99+, 900 sekitar persentil ke-90, 800 sekitar ke-75, 700 sekitar ke-55, dan 500 sekitar ke-20. Persentil penting untuk seleksi kompetitif (beasiswa, kumpulan perekrutan internasional) tetapi tidak mengubah ambang batas absolut employer.

Membaca Laporan Skormu: Checklist Praktis

Ketika kamu menerima laporan skor TOEIC-mu, kerjakan berurutan:

  1. Skor total — bandingkan dengan targetmu dan dengan SEM. Apakah marginmu di atas minimum yang dipersyaratkan lebih besar dari ±25?
  2. Skor bagian — apakah satu bagian menarik yang lain turun? Jika ya, ronde persiapan berikutnya harus fokus di sana.
  3. Persentase Abilities Measured — identifikasi dua area kemampuan terlemah dari sepuluh (lima Listening, lima Reading). Ini adalah target studi dengan daya ungkit tertinggi.
  4. (S&W saja) Descriptor kemahiran — baca descriptor tingkat paragraf lengkap untuk band-mu, bukan hanya skor. Descriptor memberitahu perilaku spesifik apa yang akan menaikkanmu.
  5. (S&W saja) Label Pronunciation / Intonation — jika salah satunya "Low," latihan phonics dan prosodi yang tertarget akan menghasilkan keuntungan yang terlihat lebih cepat daripada latihan speaking umum.
  6. Peringkat persentil — hanya relevan jika kamu berada dalam konteks seleksi kompetitif. Jika tidak, fokus pada skor absolut.

Miskonsepsi Umum

"Saya mendapat 87% pada rincian Listening Abilities, jadi skor Listening saya seharusnya 870." Salah. Persentase Abilities Measured adalah persentase kategori diagnostik, bukan dasar skor terskalamu. Skor terskalamu mencerminkan model IRT yang disetarakan secara penuh di semua item, dibobotkan berdasarkan tingkat kesulitan item.

"Saya mendapat 720, teman saya mendapat 740 — dia lebih baik dalam bahasa Inggris." Dalam rentang ±35 satu sama lain, skor secara statistik tidak dapat dibedakan. Sebuah 720 dan 740 secara operasional adalah skor yang sama. Hanya selisih sekitar 70+ poin yang secara andal mencerminkan perbedaan kemampuan yang nyata.

"Saya akan fokus mencapai tingkatan warna berikutnya." Target motivasional, tetapi batasan tingkatan bersifat diskret sementara kemampuan bersifat kontinu. Sebuah 855 (puncak Blue) secara fungsional identik dengan 860 (dasar Gold). Jangan terlalu menghargai warna di batas.

Kesimpulan

TOEIC menggunakan dua skala berbeda karena memang dua tes berbeda, dibangun pada waktu yang berbeda untuk tujuan yang berbeda. Kedua skala diequating secara ketat, cukup andal, dan disertai dengan informasi diagnostik yang kaya — jika kamu tahu cara membacanya. Satu kebiasaan paling penting yang dapat dibangun kandidat TOEIC adalah mengabaikan skor total sebagai bacaan first-pass dan sebaliknya langsung menuju rincian Abilities Measured (untuk L&R) atau paragraf descriptor kemahiran (untuk S&W). Di situlah informasi yang actionable berada.

Pahami SEM, perhitungkan ±25 dalam penetapan target, dan jangan mengejar ayunan 10 poin antaradministrasi — itu noise. Bidik peningkatan yang bermakna 40-70 poin per siklus persiapan, dan pelajari area kemampuan spesifik yang menahanmu daripada melakukan latihan full-length yang tidak terdiferensiasi.


Siap menggerakkan skormu secara bermakna? ExamRift menyediakan mock exam adaptif TOEIC L&R lengkap dengan diagnostik per area kemampuan — sehingga kamu dapat melihat persis mana dari lima kemampuan Listening dan lima kemampuan Reading yang menghabiskan poinmu, dan berlatih drill tertarget yang menangani area terlemahmu. Setiap sesi dilengkapi supplement kosakata, functional phrases, dan penjelasan yang dihasilkan AI yang mengubah setiap soal menjadi momen studi yang terfokus. Mulai latihan gratismu hari ini dan lihat di mana posisimu sebenarnya.