فك شيفرة درجات TOEIC: ماذا تعني 10-990 و0-200 فعلاً
إذا سبق أن نظرت إلى تقرير درجة TOEIC وتساءلت لماذا يُبلَّغ عن الاستماع والقراءة على مقياس 10-990 بينما يستخدم التحدث والكتابة كلٌّ منهما مقياس 0-200، فأنت لست وحدك. المقياسان ليسا اعتباطيَّين — فهما يعكسان صيغَ اختبار مختلفة، ونماذج إحصائية مختلفة، وأغراضاً مختلفة — لكنهما يحطّان على التقرير ذاته ويربكان كثيراً من المرشحين الذين يتوقعون رقماً موحداً واحداً.
يستعرض هذا الدليل كلا المقياسين، ويوضح كيف تتحول الإجابات الخام إلى درجات معدَّلة، ويفك شيفرة كل عنصر آخر على تقريرك: الخطأ القياسي للقياس (SEM)، ونسب Abilities Measured، ومستويات ألوان الشهادة، وواصفات النطق والتنغيم على شهادة Speaking.
اختباران، مقياسان
TOEIC ليس اختباراً واحداً بل تقييمَين منفصلَين:
- TOEIC الاستماع والقراءة (L&R): اختبار اختيار من متعدد مدته ساعتان يتضمن 100 سؤال استماع و100 سؤال قراءة، يُصحَّح على 10-990.
- TOEIC التحدث والكتابة (S&W): اختبار أداء يستغرق نحو 80 دقيقة، يتضمن 11 مهمة تحدث و8 مهام كتابة، يُصحَّح كل نصف منه على 0-200.
يمكن للمرشحين التقدم لأيّ نصف باستقلالية. فكثير من المرشحين المؤسسيين يتقدمون لـ L&R فقط؛ بينما يجلس المرشحون الأكاديميون أو المهنيون الذين يحتاجون إلى إثبات مهارات الإنتاج لاختبار S&W في جلسة منفصلة. صُمِّم الاختباران في سنوات متباعدة لأغراض مختلفة، وأبقت ETS على المقياسَين التاريخيَّين بدلاً من فرض درجة موحَّدة.
لماذا 10-990 لـ L&R؟
يعود مقياس 10-990 إلى اختبار TOEIC الأصلي عام 1979، واختير لتفادي مظهر النسبة المئوية. يُصحَّح كل قسم (الاستماع، القراءة) باستقلالية على 5-495 بزيادات من 5 نقاط، ويُجمعان لإنتاج الإجمالي. لا يحصل أحد على 0، لأن التخمين وحده يُنتج درجة معدَّلة غير صفرية.
لماذا 0-200 لـ S&W؟
انطلق اختبار S&W في 2006-2007 بفلسفة تصحيح مختلفة. فالإجابات يقيمها مصححون بشر، وعدد المهام أصغر، لذا يعكس مقياس 0-200 بزيادات 10 نقاط دقة حُكم المصحّح أكثر من تعديل الاختيار من متعدد. ويُحافَظ على فصل المقياسَين لأن تجميع معدلهما سيخفي أدلةً أساسية مختلفة جداً.
كيف تُشتق الدرجات المعدَّلة: قصة equating (المعادَلة)
درجتك الخام — عدد الأسئلة التي أجبت عنها إجابة صحيحة — ليست ما يظهر في تقرير درجتك. فـ ETS تطبق عملية إحصائية تُسمى equating (المعادَلة) تصحّح الفروق الطفيفة في الصعوبة بين نماذج الاختبار.
لنفترض أن Form A (النموذج أ) يحتوي على قسم قراءة أسهل قليلاً من Form B. إذا صُحِّح كلاهما بالعدد الخام فقط، فسيحظى من اختبر Form A بميزة غير عادلة. وتحل المعادَلة ذلك بربط الدرجات الخام في كل نموذج بمقياس مشترك بحيث تمثل درجة معدَّلة، مثلاً 400 في القراءة، القدرة نفسها بغض النظر عن النموذج الذي جلست له.
ولهذا:
- الدرجات الخام لا تُبلَّغ أبداً. لن ترى "87 من 100" على تقريرك.
- العدد الخام نفسه قد يُنتج درجات معدَّلة مختلفة عبر الجلسات.
- المقياس مستقر عبر الزمن. فـ 750 عام 2020 و750 عام 2026 تمثلان المستوى نفسه من إتقان الإنجليزية، رغم اختلاف الأسئلة وبرك المرشحين.
يستخدم L&R معادَلة نظرية استجابة المفردة (IRT)، بمعاملات ثبات KR-20 تبلغ تقريباً 0.90 أو أعلى على القسمين — ما يعني أن الاختبار يُنتج نتائج متسقة عندما يأخذ المرشح نفسه نماذج متوازية.
الخطأ القياسي للقياس: لماذا تتأرجح درجتك "الحقيقية"
لا يوجد اختبار — لا TOEIC ولا TOEFL ولا IELTS — يُبلّغ عن مستوى قدرة دقيق تماماً. فكل درجة معدَّلة تحمل خطأ قياسياً للقياس (SEM) يُقدِّر مقدار الضوضاء المحيطة بالرقم المُبلَّغ.
بالنسبة لـ TOEIC L&R، يبلغ SEM تقريباً ±25 نقطة معدَّلة لكل قسم. ما يعني: إذا كانت درجة الاستماع المُبلَّغة 400، فدرجتك "الحقيقية" (ما ستحصل عليه معدلاً عبر جلسات لا نهائية) تقع بين 375 و425 بنسبة 68% تقريباً، وبين 350 و450 تقريباً بنسبة 95%.
ماذا يعني SEM عملياً
إذا حصلت على 700 اليوم ثم أعدت الاختبار الشهر القادم فحصلت على 720، فمكسب الـ20 نقطة ذلك هو في الغالب ضوضاء قياس لا تحسُّن حقيقي. ويبلغ الخطأ القياسي للفرق (SE_diff) عند مقارنة جلستَين تقريباً ±35 نقطة على مقياس L&R الإجمالي. قاعدة إبهام تقريبية:
| التغيُّر الملحوظ | التفسير |
|---|---|
| 0-20 نقطة | ضوضاء على الأرجح؛ لا تغيُّر ذا معنى في القدرة |
| 20-40 نقطة | ملتبس؛ قد يكون ضوضاء أو تحسناً متواضعاً |
| 40+ نقطة | تغيُّر حقيقي في القدرة على الأرجح |
| 70+ نقطة | تحسُّن جوهري، شبه مؤكد أنه حقيقي |
ولهذا كثيراً ما تشترط عتبات التوظيف المؤسسية أن يحقق المرشحون الدرجة المستهدفة بهامش مريح. فالشركة التي تشترط "الحد الأدنى 700" تعلم أن 695 و705 لا يمكن تمييزهما إحصائياً، لذا تضع كثير من أقسام الموارد البشرية عتبات داخلية تزيد 30-50 نقطة عن الحد الأدنى المُعلَن.
SEM بالنسبة لـ S&W
تُبلَّغ درجات S&W بزيادات 10 نقاط لأن دقة القياس الكامنة لا تدعم تمييزات أدق. فدرجة تحدث 140 و150 تمثلان نطاقَي أداء مختلفَين فعلاً؛ أما درجة تحدث 143 فلن تكون ذات معنى إحصائي، ومن ثمّ لا تُبلّغ عنها ETS بذلك المستوى.
نطاقات درجات TOEIC L&R وما تعنيه
فيما يلي التفسير المُشار إليه عموماً لدرجات L&R الإجمالية، مستقاة من واصفات ETS للإتقان وأدلة الاستخدام المؤسسية:
| الدرجة الإجمالية | CEFR (تقريبي) | القدرة العملية على الإنجليزية |
|---|---|---|
| 905-990 | C1-C2 | إتقان عملي شبه أصلي؛ يمكن التعامل مع مفاوضات معقدة، وتواصل كتابي دقيق، ومناقشات تقنية |
| 785-900 | B2-C1 | إتقان عملي قوي؛ يمكن المشاركة بثقة في الاجتماعات، وكتابة رسائل مهنية، وفهم معظم محتوى الأعمال |
| 605-780 | B1-B2 | إتقان عملي وظيفي؛ يمكن التعامل مع تفاعلات العمل الروتينية والمراسلات القياسية مع فجوات عرضية |
| 405-600 | A2-B1 | إتقان عملي محدود؛ يمكن التواصل بالاحتياجات الأساسية، واتباع التعليمات البسيطة، مع صعوبة في المواضيع المجردة أو التقنية |
| 255-400 | A2 | إتقان ابتدائي؛ يمكن التعامل مع التبادلات المتوقعة تماماً فقط |
| 10-250 | A1 | إنجليزية قوالبية أساسية؛ فهم وإنتاج على مستوى العبارات |
هذه النطاقات إرشادية، لا عتبات تعاقدية. ويُصدر كثير من أصحاب العمل عتباتهم الخاصة بناءً على وظيفة الدور (مثلاً 600 لخدمة العملاء، 750 للمبيعات الدولية، 850 للأدوار التنفيذية).
مستويات ألوان شهادة L&R
يحصل المتقدمون لـ TOEIC L&R على شهادة برمز لوني يعكس نطاق الدرجة. والبنية الشائعة للمستويات:
| اللون | نطاق الدرجة | ملخص الإتقان |
|---|---|---|
| Gold | 860-990 | يمكنه التعامل بثقة مع معظم مواقف العمل |
| Blue | 730-855 | يمكنه تلبية احتياجات التواصل الاجتماعي ومكان العمل |
| Green | 470-725 | يمكنه إجراء محادثة أساسية واضحة |
| Brown | 220-465 | يمكنه التعامل مع تبادلات روتينية محدودة |
| Orange | 10-215 | إنجليزية قوالبية أساسية فقط |
هذه العتبات مُشار إليها على نطاق واسع لكنها قد تختلف حسب المنطقة. فلكل ETS Preferred Network (EPN) — المُدير الوطني في سوق معين — هامش من التقدير في عرض الشهادة، وتحدث تغيرات طفيفة في حواف النطاقات في بعض الدول. وإذا كانت عتبة محددة مهمة لك (مثلاً طلب مدير توظيف "مستوى Gold")، فتحقق من العتبة الدقيقة مع EPN المحلي لديك.
تحليل Abilities Measured
يتضمن كل تقرير درجة L&R قسم Abilities Measured يُبلّغ عن نسبة إجاباتك الصحيحة عبر خمسة مجالات مهارية لكل قسم. وهذه معلومات تشخيصية مفيدة جداً — أكثر قابلية للتنفيذ من الدرجة المعدَّلة المنفردة.
Abilities Measured للاستماع
- يمكنه استنتاج الفكرة والغرض والسياق الأساسي بناءً على معلومات مذكورة صراحة في نصوص منطوقة قصيرة (مجال Parts 1-2).
- يمكنه استنتاج الفكرة والغرض والسياق الأساسي بناءً على معلومات مذكورة صراحة في نصوص منطوقة مطوَّلة (أسئلة الفكرة في Parts 3-4).
- يمكنه فهم التفاصيل في النصوص المنطوقة القصيرة (أسئلة التفاصيل في Part 2، وتفاصيل صور Part 1).
- يمكنه فهم التفاصيل في النصوص المنطوقة المطوَّلة (أسئلة التفاصيل في Parts 3-4).
- يمكنه فهم غرض المتحدث أو المعنى الضمني (الفهم البراجماتي؛ النية، النبرة، الخطاب غير المباشر).
Abilities Measured للقراءة
- يمكنه تحديد وفهم معلومات محددة في الجداول والنصوص (مهام المسح في Parts 5-7).
- يمكنه ربط المعلومات عبر جمل متعددة في نص واحد وعبر نصوص متعددة (الاستدلال عبر مجموعات Parts 6-7 متعددة النصوص).
- يمكنه إجراء استدلالات بناءً على معلومات في النصوص المكتوبة (المعنى الضمني في Part 7).
- يمكنه فهم المفردات في نصوص مكان العمل (عناصر المعجم في Part 5).
- يمكنه فهم قواعد اللغة في نصوص مكان العمل (الصيغ النحوية في Part 5).
استخدام Abilities Measured في الدراسة
إذا كانت درجة الاستماع الإجمالية لديك 350 لكن تحليلك يُظهر 85% في أسئلة التفاصيل و40% في المعنى البراجماتي/الضمني، فأنت تعرف بالضبط أين توجّه التدريب. معظم المرشحين يتحسنون أسرع بالتدريب على المجال المهاري الأضعف بدلاً من اختبارات محاكاة عامة كاملة.
نطاقات درجات TOEIC S&W وواصفاته
يتراوح مقياسا التحدث والكتابة كلٌّ منهما من 0 إلى 200 بزيادات 10 نقاط. ويصدر كل نصف نطاقات واصفة للإتقان الخاصة به.
نطاقات إتقان التحدث
يتضمن قسم التحدث 11 مهمة. تُقيَّم المهام 1-10 كلٌّ من 0-3، وتُقيَّم المهمة 11 من 0-5، لتنتج درجة خام قصوى قدرها 40، ثم تُحوَّل إلى مقياس 0-200. وتنشر ETS 8 نطاقات واصفة للإتقان:
| الدرجة المعدَّلة | مستوى الإتقان |
|---|---|
| 190-200 | متقن جداً؛ آراء دقيقة، بنية نحوية معقدة، أداء شبه أصلي |
| 160-180 | متقن؛ آراء واضحة وتعليل، أخطاء نطق أو قواعد طفيفة |
| 130-150 | فعّال؛ مفهوم عموماً مع بعض التردد ومدى محدود |
| 110-120 | وظيفي؛ مفهوم في السياقات المتوقعة، توقفات متكررة |
| 80-100 | محدود؛ عبارات قصيرة، اعتماد كبير على اللغة القوالبية |
| 60-70 | أساسي؛ صعب المتابعة، مفردات محدودة جداً |
| 40-50 | ضئيل؛ كلمات مفردة وعبارات محفوظة فقط |
| 0-30 | لا يستطيع التواصل بمعنى في الإنجليزية الشفوية |
نطاقات إتقان الكتابة
يتضمن قسم الكتابة 8 مهام. تُقيَّم Q1-5 من 0-3، وQ6-7 من 0-4، وQ8 من 0-5، وتُحوَّل مرة أخرى إلى مقياس 0-200. وتنشر ETS 9 نطاقات واصفة للإتقان:
| الدرجة المعدَّلة | مستوى الإتقان |
|---|---|
| 200 | إتقان كامل؛ راقٍ، منظَّم جيداً، أخطاء ضئيلة |
| 170-190 | متقن جداً؛ آراء ممتدة بدعم قوي |
| 140-160 | متقن؛ آراء متماسكة مع أخطاء عرضية |
| 110-130 | فعّال؛ تواصل أساسي واضح؛ مدى محدود |
| 90-100 | وظيفي؛ جمل بسيطة، أخطاء متكررة |
| 70-80 | محدود؛ أفكار مشتتة، مشكلات نحوية كبيرة |
| 50-60 | ضئيل؛ كتابة على مستوى العبارات فقط |
| 40 | دون الوظيفي؛ بالكاد مفهوم |
| 0-30 | لا يستطيع إنتاج إنجليزية مكتوبة بمعنى |
النطق والتنغيم على شهادة التحدث
من السمات المميزة لشهادة TOEIC Speaking إدراج واصفتَين فرعيتَين لا تظهران كأرقام بل كنطاقات ثلاثية المستويات:
- النطق (Pronunciation): Low / Medium / High
- التنغيم والنبر (Intonation and Stress): Low / Medium / High
تعكس هذه الوسوم أحكام المصححين حول وضوح أصواتك (حروف ساكنة، متحركة، نبر الكلمات) وطبيعية تَنغيم الجمل (الإيقاع، منحنى طبقة الصوت، موضع التشديد).
قد يحصل مرشح يحصل على 150 في Speaking على:
- Pronunciation: Medium
- Intonation: Medium
ومرشح يحصل على 180+ يحصل شبه دائماً على High في كليهما، بينما يحصل من هم دون 110 عادة على Low في واحدة على الأقل.
يدقق بعض أصحاب العمل — خاصة في أدوار التواصل مع العملاء أو التواصل الدولي — في هذه الواصفات تحديداً. فمرشح حصل على 160 و"High / High" في الواصفات الفرعية قد يُفضَّل على مرشح حصل على 170 و"Medium / Low"، لأن الوضوح غالباً ما يهم الوظيفة أكثر من سعة المفردات.
كيف تُنتج درجات S&W
خلافاً لـ L&R، يقيّم مصححون بشر معتمدون من ETS إجابات S&W عبر شبكة التقييم الإلكترونية (Online Network for Evaluation - ONE). وعادة يقيّم كل إجابة عدة مصححين، وتُحلّ التفاوتات بالتحكيم. وتغطي معايير التحدث النطق والتنغيم والنبر والقواعد والمفردات والتماسك وملاءمة المحتوى؛ بينما تغطي معايير الكتابة القواعد والمفردات والتنظيم والملاءمة واكتمال المهمة — كلٌّ يُطبَّق بشكل مختلف حسب نوع المهمة. تُجمع درجات المصححين ثم تُربط بمقياس 0-200 باستخدام جدول تحويل يُحدَّث دورياً للحفاظ على الاستقرار.
الرتب المئوية: أين تقف عالمياً
يُظهر تقرير درجتك أيضاً الرتب المئوية — نسبة المتقدمين حول العالم الذين حصلوا على درجتك أو أقل. وتحدّث ETS هذه الجداول كل مايو بناءً على بركة مرشحين متحركة مدتها ثلاث سنوات. وكمراجع تقريبية: 990 هي الرتبة المئوية 99+، و900 نحو 90، و800 نحو 75، و700 نحو 55، و500 نحو 20. وتهم الرتب المئوية في الاختيار التنافسي (المنح، برك التوظيف الدولي) لكنها لا تغير عتبات أصحاب العمل المطلقة.
قراءة تقرير درجتك: قائمة مراجعة عملية
حين تستلم تقرير درجة TOEIC الخاص بك، اعمل عبره بهذا الترتيب:
- الدرجة الإجمالية — قارنها بهدفك وبـ SEM. هل هامشك فوق الحد الأدنى المطلوب أكبر من ±25؟
- درجات الأقسام — هل هناك قسم يسحب الآخر إلى الأسفل؟ إن كان كذلك، فينبغي أن تركّز جولة التحضير القادمة هناك.
- نسب Abilities Measured — حدد أضعف مجالين من المجالات العشرة (خمسة استماع، خمسة قراءة). هذه أعلى أهدافك ذات الأثر الدراسي.
- (S&W فقط) واصفات الإتقان — اقرأ فقرة الواصفة الكاملة لنطاقك، لا الدرجة فقط. فالواصفة تخبرك بالسلوكيات المحددة التي ستنقلك للأعلى.
- (S&W فقط) وسوم النطق / التنغيم — إذا كانت إحداهما "Low"، فستُنتج تمارين الصوتيات والعروض المستهدفة مكاسب أسرع من التحدث العام.
- الرتبة المئوية — مهمة فقط إذا كنت في سياق اختيار تنافسي. وإلا فركّز على الدرجة المطلقة.
سوء التفسير الشائع
"حصلت على 87% في تحليل Abilities Measured للاستماع، فينبغي أن تكون درجة الاستماع عندي 870." لا. نسب Abilities Measured نسب فئات تشخيصية، لا أساس درجتك المعدَّلة. فدرجتك المعدَّلة تعكس نموذج IRT المُعادَل الكامل عبر كل العناصر، مرجَّحاً بصعوبة العنصر.
"حصلت على 720، وحصلت صديقتي على 740 — فهي أفضل في الإنجليزية مني." داخل ±35 من بعضهما، الدرجات لا يمكن تمييزها إحصائياً. فـ 720 و740 الدرجة نفسها عملياً. فقط الفجوات تقريباً 70+ نقطة تعكس بموثوقية فروقاً حقيقية في القدرة.
"سأركّز على الوصول إلى المستوى اللوني التالي." هدف محفّز، لكن حدود المستويات منفصلة في حين أن القدرة متصلة. فـ 855 (أعلى Blue) متطابقة وظيفياً مع 860 (أسفل Gold). لا تبالغ في تقدير اللون عند الحد.
الخلاصة
يستخدم TOEIC مقياسَين مختلفَين لأنه اختباران مختلفان، بُنيا في أوقات مختلفة لأغراض مختلفة. كلا المقياسَين مُعادَلان بدقة، وذوا ثبات معقول، ومرفقان بمعلومات تشخيصية غنية — إن عرفت كيف تقرؤها. وأهم عادة منفردة يمكن لمرشح TOEIC أن يبنيها هي تجاهل الدرجة الإجمالية كقراءة أولى، والتوجه مباشرة إلى تحليل Abilities Measured (لـ L&R) أو فقرة واصفة الإتقان (لـ S&W). فهناك تقع المعلومات القابلة للتنفيذ.
افهم SEM، وأدمج ±25 في تحديد هدفك، ولا تلاحق تأرجحات 10 نقاط بين الجلسات — فهي ضوضاء. اسعَ إلى مكاسب ذات معنى قدرها 40-70 نقطة لكل دورة تحضير، وادرس مجالات القدرة المحددة التي تعيقك بدلاً من اختبارات محاكاة كاملة غير متمايزة.
مستعد لتحريك درجتك بمعنى؟ يقدم ExamRift اختبارات TOEIC L&R محاكية تكيُّفية كاملة مع تشخيصات لكل مجال قدرة — حتى ترى بالضبط أيٌّ من مجالات الاستماع الخمس والقراءة الخمس يكلّفك نقاطاً، وتتدرب على تمارين مستهدفة تعالج أضعف مجالاتك. وتأتي كل جلسة مع مكمّلات مفردات وعبارات وظيفية وشروحات مولَّدة بالذكاء الاصطناعي تحوّل كل سؤال إلى لحظة دراسية مركَّزة. ابدأ تدريبك المجاني اليوم وتعرّف على مستواك الفعلي.