TOEFL 2026のMulti-Stage Adaptive Testingとは?難しくなるの?

TOEFL 2026のMulti-Stage Adaptive Testingとは?難しくなるの?

ETSがTOEFL iBT 2026でMulti-Stage Adaptive Testing(多段階適応型テスト)を採用すると発表した時、多くの受験者が同じ反応をしました。「アダプティブって、つまり難しくなるの?」 短い答えはノーです。「違う」のであって「難しい」のではなく、ほとんどの面で「より公平」になったと言えます。しかし、MSTの仕組みを理解することは効果的な準備に不可欠です。テスト体験が変わることで、戦略、ペース配分、心構えに影響があるからです。

この記事では、MSTとは何か、TOEFL iBT 2026でどう機能するのか、そして準備にどう影響するのかを詳しく解説します。

アダプティブテストとは?

アダプティブテスト(適応型テスト)とは、受験者のパフォーマンスに基づいてテストの難易度を調整する方式です。すべての受験者に同じ問題を出すのではなく、受験者の実証された能力レベルに最も適した問題をシステムが選択します。

この概念自体は新しくありません。GREやGMATは何年も前からアダプティブテストを採用しています。医師免許試験でも使われています。すべてに共通する原理は同じです。簡単すぎる問題や難しすぎる問題ではなく、受験者のレベルに合った問題を出すことで、能力をより正確に測定できるということです。

テニスに例えるとわかりやすいです。テニスを学んでいる時、5歳の子供やプロの選手と対戦しても上達しません。自分に近いレベルの相手と対戦することで上達します。アダプティブテストはこの同じ論理を測定に適用します。テストが受験者のレベルで「プレー」することで、より精密に測定できるのです。

TOEFL iBT 2026でのMSTの仕組み

TOEFL iBT 2026では、Multi-Stage Testing(多段階テスト)と呼ばれる特定のタイプのアダプティブテストを使用しています。構造は以下の通りです。

ステージ1:モジュール1(中程度の難易度)

すべての受験者が同じモジュール1から始めます。このモジュールには中程度の難易度の問題が含まれています。これがベースライン測定です。これらの問題へのパフォーマンスにより、システムが受験者の能力の最初の推定値を得ます。

モジュール1のすべての問題に答えてから次に進みます。先に進んだり、モジュール内の前の問題に戻ったりすることはできません。

ルーティングの判定

モジュール1を完了すると、システムがItem Response Theory(IRT、項目反応理論)を使って能力推定値を計算します。IRTは、正答数だけでなく、答えた各問題の難易度と識別力を考慮する統計モデルです。

この推定値に基づいて、2つのパスのいずれかに振り分けられます。

  • モジュール2 Easy: モジュール1のパフォーマンスが低めの能力レベルを示唆する場合
  • モジュール2 Hard: モジュール1のパフォーマンスが高めの能力レベルを示唆する場合

このルーティングは自動的かつ見えない形で行われます。「あなたはEasyモジュールに振り分けられました」というメッセージは表示されません。単に次の問題セットに移るだけです。

ステージ2:モジュール2(EasyまたはHard)

モジュール2には、推定されたレベルに合わせて調整された問題が含まれます。モジュール2 Hardに振り分けられた場合はより難しい問題に直面し、モジュール2 Easyに振り分けられた場合はより取り組みやすい問題に直面します。

そのセクションの最終スコアは、両方のモジュールのパフォーマンスを、受け取った問題の難易度で重み付けして算出されます。

IRTスコアリングが単純な正答数カウントと異なる理由

旧リニアTOEFLでは、スコアリングは比較的シンプルでした。素点(正答数)が換算テーブルでスケールドスコアに変換されていました。全員が同じ問題に答えるので、単純な換算で十分だったのです。

MSTとIRTでは、スコアリングがより精巧になっています。

核心的な原則

難しい問題の正解は、簡単な問題の正解よりも価値が高い。

これが根本的な違いです。20問中15問正解した受験者2人でも、片方がより難しい問題に答えていれば、異なるスコアになる可能性があります。

IRTによる能力推定の仕組み

IRTは各問題にパラメータのセットを割り当てます。

  • 難易度: その問題の難しさ(受験者が50%の確率で正解する能力レベルとして表現される)
  • 識別力: その問題が異なる能力レベルの受験者をどれだけうまく区別できるか

問題に正解すると、能力推定値が上がります。不正解だと下がります。ただし、調整の大きさは問題のパラメータによって異なります。非常に難しい問題に正解すると大きな上方修正が、非常に簡単な問題に不正解だと大きな下方修正が生じます。

すべての問題を採点した後、システムは信頼区間付きの最終能力推定値を算出します。この推定値が0〜30のスコアスケールにマッピングされます。

実際の影響

  1. 正答数を数えてもスコアは予測できない。 問題の難易度が正答率と同じくらい重要です。
  2. モジュール2 Hardに振り分けられるのは悪いニュースではない。 システムが受験者の実力を高く評価している証拠であり、それらの難しい問題に正解すれば高いスコアで報われます。
  3. モジュール2 Easyに振り分けられてもスコアの上限が低く制限されるわけではない。 モジュール2 Easyの問題に正解すれば十分なスコアを得ることができますが、上限はモジュール2 Hardより低くなります。
  4. すべての問題が重要。 簡単な問題を「犠牲にして」難しい問題に時間を割く戦略は通用しません。各回答が能力推定値を更新します。

MSTは旧フォーマットより難しいのか?

これが最もよく聞かれる質問ですが、答えにはニュアンスが必要です。

絶対的な意味では難しくない

テスト全体の難易度は、以前と同じスコア分布になるよう調整されています。旧TOEFLで100点を取れる学生は、新しいテストでもおよそ100点を取れるはずです。ETSはこれを保証するために大規模なスコア等化調査を実施しています。

体感は異なる

変わるのは主観的な体験です。

  • 実力が高い場合: モジュール1は対処可能に感じ、その後のモジュール2 Hardは本当に難しく感じるでしょう。旧フォーマットでは、簡単な問題と難しい問題が混在していたので楽にこなせていた部分がありました。今は難しい問題がモジュール2に集中しています。
  • 実力が発展途上の場合: モジュール1が難しく感じるかもしれませんが、モジュール2 Easyはレベルに合った内容になります。旧フォーマットでは、難しすぎる問題が多く、フラストレーションとランダムな推測につながっていました。
  • 中間レベルの場合: モジュール1が中程度の難易度で、モジュール2がどちらになるか分からないため、旧フォーマットに最も近い体験になります。

重要なポイント:難易度が受験者に合わせて調整される

テストは固定的な意味で難しくも簡単にもなりません。受験者に合わせて調整されます。レベルに適応するテストは常に適切に難しく感じますが、それこそが望ましい状態です。簡単すぎる問題はスコアに貢献しません。難しすぎる問題は推測を招き、それもスコアに貢献しません。MSTは受験者の「生産的なゾーン」の問題を提供します。

MSTが各セクションにどう適用されるか

MSTはTOEFL iBT 2026の各セクションに独立して適用されます。

Reading

モジュール1には中程度の難易度のリーディングパッセージ(日常とアカデミックの両方)が含まれます。モジュール1のパフォーマンスに基づいて、Readingのモジュール2 EasyまたはHardに振り分けられます。難しいモジュールでは、より複雑なパッセージ、よりニュアンスのある問題、より手強い文脈中の語彙問題が出題されます。

Listening

同じ構造が適用されます。モジュール1には中程度の難易度のリスニング問題(Choose a Response、会話、アナウンスメント、アカデミックトーク)が含まれます。モジュール2はリスニングのパフォーマンスに基づいて適応します。難しいリスニングモジュールでは、より速いスピーチ速度、より複雑なアカデミックトピック、より深い推論を要する問題が特徴です。

Speaking

Speakingセクションも2モジュール構造に従います。難易度の調整には、より複雑なインタビュートピック、より抽象的な質問、より洗練された言語を必要とするシナリオが含まれる場合があります。

Writing

Writingも同じパターンです。モジュール2 Hardでは、より複雑なメールのシナリオ、よりニュアンスのあるアカデミックディスカッションのプロンプト、より洗練された議論を要するトピックが出題される場合があります。

MSTが準備戦略に与える影響

MSTを理解することで、いくつかの具体的な点で準備方法を変えるべきです。

1. モジュール1のパフォーマンスが極めて重要

モジュール1のパフォーマンスがルーティングを決定します。緊張、疲労、不注意によりモジュール1で実力を発揮できないと、モジュール2 Easyに振り分けられ、そのセクションのスコアの上限が制限されます。

準備への影響: 最初から全力で臨む練習をしましょう。テスト条件をシミュレートし、最初の問題から良いパフォーマンスを出すことに集中してください。テスト前にウォームアップをしましょう。

2. モジュール2が難しく感じてもパニックにならない

モジュール2 Hardに振り分けられた場合、問題が難しく感じるのは当然です。それは失敗の兆候ではなく、システムがモジュール1での好成績を認識した証拠です。

準備への影響: 難しい教材で練習し、難問に遭遇しても不安が引き起こされないようにしましょう。「難しい問題 = モジュール1で良い成績だった」という思考の習慣を身につけてください。

3. すべての問題がルーティングに等しく寄与する

モジュール1では、特定の問題に不釣り合いに時間をかける戦略的メリットはありません。すべての正解が能力推定値に貢献し、すべての不正解がそれを下げます。

準備への影響: 一定のペースで解く練習をしましょう。一部の問題を急いで他の問題に余分な時間を使うのではなく、安定したリズムを身につけてください。

4. ルーティングを操作することはできない

モジュール1でわざと低い成績を取って、モジュール2で簡単な問題を得ようとする受験者もいますが、これは機能しません。IRTスコアリングモデルは問題の難易度を考慮するため、簡単な問題に正解しても難しい問題に正解するよりスコアは低くなります。常に全力で取り組むことが最善です。

準備への影響: すべての問題で常にベストを尽くしてください。戦略的な手抜きは通用しません。

5. アダプティブテストで練習する

リニアテスト(すべての問題が同じ難易度)で練習しても、MST体験の準備にはなりません。パフォーマンスに基づいて実際に異なるモジュールに振り分けるシステムで練習する必要があります。

準備への影響: モジュール1からモジュール2へのルーティング判定を含むMST形式を再現するプラットフォームを使用してください。

MSTに関するよくある誤解

誤解:「モジュール2 Easyに振り分けられたら、スコアの上限が決まる」

事実: モジュール2 Easyではスコアの上限は低くなりますが、それでも十分なスコアを達成できます。モジュール2 Easyでの好成績でも公平なスコアが出るようシステムは設計されています。ただし、最高スコアにはモジュール2 Hardが必要です。

誤解:「テスト終了前にコンピュータがスコアを決めている」

事実: モジュール1後のルーティングは単なる分岐点です。最終スコアは両モジュールのすべての問題へのパフォーマンスから算出されます。モジュール2のパフォーマンスはモジュール1と同じくらい重要です。

誤解:「人によって問題が違うのは不公平だ」

事実: IRTスコアリングは問題の難易度を考慮します。難しい問題に8問正解した受験者と、簡単な問題に10問正解した受験者が同程度のスコアになることがあります。難しい問題の方が1問あたりの情報量が多いからです。どのパスを通っても同等のスコアが出るようシステムは設計されています。

誤解:「モジュール1でランダムに推測して、モジュール2で簡単な問題を得るべきだ」

事実: これは最悪の戦略です。モジュール2 Easyに振り分けられ、すべてのモジュール2 Easyの問題に正解したとしても、システムはそれらが簡単な問題だと認識しているためスコアは限定されます。すべての問題で全力を尽くすことでスコアを最大化できます。

ExamRiftがMSTを再現する方法

ほとんどのTOEFL練習プラットフォームは、まだ旧リニア形式を使用しています。パフォーマンスに関係なく、固定の問題セットを出題するだけです。これでは実際のテスト体験の練習にはなりません。

ExamRiftは、MSTアダプティブテストシステムを完全に実装しています。

  • モジュール1 では全セクションで中程度の難易度の問題を出題
  • IRTベースの能力推定 でモジュール1後のルーティングを計算
  • モジュール2 EasyまたはHard を実際のパフォーマンスに基づいて選択
  • IRTスコアリング で問題の難易度を考慮した最終セクションスコアを算出

これにより、模擬試験がテスト当日の体験を正確にプレビューします。難しい問題や簡単な問題に振り分けられる経験、そしてそれがスコアにどう影響するかを理解できます。

まとめ

MSTは難しくなったのではなく、賢くなったのです。テストが受験者のレベルに適応することで、より精密な測定が可能になります。実力の高い受験者はより難しい問題に直面し(正解すれば報われます)、発展途上の受験者はより適切な問題に直面し(実際の能力のより公平な測定を得られます)。

準備戦略は3つのことに集中すべきです。強いスタートを切る(モジュール1が重要)、問題が難しくなっても冷静でいる(それは好成績の証拠)、そしてアダプティブルーティングを実際に使用するシステムで練習する。

本物のアダプティブテストで練習しよう

ExamRiftは、IRTベースのルーティングとスコアリングを備えたTOEFL iBT 2026の完全なMST体験を再現する唯一のプラットフォームです。アダプティブテストがどんな感覚か推測するのはやめて、実際に体験してみましょう。ExamRift で最初のアダプティブ模擬試験を受けてください。