Pontuações do TOEIC Decifradas: O Que 10-990 e 0-200 Realmente Significam

Se você já olhou para um boletim de pontuação do TOEIC e se perguntou por que Listening e Reading são reportados em uma escala de 10-990 enquanto Speaking e Writing usam cada um uma escala de 0-200, você não está sozinho. As duas escalas não são arbitrárias — elas refletem formatos de teste diferentes, modelos estatísticos diferentes e propósitos diferentes — mas aparecem no mesmo boletim e frequentemente confundem candidatos que esperam um único número unificado.

Este guia percorre as duas escalas, explica como as respostas brutas se tornam pontuações escaladas (scaled scores) e decodifica todos os outros elementos do seu boletim: o erro padrão de medição (SEM), as porcentagens de Abilities Measured, as faixas coloridas do certificado e os descritores de Pronúncia e Entonação no certificado de Speaking.

Dois Testes, Duas Escalas

O TOEIC não é um teste, mas duas avaliações separadas:

TOEIC Listening & Reading (L&R): um teste de múltipla escolha de duas horas com 100 questões de Listening e 100 de Reading, pontuado 10-990.
TOEIC Speaking & Writing (S&W): um teste de desempenho de aproximadamente 80 minutos com 11 tarefas de Speaking e 8 tarefas de Writing, cada metade pontuada 0-200.

Os candidatos podem fazer qualquer uma das duas partes de forma independente. Muitos candidatos corporativos só fazem o L&R; candidatos acadêmicos ou profissionais que precisam demonstrar habilidades produtivas fazem o S&W como sessão separada. Os dois testes foram projetados com anos de diferença, para casos de uso distintos, e a ETS manteve as escalas históricas em vez de forçar uma pontuação unificada.

Por Que 10-990 para o L&R?

A escala 10-990 vem do teste original do TOEIC de 1979 e foi escolhida para evitar a aparência de uma porcentagem. Cada seção (Listening, Reading) é escalada independentemente 5-495 em incrementos de 5 pontos, e as duas são somadas para o total. Ninguém tira 0, porque mesmo chutando produz uma pontuação escalada diferente de zero.

Por Que 0-200 para o S&W?

O teste S&W foi lançado em 2006-2007 com uma filosofia de pontuação diferente. As respostas são avaliadas por humanos e o número de tarefas é menor, então a escala 0-200 em incrementos de 10 pontos espelha a granularidade do julgamento do avaliador em vez da equiparação (equating) de múltipla escolha. As duas escalas são mantidas separadas porque a média delas ocultaria evidências subjacentes bem diferentes.

Como as Pontuações Escaladas São Derivadas: A História do Equating

Sua pontuação bruta — a contagem de questões que você acertou — não é o que aparece no seu boletim. A ETS aplica um processo estatístico chamado equating (equiparação) que ajusta pequenas diferenças de dificuldade entre formas de prova.

Suponha que a Forma A tenha uma seção de Reading ligeiramente mais fácil que a Forma B. Se ambas as formas fossem pontuadas apenas pela contagem bruta, um candidato que fez a Forma A teria vantagem injusta. O equating resolve isso mapeando as pontuações brutas em cada forma para uma escala comum, de modo que uma pontuação escalada de, digamos, 400 em Reading represente a mesma habilidade independentemente da forma que você fez.

É por isso que:

As pontuações brutas nunca são reportadas. Você não verá "87 de 100" no seu boletim.
A mesma contagem bruta pode produzir pontuações escaladas diferentes em administrações distintas.
A escala é estável ao longo do tempo. Um 750 em 2020 e um 750 em 2026 representam o mesmo nível de proficiência em inglês, mesmo que as questões específicas e o grupo de candidatos sejam diferentes.

O L&R usa equating por Item Response Theory (IRT), com coeficientes de confiabilidade KR-20 de aproximadamente 0,90 ou mais em ambas as seções — o que significa que o teste produz resultados consistentes quando o mesmo candidato faz formas paralelas.

O Erro Padrão de Medição: Por Que Sua "Pontuação Verdadeira" Oscila

Nenhum teste — nem TOEIC, nem TOEFL, nem IELTS — reporta um nível de habilidade perfeitamente exato. Toda pontuação escalada carrega um erro padrão de medição (SEM), que quantifica quanto ruído cerca o número reportado.

Para o TOEIC L&R, o SEM é de aproximadamente ±25 pontos escalados por seção. Isso significa que, se sua pontuação de Listening reportada for 400, sua pontuação "verdadeira" (o que você obteria em média em infinitas administrações) está entre 375-425 cerca de 68% do tempo, e entre aproximadamente 350-450 cerca de 95% do tempo.

O Que o SEM Significa na Prática

Se você tirou 700 hoje e fizer o teste novamente no mês que vem e tirar 720, esse ganho de 20 pontos é quase certamente ruído de medição, não melhoria real. O erro padrão de diferença (SE_diff) ao comparar duas administrações é aproximadamente ±35 pontos na escala total do L&R. Uma regra prática aproximada:

Variação observada	Interpretação
0-20 pontos	Provavelmente ruído; nenhuma mudança significativa de habilidade
20-40 pontos	Ambíguo; pode ser ruído ou melhoria modesta
40+ pontos	Provavelmente mudança real de habilidade
70+ pontos	Substancial, quase certamente melhoria real

É por isso que os limites corporativos de contratação frequentemente exigem que os candidatos atinjam uma pontuação-alvo com margem confortável. Uma empresa que exige "mínimo 700" sabe que um 695 e um 705 são estatisticamente indistinguíveis, então muitos departamentos de RH estabelecem cortes internos 30-50 pontos acima do mínimo declarado.

SEM para o S&W

As pontuações do S&W são reportadas em incrementos de 10 pontos porque a precisão de medição subjacente não suporta distinções mais finas. Uma pontuação de Speaking de 140 e 150 representa faixas de desempenho genuinamente diferentes; uma pontuação de Speaking de 143 não seria estatisticamente significativa, então a ETS não reporta nesse nível.

Faixas de Pontuação do TOEIC L&R e o Que Significam

Aqui está a interpretação comumente citada para pontuações totais do L&R, extraída de descritores de proficiência da ETS e guias de uso corporativo:

Pontuação Total	CEFR (aprox.)	Habilidade Prática em Inglês
905-990	C1-C2	Proficiência de trabalho quase nativa; capaz de lidar com negociações complexas, comunicação escrita nuançada, discussões técnicas
785-900	B2-C1	Forte proficiência de trabalho; pode participar com confiança em reuniões, escrever e-mails profissionais, entender a maior parte do conteúdo de negócios
605-780	B1-B2	Proficiência de trabalho funcional; pode lidar com interações rotineiras no ambiente profissional e correspondência padrão com lacunas ocasionais
405-600	A2-B1	Proficiência de trabalho limitada; pode comunicar necessidades básicas, seguir instruções simples, tem dificuldade com tópicos abstratos ou técnicos
255-400	A2	Proficiência elementar; só consegue lidar com trocas altamente previsíveis
10-250	A1	Inglês básico feito de fórmulas; compreensão e produção no nível da frase

Essas faixas são diretrizes, não limites contratuais. Muitos empregadores publicam seus próprios cortes com base na função do cargo (por exemplo, 600 para atendimento ao cliente, 750 para vendas internacionais, 850 para cargos executivos).

As Faixas Coloridas do Certificado L&R

Candidatos que fazem o TOEIC L&R recebem um certificado com um código de cor que reflete a faixa de pontuação. A estrutura comum das faixas é:

Cor	Faixa de Pontuação	Resumo da Proficiência
Gold	860-990	Consegue lidar com a maioria das situações de trabalho com confiança
Blue	730-855	Consegue atender às necessidades de comunicação social e profissional
Green	470-725	Consegue manter conversa básica e clara
Brown	220-465	Consegue lidar com trocas limitadas e rotineiras
Orange	10-215	Apenas inglês básico feito de fórmulas

Esses limiares são amplamente citados, mas podem variar por região. Cada ETS Preferred Network (EPN) — o administrador nacional em um determinado mercado — tem alguma discricionariedade sobre a apresentação do certificado, e pequenas variações nas bordas das faixas ocorrem em alguns países. Se um corte específico importa para você (por exemplo, um gestor de contratação pediu "nível Gold"), confirme o limiar exato com sua EPN local.

O Detalhamento Abilities Measured

Todo boletim de L&R inclui uma seção Abilities Measured que reporta sua porcentagem de acertos em cinco áreas de habilidade por seção. Essa é uma informação diagnóstica genuinamente útil — muito mais acionável do que a pontuação escalada única.

Abilities Measured em Listening

Consegue inferir essência, propósito e contexto básico com base em informações explicitamente declaradas em textos falados curtos (território das Parts 1-2).
Consegue inferir essência, propósito e contexto básico com base em informações explicitamente declaradas em textos falados mais longos (questões de essência das Parts 3-4).
Consegue entender detalhes em textos falados curtos (questões de detalhe da Part 2, detalhes de fotografia da Part 1).
Consegue entender detalhes em textos falados mais longos (questões de detalhe das Parts 3-4).
Consegue entender o propósito de um falante ou o significado implícito (compreensão pragmática; intenção, tom, fala indireta).

Abilities Measured em Reading

Consegue localizar e entender informações específicas em tabelas e passagens (tarefas de escaneamento das Parts 5-7).
Consegue conectar informações entre múltiplas frases em um único texto e entre textos (inferência entre conjuntos de múltiplos textos nas Parts 6-7).
Consegue fazer inferências com base em informações em textos escritos (significado implícito na Part 7).
Consegue entender vocabulário em textos do ambiente profissional (itens lexicais da Part 5).
Consegue entender gramática em textos do ambiente profissional (formas gramaticais da Part 5).

Usando o Abilities Measured para Estudar

Se sua pontuação geral de Listening é 350 mas seu detalhamento mostra 85% em questões de detalhe e 40% em significado pragmático/implícito, você sabe exatamente onde direcionar a prática. A maioria dos candidatos melhora mais rápido treinando sua área de habilidade mais fraca do que fazendo simulados genéricos completos.

Faixas de Pontuação e Descritores do TOEIC S&W

As escalas de Speaking e Writing rodam cada uma de 0-200 em incrementos de 10 pontos. Cada metade publica suas próprias faixas de descritores de proficiência.

Faixas de Proficiência em Speaking

A seção Speaking tem 11 tarefas. As Tarefas 1-10 são avaliadas 0-3 cada, e a Tarefa 11 é avaliada 0-5, produzindo um máximo bruto de 40, que é então convertido para a escala 0-200. A ETS publica 8 faixas de descritores de proficiência:

Pontuação Escalada	Nível de Proficiência
190-200	Altamente proficiente; opiniões nuançadas, sintaxe complexa, entrega quase nativa
160-180	Proficiente; opiniões e raciocínio claros, pequenos problemas de pronúncia ou gramática
130-150	Eficaz; geralmente compreensível com alguma hesitação e amplitude limitada
110-120	Funcional; inteligível em contextos previsíveis, pausas frequentes
80-100	Limitado; frases curtas, forte dependência de linguagem feita de fórmulas
60-70	Básico; difícil de acompanhar, vocabulário severamente limitado
40-50	Mínimo; apenas palavras isoladas e frases memorizadas
0-30	Não consegue funcionar de forma significativa em inglês falado

Faixas de Proficiência em Writing

A seção Writing tem 8 tarefas. Q1-5 são avaliadas 0-3, Q6-7 são avaliadas 0-4, e Q8 é avaliada 0-5, novamente convertida para a escala 0-200. A ETS publica 9 faixas de descritores de proficiência:

Pontuação Escalada	Nível de Proficiência
200	Domínio; sofisticado, bem organizado, erros mínimos
170-190	Altamente proficiente; opiniões estendidas com forte sustentação
140-160	Proficiente; opiniões coerentes com erros ocasionais
110-130	Eficaz; comunicação básica clara; amplitude limitada
90-100	Funcional; frases simples, erros frequentes
70-80	Limitado; ideias fragmentadas, problemas gramaticais severos
50-60	Mínimo; escrita apenas no nível da frase
40	Pré-funcional; mal inteligível
0-30	Não consegue produzir inglês escrito de forma significativa

Pronúncia e Entonação no Certificado de Speaking

Uma característica distintiva do certificado de TOEIC Speaking é a inclusão de dois subdescritores que não aparecem como números, mas como faixas de três níveis:

Pronúncia (Pronunciation): Low / Medium / High
Entonação e Ênfase (Intonation and Stress): Low / Medium / High

Esses rótulos refletem os julgamentos dos avaliadores sobre a clareza dos seus sons (consoantes, vogais, tônica das palavras) e a naturalidade da sua prosódia no nível da frase (ritmo, contorno melódico, colocação de ênfase).

Um candidato que tira 150 em Speaking pode receber:

Pronúncia: Medium
Entonação: Medium

Um candidato que tira 180+ quase sempre recebe High em ambas, enquanto candidatos abaixo de 110 tipicamente recebem Low em pelo menos uma.

Alguns empregadores — especialmente em cargos de atendimento ao cliente ou comunicação internacional — olham para esses descritores especificamente. Um candidato com 160 e "High / High" nos subdescritores pode ser preferido a um candidato com 170 e "Medium / Low", porque a inteligibilidade muitas vezes importa mais para o trabalho do que a amplitude do vocabulário.

Como as Pontuações do S&W São Produzidas

Diferentemente do L&R, as respostas do S&W são avaliadas por avaliadores certificados da ETS por meio da Online Network for Evaluation (ONE). Cada resposta é tipicamente pontuada por múltiplos avaliadores com discrepâncias resolvidas por adjudicação. As rubricas de Speaking cobrem pronúncia, entonação e ênfase, gramática, vocabulário, coesão e relevância de conteúdo; as rubricas de Writing cobrem gramática, vocabulário, organização, relevância e completude da tarefa — aplicadas de forma diferente por tipo de tarefa. As pontuações dos avaliadores são somadas e então mapeadas para a escala 0-200 usando uma tabela de conversão atualizada periodicamente para manter a estabilidade.

Ranking Percentil: Onde Você Está Globalmente

Seu boletim também mostra rankings percentis — a porcentagem de candidatos no mundo que pontuaram igual ou abaixo da sua pontuação. A ETS atualiza essas tabelas a cada maio com base em um pool contínuo de candidatos de três anos. Como pontos de referência aproximados: 990 é o percentil 99+, 900 é cerca do 90, 800 cerca do 75, 700 cerca do 55, e 500 cerca do 20. Os percentis importam para seleção competitiva (bolsas de estudo, pools de contratação internacionais), mas não alteram os limites absolutos dos empregadores.

Lendo Seu Boletim: Uma Lista de Verificação Prática

Quando receber seu boletim do TOEIC, percorra-o nesta ordem:

Pontuação total — compare com seu alvo e com o SEM. Sua margem acima do mínimo exigido é maior que ±25?
Pontuações por seção — uma seção está puxando a outra para baixo? Se sim, a próxima rodada de preparação deve focar lá.
Porcentagens do Abilities Measured — identifique as duas áreas de habilidade mais fracas entre as dez (cinco de Listening, cinco de Reading). Esses são seus alvos de estudo com maior alavancagem.
(Apenas S&W) Descritores de proficiência — leia o descritor completo em nível de parágrafo para sua faixa, não apenas a pontuação. O descritor diz quais comportamentos específicos moveriam você para cima.
(Apenas S&W) Rótulos de Pronúncia / Entonação — se algum for "Low", prática de fonética e prosódia direcionadas produzirá ganhos visíveis mais rápido do que prática geral de fala.
Ranking percentil — relevante apenas se você estiver em contexto de seleção competitiva. Caso contrário, foque na pontuação absoluta.

Interpretações Equivocadas Comuns

"Tirei 87% no detalhamento das Abilities de Listening, então minha pontuação de Listening deveria ser 870." Não. As porcentagens do Abilities Measured são porcentagens de categorias diagnósticas, não a base da sua pontuação escalada. Sua pontuação escalada reflete o modelo IRT totalmente equiparado em todos os itens, ponderado pela dificuldade do item.

"Tirei 720, minha amiga tirou 740 — ela é melhor em inglês." Dentro de ±35 uma da outra, as pontuações são estatisticamente indistinguíveis. 720 e 740 são operacionalmente a mesma pontuação. Apenas diferenças de aproximadamente 70+ pontos refletem de forma confiável diferenças reais de habilidade.

"Vou focar em alcançar a próxima faixa de cor." Uma meta motivacional, mas as fronteiras das faixas são discretas enquanto a habilidade é contínua. Um 855 (topo do Blue) é funcionalmente idêntico a um 860 (base do Gold). Não supervalorize a cor na fronteira.

Resumo Final

O TOEIC usa duas escalas diferentes porque são dois testes diferentes, construídos em momentos diferentes para propósitos diferentes. Ambas as escalas são rigorosamente equiparadas, razoavelmente confiáveis e acompanhadas de informação diagnóstica rica — se você souber ler. O hábito mais importante que um candidato do TOEIC pode construir é ignorar a pontuação total como primeira leitura e ir direto para o detalhamento do Abilities Measured (para o L&R) ou o parágrafo descritor de proficiência (para o S&W). É lá que mora a informação acionável.

Entenda o SEM, considere ±25 na definição dos seus alvos e não persiga oscilações de 10 pontos entre administrações — são ruído. Busque ganhos significativos de 40-70 pontos por ciclo de preparação e estude as áreas de habilidade específicas que estão segurando você em vez de fazer simulados indiferenciados e completos.

Pronto para mover sua pontuação de forma significativa? ExamRift oferece simulados adaptativos completos de TOEIC L&R com diagnóstico por área de habilidade — para que você possa ver exatamente quais das cinco habilidades de Listening e cinco de Reading estão custando pontos e praticar exercícios direcionados que tratam suas áreas mais fracas. Cada sessão vem com suplementos gerados por IA de vocabulário, frases funcionais e explicações que transformam cada questão em um momento de estudo focado. Comece sua prática gratuita hoje e veja onde você realmente está.