Prompt, output, hallucination : les mots de l'AI qui sonnent plus étranges qu'ils ne le sont
Vous ouvrez un outil d'AI et quelqu'un vous dit de « write a better prompt ». Puis on vous prévient que le model risque de « hallucinate », et on mentionne que votre texte coûte un certain nombre de « tokens ». Si vous vous arrêtiez pour réfléchir à ces mots pris isolément, ils sonneraient bizarres. Un outil qui hallucine ? Des tokens, comme des jetons d'arcade ?
La bonne nouvelle : ces mots ne sont pas aussi étranges qu'ils en ont l'air. Chacun emprunte un mot de tous les jours et lui confie une fonction étroite et précise. Une fois la fonction apprise, le vocabulaire cesse d'intimider et devient utile.
Il est utile de voir ces mots comme des costumes. Un mot familier enfile un costume tech et entre dans une nouvelle pièce. « Prompt » a la même apparence de l'extérieur, mais dans la pièce de l'AI il signifie quelque chose de précis. Votre tâche consiste simplement à reconnaître dans quelle pièce vous vous tenez, pour lire le mot de la bonne façon.
Réponse rapide
En AI, un prompt est l'instruction ou la question que vous tapez, l'output est ce que le système produit en réponse, une hallucination est un morceau de cet output assuré mais faux, un token est un petit fragment de texte que le système traite, et un model est le système entraîné lui-même. Aucun de ces mots ne veut dire ce qu'il dirait à table, et c'est dans cet écart que les gens s'embrouillent.
Mots-clés
- Prompt. Ce que vous donnez à l'AI : votre question, instruction ou texte. « Write me a prompt » veut dire « écrivez l'input que vous allez envoyer ».
- Output. Tout ce que le système renvoie. C'est volontairement neutre. On dit « output » plutôt que « answer » parce que le résultat n'est pas garanti correct, ni même dans le sujet.
- Hallucination. Un morceau d'output assuré et fluide qui est tout simplement inventé ou faux. Le faux fait, la citation inventée, la référence qui n'existe pas.
- Token. Un petit bout de texte, souvent un mot ou une partie de mot, utilisé comme unité que le système lit et compte. La longueur et le coût se mesurent d'ordinaire en tokens.
- Model. Le système entraîné qui produit l'output. « The model » est la chose qui fait le travail, pas une personne ni un exemple à copier.
- Context. Le texte auquel le système prête attention sur le moment, y compris votre prompt et la conversation récente. Une « context window » est la quantité de texte qu'il peut retenir d'un coup.
- Fine-tune. Prendre un model existant et l'entraîner un peu plus sur un matériel précis pour qu'il se comporte d'une certaine manière. Pas « faire un petit ajustement à la main », mais une vraie étape de training, plus modeste mais réelle.
Pièges fréquents
Un piège fréquent consiste à entendre prompt et à penser à ses sens de tous les jours. En anglais courant, « prompt » peut vouloir dire rapide (« a prompt reply ») ou inciter quelqu'un (« she prompted him to speak »). En AI c'est un nom : le texte d'input. Donc « improve your prompt » ne veut pas dire « soyez plus rapide », mais « réécrivez l'instruction que vous avez tapée ».
Le mot output fait trébucher les gens parce qu'ils s'attendent à ce qu'il signifie « la bonne réponse ». Ce n'est pas le cas. L'output, c'est juste ce qui est sorti. Cela peut être brillant, cela peut être absurde. Garder ce mot neutre en tête vous protège de faire confiance aux résultats trop vite.
Hallucination sonne dramatique, voire médical, et beaucoup supposent que cela signifie que l'AI est cassée ou en pleine crise. C'est plus calme que cela. C'est un simple terme technique pour un output fluide et assuré, mais faux. Le système ne voit pas des choses ; il comble un vide avec un texte d'allure plausible. Le danger, c'est précisément qu'il n'a pas l'air d'une erreur, il a l'air lisse.
Token déroute presque tout le monde au début. Ce n'est pas un jeton, un cadeau, un geste (« a token of thanks ») ni un laissez-passer de sécurité. En AI c'est un fragment de texte. Quand un outil dit que vous avez une limite de tant de tokens, il parle de la quantité de texte qu'il peut traiter, pas d'une monnaie que vous dépensez en lots.
Enfin, model sonne comme s'il devait désigner une personne qui pose pour des photos, ou un exemple parfait à imiter (« a model student »). En AI il désigne le système entraîné lui-même. « Which model are you using? » demande quel système entraîné, pas quel exemple ni quel modèle à suivre.
Un piège plus discret se cache dans context. Dans le langage de tous les jours, context signifie l'arrière-plan ou la situation (« in this context »). En AI il a un contour précis : c'est le texte précis que le système peut voir sur le moment. Quand on dit « it forgot, the context ran out », on veut dire que la conversation est devenue plus longue que ce que le système pouvait retenir, pas qu'il a perdu intérêt. Et fine-tune, en anglais courant, veut dire faire un réglage minime (« fine-tune the wording »). En AI il nomme une véritable série supplémentaire de training. Donc « we fine-tuned the model » est une action plus grande que « we tweaked a setting », même si le mot courant sonne doux et anodin.
Dans tous ces cas, le schéma est le même : un mot doux et familier cache une fonction technique précise. Les malentendus ne viennent pas de la difficulté des mots, mais du fait qu'on se fie au sens courant un battement de trop. Ralentissez sur chaque terme, attachez-lui sa fonction étroite, et la confusion se dissipe.
Exemples naturels vs. maladroits
Maladroit : I gave the AI a quick prompt, so it answered promptly with the right output.
Naturel : I typed a short prompt, and the model produced an output I still had to check.
Moins naturel : The model hallucinated, so something must be seriously wrong with it.
Mieux : The model hallucinated a source, so I verified the claim before trusting it.
Maladroit : My message used too many tokens, like spending coins.
Naturel : My message was long, so it used a lot of tokens.
Maladroit : This AI model is a real role model for writing.
Naturel : This model produces strong writing, though it still makes mistakes.
Les versions naturelles maintiennent les mots dans leurs fonctions techniques étroites et évitent de laisser les sens courants se glisser en douce.
Moins naturel : The conversation got too long, so the AI lost interest in the context.
Mieux : The conversation got too long, so it ran past the context the model could hold.
Ici « lost interest » fait passer en contrebande un sentiment. Le model n'a pas d'intérêt à perdre. Il n'a simplement pas pu garder tout le texte précédent sous les yeux.
Mini-tableau
| Word | Sens courant | Sens en AI |
|---|---|---|
| prompt | rapide ; inciter | le texte d'input que vous donnez |
| output | résultat (général) | tout ce que le système génère, juste ou faux |
| hallucination | voir des choses ; événement médical | output assuré mais faux |
| token | jeton ; cadeau ; marque de gratitude | un petit fragment de texte |
| model | une personne ; exemple parfait | le système entraîné qui fait le travail |
Entraînement rapide
Complétez le blanc avec l'un de : prompt, output, hallucination, token, model. Vérifiez ensuite.
- The system invented a study that does not exist; that is a ________.
- The instruction you type into the tool is the ________.
- Long text costs more because it uses more ________s.
- Whatever the tool generates back is its ________.
- The trained system answering you is the ________.
Réponses :
- hallucination
- prompt
- token
- output
- model
Vérification bonus : dans « she gave a prompt reply », « prompt » est-il au sens de l'AI ? (Non. Là, il signifie rapide, le sens courant.)
À retenir
Ce vocabulaire ne sonne étrange que parce que chaque mot emprunte un mot ordinaire et lui confie une fonction unique et précise. Un prompt est votre input, l'output est le résultat brut, une hallucination est une absurdité assurée, un token est un fragment de texte, et un model est le système lui-même. Tenez chaque mot à son sens étroit, surtout output et hallucination, et vous lirez des textes d'AI sans broncher et parlerez de ces outils comme quelqu'un qui sait vraiment ce que les mots font. Ces termes ne sont pas de la magie profonde. Ce sont juste des étiquettes, et désormais elles sont à vous.
