GPU, Chip, Model, Compute : les mots de hardware derrière le hype de l'AI

Vous lisez un article sur un nouveau système d'AI et, en trois phrases, l'auteur a déjà mentionné un chip, une GPU, un model et « compute » comme si c'était une chose qu'on pouvait verser dans une tasse. Vous hochez la tête, mais quelque part au fond de votre esprit, une petite voix demande : attendez, lequel de ces éléments est le vrai cerveau, et lequel n'est que la boîte où il vit ?

Cette confusion est tout à fait normale. Ces mots voyagent ensemble, ils sonnent techniques, et beaucoup de textes marketing les emploient de façon floue exprès. La bonne nouvelle, c'est qu'une fois que vous séparez le hardware du software, tout le vocabulaire se met en place.

Réponse rapide

Un chip est un petit morceau de hardware ; une GPU est un type particulier de chip qui excelle à faire beaucoup de petits calculs en même temps. Compute est un mot familier pour la puissance de traitement ou les ressources brutes. Un model n'est pas du hardware du tout — c'est le système logiciel entraîné qui tourne sur ces chips. Les chips font le travail ; le model est ce qui est exécuté.

Mots-clés

Chip — Un petit morceau de hardware, aussi appelé circuit intégré, qui abrite des composants électroniques. C'est un objet physique. « Processor » et « chip » se recoupent, mais « processor » met l'accent sur la partie qui fait les calculs, tandis que « chip » désigne l'unité physique générale.
Processor — Le composant qui exécute des instructions. Une CPU (central processing unit) est le processor à usage général de la plupart des appareils. Elle est douée pour traiter une tâche complexe à la fois, dans l'ordre.
GPU — Graphics processing unit (processeur graphique). Conçue à l'origine pour dessiner des images sur les écrans, les GPU se sont révélées excellentes pour exécuter de nombreux calculs simples en parallèle, ce dont les systèmes d'AI ont précisément besoin. Voilà pourquoi la GPU est devenue la vedette du hardware d'AI.
Compute — Employé ici comme nom, désignant la puissance de traitement ou les ressources nécessaires pour exécuter une tâche. « This needs a lot of compute » signifie « cela demande beaucoup de capacité de traitement ». C'est un raccourci, pas une unité technique précise.
Model — Un système logiciel entraîné qui reçoit une entrée et produit une sortie. C'est du software. Le model a été façonné par des données ; il n'existe pas comme un chip que vous pourriez tenir en main.
Training — Le processus de construction d'un model en le nourrissant de données pour qu'il ajuste ses réglages internes.
Inference — Le processus consistant à utiliser un model déjà entraîné pour produire une réponse.
Accelerator — Un mot général pour un chip conçu pour accélérer un type de travail précis. Une GPU est un type d'accelerator. Vous verrez aussi d'autres accelerators construits spécialement pour des tâches d'AI. Le mot vous dit que le chip a une fonction ciblée, pas qu'il est mystérieux.
Cluster — Un groupe de nombreux chips reliés entre eux pour agir comme une seule grande ressource. Quand on dit qu'un model a été entraîné « on a cluster », cela veut dire qu'une salle entière de hardware connecté y a travaillé, pas un seul chip.

Pièges courants

Le plus grand piège est de traiter le chip comme « l'AI ». On dit « this chip is the AI » ou « they built the AI into the chip ». Un chip est du hardware. Le comportement d'AI vient d'un model, qui est du software tournant sur ce hardware. Le chip rend l'AI possible ; il n'est pas l'AI.

Un deuxième piège est de confondre GPU et chip comme s'il s'agissait de catégories différentes. Une GPU est un chip — un chip spécialisé. Dire « should we use a chip or a GPU? » revient un peu à demander « dois-je prendre un véhicule ou un vélo ? ». Un vélo est un véhicule. La question plus claire est « CPU ou GPU ? ».

Troisième, « compute » comme une chose dénombrable. Vous verrez « we need more compute ». C'est correct en usage familier, mais notez qu'ici c'est indénombrable. Vous ne diriez pas « three computes ». Traitez-le comme « more processing power ».

Quatrième, confondre training et inference. Le training construit le model et il est coûteux et lent. L'inference fait tourner le model fini et est comparativement rapide. Quand un article dit qu'un système a « learned » quelque chose de nouveau, c'est du training. Quand il répond à votre question, c'est de l'inference. Employer les deux de façon interchangeable rend votre description vague.

Cinquième, supposer qu'un chip plus rapide signifie automatiquement un model plus intelligent. Un meilleur hardware permet à un model de tourner plus vite ou rend possible un model plus grand, mais le chip ne rend pas le model plus sage. Le comportement qui ressemble à de l'intelligence vient de la façon dont le model a été entraîné, pas de la fréquence d'horloge.

Un sixième piège est de confondre « un model » et « une app ». L'app que vous touchez est l'enveloppe conviviale ; le model est le moteur qui ronronne dessous, tournant souvent sur des chips lointains que vous ne voyez jamais. Quand un titre dit qu'une entreprise a « released a new model », il parle de ce moteur, même si aucune nouvelle app n'est apparue sur votre écran. Garder le moteur et le tableau de bord distincts dans votre esprit rend l'actualité plus facile à décoder.

Un septième piège qui mérite d'être nommé est l'expression familière « runs on the cloud ». Cela ne veut pas dire que le travail flotte dans l'air ; cela veut dire qu'il se passe sur les chips de quelqu'un d'autre dans un data center, puis que le résultat vous est renvoyé. « The cloud », c'est juste le hardware d'autres gens, accessible par un réseau. Dire qu'un model « lives in the cloud » signifie en réalité qu'il vit sur des chips ailleurs.

Exemples naturels vs maladroits

Maladroit : Their new chip can write essays and answer questions.

Naturel : Their new model can write essays and answer questions; it runs on their latest chips.

Maladroit : We should switch from a chip to a GPU for this.

Naturel : We should switch from a CPU to a GPU for this, since the task runs in parallel.

Moins naturel : The AI is trained every time you ask it something.

Mieux : The model was trained once; each question you ask is just inference.

Moins naturel : This will require many computes.

Mieux : This will require a lot of compute.

Moins naturel : The cloud thinks about your question and replies.

Mieux : The model runs on chips in a data center and sends the reply back.

Remarquez comme les versions naturelles gardent le hardware (chip, GPU) séparé du software (model) et traitent « compute » comme une ressource indénombrable. La même discipline s'applique à « the cloud » : nommez le hardware qui fait le travail plutôt que de laisser un mot vague tenir sa place.

Mini tableau

Word	Often confused with	What it actually is
Chip	L'AI elle-même	Un morceau physique de hardware qui abrite des circuits
GPU	Une chose distincte d'un chip	Un chip spécialisé, doué pour les calculs en parallèle
Compute	Un objet dénombrable	De la puissance de traitement ou des ressources, indénombrable
Model	Un chip ou un appareil	Du software entraîné qui tourne sur du hardware

Pratique rapide

Essayez de reformuler ou de répondre à chaque consigne. Les réponses suggérées suivent.

Complétez le blanc : « The ______ runs on thousands of GPUs. » (mot de hardware ou de software ?)
Vrai ou faux : une GPU et un chip sont deux catégories complètement différentes.
Reformulez pour que cela sonne naturel : « We bought more computes for the project. »
Quel mot convient : « Answering your question is an example of ______ (training / inference). »
Repérez l'erreur : « Their faster chip made the AI much smarter. »

Réponses : (1) model — c'est du software qui tourne sur le hardware. (2) Faux — une GPU est un type de chip. (3) « We bought more compute for the project. » (4) inference. (5) Un chip plus rapide peut faire tourner un model plus vite ou permettre un model plus grand, mais il ne rend pas directement le model plus intelligent ; la formulation exagère le rôle du chip.

À retenir

Le moyen le plus rapide de paraître clair sur le hardware d'AI est de garder une ligne fermement en tête : les chips et les GPU sont des choses physiques, et un model est le software entraîné qui tourne dessus, tandis que « compute » n'est qu'un raccourci pour la puissance de traitement. Une fois cette ligne tenue, le texte marketing cesse d'être un brouillard. Vous saisirez le moment où quelqu'un appelle un chip « l'AI », et vous saurez substituer mentalement le bon mot. Rien de tout cela ne demande un diplôme d'ingénieur — il suffit de garder le hardware et le software chacun dans sa voie, et de traiter « compute » comme une ressource plutôt que comme un gadget.