GPU・Chip・Model・Compute:AIブームの裏にあるハードウェア用語
新しいAIシステムについての記事を読んでいると、わずか3文のうちに筆者は chip(チップ)、GPU、model(モデル)、そして「compute」を、まるでカップに注げる何かであるかのように口にします。あなたはうなずきながらも、頭の片隅で小さな声がこう問いかけます。待って、このうちどれが本物の「頭脳」で、どれがそれが入っている箱にすぎないの?
その混乱はまったく自然なことです。これらの語はいつもセットで出てきて、技術的に聞こえ、しかも多くの宣伝文句はわざとあいまいに使っています。良いニュースは、いったんハードウェアとソフトウェアを分けてしまえば、語彙全体がカチッと収まるということです。
クイック回答
Chip(チップ)は小さなハードウェアの一片です。GPU は、たくさんの小さな計算を一度にこなすのが得意な、特定の種類のチップです。Compute は生の処理能力やリソースを指すくだけた言い方です。Model(モデル)はハードウェアではまったくありません——それは訓練済みのソフトウェアシステムで、それらのチップの上で動きます。チップが仕事をし、モデルは動かされる側です。
キーワード
- Chip(チップ) — 集積回路とも呼ばれる小さなハードウェアの一片で、電子部品を載せています。物理的な物体です。「Processor」と「chip」は重なりますが、「processor」は計算を行う部分を強調し、「chip」は一般的な物理ユニットを指します。
- Processor(プロセッサ) — 命令を実行する部品。CPU(中央処理装置)は、ほとんどの機器に入っている汎用プロセッサです。複雑な作業を一度に1つずつ順番にこなすのが得意です。
- GPU — グラフィックス処理装置(graphics processing unit)。もともとは画面に画像を描くために作られましたが、多くの単純な計算を並列でこなすのが抜群に得意だと判明し、それこそがAIシステムに必要なものでした。GPUがAIハードウェアの主役になったのはそのためです。
- Compute — ここでは名詞として使い、処理能力や作業を動かすのに必要なリソースを意味します。「This needs a lot of compute」は「これには多くの処理能力が要る」という意味です。略式の言い方で、正確な技術単位ではありません。
- Model(モデル) — 入力を受け取り出力を生み出す、訓練済みのソフトウェアシステム。ソフトウェアです。モデルはデータによって形づくられたもので、手に持てるチップとして存在するわけではありません。
- Training(訓練) — データを与えて内部設定を調整させ、モデルを作り上げる過程。
- Inference(推論) — すでに訓練済みのモデルを使って答えを出す過程。
- Accelerator(アクセラレータ) — 特定の種類の作業を速くするために設計されたチップの総称。GPUはその一種です。AIタスク専用に作られた他のアクセラレータも目にするでしょう。この語は、そのチップに絞られた役割があることを示すだけで、神秘的だという意味ではありません。
- Cluster(クラスタ) — 多数のチップを配線でつなぎ、1つの大きなリソースとして動かすもの。あるモデルが「クラスタ上で」訓練されたと言うとき、それは1枚のチップではなく、つながったハードウェアの部屋まるごとが取り組んだという意味です。
よくある落とし穴
最大の落とし穴は、チップを「AIそのもの」だと思い込むことです。人は「このチップがAIだ」とか「彼らはAIをチップに組み込んだ」と言います。チップはハードウェアです。AIのふるまいは、そのハードウェア上で動くソフトウェアであるモデルから来ます。チップはAIを可能にしますが、AIそのものではありません。
2つ目の落とし穴は、GPUとchipを別カテゴリのように混同することです。GPUはチップ——特化したチップ——です。「チップを使うべき、それともGPU?」と尋ねるのは、「乗り物を持っていこうか、それとも自転車?」と聞くのに少し似ています。自転車は乗り物です。よりはっきりした問いは「CPUかGPUか?」です。
3つ目、「compute」を数えられるものとして扱うこと。「we need more compute」という表現を目にします。くだけた用法なら問題ありませんが、ここでは不可算であることに注意してください。「three computes」とは言いません。「more processing power(もっと処理能力)」のように扱いましょう。
4つ目、trainingとinferenceの取り違え。Trainingはモデルを作る工程で、費用も時間もかかります。Inferenceは完成したモデルを動かすもので、比較的速いです。記事がシステムが新しい何かを「学んだ」と言えば、それはtrainingです。あなたの質問に答えるときは、それがinferenceです。この2つを入れ替えて使うと、説明があいまいになります。
5つ目、速いチップが自動的に賢いモデルを意味すると思い込むこと。優れたハードウェアはモデルをより速く動かしたり、より大きなモデルの存在を可能にしたりしますが、チップがモデルを賢くするわけではありません。知能のようなふるまいは、モデルがどう訓練されたかから来るのであって、クロック速度から来るのではありません。
6つ目の落とし穴は、「a model」と「an app」を混同することです。あなたがタップするappは親しみやすい外殻で、モデルはその下でうなりを上げて動くエンジンであり、目にすることのない遠くのチップで動いていることがよくあります。見出しがある会社が「新しいモデルを公開した」と言うとき、それはそのエンジンの話で、画面に新しいappが現れていなくてもそうです。頭の中でエンジンとダッシュボードを分けておくと、ニュースが読み解きやすくなります。
7つ目の名指ししておきたい落とし穴は、くだけた言い回しの「runs on the cloud」です。それは作業が空中に浮かぶという意味ではなく、どこかのデータセンターにある他人のチップ上で起こり、その結果があなたに送り返されるという意味です。「The cloud」(クラウド)とは、ネットワーク越しにアクセスする他人のハードウェアにすぎません。モデルが「lives in the cloud」と言うのは、実際にはどこか別の場所のチップ上に住んでいるという意味です。
自然な表現とぎこちない表現
ぎこちない: Their new chip can write essays and answer questions.
自然: Their new model can write essays and answer questions; it runs on their latest chips.
ぎこちない: We should switch from a chip to a GPU for this.
自然: We should switch from a CPU to a GPU for this, since the task runs in parallel.
やや不自然: The AI is trained every time you ask it something.
より良い: The model was trained once; each question you ask is just inference.
やや不自然: This will require many computes.
より良い: This will require a lot of compute.
やや不自然: The cloud thinks about your question and replies.
より良い: The model runs on chips in a data center and sends the reply back.
自然な版がどうハードウェア(chip、GPU)をソフトウェア(model)から切り分け、「compute」を不可算のリソースとして扱っているかに注目してください。同じ規律は「the cloud」にも当てはまります。あいまいな語に肩代わりさせず、作業をするハードウェアを名指ししましょう。
ミニ表
| 語 | よく混同される相手 | 実際は何か |
|---|---|---|
| Chip | AIそのもの | 回路を載せた物理的なハードウェアの一片 |
| GPU | チップとは別物 | 並列計算が得意な特化したチップ |
| Compute | 数えられる物体 | 不可算の処理能力やリソース |
| Model | チップや機器 | ハードウェア上で動く訓練済みのソフトウェア |
クイック練習
各設問を書き直すか答えてみましょう。模範解答は後ろにあります。
- 空欄を埋めましょう:「The ______ runs on thousands of GPUs.」(ハードとソフト、どちらの語?)
- 正誤:GPUとchipは、まったく異なる2つのカテゴリである。
- 自然になるよう書き直す:「We bought more computes for the project.」
- どちらの語が合う:「Answering your question is an example of ______(training / inference).」
- 誤りを見つける:「Their faster chip made the AI much smarter.」
解答:(1) model——ハードウェア上で動くソフトウェアです。(2) 誤り——GPUはチップの一種です。(3)「We bought more compute for the project.」(4) inference。(5) 速いチップはモデルをより速く動かしたり、より大きなモデルを可能にしたりできますが、モデルを直接賢くはしません。この表現はチップの役割を誇張しています。
まとめ
AIハードウェアについて明快に話す一番の近道は、一本の線をしっかり心に留めることです。chipとGPUは物理的な物であり、modelはその上で動く訓練済みのソフトウェアであり、「compute」は処理能力の略語にすぎない、という線です。その線を保てば、宣伝文句は霧でなくなります。誰かがチップを「AI」と呼んだ瞬間に気づき、頭の中で正しい語に置き換えるべきだとわかるでしょう。これにはエンジニアリングの学位など要りません——ハードとソフトをそれぞれの車線に置き、「compute」をガジェットではなくリソースとして扱うだけです。
