GPU、Chip、Model、Compute:AI 熱潮背後的硬體詞彙
你正在讀一篇介紹新 AI 系統的文章,才三句話,作者就提到了 chip(晶片)、GPU、model(模型),還有 compute,彷彿那是某種可以倒進杯子裡的東西。你跟著點頭,但腦海深處有個小小的聲音問道:等等,這幾個到底哪一個才是真正的「大腦」,哪一個只是它住的盒子?
這種混淆完全正常。這些字總是結伴出現,聽起來都很技術,而且很多行銷文案是刻意把它們用得含糊。好消息是,一旦你把硬體和軟體分開,整套詞彙就會各就各位。
快速解答
Chip(晶片)是一小塊硬體;GPU 是一種特別擅長同時做大量小計算的晶片。Compute 是個口語化的字,指原始的運算能力或資源。Model(模型)根本不是硬體——它是訓練好、跑在那些晶片上的軟體系統。晶片負責幹活;模型才是被運行的那個東西。
關鍵詞
- Chip(晶片) — 一小塊硬體,也叫積體電路,裡頭裝著電子元件。它是個實體物件。「Processor」和「chip」有重疊,但「processor」強調負責計算的那部分,「chip」則是泛指實體單元。
- Processor(處理器) — 執行指令的元件。CPU(中央處理器)是大多數裝置裡的通用處理器。它擅長一次依序處理一件複雜的工作。
- GPU — 圖形處理器(graphics processing unit)。原本是為了在螢幕上繪圖而打造,但結果發現 GPU 非常擅長平行處理大量簡單計算,而這正是 AI 系統需要的。這就是 GPU 成為 AI 硬體主角的原因。
- Compute — 這裡當名詞用,指運算能力或執行一項任務所需的資源。「This needs a lot of compute」就是「這需要很多運算量」。它是個簡略說法,不是精確的技術單位。
- Model(模型) — 一個訓練好、接收輸入並產生輸出的軟體系統。它是軟體。模型是由資料塑造而成;它不是你能拿在手上的晶片。
- Training(訓練) — 用資料餵養模型、讓它調整內部設定來建立模型的過程。
- Inference(推論) — 使用一個已經訓練好的模型來產生答案的過程。
- Accelerator(加速器) — 泛指為了加快某種特定工作而設計的晶片。GPU 就是一種加速器。你也會看到專為 AI 任務打造的其他加速器。這個字告訴你晶片有個專注的任務,而不是說它很神祕。
- Cluster(叢集) — 一群被串接在一起、當成一個大型資源運作的晶片。當人們說某個模型是「在 cluster 上」訓練的,意思是一整個房間相連的硬體一起參與了,而不是單一晶片。
常見陷阱
最大的陷阱是把晶片當成「AI 本身」。有人會說「這個晶片就是 AI」或「他們把 AI 內建到晶片裡」。晶片是硬體。AI 的行為來自模型,也就是跑在那硬體上的軟體。晶片讓 AI 得以運作;它本身不是 AI。
第二個陷阱是把 GPU 和 chip 當成兩個不同的類別。GPU 就是一種晶片——一種特化的晶片。問「我們該用 chip 還是 GPU?」有點像問「我該帶交通工具還是腳踏車?」腳踏車就是交通工具。更清楚的問法是「CPU 還是 GPU?」
第三,把「compute」當成可數的東西。你會看到「we need more compute」。當作口語沒問題,但要注意這裡它是不可數的。你不會說「three computes」。把它當成「更多運算能力」就對了。
第四,把 training 和 inference 搞混。Training 建立模型,既昂貴又緩慢。Inference 運行完成的模型,相對快速。當文章說某系統「學會」了新東西,那是 training。當它回答你的問題時,那是 inference。把這兩者混用會讓你的描述變得模糊。
第五,以為更快的晶片就自動代表更聰明的模型。更好的硬體能讓模型跑得更快,或讓更大的模型得以存在,但晶片並不會讓模型變得更睿智。類似智慧的行為來自模型如何被訓練,而不是來自時脈速度。
第六個陷阱是把「a model」和「an app」混為一談。你點開的 app 是友善的外殼;模型是底下嗡嗡運轉的引擎,常常跑在你從未見過的遠端晶片上。當標題說某公司「發布了新模型」,講的是那具引擎,即使你的螢幕上並沒有冒出新的 app。在腦中把引擎和儀表板分開,新聞就更好讀懂了。
第七個值得點名的陷阱是那句口語的「runs on the cloud」。那不代表工作飄浮在空中;它代表工作發生在某座資料中心、別人的晶片上,然後結果再傳回給你。「The cloud」(雲端)不過是別人的硬體,透過網路存取。說某個模型「lives in the cloud」其實是指它住在別處的某些晶片上。
自然與生硬的對照範例
生硬: Their new chip can write essays and answer questions.
自然: Their new model can write essays and answer questions; it runs on their latest chips.
生硬: We should switch from a chip to a GPU for this.
自然: We should switch from a CPU to a GPU for this, since the task runs in parallel.
不太自然: The AI is trained every time you ask it something.
更好: The model was trained once; each question you ask is just inference.
不太自然: This will require many computes.
更好: This will require a lot of compute.
不太自然: The cloud thinks about your question and replies.
更好: The model runs on chips in a data center and sends the reply back.
注意自然版怎麼把硬體(chip、GPU)和軟體(model)分開,並把「compute」當成不可數的資源。同樣的原則也適用於「the cloud」:點名做事的硬體,而不要讓一個含糊的字頂替它。
小對照表
| 詞 | 常被誤認為 | 它實際上是什麼 |
|---|---|---|
| Chip | AI 本身 | 一塊裝著電路的實體硬體 |
| GPU | 跟晶片不同的東西 | 一種擅長平行計算的特化晶片 |
| Compute | 可數的物件 | 不可數的運算能力或資源 |
| Model | 一塊晶片或裝置 | 跑在硬體上、訓練好的軟體 |
快速練習
試著改寫或回答每一題。建議答案在後面。
- 填空:「The ______ runs on thousands of GPUs.」(要填硬體還是軟體的字?)
- 是非題:GPU 和 chip 是兩個完全不同的類別。
- 改寫得自然些:「We bought more computes for the project.」
- 哪個字合適:「Answering your question is an example of ______(training / inference).」
- 找錯:「Their faster chip made the AI much smarter.」
答案:(1) model——它是跑在硬體上的軟體。(2) 錯——GPU 是一種晶片。(3)「We bought more compute for the project.」(4) inference。(5) 更快的晶片能讓模型跑得更快或容許更大的模型,但不會直接讓模型更聰明;這個說法誇大了晶片的角色。
重點帶走
要把 AI 硬體說得清楚,最快的辦法是牢牢記住一句話:晶片和 GPU 是實體的東西,model 是跑在它們上面、訓練好的軟體,而「compute」只是運算能力的簡略說法。一旦你守住這條線,行銷文案就不再是一團迷霧。你會抓到有人把晶片叫成「AI」的那一刻,並知道該在心裡換上正確的字。這一切都不需要工程學位——只需要把硬體和軟體各放各的車道,並把「compute」當成一種資源而非一個小工具。
