GPU、Chip、Model、Compute:AI 熱潮背後嘅硬件詞

GPU、Chip、Model、Compute:AI 熱潮背後嘅硬件詞

你正喺度睇一篇講新 AI 系統嘅文章,唔夠三句,作者已經提過 chip、GPU、model,仲有「compute」,講到好似可以倒入杯度嘅一件嘢咁。你一路點頭,但腦海某個角落有把細細聲音問:等等,邊樣先係真正嘅腦袋,邊樣只係佢住嘅個盒?

呢種混亂完全正常。呢啲字成日一齊出現,聽落好技術性,加上好多廣告文案都係故意用得鬆散。好消息係,一旦你將硬件同軟件分開,成套詞彙就會即刻歸位。

快速答案

chip(晶片)係一細件硬件;GPU 係其中一種特別擅長同時做好多細計算嘅 chip。compute(算力)係一個口語講法,指原始嘅處理能力或者資源。model(模型)根本唔係硬件——佢係訓練出嚟、跑嗰啲 chip 上面嘅軟件系統。Chip 做工,model 先係被跑嗰樣嘢。

關鍵字詞

  • Chip(晶片)—— 一細件硬件,又叫 integrated circuit(積體電路),入面裝住電子元件。佢係一件實物。「Processor」同「chip」有重疊,但「processor」強調做計算嗰部分,而「chip」係指籠統嘅實體單位。
  • Processor(處理器)—— 執行指令嘅元件。CPU(central processing unit,中央處理器)係大部分裝置入面嗰個通用處理器。佢擅長一次按順序處理一件複雜工作。
  • GPU—— Graphics processing unit(圖形處理器)。原本係為咗喺螢幕畫圖而整,但 GPU 後來發現好擅長並行跑好多簡單計算,而呢樣正正係 AI 系統需要嘅。所以 GPU 就成為咗 AI 硬件嘅主角。
  • Compute(算力)—— 喺度當名詞用,指處理能力,或者跑一件工作所需嘅資源。「This needs a lot of compute」即係「呢樣嘢需要好多處理能力」。佢係一個簡稱,唔係精確嘅技術單位。
  • Model(模型)—— 一個訓練出嚟嘅軟件系統,接收輸入然後產生輸出。佢係軟件。Model 係被資料塑造出嚟嘅;佢唔係一塊你攞得喺手嘅 chip。
  • Training(訓練)—— 透過餵資料畀 model、令佢調整內部設定,從而建立 model 嘅過程。
  • Inference(推論)—— 一個已經訓練好嘅 model 去產生答案嘅過程。
  • Accelerator(加速器)—— 一個籠統講法,指為加快某種特定工作而設計嘅 chip。GPU 就係其中一種 accelerator。你仲會見到啲專為 AI 工作而整嘅 accelerator。呢個字話畀你知個 chip 有個專注嘅任務,而唔係話佢好神秘。
  • Cluster(叢集)—— 一大堆 chip 駁埋一齊、當成一個大資源咁運作。當人講一個 model 係「on a cluster」訓練出嚟,佢係指成間房駁住嘅硬件一齊做嗰件事,而唔係單一塊 chip。

常見陷阱

最大嘅陷阱係將 chip 當成「個 AI」。有人會講「this chip is the AI」或者「they built the AI into the chip」。Chip 係硬件。AI 嘅行為係嚟自 model,而 model 係跑喺嗰件硬件上面嘅軟件。Chip 令到 AI 行得到;佢本身唔係個 AI。

第二個陷阱係將 GPU 同 chip 當成兩個唔同類別咁撈亂。GPU 就係一塊 chip——一塊特化嘅。問「should we use a chip or a GPU?」就有啲似問「我帶部車定帶架單車好?」單車本身就係一種車。比較清楚嘅問法係「CPU or GPU?」。

第三,將「compute」當成可數嘅嘢。你會見到「we need more compute」。當口語咁用係冇問題嘅,但要留意呢度佢係不可數。你唔會講「three computes」。當佢係「more processing power」咁就啱。

第四,撈亂 training 同 inference。Training 係建立 model,又貴又慢。Inference 係跑已經完成嘅 model,相對快好多。當一篇文章話某個系統「learned」咗啲新嘢,嗰啲係 training。當佢答你嘅問題,嗰啲係 inference。將呢兩個字交換咁用,會令你嘅描述變得含糊。

第五,以為 chip 快咗就自動代表 model 叻咗。更好嘅硬件可以令 model 跑快啲,或者令更大嘅 model 存在得到,但 chip 唔會令 model 變得更有智慧。似智能嘅行為係嚟自 model 點樣訓練,而唔係嚟自時脈速度。

第六個陷阱係將「a model」同「an app」撈亂。你㩒嗰個 app 係個友善嘅外殼;model 係喺底下嗡嗡作響嘅引擎,通常跑喺你永遠都見唔到嘅遠方 chip 上面。當一個標題話某間公司「released a new model」,佢係喺度講嗰個引擎,即使你螢幕上面冇出現過任何新 app。喺腦海入面將引擎同儀表板分開,就會令啲新聞容易理解好多。

第七個值得提嘅陷阱係嗰句口語「runs on the cloud」。咁唔代表件工作飄喺空氣度;佢係指件事發生喺第二個人位於 data center 嘅 chip 上面,然後結果再傳返畀你。「The cloud」(雲端)只係其他人嘅硬件,透過網絡去存取。講一個 model「lives in the cloud」,其實係指佢住喺第二度嘅 chip 上面。

自然 vs 彆扭嘅例子

彆扭: Their new chip can write essays and answer questions.

自然: Their new model can write essays and answer questions; it runs on their latest chips.

彆扭: We should switch from a chip to a GPU for this.

自然: We should switch from a CPU to a GPU for this, since the task runs in parallel.

冇咁自然: The AI is trained every time you ask it something.

較好: The model was trained once; each question you ask is just inference.

冇咁自然: This will require many computes.

較好: This will require a lot of compute.

冇咁自然: The cloud thinks about your question and replies.

較好: The model runs on chips in a data center and sends the reply back.

留意吓自然版本點樣將硬件(chip、GPU)同軟件(model)分開,仲將「compute」當成一個不可數嘅資源。同一套紀律都適用於「the cloud」:講明邊件硬件喺度做工,而唔係由一個含糊嘅字頂上去。

小型表格

Word Often confused with What it actually is
Chip The AI itself 一件裝住電路嘅實體硬件
GPU A separate thing from a chip 一塊擅長並行計算嘅特化 chip
Compute A countable object 不可數嘅處理能力或者資源
Model A chip or device 跑喺硬件上面、訓練出嚟嘅軟件

快速練習

試吓改寫或者回答每條題目。建議答案喺後面。

  1. 填空:「The ______ runs on thousands of GPUs.」(係硬件字定軟件字?)
  2. 是非題:GPU 同 chip 係兩個完全唔同嘅類別。
  3. 改到自然啲:「We bought more computes for the project.」
  4. 邊個字啱:「Answering your question is an example of ______(training / inference)。」
  5. 捉錯處:「Their faster chip made the AI much smarter.」

答案:(1) model——佢係跑喺硬件上面嘅軟件。(2) 錯——GPU 係 chip 嘅一種。(3)「We bought more compute for the project.」(4) inference。(5) 快啲嘅 chip 可以令 model 跑快啲,或者容許更大嘅 model,但唔會直接令 model 變得更聰明;呢個寫法誇大咗 chip 嘅角色。

重點帶走

要講 AI 硬件講得清楚,最快嘅方法係牢牢記住一條界線:chip 同 GPU 係實物,而 model 係跑喺佢哋上面、訓練出嚟嘅軟件,至於「compute」只係處理能力嘅簡稱。一旦你守住呢條界線,廣告文案就唔再係一團霧。你會捉到有人將 chip 叫做「個 AI」嗰一刻,然後知道喺心入面換上啱嘅字。呢啲全部都唔需要一個工程學位——只需要將硬件同軟件各歸各位,再將「compute」當成一種資源而唔係一件小玩意。