GPU, Chip, Model, Compute: คำศัพท์ฮาร์ดแวร์ที่ซ่อนอยู่หลังคำโฆษณา AI
คุณกำลังอ่านบทความเกี่ยวกับระบบ AI ใหม่ และภายในสามประโยคผู้เขียนก็เอ่ยถึง chip, GPU, model และคำว่า "compute" ราวกับว่ามันเป็นของที่ตักใส่ถ้วยได้ คุณพยักหน้าตามไปเรื่อยๆ แต่ในใจลึกๆ ก็มีเสียงเล็กๆ ถามว่า เดี๋ยวก่อน อันไหนคือสมองตัวจริง แล้วอันไหนแค่กล่องที่มันอาศัยอยู่
ความสับสนนี้เป็นเรื่องปกติมาก คำเหล่านี้มักมาด้วยกัน ฟังดูเทคนิค และข้อความโฆษณาจำนวนมากก็จงใจใช้มันแบบหลวมๆ ข่าวดีคือเมื่อคุณแยกฮาร์ดแวร์ออกจากซอฟต์แวร์ได้ คำศัพท์ทั้งหมดก็จะเข้าที่เข้าทางทันที
คำตอบสั้นๆ
chip คือชิ้นส่วนฮาร์ดแวร์ตัวเล็กๆ ส่วน GPU คือ chip ชนิดหนึ่งที่เก่งในการคำนวณเล็กๆ หลายอย่างพร้อมกัน compute เป็นคำพูดแบบไม่เป็นทางการที่หมายถึงพลังประมวลผลดิบหรือทรัพยากร ส่วน model ไม่ใช่ฮาร์ดแวร์เลย — มันคือระบบซอฟต์แวร์ที่ฝึกมาแล้วและทำงานอยู่ บน chip เหล่านั้น chip เป็นตัวทำงาน ส่วน model คือสิ่งที่ถูกรัน
คำสำคัญ
- Chip — ชิ้นส่วนฮาร์ดแวร์ตัวเล็กๆ หรือที่เรียกว่าวงจรรวม ซึ่งบรรจุชิ้นส่วนอิเล็กทรอนิกส์เอาไว้ เป็นวัตถุที่จับต้องได้ คำว่า "processor" กับ "chip" คาบเกี่ยวกัน แต่ "processor" เน้นส่วนที่ทำการคำนวณ ส่วน "chip" คือหน่วยทางกายภาพแบบทั่วไป
- Processor — ชิ้นส่วนที่ทำตามคำสั่ง CPU (central processing unit) คือ processor อเนกประสงค์ในอุปกรณ์ส่วนใหญ่ มันเก่งในการจัดการงานซับซ้อนทีละอย่างตามลำดับ
- GPU — graphics processing unit เดิมสร้างมาเพื่อวาดภาพบนหน้าจอ แต่กลับกลายเป็นว่า GPU เก่งมากในการรันการคำนวณง่ายๆ หลายอย่างพร้อมกันแบบขนาน ซึ่งเป็นสิ่งที่ระบบ AI ต้องการพอดี นั่นคือเหตุผลที่ GPU กลายเป็นดาวเด่นของฮาร์ดแวร์ AI
- Compute — ใช้ในที่นี้เป็นคำนาม หมายถึงพลังประมวลผลหรือทรัพยากรที่ต้องใช้รันงาน "This needs a lot of compute" แปลว่า "อันนี้ต้องใช้พลังประมวลผลเยอะ" เป็นคำย่อ ไม่ใช่หน่วยทางเทคนิคที่แม่นยำ
- Model — ระบบซอฟต์แวร์ที่ฝึกมาแล้ว รับอินพุตเข้าไปแล้วผลิตเอาต์พุตออกมา มันคือซอฟต์แวร์ model ถูกหล่อหลอมขึ้นจากข้อมูล มันไม่ได้มีอยู่ในรูป chip ที่คุณถือได้
- Training — กระบวนการสร้าง model โดยป้อนข้อมูลให้มันเพื่อให้มันปรับค่าภายในของตัวเอง
- Inference — กระบวนการ ใช้งาน model ที่ฝึกเสร็จแล้วเพื่อผลิตคำตอบ
- Accelerator — คำกว้างๆ สำหรับ chip ที่ออกแบบมาเพื่อเร่งความเร็วงานบางชนิดโดยเฉพาะ GPU เป็น accelerator ชนิดหนึ่ง คุณจะเจอ accelerator อื่นๆ ที่สร้างมาเพื่องาน AI โดยเฉพาะด้วย คำนี้บอกคุณว่า chip มีหน้าที่เฉพาะเจาะจง ไม่ได้แปลว่ามันลึกลับ
- Cluster — กลุ่มของ chip จำนวนมากที่ต่อสายเข้าด้วยกันให้ทำงานเป็นทรัพยากรก้อนใหญ่ก้อนเดียว เมื่อมีคนพูดว่า model ถูกฝึก "on a cluster" หมายความว่าฮาร์ดแวร์ทั้งห้องที่เชื่อมต่อกันช่วยกันทำงาน ไม่ใช่ chip ตัวเดียว
กับดักที่พบบ่อย
กับดักใหญ่ที่สุดคือ การมอง chip ว่าเป็น "ตัว AI" คนชอบพูดว่า "chip ตัวนี้คือ AI" หรือ "พวกเขาสร้าง AI ไว้ใน chip" chip คือฮาร์ดแวร์ ส่วนพฤติกรรมแบบ AI มาจาก model ซึ่งเป็นซอฟต์แวร์ที่รันอยู่บนฮาร์ดแวร์นั้น chip เป็นตัวเปิดทางให้ AI ทำงาน มันไม่ใช่ตัว AI
กับดักที่สองคือ การสับสนระหว่าง GPU กับ chip ราวกับว่าเป็นคนละประเภทกัน GPU คือ chip — เป็น chip เฉพาะทาง การถามว่า "เราควรใช้ chip หรือ GPU ดี?" ก็เหมือนถามว่า "ฉันควรเอายานพาหนะมาหรือเอาจักรยานมาดี?" จักรยานก็เป็นยานพาหนะอยู่แล้ว คำถามที่ชัดเจนกว่าคือ "CPU หรือ GPU?"
กับดักที่สาม "compute" ในฐานะของที่นับได้ คุณจะเจอ "we need more compute" อันนี้โอเคในฐานะการใช้แบบไม่เป็นทางการ แต่สังเกตว่ามันนับไม่ได้ คุณจะไม่พูดว่า "three computes" ให้มองมันเหมือน "พลังประมวลผลมากขึ้น"
กับดักที่สี่ การสับสนระหว่าง training กับ inference training คือการสร้าง model ซึ่งแพงและช้า ส่วน inference คือการรัน model ที่เสร็จแล้ว ซึ่งเร็วกว่ามากเมื่อเทียบกัน เมื่อบทความบอกว่าระบบ "เรียนรู้" อะไรใหม่ๆ นั่นคือ training เมื่อมันตอบคำถามของคุณ นั่นคือ inference การใช้สองคำนี้สลับกันมั่วทำให้คำอธิบายของคุณคลุมเครือ
กับดักที่ห้า การคิดเอาเองว่า chip ที่เร็วกว่าแปลว่า model ฉลาดกว่าโดยอัตโนมัติ ฮาร์ดแวร์ที่ดีกว่าทำให้ model รันได้เร็วขึ้น หรือทำให้ model ขนาดใหญ่กว่ามีอยู่ได้ แต่ chip ไม่ได้ทำให้ model ฉลาดขึ้น พฤติกรรมที่ดูเหมือนความฉลาดมาจากวิธีที่ฝึก model ไม่ได้มาจากความเร็วสัญญาณนาฬิกา
กับดักที่หกคือ การสับสนระหว่าง "model" กับ "app" app ที่คุณแตะคือเปลือกหน้าตาเป็นมิตร ส่วน model คือเครื่องยนต์ที่ทำงานอยู่ข้างใต้ ซึ่งมักรันอยู่บน chip ไกลๆ ที่คุณไม่เคยเห็น เมื่อพาดหัวข่าวบอกว่าบริษัทหนึ่ง "ปล่อย model ใหม่" มันกำลังพูดถึงเครื่องยนต์ตัวนั้น แม้จะไม่มี app ใหม่โผล่ขึ้นบนจอคุณก็ตาม การแยกเครื่องยนต์ออกจากแผงควบคุมในใจช่วยให้อ่านข่าวได้ง่ายขึ้น
กับดักที่เจ็ดที่ควรพูดถึงคือวลีติดปาก "runs on the cloud" นั่นไม่ได้แปลว่างานลอยอยู่กลางอากาศ มันแปลว่างานเกิดขึ้นบน chip ของคนอื่นในศูนย์ข้อมูล แล้วผลลัพธ์ก็ถูกส่งกลับมาหาคุณ "the cloud" ก็แค่ฮาร์ดแวร์ของคนอื่นที่เข้าถึงผ่านเครือข่าย การพูดว่า model "lives in the cloud" จริงๆ แล้วหมายความว่ามันอยู่บน chip ที่ไหนสักแห่ง
ตัวอย่างที่เป็นธรรมชาติ vs ที่ฟังดูแปลก
แปลกๆ: Their new chip can write essays and answer questions.
เป็นธรรมชาติ: Their new model can write essays and answer questions; it runs on their latest chips.
แปลกๆ: We should switch from a chip to a GPU for this.
เป็นธรรมชาติ: We should switch from a CPU to a GPU for this, since the task runs in parallel.
ไม่ค่อยเป็นธรรมชาติ: The AI is trained every time you ask it something.
ดีกว่า: The model was trained once; each question you ask is just inference.
ไม่ค่อยเป็นธรรมชาติ: This will require many computes.
ดีกว่า: This will require a lot of compute.
ไม่ค่อยเป็นธรรมชาติ: The cloud thinks about your question and replies.
ดีกว่า: The model runs on chips in a data center and sends the reply back.
สังเกตว่าเวอร์ชันที่เป็นธรรมชาติแยกฮาร์ดแวร์ (chip, GPU) ออกจากซอฟต์แวร์ (model) อย่างชัดเจน และมอง "compute" เป็นทรัพยากรที่นับไม่ได้ หลักการเดียวกันใช้ได้กับ "the cloud" ด้วย คือระบุชื่อฮาร์ดแวร์ที่ทำงานจริง แทนที่จะปล่อยให้คำคลุมเครือมายืนแทนที่
ตารางสรุป
| Word | มักสับสนกับ | จริงๆ แล้วมันคืออะไร |
|---|---|---|
| Chip | ตัว AI เอง | ชิ้นส่วนฮาร์ดแวร์ที่จับต้องได้ซึ่งบรรจุวงจร |
| GPU | คนละอย่างกับ chip | chip เฉพาะทางที่เก่งการคำนวณแบบขนาน |
| Compute | วัตถุที่นับได้ | พลังประมวลผลหรือทรัพยากรที่นับไม่ได้ |
| Model | chip หรืออุปกรณ์ | ซอฟต์แวร์ที่ฝึกมาแล้วและรันบนฮาร์ดแวร์ |
ฝึกสั้นๆ
ลองเขียนใหม่หรือตอบแต่ละข้อ เฉลยอยู่ด้านล่าง
- เติมคำในช่องว่าง: "The ______ runs on thousands of GPUs." (คำที่เป็นฮาร์ดแวร์หรือซอฟต์แวร์?)
- ถูกหรือผิด: GPU กับ chip เป็นคนละประเภทกันโดยสิ้นเชิง
- เขียนใหม่ให้เป็นธรรมชาติ: "We bought more computes for the project."
- คำไหนเข้ากับประโยค: "Answering your question is an example of ______ (training / inference)."
- หาที่ผิด: "Their faster chip made the AI much smarter."
เฉลย: (1) model — มันคือซอฟต์แวร์ที่รันอยู่บนฮาร์ดแวร์ (2) ผิด — GPU เป็น chip ชนิดหนึ่ง (3) "We bought more compute for the project." (4) inference (5) chip ที่เร็วกว่าทำให้ model รันได้เร็วขึ้นหรือทำให้ model ใหญ่ขึ้นได้ แต่ไม่ได้ทำให้ model ฉลาดขึ้นโดยตรง การใช้คำแบบนี้พูดเกินจริงเรื่องบทบาทของ chip
สรุปส่งท้าย
วิธีที่เร็วที่สุดที่จะพูดเรื่องฮาร์ดแวร์ AI ได้อย่างชัดเจนคือ ยึดประโยคเดียวไว้ให้มั่น: chip และ GPU เป็นของที่จับต้องได้ ส่วน model คือซอฟต์แวร์ที่ฝึกมาแล้วและรันอยู่บนพวกมัน ขณะที่ "compute" ก็แค่คำย่อของพลังประมวลผล เมื่อคุณยึดเส้นนี้ไว้ คำโฆษณาก็จะเลิกเป็นหมอกควัน คุณจะจับได้ทันทีที่มีคนเรียก chip ว่า "ตัว AI" และคุณจะรู้ว่าต้องสลับคำที่ถูกต้องเข้าไปในใจ ทั้งหมดนี้ไม่ต้องใช้ปริญญาวิศวกรรม — แค่แยกฮาร์ดแวร์กับซอฟต์แวร์ให้อยู่ในเลนของตัวเอง และมอง "compute" เป็นทรัพยากร ไม่ใช่อุปกรณ์ชิ้นหนึ่ง
