GPU, Chip, Model, Compute: Perkataan Perkakasan di Sebalik Hype AI
Anda sedang membaca artikel tentang sistem AI baharu, dan dalam tiga ayat sahaja penulisnya sudah menyebut chip, GPU, model, dan "compute" seolah-olah ia sesuatu yang boleh anda tuang ke dalam cawan. Anda mengangguk-angguk, tetapi di sudut fikiran anda ada suara kecil bertanya: nanti dulu, yang mana satu otak sebenar, dan yang mana hanya kotak tempat ia tinggal?
Kekeliruan itu memang biasa. Perkataan-perkataan ini berjalan bersama, kedengaran teknikal, dan banyak teks pemasaran sengaja menggunakannya secara longgar. Berita baiknya, sebaik sahaja anda memisahkan perkakasan daripada perisian, seluruh perbendaharaan kata ini akan jatuh ke tempatnya.
Jawapan Pantas
Sebuah chip ialah kepingan kecil perkakasan; sebuah GPU ialah jenis chip tertentu yang pandai melakukan banyak pengiraan kecil serentak. Compute ialah perkataan santai untuk kuasa pemprosesan atau sumber mentah. Sebuah model pula bukan perkakasan langsung — ia sistem perisian terlatih yang berjalan pada chip-chip itu. Chip melakukan kerja; model ialah benda yang dijalankan.
Perkataan Penting
- Chip — Kepingan kecil perkakasan, juga dipanggil litar bersepadu, yang memuatkan komponen elektronik. Ia objek fizikal. "Processor" dan "chip" bertindih, tetapi "processor" menekankan bahagian yang membuat pengiraan, manakala "chip" ialah unit fizikal umum.
- Processor — Komponen yang melaksanakan arahan. Sebuah CPU (central processing unit) ialah processor serba guna dalam kebanyakan peranti. Ia pandai mengendalikan satu tugas rumit pada satu masa, secara teratur.
- GPU — Graphics processing unit. Asalnya dibina untuk melukis imej pada skrin, GPU rupanya sangat cemerlang menjalankan banyak pengiraan ringkas secara selari, iaitu tepat seperti yang diperlukan oleh sistem AI. Itulah sebabnya GPU menjadi bintang perkakasan AI.
- Compute — Digunakan di sini sebagai kata nama, bermaksud kuasa pemprosesan atau sumber yang diperlukan untuk menjalankan tugas. "This needs a lot of compute" bermaksud "ini perlukan banyak kapasiti pemprosesan." Ia singkatan, bukan unit teknikal yang tepat.
- Model — Sistem perisian terlatih yang menerima input dan menghasilkan output. Ia perisian. Model telah dibentuk oleh data; ia tidak wujud sebagai chip yang boleh anda pegang.
- Training — Proses membina model dengan memberinya data supaya ia melaraskan tetapan dalamannya.
- Inference — Proses menggunakan model yang sudah terlatih untuk menghasilkan jawapan.
- Accelerator — Perkataan umum untuk chip yang direka bagi mempercepatkan jenis kerja tertentu. GPU ialah salah satu jenis accelerator. Anda juga akan jumpa accelerator lain yang dibina khas untuk tugas AI. Perkataan ini memberitahu chip itu ada tugas fokus, bukan ia misteri.
- Cluster — Sekumpulan banyak chip yang disambung bersama untuk bertindak sebagai satu sumber besar. Apabila orang kata model dilatih "on a cluster," maksudnya seluruh bilik perkakasan bersambung yang menjalankannya, bukan satu chip sahaja.
Perangkap Biasa
Perangkap terbesar ialah menganggap chip sebagai "AI itu sendiri." Orang kata "this chip is the AI" atau "they built the AI into the chip." Chip ialah perkakasan. Tingkah laku AI datang daripada model, iaitu perisian yang berjalan pada perkakasan itu. Chip membolehkan AI; ia bukan AI itu.
Perangkap kedua ialah mengelirukan GPU dan chip seolah-olah ia kategori berbeza. GPU ialah chip — yang khusus. Bertanya "should we use a chip or a GPU?" agak seperti bertanya "patut saya bawa kenderaan atau basikal?" Basikal ialah kenderaan. Soalan yang lebih jelas ialah "CPU atau GPU?"
Ketiga, "compute" sebagai benda yang boleh dikira. Anda akan jumpa "we need more compute." Ini tak apa sebagai penggunaan santai, tetapi perhatikan ia tak boleh dikira di sini. Anda takkan kata "three computes." Anggap ia seperti "more processing power."
Keempat, mengelirukan training dan inference. Training membina model dan ia mahal serta lambat. Inference menjalankan model yang sudah siap dan agak pantas. Apabila artikel kata sistem "learned" sesuatu baharu, itu training. Apabila ia menjawab soalan anda, itu inference. Menggunakan kedua-duanya secara bertukar ganti menjadikan huraian anda kabur.
Kelima, menganggap chip yang lebih pantas secara automatik bermakna model yang lebih pintar. Perkakasan yang lebih baik membenarkan model berjalan lebih pantas atau membenarkan model yang lebih besar wujud, tetapi chip tidak menjadikan model lebih bijak. Tingkah laku seakan kecerdasan datang daripada cara model dilatih, bukan daripada kelajuan jam.
Perangkap keenam ialah mengelirukan "a model" dengan "an app." App yang anda ketuk ialah pembalut mesra; model ialah enjin yang berdengung di bawah, sering berjalan pada chip jauh yang anda tidak pernah nampak. Apabila tajuk berita kata sebuah syarikat "released a new model," ia bercakap tentang enjin itu, walaupun tiada app baharu muncul pada skrin anda. Memisahkan enjin dan papan pemuka dalam fikiran menjadikan berita lebih mudah difahami.
Perangkap ketujuh yang patut dinamakan ialah frasa santai "runs on the cloud." Itu tidak bermakna kerja itu terapung di udara; maksudnya ia berlaku pada chip orang lain di pusat data, kemudian hasilnya dihantar balik kepada anda. "The cloud" hanyalah perkakasan orang lain, diakses melalui rangkaian. Mengatakan model "lives in the cloud" sebenarnya bermaksud ia tinggal pada chip di tempat lain.
Contoh Bersahaja vs Janggal
Janggal: Their new chip can write essays and answer questions.
Bersahaja: Their new model can write essays and answer questions; it runs on their latest chips.
Janggal: We should switch from a chip to a GPU for this.
Bersahaja: We should switch from a CPU to a GPU for this, since the task runs in parallel.
Kurang bersahaja: The AI is trained every time you ask it something.
Lebih baik: The model was trained once; each question you ask is just inference.
Kurang bersahaja: This will require many computes.
Lebih baik: This will require a lot of compute.
Kurang bersahaja: The cloud thinks about your question and replies.
Lebih baik: The model runs on chips in a data center and sends the reply back.
Perhatikan bagaimana versi bersahaja mengasingkan perkakasan (chip, GPU) daripada perisian (model), dan menganggap "compute" sebagai sumber yang tak boleh dikira. Disiplin yang sama terpakai pada "the cloud": namakan perkakasan yang melakukan kerja itu, bukannya membiarkan perkataan kabur menggantikannya.
Jadual Ringkas
| Word | Often confused with | What it actually is |
|---|---|---|
| Chip | AI itu sendiri | Kepingan fizikal perkakasan yang memuatkan litar |
| GPU | Benda berasingan daripada chip | Chip khusus yang pandai pengiraan selari |
| Compute | Objek yang boleh dikira | Kuasa pemprosesan atau sumber yang tak boleh dikira |
| Model | Chip atau peranti | Perisian terlatih yang berjalan pada perkakasan |
Latihan Pantas
Cuba tulis semula atau jawab setiap soalan. Jawapan cadangan menyusul.
- Isi tempat kosong: "The ______ runs on thousands of GPUs." (perkataan perkakasan atau perisian?)
- Betul atau salah: GPU dan chip ialah dua kategori yang sepenuhnya berbeza.
- Tulis semula supaya bersahaja: "We bought more computes for the project."
- Perkataan mana yang sesuai: "Answering your question is an example of ______ (training / inference)."
- Kesan kesilapan: "Their faster chip made the AI much smarter."
Jawapan: (1) model — ia perisian yang berjalan pada perkakasan. (2) Salah — GPU ialah sejenis chip. (3) "We bought more compute for the project." (4) inference. (5) Chip yang lebih pantas boleh menjadikan model berjalan lebih pantas atau membenarkan model yang lebih besar, tetapi ia tidak terus menjadikan model lebih pintar; ayat itu membesar-besarkan peranan chip.
Kesimpulan
Cara terpantas untuk kedengaran jelas tentang perkakasan AI ialah pegang satu garis ini erat-erat: chip dan GPU ialah benda fizikal, dan model ialah perisian terlatih yang berjalan padanya, manakala "compute" hanyalah singkatan untuk kuasa pemprosesan. Sebaik sahaja anda pegang garis itu, teks pemasaran berhenti menjadi kabut. Anda akan menangkap saat seseorang memanggil chip "the AI," dan anda tahu untuk menukar perkataan yang betul dalam fikiran. Tiada apa-apa di sini memerlukan ijazah kejuruteraan — ia hanya memerlukan anda menyimpan perkakasan dan perisian di lorong masing-masing, dan menganggap "compute" sebagai sumber, bukan gajet.
