GPU, Chip, Model, Compute: Sprzętowe słowa kryjące się za szumem wokół AI

Czytasz artykuł o nowym systemie AI i w ciągu trzech zdań autor wspomina o chipie, GPU, modelu oraz o "compute", tak jakby był to coś, co można nalać do kubka. Kiwasz głową, ale gdzieś z tyłu głowy cichy głos pyta: chwila, które z tych rzeczy jest właściwie mózgiem, a które to tylko pudełko, w którym ten mózg siedzi?

To zamieszanie jest zupełnie normalne. Te słowa chodzą parami, brzmią technicznie, a spora część tekstów reklamowych celowo używa ich nieprecyzyjnie. Dobra wiadomość jest taka, że gdy raz oddzielisz sprzęt od oprogramowania, całe słownictwo wskakuje na swoje miejsce.

Szybka odpowiedź

Chip to malutki kawałek sprzętu; GPU to szczególny rodzaj chipa, dobry w wykonywaniu wielu drobnych obliczeń naraz. Compute to potoczne słowo na surową moc obliczeniową albo zasoby. Model w ogóle nie jest sprzętem — to wytrenowany system programowy, który działa na tych chipach. Chipy wykonują pracę; model jest tym, co się uruchamia.

Kluczowe słowa

Chip — Mały kawałek sprzętu, nazywany też układem scalonym, mieszczący elementy elektroniczne. To fizyczny obiekt. "Processor" i "chip" się pokrywają, ale "processor" podkreśla część wykonującą obliczenia, podczas gdy "chip" to ogólna jednostka fizyczna.
Processor — Element, który wykonuje instrukcje. CPU (central processing unit) to procesor ogólnego przeznaczenia w większości urządzeń. Dobrze radzi sobie z jednym złożonym zadaniem naraz, po kolei.
GPU — Graphics processing unit. Pierwotnie stworzony do rysowania obrazów na ekranach, GPU okazał się świetny w wykonywaniu wielu prostych obliczeń równolegle, a tego właśnie potrzebują systemy AI. Dlatego GPU stało się gwiazdą sprzętu dla AI.
Compute — Tu użyte jako rzeczownik, oznaczające moc obliczeniową albo zasoby potrzebne do uruchomienia zadania. "This needs a lot of compute" znaczy "to wymaga dużej mocy obliczeniowej". To skrót myślowy, nie precyzyjna jednostka techniczna.
Model — Wytrenowany system programowy, który bierze dane wejściowe i tworzy dane wyjściowe. To oprogramowanie. Model został ukształtowany przez dane; nie istnieje jako chip, który dałoby się wziąć do ręki.
Training — Proces budowania modelu poprzez podawanie mu danych, dzięki czemu dostraja swoje wewnętrzne ustawienia.
Inference — Proces używania już wytrenowanego modelu do uzyskania odpowiedzi.
Accelerator — Ogólne słowo na chip zaprojektowany tak, by przyspieszać określony rodzaj pracy. GPU to jeden z typów akceleratorów. Spotkasz też inne akceleratory budowane specjalnie pod zadania AI. To słowo mówi, że chip ma sprecyzowaną robotę, a nie że jest czymś tajemniczym.
Cluster — Grupa wielu chipów połączonych przewodami, działających jak jeden wielki zasób. Gdy ktoś mówi, że model wytrenowano "on a cluster", ma na myśli, że pracował nad nim cały pokój połączonego sprzętu, a nie pojedynczy chip.

Częste pułapki

Największa pułapka to traktowanie chipa jako "tej AI". Ludzie mówią "this chip is the AI" albo "they built the AI into the chip". Chip to sprzęt. Zachowanie AI bierze się z modelu, czyli oprogramowania działającego na tym sprzęcie. Chip umożliwia AI; nie jest nią.

Druga pułapka to mylenie GPU i chipa, jakby to były odrębne kategorie. GPU jest chipem — wyspecjalizowanym. Pytanie "should we use a chip or a GPU?" przypomina trochę pytanie "should I bring a vehicle or a bicycle?" Rower jest pojazdem. Jaśniejsze pytanie brzmi: "CPU or GPU?"

Po trzecie, "compute" jako rzecz policzalna. Zobaczysz "we need more compute". To w porządku jako użycie potoczne, ale zauważ, że jest tu niepoliczalne. Nie powiesz "three computes". Traktuj to jak "więcej mocy obliczeniowej".

Po czwarte, mylenie training i inference. Training buduje model i jest kosztowny oraz powolny. Inference uruchamia gotowy model i jest stosunkowo szybki. Gdy artykuł mówi, że system "nauczył się" czegoś nowego, to training. Gdy odpowiada na twoje pytanie, to inference. Używanie ich zamiennie sprawia, że twój opis robi się mglisty.

Po piąte, zakładanie, że szybszy chip automatycznie oznacza mądrzejszy model. Lepszy sprzęt pozwala modelowi działać szybciej albo umożliwia istnienie większego modelu, ale chip nie czyni modelu mądrzejszym. Zachowanie przypominające inteligencję bierze się z tego, jak model został wytrenowany, a nie z taktowania zegara.

Szósta pułapka to mylenie "modelu" z "aplikacją". Aplikacja, którą stukasz palcem, to przyjazna nakładka; model to silnik buczący pod spodem, często działający na odległych chipach, których nigdy nie widzisz. Gdy nagłówek mówi, że firma "wydała nowy model", chodzi o ten silnik, nawet jeśli żadna nowa aplikacja nie pojawiła się na twoim ekranie. Rozdzielenie w głowie silnika i deski rozdzielczej ułatwia rozszyfrowywanie wiadomości.

Siódma pułapka warta nazwania to potoczne wyrażenie "runs on the cloud". To nie znaczy, że praca unosi się w powietrzu; znaczy, że dzieje się na cudzych chipach w centrum danych, a potem wynik jest odsyłany do ciebie. "The cloud" to po prostu cudzy sprzęt, do którego sięgasz przez sieć. Powiedzenie, że model "lives in the cloud", naprawdę oznacza, że żyje na chipach gdzieś indziej.

Naturalnie kontra niezręcznie

Niezręcznie: Their new chip can write essays and answer questions.

Naturalnie: Their new model can write essays and answer questions; it runs on their latest chips.

Niezręcznie: We should switch from a chip to a GPU for this.

Naturalnie: We should switch from a CPU to a GPU for this, since the task runs in parallel.

Mniej naturalnie: The AI is trained every time you ask it something.

Lepiej: The model was trained once; each question you ask is just inference.

Mniej naturalnie: This will require many computes.

Lepiej: This will require a lot of compute.

Mniej naturalnie: The cloud thinks about your question and replies.

Lepiej: The model runs on chips in a data center and sends the reply back.

Zauważ, jak naturalne wersje trzymają sprzęt (chip, GPU) z dala od oprogramowania (model) i traktują "compute" jako niepoliczalny zasób. Ta sama dyscyplina dotyczy "the cloud": nazwij sprzęt wykonujący pracę, zamiast pozwalać, by mgliste słowo go zastępowało.

Mała tabelka

Słowo	Często mylone z	Czym naprawdę jest
Chip	Samą AI	Fizycznym kawałkiem sprzętu mieszczącym układy
GPU	Czymś odrębnym od chipa	Wyspecjalizowanym chipem dobrym w obliczeniach równoległych
Compute	Obiektem policzalnym	Niepoliczalną mocą obliczeniową lub zasobami
Model	Chipem lub urządzeniem	Wytrenowanym oprogramowaniem działającym na sprzęcie

Szybkie ćwiczenie

Spróbuj przepisać lub odpowiedzieć na każde polecenie. Proponowane odpowiedzi znajdziesz poniżej.

Uzupełnij lukę: "The ______ runs on thousands of GPUs." (słowo o sprzęcie czy o oprogramowaniu?)
Prawda czy fałsz: GPU i chip to dwie zupełnie różne kategorie.
Przepisz, by brzmiało naturalnie: "We bought more computes for the project."
Które słowo pasuje: "Answering your question is an example of ______ (training / inference)."
Znajdź błąd: "Their faster chip made the AI much smarter."

Odpowiedzi: (1) model — to oprogramowanie działające na sprzęcie. (2) Fałsz — GPU to rodzaj chipa. (3) "We bought more compute for the project." (4) inference. (5) Szybszy chip może sprawić, że model działa szybciej, albo pozwolić na większy model, ale nie czyni modelu mądrzejszym wprost; sformułowanie wyolbrzymia rolę chipa.

Wniosek

Najszybszy sposób, by mówić jasno o sprzęcie dla AI, to trzymać w głowie jedną zasadę: chipy i GPU to rzeczy fizyczne, a model to wytrenowane oprogramowanie, które na nich działa, podczas gdy "compute" to po prostu skrót na moc obliczeniową. Gdy raz złapiesz tę linię, teksty reklamowe przestają być mgłą. Wyłapiesz moment, w którym ktoś nazywa chip "tą AI", i będziesz wiedzieć, by w głowie podmienić to na właściwe słowo. Nic z tego nie wymaga dyplomu inżyniera — wymaga tylko trzymania sprzętu i oprogramowania na osobnych torach oraz traktowania "compute" jako zasobu, a nie gadżetu.