Prompt, Output, Hallucination: Perkataan AI Yang Bunyinya Lebih Pelik Daripada Sebenarnya

Anda buka satu alat AI dan seseorang menyuruh anda "write a better prompt." Kemudian mereka memberi amaran model itu mungkin "hallucinate," dan menyebut bahawa teks anda berharga sekian banyak "tokens." Jika anda berhenti dan memikirkan perkataan itu sendirian, ia akan terdengar pelik. Satu alat yang berhalusinasi? Tokens, seperti syiling mesin arked?

Berita baiknya: perkataan ini tidak sepelik bunyinya. Setiap satu meminjam perkataan harian dan memberikannya satu tugas yang sempit lagi khusus. Sebaik sahaja anda pelajari tugas itu, perbendaharaan kata ini berhenti menakutkan dan mula menjadi berguna.

Ada baiknya membayangkan perkataan ini sebagai kostum. Satu perkataan biasa memakai kostum teknologi dan masuk ke bilik baru. "Prompt" kelihatan sama di luar, tetapi di dalam bilik AI ia bermaksud sesuatu yang khusus. Tugas anda cuma mengenal pasti bilik mana anda sedang berdiri, supaya anda membaca perkataan itu dengan cara yang betul.

Jawapan Ringkas

Dalam AI, satu prompt ialah arahan atau soalan yang anda taip, output ialah apa yang sistem hasilkan sebagai balasan, satu hallucination ialah serpihan output yang yakin tetapi salah, satu token ialah ketulan kecil teks yang diproses oleh sistem, dan satu model ialah sistem terlatih itu sendiri. Tiada satu pun yang bermaksud seperti yang ia maksudkan di meja makan, dan jurang itulah tempat orang menjadi keliru.

Perkataan Utama

Prompt. Benda yang anda berikan kepada AI: soalan, arahan atau teks anda. "Write me a prompt" bermaksud "tulis input yang akan anda hantar."
Output. Apa sahaja yang sistem hasilkan kembali. Ia sengaja dibuat neutral. Kita kata "output" dan bukan "answer" kerana hasilnya tidak dijamin betul atau pun pada topiknya.
Hallucination. Serpihan output yang yakin lagi lancar tetapi semata-mata direka atau salah. Fakta palsu, petikan ciptaan, rujukan yang tidak wujud.
Token. Sekeping kecil teks, selalunya satu perkataan atau sebahagian perkataan, digunakan sebagai unit yang sistem baca dan kira. Panjang dan kos biasanya diukur dalam tokens.
Model. Sistem terlatih yang menghasilkan output. "The model" ialah benda yang melakukan kerja itu, bukan seorang manusia dan bukan satu contoh untuk disalin.
Context. Teks yang sistem sedang beri perhatian, termasuk prompt anda dan perbualan terkini. Satu "context window" ialah berapa banyak teks yang boleh dipegangnya sekali gus.
Fine-tune. Mengambil model sedia ada dan melatihnya sedikit lagi atas bahan tertentu supaya ia berkelakuan dengan cara tertentu. Bukan "membuat pelarasan kecil dengan tangan," tetapi satu langkah training yang sebenar, walaupun lebih kecil.

Perangkap Biasa

Satu perangkap biasa ialah mendengar prompt dan terfikir maksud hariannya. Dalam bahasa Inggeris harian, "prompt" boleh bermaksud pantas ("a prompt reply") atau mengingatkan seseorang ("she prompted him to speak"). Dalam AI ia kata nama: teks input. Jadi "improve your prompt" tidak bermaksud "jadi lebih pantas," ia bermaksud "tulis semula arahan yang anda taip."

Perkataan output menyusahkan orang kerana mereka jangka ia bermaksud "jawapan yang betul." Ia bukan begitu. Output cuma apa yang keluar. Ia mungkin cemerlang, ia mungkin mengarut. Mengingati perkataan neutral itu melindungi anda daripada mempercayai hasil terlalu cepat.

Hallucination terdengar dramatik, malah seperti perubatan, dan ramai orang menyangka ia bermaksud AI itu rosak atau sedang mengalami sejenis serangan. Ia lebih tenang daripada itu. Ia istilah teknikal biasa untuk output yang lancar dan yakin tetapi palsu. Sistem itu tidak ternampak apa-apa; ia mengisi satu jurang dengan teks yang berbunyi munasabah. Bahayanya tepatnya ialah ia tidak kelihatan seperti satu kesilapan, ia kelihatan lancar.

Token mengelirukan hampir semua orang pada mulanya. Ia bukan syiling, hadiah, isyarat ("a token of thanks"), atau pas keselamatan. Dalam AI ia ketulan teks. Bila satu alat berkata anda ada had sekian banyak tokens, ia bercakap tentang berapa banyak teks yang boleh dikendalikannya, bukan mata wang yang anda belanjakan untuk hadiah.

Akhir sekali, model terdengar seolah-olah patut bermaksud seseorang yang berpose untuk foto, atau contoh sempurna untuk ditiru ("a model student"). Dalam AI ia bermaksud sistem terlatih itu sendiri. "Which model are you using?" bertanya sistem terlatih yang mana, bukan contoh mana atau model peranan yang mana.

Satu perangkap yang lebih senyap menyorok dalam context. Dalam percakapan harian, context bermaksud latar belakang atau keadaan ("in this context"). Dalam AI ia ada ketajaman yang tepat: ia teks tertentu yang sistem boleh nampak sekarang. Bila orang berkata "it forgot, the context ran out," mereka maksudkan perbualan menjadi lebih panjang daripada yang sistem boleh pegang, bukan ia hilang minat. Dan fine-tune, dalam bahasa Inggeris santai, bermaksud membuat tweak kecil ("fine-tune the wording"). Dalam AI ia menamakan satu pusingan training tambahan yang sebenar. Jadi "we fine-tuned the model" ialah tindakan yang lebih besar daripada "we tweaked a setting," walaupun perkataan harian itu terdengar lembut dan kecil.

Merentas kesemua ini, polanya sama: satu perkataan lembut lagi biasa menyembunyikan satu tugas teknikal yang tepat. Salah faham timbul bukan kerana perkataan itu sukar, tetapi kerana kita mempercayai makna harian seketika terlalu lama. Perlahankan pada setiap istilah, lekatkan tugas sempitnya, dan kekeliruan pun jelas.

Contoh Semula Jadi vs Janggal

Janggal: I gave the AI a quick prompt, so it answered promptly with the right output.

Semula jadi: I typed a short prompt, and the model produced an output I still had to check.

Kurang semula jadi: The model hallucinated, so something must be seriously wrong with it.

Lebih baik: The model hallucinated a source, so I verified the claim before trusting it.

Janggal: My message used too many tokens, like spending coins.

Semula jadi: My message was long, so it used a lot of tokens.

Janggal: This AI model is a real role model for writing.

Semula jadi: This model produces strong writing, though it still makes mistakes.

Versi semula jadi mengekalkan perkataan dalam tugas teknikal sempitnya dan mengelak makna harian daripada menyelinap masuk.

Kurang semula jadi: The conversation got too long, so the AI lost interest in the context.

Lebih baik: The conversation got too long, so it ran past the context the model could hold.

Di sini "lost interest" menyeludup masuk satu perasaan. Model itu tiada minat untuk dihilangkan. Ia cuma tidak dapat menyimpan semua teks terdahulu dalam pandangan.

Jadual Ringkas

Word	Everyday meaning	AI meaning
prompt	pantas; mengingatkan	teks input yang anda berikan
output	(am) hasil	apa sahaja yang sistem hasilkan, betul atau salah
hallucination	ternampak benda; kejadian perubatan	output yang yakin tetapi palsu
token	syiling; hadiah; tanda terima kasih	ketulan kecil teks
model	seorang manusia; contoh sempurna	sistem terlatih yang melakukan kerja

Latihan Pantas

Isi tempat kosong dengan salah satu: prompt, output, hallucination, token, model. Semak diri anda selepas itu.

The system invented a study that does not exist; that is a ________.
The instruction you type into the tool is the ________.
Long text costs more because it uses more ________s.
Whatever the tool generates back is its ________.
The trained system answering you is the ________.

Jawapan:

hallucination
prompt
token
output
model

Semakan bonus: Dalam "she gave a prompt reply," adakah "prompt" itu makna AI? (Tidak. Di situ ia bermaksud pantas, makna hariannya.)

Intipati

Perbendaharaan kata ini hanya terdengar pelik kerana setiap perkataan meminjam satu perkataan biasa dan menyerahkannya satu tugas tunggal lagi khusus. Satu prompt ialah input anda, output ialah hasil mentah, satu hallucination ialah karut yang yakin, satu token ialah ketulan teks, dan satu model ialah sistem itu sendiri. Pegang setiap perkataan pada makna sempitnya, terutamanya output dan hallucination, dan anda akan membaca penulisan AI tanpa mengelak dan bercakap tentang alat ini seperti seseorang yang benar-benar tahu apa yang perkataan itu lakukan. Istilah ini bukan sihir yang mendalam. Ia cuma label, dan kini ia milik anda.