Prompt、Output、Hallucination:聽落比實際古怪嘅 AI 字
你打開一個 AI 工具,有人叫你「寫一個好啲嘅 prompt」。跟住佢哋警告你 model 可能會「hallucinate」,又提到你嘅文字會用一定數量嘅「token」。如果你停低嚟單獨諗呢啲字,佢哋會聽落好怪。一個會幻覺嘅工具?token,似遊戲機代幣咁?
好消息係:呢啲字並冇佢哋聽落咁奇怪。每個都借用咗一個日常字眼,再俾佢一份好窄、好特定嘅工作。一旦你學識嗰份工作,呢啲詞彙就唔再嚇人,反而開始變得有用。
不妨將呢啲字諗成戲服。一個熟悉嘅字穿上科技戲服,行入一間新房。「Prompt」表面睇落一樣,但喺 AI 嗰間房入面,佢有個特定意思。你嘅任務只係認出自己企緊喺邊間房,咁你就會用啱嘅方式去解讀個字。
快速解答
喺 AI 入面,prompt(提示)係你打入去嘅指令或者問題,output(輸出)係系統回應時產生嘅嘢,hallucination(幻覺)係嗰個 output 入面自信但錯嘅一段內容,token(詞元)係系統處理嘅一小段文字,而 model(模型)就係經訓練嘅系統本身。冇一個係佢哋喺飯枱上會解嘅意思,而呢個落差正係令人混淆嘅地方。
重點字詞
- Prompt(提示)。你俾 AI 嘅嘢:你嘅問題、指令或者文字。「Write me a prompt」意思係「寫你將會發送嘅輸入」。
- Output(輸出)。系統生成返出嚟嘅任何嘢。佢刻意保持中性。我哋用「output」而唔用「answer」,因為個結果唔保證正確,甚至唔保證切題。
- Hallucination(幻覺)。一段自信、流暢,但純粹砌出嚟或者錯嘅 output。嗰個假事實、嗰句虛構嘅引言、嗰個根本唔存在嘅出處。
- Token(詞元)。一小段文字,通常係一個字或者一個字嘅一部分,用嚟做系統讀取同點算嘅單位。長度同成本通常以 token 計。
- Model(模型)。產生 output 嘅經訓練系統。「The model」係做嘢嗰樣嘢,唔係一個人,亦唔係一個畀你模仿嘅榜樣。
- Context(上下文)。系統當下留意緊嘅文字,包括你嘅 prompt 同最近嘅對話。「Context window」係佢一次過可以容納幾多文字。
- Fine-tune(微調)。攞一個現成嘅 model,再用特定材料多訓練佢一陣,令佢以某種方式表現。唔係「用手做個小調整」,而係一個真實、只係細啲嘅訓練步驟。
常見陷阱
一個常見陷阱,係聽到 prompt 就諗起佢嘅日常意思。喺日常英文,「prompt」可以解快(「a prompt reply」)或者提醒人(「she prompted him to speak」)。喺 AI 入面佢係名詞:輸入嘅文字。所以「improve your prompt」唔係叫你「快啲」,而係「改寫你打咗入去嘅指令」。
Output 呢個字絆親好多人,因為佢哋預咗佢解「正確答案」。佢唔係。Output 只係出咗嚟嘅嘢。佢可以好出色,亦可以係廢話。記住呢個中性嘅字,可以保護你唔好太快信個結果。
Hallucination 聽落好戲劇化,甚至好醫學,好多人以為佢解 AI 壞咗或者發緊某種病。其實平靜好多。佢只係一個樸實嘅技術詞,指啲流暢、自信但係假嘅 output。系統並冇見到幻象;佢只係用聽落合理嘅文字填補一個空隙。危險之處正正在於佢唔似一個錯誤,佢睇落好順滑。
Token 一開始幾乎難倒所有人。佢唔係一個代幣、一份禮物、一個心意(「a token of thanks」)或者一張保安通行證。喺 AI 入面佢係一小段文字。當一個工具話你有幾多 token 嘅上限,佢講緊佢可以處理幾多文字,唔係一種你用嚟換獎品嘅貨幣。
最後,model 聽落好似應該解一個影相擺甫士嘅人,或者一個完美畀人模仿嘅例子(「a model student」)。喺 AI 入面佢解經訓練嘅系統本身。「Which model are you using?」問緊邊一個經訓練嘅系統,唔係邊個例子或者邊個榜樣。
仲有一個靜啲嘅陷阱潛伏喺 context。喺日常講法,context 解背景或者情況(「in this context」)。喺 AI 入面佢有個精確嘅邊界:佢係系統當下睇到嘅特定文字。當大家話「佢唔記得喇,context 用晒」,佢哋係指對話長過系統可以容納嘅量,唔係佢失咗興趣。而 fine-tune,喺日常英文解做一個好細嘅微調(「fine-tune the wording」)。喺 AI 入面佢指一個真實嘅額外訓練回合。所以「we fine-tuned the model」係一個比「we tweaked a setting」更大嘅動作,即使日常嗰個字聽落溫和又微不足道。
呢啲全部,背後嘅模式都一樣:一個柔和、熟悉嘅字眼藏住一份精確嘅技術工作。誤解唔係嚟自啲字難,而係嚟自我哋信咗日常意思耐咗少少。喺每個詞上慢落嚟,將佢窄窄嘅工作貼返上去,混淆就會清晰。
自然 vs 生硬例句
生硬: I gave the AI a quick prompt, so it answered promptly with the right output.
自然: I typed a short prompt, and the model produced an output I still had to check.
冇咁自然: The model hallucinated, so something must be seriously wrong with it.
較好: The model hallucinated a source, so I verified the claim before trusting it.
生硬: My message used too many tokens, like spending coins.
自然: My message was long, so it used a lot of tokens.
生硬: This AI model is a real role model for writing.
自然: This model produces strong writing, though it still makes mistakes.
自然嘅版本將啲字保持喺佢哋窄窄嘅技術工作,唔畀日常意思偷偷溜入嚟。
冇咁自然: The conversation got too long, so the AI lost interest in the context.
較好: The conversation got too long, so it ran past the context the model could hold.
呢度「lost interest」夾帶咗一份感受入嚟。Model 冇興趣可以失去。佢只係冇辦法將之前所有文字保持喺視野入面。
迷你對照表
| Word | 日常意思 | AI 意思 |
|---|---|---|
| prompt | 快;提醒 | 你俾嘅輸入文字 |
| output | (一般)結果 | 系統生成嘅任何嘢,啱或者錯 |
| hallucination | 見到幻象;醫學事件 | 自信但係假嘅 output |
| token | 代幣;禮物;心意 | 一小段文字 |
| model | 一個人;完美例子 | 做嘢嗰個經訓練嘅系統 |
快速練習
用以下其中一個填空:prompt、output、hallucination、token、model。做完自己核對。
- The system invented a study that does not exist; that is a ________.
- The instruction you type into the tool is the ________.
- Long text costs more because it uses more ________s.
- Whatever the tool generates back is its ________.
- The trained system answering you is the ________.
答案:
- hallucination
- prompt
- token
- output
- model
加分題:喺「she gave a prompt reply」入面,「prompt」係 AI 意思嗎?(唔係。嗰度佢解快,係日常意思。)
帶走嘅重點
呢套詞彙之所以聽落古怪,純粹係因為每個字都借用咗一個普通字眼,再交一份單一、特定嘅工作俾佢。Prompt 係你嘅輸入,output 係原始結果,hallucination 係自信嘅廢話,token 係一小段文字,model 係系統本身。將每個字緊扣住佢窄窄嘅意思,尤其係 output 同 hallucination,咁你讀 AI 寫嘅嘢時就唔會縮,講起呢啲工具上嚟亦會似一個真正識得啲字解咩嘅人。呢啲詞唔係咩高深魔法。佢哋只係標籤,而家亦變咗你嘅嘢。
