Prompt, Output, Hallucination: Những từ AI nghe lạ hơn bản chất của chúng
Bạn mở một công cụ AI và ai đó bảo bạn "viết một prompt tốt hơn". Rồi họ cảnh báo rằng model có thể "hallucinate" (ảo giác), và nhắc rằng văn bản của bạn tốn một số "token" nhất định. Nếu bạn dừng lại nghĩ về những từ ấy một cách riêng lẻ, chúng nghe thật kỳ quặc. Một công cụ bị ảo giác? Token, như xu trò chơi điện tử?
Tin tốt là: những từ này không lạ như chúng nghe. Mỗi từ mượn một từ đời thường và giao cho nó một công việc hẹp, cụ thể. Một khi bạn học được công việc đó, vốn từ này thôi đáng sợ và bắt đầu hữu ích.
Sẽ hữu ích nếu coi những từ này như những bộ trang phục. Một từ quen thuộc khoác lên bộ đồ công nghệ và bước vào một căn phòng mới. "Prompt" bên ngoài trông y hệt, nhưng bên trong căn phòng AI nó mang một nghĩa cụ thể. Việc của bạn chỉ đơn giản là nhận ra mình đang đứng trong căn phòng nào, để đọc từ ấy theo cách đúng.
Câu trả lời nhanh
Trong AI, một prompt là chỉ dẫn hay câu hỏi bạn gõ vào, output là thứ hệ thống tạo ra để phản hồi, một hallucination là một phần output tự tin nhưng sai, một token là một mẩu văn bản nhỏ hệ thống xử lý, và một model là chính cái hệ thống đã được huấn luyện. Không từ nào trong số này mang nghĩa như khi ngồi ở bàn ăn, và chính khoảng cách đó là nơi người ta bối rối.
Những từ then chốt
- Prompt. Thứ bạn đưa cho AI: câu hỏi, chỉ dẫn hay văn bản của bạn. "Write me a prompt" nghĩa là "viết phần đầu vào bạn sẽ gửi".
- Output. Bất cứ thứ gì hệ thống tạo ra trả lại. Nó cố tình trung lập. Ta nói "output" thay vì "answer" vì kết quả không chắc đúng hay thậm chí đúng chủ đề.
- Hallucination. Một phần output tự tin, trôi chảy nhưng đơn giản là bịa ra hoặc sai. Sự thật giả, trích dẫn dựng lên, nguồn không hề tồn tại.
- Token. Một mẩu văn bản nhỏ, thường là một từ hoặc một phần của từ, dùng làm đơn vị mà hệ thống đọc và đếm. Độ dài và chi phí thường được đo bằng token.
- Model. Hệ thống đã huấn luyện tạo ra output. "The model" là cái đang làm việc, không phải một con người và không phải một hình mẫu để noi theo.
- Context. Văn bản mà hệ thống đang chú ý đến, bao gồm prompt của bạn và cuộc trò chuyện gần đây. Một "context window" là lượng văn bản nó có thể giữ cùng một lúc.
- Fine-tune. Lấy một model có sẵn và huấn luyện nó thêm một chút trên tài liệu cụ thể để nó hành xử theo một cách nhất định. Không phải "chỉnh một chút bằng tay", mà là một bước huấn luyện thật sự, dù nhỏ hơn.
Những cái bẫy thường gặp
Một cái bẫy thường gặp là nghe prompt và nghĩ đến những nghĩa đời thường của nó. Trong tiếng Anh hằng ngày, "prompt" có thể nghĩa là nhanh ("a prompt reply") hoặc nhắc nhở ai đó ("she prompted him to speak"). Trong AI nó là danh từ: văn bản đầu vào. Vậy nên "improve your prompt" không nghĩa là "nhanh lên", mà là "viết lại chỉ dẫn bạn đã gõ".
Từ output làm người ta vấp vì họ mong nó nghĩa là "câu trả lời đúng". Không phải vậy. Output chỉ là thứ đã ra. Nó có thể tuyệt vời, có thể vô nghĩa. Giữ từ trung lập này trong đầu sẽ bảo vệ bạn khỏi việc tin kết quả quá sớm.
Hallucination nghe đầy kịch tính, thậm chí mang màu sắc y khoa, và nhiều người cho rằng nó nghĩa là AI bị hỏng hay đang lên cơn gì đó. Nó điềm tĩnh hơn thế. Đó là một thuật ngữ kỹ thuật đơn giản chỉ output trôi chảy và tự tin nhưng sai. Hệ thống không nhìn thấy gì cả; nó đang lấp một chỗ trống bằng văn bản nghe hợp lý. Mối nguy chính ở chỗ nó không trông như một lỗi, nó trông mượt mà.
Token làm hầu như ai cũng bối rối lúc đầu. Nó không phải xu, quà tặng, cử chỉ ("a token of thanks"), hay thẻ an ninh. Trong AI nó là một mẩu văn bản. Khi một công cụ nói bạn có giới hạn bấy nhiêu token, nó đang nói về lượng văn bản nó xử lý được, không phải một loại tiền bạn tiêu để đổi quà.
Cuối cùng, model nghe như phải nghĩa là người làm mẫu chụp ảnh, hoặc một hình mẫu hoàn hảo để bắt chước ("a model student"). Trong AI nó nghĩa là chính hệ thống đã huấn luyện. "Which model are you using?" hỏi hệ thống huấn luyện nào, không phải hình mẫu hay tấm gương nào.
Một cái bẫy lặng lẽ hơn nấp trong context. Trong lời nói hằng ngày, context nghĩa là bối cảnh hay tình huống ("in this context"). Trong AI nó có một ranh giới chính xác: đó là văn bản cụ thể hệ thống hiện thấy được. Khi người ta nói "nó quên rồi, context cạn rồi", họ muốn nói cuộc trò chuyện đã dài hơn mức hệ thống giữ được, chứ không phải nó mất hứng. Và fine-tune, trong tiếng Anh thông thường, nghĩa là chỉnh một tí ("fine-tune the wording"). Trong AI nó đặt tên cho một vòng huấn luyện bổ sung thật sự. Vậy nên "we fine-tuned the model" là một hành động lớn hơn "we tweaked a setting", dù từ đời thường nghe nhẹ nhàng và nhỏ nhặt.
Xuyên suốt tất cả những từ này, khuôn mẫu vẫn vậy: một từ mềm mại, quen thuộc giấu một công việc kỹ thuật chính xác. Hiểu lầm không đến từ việc các từ khó, mà từ việc ta tin nghĩa đời thường lâu hơn một nhịp. Chậm lại ở mỗi thuật ngữ, gắn cho nó công việc hẹp, và sự bối rối tan đi.
Ví dụ tự nhiên vs gượng gạo
Gượng gạo: I gave the AI a quick prompt, so it answered promptly with the right output.
Tự nhiên: I typed a short prompt, and the model produced an output I still had to check.
Kém tự nhiên: The model hallucinated, so something must be seriously wrong with it.
Tốt hơn: The model hallucinated a source, so I verified the claim before trusting it.
Gượng gạo: My message used too many tokens, like spending coins.
Tự nhiên: My message was long, so it used a lot of tokens.
Gượng gạo: This AI model is a real role model for writing.
Tự nhiên: This model produces strong writing, though it still makes mistakes.
Các phiên bản tự nhiên giữ những từ ấy trong công việc kỹ thuật hẹp của chúng và tránh để nghĩa đời thường lén vào.
Kém tự nhiên: The conversation got too long, so the AI lost interest in the context.
Tốt hơn: The conversation got too long, so it ran past the context the model could hold.
Ở đây "lost interest" lén đưa vào một cảm xúc. Model không có hứng thú nào để mất. Nó đơn giản là không thể giữ toàn bộ văn bản trước đó trong tầm nhìn.
Bảng nhỏ
| Word | Nghĩa đời thường | Nghĩa trong AI |
|---|---|---|
| prompt | nhanh; nhắc nhở | văn bản đầu vào bạn đưa |
| output | kết quả (chung chung) | bất cứ thứ gì hệ thống tạo ra, đúng hay sai |
| hallucination | nhìn thấy ảo giác; sự kiện y khoa | output tự tin nhưng sai |
| token | xu; quà; dấu hiệu cảm ơn | một mẩu văn bản nhỏ |
| model | một con người; hình mẫu hoàn hảo | hệ thống đã huấn luyện đang làm việc |
Luyện tập nhanh
Điền vào chỗ trống bằng một trong các từ: prompt, output, hallucination, token, model. Tự kiểm tra sau đó.
- The system invented a study that does not exist; that is a ________.
- The instruction you type into the tool is the ________.
- Long text costs more because it uses more ________s.
- Whatever the tool generates back is its ________.
- The trained system answering you is the ________.
Đáp án:
- hallucination
- prompt
- token
- output
- model
Kiểm tra thêm: Trong "she gave a prompt reply", "prompt" có phải nghĩa AI không? (Không. Ở đó nó nghĩa là nhanh, nghĩa đời thường.)
Điều rút ra
Vốn từ này chỉ nghe lạ vì mỗi từ mượn một từ bình thường và giao cho nó một công việc duy nhất, cụ thể. Một prompt là đầu vào của bạn, output là kết quả thô, một hallucination là điều vô nghĩa nhưng tự tin, một token là một mẩu văn bản, và một model là chính hệ thống. Giữ mỗi từ đúng nghĩa hẹp của nó, nhất là output và hallucination, và bạn sẽ đọc văn bản AI mà không nao núng, nói về những công cụ này như một người thật sự hiểu các từ ấy làm gì. Những thuật ngữ này không phải phép màu cao siêu. Chúng chỉ là nhãn, và giờ chúng là của bạn.
