Nội dung bài viết
© 2025 AI VIET NAM. All rights reserved.
Tác giả: AI VIET NAM (AI VIET NAM)
Keywords: Temperature Softmax, τ, điều chỉnh phân phối xác suất, NLP, LLMs, text generation, knowledge distillation
Trong nhiều bài toán từ Machine Learning đến Deep Learning, đặc biệt ở NLP và LLMs, bạn sẽ gặp một biến quen thuộc trong công thức Softmax: Temperature (τ).
Và rất nhiều bạn đặt câu hỏi:
“Temperature dùng để làm gì? Tại sao tăng hoặc giảm τ lại làm mô hình thay đổi hành vi dự đoán?”
Temperature là một cơ chế điều chỉnh độ sắc/nhọn của phân phối xác suất sau Softmax.
Nó hoạt động như một “núm xoay” để điều khiển mô hình quyết đoán hơn hoặc sáng tạo hơn.
Ý tưởng chính:
Bạn có thể hình dung:
Trong NLP, text generation, LLMs:
Đây là lý do Temperature xuất hiện trong API của ChatGPT, Gemini, LLaMA…
Trong knowledge distillation:
Điều này liên quan chặt đến optimization & loss (Module 5).
Khi mô hình sinh ra các logits chênh lệch nhiều:
Cùng một nhóm logits:
Hình ảnh trực quan:
Temperature xuất hiện xuyên suốt nhiều module:
Hiểu Temperature giúp bạn nắm được cách mô hình “tư duy”, “tự tin”, “định hướng sáng tạo”.
Dù classification thường đặt τ = 1, hiểu Temperature giúp bạn:
Dùng τ lớn để:
Bạn có thể thử:
Những thử nghiệm nhỏ này giúp bạn hiểu Temperature nhanh và sâu hơn bất kỳ công thức nào.
Q: Temperature có làm mô hình “thông minh hơn” không?
A: Không. Nó chỉ điều chỉnh mức ngẫu nhiên của đầu ra, không thay đổi kiến trúc hay kiến thức của mô hình.
Q: Vì sao tăng τ lại khiến mô hình sáng tạo hơn?
A: Vì Softmax trở nên phẳng hơn, các token ít khả năng cũng có cơ hội được chọn.
Q: τ = 1 có ý nghĩa gì?
A: Đây là Softmax chuẩn, không khuếch đại hay làm phẳng phân phối.
Q: Có nên luôn đặt τ cao để nội dung phong phú?
A: Không. τ cao dễ sinh ra nội dung lộn xộn, kém chính xác.
Q: Temperature có ảnh hưởng tới mô hình classification không?
A: Thường rất ít, vì classification dùng τ = 1. Temperature chủ yếu quan trọng trong text generation.
Q1. Con số 0 thì học nổi không?
Ans: Chỉ cần bạn có thời gian học. Điều quan trọng nhất không phải giỏi hay không, mà là có học đều mỗi ngày. Kiến thức – tài liệu – môi trường đã có team lo. Nếu bạn không có thời gian thì nên cân nhắc.
Q2. Ai dạy AIO?
Ans: Đội admin dạy toàn bộ. Admin trực tiếp hướng dẫn và hỗ trợ mọi câu hỏi của bạn trong suốt quá trình học.
Q3. Admin có “xịn” không?
Ans: Admin đều là người làm nghề thật, mỗi người một cách dạy. Quan trọng là bạn cảm thấy hợp cách truyền đạt. Admin không dám nói xịn, chỉ dạy bằng hết sức.
Q4. AIO có gì khác những nơi khác?
Ans: AIO không phải trung tâm. Đây là dự án học tập cộng đồng, được cải tiến qua từng khóa. Tinh thần của AIO: Cùng nhau học – cùng nhau khổ – cùng nhau lớn. Nếu hợp tinh thần đó, bạn sẽ thấy phù hợp.