Nội dung bài viết
© 2025 AI VIET NAM. All rights reserved.
Tác giả: AI VIET NAM (AI VIET NAM)
Keywords: logistic vs linear regression, khác biệt logistic regression, linear regression là gì, phân loại và hồi quy
Khi bắt đầu học Machine Learning, rất nhiều bạn gặp câu hỏi quen thuộc:
“Linear Regression và Logistic Regression đều có chữ Regression. Vậy chúng khác gì nhau? Sao một cái lại dùng cho phân loại?”
Sự nhầm lẫn này xuất hiện vì tên gọi dễ gây hiểu lầm. Nếu chỉ nhìn công thức, bạn sẽ thấy cả hai đều dùng một dạng hàm tuyến tính. Nhưng khi hiểu bản chất và mục tiêu tối ưu, bạn sẽ thấy chúng khác nhau ngay từ gốc — một nội dung quan trọng trong nhóm kiến thức ML cơ bản (Module 4 của chương trình học thuật AIO).
Linear Regression
Logistic Regression
Điểm cốt lõi:
Linear Regression dự đoán “bao nhiêu”, Logistic Regression dự đoán “thuộc lớp nào”.
Linear Regression → đầu ra là một số thực.
Logistic Regression → đầu ra là xác suất trong khoảng (0, 1), sau đó quyết định lớp dựa theo ngưỡng, thường là 0.5.
Logistic Regression dùng sigmoid để nén đầu ra.
Linear Regression không dùng activation.
Sigmoid giúp Logistic Regression xử lý phân loại dưới dạng xác suất.
Linear Regression → MSE (Mean Squared Error)
Logistic Regression → Binary Cross-Entropy (Log Loss)
Đây là một phần quan trọng trong nhóm optimization & loss (Module 5 của AIO).
Linear Regression: mô hình hóa quan hệ tuyến tính giữa input và output.
Logistic Regression: mô hình hóa xác suất thông qua hồi quy tuyến tính + sigmoid.
Linear Regression:
Dự đoán giá nhà theo diện tích → đầu ra là một số liên tục.
Logistic Regression:
Dự đoán email có phải spam hay không → đầu ra là xác suất.
Linear Regression phù hợp cho:
Logistic Regression phù hợp cho:
Hai mô hình này khác nhau rõ nhất ở:
Một lỗi phổ biến: dùng Linear Regression cho phân loại → đầu ra bị âm hoặc >1, không còn ý nghĩa.
Người học gặp Logistic & Linear Regression khi kết nối các nhóm:
Khi hiểu các nền tảng này, sự khác nhau trở nên rất rõ ràng.
Bạn có thể thử:
Các thử nghiệm nhỏ giúp hiểu bản chất thay vì học thuộc.
Q: Logistic Regression có phải là mô hình hồi quy không?
A: Không. Đây là mô hình phân loại nhưng dùng lõi toán học của hồi quy tuyến tính.
Q: Tại sao Logistic Regression phải dùng sigmoid?
A: Vì phân loại cần xác suất trong 0–1; sigmoid đảm nhiệm việc nén đầu ra về khoảng này.
Q: Linear Regression có dùng được cho phân loại không?
A: Không nên. Đầu ra có thể bị âm hoặc >1, không phản ánh xác suất.
Q: Logistic Regression có cần chuẩn hóa dữ liệu không?
A: Có. Scaling giúp tối ưu nhanh và ổn định hơn.
Q: Logistic Regression có phải mô hình tuyến tính không?
A: Có — tuyến tính ở phần tính z = wx + b, phi tuyến ở phần sigmoid.
Q1. Con số 0 thì học nổi không?
Ans: Chỉ cần bạn có thời gian học. Quan trọng nhất không phải giỏi hay không, mà là học đều mỗi ngày. Kiến thức – tài liệu – môi trường đã có team lo.
Q2. Ai dạy AIO?
Ans: Đội admin dạy toàn bộ. Admin trực tiếp hướng dẫn và hỗ trợ mọi câu hỏi trong suốt quá trình học.
Q3. Admin có “xịn” không?
Ans: Admin đều là người làm nghề thật, mỗi người một phong cách dạy. Quan trọng là bạn hợp cách truyền đạt. Admin không dám nói “xịn”, chỉ dạy bằng hết sức.
Q4. AIO có gì khác những nơi khác?
Ans: AIO tập trung vào nền tảng – thực hành – kèm cặp. Không chạy theo trào lưu. Mục tiêu là giúp bạn học chắc và làm được.