Nội dung bài viết
© 2025 AI VIET NAM. All rights reserved.
Tác giả: AI VIET NAM (AI VIET NAM)
Keywords: logistic vs linear regression, khác biệt logistic regression, linear regression là gì, phân loại và hồi quy
Khi bắt đầu học Machine Learning, rất nhiều bạn gặp câu hỏi quen thuộc:
“Linear Regression và Logistic Regression đều có chữ Regression. Vậy chúng khác gì nhau? Sao một cái lại dùng cho phân loại?”
Sự nhầm lẫn này xuất hiện vì tên gọi dễ gây hiểu lầm. Nếu chỉ nhìn công thức, bạn sẽ thấy cả hai đều dùng một dạng hàm tuyến tính. Nhưng khi hiểu bản chất và mục tiêu tối ưu, bạn sẽ thấy chúng khác nhau ngay từ gốc — một nội dung quan trọng trong nhóm kiến thức ML cơ bản (Module 4 của chương trình học thuật AIO).
👉 Linear Regression
👉 Logistic Regression
Điểm cốt lõi:
Linear Regression dự đoán bao nhiêu, Logistic Regression dự đoán thuộc lớp nào.
Đầu ra là một số thực, ví dụ:
Không có giới hạn trên/dưới.
Đầu ra là một xác suất trong khoảng
(0, 1)Để ra quyết định, ta thường đặt một ngưỡng:
Hàm sigmoid giúp Logistic Regression xử lý bài toán phân loại dưới dạng xác suất — điều mà Linear Regression không làm được.
Điều này thuộc nhóm optimization–loss–metrics trong Module 5 của AIO.
Điểm đáng chú ý: Logistic Regression không phải mô hình hồi quy, mà là mô hình phân loại có lõi toán học dạng hồi quy tuyến tính.
Bạn dự đoán giá nhà dựa trên diện tích:
Đầu ra liên tục.
Bạn dự đoán email có phải spam hay không:
Đây là phân loại nhị phân.
Sự khác biệt giữa hai mô hình thể hiện rõ nhất trong:
Một sai lầm phổ biến là dùng Linear Regression cho phân loại. Dù về mặt toán học vẫn chạy được, nhưng mô hình sẽ cho ra xác suất vượt quá 1 hoặc âm — không có ý nghĩa thực tế.
Học viên AI thường gặp Logistic và Linear Regression khi kết nối các mảng:
Khi ghép các mảnh kiến thức lại, sự khác biệt giữa hai thuật toán trở nên rõ ràng hơn rất nhiều.
Bạn có thể thử:
Việc thử nghiệm này giúp hiểu bản chất thay vì học thuộc.
Điểm khác biệt cốt lõi giữa Logistic Regression và Linear Regression nằm ở loại bài toán mà chúng giải quyết:
Sự khác biệt kéo theo thay đổi ở hàm kích hoạt, hàm mất mát và cách diễn giải, tạo nên hai mô hình phục vụ hai mục đích hoàn toàn khác nhau trong Machine Learning.