6. Bố cục của luận văn:
2.1.3 Hàm Sigmoid sử dụng trong hồi quy Logistic
Hồi quy Logistic là một trường hợp đặc biệt của hồi quy tuyến tính, trong đĩ biến mục tiêu cĩ tính chất phân loại. Nĩ sử dụng nhật ký tỷ lệ cược làm biến phụ thuộc. Hồi quy Logistic dự đốn xác suất xảy ra một sự kiện nhị phân bằng cách sử dụng hàm logit.
Phương trình hồi quy tuyến tính:
𝑦 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + ⋯ + 𝛽𝑛𝑋𝑛 (1) Trong đĩ, y là biến phụ thuộc và X1, X2 ... và Xn là biến giải thích. Hàm Sigmoid:
𝑃 = 1+𝑒1−𝑦 (2) Áp dụng hàm Sigmoid trên hồi quy tuyến tính:
𝑃 = 1+𝑒−(𝛽0+ 𝛽1𝑋1+𝛽2𝑋2+⋯+𝛽𝑛𝑋𝑛)1 (3) Các thuộc tính của hồi quy logistic:
Biến phụ thuộc trong hồi quy logistic tuân theo phân phối Bernoulli. Ước tính được thực hiện thơng qua khả năng tối đa.
Hàm sigmoid, cịn được gọi là hàm logistic cho đường cong hình chữ 'S' cĩ thể lấy bất kỳ số cĩ giá trị thực nào và ánh xạ nĩ thành giá trị từ 0 đến 1. Nếu đường cong chuyển sang vơ cực dương, biến dự đốn y sẽ trở thành 1 và nếu đường cong chuyển sang vơ cực âm, biến dự đốn y sẽ trở thành 0. Trường hợp đầu ra của hàm sigmoid lớn hơn 0.5, chúng ta cĩ thể phân loại kết quả là 1 (tương ứng với cĩ) và nếu nĩ nhỏ hơn 0.5 chúng ta cĩ thể phân loại nĩ thành 0 (khơng). Hàm Sigmoid được biểu diễn thơng qua đồ thị sau:
Pl-22
Hình 2.2: Đồ thị hàm sigmoid biểu diễn trong python.
Qua đồ thị chúng ta nhận thấy giá trị hàm tiến dần tới 1 khi giá trị của biến tiến đến giá trị lớn nhất dương và giá trị hàm dần tới 0 khi giá trị của biến tiến tới giá trị nhỏ nhất âm.
Để tính ước lượng xác suất p với sự kiện phân lớp cho dữ liệu đã cĩ x theo cơng thức:
p(Y=y/x) = 1
1+ 𝑒−𝑦 (4)