Ví dụ về hồi quy phân loạ

Một phần của tài liệu PHÂN TÍCH DỮ LIỆU THỐNG KÊ VÀ PYTHON (Trang 126 - 131)

2. Hồi quy tuyến tính bộ

2.5.3. Ví dụ về hồi quy phân loạ

Các biến phân loại có thể cung cấp cái nhìn sâu sắc hơn về việc dự đoán kết quả. Ví dụ: giới tính, khu vực của khách hàng hoặc đôi khi chúng ta có thể muốn nhóm các biến liên tục thành các nhóm. Chẳng hạn, tuổi. Tệp CSV có tên là categ1 chứa 19 công ty với các biến sau:

+ Công ty - tên công ty;

127 + Tăng trưởng - tỷ lệ tăng trưởng;

+ PER của công ty - tỷ lệ giá trên thu nhập; + (P-E) của công ty - Ngành có 3 loại: 1 = Tài chính.

3 = Máy tính.

Nhập dữ liệu này và xây dựng mô hình hồi quy đa tuyến tính để dự đoán PER từ lợi nhuận, tăng trưởng và ngành.

128

1) Với một biến phân loại được bao gồm, mỗi thùng được cho điểm riêng của nó.

a. Ngành 1 (còn thiếu trong kết quả) có giá trị là 0.

b. Không giống như với các biến liên tục, trong đó chúng ta nhân các biến giải thích với các ước tính, vì phân loại chúng chỉ có một giá trị cố định

2) Kết quả thu thập được đã cho chúng ta thấy rằng lợi nhuận không phải là một biến giải thích tốt để dự đoán PER. Vì vậy, chúng ta cần mô hình lại, loại trừ lợi nhuận.

Chương trình 9-10: Bài tập 9.3 part2.

Từ các kết quả gần đây, ngành_3 không phải là dự đoán, do đó chúng ta phải loại bỏ kết quả này, kết hợp với ngành_1. Điều này đã bị loại bỏ ở giai đoạn cuối. Một số nhà phân tích sẽ đưa điều này vào mô hình của họ, vì nó là một phần của một biến.

129

Tăng trưởng có giá trị pr (> | t |) lớn hơn 0,05, vì vậy chúng ta có thể muốn xóa biến này theo cách thủ công, đây là lựa chọn cá nhân. Trong trường hợp này, sẽ chỉ viết kết quả cuối cùng.

Đối với ngành 1 và 3: 11.1177 + 0 + (0,3027 * Tăng trưởng); Đối với ngành 2: 11.177+ 6.1414 + (0,3027 * Tăng trưởng).

Trong suốt bài tập này, điều chỉnh-R -squared, chuyển từ 0,695 xuống 0,676. Điều này cho thấy việc giảm các biến yếu không ảnh hưởng quá nhiều đến hiệu suất của mô hình.

2.6. Tóm tắt

Việc tạo mô hình hồi quy rất đơn giản. Hy vọng rằng bạn đã nhận thấy rằng các bước thực hiện như sau:

1) Nhập dữ liệu

2) Xác định mục tiêu của chúng tôi 3) Xác định các biến của chúng tôi

130 4) Tạo mô hình

5) Kiểm tra các biến là dự đoán, nếu không quay lại 3, cho đến khi hoàn thành

6) Đảm bảo mô hình đủ mạnh để dự đoán (adj. R bình phương).

Mối quan tâm chính khi tạo mô hình luôn là dữ liệu. Nếu không có hiểu biết thực sự về dữ liệu, mô hình bạn tạo có thể tạo ra kết quả không thực tế với các biến lạ.

131

Một phần của tài liệu PHÂN TÍCH DỮ LIỆU THỐNG KÊ VÀ PYTHON (Trang 126 - 131)

Tải bản đầy đủ (PDF)

(147 trang)