Phân tích hồi quy đa biến

Một phần của tài liệu Bài giảng Ứng dụng công cụ phân tích dữ liệu: Phần 2 (Trang 51 - 55)

Chương 4: Các công cụ phân tích dữ liệu cho mô hình thông kê, dự báo

4.1.2. Phân tích hồi quy đa biến

Mô hình hồi qui tuyến tính đơn cho phép chúng ta phân tích mối quan hệ tuyến tính giữa biến giải thích và biến đáp ứng. Tuy nhiên, bằng cách hạn chế số lượng các biến giải thích cho một, đôi khi chúng ta làm giảm tính hữu ích tiềm tàng của mô hình. Ví dụ, chúng ta phân tích cách các khoản thanh toán nợ bị ảnh hưởng bởi thu nhập, bỏ qua hiệu quả có thể có của tỷ lệ thất nghiệp. Có thể là các khoản thanh toán nợ được gây ra bởi cả thu nhập và tỷ lệ thất nghiệp. Mô hình hồi quy đa biến cho phép chúng ta nghiên cứu xem biến phản ứng bị ảnh hưởng như thế nào bởi hai hoặc nhiều biến giải thích. Sự lựa chọn của các biến giải thích dựa trên lý thuyết kinh tế, trực giác, và/hoặc nghiên cứu trước. Mô hình hồi quy đa là một phần mở rộng đơn giản của mô hình hồi quy tuyến tính đơn.

 β0 = chặn Y

 β1 = độ dốc của Y với biến X1, giữ các biến số X2, X3, ..., Xk  β2 = độ dốc của Y với biến X2, giữ các biến số X1, X3, ..., Xk  β3 = độ dốc của Y với biến X3, giữ các biến số X1, X2, ..., Xk

. . .

 βk = độ dốc của Y với biến Xk, giữ các biến số X1, X2, X3, ..., Xk-1  εi = sai số ngẫu nhiên trong Y cho quan sát i

Phương trình sau định nghĩa mô hình hồi quy đa biến với hai biến độc lập

trong đó :  β0 = chặn

 β1 = độ dốc của Y với biến X1, giữ biến số X2  β2 = độ dốc của Y với biến X2, giữ biến số X1  εi = sai số ngẫu nhiên trong Y cho quan sát i

So sánh mô hình hồi quy đa biến với mô hình hồi quy tuyến tính đơn ở phía trên:

Trong mô hình hồi quy tuyến tính đơn, độ dốc, β1, đại diện cho sự thay đổi trong trung bình của Y trên mỗi đơn vị thay đổi trong X và không tính đến bất kỳ biến số nào khác. Trong mô hình hồi quy đa biến với hai biến độc lập, độ dốc, β1, đại diện cho sự thay đổi trung bình của Y trên mỗi đơn vị thay đổi trong X1, có tính đến hiệu quả của X2. Như trong trường hợp hồi qui tuyến tính đơn, bạn sử dụng phương pháp bình phương nhỏ để tính các hệ số hồi quy mẫu (b0, b1 và b2) như các ước lượng về các tham số quần thể (β0, β1 và β2). phương trình sau định nghĩa phương trình hồi quy cho mô hình hồi quy đa biến với hai biến độc lập.

Khi chúng tôi sử dụng các công thức để ước lượng mô hình hồi quy tuyến tính đơn, chúng tôi thấy rằng các phép tính khá rườm rà. Như bạn có thể tưởng tượng, nếu chúng ta ước tính mô hình hồi quy đa phương bằng tay, việc tính toán sẽ trở nên tẻ nhạt hơn. Do đó, chúng tôi chỉ dựa vào việc sử dụng các gói thống kê để ước lượng mô hình hồi quy đa.

Ví dụ : Một nghiên cứu gần đây cho thấy người tiêu dùng Mỹ đang có khoản nợ trung bình hàng tháng là $ 983 (Experian.com, ngày 11 tháng 11 năm 2010). Tuy nhiên, nghiên cứu của 26 khu vực đô thị cho thấy khá nhiều biến thể trong thanh toán nợ, tùy thuộc vào nơi mà người tiêu dùng sống. Chẳng hạn, ở Washington, DC, người dân trả nhiều nhất (1.285 USD / tháng), trong khi Pittsburghers trả ít nhất (763 USD / tháng). Madelyn Davis, một nhà kinh tế

tại một ngân hàng lớn, tin rằng sự khác biệt thu nhập giữa các thành phố là lý do chính cho các khoản thanh toán nợ khác biệt. Chẳng hạn, thu nhập cao của khu vực Washington, DC, có khả năng đóng góp vị trí của nó vào trong danh sách. Cô không chắc chắn về tác động có thể có của thất nghiệp đối với thanh toán nợ của người tiêu dùng. Một mặt, tỷ lệ thất nghiệp cao có thể làm giảm thanh toán nợ của người tiêu dùng, vì người tiêu dùng bỏ qua việc mua sắm lớn như nhà cửa và ô tô. Mặt khác, tỷ lệ thất nghiệp cao hơn có thể làm tăng thanh toán nợ của người tiêu dùng khi người tiêu dùng đấu tranh để trả các hóa đơn. Để phân tích mối quan hệ giữa thu nhập, tỷ lệ thất nghiệp và thanh toán nợ của người tiêu dùng, Madelyn thu thập dữ liệu từ 26 khu vực đô thị được sử dụng trong nghiên cứu thanh toán nợ. Cụ thể, cô thu thập thu nhập hộ gia đình trung bình năm 2010-2011 cũng như tỷ lệ thất nghiệp hàng tháng và nợ tiêu dùng trung bình cho tháng 8 năm 2010. Bảng sau đây cho thấy một phần dữ liệu; bộ dữ liệu hoàn chỉnh có thể được tìm thấy trên trang web, có nhãn Debt Payments.

Hình 4.1F

 Với dữ liệu từ bảng này, ước tính mô hình hồi quy đa biến với các khoản thanh toán nợ như là biến số phản hồi và thu nhập và tỷ lệ thất nghiệp như các biến giải thích.

 Giải thích các hệ số hồi quy.

 Dự báo các khoản nợ nếu thu nhập là $ 80,000 và tỷ lệ thất nghiệp là 7,5%. Chúng tôi sẽ sử dụng Excel để ước lượng mô hình hồi quy đa biến,

Chúng ta làm theo các bước tương tự như sau. Mở dữ liệu có Debt Payments  Chọn Data/Data Analysis/Regression từ menu.

Trong hộp thoại hồi quy, nhấp chuột vào ô bên cạnh để nhập Y vào, sau đó chọn dữ liệu thanh toán nợ. Đối với dãy đầu vào X, đồng thời chọn thu nhập và dữ liệu tỷ lệ thất nghiệp. Kiểm tra lại nhãn mà chúng ta đang sử dụng, Thu nhập và Thất nghiệp làm tiêu đề. Nhấp OK và Excel sẽ hiện thị dữ liệu trong một bảng như sau :

Hình 4.1H

Sử dụng các ước lượng in đậm, b0 = 198.9956, b1 = 10.5122, và b2 = 0.6186, chúng ta lấy được phương trình hồi quy mẫu như sau

Hệ số hồi quy thu nhập là 10.51. Vì thu nhập được tính bằng $ 1,000, mô hình cho thấy rằng nếu thu nhập tăng 1.000 đô la, thì các khoản nợ được dự đoán sẽ tăng 10,51 đô la, giữ tỷ lệ thất nghiệp không đổi. Tương tự, hệ số hồi quy của tỷ lệ thất nghiệp là 0,62, có nghĩa là tỷ lệ thất nghiệp tăng 1 phần trăm dẫn tới sự gia tăng nợ dự đoán là 0,62 đô la, giữ thu nhập không đổi. Có vẻ như tác động dự đoán của thất nghiệp, với thu nhập giữ không đổi, là khá nhỏ. Trên thực tế, ảnh hưởng của tỷ lệ thất nghiệp thậm chí không có ý nghĩa thống kê ở bất kỳ mức hợp lý nào.

Một phần của tài liệu Bài giảng Ứng dụng công cụ phân tích dữ liệu: Phần 2 (Trang 51 - 55)

Tải bản đầy đủ (PDF)

(79 trang)