Chương 4: Các cơng cụ phân tích dữ liệu cho mơ hình thơng kê, dự báo
4.1.2. Phân tích hồi quy đa biến
Mơ hình hồi qui tuyến tính đơn cho phép chúng ta phân tích mối quan hệ tuyến tính
giữa biến giải thích và biến đáp ứng. Tuy nhiên, bằng cách hạn chế số lượng các biến giải
thích cho một, đơi khi chúng ta làm giảm tính hữu ích tiềm tàng của mơ hình. Ví dụ, chúng ta phân tích cách các khoản thanh tốn nợ bị ảnh hưởng bởi thu nhập, bỏ qua hiệu quả có thể có của tỷ lệ thất nghiệp. Có thể là các khoản thanh tốn nợ được gây ra bởi cả thu nhập và tỷ lệ thất nghiệp. Mơ hình hồi quy đa biến cho phép chúng ta nghiên cứu xem biến phản ứng bị ảnh hưởng như thế nào bởi hai hoặc nhiều biến giải thích. Sự lựa chọn của các biến giải thích dựa
trên lý thuyết kinh tế, trực giác, và/hoặc nghiên cứu trước. Mơ hình hồi quy đa là một phần
mở rộng đơn giản của mơ hình hồi quy tuyến tính đơn.
105 | P a g e
β0 = chặn Y
β1 = độ dốc của Y với biến X1, giữ các biến số X2, X3, ..., Xk
β2 = độ dốc của Y với biến X2, giữ các biến số X1, X3, ..., Xk
β3 = độ dốc của Y với biến X3, giữ các biến số X1, X2, ..., Xk
. . .
βk = độ dốc của Y với biến Xk, giữ các biến số X1, X2, X3, ..., Xk-1
εi = sai số ngẫu nhiên trong Y cho quan sát i
Phương trình sau định nghĩa mơ hình hồi quy đa biến với hai biến độc lập
trong đó :
β0 = chặn
β1 = độ dốc của Y với biến X1, giữ biến số X2
β2 = độ dốc của Y với biến X2, giữ biến số X1
εi = sai số ngẫu nhiên trong Y cho quan sát i
So sánh mơ hình hồi quy đa biến với mơ hình hồi quy tuyến tính đơn ở phía trên:
Trong mơ hình hồi quy tuyến tính đơn, độ dốc, β1, đại diện cho sự thay đổi trong trung bình của Y trên mỗi đơn vị thay đổi trong X và khơng tính đến bất kỳ biến số nào khác. Trong mơ hình hồi quy đa biến với hai biến độc lập, độ dốc, β1, đại diện cho sự thay đổi trung bình của Y trên mỗi đơn vị thay đổi trong X1, có tính đến hiệu quả của X2. Như trong trường hợp hồi qui tuyến tính đơn, bạn sử dụng phương pháp bình phương nhỏ để tính các hệ số hồi quy mẫu (b0, b1 và b2) như các ước lượng về các tham số quần thể (β0, β1 và β2). phương trình sau định nghĩa phương trình hồi quy cho mơ hình hồi quy đa biến với hai biến độc lập.
Khi chúng tôi sử dụng các công thức để ước lượng mơ hình hồi quy tuyến tính đơn, chúng tơi thấy rằng các phép tính khá rườm rà. Như bạn có thể tưởng tượng, nếu chúng ta ước
tính mơ hình hồi quy đa phương bằng tay, việc tính tốn sẽ trở nên tẻ nhạt hơn. Do đó, chúng
tơi chỉ dựa vào việc sử dụng các gói thống kê để ước lượng mơ hình hồi quy đa.
Ví dụ : Một nghiên cứu gần đây cho thấy người tiêu dùng Mỹ đang có khoản nợ trung
bình hàng tháng là $ 983 (Experian.com, ngày 11 tháng 11 năm 2010). Tuy nhiên, nghiên cứu của 26 khu vực đô thị cho thấy khá nhiều biến thể trong thanh toán nợ, tùy thuộc vào nơi mà người tiêu dùng sống. Chẳng hạn, ở Washington, DC, người dân trả nhiều nhất (1.285 USD / tháng), trong khi Pittsburghers trả ít nhất (763 USD / tháng). Madelyn Davis, một nhà kinh tế
106 | P a g e
tại một ngân hàng lớn, tin rằng sự khác biệt thu nhập giữa các thành phố là lý do chính cho các khoản thanh toán nợ khác biệt. Chẳng hạn, thu nhập cao của khu vực Washington, DC, có khả năng đóng góp vị trí của nó vào trong danh sách. Cơ khơng chắc chắn về tác động có thể có của thất nghiệp đối với thanh tốn nợ của người tiêu dùng. Một mặt, tỷ lệ thất nghiệp cao có thể làm giảm thanh tốn nợ của người tiêu dùng, vì người tiêu dùng bỏ qua việc mua sắm lớn như nhà cửa và ô tô. Mặt khác, tỷ lệ thất nghiệp cao hơn có thể làm tăng thanh tốn nợ của người tiêu dùng khi người tiêu dùng đấu tranh để trả các hóa đơn. Để phân tích mối quan hệ giữa thu nhập, tỷ lệ thất nghiệp và thanh toán nợ của người tiêu dùng, Madelyn thu thập dữ liệu từ 26 khu vực đô thị được sử dụng trong nghiên cứu thanh tốn nợ. Cụ thể, cơ thu thập thu nhập hộ gia đình trung bình năm 2010-2011 cũng như tỷ lệ thất nghiệp hàng tháng và nợ tiêu dùng trung bình cho tháng 8 năm 2010. Bảng sau đây cho thấy một phần dữ liệu; bộ dữ liệu hồn chỉnh có thể được tìm thấy trên trang web, có nhãn Debt Payments.
Hình 4.1F
Với dữ liệu từ bảng này, ước tính mơ hình hồi quy đa biến với các khoản thanh toán nợ như là biến số phản hồi và thu nhập và tỷ lệ thất nghiệp như các biến giải thích.
Giải thích các hệ số hồi quy.
Dự báo các khoản nợ nếu thu nhập là $ 80,000 và tỷ lệ thất nghiệp là 7,5%. Chúng tơi sẽ sử dụng Excel để ước lượng mơ hình hồi quy đa biến,
Chúng ta làm theo các bước tương tự như sau. Mở dữ liệu có Debt Payments
Chọn Data/Data Analysis/Regression từ menu.
Trong hộp thoại hồi quy, nhấp chuột vào ô bên cạnh để nhập Y vào, sau đó chọn dữ liệu thanh toán nợ. Đối với dãy đầu vào X, đồng thời chọn thu nhập và dữ liệu tỷ lệ thất nghiệp. Kiểm tra lại nhãn mà chúng ta đang sử dụng, Thu nhập và Thất nghiệp làm tiêu đề. Nhấp OK và Excel sẽ hiện thị dữ liệu trong một bảng như sau :
107 | P a g e
Hình 4.1H
Sử dụng các ước lượng in đậm, b0 = 198.9956, b1 = 10.5122, và b2 = 0.6186, chúng ta lấy được phương trình hồi quy mẫu như sau
Hệ số hồi quy thu nhập là 10.51. Vì thu nhập được tính bằng $ 1,000, mơ hình cho thấy rằng nếu thu nhập tăng 1.000 đơ la, thì các khoản nợ được dự đốn sẽ tăng 10,51 đơ la, giữ tỷ lệ thất nghiệp không đổi. Tương tự, hệ số hồi quy của tỷ lệ thất nghiệp là 0,62, có nghĩa là tỷ lệ thất nghiệp tăng 1 phần trăm dẫn tới sự gia tăng nợ dự đốn là 0,62 đơ la, giữ thu nhập khơng đổi. Có vẻ như tác động dự đoán của thất nghiệp, với thu nhập giữ không đổi, là khá nhỏ. Trên thực tế, ảnh hưởng của tỷ lệ thất nghiệp thậm chí khơng có ý nghĩa thống kê ở bất kỳ mức hợp lý nào.
108 | P a g e