yˆ =β β
PHƯƠNG SAI SAI SỐ THAY ĐỔI 6.1.Khái niệm
6.1. Khái niệm
Trong việc tính toán các giá trị ước lượng bình phương tối thiểu thông thường (OLS), chúng ta đã thiết lập giả thuyết cho rằng các số hạng sai số ui có phân phối giống nhau với trị trung bình bằng không và phương sai bằng nhau.
(ui Xi)= E(ui2 Xi)=σ2
Var
Giả thuyết phương sai bằng nhau được hiểu là phương sai của sai số không đổi (có nghĩa là phân tán như nhau).
Phương sai σ2 là một đại lượng đo lường mức độ phân tán của các số hạng sai số ui, xung quanh giá trị trung bình bằng 0. Một cách tương đương, đó là một đại lượng đo lường mức độ phân tán của giá trị biến phụ thuộc quan sát được (Y) xung quanh đường hồi qui β1 + β2X2 +… + βkXk. Phương sai của sai số không đổi có nghĩa là mức độ phân tán như nhau cho tất cả các quan sát.
Tuy nhiên, trong nhiều trường hợp đối với dữ liệu chéo, giả định này bị vi phạm. Khi giảđịnh bị vi phạm, khi đó ta gọi là phương sai sai số thay đổi.
ui Xi Yi=β1 +β2 + Và ) ( ) (uiXi 2 2 Xi Var =σi =σ
Phương sai sai số thay đổi, có nghĩa là phương sai sai số là khác nhau đối với các quan sát. Trường hợp đặc biệt là nó là một hàm của biến giải thích , Xi.
Ví dụ, giả sử như chúng ta tiến hành điều tra một mẫu ngẫu nhiên các hộ gia đình và thu được thông tin về tổng chi phí tiêu dùng của từng hộ gia đình và thu nhập của họ
trong một năm cho trước. Những hộ gia đình với mức thu nhập thấp không có nhiều linh động trong chi tiêu. Phần lớn thu nhập sẽ tập trung vào các nhu cầu căn bản chẳng hạn như thức ăn, chỗở, quần áo, và đi lại. Do vậy, chi tiêu giữa những hộ gia đình có thu nhập thấp như thế sẽ không khác nhau nhiều. Mặt khác, những gia đình giàu có có sự linh động rất lớn trong chi tiêu. Một vài gia đình là những người tiêu dùng lớn; những người khác có thể là những người tiết kiệm nhiều và đầu tư nhiều vào bất động sản, thị trường chứng khoán, …. Điều này hàm ý rằng tiêu dùng thực có thể khác nhiều so với mức thu nhập trung bình. Hay nói cách khác, rất có khả năng những hộ gia đình có thu nhập cao có mức độ phân tán xung quanh giá trị tiêu dùng trung bình lớn hơn những hộ gia đình có thu nhập thấp. Trong trường hợp như thế, biểu đồ phân tán giữa tiêu dùng và thu nhập sẽ chỉ ra những điểm của mẫu gần với đường hồi qui hơn cho những hộ gia đình thu nhập thấp nhưng những điểm phân tán rộng hơn cho những hộ
gia đình thu nhập cao. (xem Hình dưới đây). Hiện tượng như vậy được gọi là phương sai của sai số thay đổi (có nghĩa là phân tán không như nhau).
0 10 20 30 40 50 60 0 10 20 30 40 50 60 70 80 90 X (Thu nhap) Y ( T ie u d u n g )