II. Giới thiệu
2. Đóng góp của người sử dụng
5.2 Bình phương tối thiểu không giới hạn
Nếu quá trình tạo dữ liệu là:
và có cấu trúc chung, ước tính bình phương nhỏ nhất cho 𝛽 sẽ không hiệu quả mặc dù có phù hợp. Theo định lý Aitken bình phương nhỏ nhất (GLS) là bộ ước tính hiệu quả cho các tham số mô hình nếu biết Ω. Ông đã ước tính:
Các quy trình GLS khả thi khác nhau tồn tại dựa trên các ước lượng nhất quán của Ω, sau đó là gắn vào bộ ước lượng GLS. Mấu chốt để đạt được ước tính nhất quán Ω, nói chung là
để xác định đủ cấu trúc để biểu thị một cách trung thực các đặc điểm của nó trong khi vẫn giữ các thông số được ước tính ở mức có thể quản lý được.
Trong mô hình thành phần lỗi một chiều tiêu chuẩn, như đã thấy, các giá trị gây nhiễu có thể được viết dưới dạng 𝜖nt = 𝜂n + 𝜈nt trong đó 𝜂n biểu thị các mức riêng (bất biến) và 𝜈nt lỗi riêng. Các quan sát về cùng một giá trị n chia sẻ 𝜂n các mức giống nhau, do đó các lỗi tương đối được tự tương quan. Cấu trúc các mức ngẫu nhiên là cách phân tích đa dạng để giải thích tính không đồng nhất riêng lẻ, có thể được mở rộng trong nhiều thứ nguyên, ví dụ bằng cách chỉ định quy trình tự động trong không thời gian cho 𝜈nt thành phần riêng biệt.
Theo đặc tả các mức ngẫu nhiên, ma trận phương sai-hiệp phương sai của các lỗi
Ω = là ma trận đường chéo với Ω = IN⊗ΣT trong đó
Phía trên là tiêu chuẩn đặc tả của bảng các mức ngẫu nhiên. Nó phân tích cú pháp hiệp phương sai lỗi chỉ bằng 2 tham số và do đó, có khả năng ứng dụng rất tổng quát trên các loại mẫu. Trong bảng với một chiều lớn hơn nhiều so với kích thước khác (thường là các bảng lớn và ngắn) - 1 hướng tiếp cận khả thi được áp dụng, đó là GLS chung (general GLS). Nó cho phép hiệp phương sai không đồng nhất và có tương quan lỗi, miễn là chúng vẫn giữ nguyên mô hình cho từng đối tượng.
5.2.1 Khả thi chung của bình phương nhỏ nhất
Nếu người ta giả định Ω = IN⊗ ΣT nhưng để cấu trúc của ΣT hoàn toàn tự do, thay vì điều kiện tiên quyết của việc xác định đối xứng và dương:
33 / 42
các lỗi riêng lẻ có thể phát triển theo thời gian với lượng không giới hạn của tính không đồng nhất và tự tương quan, nhưng chúng được cho là không tương quan giữa chúng trong miền giao, và cấu trúc này được giả định không đổi trên các thành phần khác nhau. Theo giả định này, các thành phần 𝜎st của ΣT có thể được ước tính dựa trên kích thước miền giao nhau, sử dụng trung bình trên các thành phần của tích ngoài của số dư từ một phép ước tính:
trong đó là phần con của số dư OLS cho n riêng lẻ. Công cụ ước tính này được gọi là GLS khả thi chung, hoặc GGLS và đôi khi được gọi là ước tính Park, theo quan sát của Driscoll và Kraay (1998), cũng như là một biến thể SUR ước tính của Zellner (1962). Greene (2003) trình bày cùng một ước tính trong ngữ cảnh chuỗi thời gian gộp, với N cố định và T "rộng".
Bỏ qua các thông số hiệp phương sai lỗi nhóm nội bộ, để nó hoàn toàn có thể tự do thay đổi là một chiến lược hay, với điều kiện N ≫ T vì số lượng các tham số phương sai được ước tính với NT điểm dữ liệu là T (T + 1) ∕ 2. Đây là một tình huống điển hình trong các bảng nhỏ như khảo sát thu nhập hộ gia đình, trong đó N là hàng nghìn nhưng T thường khá ngắn để thậm chí nếu ước tính hiệp phương sai không giới hạn, nhiều bậc tự do vẫn còn trống.
Các ứng dụng ban đầu đã được thay thế trong trường chuỗi thời gian gộp, nhằm vào việc tính toán tương quan chéo và tính không đồng nhất. Trong bối cảnh này, Driscoll và Kraay (1998) đã quan sát mức độ thiếu tự do trong ước tính hiệp phương sai lỗi dẫn đến các lỗi tiêu chuẩn sai lệch hướng xuống, khiến ta đánh giá quá cao ý nghĩa của tham số. Beck và Katz (1995) cũng thảo luận về một số thành kiến nghiêm trọng của bộ ước lượng này trong các mẫu nhỏ. Cả hai bắt đầu từ một chuỗi thời gian gộp, cả hai đều quan tâm đến độ mạnh trên miền giao nhau. Trong hướng đi này, hầu hết những sự chỉ trích mà ước tính này phụ thuộc vào đều đến từ các lĩnh vực ứng dụng đặc thù. Đặc biệt là trong tài liệu Beck và Katz (1995) và các tài liệu tham khảo trong đó (do Alvarez và cộng sự biên soạn, 1991) đã áp dụng cho dữ liệu khoa học chính trị với kích thước mẫu rất khiêm tốn; những mô phỏng gần đây của Chen và cộng sự. (2009) cho thấy rằng ngay cả trong các tình huống như vậy FGLS có thể hiệu quả hơn so với đề xuất lựa chọn thay thế (OLS với lỗi tiêu chuẩn PCSE).
Nguyên tắc của GGLS có thể được áp dụng cho các tình huống khác nhau, phù hợp với các chế độ xem khác nhau về tính không đồng nhất (giả thuyết về các mức cố định so với cố định) hoặc tình trạng không ổn định (ví dụ, đối với mô hình trong lần đầu tiên sự khác biệt). Điều đó chuyển thành áp dụng ước lượng GLS không giới hạn trực tiếp cho dữ liệu quan sát hoặc chuyển đổi chúng. Khung này cho phép cấu trúc hiệp phương sai lỗi bên trong mỗi nhóm (nếu các mức được đặt thành từng đối tượng) của các quan sát được hoàn toàn không hạn chế và do đó chống lại một cách mạnh mẽ bất kỳ hiệp phương sai không đồng nhất trong nhóm và tương quan nối tiếp. Cấu trúc này được giả định giống hệt nhau giữa các nhóm và do đó các FGLS tổng quát không hiệu quả dưới các nhóm không đồng nhất. Sự tương quan của phần giao được loại trừ ưu tiên. Trong ngữ cảnh chuỗi thời gian gộp (các mức được đặt thành 'thời gian'), đối xứng, ước tính này có thể tính đến mối tương quan chéo tùy ý, miễn là sau đó là thời gian bất biến. Trong trường hợp này, tương quan nối tiếp phải là giả định và bộ ước lượng phù hợp với chiều thời gian, giữ N cố định.