Phần trước đã giới thiệu việc ước lượng tham số cho những tham số cố định với độ lệch chuẩn của chúng. Điều này cho phép xây dựng tiêu chuẩn kiểm định giả thuyết hoặc khoảng tin cậy riêng biệt cho mỗi tham số. Trong nhiều trường hợp, người ta quan tâm đến tổ hợp tuyến tính của các tham số. Đối với việc kiểm định giả thuyết, thường xuất hiện các biến giải thích đóng vai trò phân nhóm hoặc sự xếp loại, ở đó n nhóm các đối tượng hoàn toàn được xác định qua n−1 biến giả nhị phân (nhận hai giá trị tương phản 0 và 1). Như vậy, đối với các tham số cần ước lượng, chúng ta quan tâm đến việc cung cấp các cặp khoảng tin cậy tương ứng. Chúng ta tiến hành như sau:
Định nghĩa một ma trận tương phản C cấp r×p với các thành phần có giá trị 0 hoặc 1. Ma trận này được sử dụng để thành lập các hàm độc lập tuyến tính của p tham số cố định trong mô hình có dạng f = Cβ, để mỗi dòng của C xác định một hàm tuyến tính cụ thể. Các tham số không xuất hiện trong tổ hợp tuyến tính tương ứng với giá trị 0 của hàng trong ma trận C. Giả sử trong mô hình xây dựng từ số liệu nghiên cứu giáo dục nói đến ở phần trước, chúng ta quan tâm đến việc kiểm định giả thuyết đối với hệ số chặn và các hệ số dốc ứng với các biến độc lập về điểm môn toán năm 8 tuổi, giới tính và thành phần xã hội (Bảng 1.1). Chẳng hạn, ta cần kiểm định giả thuyết cho rằng hai tham số tương ứng với giới tính và thành phần xã hội là đồng thời bằng 0.
Chúng ta định nghĩa C = 0 0 1 0 0 0 0 1 , f = β2 β3
Tham số Ước lượng (Độ lệch chuẩn) Ước lượng (Độ lệch chuẩn) Cố định Hằng số 14,9 32,9 Điểm 8 tuổi 0,64(0,025) Giới tính(Nam – Nữ) -0,36(0,34) -0,39(0,47) TPXH(Trí óc – chân tay) 0,72(0,39) 2,39(0,51) Ngẫu nhiên σ2 u0 (giữa các trường) 3,21(1,0) 4,52(1,5) σ2 e0 (giữa các học sinh) 19,6(1,1) 37,2(2,0)
Tương quan nội tại 0,14 0,11
Bảng 1.1: Mô hình phương sai thành phần sử dụng số liệu về giáo dục với giới tính và thành phần xã hội
Giả thuyết cần kiểm định là
H0 : f = k, k = {0} Ta có
R = ( ˆf −k)T[C(XTVˆ−1X)−1CT]−1( ˆf −k) ˆ
f = Cβˆ
Nếu giả thuyết là đúng, thì R là đại lượng có phân phối xấp xỉ phân phối
χ2 với 2 bậc tự do. Chú ý rằng số hạng (XTVˆ−1X)−1 là ma trận ước lượng hiệp phương sai của những hệ số cố định. Giá trị của R thu được trên đây có thể dùng so sánh với giá trị tới hạn của phân phối Khi-bình phương với 2 bậc tự do để đưa ra các kết luận thống kê thích hợp.
xét giá trị của Rˆ trong biểu thức ˆ R = (f −fˆ)T CXTVˆ−1X −1 CT −1 (f −fˆ)
với các khoảng giá trị của biến ngẫu nhiên có phân phối χ2 với r bậc tự do. Biểu thức trên mang lại một hàm bậc 2 của các hệ số ước lượng, đưa ra một vùng elip r chiều.
Từ Bảng 1.1, chúng ta thu được kết quả sau: Giá trị tới hạn của phân phối Khi bình phương với 2 bậc tự do ứng với xác suất ý nghĩa 5% là 5,99. Từ đó, miền tin cậy 95% là vùng giới hạn bởi elip xác định qua phương trình
8,3(β1 + 0,36)2+ 0,22(β1+ 0,36)(β2 −0,72) + 0,67(β2 −0,72)2 = 5,99
ở đó β1, β2 là các tham số tương ứng với giới tính và tầng lớp xã hội. Trong một số tình huống, người ta có quan tâm đến các khoảng tin cậy riêng rẽ cho tất cả các hàm tuyến tính có thể có từ tập con gồm q
tham số hoặc q hàm độc lập tuyến tính của các tham số, đồng thời nêu ra giá trị cố định cho trước của xác suất để giá trị thực (tức là giá trị quần thể) của các hàm tham số đó rơi vào mỗi khoảng tin cậy tương ứng. Như đã nói, nhu cầu có thể xuất hiện khi chúng ta có một biến giải thích định tính xác định một số nhóm đối tượng và chúng ta cần quan tâm đến những khoảng tin cậy cho giá trị của một tập các hàm ràng buộc. Đối với khoảng tin cậy (1−α)% ký hiệu Ci là dòng thứ i của C, và 1 khoảng tin cậy (1−α)% đồng thời của Ciβ cho tất cả các Ci được cho bằng
ở đó di = Ci XTVˆ−1X −1 CiTχ2q,(α) 0,5 Với χ2q,(α) là điểm phân vị (trên) α% của phân phối χ2.