Var(X' )= Ị£(X,-X) 2= s
1.1.2. Phương pháp ước lương hợp lý tối đa
Giả sử ta đã biết dạng tổng quát của luật phân phối xác suất của
ĐLNN gốc X, nhưng luật này phụ thuộc vào tham số 0 chưa biết. Để ước lượng 0 từ đám đông ta lấy ra mẫu ngẫu nhiên kích thước n: w =
(Xj, X2,Xn). Ta đi xây dựng hàm hợp lý L với đối số là 0 tại một giá trị cụ thể của mẫu w = (X|, x2,xn):
+ Trường hợp rời rạc
L(0,x1,...,xn) = P(X1 = x,,X2 = x2,...,Xn =xir/e) = J2ỊP(Xi =Xi/0)
i = l
Đây chính là xác suất để nhận được mẫu cụ thể đang xét.
+ Trường hợp liên tục. Tương tự như trong trường hợp rời rạc ta có
L(0,x1,...,xn) = fJf(xi,O)
i=l
Trong đó f(x, 0) là hàm mật độ của X với tham số 0.
Ta sẽ đi tìm ước lượng của 0 là 0*(Xị,...,xn) sao cho 0* làm cực đại hàm hợp lý L(0,Xị,...,xn), tức là
L(0*,x1,...,x2) = maxL(0,x1,...,xn).
Như vậy, ước lượng hợp lý tối đa của 0 là ước lượng làm cho xác
suất nhận được mẫu cụ thể là lớn nhất (trường hợp rời rạc).
Vì hàm lơgarít cơ số e ( e « 2,71828...) là hàm đồng biến, nên
hàm L và hàm lnL đạt cực đại tại cùng một giá trị của 0. Giả sử lnL có
đạo hàm đến cấp hai theo 0, để tìm giá trị của 0 làm cực đại hàm lnL ta làm như sau:
+ Tìm đạo hàm bậc nhất của lnL theo 0 và giải phương trình
ainL(e,XỊ,-,xn) = 0
Ổ0
Giả sử phương trình này có nghiệm 0 = 0*(x!,...,xn). + Tìm đạo hàm bậc hai của lnL theo 0. Nếu
d2 lnL(J6,x,,...,xn)
thì 0* là ước lượng hợp lý tối đa của 0. Thường ta chỉ cần giải (7.1) là đủ.
Ví dụ 7: Biết X ~ N( p, ơ2 ), hãy tìm ước lượng hợp lý tối đa của
các tham số p và ơ2. Giả sử có mẫu cụ thể w = (Xj, x2,..., xn). Lập hàm hợp lý: 2 x 1 L(p,ơ ,x1,...,xn) = —-7==-exp (ơv 2 71 ) 1 2ơ2 ẺUi-102 i=l
Tìm đạo hàm riêng của lnL theo |1 và theo ơ rồi giải hệ phương trình dlnL ỡp ỡlnL ổơ ta được p = X, và ơ2= s2. Mặt khác ta có và d2 lnL ổp2 d2 lnL ổơ2 -2n2 È<xi"^2 i = l <0
Như vậy ước lượng hợp lý tối đa của trung bình đám đơng p là trung bình mẫu X, cịn của phương sai của đám đông ơ2 là phương sai
mẫu s2 (chứ khơng phải phương sai mẫu điều chỉnh S’2).
Ví dụ 2: Xét một đám đơng có tỷ lệ phần tử mang dấu hiệu A là p.
Ta sẽ đi tìm ước lượng hợp lý tối đa của tỷ lệ đám đông p. Gọi X là số
phần tử mang dấu hiệu A khi lấy ngẫu nhiên từ đám đông ra một phần
tử, theo mục 1.2, §1 chương IV, ĐLNN gốc X tuân theo quy luật phân phối không - một với tham số là p. Ta lập mẫu ngẫu nhiên kích thước
n: w = (Xị, x2,..., Xn) và lập hàm hợp lý cho một giá trị w = (xb x2, ...,
xn) của mẫu (cũng như ĐLNN gốc, Xj chỉ có thể nhận một trong hai giá trị 0 hoặc 1: Xj' nhận giá trị 1 nếu phần tử thứ i của mẫu mang dấu hiệu
A hoặc nhận giá trị 0 nếu phần tử thứ i của mẫu khơng mang dấu hiệu A). Ta có L(p,Xị,...,xn) = P[pXi (1 - p)1_Xi i = l ổlnL ổp lnL = ^[xilnp + (l-xi)ln(l-p)] i=i Giải ra ta có p = — Vxj = — = f n i=1 .n Dễ dàng thấy rằng ——= -n < 0. ỡp
Như vậy ước lượng hợp lý tối đa của p là tần suất mẫu f.
Chú ý rằng hàm hợp lý là hàm của 0 chứ không phải là của
w = (x,, x2, xn), vì vậy kết quả sẽ vẫn đúng nếu thay mẫu cụ thể
w = (X|, x2, ..., xn) bằng mẫu ngẫu nhiên w = (Xj, x2, Xn). Chúng ta thấy rất rõ nhận xét này qua hai ví dụ trên.
Ngồi hai phương pháp trên cịn có những phương pháp khác như
phương pháp Minimax, phương pháp X2 bé nhất... (xem trang 135, [9]). Rõ ràng có vơ số cách chọn thống kê 0* dùng làm ước lượng cho 0.
Vì vậy chúng ta cần đưa ra các tiêu chuẩn để đánh giá chất lượng của các thống kê 0*. Dưới đây ta sẽ nghiên cứu một sộ tiêu chuẩn đó.