Var(X' )= Ị£(X,-X) 2= s
§2 ƯỚC LƯỢNG BẰNG KHOẢNG TIN CẬY 2.1 Khái niệm
2.1. Khái niệm
Phương pháp ước lượng điểm nói trên tuy có ưu điểm là đơn giản, nhưng cũng có nhược điểm rất lớn là nó khơng cho biết sai số cũng như
không chỉ ra được khả năng mắc sai lầm khi ước lượng là bao nhiêu. Đặc biệt khi kích thước mẫu nhỏ, ước lượng điểm tìm được có thể sai lệch rất nhiều so với tham số cần ước lượng, nói một cách khác sai số
của ước lượng có thể rất lớn. Phương pháp ước lượng bằng khoảng tin cậy khắc phục được những nhược điểm này.
Giả sử ta cần ước lượng một tham số G của ĐLNN gốc X trên một
đám đơng nào đó. Phương pháp ước lượng bằng khoảng tin cậy được
tiến hành như sau: Trước hết, từ đám đông ta lấy ra mẫu ngẫu nhiên
kích thước n: W=(X|, x2, ..., Xn). Tiếp đến, dựa vào ước lượng điểm tốt
nhất của 0 ta xây dựng một thống kê G = f(Xj, x2, ..., Xn, 0) sao cho
quy luật phân phối xác suất của G hồn tồn xác định, khơng phụ
thuộc vào tham số 0 (nhưng thống kê G thì phụ thuộc
vào 0). Với xác suất Y = 1 - a cho trước, ta xác định cặp giá trị dị, a2
thoả mãn các điều kiện ơ| > 0, ơ2> 0 và a,ị+ a2 = a. Từ quy luật phân
phối xác suất của G ta tìm được các phân vị gj và ga2 sao cho P(G > gi-ai) = 1 - 011 và P(G > ga2) = a2
Từ đó ta có
P(gi-<X1 <G < ga2) = 1 - 0Cj - a2 = 1 - a
Cuối cùng bằng cách biến đổi tương đương, ta đưa công thức trên về dạng:
P(G*| < 0 < 0*2) = 1 - a (7.2) ở đây: Xác suất Y = 1 - a được gọi là độ tin cậy
Khoảng (0*!, G*2) được gọi là khoảng tin cậy
Người ta thường chọn độ tin cây 1 - a khá lớn như 1 - a = 0,9;
0,95; 0,99; 0,999 .... Khi đó theo nguyên lý 'xác suất lớn: "Nếu một
biến cố có xác suất khá gần 1 thì trong thực hành ta cố thể coi nó sẽ
xảy ra trong một lần thực hiện phép thử' thì biến cố (0*! < 9 < 0*2) hầu
như chắc chắn sẽ xảy ra trong một lần lấy mẫu.
Công thức (7.2) cũng chỉ ra rằng: Xác suất mắc sai lầm khi dùng ước lượng khoảng là d.
Hiển nhiên với cùng độ tin cậy 1 - a thì khoảng tin cậy nào ngắn hơn sẽ tốt hơn. Khi thống kê G có phân phối chuẩn hố hoặc có phân phối Student nếu chọn dj = d2 = d/2 thì khoảng tin cậy sẽ là ngắn nhất.
Đồng thời trong trường hợp .này ta sẽ có các khoảng tin cậy là đối xứng. Vì lẽ đó người ta thường chọn dj = d2 = d/2. Trường hợp đặc biệt, nếu
chọn dj = 0 và d2 = d hoặc chọn dị = d và d2 = 0 thì ta sẽ có khoảng tin cậy một phía (dùng để ước lượng giá trị tối thiểu hoặc tối đa của 0).