V. Bố cục luận văn
2.2.2. Một số bài toán ƣớc lƣợng liên quan đến tỷ lệ
a. Ƣớc lƣợng tỷ lệ
Giả sử tổng thể có hai loại phần tử, loại phần tử có tính chất A và loại ngƣợc lại không có tính chất A với tỷ lệ phần tử có tính chất A là 𝑝 chƣa biết. Với độ tin cậy 1 − 𝛼 cho trƣớc, ta cần tìm khoảng 𝑝1, 𝑝2 chứa p sao cho
𝑃 𝑝1 < 𝑝 < 𝑝2 = 1 − 𝛼
Giả sử phân phối tiên nghiệm của tỷ lệ là 𝛽(𝑎, 𝑏). Khi đó phân phối hậu nghiệm của 𝑝 là 𝛽 𝑎 , 𝑏 . Trong đó 𝑎 = 𝑎 + 𝑚, 𝑏 = 𝑏 + 𝑛 − 𝑚.
Ta chứng minh đƣợc rằng 𝛽(𝑎 , 𝑏 ) xấp xỉ phân phối chuẩn với trung bình và phƣơng sai
𝐸 𝑝 = 𝑎
𝑎 + 𝑏 , 𝑉𝑎𝑟 𝑝 =
𝑎 𝑏
𝑎 + 𝑏 2(𝑎 + 𝑏 + 1)
Do đó, với độ tin cậy 1 − 𝛼 cho trƣớc thì khoảng ƣớc lƣợng hậu nghiệm 𝑝1, 𝑝2 của 𝑝 là
𝐸 𝑝 − 𝜀, 𝐸 𝑝 + 𝜀 Với
𝜀 = 𝑢1−𝛼 2 𝑉𝑎𝑟 𝑝
Ví dụ 2.4: Gọi 𝑝 là tỷ lệ công ty làm ô nhiễm môi trƣờng ở một tỉnh. Giả sử 𝑝 có phân phối tiên nghiệm 𝛽(1; 4). Chọn một mẫu gồm 145 công ty có 12 công ty làm ô nhiễm môi trƣờng, với độ tin cậy 95% hãy ƣớc lƣợng công ty làm ô nhiễm môi trƣờng của tỉnh.
Giải
22 𝑎 = 𝑎 + 𝑚 = 1 + 12 = 13 𝑏 = 𝑛 + 𝑏 − 𝑚 = 145 + 4 − 1 = 148 Nhƣ vậy 𝛽 𝑎 , 𝑏 = 𝛽(13,148). Do đó 𝐸 𝑝 = 𝑎 𝑎 + 𝑏 = 13 13 + 148 = 0,081 𝑉𝑎𝑟 𝑝 = 𝑎 𝑏 𝑎 + 𝑏 2 𝑎 + 𝑏 + 1 = 13.148 13 + 148 2 13 + 148 + 1 = 0,00046 Khi đó p xấp xỉ phân phối chuẩn N(0,081; 0,00046)
Với mức ý nghĩa 𝛼 = 0,05, ta đƣợc
𝜀 = 𝑢1−𝛼 2 𝑉𝑎𝑟 𝑝 = 1.96 13.148
13 + 148 2 13 + 148 + 1 = 0,042 Vậy tỷ lệ công ty làm ô nhiễm của một tỉnh là
0,081 − 0,042; 0,081 + 0,042 = (0.039 ; 0.123).
b. Ƣớc lƣợng sự khác nhau của hai tỷ lệ
Giả sử hai tổng thể 𝑤1 và 𝑤2 có tỷ lệ những phần tử có tính chất A nào đó
chƣa biết. Gọi 𝑝1, 𝑝2 là tỷ lệ những phần tử có tính chất A của 𝑤1 và 𝑤2. Chọn một mẫu gồm 𝑛1 phần tử từ 𝑤1 ta có 𝑚1 và 𝑛2 phần tử từ 𝑤2 ta có 𝑚2 phần tử có tính chất A.
Giả sử 𝑝1 có phân phối tiên nghiệm 𝛽(𝑎1, 𝑏1) và 𝑝2 có phân phối tiên nghiệm 𝛽(𝑎2, 𝑏2), với độ tin cậy 1 − 𝛼 cho trƣớc.
Ta cần ƣớc lƣợng trung bình sự khác nhau của 2 tỷ lệ 𝑝𝑑 = 𝑝1 − 𝑝2. Ta chỉ xét trƣờng hợp hai phân phối trên độc lập
Khi đó hai phân phối hậu nghiệm của 𝑝1 và 𝑝1 là phân phối Beta độc lập sau 𝑝1~𝛽 𝑎 1, 𝑏 1 , 𝑝2~𝛽(𝑎 2, 𝑏 2)
Trong đó
𝑎 1 = 𝑎1 + 𝑚1, 𝑏 1 = 𝑏1 + 𝑛1 − 𝑚1 𝑎 2 = 𝑎2 + 𝑚2, 𝑏 2 = 𝑏2 + 𝑛2− 𝑚2
Ta có phân phối Beta xấp xỉ phân phối chuẩn, do đó phân phối hậu nghiệm của
𝑝𝑑 = 𝑝1 − 𝑝2 cũng có phân phối chuẩn 𝑁(𝑚𝑑, 𝑠 𝑑2), trong đó 𝑚𝑑 = 𝑎 1
𝑎 1 + 𝑏 1 − 𝑎 2 𝑎 2 + 𝑏 2
23 𝑠 𝑑2 = 𝑎 1𝑏 1
𝑎 1 + 𝑏 1 2 𝑎 1+ 𝑏 1 + 1 +
𝑎 2𝑏 2
𝑎 2 + 𝑏 2 2 𝑎 2 + 𝑏 2 + 1
Do đó, khoảng ƣớc lƣợng cho sự khác nhau giữa hai tỷ lệ với độ tin cậy 1 − 𝛼 là 𝑚𝑑 − 𝑢1−𝛼 2. 𝑠 𝑑; 𝑚𝑑 + 𝑢1−𝛼 2. 𝑠 𝑑
24
CHƢƠNG 3: KIỂM ĐỊNH THAM SỐ THỐNG KÊ BẰNG PHƢƠNG PHÁP BAYES