Chương MẪU VÀ CÁC THAM SỐ MẪU 4.1 MẪU VÀ CÁC PHƯƠNG PHÁP XÂY DỰNG MẪU 4.1.1 Tổng thể mẫu Định nghĩa 4.1.24 Tập hợp toàn đối tượng cần nghiên cứu, khảo sát "đặc tính" chúng gọi tổng thể(hay tập hợp tổng quát hay tập sinh) Ký hiệu tập tổng thể Ω Số phần tử(lực lượng) Ω gọi kích thước tổng thể Ω Định nghĩa 4.1.25 Từ tổng thể, ta chọn ngẫu nhiên(theo cách chọn quy định trước) n phần tử(đối tượng), tập n phần tử chọn gọi mẫu Khi đó, n gọi kích thước mẫu 4.1.2 Các phương pháp xây dựng mẫu Mẫu lặp Lấy mẫu có lặp lấy mẫu mà phần tử lấy ra, sau ghi giá trị đặc trưng, trả trở lại tổng thể trộn lấy tiếp phần tử khác.(phân phối nhị thức) Mẫu không lặp Lấy mẫu không lặp lấy mẫu mà phần tử lấy ra, sau ghi giá trị đặc trưng, không trả trở lại tổng thể mà lấy tiếp phần tử khác.(phân phối siêu bội) Ta biết rằng, phân phối siêu bội hội tụ phân phối nhị thức nên số phần tử tổng thể N lớn so với kích thước mẫu n(N > 100n) việc lấy mẫu khơng lặp lại xem mẫu có lặp Do đó, lý thuyết, ta thường nghiên cứu mẫu lặp Xây dựng mẫu theo lối điển hình Ví dụ 4.1.48 Để ước lượng chiều cao trung bình học sinh lớp địa phương A có 20000 học sinh lớp Trong đó, thành phố 7000, nông thôn 8000 miền núi 5000 học sinh Lấy mẫu 2000 học sinh sau: lấy 700 học sinh thành phố, 800 học sinh nông thôn 500 học sinh miền núi Khi mẫu chọn xây dựng theo lối điển hình Xây dựng mẫu theo lối máy móc Ví dụ 4.1.49 Để kiểm tra đoạn đường AB dài 3000m Bắt đầu từ A cách 30m ta lấy mẫu Khi đó, ta mẫu có kích thước n = 100 xây dựng theo lối máy móc 31 32 4.2 Chương MẪU VÀ CÁC THAM SỐ MẪU Các phương pháp trình bày số liệu 4.2.1 Mẫu ngẫu nhiên mẫu thực nghiệm Ta chọn ngẫu nhiên phần tử từ tập Ω Khi Ω xem khơng gian kiện sơ cấp Gọi X biến ngẫu nhiên biểu thị đặc trưng nghiên cứu tập Ω(X liên kết với phép thử lấy phần tử) Ký hiệu ϵ phép thử lấy phần tử Lặp lại phép thử ϵ n lần Gọi Xi giá trị đặc trưng phần tử lấy lần thứ i(i = 1, n Khi biến X1 , X2 , , Xn độc lập có quy luật phân phối với X, n biến ngẫu nhiên (X1 , X2 , , Xn ) gọi mẫu ngẫu nhiên X Sau lấy mẫu, ta có X1 = x1 , X2 = x2 , , Xn = xn Bộ n số (x1 , x2 , , xn ) gọi mẫu cụ thể(mẫu thực nghiệm) X Định nghĩa 4.2.26 Ta gọi mẫu ngẫu nhiên kích thức n biến ngẫu nhiên X n thứ tự (X1 , X2 , , Xn ), X1 , X2 , , Xn n biến ngẫu nhiên độc lập có phân phối xác suất với X Sau lấy mẫu, ta có X1 = x1 , X2 = x2 , , Xn = xn Bộ n số (x1 , x2 , , xn ) gọi mẫu cụ thể(mẫu thực nghiệm) X 4.2.2 Các phương pháp trình bày mẫu Trình bày mẫu có giá trị khác Giả sử lấy mẫu kích thức n biến ngẫu nhiên X có mẫu cụ thể với số liệu ban đầu (x1 , x2 , , xn ) có k giá trị khác nhau: a1 < a2 < < ak Gọi ni số lần (i = 1, n có mẫu thực nghiệm ni gọi tần số Gọi fi = nni tần suất giá trị mẫu thực nghiệm Khi đó, ta có bảng thống kê(Bảng phân phối tần số không chia lớp) sau: a1 a2 ak ni n1 n2 n k Ví dụ 4.2.50 Ta lấy mẫu kích thước n = 20, ta có 1, 3, 2, 1, 5, 3, 4, 1, 4, 3, 2, 5, 4, 3, 12, 1, 4, 3, Ta có bảng thống kê ni Trình bày mẫu có nhiều giá trị khác Trong trường hợp lấy mẫu kích thước n có nhiều giá trị khác ý nghĩa thực tế mà ta chia mẫu thành nhiều lớp Khơng có quy tắc chia lớp Tuy nhiên, theo số nhà thống kê đề nghị chia lớp sau: 1) Xác định số lượng lớp k { + log2 n k 5lgn 6 k 20 2) Bề rộng lớp amax − amin k 3) Tần số ni lớp ai−1 − số lần giá trị mẫu mà ai−1 x < fi = nni tần suất lớp ai−1 − b= 32 4.2 Các phương pháp trình bày số liệu 33 4) Giá trị giữa(trung tâm) lớp ai−1 − là: a∗i = ai−12+ai Ta có bảng thống kê(Bảng phân phối tần số chia lớp) sau: Lớp[ai , ) a0 − a1 a1 − a2 ak−1 − ak ni n1 n2 nk Chú ý, bảng phân phối tần số thực nghiệm ta thay tần số ni bỡi tần suất tương ứng fi ta bảng gọi bảng phân phối tần suất(chia lớp không chia lớp) thực nghiệm Hàm phân phối thực nghiệm Định nghĩa 4.2.27 Cho X biến ngẫu nhiên lấy mẫu kích thức n X Hàm phân phối thực nghiệm ứng với mẫu chọn, ký hiệu Fn (x), xác định sau: + Nếu mẫu thực nghiệm cho theo bảng khơng chia lớp (4.2.2.) Nếu x a1 n Nếu a1 < x a1 n n +n ∑ ni Nếu a2 < x a3 n Fn (x) = = n a k + Nếu mẫu thực nghiệm cho theo bảng chia lớp (??) Nếu x a0 n Nếu a0 < x a1 n n +n ∑ ni Nếu a1 < x a2 n Fn (x) = = n ai−1 a k−1 Định lý 4.2.19 Giả sử F (x) hàm phân phối xác suất X Fn (x) hàm phân phối thực nghiệm X Khi đó, với n lớn Fn (x) ≈ F (x) Ví dụ 4.2.51 Tìm hàm phân phối thực nghiệm X biết a) Lớp[ai , ) − 4 − 8 − 12 ni ; b) ni Giải a) Ta có 2 F10 (x) = ∑ ni = 10 10 n Nếu x Nếu < x Nếu < x Nếu x > 34 4.3 Chương MẪU VÀ CÁC THAM SỐ MẪU CÁC THAM SỐ ĐẶC TRƯNG CỦA MẪU Giả sử (X1 , X2 , , Xn ) mẫu ngẫu nhiên X sau lấy mẫu ta có mẫu thực nghiệm (x1 , x2 , , xn ) 4.3.1 Các tham số mẫu ngẫu nhiên Biến ngẫu nhiên X = n ∑n i=1 Xi gọi trung bình mẫu ngẫu nhiên ∑ Biến ngẫu nhiên δn2 = n1 ni=1 (Xi − X)2 gọi phương sai mẫu ngẫu nhiên ∑n n 2 δn−1 δn2 = n−1 = n−1 i=1 (Xi −X) gọi phương sai điều chỉnh mẫu ngẫu nhiên √ δn = δn2 : Độ lệch chuẩn mẫu ngẫu nhiên √ : Độ lệch chuẩn điều chỉnh mẫu ngẫu nhiên δn−1 = δn−1 4.3.2 Các tham số mẫu thực nghiệm Số trung bình mẫu thực nghiệm: 1∑ xi n i=1 n x= Số phương sai mẫu thực nghiệm: 1∑ = (xi − x)2 n i=1 n δn2 Số phương sai điều chỉnh mẫu thực nghiệm: n ∑ (xi − x)2 = δn = n−1 n − i=1 n δn−1 δn = δn−1 √ δn2 : Độ lệch chuẩn mẫu thực nghiệm √ : Độ lệch chuẩn điều chỉnh mẫu thực nghiệm = δn−1 Từ công thức trên, ta suy cơng thức tính mẫu thực nghiệm có bảng phân phối khơng chia lớp chia lớp sau: + Nếu mẫu thực nghiệm có bảng phân phối tần số không chia lớp dạng k a1 a2 ak ∑ ( ni = n) ni n1 n2 nk i=1 1∑ ni n i=1 k x= 1∑ 1∑ ni (ai − x)2 = ni a2i − x2 n i=1 n i=1 k δn2 = k 34 4.3 CÁC THAM SỐ ĐẶC TRƯNG CỦA MẪU 35 + Nếu mẫu thực nghiệm có bảng phân phối tần số chia lớp k Lớp[ai , ) a0 − a1 a1 − a2 ak−1 − ak ∑ ( ni = n) ni n1 n2 nk i=1 Đặt a∗i = ai−1 +ai , ta có bảng a∗i a∗1 a∗2 a∗k ni n1 n2 n k Khi 1∑ x= ni a∗i n i=1 k 1∑ 1∑ ni (a∗i − x)2 = ni a∗ 2i − x2 = n i=1 n i=1 k δn2 k Ví dụ 4.3.52 Tính x, δn2 mẫu trường hợp sau: a) ; b) ni [ai , ) − 2 − 4 − 6 − 8 − 10 10 − 12 ni 10 10 10 20 Giải a) Lập bảng tính ∑ ni ni ni a2i 3 15 45 10 50 n = 10 28 98 ∑ Số trung bình mẫu x = n1 ki=1 ni = 10 28 = 2, ∑ k 1 2 Số phương sai mẫu δn = n i=1 ni xi − x = 10 98 − (2, 8)2 = 1, 96 b) Đặt x∗i = xi−12+xi , ta có x∗i 11 ni 10 10 10 20 Lập bảng tính x∗i 11 ∑ ni x∗i ni ni x∗i 5 10 30 90 10 50 250 35 245 10 90 810 20 220 2420 n = 60 430 3820 ∑ 430 = 43 Số trung bình mẫu x = n1 ki=1 ni x∗i = 60 ∑ k 1 2 ∗2 Số phương sai mẫu δn = n i=1 ni xi − x = 60 3820 − ( 43 )2 = 12, 31 35 36 Chương MẪU VÀ CÁC THAM SỐ MẪU Cơng thức tính tốn Khi tính tốn tham số đặc trương mẫu thực nghiệm để tránh việc tính tốn số có giá trị lớn phức tạp, người ta thường sử dụng tính chất sau ∀x0 ∈ R, ∀d ̸= 0, k ∑ ni = n ta có i=1 d ∑ − x0 1∑ ni = ni x= + x0 n i=1 n i=1 d k δn2 k k k d2 ∑ − x0 1∑ ni (ai − x) = ni ( = ) − (x − x0 )2 n i=1 n i=1 d Thông thường ta chọn x0 gia trị tần số lớn nhất, d khoảng cách đều(nếu có) Ví dụ 4.3.53 Tìm x, δn2 , δn−1 với xi 3, 94 3, 97 4, 00 4, 03 4, 06 ni 10 GiảiTa chọn x0 = 4, 00 = 4, d = 0, 03 Ta có bảng tính: xi 3, 94 3, 97 4, 00 4, 03 4,∑ 06 ni 10 n = 25 xi −4 0,03 −2 −1 i −4 i −4 ni x0,03 ni ( x0,03 ) −2 −7 0 5 24 Số trung bình mẫu d ∑ − x0 0, 03 ni x= + x0 = + = n i=1 d 25 k Số phương sai mẫu phương sai điều chỉnh δn2 = k d2 ∑ − x0 0, 032 ) − (x − x0 )2 = 24 − (4 − 4)2 = 0, 000864 ni ( n i=1 d 25 √ δn−1 = n δ = n−1 n √ 25 0, 000864 = 0, 03 24 Ví dụ 4.3.54 Tìm x, δn2 , δn−1 với [ai−1 , ) 10500 − 10550 10550 − 10600 1060 − 10650 10650 − 10700 ni 15 55 20 10 36 4.3 CÁC THAM SỐ ĐẶC TRƯNG CỦA MẪU Giải Đặt x∗i = xi−1 +xi , 37 ta có x∗i 10525 10575 10625 10675 ni 15 55 20 10 Ta chọn x0 = 10575, d = 50 Ta có bảng tính: x∗i 10525 10575 10625 10675 ∑ ni 15 55 20 10 n = 100 x∗i −10575 50 −1 2 ni x∗i −10575 50 ni ( −15 20 20 25 x∗i −10575 ) 50 15 20 40 75 Số trung bình mẫu 50 25 + 10575 = 10587, 100 Số phương sai mẫu phương sai điều chỉnh x= δn2 502 = 75 − (10587, − 10575)2 = 1618, 75 100 √ δn−1 = n δ = n−1 n 37 √ 100 1618, 75 ≈ 40, 44 99 38 Chương MẪU VÀ CÁC THAM SỐ MẪU 38 Chương ƯỚC LƯỢNG THAM SỐ 5.1 PHƯƠNG PHÁP ƯỚC LƯỢNG ĐIỂM - HÀM ƯỚC LƯỢNG 5.1.1 Phương pháp ước lượng điểm Giả sử X biến ngẫu nhiên biểu thị đặc trưng nghiên cứu tập Ω, có phân phối xác suất biết phụ thuộc vào tham số θ chưa biết Để ước lượng θ, ta lấy mẫu kích thước n Khi đó, ta có mẫu ngẫu nhiên (X1 , X2 , , Xn ) Sau lấy mẫu, ta mẫu thực nghiệm (x1 , x2 , , xn ) với Xi = xi (i = 1, n) Ứng với mẫu thực nghiệm (x1 , x2 , , xn ) ta có số θˆn (x1 , x2 , , xn ) dùng để ước lượng cho θ Phương pháp ước lượng gọi phương pháp ước lượng điểm Vì số θˆn (x1 , x2 , , xn ) ứng với điểm đường thẳng số Ta gọi U tập hợp mẫu thực nghiệm (x1 , x2 , , xn ) hay nói cách khác U miền giá trị mẫu ngẫu nhiên (X1 , X2 , , Xn ) Khi ta có hàm θˆn : U → R, (x1 , x2 , , xn ) 7→ θˆn (x1 , x2 , , xn ) Biến ngẫu nhiên θˆn (x1 , x2 , , xn ) gọi hàm ước lượng tham số θ Vấn đề phải tìm hàm θˆn (x1 , x2 , , xn ) cho ước lượng tốt, tức ước lượng không mắc sai số hệ thống hiệu 5.1.2 Các tiêu chuẩn ước lượng tham số đặc trưng X Ước lượng không chệch Định nghĩa 5.1.28 Hàm ước lượng θˆn (x1 , x2 , , xn ) tham số θ gọi ước lượng không chệch tham số θ E(θˆn (x1 , x2 , , xn )) = θ Ngược lại E(θˆn (x1 , x2 , , xn )) ̸= θ ta nói hàm ước lượngθˆn (x1 , x2 , , xn ) hàm ước lượng chệch θ Ước lượng bền vững Định nghĩa 5.1.29 Hàm ước lượng θˆn (x1 , x2 , , xn ) tham số θ gọi ước lượng bền vững tham số θ ∀ϵ > ta có lim P (| θˆn − θ |< ϵ) = n→+∞ Định lý 5.1.20 Nếu hàm ước lượng θˆn (x1 , x2 , , xn ) thỏa mãn 39 40 Chương ƯỚC LƯỢNG THAM SỐ i) E(θˆn (x1 , x2 , , xn )) = θ hay limn→∞ E(θˆn (x1 , x2 , , xn )) = θ ii) limn→∞ D(θˆn (x1 , x2 , , xn )) = θˆn (x1 , x2 , , xn ) ước lượng bền vững θ Ước lượng hiệu Định nghĩa 5.1.30 Ước lượng không chệch θˆn (x1 , x2 , , xn ) θ gọi ước lượng hiệu ′ với ước lượng không chệch θˆn (x1 , x2 , , xn ) θ D(θˆn (x1 , x2 , , xn )) ′ D(θˆn (x1 , x2 , , xn )) Định nghĩa 5.1.31 Hàm ước lượng θˆn (x1 , x2 , , xn ) tham số θ gọi ước lượng tốt tham số θ ước lượng không chệch, bền vững hiệu θ ∀ϵ > ta có lim P (| θˆn − θ |< ϵ) = n→+∞ 5.1.3 Ước lượng kỳ vọng phương sai biến ngẫu nhiên X Định lý 5.1.21∑Cho X biến ngẫu nhiên (x1 , x2 , , xn ) mẫu ngẫu nhiên X Khi a) X = n1 ni=1 Xi ước lượng không chệch, bền vững hiệu kỳ vọng E(X) biến ngẫu nhiên X ∑n 2 b) Phương sai điều chỉnh δn−1 = n−1 i=1 (Xi − X) mẫu ngẫu nhiên ước lượng không chệch, bền vững phương sai D(X) biến ngẫu nhiên X Ý nghĩa: - Muốn ước lượng kỳ vọng E(X) ta lấy trung bình mẫu ước lượng cho - Muốn ước lượng phương sai D(X) ta lấy phương sai mẫu điều chỉnh ước lượng cho 40 5.2 ƯỚC LƯỢNG KHOẢNG 5.2 41 ƯỚC LƯỢNG KHOẢNG 5.2.1 Nguyên lý xác suất nhỏ lớn Nguyên lý xác suất nhỏ Với số α > bé P (A) = α(thơng thường < α 0, 05) thực tế ta thừa nhận kiện A không xảy lần thực phép thử Nguyên lý xác suất lớn Với số α > bé P (B) = − α(thông thường < α 0, 05) thực tế ta thừa nhận kiện B xảy lần thực phép thử 5.2.2 Khoảng tin cậy độ tin cậy Định nghĩa Giả sử X biến ngẫu nhiên biểu thị đặc trưng nghiên cứu tập Ω, có phân phối xác suất biết phụ thuộc vào tham số θ chưa biết Để ước lượng θ ta lấy mẫu kích thức n Giả sử (x1 , x2 , , xn ) mẫu thực nghiệm ứng với mẫu ngẫu nhiên (X1 , X2 , , Xn ) X Nếu ta tìm hai biến ngẫu nhiên f1 (X1 , X2 , , Xn ), f2 (X1 , X2 , , Xn ) cho P [f1 (X1 , X2 , , Xn ) < θ < f2 (X1 , X2 , , Xn )] = γ ,trong γ = − α cho trước gần 1(thông thường < α 0, 05), khoảng số thực (f1 (X1 , X2 , , Xn ), f2 (X1 , X2 , , Xn )) hay f1 (X1 , X2 , , Xn ) < θ < f2 (X1 , X2 , , Xn ) gọi khoảng tin cậy tham số θ với độ tin cậy γ Trong trường hợp khoảng tin cậy đối xứng có dạng (g(X1 , X2 , , Xn ) − ϵ, g(X1 , X2 , , Xn ) + ϵ) Khi ϵ gọi độ xác hay sai số ước lượng Cần ý rằng, độ tin cậy γ ta tìm nhiều khoảng tin cậy khác tham số θ Khoảng tin cậy có độ dài ngắn xem khoảng tin cậy tốt Trong thực hành, ta tìm khoảng tin cậy tốt Nhận xét Từ định nghĩa trên, ta chọn α = 1% ⇒ γ = 99% P [f1 (X1 , X2 , , Xn ) < θ < f2 (X1 , X2 , , Xn )] = γ Điều nói lên xác suất để lấy mẫu thực nghiệm (x1 , x2 , , xn ) mà f1 (x1 , x2 , , xn ) < θ < f2 (x1 , x2 , , xn ) 99% Như ta lấy mẫu thực nghiệm (x1 , x2 , , xn ) Ta có khoảng tin cậy cụ thể f1 (x1 , x2 , , xn ) < θ < f2 (x1 , x2 , , xn ) theo nguyên lý xác suất lớn, ta thừa nhận tham số θ thỏa mãn f1 (x1 , x2 , , xn ) < θ < f2 (x1 , x2 , , xn ) 41 42 Chương ƯỚC LƯỢNG THAM SỐ 5.2.3 Khoảng tin cậy cho kỳ vọng E(X) = µ với X v N (µ, δ) X đại lượng ngẫu nhiên biểu thị đặc trưng nghiên cứu tập Ω phân phối chuẩn với kỳ vọng E(X) = µ chưa biết Để ước lượng µ, ta lấy mẫu ngẫu nhiên kích thước n Ta có mẫu ngẫu nhiên (X1 , X2 , , Xn ) mẫu thực nghiệm tương ứng (x1 , x2 , , xn ) Ta tính số trung bình mẫu x Tùy theo độ lệch chuẩn δ biết hay chưa mà tính độ lệch chuẩn mẫu điều chỉnh δn−1 Với độ tin cậy γ = − α, ta có Khoảng tin cậy đối xứng E(X) = µ (x − ϵ, x + ϵ) hay x − ϵ < µ < x + ϵ Để ước lượng E(X) = µ ta lấy số trung bình mẫu x ước lượng cho Khi P (x − ϵ < µ < x + ϵ) = γ ⇔ P (| X − µ |< ϵ) = γ Trường hợp độ lệch chuẩn δ biết Trường hợp độ lệch chuẩn δ chưa biết (γ ) δ Khi ϵ = √ Φ−1 n Tính số δn−1 Ta có ( P (| X − µ |< ϵ) = − α ⇔ P √ ) X − µ√ ϵ n =γ | n |< δn−1 δn−1 δn−1 ⇔ ϵ = √ t(n − 1; − γ) n X − µ√ n có phân phối Student với n − bậc tự δn−1 X − µ√ n có phân phối xấp xỉ phân phối chuẩn N (0, 1) nên t(n − Chú ý rằng, n > 30: δ n−1 (γ ) 1; − γ) ≈ Φ−1 Vì Ví dụ 5.2.55 Để ước lượng độ cứng trung bình loại bi thép, người ta lấy 25 bi để kiểm tra Tính độ cứng trung bình x = 10, với độ tin cậy 99% Hãy tìm khoảng tin cậy đối xứng độ cứng trung bình viên bi thép Biết độ cứng viên bi có phân phối chuẩn N (µ, δ ) hai trường hợp: a) Độ lệch chuẩn δ = b) Độ lệch chuẩn chưa biết từ mẫu thực nghiệm tính δn−1 = 1, Giải Gọi X độ cứng viên bi thép X đại lượng ngẫu nhiên có phân phối chuẩn Khi kỳ vọng E(X) = µ độ cứng trung bình viên bi a) Ta có n = 25, x = 10, δ = 1, độ (tin )cậy γ = 99% γ Tra bảng phân vị chuẩn, ta có Φ−1 = 2, 567 ( ) δ γ Từ đó, ta có ϵ = √ Φ−1 = √ 2, 567 ≈ 0, 515 n 25 Vậy khoảng tin cậy đối xứng độ cứng trung bình µ (x − ϵ, x + ϵ) = (9, 485; 10, 515) hay 9, 485 < µ < 10, 515 b) Ta có n = 25, x = 10, δn−1 = 1, 2, độ tin cậy γ = 99% 42 5.2 ƯỚC LƯỢNG KHOẢNG 43 Tra bảng phân vị Student với n−1 = 24 bậc tự do, mức phân vị 1−γ = 0, 05, ta có t(24; 0, 05) = 2, 797 nên δn−1 1, ϵ = √ t(n − 1; − γ) = 2, 797 ≈ 0, 67 n Vậy khoảng tin cậy đối xứng độ cứng trung bình µ (x − ϵ, x + ϵ) = (9, 33; 10, 67) hay 9, 33 < µ < 10, 67 Ví dụ 5.2.56 Để ước lượng hao phí xăng loại ơtơ chạy đoạn đường AB, người ta theo dõi 100 chuyến xe tính x = 10 lít, δn−1 = 0, lít, với độ tin cậy 95% Giả sử xằng biến ngẫu nhiên X lượng xăng hao phí loại ơtơ trên đoạn AB có phân phối chuẩn Hãy ước lượng khoảng tin cậy đối xứng của mức hao phí xăng trung bình µ? Giải ( ) a) Ta có n = 100, x = 10, độ tin cậy γ = 95% Tra bảng phân vị chuẩn, ta có Φ−1 γ2 = ( ) Φ−1 95% = 1, 96 0, 05 δ −1 ( γ ) √ =√ Từ đó, ta có ϵ = Φ 1, 96 ≈ 0, n 100 Vậy khoảng tin cậy đối xứng độ cứng trung bình µ (x − ϵ, x + ϵ) = (9, 9; 10, 1) hay 9, < µ < 10, 5.2.4 Ước lượng tỉ lệ phần trăm hay xác suất Giả sử A kiện liên kết với phép thử Muốn biết xác suất xảy biến cố A hay p = P (A), ta lặp lại phép thử n lần(lấy mẫu có lặp kích thước n) Gọi Xi số lần xảy kiện A phép thử thứ i(i = 1, n) X1 , X2 , , Xn đại lượng ngẫu nhiên độc lập có phân phối Xi (i = 1, n) P 1−p p ∑ Khi X = n1 ni=1 Xi = Fn (A) Ta có E(X) = p Bài tốn ước lượng xác∑suất tốn ước lượng kỳ vọng E(X) = p Khi n lớn:X = n1 ni=1 Xi = Fn (A) có phân phối xấp xỉ phân phối chuẩn N (p, p(1 − p)) Ước lượng tỉ lệ Giả sử tổng thể Ω có N phần tử, có M phần tử mang đặc tính A Do khơng điều tra tồn nên ta khơng biết tỉ lệ p = M Phép thử lấy phần tử Gọi C kiện phần tử lấy N = p mang đạc tính A Khi P (C) = M N Suy toán ước lượng tỉ lệ tốn ước lượng xác suất Để ước lượng tỉ lệ p, ta lấy mẫu kích thước n, ta tính tỉ lệ fn với độ tin cậy γ = − α, ta có: Khoảng tin cậy cho tỉ lệ p (fn − ϵ, fn + ϵ) ϵ xác định sau: Với n > 50 : nfn > n(1 − fn ) > Ta có √ fn (1 − fn ) −1 ( γ ) √ ϵ= Φ n 43 44 Chương ƯỚC LƯỢNG THAM SỐ Ví dụ 5.2.57 Để ước lượng tỉ lệ gạch loại nhà máy, người ta lấy 10000 viên thấy có 300 viên gạch loại Với độ tin cậy 99% a) Hãy ước lượng tỉ lệ gạch loại 2? b) Cần lấy thêm gạch để tỉ lệ gạch loại tồn so với tỉ lệ mẫu có sai số không vượt 0, 001 Giả thiết lấy tỉ lệ mẫu fn thay cho tỉ lệ mẫu mẫu cần thêm Giải Gọi p tỉ lệ gạch loại nhà máy 300 Ta có n = 10000, tỉ lệ mẫu fn = 10000 = 0, 03 Độ tin cậy γ = − α = 99% a) √ √ fn (1 − fn ) −1 ( γ ) 0, 03.0, 07 √ ϵ= = √ Φ 2, 576 ≈ 0, 0044 n 10000 Vậy khoảng ước lượng đối xứng tỉ lệ fn − ϵ < p < fn + ϵ ⇔ 0, 03 − 0, 0044 < p < 0, 03 + 0, 0044 hay 0, 0256 < p < 0, 0344 b) Gọi N số gạch cần lấy thêm n = N + 10000 ( ) Tỉ lệ mẫu fn = 0, 03 độ tin cậy γ = 0, 99, ta có Φ−1 γ2 = 2, 576 Theo giả thiết ϵ 0, 001 ⇒ √ √ fn (1 − fn ) −1 ( γ ) 0, 03.0, 07 √ √ = ϵ= Φ 2, 576 0, 001 ⇒ n > 193101, 18 n n suy nmin = 193102 Số gạch cần lấy thêm N = 193102 − 10000 = 193102 Ví dụ 5.2.58 Để ước lượng cá hồ, người ta bắt 1000 làm dấu thả lại Sau lại bắt 900 thấy có 90 làm dấu Hãy ước lượng số lượng cá hồ với độ tin cậy 95% Giải Gọi N số cá hồ Gọi p tỉ lệ cá làm dấu hồ, ta có p = 1000 N 90 Ta ước lượng p Ta có n = 900, tỉ lệ mẫu fn = 900 = 0, Độ tin cậy γ = − α = 95% ( ) Tra bảng phân vị chuẩn, ta có Φ−1 γ2 = 1, 96 √ ϵ= fn (1 − fn ) −1 ( γ ) √ = Φ n √ 0, 1.0, √ 1, 96 ≈ 0, 0196 900 Suy fn − ϵ < p < fn + ϵ ⇒ 0, 0804 < 1000 < 0, 1196 N Vậy số cá hồ 8362 N 12437 5.2.5 Ước lượng phương sai D(X) với X v N (µ, δ) Giả sử X biến ngẫu nhiên biểu thị đặc trưng nghiên cứu tập Ω có phân phối chuẩn D(X) = δ chưa biết Để ước lượng D(X) ta lấy mẫu kích thước n, ta mẫu ngẫu nhiên (X1 , X2 , , Xn ) mẫu thực nghiệm (x1 , x2 , , xn ) Ta có Xi v N (µ, δ ) ⇒ Xiδ−µ v N (0, 1) Do đó: ∑n Xi −µ ns20 i=1 ( δ ) = δ có phân phối bình phương với (n − 1) bậc tự 44 5.2 ƯỚC LƯỢNG KHOẢNG Trong 45 1∑ (xi − x)2 ; = n i=1 n δn2 1∑ xi x= n i=1 n Ta xét trường hợp sau: Với kỳ vọng E(X) = µ biết ∑ Tính sn = n1 ni=1 (xi − µ)2 Tra bảng phân vị bình phương với n bậc tự ứng với mức phân vị χ α (n), χ21− α (n) 2 Khi đó, khoảng tin cậy phương sai α ,1 − α ta có ns2n ns2n < δ < χ21− α (n) χ2α (n) 2 Với kỳ vọng E(X) = µ chưa biết Tính 1∑ x= xi ; n i=1 n 1∑ = (xi − x)2 n i=1 n δn2 Tra bảng phân vị bình phương với (n − 1) bậc tự ứng với mức phân vị α2 , − χ2α (n − 1), χ21− α (n − 1) 2 Khi đó, khoảng tin cậy phương sai D(X) = δ α ta có nδn2 nδn2 < δ < χ21− α (n − 1) χ2α (n − 1) 2 Chú ý: Khi n > 30 ta có với U1+ α2 √ χ21− α (n) ≈ ( 2n − + U1− α2 )2 2 phân vị chuẩn mức 1− α2 N (0, 1) √ χ2α (n) ≈ ( 2n − − U1− α2 )2 2 Ví dụ 5.2.59 Tuổi thọ X van điện có phân phối chuẩn Ta lấy 10 van điện tính phương sai mẫu δ12 = 0, Với độ tin cậy 95% ước lượng phương sai D(X)? α GiảiTa có n = 10 kỳ vọng chưa biết Độ tin cậy γ = − α = 95% ⇒ α = 0, 05 Tra bảng phân vị bình phương với n − = 10 − = bậc tự ứng với mức phân vị = 0, 025, − α2 = 0, 975 ta có χ20,025 (9) = 2, 7, χ20,975 (9) = 19 nδn = 10.0,8 = 2, 96 2,7 χ2α (n−1) 2 nδn χ21− α (n−1) = 10.0,8 19 = 0, 42 Vậy khoảng tin cậy phương sai D(X) = δ 0, 42 < δ < 2, 96 45 PHỤ LỤC e dt Hàm Laplace: Φ(x) = (x > 0) Chú ý: Với x < Φ(x) = −Φ(−x) √1 2π ∫x − t2 Bảng phân vị Student: P (X < tn,α ) = α Bµi tập Câu Tung xúc xắc Tính xác suất để có mặt chia hết cho Tỉng sè chÊm mỈt b»ng 15 Cã Ýt nhÊt mét mỈt mét chÊm xt hiƯn Câu Có ng-ời lên toa tàu có hai ng-ời tên A B Tính xác suất để ng-ời ngồi toa khác nhau? Hai ng-êi A, B ngåi cïng mét toa? có ng-ời ngồi toa thứ 2? Câu Mét hép cã bi ®á, bi xanh bi trắng Lấy ngẫu nhiên lần l-ợt bi TÝnh x¸c st c¸c sù kiƯn sau hai tr-ờng hợp có hoàn lại không hoàn lại Cả hai bi lấy màu đỏ Hai bi lÊy cïng mµu Hai bi lÊy khác màu Câu Một hộp có m bi đỏ bi xanh Lần lấy ngẫu nhiên bi (không hoàn lại) Sau đó, lần lấy ngẫu nhiên bi Tính xác suất a) Lần lấy đ-ợc hai bi màu ? b) Cả hai lần lấy đ-ợc toàn bi xanh ? c) Lần lấy đ-ợc hai bi xanh ? d) Giả sử lần lấy đ-ợc bi xanh Tính xác suất để lần lấy đ-ợc hai bi xanh ? Câu Chon ngẫu nhiên hai điểm x, y (0, 1) Tính xác suất để chọn đ-ợc hai điểm có tỉng x + y vµ xy Câu Trên đoạn thẳng OM có độ dài m > 0, ta lấy ngẫu nhiên hai điểm B vµ C víi m OB = x, OC = y Tính xác suất để lấy đ-ợc hai điểm B, C cho BC < ? C©u Trong 20 sản phẩm có phế phẩm Ta bỏ vào hộp hộp sản phẩm Tính xác st ®Ĩ ë hép chØ cã mét phÕ phẩm? Các hộp có phế phẩm? Các phế phẩm hộp Câu Đề c-ơng ôn thi có 12 câu lý thuyết 30 câu tập Một đề thi gồm câu lý thuyết câu tập Một học sinh học câu lý thuyết 10 câu tập Tính xác suất để học sinh không làm đ-ợc câu lý thuyết? làm đ-ợc câu lý thuyết câu tập làm đ-ợc câu lý thuyết tập? Học sinh thi lại? Biết học sinh không thi lại làm đ-ợc câu lý thuyết câu tập làm đ-ợc câu lý thuyết tập Câu Trong thành phố A, tỉ lệ ng-ời tốt nghiệp đại học 0.3 tỉ lệ ng-ời tốt nghiệp phổ thông 0.35 Trong số ng-ời đà tốt nghiệp đại học có 60% ng-êi cã xe m¸y; sè ng-êi tèt nghiƯp phổ thông có 40% ng-ời có xe máy; số ng-êi ch-a tèt nghiƯp phỉ th«ng cã 10% ng-êi cã xe máy Chọn ngẫu nhiên ng-ời dân thành phố A Tính xác suất để ng-ời chọn có xe m¸y? BiÕt ng-êi chän cã xe m¸y Hỏi khả ng-ời thuộc nhóm ng-ời nhiều nhất? Câu 10 Có hai thùng hàng, thùng I chứa chÝnh phÈm vµ phÕ phÈm; thïng II chøa phẩm phế phẩm Lấy ngẫu nhiên sản phẩm thùng I bỏ vào thùng Sau lấy ngẫu nhiên sản phẩm từ thùng II Tính xác suất để hai sản phẩm lấy cuối tốt? Đều tốt thùng I? Câu 11 Bắn viên đạn độc lập vào mục tiêu Xác suất trúng mục tiêu viên đạn lần l-ợt 0.7, 0.8 0.9 Biết viên đạn trúng viên trúng mục tiêu bị phá hủy với xác suất t-ơng tứng 0.4 0.6; trúng viên mục tiêu bị phá hủy Tính xác suất để mục tiêu bị phá hủy? Câu 12 Một ng-ời túi có hai bao diêm, bao có 30 que Mỗi lần hút thuốc ng-ời lấy ngẫu nhiên bao dùng que bao Tính xác suất để Mỗi bao lại 10 que? Một bao hết diêm bao lại 10 que? Câu 13 Xác suất bắn trúng mục tiêu xạ thủ không đổi 0.6 Xạ thủ bắn viên vào mục tiêu Gọi X số viên đạn bắn trúng Lập bảng phân phối xác suất hàm phân phối xác suất X? Tính tham số đặc tr-ng X? Tính xác suất để xạ thủ phá hủy đ-ợc mục tiêu Biết mục tiêu bị phá hủy bắn trúng viên Câu 14 Có hai hộp, hộp I cã bi ®á, bi xanh; hép II có bi đỏ bi xanh Lấy ngẫu nhiên bi ë hép I råi bá vµo hép II Sau từ hộp II lấy ngẫu nhiên bi Gọi X, Y lần l-ợt số bi đỏ lấy hộp I hộp II Lập bảng phân phối xác suất X Y ? Lập bảng phân phối xác suất X Y, X.Y ? Câu 15 Cho biến ngẫu nhiên X có hàm phân 0, F (x) = a sin 2x, 0, phèi x¸c suÊt x60 x ∈ (0, π4 ) x> π Xác đinh a hàm mật độ xác suất f (x)? Tính tham số đặc tr-ng X ? Tính xác suất để ba lần thùc hiƯn phÐp thư vỊ X cã lÇn X nhận giá trị )? khoảng (0, Câu 16 Cho biến ngẫu nhiên X có hàm mật độ xác suÊt ax2 , x ∈ (0, 2] f (x) = 0, x / (0, 2] a) Xác định a hàm phân phối F (x) ? b) Tính E(X), D(X) ? c) TÝnh P (1 < X < 9) ? Câu 17 Độ dài X chi tiết máy N (5cm, 0.81cm) Tĩnh xác suất để lấy đ-ợc chi tiết máy có chiều dài khoảng (4cm, 7cm)? C©u 18 ChiỊu cao Y cđa nam giíi tr-ëng thµnh lµ N (160cm, δcm) BiÕt r»ng P (|X − 160| < 2) = 0.2569, tìm tính xác suất để lấy ngẫu nhiên nam có nhÊt mét ng-êi cã chiỊu cao kho¶ng 158 cm ®Õn 162 cm?