Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 146 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
146
Dung lượng
1,01 MB
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC BÀI GIẢNG XÁC SUẤT THỐNG KÊ NGUYỄN THỊ THU THỦY BỘ MƠN TỐN ỨNG DỤNG HÀ NỘI - 01/2020 MỤC LỤC Chương Sự kiện ngẫu nhiên phép tính xác suất 1.1 1.2 1.3 1.4 1.5 1.6 Sự kiện Quan hệ kiện 1.1.1 Phép thử Sự kiện 1.1.2 Phân loại kiện 1.1.3 Quan hệ kiện Giải tích kết hợp 11 1.2.1 Quy tắc cộng Quy tắc nhân 11 1.2.2 Chỉnh hợp 12 1.2.3 Chỉnh hợp lặp 12 1.2.4 Hoán vị 12 1.2.5 Tổ hợp 13 Khái niệm định nghĩa xác suất 13 1.3.1 Khái niệm xác suất 13 1.3.2 Định nghĩa cổ điển xác suất 14 1.3.3 Định nghĩa xác suất theo quan điểm hình học 16 1.3.4 Định nghĩa thống kê xác suất 18 1.3.5 Nguyên lý xác suất nhỏ, nguyên lý xác suất lớn 19 Công thức cộng nhân xác suất 20 1.4.1 Xác suất có điều kiện 20 1.4.2 Công thức nhân xác suất 20 1.4.3 Công thức cộng xác suất 23 Công thức Béc–nu–li 27 1.5.1 Dãy phép thử độc lập 27 1.5.2 Lược đồ Béc–nu–li 27 1.5.3 Công thức Béc–nu–li 27 1.5.4 Số có khả lược đồ Béc–nu–li 29 1.5.5 Công thức xấp xỉ 30 Công thức xác suất đầy đủ Công thức Bay–ét 31 1.6.1 Công thức xác suất đầy đủ 31 1.6.2 Công thức Bay–ét 32 MI2020 – KỲ 20192 – TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy Chương Biến ngẫu nhiên quy luật phân phối xác suất 2.1 2.2 2.3 2.4 Định nghĩa phân loại biến ngẫu nhiên 36 2.1.1 Định nghĩa biến ngẫu nhiên 36 2.1.2 Phân loại biến ngẫu nhiên 37 Quy luật phân phối xác suất biến ngẫu nhiên 37 2.2.1 Bảng phân phối xác suất biến ngẫu nhiên rời rạc 37 2.2.2 Hàm phân phối xác suất 39 2.2.3 Hàm mật độ xác suất biến ngẫu nhiên liên tục 42 Các tham số đặc trưng biến ngẫu nhiên 44 2.3.1 Kỳ vọng 44 2.3.2 Phương sai 49 2.3.3 Độ lệch chuẩn 51 2.3.4 Một số đặc trưng khác 51 Một số phân phối xác suất thông dụng 52 2.4.1 Phân phối 52 2.4.2 Phân phối nhị thức 55 2.4.3 Phân phối Poa–xông 56 2.4.4 Phân phối chuẩn 59 2.4.5 Phân phối bình phương 66 2.4.6 Phân phối Student 67 Chương Biến ngẫu nhiên nhiều chiều 3.1 36 69 Khái niệm phân loại biến ngẫu nhiên nhiều chiều 69 3.1.1 Khái niệm 69 3.1.2 Phân loại 69 Bảng phân phối xác suất biến ngẫu nhiên hai chiều rời rạc 69 3.2.1 Bảng phân phối xác suất đồng thời 69 3.2.2 Bảng phân phối xác suất thành phần (biên) 71 3.2.3 Phân phối có điều kiện 73 Hàm phân phối xác suất 74 3.3.1 Hàm phân phối xác suất đồng thời 74 3.3.2 Hàm phân phối xác suất thành phần (biên) 75 Hàm mật độ xác suất biến ngẫu nhiên hai chiều liên tục 75 3.4.1 Hàm mật độ xác suất đồng thời 75 3.4.2 Hàm mật độ xác suất biên 77 3.4.3 Hàm mật độ xác suất có điều kiện 78 3.5 Tính độc lập biến ngẫu nhiên 79 3.6 Đặc trưng biến ngẫu nhiên hai chiều 79 3.6.1 79 3.2 3.3 3.4 MỤC LỤC Kỳ vọng, phương sai biến ngẫu nhiên thành phần MI2020 – KỲ 20192 – TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy 3.6.2 Hiệp phương sai 80 3.6.3 Hệ số tương quan 82 3.7 Hàm hai biến ngẫu nhiên 83 3.8 Luật số lớn định lý giới hạn trung tâm 85 3.8.1 Luật số lớn 85 3.8.2 Định lý giới hạn trung tâm 87 Chương Thống kê Ước lượng tham số 4.1 4.2 4.3 Lý thuyết mẫu 88 4.1.1 Tổng thể mẫu 88 4.1.2 Mẫu ngẫu nhiên 90 4.1.3 Mô tả giá trị mẫu ngẫu nhiên 91 4.1.4 Đại lượng thống kê đặc trưng mẫu ngẫu nhiên 92 4.1.5 Cách tính giá trị cụ thể trung bình mẫu phương sai mẫu 94 4.1.6 Phân phối xác suất thống kê trung bình mẫu, phương sai mẫu, tần suất mẫu ngẫu nhiên 98 Ước điểm cho kỳ vọng, phương sai tỷ lệ 99 4.2.1 Ước lượng điểm 99 4.2.2 Các tiêu chuẩn lựa chọn hàm ước lượng 99 4.2.3 Ước lượng điểm cho kỳ vọng, phương sai xác suất 100 4.2.4 Một số phương pháp tìm ước lượng điểm 100 Phương pháp ước lượng khoảng tin cậy 101 4.3.1 Khoảng tin cậy kỳ vọng biến ngẫu nhiên phân phối chuẩn 101 4.3.2 Ước lượng khoảng cho tỷ lệ 106 Chương Kiểm định giả thuyết 5.1 5.2 5.3 5.4 88 109 Các khái niệm 109 5.1.1 Giả thuyết thống kê 109 5.1.2 Tiêu chuẩn kiểm định Mức ý nghĩa Miền bác bỏ 110 5.1.3 Sai lầm loại Sai lầm loại 111 Kiểm định giả thuyết kỳ vọng biến ngẫu nhiên có phân phối chuẩn 112 5.2.1 Trường hợp biết phương sai 112 5.2.2 Trường hợp chưa biết phương sai, cỡ mẫu n < 30 114 5.2.3 Trường hợp chưa biết phương sai, cỡ mẫu n ≥ 30 115 Kiểm định giả thuyết tỷ lệ 117 5.3.1 Bài toán 117 5.3.2 Các bước tiến hành 117 So sánh hai kỳ vọng hai biến ngẫu nhiên phân phối chuẩn 119 5.4.1 MỤC LỤC Trường hợp phương sai σ12 , σ22 biết 119 MI2020 – KỲ 20192 – TÓM TẮT BÀI GIẢNG 5.5 5.4.2 Trường hợp phương sai σ12 , σ22 chưa biết, cỡ mẫu n1 < 30, n2 < 30 120 5.4.3 Trường hợp phương sai σ12 , σ22 chưa biết, cỡ mẫu n1 ≥ 30, n2 ≥ 30 122 So sánh hai tỷ lệ 124 5.5.1 Bài toán 124 5.5.2 Các bước tiến hành 124 Chương Phụ lục bảng số 6.1 6.2 Nguyễn Thị Thu Thủy 127 Phụ lục bảng số 127 6.1.1 Phụ lục 1: Giá trị hàm Gao-xơ 127 6.1.2 Phụ lục 2: Giá trị hàm Láp-la-xơ 127 6.1.3 Phụ lục 3: Giá trị hàm phân phối chuẩn tắc 127 6.1.4 Phụ lục 4: Giá trị phân phối Student 127 6.1.5 Phụ lục 5: Giá trị hàm khối lượng xác suất Poa-xông 127 Hướng dẫn sử dụng bảng số 134 6.2.1 Bảng giá trị hàm Gao-xơ (Phụ lục 1) 134 6.2.2 Bảng giá trị hàm Láp-la-xơ (Phụ lục 2) 134 6.2.3 Bảng giá trị hàm phân phối chuẩn tắc (Phụ lục 3) 134 6.2.4 Bảng giá trị t1n−α phân phối Student (Phụ lục 4) 134 MỤC LỤC Lời nói đầu Lý thuyết xác suất thống kê tốn học ngành khoa học giữ vị trí quan trọng lĩnh vực ứng dụng rộng rãi phong phú đời sống người Cùng với phát triển mạnh mẽ khoa học công nghệ, nhu cầu hiểu biết sử dụng công cụ ngẫu nhiên phân tích xử lý thơng tin ngày trở nên đặc biệt cần thiết Các kiến thức phương pháp xác suất thống kê hỗ trợ hữu hiệu nhà nghiên cứu nhiều lĩnh vực khoa học khác vật lý, hóa học, sinh học, nơng học, kinh tế học, xã hội học, ngơn ngữ học Do "Xác suất thống kê" học phần cần thiết cho sinh viên bậc đại học Bài giảng học phần "Xác suất thống kê", mã học phần MI2020 biên soạn theo Đề cương chi tiết với khối lượng 30 tiết lý thuyết, 30 tiết tập dành cho sinh viên hệ đại học quy (khơng phải chun ngành Toán Tin) Trường Đại học Bách khoa Hà Nội Mục tiêu học phần: Cung cấp cho sinh viên kiến thức xác suất khái niệm quy tắc suy diễn xác suất biến ngẫu nhiên phân phối xác suất thông dụng (một hai chiều); khái niệm thống kê toán học nhằm giúp sinh viên biết cách xử lý toán thống kê ước lượng, kiểm định giả thuyết Trên sở sinh viên có phương pháp tiếp cận với mơ hình thực tế có kiến thức cần thiết để đưa lời giải cho tốn Nội dung vắn tắt học phần: Sự kiện ngẫu nhiên phép tính xác suất, đại lượng ngẫu nhiên, phân phối xác suất, véc tơ ngẫu nhiên, lý thuyết ước lượng thống kê, lý thuyết định thống kê Chương Sự kiện ngẫu nhiên phép tính xác suất Các tượng tự nhiên hay xã hội xảy cách ngẫu nhiên (không biết trước kết quả) tất định (biết trước kết xảy ra) Chẳng hạn vật nặng thả từ cao chắn rơi xuống đất, điều kiện bình thường nước sơi 100∘ C Đó tượng diễn có tính quy luật, tất nhiên Trái lại, tung đồng xu ta xuất mặt sấp hay mặt ngửa; ta khơng thể biết trước có gọi đến tổng đài; có khách hàng đến điểm phục vụ khoảng thời gian đó; ta khơng thể xác định trước số chứng khốn thị trường chứng khốn Đó tượng ngẫu nhiên Tuy nhiên, tiến hành quan sát nhiều lần tượng ngẫu nhiên hồn cảnh nhau, nhiều trường hợp ta rút kết luận có tính quy luật tượng Lý thuyết xác suất nghiên cứu quy luật tượng ngẫu nhiên Việc nắm bắt quy luật cho phép dự báo tượng ngẫu nhiên xảy Chính phương pháp lý thuyết xác suất ứng dụng rộng rãi việc giải toán thuộc nhiều lĩnh vực khác khoa học tự nhiên, kỹ thuật kinh tế–xã hội 1.1 Sự kiện Quan hệ kiện 1.1.1 Phép thử Sự kiện Định nghĩa 1.1 (Phép thử Sự kiện) (a) Việc thực nhóm điều kiện để quan sát tượng gọi phép thử (experiment) (b) Hiện tượng, kết xét phép thử gọi kiện hay biến cố (event) (c) Sự kiện sơ cấp hay kết cục phép thử kết mà ta không chia nhỏ được, ký hiệu ω (d) Sự kiện phức hợp kiện phân tích thành kiện nhỏ MI2020 – KỲ 20192 – TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy (e) Tập hợp tất kết cục phép thử tạo thành không gian kiện sơ cấp, ký hiệu Ví dụ 1.1 Ω = ωi , i ∈ I , I tập số (a) Gieo xúc xắc (cân đối, đồng chất, mặt phẳng cứng) phép thử Xúc xắc xuất mặt 1, 2, 3, 4, 5, chấm kiện (b) Gieo đồng xu (cân đối, đồng chất, mặt phẳng cứng) phép thử Đồng xu xuất mặt sấp, mặt ngửa kiện Ví dụ 1.2 Gieo xúc xắc, (a) Sự kiện Ai "xuất mặt i chấm", i = 1, , kiện sơ cấp (b) Sự kiện A "xuất mặt chấm chẵn" kiện phức hợp phân tích thành kiện "xuất mặt 2, 4, chấm" Ví dụ 1.3 (a) Phép thử gieo đồng xu (cân đối, đồng chất, mặt phẳng cứng) có khơng gian kiện sơ cấp Ω = {S, N } (b) Phép thử gieo đồng thời hai đồng xu (cân đối, đồng chất, mặt phẳng cứng) có khơng gian kiện sơ cấp Ω = {SS, SN, NS, NN } Chú ý 1.1 (a) Chú ý chất kiện sơ cấp khơng có vai trị đặc biệt lý thuyết xác suất Chẳng hạn mã hóa kết xem khơng gian kiện sơ cấp phép thử tung đồng xu Ω = {0, 1}, kiện sơ cấp mặt sấp xuất để mặt ngửa xuất (b) Mỗi kết cục ω phép thử 𝒞 gọi kết cục thuận lợi cho kiện A A xảy kết cục phép thử 𝒞 ω Ví dụ 1.4 Nếu gọi kiện A "xuất mặt chấm chẵn" phép thử gieo xúc xắc A có kết cục thuận lợi 2, 4, 1.1.2 Phân loại kiện Có loại kiện (a) Sự kiện chắn kiện định xảy thực phép thử Ký hiệu U Ω S (b) Sự kiện khơng thể có kiện định không xảy thực phép thử Ký hiệu V ∅ (c) Sự kiện ngẫu nhiên kiện xảy ra, không xảy thực phép thử Ký hiệu A, B, C, A1 , A2 1.1 Sự kiện Quan hệ kiện MI2020 – KỲ 20192 – TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy Ví dụ 1.5 Gieo xúc xắc, (a) Sự kiện S “xuất mặt có số chấm ≤ ≥ 1” kiện chắn (b) Sự kiện ∅ “xuất mặt chấm” kiện (c) Sự kiện A “xuất mặt chấm chẵn” kiện ngẫu nhiên 1.1.3 Quan hệ kiện Một cách tương ứng với phép toán tập hợp, lý thuyết xác suất người ta xét quan hệ sau cho kiện phép thử (a) Quan hệ kéo theo: Sự kiện A kéo theo kiện B, ký hiệu A ⊂ B, A xảy B xảy Nếu A ⊂ B B ⊂ A ta nói hai kiện A B trùng nhau, viết A = B (b) Tổng kiện: Sự kiện A gọi tổng kiện A1 , A2 , , An A xảy kiện Ai xảy ra, i = 1, 2, , n Viết là: A = A1 + A2 + · · · + A n A = A1 ∪ A2 ∪ · · · ∪ A n Hình 1.1: Sơ đồ Venn A ∪ B A ∩ B (c) Tích kiện: Sự kiện B gọi tích kiện A1 , A2 , , An B xảy tất kiện Ai xảy ra, i = 1, 2, , n Viết là: B = A1 A2 A n B = A1 ∩ A2 ∩ · · · ∩ A n 1.1 Sự kiện Quan hệ kiện MI2020 – KỲ 20192 – TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy Hình 1.2: Hai kiện xung khắc (d) Sự kiện xung khắc: Hai kiện A B gọi xung khắc với chúng không đồng thời xảy phép thử Như vậy, A B xung khắc A ∩ B = ∅ (e) Sự kiện đối lập: Sự kiện không xảy kiện A gọi kiện đối lập A, ký hiệu A Ac Như A A thỏa mãn tính chất: A ∪ A = S A ∩ A = ∅ Hình 1.3: Sự kiện đối lập (f) Hiệu hai kiện: Hiệu kiện A B, ký hiệu A − B, kiện xảy A xảy B không xảy Trường hợp hay sử dụng kiện hiệu: A = S − A, A = S − A Trường hợp tổng quát, ta biến đổi thành kiện tích sau: A − B = A ∩ B (g) Hệ (nhóm) đầy đủ kiện: Hệ (nhóm) n kiện A1 , A2 , , An gọi hệ (nhóm) đầy đủ kiện định phải xảy kiện sau phép thử Như hệ { A1 , A2 , , An } hệ đầy đủ A ∩ A = ∅, i ̸= j, i j A ∪ A ∪ · · · ∪ A = S 1.1 Sự kiện Quan hệ kiện n MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST (a) Khoảng tin cậy đối xứng ( n −1) s x − t 1− α √ n ( n −1) s x + t 1− α √ n ; (4.34) ( n −1) s Sai số ước lượng ε = t1− α √ Kích thước mẫu suy từ sai số hay độ n xác ước lượng, số tự nhiên n nhỏ thỏa mãn: n≥ ( n −1) t 1− α 2 × s2 (4.35) ε2 (b) Khoảng tin cậy trái −∞ ; ( n −1) s x − t1− α √ ( n −1) s x + t 1− α √ (4.36) (4.37) n (c) Khoảng tin cậy phải ( n −1) n ; +∞ ( n −1) t1− α , t1−α xác định từ bảng phân phối Student với n − bậc tự (Phụ lục 4) Ví dụ 4.7 Theo dõi mức xăng hao phí (X) cho loại tơ từ A đến B thu bảng số liệu sau: Mức xăng hao phí (lít) 19-19,5 19,5-20,0 20,0-20,5 20,5-21,0 Số lần 10 Với độ tin cậy − α = 95% tính mức xăng hao phí trung bình tối thiểu từ A đến B biết X tuân theo luật phân phối chuẩn Lời giải Ví dụ 4.7 Gọi X lượng xăng hao phí loại tơ đoạn đường AB, X ∼ N (µ, σ2 ) với phương sai σ2 chưa biết Mức xăng hao phí trung bình E( X ) = µ chưa biết, cần ước lượng Bước 1: Vì phương sai chưa biết n = 25 < 30, chọn thống kê T = có phân phối Student với n − bậc tự Bước 2: Sử dụng khoảng tin cậy phải cho E( X ) = µ: ( n −1) s x − t1− α √ ; n ( n −1) t1−α +∞ X − µ√ n Thống kê T S (24) = t0,95 = 1, 711 xác định từ bảng phân phối Student (Phụ lục 4) 4.3 Phương pháp ước lượng khoảng tin cậy 116 MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Bước 3: Từ số liệu đầu bài, tính n = 25, x = 20, 07, s = 0, 45 Suy khoảng tin cậy 0, 45 phải µ 20, 07 1, 711 ì < < +∞ hay (19, 92 < µ < +∞) 25 Bước 4: Kết luận mức xăng hao phí trung bình tối thiểu từ A đến B 19,92 lít với độ tin cậy 95% Trường hợp chưa biết phương sai, cỡ mẫu n ≥ 30 Khi n ≥ 30 thống kê T (4.33) có phân phối tiệm cận chuẩn tắc N (0, 1) Hay thống kê X − µ√ n ∼ N (0, 1) S U= (4.38) Do đó, (a) Khoảng tin cậy đối xứng s x − u1− α2 √ n s x + u1− α2 √ n ; (4.39) s Sai số ước lượng ε = u1− α2 √ Kích thước mẫu suy từ sai số hay độ n xác ước lượng, số tự nhiên n nhỏ thỏa mãn: n≥ u1− α2 2 × s2 (4.40) ε2 (b) Khoảng tin cậy trái −∞ ; s x − u 1− α √ n (4.41) (4.42) s x + u 1− α √ n (c) Khoảng tin cậy phải ; +∞ Ví dụ 4.8 Để ước lượng trọng lượng trung bình loại trái A vùng, người ta thu hoạch ngẫu nhiên 100 trái A vùng thu kết sau Trọng lượng (gam) 40-42 42-44 44-46 46-48 48-50 50-52 Số trái 13 25 35 15 Hãy ước lượng trọng lượng trung bình loại trái A vùng khoảng tin cậy đối xứng với độ tin cậy 95% Cho biết trọng lượng loại trái A biến ngẫu nhiên tuân theo luật phân phối chuẩn 4.3 Phương pháp ước lượng khoảng tin cậy 117 MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Lời giải Ví dụ 4.8 Gọi X trọng lượng loại trái A, X ∼ N (µ, σ2 ) với phương sai σ2 chưa biết Trọng lượng trung bình loại trái A E( X ) = µ chưa biết, cần ước lượng X − µ√ n Vì n = 100 > 30 nên thống kê U ∼ N (0, 1) S ! s s Bước 2: Khoảng tin cậy đối xứng cho E( X ) = µ x − u1− α2 √ ; x + u1− α2 √ đó, n n với α = 0, 05, u1− α2 = u0,975 = 1, 96 tra từ bảng giá trị hàm phân phối chuẩn tắc Bước 1: Chọn thống kê U = (Phụ lục 3) Bước 3: Từ số liệu cho tính n = 100, x = 46, 06, s = 2, 48.Suy khoảng tin cậy đối 2, 48 2, 48 xứng µ 46, 06 − 1, 96 × √ ; 46, 06 + 1, 96 × √ hay (45, 573 ; 46, 546) 100 100 Bước 4: Kết luận, với độ tin cậy 95%, trọng lượng trung bình loại trái A vùng từ 45,573 gam đến 46,546 gam 4.3.2 Ước lượng khoảng cho tỷ lệ Bài toán 4.2 Xác suất xảy kiện A p Do p nên người ta thực n phép thử độc lập, điều kiện, có m phép thử xảy A Khi tần suất xuất A f = m/n ước lượng điểm không chệch cho p Với độ tin cậy γ = − α ước lượng khoảng cho p Phương pháp tiến hành Bước Chọn thống kê Z = p f−p √ n Theo Mục 4.1.6, Z có phân phối chuẩn tắc N (0; 1) p (1 − p ) Trong trường hợp n lớn ta dùng f để thay cho p Khi đó, Z=p f−p √ n ∼ N (0; 1) f (1 − f ) (4.43) Bước 2: Khi có mẫu cụ thể Wx = ( x1 , x2 , , xn ), ta tính giá trị cụ thể f suy khoảng ước lượng cho p với độ tin cậy γ = − α là: f − u 1− α2 f (1 − f ) n ; f + u 1− α1 f (1 − f ) n (4.44) với α = α1 + α2 Các trường hợp ước lượng hay dùng: 4.3 Phương pháp ước lượng khoảng tin cậy 118 MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST (a) Khoảng tin cậy đối xứng f − u1− α2 f (1 − f ) n ; f + u1− α2 f (1 − f ) n (4.45) … f (1 − f ) Với độ tin cậy γ = − α độ n xác ε cho trước kích thước mẫu cần thiết số tự nhiên n nhỏ thỏa mãn: Độ xác ước lượng ε = u1− α2 n≥ u1− α2 2 × f × (1 − f ) (4.46) ε20 (b) Khoảng tin cậy trái −∞ ; f + u 1− α f (1 − f ) n (4.47) (4.48) (c) Khoảng tin cậy phải f − u 1− α f (1 − f ) n ; +∞ Chú ý 4.3 (a) Do tỷ lệ nhận giá trị từ đến nên ta thay giá trị −∞ +∞ khoảng tin cậy trái (phải) (b) Các khoảng tin cậy xây dựng kích thước mẫu n đủ lớn thỏa mãn n f ≥ n(1 − f ) ≥ Ví dụ 4.9 Điều tra nhu cầu tiêu dùng loại hàng A 100 hộ gia đình khu dân cư B thấy 60 hộ gia đình có nhu cầu loại hàng Với độ tin cậy − α = 95% tìm khoảng tin cậy đối xứng tỷ lệ hộ gia đình có nhu cầu loại hàng Lời giải Ví dụ 4.9 Gọi p tỷ lệ hộ gia đình khu dân cư B có nhu cầu mặt hàng A Kiểm tra điều kiện n f = 100 × 0, = 60 > n(1 − f ) = 100 × 0, = 40 > Bước 1: Chọn thống kê Z = p f−p √ n Thống kê Z ∼ N (0, 1) f (1 − f ) Bước 2: Khoảng tin cậy đối xứng xác suất p f (1 − f ) f (1 − f ) ; f + u1− α2 f − u1− α2 n n u1− α2 = u0,975 = 1, 96 tra từ bảng giá trị hàm phân phối chuẩn tắc (Phụ lục 3) 4.3 Phương pháp ước lượng khoảng tin cậy 119 MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST m = 0, 6, suy khoảng tin cậy đối xứng p n … … 0, × 0, 0, × 0, 0, − 1, 96 ; 0, − 1, 96 = (0, 504 ; 0, 696) 100 100 Bước 3: Với n = 100, m = 60, f = Bước 4: Kết luận, tỷ lệ hộ gia đình khu dân cư B có nhu cầu loại hàng A từ 50,4% đến 69,6% với độ tin cậy 95% 4.3 Phương pháp ước lượng khoảng tin cậy 120 Chương Kiểm định giả thuyết thống kê TUẦN 13 Một dạng khác quy nạp thống kê kiểm định giả thuyết thống kê Đây phương pháp quan trọng cho phép giải nhiều toán thực tế Nội dung kiểm định giả thuyết thống kê dựa vào mẫu cụ thể quy tắc hay thủ tục định dẫn đến bác bỏ hay chấp nhận giả thuyết tổng thể 5.1 Các khái niệm Thông thường ta nghiên cứu biến ngẫu nhiên trường hợp thông tin không đầy đủ, thể nhiều mặt Cụ thể là: Chưa biết xác tham số θ, quy luật phân phối xác xuất biến ngẫu nhiên X, có sở để nêu lên giả thuyết, chẳng hạn θ = θ0 (θ0 biết), X tuân theo quy luật phân phối chuẩn Khi nghiên cứu hai hay nhiều biến ngẫu nhiên, vấn đề cần quan tâm là: biến ngẫu nhiên độc lập với hay có phụ thuộc tương quan? Hơn nữa, tham số chúng có hay không? Những câu hỏi thường chưa trả lời khẳng định mà nêu lên giả thuyết 5.1.1 Giả thuyết thống kê Giả thuyết thống kê giả thuyết biến ngẫu nhiên gốc tổng thể, bao gồm: dạng phân phối xác suất, đặc trưng tham số biến ngẫu nhiên gốc giả thuyết độc lập biến ngẫu nhiên gốc 121 MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Giả thuyết thống kê Kiểm định giả thuyết thống kê Bất kỳ giả thuyết nói tham số, dạng quy luật phân phối xác suất hay tính độc lập biến ngẫu nhiên, gọi giả thuyết thống kê Việc tìm kết luận tính thừa nhận hay khơng thừa nhận giả thuyết gọi kiểm định giả thuyết thống kê Trong khn khổ chương trình, ta đề cập đến giả thuyết tham số biến ngẫu nhiên Giả thuyết Giả thuyết đối Giả sử cần nghiên cứu tham số θ biến ngẫu nhiên X có sở để nêu lên giả thuyết θ = θ0 Giả thuyết ký hiệu H0 , gọi giả thuyết cần kiểm định hay giả thuyết hay giả thuyết không (null hypothesis) Mệnh đề đối lập với giả thuyết H0 ký hiệu H1 , gọi đối thuyết (alternative hypothesis) Dạng tổng quát H1 θ 6= θ0 Trong nhiều trường hợp giả thuyết đối phát biểu cụ thể H1 : θ > θ0 H1 : θ < θ0 Như vậy, giả thuyết hay giả thuyết đối thường phát biểu thành cặp: Giả thuyết H0 θ = θ0 θ = θ0 θ = θ0 Đối thuyết H1 θ = θ0 θ > θ0 θ < θ0 Nhiệm vụ lý thuyết kiểm định giả thuyết thống kê kiểm tra thực nghiệm, thông qua mẫu cụ thể Wx = ( x1 , x2 , , xn ), tính sai giả thuyết H0 5.1.2 Tiêu chuẩn kiểm định Mức ý nghĩa Miền bác bỏ Quy tắc kiểm định dựa hai nguyên lý sau: Nguyên lý xác suất nhỏ: "Nếu kiện có xác nhỏ phép thử kiện coi không xảy ra" Phương pháp phản chứng: "Để bác bỏ A ta giả sử A đúng; A dẫn đến điều vơ lý bác bỏ A" Dựa vào hai nguyên lý ta đưa phương pháp chung để kiểm định giả thuyết thống kê sau Cơ sở lập luận: Giả sử giả thuyết H0 Trên sở xây dựng kiện A đó, cho xác suất xảy A α bé đến mức sử dụng nguyên lý xác suất nhỏ, tức coi A không xảy phép thử kiện Thực phép thử kiện A: 5.1 Các khái niệm 122 MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Nếu A xảy bác bỏ giả thuyết H0 ; Nếu A khơng xảy chưa có sở để bác bỏ H0 Các bước tiến hành: Bước Từ biến ngẫu nhiên X, lập mẫu ngẫu nhiên WX = ( X1 , X2 , , Xn ) cỡ n chọn thống kê G ( X, θ ) = f ( X1 , X2 , , Xn , θ ) (5.1) cho H0 quy luật phân phối xác suất G hoàn toàn xác định Thống kê G gọi tiêu chuẩn kiểm định Bước Tìm miền Wα cho P( G ∈ Wα ) = α (với giả thuyết H0 đúng), tức P( G ∈ Wα | H0 ) = α (5.2) Vì α nhỏ, nên theo nguyên lý xác suất nhỏ coi G không nhận giá trị miền Wα phép thử Bước Thực phép thử mẫu ngẫu nhiên WX ta thu mẫu cụ thể Wx = ( x1 , x2 , , xn ) tính giá trị cụ thể tiêu chuẩn kiểm định G (5.1), gọi giá trị quan sát, ký hiệu g hay gqs Bước Xét xem giá trị quan sát g có thuộc miền Wα hay khơng để kết luận (a) Nếu g ∈ Wα bác bỏ H0 thừa nhận H1 (b) Nếu g ∈ / Wα chưa có sở để bác bỏ H0 Xác suất α gọi mức ý nghĩa tiêu chuẩn kiểm định (thông thường yêu cầu α ≤ 0, 05) Miền Wα gọi miền bác bỏ giả thuyết H0 với mức ý nghĩa α P( G ∈ Wα | H0 = α) Chú ý 5.1 Cùng mức ý nghĩa α tiêu chuẩn kiểm định G có vơ số miền bác bỏ giả thuyết H0 5.1.3 Sai lầm loại I Sai lầm loại II Sai lầm loại I: Bác bỏ giả thuyết H0 H0 Xác suất mắc sai lầm α: P( G ∈ Wα | H0 ) = α Sai lầm loại phát sinh kích thước mẫu nhỏ, phương pháp lấy mẫu Sai lầm loại 2: Thừa nhận H0 H0 sai, hay giá trị quan sát g không thuộc miền bác bỏ Wα H1 Xác suất mắc sai lầm loại II β = P( G ∈ / Wα | H1 ) = − P( G ∈ Wα | H1 ) 5.1 Các khái niệm (5.3) 123 MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Suy xác suất bác bỏ giả thuyết H0 sai P( G ∈ Wα | H1 ) = − β Xác suất gọi hiệu lực kiểm định, xác suất "khơng mắc sai lầm loại II" Các tình xảy kiểm định giả thuyết thống kê tóm tắt bảng ❳❳❳ ❳❳❳ ❳❳❳ Thực tế ❳❳❳ Quyết định ❳❳❳ H0 H0 sai Bác bỏ H0 Sai lầm loại I Quyết định Xác suất α Xác suất − β Quyết định Sai lầm loại II Xác suất − α Xác suất β Không bác bỏ H0 Bảng 5.1: Các tình xảy kiểm định giả thuyết thống kê Mục tiêu phải cực tiểu hai sai lầm Tuy nhiên, điều khó thực Người ta tìm cách cố định sai lầm loại I cực tiểu sai lầm loại II Lựa chọn miền bác bỏ để xác suất mắc sai lầm loại bé nhất: Khi kiểm định giả thuyết thống kê, mức ý nghĩa α chọn, cỡ mẫu n xác định, vấn đề cịn lại vơ số miền bác bỏ, ta chọn miền Wα cho xác suất mắc sai lầm loại II nhỏ hay hiệu lực kiểm định lớn Định lý Neymann–Pearson nhiều tốn quan trọng thực tiễn tìm miền bác bỏ Wα thỏa mãn yêu cầu trên, nghĩa P( G ∈ Wα | H0 ) = α P( G ∈ Wα | H1 ) = − β → max (5.4) Trong thực hành, quy tắc xây dựng có miền bác bỏ thỏa mãn tính chất 5.1.4 Thủ tục kiểm định giả thuyết thống kê Qua nội dung trình bày ta xây dựng thủ tục kiểm định giả thuyết thống kê bao gồm: Phát biểu giả thuyết H0 đối thuyết H1 Từ tổng thể nghiên cứu lập mẫu ngẫu nhiên kích thước n Chọn tiêu chuẩn kiểm định G xác định quy luật phân phối xác suất G với điều kiện giả thuyết H0 Với mức ý nghĩa α, xác định miền bác bỏ giả thuyết H0 (ký hiệu Wα ) tốt tùy thuộc vào đối thuyết H1 Từ mẫu cụ thể tính giá trị quan sát gqs tiêu chuẩn kiểm định So sánh giá trị quan sát gqs tiêu chuẩn kiểm định với miền bác bỏ Wα kết luận 5.1 Các khái niệm 124 MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST 5.2 Kiểm định giả thuyết kỳ vọng biến ngẫu nhiên có phân phối chuẩn Bài toán 5.1 Giả sử biến ngẫu nhiên gốc X tổng thể có phân phối chuẩn N (µ, σ2 ), E( X ) = µ chưa biết có sở để nêu lên giả thuyết H0 : µ = µ0 với µ0 tham số biết Hãy kiểm định giả thuyết với thuyết đối H1 : µ 6= µ0 µ > µ0 µ < µ0 Tiêu chuẩn kiểm định miền bác bỏ giả thuyết H0 phụ thuộc trường hợp sau 5.2.1 Trường hợp biết phương sai Giả sử phương sai σ2 biến ngẫu nhiên gốc X tổng thể có phân bố chuẩn N (µ, σ2 ) biết Từ tổng thể rút mẫu ngẫu nhiên WX = ( X1 , X2 , , Xn ) kích thước n Bước Chọn tiêu chuẩn kiểm định: U= X − µ√ n σ (5.5) U= X − µ0 √ n σ (5.6) Nếu giả thuyết H0 Theo (4.19) thống kê U có phân phối chuẩn tắc N (0; 1) Bước Xây dựng miền bác bỏ Wα phụ thuộc vào thuyết đối H1 (a) H0 : µ = à0 , H1 : 6= à0 (biòtoỏn kim định hai phía) ™ Với mức ý nghĩa α cho trước, giả thuyết H0 bị bác bỏ P |U | > u1−α/2 (µ = µ0 ) = α, u1−α/2 xác định từ hệ thức Φ(u1−α/2 ) = − α/2 Do đó, miền bác bỏ giả thuyết H0 Wα = (−∞; −u1−α/2 ) ∪ (u1−α/2 ; +∞) (b) H0 : µ = µ0 , H1 : > à0 (biòtoỏn kim nh mt phớa) Vi mức ý nghĩa α cho trước, ta ™ ... sinh viên học giỏi môn Xác suất thống kê Lời giải: Gọi A kiện "nhóm có sinh viên học giỏi mơn Xác suất thống kê" ; Ai kiện "nhóm i có sinh viên học giỏi môn Xác suất thống kê" , i = 1, , Khi... nghĩa thống kê xác suất 18 1.3.5 Nguyên lý xác suất nhỏ, nguyên lý xác suất lớn 19 Công thức cộng nhân xác suất 20 1.4.1 Xác suất. .. toán xác suất, 20 sinh viên giỏi ngoại ngữ lẫn toán xác suất Chọn ngẫu nhiên sinh viên lớp Tìm xác suất để sinh viên giỏi môn 1.4 Công thức cộng nhân xác suất 23 MI2020 – KỲ 20192 – TÓM TẮT BÀI GIẢNG