Bài giảng toán 5 xác suất và thống kê

133 133 0
Bài giảng toán 5 xác suất và thống kê

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

NGUYỄN VĂN ĐẮC BÀI GIẢNG TOÁN XÁC SUẤT & THỐNG KÊ 1|Page Giới thiệu môn học Lý thuyết xác suất vào nửa cuối kỷ thứ 17 nước Pháp, phận tốn học nghiên cứu quy luật tượng ngẫu nhiên Hơn 300 năm tồn phát triển, đến lý thuyết có nội dung vơ phong phú, áp dụng nhiều ngành khoa học sống đời thường Thống kê toán học(TKTH) khoa học phương pháp toán học để xử lí kết thực nghiệm liệu thống kê nhằm rút kết luận khoa học thực tiễn Để có phán đốn xác, TKTH phải dựa vào lí thuyết xác suất Mục đích mơn học Xác suất & thống kê chương trình đào tạo trường kỹ thuật trang bị cho kỹ sư tương lai khái niệm kết lý thuyết xác suất & thống kê toán học, để giúp người học tiếp thu mơn học có liên quan cách thức thu thập xử lý số liệu q trình cơng tác sau Nội dung gồm chương Chương I Biến cố xác suất biến cố Chương II Biến ngẫu nhiên phân phối xác suất Chương III Kỳ vọng toán Chương IV Một số phân phối xác suất thường gặp Chương V Mẫu ngẫu nhiên phân phối số thống kê Chương VI Ước lượng tham số Chương VII Kiểm định giả thiết Chương VIII Hồi quy tương quan tuyến tính 2|Page Tài liệu tham khảo [1] Ronald E Walpole, Raymond H.Myers Sharon L.Myers, Xác suất thống kê dành cho kỹ sư nhà khoa học(Bản dịch lần Bộ môn ĐS-XS&TK ĐHTL) [2] Morris H DeGroot, Mark J Schervish, Probability and Statistics(Third edition) [3] Đặng Hùng Thắng, Mở đầu lí thuyết xác suất ứng dụng,Nhà XBGD,1997 [4] Trần Mạnh Tuấn, Xác suất & Thống kê lý thuyết thực hành tính tốn, Nhà xuất ĐHQGHN, 2004 3|Page NGUYỄN VĂN ĐẮC BÀI GIẢNG TOÁN TUẦN 4|Page BIẾN CỐ VÀ XÁC SUẤT CỦA BIẾN CỐ 1.1 Phép thử không gian mẫu Ta biết tốn học có khái niệm không định nghĩa, chẳng hạn điểm, đường thẳng, mặt phẳng, tập hợp Phép thử ngẫu nhiên khái niệm kiểu vậy, hành động mà kết khơng thể dự đốn trước gọi chung phép thử ngẫu nhiên, gọi tắt phép thử (do ta không quan tâm đến hành động dự đốn trước kết quả) Tuy khơng đốn kết phép thử ta liệt kê kết Định nghĩa 1.1 Tập hợp gồm tất kết phép thử gọi không gian mẫu(sample space) ký hiệu S  Mỗi phần tử không gian mẫu gọi kết phép thử điểm mẫu Do định nghĩa nên trình bày khơng gian mẫu ta dùng cách trình bày tập hợp Ví dụ 1.1 Tung đồng xu Khơng gian mẫu  ={S, N}, S biểu thị cho kết mặt sấp xuất hiện, N biểu thị cho kết mặt ngửa xuất Ví dụ 1.2 Lấy ngẫu nhiên hai số x, y [0, 2] Không gian mẫu S = { (x, y) | ≤ x ≤ ≤ y ≤ 2} Ví dụ 1.3 Tung xúc xắc Nếu ta quan tâm đến số chấm xuất khơng gian mẫu S1 = {1, 2, 3, 4, 5, 6} Nếu ta quan tâm đến số chẵn chấm hay số lẻ chấm xuất khơng gian mẫu S2 = {C, L} Qua Ví dụ 1.3 ta thấy có nhiều khơng gian mẫu để mơ tả kết phép thử, nhiên ta biết kết S1 xuất suy kết S2 xuất hiện, ngược lại khơng Người ta thường dùng khơng gian mẫu “giàu thông tin” để mô tả kết phép thử Trong Ví dụ trên, ta dễ dàng xác định không gian mẫu Đôi ta gặp tình khó khăn Khi dùng sơ đồ để xác định không gian mẫu, Ví dụ sau minh họa cho cách Ví dụ 1.4 Tung đồng xu, mặt ngửa xuất ta tung đồng xu lần thứ hai mặt sấp xuất ta tung xúc xắc Hãy xác định không gian mẫu? 5|Page Sơ đồ cho kết phép thử Tung lần Tung lần N Điểm mẫu NN N S S NS S1 S2 S3 S4 S5 S6 Như không gian mẫu S = {NN, NS, S 1, S 2, S 3, S 4, S 5, S 6} 1.2 Biến cố phép toán biến cố Với phép thử cụ thể, ta quan tâm đến kiện gồm kết Chẳng hạn, trò chơi may rủi sau: Gieo hai đồng xu, hai mặt ngửa xuất người chơi 5000 đồng ngược lại người chơi 1000 đồng Lúc này, không gian mẫu  ={SS, NN, SN, NS} Sự kiện mà ta quan tâm gồm “hai mặt ngửa xuất hiện” = {NN} “không có hai mặt ngửa xuất hiện” ={NN, SN, NS} Mỗi kiện đồng với tập không gian mẫu, người ta gọi biến cố Tổng quát, ta có định nghĩa sau Định nghĩa 1.2 Mỗi tập không gian mẫu gọi biến cố Dùng chữ in hoa A, B, C, A1, A2,… để ký hiệu cho biến cố Đặc biệt, kiện không xảy thực phép thử đồng với tập rỗng nên ký hiệu  gọi biến cố khơng, cịn kiện chắn xảy thực phép thử ký hiệu S gọi biến cố chắn Mỗi điểm mẫu biến cố, gọi biến cố sơ cấp Trong lý thuyết tập hợp ta biết khái niệm tập con, hai tập hợp nhau, phần bù phép toán hợp hai tập, giao hai tập Tương ứng , ta có khái niệm phép toán biến cố lý thuyết xác suất sau Định nghĩa 1.3 Cho A B hai biến cố phép thử với không gian mẫu S + A  B ta nói biến cố A kéo theo biến cố B + A = B ta nói A tương đương với B + Phần bù A S gọi biến cố đối A, ký hiệu A’ 6|Page + Hợp A B, ký hiệu A  B A+B, biến cố gồm điểm mẫu thuộc A thuộc B Tương tự, ta định nghĩa hợp nhiều biến cố + Giao A B, ký hiệu A  B AB, biến cố gồm điểm mẫu thuộc A B Đặc biệt, A  B = , ta gọi A B hai biến cố xung khắc Tương tự, ta định nghĩa giao nhiều biến cố Ví dụ 1.5 Gieo đồng xu hai lần Không gian mẫu  = {SS, SN, NS, NN} Đặt A = {SS, SN, NS}, B = {NN}, C = {SN, NS, NN} a) Biến cố kéo theo biến cố nào? Biến cố tương đương với biến cố “có lần xuất mặt ngửa”? b) Tìm biến cố đối B? c) Hãy phát biểu lời biến cố giao A B Hai biến cố A B có xung khắc? d) Xác định biến cố A  B Giải a) Vì B  C nên B kéo theo C b) Do  \B = A nên biến cố B’ = A c) A  B ={SN, NS} = “một lần xấp lần ngửa xuất hiện” Vì A  B ≠  nên A B không xung khắc d) A  B =  Nhận xét + Biến cố A kéo theo biến cố B tức A xảy B xảy + A = B tức A xảy B xảy + A’ biến cố đối A mà thực phép thử chắn A A’ xảy xảy đồng thời + A  B biến cố xảy A B xảy + A  B biến cố xảy A B xảy Ví dụ 1.6 Ba xạ thủ A, B, C bắn người viên đạn vào mục tiêu Gọi A, B, C biến cố “ xạ thủ A bắn trúng”, “xạ thủ B bắn trúng”, “xạ thủ C bắn trúng” i) Hãy mô tả lời biến cố sau ABC, A’B’C’, A  B  C ii) Xét biến cố sau D = “ Có hai xạ thủ bắn trúng” E = “Có nhiều xạ thủ bắn trúng” F = “Chỉ có xạ thủ bắn trúng” G = “chỉ có xạ thủ C bắn trúng” Hãy biểu diễn biến cố theo biến cố A, B, C 7|Page Giải i) ABC biến cố “cả ba xạ thủ bắn trúng” A’B’C’ biến cố “cả ba xạ thủ bắn trượt” A  B  C biến cố “có xạ thủ bắn trúng” ii) D = AB  BC  CA E = A’B’  B’C’  C’A’ F = AB’C’  A’BC’  A’B’C G=A’B’C Từ định nghĩa ta phép biến cố có tích chất (tương ứng với tính chất phép tốn tập hợp) sau: a) Giao hoán A  B = B  A; AB=BA b) Kết hợp A  B  C = (A  B)  C = A  (B  C ) ABC = (AB)C = A(BC) c) Phân phối A(B  C) = AB  AC A  (BC) = (A  B)(A  C) d) Công thức De Morgan (A  B)’ = A’  B’ (A  B)’=A’  B’ Ngoài (A’)’ = A A  A’=S A  A’ =  I.3 Định nghĩa xác suất biến cố Theo tài liệu lịch sử có lẽ thèm khát khơn ngi người trò cờ bạc dẫn đến đời phát triển lý thuyết xác suất Nhằm làm tăng chiến thắng, bạc nhờ nhà toán học cung cấp chiến lược tốt cho trò chơi may rủi khác Một số nhà toán học cung cấp chiến lược Pascal, Leibniz, Fermat, James Bernuolli, nhà toán học coi người khai sinh lý thuyết xác suất Sự phát triển lý thuyết xác suất thời kỳ đầu với suy diễn thống kê, dự đoán khái qt hố vượt khỏi trò chơi may rủi để bao hàm nhiều lĩnh vực khác có liên quan đến xuất ngẫu nhiên trị, kinh doanh, dự báo thời tiết, nghiên cứu khoa học Như vậy, để đưa dự đốn suy diễn thống kê có sở ta cần phải có hiểu biết lý thuyết xác suất Trong đời sống hàng ngày, ta gặp khẳng định như: “Tơi có 90% hội thi qua môn xác suất thông kê” “Cơ hội chiến thắng chia cho hai đội” “Đội tuyển bóng đá Việt Nam có hội giành chiến thắng trước đội tuyển Brazil”…Trong trường hợp, ta thấy đề cập đến biến cố mà ta khơng chắn có xảy hay không, thông tin từ khứ hiểu biết phép thử mà ta có mức độ tin tưởng vào khả đắn khẳng định Có biến cố thường xun xảy ra, có biến cố xảy ra,…Như vậy, vấn đề đặt phải đo lường mức độ xảy biến cố Con số để đo lường mức độ xảy biến cố gọi xác suất 8|Page Dựa vào đặc điểm không gian mẫu mà người ta đưa định nghĩa xác suất biến cố cho phù hợp  Không gian mẫu gồm đếm điểm mẫu Giả sử không gian mẫu phép thử S = {s1, s2, s3,…} Từ đặc điểm phép thử, ta gán cho điểm mẫu si số thực pi với điều kiện pi  [0; 1] tổng pi 1, gọi pi xác suất si Tổng xác suất điểm mẫu A gọi xác suất A (the probability of A), ký hiệu P(A) Định nghĩa Cho phép thử với không gian mẫu S mà điểm mẫu gán xác suất A biến cố phép thử Ta gọi tổng xác suất điểm mẫu A xác suất A Như ≤ P(A) ≤ P(S) = P() = Ví dụ 1.7 Một xúc xắc đổ chì cho khả xuất mặt chẵn chấm gấp đôi khả xuất mặt lẻ chấm Gieo xúc xắc lần Đặt A = “số chấm xuất nhỏ 4” B = “số chấm xuất chẵn” C = “số chấm xuất chia hết cho 3” a) Tính xác suất biến cố A? b) Tính P(A+B), P(AC)? Giải Không gian mẫu S = { 1, 2, 3, 4, 5, 6} Ta gán cho mặt lẻ chấm xác suất p, theo giả thiết mặt chẵn chấm phải gán cho xác suất 2p ta phải có: 3p + 3(2p) = hay p = 1/9 a) Do A = {1, 2, 3} nên P(A) =    9 9 2 b) Do B = {2, 4, 6} nên A + B = {1, 2, 3, 4, 6}, từ P(A + B) =      9 9 9 Vì C = {3, 6} nên AC ={3}, từ P(AC) = 1/9 Ví dụ 1.8 Gieo đồng xu cân đối hai lần Tính xác suất để lần mặt ngửa xuất hiện? Giải Không gian mẫu phép thử  = {SS, SN, NS, NN} Do đồng xu cân đối nên điểm mẫu không gian có khả xuất nhau, ta gán cho điểm mẫu xác suất p phải thoả mãn 4p = hay p = 1/4 Khi đó, A = “ít lần mặt ngửa xuất hiện” = {SN, NS, NN} 1 P(A) =    4 4 9|Page Ta thường gặp trường hợp không gian biến cố sơ cấp có hữu hạn phần tử đặc điểm phép thử yêu cầu ta phải gán cho điểm mẫu xác suất Từ định nghĩa suy Nếu phép thử có N biến cố sơ cấp đồng khả có n biến cố sơ cấp biến cố A, P(A) = n N Như vậy, để tính biến cố A, trường hợp ta việc: + Đếm số biến cố sơ cấp phép thử + Đếm số biến cố sơ cấp nằm A, biến cố sơ cấp(b.c.s.c) nằm A gọi b.c.s.c thuận lợi cho A Ví dụ 1.9 Một đống kẹo trộn lẫn bạc hà, kẹo bơ, chocolate Nếu người chọn ngẫu nhiên kẹo này, tìm xác suất để (a) bạc hà; b)một kẹo bơ chocolate Giải Đặt M, T C biểu thị biến cố chọn được,tương ứng, bạc hà, kẹo bơ, chocolate Tổng số kẹo 13 đồng khả chọn (a) Do 13 bạc hà, suy P(M) = 13 (b) Do 13 kẹo bơ chocolate, suy P(TC) =  13 Việc đếm số lượng điểm mẫu đơi ta phải dùng “mẹo” , dùng quy tắc cộng, quy tắc nhân, hoán vị, chỉnh hợp, tổ hợp ta học chương trình phổ thông Xin xem thêm phần nhắc lại bổ xung phép đếm cuối Mục Ví dụ 1.10 Rút ngẫu nhiên từ 52 quân, tìm xác suất để Át J Giải  4 4! Số cách lấy từ Át   = = số cách lấy từ J 2!2!  2 Theo quy tắc nhân, có n = (6)(4) = 24 kết có Át J Tổng số trường hợp rút bài, mà tất đồng khả năng,  52  52! N =   = = 2598960   5!47! Do đó, xác suất biến cố C = “rút Át J” 24 P(C) = = 0.910-5  2598960  4 Lưu ý ký hiệu:   trùng với ký hiệu C 43 3 10 | P a g e  4 4!   = =   3!1! Khoảng tin cậy cỡ mẫu lớn cho p Nếu tỷ lệ mẫu cỡ n ̂ = − ̂ , khoảng tin cậy xấp xỉ (1- α)100% cho p / xác định ̂− / > / < < ̂+ = /2 , / Nói chung n nhỏ khơng nên dùng cơng thức Người ta n ̂ n lớn cơng thức cho kết tốt Ví dụ 6.8 Điều tra ngẫu nhiên 500 gia đình có tivi thành phố Hamilton, Canada, thấy có 340 gia đình th bao chương trình HBO Hãy tìm khoảng tin cậy 95% cho tỷ lệ gia đình thuê bao chương trình HBO số gia đình có tivi thành phố Giải Đặt p tỷ lệ cần ước lượng + Ước lượng điểm cho p ̂ = 340/500 = 0.68; = 1.96; +Sử dụng bảng A.3, tìm + Khoảng tin cậy xấp xỉ 95% cho p (0.68)(0.32) < 500 0.68 − 1.96 < 0.68 + 1.96 Thu gọn ta 0.64 < p < 0.72 Tương tự phần ước lượng cho μ, ta thấy tương đương với − / ̂ < | − |< Ta hình dung qua hình vẽ đây: Như vậy, ta có < / + ̂ / ̂ (0.68)(0.32) 500 ≈1− ≈1− Định lý 6.5 Nếu dùng ̂ để làm ước lượng điểm cho p, với độ tin cậy (1 – α)100% ta khẳng định sai số ước lượng không vượt / Một vấn đề đặt là: Khi độ tin cậy (1 – α)100% , muốn sai số ước lượng ̂ cho p không vượt q số cho trước ta phải có cỡ mẫu bao nhiêu? Để trả lời, ta việc giải ̂ / = để tìm n Do n số nguyên nên tìm n từ đẳng thức phải theo nguyên tắc làm tròn đến số nguyên = chưa phải số nguyên Ta / Định lý 6.6 Nếu ̂ dùng làm ước lượng điểm cho p, với độ tin cậy (1- α )100% ta khẳng định sai số nhỏ kích thước mẫu tìm từ đẳng thức = ̂ / Ví dụ 6.9 Tiếp theo Ví dụ 6.8 , với độ tin cậy 95% + Sai số dùng ̂ làm ước lượng điểm cho p bé bao nhiêu? + Muốn sai số khơng vượt q 0.02, cỡ mẫu phải bao nhiêu? Giải + Sai số dùng ̂ làm ước lượng điểm cho p , nhỏ 1.96 ( )( ) = 0.04 + Muốn sai số không vượt 0.02, cỡ mẫu phải = / ̂ = 1.96 (0.68)(0.32) 0.02 , suy = 2090 Như với độ tin cậy 95% muốn có sai số ước lượng cho p ̂ , ta phải có cỡ mẫu tối thiểu 2090 Trong định lý trên, ta dùng đến mẫu cho trước tính ̂ để làm ước lượng điểm cho p dựa vào tìm n Tuy nhiên ta đưa cỡ mẫu phải có để sai số ̂ p không vượt mà không cần đến ̂ Thật vậy, tương đương − / < < + / =1− theo bất đẳng thức Cô-si, ta có / | − |< ≤ =1− / / = √ / √ Nên Định lý 6.7 Khi ̂ dùng làm ước lượng điểm cho p ta khẳng định rằng, với độ tin cậy (1- α )100%: * Sai số ước lượng không vượt * Muốn sai số ước lượng khơng q / √ cho trước ta phải có cỡ mẫu xác định = / Điều đáng ý khẳng định không cần dựa vào mẫu cho trước Số n tìm theo Định lý 6.7 nói chung lớn so với số n tìm theo Định lý 6.6 Ví dụ 6.10 Một nhà nơng học muốn ước lượng tỷ lệ nảy mầm loại hạt giống với độ tin cậy 90% sai số không vượt 0.02 Cần phải lấy mẫu với kích thước bao nhiêu? Giải Cách thứ nhất: Nhà nông học phải lấy mẫu tính tỷ lệ mẫu, giả sử mẫu với kích thước n =1000 thấy có 640 hạt nảy mầm Ta ̂ = 0.64 = 0.1 = ̂ / Từ cỡ mẫu phải lấy n = 1550 Cách thứ hai: = / ( = ( ) ) (0.64)(0.36) 0.02 = 1.64 = 1549.2 = 1681 Suy n = 1681 Người ta thấy rằng, p gần 0.5 hai cách cho kết khơng khác xa lắm, cịn p bé lớn nên sử dụng theo cách thứ 6.4.4 Ước lượng khoảng cho hiệu hai tỷ lệ Đặt vấn đề Xét hai tổng thể Ω1 Ω2, phần tử tổng thể mang dấu hiệu A Đặt p1, p2 tỷ lệ cá thể mang dấu hiệu A hai tổng thể Ω1 Ω2 Hãy tìm khoảng tin cậy (1- α )100% cho hiệu p1 - p2 Giải vấn đề trên, người ta thu kết sau Khoảng tin cậy cho hiệu hai tỷ lệ Nếu ̂ , ̂ hai tỷ lệ mẫu ngẫu nhiên cỡ n1, n2 lấy từ tổng thể Ω1 Ω2, đặt = 1− ̂ = − ̂ , khoảng tin cậy (1- α )100% cho hiệu p1 - p2 ( ̂ − / ̂ )− / ̂ xác định + ̂ > < / − / / , / / / > xác định từ bất đẳng thức / = − /2, = /2 tìm cách tra bảng A.5 với số bậc tự n - Lấy bậc hai vế, ta khoảng tin cậy cho Ví dụ 6.12 Một công ty phân phối loại hạt giống, công ty cho cân thử 10 bao thu khôi lượng bao sau( đơn vị decagrams) 46.4 46.1 45.8 47.0 46.1 45.9 45.8 46.9 45.2 vµ 46.0 Tìm khoảng tin cậy 95% cho phương sai khối lượng bao hạt giống công ty, biết khối lượng bao hạt giống biến ngẫu nhiên có phân phối chuẩn Giải +Trước hết, ta có  n  n∑ x −  ∑ xi   i =1  = 0.286 s = i =1 n(n − 1) + Do = 0.05 n =10, nên tra bảng A.5 với số bậc tự thu = 19.023, = 2.700 + Như vậy, khoảng tin cậy 95% cho (9)(0.286) (9)(0.268) < < 19.023 2.700 Thu gọn 0.135 < < 0.953 n i ĐIỂM LẠI NỘI DUNG LÝ THUYẾT TÍN CHỈ IV Một số dạng phân phối xác suất thường gặp Một số dạng phân phối rời rạc thường gặp: +Phân phối +Phân phối nhị thức đa thức +Phân phối siêu bội +Phân phối nhị thức âm +Phân phối Poisson Một số dạng phân phối xác suất liên tục thường gặp +Phân phối +Phân phối chuẩn +Phân phối mũ phân phối Gamma + Phân phối Khi- bình phương V Mẫu, thống kê phân phối xác suất vài thống kê quan trọng + Mẫu ngẫu nhiên +Thống kê số thống kê quan trọng +Phân phối xác suất số thống kê quan trọng VI Các toán ước lượng mẫu hai mẫu +Ước lượng điểm +Ước lượng khoảng cho kỳ vọng +Ước lượng khoảng cho hiệu hai kỳ vọng +Ước lượng khoảng cho tỷ lệ +Ước lượng khoảng cho hiệu hai tỷ lệ +Ước lượng khoảng cho phương sai biến ngẫu nhiên có luật phân phối chuẩn • Chú ý: Nội dung thi tín có phần covariance, hệ số tương quan ý nghĩa Các ý Bài giảng tuần 10 Ước lượng khoảng cho tỷ lệ, hai tỷ lệ Ước lượng khoảng cho phương sai biến ngẫu nhiên có phân phối chuẩn Điểm lại nội dung tín NGUYỄN VĂN ĐẮC BÀI GIẢNG TOÁN TUẦN 11 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 7.1 Các khái niệm chung Giả thuyết thống kê Chương giúp biết cách ước lượng tham số tổng thể mà ta chưa biết Trong thực tế, ta phải đối mặt với việc phải chấp nhận bác bỏ khẳng định tổng thể, chẳng hạn với tư cách nhà quản lý thị trường bảo vệ người tiêu dùng bạn phải có trách nhiệm kiểm sốt tính hợp lý đoạn quảng cáo: “Lốp xe máy công ty Y sản xuất trung bình chạy 20 000km”, phải làm nào? Chương giúp bạn cách để giải vấn đề đặt Trước tiên ta đưa khái niệm mà đoạn quảng cáo nói trường hợp riêng: Định nghĩa 7.1 Giả thuyết thống kê (gọi tắt giả thuyết) khẳng định đoán nhiều tổng thể Như ta biết, nói đến tổng thể nghĩa ta quan tâm đến biến ngẫu nhiên đo đặc tính chung cá thể tổng thể Ở đây, khẳng định đốn tổng thể khẳng định hay đoán biến ngẫu nhiên mà ta quan tâm Ví dụ 7.1 Giả sử X chiều cao người trưởng thành Việt Nam, Y chiều cao người trưởng thành Thái Lan Mỗi khẳng định sau giả thuyết thống kê: + E(X) = 1.65; + E(X) = E(Y); + X có phân phối chuẩn Ta thường đối mặt với tình là: Tính sai giả thuyết thống kê chưa biết Khơng thể khảo sát tồn cá thể tổng thể Phải đưa định chấp nhận hay bác bỏ giả thuyết Khi giải tình trên, bác bỏ giả thuyết đồng nghĩa với việc ta chấp nhận khẳng định khác với giả thuyết – gọi đối thuyết Để tiện việc tiến hành giải vấn đề người ta ký hiệu giả thuyết H0 thường khẳng định giá trị xác định tham số, đối thuyết ký hiệu H1 Chẳng hạn, H0: μ = 1.65 cịn H1 khẳng định sau: μ > 1.65, μ < 1.65, μ ≠ 1.65 Khi ta có H1: μ ≠ 1.65, giả thuyết thống kê thường viết dạng: H0: μ = 1.65 H1: μ ≠ 1.65 Một thủ tục mà dựa vào thông tin từ mẫu ta đưa chứng để định chấp nhận bác bỏ giả thuyết thống kê, gọi thủ tục kiểm định giả thuyết kiểm định thống kê Kiểm định giả thuyết thống kê Để hiểu khái niệm tổng quát, xét ví dụ sau: Giả sử ta quan tâm đến chiều cao trung bình người trưởng thành Việt Nam phải định chấp nhận bác bỏ giả thuyết H0: μ = 1.65 H1: μ ≠ 1.65 Lấy ngẫu nhiên người (đây ví dụ, thực tế muốn có kết tốt phải lấy cỡ mẫu lớn) đo chiều cao ta giá trị X , ước lượng cho μ Nếu X nhận giá trị gần với số 1.65 chứng cho thấy nên chấp nhận H0, ngược lại X nhận giá trị xa giá trị trung bình nên bác bỏ H0 Trong tình này, thống kê X gọi tiêu kiểm định Nói chung tiêu kiểm định thống kê Tập giá trị tiêu kiểm định chia thành hai phần Nếu giá trị cụ thể tiêu kiểm định thu từ mẫu cụ thể rơi vào phần từ ta chấp nhận giả thuyết phần gọi miền chấp nhận giả thuyết phần lại gọi miền bác bỏ giả thuyết, số nằm miền chấp nhận bác bỏ gọi giá trị tới hạn Chẳng hạn, tình chọn 1.60 < X < 1.70 ta chấp nhận giả thuyết, cịn ngược lại bác bỏ giả thuyết Ta có: miền chấp nhận giả thuyết (1.60, 1.70), miền bác bỏ (- ∞, 1.60]∪[1.70, +∞), giá trị tới hạn 1.60 1.70 Khi đưa định chấp nhận hay bác bỏ giả thuyết định ta mắc hai sai lầm Chẳng hạn, thực μ = 1.65, X lại nhận giá trị miền bác bỏ nghĩa ta bác bỏ giả thuyết Ta mắc phải sai lầm chỗ: Giả thuyết lại bác bỏ, sai lầm kiểu gọi sai lầm loại I Hoặc là, μ thực khác 1.65 X lại nhận giá trị miền chấp nhận giả thuyế Ta mắc sai lầm chỗ: Giả thuyết sai lại chấp nhận, sai lầm kiểu gọi sai lầm loại II Tổng quát, có Định nghĩa 7.2 Bác bỏ giả thuyết giả thuyết gọi sai lầm loại I Chấp nhận giả thuyết giả thuyết sai gọi sai lầm loại II Bất kỳ tốn kiểm định kết luận ta rơi vào tình sau: H Chấp nhận H Bác bỏ H0 H sai Quyết định Sai lầm loại II Sai lầm loại I Quyết định Trong ví dụ trên, ta tính xác suất mắc sai lầm loại I biết = 0.75 Thật vậy, P(Mắc sai lầm loại I) = P( X < 1.60 μ = 1.65) + P( X > 1.70 μ = 1.65) = P(Z < -2.0) + P(Z > 2.0) = 0.0228 + 0.0228 = 0.0456 Điều nghĩa 4.56% mẫu ngẫu nhiên dẫn đến bác bỏ giả thuyết giả thuyết Xác suất mắc sai lầm loại I ký hiệu α gọi mức ý nghĩa Xác suất mắc sai lầm loại II ký hiệu β, tức β = P(mắc sai lầm loại II) = P(Chấp nhận H0 H0 sai) Ta thấy 1- β xác suất bác bỏ H0 H0 sai, 1- β gọi lực lượng kiểm định Việc tính β khơng dễ dàng Một kiểm định lí tưởng kiểm định cực tiểu hóa xác suất mắc hai loại sai lầm nói Đáng tiếc khơng có kiểm định vậy, người ta với cỡ mẫu cố định giảm α giá trị β lại tăng ngược lại Trong đa phần trường hợp thường gặp việc mắc sai lầm loại I khơng đáng ngại so với sai lầm loại II, giống việc từ chối dùng loại thuốc đáng chữa khỏi bệnh khơng đáng ngại việc dùng nhầm thuốc dùng nhầm thuốc dễ dẫn đến tử vong Do đó, người ta chấp nhận mắc sai lầm loại I với xác suất α cố định để từ tìm cách cực tiểu hóa sai lầm loại II Các kiểm định trình bày chương chứng minh chặt chẽ mặt toán học kiểm định đạt yêu cầu đặt Kiểm định phía kiểm định hai phía Kiểm định giả thuyết mà đối thuyết có dạng phía sau: H : θ = θ0 H1 : θ > θ0 H : θ = θ0 H1 : θ < θ0 gọi kiểm định phía Với đối thuyết H1 : θ > θ0 miền bác bỏ giả thuyết(cũng miền chấp nhận đối thuyết) nằm phía phải phân phối xác suất tiêu kiểm định Với H1 : θ < θ0 miền bác bỏ giả thuyết nằm đuôi bên trái phân phối xác suất tiêu kiểm định Việc kiểm định giả thuyết với đối thuyết hai phía sau: H : θ = θ0 H1 : θ ≠ θ0 gọi kiểm định hai phía Do ≠ nghĩa > < nên miền bác bỏ giả thuyết chia thành hai phần nằm hai phía phân phối xác suất tiêu kiểm định có xác suất Giả thuyết H phát biểu dấu bằng, nhằm giá trị đơn lẻ Theo cách này, xác suất mắc sai lầm loại I điều khiển Việc đặt tốn phía hay hai phía phụ thuộc vào kết luận đưa H bị bác bỏ Vị trí miền bác bỏ xác định H1 phát biểu Ví dụ, kiểm định loại thuốc mới, ta đặt giả thuyết khơng tốt loại thuốc có thị trường kiểm định với đối thuyết loại thuốc tốt Đây kiểm định phía với miền tiêu chuẩn đuôi bên phải Tuy nhiên, ta muốn so sánh công nghệ dạy học với cách dạy theo lớp thơng thường, đối thuyết chấp nhận phương pháp hơn, tốt phương pháp thơng thường Do đó, kiểm định hai phía với miền tiêu chuẩn chia thành hai phần nằm đuôi bên trái phải phân phối tiêu kiểm định Tất nhiên, điều đáng mong muốn xác định rõ xem giả thuyết nên trình bày H giả thuyết nên trình bày H1 Đầu tiên, đọc kỹ toán xác định yêu cầu cần kiểm định Nếu yêu cầu đề cập tới hướng đơn lớn hơn, nhỏ hơn, tốt hơn, hơn,…… H1 phát biểu qua dấu bất đẳng thức ( > < ) Ví dụ, kiểm định loại thuốc mới, ta muốn đưa chứng cớ 30% bệnh nhân chữa khỏi, ta viết H1 : p > 0,3 giả thuyết viết H0 : p = 0,3 Nếu yêu cầu đề cập tới hướng kép nhất, lớn hơn, nhiều nhất, khơng nhiều hơn,… dấu kép ( ≤ ≥ ) biểu diễn cho H , sử dụng dấu bằng, H1 cho theo dấu ngược lại Cuối cùng, không hướng nói tới u cầu, H1 phát biểu qua dấu khơng ( ≠) Ví dụ 7.2 Một hãng sản xuất loại ngũ cốc khẳng định lượng chất béo trung bình ngũ cốc khơng vượt 1,5 miligam Phát biểu giả thuyết đối thuyết dùng kiểm định yêu cầu xác định vị trí miền bác bỏ giả thuyết Giải Khẳng định nhà sản xuất bị bác bỏ µ lớn 1,5 miligam chấp nhận µ nhỏ 1,5 miligam Từ việc giả thuyết rõ giá trị cụ thể H : µ = 1,5 tham số, ta kiểm định: H1 : µ > 1,5 Mặc dù ta phát biểu giả thuyết với dấu bằng, cần hiểu bao gồm giá trị khơng nhắc tới đối thuyết Do vậy, việc chấp nhận H khơng có nghĩa xác µ = 1, ; phần có nghĩa ta không đủ chứng để chấp nhận H1 Ta có tốn kiểm định phía, dấu lớn cho thấy miền bác bỏ giả thuyết nằm hoàn tồn bên phải phân phối tiêu kiểm định Ví dụ 7.3 Một đại lý nhà đất khẳng định 60% số nhà riêng xây dựng ngày có phịng ngủ Để kiểm tra khẳng định này, lượng lớn nhà xây dựng kiểm tra, tỉ lệ nhà có phòng ngủ ghi lại sử dụng tiêu kiểm định ta Phát biểu giả thuyết đối thuyết kiểm định, xác định vị trí miền bác bỏ giả thuyết Giải Nếu tiêu kiểm định thực chất cao thấp p = 0,6 ta bác bỏ khẳng định đại lý Do ta đặt giả thuyết: H : p = 0,6 H1 : p ≠ 0,6 Đối thuyết cho thấy toán kiểm định hai phía, với miền bác bỏ giả thuyết nằm hai đuôi phân phối - thống kê tiêu kiểm định mà ta chọn Trong khn khổ có hạn chương trình, ta tập trung vào kiểm định hai phía Phần kiểm định phía coi đọc thêm Thủ tục tổng quát để kiểm định giả thuyết Xác định tham số cần quan tâm, từ phát biểu giả thuyết đối thuyết Chọn mức ý nghĩa α(Xác suất mắc sai lầm loại I) Chọn tiêu kiểm định Xác định miền bác bỏ giả thuyết Tính giá trị tiêu kiểm định dựa vào mẫu quan sát Quyết định: Bác bỏ chấp nhận giả thuyết tùy thuộc vào việc giá trị tiêu kiểm định nằm miền bác bỏ hay chấp nhận giả thuyết 7.2 Kiểm định giả thuyết giá trị trung bình Xét tổng thể với X biến ngẫu nhiên có kỳ vọng phương sai ký hiệu , Ta muốn kiểm định giả thuyết H0: H1: Trường hợp biết = ≠ + Chọn mức ý nghĩa α + Chỉ tiêu kiểm định Z = X − µ0 σ/ n + Từ đối thuyết H1, ta chọn miền bác bỏ hai phía Ta có   X − µ0 P − zα / < < zα /  = − α σ/ n   với giả thuyết H0 Z có phân phối tiệm cận tiêu chuẩn nên từ mức ý nghĩa α, tra bảng A.3 ta giá trị tới hạn − zα / , zα / Từ đó, miền bác bỏ giả thuyết (−∞,− zα / ] ∪ [ zα / ,+∞) + Từ mẫu quan sát được, tính giá trị Z đưa định Chú ý: Ở ta sử dụng định lý giới hạn trung tâm nên tổng thể có phân phối chuẩn cỡ mẫu khơng quan trọng, tổng thể khơng có phân phối chuẩn cỡ mẫu phải đủ lớn Ví dụ 7.4 Một nhà sản xuất dụng cụ thể thao đưa loại dây câu mới, họ khẳng định khối lượng trung bình dây chịu kg, với độ lệch chuẩn 0,5 kg Để kiểm định giả thuyết µ = kg với đối thuyết µ ≠ kg, 50 dây ngẫu nhiên kiểm tra khối lượng trung bình dây chịu 7,8 kg Hãy kiểm định khẳng định nhà sản xuất với mức ý nghĩa 0,01 Giải H : µ = kg H1 : µ ≠ kg α = 0,01 Chỉ tiêu kiểm định Z = X − µ0 σ/ n Miền bác bỏ: z < −2,575 z > 2,575 với z = Tính tốn: x = ,8 kg, σ = 0,5 kg, z = x − µ0 σ/ n 7,8 − = −2,83 0,5 50 Kết luận: Bác bỏ H kết luận trọng lượng trung bình dây chịu khác 8kg, thực tế nhỏ kg Trường hợp chưa biết + Chọn mức ý nghĩa α , ta phải có phân phối tổng thể phân phối chuẩn + Chỉ tiêu kiểm định T = X − µ0 S/ n + Với giả thuyết đúng, T có phân phối Student với n-1 bậc tự nên từ   X − µ0 P − tα / 2, n −1 < < tα / ,n −1  = − α S/ n   Ta xác định miền bác bỏ +Từ mẫu quan sát ta tính giá trị T + Đưa định Ví dụ 7.5 Một báo cáo khẳng định máy hút bụi tiêu thụ khoảng 46 kWh / năm Từ mẫu gồm 12 gia đình nghiên cứu, cho thấy máy hút bụi tiêu thụ trung bình 42 kWh năm với độ lệch chuẩn 11,9 kWh Liệu nói, với mức ý nghĩa 0,05, trung bình máy hút bụi tiêu thụ không 46 kWh năm hay không? Giả sử tổng thể xét có phân phối chuẩn Giải H : µ = 46 kWh H : µ ≠ 46 kWh α = 0,05 Chỉ tiêu kiểm định T = X − µ0 S/ n Miền bác bỏ: t < −1,796 ; t > 1.796 với t = x − µ0 , v = 11 bậc tự s/ n Tính tốn: x = 42 kWh, s = 11,9 kWh, n = 12 Do đó: 42 − 46 t= = −1,16 11,9 12 Kết luận: Không bác bỏ H kết luận trung bình lượng điện mà máy hút bụi tiêu thụ năm 46kWH 7.3 Kiểm định giả thuyết hiệu hai giá trị trung bình Bài tốn Cho hai tổng thể Ω1, Ω2 Gọi X1, X2 hai biến ngẫu nhiên đo đặc tính chung cá thể hai tổng thể, với kỳ vọng phương sai tương ứng ký hiệu µ1 , σ µ , σ Dựa vào hai mẫu ngẫu nhiên rút từ Ω1, Ω2 với cỡ n1, n2 , để kiểm định giả thuyết H0: µ1 − µ = d H1: µ1 − µ ≠ d d0 số biết Đây toán kiểm định giả thuyết hai phía + Chọn mức ý nghĩa α + Chỉ tiêu kiểm định miền bác bỏ: • Đã biết σ 12 ,σ 22 cỡ mẫu đủ lớn cho định lý giới hạn trung tâm có hiệu lực: - Chỉ tiêu kiểm định chọn X − X − d0 Z= σ 12 σ 22 + n1 n2 với giả thuyết H0 đúng, Z có phân phối tiệm cận chuẩn Từ mức ý nghĩa α ta - Miền bác bỏ (−∞,− zα / ] ∪ [ zα / ,+∞) • - Cả hai biến ngẫu nhiên có phân phối chuẩn(hoặc xấp xỉ chuẩn) với phương sai chưa biết: Chỉ tiêu kiểm định chọn ( X − X ) − d0 T= S p / n1 + / n2 S12 (n1 − 1) + S 22 (n2 − 1) Khi giả thuyết T có phân phối student với n1 + n1 + n2 − n2 -2 bậc tự nên với mức ý nghĩa α ta Miền bác bỏ giả thuyết với S p2 = - (−∞,−tα / 2, n1 +n2 −2 ] ∪ [tα / 2, n1 +n2 −2 ,+∞) • Cả hai biến ngẫu nhiên có phân phối chuẩn(hoặc xấp xỉ chuẩn) với phương sai khác chưa biết: - Chỉ tiêu kiểm định chọn T '= - ( X − X ) − d0 S12 S 22 + n1 n2 Khi giả thuyết T’ có phân phối xấp xỉ phân phối student với bậc tự xác định (s12 / n1 + s22 / n2 ) v= [(s1 / n1 ) /(n1 − 1)] + [(s22 / n2 ) /(n2 − 1)] Miền bác bỏ (−∞,−tα / 2, ν ] ∪ [tα / 2, ν ,+∞) Ví dụ 7.6 Cho hai tổng thể Ω1, Ω2 với X1, X2 hai biến ngẫu nhiên đo đặc tính chung cá thể hai tổng thể Từ Ω1, Ω2 lấy hai mẫu độc lập với kích thước n = 40, m = 50 Trung bình mẫu tính 130 140 Biết X1 có trung bình µ1 chưa biết σ 12 = 80 ; X2 có trung bình µ chưa biết σ 22 = 100 Với mức ý nghĩa = 0.01, kiểm định giả thuyết H0: µ1 − µ = H1: µ1 − µ ≠ Giải + Mức ý nghĩa α = 0.01 + Chỉ tiêu kiểm định Z = X1 − X − d0 σ 12 σ 22 + n1 n2 + Miền bác bỏ (-∞, -2.58] ∪[2.58, +∞) +Tính tốn: T = -5 + Bác bỏ H0 Ví dụ 7.7 Một thí nghiệm thực nhằm so sánh mức độ mài mòn hai loại kim loại khác 12 miếng kim loại I kiểm tra cách đưa vào máy đo độ mài mòn 10 miếng kim loại II kiểm tra tương tự Trong trường hợp, độ sâu mài mòn ghi lại Mẫu ứng với kim loại I có trung bình mài mịn 85 đơn vị, với độ lệch mẫu 4; mẫu ứng với kim loại II có trung bình 81 độ lệch mẫu Có thể kết luận, với mức ý nghĩa 0.05, mức độ mài mòn kim loại I kim loại II đơn vị không? Giả sử mật độ xấp xỉ chuẩn với phương sai Giải Đặt µ1 , µ2 kỳ vọng cho độ mài mòn hai kim loại + H : µ1 − µ2 = H : µ1 − µ ≠ + α = 0,05 + Chỉ tiêu kiểm định T = ( X − X ) − d0 S p / n1 + / n2 , bậc tự v = 20 + Miền bác bỏ: t > 1,725 t < - 1.725 + Tính tốn: x1 = 85 , x2 = 81 , Do đó: sp = s1 = , s2 = , n1 = 12 n2 = 10 11.16 + 9.25 = 4,478 , 12 + 10 − t= (85 − 81) − = 1,04 4,478 1/ 12 + 1/ 10 + Kết luận: Không bác bỏ H Hết tuần 11 ... P(A ) = , P(A /A ) = , P(A /A A ) = , 52 51 50 theo quy tắc nhân xác suất, 12 P(A A A ) = P(A )P(A /A )P(A /A A ) = = 52 51 50 55 25 I.7 Công thức xác suất đầy đủ công thức Bayes Giả sử phép... 9|Page * Bài tập: 2.6 Xác suất có điều kiện, 2.7 Quy tắc nhân 2 .5 (2.t51) (ĐS: 1 /5) 2.6 (3.t51) (ĐS: (a) 14/39 (b) 95/ 112) 2.7 (5. t52) (ĐS: (a) 5/ 34 (b) 3/8) 2.8 (13.t53) (ĐS: 0,27) * Bài tập:... thuyết xác suất ứng dụng,Nhà XBGD,1997 [4] Trần Mạnh Tuấn, Xác suất & Thống kê lý thuyết thực hành tính tốn, Nhà xuất ĐHQGHN, 2004 3|Page NGUYỄN VĂN ĐẮC BÀI GIẢNG TOÁN TUẦN 4|Page BIẾN CỐ VÀ XÁC SUẤT

Ngày đăng: 21/03/2021, 18:37

Tài liệu cùng người dùng

Tài liệu liên quan