tài liệu trang web lớp đ5h13b đại học điện lực

204 12 0
tài liệu trang web lớp đ5h13b đại học điện lực

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐỊNH NGHĨA XÁC SUẤT Việc biến cố ngẫu nhiên xảy ra hay không trong kết quả của một phép thử là điều không thể biết hoặc đoán trước được.. Tuy nhiên bằng những cách khác nhau ta có thể đị[r]

(1)HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - - SÁCH HƯỚNG DẪN HỌC TẬP LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN Biên soạn : Ts LÊ BÁ LONG Lưu hành nội HÀ NỘI - 2006 (2) LỜI NÓI ĐẦU Lý thuyết xác suất thống kê là phận toán học, nghiên cứu các tượng ngẫu nhiên và ứng dụng chúng vào thực tế Ta có thể hiểu tượng ngẫu nhiên là tượng không thể nói trước nó xảy hay không xảy thực lần quan sát Tuy nhiên, tiến hành quan sát khá nhiều lần tượng ngẫu nhiên các phép thử nhau, ta có thể rút kết luận khoa học tượng này Lý thuyết xác suất là sở để nghiên cứu Thống kê - môn học nghiên cứu các các phương pháp thu thập thông tin chọn mẫu, xử lý thông tin, nhằm rút các kết luận định cần thiết Ngày nay, với hỗ trợ tích cực máy tính điện tử và công nghệ thông tin, lý thuyết xác suất thống kê ngày càng ứng dụng rộng rãi và hiệu lĩnh vực khoa học tự nhiên và xã hội Chính vì lý thuyết xác suất thống kê giảng dạy cho hầu hết các nhóm ngành đại học Có nhiều sách giáo khoa và tài liệu chuyên khảo viết lý thuyết xác suất thống kê Tuy nhiên, với phương thức đào tạo từ xa có đặc thù riêng, đòi hỏi học viên phải làm việc độc lập nhiều hơn, vì cần phải có tài liệu hướng dẫn học tập môn học thích hợp cho đối tượng này Tập tài liệu “Hướng dẫn học môn toán xác suất thống kê” này biên soạn nhằm mục đích trên Tập tài liệu “Hướng dẫn học môn Lý thuyết xác suất và thống kê toán” biên soạn theo chương trình qui định Học viện Công nghệ Bưu Chính Viễn Thông dành cho hệ đại học chuyên ngành Quản trị kinh doanh Nội dung sách bám sát các giáo trình các trường đại học khối kinh tế và theo kinh nghiệm giảng dạy nhiều năm tác giả Chính vì thế, giáo trình này có thể dùng làm tài liệu học tập, tài liệu tham khảo cho sinh viên các trường đại học và cao đẳng khối kinh tế Giáo trình gồm chương tương ứng với đơn vị học trình (60 tiết): Chương I: Biến cố ngẫu nhiên và xác suất Chương II: Biến ngẫu nhiên và quy luật phân bố xác suất Chương III: Một số quy luật phân bố xác suất quan trọng Chương IV: Biến ngẫu nhiên hai chiều Chương V: Luật số lớn Chương VI: Cơ sở lý thuyết mẫu Chương VII: Ước lượng các tham số biến ngẫu nhiên Chương VIII: Kiểm định giả thiết thống kê (3) Năm chương đầu thuộc lý thuyết xác suất, ba chương còn lại là vấn đề lý thuyết thống kê Điều kiện tiên môn học này là hai môn toán cao cấp đại số và giải tích chương trình toán đại cương Tuy nhiên, vì hạn chế chương trình toán dành cho khối kinh tế, nên nhiều kết và định lý phát biểu, minh họa, không có điều kiện để chứng minh chi tiết Giáo trình này trình bày theo phương pháp phù hợp người tự học, đặc biệt phục vụ đắc lực cho công tác đào tạo từ xa Trước nghiên cứu các nội dung chi tiết, người học nên xem phần giới thiệu chương, để thấy mục đích, ý nghĩa, yêu cầu chính chương đó Trong chương, nội dung, người học có thể tự đọc và hiểu cặn kẽ thông qua cách diễn đạt và dẫn rõ ràng Đặc biệt học viên nên chú ý đến các nhận xét, bình luận, để hiểu sâu sắc mở rộng tổng quát các kết và hướng ứng dụng vào thực tế Hầu hết các bài toán giáo trình xây dựng theo lược đồ: đặt bài toán, chứng minh tồn lời giải lý thuyết và cuối cùng nêu thuật toán giải bài toán này Các ví dụ là để minh hoạ trực tiếp khái niệm, định lý các thuật toán, vì giúp người học dễ tiếp thu bài Sau các chương có phần tóm tắt các nội dung chính, và cuối cùng là các câu hỏi luyện tập Có khoảng từ 20 đến 30 bài tập cho chương, tương ứng với -5 câu hỏi cho tiết lý thuyết Hệ thống câu hỏi này bao trùm toàn nội dung vừa học Có câu hỏi kiểm tra trực tiếp các kiến thức vừa học, có câu đòi hỏi học viên phải vận dụng cách tổng hợp và sáng tạo các kiến thức đã học để giải Vì vậy, việc giải các bài tập này giúp học viên nắm lý thuyết và tự kiểm tra mức độ tiếp thu lý thuyết mình Giáo trình viết theo đúng đề cương chi tiết môn học đã Học Viện ban hành Các kiến thức trang bị tương đối đầy đủ, có hệ thống Tuy nhiên, người học không có điều kiện đọc kỹ toàn giáo trình thì các nội dung có đánh dấu (*) coi là phần tham khảo thêm (chẳng hạn: chương luật số lớn và định lý giới hạn trung tâm (*), mục 6.6 chương …) Tuy tác giả đã cố gắng, song thời gian bị hạn hẹp, nên các thiếu sót còn tồn giáo trình là điều khó tránh khỏi Tác giả mong nhận đóng góp ý kiến bạn bè, đồng nghiệp, các học viên xa gần Xin chân thành cám ơn Tác giả xin bày tỏ lời cám ơn tới TS Tô Văn Ban, CN Nguyễn Đình Thực, đã đọc thảo và cho ý kiến phản biện quý giá và đặc biệt tới KS Nguyễn Chí Thành người đã giúp tôi biên tập hoàn chỉnh tài liệu Cuối cùng, tác giả xin bày tỏ cám ơn Ban Giám đốc Học viện Công nghệ Bưu Chính Viễn Thông, Trung tâm Đào tạo Bưu Chính Viễn Thông và bạn bè đồng nghiệp đã khuyến khích, động viên, tạo nhiều điều kiện thuận lợi để chúng tôi hoàn thành tập tài liệu này Hà Nội, đầu năm 2006 TÁC GIẢ (4) Chương 1: Biến cố ngẫu nhiên và xác xuất CHƯƠNG I: BIẾN CỐ NGẪU NHIÊN VÀ XÁC SUẤT GIỚI THIỆU Các tượng tự nhiên hay xã hội xảy cách ngẫu nhiên (không biết trước kết quả) tất định (biết trước kết xảy ra) Chẳng hạn ta biết chắn lông quạ có mầu đen, vật thả từ trên cao chắn rơi xuống đất Đó là tượng diễn có tính quy luật, tất định Trái lại tung đồng xu ta không biết mặt sấp hay mặt ngửa xuất Ta không thể biết có bao nhiêu gọi đến tổng đài, có bao nhiêu khách hàng đến điểm phục vụ khoảng thời gian nào đó Ta không thể xác định trước số chứng khoán trên thị trường chứng khoán… Đó là tượng ngẫu nhiên Tuy nhiên, tiến hành quan sát khá nhiều lần tượng ngẫu nhiên hoàn cảnh nhau, thì nhiều trường hợp ta có thể rút kết luận có tính quy luật tượng này Lý thuyết xác suất nghiên cứu các qui luật các tượng ngẫu nhiên Việc nắm bắt các quy luật này cho phép dự báo các tượng ngẫu nhiên đó xảy nào Chính vì các phương pháp lý thuyết xác suất ứng dụng rộng rãi việc giải các bài toán thuộc nhiều lĩnh vực khác khoa học tự nhiên, kỹ thuật và kinh tế-xã hội Chương này trình bày cách có hệ thống các khái niệm và các kết chính lý thuyết xác suất: - Các khái niệm phép thử, biến cố - Quan hệ các biến cố - Các định nghĩa xác suất: định nghĩa xác suất theo cổ điển, theo thống kê - Các tính chất xác suất: công thức cộng và công thức nhân xác suất, xác suất biến cố đối - Xác suất có điều kiện, công thức nhân trường hợp không độc lập Công thức xác suất đầy đủ và định lý Bayes Khi nắm vững các kiến thức đại số tập hợp như: hợp, giao tập hợp, tập con… học viên dễ dàng việc tiếp thu, biểu diễn mô tả các biến cố Để tính xác suất các biến cố theo phương pháp cổ điển đòi hỏi phải tính số các trường hợp thuận lợi biến cố và số các trường hợp có thể Vì học viên cần nắm vững các phương pháp đếm - giải tích tổ hợp (đã học lớp 12) Tuy nhiên để thuận lợi cho người học chúng tôi nhắc lại các kết chính mục Một khó khăn bài toán xác suất là xác định biến cố và sử dụng đúng các công thức thích hợp Bằng cách tham khảo các ví dụ và giải nhiều bài tập rèn luyện tốt kỹ này (5) Chương 1: Biến cố ngẫu nhiên và xác xuất NỘI DUNG 1.1 PHÉP THỬ VÀ BIẾN CỐ 1.1.1 Phép thử (Experiment) Trong thực tế ta thường gặp nhiều thí nghiệm, quan sát mà các kết nó không thể dự báo trước Ta gọi chúng là các phép thử ngẫu nhiên Phép thử ngẫu nhiên thường ký hiệu chữ C Tuy không biết kết xảy nào, ta có thể liệt kê biểu diễn tất các kết phép thử C Mỗi kết phép thử C gọi là biến cố sơ cấp Tập hợp tất các biến cố sơ cấp phép thử gọi là không gian mẫu, ký hiệu Ω Ví dụ 1.1: ƒ Phép thử tung đồng xu có không gian mẫu là Ω = {S, N } ƒ Với phép thử tung xúc xắc, các biến cố sơ cấp có thể xem là số các nốt trên mặt xuất Vậy Ω = {1, 2, 3, 4, 5, 6} ƒ Phép thử tung đồng thời đồng xu có không gian mẫu là: Ω = {( S , S ), ( S , N ), ( N , S ), ( N , N )} Chú ý chất các biến cố sơ cấp không có vai trò đặc biệt gì lý thuyết xác suất Chẳng hạn có thể xem không gian mẫu phép thử tung đồng tiền là Ω = {0, 1}, đó là biến cố sơ cấp mặt sấp xuất và để mặt ngửa xuất 1.2.1 Biến cố (Event) Với phép thử C ta thường xét các biến cố (còn gọi là kiện) mà việc xảy hay không xảy hoàn toàn xác định kết C Các biến cố ngẫu nhiên ký hiệu các chữ in hoa A, B, C, … Mỗi kết ω C gọi là kết thuận lợi cho biến cố A A xảy kết C là ω Ví dụ 1.2: Nếu gọi A là biến cố số nốt xuất là chẵn phép thử tung xúc xắc ví dụ 1.1 thì A có các kết thuận lợi là 2, 4, Tung hai đồng xu, biến cố xuất mặt sấp mặt ngửa (xin âm dương) có các kết thuận lợi là ( S , N ) ; ( N , S ) Như biến cố A đồng với tập không gian mẫu Ω bao gồm các kết thuận lợi A Mỗi biến cố có thể xảy phép thử thực hiện, nghĩa là gắn với không gian mẫu nào đó Có hai biến cố đặc biệt sau: • Biến cố chắn: là biến cố luôn luôn xảy thực phép thử, biến cố này trùng với không gian mẫu Ω (6) Chương 1: Biến cố ngẫu nhiên và xác xuất • Biến cố không thể: là biến cố định không xảy thực phép thử Biến cố không thể ký hiệu φ Tung xúc xắc, biến cố xuất mặt có số nốt nhỏ hay là biến chắn, biến cố xuất mặt có nốt là biến cố không thể 1.2 ĐỊNH NGHĨA XÁC SUẤT Việc biến cố ngẫu nhiên xảy hay không kết phép thử là điều không thể biết đoán trước Tuy nhiên cách khác ta có thể định lượng khả xuất biến cố, đó là xác suất xuất biến cố Xác suất biến cố là số đặc trưng khả khách quan xuất biến cố đó thực phép thử Dựa vào chất phép thử (đồng khả năng) ta có thể suy luận khả xuất biến cố, với cách tiếp cận này ta có định nghĩa xác suất theo phương pháp cổ điển Khi thực nhiều lần lặp lại độc lập phép thử ta có thể tính tần suất xuất (số lần xuất hiện) biến cố nào đó Tần suất thể khả xuất biến cố, với cách tiếp cận này ta có định nghĩa xác suất theo thống kê 1.3 ĐỊNH NGHĨA CỔ ĐIỂN VỀ XÁC SUẤT 1.3.1 Định nghĩa và ví dụ Giả sử phép thử C thoả mãn hai điều kiện sau: (i) Không gian mẫu có số hữu hạn phần tử (ii) Các kết xảy đồng khả Khi đó ta định nghĩa xác suất biến cố A là P(A) = sè tr−êng hîp thuËn lîi đèi víi A sè tr−êng hîp cã thÓ (1.1) Nếu xem biến cố A là tập không gian mẫu Ω thì P( A) = A sè phÇn tö cña A = sè phÇn tö cña Ω Ω (1.1)’ Ví dụ 1.3: Biến cố A xuất mặt chẵn phép thử gieo xúc xắc ví dụ 1.1 có trường hợp thuận lợi ( A = ) và trường hợp có thể ( Ω = ) Vậy P ( A) = = Để tính xác suất cổ điển ta sử dụng phương pháp đếm giải tích tổ hợp (7) Chương 1: Biến cố ngẫu nhiên và xác xuất 1.3.2 Các qui tắc đếm 1.3.2.1 Qui tắc cộng Nếu có m1 cách chọn loại đối tượng x1 , m cách chọn loại đối tượng x , , mn cách chọn loại đối tượng x n Các cách chọn đối tượng xi không trùng với cách chọn x j i ≠ j thì có m1 + m2 + + mn cách chọn các đối tượng đã cho 1.3.2.2 Qui tắc nhân Giả sử công việc H gồm nhiều công đoạn liên tiếp H1 , H , , H k và công đoạn H i có ni cách thực thì có tất n1 × n2 × × nk cách thực công việc H 1.3.2.3 Hoán vị Mỗi phép đổi chỗ n phần tử gọi là phép hoán vị n phần tử Sử dụng quy tắc nhân ta có thể tính được: Có n ! hoán vị n phần tử 1.3.2.4 Chỉnh hợp Chọn k phần tử không hoàn lại tập n phần tử ta chỉnh hợp chập k n phần tử Sử dụng quy tắc nhân ta có thể tính số các chỉnh hợp chập k n phần tử là: Ank = n! (n − k )! (1.2) 1.3.2.5 Tổ hợp Chọn đồng thời k phần tử tập n phần tử ta tổ hợp chập k n phần tử Cũng có thể xem tổ hợp chập k n phần tử là tập k phần tử tập n phần tử Hai chỉnh hợp n chập k là khác nếu: ƒ có ít phần tử chỉnh hợp này không có chỉnh hợp ƒ các phần tử thứ tự khác Do đó với tổ hợp chập k n phần tử có k! chỉnh hợp tương ứng Mặt khác hai chỉnh hợp khác ứng với hai tổ hợp khác là khác Vậy số các tổ hợp chập k n phần tử là Ank k Cn = = k! n! k!( n − k )! (1.3) (8) Chương 1: Biến cố ngẫu nhiên và xác xuất Ví dụ 1.4: Tung xúc xắc hai lần Tìm xác suất để đó có lần nốt Giải: Số các trường hợp có thể là 36 Gọi A là biến cố “trong lần tung xúc xắc có lần mặt 6” Nếu lần thứ mặt thì lần thứ hai có thể các mặt từ đến 5, nghĩa là có trường hợp Tương tự có trường hợp xuất mặt lần tung thứ hai Áp dụng quy tắc cộng ta suy xác suất để có lần mặt tung xúc xắc lần là 10 36 Ví dụ 1.5: Một người gọi điện thoại quên hai số cuối số điện thoại và nhớ chúng khác Tìm xác suất để quay ngẫu nhiên lần đúng số cần gọi Giải: Gọi A là biến cố “quay ngẫu nhiên lần đúng số cần gọi” Số các trường hợp có thể là số các cặp hai chữ số khác từ 10 chữ số từ đến Nó số các chỉnh hợp 10 chập Vậy số các trường hợp có thể là A10 = 10 ⋅ = 90 Số các trường hợp thuận lợi A là Do đó P( A) = 90 Ví dụ 1.6: Một công ty cần tuyển nhân viên Có người nộp đơn đó có nữ và nam Giả sử khả trúng tuyển người là Tính xác suất biến cố: a Hai người trúng tuyển là nam b Hai người trúng tuyển là nữ c Có ít 1nữ trúng tuyển Giải: Số trường hợp có thể Ω = C62 = 15 a Chỉ có trường hợp nam trúng tuyển đó xác suất tương ứng là P = / 15 b Có C 42 = cách chọn nữ, xác suất tương ứng P = / 15 c Trong 15 trường hợp có thể có trường hợp nam chọn, có 14 trường hợp ít nữ chọn Do đo xác suất tương ứng P = 14 / 15 1.4 ĐỊNH NGHĨA THỐNG KÊ VỀ XÁC SUẤT Định nghĩa xác suất theo cổ điển trực quan, dễ hiểu Tuy nhiên số các kết có thể vô hạn không đồng khả thì cách tính xác suất cổ điển không áp dụng Giả sử phép thử C có thể thực lặp lại nhiều lần độc lập điều kiện giống hệt Nếu n lần thực phép thử C , biến cố A xuất k n (A) lần thì tỉ số: f n ( A) = k n ( A) n gọi là tần suất xuất biến cố A n phép thử Người ta chứng minh (định lý luật số lớn) n tăng lên vô hạn thì f n (A) tiến đến giới hạn xác định Ta định nghĩa giới hạn này là xác suất biến cố A , ký hiệu P(A) (9) Chương 1: Biến cố ngẫu nhiên và xác xuất P ( A) = lim f n ( A) (1.4) n →∞ Trên thực tế P(A) tính xấp xỉ tần suất f n (A) n đủ lớn Ví dụ 1.7: Một công ty bảo hiểm muốn xác định xác suất để người Mỹ 25 tuổi bị chết năm tới, người ta theo dõi 100.000 niên và thấy có 798 người bị chết vòng năm sau đó Vậy xác suất cần tìm xấp xỉ 0,008 Ví dụ 1.8: Thống kê cho thấy tần suất sinh trai xấp xỉ 0,513 Vậy xác suất để bé trai đời lớn bé gái Nhận xét: Định nghĩa xác suất theo thống kê khắc phục hạn chế định nghĩa cổ điển, nó hoàn toàn dựa trên các thí nghiệm quan sát thực tế để tìm xác suất biến cố Tuy nhiên định nghĩa thống kê xác suất áp dụng cho các phép thử mà có thể lặp lại nhiều lần cách độc lập điều kiện giống hệt Ngoài để xác định cách tương đối chính xác giá trị xác suất thì cần tiến hành số lần n đủ lớn các phép thử, mà việc này đôi không thể làm vì hạn chế thời gian và kinh phí Ngày với trợ giúp công nghệ thông tin, người ta có thể mô các phép thử ngẫu nhiên mà không cần thực các phép thử thực tế Điều này cho phép tính xác suất theo phương pháp thống kê thuận tiện 1.5 QUAN HỆ GIỮA CÁC BIẾN CỐ Trong lý thuyết xác suất người ta xét các quan hệ sau đây cho các biến cố 1.5.1 Quan hệ kéo theo Biến cố A kéo theo biến cố B , ký hiệu A ⊂ B , A xảy thì B xảy 1.5.2 Quan hệ biến cố đối Biến cố đối A là biến cố ký hiệu là A và xác định sau: A xảy và A không xảy 1.5.3 Tổng hai biến cố Tổng hai biến cố A, B là biến cố ký hiệu A ∪ B (hoặc A + B ) Biến cố A ∪ B xảy và có ít A B xảy Tổng dãy các biến cố {A1 , A2 , , An } là biến cố ít các biến cố Ai xảy 10 n ∪ Ai Biến cố này xảy có i =1 (10) Chương 1: Biến cố ngẫu nhiên và xác xuất 1.5.4 Tích hai biến cố Tích hai biến cố A, B là biến cố ký hiệu AB Biến cố AB xảy và hai biến cố A , B cùng xảy Tích dãy các biến cố {A1 , A2 , , An } là biến cố n ∏ Ai Biến cố này xảy tất i =1 các biến cố Ai cùng xảy 1.5.5 Biến cố xung khắc Hai biến số A, B gọi là xung khắc biến cố tích AB là biến cố không thể Nghĩa là hai biến cố này không thể đồng thời xảy Chú ý các biến cố với phép toán tổng, tích và lấy biến cố đối tạo thành đại số Boole đó các phép toán định nghĩa trên có các tính chất các phép toán hợp, giao, lấy phần bù các tập không gian mẫu Chẳng hạn phép toán tổng tích các biến cố có tính giao hoán, kết hợp, tổng phân bố tích, tích phân bố tổng, luật De Morgan … 1.5.6 Hệ đầy đủ các biến cố Dãy các biến cố A1 , A2 , , An gọi là hệ đầy đủ các biến cố nếu: (i) Xung khắc đôi một, nghĩa là Ai A j = φ với i ≠ j = 1, , n , n (ii) Tổng chúng là biến cố chắc, nghĩa là ∪ Ai = Ω i =1 { } Đặc biệt với biến cố A , hệ A, A là hệ đầy đủ Ví dụ 1.9: Một nhà máy có ba phân xưởng sản xuất cùng loại sản phẩm Giả sử sản phẩm nhà máy ba phân xưởng này sản xuất Chọn ngẫu nhiên sản phẩm, gọi A1 , A2 , A3 là biến cố sản phẩm chọn phân xưởng thứ nhất, thứ hai, thứ ba sản xuất Khi đó hệ ba biến cố A1 , A2 , A3 là hệ đầy đủ 1.5.7 Tính độc lập các biến cố Hai biến cố A và B gọi là độc lập với việc xảy hay không xảy biến cố này không ảnh hưởng tới việc xảy hay không xảy biến cố Tổng quát các biến cố A1 , A2 , , An gọi là độc lập việc xảy hay không xảy nhóm k biến cố, đó ≤ k ≤ n , không làm ảnh hưởng tới việc xảy hay không xảy các biến cố còn lại 11 (11) Chương 1: Biến cố ngẫu nhiên và xác xuất Ví dụ 1.10: Ba xạ thủ A, B, C người bắn viên đạn vào mục tiêu Gọi A, B, C là biến cố A, B, C bắn trúng mục tiêu i Hãy mô tả các biến cố: ABC , A B C , A ∪ B ∪ C ii Biểu diễn các biến cố sau theo A, B, C : ƒ D : Có ít xạ thủ bắn trúng ƒ E : Có nhiều xạ thủ bắn trúng ƒ F : Chỉ có xạ thủ C bắn trúng ƒ G : Chỉ có xạ thủ bắn trúng iii Các biến cố A, B, C có xung khắc, có độc lập không ? Giải: i ABC : bắn trúng A B C : bắn trượt A ∪ B ∪ C : có ít người bắn trúng ii D = AB ∪ BC ∪ CA Có nhiều xạ thủ bắn trúng có nghĩa là có ít hai xạ thủ bắn trượt, vậy: E = AB ∪ BC ∪C A F = ABC G = ABC ∪ ABC ∪ ABC iii Ba biến cố A, B, C độc lập không xung khắc 1.6 CÁC TÍNH CHẤT VÀ ĐỊNH LÝ XÁC SUẤT 1.6.1 Các tính chất xác suất Các định nghĩa trên xác suất thỏa mãn các tính chất sau: Với biến cố A : ≤ P( A) ≤ (1.5) Xác suất biến cố không thể 0, xác suất biến cố chắn P(φ) = 0, P(Ω) = (1.6) 1.6.2 Qui tắc cộng 1.6.2.1 Trường hợp xung khắc Nếu A, B là hai biến cố xung khắc thì P( A ∪ B) = P( A) + P( B) 12 (1.7) (12) Chương 1: Biến cố ngẫu nhiên và xác xuất Tổng quát hơn, {A1 , A2 , , An } là dãy các biến cố xung khắc đôi thì ⎛n ⎞ n P⎜ ∪ Ai ⎟ = ∑ P( Ai ) ⎜ ⎟ ⎝ i =1 ⎠ i =1 (1.7)’ Từ công thức (1.6) và (1.7)’ ta có hệ quả: Nếu {A1 , A2 , , An } là hệ đầy đủ thì n ∑ P( Ai ) = (1.8) i =1 1.6.2.2 Trường hợp tổng quát ƒ Nếu A, B là hai biến cố thì P( A ∪ B) = P( A) + P( B) − P( AB) ƒ (1.9) Nếu A, B, C là ba biến cố thì P( A ∪ B ∪ C ) = P( A) + P( B) + P(C ) − P( AB) − P( BC ) − P(CA) + P( ABC) (1.9)’ ƒ Nếu {A1 , A2 , , An } là dãy các biến cố ⎛n ⎞ n P⎜ ∪ Ai ⎟ = ∑ P ( Ai ) − ∑ P ( Ai A j ) + ∑ P ( Ai A j Ak ) − ⎜ ⎟ i< j i< j <k ⎝ i =1 ⎠ i =1 + (−1) n−1 P ( A1 A2 An ) 1.9)” Ví dụ 11: Một lô hàng có 25% sản phẩm loại I, 55% sản phẩm loại II và 20% sản phẩm loại III Sản phẩm cho là đạt chất lượng thuộc loại I loại II Chọn ngẫu nhiên sản phẩm tìm xác suất để sản phẩm này đạt tiêu chuẩn chất lượng Giải: Gọi A1 , A2 , A3 là biến cố sản phẩm chọn thuộc loại I, II, III Ba biến cố này xung khắc đôi P ( A1 ) = 0,25 , P( A2 ) = 0,55 , P( A3 ) = 0,20 Gọi A là biến cố sản phẩm chọn đạt tiêu chuẩn chất lượng Vậy A = A1 ∪ A2 P( A) = P( A1 ) + P( A2 ) = 0,25 + 0,55 = 0,8 { } Áp dụng công thức (1.8) cho hệ đầy đủ A, A ta quy tắc xác suất biến cố đối 1.6.3 Quy tắc xác suất biến cố đối Với biến cố A : P( A ) = − P( A) (1.10) 1.6.4 Xác suất có điều kiện Xác suất biến cố B tính điều kiện biết biến cố A đã xảy gọi là xác suất B với điều kiện A Ký hiệu P (B A) 13 (13) Chương 1: Biến cố ngẫu nhiên và xác xuất Tính chất ¾ Nếu P( A) > thì: P(B A) = ¾ P( AB) P( A) (1.11) Khi cố định A với P( A) > thì xác suất có điều kiện P (B A) có tất các tính chất xác suất thông thường (công thức (1.5)-(1.10)”) biến cố B Chẳng hạn: ( ) P B A = − P (B A), P (B1 ∪ B2 A) = P (B1 A) + P (B2 A) − P (B1 B2 A) Ví dụ 12: Gieo đồng thời hai xúc xắc cân đối Tính xác suất để tổng số nốt xuất trên hai xúc xắc ≥ 10 biết ít đã nốt Giải: Gọi A là biến cố " ít nốt 5" ( ) 11 ⎛5⎞ P ( A) = − P A = − ⎜ ⎟ = 36 ⎝6⎠ Gọi B là biến cố "tổng số nốt trên hai ≥ 10 " Biến cố AB có kết thuận lợi là (5,6), (6,5), (5,5) Vậy P( AB) = 3 11 ⇒ P ( B A) = = 36 36 11 36 1.6.5 Quy tắc nhân 1.6.5.1 Trường hợp độc lập ƒ Nếu A, B là hai biến cố độc lập thì P( AB) = P( A) P( B) (1.12) ƒ Nếu {A1 , A2 , , An } là các biến cố độc lập thì P( A1 A2 An ) = P( A1 )P( A2 ) P( An ) (1.13) 1.6.5.2 Trường hợp tổng quát 14 ƒ P ( AB ) = P ( A) P (B A) (1.14) ƒ P ( A1 A2 An ) = P ( A1 ) P ( A2 A1 ) P ( A3 A1 A2 ) P ( An A1 A2 An −1 ) (1.15) (14) Chương 1: Biến cố ngẫu nhiên và xác xuất Ví dụ 1.14: Túi I chứa bi trắng, bi đỏ, 15 bi xanh Túi II chứa 10 bi trắng, bi đỏ, bi xanh Từ túi lấy ngẫu nhiên bi Tìm xác suất để bi rút từ túi là cùng màu Giải: Gọi At , Ađ , Ax là biến cố bi rút từ túi I là trắng, đỏ, xanh Bt , Bđ , B x là biến cố bi rút từ túi II là trắng, đỏ, xanh Các biến cố At , Ađ , Ax độc lập với các biến cố Bt , Bđ , B x Vậy xác suất để bi rút cùng mầu là: P ( At Bt ∪ Ađ Bđ ∪ Ax Bx ) = P ( At Bt ) + P ( Ađ Bđ ) + P ( Ax Bx ) (do xung khắc) = P ( At ) P ( Bt ) + P ( Ađ ) P ( Bđ ) + P ( Ax ) P ( Bx ) (do độc lập) = 10 15 207 + + = ≈ 0,331 25 25 25 25 25 25 625 Ví dụ 1.15: Một thủ kho có chùm chìa khóa gồm chiếc, bề ngoài chúng giống hệt đó có đúng mở kho Anh ta thử ngẫu nhiên chìa (chìa nào không trúng thì bỏ ra) Tính xác suất để mở kho lần thứ ba Giải: Ký hiệu Ai là biến cố "thử đúng chìa lần thứ i" Vậy xác suất cần tìm là ( ) ( ) ( ) ( ) P A1 A2 A3 = P A1 P A2 A1 P A3 A1 A2 = 762 = 987 1.6.6 Công thức xác suất đầy đủ Định lý 1.3: Nếu { A1 , A2 , , An } là hệ đầy đủ các biến cố Với biến cố B (trong cùng phép thử) ta có n P( B ) = ∑ P ( Ai ) P ( B Ai ) (1.16) i =1 1.6.7 Công thức Bayes Định lý 1.4: Nếu { A1 , A2 , , An } là hệ đầy đủ các biến cố Với biến cố B (trong cùng phép thử) cho P( B) > ta có : P ( Ak B ) = P ( Ak ) P ( B Ak ) P ( Ak B ) = n P( B) ∑ P( Ai ) P ( B Ai ) (1.17) i =1 15 (15) Chương 1: Biến cố ngẫu nhiên và xác xuất Giải thích: Trong thực tế các xác suất { P ( A1 ), P ( A2 ), , P ( An )} đã biết và gọi là các xác suất tiền nghiệm Sau quan sát biết biến cố B xảy ra, các xác suất Ak tính trên thông tin này (xác suất có điều kiện P ( Ak B ) ) gọi là xác suất hậu nghiệm Vì công thức Bayes còn gọi là công thức xác suất hậu nghiệm Ví dụ 1.16: Một trạm phát hai tín hiệu A và B với xác suất tương ứng 0,85 và 0,15 Do có nhiễu trên đường truyền nên 1/7 tín hiệu A bị méo và thu tín hiệu B còn 1/8 tín hiệu B bị méo và thu A a Tìm xác suất thu tín hiệu A b Giả sử đã thu tín hiệu A Tìm xác suất thu đúng tín hiệu lúc phát Giải: Gọi là A biến cố "phát tín hiệu A" và B là biến cố "phát tín hiệu B" Khi đó {A, B} là hệ đầy đủ Gọi là T A biến cố "thu tín hiệu A" và là TB biến cố "thu tín hiệu B" P( A) = 0,85 , P( B) = 0,15 ; P(TB A) = a 1 , P(T A B ) = Áp dụng công thức xác suất đầy đủ ta có xác suất thu tín hiệu A: P(T A ) = P( A) P(T A A) + P( B) P(T A B ) = 0,85 × b + 0,15 × = 0,7473 Áp dụng công thức Bayes ta có P(A T A ) = P ( A) P (T A A) P (T A ) = 0,975 = 0,7473 0,85 × Ví dụ 1.17: Người ta dùng thiết bị để kiểm tra loại sản phẩm nhằm xác định sản phẩm có đạt yêu cầu không Biết sản phẩm có tỉ lệ phế phẩm là p% Thiết bị có khả phát đúng sản phẩm là phế phẩm với xác suất α và phát đúng sản phẩm đạt chất lượng với xác suất β Kiểm tra ngẫu nhiên sản phẩm, tìm xác suất cho sản phẩm này: a Được kết luận là phế phẩm (biến cố A ) b Được kết luận là đạt chất lượng thì lại là phế phẩm c Được kết luận là đúng với thực chất nó Giải: Gọi H là biến cố “sản phẩm chọn là phế phẩm” Theo giả thiết ta có: ( ) P ( H ) = p, P ( A H ) = α , P A H = β a { } Áp dụng công thức đầy đủ cho hệ đầy đủ H , H ta có: ( ) ( ) P ( A) = P ( H ) P ( A H ) + P H P A H = pα + (1 − p )(1 − β ) 16 (16) Chương 1: Biến cố ngẫu nhiên và xác xuất b c ( ) P H A = ( P HA ( ) P A ( )= p(1 − α ) p (1 − α ) + (1 − p) β ( ) ( ) ) P ( AH ) + P A H = P ( H ) P ( A H ) + P H P A H = pα + (1 − p ) β Ví dụ 1.18: Trước đưa sản phẩm thị trường người ta đã vấn ngẫu nhiên 200 khách hàng sản phẩm đó và thấy có 34 người trả lời “sẽ mua”, 97 người trả lời “có thể mua” và 69 người trả lời “không mua” Kinh nghiệm cho thấy tỷ lệ khách hàng thực mua sản phẩm tương ứng với cách trả lời trên tương ứng là 70%, 30% và 1% a Hãy đánh giá thị trường tiềm sản phẩm đó b Trong số khách hàng thực mua sản phẩm thì có bao nhiêu phần trăm trả lời “sẽ mua” Giải: Gọi A là biến cố “người vấn mua sản phẩm” Gọi H1 , H , H là biến cố tương ứng với cách trả lời khách hàng vấn: H - người đó trả lời “sẽ mua” H - người đó trả lời “có thể mua” H - người đó trả lời “không mua” H1 , H , H là hệ đầy đủ các biến cố với xác suất tương ứng 34 97 69 , , 200 200 200 Các xác suất điều kiện P (A H ) = 0,7 ; P ( A H ) = 0,3 ; P ( A H ) = 0,01 a Theo công thức xác suất đầy đủ P( A) = 34 97 69 ⋅ 0,7 + ⋅ 0,3 + ⋅ 0,01 = 0,268 200 200 200 Vậy thị trường tiềm sản phẩm đó là 26,8% b Theo công thức Bayes P (H A) = P( H1 ) P(A H ) P( A) = 0,17 ⋅ 0,7 = 0,444 = 44,4% 0,268 1.7 NGUYÊN LÝ XÁC SUẤT LỚN, XÁC SUẤT NHỎ Một biến cố không thể có xác suất Qua thực nghiệm và quan sát thực tế, người ta thấy các biến cố có xác suất nhỏ không xảy ta thực phép thử hay vài phép thử Từ đó ta thừa nhận nguyên lý sau đây, gọi là “Nguyên lý xác suất nhỏ”: Nếu 17 (17) Chương 1: Biến cố ngẫu nhiên và xác xuất biến cố có xác suất nhỏ thì thực tế có thể cho phép thử biến cố đó không xảy Chẳng hạn máy bay có xác suất nhỏ bị xảy tai nạn Nhưng trên thực tế ta không từ chối máy bay vì tin tưởng chuyến bay ta kiện máy bay rơi không xảy Hiển nhiên việc quy định mức xác suất nào gọi là nhỏ phụ thuộc vào bài toán cụ thể Chẳng hạn xác suất để máy bay rơi là 0,01 thì xác suất đó chưa thể coi là nhỏ Song xác suất chuyến tàu khởi hành chậm là 0,01 thì có thể coi xác suất này là nhỏ Mức xác suất nhỏ này gọi là mức ý nghĩa Nếu α là mức ý nghĩa thì số β = − α gọi là độ tin cậy Khi dựa trên nguyên lý xác suất nhỏ ta tuyên bố rằng: “Biến cố A có xác suất nhỏ (tức là P(A) ≤ α ) không xảy trên thực tế” thì độ tin cậy kết luận trên là β Tính đúng đắn kết luận xảy 100 ⋅ β % trường hợp Tương tự ta có thể đưa “Nguyên lý xác suất lớn”: “Nếu biến cố A có xác suất gần thì trên thực tế có thể cho biến cố đó xảy phép thử” Cũng trên, việc quy định mức xác suất nào gọi là lớn tùy thuộc vào bài toán cụ thể TÓM TẮT Phép thử Trong thực tế ta thường gặp nhiều thí nghiệm, quan sát mà các kết nó không thể dự báo trước Ta gọi chúng là các phép thử ngẫu nhiên Mỗi kết phép thử C gọi là biến cố sơ cấp Tập hợp tất các biến cố sơ cấp phép thử gọi là không gian mẫu, ký hiệu Ω Biến cố Mỗi biến cố A đồng với tập không gian mẫu Ω bao gồm các kết thuận lợi A Xác suất Xác suất biến cố là số đặc trưng khả khách quan xuất biến cố đó thực phép thử Định nghĩa cổ điển xác suất Xác suất biến cố A là P( A) = sè tr−êng hîp thuËn lîi đèi víi A sè tr−êng hîp cã thÓ Định nghĩa thống kê xác suất Xác suất biến cố A là P( A) ≈ f n ( A) = 18 k n ( A) n (18) Chương 1: Biến cố ngẫu nhiên và xác xuất đó k n (A) số lần xuất biến cố A n phép thử Quan hệ kéo theo Biến cố A kéo theo biến cố B , ký hiệu A ⊂ B , A xảy thì B xảy Quan hệ biến cố đối A là biến cố đối A A xảy và A không xảy Tổng hai biến cố Biến cố A ∪ B tổng ( A + B ) hai biến cố A, B xảy và có ít A n B xảy Biến cố tổng ∪ Ai dãy các biến cố {A1 , A2 , , An } xảy có ít i =1 các biến cố Ai xảy Tích hai biến cố Biến cố AB hai biến cố A, B xảy và hai biến cố A , B cùng xảy n Biến cố tích ∏ Ai dãy các biến cố {A1 , A2 , , An } xảy tất các biến cố i =1 Ai cùng xảy Biến cố xung khắc Hai biến số A, B gọi là xung khắc AB là biến cố không thể Hệ đầy đủ các biến cố Dãy các biến cố A1 , A2 , , An gọi là hệ đầy đủ các biến cố chúng xung khắc đôi và tổng chúng là biến cố chắc Tính độc lập các biến cố Hai biến cố A và B gọi là độc lập với việc xảy hay không xảy biến cố này không ảnh hưởng tới việc xảy hay không xảy biến cố Tổng quát các biến cố A1 , A2 , , An gọi là độc lập việc xảy hay không xảy nhóm k biến cố, đó ≤ k ≤ n , không làm ảnh hưởng tới việc xảy hay không xảy các biến cố còn lại Qui tắc cộng Trường hợp xung khắc: P( A ∪ B) = P( A) + P( B) ⎛ n ⎞ n P⎜ ∪ Ai ⎟ = ∑ P ( Ai ) ⎜ ⎟ ⎝ i =1 ⎠ i =1 19 (19) Chương 1: Biến cố ngẫu nhiên và xác xuất Trường hợp tổng quát: P( A ∪ B) = P( A) + P( B) − P( AB) P( A ∪ B ∪ C ) = P( A) + P( B) + P(C ) − P( AB) − P( BC ) − P(CA) + P( ABC) ⎞ n ⎛ n P⎜ ∪ Ai ⎟ = ∑ P ( Ai ) − ∑ P ( Ai A j ) + ∑ P ( Ai A j Ak ) + ⎟ ⎜ i< j i< j <k ⎝ i =1 ⎠ i =1 + ( −1) n−1 P ( A1 A2 An ) Quy tắc xác suất biến cố đối P( A ) = − P( A) Xác suất có điều kiện Xác suất biến cố B tính điều kiện biết biến cố A đã xảy gọi là xác suất B với điều kiện A , ký hiệu P (B A) Quy tắc nhân Trường hợp độc lập: P( AB) = P( A) P( B) ; P( A1 A2 An ) = P( A1 )P( A2 ) P( An ) Trường hợp không độc lập: P ( AB ) = P ( A) P (B A) ; P ( A1 A2 An ) = P ( A1 ) P ( A2 A1 ) P ( A3 A1 A2 ) P ( An A1 A2 An−1 ) Công thức xác suất đầy đủ Giả sử { A1 , A2 , , An } là hệ đầy đủ Với biến cố B ta có: n P( B ) = ∑ P ( Ai ) P ( B Ai ) i =1 Công thức Bayes Nếu { A1 , A2 , , An } là hệ đầy đủ và với biến cố B cho P( B) > ta có : P ( Ak B ) = P ( Ak ) P ( B Ak ) P ( Ak B ) = n P( B) ∑ P( Ai ) P ( B Ai ) i =1 Nguyên lý xác suất nhỏ Nếu biến cố có xác suất nhỏ thì thực tế có thể cho phép thử biến cố đó không xảy Nguyên lý xác suất lớn Nếu biến cố A có xác suất gần thì trên thực tế có thể cho biến cố đó xảy phép thử 20 (20) Chương 1: Biến cố ngẫu nhiên và xác xuất CÂU HỎI ÔN TẬP VÀ BÀI TẬP 1.1 Ta có thể có hai không gian mẫu Ω các biến cố sơ cấp cho cùng phép thử Đúng Sai C? 1.2 Các biến cố A và A ∪ B là xung khắc Đúng Sai 1.3 Hai biến cố A và B là xung khắc thì P( A ∪ B) = P( A) + P( B) Đúng Sai 1.4 Thông tin liên quan đến việc xuất biến cố B làm tăng xác suất biến cố A , tức là P ( A B ) ≥ P ( A) ? Đúng Sai 1.5 Hai biến cố xung khắc là hai biến cố độc lập Đúng Sai 1.6 Các biến cố đối hai biến cố độc lập là độc lập Đúng Sai 1.7 Xác suất tổng hai biến cố độc lập tổng xác suất hai biến cố này Đúng Sai 1.8 Xác suất tích biến cố xung khắc tích xác suất Đúng Sai { } 1.9 Hệ biến cố A, A là hệ đầy đủ Đúng Sai 1.10 Cho Ω = {a, b, c, d } đó các biến cố sơ cấp là đồng khả Biến cố A = {a, b} và B = {a, c} là phụ thuộc vì chúng cùng xảy biến cố sơ cấp a xảy Đúng Sai 1.11 Trong hòm đựng 10 chi tiết đạt tiêu chuẩn và chi tiết là phế phẩm Lấy đồng thời chi tiết Tính xác suất: a) Cả chi tiết lấy thuộc loại đạt tiêu chuẩn b) Trong số chi tiết lấy có chi tiết đạt tiêu chuẩn 1.12 Thang máy tòa nhà tầng xuất phát từ tầng với khách Tìm xác suất để: a) Tất cùng tầng bốn 21 (21) Chương 1: Biến cố ngẫu nhiên và xác xuất b) Tất cùng tầng c) Mỗi người tầng khác 1.13 Một người gọi điện thoại cho bạn lại quên chữ số cuối và nhớ chúng khác Tìm xác suất để người đó quay số lần đúng số điện thoại bạn 1.14 Ta kiểm tra theo thứ tự lô hàng có 10 sản phẩm Mỗi sản phẩm thuộc hai loại: Tốt Xấu Ký hiệu Ak ( k = 1,10 ) là biến cố sản phẩm kiểm tra thứ k thuộc loại xấu Biểu diễn các biến cố sau theo Ak : a) Cả 10 sản phẩm xấu b) Có ít sản phẩm xấu c) Có sản phẩm kiểm tra đầu là tốt, các sản phẩm còn lại là xấu d) Có sản phẩm kiểm tra đầu là xấu 1.15 Hai người cùng bắn vào mục tiêu Khả bắn trúng người là 0,8 và 0,9 Tìm xác suất: a) Chỉ có người bắn trúng mục tiêu b) Có người bắn trúng mục tiêu c) Cả hai người bắn trượt 1.16 Cơ cấu chất lượng sản phẩm nhà máy sau: 40% là sản phẩm loại I, 50% là sản phẩm loại II, còn lại là phế phẩm Lấy ngẫu nhiên sản phẩm nhà máy Tính xác suất sản phẩm lấy là phế phẩm 1.17 Tín hiệu thông tin phát lần độc lập Xác suất thu tin lần phát là 0,4 Tính xác suất để thu thông tin đó 1.18 Có 1000 vé số đó có 20 vé trúng thưởng Một người mua 30 vé, tìm xác suất để người đó trúng vé 1.19 Để nhập kho, sản phẩm nhà máy phải qua vòng kiểm tra chất lượng độc lập Xác suất phát phế phẩm các vòng theo thứ tự là 0,8; 0,9 và 0,99 Tính xác suất phế phẩm nhập kho 1.20 Một thủ kho có chùm chìa khóa gồm trông giống hệt đó có mở kho Anh ta thử ngẫu nhiên chìa khóa một, nào thử thì không thử lại Tính xác suất mở cửa lần thử thứ 1.21 Một lô hàng có sản phẩm Mỗi lần kiểm tra chất lượng lấy ngẫu nhiên sản phẩm Sau kiểm tra xong trả lại vào lô hàng Tính xác suất để sau lần kiểm tra lô hàng, tất các sản phẩm kiểm tra 22 (22) Chương 1: Biến cố ngẫu nhiên và xác xuất 1.22 Một nhà máy ô tô có ba phân xưởng I, II, III cùng sản xuất loại pít-tông Phân xưởng I, II, III sản xuất tương ứng 36%, 34%, 30% sản lượng nhà máy, với tỷ lệ phế phẩm tương ứng là 0,12; 0,1; 0,08 a) Tìm tỷ lệ phế phẩm chung nhà máy b) Lấy ngẫu nhiên sản phẩm kiểm tra và sản phẩm là phế phẩm Tính xác suất để phế phẩm đó là phân xưởng I, II, III sản xuất 1.23 Có bốn nhóm xạ thủ tập bắn Nhóm thứ có người, nhóm thứ hai có người, nhóm thứ ba có người và nhóm thứ tư có người Xác suất bắn trúng đích người nhóm thứ nhất, nhóm thứ hai, nhóm thứ ba và nhóm thứ tư theo thứ tự là 0,8; 0,7; 0,6 và 0,5 Chọn ngẫu nhiên xạ thủ và biết xạ thủ này bắn trượt Hãy xác định xem xạ thủ này có khả nhóm nào 1.24 Bắn hai lần độc lập với lần viên đạn vào cùng bia Xác suất trúng đích viên đạn thứ là 0,7 và viên đạn thứ hai là 0,4 Tìm xác suất để có viên đạn trúng bia (biến cố A) Sau bắn, quan trắc viên báo có vết đạn bia Tìm xác suất để vết đạn đó là vết đạn viên đạn thứ 1.25 Một trạm phát hai tín hiệu A và B với xác suất tương ứng 0.85 và 0.15 Do có nhiễu trên đường truyền nên tín hiệu A bị méo và thu tín hiệu B còn tín hiệu B bị méo và thu A a) Tìm xác suất thu tín hiệu A b) Giả sử đã thu tín hiệu A Tìm xác suất thu đúng tín hiệu lúc phát 1.26 Một nhà máy sản xuất chi tiết điện thoại di động có tỷ lệ sản phẩm đạt tiêu chuẩn chất lượng là 85% Trước xuất xưởng người ta dùng thiết bị kiểm tra để kết luận sản phẩm có đạt yêu cầu chất lượng hay không Thiết bị có khả phát đúng sản phẩm đạt tiêu chuẩn với xác suất là 0,9 và phát đúng sản phẩm không đạt tiêu chuẩn với xác suất là 0,95 Tìm xác suất để sản phẩm chọn ngẫu nhiên sau kiểm tra: a) Được kết luận là đạt tiêu chuẩn b) Được kết luận là đạt tiêu chuẩn thì lại không đạt tiêu chuẩn c) Được kết luận đúng với thực chất nó 23 (23) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất CHƯƠNG II: BIẾN NGẪU NHIÊN VÀ LUẬT PHÂN BỐ XÁC SUẤT GIỚI THIỆU Trong chương này ta khảo sát các biến cố gắn với các giá trị nào đó, các giá trị này thay đổi ta các biến ngẫu nhiên Khái niệm biến ngẫu nhiên (còn gọi là đại lượng ngẫu nhiên) và các đặc trưng chúng là khái niệm quan trọng lý thuyết xác suất Đối với biến ngẫu nhiên ta quan tâm đến vấn đề biến ngẫu nhiên này nhận giá trị nào đó nhận giá trị khoảng nào đó với xác suất bao nhiêu Nói cách khác biến ngẫu nhiên X có thể khảo sát thông qua hàm phân bố xác suất nó F ( x ) = P { X < x} Như ta biết qui luật phân bố xác suất biến ngẫu nhiên thì ta đã nắm toàn thông tin biến ngẫu nhiên này Khi biến ngẫu nhiên nhận các giá trị rời rạc thì hàm phân bố xác suất hoàn toàn xác định bảng phân bố xác suất, đó là bảng ghi các giá trị mà biến ngẫu nhiên nhận với xác suất tương ứng Khi biến ngẫu nhiên nhận giá trị liên tục thì hàm phân bố xác suất xác định hàm mật độ xác suất Các biến ngẫu nhiên đặc biệt thường gặp xét chương sau Ngoài phương pháp sử dụng hàm phân bố để xác định biến ngẫu nhiên, nhiều trường hợp bài toán đòi hỏi cần khảo sát đặc trưng biến ngẫu nhiên Các đặc trưng biến ngẫu nhiên chia thành hai loại sau: ™ Các đặc trưng cho vị trí trung tâm biến ngẫu nhiên như: Kỳ vọng, Trung vị, Mốt ™ Các đặc trưng cho độ phân tán biến ngẫu nhiên như: Phương sai, Độ lệch chuẩn, Hệ số biến thiên, Hệ số bất đối xứng và Hệ số nhọn Trong các bài toán thực tế kỳ vọng sử dụng dạng lợi nhuận kỳ vọng còn phương sai để tính mức độ rủi ro định Trong kỹ thuật độ lệch chuẩn biểu diễn sai số phép đo Để học tốt chương này học viên phải nắm vững định nghĩa xác suất, biến cố và các tính chất chúng Các đặc trưng biến ngẫu nhiên xác định thông qua tính tổng các số hạng nào đó (trường hợp biến ngẫu nhiên rời rạc) tính tích phân xác định (trường hợp biến ngẫu nhiên liên tục) Vì học viên cần ôn tập tích phân xác định 24 (24) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất NỘI DUNG 2.1 ĐỊNH NGHĨA VÀ PHÂN LOẠI BIẾN NGẪU NHIÊN 2.1.1 Khái niệm biến ngẫu nhiên Định nghĩa 2.1: Biến ngẫu nhiên X là đại lượng nhận các giá trị nào đó phụ thuộc vào các yếu tố ngẫu nhiên Người ta thường ký hiệu các biến ngẫu nhiên các chữ in hoa X , Y , Z , và các chữ thường ký hiệu các trị số chúng Vì với biến ngẫu nhiên X và với giá trị thực x ∈  thì {X < x} là biến cố ngẫu nhiên Đối với biến ngẫu nhiên người ta quan tâm xem nó nhận giá trị nào đó nhận giá trị khoảng nào đó với xác suất bao nhiêu Ví dụ 2.1: Các đại lượng sau là biến ngẫu nhiên: • Số nốt xuất gieo xúc xắc • Tuổi thọ thiết bị hoạt động • Số khách hàng vào điểm phục vụ đơn vị thời gian • Số gọi đến tổng đài • Sai số đo lường đại lượng vật lý … 2.1.2 Phân loại Người ta phân các biến ngẫu nhiên thành hai loại: ™ Biến ngẫu nhiên rời rạc nó nhận số hữu hạn vô hạn đếm các giá trị Nghĩa là có thể liệt kê các giá trị thành dãy x1 , x , ™ Biến ngẫu nhiên liên tục các giá trị nó có thể lấp đầy các khoảng hữu hạn vô hạn và xác suất P{X = a} không với a Ví dụ 2.2: • Gọi X là số nốt xuất gieo xúc xắc thì X là biến ngẫu nhiên rời rạc nhận các giá trị 1, 2,3, 4,5, • Gọi Y là tuổi thọ thiết bị hoạt động thì Y là biến ngẫu nhiên liên tục nhận giá trị khoảng • Gọi Z là số khách hàng vào điểm phục vụ đơn vị thời gian, Z là biến ngẫu nhiên rời rạc nhận các giá trị 0,1, 2, • Số gọi đến tổng đài là biến ngẫu nhiên rời rạc nhận các giá trị 0,1, 2, 25 (25) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất • Sai số đo lường đại lượng vật lý Y nào đó là biến ngẫu nhiên liên tục nhận giá trị khoảng 2.2 QUY LUẬT PHÂN BỐ XÁC SUẤT CỦA BIẾN NGẪU NHIÊN Biến ngẫu nhiên nhận các giá trị nào đó phụ thuộc vào yếu tố ngẫu nhiên vì có thể sử dụng các phương pháp sau để xác định luật phân bố xác suất biến ngẫu nhiên 2.2.1 Hàm phân bố xác suất Định nghĩa 2.2: Hàm phân bố xác suất (cumulative distribution function, viết tắt CDF) biến ngẫu nhiên X là hàm số F (x) xác định với x ∈  công thức: F ( x) = P{X < x}; − ∞ < x < ∞ (2.1) Hàm phân bố có các tính chất sau: a ≤ F ( x) ≤ với x ∈  , (2.2) b F (x) là hàm không giảm, liên tục bên trái Nếu X là biến ngẫu nhiên liên tục thì F (x) là hàm liên tục c F ( −∞ ) = lim F ( x ) = ; F ( +∞ ) = lim F ( x) = , (2.3) d P{a ≤ X < b} = F (b) − F (a ) (2.4) x→−∞ x→+∞ 2.2.2 Bảng phân bố xác suất biến ngẫu nhiên rời rạc Giả sử biến ngẫu nhiên X nhận các giá trị x1 , x , với xác suất tương ứng pi = P{X = xi } pi > và ∑ pi = i Bảng phân bố xác suất X có dạng sau: X P ƒ x1 p1 x2 p2 (2.5) Nếu biến ngẫu nhiên rời rạc X nhận vô hạn các giá trị x1 , x , thì hàm phân bố có dạng: ⎧ F ( x) = ⎨ ⎩ p1 + p2 + nÕu + pk −1 nÕu x ≤ x1 xk −1 < x ≤ xk , ∀ k > (2.6) Đồ thị F (x) là hàm bậc thang có bước nhảy x1 , x , ƒ Nếu X nhận các giá trị x1, x2 , , xn thì các biến cố {X 26 = x1} , { X = x2 } , , { X = xn } (2.7) (26) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất lập thành hệ đầy đủ các biến cố Hàm phân bố có dạng: ⎧ ⎪ F ( x) = ⎨ p1 + p2 + ⎪ ⎩ nÕu + pk −1 nÕu x ≤ x1 xk −1 < x ≤ xk , < k ≤ n (2.8) x > xn nÕu Ví dụ 2.3: Chọn ngẫu nhiên bi từ túi có bi đen, bi trắng Gọi X là số bi trắng bi vừa chọn thì X là biến ngẫu nhiên rời rạc Tìm bảng phân bố và hàm phân bố biến ngẫu nhiên X Giải: P { X = 0} = P { X = 3} = C43 C10 C63 C10 = = 30 Bảng phân bố xác suất: Hàm phân bố: Đồ thị: C 2C1 15 C1C , P { X = 1} = = , P { X = 2} = = , 3 30 30 30 C10 C10 X P / 30 15 / 30 / 30 / 30 ⎧0 ⎪5 / 30 ⎪⎪ F ( x) = ⎨20 / 30 ⎪29 / 30 ⎪ ⎪⎩ nÕu x ≤ nÕu < x ≤ nÕu < x ≤ nÕu < x ≤ nÕu x > y 30 / 30 29 / 30 20 / 30 / 30 O x 27 (27) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất 2.2.3 Hàm mật độ phân bố xác suất biến ngẫu nhiên liên tục Định nghĩa 2.3: Giả sử X là biến ngẫu nhiên liên tục có hàm phân bố F (x) Nếu tồn hàm f (x) cho với x ∈  x F ( x) = ∫ f (t )dt (2.9) −∞ thì f (x) gọi là hàm mật độ biến ngẫu nhiên X (probability density function, viết tắt PDF) Như giá trị hàm F (x) diện tích hình phẳng giới hạn đồ thị hàm mật độ f (x) , trục hoành và đường thẳng song song với trục tung có hoàng độ là x f ( x) F (x) x x Tính chất hàm mật độ a F ' ( x) = f ( x) các điểm x mà f (x) liên tục b (2.10) f ( x) ≥ với x ∈  , (2.11) ∞ c ∫ f ( x)dx = , (2.12) −∞ b d P{a < X < b} = P{a ≤ X ≤ b} = P{a < X ≤ b} = P{a ≤ X < b} = ∫ f ( x)dx a Ví dụ 2.4: Giả sử hàm phân bố xác suất biến ngẫu nhiên liên tục X có dạng: ⎧0 ⎪ F ( x) = ⎨kx ⎪1 ⎩ 28 víi x ≤ víi < x ≤ víi x > (2.13) (28) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất a) Xác định hệ số k ; b) Tìm hàm mật độ xác suất f (x) Giải: a) Vì hàm phân bố xác suất F (x) liên tục, đó x = ⇒ = F (1) = kx x =1 =k b) Theo tính chất (2.10) hàm mật độ xác suất ta có ⎧0 ⎪ f ( x ) = ⎨2 x ⎪0 ⎩ víi x ≤ víi < x ≤ víi x > Ví dụ 2.5: Biến ngẫu nhiên liên tục X có hàm mật độ dạng ⎧0 ⎪ f ( x) = ⎨ k ⎪ ⎩x víi x < víi x ≥ Hãy xác định: a) Hệ số k ; b) Hàm phân bố F (x) ; c) Xác suất P{2 < X < 3} ; d) Xác suất để phép thử độc lập biến ngẫu nhiên X không lấy giá trị khoảng (2, 3) Giải: a) Dựa vào tính chất (2.12) ta có: ∞ 1= ∫ −∞ ∞ f ( x)dx = ⎛k a⎞ ⎜ ⎟ = k , từ đó k = = − dx lim ∫ x2 a →∞⎜ x ⎟ ⎝ ⎠ k b) Từ công thức (2.9) xác định hàm mật độ ta có víi x < ⎧0 ⎪ F ( x) = ∫ f (t )dt = ⎨ x − víi x ≥ ⎪⎩ x −∞ x c) Từ công thức (2.13) ta có P{2 < X < 3} = F (3) − F (2) = 1 − = 29 (29) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất = 6 Vậy xác suất để phép thử độc lập biến ngẫu nhiên X không lấy giá trị khoảng d) Xác suất để X không lấy giá trị khoảng (2, 3) phép thử − ⎛5⎞ (2, 3) ⎜ ⎟ ≈ 0,48 ⎝6⎠ 2.3 CÁC THAM SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN 2.3.1 Kỳ vọng toán 2.3.1.1 Định nghĩa Kỳ vọng giá trị trung bình (average, mean value, expected value) biến ngẫu nhiên X ký hiệu là E X và xác định sau: (i) Nếu X rời rạc nhận các giá trị xi với xác suất tương ứng pi = P{X = xi } thì E X = ∑ xi pi (2.14) i (ii) Nếu X liên tục có hàm mật độ f (x) thì ∞ EX = ∫ xf ( x)dx (2.15) −∞ Kỳ vọng E X tồn chuỗi (2.14) (trường hợp rời rạc) hội tụ tuyệt đối tích phân (2.15) (trường hợp liên tục) hội tụ tuyệt đối Ví dụ 2.6: Tính kỳ vọng biến ngẫu nhiên X cho ví dụ 2.3 Giải: E X = × 15 + 1× + × + × = 30 30 30 30 Ví dụ 2.7: Theo thống kê, việc người Mỹ 25 tuổi sống thêm trên năm có xác suất là 0,992, còn xác suất để người đó chết vòng năm tới là 0,008 Một chương trình bảo hiểm đề nghị người đó bảo hiểm sinh mạng cho năm với số tiền chi trả 1000 đô la, còn tiền đóng là 10 đô la Hỏi lợi nhuận công ty bảo hiểm nhận là bao nhiêu? Giải: Rõ ràng lợi nhuận là biến ngẫu nhiên X với giá trị là + 10 đô la (nếu người bảo hiểm không chết) và − 990 đô la (nếu người đó chết) Bảng phân bố xác suất tương ứng X − 990 + 10 P 0,008 0,992 Do đó kỳ vọng E X = (−990) ⋅ 0,008 + 10 ⋅ 0,992 = Ta thấy lợi nhuận trung bình là số dương vì công ty bảo hiểm có thể làm ăn có lãi 30 (30) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất Ví dụ 2.8: Tuổi thọ loại côn trùng nào đó là biến ngẫu nhiên X (đơn vị là tháng) với hàm mật độ sau: ⎧⎪kx (4 − x) nÕu ≤ x ≤ f ( x) = ⎨ ⎪⎩ nÕu ng−îc l¹i Tìm hàm phân bố và tìm tuổi thọ trung bình loài côn trùng trên Giải: Vì ∫x (4 − x)dx = 64 ⇒ k= Hàm phân bố xác suất 64 ⎧ ⎪ ⎪ 3x ⎛ x ⎞ F ( x) = ∫ f (t )dt = ⎨ ⎜ − ⎟ 64 ⎝3 4⎠ ⎪ −∞ ⎪ ⎩ nÕu x≤0 x nÕu < x ≤ nÕu x>4 3 ⎛⎜ x ⎞⎟ Tuổi thọ trung bình E X = − = x x dx x − ( ) 64 ∫0 64 ⎜⎝ ⎟⎠ = 12 (tháng) 2.3.1.2 Ý nghĩa kỳ vọng Kỳ vọng mang ý nghĩa là giá trị trung bình mà biến ngẫu nhiên nhận Giả sử biến ngẫu nhiên X nhận các giá trị x1 , x2 , , xm với các tần số tương ứng r1 , r2 , , rm ri xi là tổng giá trị X nhận với cùng giá trị xi Do đó r1 x1 + r2 x2 + tổng tất các giá trị X nhận r x +r x + Vậy 1 2 n + rm xm = f1x1 + f x2 + + rm xm là + f m xm là giá trị trung bình X , ri là tần suất nhận giá trị xi X Trong trường hợp tổng quát thì tần suất f i n thay xác suất pi và ta có công thức (2.14) đó f i = Trường hợp biến ngẫu nhiên liên tục phép tính tổng giá trị trung bình thay phép tính tích phân xác định, công thức (2.15) Khái niệm kỳ vọng áp dụng rộng rãi nhiều lĩnh vực kinh doanh và quản lý dạng lợi nhuận kỳ vọng hay doanh số kỳ vọng Ví dụ 2.9: Giả sử cửa hàng sách dự định nhập số niên giám thống kê Nhu cầu hàng năm loại sách này cho bảng phân bố xác suất sau: Nhu cÇu j (cuèn) X¸c suÊt Pj 20 0,3 21 22 23 0,25 0,18 0,14 24 0,1 25 0,03 31 (31) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất Cửa hàng mua với giá USD/cuốn bán với giá 10 USD/cuốn Song đến cuối năm phải hạ giá bán hết với giá USD/cuốn Cửa hàng muốn xác định số lượng nhập cho lợi nhuận kỳ vọng lớn Giải: Gọi i là số lượng sách dự định nhập, j là nhu cầu Lúc đó lợi nhuận có điều kiện tương ứng xác định bởi: ⎧ 10 j − 7i + 4(i − j ) nÕu j ≤ i ⎧ j − 3i nÕu j ≤ i E ij = ⎨ =⎨ nÕu j > i ⎩ 3i nÕu j > i ⎩ 10i − 7i Các giá trị E ij cho bảng sau: Nhu cầu Pj j i 0,3 0,25 0,18 0,14 0,10 0,03 20 21 22 23 24 25 Lượng 20 60 60 60 60 60 60 Hàng 21 57 63 63 63 63 63 22 54 60 66 66 66 66 23 51 57 63 69 69 69 24 48 54 60 66 72 72 25 45 51 57 63 69 75 Nhập Với số lượng nhập i lợi nhuận trung bình tính theo công thức E i = ∑ Pj E ij j Kết Số lượng nhập i (cuốn) 20 21 22 23 24 25 Lợi nhuận kỳ vọng E i 60 61, 60,9 59,52 57,3 54, 48 Vậy cửa hàng nên nhập 21 2.3.1.3 Tính chất 1) E (C ) = C với số C 2) E (CX ) = CE ( X ) với số C 3) E ( X + + X n ) = E (X1 ) + + E (X n ) 4) Cho hàm số ϕ (x) , xét biến ngẫu nhiên Y = ϕ (X ) thì 32 (2.16) (32) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất { } ⎧ ∑ ϕ( xi ) pi nÕu X rêi r¹c cã pi = P X = xi ⎪ i ⎪ EY = ⎨ ∞ ⎪ ϕ(x)f(x)dx nÕu X liª n tôc cã hµm mËt đé f ( x) ⎪⎩ −∫∞ (2.17) Đặc biệt ta có các đẳng thức sau tổng tích phân sau tương ứng hội tụ: ⎧ ∑ xi2 pi nÕu X rêi r¹c ⎪ i ⎪ EX =⎨ ∞ ⎪ x f(x)dx nÕu X liª n tôc cã hµm mËt đé ∫ ⎪⎩ −∞ 5) Nếu X , , X n độc lập thì E ( X X n ) = E (X1 ) (2.18) f ( x) E (X n ) (2.19) Ví dụ 2.10: Chọn ngẫu nhiên bi từ túi có bi đen, bi trắng a) Nếu chọn bi trắng thưởng 200$ Gọi Y là số tiền nhận Tính kỳ vọng Y b) Nếu chọn bi trắng thưởng 200$ và chọn bi đen thưởng 300$ Gọi Z là số tiền nhận Tính kỳ vọng Z Giải: a) Gọi X là số bi trắng bi vừa chọn (xem ví dụ 2.3) thì Y = ϕ( X ) = 200 X là biến ngẫu nhiên rời rạc có bảng phân bố sau: Y = ϕ( X ) P EY = × 200 400 600 / 30 15 / 30 / 30 / 30 15 + 200 × + 400 × + 600 × = 240 = 200E X 30 30 30 30 b) Z = 200 X + 300(3 − X ) = 900 − 100 X ⇒ E Z = E (900 − 100 X ) = 900 − 100EX = 900 − 100 × = 780$ Ví dụ 2.11: Tung xúc xắc n lần Tìm kỳ vọng tổng số nốt thu Giải: Gọi X i (i = 1, , n) là số nốt thu lần tung thứ i , gọi X là tổng số nốt thu n n lần tung Như X = ∑ X i i =1 n Theo công thức (3.5) ta có E X = ∑ E X i i =1 33 (33) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất Các biến ngẫu nhiên X i có bảng phân bố xác suất sau Xi P Do đó E X i = 1/ 1/ 1/ 1/ 1/ 1/ (1 + + + + + 6) = ⇒ EX = n 2.3.2 Phương sai 2.3.2.1 Định nghĩa Phương sai (variance) hay độ lệch bình phương trung bình biến ngẫu nhiên X là đại lượng đo phân tán bình phương trung bình X xung quanh giá trị trung bình EX Phương sai X ký hiệu là DX hay var X và định nghĩa sau: DX = E ( X − E X ) (2.20) σ X = DX gọi là độ lệch tiêu chuẩn (deviation) X Khai triển vế phải công thức (2.20) và áp dụng các tính chất kỳ vọng ta có thể tính phương sai theo công thức sau: DX = E X − ( E X ) (2.21) Từ công thức (2.17) thì phương sai có thể tính theo công thức sau: (i) Nếu X rời rạc nhận các giá trị với xác suất tương ứng pi = P{X = xi } thì D X = ∑ ( xi − E X )2 pi = ∑ xi2 pi − (E X )2 i (2.22) i (ii) Nếu X liên tục có hàm mật độ f (x) thì ∞ DX = ∫ (x − E X ) ∞ f ( x)dx = −∞ ∫x f ( x )dx − (E X )2 −∞ Ví dụ 2.12: Tính phương sai biến ngẫu nhiên xét ví dụ 2.7 Giải: E X = (−990) ⋅ 0, 008 + 102 ⋅ 0,992 = 7940 ⇒ DX = EX − ( EX ) = 7940 − = 7936 ⇒ σ X = DX = 7936 ≈ 89,08 Điều này nói lên mặc dù kinh doanh bảo hiểm có lãi rủi ro khá lớn 34 (2.23) (34) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất Ví dụ 2.13: Tính phương sai biến ngẫu nhiên xét ví dụ 2.8 3 ⎛⎜ x x ⎞⎟ Giải: E X = x (4 − x)dx = − 64 ∫0 64 ⎜⎝ ⎟⎠ ⇒ DX = EX − (EX )2 = = 32 32 ⎛ 12 ⎞ 16 ⇒ σX = −⎜ ⎟ = ⎝5⎠ 25 2.3.2.2 Ý nghĩa và ứng dụng thực tế phương sai Phương sai biến ngẫu nhiên X là độ lệch bình phương trung bình quanh giá trị trung bình E X Trong kỹ thuật phương sai đặc trưng cho mức độ phân tán các chi tiết gia công hay sai số thiết bị Trong quản lý và kinh doanh thì phương sai đặc trưng cho mức độ rủi ro các định Ví dụ 2.8 cho thấy đầu tư bảo hiểm cho người 25 tuổi là có lãi, ví dụ 2.12 cho thấy rủi ro bảo hiểm lớn Ví dụ 2.14: Một nhà đầu tư cân nhắc việc đầu tư vào hai dự án A và B hai lĩnh vực độc lập Khả thu hồi vốn sau năm (tính %) hai dự án là các biến ngẫu nhiên có bảng phân bố sau: Dự án A XA P 65 67 68 69 70 71 73 0,04 0,12 0,16 0,28 0,24 0,08 0,08 Dự án B XB P 66 68 69 70 71 0,12 0,28 0,32 0,20 0,08 Từ các bảng phân bố xác suất trên ta tìm E X A = 69,16%; DX A = 3, 0944 ; E X B = 68, 72%; DX B = 1,8016 ; Như chọn phương án đầu tư cho tỷ lệ thu hồi vốn kỳ vọng cao thì chọn phương án A, song cần chọn phương án có độ rủi ro thu hồi vốn thấp thì chọn B 2.3.2.3 Tính chất 1) D( aX ) = a D( X ) với số a (2.24) 2) D( aX + b) = a D( X ) với số a, b (2.25) 35 (35) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất 3) Nếu X , , X n độc lập có các phương sai hữu hạn thì D ( a1 X1 + + an X n ) = a12 D ( X1 ) + + a 2n D ( X n ) (2.26) Nói riêng: Nếu X , Y độc lập và DX , DY hữu hạn thì D ( X ± Y ) = DX + DY Ví dụ 2.15: Tung xúc xắc n lần độc lập Tìm phương sai tổng số nốt xuất n Giải: Xét X = ∑ X i ví dụ 3.4 Vì các X i (i = 1, , n) độc lập nhau, theo công thức i =1 n (2.26) ta có DX = ∑ DX i i =1 Mặt khác E X i = đó DX i = ( ) 91 ; E X i2 = 12 + 2 + + + + = , 6 35 91 35 − = Vậy DX = n 12 12 2.3.3 Phân vị, Trung vị 2.3.3.1 Phân vị Phân vị mức α biến ngẫu nhiên X có hàm phân bố F (x) là giá trị vα thỏa mãn P{X < vα } ≤ α ≤ P{X ≤ vα } F (vα ) ≤ α ≤ F (vα + 0) Hay (2.27) ƒ Nếu F (x) liên tục tăng chặt thì phân vị vα là nghiệm phương trình F (x) = α , nghĩa là vα = F −1 (α ) ƒ Nếu X rời rạc có phân bố: X P x1 p1 x2 … p2 … ⎧ m, ∀ m ∈ [xi , xi +1 ] vα = ⎨ ⎩ xi +1 đặt Pi = p1 + (2.27)’ + pi thì nÕu Pi = α < Pi +1 nÕu Pi < α < Pi +1 (2.27) 2.3.3.2.Trung vị Phân vị mức 1/2 gọi là median hay trung vị X , ký hiệu MedX Như trung vị là điểm phân chia phân bố xác suất thành hai phần 36 (36) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất 2.3.4 Mốt Mốt (Mode) biến ngẫu nhiên X là giá trị mà biến ngẫu nhiên X nhận với xác suất lớn theo nghĩa sau: X P ƒ Nếu X rời rạc có phân bố: x1 p1 x2 … p2 … thì pi0 = max { p1, p2 , } (2.28) f (c) = max{ f ( x) , x ∈ } (2.29) xi0 = Mod X ⇔ ƒ Nếu X liên tục có hàm mật độ f (x) c = Mod X ⇔ Ví dụ 2.16: biến ngẫu nhiên X ví dụ 2.3 có Mốt, trung vị và ModX = MedX = Ví dụ 2.17: Tìm trung vị và Mốt biến ngẫu nhiên rời rạc có bảng phân bố xác suất X 20 21 22 23 24 P 0,3 0,25 0,18 0,14 0,13 Giải: Dễ thấy ModX = 20 Hàm phân bố xác suất X ⎧0 ⎪ 0,3 ⎪ ⎪⎪ 0,55 F ( x) = ⎨ ⎪ 0,73 ⎪ 0,87 ⎪ ⎪⎩ nÕu nÕu nÕu nÕu nÕu nÕu x ≤ 20 20 < x ≤ 21 21 < x ≤ 22 22 < x ≤ 23 23 < x ≤ 24 x > 24 Từ đó suy MedX = 21 Ví dụ 2.18: Tìm MedX và ModX biến ngẫu nhiên liên tục X xét ví dụ 2.4 Giải: MedX là nghiệm phương trình F ( x) = x = ⎧0 ⎪ Hàm mật độ f ( x) = ⎨2 x ⎪0 ⎩ 1 ⇒ MedX = 2 víi x ≤ víi < x ≤ đạt cực đại x = , ModX = víi x > Ví dụ 2.19: Tìm MedX và ModX biến ngẫu nhiên liên tục X có hàm mật độ xác định sau: 37 (37) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất ⎧3 ⎪ x(2 − x ) f ( x) = ⎨ ⎪⎩ víi ≤ x ≤ nÕu tr¸i l¹i Giải: Hàm phân bố xác suất: víi x ≤ ⎧ ⎪ x3 ⎞ ⎪3 ⎛ F ( x) = ⎨ ⎜ x − ⎟ víi < x ≤ ⎜ ⎟⎠ ⎪4 ⎝ ⎪ víi x > ⎩ MedX là nghiệm phương trình F ( x) = ⎪⎧ x − x + = ⇔⎨ Từ đó MedX = ⎪⎩0 < x ≤ ⎧3 ⎪ (1 − x ) Hàm mật độ f (x) có đạo hàm f ' ( x) = ⎨ ⎪⎩ víi < x < đổi dấu từ dương sang nÕu tr¸i l¹i âm qua x = , đó đạt cực đại điểm này Vậy ModX = 2.3.5 Moment, hệ số bất đối xứng, hệ số nhọn mk = EX k ; k = 1, 2, (2.8) Moment quy tâm cấp k μ k = E ( X − EX )k ; k = 1, 2, (2.9) 3) Hệ số bất đối xứng α3 = 4) Hệ số nhọn α4 = 1) Moment gốc cấp k 2) μ3 σ3 μ4 σ4 với σ = DX (2.10) (2.11) Nhận xét: ƒ m1 = EX , μ1 = , μ = DX ƒ α đo mức độ bất đối xứng luật phân bố : Nếu α < thì phân bố xác suất và đồ thị hàm mật độ lệch bên trái α = thì phân bố xác suất và đồ thị hàm mật độ đối xứng α > thì phân bố xác suất và đồ thị hàm mật độ lệch bên phải ƒ Hệ số nhọn α đặc trưng cho độ nhọn đồ thị hàm mật độ so với đồ thị hàm mật độ phân bố chuẩn 38 (38) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất Với biến ngẫu nhiên có phân bố chuẩn thì α = α > thì đồ thị hàm mật độ nhọn so với đồ thị hàm mật độ chuẩn α < thì đồ thị hàm mật độ tù so với đồ thị hàm mật độ chuẩn ƒ Khi phân bố X đối xứng gần đối xứng thì dùng kỳ vọng để định vị là tốt nhất, song phân bố X quá lệch thì nên dùng Median và Mode để định vị TÓM TẮT Biến ngẫu nhiên Biến ngẫu nhiên X là đại lượng nhận các giá trị nào đó phụ thuộc vào các yếu tố ngẫu nhiên, nghĩa là với giá trị thực x ∈  thì {X < x} là biến cố ngẫu nhiên Người ta phân các biến ngẫu nhiên thành hai loại: ™ Biến ngẫu nhiên rời rạc nó nhận số hữu hạn vô hạn đếm các giá trị Nghĩa là có thể liệt kê các giá trị thành dãy x1 , x , ™ Biến ngẫu nhiên liên tục các giá trị nó có thể lấp đầy các khoảng hữu hạn vô hạn và xác suất P{X = a} = với a Hàm phân bố xác suất Hàm phân bố xác suất biến ngẫu nhiên X là hàm số F (x) xác định với x ∈  công thức: F ( x) = P{X < x}; − ∞ < x < ∞ Bảng phân bố xác suất biến ngẫu nhiên rời rạc Giả sử biến ngẫu nhiên X nhận các giá trị x1 , x , với xác suất tương ứng pi = P{X = xi } pi > và ∑ pi = Bảng phân bố xác suất X có dạng sau: i X P x1 p1 x2 p2 Hàm mật độ phân bố xác suất biến ngẫu nhiên liên tục Giả sử X là biến ngẫu nhiên liên tục có hàm phân bố F (x) Hàm mật độ biến ngẫu nhiên X là hàm f (x) cho với x ∈  , F ( x) = x ∫ f (t )dt −∞ Kỳ vọng Kỳ vọng giá trị trung bình biến ngẫu nhiên X định nghĩa và ký hiệu sau: 39 (39) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất rời rạc nhận các giá trị với xác suất tương ứng pi = P{X = xi } thì ƒ Nếu X E X = ∑ xi p i i ∞ ƒ Nếu X liên tục có hàm mật độ f (x) thì E X = ∫ xf ( x)dx −∞ Khái niệm kỳ vọng áp dụng rộng rãi nhiều lĩnh vực kinh doanh và quản lý dạng lợi nhuận kỳ vọng hay doanh số kỳ vọng Phương sai Phương sai hay độ lệch bình phương trung bình biến ngẫu nhiên X là đại lượng đo phân tán bình phương trung bình X xung quanh giá trị trung bình EX Phương sai X ký hiệu là DX hay var X và định nghĩa sau: DX = E ( X − E X ) Độ lệch tiêu chuẩn σ X = DX gọi là độ lệch tiêu chuẩn X Phân vị Phân vị mức α biến ngẫu nhiên X có hàm phân bố F (x) là giá trị vα thỏa mãn: P{X < vα } ≤ α ≤ P{X ≤ vα } hay F (vα ) ≤ α ≤ F (vα + 0) Trung vị Phân vị mức 1/2 gọi là median hay trung vị X , ký hiệu MedX Như trung vị là điểm phân chia phân bố xác suất thành hai phần Mốt Mốt (Mode) biến ngẫu nhiên X là giá trị mà biến ngẫu nhiên X nhận với xác suất lớn ƒ Nếu X rời rạc có phân bố: X P x1 p1 x2 … p2 … thì xi0 = Mod X ⇔ pi0 = max{p1 , p , } ƒ Nếu X liên tục có hàm mật độ f (x) thì: c = Mod X ⇔ f (c) = max{ f ( x) , x ∈ } Moment, hệ số bất đối xứng, hệ số nhọn Moment gốc cấp k : mk = EX k ; k = 1, 2, 40 (40) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất Moment quy tâm cấp k : μ k = E ( X − EX )k ; k = 1, 2, Hệ số bất đối xứng : α = Hệ số nhọn: α = μ4 σ4 μ3 σ3 với σ = DX ƒ Hệ số bất đối xứng α đo mức độ bất đối xứng luật phân bố ƒ Hệ số nhọn α cho phép bổ sung thêm thông tin phương sai phân bố CÂU HỎI ÔN TẬP VÀ BÀI TẬP 2.1 Biến ngẫu nhiên luôn luôn nhận giá trị dương Đúng Sai 2.2 Biến ngẫu nhiên rời rạc nhận số hữu hạn các giá trị Đúng Sai 2.3 Nếu biến ngẫu nhiên X rời rạc nhân các giá trị x1 , , xn thì hệ các biến cố {X = x1 } , …, {X = xn } lập thành hệ đầy đủ Đúng Sai 2.4 Một biến ngẫu nhiên có thể có hai hàm phân bố khác Đúng Sai 2.5 Kỳ vọng biến ngẫu nhiên rời rạc là giá trị nó lấy thường xuyên Đúng Sai 2.6 Kỳ vọng tổng hai biến ngẫu nhiên luôn luôn tổng các kỳ vọng nó Đúng Sai 2.7 Hai biến ngẫu nhiên có cùng kỳ vọng có cùng phương sai Đúng Sai 2.8 Phương sai tổng hai biến ngẫu nhiên rời rạc luôn luôn tổng phương sai nó Đúng Sai 2.9 Biến ngẫu nhiên tồn phương sai thì tồn kỳ vọng Đúng Sai 2.10 Hàm mật độ f (x) biến ngẫu nhiên liên tục có tính chất f ( x) ≥ Đúng Sai 41 (41) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất 2.11 Biến ngẫu nhiên X có bảng phân bố X −5 P 0, 0,3 0,1 0, Tính kỳ vọng EX và phương sai DX 2.12 Biến ngẫu nhiên rời rạc X nhận ba giá trị có thể có là x1, x2 , x3 Biết x1 = 4, x2 = 0, với xác suất tương ứng p1 = 0,5 , p2 = 0,3 và có kỳ vọng EX = Tìm x3 và p3 2.13 Cho X và X là hai biến ngẫu nhiên độc lập có bảng phân bố xác suất sau: X1 X2 P 0,3 0,5 0,2 P 0,2 0,8 a) Tính EX ; EX ; DX ; DX b) Tính E( X + X ) và D( X + X ) 2.14 Cho X , X , X là ba biến ngẫu nhiên độc lập có bảng phân bố xác suất sau: X1 X2 X3 P 0,6 0,4 P 0,4 0.6 P 0,8 0.2 Lập X = X1 + X + X Tính E ( X ) ; D( X ) 2.15 Hai biến ngẫu nhiên X , Y độc lập Tính D(Z ) với: a) Z = X + 3Y b) Z = −3 X + Y Cho biết D( X ) = , D(Y) = 2.16 Biến ngẫu nhiên rời rạc X nhận các giá trị có thể có là x1 = −1; x2 = ; x3 = Tìm các xác suất tương ứng p1 ; p ; p3 biết E( X ) = 0,1 và D( X ) = 0,89 2.17 Xếp ngẫu nhiên hành khách lên toa tầu I, II, III Gọi X là số khách lên toa I và Y là số khách lên toa II và III a) Tính xác suất để toa có khách b) Lập bảng phân bố xác suất biến ngẫu nhiên X và biến ngẫu nhiên Y 2.18 Tính kỳ vọng biến ngẫu nhiên liên tục X có hàm mật độ xác suất: 42 (42) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất ⎧ cos x nÕu x ∈ ( −π / 2; π / ) ⎪ f ( x) = ⎨ ⎪0 nÕu x ∉ ( −π / 2; π / ) ⎩ 2.19 Cho biến ngẫu nhiên X liên tục với hàm mật độ sau: ⎧kx nÕu ≤ x ≤ ⎪ f ( x) = ⎨k nÕu ≤ x ≤ ⎪0 nÕu tr¸i l¹i ⎩ a) Tìm k và hàm phân bố F(x) b) Tính kỳ vọng EX và phương sai DX 2.20 Tuổi thọ loài côn trùng nào đó là biến ngẫu nhiên X (đơn vị là tháng) với hàm mật độ sau: ⎧⎪kx (2 − x) nÕu ≤ x ≤ f ( x) = ⎨ nÕu tr¸i l¹i ⎪⎩0 a) Tìm k b) Tính xác suất để côn trùng chết trước nó tháng tuổi c) Tìm EX , DX 2.21 Hai xạ thủ A và B tập bắn Mỗi người bắn hai phát Xác suất bắn trúng đích A lần bắn là 0,4; còn B là 0,5 a) Gọi X là số phát bắn trúng A trừ số phát bắn trúng B Tìm phân bố xác suất X , kỳ vọng EX và phương sai DX b) Tìm phân bố xác suất Y = X và kỳ vọng EY 2.22 Một xí nghiệp có hai ô tô vận tải hoạt động Xác suất ngày làm việc các ô tô bị hỏng tương ứng 0,1 và 0,2 Gọi X là số ô tô bị hỏng thời gian làm việc Lập bảng phân bố xác suất, tính kỳ vọng EX và phương sai DX X 2.23 Cho biến ngẫu nhiên liên tục X có hàm mật độ ⎪⎧ kx nÕu ≤ x ≤ f ( x) = ⎨ ⎪⎩ víi x cßn l¹i a) Tìm k b) Tính kỳ P { X > 2} c) Tìm hàm phân bố X 43 (43) Chương II: Biến ngẫu nhiên và luật phân bố xác xuất d) Tìm α để P { X < α } = 2.24 Cho biến ngẫu nhiên rời rạc X có bảng phân bố xác suất X P k 2k 2k 3k k2 k2 k2 + k a) Xác định k b) Tính xác suất P { X ≥ 5} và P { X < 3} c) Tính kỳ vọng EX d) Tính phương sai DX 2.25 Có sản phẩm đó có chính phẩm và phế phẩm Người ta lấy sản phẩm (lấy không hoàn lại) a) Gọi X là "số phế phẩm có thể gặp phải" Lập bảng phân bố xác suất X Tính kỳ vọng EX và phương sai DX b) Gọi Y là "số chính phẩm có thể gặp phải" Lập hệ thức cho biết mối quan hệ Y và X Tính kỳ vọng EY và phương sai DY 2.26 Một nhóm có 10 người đó có nam và nữ Chọn ngẫu nhiên người Gọi X là số nữ có nhóm chọn Lập bảng phân bố xác suất X Tính kỳ vọng EX 2.27 Cho biến ngẫu nhiên liên tục X có hàm mật độ: ⎧⎪ kx (1 − x) nÕu ≤ x ≤ f ( x) = ⎨ ⎪⎩ víi x cßn l¹i a) Tìm k Tính P {0, < X < 0, 6} b) Tính kỳ vọng EX 2.28 Để kinh doanh có lãi cửa hàng rau tươi cần nhập ngày bao nhiêu kg? Biết kg rau bán lãi 50 đồng, không bán thì lỗ 20 đồng Theo dự kiến 100 ngày thì có 10 ngày không bán kg nào, 30 ngày bán 1000kg/ngày, 45 ngày bán 2000kg/ngày và15 ngày bán 3000kg/ngày 44 (44) Chương III: Một số quy luật phân bố xác suất quan trọng CHƯƠNG III: MỘT SỐ QUY LUẬT PHÂN BỐ XÁC SUẤT QUAN TRỌNG GIỚI THIỆU Trong chương này chúng ta khảo sát số quy luật phân bố xác suất quan trọng: - Quy luật không – A(p) Quy luật này thường gặp các bài toán xét xuất biến cố A nào đó phép thử mà xác suất xuất là p Trong thống kê ta xét biến ngẫu nhiên này dạng tần suất xuất biến cố A tổng thể, ví dụ tỉ lệ cử tri bỏ phiếu cho ứng cử viên A nào đó, tỉ lệ phế phẩm lô sản phẩm, tỉ lệ nẩy mầm lô hạt giống … - Quy luật nhị thức Quy luật này thường gặp dãy phép thử Bernoulli, tổng các biến ngẫu nhiên độc lập có quy luật không – A(p) - Quy luật Poisson Quy luật này thường gặp bài toán quá trình đếm xuất biến cố A nào đó: số gọi đến tổng đài, số khách hàng đến điểm phục vụ, số tai nạn (xe cộ), số các cố xảy địa điểm … khoảng thời gian xác định nào đó - Quy luật phân bố Quy luật phân bố trên đoạn là quy luật phân bố xác suất biến ngẫu nhiên liên tục đồng khả lấy giá trị khoảng đó Quy luật phân bố có ứng dụng rộng thống kê toán Nó có ý nghĩa to lớn các bài toán sử dụng phương pháp phi tham số - Quy luật chuẩn - Quy luật bình phương - Quy luật Student - Quy luật Fisher – Snedecor Phân bố chuẩn thường gặp các bài toán sai số đo đạc các đại lượng vật lý, thiên văn Trong thực tế, nhiều biến ngẫu nhiên tuân theo quy luật chuẩn tiệm cận chuẩn (định lý giới hạn trung tâm) chẳng hạn: trọng lượng, chiều cao nhóm người nào đó, điểm thi thí sinh, suất cây trồng, mức lãi suất công ty, nhu cầu tiêu thụ mặt hàng nào đó 45 (45) Chương III: Một số quy luật phân bố xác suất quan trọng Trong thống kê quy luật chuẩn và quy luật Student ứng dụng để giải các bài toán giá trị trung bình và quy luật Fisher-Snedecor giải các bài toán phương sai biến ngẫu nhiên có quy luật chuẩn Quy luật bình phương ứng dụng để kiểm định các giả thiết xác suất hệ đầy đủ Với quy luật xác suất ta khảo sát bảng phân bố xác suất hàm mật độ các tính chất và các đặc trưng nó Vì để học tốt chương này học viên cần nắm các khái niệm và kết chương và chương NỘI DUNG 3.1 QUY LUẬT KHÔNG - MỘT A(p) 3.1.1 Định nghĩa Biến ngẫu nhiên X gọi là có phân bố xác suất theo quy luật không – tham số p X nhận hai giá trị và với bảng phân bố xác suất sau: X P q p ; q = 1− p (3.1) Quy luật không – ký hiệu A( p) Giả sử ta tiến hành phép thử, đó xác suất xuất biến cố A p Gọi X là số lần xuất biến cố A phép thử đó thì X là biến ngẫu nhiên rời rạc có quy luật không – A( p) 3.1.2 Các tham số đặc trưng quy luật không – A(p) EX = ⋅ q + ⋅ p = p ; EX = ⋅ q + 12 ⋅ p = p Như kỳ vọng, phương sai và độ lệch chuẩn biến ngẫu nhiên X có phân bố không – tham số p cho EX = p ; DX = pq ; σ X = pq (3.2) Trong thực tế quy luật không – thường dùng để đặc trưng cho các dấu hiệu nghiên cứu có tính định tính đó cá thể tổng thể có dấu hiệu này không có dấu hiệu này Chẳng hạn muốn nghiên cứu giới tính khách hàng ta có thể đặc trưng cho giới tính biến ngẫu nhiên với giá trị (Nam) và (Nữ) Trong bài toán bầu cử cử tri nào bỏ phiếu cho ứng cử viên A ta cho nhận giá trị 1, ngược lại ta cho nhận giá trị Để xác định tỷ lệ phế phẩm lô hàng ta xét biến ngẫu nhiên có quy luật không - một, đó sản phẩm là phế phẩm ta cho nhận giá trị và ngược lại cho nhận giá trị 46 (46) Chương III: Một số quy luật phân bố xác suất quan trọng 3.2 QUI LUẬT NHỊ THỨC B (n ; p) 3.2.1 Định nghĩa Biến ngẫu nhiên rời rạc X nhận các giá trị 0, 1, , n với xác suất tương ứng P { X = k} = Cnk p k q n−k (3.3) đó n là số tự nhiên và < p < 1, q = − p , gọi là có phân bố nhị thức tham số n, p , ký hiệu X ~ B (n ; p) Bảng phân bố xác suất biến ngẫu nhiên có quy luật nhị thức B (n ; p) X … k … n P Cn0 p q n Cn1 pq n−1 … C nk p k q n−k … Cnn p n q 3.2.2 Dãy phép thử Bernoulli Dãy các phép thử lặp lại, độc lập, phép thử có kết cục: A , A và xác suất xuất biến cố A không đổi P( A) = p , (0 < p < 1) gọi là dãy phép thử Bernoulli p là xác suất thành công lần thử Kí hiệu H k là biến cố " A xuất đúng k lần n phép thử" Đặt: Pn (k ; p) = P( H k ) Định lý 3.1: Pn (k ; p ) = C nk p k (1 − p) n−k ; k = 0,1, , n (3.4) Chứng minh: H k là tổng C nk các biến cố xung khắc đôi nhận cách hoán vị các chữ A và A biến cố tích sau: A A A A k lÇn n−k lÇn Mỗi biến cố này có xác suất P( A A A A ) = p k (1 − p ) n − k k lÇn n − k lÇn Vậy Pn (k ; p ) = C nk p k (1 − p ) n−k Định nghĩa: Nếu Pn (m ; p) = max Pn (k ; p ) thì m gọi là giá trị chắn 0≤ k ≤ n số thành công hay giá trị có khả xảy lớn phân bố nhị thức 47 (47) Chương III: Một số quy luật phân bố xác suất quan trọng Định lý 3.2: Khi k tăng từ đến n thì Pn (k ; p) đầu tăng sau đó giảm và đạt giá trị lớn k = m thoả mãn: (n + 1) p − ≤ m ≤ (n + 1) p (3.5) Như vậy: ƒ Khi (n + 1) p không nguyên thì m = [(n + 1) p ] (là phần nguyên (n + 1) p ) ƒ Khi (n + 1) p nguyên thì m = (n + 1) p − m = (n + 1) p Pmax = Pn (m − 1; p) = Pn (m ; p) (3.6) Hệ quả: Nếu gọi X là số thành công n phép thử Bernoulli với xác suất thành công lần thử là p thì X có phân bố nhị thức B (n ; p) và ModX = m Ví dụ 3.1: Tín hiệu thông tin phát lần độc lập Xác suất thu lần là 0.4 a) Tìm xác suất để nguồn thu nhận thông tin đúng lần b) Tìm xác suất để nguồn thu nhận thông tin đó c) Tìm giá trị chắn số thành công d) Nếu muốn xác suất thu tin ≥ 0,9 thì phải phát ít bao nhiêu lần Giải: Có thể xem lần phát tin là phép thử Bernoulli mà thành công phép thử là nguồn thu nhận tin, theo giả thiết xác suất thành công mỗI lần thử là 0,4 Vậy: a) Xác suất để nguồn thu nhận thông tin đúng lần là P3 (2;0, 4) = C32 ( 0, ) ( 0, ) = 0, 288 b) Xác suất để nguồn thu nhận thông tin là P = − (0,6 )3 = 0,784 c) (n + 1) p = (3 + 1)0, = 1,6 ⇒ m = d) Xác suất để nguồn thu nhận thông tin phát n lần là P = − (0,6 )n Vậy muốn xác suất thu tin ≥ 0,9 thì phải phát ít n lần cho: − (0,6)n ≥ 0,9 ⇔ (0,6)n ≤ 0,1 ⇔ n ≥ −1 lg(0,1) = = 4,504 Chọn n = lg(0,6) − = 0,778 Nhận xét: Phân bố nhị thức 48 B (1; p) là phân bố không – A( p) (48) Chương III: Một số quy luật phân bố xác suất quan trọng Thực n phép thử Bernoulli với xác suất thành công biến cố A lần thử là p Gọi X , X , , X n là số lần xuất biến cố A lần thử thứ 1, 2, , n Các biến ngẫu nhiên X , X , , X n độc lập có cùng phân bố không - A( p) Gọi X là số thành công n phép thử Bernoulli này thì X = X1 + X + Từ (3.7) suy X ~ B (n1 ; p) và Y ~ X +Y ~ + X n ~ B (n ; p) B (n2 ; p ) (3.7) thì B (n1 + n2 ; p) (3.8) 3.2.3 Các tham số đặc trưng quy luật nhị thức Từ công thức (3.2) và (3.7) ta có công thức tính kỳ vọng, phương sai và độ lệch chuẩn biến ngẫu nhiên X ~ B (n ; p) : EX = np ; DX = npq ; σ X = npq (3.9) Từ công thức (3.5) và (3.6) ta có: ƒ Nếu (n + 1) p không nguyên thì ModX = m thỏa mãn (n + 1) p − ≤ m ≤ (n + 1) p ƒ (3.10) Nếu (n + 1) p nguyên thì ModX nhận hai giá trị ModX = m = np + p ModX = m − = np − q (3.10)’ Ví dụ 3.2: Một bưu cục có 10 loại nhật báo khác nhau, xác suất bán hết báo hàng ngày cho loại là 0,8 Vậy năm với 300 ngày mở cửa thì có khoảng bao nhiêu ngày bưu cục không bán hết báo Giải: Trong ngày nào đó ta có thể xem việc bán hết loại nhật báo là phép thử Bernoulli, gọi X là số loại báo bán hết ngày thì X ~ B (n ; p) với n = 10, p = 0,8 Vậy xác suất để ngày không bán hết báo là: P = P{X < 10} = − P{X = 10} = − 0,810 = 0,8926 Tương tự năm với 300 ngày bán hàng tương ứng với 300 phép thử Bernoulli mà kết lần thử là ngày không bán hết báo, gọi Y là số ngày năm bưu cục không bán hết báo thì Y ~ B (n ; p) với n = 300, p = 0,8926 Vậy số ngày trung bình năm mà bưu cục không bán hết báo kỳ vọng toán: EX = np = 300 ⋅ 0,8926 = 267,78 ngày 3.3 PHÂN BỐ POISSON 3.3.1 Định nghĩa Biến ngẫu nhiên X nhận các giá trị k = 0, 1, 2, với xác suất 49 (49) Chương III: Một số quy luật phân bố xác suất quan trọng P { X = k} = e−λ gọi là có phân bố Poisson tham số λ > , ký hiệu X ~ λk k! (3.11) P (λ ) Trong thực tế với số giả thiết thích hợp thì các biến ngẫu nhiên là các quá trình đếm sau: 1) Số gọi đến tổng đài 2) Số khách hàng đến điểm phục vụ 3) Số xe cộ qua ngã tư 4) Số tai nạn (xe cộ); số các cố xảy địa điểm … khoảng thời gian xác định nào đó có phân bố Poisson với tham số λ λ là tốc độ trung bình quá trình diễn khoảng thời gian này Ví dụ 3.3: Ở tổng đài điện thoại các gọi đến cách ngẫu nhiên, độc lập và trung bình có gọi phút Tìm xác suất để: a) Có đúng gọi đến phút (biến cố A) b) Không có gọi nào 30 giây (biến cố B) c) Có ít gọi 10 giây (biến cố C) Giải: Nếu ký hiệu X (t ) là số gọi đến tổng đài khoảng thời gian t phút Theo giả thiết trung bình có gọi đến tổng đài phút, trung bình có 2t gọi t phút, đó X (t ) ~ P (2t ) a) X (2) ~ P (4) , đó P( A) = P{X (2) = 5} = e −4 45 ≈ 0,156 5! P (1) , đó P( B) = P{X (1 / 2) = 0} = e −1 ≈ 0,3679 X (1 / 6) ~ P (1 / 3) , đó b) X (1 / 2) ~ c) P (C ) = P{X (1 / 6) ≥ 1} = − P{X (1 / 6) = 0} = − e −1 / ≈ 0,2835 Quy luật Poisson có ứng dụng rộng rãi nhiều lĩnh vực thực tế kiểm tra chất lượng sản phẩm, lý thuyết quản trị dự trữ, lý thuyết xếp hàng … Hầu hết các quá trình đến lý thuyết xếp hàng, hệ phục vụ đám đông, các bài toán chuyển mạch tổng đài… thường xét là quá trình đến Poisson 3.3.2 Các tham số đặc trưng quy luật Poisson Kỳ vọng và phương sai biến ngẫu nhiên X có quy luật Poisson tham số λ λ : EX = λ ; DX = λ ; σ X = λ 50 (3.12) (50) Chương III: Một số quy luật phân bố xác suất quan trọng Mốt X là giá trị m0 = ModX thỏa mãn: λ − ≤ m0 ≤ λ (3.13) Như ƒ Nếu λ nguyên thì ModX nhận giá trị là λ − λ ƒ Nếu λ không nguyên thì ModX phần nguyên λ Nếu X , X là hai biến ngẫu nhiên độc lập có phân bố Poisson tham số λ1 , λ thì X + X có phân bố Poisson: X1 + X ~ P (λ1 + λ ) (3.14) Các quy luật phân bố xét trên là các quy luật phân bố quan trọng biến ngẫu nhiên rời rạc Sau đây ta xét vài quy luật phân bố biến ngẫu nhiên liên tục 3.4 QUY LUẬT PHÂN BỐ ĐỀU U(a, b) 3.4.1 Định nghĩa Biến ngẫu nhiên X gọi là có phân bố trên [a , b] , ký hiệu X ~ U (a; b) hàm mật độ X xác định bởi: ⎧ ⎪ f ( x) = ⎨ b − a ⎪⎩ nÕu a ≤ x ≤ b (3.15) nÕu ng−îc l¹i Hàm phân bố: nÕu x < a ⎧ ⎪x − a ⎪ F ( x) = ∫ f (t )dt = ⎨ ⎪b − a −∞ ⎪⎩ x nÕu a ≤ x ≤ b (3.16) nÕu x > b Vậy X có khả nhận giá trị khoảng [a , b] là “đều nhau” và không nhận giá trị ngoài [a , b ] f (x) F (x) b−a O a x b Đồ thị hàm mật độ phân bố U(a, b) x 51 (51) Chương III: Một số quy luật phân bố xác suất quan trọng F (x) b−a O a b x Đồ thị hàm phân bố U(a, b) 3.4.2 Các tham số đặc trưng quy luật phân bố U(a, b) Bằng cách tính tích phân xác định ta nhận công thức kỳ vọng và phương sai biến ngẫu nhiên X ~ U(a, b) : (b − a ) a+b EX = ; DX = 12 Từ đồ thị hàm mật độ (3.15) ta suy rằng: MedX = EX = ∀m ∈ [a b] (3.17) a+b và ModX = m , Quy luật phân bố có nhiều ứng dụng thống kê toán mô thống kê, đặc biệt phương pháp phi tham số Trong số lý thuyết kết luận thống kê người ta thường xuất phát từ quy tắc sau đây: Nếu ta không biết gì giá trị tham số cần ước lượng thì giá trị có thể có tham số đó là đồng khả Điều đó dẫn đến việc quan niệm tham số cần ước lượng biến ngẫu nhiên có quy luật phân bố 3.5 QUY LUẬT CHUẨN N (μ ; σ ) 3.5.1 Định nghĩa Biến ngẫu nhiên liên tục X có phân bố chuẩn N (μ ; σ ) , ký hiệu X ~ N (μ ; σ ) , hàm mật độ có dạng: 52 (52) Chương III: Một số quy luật phân bố xác suất quan trọng f ( x) = e σ 2π − ( x − μ )2 2σ ; ∀ x ∈ (3.18) Phân bố chuẩn Gauss tìm năm 1809 nên nó còn gọi là phân bố Gauss Phân bố chuẩn thường thấy các bài toán sai số gặp phải đo đạc các đại lượng vật lý, thiên văn Trong thực tế, nhiều biến ngẫu nhiên tuân theo quy luật chuẩn tiệm cận chuẩn (Định lý giới hạn trung tâm) Chẳng hạn: trọng lượng, chiều cao nhóm người nào đó, điểm thi thí sinh, suất cây trồng, mức lãi suất công ty, nhu cầu tiêu thụ mặt hàng nào đó 3.5.2 Các tham số đặc trưng quy luật chuẩn Từ công thức xác định hàm mật độ (3.18) ta suy các tính chất sau đồ thị: - Nhận trục x = μ làm trục đối xứng - Tiệm cận với trục hoành x → ±∞ - Diện tích giới hạn đồ thị và trục hoành - Đạt cực đại x = μ và có giá trị cực đại σ 2π Có điểm uốn x = μ ± σ Do đó μ tăng lên thì đồ thị dịch sang phải, còn μ giảm đồ thị dịch sang trái Khi σ tăng lên thì đồ thị thấp xuống, còn σ giảm đồ thị cao lên và nhọn ModX = MedX = μ y σ <1 σ =1 σ >1 O x=μ x 53 (53) Chương III: Một số quy luật phân bố xác suất quan trọng Bằng cách tính các tích phân suy rộng ta có thể tính kỳ vọng và phương sai biến ngẫu nhiên liên tục X ~ N (μ ; σ ) : E X = μ ; DX = σ ; σ X = D X = σ (3.19) Nếu X , X là hai biến ngẫu nhiên độc lập có phân bố chuẩn X ~ N (μ1 ; σ12 ) và X ~ N (μ ; σ 22 ) thì tổ hợp tuyến tính X , X có phân bố chuẩn Đặc biệt: X + X ~ N (μ1 + μ ; σ12 + σ 22 ) (3.20) 3.5.3 Phân bố chuẩn tắc Phân bố chuẩn N (0 ;1) với kỳ vọng 0, phương sai gọi là phân bố chuẩn tắc Hàm mật độ N (0 ;1) : ϕ ( x) = e 2π − x2 ; ∀ x ∈ (3.21) Hàm phân bố N (0 ;1) : x x −t Φ ( x) = ∫ ϕ (t )dt = ∫ e dt ; ∀ x ∈  π −∞ −∞ (3.22) Có bảng tính sẵn các giá trị ϕ ( x) và Φ(x) (xem Phụ lục I và Phụ lục II) y 2π Φ(−a) − Φ (a) −a O Đồ thị hàm mật độ ϕ (x) 54 a x (54) Chương III: Một số quy luật phân bố xác suất quan trọng Các tính chất hàm phân bố Φ(x) 1) Φ( x) + Φ ( − x ) = , Φ ( − x ) = − Φ ( x ) 2) Nếu X ~ N (0 ;1) thì ∀ a > 0, P { X < a} = 2Φ ( a ) − 1, P { X > a} = (1 − Φ ( a ) ) (3.23) Định nghĩa: Giá trị U α gọi là giá trị tới hạn phân bố chuẩn tắc mức α Φ −1 (1 − α) = U α (3.24) y 2π α α U 1−α O Uα x Nếu X ~ N (0 ;1) thì ⎧⎪ ⎫⎪ ⎧⎪ ⎫⎪ P { X > Uα } = α ; P ⎨ X > U α ⎬ = α ; P ⎨ X < U α ⎬ = − α 2⎪ 2⎪ ⎩⎪ ⎭ ⎩⎪ ⎭ 3) Người ta chứng minh X ~ N (μ ; σ ) thì (3.25) X −μ ~ N (0 ;1) σ ⎧ X − μ x − μ⎫ ⎛ x−μ⎞ Từ đó ta có F ( x) = P{X < x} = P ⎨ < ⎟ ⎬ = Φ⎜ σ ⎭ ⎩ σ ⎝ σ ⎠ ⎛a−μ⎞ ⎧a − μ X − μ b − μ ⎫ ⎛b−μ⎞ P{a < X < b} = P ⎨ < < ⎟ ⎟ − Φ⎜ ⎬ = Φ⎜ σ ⎭ σ ⎝ σ ⎠ ⎩ σ ⎝ σ ⎠ (3.26) (3.26)’ Xác suất sai lệch biến ngẫu nhiên có quy luật chuẩn X ~ N (μ ; σ ) và kỳ vọng nó tính theo công thức: ⎛ε ⎞ P { X − μ < ε } = 2Φ ⎜ ⎟ − ⎝σ ⎠ (3.27) 55 (55) Chương III: Một số quy luật phân bố xác suất quan trọng Ví dụ 3.4: Giả sử X ~ N (μ ; σ ) , μ = 2100, σ = 200 Hãy tìm: a) P{X > 2400} b) P{1700 < X < 2200} c) Xác định a để P{X > a} = 0,03 Giải: ⎛ 2400 − 2100 ⎞ a) P{X > 2400} = − Φ⎜ ⎟ = − Φ (1,5) = − 0,9332 = 0,0668 200 ⎠ ⎝ b) Áp dụng công thức (3.23): ⎛ 1700 − 2100 ⎞ ⎛ 2200 − 2100 ⎞ P{1700 < X < 2200} = Φ⎜ ⎟ = Φ(0,5) − Φ(−2) = 0,6688 ⎟ − Φ⎜ 200 200 ⎠ ⎝ ⎠ ⎝ ⎛ a − 2100 ⎞ ⎛ a − 2100 ⎞ c) P{X > a} = − Φ⎜ ⎟ = 0,97 ⎟ = 0,03 ⇒ Φ⎜ ⎝ 200 ⎠ ⎝ 200 ⎠ Tra bảng ta 0,97 = Φ(1,881) ⇒ a − 2100 = 1,881 ⇒ a = 2476,2 200 3.5.4 Quy tắc hai xích ma và ba xích ma Nếu công thức (3.27) ta đặt ε = 2σ tức là hai lần độ lệch chuẩn X thì P { X − μ < 2σ } = 2Φ ( ) − = 0,9544 Vậy P {μ − 2σ < X < μ + 2σ } = 0, 9544 (3.28) P {μ − 3σ < X < μ + 3σ } = 0,9973 (3.29) Tương tự thay ε = 3σ ta Hai công thức trên là sở quy tắc hai xích ma và ba xích ma: Nếu X có phân bố chuẩn N (μ ; σ ) thì có đến 95,44% giá trị X nằm khoảng ( μ − 2σ ; μ + 2σ ) và toàn giá trị X nằm khoảng ( μ − 3σ ; μ + 3σ ) 3.5.5 Tính gần đúng phân bố nhị thức Giả sử X , X , , X n độc lập có cùng phân bố không – A( p) Theo công thức (3.7) ta có U n = X1 + X + 56 + X n ~ B (n ; p) Công thức (3.3) cho phép tính xác suất P {U n = k } = Cnk p k q n− k (56) Chương III: Một số quy luật phân bố xác suất quan trọng Tuy nhiên n khá lớn ta không thể áp dụng công thức này để tính mà cần đến công thức xấp xỉ 3.5.5.1 Tính gần đúng phân bố nhị thức phân bố chuẩn Định lý Moivre –Laplace: Với x ∈ : ⎧⎪U − np ⎫⎪ < x ⎬ = Φ( x) lim P ⎨ n n→∞ ⎩ ⎪ npq ⎪⎭ Do đó n đủ lớn ⎧⎪U − np x − np ⎫⎪ ⎛ x − np ⎞ < P {U n < x} = P ⎨ n ⎟⎟ ⎬ ≈ Φ ⎜⎜ npq ⎪⎭ ⎩⎪ npq ⎝ npq ⎠ Định lý Moivre-Laplace cho phép xấp xỉ phân bố nhị thức B (n ; p) (3.30) với phân bố chuẩn N (np ; npq) n đủ lớn (công thức 3.30) Người ta thấy xấp xỉ là tốt np và nq lớn npq > 20 Nếu X ~ B (n ; p) thì n đủ lớn ta có công thức tính xấp xỉ: Pn (k ; p ) = P{X = k } ≈ ⎛ k − np ⎞ ⎟= ϕ⎜ npq ⎜⎝ npq ⎟⎠ 1 npq 2π e −( k −np ) 2 npq ⎛ b − np ⎞ ⎛ a − np ⎞ −Φ⎜ P {a < X < b} ≈ Φ ⎜ ⎟ ⎜ npq ⎟ ⎜ npq ⎟⎟ ⎝ ⎠ ⎝ ⎠ (3.31) (3.32) Ví dụ 3.5: Gieo 3200 lần đồng xu cân đối và đồng chất Gọi X là số lần xuất mặt sấp 3200 lần gieo đó a) Tìm số lần xuất mặt sấp có khả Tính xác suất tương ứng { } b) Tính xác suất P + 1600 ≤ X ≤ 10 + 1600 Giải: a) Ta có: n = 3200 , p = 0,5 ⇒ (n + 1) p = 1600,5 Vậy số lần xuất mặt sấp có khả là 1600 với xác suất tương ứng: P3200 (1600;0,5) = 3200! 0,53200 1600!1600! Mặt khác tính gần đúng ta có: xm = 1600 − 3200 ⋅ 0,5 = Do đó: 3200 ⋅ 0,5 ⋅ 0,5 57 (57) Chương III: Một số quy luật phân bố xác suất quan trọng P3200 (1600;0,5) ≈ 1 ϕ (0) = ≈ 0, 014 3200 ⋅ 0,5 ⋅ 0,5 40 π X − 1600 ⎧ ⎫ b) P ≤ X − 1600 ≤ 10 = P ⎨0, 25 ≤ ≤ 0,5⎬ ≈ Φ (0,5) − Φ (0, 25) = 0, 09 20 ⎩ ⎭ { } 3.5.5.2 Tính gần đúng phân bố nhị thức phân bố Poisson Khi npq bé thì xấp xỉ B (n ; p) N (np ; npq) không tốt Tuy nhiên trường hợp n > 50 và p < 0,1 người ta chứng minh có thể xấp xỉ P (np) tham số λ = np B (n ; p) với phân bố Poisson Ví dụ 3.6: Một nhà phân tích kinh tế tiên đoán 3,5% số công ti nhỏ miền A bị lý phá sản năm tới Với mẫu ngẫu nhiên gồm 100 công ti chọn Tìm xác suất để ít công ti mẫu bị lý phá sản năm tới (giả sử tiên đoán nhà phân tích trên là đúng) Giải: Gọi X là số công ti bị phá sản năm tới 100 công ti lấy mẫu thì X ~ B (n ; p) với n = 100, p = 0, 035 Ta có thể xấp xỉ X ~ P (np) = P (3,5) Ta cần tính: ⎧⎪ 3,5 3,52 ⎫⎪ P { X ≥ 3} = − ⎡⎣ P { X = 0} + P { X = 1} + P { X = 2} ⎤⎦ = − e−3,5 ⎨1 + + ⎬ 1! 2! ⎪⎭ ⎪⎩ = − [ 0, 0302 + 0,1057 + 0,1850 ] = 0, 697 ≈ 69, 7% 3.6 QUY LUẬT KHI BÌNH PHƯƠNG 3.6.1 Định nghĩa Biến ngẫu nhiên liên tục X có phân bố “Khi bình phương” n bậc tự do, ký hiệu X ~ χ (n) hàm mật độ có dạng: −x ⎧ n / −1 x ⎪⎪ e2 f ( x ) = ⎨ n / Γ ( n / 2) ⎪ ⎪⎩ +∞ đó Γ( x) = ∫t nÕu x > (3.33) nÕu x ≤ x −1 −t e dt là hàm Gamma Có thể chứng minh X , X , , X n là các biến ngẫu nhiên độc lập có cùng phân bố chuẩn tắc N (0,1) thì: 58 (58) Chương III: Một số quy luật phân bố xác suất quan trọng n ∑ X i2 = X 12 + X 22 + + X n2 ~ χ 2n i =1 (3.34) Phân bố χ Karl Pearson đưa vào năm 1900 Từ (3.34) suy X , X là hai biến ngẫu nhiên độc lập có phân bố bình phương n1 và n2 bậc tự thì X1 + X là biến ngẫu nhiên có phân bố bình phương n1 + n2 bậc tự do: X + X ~ χ (n1 + n2 ) (3.35) 3.6.2 Các tham số đặc trưng phân bố “Khi bình phương“ n bậc tự Có thể chứng minh rằng, kỳ vọng và phương sai biến ngẫu nhiên “Khi bình phương“ n bậc tự χ (n) có công thức: E χ ( n ) = n ; Dχ ( n ) = n (3.36) (n) , định nghĩa Giá trị tới hạn bình phương n bậc tự mức α , ký hiệu χ α sau, với χ ~ χ (n) : { } P χ > χ α2 (n) = α (3.37) Bảng các giá trị tới hạn χ α (n) tính sẵn bảng Phụ lục III y α O χ α2 (n) x 59 (59) Chương III: Một số quy luật phân bố xác suất quan trọng 3.7 QUY LUẬT STUDENT T(n) Biến ngẫu nhiên liên tục T có phân bố Student n bậc tự do, ký hiệu T ~ T(n) , hàm mật độ có dạng: −( n+1) ⎛ n +1⎞ Γ⎜ ⎟ ⎛ 2⎞ 2 ⎠ ⎜ t ⎟ f (t ) = ⎝ 1+ , −∞ < t < ∞ n ⎟⎠ nπΓ(n / 2) ⎜⎝ (3.38) đó Γ(x) là hàm Gamma Người ta chứng minh Z ~ N (0 ;1) , V ~ χ (n) ; Z và V độc lập thì T= Z V n ~ T( n ) (3.39) Kỳ vọng và phương sai biến ngẫu nhiên T có phân bố Student n bậc tự do: ET = , DT = n n−2 (3.40) Giá trị tới hạn mức α phân bố Student n bậc tự do, ký hiệu t α (n) , thỏa mãn: P{T > t α (n)} = α (3.41) Bảng tính các giá trị tới hạn t α (n) cho Phụ lục IV Hàm mật độ (3.38) là hàm chẵn nên đồ thị đối xứng qua trục tung Khi số bậc tự tăng lên, phân bố Student hội tụ nhanh phân bố chuẩn tắc N (0;1) Do đó n đủ lớn ( n ≥ 30 ) có thể dùng phân bố chuẩn tắc thay cho phân bố Student Tuy nhiên n nhỏ ( n < 30 ) việc thay trên gặp sai số lớn f (t ) α α t α −1 (n) 60 O t α (n) t (60) Chương III: Một số quy luật phân bố xác suất quan trọng 3.8 QUY LUẬT FISHER-SNEDECOR F (n1 , n2 ) Biến ngẫu nhiên liên tục F có phân bố Fisher-Snedecor với n1 và n2 bậc tự do, ký hiệu F ~ F (n1 , n ) , hàm mật độ có dạng: ⎧ ⎪ n1 − ⎪ f ( x) = ⎨ x ⎪C n +n ⎪ (n + n x ) 2 ⎩ nÕu x ≤ nÕu x > (3.42) ⎛ n + n2 ⎞ n1 n2 Γ⎜ ⎟n1 n2 2 ⎠ ⎝ đó C = ⎛ n1 ⎞ ⎛ n2 ⎞ Γ⎜ ⎟Γ ⎜ ⎟ ⎝ 2⎠ ⎝ ⎠ Người ta chứng minh U ~ χ (n1 ) , V ~ χ (n2 ) ; U và V độc lập thì: U F= V n1 ~ F (n1 , n2 ) (3.43) n2 Kỳ vọng và phương sai biến ngẫu nhiên F có phân bố Fisher-Snedecor với n1 và n2 bậc tự do: EF = n2 2n (n + n − 2) , DF = 2 2 n2 − n1 (n2 − 2) (n2 − 4) (3.44) Giá trị tới hạn mức α phân bố Fisher-Snedecor với n1 và n2 bậc tự do, ký hiệu f α (n1 , n2 ) , thỏa mãn: P{F > f α (n1 , n2 )} = α (3.45) Bảng tính các giá trị tới hạn f α (n1 , n2 ) cho Phụ lục Va, Vb, Vc, Vd TÓM TẮT Quy luật không – A(p) Biến ngẫu nhiên X gọi là có phân bố xác suất theo quy luật không – tham số p X nhận hai giá trị và với bảng phân bố xác suất sau: 61 (61) Chương III: Một số quy luật phân bố xác suất quan trọng X P q p EX = p ; DX = pq ; σ X = pq Qui luật nhị thức ; q = 1− p B (n ; p) Biến ngẫu nhiên rời rạc X nhận các giá trị 0, 1, , n với xác suất tương ứng: P{X = k } = C nk p k q n − k đó n là số tự nhiên và < p < 1, q = − p , gọi là có phân bố nhị thức tham số n, p , ký hiệu X ~ B (n ; p) EX = np ; DX = npq ; σ X = npq Dãy phép thử Bernoulli Dãy các phép thử lặp lại, độc lập và phép thử xuất biến cố A có xác suất P( A) = p , (0 < p < 1) không đổi gọi là dãy phép thử Bernoulli Khi m = [(n + 1) p ] thì Pn ( m ; p ) = Cnm p m (1 − p ) n − m đạt giá trị lớn Gọi m là giá trị có khả xảy lớn dãy phép thử Bernoulli Nếu gọi X là số thành công n phép thử Bernoulli với xác suất thành công lần thử là p , theo định lý 3.1 thì X có phân bố nhị thức B (n ; p) Nếu X , X , , X n là các biến ngẫu nhiên độc lập có cùng phân bố không – A(p) thì X = X ,+ X + + Xn ~ B (n ; p) Phân bố Poisson Biến ngẫu nhiên X nhận các giá trị k = 0, 1, 2, với xác suất P{X = k } = e có phân bố Poisson tham số λ > , ký hiệu X ~ −λ λk k! gọi là P (λ ) EX = λ ; DX = λ ; σ X = λ ; λ − ≤ ModX ≤ λ Quy luật phân bố U(a, b) Biến ngẫu nhiên X gọi là có phân bố trên [a , b ] hàm mật độ và hàm phân bố 62 (62) Chương III: Một số quy luật phân bố xác suất quan trọng ⎧ ⎪ f ( x) = ⎨ b − a ⎪⎩ EX = ⎧ ⎪x − a ⎪ F ( x) = ∫ f (t )dt = ⎨ ⎪b − a −∞ ⎪⎩ nÕu x < a x nÕu a ≤ x ≤ b nÕu ng−îc l¹i nÕu a ≤ x ≤ b nÕu x > b a+b (b − a ) a+b ; DX = ; MedX = EX = và ModX = m , ∀m ∈ [a b] 12 Quy luật chuẩn N (μ ; σ ) Biến ngẫu nhiên liên tục X có phân bố chuẩn N ( μ ; σ ) , ký hiệu X ~ N ( μ ; σ ) , hàm mật độ có dạng f ( x) = σ 2π −( x − μ )2 e 2σ ; −∞ <x < ∞ Mod X = MedX = EX = μ ; DX = σ ; σ X = DX = σ Phân bố chuẩn tắc Phân bố chuẩn N (0 ;1) với kỳ vọng 0, phương sai gọi là phân bố chuẩn tắc − x2 e ; ∀ x ∈ Hàm mật độ: ϕ ( x) = 2π x x −t Hàm phân bố: Φ ( x) = ∫ ϕ (t )dt = ∫ e dt ; ∀ x ∈  π −∞ −∞ Giá trị U α thỏa mãn Φ −1 (1 − α) = U α gọi là giá trị tới hạn phân bố chuẩn mức α ⎧⎪ ⎫⎪ Nếu X ~ N (0 ;1) thì P { X > Uα } = α ; P ⎨ X > U α ⎬ = α ⎪⎩ 2⎪ ⎭ X ~ N (μ ; σ ) thì X −μ ~ N (0 ;1) σ ⎧ X − μ x − μ⎫ ⎛ x−μ⎞ < Từ đó P{X < x} = P ⎨ ⎟ ⎬ = Φ⎜ σ ⎭ ⎩ σ ⎝ σ ⎠ Quy luật bình phương Biến ngẫu nhiên liên tục X có phân bố bình phương n bậc tự do, ký hiệu X ~ χ (n) , hàm mật độ có dạng 63 (63) Chương III: Một số quy luật phân bố xác suất quan trọng x ⎧ x n / −1 − ⎪ e f ( x ) = ⎨ n / Γ ( n / 2) ⎪ ⎩ nÕu x > nÕu x ≤ Nếu X , X , , X n là các biến ngẫu nhiên độc lập có cùng phân bố chuẩn tắc N (0,1) thì n ∑ X i2 = X 12 + X 22 + i =1 + X n2 ~ χ 2n { } Eχ = n ; Dχ = 2n Giá trị tới hạn χ α2 ( n) định nghĩa: P χ > χ α2 (n) = α Quy luật Student T(n) Biến ngẫu nhiên liên tục T có phân bố Student n bậc tự do, ký hiệu T ~ T(n) , hàm −( n +1) ⎛ n +1⎞ Γ⎜ ⎟ ⎛ 2⎞ ⎝ ⎠ ⎜1 + t ⎟ , − ∞ < t < ∞ mật độ có dạng: f (t ) = n ⎟⎠ nπΓ(n / ) ⎜⎝ Nếu Z ~ N (0;1) , V ~ χ (n) ; Z và V độc lập thì T = Z V n ~ T( n ) n Giá trị tới hạn mức α phân bố Student n bậc tự ký hiệu n−2 t α (n) thỏa mãn: P{T > t α (n)} = α ET = , DT = Quy luật Fisher-Snedecor F (n1 , n2 ) Biến ngẫu nhiên liên tục F có phân bố Fisher-Snedecor với n1 và n2 bậc tự do, ký hiệu F ~ F (n1 , n ) , hàm mật độ có dạng: ⎧ ⎪ n1 − ⎪ f ( x) = ⎨ x ⎪C n +n ⎪ (n + n x ) 2 ⎩ nÕu x ≤ nÕu x > ⎛ n + n2 ⎞ n1 n2 Γ⎜ ⎟n1 n2 2 ⎠ ⎝ đó C = ⎛ n1 ⎞ ⎛ n2 ⎞ Γ⎜ ⎟Γ ⎜ ⎟ ⎝ 2⎠ ⎝ ⎠ U Nếu U ~ 64 χ 2n1 , V ~ χ 2n2 ; U và V độc lập thì F = V n1 n2 ~ F (n1 , n2 ) (64) Chương III: Một số quy luật phân bố xác suất quan trọng EF = 2n (n + n − 2) n2 , DF = 2 2 n2 − n1 (n − 2) (n2 − 4) Giá trị tới hạn mức α phân bố Fisher-Snedecor với n1 và n2 bậc tự ký hiệu f α (n1 , n2 ) thỏa mãn: P{F > f α (n1 , n2 )} = α CÂU HỎI ÔN TÂP VÀ BÀI TẬP 3.1 Tổng n biến ngẫu nhiên độc lập phân bố theo quy luật không – A(p) là biến ngẫu nhiên phân bố theo quy luật nhị thức B (n ; p) Đúng Sai 3.2 Tổng hai biến ngẫu nhiên phân bố theo quy luật nhị thức luôn luôn là biến ngẫu nhiên phân bố theo quy luật nhị thức Đúng Sai 3.3 Biến ngẫu nhiên phân bố theo quy luật Poisson là biến ngẫu nhiên rời rạc nên nhận số hữu hạn các giá trị Đúng Sai 3.4 Nếu X là biến ngẫu nhiên phân bố theo quy luật nhị thức B (n ; p) thì X nhận giá trị ModX = m thỏa mãn (n + 1) p − ≤ m ≤ (n + 1) p Đúng Sai 3.5 Nếu X là biến ngẫu nhiên phân bố theo quy luật Poisson tham số λ >0 thì kỳ vọng, phương sai và mốt X λ Đúng Sai 3.6 Nếu biến ngẫu nhiên X phân bố theo quy luật chuẩn N (μ; σ ) thì xác suất sai lệch X ⎛ε và kỳ vọng nó thỏa mãn P { X − μ < ε } = 2Φ ⎜ ⎝σ Đúng Sai ⎞ ⎟ −1 ⎠ 3.7 Nếu biến ngẫu nhiên X phân bố theo quy luật chuẩn N (μ; σ ) thì X −μ phân bố theo quy σ luật chuẩn tắc N (0;1) Đúng Sai 3.8 Ta có thể tính gần đúng quy luật nhị thức B (n ; p) phân bố chuẩn n đủ lớn và p > 0,1 Khi n > 50 và p < 0,1 thì xấp xỉ phân bố Poisson 65 (65) Chương III: Một số quy luật phân bố xác suất quan trọng Đúng Sai 3.9 Biến ngẫu nhiên phân bố theo quy luật Student nhận giá trị dương Đúng Sai 3.10 Biến ngẫu nhiên liên tục F ~ F (n1 , n ) phân bố theo quy luật Fisher-Snedecor với n1 và n2 bậc tự có tính chất đối xứng n1 và n2 Đúng Sai 3.11 Hai kiện tướng bóng bàn ngang sức thi đấu với Hỏi thắng ván dễ hay thắng ván dễ 3.12 Một nữ công nhân quản lý 12 máy dệt Xác suất để máy khoảng thời gian T cần đến chăm sóc nữ công nhân là 1/3 Tính xác suất: a) Trong khoảng thời gian T có máy cần đến chăm sóc nữ công nhân b) Trong khoảng thời gian T có từ đến máy cần đến chăm sóc nữ công nhân 3.13 Trong lô hàng có 800 sản phẩm loại và 200 sản phẩm loại Lấy ngẫu nhiên sản phẩm theo phương thức có hoàn lại Gọi X là số sản phẩm loại lấy a) X tuân theo quy luật phân bố gì? Viết biểu thức tổng quát quy luật b) Tìm kỳ vọng và phương sai X c) Tìm mốt X và tính khả để xảy điều đó 3.14 Xác suất để sản phẩm sản xuất bị hỏng 0,1 a) Tìm xác suất để sản phẩm sản xuất có không quá sản phẩm hỏng b) Tìm số sản phẩm hỏng trung bình sản phẩm đó c) Tìm số sản phẩm hỏng có khả xảy nhiều 3.15 Một bài thi trắc nghiệm gồm có 10 câu hỏi, câu hỏi có phương án trả lời, đó có phương án đúng Giả sử câu trả lời đúng điểm và câu trả lời sai bị trừ điểm Một học sinh kém làm bài cách chọn hú hoạ phương án cho câu hỏi Tính xác suất để: a) Anh ta điểm b) Anh ta bị điểm âm 3.16 Tín hiệu thông tin phát lần độc lập Xác suất thu tin lần phát là 0,7 Tính xác suất: a) Thu tín hiệu đúng lần ; b) Thu tín hiệu nhiều lần ; 66 (66) Chương III: Một số quy luật phân bố xác suất quan trọng c) Thu tin 3.17 Trong thi bắn, xạ thủ bắn phát vào bia Xác suất bắn trúng bia xạ thủ A là 0,8 Tinh xác suất: a) A bắn trúng bia đúng lần ; b) A bắn trúng bia nhiều lần ; c) A bắn trúng bia 3.18 Một cầu thủ tiếng đá phạt đền, xác suất đá vào gôn là 4/5 Có người cho “sút” thì chắn có vào lưới Điều khẳng định đó có đúng không? Tìm xác suất để lần sút có đúng lần bóng vào lưới 3.19 Ỏ tổng đài bưu điện các điện thoại gọi đến xuất cách ngẫu nhiên, độc lập với và trung bình có gọi phút Tính xác suất để: a) Có ít gọi khoảng thời gian 10 giây b) Trong khoảng thời gian phút có nhiều ba gọi c) Trong khoảng thời gian phút liên tiếp phút có nhiều gọi 3.20 Số gọi điện thoại đến trạm điện thoại A phút là đại lượng ngẫu nhiên (biến ngẫu nhiên) X có phân bố Poát-xông với tham số λ = 1,5 Tính xác suất để phút: a) Trạm điện thoại A không nhận gọi nào b) Trạm điện thoại A nhận nhiều gọi c) Trạm điện thoại A nhận ít gọi 3.21 Số khách hàng vào siêu thị là biến ngẫu nhiên tuân theo quy luật Poisson với tham số λ = (8 là số khách hàng đến trung bình giờ) Tìm xác suất để nào đó có khách vào 3.22 Biến ngẫu nhiên X tuân theo quy luật chuẩn với kỳ vọng μ = 10 và phương sai σ = Tính xác suất để X nhận giá trị khoảng (8; 12) 3.23 Biến ngẫu nhiên X tuân theo quy luật chuẩn với kỳ vọng μ = 10 Xác suất để X nhận giá trị khoảng (10; 20) là 0,3 Tìm xác suất để X nhận giá trị khoảng (0; 10) 3.24 Trọng lượng sản phẩm X máy tự động sản xuất là biến ngẫu nhiên tuân theo quy luật chuẩn với μ = 100 gam và độ lệch chuẩn σ = gam Sản phẩm coi là đạt tiêu chuẩn kỹ thuật trọng lượng nó đạt từ 98 đến 102gam a) Tìm tỷ lệ sản phẩm đạt tiêu chuẩn kỹ thuật nhà máy b) Tìm tỷ lệ phế phẩm nhà máy c) Giải thích đồ thị kết tìm phần a) 67 (67) Chương III: Một số quy luật phân bố xác suất quan trọng 3.25 Chiều cao nam giới trưởng thành vùng dân cư là biến ngẫu nhiên phân bố chuẩn với kỳ vọng μ = 160 cm và độ lệch chuẩn σ = cm Một niên bị coi là lùn có chiều cao nhỏ 155 cm a) Tìm tỷ lệ niên lùn vùng đó b) Tìm xác suất để lấy ngẫu nhiên người thì có ít người không bị lùn 3.26 Cho X i ( i = 1, n )là các biến ngẫu nhiên độc lập, cùng tuân theo quy luật chuẩn với E( X ) = E( X ) = = E( X n ) = μ ; D( X ) = D( X ) = = D( X n ) = σ { Lập công thức tính P X − μ < ε chuẩn, ε > tùy ý 68 } biết X = n ∑ X i và tuân theo quy luật n i =1 (68) Chương IV: Biến ngẫu nhiên hai chiều CHƯƠNG IV: BIẾN NGẪU NHIÊN HAI CHIỀU GIỚI THIỆU Khái niệm biến ngẫu nhiên hai chiều hay còn gọi là véc tơ ngẫu nhiên hai chiều là trường hợp riêng biến ngẫu nhiên nhiều chiều bao gồm nhiều biến ngẫu nhiên lập thành có thứ tự Mỗi biến ngẫu nhiên là thành phần nó Tương tự biến ngẫu nhiên, quy luật biến ngẫu nhiên nhiều chiều khảo sát thông qua hàm phân bố Biến ngẫu nhiên nhiều chiều có các biến ngẫu nhiên thành phần rời rạc gọi là biến ngẫu nhiên nhiều chiều rời rạc Nếu tất các biến ngẫu nhiên thành phần liên tục thì biến ngẫu nhiên nhiều chiều tương ứng gọi là liên tục Biến ngẫu nhiên nhiều chiều rời rạc xác định bảng phân bố xác suất đồng thời, còn biến ngẫu nhiên liên tục xác định hàm mật độ xác suất Trong chương này ta xét biến ngẫu nhiên hai chiều rời rạc Từ bảng phân bố xác suất đồng thời biến ngẫu nhiên hai chiều rời rạc, dựa vào công thức cộng xác suất đầy đủ ta có thể tìm bảng phân bố xác suất hai biến ngẫu nhiên thành phần Áp dụng công thức tính xác suất có điều kiện suy quy luật phân bố xác suất có điều kiện các biến ngẫu nhiên thành phần Ngoài các đặc trưng kỳ vọng, phương sai hai biến ngẫu nhiên thành phần, biến ngẫu nhiên hai chiều rời rạc còn đặc trưng hiệp phương sai và hệ số tương quan Hệ số tương quan đo mức độ phụ thuộc tuyến tính hai biến ngẫu nhiên thành phần, hệ số tương quan càng gần thì mức độ phụ thuộc tuyến tính càng chặt Hai biến ngẫu nhiên thành phần không tương quan thì hệ số tương quan Áp dụng công thức xác suất có điều kiện ta xây dựng phân bố xác suất có điều kiện Từ đó có thể tính kỳ vọng có điều kiện biến ngẫu nhiên thành phần này biến ngẫu nhiên thành phần và xây dựng hàm hồi quy tương quan Để học tốt chương này học viên cần nắm vững các tính chất xác suất, xác suất có điều kiện và phân bố xác suất biến ngẫu nhiên rời rạc NỘI DUNG KHÁI NIỆM BIẾN NGẪU NHIÊN NHIỀU CHIỀU Trong các chương trước ta xét các biến ngẫu nhiên mà giá trị chúng nhận có thể biểu diễn số, đó là các biến ngẫu nhiên chiều Tuy nhiên thực tế có thể gặp các đại 68 (69) Chương IV: Biến ngẫu nhiên hai chiều lượng ngẫu nhiên mà giá trị nhận là gồm hai, ba, …, n số Những đại lượng này gọi cách tương ứng là biến ngẫu nhiên hai chiều, ba chiều, …, n chiều và gọi chung là biến ngẫu nhiên nhiều chiều Các biến ngẫu nhiên hai chiều, ba chiều, …, n chiều còn gọi là véc tơ ngẫu nhiên hai chiều, ba chiều, …, n chiều Một biến ngẫu nhiên n chiều là ( X , X , , X n ) với các thành phần X , X , , X n là các biến ngẫu nhiên Ta ký hiệu biến ngẫu nhiên hai chiều là ( X , Y ) , đó X là biến ngẫu nhiên thành phần thứ và Y là biến ngẫu nhiên thành phần thứ hai Ví dụ 4.1: Một nhà máy sản xuất loại sản phẩm Nếu kích thước sản phẩm đo chiều dài X và chiều rộng Y thì ta có biến ngẫu nhiên hai chiều, còn xét thêm chiều cao Z thì ta có biến ngẫu nhiên ba chiều Nếu ta quan tâm đến trọng lượng và thể tích sản phẩm ta biến ngẫu nhiên hai chiều Biến ngẫu nhiên n chiều ( X , X , , X n ) là liên tục hay rời rạc tất các biến ngẫu nhiên thành phần X , X , , X n là liên tục hay rời rạc Trong chương này ta xét biến ngẫu nhiên hai chiều ( X , Y ) rời rạc BẢNG PHÂN BỐ XÁC SUẤT CỦA BIẾN NGẪU NHIÊN RỜI RẠC HAI CHIỀU 2.1 Bảng phân bố xác suất đồng thời Bảng phân bố xác suất đồng thời biến ngẫu nhiên rời rạc hai chiều ( X , Y ) là bảng liệt kê tất các giá trị nó và các xác suất tương ứng Y ∑j y1 y2 … yj … ym x1 p( x1, y1) p( x1, y2 ) … p ( x1, y j ) … p( x1, ym ) p( x1 ) x2 p( x2 , y1 ) p( x2 , y2 ) … p ( x2 , y j ) … p( x2 , ym ) p( x2 ) p( xi , ym ) p( xi ) X … xi p( xi , y1 ) p( xi , y2 ) … … p ( xi , y j ) … xn ∑i … … p( xn , y1) p( xn , y2 ) … p ( xn , y j ) … p( xn , ym ) p( xn ) p( y1 ) p ( y2 ) … p( y j ) … p( ym ) Trong đó xi ( i = 1, n ) là các giá trị có thể có thành phần X ; y j ( j = 1, m ) là các giá trị có thể có thành phần Y p ( xi , y j ) là xác suất đồng thời biến ngẫu nhiên hai chiều ( X , Y ) nhận giá trị ( xi , y j ) , nghĩa là: 69 (70) Chương IV: Biến ngẫu nhiên hai chiều { } p ( xi , y j ) = P X = xi , Y = y j , các xác suất này thỏa mãn: ⎧ p ( xi , y j ) ≥ , ∀ i = 1, n , j = 1, m ⎪⎪ ⎨ n m ⎪ ∑∑ p ( xi , y j ) = ⎪⎩ i =1 j =1 (4.1) 2.2 Bảng phân bố xác suất biên Áp dụng công thức xác suất đầy đủ (1.16) cho hệ { X = x1} , { X = x2 } , , { X = xn } (xem công thức 2.7) ta có: { n } { n } p ( y j ) = P Y = y j = ∑ P X = xi , Y = y j = ∑ p ( xi , y j ) ; j = 1, m i =1 m (4.2) i =1 { } m p ( xi ) = P{ X = xi } = ∑ P X = xi , Y = y j = ∑ p( xi , y j ) ; i = 1, n j =1 (4.3) j =1 Như từ bảng phân bố xác suất đồng thời ( X , Y ) , ta cộng các xác suất theo cột thì ta các xác suất tương ứng với các giá trị Y , ta cộng các xác suất theo hàng ta các xác suất tương ứng với giá trị X Từ đó nhận phân bố xác suất biến ngẫu nhiên thành phần Y và biến ngẫu nhiên thành phần X X x1 P p ( x1 ) Y y1 P p ( y1 ) x2 … xi … xn p( x2 ) … p ( xi ) … p( xn ) y2 … yj … ym p( y ) … p( y j ) … p( y m ) Ví dụ 4.2: Gieo đồng tiền cân đối A, B, C Gọi X là số mặt ngửa xuất đồng tiền A, B và Y là số mặt ngửa xuất đồng tiền A, B, C Hãy lập bảng phân bố xác suất đồng thời X , Y Giải: Chúng ta có bảng kết đồng khả việc gieo đồng tiền cân đối và tính các giá trị X , Y tương ứng, đó N là ký hiệu mặt ngửa xuất còn S là mặt sấp 70 (71) Chương IV: Biến ngẫu nhiên hai chiều A B C X Y N N N N N S 2 N S N N S S 1 S N N 1 S N S S S N S S S 0 Sử dụng công thức tính xác suất cổ điển (1.1) ta có: P{X = 2, Y = 3} = 1 ; P{X = 2, Y = 2} = ; P{X = 1, Y = 2} = … 8 Vậy bảng phân bố xác suất đồng thời X và Y là: Y ∑ 1/8 1/8 0 2/8 2/8 2/8 4/8 0 1/8 1/8 2/8 1/8 3/8 3/8 1/8 X ∑ Cộng các cột ta phân bố xác suất biến ngẫu nhiên thành phần X : X P 2/8 4/8 2/8 Cộng các hàng ta phân bố xác suất biến ngẫu nhiên thành phần Y : Y P 1/8 3/8 3/8 1/8 Ví dụ 4.3: Có hai hộp, hộp đựng bi 71 (72) Chương IV: Biến ngẫu nhiên hai chiều Hộp I có bi mang số 1, bi mang số 2, bi mang số Hộp II có bi mang số 1, bi mang số 2, bi mang số Rút ngẫu nhiên từ hộp bi Gọi X , Y là số ghi trên bi rút từ hộp I và hộp II Hãy lập bảng phân bố xác suất đồng thời X , Y Giải: Mỗi hộp có bi cho nên số các trường hợp có thể có phép thử là ⋅ = 36 , đó có trường hợp (1,1) , trường hợp (1, 2) , trường hợp (2,1) , … Vậy bảng phân bố xác suất đồng thời X , Y sau Y ∑ 2/36 3/36 1/36 1/6 4/36 6/36 2/36 2/6 6/36 9/36 3/36 3/6 ∑ 2/6 3/6 1/6 X 2.3 Quy luật phân bố xác suất có điều kiện các thành phần Áp dụng công thức tính xác suất có điều kiện (1.11) và (1.11)’ ta suy biến ngẫu { nhiên thành phần X với điều kiện biến cố Y = y j } xảy nhận các giá trị x1 , x2 , , xn với bảng phân bố xác suất điều kiện tương ứng: X Y = yj P x1 x2 … xi … xn p ( x1 y j ) p( x2 y j ) … p ( xi y j ) … p( xn y j ) đó: p ( xi y j ) = p ( xi , y j ) p( y j ) ; i = 1, n , j = 1, m (4.4) Tương tự ta có bảng phân bố xác suất có điều kiện Y với điều kiện {X = xi } 72 Y X = xi y1 y2 … yj … ym P p ( y1 xi ) p ( y xi ) … p ( y j xi ) … p ( y m xi ) (73) Chương IV: Biến ngẫu nhiên hai chiều đó: p ( y j xi ) = p ( xi , y j ) p ( xi ) ; i = 1, n , j = 1, m (4.5) Từ công thức xác suất có điều kiện (4.4)-(4.5) ta có công thức tính xác suất đồng thời: p ( xi , y j ) = p ( xi ) p ( y j xi ) = p ( y j ) p ( xi y j ) ; i = 1, n , j = 1, m (4.6) Ví dụ 4.4: Phân bố xác suất có điều kiện biến ngẫu nhiên Y với điều kiện {X = 1} ví dụ 4.2 Y X =1 P 2/4 2/4 2.4 Tính độc lập các biến ngẫu nhiên Hai biến ngẫu nhiên X và Y gọi là độc lập biến ngẫu nhiên nhận giá trị này hay giá trị khác không ảnh hưởng gì đến phân bố xác suất biến ngẫu nhiên Vậy biến ngẫu nhiên hai chiều rời rạc ( X , Y ) với phân bố xác suất (4.1) là độc lập và khi: p( xi , y j ) = p( xi ) p( y j ) ∀ i = 1, n , j = 1, m (4.7) Một dấu hiệu để nhận biết hai biến ngẫu nhiên độc lập là bảng phân bố xác suất đồng thời có tính chất: • Hai hàng tỉ lệ • Hai cột tỉ lệ Ví dụ 4.5: Hai biến ngẫu nhiên X và Y ví dụ 4.2 không độc lập vì P{X = 2} = P{Y = 1} = , P{X = 2, Y = 1} = Hai biến ngẫu nhiên X và Y ví dụ 4.3 độc lập vì thỏa mãn điều kiện (4.7) CÁC THAM SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN HAI CHIỀU 3.1 Kỳ vọng và phương sai các biến ngẫu nhiên thành phần Từ bảng phân bố xác suất thành phần (4.2)-(4.3) ta có công thức tính kỳ vọng và phương sai: 73 (74) Chương IV: Biến ngẫu nhiên hai chiều n n m i =1 i =1 j =1 EX = ∑ xi p( xi ) = ∑∑ xi p( xi , y j ) m m n j =1 j =1 i =1 EY = ∑ y j p( y j ) = ∑∑ y j p( xi , y j ) (4.8) (4.9) n m DX = EX − (EX )2 = ∑∑ xi2 p( xi , y j ) − (EX )2 (4.10) i =1 j =1 m n DY = EY − (EY )2 = ∑∑ y 2j p( xi , y j ) − (EY )2 (4.11) j =1 i =1 3.2 Hiệp phương sai Hiệp phương sai (hay còn gọi là Covariance) hai biến ngẫu nhiên X , Y , ký hiệu cov( X , Y ) , là kỳ vọng toán tích các sai lệch các biến ngẫu nhiên đó với kỳ vọng toán chúng: cov( X , Y ) = E ( X − EX )(Y − EY ) (4.12) Nếu X , Y rời rạc có bảng phân bố đồng thời (4.1) thì: m n cov( X , Y ) = ∑∑ xi y j p( xi , y j ) − E X E Y (4.13) j =1 i =1 Tính chất 1) cov( X , Y ) = E XY − EX EY 2) cov( X , Y ) = cov(Y , X ) 3) cov( X , X ) = DX 4) cov(aX + c, bY + d ) = ab cov(Y , X ) với số a, b, c, d 5) Nếu X , Y độc lập thì cov( X , Y ) = ngược lại chưa đúng 3.3 Hệ số tương quan Hệ số tương quan hai biến ngẫu nhiên X , Y ký hiệu và định nghĩa công thức: ρ X ,Y = Tính chất 1) − ≤ ρ X ,Y ≤ với X , Y 74 cov( X , Y ) σ X σY (4.14) (75) Chương IV: Biến ngẫu nhiên hai chiều 2) Nếu X , Y độc lập thì ρ X ,Y = , điều ngược lại chưa đúng 3) Với số a, b, c, d ⎧⎪ ρ X ,Y ρ aX +c,bY + d = ⎨ ⎪⎩− ρ X ,Y 4) nÕu ab > nÕu ab < (4.15) Y = aX + b , a ≠ và ⎧ nÕu a > ρ X ,Y = ⎨ ⎩− nÕu a < (4.16) Ý nghĩa hệ số tương quan: Hệ số tương quan đo mức độ phụ thuộc tuyến tính X và Y Khi ρ X ,Y càng gần thì tính chất quan hệ tuyến tính càng chặt, ρ X ,Y càng gần thì phụ thuộc tuyến tính càng ít, càng lỏng lẻo Khi ρ X ,Y = ta nói X và Y không tương quan 3.4 Kỳ vọng có điều kiện, hàm hồi quy Từ luật phân bố điều kiện (4.5), kỳ vọng biến ngẫu nhiên Y với điều kiện {X = xi } ký hiệu và tính theo công thức sau: m ( E(Y X = xi ) = ∑ y j p y j xi j =1 ) (4.17) Khi cho giá trị xi thay đổi thì kỳ vọng có điều kiện Y phụ thuộc vào giá trị X gọi là hàm hồi quy Y X f ( x ) = E (Y X = x ) (4.18) Tương tự ta có định nghĩa kỳ vọng có điều kiện X với điều kiện {Y = y} và hàm hồi quy X Y : n E ( X Y = y ) = ∑ x i p (x i y ) (4.19) i =1 g ( y ) = E (X Y = y ) (4.20) 75 (76) Chương IV: Biến ngẫu nhiên hai chiều Hàm hồi qui (4.18) có miền xác định là miền giá trị X , đó là tập {x1 , x2 , , x n } Tương tự, hàm hồi qui (4.20) có miền xác định là miền giá trị Y , đó là tập {y1 , y , , y m } Khi X , Y liên tục thì miền xác định hàm hồi qui là khoảng nào đó Ví dụ 4.6: Thống kê dân cư thành phố độ tuổi trưởng thành thu nhập hàng tháng X và lứa tuổi Y thu kết bảng sau Tìm thu nhập trung bình theo lứa tuổi Y 30 45 70 0,01 0,02 0,05 0,03 0,06 0,10 0,18 0,21 0,15 0,07 0,08 0,04 X đó X =1, 2, 3, tương ứng thu nhập triệu đồng /tháng Y = 30, 45, 70 độ tuổi người dân khoảng: 25-35, 35-55, 55-85 Giải: Thu nhập trung bình theo lứa tuổi là kỳ vọng có điều kiện X theo Y Với Y = 30 bảng phân bố xác suất điều kiện tương ứng: X Y = 30 P Từ đó E( X Y = 30) = ⋅ 0,01 0,29 0,03 0,29 0,18 0,29 0,07 0,29 18 + 1⋅ + 2⋅ + 3⋅ = 2,069 29 29 29 29 Tương tự E ( X Y = 45 ) = 1,946 ; E ( X Y = 70 ) = 1,529 Vậy thu nhập trung bình độ tuổi 30 là 2.069.000đ/tháng, độ tuổi 45 là 1.946.000đ/tháng và độ tuổi 70 là 1.529.000 đ/tháng TÓM TẮT Biến ngẫu nhiên nhiều chiều 76 (77) Chương IV: Biến ngẫu nhiên hai chiều ( X , X , , X n ) Một biến ngẫu nhiên n chiều là với các thành phần X , X , , X n là các biến ngẫu nhiên Biến ngẫu nhiên n chiều là liên tục hay rời rạc tất các biến ngẫu nhiên thành phần X , X , , X n là liên tục hay rời rạc Ta ký hiệu biến ngẫu nhiên hai chiều là ( X , Y ) , đó X là biến ngẫu nhiên thành phần thứ và Y là biến ngẫu nhiên thành phần thứ hai Bảng phân bố xác suất đồng thời biến ngẫu nhiên rời rạc hai chiều Bảng phân bố xác suất đồng thời biến ngẫu nhiên rời rạc hai chiều ( X , Y ) là bảng liệt kê tất các giá trị nó và các xác suất tương ứng, đó xi ( i = 1, n ) là các giá trị có thể có X; thành phần yj { p ( xi , y j ) = P X = xi , Y = y j ( j = 1, m ) là các giá trị có thể có thành phần Y : } Bảng phân bố xác suất biên { } n { n } p ( y j ) = P Y = y j = ∑ P X = xi , Y = y j = ∑ p( xi , y j ) ; j = 1, m i =1 m i =1 { m } p ( xi ) = P{ X = xi } = ∑ P X = xi , Y = y j = ∑ p( xi , y j ) ; i = 1, n j =1 j =1 Quy luật phân bố xác suất có điều kiện các thành phần X Y = yj P x1 x2 … xi … xn p ( x1 y j ) p( x2 y j ) … p ( xi y j ) … p( xn y j ) p ( xi y j ) = p ( xi , y j ) p( y j ) ; i = 1, n , j = 1, m Y X = xi y1 y2 … yj … ym P p ( y1 xi ) p ( y xi ) … p ( y j xi ) … p ( y m xi ) p ( y j xi ) = p ( xi , y j ) p ( xi ) ; i = 1, n , j = 1, m Tính độc lập các biến ngẫu nhiên 77 (78) Chương IV: Biến ngẫu nhiên hai chiều Hai biến ngẫu nhiên X và Y gọi là độc lập biến ngẫu nhiên nhận giá trị này hay giá trị khác không ảnh hưởng gì đến phân bố xác suất biến ngẫu nhiên Trường hợp hai biến ngẫu nhiên X và Y rời rạc nhận các giá trị xi , y j ; ∀ i = 1, n , j = 1, m thì tính chất độc lập tương đương với: p( xi , y j ) = p( xi ) p( y j ) ∀ i = 1, n , j = 1, m Kỳ vọng và phương sai các biến ngẫu nhiên thành phần n n m i =1 i =1 j =1 EX = ∑ xi p( xi ) = ∑∑ xi p( xi , y j ) m m n j =1 j =1 i =1 EY = ∑ y j p ( y j ) = ∑∑ y j p( xi , y j ) n m DX = EX − (EX ) = ∑∑ xi2 p( xi , y j ) − (EX )2 2 i =1 j =1 m n DY = EY − (EY )2 = ∑∑ y 2j p ( xi , y j ) − (EY )2 j =1 i =1 Hiệp phương sai m n cov( X , Y ) = E ( X − EX )(Y − EY ) = ∑∑ xi y j p ( xi , y j ) − E X E Y j =1 i =1 Hệ số tương quan Hệ số tương quan hai biến ngẫu nhiên X , Y ký hiệu và định nghĩa công thức: ρ X ,Y = cov( X , Y ) σ X σY Kỳ vọng có điều kiện m ( ) Kỳ vọng có điều kiện Y với điều kiện {X = xi } : E(Y X = xi ) = ∑ y j p y j xi j =1 n Kỳ vọng có điều kiện X với điều kiện {Y = y}: E( X Y = y ) = ∑ xi p (xi y ) i =1 Hàm hồi quy 78 (79) Chương IV: Biến ngẫu nhiên hai chiều Khi cho giá trị xi thay đổi thì kỳ vọng có điều kiện Y phụ thuộc vào giá trị X gọi là hàm hồi quy Y X : f ( x ) = E (Y X = x ) Hàm hồi quy X Y : g ( y ) = E ( X Y = y ) CÂU HỎI ÔN TẬP VÀ BÀI TẬP 4.1 Bảng phân bố xác suất X và Y cho phép xác định phân bố xác suất đồng thời ( X ,Y ) Đúng Sai 4.2 Bảng phân bố xác suất đồng thời ( X , Y ) xác định phân bố xác suất biến ngẫu nhiên thành phần X và Y Đúng Sai 4.3 Nếu hai biến ngẫu nhiên X , Y độc lập thì bảng phân bố xác suất X và Y cho phép xác định phân bố xác suất đồng thời ( X , Y ) Đúng Sai 4.4 Hai biến ngẫu nhiên độc lập có hiệp phương sai Đúng Sai 4.5 Hai biến ngẫu nhiên có hiệp phương sai thì độc lập Đúng Sai 4.6 Hiệp phương sai luôn nhận giá trị dương Đúng Sai 4.7 Nếu Y = aX + b , a ≠ thì hệ số tương quan ρ X ,Y luôn luôn Đúng Sai 4.8 Nếu {x1 , x2 , , x n } là tập giá trị X thì { f ( x1 ), f ( x2 ), , f ( xn )} là tập giá trị hàm hồi quy f ( x ) = E (Y X = x ) Y X Đúng Sai 4.9 Nếu hai biến ngẫu nhiên X , Y độc lập thì hàm hồi quy f ( x ) = E (Y X = x ) Y X và hàm hồi quy g ( y ) = E ( X Y = y ) X Y là hai hàm Đúng Sai 4.10 Nếu hiệp phương sai hai biến ngẫu nhiên thì hai kỳ vọng chúng ( cov( X , Y ) = thì EX = EY ) 79 (80) Chương IV: Biến ngẫu nhiên hai chiều Đúng 4.11 Sai Cho X , Y là hai biến ngẫu nhiên có phân bố xác suất đồng thời sau Y y1 y2 y3 x1 0,18 0,22 0,16 x2 0,08 0,16 0,20 X Tìm phân bố xác suất hai biến ngẫu nhiên thành phần X , Y 4.12 Cho X , Y là hai biến ngẫu nhiên có phân bố xác suất đồng thời sau Y X −1 −1 1/6 1/6 1/6 1/4 1/8 1/8 Hãy xác định EX , EY , cov( X , Y ) = và ρ X ,Y 4.13 Cho X , Y là hai biến ngẫu nhiên có phân bố xác suất đồng thời sau Y −1 −1 4/15 1/15 4/15 1/15 2/15 1/15 2/15 X Hãy xác định EX , EY , cov( X , Y ) = và ρ X ,Y X , Y có độc lập không? 4.14 Cho X , Y là hai biến ngẫu nhiên có phân bố xác suất đồng thời sau Y 0,12 0,15 0,03 0,28 0,35 0,07 X a) Chứng minh X , Y có độc lập b) Tìm quy luật phân bố biến ngẫu nhiên Z = XY c) Tính các kỳ vọng EX , EY , EZ 80 (81) Chương IV: Biến ngẫu nhiên hai chiều 4.15 Cho X , Y là hai biến ngẫu nhiên độc lập có phân bố xác suất sau: X P 0,4 0,3 0,2 0,1 Y P 0,1 0,3 0,4 0,15 0,05 Tìm phân bố xác suất đồng thời X , Y Tính xác suất P{X > Y } 4.16 Cho X , Y là hai biến ngẫu nhiên có phân bố xác suất đồng thời sau: Y 0,15 0,20 0,10 0,35 0,05 0,15 X Hai biến ngẫu nhiên X , Y có độc lập không Tính xác suất P{X = 1Y = 2} 4.17 Gieo đồng thời xúc xắc và đồng tiền Gọi X là biến ngẫu nhiên số chấm xúc xắc và Y là biến ngẫu nhiên mặt sấp (1) hay mặt ngửa (0) đồng tiền Lập bảng phân bố xác suất đồng thời X và Y 4.18 Cho bảng phân bố xác suất đồng thời X , Y : X 26 30 41 50 23 0,05 0,08 0,12 0,04 27 0,09 0,30 0,11 0,21 Y Tìm bảng phân bố xác suất điều kiện Y X = 26 và X Y = 27 4.19 Cho bảng phân bố xác suất đồng thời X , Y : X 0,15 0,06 0,25 0,04 0,30 0,10 0,03 0,07 Y a) Tìm kỳ vọng có điều kiện Y X = b) Tìm các kỳ vọng EX , EY và phương sai DX , DY 4.20 Cho X , Y là hai ĐLNN có phân bố xác suất đồng thời: 81 (82) Chương IV: Biến ngẫu nhiên hai chiều Y −1 −1 4α α 4α α 2α α 2α X a) Tìm α Tính EX , EY b) Tính cov( X , Y ), ρ ( X , Y ) c) 82 X và Y có độc lập không (83) Chương V: Luật số lớn CHƯƠNG V: LUẬT SỐ LỚN (*) GIỚI THIỆU Lý thuyết xác suất nghiên cứu khả xuất các biến cố ngẫu nhiên Khi tung đồng xu ta không biết mặt sấp hay mặt ngửa xuất tung nhiều lần thì ta thấy số lần mặt sấp và mặt ngửa xuất là xấp xỉ gần Như thực nhiều lần phép thử ngẫu nhiên ta tìm quy luật xuất biến cố ngẫu nhiên, là nội dung luật số lớn Luật số lớn là sở để định nghĩa xác suất biến cố thông qua tần suất xuất biến cố đó Luật số lớn nghiên cứu hội tụ theo xác suất dãy các biến ngẫu nhiên Luật số lớn đầu tiên James Bernoulli công bố năm 1713 Về sau, kết này Poisson, Trêbưsép, Máckốp, Liapunốp mở rộng Trong chương này ta xét hai định lý luật số lớn Định lý Trêbưsép là dạng tổng quát luật số lớn còn định lý Bernoulli là trường hợp đơn giản cho các biến ngẫu nhiên có phân bố không – Để chứng minh định lý Trêbưsép ta sử dụng bất đẳng thức Trêbưsép NỘI DUNG 5.1 BẤT ĐẲNG THỨC TRÊBƯSÉP Định lý 5.1: Cho Y là biến ngẫu nhiên không âm có kỳ vọng hữu hạn Khi đó với a > ta có: P {Y > a} ≤ EY a Chứng minh: a) Trường hợp Y rời rạc có tập giá trị V = { y1, y2 , } Đặt V1 = { yi ∈ V , yi ≤ a} ; V2 = { yi ∈ V , yi > a} Khi đó EY = ∑ yi∈V ≥ yi P {Y = yi } = ∑ yi∈V2 82 ∑ yi∈V1 yi P {Y = yi } ≥ a yi P {Y = yi } + ∑ yi∈V2 yi P {Y = yi } ∑ P {Y = yi } = aP {Y > a} yi∈V2 (5.1) (84) Chương V: Luật số lớn P {Y > a} ≤ Suy EY a b) Giả sử Y liên tục có hàm mật độ f (x) Ta có EY = Suy +∞ a +∞ +∞ +∞ 0 a a a ∫ xf ( x)dx = ∫ xf ( x)dx + P {Y > a} ≤ ∫ xf ( x)dx ≥ ∫ xf ( x)dx ≥ a ∫ f ( x)dx = aP{Y > a} EY a Hệ quả: Nếu X là biến ngẫu nhiên có kỳ vọng và phương sai hữu hạn thì với ε > ta có: P { X − EX > ε } ≤ P { X − EX ≤ ε } ≥ − vậy: DX ε2 DX ε2 (5.2) (5.3) Chứng minh: Áp dụng công thức (5.1) cho biến ngẫu nhiên Y = ( X − EX )2 và a = ε ta có: { P { X − EX > ε } = P Y > ε }≤ ε2 = EY E ( X − EX ) ε 2 = DX ε2 Bất đẳng thức (5.2)-(5.3) gọi là bất đẳng thức Trêbưsép Bất đẳng thức Trêbưsép có nhiều ứng dụng Trước hết nó cho phép ta đánh giá cận trên cận xác suất để biến ngẫu nhiên X nhận giá trị sai lệch so với kỳ vọng E X không quá ε Bất đẳng thức Trêbưsép có ý nghĩa to lớn mặt lý thuyết, nó sử dụng để chứng minh các định lý luật số lớn Ví dụ 5.1: Một cửa hàng muốn ước lượng nhanh chóng sai số số vải bán tháng mình Biết số vải khách hàng làm tròn số nguyên M gần (ví dụ sổ ghi 195,6 m thì làm tròn là 196m) Giải: Ký hiệu X i là sai số số mét vải thực bán và số mét vải đã làm tròn khách hàng thứ i Các sai số X1, X , , X n là các biến ngẫu nhiên độc lập có phân bố trên đoạn Sai số tổng cộng tháng là S = X1 + " + X n 12 (trong đó n là số khách hàng mua hàng tháng) Ta có: [ −0, 5; 0,5] Khi đó EX i = 0, DX i = n n i =1 i =1 ES = ∑ EX i = 0, DS = ∑ DX i = n 12 Theo bất đẳng thức Trêbưsép, xác suất để sai số vượt quá ε mét đánh giá bởi: 83 (85) Chương V: Luật số lớn P{ S > ε} ≤ DS ε2 = n 12ε Giả sử có n = 104 khách hàng tháng Để xác suất P { S > ε } bé 0,01 ta phải có n 12ε ≤ 0, 01 hay ε ≥ n = 288, 67 12 ⋅ 0, 01 Vậy ta có thể kết luận: Với xác suất 0,99 sai số số vải thực bán với số vải đã tính tròn không vượt quá 289 m, số khách hàng là vạn 5.2 LUẬT SỐ LỚN 5.2.1 Hội tụ theo xác suất Định nghĩa 5.1: Dãy các biến ngẫu nhiên X1, X , gọi là hội tụ theo xác suất biến ngẫu P nhiên X , ký hiệu X n ⎯⎯⎯→ X , nếu: n→∞ ∀ε > lim P { X n − X > ε } = n→∞ (5.4) Như dãy các biến ngẫu nhiên X1, X , hội tụ theo xác suất biến ngẫu nhiên X thì với n đủ lớn, thực tế ta có thể coi X n không khác so với X 5.2.2 Luật số lớn Trêbưsép Định lý 5.2: Giả sử X1, X , là dãy các biến ngẫu nhiên độc lập, có các kỳ vọng hữu hạn và phương sai bị chặn trên số C ( DX i ≤ C; ∀i = 1, 2, ) Khi đó: ⎛ X + " + X n EX1 + " + EX n ⎞ lim P ⎜ − > ε ⎟= n n n→∞ ⎝ ⎠ Chứng minh: Xét biến ngẫu nhiên Sn = X1 + " + X n Từ giả thiết độc lập dãy các n biến ngẫu nhiên X1, X , ta suy ra: ESn = EX1 + " + EX n DX1 + " + DX n C ; DSn = ≤ n n n2 Áp dụng bất đẳng thức Trêbưsép (5.2) cho biến ngẫu nhiên Sn ta có: ⎛ X + " + X n EX1 + " + EX n ⎞ C P⎜ − > ε ⎟ ≤ ⎯⎯⎯→ n→∞ n n ⎝ ⎠ nε 84 (5.5) (86) Chương V: Luật số lớn Hệ 1: Giả sử X1, X , là dãy các biến ngẫu nhiên độc lập có cùng có kỳ vọng μ và phương sai bị chặn trên số C ( DX i ≤ C; ∀i = 1, 2, ) Khi đó: X1 + " + X n P ⎯⎯⎯→ μ →∞ n n (5.6) Hệ 2: Giả sử X1, X , là dãy các biến ngẫu nhiên độc lập có cùng phân bố, có kỳ vọng μ và phương sai σ Khi đó: X1 + " + X n P ⎯⎯⎯→ μ n→∞ n (5.7) Định lý Trêbưsép chứng tỏ trung bình số học các biến ngẫu nhiên độc lập hội tụ theo xác suất trung bình số học kỳ vọng tương ứng nó Nói cách khác nó chứng tỏ ổn định trung bình số học số lớn các biến ngẫu nhiên xung quanh trung bình số học các kỳ vọng các biến ngẫu nhiên Như mặc dù biến ngẫu nhiên độc lập có thể nhận giá trị khác nhiều so với kỳ vọng chúng, song trung bình số học số lớn số lớn các biến ngẫu nhiên lại nhận giá trị gần trung bình số học chúng với xác suất lớn Điều đó cho phép dự đoán giá trị trung bình số học các biến ngẫu nhiên Chẳng hạn, gieo xúc xắc cân đối, gọi X là số nốt xuất mặt trên xúc xắc Theo lý thuyết ta tính EX = 3, Một nhà thống kê đã gieo xúc xắc cân đối triệu lần (nhờ trợ giúp máy vi tính) và ghi lại số nốt xuất mặt trên xúc xắc Số trung bình triệu lần gieo tìm thấy là: x1 + " + x106 106 ≈ 3,500867 ≈ 3,5 Định lý Trêbưsép có ứng dụng rộng rãi nhiều lĩnh vực, chẳng hạn nó chính là sở cho phương pháp đo lường vật lý Để xác định giá trị đại lượng vật lý nào đó người ta thường tiến hành đo n lần độc lập và lấy trung bình số học các kết đo làm giá trị thực đại lượng cần đo Thật vậy, giả sử xem kết n lần đo là các biến ngẫu nhiên X1, X , , X n Ta thấy các biến ngẫu nhiên này độc lập, có cùng kỳ vọng chính giá trị thực đại lượng vật lý (giả sử không có sai số hệ thống), các phương sai chúng bị chặn trên bình phương độ chính xác thiết bị đo Do đó theo định lý Trêbưsép ta có thể cho trung bình số học các kết đo sai lệch ít so với giá trị thực đại lượng vật lý với xác suất gần Định lý Trêbưsép còn là sở cho phương pháp mẫu ứng dụng thống kê 5.3 LUẬT SỐ LỚN BERNOULLI Xét phép thử ngẫu nhiên C và A là biến cố liên quan đến phép thử C Tiến hành phép k thử C n lần độc lập và gọi kn là tần số xuất biến cố A n phép thử đó f n = n n gọi là tần suất xuất A n phép thử 85 (87) Chương V: Luật số lớn Định lý 5.3: Tần suất f n hội tụ theo xác suất xác suất p biến cố A , nghĩa là với ε > : lim P{ f n − p > ε} = (5.8) n→∞ Chứng minh: Xét dãy các biến ngẫu nhiên X1, X , , X n xác định sau: ⎧ nÕu A x¶y ë phÐp thö thø k Xk = ⎨ ⎩ nÕu A kh«ng x¶y ë phÐp thö thø k thì dãy các biến ngẫu nhiên X1, X , , X n độc lập có cùng phân bố không – A( p) Ta có X1 + " + X n kn = = fn n n Vậy theo hệ định lý 5.2 suy f n hội tụ theo xác suất p Định lý Bernoulli tần suất xuất biến cố n phép thử độc lập hội tụ theo xác suất xác suất biến cố đó số lần thử tăng lên vô hạn Chính vì định lý Bernoulli là sở lý thuyết định nghĩa thống kê xác suất Ở kỷ 18, nhà toán học Pháp Buffon gieo đồng tiền 4040 lần và ghi 2048 lần xuất mặt ngửa, tần suất là 0,507 Một nhà thống kê người Anh gieo đồng tiền 12000 lần và thu 6019 lần xuất mặt ngửa, tần suất tương ứng 0,5016 Trong thí nghiệm khác, ông ta gieo 24000 lần và thu 12012 lần xuất mặt ngửa, tần suất tương ứng là 0,5005 Như vây ta thấy số phép thử tăng lên thì tần suất tương ứng càng gần 0,5 TÓM TẮT Bất đẳng thức Trêbưsép Cho Y là biến ngẫu nhiên không âm có kỳ vọng hữu hạn Khi đó với a > ta có: EY P{Y > a} ≤ a Nếu X là biến ngẫu nhiên có kỳ vọng và phương sai hữu hạn thì với ε > ta có: P{ X − EX > ε} ≤ DX ε và P{ X − EX ≤ ε} ≥ − DX ε2 Luật số lớn Trêbưsép Giả sử X1, X , là dãy các biến ngẫu nhiên độc lập, có các kỳ vọng hữu hạn và phương sai bị chặn trên số C ( DX i ≤ C; ∀i = 1, 2, ) Khi đó: 86 (88) Chương V: Luật số lớn ⎛ X + " + X n EX1 + " + EX n ⎞ lim P ⎜ − > ε ⎟= n n n→∞ ⎝ ⎠ Giả sử X1, X , là dãy các biến ngẫu nhiên độc lập có cùng có kỳ vọng μ và phương sai bị chặn trên số C ( DX i ≤ C; ∀i = 1, 2, ) độc lập có cùng phân bố, có kỳ vọng μ và phương sai σ Khi đó X1 + " + X n P ⎯⎯⎯→ μ n→∞ n Luật số lớn Bernoulli Tần suất xuất biến cố A n phép thử f n hội tụ theo xác suất xác suất p biến cố A , nghĩa là với ε > lim P{ f n − p > ε} = n→∞ CÂU HỎI ÔN TẬP VÀ BÀI TẬP 5.1 Luật số lớn kết luận hội tụ theo xác suất trung bình cộng các biến ngẫu nhiên độc lập trung bình cộng kỳ vọng chúng các phương sai các biến ngẫu nhiên này bị chặn Đúng Sai 5.2 Giả sử {X n } là dãy các biến ngẫu nhiên có kỳ vọng và phương sai dần tới 0, đó dãy hội tụ theo xác suất đến kỳ vọng chung dãy biến ngẫu nhiên trên Đúng Sai 5.3 Bất đẳng thức Trêbưsép đúng các biến ngẫu nhiên rời rạc Đúng Sai 5.4 Bất đẳng thức Trêbưsép đúng các biến ngẫu nhiên nhận giá trị dương Đúng Sai 5.5 Luật số lớn Bernoulli là trường hợp đặc biết luật số lớn Trêbưsép dãy các biến ngẫu nhiên có cùng phân bố không – A( p ) Đúng Sai 5.6 Luật số lớn Bernoulli là sở lý thuyết định nghĩa thống kê xác suất Đúng Sai 5.7 Có 10 máy hoạt động độc lập với Xác suất để ca làm việc máy bị hỏng là 0,05 Dựa vào bất đẳng thức Trêbưsép hãy đánh giá xác suất sai lệch số máy hỏng và số máy hỏng trung bình a) Nhỏ b) Lớn 87 (89) Chương V: Luật số lớn 5.8 Cho X , X , , X 12 là các biến ngẫu nhiên độc lập với EX i = 16 , DX i = ( i = 1,12 ) Sử dụng bất đẳng thức Trêbưsép để tìm hai số a, b cho: 12 ⎧⎪ ⎫⎪ P ⎨a ≤ ∑ X i ≤ b⎬ ≥ 0,99 ⎪⎩ ⎪⎭ i =1 ⎡ 1⎤ 5.9 Cho X , X , , X 10000 là các biến ngẫu nhiên độc lập có phân bố đoạn ⎢− , ⎥ ⎣ 2⎦ ⎧⎪ 10000 ⎫⎪ Chứng minh P ⎨ ∑ X i ≥ 500⎬ ≥ ⎪⎩ i =1 ⎪⎭ 300 5.10 Gieo xúc xắc cân đối n lần cách độc lập Gọi S là số lần xuất mặt lục n ⎧n ⎫ 31 Chứng minh P ⎨ − n < S < + n ⎬ ≥ ⎩6 ⎭ 36 5.11 Giả sử tiền điện gia đình phải trả tháng là biến ngẫu nhiên với trung bình 16USD và độ lệch tiêu chuẩn 1USD Sử dụng bất đẳng thức Trêbưsép, hãy xác định số M nhỏ để với xác suất 0,99 số tiền điện phải trả năm (12 tháng) không vượt quá M 5.12 Cho dãy các biến ngẫu nhiên độc lập {X n } xác định sau: Xn − 2n 2n P −( n+1) − −2 n −( n+1) Chứng minh dãy {X n } thỏa mãn luật số lớn Trêbưsép 5.13 Cho dãy các biến ngẫu nhiên độc lập {X n } xác định sau: − na Xn P 2n na 1− n 2n đó a là hàng số Dãy {X n } thỏa mãn luật số lớn Trêbưsép không? 5.14 Cho dãy các biến ngẫu nhiên độc lập {X n } xác định sau: Xn −a a P n +1 2n + n 2n + đó a là hàng số Dãy {X n } thỏa mãn luật số lớn Trêbưsép không? 5.15 Xác suất chậm tầu hành khách là 0,007 Dùng bất đẳng thức Trêbưsép hãy đánh giá xác suất để 20.000 hành khách có từ 100 đến 180 người chậm tầu 88 (90) Chương V: Luật số lớn 5.16 Phải kiểm tra bao nhiêu chi tiết để với xác suất không nhỏ 0,98 có thể hy vọng sai lệch tần suất xuất chi tiết tốt và xác suất để chi tiết là tốt 0,95 không vượt quá 0,01 89 (91) Chương VI: Cơ sở lý thuyết mẫu CHƯƠNG VI: CƠ SỞ LÝ THUYẾT MẪU GIỚI THIỆU Thống kê toán là môn toán học nghiên cứu qui luật các tượng ngẫu nhiên có tính chất số lớn trên sở thu thập và xử lý các số liệu thống kê các kết quan sát các tượng ngẫu nhiên này Nếu ta thu thập tất các số liệu liên quan đến đối tượng cần nghiên cứu thì ta có thể biết đối tượng này Tuy nhiên thực tế điều đó không thể thực vì quy mô đối tượng nghiên cứu quá lớn quá trình nghiên cứu đối tượng nghiên cứu bị phá hủy Vì cần lấy mẫu để nghiên cứu Phương pháp mẫu là phương pháp quan trọng lý thuyết thống kê Trong chương này chúng ta tìm hiểu sở lý thuyết mẫu Các phương pháp chọn mẫu: mẫu ngẫu nhiên đơn, mẫu ngẫu nhiên hệ thống, mẫu chùm, mẫu phân tổ, mẫu nhiều cấp Đối với mẫu ngẫu nhiên ta xét các vấn đề: • Các phương pháp mô tả mẫu: - Bảng phân bố tần số thực nghiệm, bảng phân bố tần suất thực nghiệm, bảng phân bố ghép lớp - Biểu đồ tần số hình gậy, đa giác tần suất và tổ chức đồ • Thống kê mẫu ngẫu nhiên • Các đặc trưng thống kê mẫu ngẫu nhiên • Quy luật phân bố xác suất số thống kê đặc trưng mẫu Chương này là sở cho hai chương tiếp NỘI DUNG 6.1 KHÁI NIỆM VỀ PHƯƠNG PHÁP MẪU Nhiều bài toán thực tế dẫn đến nghiên cứu hay nhiều dấu hiệu định tính định lượng đặc trưng cho các phần tử tập hợp nào đó Chẳng hạn muốn điều tra thu nhập bình quân các gia đình Hà Nội thì tập hợp cần nghiên cứu là các hộ gia đình Hà Nội, dấu hiệu nghiên cứu là thu nhập hộ gia đình Một doanh nghiệp muốn nghiên cứu các khách hàng mình dấu hiệu định tính có thể là mức độ hài lòng khách hàng sản phẩm dịch vụ doanh nghiệp, còn dấu hiệu định lượng là số lượng sản phẩm doanh nghiệp mà khách hàng có nhu cầu đáp ứng 89 (92) Chương VI: Cơ sở lý thuyết mẫu Dấu hiệu định lượng thể qua các đơn vị đo đại lượng trọng lượng, độ dài, thời gian, áp suất, chiếc, tá … Trái lại, dấu hiệu định tính giới tính (nam, nữ), sở thích (yêu, ghét, thích loại sản phẩm nào đó), loại phương tiện (di động, cố định, internet)… không có đơn vị Dù có thể mã hóa dấu hiệu này ví dụ nam ứng với 1, nữ ứng với 0, song không có đơn vị đo cho dấu hiệu này Để xử lý dấu hiệu cần nghiên cứu đôi người ta sử dung phương pháp nghiên cứu toàn bộ, đó là điều tra toàn các phần tử tập hợp theo dấu hiệu cần nghiên cứu để rút các kết luận cần thiết Tuy nhiên thực tế việc áp dụng phương pháp này gặp phải khó khăn sau: - Do qui mô tập hợp cần nghiên cứu quá lớn nên việc nghiên cứu toàn đòi hỏi nhiều chi phí vật chất và thời gian, có thể không kiểm soát dẫn đến bị chồng chéo bỏ sót - Trong nhiều trường hợp không thể nắm toàn các phần tử tập hợp cần nghiên cứu, đó không thể tiến hành toàn - Có thể quá trình điều tra phá hủy đối tượng nghiên cứu … Vì thực tế phương pháp nghiên cứu toàn thường áp dụng các tập hợp có qui mô nhỏ, còn chủ yếu người ta sử dụng phương pháp không toàn mà đặc biệt là phương pháp nghiên cứu chọn mẫu 6.2 TỔNG THỂ NGHIÊN CỨU Toàn tập hợp các phần tử đồng theo dấu hiệu nghiên cứu định tính hay định lượng nào đó gọi là tổng thể, ký hiệu C Số lượng các phần tử tổng thể gọi là kích thước tổng thể, ký hiệu N Thường thì kích thước N tổng thể là hữu hạn, song tổng thể quá lớn không thể nắm toàn tổng thể ta có thể giả thiết kích thước tổng thể là vô hạn Điều giả thiết này dựa trên sở là tăng kích thước tổng thể lên khá lớn thì thực tế không ảnh hưởng gì đến kết tính toán trên số liệu phận rút từ tổng thể đó Mỗi phân tử tổng thể gọi là cá thể Các cá thể tổng thể nghiên cứu thông qua các dấu hiệu nghiên cứu Dấu hiệu nghiên cứu này có thể định tính định lượng Nếu dấu hiệu nghiên cứu có tính định lượng, nghĩa là thể cách cho tương ứng cá thể tổng thể C nhận giá trị thực nào đó thì dấu hiệu này gọi là biến lượng, ký hiệu X Bằng cách mô hình hóa ta có thể xem biến lượng X là biến ngẫu nhiên xác định trên tổng thể C Việc chọn từ tổng thể tập nào đó gọi là phép lấy mẫu Tập hợp này gọi là mẫu 90 (93) Chương VI: Cơ sở lý thuyết mẫu 6.3 MẪU NGẪU NHIÊN 6.3.1 Các phương pháp chọn mẫu Một nhiệm vụ quan trọng phương pháp thống kê là xây dựng các phương pháp cho phép ta có thể rút các kết luận, định, lập các dự báo toàn tổng thể trên sở xử lý các thông tin thu trên mẫu Vì vấn đề lấy mẫu quan trọng Tùy theo đặc điểm tổng thể mà mẫu có thể chọn theo nhiều phương pháp khác để đảm bảo yêu cầu tính đại diện mẫu: a Mẫu ngẫu nhiên đơn: là loại mẫu chọn trực tiếp từ danh sách đã đánh số tổng thể Từ tổng thể kích thước N người ta dùng cách rút thăm đơn giản để rút n phần tử tổng thể theo bảng số ngẫu nhiên nào đó Phương pháp này có ưu điểm là cho phép thu mẫu có tính đại diện cao, cho phép suy rộng các kết mẫu cho tổng thể với sai số xác định, song để sử dụng phương pháp này cần phải có toàn danh sách tổng thể nghiên cứu Mặt khác chi phí chọn mẫu khá lớn b Mẫu ngẫu nhiên hệ thống: là loại mẫu ngẫu nhiên đã đơn giản hóa cách chọn, đó có phần tử đầu tiên lựa chọn cách ngẫu nhiên, sau đó dựa trên danh sách đã đánh số tổng thể các phần tử còn lại mẫu chọn theo thủ tục hay quy luật nào đó Nhược điểm chính phương pháp này là dễ mắc sai số hệ thống danh sách tổng thể không xếp cách ngẫu nhiên mà theo trật tự chủ quan nào đó Tuy cách thức đơn giản nó, mẫu ngẫu nhiên hệ thống hay dùng trường hợp tổng thể tương đối c Mẫu chùm: Trong số trường hợp, để tiện cho việc nghiên cứu người ta muốn qui diện nghiên cứu gọn chùm không các phần tử mẫu phần tán quá rộng Chẳng hạn muốn điều tra chi tiêu hàng tháng thì ta tiến hành điều tra với hộ gia đình không xét người riêng lẻ Mỗi hộ gia đình là chùm d Mẫu phân tổ: Để chọn mẫu phân tổ, trước hết người ta phân chia tổng thể thành các tổ có độ cao để chọn các phần tử đại diện cho tổ Việc phân tổ có hiệu tổng thể nghiên cứu không theo dấu hiệu nghiên cứu Sau đã phân tổ thì kích thước mẫu phân bố cho tổ theo qui tắc nào đó, chẳng hạn tỷ lệ thuận với kích thước tổ e Mẫu nhiều cấp: Nếu các phần tử tổng thể phân tán quá rộng và thiếu thông tin chúng, người ta thường chọn mẫu theo nhiều cấp Việc chọn mẫu cấp có thể tiến hành theo phương pháp mẫu ngẫu nhiên đơn, mẫu ngẫu nhiên hệ thống, mẫu chùm hay mẫu phân tổ 6.3.2 Định nghĩa mẫu ngẫu nhiên Ta nói mẫu là mẫu ngẫu nhiên phép lấy mẫu đó cá thể tổng thể chọn cách độc lập và có xác suất chọn Giả sử các cá thể tổng thể nghiên cứu thông qua dấu hiệu X 91 (94) Chương VI: Cơ sở lý thuyết mẫu Với mẫu ngẫu nhiên kích thước n , gọi X i là dấu hiệu X phần tử thứ i mẫu ( i = 1, n ) Bằng cách đồng mẫu ngẫu nhiên với các dấu hiệu nghiên cứu mẫu ta có định nghĩa mẫu ngẫu nhiên sau: Mẫu ngẫu nhiên kích thước n là dãy gồm n biến ngẫu nhiên: X , X , , X n độc lập cùng phân bố với X , ký hiệu W = ( X , X , , X n ) Thực phép thử mẫu ngẫu nhiên W chính là thực phép thử thành phần mẫu Giả sử X i nhận giá trị xi ( i = 1, n ), đó các giá trị x1 , x2 , , xn tạo thành giá trị cụ thể mẫu ngẫu nhiên, hay còn gọi là thể mẫu ngẫu nhiên, ký hiệu w = ( x1 , x2 , , xn ) Ví dụ 6.1: Gọi X là số nốt xuất tung xúc xắc cân đối, X là biến ngẫu nhiên có bảng phân bố xác suất sau: X P 6 6 6 Nếu tung xúc xắc lần và gọi X i là số nốt xuất lần tung thứ i ( i = 1,3 ) thì ta có biến ngẫu nhiên độc lập có cùng quy luật phân bố xác suất với X Vậy ta có mẫu ngẫu nhiên kích thước 3, W = ( X , X , X ) Thực phép thử mẫu ngẫu nhiên này tức là tung xúc xắc lần Giả sử lần thứ nốt, lần thứ hai nốt lần ba nốt thì w = (2,5,3) là mẫu cụ thể mẫu ngẫu nhiên W 6.3.3 Các phương pháp mô tả mẫu ngẫu nhiên 6.3.3.1 Bảng phân bố tần số thực nghiệm Nếu mẫu ngẫu nhiên kích thước n X nhận giá trị xi với tần số xuất ri , i = 1, , k đó: x1 < < xk ; r1 + + rk = n (6.1) Khi đó ta có thể mô tả mẫu ngẫu nhiên trên qua bảng phân bố tần số thực nghiệm: X TÇn sè 92 x1 r1 x2 r2 xk rk (6.2) (95) Chương VI: Cơ sở lý thuyết mẫu 6.3.3.2 Bảng phân bố tần suất thực nghiệm Ký hiệu f i = ri gọi là tần suất xi n Ta có bảng phân bố tần suất thực nghiệm X: X TÇn suÊt x1 f1 x2 f2 xk fk (6.3) Ví dụ 6.2: Lấy mẫu ngẫu nhiên kích thược 120 ta có bảng phân bố thực nghiệm tần số và tần suất: X 31 34 35 36 38 40 42 ∑ 44 TÇn sè 10 20 30 15 10 10 20 120 TÇn suÊt / 24 / 24 / 24 / 24 / 24 / 24 / 24 / 24 6.3.3.3 Hàm phân bố thực nghiệm mẫu Với mẫu ngẫu nhiên xác định bới công thúc (6.1) Hàm số xác định sau: Fn ( x) = ∑ rj x j <x n ; − ∞ < x < +∞ (6.4) gọi là hàm phân bố thực nghiệm mẫu đã cho Định lý Glivenco hàm phân bố thực nghiệm Fn (x) xấp xỉ với phân bố lý thuyết F ( x) = P{X < x} n đủ lớn 6.3.3.4 Bảng phân bố ghép lớp Trong trường hợp mẫu điều tra có kích thước lớn, các giá trị cụ thể dấu hiệu X lấy giá trị khác song lại khá gần nhau, người ta thường xác định số các khoảng C1 , C , , C k cho giá trị dấu hiệu điều tra thuộc vào khoảng nào đó Các khoảng này lập thành phân hoạch miền giá trị X Việc chọn số khoảng và độ rộng khoảng là tùy thuộc vào kinh nghiệm người nghiên cứu, nói chung không nên chia quá ít khoảng Ngoài độ rộng các khoảng không thiết phải Chẳng hạn muốn thống kê tỉ lệ người nghiện thuốc lá thì ta tập trung nhiều vào độ tuổi niên và trung niên Một gợi ý để chọn số khoảng k tối ưu là hãy chọn k nguyên nhỏ cho k ≥ n sau: n : kích thước mẫu k : số khoảng −16 17 −32 33 −64 65 −127 129 −256 257 −512 93 (96) Chương VI: Cơ sở lý thuyết mẫu Ví dụ 6.3: Một mẫu chiều cao 400 cây vườn ươm trình bày bảng phân bố ghép lớp sau: Kho¶ ng 4,5 − 9,5 9,5 − 11,5 TÇn sè ri TÇn suÊt f i § é réng kho¶ ng li yi = ri / li 18 58 0,045 0,145 3,6 29 11,5 − 13,5 13,5 − 16,5 62 72 0,155 0,180 31 24 16,5 − 19,5 19,5 − 22,5 57 42 0,1425 0,105 3 19 14 22,5 − 26,5 26,5 − 36,5 36 55 0,090 0,1375 10 5,5 Chiều cao yi = ri là tần số xuất đơn vị khoảng khoảng có độ dài li li Qui ước: Đầu mút bên phải khoảng thuộc vào khoảng đó mà không thuộc khoảng tính tần số lớp Trong ví dụ trên ta có các khoảng [4,5 ; 9,5] , (9,5 ;11,5] , (11,5 ;13,5] , 6.3.3.5 Biểu diễn biểu đồ Giả sử dấu hiệu điều tra X có bảng phân bố tần số và tần suất thực nghiệm: X TÇn sè x1 r1 x2 r2 xk rk X TÇn suÊt x1 f1 x2 f2 xk fk Trong mặt phẳng với hệ trục toạ độ Oxy ™ Nối điểm trên trục hoành có toạ độ ( xi ,0) với điểm có toạ độ ( xi , ri ) ; i = 1, k ta biểu đồ tần số hình gậy ™ Nối điểm có toạ độ ( xi , f i ) với điểm có toạ độ ( xi +1 , f i +1 ) ; i = 1, k − ta biểu đồ đa giác tần suất Bảng phân bố tần số và tần suất thực nghiệm ví dụ 6.2 có biểu đồ tần số hình gậy và đa giác tần suất 94 (97) Chương VI: Cơ sở lý thuyết mẫu ri 30 20 15 10 31 34 36 38 40 42 44 31 34 36 38 40 42 44 xi fi / 24 / 24 / 24 / 24 / 24 xi 6.3.3.6 Tổ chức đồ (histogram) Đối với bảng phân bố ghép lớp, người ta thường dùng tổ chức đồ để biểu diễn Trong mặt phẳng với hệ toạ độ Oxy , trên trục hoành ta chia các khoảng Ci có độ rộng li Với khoảng Ci ta dựng hình chữ nhật có chiều cao yi = yi = ri (đối với tổ chức đồ tần số), hay li fi (đối với tổ chức đồ tần suất) li 95 (98) Chương VI: Cơ sở lý thuyết mẫu Tổ chức đồ tần số mẫu ghép lớp ví dụ 6.3 31 29 24 19 14 5,5 3,6 4,5 9,5 11,5 13,5 16,5 19,5 22,5 26,5 36,5 Chú ý diện tích giới hạn tổ chức đồ tần số xuất Chẳng hạn số cây nằm khoảng (12; 25] chính là diện tích tổ chức đồ giới hạn đường thẳng x = 12 và x = 25 (13,5 − 12) × 31 + (16,5 − 13,5) × 24 + (19,5 − 16,5) × 19 + (22,5 − 19,5) × 14 + (25 − 22,5) × = 240 Vậy có 240 cây có chiều cao từ 12m đến 25m Với các dấu hiệu điều tra là định tính thì người ta thường mô tả các số liệu mẫu biểu đồ hình bánh xe Đó là hình tròn chia thành góc có diện tích tỷ lệ với các tần số tương ứng mẫu Ví dụ 6.4: Tổng kết kết học tập sinh viên Học viện ta năm 2005 số liệu sau: 19% 12% 31% 38% 96 Gioi Khá Trung bình Yéu (99) Chương VI: Cơ sở lý thuyết mẫu 6.4 THỐNG KÊ VÀ CÁC ĐẶC TRƯNG CỦA MẪU NGẪU NHIÊN 6.4.1 Định nghĩa thống kê Một thống kê mẫu là hàm các biến ngẫu nhiên thành phần mẫu Thống kê mẫu ngẫu nhiên W = ( X , X , , X n ) có dạng: T = T ( X , X , , X n ) (6.5) Như thống kê T là biến ngẫu nhiên tuân theo quy luật phân bố xác suất định và có các tham số đặc trưng kỳ vọng ET phương sai DT … Mặt khác, mẫu ngẫu nhiên nhận giá trị cụ thể w = ( x1 , x2 , , xn ) thì T nhận giá trị cụ thể gọi là giá trị quan sát thống kê: Tqs = T ( x1 , x2 , , xn ) Các thống kê cùng với quy luật phân bố xác suất chúng là sở để suy rộng các thông tin mẫu cho dấu hiệu nghiên cứu tổng thể 6.4.2 Một số thống kê đặc trưng mẫu ngẫu nhiên Có hai nhóm chứa các số đặc trưng mẫu: ™ Các số đặc trưng cho ta hình ảnh vị trí trung tâm mẫu, tức là xu các số liệu mẫu tụ tập xung quanh số nào đó Chẳng hạn trung bình mẫu, trung vị mẫu, mốt mẫu ™ Các số đặc trưng cho phân tán các số liệu: biên độ, độ lệch trung bình, độ lệch tiêu chuẩn và phương sai Ta xem xét số thống kê đặc trưng mẫu quan trọng sau: 6.4.2.1 Trung bình mẫu Trung bình mẫu mẫu ngẫu nhiên W = ( X , X , , X n ) biến ngẫu nhiên X định nghĩa và ký hiệu: X = n ∑ Xi n i =1 (6.6) Giá trị trung bình mẫu cụ thể mẫu ngẫu nhiên cụ thể w = ( x1 , x2 , , xn ) là: x = n ∑ xi n i =1 (6.7) Giả sử dấu hiệu nghiên cứu X có kỳ vọng và phương sai hữu hạn, áp dụng các công thức tính kỳ vọng và phương sai tổng các biến ngẫu nhiên độc lập (2.18), (2.19), (2.26) ta có: 97 (100) Chương VI: Cơ sở lý thuyết mẫu ( ) ( ) E X = EX ; D X = DX n (6.8) Độ lệch chuẩn trung bình mẫu σ X thường dùng để phản ảnh sai số ước lượng, đó người ta còn gọi là sai số chuẩn Se trung bình mẫu: ( ) Se X = σ X = DX n (6.9) 6.4.2.2 Tổng bình phương các sai lệch và trung bình tổng bình phương các sai lệch (*) Tổng bình phương các sai lệch các giá trị mẫu và trung bình mẫu mẫu ngẫu nhiên W = ( X , X , , X n ) ký hiệu và xác định công thức sau: n SS = ∑ ( X i − X ) (6.10) i =1 Nếu mẫu các giá trị X i xuất với tần số ni ( i = 1, k ) và k ∑ ni = n thì: i =1 k SS = ∑ ni ( X i − X ) (6.11) i =1 Trung bình tổng bình phương các sai lệch các giá trị mẫu và trung bình mẫu mẫu ngẫu nhiên W = ( X , X , , X n ) ký hiệu và xác định công thức sau: MS = n k ( X − X ) MS = ni ( X i − X ) ∑ ∑ i n i =1 n i =1 (6.12) Ta có thể chứng minh được: MS = ( )2 k ∑ ni X i − X n i =1 (6.13) Nếu dấu hiệu nghiên cứu X có kỳ vọng và phương sai hữu hạn thì: E(MS) = n −1 DX n (6.14) 6.4.2.3 Phương sai mẫu ƒ Phương sai mẫu Ŝ : k ˆ S = MS = ∑ ni X i − X n i =1 ( 98 ) k = ∑ ni X i2 − X n i =1 ( )2 (6.15) (101) Chương VI: Cơ sở lý thuyết mẫu ƒ Phương sai mẫu có hiệu chỉnh S : S2 = ƒ ( n k MS = ∑ ni X i − X n −1 n − i =1 )2 = n 1− ∑ ni X i2 − n n− (X )2 k (6.15) i =1 Phương sai mẫu S *2 : dấu hiệu nghiên cứu X tổng thể có kỳ vọng xác định EX = μ n S * = ∑ ( X i − μ )2 n i =1 (6.16) Áp dụng công thức tính kỳ vọng (2.18), (2.19) và (6.15) ta có: ES = DX và ES *2 = DX (6.17) 6.4.2.4 Độ lệch tiêu chuẩn mẫu S= ( k ∑ ni X i − X n − i =1 )2 (6.18) 6.4.2.5 Tần suất mẫu Ta cần nghiên cứu dấu hiệu nghiên cứu A nào đó mà cá thể tổng thể có thể có không có dấu hiệu A Nếu cá thể có dấu hiệu A ta cho nhận giá trị 1, trường hợp ngược lại ta cho nhận giá trị Lúc đó dấu hiệu nghiên cứu có thể xem là biến ngẫu nhiên X có quy luật phân bố xác suất không – A( p) có kỳ vọng và phương sai EX = p ; DX = p(1 − p) Lấy mẫu ngẫu nhiên kích thước n : W = ( X , X , , X n ) , đó X , X , , X n là các biến ngẫu nhiên độc lập có cùng phân bố không – A( p) Tần số xuất dấu hiệu A mẫu là: r = X1 + X + + Xn (6.19) Tần suất mẫu: f = r n (6.20) Tương tự ta có công thức tính kỳ vọng và phương sai tần suất mẫu: E ( f ) = p ; D( f ) = p(1 − p) n (6.21) Sai số chuẩn tần suất mẫu: Se( f ) = p (1 − p ) n (6.22) 99 (102) Chương VI: Cơ sở lý thuyết mẫu 6.4.2.6 Cách tính giả trị cụ thể trung bình mẫu và phương sai mẫu x , s Nếu mẫu nhận các giá trị x1 , x2 , , xk với tần số tương ứng n1 , n2 , , nk thì giá trị trung bình mẫu và phương sai mẫu cụ thể tính theo công thức: ∑ ni x i x = i =1 k n ∑ ni = n (6.23) i =1 ( k s = ∑ ni x i − x n − i =1 k , ) ⎛ ⎜ k = ⎜ ∑ ni x i − n − ⎜ i =1 ⎝ ) ⎞⎟⎟ (∑ k n x i i i =1 n (6.24) ⎟ ⎠ Nếu giá trị mẫu cụ thể cho dạng bảng phân bố ghép lớp với các khoảng C1 , , C m và tần số Ci là ni thì giá trị trung bình mẫu và phương sai mẫu tính trên, đó xi là trung điểm khoảng Ci Mẫu thu gọn: Nếu các giá trị mẫu cụ thể xi không gọn (quá lớn quá bé phân tán) ta có thể thu gọn mẫu cách đổi biến: ui = xi − a ⇒ xi = hu i + a ⇒ x = h u + a ; s x2 = h su2 h k k k i =1 i =1 i =1 (6.25) Thật vậy: x = ∑ ni xi = ∑ ni ( h ui + a ) = h∑ ni ui + a = h u + a s x2 = ( k ∑ ni xi − x n − i =1 )2 = n 1− ∑ ni (h ui + a − h u − a )2 = nh− ∑ ni (ui − u )2 = h su2 k i =1 k i =1 Các số a và h chọn phù hợp cho u , su2 tính dễ dàng Thông thường ta chọn a là điểm các giá trị xi Ví dụ 6.5: Giá trị trung bình mẫu và phương sai mẫu mẫu ví dụ 6.3 100 xi − 20 ni ui ni u i2 − 2,6 − 46,8 121,68 10,5 − 1,9 − 110,2 209,38 62 12,5 − 1,5 − 93 139,5 72 15 −1 − 72 72 Khoảng tần số ni xi 4,5 − 9,5 18 9,5 − 11,5 58 11,5 − 13,5 13,5 − 16,5 ui = (103) Chương VI: Cơ sở lý thuyết mẫu 16,9 − 19,5 57 18 − 0,4 − 22,8 9,12 19,5 − 22,5 42 21 0,2 8,4 1,68 22,5 − 26,5 36 24,5 0,9 32,4 29,16 26,5 − 36,5 55 31,5 2,3 126,5 290,95 − 177,5 873,47 ∑ 400 x = u + 20 = × su2 = − 177,5 + 20 = 17,78 400 (− 177,5)2 ⎞⎟ = 1,9917 ⇒ ⎛⎜ × 873,47 − 399 ⎜⎝ 400 ⎟⎠ sx2 = 52 × su2 = 49, 79 ⇒ s = 49, 79 = 7, 056 6.5 MẪU NGẪU NHIÊN HAI CHIỀU 6.5.1 Khái niệm mẫu ngẫu nhiên hai chiều Giả sử trên cùng tổng thể phải nghiên cứu đồng thời hai dấu hiệu nghiên cứu, đó dấu hiệu nghiên cứu thứ có thể xem là biến ngẫu nhiên X , còn dấu hiệu nghiên cứu thứ hai là biến ngẫu nhiên Y Lúc đó việc nghiên cứu đồng thời hai dấu hiệu tổng thể tương đương với việc nghiên cứu biến ngẫu nhiên hai chiều ( X , Y ) Mẫu ngẫu nhiên hai chiều kích thước n dấu hiệu nghiên cứu ( X , Y ) là dãy gồm n biến ngẫu nhiên hai chiều ( X , Y1 ) , ( X , Y2 ) , …, ( X n , Yn ) độc lập và có cùng quy luật phân bố xác suất với ( X , Y ) Mẫu ngẫu nhiên hai chiều ký hiệu là: W = [( X , Y1 ), ( X , Y2 ), , ( X n , Yn )] Giả sử thành phần ( X i , Yi ) nhận giá trị ( xi , yi ) ( i = 1, n ) ta thu mẫu cụ thể: w = [( x1 , y1 ), ( x2 , y ), , ( xn , y n )] Các giá trị xi ( i = 1, n ) gọi là thành phần X mẫu, còn các giá trị yi ( i = 1, n ) gọi là thành phần Y mẫu 6.5.2 Phương pháp mô tả mẫu ngẫu nhiên hai chiều Giả sử từ tổng thể ta rút mẫu ngẫu nhiên cụ thể w kích thước n Ta hãy xếp các giá trị thành phần X và Y mẫu theo thứ tự tăng dần: 101 (104) Chương VI: Cơ sở lý thuyết mẫu x1 < x2 < < xi < < xh và y1 < y < < y j < < y k Ký hiệu nij là tần số cặp giá trị ( xi , y j ) mẫu w , rõ ràng các tần số nij thỏa mãn k hệ thức h ∑∑ nij = Lúc đó mẫu cụ thể w mô tả bảng phân bố xác suất tần số thực j =1 i =1 nghiệm sau: Y y1 y2 … yj … yk ni* x1 n11 n12 … n1 j … n1k n1* x2 n 21 n 22 … n2 j … n2 k n 2* nik ni* X … xi ni1 ni … … nij … … … xh nh1 nh … n hj … nhk nh* n* j n*1 n*2 … n* j … n*k ∑= n đó ni* là tần số giá trị xi ( i = 1, h ) thành phần X , n* j là tần số giá trị y j ( j = 1, k ) thành phần Y 6.5.3 Một số thống kê đặc trưng mẫu ngẫu nhiên hai chiều Từ bảng phân bố thực nghiệm mẫu ngẫu nhiên hai chiều ta có thể rút ra: Bảng phân bố thực nghiệm thành phần X : X x1 x2 … xi … xh Tần số n1* n 2* … ni* … nh* ( )2 Các thống kê đặc trưng X : X = 102 h h n X ; S = ∑ i* i X n − ∑ ni* X i − X n i =1 i =1 (6.26) (105) Chương VI: Cơ sở lý thuyết mẫu Bảng phân bố thực nghiệm thành phần Y Y y1 y2 … yj … yk Tần số n*1 n*2 … n* j … n*k Các thống kê đặc trưng Y : Y= ( k k n Y S = ; ∑ * j j Y n − ∑ n* j Y j − Y n j =1 j =1 )2 (6.27) Hệ số tương quan mẫu: h k ∑ i =1 ∑ j =1 nij ( X i − X )(Y j − Y ) r= ⋅ n MS X MSY (6.28) 6.6 QUY LUẬT PHÂN BỐ XÁC SUẤT CỦA MỘT SỐ THỐNG KÊ ĐẶC TRƯNG MẪU (*) 6.6.1 Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân bố chuẩn Giả sử dấu hiệu nghiên cứu tổng thể có thể xem biến ngẫu nhiên X tuân theo quy luật chuẩn với kỳ vọng EX = μ và phương sai DX = σ Các tham số này có thể đã biết chưa biết Từ tổng thể rút mẫu ngẫu nhiên kích thước n : W = ( X , X , , X n ) Các biến ngẫu nhiên thành phần X , X , , X n độc lập có cùng quy luật phân bố chuẩn N (μ, σ ) X Theo công thức (3.20) tổ hợp tuyến tính các biến ngẫu nhiên có phân bố chuẩn là biến ngẫu nhiên có phân bố chuẩn Vì ta có các kết sau: Thống kê trung bình mẫu: ( ) Trung bình mẫu X có quy luật phân bố chuẩn với kỳ vọng E X = μ và phương sai ( ) DX = σ2 Theo công thức (3.26), biến ngẫu nhiên sau có quy luật chuẩn tắc N (0;1) n U= ( X − μ) n σ ~ N (0;1) (6.29) Thống kê phương sai Ŝ 103 (106) Chương VI: Cơ sở lý thuyết mẫu n n nSˆ 2 ⎛ Xi − μ ⎞ Từ công thức (6.16) ta có: nSˆ = ∑ ( X i − μ ) và = ∑ ⎜⎝ σ ⎟⎠ σ i =1 i =1 Vì các biến ngẫu nhiên X i độc lập nên các biến ngẫu nhiên khác theo (3.26) Xi − μ độc lập Mặt σ Xi − μ ~ N (0;1) Do đó biến ngẫu nhiên sau có phân bố ”Khi bình phương“ n σ bậc tự χ2 = nSˆ σ2 n ⎛ X −μ⎞ = ∑⎜ i ⎟ ~ χ ( n) σ ⎠ i =1 ⎝ (6.30) Thống kê phương sai S Có thể chứng minh thống kê sau có phân bố “Khi bình phương“ n − bậc tự χ = (n − 1) S σ2 ⎛X −X = ∑ ⎜⎜ i σ i =1 ⎝ n ⎞ ⎟ ~ χ (n − 1) ⎟ ⎠ (6.31) Hơn nữa, từ (6.29), (6.31) và U , χ độc lập, áp dụng công thức (3.39) thì: T= U χ (n − 1) có phân bố Student n − bậc tự ( X − μ) n T= U χ (n − 1) = (X − μ) n σ = ~ T(n − 1) S (n − 1) S σ (n − 1) (6.32) Khi n khá lớn thì quy luật Student T(n) hội tụ khá nhanh phân bố chuẩn tắc N (0;1) , đó thực tế n > 30 ta có thể xem thống kê T xấp xỉ N (0;1) 6.6.2 Trường hợp có hai biến ngẫu nhiên gốc cùng phân bố theo quy luật chuẩn Giả sử ta xét cùng lúc hai tổng thể Ở tổng thể thứ dấu hiệu nghiên cứu xem biến ngẫu nhiên X có phân bố chuẩn N (μ1 ; σ12 ) Ở tổng thể thứ hai dấu hiệu nghiên cứu xem biến ngẫu nhiên X có phân bố chuẩn N (μ ; σ 22 ) Từ hai tổng thể nói trên rút hai mẫu ngẫu nhiên độc lập kích thước tương ứng là n1 và n2 W1 = ( X 11 , X 12 , , X 1n1 ) ; 104 W2 = ( X 21 , X 22 , , X 2n ) (107) Chương VI: Cơ sở lý thuyết mẫu Thống kê hiệu hai trung bình mẫu X − X Đây là tổ hợp tuyến tính các phân bố chuẩn đó có quy luật phân bố chuẩn Mặt khác kỳ vọng và phương sai ( ) ( ) ( ) E X − X = E X − E X = μ1 − μ ( ) ( ) ( ) D X1 − X = D X1 + D X σ12 σ 22 = + n1 n2 Do đó thống kê sau có phân bố chuẩn tắc: U= ( X − X ) − (μ1 − μ ) σ12 n1 + σ 22 ~ N (0;1) (6.33) n2 Hai thống kê phương sai thành phần: χ12 = (n1 − 1) S12 σ12 ~ χ (n1 − 1) ; χ 22 = (n2 − 1) S 22 σ 22 ~ χ (n2 − 1) và độc lập (6.34) Do đó thống kê: χ2 = (n1 − 1) S12 σ12 + (n2 − 1) S 22 σ 22 ~ χ (n1 + n2 − 2) (6.35) Từ (6.33)-(6.35) suy ra: ♦ Nếu σ12 = σ 22 thì thống kê: T= ( X − X ) − ( μ1 − μ2 ) (n1 − 1) S12 + (n2 − 1) S 22 n1 + n2 − 1 + n1 n2 ~ T(n1 + n2 − 2) (6.36) có phân bố Student n1 + n2 − bậc tự ♦ Nếu σ12 ≠ σ 22 thì thống kê: T= ( X − X ) − ( μ1 − μ ) S12 S 22 + n1 n2 ~ T( k ) (6.37) có phân bố Student k bậc tự do, đó: 105 (108) Chương VI: Cơ sở lý thuyết mẫu k= (n1 − 1)(n2 − 1) (n − 1)C + (n1 − 1)(1 − C ) ; C= S12 n1 S12 S 22 + n1 n2 Từ (6.34) và (3.43) suy ra: χ12 n1 − F= χ 22 n2 − = S12 σ 22 S 22 σ12 ~ F [(n1 − 1); (n2 − 1)] (6.38) có phân bố Fisher-Snedecor với n1 − và n − bậc tự 6.6.3 Trường hợp biến ngẫu nhiên gốc phân bố theo quy luật không – Định lý: (Định lý giới hạn trung tâm) Giả sử X1, X , là dãy các biến ngẫu nhiên độc lập có cùng phân bố, với kỳ vọng μ và phương sai σ Khi đó dãy biến ngẫu nhiên Sn = X1 + + X n − nμ σ n hội tụ theo phân bố phân bố chuẩn tắc N (0;1) , nghĩa là: Với x ∈ lim P {Sn < x} = Φ( x) (6.38) n→∞ Φ( x) là hàm phân bố phân bố chuẩn tắc N (0;1) Áp dụng định lý giới hạn trung tâm cho dãy các ĐLNN độc lập X1, X , có cùng phân bố không – A( p) ta định lý Moivre –Laplace: ⎧⎪ X + Với x ∈ , lim P ⎨ n→∞ ⎩ ⎪ + X n − np npq ⎪⎫ < x ⎬ = Φ ( x) ⎭⎪ (6.39) Giả sử tổng thể dấu hiệu nghiên cứu có thể xem biến ngẫu nhiên phân bố theo quy luật không – Từ tổng thể rút mẫu ngẫu nhiên kích thước n : W = ( X , X , , X n ) Từ công thức (6.19), (6.20), (6.21) ta đã biết tần suất mẫu f = nhị thức với các tham số đặc trưng là: E( f ) = p ; D( f ) = 106 X1 + + Xn n có quy luật pq Do đó công thức (6.39) trở thành: n (109) Chương VI: Cơ sở lý thuyết mẫu ⎪⎧ ( f − p) n ⎪⎫ < x ⎬ = Φ ( x) Với x ∈ , lim P ⎨ n→∞ ⎪ pq ⎪⎭ ⎩ Định lý Moivre-Laplace cho phép xấp xỉ thống kê U = (6.40) ( f − p) n với phân bố chuẩn tắc pq N (0;1) n đủ lớn Người ta thấy xấp xỉ là tốt np > và nq > npq > 20 U= ⎧ np > ( f − p) n ~ N (0;1) ⎨ npq > 20 pq ⎩ nq > (6.41) 6.6.4 Trường hợp có hai biến ngẫu nhiên gốc phân bố theo quy luật không - Giả sử ta xét cùng lúc hai tổng thể đó dấu hiệu nghiên cứu hai tổng xem biến ngẫu nhiên có phân bố không – với các tham số là p1 và p2 Từ hai tổng thể nói trên rút hai mẫu ngẫu nhiên độc lập kích thước tương ứng là n1 và n2 : W1 = ( X 11 , X 12 , , X 1n1 ) ; W2 = ( X 21 , X 22 , , X 2n ) Xét thống kê f1 − f là hiệu hai tần suất mẫu Lúc đó n1 > 30 và n2 > 30 thì f1 − f có phân bố xấp xỉ chuẩn theo định lý giới hạn trung tâm với các tham số đặc trưng là: p (1 − p1 ) p2 (1 − p2 ) + E ( f1 − f ) = p1 − p2 và D ( f1 − f ) = n1 n2 Do đó thống kê sau xấp xỉ phân bố chuẩn tắc: U= ( f1 − f ) − ( p1 − p2 ) p1 (1 − p1 ) p2 (1 − p2 ) + n1 n2 ~ N (0;1) (6.42) TÓM TẮT Tổng thể Toàn tập hợp các phần tử đồng theo dấu hiệu nghiên cứu định tính hay định lượng nào đó gọi là tổng thể Việc chọn từ tổng thể tập nào đó gọi là phép lấy mẫu Tập hợp này gọi là mẫu Mẫu ngẫu nhiên Nếu phép lấy mẫu đó cá thể tổng thể chọn cách độc lập và có xác suất chọn Mẫu ngẫu nhiên dấu hiệu nghiên cứu X 107 (110) Chương VI: Cơ sở lý thuyết mẫu Mẫu ngẫu nhiên kích thước n là dãy gồm n biến ngẫu nhiên: X , X , , X n độc lập cùng phân bố với X , ký hiệu W = ( X , X , , X n ) Bảng phân bố tần số thực nghiệm và tần suất thực nghiệm Nếu mẫu ngẫu nhiên kích thước n X nhận giá trị xi với tần số xuất ri , i = 1, , k : x1 < < xk ; r1 + + rk = n f i = ri gọi là tần suất xi n Khi đó ta có thể mô tả mẫu ngẫu nhiên trên qua bảng phân bố tần số thực nghiệm tần suất thực nghiệm X X TÇn sè x1 r1 x2 r2 xk rk X TÇn suÊt x1 f1 x2 f2 xk fk Hàm phân bố thực nghiệm mẫu Hàm số xác định sau: Fn ( x) = ∑ rj x j <x n ; −∞ < x < +∞ Bảng phân bố ghép lớp Trong trường hợp mẫu điều tra có kích thước lớn, các giá trị cụ thể dấu hiệu X lấy giá trị khác song lại khá gần nhau, người ta thường xác định số các khoảng C1 , C , , C k cho giá trị dấu hiệu điều tra thuộc vào khoảng nào đó Các khoảng này lập thành phân hoạch miền giá trị X Biểu diễn biểu đồ Trong mặt phẳng với hệ trục toạ độ Oxy ™ Nối điểm trên trục hoành có toạ độ ( xi ,0) với điểm có toạ độ ( xi , ri ) ; i = 1, k ta biểu đồ tần số hình gậy ™ Nối điểm có toạ độ ( xi , f i ) với điểm có toạ độ ( xi +1 , f i +1 ) ; i = 1, k − ta biểu đồ đa giác tần suất ™ Đối với bảng phân bố ghép lớp, người ta thường dùng tổ chức đồ để biểu diễn: Trên trục hoành ta chia các khoảng Ci có độ rộng li Với khoảng Ci ta dựng hình chữ nhật có chiều cao yi = ri f (đối với tổ chức đồ tần số), hay yi = i (đối với tổ chức đồ tần suất) li li Thống kê 108 (111) Chương VI: Cơ sở lý thuyết mẫu Một thống kê mẫu là hàm các biến ngẫu nhiên thành phần mẫu Thống kê mẫu ngẫu nhiên W = ( X , X , , X n ) có dạng: T = T ( X , X , , X n ) Trung bình mẫu Trung bình mẫu mẫu ngẫu nhiên W = ( X , X , , X n ) n là: X = ∑ X i n i =1 Trung bình tổng bình phương các sai lệch các giá trị mẫu và trung bình mẫu MS = n ( X i − X )2 ∑ n i =1 Phương sai mẫu • Phương sai mẫu có hiệu chỉnh S : S2 = • ( k n MS = ∑ ni X i − X n −1 n − i =1 )2 = n 1− ∑ ni X i2 − n n− (X )2 k i =1 Phương sai mẫu S *2 xét dấu hiệu nghiên cứu X tổng thể có kỳ vọng xác định EX = μ n S * = ∑ ( X i − μ )2 n i =1 Độ lệch tiêu chuẩn mẫu S= ( k ∑ ni X i − X n − i =1 )2 Tần suất mẫu Xét biến ngẫu nhiên gốc X có phân bố không – A( p) Lấy mẫu ngẫu nhiên kích thước n : W = ( X , X , , X n ) , X , X , , X n là các biến ngẫu nhiên độc lập có cùng phân bố với X Tần số xuất dấu hiệu A mẫu là: r = X + X + + X n Tần suất mẫu f = r n Cách tính giả trị cụ thể trung bình mẫu và phương sai mẫu x , s Nếu mẫu nhận các giá trị x1 , x2 , , xk với tần số tương ứng n1 , n2 , , nk thì giá trị trung bình mẫu và phương sai mẫu cụ thể tính theo công thức: 109 (112) Chương VI: Cơ sở lý thuyết mẫu ∑ x= k nx i =1 i i n k k ( , ∑ ni = n ; s = ∑ ni xi − x n − i =1 i =1 ) ⎛ ⎜ k = ⎜ ∑ ni xi2 − n − ⎜ i =1 ⎜ ⎝ (∑ ) k n x i =1 i i n ⎞ ⎟ ⎟ ⎟ ⎟ ⎠ Mẫu ngẫu nhiên hai chiều Giả sử trên cùng tổng thể phải nghiên cứu đồng thời hai dấu hiệu nghiên cứu, lúc đó việc nghiên cứu đồng thời hai dấu hiệu tổng thể tương đương với việc nghiên cứu biến ngẫu nhiên hai chiều ( X , Y ) Mẫu ngẫu nhiên hai chiều ký hiệu là: W = [( X , Y1 ), ( X , Y2 ), , ( X n , Yn )] Giả sử thành phần ( X i , Yi ) nhận giá trị ( xi , yi ) ( i = 1, n ) ta thu mẫu cụ thể: w = [( x1 , y1 ), ( x2 , y ), , ( xn , y n )] Phương pháp mô tả mẫu ngẫu nhiên hai chiều Giả sử từ tổng thể rút mẫu ngẫu nhiên cụ thể w kích thước n Ta xếp các giá trị thành phần X và Y mẫu theo thứ tự tăng dần: x1 < x2 < < xi < < xh và y1 < y < < y j < < y k k Ký hiệu nij là tần số cặp giá trị ( xi , y j ) mẫu w , h ∑∑ nij = j =1 i =1 Lúc đó mẫu cụ thể w mô tả bảng phân bố xác suất tần số thực nghiệm sau: Y y1 y2 … yj … yk ni* x1 n11 n12 … n1 j … n1k n1* x2 n 21 n 22 … n2 j … n2 k n 2* nik ni* X … xi ni1 ni … … nij … 110 … … xh nh1 nh … n hj … nhk nh* n* j n*1 n*2 … n* j … n*k ∑= n (113) Chương VI: Cơ sở lý thuyết mẫu đó ni* là tần số giá trị xi ( i = 1, h ) thành phần X , n* j là tần số giá trị y j ( j = 1, k ) thành phần Y Một số thống kê đặc trưng mẫu ngẫu nhiên hai chiều Bảng phân bố thực nghiệm thành phần X : X x1 x2 … xi … xh Tần số n1* n 2* … ni* … nh* ( h h n X ; S = ∑ i* i X n − ∑ ni* X i − X n i =1 i =1 Các thống kê đặc trưng X : X = )2 Bảng phân bố thực nghiệm thành phần Y : Y Tần số y1 y2 … yj … yk n*1 n*2 … n* j … n*k ∑i=1 ∑ j =1 nij ( X i − X )(Y j − Y ) h Hệ số tương quan mẫu: r = ( k k n Y S = ; ∑ * j j Y n − ∑ n* j Y j − Y n j =1 j =1 Y= Các thống kê đặc trưng Y : )2 k n MS X MSY Quy luật phân bố xác suất số thống kê đặc trưng mẫu Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân bố chuẩn: U= ( X − μ) n ~ N (0;1) σ χ = χ = nSˆ σ2 n ⎛ X −μ⎞ = ∑⎜ i ⎟ ~ χ ( n) σ ⎠ i =1 ⎝ (n − 1) S σ2 ⎛X −X = ∑ ⎜⎜ i σ i =1 ⎝ n ⎞ ⎟ ~ χ (n − 1) ⎟ ⎠ 111 (114) Chương VI: Cơ sở lý thuyết mẫu (X − μ) n U T= χ (n − 1) σ = (n − 1) S σ (n − 1) = (X − μ) n ~ T(n − 1) S Trường hợp có hai biến ngẫu nhiên gốc cùng phân bố theo quy luật chuẩn: X1 ~ N ( μ1; σ12 ) , X ~ N ( μ2 ; σ 22 ) U= ( X − X ) − (μ1 − μ ) σ12 σ 22 + n1 n2 χ = T= F= (n1 − 1) S12 σ12 + ~ N (0;1) (n2 − 1) S 22 σ 22 ~ χ (n1 + n2 − 2) ( X − X ) − ( μ1 − μ2 ) (n1 − 1) S12 + (n2 − 1) S22 n1 + n2 − χ12 n1 − χ 22 n2 − = S12 σ 22 S 22 σ12 1 + n1 n2 ~ T(n1 + n2 − 2) ~ F [(n1 − 1); (n2 − 1)] Trường hợp biến ngẫu nhiên gốc có phân bố theo quy luật không – một: U= ⎧ np > ( f − p) n npq > 20 ~ N (0;1) ⎨ pq ⎩ nq > Trường hợp có hai biến ngẫu nhiên gốc có phân bố theo quy luật không – một: Giả sử ta xét cùng lúc hai tổng thể đó dấu hiệu nghiên cứu hai tổng xem biến ngẫu nhiên có phân bố không – với các tham số là p1 và p2 Xét thống kê f1 − f là hiệu hai tần suất mẫu Lúc đó n1 > 30 và n2 > 30 thì: U= 112 ( f1 − f ) − ( p1 − p2 ) p1 (1 − p1 ) p2 (1 − p2 ) + n1 n2 ~ N (0;1) (115) Chương VI: Cơ sở lý thuyết mẫu CÂU HỎI ÔN TẬP VÀ BÀI TẬP 6.1 Mẫu ngẫu nhiên kích thước n dấu hiệu nghiên cứu X là dãy gồm n biến ngẫu nhiên X , X , , X n độc lập cùng phân bố với X Đúng Sai 6.2 Tổ chức đồ dùng để biểu diễn mẫu ngẫu nhiên cho dạng bảng phân bố ghép lớp Đúng Sai 6.3 Một thống kê mẫu ngẫu nhiên là số cụ thể dấu hiệu nghiên cứu Đúng Sai 6.4 Trung bình mẫu dấu hiệu nghiên cứu có phân bố chuẩn có phân bố chuẩn Đúng Sai 6.5 Một thống kê mẫu là hàm các biến ngẫu nhiên thành phần mẫu đó là biến ngẫu nhiên Đúng Sai 6.6 Phương sai mẫu dấu hiệu nghiên cứu có phân bố chuẩn có phân bố chuẩn Đúng Sai 6.7 Nếu hai biến ngẫu nhiên gốc X , X có phân bố chuẩn thì thống kê hiệu hai trung bình mẫu X − X có phân bố chuẩn Đúng Sai 6.8 Khi bậc tự phân bố Student lớn 30, phân bố Student tiệm cận phân bố chuẩn Đúng Sai 6.9 Khi kích thước mẫu n1 > 30 và n2 > 30 thì thống kê hiệu hai tần suất mẫu f1 − f hai dấu hiệu nghiên cứu có quy luật không – xấp xỉ phân bố chuẩn Đúng Sai 6.10 Nếu biến ngẫu nhiên gốc có phân bố chuẩn thì phương sai mẫu có phân bố χ Đúng Sai 6.11 Cho ví dụ biến ngẫu nhiên, mẫu ngẫu nhiên kích thước n = 10 và giá trị mẫu ngẫu nhiên xây dựng từ biến ngẫu nhiên 6.12 Cho ví dụ mẫu ngẫu nhiên kích thước n xây dựng từ biến ngẫu nhiên có phân bố không – một, phân bố nghị thức, phân bố chuẩn 6.13 Hãy tính giá trị trung bình mẫu tần số thực nghiệm sau: x và phương sai mẫu s mẫu cụ thể có bảng phân bố 113 (116) Chương VI: Cơ sở lý thuyết mẫu xi ni 21 10 24 20 6.14 Hãy tính giá trị trung bình mẫu phân bố tần số thực nghiệm sau xi ni 25 30 26 15 28 10 32 10 34 x và độ lệch chuẩn mẫu s mẫu cụ thể có bảng 12 10 6.15 Để nghiên cứu tuổi thọ ( X ) loại bóng đèn, người ta thắp thử 100 bóng và có số liệu sau: Tuæi thä X (giê ) Sè bãng t−ong øng (ni ) 1010 − 1030 1030 − 1050 1050 − 1070 1070 − 1090 1090 − 1110 13 25 1110 − 1130 1130 − 1150 1150 − 1170 20 12 10 1170 − 1190 1190 − 1210 n = 100 Tính tuổi thọ trung bình x và độ lệch chuẩn mẫu s 6.16 Từ tổng thể có dấu hiệu nghiên cứu X có bảng phân bố xác suất sau X P 0,5 0,5 lập mẫu ngẫu nhiên kích thước n = 10 Tính xác suất để trung bình mẫu mẫu ngẫu nhiên này nhận giá trị 0,5 6.17 Giả sử biến ngẫu nhiên gốc có phân bố không - A( p ) Chọn mẫu ngẫu nhiên kích thước n = 10 Hãy tính kỳ vọng và phương sai trung bình mẫu 6.18 Giả sử biến ngẫu nhiên gốc có phân bố chuẩn N (20;1) Chọn mẫu ngẫu nhiên kích thước n = 100 Hãy tính xác suất để trung bình mẫu X nằm khoảng: 114 (117) Chương VI: Cơ sở lý thuyết mẫu 19,8 < X < 20,2 6.19 Một mẫu cụ thể biến ngẫu nhiên X sau: ; ; ; ; ; ; ; ; ; ( n − 10 ) a) Lập bảng phân bố tần suất b) Xây dựng hàm phân bố thực nghiệm c) Tính x , s2 , s 6.20 Theo dõi thời gian và số người hoàn thành sản phẩm hai nhóm công nhân ta có bảng sau: Nhóm X (phút) 42 44 50 58 60 64 ni (số người) 20 10 X (phút) 46 48 51 ni (số người) 40 Nhóm Tính x và độ lệch chuẩn mẫu s hai mẫu cụ thể trên Cho nhận xét 115 (118) Chương VII: Ước lượng các tham số biến ngẫu nhiên CHƯƠNG VII: ƯỚC LƯỢNG CÁC THAM SỐ CỦA BIẾN NGẪU NHIÊN GIỚI THIỆU Quy luật phân bố xác suất các thống kê đặc trưng mẫu phản ánh mối liên hệ chặt chẽ các tham số mẫu với các tham số dấu hiệu nghiên cứu tương ứng tổng thể Lý thuyết thống kê sử dụng hai phương pháp sau • Suy diễn thống kê: Nếu đã biết qui luật phân bố xác suất các tham số đặc trưng tổng thể thì có thể sử dụng các kết luận trên để suy đoán tính chất mẫu ngẫu nhiên rút từ tổng thể đó Chẳng hạn, biết dấu hiệu nghiên cứu X có phân bố chuẩn N (μ, σ ) thì thống kê ( X − μ) n σ2 • có phân bố chuẩn tắc N (0;1) Quy nạp thống kê: Sử dụng các phương pháp thống kê để từ các đặc trưng mẫu suy các đặc trưng tổng thể Chính vì các phương pháp thống kê giải nhiều bài toán thực tể, có thể giúp cho các nhà nghiên cứu tìm quy luật tổng thể, giúp các nhà hoạch định chính sách dự đoán phát triển tương lai, để các định chấp nhận bác bỏ các giả thiết nào đó Trong chương này ta sử dụng phương pháp quy nạp thống kê để ước lượng các tham số đặc trưng tổng thể thông qua thống kê mẫu Nếu dấu hiệu nghiên cứu tổng thể có thể xem biến ngẫu nhiên và giả sử lý thuyết đã xác định dạng phân bố xác suất nó thì vấn đề xác định các tham số đặc trưng tổng thể quy bài toán xác định các tham số đặc trưng quy luật phân bố xác suất biến ngẫu nhiên gốc X Chẳng hạn đã biết dấu hiệu nghiên cứu tổng thể có phân bố chuẩn N (μ, σ ) thì bài toán đặt là phải ước lượng các tham số là kỳ vọng μ và phương sai σ , hai tham số này chính là trung bình và phương sai tổng thể Có hai phương pháp sử dụng thống kê để ước lượng tham số là ước lượng điểm và khoảng tin cậy: Ước lượng điểm là dùng thống kê để ước lượng tham số nào đó theo các tiêu chuẩn: vững, không chệch, hiệu Có hai phương pháp ước lượng điểm là phương pháp môment và phương pháp hợp lý cực đại 116 (119) Chương VII: Ước lượng các tham số biến ngẫu nhiên Khoảng tin cậy là khoảng mà tham số dấu hiệu nghiên cứu tổng thể rơi vào khoảng này với xác suất độ tin cậy Trong chương này ta xây dựng ước lượng cho kỳ vọng, phương sai dấu hiệu nghiên cứu có phân bố chuẩn và ước lượng cho tần suất tổng thể Để học tốt chương này học viên cần nắm vững chương lý thuyết mẫu NỘI DUNG 7.1 PHƯƠNG PHÁP ƯỚC LƯỢNG ĐIỂM Phương pháp ước lượng điểm chủ trương dùng giá trị để thay cho giá trị tham số θ chưa biết tổng thể Thông thường giá trị chọn này giá trị cụ thể thống kê θ̂ nào đó mẫu ngẫu nhiên Với mẫu ngẫu nhiên W = ( X , X , , X n ) , thống kê ước lượng cho tham số θ có dạng (6.5): θˆ = T ( X , X , , X n ) Khi đó với mẫu cụ thể w = ( x1 , x2 , , xn ) giá trị cụ thể thống kê θˆ = T ( x1 , x , , x n ) là ước lượng θ Cùng với mẫu ngẫu nhiên có thể xây dựng nhiều thống kê θ̂ khác để ước lượng cho tham số θ Vì ta cần lựa chọn thống kê tốt để ước lượng cho tham số θ dựa vào các tiêu chuẩn sau: 7.1.1 Ước lượng không chệch Thống kê θˆ = T ( X , X , , X n ) là hàm các biến ngẫu nhiên X , X , , X n nên là biến ngẫu nhiên Do đó ta có thể xét các đặc trưng thống kê này Định nghĩa 7.1: Thống kê θˆ = T ( X , X , , X n ) gọi là ước lượng không chệch θ với giá trị tham số θ , ˆ =θ E(θ) (7.1) ˆ ≠ θ thì θˆ = T ( X , X , , X ) gọi là ước lượng chệch θ Nếu E(θ) n Ví dụ 7.1: Dựa vào các công thức (6.8), (6.17), (6.21) lý thuyết mẫu ta có các kết sau: ƒ Trung bình mẫu X là ước lượng không chệch kỳ vọng μ biến ngẫu nhiên gốc ƒ Phương sai mẫu S và Ŝ là ước lượng không chệch cho phương sai σ biến ngẫu nhiên gốc ƒ Tần suất mẫu f là ước lượng không chệch tần suất p tổng thể 117 (120) Chương VII: Ước lượng các tham số biến ngẫu nhiên 7.1.2 Ước lượng hiệu Điều kiện (7.1) ước lượng không chệch có nghĩa trung bình các giá trị θ̂ giá trị θ Từng giá trị θ̂ có thể sai lệch lớn so với θ Vì ta tìm ước lượng không chệch cho độ sai lệch trên bé Định nghĩa 7.2: Ước lượng không chệch có phương sai nhỏ so với ước lượng không chệch khác xây dựng trên cùng mẫu ngẫu nhiên gọi là ước lượng hiệu Như vậy, để xét xem ước lượng không chệch θ̂ có phải là ước lượng hiệu θ hay không ta cần phải tìm cận phương sai các ước lượng không chệch và so sánh phương sai θ̂ với cận này Điều này giải bất đẳng thức Cramer-Rao phát biểu sau: Cho mẫu ngẫu nhiên W = ( X , X , , X n ) lấy từ tổng thể có dấu hiệu nghiên cứu là biến ngẫu nhiên X có hàm mật độ xác suất (hay biểu thức xác suất ) f ( x, θ) thỏa mãn số điều kiện định (thường thỏa mãn thực tế, ít là các phân bố xác suất đã xét chương III) và θ̂ là ước lượng không chệch θ thì () D θˆ ≥ ⎛ ∂ (ln f ( x, θ) ) ⎞ nE⎜ ⎟ ∂θ ⎝ ⎠ (7.2) Ví dụ 7.2: Dựa vào bất đẳng thức trên ta có thể chứng minh trung bình mẫu X là ước lượng hiệu kỳ vọng μ dấu hiệu nghiên cứu X tổng thể có phân bố chuẩn N (μ, σ ) ( ) σ2 Mặt khác theo (3.18) hàm mật độ X Thật theo công thức (6.8) ta có D X = n có dạng: f ( x, θ ) = e σ 2π ( ) ⇒ ln f ( x, μ ) = − ln σ 2π − − ( x − μ )2 2σ ( x − μ )2 2σ ⇒ ∂ ln f ( x, μ ) x − μ = ∂μ σ ⎛ ∂ ( ln f ( X , θ ) ) ⎞ n n n ⎛ X −μ ⎞ X X = = E − μ = D Vậy: nE ⎜ ( ) ( ) ⎟ = nE ⎜ ⎟ ∂θ σ4 σ4 σ2 ⎝ σ2 ⎠ ⎝ ⎠ ( ) Như D X = σ2 n đạt giá trị cực tiểu bất đẳng thức Cramer-Rao, đó trung bình mẫu X là ước lượng hiệu μ 118 (121) Chương VII: Ước lượng các tham số biến ngẫu nhiên 7.1.3 Ước lượng vững Định nghĩa 7.3: Thống kê θˆ = T ( X , X , , X n ) gọi là ước lượng vững tham số θ biến ngẫu nhiên gốc X θˆ = T ( X , X , , X n ) hội tụ theo xác suất đến θ n → ∞ ,nghĩa là với ε > , luôn có: { } lim P θˆ − θ < ε = n→∞ (7.3) Theo luật số lớn hệ 2, công thức (5.7) chương V, ta có trung bình mẫu X là ước lượng vững kỳ vọng μ , S và Ŝ là ước lượng vững phương sai σ biến ngẫu nhiên gốc X tổng thể Tần suất mẫu f là ước lượng vững tần suất p tổng thể Tóm lại ta có kết sau: ¾ Trung bình mẫu X là ước lượng không chệch, hiệu và vững kỳ vọng μ biến ngẫu nhiên gốc tổng thể ¾ Tần suất mẫu f là ước lượng không chệch, hiệu và vững tần suất p tổng thể ¾ Phương sai mẫu S và Ŝ là ước lượng không chệch và vững phương sai σ biến ngẫu nhiên gốc tổng thể 7.1.4 Ước lượng hợp lý cực đại Giả sử đã biết quy luật phân bố xác suất dấu hiệu nghiên cứu biến ngẫu nhiên gốc X có hàm mật độ f ( x, θ) (hoặc có thể là biểu thức xác suất X là biến ngẫu nhiên rời rạc) Cần phải ước lượng tham số θ nào đó X Từ tổng thể rút mẫu ngẫu nhiên kích thước n : W = ( X , X , , X n ) Vì các biến ngẫu nhiên X , X , , X n độc lập nên hàm mật độ đồng thời có dạng: L( x1 , x2 , , xn , θ) = f ( x1 , θ) ⋅ f ( x2 , θ) ⋅ ⋅ ⋅ f ( xn , θ) (7.4) Hàm L( x1 , x2 , , xn , θ) gọi là hàm hợp lý tham số θ Phương pháp hợp lý cực đại chủ trương θˆ = g ( x1 , x , , x n ) ước lượng tốt cho tham số θ nếu: Khi ta xem x1 , , xn là tham số còn θ là biến thì hàm hợp lý L( x1 , , xn , θ) đạt cực đại θˆ = g ( x1 , x , , x n ) Thống kê θˆ = g ( X , X , , X n ) gọi là ước lượng hợp lý cực đại θ 119 (122) Chương VII: Ước lượng các tham số biến ngẫu nhiên Mặt khác vì hàm logarit đồng biến nên hàm L( x1 , x2 , , xn , θ) và ln L( x1 , x2 , , xn , θ) đạt cực đại cùng giá trị θ , đó để tìm ước lượng hợp lý cực đại ta cần tìm θ thỏa mãn các điều kiện sau: ⎧ ∂ ln L ⎪ ∂θ = ⎪ ⎨ ⎪ ∂ ln L < ⎪⎩ ∂θ (7.5) Ví dụ 7.3: Tìm ước lượng hợp lý cực đại tần suất tổng thể p Bài toán tương đương với tìm ước lượng hợp lý cực đại tham số p biến ngẫu nhiên gốc có quy luật phân bố không – A( p) Biểu thức xác suất có dạng Px = p x (1 − p)1− x ; x = 0,1 n Hàm hợp lý L( x1 , x , , x n , p ) = ∏ p xi (1 − p )1− xi Từ đó: i =1 n ln L( x1 , x , , x n , p) = ∑ ( xi ln p + (1 − xi ) ln(1 − p) ) i =1 ∂ ln L ∂ ln L n n =0 ⇒ p=x = ∑ xi + ( xi − 1) ; ∑ ∂p p i =1 ∂p − p i =1 Hơn ∂ ln L ∂p =− n < , đó ước lượng hợp lý cực đại p là tần suất mẫu p(1 − p) X = f (công thức (6.20), (6.21)) Ví dụ 7.4: Tìm ước lượng hợp lý cực đại hai tham số μ và σ biến ngẫu nhiên X có phân bố chuẩn N (μ; σ ) Hàm hợp lý có dạng L( x1, x2 , , xn , μ , σ ) = (σ 2π ) n −1 n ( x − μ )2 2∑ i σ = i e Các đạo hàm riêng ln L theo μ và σ sau: n ∑ ( xi − μ )2 ∂ ln L nx − nμ ∂ ln L n =− = − + i =1 ; 2 ∂μ σ σ σ ∂σ 120 (123) Chương VII: Ước lượng các tham số biến ngẫu nhiên Giải hệ phương trình (7.5) thu nghiệm μ = x và σ = n ∑ xi − x n i =1 ( ) Tại điểm này hàm hợp lý L( x1, x2 , , xn , μ , σ ) đạt cực đại Vậy ước lượng hợp lý cực đại kỳ vọng μ là trung bình mẫu X , còn σ là MS 7.2 PHƯƠNG PHÁP ƯỚC LƯỢNG BẰNG KHOẢNG TIN CẬY 7.2.1 Khái niệm Các phương pháp ước lượng điểm nói trên có nhược điểm là kích thước mẫu bé thì ước lượng điểm có thể sai lệch nhiều so với giá trị tham số cần ước lượng Mặt khác phương pháp trên không thể đánh giá khả mắc sai lầm ước lượng là bao nhiêu Do đó kích thước mẫu bé người ta thường dùng phương pháp ước lượng khoảng tin cậy Nghĩa là từ mẫu ngẫu nhiên tìm khoảng [a; b] chứa tham số θ với xác suất β đủ lớn cho trước ( β gọi là độ tin cậy và thường chọn là 0,95 hay 0,99) Định nghĩa 7.4: Khoảng [a ; b ] có hai đầu mút là hai thống kê: a = a( X , X , , X n ) , b = b( X , X , , X n ) (7.6) phụ thuộc mẫu ngẫu nhiên W = ( X , X , , X n ) biến ngẫu nhiên gốc X , gọi là khoảng tin cậy tham số θ với độ tin cậy β nếu: P{a ≤ θ ≤ b} = β (7.7) Trong thực tế thường yêu cầu độ tin cậy β khá lớn, đó theo nguyên lý xác suất lớn biến cố {a ≤ θ ≤ b} chắn xảy phép thử Tiến hành phép thử với mẫu ngẫu nhiên W = ( X , X , , X n ) ta thu mẫu cụ thể w = ( x1 , x2 , , xn ) , tính giá trị cụ thể a = a( x1 , x2 , , xn ) , b = b( x1 , x2 , , xn ) Lúc đó có thể kết luận là: Qua mẫu cụ thể với độ tin cậy β tham số θ biến ngẫu nhiên gốc X nằm khoảng [a ; b ] , tức là a ≤ θ ≤ b 7.2.2 Khoảng tin cậy kỳ vọng biến ngẫu nhiên phân bố theo quy luật chuẩn Giả sử tổng thể biến ngẫu nhiên gốc X có phân bố chuẩn N ( μ ; σ ) chưa biết tham số μ nó Từ tổng thể rút mẫu ngẫu nhiên kích thước n : W = ( X , X , , X n ) , ta tìm khoảng tin cậy μ các trường hợp sau 7.2.2.1 Trường hợp phương sai σ đã biết Định lý 7.1: Khoảng tin cậy tham số μ với độ tin cậy β có dạng: 121 (124) Chương VII: Ước lượng các tham số biến ngẫu nhiên σ σ ⎤ ⎡ ; X + Uα / ⎢ X − Uα / ⎥ n n⎦ ⎣ α đó: α = − β ; U α là giá trị tới hạn mức 2 (7.8) phân bố chuẩn tắc N (0;1) (công thức 3.24) Chứng minh: Theo công thức (6.29) ta có Mặt khác: X − Uα / σ n ≤ μ ≤ X + Uα / (X − μ) n σ σ n ⇔ ~ N (0;1) ( X − μ) n σ ≤ Uα / Áp dụng công thức (3.25) ta có ⎧⎪ ( X − μ ) n ⎫⎪ σ σ ⎤ ⎡ ≤ μ ≤ X + Uα / = ≤ P ⎢ X − Uα / P U ⎨ ⎬ = 1−α = β α / ⎥ σ n n⎦ ⎣ ⎩⎪ ⎭⎪ Định nghĩa 7.5: ε = Uα / σ n gọi là độ chính xác ước lượng Với độ chính xác ε và độ tin cậy β cho trước, thì kích thước mẫu tối thiểu là số tự nhiên n nhỏ thỏa mãn: σ 2Uα2 / n≥ ε 02 (7.9) Ví dụ 7.5: Trọng lượng loại sản phẩm là biến ngẫu nhiên phân bố theo quy luật chuẩn với độ lệch tiêu chuẩn gram Cần thử 25 sản phẩm loại này ta thu kết quả: Trọng lượng (gram) 18 19 20 21 Số SP tương ứng 15 Với độ tin cậy 95% a) Hãy tìm khoảng tin cậy trọng lượng trung bình loại sản phẩm trên b) Nếu muốn độ chính xác ước lượng không vượt quá 0,3 thì cần cân thử ít bao nhiêu sản phẩm Giải: Gọi X là trọng lượng sản phẩm, theo giả thiết X có phân bố chuẩn N (μ; σ ) với σ = Trọng lượng trung bình sản phẩm là tham số μ Khoảng tin cậy có dạng (7.8) 122 (125) Chương VII: Ước lượng các tham số biến ngẫu nhiên α Với độ tin cậy β = 0,95 ⇒ = 0, 025 ⇒ U α = 1,96 a) Từ bảng số liệu tìm trung bình mẫu cụ thể: x = ⋅18 + ⋅19 + 15 ⋅ 20 + ⋅ 21 = 19, 64 25 Độ chính xác ước lượng ε = Uα / σ n = 0,392 25 = 1,96 ⋅ Vậy với độ tin cậy 95% qua mẫu cụ thể này, khoảng tin cậy tham số μ là: [19,64 − 0,392 ; 19,64 + 0,392] 19, 248 ≤ μ ≤ 20,032 hay b) Nếu muốn độ chính xác ước lượng không vượt quá 0,3 thì cần cân thử ít n sản phẩm cho: n≥ σ 2Uα2 / 1⋅1,962 = = 42, 68 ε 02 0,32 Chọn n = 43 7.2.2.2 Trường hợp phương sai σ chưa biết, kích thước mẫu n ≥ 30 Trong nhiều bài toán thực tế, ta không biết phương sai σ biến ngẫu nhiên gốc X tổng thể Nhưng kích thước mẫu n đủ lớn ( n ≥ 30 ) ta có thể xấp xỉ độ lệch chuẩn σ độ lệch chuẩn mẫu S (vì S là ước lượng vững không chệch σ ), S xác định công thức (6.18) Mặt khác, theo định lý giới hạn trung tâm thì thống kê (X − μ) n σ xấp xỉ chuẩn, đúng với biến ngẫu nhiên gốc X (không đòi hỏi phân bố chuẩn) Do đó khoảng tin cậy tham số μ với độ tin cậy β có thể lấy là: S S ⎤ ⎡ ; X + Uα / ⎢ X − Uα / ⎥ n n⎦ ⎣ (7.10) Ví dụ 7.6: Để xác định chiều cao trung bình các cây bạch đàn khu rừng rộng trồng bạch đàn, ta tiến hành đo ngẫu nhiên 35 cây và có kết cho bảng sau: ui = xi − 8, 25 ni ui ni ui2 −1,5 −3 4,5 7,25 −1, −4 10 7,75 −0,5 −5 2,5 11 8,25 0 Khoảng ni xi 6,5 − 7, 6,75 7, − 7,5 7,5 − 8,0 8, − 8,5 123 (126) Chương VII: Ước lượng các tham số biến ngẫu nhiên 8,5 − 9, 8,75 0,5 2,5 1, 25 9,0 − 9,5 9,25 1, 3 −6,5 15, 25 ∑ u = 35 −6,5 = −0,1857 ⇒ x = 8, 25 − 0,1857 ≈ 8, 06 35 s 2X = sU2 = ⎛ (−6,5)2 ⎞ ⎜⎜ 15, 25 − ⎟ = 0, 413 ⇒ s = 0, 64 34 ⎝ 35 ⎟⎠ Với độ tin cậy β = 95% , U α = 1,96 Độ chính xác ước lượng ε = Uα / 0, 64 s = 1,96 ⋅ = 0, 21 35 n Vậy khoảng tin cậy cho chiều cao trung bình μ các cây bạch đàn là: 7,87 ≤ μ ≤ 8, 29 7.2.2.3 Trường hợp phương sai σ chưa biết, kích thước mẫu n < 30 Trong trường hợp này, theo công thức (6.32) thống kê T= ( X − μ) n S (7.11) có phân bố Student n − bậc tự Vì khoảng tin cậy tính theo kết sau: Định lý 7.2: Khoảng tin cậy tham số μ với độ tin cậy β có dạng: S S ⎤ ⎡ ; X + tα / (n − 1) ⎢ X − tα / (n − 1) ⎥ n n⎦ ⎣ đó tα / (n − 1) là giá trị tới hạn mức α (7.12) phân bố Student n − bậc tự (công thức 3.41) Độ chính xác ước lượng: ε = tα / (n − 1) S n (7.13) Với độ tin cậy β và độ chính xác ε cho trước thì kích thước mẫu cần thiết là số tự nhiên n nhỏ thỏa mãn: 124 (127) Chương VII: Ước lượng các tham số biến ngẫu nhiên ⎛ S ⋅ tα / (n − 1) ⎞ n≥⎜ ⎟ ε0 ⎝ ⎠ (7.14) Ví dụ 7.7: Năng suất loại giống là biến ngẫu nhiên có quy luật phân bố chuẩn N ( μ ; σ ) Gieo thử giống này trên 16 mảnh vườn thí nghiệm thu sau (đơn vị kg/ha): 172, 173, 173,174, 174, 175, 176, 166, 166, 167, 165, 173, 171, 170, 171, 170 Hãy tìm khoảng tin cậy cho suất trung bình loại hạt giống này với độ tin cậy β = 95% Giải: Năng suất trung bình hạt giống là tham số μ Từ các số liệu trên ta tính được: x = 171; s = 3, 4254 α = 0, 05; α = 0, 025 Tra bảng phân bố Student với 15 bậc tự ta tìm tα / (n − 1) = t0,025 (15) = 2,131 Độ chính xác ε = tα / (n − 1) 3, 4254 S = 2,131⋅ = 1,885 16 n Vậy khoảng tin cậy cho suất trung bình loại giống này thỏa mãn: 169,115 ≤ μ ≤ 172,885 7.2.3 Khoảng tin cậy cho xác suất p biến ngẫu nhiên có phân bố theo quy luật không – A( p) Ta cần nghiên cứu dấu hiệu nghiên cứu A nào đó mà cá thể tổng thể có thể có không có dấu hiệu A Nếu cá thể có dấu hiệu A ta cho nhận giá trị 1, trường hợp ngược lại ta cho nhận giá trị Lúc đó dấu hiệu nghiên cứu có thể xem là biến ngẫu nhiên X có quy luật phân bố xác suất không – A( p) có kỳ vọng và phương sai EX = p ; DX = p(1 − p) Lấy mẫu ngẫu nhiên kích thước n : W = ( X1 , X , , X n ) , đó X1, X , , X n là các biến ngẫu nhiên độc lập có cùng phân bố không – A( p) Theo định lý Moivre-Laplace (6.40) thì n đủ lớn ta có thể xấp xỉ thống kê U= ( f − p) n với phân bố chuẩn tắc N (0;1) p(1 − p) Tuy nhiên vì p chưa biết nên chưa biết p(1 − p) = DX Mặt khác theo công thức (6.19), (6.20) và mục ta có tần suất mẫu f là ước lượng vững, không chệch và hiệu tần suất p tổng thể Vì n đủ lớn ta có thể thay p f Do đó ta có khoảng tin cậy cho tần suất p tổng thể với độ tin cậy β là: 125 (128) Chương VII: Ước lượng các tham số biến ngẫu nhiên ⎡ ⎢ f − Uα / ⎣ f (1 − f ) ; f + Uα / n f (1 − f ) ⎤ ⎥ n ⎦ (7.15) Với điều kiện: ⎧nf > 10 ⎨ ⎩n(1 − f ) > 10 đó α = − β ; U α là giá trị tới hạn mức α Độ chính xác khoảng tin cậy: ε = Uα / (7.16) phân bố chuẩn tắc N (0;1) f (1 − f ) n Với độ tin cậy β và độ chính xác ε cho trước thì kích thước mẫu cần thiết là số tự nhiên n nhỏ thỏa mãn: ⎛U ⎞ n ≥ f (1 − f ) ⎜ α / ⎟ ⎝ ε0 ⎠ (7.17) đó f là tần suất mẫu mẫu ngẫu nhiên nào đó Ví dụ 7.8: Trong đợt vận động bầu cử tổng thống nước nọ, người ta vấn ngẫu nhiên 1600 cử tri, biết có 960 người số đó bỏ phiếu cho ứng cử viên A Với độ tin cậy β = 95% tối thiếu ứng cử viên A chiếm bao nhiêu % số phiếu bầu Giải: Gọi p là tỉ lệ số phiếu bầu cho ứng cử viên A Tổng thể nghiên cứu là tập hợp tất các cử tri Dấu hiệu nghiên cứu là cử tri bỏ phiếu cho A, là biến ngẫu nhiên có quy luật phân bố không – A( p) Khoảng tin cậy cho p có dạng (7.15) với điều kiện (7.16) Từ mẫu cụ thể trên ta có f = 960 = 0, 1600 ⎧nf = 960 > 10 Điều kiện ⎨ thỏa mãn ⎩n(1 − f ) = 640 > 10 Độ chính xác ước lượng ε = Uα / f (1 − f ) 0, ⋅ 0, = 0, 024 = 1,96 n 1600 Khoảng tin cậy: 0,576 ≤ p ≤ 0, 624 Vậy với độ tin cậy 95% thì tối thiểu có 57,6% cử tri bỏ phiếu cho ứng cử viên A 126 (129) Chương VII: Ước lượng các tham số biến ngẫu nhiên 7.2.4 Ước lượng phương sai biến ngẫu nhiên có phân bố theo quy luật chuẩn N ( μ ; σ ) Giả sử tổng thể biến ngẫu nhiên gốc X có phân bố chuẩn N ( μ ; σ ) chưa biết phương sai σ nó Từ tổng thể rút mẫu ngẫu nhiên kích thước n : W = ( X , X , , X n ) Ta chọn thống kê thích hợp để ước lượng cho tham số σ các trường hợp sau: 7.2.4.1 Đã biết kỳ vọng μ T= Chọn thống kê nS (7.18) σ2 Theo công thức (6.30) thống kê T có phân bố bình phương n bậc tự do: χ ( n) Do đó với độ tin cậy β cho trước, với cặp số α1 , α cho α1 + α = − β có thể tìm hai giá trị tới hạn T mức α1 , α là χ12−α1 (n) , χα22 (n) : { } { } P T > χ12−α1 ( n) = − α1 và P T > χα22 (n) = α Do đó { } P χ12−α1 (n) < T < χα22 (n) = − (α1 + α ) = β (7.19) Thay thống kê T từ công thức (7.18) vào (7.19) và giải theo σ , ta được: ⎫ ⎧ nS nS ⎪ ⎪ <σ < P⎨ ⎬=β χ1−α1 (n) ⎪⎭ ⎪⎩ χα (n) (7.20) Như vậy, với độ tin cậy β khoảng tin cậy σ có dạng: ⎞ ⎛ nS nS ⎜ ⎟ ; ⎜ χα2 (n) χ12−α (n) ⎟ ⎝ ⎠ • Nếu α1 = α = α (7.21) khoảng tin cậy có dạng: ⎛ nS 2 ⎞ nS ⎟ ⎜ ; ⎜ χα2 / (n) χ12−α / (n) ⎟ ⎝ ⎠ (7.22) • Nếu α1 = 0; α = α khoảng tin cậy bên phải σ có dạng: 127 (130) Chương VII: Ước lượng các tham số biến ngẫu nhiên ⎛ nS ⎞ ⎜ ⎟ ; + ∞ ⎜ χα2 (n) ⎟ ⎝ ⎠ (7.23) • Nếu α = 0; α1 = α khoảng tin cậy bên trái σ có dạng: ⎛ 2 ⎞ nS ⎜0 ; ⎟ ⎜ χ12−α (n) ⎟ ⎝ ⎠ (7.24) Ví dụ 7.9: Mức hao phí nguyên liệu cho đơn vị sản phẩm là biến ngẫu nhiên có phân bố chuẩn với trung bình là 20 gam Để ước lượng mức độ phân tán mức hao phí này người ta cân thử 25 sản phẩm và thu kết sau: Hao phí nguyên liệu (gam) 19,5 20,0 20,5 Số sản phẩm tương ứng 18 Với độ tin cậy β = 90% hãy tìm khoảng tin cậy σ α1 = α = α = 0, 05 Giải: Gọi X là mức hao phí nguyên liệu cho đơn vị sản phẩm X có phân bố chuẩn với kỳ vọng đã biết μ = 20 Đây là ước lượng phương sai σ phân bố chuẩn N (μ; σ ) đã biết μ Khoảng tin cậy theo công thức (2.22) Tra bảng χ ( n) ta có: 2 χα2 / (n) = χ 0,05 (25) = 37, 65; χ12−α / ( n) = χ 0,95 (25) = 14, 61 Để tìm s ta lập bảng sau: xi ni xi − μ ( xi − μ )2 ni ( xi − μ ) 19,5 − 0,5 0,25 1,25 20,0 18 0,0 0,00 0,00 20,5 0,5 0,25 0,50 ∑ 25 1,75 1, 75 s = = 0, 07 25 Vậy với độ tin cậy 90%, qua mẫu cụ thể này, khoảng tin cậy σ là: 128 (131) Chương VII: Ước lượng các tham số biến ngẫu nhiên ⎛ 25 ⋅ 0, 07 25 ⋅ 0, 07 ⎞ ⎜ 37, 65 ; 14, 61 ⎟ hay 0, 0464 < σ < 0,1198 ⎝ ⎠ 7.2.4.2 Chưa biết kỳ vọng μ Chọn thống kê: T= ( n − 1) S (7.25) σ2 Theo công thức (6.31) thống kê T có phân bố bình phương n − bậc tự do: χ (n − 1) Do đó với độ tin cậy β cho trước, với cặp số α1 , α cho α1 + α = − β có thể tìm hai giá trị tới hạn T mức α1 , α là χ12−α1 (n − 1) , χα22 (n − 1) : { } { } P T > χ12−α1 ( n − 1) = − α1 và P T > χα22 ( n − 1) = α Do đó: { } P χ12−α1 ( n − 1) < T < χα22 ( n − 1) = − (α1 + α ) = β (7.26) Thay thống kê T từ công thức (7.25) vào (7.26) và giải theo σ , ta được: ⎧⎪ (n − 1) S (n − 1) S ⎫⎪ <σ2 < P⎨ ⎬=β χ − χ − ( n 1) ( n 1) ⎪⎩ α ⎪⎭ 1−α1 (7.27) Như vậy, với độ tin cậy β khoảng tin cậy σ có dạng: ⎛ (n − 1) S (n − 1) S ⎟⎞ ⎜ ; ⎜ χα2 (n − 1) χ12−α (n − 1) ⎟ ⎝ ⎠ • Nếu α1 = α = α (7.28) khoảng tin cậy có dạng: ⎛ (n − 1) S (n − 1) S ⎞ ; ⎜ ⎟ ⎜χ ⎟ − − ( n 1) ( n 1) χ 1−α / ⎝ α /2 ⎠ (7.29) • Nếu α1 = 0; α = α khoảng tin cậy bên phải σ có dạng: ⎛ (n − 1) S ⎞ ; + ∞⎟ ⎜ ⎟ ⎜ χ (n − 1) ⎝ α ⎠ (7.30) 129 (132) Chương VII: Ước lượng các tham số biến ngẫu nhiên • Nếu α = 0; α1 = α khoảng tin cậy bên trái σ có dạng: ⎛ (n − 1) S ⎞ ; ⎜ ⎟ ⎜ χ (n − 1) ⎟ 1−α ⎝ ⎠ (7.31) TÓM TẮT Ước lượng không chệch ˆ = θ Thống kê θˆ = T ( X , X , , X n ) gọi là ước lượng không chệch θ nếu: E(θ) Ước lượng hiệu Ước lượng không chệch có phương sai nhỏ so với ước lượng không chệch khác xây dựng trên cùng mẫu ngẫu nhiên gọi là ước lượng hiệu Ước lượng vững Thống kê θˆ = T ( X , X , , X n ) gọi là ước lượng vững tham số θ biến ngẫu nhiên gốc X θˆ = T ( X , X , , X n ) hội tụ theo xác suất đến θ n → ∞ Ước lượng hợp lý cực đại Giả sử đã biết quy luật phân bố xác suất dấu hiệu nghiên cứu biến ngẫu nhiên gốc X có hàm mật độ f ( x, θ) (hoặc có thể là biểu thức xác suất X là biến ngẫu nhiên rời rạc) Cần phải ước lượng tham số θ nào đó X Từ tổng thể rút mẫu ngẫu nhiên kích thước n , hàm mật độ đồng thời có dạng mẫu ngẫu nhiên có dạng L( x1 , x2 , , xn , θ) = f ( x1 , θ) ⋅ f ( x2 , θ) ⋅ ⋅ ⋅ f ( xn , θ) Hàm L( x1 , x2 , , xn , θ) gọi là hàm hợp lý tham số θ Khi ta xem x1 , , xn là tham số còn θ là biến và giả sử hàm hợp lý L( x1 , , xn , θ) đạt cực đại θˆ = g ( x1 , x , , x n ) Thống kê θˆ = g ( X , X , , X n ) gọi là ước lượng hợp lý cực đại θ Khoảng tin cậy [a ; b] có hai đầu mút là hai thống kê a = a( X , X , , X n ) , b = b( X , X , , X n ) phụ thuộc mẫu ngẫu nhiên W = ( X , X , , X n ) biến ngẫu nhiên gốc X , gọi là khoảng tin cậy tham số θ với độ tin cậy β nếu: P{a ≤ θ ≤ b} = β Khoảng Khoảng tin cậy kỳ vọng biến ngẫu nhiên phân bố theo quy luật chuẩn 130 (133) Chương VII: Ước lượng các tham số biến ngẫu nhiên • Trường hợp phương sai σ đã biết: σ σ ⎤ ⎡ ; X + Uα / ⎢ X − Uα / ⎥ , Uα / là giá trị tới hạn mức α / phân bố n n⎦ ⎣ chuẩn tắc N (0;1) ; α = − β • Trường hợp phương sai σ chưa biết, n ≥ 30 : S S ⎤ ⎡ ; X + Uα / ⎢ X − Uα / ⎥ n n⎦ ⎣ • Trường hợp phương sai σ chưa biết, n < 30 : S S ⎤ ⎡ ; X + tα / (n − 1) ⎢ X − tα / (n − 1) ⎥, n n⎦ ⎣ đó tα / (n − 1) là giá trị tới hạn mức α phân bố Student n − bậc tự Khoảng tin cậy cho xác suất p biến ngẫu nhiên có phân bố theo quy luật không – A( p) : ⎡ ⎢ f − Uα / ⎣ f (1 − f ) ; f + Uα / n ⎧nf > 10 f (1 − f ) ⎤ ⎥ Với điều kiện ⎨ n ⎩n(1 − f ) > 10 ⎦ đó α = − β ; U α là giá trị tới hạn mức α phân bố chuẩn tắc N (0;1) Ước lượng phương sai biến ngẫu nhiên có phân bố theo quy luật chuẩn N (μ; σ ) • Trường hợp đã biết kỳ vọng μ : Khoảng tin cậy σ ⎛ nS 2 ⎞ nS ⎟ , đó cặp số ; với độ tin cậy β có dạng: ⎜ ⎜ χα (n) χ12−α (n) ⎟ ⎝ ⎠ α1 , α cho α1 + α = − β χ12−α1 (n) , χα22 (n) là giá trị tới hạn mức − α1 và α phân bố “Khi bình phương” n bậc tự • Trường hợp chưa biết kỳ vọng μ : 131 (134) Chương VII: Ước lượng các tham số biến ngẫu nhiên ⎛ (n − 1) S (n − 1) S ⎞⎟ ; , đó Khoảng tin cậy σ với độ tin cậy β có dạng: ⎜ ⎜ χα (n − 1) χ1−α (n − 1) ⎟ ⎝ ⎠ cặp số α1 , α cho α1 + α = − β χα22 (n − 1) , χ12−α1 (n − 1) là giá trị tới hạn mức α và − α1 phân bố “Khi bình phương” n − bậc tự CÂU HỎI ÔN TẬP VÀ BÀI TẬP 7.1 Trung bình mẫu là ước lượng vững và hiệu kỳ vọng biến ngẫu nhiên gốc Đúng Sai 7.2 Có thể tìm ước lượng không chệch θ có phương sai nhỏ đại lượng ( ) ∂ ln f ( x , θ ) ⎛ ⎞ nE⎜ ⎟ ∂θ ⎝ ⎠ Đúng Sai 7.3 Tống hai ước lượng không chệch là ước lượng không chệch Đúng Sai 7.4 Phương sai mẫu hiệu chỉnh S là ước lượng vững không chệch phương sai biến ngẫu nhiên gốc Đúng Sai 7.5 Việc tìm giá trị cực đại hàm hợp lý L( x1 , x2 , , xn , θ) tương đương với việc tìm giá trị cực đại hàm ln L( x1 , x2 , , xn , θ) Đúng Sai 7.6 Có thể tìm khoảng tin cậy chứa tham số với xác suất Đúng Sai 7.7 Hai đầu mút khoảng tin cậy là hai thống kê mẫu Đúng Sai 7.8 Muốn tìm khoảng tin cậy cho tham số μ biến ngẫu nhiên gốc có phân bố chuẩn N (μ; σ ) thì kích thước mẫu n phải lớn 30 Đúng 132 Sai (135) Chương VII: Ước lượng các tham số biến ngẫu nhiên 7.9 Để tìm khoảng tin cậy cho tham số p biến ngẫu nhiên gốc có phân bố không – ⎧nf > 10 A( p ) ta xấp xỉ tần suất mẫu với quy luật chuẩn n đủ lớn: điều kiện ⎨ ⎩n(1 − f ) > 10 Đúng Sai 7.10 Có thể tìm kích thước mẫu cần thiết để khoảng tin cậy cho tham số p biến ngẫu nhiên gốc có phân bố không – A( p ) thỏa mãn độ tin cậy và độ chính xác cho trước Đúng Sai 7.11 Cho mẫu ngẫu nhiên W = ( X , X , , X n ) biến ngẫu nhiên gốc X có phân bố mũ tham số λ > Chứng minh n −1 X là ước lượng không chệch λ n 7.12 Bằng phương pháp hợp lý cực đại hãy ước lượng tham số quy luật phân bố mũ 7.13 Một nghiên cứu trên 50 em bé tuổi cho thấy số xem tivi trung bình tuần nhóm này là 38 với độ lệch tiêu chuẩn là 6,4 Tìm khoảng tin cậy 99% cho thời gian xem tivi trung bình tuần các em nhỏ tuổi 7.14 Trong đợt vận động bầu cử tổng thống nước nọ, người ta vấn ngẫu nhiên 2000 cử tri thì biết có 1082 người số đó bỏ phiếu cho ứng cử viên A Với độ tin cậy 98% tối thiếu ứng cử viên A chiếm bao nhiêu % số phiếu bầu? Cho biết phân vị mức 0,975 phân bố chuẩn tắc N(0;1) là 1,96 7.15 Để xác định sản lượng khai thác điện thoại đơn vị mình, đơn vị đã tiến hành thống kê ngẫu nhiên 35 ngày và thu kết sau với đơn vị 100.000 phút/ngày: 0,84 0,96 1,02 1,08 0,88 0,80 0,91 0,97 1,07 0,98 1,04 1,13 0,87 0,82 1,01 0,93 1,03 1,10 0,97 1,05 0,83 0,76 0,95 1,15 1,00 1,05 1,14 0,89 0,81 0,95 1,20 1,16 1,24 0,79 0,77 Tìm khoảng tin cậy 95% cho sản lượng điện thoại trung bình ngày 7.16 Muốn ước lượng số cá hồ, người ta bắt 2000 cá hồ đánh dấu thả lại xuống hồ Sau đó bắt lại 400 và thấy có 53 có dấu Hãy ước lượng số cá hồ với độ tin cậy là 0,95 7.17 Hao phí nguyên liệu cho đơn vị sản phẩm là biến ngẫu nhiên tuân theo luật phân bố chuẩn với độ lệch chuẩn σ = 0, 03 Sản xuất thử 36 sản phẩm và thu số liệu sau: X ( gram) sè s¶n phÈm 19 ,5 - 19 , 19 ,7 - 19 ,9 19 ,9 - 20 ,1 20 ,1 - 20 ,3 8 18 Với độ tin cậy 95% hãy ước lượng hao phí nguyên liệu trung bình cho đơn vị sản phẩm 7.18 Để xác định chiều cao trung bình các cây vườn ươm người ta tiến hành đo ngẫu nhiên 40 cây Kết đo sau: 133 (136) Chương VII: Ước lượng các tham số biến ngẫu nhiên Khoảng chiều cao (cm) 16,5-17 17-17,5 17,5-18 18-18,5 18,5-19 19-19,5 Số cây tương ứng 11 12 a) Tìm khoảng tin cậy 90% cho chiều cao trung bình vườn cây b) Nếu muốn khoảng ước lượng có độ chính xác ε = 0,1 thì cần lấy mẫu bao nhiêu cây 7.19 Để ước lượng suất trung bình giống lúa mới, người ta gặt ngẫu nhiên 100 ruộng trồng thí nghiệm và thu số liệu sau: X (tạ/ha) 40 - 42 42 - 44 44 - 46 46 - 48 48 - 50 50 - 52 Số ruộng 13 25 35 15 Giả sử biến ngẫu nhiên suất X tuân theo quy luật chuẩn a) Tìm khoảng tin cậy 95% cho suất trung bình giống lúa b) Nếu muốn khoảng ước lượng có độ chính xác ε = 0, thì cần lấy mẫu gồm bao nhiêu ruộng 7.20 Trọng lượng loại sản phẩm A là biến ngẫu nhiên có phân bố theo quy luật chuẩn với độ lệch chuẩn là gam Cân thử 27 bao loại này ta thu kết quả: Trọng lượng(gam) 47,5 - 48,5 48,5 - 49,5 49,5 - 50,5 50,5 - 51,5 51,5 - 52,5 Số bao tương ứng 15 a) Tìm khoảng tin cậy 95% trọng lượng trung bình loại sản phẩm trên b) Nếu muốn độ chính xác ε = 0,1 thì kích thước mẫu cần thiết là bao nhiêu 7.21 Để xác định chiều cao trung bình trẻ em tuổi thành phố, người ta tiến hành ngẫu nhiên đo chiều cao 100 em học sinh lớp (8 tuổi) trường tiểu học và kết quả: Khoảng chiều cao 110-112 112-114 114-116 116-118 118-120 120-122 122-124 124-126 126-128 Số em tương ứng 14 17 20 16 10 a) Tìm khoảng tin cậy 95% cho chiều cao trung bình trẻ em tuổi thành phố b) Nếu muốn khoảng ước lượng có độ chính xác ε = 0,5 cm thì cần phải lấy mẫu kích thước bao nhiêu 7.22 Để ước lượng tỷ lệ phần trăm phế phẩm lô hàng người ta tiến hành kiểm tra ngẫu nhiên 400 sản phẩm và nhận thấy có 16 phế phẩm Với mức tin cậy 95% hãy ước lượng tỷ lệ phế phẩm tối đa lô hàng 7.23 Để xác định giá trung bình loại hàng hoá trên thị trường, người ta điều tra ngẫu nhiên 100 cửa hàng thu số liệu sau đây 134 (137) Chương VII: Ước lượng các tham số biến ngẫu nhiên Gía X (ngh ì n đồng) Sè cöa hµng ni 83 85 87 89 91 93 95 97 99 101 12 15 30 10 Với độ tin cậy 95% hãy tìm khoảng tin cậy cho giá trung bình loại hàng hoá nói trên 7.24 Người ta đo đại lượng không đổi 25 lần dụng cụ đo không có sai số hệ thống và sai số đo trung bình Giả sử sai số phép đo tuân theo quy luật phân bố chuẩn và phương sai mẫu đo 0,5 Hãy xác định khoảng tin cậy 95% cho phương sai sai số đo 135 (138) Chương VIII: Kiểm định giả thiết thống kê CHƯƠNG VIII: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ GIỚI THIỆU Một dạng khác quy nạp thống kê là kiểm định giả thiết thống kê Đây là phương pháp quan trọng cho phép giải nhiều bài toán thực tế Nội dung kiểm định giả thiết thống kê là dựa vào mẫu cụ thể và các quy tắc hay thủ tục định dẫn đến bác bỏ hay chấp nhận giả thiết tổng thể Giả thiết thống kê là giả thiết dạng phân bố xác suất biến ngẫu nhiên gốc tổng thể các tham số đặc trưng, tính chất biến ngẫu nhiên này Giả thiết thống kê là điều ta muốn bảo vệ ta nghi ngờ muốn bác bỏ, phát biểu dạng H0 Cạnh tranh với giả thiết này là đối thiết H1, theo nghĩa bác bỏ H0 thì chấp nhận H1 và ngược lại Phép kiểm định giả thiết thống kê dựa vào hai nguyên lý: Phép chứng minh phản chứng và nguyên lý xác suất nhỏ Để kiểm định giả thiết H0, dựa vào hai nguyên lý này ta giả sử H0 đúng từ đó xây dựng biến cố A có xác suất bé (bằng mức ý nghĩa phép kiểm định) Theo nguyên lý xác suất nhỏ thì vài lần thử biến cố A không xảy Vì với mẫu cụ thể nào đó mà A xảy thì giả thiết H0 đúng là vô lý đó ta bác bỏ H0, còn A không xảy thì ta chưa có sở để bác bỏ H0 Biến cố A gọi là miền bác bỏ Hai dạng bài toán kiểm định xét chương này là: kiểm định tham số và kiểm định phi tham số - Kiểm định tham số là kiểm định tham số đặc trưng biến ngẫu nhiên gốc tổng thể: kỳ vọng, phương sai, tần suất tổng thể Kiểm định hai kỳ vọng, hai phương sai hai tần suất tổng thể - Kiểm định phi tham số bao gồm các bài toán quy luật phân bố xác suất biến ngẫu nhiên gốc tổng thể, tính độc lập hai dấu hiệu nghiên cứu định tính, tính tổng thể nghiên cứu Lý thuyết kiểm định giả thiết thống kê có nhiều ứng dụng thực tế, giúp các nhà quản lý kiểm tra tính đúng đắn các định Để học tốt chương này học viên cần nắm vững chương VI lý thuyết mẫu NỘI DUNG 8.1 KHÁI NIỆM CHUNG Trong chương trước ta giải các bài toán ước lượng tham số đặc trưng dấu hiệu nghiên cứu tổng thể cách đưa ước lượng các tham số đặc trưng các biến ngẫu nhiên gốc Trong chương này ta nghiên cứu bài toán kiểm định giả thiết các tham số đặc trưng tổng thể 135 (139) Chương VIII: Kiểm định giả thiết thống kê Phương pháp kiểm định giả thiết thống kê là dựa vào mẫu cụ thể và các các quy tắc hay thủ tục định dẫn đến bác bỏ hay chấp nhận giả thiết tổng thể Trong mục này ta tìm hiểu các khái niệm: giả thiết thống kê, các nguyên tắc để xây dựng quy tắc kiểm định, miền bác bỏ, sai lầm kiểm định … 8.1.1 Giả thiết thống kê Vì các dấu hiệu nghiên cứu có thể xem là các biến ngẫu nhiên gốc đó giả thiết thống kê là giả thiết dạng phân bố xác suất Chẳng hạn số khách hàng đến điểm phục vụ có theo quy luật phân bố Poisson hay không? Nhu cầu thị trường sản phẩm nào đó có theo quy luật chuẩn không?… Nếu phân bố biến ngẫu nhiên gốc đặc trưng các tham số (như giá trị trung bình, phương sai, tham số p quy luật không – …), thì giả thiết thống kê là giả thiết tham số phân bố đó Đối với bài toán có hai dấu hiệu nghiên cứu thì giả thiết thống kê có thể là giả thiết độc lập chúng so sánh các tham số đặc trưng chúng Giả thiết đưa kiểm nghiệm ký hiệu là H0, gọi là “giả thiết không” Đó là giả thiết mà ta muốn bảo vệ ta nghi ngờ muốn bác bỏ Ngoài giả thiết H0 ra, ta còn phải định giả thiết cạnh tranh với H0 gọi là đối thiết, ký hiệu H1 Đối thiết H1 chấp nhận H0 bị bác bỏ Cần chú ý đối thiết H1 không thiết là phủ định giả thiết H0 Chẳng hạn giả thiết H0: nhu cầu thị trường loại hàng hóa này là μ = 1000 đơn vị/tháng Nếu ta nghi ngờ nhu cầu này không đúng thì đối thiết H1 là μ ≠ 1000 , tiếp thị tốt, chính sách hậu mãi tốt người ta nghĩ nhu cầu mặt hàng này tăng lên thì đối thiết H1 là μ > 1000 Qui tắc kiểm định dựa trên hai nguyên lý sau: * Nguyên lý xác suất nhỏ: "Nếu biến cố có xác nhỏ thì hay vài phép thử thì biến cố đó coi không xảy ra" * Phương pháp phản chứng: "Để bác bỏ A ta giả sử A đúng thì dẫn đến điều vô lý" Dựa vào hai nguyên lý này ta đưa phương pháp chung để kiểm định giả thiết thống kê sau: Để kiểm định H0 trước hết giả sử H0 đúng từ đó ta tìm biến cố A mà xác suất xuất biến cố A là bé và ta có thể xem A không thể xảy phép thử biến cố này Lúc đó trên mẫu cụ thể quan sát mà biến cố A xuất thì điều này trái với nguyên lý xác suất nhỏ Vậy H0 sai và bác bỏ nó Còn A không xảy thì ta chưa có sở để bác bỏ H0 Ta thực phương pháp trên các bước cụ thể sau: 136 (140) Chương VIII: Kiểm định giả thiết thống kê 8.1.2 Tiêu chuẩn kiểm định giả thiết thống kê Từ biến ngẫu nhiên gốc X W = ( X , X , , X n ) Chọn thống kê tổng thể lập mẫu ngẫu nhiên kích thước n : T = T ( X , X , , X n , θ ) (8.1) đó θ là tham số liên quan đến giả thiết cần kiểm định Nếu H0 đúng thì thống kê T có quy luật phân bố xác suất xác định Thống kê T gọi là tiêu chuẩn kiểm định 8.1.3 Miền bác bỏ giả thiết Sau đã chọn tiêu chuẩn kiểm định T , với α bé cho trước (thường α lấy 0,05 0,01) và với điều kiện H0 đúng ta có thể tìm miền Wα cho T nhận giá trị miền Wα với xác suất α : P {T ∈ Wα H } = α (8.2) Giá trị α gọi là mức ý nghĩa kiểm định và miền Wα gọi là miền bác bỏ giả thiết H0 với mức ý nghĩa α 8.1.4 Giá trị quan sát tiêu chuẩn kiểm định Thực phép thử với mẫu ngẫu nhiên W = ( X , X , , X n ) thu mẫu cụ thể w = ( x1 , x , , x n ) , thay giá trị này vào thống kê (8.1) ta giá trị quan sát tiêu chuẩn kiểm định: Tqs = ( x1 , x , , x n , θ ) (8.3) 8.1.5 Quy tắc kiểm định giả thiết thống kê So sánh giá trị quan sát tiêu chuẩn kiểm định với miền bác bỏ Wα và kết luận theo quy tắc sau: Nếu Tqs ∈Wα , theo nguyên tắc kiểm định thì H0 sai, đó ta bác bỏ H0 thừa nhận H1 Nếu Tqs ∉Wα thì điều này chưa khẳng định H0 đúng mà có nghĩa là qua mẫu cụ thể này chưa khẳng định là H0 sai Do đó ta có thể nói qua mẫu cụ thể này chưa có sở để bác bỏ H0 (trên thực tế là thừa nhận H0) 8.1.6 Sai lầm loại và sai lầm loại hai Với quy tắc kiểm định trên có thể mắc hai loại sai lầm sau: Sai lầm loại I: Đó là sai lầm mắc phải bác bỏ giả thiết H0 H0 đúng Ta thấy xác suất mắc sai lầm loại I đúng mức ý nghĩa α Thật vậy, xác suất ta bác bỏ H0 137 (141) Chương VIII: Kiểm định giả thiết thống kê xác suất biến cố {T ∈Wα }, đó H0 đúng thì xác suất này P{T ∈ Wα H } = α Sai lầm loại I sinh kích thước mẫu quá nhỏ, phương pháp lấy mẫu v.v… Sai lầm loại II: Đó là sai lầm mắc phải thừa nhận giải thiết H0 H0 sai, điều này xảy giá trị quan sát Tqs không thuộc miền bác bỏ Wα H1 đúng Vậy xác suất sai lầm loại II là β xác định sau: P {T ∉ Wα H1} = β (8.4) Xác suất biến cố đối sai lầm loại II: P{T ∈ Wα H1 } = − β gọi là lực lượng kiểm định Thực tế Quyết định Bác bỏ H0 Không bác bỏ H0 H0 đúng H0 sai Sai lầm loại I Quyết định đúng Xác suất = α Xác suất = − β Quyết định đúng Sai lầm loại II Xác suất = − α Xác suất = β Ta muốn tìm qui tắc kiểm định mà hai loại sai lầm trên là cực tiểu Nhưng không tồn kiểm định lý tưởng vậy, vì nói chung giảm sai lầm loại I thì sai lầm loại II tăng và ngược lại Chẳng hạn lấy α = thì không bác bỏ giả thiết nào, kể giả thiết sai, β đạt cực đại Mặt khác bài toán kiểm định thì giả thiết H0 là giả thiết quan trọng, đó sai lầm nó càng nhỏ càng tốt Vì các nhà thống kê đưa phương pháp sau: Sau ta chọn sai lầm loại I nhỏ mức ý nghĩa α , với mẫu kích thước n xác định, ta chọn miền bác bỏ Wα cho xác suất sai lầm loại II là nhỏ hay lực lượng kiểm định là lớn Nghĩa là cần tìm miền bác bỏ Wα thỏa mãn điều kiện: P{T ∈ Wα H } = α và P{T ∈ Wα H1 } = − β → max Định lý Neymann - Pearson nhiều bài toán quan trọng thực tiễn có thể tìm miền bác bỏ Wα thỏa mãn điều kiện trên Việc chọn mức ý nghĩa α bao nhiêu tùy thuộc vào trường hợp cụ thể, tùy thuộc vào ý nghĩa bài toán 8.1.7 Thủ tục kiểm định giả thiết thống kê Qua nội dung trình bày trên ta có thể xây dựng thủ tục kiểm định giả thiết thống kê bao gồm các bước sau: 138 (142) Chương VIII: Kiểm định giả thiết thống kê a) Phát biểu giả thiết H0 và đối thiết H1 b) Từ tổng thể nghiên cứu lập mẫu ngẫu nhiên kích thước n c) Chọn tiêu chuẩn kiểm định T và xác định quy luật phân bố xác suất T với điều kiện giả thiết H0 đúng d) Với mức ý nghĩa α , xác định miền bác bỏ Wα tốt tùy thuộc vào đối thiết H1 e) Từ mẫu cụ thể tính giá trị quan sát tiêu chuẩn kiểm định Tqs f) So sánh giá trị quan sát tiêu chuẩn kiểm định Tqs với miền bác bỏ Wα và kết luận 8.2 KIỂM ĐỊNH THAM SỐ 8.2.1 Kiểm định giả thiết kỳ vọng biến ngẫu nhiên có phân bố theo quy luật chuẩn Giả sử biến ngẫu nhiên gốc X tổng thể có phân bố chuẩn N (μ; σ ) , cần kiểm định kỳ vọng μ Nếu có sở để giả thiết kỳ vọng μ giá trị μ ta đưa giả thiết thống kê H0 : μ = μ Ta xét các trường hợp sau: 8.2.1.1 Trường hợp đã biết phương sai Giả sử phương sai σ biến ngẫu nhiên gốc X tổng thể có phân bố chuẩn N (μ; σ ) đã biết Từ tổng thể rút mẫu ngẫu nhiên kích thước n : W = ( X , X , , X n ) Xét thống kê T= ( X − μ0 ) n σ (8.5) Nếu giả thiết H0 đúng (theo công thức (6.29) chương VI) thì thống kê T có phân bố chuẩn tắc N (0;1) Ta xây dựng các miền bác bỏ dựa vào đối thiết H1 a) Bài toán 1: H0: μ = μ ; H1: μ ≠ μ Ta nói đây là bài toán kiểm định hai phía Miền bác bỏ ⎧⎪ ⎫⎪ ( X − μ0 ) n Wα = ⎨T = ; T > Uα/2 ⎬ σ ⎪⎩ ⎪⎭ (8.6) b) Bài toán 2: H0: μ = μ ; H1: μ > μ Đây là bài toán kiểm định phía Miền bác bỏ ⎧⎪ ⎫⎪ ( X − μ0 ) n Wα = ⎨T = ; T > Uα ⎬ σ ⎪⎩ ⎪⎭ (8.7) 139 (143) Chương VIII: Kiểm định giả thiết thống kê c) Bài toán 3: H0: μ = μ ; H1: μ < μ Đây là bài toán kiểm định phía Miền bác bỏ ⎧⎪ ⎫⎪ ( X − μ0 ) n Wα = ⎨T = ; −T > Uα ⎬ σ ⎪⎩ ⎪⎭ đó U α / , U α là giá trị tới hạn mức α (8.8) và mức α phân bố chuẩn tắc N (0;1) Lập mẫu cụ thể w = ( x1 , x , , x n ) và tính giá trị quan sát tiêu chuẩn kiểm định Tqs = ( x − μ0 ) n σ và so sánh với miền bác bỏ Wα để kết luận 8.2.1.2 Trường hợp chưa biết phương sai, kích thước mẫu n ≥ 30 (có thể không cần phân bố chuẩn) Trường hợp phương sai σ chưa biết: Với kích thước n đủ lớn ( n ≥ 30 ) và giả thiết H0 đúng (tương tự (2.2.2) chương 7) thì thống kê: T= ( X − μ0 ) n S (8.9) xấp xỉ phân bố chuẩn tắc N (0;1) Ta xây dựng các miền bác bỏ dựa vào đối thiết H1 a) Bài toán 1: H0: μ = μ ; H1: μ ≠ μ Ta nói đây là bài toán kiểm định hai phía Miền bác bỏ ⎫⎪ ⎧⎪ ( X − μ0 ) n Wα = ⎨T = ; T > Uα/2 ⎬ S ⎪⎭ ⎪⎩ (8.10) b) Bài toán 2: H0: μ = μ ; H1: μ > μ Đây là bài toán kiểm định phía Miền bác bỏ ⎫⎪ ⎧⎪ ( X − μ0 ) n Wα = ⎨T = ; T > Uα ⎬ S ⎪⎭ ⎪⎩ (8.11) c) Bài toán 3: H0: μ = μ ; H1: μ < μ Đây là bài toán kiểm định phía Miền bác bỏ ⎫⎪ ⎧⎪ ( X − μ0 ) n Wα = ⎨T = ; −T > Uα ⎬ S ⎪⎭ ⎪⎩ (8.12) Ví dụ 8.1: Một hãng buôn muốn biết xem phải có không ổn định trung bình lượng hàng bán trung bình trên nhân viên bán hàng so với các năm trước (lượng đó 7,4) Một mẫu ngẫu nhiên gồm 40 nhân viên bán hàng lựa chọn và tìm thấy lượng hàng trung bình họ là x = 6,1 với độ lệch chuẩn là s = 2,5 Với mức ý nghĩa α = 1% có thể nói lượng hàng bán trung bình trên đầu người có thay đổi không? 140 (144) Chương VIII: Kiểm định giả thiết thống kê Giải: Gọi μ là lượng hàng bán trung bình trên nhân viên bán hàng hãng buôn Ta kiểm định: Giả thiết H0: μ = 7,4 ; Đối thiết H1: μ ≠ 7,4 Tiêu chuẩn kiểm định: T = ( X − 7,4) n S Miền bác bỏ: α = 0,01 ( X − 7, 4) n ⎪⎧ ⎪⎫ ; T > 2,575⎬ ⇒ U α = 2,575 ⇒ Wα = ⎨T = S ⎩⎪ ⎭⎪ (6,1 − 7,4) 40 = −3,289 Với mẫu cụ thể này giá trị quan sát tiêu chuẩn kiểm 2,5 định rơi vào miền bác bỏ, ta có thể kết luận số lượng hàng bán trung bình nhân viên bán hàng là có thay đổi Tqs = Ví dụ 8.2: Một công tyi có hệ thống máy tính có thể xử lí 1200 hóa đơn Công ti nhập hệ thống máy tính Hệ thống này chạy kiểm tra 40 cho thấy số hóa đơn xử lí trung bình là 1260 với độ lệch chuẩn 215 Với mức ý nghĩa 5% hãy nhận định xem hệ thống có tốt hệ thống cũ hay không? Giải: Gọi μ là số hóa đơn trung bình mà hệ thống máy tính xử lí Ta kiểm định: Giả thiết H0: μ = 1200; Đối thiết H1: μ > 1200 Tiêu chuẩn kiểm định: T = ( X − 1200) n S ⎧⎪ ⎫⎪ ( X − 1200) n ; T > 1, 64 ⎬ Miền bác bỏ: α = 0,05 ⇒ U α = 1,64 ⇒ Wα = ⎨T = S ⎩⎪ ⎭⎪ Thay giá trị cụ thể mẫu vào công thức (8.9) ta Tqs = (1260 − 1200) 40 = 1,76 215 Với mẫu cụ thể này giá trị quan sát tiêu chuẩn kiểm định rơi vào miền bác bỏ, ta có thể kết luận hệ thống máy tính tốt hệ thống cũ 8.2.1.3 Trường hợp chưa biết phương sai, kích thước mẫu n < 30 Giả sử giả thiết H0 đúng, xét thống kê T= ( X − μ0 ) n S (8.13) 141 (145) Chương VIII: Kiểm định giả thiết thống kê theo công thức (6.32) thống kê T có phân bố Student n − bậc tự Ta xây dựng các miền bác bỏ dựa vào đối thiết H1 a) Bài toán 1: H0: μ = μ ; H1: μ ≠ μ ⎧⎪ ⎫⎪ ( X − μ0 ) n Wα = ⎨T = ; T > tα / (n − 1) ⎬ S ⎩⎪ ⎭⎪ Miền bác bỏ: đó tα / (n − 1) là giá trị tới hạn mức α (8.14) phân bố Student n − bậc tự b) Bài toán 2: H0: μ = μ ; H1: μ > μ ( X − μ0 ) n ⎪⎧ ⎪⎫ Wα = ⎨T = ; T > tα (n − 1) ⎬ S ⎩⎪ ⎭⎪ Miền bác bỏ: (8.15) đó tα (n − 1) là giá trị tới hạn mức α phân bố Student n − bậc tự c) Bài toán 3: H0: μ = μ ; H1: μ < μ ⎧⎪ ⎫⎪ ( X − μ0 ) n Wα = ⎨T = ; − T > tα (n − 1) ⎬ S ⎩⎪ ⎭⎪ Miền bác bỏ: (8.16) Ví dụ 8.3: Một công ty sản xuất hạt giống tuyên bố loại giống họ có suất trung bình là 21,5 tạ/ha Gieo thử giống này 16 vườn thí nghiệm và thu kết quả: 19,2; 18,7; 22,4; 20,3; 16,8; 25,1; 17,0; 15,8; 21,0; 18,6; 23,7; 24,1; 23,4; 19,8; 21,7; 18,9 Dựa vào kết này hãy xác nhận xem quảng cáo công ty có đúng không Mức ý nghĩa lựa chọn là α = 0,05 Biết giống cây trồng là biến ngẫu nhiên có phân bố chuẩn N ( μ ; σ ) Giải: Gọi μ là suất trung bình loại giống Ta cần kiểm định giả thiết H0: μ = 21,5; Đối thiết H1: μ ≠ 21,5 Tiêu chuẩn kiểm định: T = ( X − 21,5) n S α = 0,025 phân bố Student 15 bậc tự là ( X − 21,5) n ⎪⎧ ⎪⎫ Wα = ⎨T = ; T > 2,131⎬ S ⎪⎩ ⎭⎪ Tra bảng ta tính giá trị tới hạn mức 2,131 Do đó miền bác bỏ: Từ mẫu cụ thể trên tính được: x = 20,406 , s = 3,038 ⇒ Tqs = 142 (20,406 − 21,5) 16 = −1,44 3,038 (146) Chương VIII: Kiểm định giả thiết thống kê Vì Tqs = 1, 44 < 2,131 nên chưa có sở để bác bỏ H0 Có nghĩa là với số liệu này thì có thể chấp nhận lời quảng cáo công ty 8.2.2 Kiểm định giả thiết phương sai biến ngẫu nhiên có phân bố chuẩn(*) Giả sử tổng thể biến ngẫu nhiên gốc có phân bố chuẩn N (μ; σ ) , phương sai σ chưa biết song có sở để giả thiết giá trị nó σ 02 Ta kiểm định giả thiết H0: σ = σ 02 Từ tổng thể rút mẫu ngẫu nhiên kích thước n : W = ( X , X , , X n ) Nếu giả thiết H0 đúng, theo công thức (6.31) thì thống kê sau có phân bố bình phương n − bậc tự T= (n − 1) S σ 02 (8.17) Với mức ý nghĩa α , ta xây dựng các miền bác bỏ tùy thuộc vào đối thiết H1 sau: a H0: σ = σ 02 ; H1: σ ≠ σ 02 ⎧⎪ ⎫⎪ (n − 1) S 2 Wα = ⎨T = ; T ( n ) hoÆc T ( n ) < χ − > χ − ⎬ α α 1− σ 02 ⎪⎩ ⎪⎭ 2 (8.18) b H0: σ = σ 02 ; H1: σ > σ 02 ⎫⎪ ⎧⎪ (n − 1) S 2 Wα = ⎨T = ; T ( n ) > χ − ⎬ α ⎪⎭ ⎪⎩ σ 02 (8.19) c H0: σ = σ 02 ; H1: σ < σ 02 ⎫⎪ ⎧⎪ (n − 1) S 2 Wα = ⎨T = ; T ( n ) < χ − ⎬ − α ⎪⎭ ⎪⎩ σ 02 (8.20) Ví dụ 8.4: Để kiểm tra độ chính xác máy người ta đo ngẫu nhiên kích thước 15 chi tiết máy đó sản xuất và tính s = 14,6 Với mức ý nghĩa α =0,01 hãy kết luận hoạt động máy, biết kích thước chi tiết máy đó sản xuất là biến ngẫu nhiên có phân bố chuẩn có dung sai theo thiết kế là σ =12 Giải: Gọi X là kích thước chi tiết, theo giả thiết X có phân bố chuẩn N (μ; σ ) Vậy đây là bài toán kiểm định giả thiết: H0: σ = 12; H1: σ ≠ 12 143 (147) Chương VIII: Kiểm định giả thiết thống kê Do α = 0,01, tra bảng bình phương 14 bậc tự ta được: χ 2α (n − 1) = χ 02,005 (14) = 3,57 ; χ 1− α ( n − 1) = χ 02,995 (14) = 28,3 Thay giá trị mẫu cụ thể vào công thức (8.17) ta tính giá trị quan sát tiêu chuẩn kiểm định: Tqs = 14 ⋅ 14,6 = 17,03 12 Giá trị này không rơi vào miền bác bỏ, chưa có sở để bác bỏ H0 hay có thể nói máy móc làm việc bình thường 8.2.3 Kiểm định giả thiết kỳ vọng biến ngẫu nhiên có phân bố không – A(p) Giả sử ta để ý đến đặc trưng A nào đó mà cá thể tổng thể có thể có tính chất này không Gọi p là tần suất có đặc trưng A tổng thể, đã thấy chương VII dấu hiệu nghiên cứu này là biến ngẫu nhiên X có phân bố không – A( p ) với kỳ vọng p Nếu p chưa biết, song có sở để giả thiết giá trị này p Ta kiểm định giả thiết H0: p = p Từ tổng thể rút mẫu ngẫu nhiên kích thước n , gọi f là tần suất mẫu (công thức (5.19)-(6.21)) Xét thống kê T= ( f − p0 ) n p0 (1 − p0 ) (8.21) Nếu giả thiết H0 đúng, áp dụng định lý giới hạn trung tâm (công thức (6.41)) thì n đủ lớn thống kê trên xấp xỉ phân bố chuẩn tắc N (0;1) Trong thực tế ⎧np > ⎨ ⎩n(1 − p ) > (8.22) thì có thể xem thống kê (8.21) có phân bố chuẩn tắc N (0;1) Do đó với mức ý nghĩa α và tùy thuộc đối thiết H1 ta có thể xây dựng các miền bác bỏ tương ứng a) H0: p = p ; H1: p ≠ p ⎧⎪ ⎫⎪ ( f − p0 ) n Wα = ⎨T = ; T > Uα ⎬ p0 (1 − p0 ) ⎪⎩ ⎪ 2⎭ (8.23) ⎫⎪ ⎧⎪ ( f − p0 ) n Wα = ⎨T = ; T > Uα ⎬ p0 (1 − p0 ) ⎪⎭ ⎪⎩ (8.24) b) H0: p = p ; H1: p > p 144 (148) Chương VIII: Kiểm định giả thiết thống kê c) H0: p = p ; H1: p < p ⎫⎪ ⎧⎪ ( f − p0 ) n Wα = ⎨T = ; −T > Uα ⎬ p0 (1 − p0 ) ⎪⎭ ⎪⎩ (8.25) Với mẫu cụ thể tính giá trị quan sát tiêu chuẩn kiểm định Tqs , so sánh với Wα và kết luận Ví dụ 8.5: Một đảng chính trị bầu cử tổng thống nước tuyên bố có 45% cử tri bỏ phiếu cho ứng cử viên A đảng họ Chọn ngẫu nhiên 2000 cử tri để thăm dò ý kiến và cho thấy có 862 cử tri tuyên bố bỏ phiếu cho A Với mức α = 5%, hãy kiểm định xem dự đoán đảng trên có đúng không Giải: Gọi p là tỉ lệ cử tri bỏ phiếu cho ứng cử viên A Ta cần kiểm định: Giả thiết H0: p = 0,45 ; Đối thiết H1: p ≠ 0,45 (Bởi vì ta không có sở nào dự đoán đảng trên là cao 0,45 hay thấp 0,45) ⎧np = 2000 ⋅ 0,45 = 900 > Vì điều kiện ⎨ thỏa mãn nên có thể chọn tiêu chuẩn ⎩n(1 − p ) = 2000 ⋅ 0,55 = 1100 > 862 = 0,431 ta giá trị quan sát kiểm định theo công thức (8.21) Thay mẫu cụ thể với f = 2000 tiêu chuẩn kiểm định Tqs = (0,431 − 0,45) 2000 0,45 ⋅ 0,55 = −1,708 Với mức ý nghĩa α = 0,05 ⇒ U α = 1,96 Ta thấy Tqs < 1,96 Vậy không có sở để bác bỏ H0 8.2.4 Kiểm định giả thiết hai kỳ vọng hai biến ngẫu nhiên có phân bố chuẩn(*) Giả sử ta xét cùng lúc hai tổng thể Ở tổng thể thứ dấu hiệu nghiên cứu xem biến ngẫu nhiên X có phân bố chuẩn N (μ1 ; σ12 ) Ở tổng thể thứ hai dấu hiệu nghiên cứu xem biến ngẫu nhiên X có phân bố chuẩn N (μ ; σ 22 ) Nếu μ1 và μ chưa biết song có sở để giả thiết giá trị chúng nhau, người ta đưa giả thiết thống kê: H0: μ1 = μ2 Ta kiểm định giả thiết trên theo các trường hợp sau: 8.2.4.1 Trường hợp hai phương sai σ12 và σ 22 hai biến ngẫu nhiên gốc đã biết Từ hai tổng thể nói trên rút hai mẫu ngẫu nhiên độc lập kích thước tương ứng là n1 và n2 145 (149) Chương VIII: Kiểm định giả thiết thống kê W1 = ( X 11 , X 12 , , X 1n1 ) ; W2 = ( X 21 , X 22 , , X 2n ) Chọn thống kê sau làm tiêu chuẩn kiểm định: T= ( X1 − X ) − ( μ1 − μ2 ) σ12 n1 + σ 22 (8.26) n2 Theo công thức (6.33) chương VI, thống kê T có phân bố chuẩn tắc N (0;1) Nếu giả thiết H0 đúng thì thống kê T có dạng: T= X1 − X σ12 n1 σ 22 + ~ N (0;1) (8.27) n2 Vì với mức ý nghĩa α cho trước và tùy thuộc vào dạng đối thiết H1, ta xây dựng các miền bác bỏ tương ứng: a) H0: μ1 = μ ; H1: μ1 ≠ μ (kiểm định hai phía) ⎧ ⎫ ⎪ ⎪ X1 − X ⎪ ⎪ Wα = ⎨T = ; T > Uα ⎬ ⎪ σ12 σ 22 2⎪ + ⎪ ⎪ n1 n2 ⎩ ⎭ (8.28) b) H0: μ1 = μ2 ; H1: μ1 > μ2 (kiểm định phía) ⎧ ⎫ ⎪ ⎪ X1 − X ⎪ ⎪ Wα = ⎨T = ; T > Uα ⎬ ⎪ ⎪ σ12 σ 22 + ⎪ ⎪ n1 n2 ⎩ ⎭ (8.29) c) H0: μ1 = μ2 ; H1: μ1 < μ2 (kiểm định phía) ⎧ ⎫ ⎪ ⎪ X1 − X ⎪ ⎪ Wα = ⎨T = ; − T > Uα ⎬ ⎪ ⎪ σ12 σ 22 + ⎪ ⎪ n1 n2 ⎩ ⎭ (8.30) Lập hai mẫu cụ thể từ X1 và X và tính giá trị quan sát tiêu chuẩn kiểm định Tqs , so sánh với miền bác bỏ Wα và kết luận 146 (150) Chương VIII: Kiểm định giả thiết thống kê Ví dụ 8.6: Tại xí nghiệp người ta xây dựng hai phương án gia công cùng loại chi tiết Để đánh giá xem chi phí trung bình nguyên liệu theo hai phương án có khác hay không người ta tiến hành sản xuất thử và thu các kết sau: Phương án 1: 2,5 3,2 3,5 3,8 3,5 Phương án 2: 2,0 2,7 2,5 2,9 2,3 2,6 Với mức ý nghĩa α = 0, 05 , hãy kết luận vấn đề trên biết chi phí nguyên liệu theo hai phương án gia công là các biến ngẫu nhiên có phân bố chuẩn với σ12 = σ 22 = 0,16 Giải: Gọi X1 và X tương ứng là chi phí nguyên liệu theo hai phương án gia công trên Theo giả thiết X1 và X có phân bố chuẩn Vậy chi phí trung bình theo các phương án đó là μ1 và μ2 Đây là bài toán kiểm định: Giả thiết H0: μ1 = μ ; Đối thiết H1: μ1 ≠ μ Theo công thức (8.27) tiêu chuẩn kiểm định là T = X1 − X 0,16 0,16 + Do α = 0,05 ⇒ U α = 1,96 Vậy miền bác bỏ Wα = { T > 1,96} Từ mẫu cụ thể ta tính được: x1 = 3,3 ; x = 2,5 , thay vào ta có giá trị quan sát tiêu 3,3 − 2,5 = 3,33 > 1,96 Vậy Tqs ∈Wα , bác bỏ H0 thừa nhận H1 tức 0,16 0,16 + là chi phí nguyên liệu theo hai phương án gia công trên thực khác chuẩn kiểm định Tqs = 8.2.4.2 Trường hợp hai phương sai σ12 và σ 22 hai biến ngẫu nhiên gốc chưa biết σ12 = σ 22 Từ hai tổng thể nói trên rút hai mẫu ngẫu nhiên độc lập kích thước tương ứng là n1 và n2 W1 = ( X 11 , X 12 , , X 1n1 ) ; W2 = ( X 21 , X 22 , , X 2n ) Chọn thống kê sau làm tiêu chuẩn kiểm định: T= Với Sp = ( X1 − X ) − ( μ1 − μ2 ) 1 + Sp n1 n2 (8.31) (n1 − 1) S12 + (n2 − 1) S 22 n1 + n − 147 (151) Chương VIII: Kiểm định giả thiết thống kê Theo công thức (6.36) chương VI, thống kê T có phân bố Student với n1 + n2 − bậc tự Nếu giả thiết H0 đúng thì thống kê T có dạng : T= ( X1 − X ) 1 + Sp n1 n2 (8.32) Vì với mức ý nghĩa α , ta xây dựng các miền bác bỏ tương ứng: a) H0: μ1 = μ2 ; H1: μ1 ≠ μ2 (kiểm định hai phía) ⎧ ⎫ ⎪ ⎪ X1 − X ⎪ ⎪ Wα = ⎨T = ; T > tα / (n1 + n2 − 2) ⎬ 1 ⎪ ⎪ + Sp ⎪⎩ ⎪⎭ n1 n2 ( ) (8.33) b) H0: μ1 = μ2 ; H1: μ1 > μ2 (kiểm định phía) ⎧ ⎫ ⎪ ⎪ X1 − X ⎪ ⎪ Wα = ⎨T = ; T > tα (n1 + n2 − 2) ⎬ 1 ⎪ ⎪ + Sp ⎪⎩ ⎪⎭ n1 n2 ( ) (8.34) c) H0: μ1 = μ2 ; H1: μ1 < μ2 (kiểm định phía) ⎧ ⎫ ⎪ ⎪ − X X ⎪ ⎪ Wα = ⎨T = ; − T > tα (n1 + n2 − 2) ⎬ 1 ⎪ ⎪ + Sp ⎪⎩ n1 n2 ⎭⎪ ( ) (8.35) Lập hai mẫu cụ thể từ X1 và X , tính giá trị quan sát tiêu chuẩn kiểm định Tqs , so sánh với miền bác bỏ Wα và kết luận Ví dụ 8.7: Một nghiên cứu thực 20 người thành phố A và 19 người thành phố B xem thu nhập hàng năm (tính triệu đồng) dân cư hai thành phố đó có thực khác hay không Các số liệu mẫu thu sau: n1 = 20 ; x1 = 18,27 ; s12 = 8,74 n2 = 19 ; x = 16,78 ; s 22 = 6,53 Vậy với mức ý nghĩa α = 0,05 có thể cho thu nhập bình quân dân cư hai thành phố này là khác hay không Giả sử thu nhập hàng năm dân cư hai thành phố này cùng phân bố chuẩn với phương sai 148 (152) Chương VIII: Kiểm định giả thiết thống kê Giải: Gọi X và X tương ứng là thu nhập hàng năm dân cư hai thành phố đó Theo giả thiết X và X có phân bố chuẩn với các phương sai Do đó để kiểm định giả thiết H0: μ1 = μ ; H1: μ1 ≠ μ Ta sử dụng tiêu chuẩn kiểm định (8.32) và miền bác bỏ Wα (8.33) Với α = 0, 05 ⇒ tα / (n1 + n2 − 2) = t0,025 (37) = 2, 021 Từ mẫu cụ thể ta tính Sp = 19 ⋅ 8,74 + 18 ⋅ 6,58 = 2,773 20 + 19 − Do đó giá trị quan sát tiêu chuẩn kiểm định Tqs = 18,27 − 16,78 1 0,773 + 20 19 = 1,677 Vì Tqs ∉Wα đó với hai mẫu cụ thể này thì chưa có sở để bác bỏ H0, tức là có thể xem thu nhập trung bình hàng năm dân hai thành phố đó là 8.2.4.3 Trường hợp hai phương sai σ12 và σ 22 hai biến ngẫu nhiên gốc chưa biết và không thể cho chúng ( σ12 ≠ σ 22 ) Chọn thống kê sau làm tiêu chuẩn kiểm định: T= ( X1 − X ) − ( μ1 − μ2 ) (8.36) S12 S 22 + n1 n2 Theo công thức (6.37) chương VI, thống kê T có phân bố Student k bậc tự do, đó: k= (n1 − 1)(n2 − 1) (n2 − 1)C + (n1 − 1)(1 − C ) ; C= S12 n1 S12 S 22 + n1 n2 Nếu giả thiết H0 đúng thì thống kê T có dạng: T= X1 − X S12 n1 + S 22 (8.37) n2 Với mức ý nghĩa α , ta xây dựng các miền bác bỏ tương ứng: 149 (153) Chương VIII: Kiểm định giả thiết thống kê a) H0: μ1 = μ2 ; H1: μ1 ≠ μ2 (kiểm định hai phía) ⎧ ⎫ ⎪ ⎪ X1 − X ⎪ ⎪ Wα = ⎨T = ; T > tα / (k ) ⎬ ⎪ ⎪ S12 S22 + ⎪ ⎪ n1 n2 ⎩ ⎭ (8.38) b) H0: μ1 = μ2 ; H1: μ1 > μ2 (kiểm định phía) ⎧ ⎫ ⎪ ⎪ X1 − X ⎪ ⎪ Wα = ⎨T = ; T > tα (k ) ⎬ ⎪ ⎪ S12 S22 + ⎪ ⎪ n1 n2 ⎩ ⎭ (8.39) c) H0: μ1 = μ2 ; H1: μ1 < μ2 (kiểm định phía) ⎧ ⎫ ⎪ ⎪ X1 − X ⎪ ⎪ Wα = ⎨T = ; − T > tα (k ) ⎬ ⎪ ⎪ S12 S22 + ⎪ ⎪ n1 n2 ⎩ ⎭ (8.40) Lập hai mẫu cụ thể từ X1 và X , tính giá trị quan sát tiêu chuẩn kiểm định Tqs , so sánh với miền bác bỏ Wα và kết luận Ví dụ 8.8: Để kiểm nghiệm hiệu loại thuốc tẩy giun cho lợn, người ta bắt ngẫu nhiên 14 lợn từ trại chăn nuôi và chia thành nhóm: Nhóm I cho uống thuốc tẩy giun và Nhóm II không cho uống thuốc tẩy giun Sau thời gian dùng thuốc, giết thịt hai nhóm lợn trên cho kết sau số giun có lợn thuộc hai nhóm trên Nhóm I: 18 43 28 50 16 32 13 Nhóm II: 40 54 26 63 21 37 39 Với mức ý nghĩa α = 0,05 hãy kết luận xem loại thuốc tẩy giun nói trên có thực hiệu hay không Giả thiết số lượng giun có phân bố chuẩn Giải: Gọi X và X tương ứng là số giun lợn thuộc hai nhóm trên Theo giả thiết X và X có phân bố chuẩn với các phương sai σ12 , σ 22 chưa biết và không thể cho chúng Số giun trung bình là μ1 và μ Để kiểm định giả thiết: H0: μ1 = μ ; H1: μ1 < μ 150 (154) Chương VIII: Kiểm định giả thiết thống kê Ta sử dụng tiêu chuẩn kiểm định (8.37) và miền bác bỏ Wα (8.40) Từ hai mẫu cụ thể ta tính được: n1 = ; x1 = 28,57 ; s12 = 198,62 n2 = ; x = 40,00 ; s 22 = 215,33 Ta có C = S12 n1 S12 n1 + S 22 = 0,4798 ⇒ k = 6⋅6 ⋅ 0,4798 + ⋅ 0,5202 ≈ 12 n2 Với α = 0, 05 ⇒ tα (k ) = t0,05 (12) = 1, 782 Giá trị quan sát tiêu chuẩn kiểm định Tqs = 28,52 − 40 198,62 215,33 + 19 = −1,49 Vì Tqs ∉Wα đó với mức ý nghĩa 0,05 và từ hai mẫu cụ thể này thì chưa có sở để bác bỏ H0, tức là chưa thể nói loại thuốc tẩy giun thử nghiệm là có hiệu 8.2.5 Kiểm định giả thiết hai phương sai hai biến ngẫu nhiên có phân bố chuẩn (*) Xét hai biến ngẫu nhiên gốc hai tổng thể cùng có phân bố chuẩn biến ngẫu nhiên X có phân bố chuẩn N ( μ1; σ12 ) biến ngẫu nhiên X có phân bố chuẩn N ( μ2 ; σ 22 ) Khác với trường hợp 2.4, đây ta cần kiểm định hai phương sai σ12 và σ 22 : H0: σ12 = σ 22 Để kiểm định giả thiết trên từ hai tổng thể nói trên rút hai mẫu ngẫu nhiên độc lập kích thước tương ứng là n1 và n2 : W1 = ( X 11 , X 12 , , X 1n1 ) ; W2 = ( X 21 , X 22 , , X 2n ) Chọn thống kê sau làm tiêu chuẩn kiểm định: T= S12 σ 22 S 22 σ12 (8.41) Giả sử S12 > S 22 , từ công thức (6.38) chương VI ta biết thống kê T có phân bố FisherSnedecor với n1 − và n − bậc tự 151 (155) Chương VIII: Kiểm định giả thiết thống kê Nếu giả thiết H0 đúng thì tiêu chuẩn kiểm định có dạng: T= S12 S 22 ; ( S12 > S 22 ) (8.42) và có phân bố Fisher-Snedecor với n1 − và n − bậc tự Do đó với mức ý nghĩa α cho trước và tùy thuộc vào dạng đối thiết H1, ta xây dựng các miền bác bỏ tương ứng: a) H0: σ12 = σ 22 ; H1: σ12 ≠ σ 22 (kiểm định hai phía) ⎧⎪ ⎫⎪ S12 Wα = ⎨T = ; T < f α (n1 − 1, n2 − 1) hoÆc T > fα / (n1 − 1, n2 − 1) ⎬ 1− S2 ⎩⎪ ⎭⎪ (8 43) b) H0: σ12 = σ 22 ; H1: σ12 > σ 22 (kiểm định phía) ⎧⎪ ⎫⎪ S12 Wα = ⎨T = ; T > fα (n1 − 1, n2 − 1) ⎬ S2 ⎪⎩ ⎪⎭ (8.44) Lập hai mẫu cụ thể từ X1 và X , tính giá trị quan sát tiêu chuẩn kiểm định Tqs , so sánh với miền bác bỏ Wα và kết luận Ví dụ 8.9: Có hai giống lúa có suất trung bình xấp xỉ song mức độ phân tán suất có thể khác Để kiểm tra điều đó người ta gặt mẫu vùng trồng hai giống lúa đó và thu két sau: Giống lúa Số điểm gặt Phương sai A n1 = 41 s12 = 11,41 B n2 = 30 s 22 = 6,52 Với mức ý nghĩa α = 0,05 hãy kết luận vấn đề trên, biết suất lúa là biến ngẫu nhiên có phân bố chuẩn Giải: Gọi X và X tương ứng là suất hai giống lúa A và B Theo giả thiết X và X có phân bố chuẩn Đây là bài toán kiểm định cặp giả thiết: H0: σ12 = σ 22 ; H1: σ12 ≠ σ 22 Ta sử dụng tiêu chuẩn kiểm định (8.42) và miền bác bỏ Wα (8.43) 152 (156) Chương VIII: Kiểm định giả thiết thống kê ⎧ f α (n1 − 1, n2 − 1) = f 0,025 (40, 29) = 2, 03 ⎪ ⎪ Với α = 0, 05 ⇒ ⎨ ⎪ f1−α (n1 − 1, n2 − 1) = f (n − 1, n − 1) = 0,52 α ⎪ 2 ⎩ ⎧⎪ ⎫⎪ S12 Vậy miền bác bỏ là Wα = ⎨T = ; T < 0,52 hoÆc T > 2,03⎬ ⎪⎩ ⎪⎭ S2 Giá trị quan sát tiêu chuẩn kiểm định Tqs = 11,41 = 1,75 6,52 Vì Tqs ∉Wα đó với mức ý nghĩa 0,05 và từ hai mẫu cụ thể này thì chưa có sở để bác bỏ H0, tức là độ phân tán suất hai giống lúa trên là 8.2.6 Kiểm định giả thiết hai kỳ vọng hai biến ngẫu nhiên có phân bố A( p ) Giả sử ta xét cùng lúc hai tổng thể Ở tổng thể thứ dấu hiệu nghiên cứu xem biến ngẫu nhiên X có phân bố không – A( p1 ) Ở tổng thể thứ hai dấu hiệu nghiên cứu xem biến ngẫu nhiên X có phân bố không – A( p ) Nếu hai tham số p1 và p chưa biết song có sở để giả thiết giá trị chúng nhau, ta đưa giả thiết thống kê: H0: p1 = p Để kiểm định giả thiết trên từ hai tổng thể nói trên rút hai mẫu ngẫu nhiên độc lập kích thước tương ứng là n1 và n2 : W1 = ( X 11 , X 12 , , X 1n1 ) ; W2 = ( X 21 , X 22 , , X 2n ) Chọn thống kê sau làm tiêu chuẩn kiểm định T= ( f1 − f ) − ( p1 − p ) p1 (1 − p1 ) p (1 − p ) + n1 n2 (8.45) Theo công thức (6.42) chương VI, thống kê T có phân bố xấp xỉ chuẩn tắc N (0 ;1) n1 > 30 và n2 > 30 Nếu giả thiết H0 đúng ( p1 = p = p ) thì tiêu chuẩn kiểm định trở thành: T= f1 − f ⎛1 ⎞ ⎟⎟ p(1 − p)⎜⎜ + ⎝ n1 n2 ⎠ 153 (157) Chương VIII: Kiểm định giả thiết thống kê Thông thường p chưa biết nên thay ước lượng nó là: f = n1 f1 + n2 f n1 + n2 Như ta có tiêu chuẩn kiểm định: T= f1 − f ⎛1 ⎞ f (1 − f )⎜⎜ + ⎟⎟ ⎝ n1 n2 ⎠ (8.46) Thống kê T có phân bố xấp xỉ chuẩn tắc N (0 ;1) n1 > 30 và n2 > 30 Do đó tùy theo mức ý nghĩa α và đối thiết H1 ta xây dựng các miền bác bỏ tương ứng: a) H0: p1 = p ; H1: p1 ≠ p (kiểm định hai phía) ⎧ ⎪ ⎪ Wα = ⎨T = ⎪ ⎪ ⎩ ⎫ ⎪ f1 − f ⎪ ; T > Uα ⎬ ⎛1 ⎞ 2⎪ f (1 − f ) ⎜ + ⎟ ⎪ ⎝ n1 n2 ⎠ ⎭ (8.47) b) H0: p1 = p ; H1: p1 > p (kiểm định phía) ⎧ ⎪ ⎪ Wα = ⎨T = ⎪ ⎪ ⎩ ⎫ ⎪ ⎪ f1 − f ; T > Uα ⎬ ⎛1 ⎞ ⎪ f (1 − f )⎜⎜ + ⎟⎟ ⎪ ⎝ n1 n2 ⎠ ⎭ (8.48) c) H0: p1 = p ; H1: p1 < p (kiểm định phía) ⎧ ⎪ ⎪ Wα = ⎨T = ⎪ ⎪ ⎩ ⎫ ⎪ ⎪ f1 − f ; − T > Uα ⎬ ⎛1 ⎞ ⎪ f (1 − f )⎜⎜ + ⎟⎟ ⎪ ⎝ n1 n2 ⎠ ⎭ (8.49) Lập hai mẫu cụ thể từ X1 và X , tính giá trị quan sát tiêu chuẩn kiểm định Tqs , so sánh với miền bác bỏ Wα và kết luận Ví dụ 8.10: Kiểm tra ngẫu nhiên các sản phẩm cùng loại hai nhà máy sản xuất thu các số liệu sau: 154 (158) Chương VIII: Kiểm định giả thiết thống kê Nhà máy Số sản phẩm kiểm tra Số phế phẩm A n1 = 1100 x1 = 20 B n2 = 950 x = 31 Với mức ý nghĩa α = 0,05 có thể coi tỷ lệ phế phẩm hai nhà máy là hay không? Giải: Gọi p1 và p tương ứng là tỷ lệ phế phẩm hai nhà máy A và B Như đây là bài toán kiểm định cặp giả thiết, đối thiết: H0: p1 = p ; H1: p1 ≠ p Chọn tiêu chuẩn kiểm định (8.46) và n1 và n2 đủ lớn thì miền bác bỏ dạng (8.47) Do α = 0,05 ⇒ U α = 1,96 Miền bác bỏ Wα = { T > 1,96} Với hai mẫu cụ thể trên ta tính f1 = 31 22 + 31 22 = 0,02 ; f = = 0,0344 ; f = = 0,0265 ; 900 1100 + 900 1100 Tqs = 0,02 − 0,0344 ⎞ ⎛ 0,0265 ⋅ 0,9735⎜ + ⎟ ⎝ 1100 900 ⎠ = −1,995 Vì Tqs ∈Wα đó ta có thể bác bỏ giả thiết H0, tỷ lệ phế phẩm hai nhà máy khác 8.3 KIỂM ĐỊNH PHI THAM SỐ Trong mục ta kiểm định các giả thiết các dấu hiệu nghiên cứu tổng thể có chứa các tham số và bài toán đưa kiểm định giả thiết tham số Tuy nhiên thực tế ta cần kiểm định giả thiết không chứa các tham số, chẳng hạn kiểm định quy luật phân bố xác suất dấu hiệu nghiên cứu, kiểm định tính độc lập hai dấu hiệu nghiên cứu …, đó là bài toán kiểm định phi tham số 8.3.1 Kiểm định giả thiết quy luật phân bố xác suất biến ngẫu nhiên Giả sử chưa biết quy luật phân bố xác suất biến ngẫu nhiên gốc X tổng thể song có sở để giả thiết X có phân bố theo quy luật A nào đó Ta có thể kiểm định: Giả thiết H0: X có phân bố xác suất theo quy luật A; Đối thiết H1: X có phân bố xác suất không theo quy luật A Sau đây ta sử dụng tiêu chuẩn phù hợp Pearson để kiểm định giả thiết trên 155 (159) Chương VIII: Kiểm định giả thiết thống kê Phân hoạch miền giá trị X thành k khoảng rời C1 , C , , C k Từ tổng thể rút mẫu ngẫu nhiên kích thước n và gọi n1 , n2 , , n k là các tần số tương ứng mẫu nằm k khoảng này (gọi là tần số thực nghiệm) Nếu giả thiết H0 đúng ta có thể tính các xác suất: pi = P{X ∈ C i }; i = 1, k Từ đó ta có tần số lý thuyết: nˆ i = npi ; i = 1, k Tiêu chuẩn kiểm định chọn là thống kê: (ni − nˆ i ) nˆ i i =1 k T =∑ (8.50) Người ta chứng minh không phụ thuộc vào quy luật phân bố xác suất biến ngẫu nhiên gốc X tổng thể, n → ∞ thống kê T hội tụ quy luật phân bố “Khi bình phương” với k − r − bậc tự do, đó r là số tham số cần ước lượng quy luật cần kiểm định Các tham số này ước lượng phương pháp hợp lý cực đại Chẳng hạn quy luật cần kiểm định là quy luật phân bố chuẩn thì có hai tham số cần ước lượng là μ và σ nên r = , còn quy luật cần kiểm định là quy luật Poisson thì r = Với mức ý nghĩa α ta xây dựng miền bác bỏ: k ⎧⎪ ⎫⎪ (n − nˆ i ) ; T > χ α (k − r − 1)⎬ Wα = ⎨T = ∑ i nˆ i ⎪⎩ ⎪⎭ i =1 (8.51) Chú ý tiêu chuẩn phù hợp Pearson áp dụng kích thước mẫu đủ lớn ( n > 50 ) và các tần số thực nghiệm đủ lớn ( ni ≥ ) Khi các tần số quá nhỏ ( ni < ) thì ta phải ghép các giá trị hay các khoảng giới hạn mẫu lại để tăng giá trị tần số thực nghiệm lên Ví dụ 8.11: Số lời gọi đến trạm điện thoại X phút cho bảng sau: Số lời gọi ( xi ) ≥6 Số phút gọi tương ứng (ni ) 18 22 25 19 11 Với mức ý nghĩa α = 0,01 có thể coi X có phân bố theo quy luật Poisson không? Giải: Kiểm định giả thiết H0: X phân bố theo quy luật Poisson; Đối thiết H1: X không phân bố theo quy luật Poisson 156 (160) Chương VIII: Kiểm định giả thiết thống kê Từ mẫu tính x = là ước lượng tham số λ phân bố Poisson Để áp dụng tiêu chuẩn kiểm định (8.50) và miền bác bỏ (8.51) ta phải nhập lại để thỏa mãn điều kiện ni ≥ Số lời gọi ( xi ) ≥5 Số phút gọi tương ứng (ni ) 18 22 25 19 11 Để tính giá trị quan sát tiêu chuẩn kiểm định Tqs ta lập bảng sau: e −2 xi xi ! nˆ i = npi ni − nˆ i (ni − nˆ i ) nˆ i 0,1353 13,53 4,47 1,477 22 0,2707 27,07 -5,07 0,95 25 0,2707 27,07 -2,07 0,158 19 0,1804 18,04 0,96 0,051 11 0,0902 9,02 1,98 0,435 ≥5 0,0527 5,27 -0,27 0,014 ∑ n = 100 1,0000 100 xi ni 18 pi = 3,085 Do α = 0,01 ⇒ χ α (k − r − 1) = χ 02,01 (6 − − 1) = 13,277 Vậy Tqs ∉Wα đó chưa có sở để bác bỏ H0 hay có thể coi X phân bố theo quy luật Poisson 8.3.2 Kiểm định giả thiết tính độc lập hai dấu hiệu định tính(*) Giả sử cần nghiên cứu đồng thời hai dấu hiệu định tính A và B Ta chia dấu hiệu A thành h mức độ A1 , A2 , , Ah và dấu hiệu B thành k mức độ B1 , B2 , , Bk Ta kiểm định giả thiết H0: A và B độc lập; Đối thiết H1: A và B phụ thuộc Để kiểm định giả thiết trên tử tổng thể lập mẫu ngẫu nhiên kích thước n và trình bày dạng sau: 157 (161) Chương VIII: Kiểm định giả thiết thống kê A B1 B2 … Bk Tổng A1 n11 n12 … n1k n1* A2 n21 n22 … n2k n2* … … … … … … Ah nh1 nh … nhk nh* Tổng n*1 n*2 … n*k n B đó: ni∗ là tổng số các tần số ứng với dấu hiệu thành phần Ai ; n∗ j là tổng số các tần số ứng với dấu hiệu thành phần B j ; nij là tần số ứng với các phần tử đồng thời mang dấu hiệu Ai và B j Với n đủ lớn thì theo định nghĩa thống kê xác suất ta có: P( Ai B j ) ≈ P ( Ai ) ≈ nij n , i = 1, h ; j = 1, k n∗ j ni ∗ , i = 1, h P ( B j ) ≈ , j = 1, k n n Nếu giả thiết H0 đúng tức là A và B độc lập thì với i = 1, h ; j = 1, k : P ( Ai B j ) = P( Ai ) P ( B j ) tức là Xét thống kê: ⎛ nij ni∗ n∗ j ⎜ − ⋅ h k ⎜ n n n ⎝ T = n∑∑ ni∗ n∗ j i =1 j =1 ⋅ n n ⎞ ⎟ ⎟ ⎠ nij n = ni∗ n∗ j ⋅ n n Khai triển vế phải công thức trên và rút gọn ta ⎛ h k ⎞ nij2 ⎜ − 1⎟ T = n ∑∑ ⎜ ⎟ n ⋅n ⎝ i =1 j =1 i∗ ∗ j ⎠ (8.52) Có thể chứng minh n → ∞ phân bố xác suất T dần tới phân bố χ với (h − 1)(k − 1) bậc tự Vì n đủ lớn, với mức ý nghĩa α ta xây dựng miền bác bỏ: 158 (162) Chương VIII: Kiểm định giả thiết thống kê ⎧ ⎫ ⎛ h k ⎞ nij2 ⎪ ⎪ ⎜ − 1⎟ ; T > χ α2 (h − 1)(k − 1)⎬ Wα = ⎨T = n ∑∑ ⎜ ⎟ n ⋅n ⎪⎩ ⎪⎭ ⎝ i =1 j =1 i∗ ∗ j ⎠ (8.53) Ví dụ 8.12: Bảng sau cho ta tần số sinh viên ứng với mức A (khả học toán: thấp, trung bình, cao) và mức B (sự quan tâm đến môn xác suất thống kê) Với mức ý nghĩa α = 0,01 hãy kiểm định giả thiết H0: A và B độc lập với A Thấp Trung bình Cao Tổng Ít 43 24 15 82 Trung bình 31 46 37 114 Nhiều 12 20 49 81 Tổng 86 90 101 277 B Với α = 0,01 ta có χ α2 (h − 1)(k − 1) = χ 02,01 (4) = 13,28 Từ mẫu cụ thể trên ta tính giá trị quan sát tiêu chuẩn kiểm định Tqs = 33,533 > 13,28 nên H0 bị bác bỏ Vậy các đặc tính A và B không độc lập, tức lực toán học sinh viên có quan hệ với việc quan tâm hay thích thú môn xác suất thống kê 8.3.3 Kiểm định giả thiết tần số nhiều tổng thể (*) Ta xét k tổng thể H1, H2, … , hiệu A Gọi pi Hk Mỗi cá thể chúng có thể mang hay không mang dấu là tần suất có dấu hiệu A tổng thể Hi, ( i = 1, k ) Ta kiểm định giả thiết H0: p1 = p = = p k Đối thiết H1: Các tần suất pi ( i = 1, k ) không đồng thời Từ tổng thể Hi rút mẫu ngẫu nhiên có kích thước ni đó có mi cá thể có dấu hiệu A và li = ni − mi cá thể không có dấu hiệu A Các mẫu ngẫu nhiên này trình bày bảng sau: Tổng thể … k Tổng Có A m1 m2 … mk m Không A l1 l2 … lk l Tổng n1 n2 … nk N = m + l = ∑ ni k i =1 159 (163) Chương VIII: Kiểm định giả thiết thống kê Có thể chứng minh giả thiết H0 đúng và kích thước mẫu đủ lớn (tần số thực nghiệm mi ≥ , li ≥ ) thì thống kê sau xấp xỉ phân bố χ với k − bậc tự do: T= N k mi2 m −N ∑ ml i =1 ni l (8.54) Ta chọn thống kê trên làm tiêu chuẩn kiểm định giả thiết H0 ⎧⎪ N2 Wα = ⎨T = ml ⎪⎩ Miền bác bỏ ⎫⎪ mi2 m ∑ n − N l ; T > χα2 (k − 1) ⎬ ⎪⎭ i =1 i k (8.55) Ví dụ 8.13: So sánh tác dụng mẫu thuốc thử nghiệm trên lô chuột, kết thu sau: Mẫu thuốc Tổng Số sống 79 82 77 83 76 81 478 Số chết 21 18 23 17 24 19 122 Tổng 100 100 100 100 100 100 600 Với mức ý nghĩa α = 5% hãy kiểm định giả thiết H0: Tỉ lệ chết mẫu thuốc là nhau; Đối thiết H1: Tỉ lệ chết mẫu thuốc khác Giải: Tra bảng phân bố χ với bậc tự ta có χα2 (k − 1) = χ 0,05 (5) = 11, 07 Từ mẫu trên ta có Tqs = 6002 ⎛ 792 822 + + ⎜ 478 ⋅122 ⎜⎝ 100 100 + 812 ⎞ 478 = 2, 42 < 11, 07 ⎟⎟ − 600 ⋅ 100 ⎠ 122 Vậy Tqs ∉Wα đó chưa có sở để bác bỏ H0 hay có thể cho tỉ lệ chết mẫu thuốc là TÓM TẮT Giả thiết thống kê Giả thiết thống kê là giả thiết dạng phân bố xác suất biến ngẫu nhiên gốc tổng thể, các tham số đặc trưng tính chất các biến ngẫu nhiên này Giả thiết thống kê là điều ta nghi ngờ muốn bác bỏ, phát biểu dạng H0 Cạnh tranh với giả thiết này là đối thiết H1, theo nghĩa bác bỏ H0 thì chấp nhận H1 và ngược lại 160 (164) Chương VIII: Kiểm định giả thiết thống kê Thủ tục kiểm định giả thiết thống kê Một thủ tục kiểm định giả thiết thống kê bao gồm các bước sau: a) Phát biểu giả thiết H0 và đối thiết H1 b) Từ tổng thể nghiên cứu lập mẫu ngẫu nhiên kích thước n c) Chọn tiêu chuẩn kiểm định T và xác định quy luật phân bố xác suất T với điều kiện giả thiết H0 đúng d) Với mức ý nghĩa α , xác định miền bác bỏ Wα tốt tùy thuộc vào đối thiết H1 e) Từ mẫu cụ thể tính giá trị quan sát tiêu chuẩn kiểm định Tqs f) So sánh giá trị quan sát tiêu chuẩn kiểm định Tqs với miền bác bỏ Wα và kết luận Kiểm định giả thiết kỳ vọng biến ngẫu nhiên có phân bố theo quy luật chuẩn 1) Trường hợp đã biết phương sai Tiêu chuẩn kiểm định: T = ( X − μ0 ) n σ a Bài toán 1: H0: μ = μ ; H1: μ ≠ μ Miền bác bỏ Wα = { T > Uα / } b Bài toán 2: H0: μ = μ ; H1: μ > μ Miền bác bỏ Wα = { T > U α } c Bài toán 3: H0: μ = μ ; H1: μ < μ Miền bác bỏ Wα = { − T > U α } 2) Trường hợp chưa biết phương sai n ≥ 30 Tiêu chuẩn kiểm định: T = ( X − μ0 ) n S a Bài toán 1: H0: μ = μ ; H1: μ ≠ μ Miền bác bỏ Wα = { T > Uα / } b Bài toán 2: H0: μ = μ ; H1: μ > μ Miền bác bỏ Wα = { T > U α } c Bài toán 3: H0: μ = μ ; H1: μ < μ Miền bác bỏ Wα = { − T > U α } 3) Trường hợp chưa biết phương sai n < 30 Tiêu chuẩn kiểm định: T = ( X − μ0 ) n S a Bài toán 1: H0: μ = μ ; H1: μ ≠ μ Miền bác bỏ Wα = { T > tα / (n − 1)} b Bài toán 2: H0: μ = μ ; H1: μ > μ Miền bác bỏ Wα = { T > tα (n − 1)} c Bài toán 3: H0: μ = μ ; H1: μ < μ Miền bác bỏ Wα = { − T > tα (n − 1)} 161 (165) Chương VIII: Kiểm định giả thiết thống kê Kiểm định giả thiết phương sai biến ngẫu nhiên có phân bố chuẩn Tiêu chuẩn kiểm định: T = (n − 1) S σ 02 a H0: σ = σ 02 ; H1: σ ≠ σ 02 : ⎧⎪ ⎫⎪ Wα = ⎨ T < χ α (n − 1) hoÆc T > χ 2α (n − 1)⎬ 1− ⎪⎩ ⎪⎭ 2 { = {T < χ } b H0: σ = σ 02 ; H1: σ > σ 02 : Wα = T > χ α2 (n − 1) c H0: σ = σ 02 ; H1: σ < σ 02 : Wα } 1−α ( n − 1) Kiểm định giả thiết kỳ vọng biến ngẫu nhiên có phân bố không – A(p) Tiêu chuẩn kiểm định: T = ⎧np > với điều kiện ⎨ p0 (1 − p0 ) ⎩n(1 − p ) > ( f − p0 ) n f là tần suất mẫu a H0: p = p ; H1: p ≠ p Wα = { T > Uα / } b H0: p = p ; H1: p > p Wα = { T > U α } c H0: p = p ; H1: p < p Wα = { − T > U α } Kiểm định giả thiết hai kỳ vọng hai biến ngẫu nhiên có phân bố chuẩn 1) Trường hợp hai phương sai σ12 và σ 22 hai biến ngẫu nhiên gốc đã biết Tiêu chuẩn kiểm định: T = ( X1 − X ) − ( μ1 − μ2 ) σ12 n1 + σ 22 n2 a) H0: μ1 = μ2 ; H1: μ1 ≠ μ2 : Wα = { T > Uα / } b) H0: μ1 = μ2 ; H1: μ1 > μ2 : Wα = { T > U α } c) H0: μ1 = μ2 ; H1: μ1 < μ2 : Wα = { − T > U α } 2) Trường hợp hai phương sai σ12 và σ 22 hai biến ngẫu nhiên gốc chưa biết σ12 = σ 22 162 (166) Chương VIII: Kiểm định giả thiết thống kê Tiêu chuẩn kiểm định: T = với Sp = ( X1 − X ) 1 Sp + n1 n2 , (n1 − 1) S12 + (n2 − 1) S 22 n1 + n − a) H0: μ1 = μ2 ; H1: μ1 ≠ μ2 : Wα = { T > tα / (n1 + n2 − 2)} b) H0: μ1 = μ2 ; H1: μ1 > μ2 : Wα = { T > tα (n1 + n2 − 2)} c) H0: μ1 = μ2 ; H1: μ1 < μ2 : Wα = { − T > tα (n1 + n2 − 2)} 3) Trường hợp hai phương sai σ12 và σ 22 hai biến ngẫu nhiên gốc chưa biết và không thể cho chúng ( σ12 ≠ σ 22 ) Tiêu chuẩn kiểm định: T = C= S12 n1 S12 S 22 + n1 n2 X1 − X S12 S 22 + n1 n2 ; k= (n1 − 1)(n2 − 1) (n − 1)C + (n1 − 1)(1 − C ) ; T có phân bố Student k bậc tự a) H0: μ1 = μ2 ; H1: μ1 ≠ μ2 : Wα = { T > tα / (k )} b) H0: μ1 = μ2 ; H1: μ1 > μ2 : Wα = { T > tα (k )} c) H0: μ1 = μ2 ; H1: μ1 < μ2 : Wα = { − T > tα (k )} Kiểm định giả thiết hai phương sai hai biến ngẫu nhiên có phân bố chuẩn X có phân bố chuẩn N (μ1 ; σ12 ) X có phân bố chuẩn N (μ ; σ 22 ) H0: σ12 = σ 22 Tiêu chuẩn kiểm định: T = S12 S 22 ; ( S12 > S 22 ) có phân bố Fisher-Snedecor với n1 − và n − bậc tự ⎧⎪ ⎫⎪ a) H1: σ12 ≠ σ 22 : Wα = ⎨ T < f α (n1 − 1, n2 − 1) hoÆc T > fα / (n1 − 1, n2 − 1) ⎬ 1− ⎪⎩ ⎪⎭ 163 (167) Chương VIII: Kiểm định giả thiết thống kê S2 ⎪⎧ ⎪⎫ b) H1: σ12 > σ 22 : Wα = ⎨T = 12 ; T > fα (n1 − 1, n2 − 1) ⎬ S2 ⎩⎪ ⎭⎪ Kiểm định giả thiết hai kỳ vọng hai biến ngẫu nhiên có phân bố A( p ) Biến ngẫu nhiên X tổng thể thứ có phân bố không – A( p1 ) biến ngẫu nhiên X tổng thể thứ hai có phân bố không – A( p ) Kiểm định H0: p1 = p f1 − f Tiêu chuẩn kiểm định: T = ⎛1 ⎞ f (1 − f )⎜⎜ + ⎟⎟ ⎝ n1 n2 ⎠ f = n1 f1 + n2 f n1 > 30 và n2 > 30 n1 + n2 f1 , f là tần suất mẫu, tương ứng với kích thước mẫu n1 , n2 a) H0: p1 = p ; H1: p1 ≠ p : Wα = { T > Uα / } b) H0: p1 = p ; H1: p1 > p : Wα = { T > U α } c) H0: p1 = p ; H1: p1 < p : Wα = {− T > U α } Kiểm định giả thiết quy luật phân bố xác suất biến ngẫu nhiên Giả thiết H0: X có phân bố xác suất theo quy luật A; Đối thiết H1: X có phân bố xác suất không theo quy luật A Phân hoạch miền giá trị X thành k khoảng rời C1 , C , , C k Từ tổng thể rút mẫu ngẫu nhiên kích thước n và gọi n1 , n2 , , n k là các tần số tương ứng mẫu nằm k khoảng này (gọi là tần số thực nghiệm) Nếu giả thiết H0 đúng ta có thể tính các xác suất: pi = P{X ∈ Ci }; i = 1, k Tần số lý thuyết: nˆ i = npi ; i = 1, k (ni − nˆ i ) Tiêu chuẩn kiểm định: T = ∑ có phân bố χ với k − r − bậc tự do, đó nˆ i i =1 k r là số tham số cần ước lượng quy luật cần kiểm định k ⎧⎪ ⎫⎪ (n − nˆ i ) ; T > χ α (k − r − 1)⎬ Miền bác bỏ Wα = ⎨T = ∑ i nˆ i ⎪⎩ ⎪⎭ i =1 Kiểm định giả thiết tính độc lập hai dấu hiệu định tính Giả sử cần nghiên cứu đồng thời hai dấu hiệu định tính A và B Ta chia dấu hiệu A thành h mức độ A1 , A2 , , Ah và dấu hiệu B thành k mức độ B1 , B2 , , Bk 164 (168) Chương VIII: Kiểm định giả thiết thống kê Ta kiểm định giả thiết H0: A và B độc lập; Đối thiết H1: A và B phụ thuộc n là kích thức mẫu; ni∗ , n∗ j là tổng số các tần số ứng với dấu hiệu thành phần Ai và B j ; nij là tần số ứng với các phần tử đồng thời mang dấu hiệu Ai và B j ⎛ h k ⎞ nij2 ⎜ − 1⎟ Tiêu chuẩn kiểm định T = n ∑∑ ⎜ ⎟ n ⋅n ⎝ i =1 j =1 i∗ ∗ j ⎠ { } Miền bác bỏ Wα = T > χ α2 (h − 1)(k − 1) Kiểm định giả thiết tần số nhiều tổng thể Ta xét k tổng thể H1, H2, … , Hk Mỗi cá thể chúng có thể mang hay không mang dấu hiệu A Gọi pi là tần suất có dấu hiệu A tổng thể Hi, ( i = 1, k ) Ta kiểm định giả thiết H0: p1 = p = = p k H1: Các tần suất pi ( i = 1, k ) không đồng thời Từ tổng thể Hi rút mẫu ngẫu nhiên có kích thước ni đó có mi cá thể có dấu hiệu A và li = ni − mi k k k i =1 i =1 i =1 cá thể không có dấu hiệu A m = ∑ mi ; l = ∑ li ; N = m + l = ∑ ni Tiêu chuẩn kiểm định: T = { } N k mi2 m − N Miền bác bỏ Wα = T > χ α2 (k − 1) ∑ ml i =1 ni l CÂU HỎI ÔN TẬP VÀ BÀI TẬP 8.1 Giả thiết thống kê là giả thiết nhà thống kê đặt cho mẫu ngẫu nhiên Đúng Sai 8.2 Bác bỏ giả thiết dẫn đến chấp nhận đối thiết và ngược lại đó đối thiết là phủ định giả thiết Đúng Sai 8.3 Qui tắc kiểm định dựa trên nguyên lý xác suất nhỏ và phép chứng minh phản chứng Đúng Sai 8.4 Sai lầm loại là sai lầm gặp phải thực tế giả thiết đúng ta bác bỏ Đúng Sai 8.5 Sai lầm loại luôn luôn lớn sai lầm loại Đúng Sai 165 (169) Chương VIII: Kiểm định giả thiết thống kê 8.6 Định lý Neymann - Pearson có thể tìm tiêu chuẩn kiểm định có sai lầm loại và loại bé tùy ý cho trước Đúng Sai 8.7 Miền bác bỏ là miền có xác suất bé nên ta có thể bỏ qua phép kiểm định Đúng Sai 8.8 Miền bác bỏ tiêu chuẩn kiểm định giả thiết hai phía luôn luôn là miền đối xứng Đúng Sai 8.9 Khi xây dựng tiêu chuẩn kiểm định T ta luôn giả sử giả thiết H0 sai vì giả thiết H0 là điều ta nghi ngờ muốn bác bỏ Đúng Sai 8.10 Kiểm định hai phía là kiểm định tham số có thể nhận giá trị âm dương bất kỳ, còn kiểm định phía tham số cần kiểm định nhận giá trị dương âm Đúng Sai 8.11 Trọng lượng đóng bao loại sản phẩm X là biến ngẫu nhiên có phân bố theo quy luật chuẩn với trọng lượng trung bình theo quy định là 100kg Nghi ngờ sản phẩm bị đóng thiếu, người ta cân thử 29 bao loại này ta thu kết quả: Trọng lượng (kg) 98,0 -98,5 Số bao tương ứng 98,5– 99,0 99,0 - 99,5 99,5 - 100 100 -100,5 100,5-101 10 Với mức ý nghĩa α = 0, 025 hãy kết luận điều nghi ngờ nói trên 8.12 Định mức thời gian hoàn thành sản phẩm là 14 phút Liệu có cần thay đổi định mức không, theo dõi thời gian hoàn thành sản phẩm 250 công nhân ta thu kết sau: X (phút) 10 - 12 12 - 14 14 - 16 16 - 18 18 - 20 20 60 100 40 30 Số công nhân Với mức ý nghĩa α = 0, 05 hãy kết luận ý định nói trên 8.13 Mức hao phí xăng loại Ôtô chạy từ A đến B là biến ngẫu nhiên có quy luật chuẩn với kỳ vọng 50 lít Đoạn đường sửa chữa lại Người ta cho mức hao phí xăng trung bình giảm xuống Quan sát 28 ô tô cùng loại thu X hao phí (lít) 48,5 - 49,0 49,0 - 49,5 49,5 - 50,0 50,0 - 50,5 50,5-51 Số ôtô tương ứng 10 Với mức ý nghĩa α = 0, 025 hãy kết luận điều nghi ngờ nói trên 166 (170) Chương VIII: Kiểm định giả thiết thống kê 8.14 Trọng lượng X sản phẩm nhà máy sản xuất là biến ngẫu nhiên có phân bố chuẩn N ( μ , σ ) với độ lệch σ = kg và trọng lượng trung bình μ = 20 kg Nghi ngờ trọng lượng đóng gói thay đổi, người ta cân thử 100 sản phẩm và thu kết sau: X (kg) 18 19 20 21 22 Số sản phẩm 25 40 20 10 Hãy kiểm định điều nghi ngờ trên với mức ý nghĩa α = 0, 05 8.15 Một công ty có hệ thống máy tính có thể xử lý 1300 hoá đơn Công ty nhập hệ thống máy tính mới, hệ thống này chạy kiểm tra 40 cho thấy số hoá đơn xử lý trung bình là 1378 với độ lệch tiêu chuẩn 215 Với mức ý nghĩa 2,5% hãy nhận định xem hệ thống có tốt hệ thống cũ hay không? 8.16 Tỉ lệ phế phẩm máy tự động sản xuất là 5% Kiểm tra ngẫu nhiên 300 sản phẩm thấy có 24 sản phẩm là phế phẩm Từ đó có ý kiến cho tỷ lệ phế phẩm máy đó sản xuất có chiều hướng tăng lên Hãy kết luận ý kiến trên với mức ý nghĩa α = 0, 05 8.17 Nếu máy móc hoạt động bình thường thì trọng lượng sản phẩm tuân theo quy luật chuẩn với độ lệch tiêu chuẩn kg Có thể coi máy móc còn hoạt động tốt hay không cân thử 30 sản phẩm ta thấy độ lệch tiêu chuẩn điều chỉnh mẫu tăng lên tới 1,1 kg Kiểm định giả thiết trên với mức ý nghĩa α = 0,01 8.18 Có hai loại bi thép: loại I và loại II Loại I có đường kính là biến ngẫu nhiên X tuân theo quy luật phân bố chuẩn N (μ1 ; σ ) , Loại II có đường kính là biến ngẫu nhiên Y tuân theo quy luật phân bố chuẩn N (μ ; σ ) Người ta cho đường kính trung bình hai loại vòng bi này Lấy ngẫu nhiên 10 phần tử loại I và 10 phần tử loại II Ta thu kết sau: X 2,066 2,068 2,063 2,060 2,067 2,059 2,065 2,062 2,061 2,064 Y 2,063 2,060 2,057 2,056 2,059 2,058 2,062 2,059 2,062 2,059 Hãy kiểm định giả thiết trên với mức ý nghĩa α = 0,05 8.19 Để so sánh trọng lượng trung bình trẻ sơ sinh thành thị và nông thôn, người ta theo dõi 1000 cháu và thu bảng sau Kết n số cháu Trung bình mẫu x Độ lệch mẫu s Nông thôn 500 3,0 kg 0,4 kg Thành thị 500 3,2 kg 0,3 kg Với mức ý nghĩa α = 0,05 có thể coi trọng lượng trẻ sơ sinh thành thị cao nông thôn không? 167 (171) Chương VIII: Kiểm định giả thiết thống kê 8.20 Sau theo dõi thời gian hoàn thành sản phẩm hai công nhân A và B ta có kết sau: Kết n số sản phẩm Trung bình mẫu x Độ lệch mẫu s Công nhân A 50 32 phút phút Công nhân B 60 30 phút phút Với mức ý nghĩa α = 0,05 có thể coi công nhân B hoàn thành sản phẩm nhanh công nhân A không Giả sử thời gian hoàn thành sản phẩm hai công nhân là hai biến ngẫu nhiên phân bố theo quy luật chuẩn 8.21 Điều tra ngẫu nhiên phân bố thực nghiệm 4000 gia đình có ba con, ta có bảng sau: Số trai Số gia đình 450 1460 1530 560 Với mức ý nghĩa α = 0,05 có thể xem X là biến ngẫu nhiên số trai gia đình ba tuân theo luật phân bố nhị thức không? 8.22 Số ( X ) 2000 phụ nữ thủ đô 25 tuổi cho bảng sau X : Số Số phụ nữ 1090 650 220 30 10 Với mức ý nghĩa α = 0,05 có thể xem X tuân theo quy luật Poisson không? 8.23 Một máy tự động làm sản phẩm là loại trục có đường kính ( X ) quan sát trên 200 trục ta nhận số liệu sau Giá trị X 0,3 0,5 0,7 0,9 1,1 1,3 1,5 1,7 1,9 2.1 2.3 Số lần ni 26 25 30 26 21 24 20 Với mức ý nghĩa α = 0,05 hãy kiểm định giả thiết H0: “ X có phân bố chuẩn”, đối thiết H1: “ X không có phân bố chuẩn” 8.24 Nghiên cứu ảnh hưởng thành phần thức ăn bố mẹ ( X ) giới tính ( Y ) cái ta có kết sau X -Thành phần thức ăn Không có Vitamin Có Vitamin Tổng cộng Nam 123 145 268 Nữ 153 150 303 Tổng cộng 276 295 571 Y -Giới tính Với mức ý nghĩa α = 0,05 có thể xem X và Y độc lập với không? 168 (172) Hướng dẫn giải và đáp án bài tập HƯỚNG DẪN GIẢI VÀ ĐÁP ÁN BÀI TẬP ĐÁP ÁN CHƯƠNG I 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.10 Đúng Sai Đúng Đúng Sai Đúng Sai Sai Đúng Đúng 1.11 a) P = 0,246 b) P = 0,495 1.12 Mỗi khách có khả để tầng còn lại tòa nhà Do đó số kết cục đồng khả có thể N = A63 = 216 Gọi A là biến cố tất cùng tầng bốn, biến cố này có trường hợp thuận lợi Do đó P ( A) = 216 A65 = Lý luận tương tự trên ta có Pb = ; Pc = = 216 216 36 1.13 P = 720 1.15 Gọi A1 và A2 tương ứng là biến cố người thứ và thứ hai bắn trúng mục tiêu, A là biến cố có người bắn trúng mục tiêu A = A1 A + A1 A2 Sử dụng qui tắc cộng xác suất trường hợp xung khắc và qui tắc nhân trường hợp độc lập ta có: P ( A) = P ( A1 A ) + P ( A1 A2 ) = P ( A1 ) P ( A ) + P ( A1 ) P ( A2 ) = 0,8 ⋅ 0,1 + 0,2 ⋅ 0,9 = 0,26 Tương tự ta có: Pb = 0,98 ; Pc = 0,02 1.16 Gọi A1 là biến cố sản phẩm lấy thuộc loại Gọi A2 là biến cố sản phẩm lấy thuộc loại Gọi A là biến cố sản phẩm lấy thuộc loại loại 2: A = A1 + A2 Vì A1 , A2 xung khắc đó: P ( A) = P ( A1 + A2 ) = P ( A1 ) + P ( A2 ) = 0, + 0,5 = 0,9 1.17 P = − P0 ( 3; 0, ) = − 0, 63 = 0, 784 169 (173) Hướng dẫn giải và đáp án bài tập 1.18 ⎛ ⎞ ⎛ 49 ⎞ P = C30 ⎜ ⎟ ⎜ ⎟ ⎝ 50 ⎠ ⎝ 50 ⎠ 25 = 0, 00027 1.19 Gọi Ai là biến cố sản phẩm đã qua kiểm tra chất lượng phòng thứ i, i=1,2,3 Gọi B là biến cố phế phẩm nhập kho ( ) ( ) ( ) P ( B ) = P A1 P A2 P A3 = (1 − 0,8 )(1 − 0,9 )(1 − 0,99 ) = 0, 0002 1.20 P = 0,11 1.21 Gọi Ai là biến cố lần thứ i lấy sản phẩm để kiểm tra, ( i = 1, ) Gọi A là biến cố sau lần kiểm tra tất các sản phẩm kiểm tra A = A1 A2 A3 Vì các biến cố phụ thuộc nên P ( A) = P ( A1 ) P ( A2 A1 ) P ( A3 A1 A2 ) = ⋅ 5 ⋅ = 21 84 1764 1.22 Gọi A là biến cố sản phẩm kiểm tra là phế phẩm Gọi Bi là biến cố sản phẩm lấy kiểm tra thuộc phân xưởng thứ i, i=1,2 P ( B1 ) = 0,36; P ( B2 ) = 0,34; P ( B3 ) = 0,30 Hệ { B1, B2 , B3} đầy đủ P ( A B1 ) = 0,12; P ( A B2 ) = 0,10; P ( A B3 ) = 0, 08 a P ( A ) = P ( B1 ) P ( A B1 ) + P ( B2 ) P ( A B2 ) + P ( B3 ) P ( A B3 ) = 0,1012 b P ( B1 A ) = P ( B2 A ) = P ( B3 A ) = P ( B1 ) P ( A B1 ) P ( A) P ( B2 ) P ( A B2 ) P ( A) P ( B3 ) P ( A B3 ) P ( A) = 0,36 × 0,12 = 0, 427 0,1012 = 0,34 × 0,10 = 0,336 0,1012 = 0,30 × 0, 08 = 0, 237 0,1012 1.23 Gọi Bi là biến cố xạ thủ xét thuộc nhóm thứ i, i=1,2,3,4 Gọi A là biến cố xạ thủ bắn trượt Theo đề bài ta có: P ( B1 ) = , P ( B2 ) = , P ( B3 ) = , P ( B4 ) = 18 18 18 18 P ( A B1 ) = 0, , P ( A B2 ) = 0,3, P ( A B3 ) = 0, , P ( A B4 ) = 0,5 170 (174) Hướng dẫn giải và đáp án bài tập P ( A ) = P ( B1 ) P ( A B1 ) + P ( B2 ) P ( A B2 ) + P ( B3 ) P ( A B3 ) + P ( B4 ) P ( A B4 ) = 57 × 0, + × 0,3 + × 0, + × 0,5 = 18 18 18 18 180 Áp dụng công thức Bayer, ta thu được: P ( B1 A ) = P ( B2 A ) = P ( B1 ) P ( A B1 ) P ( A) × 0, 10 = 18 = , 57 57 180 21 16 10 , P ( B3 A ) = , P ( B4 A ) = 57 57 57 Vậy xạ thủ có khả nhóm thứ hai 1.24 Gọi B1 là biến cố viên đạn thứ trúng mục tiêu, P ( B1 ) = 0, Gọi B2 là biến cố viên đạn thứ hai trúng mục tiêu, P ( B2 ) = 0, Hai biến cố này độc lập Xác suất biến cố có viên đạn thứ trúng mục tiêu: ( ) ( ) ( P ( A ) = P B1 B2 ∪ B2 B1 = P B1 B2 + P B2 B1 ) = 0, × 0, + 0, × 0,3 = 0,54 b P ( B1 A ) = ( ) ( ) P B1 B2 P ( B1 A ) P B1 ⎡⎣ B1 B2 ∪ B2 B1 ⎤⎦ 0, × 0, = = = = 0, 778 P ( A) P ( A) P ( A) 0,54 1.25 Gọi H A và H B là biến cố tín hiệu A và B tương ứng đã phát Ta có P ( H A ) = 0,85; P ( H B ) = 0,15 , {H A , H B } là hệ đầy đủ Gọi luôn A là biến cố thu tín hiệu A P ( A H A ) = 1− = ; P ( A HB ) = 7 a P ( A ) = P ( H A ) P ( A H A ) + P ( H B ) P ( A H B ) = 0,85 × + 0,15 × = 0, 747 b P ( H A A ) = P(HA) P( A HA) P ( A) = 0,975 = 0, 747 0,85 × 171 (175) Hướng dẫn giải và đáp án bài tập 1.26 Gọi A là biến cố sản phẩm kiểm tra có kết luận đạt tiêu chuẩn chất lượng Gọi BT là biến cố sản phẩm đạt tiêu chuẩn chất lượng Gọi BH là biến cố sản phẩm không đạt tiêu chuẩn chất lượng P ( BT ) = 0,85; P ( BH ) = 0,15 Hệ { BT , BH } đầy đủ P ( A BT ) = 0,9; P ( A BH ) = 0,95 ⇒ P ( A BT ) = 0,1; P ( A BH ) = 0, 05 a) P ( A ) = P ( BT ) P ( A BT ) + P ( BH ) P ( A BH ) = 0,85 × 0,9 + 0,15 × 0, 05 = 0, 7725 b) P ( BH A ) = P ( BH ) P ( A BH ) P ( A) = 0,15 × 0, 05 = 0, 0097 0, 7725 c) P ( ABT ∪ ABH ) = P ( ABT ) + P ( ABH ) = 0,85 × 0,9 + 0,15 × 0,95 = 0,9075 ĐÁP ÁN CHƯƠNG II 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 Sai Sai Đúng Sai Sai Đúng Sai Sai Đúng Đúng 2.11 E ( X ) = 0,3; D ( X ) = 15, 21 2.12 x3 = 29,1; p3 = 0, 2.13 E( X ) = 3,1; E( X ) = 3,4 ; D( X ) = 1,09 ; D( X ) = 1,44 E( X + X ) = 6,5 ; D( X + X ) = 2,53 2.14 E ( X ) = 0,8 ; D( X ) = 0,12 2.15 a) D ( Z ) = 61 b) D ( Z ) = 41 2.16 p1 = 0,4 ; p = 0,1; p3 = 0,5 2.17 a) Gọi Ai là biến cố toa i có người ngồi ( i = 1,3 ) Gọi A là biến cố toa có người ngồi Khi đó: A = A1 A2 A3 ⇒ A = A1 + A2 + A3 P ( A) = P ( A1 ) + P ( A ) + P ( A ) − P ( A1 A ) − P ( A1 A ) − P ( A A ) + P ( A1 A A ) = ⇒ P ( A) = 172 150 243 93 243 (176) Hướng dẫn giải và đáp án bài tập b) X P 32 243 80 243 80 243 40 243 10 243 243 Y P 243 10 243 40 243 80 243 80 243 32 243 2.18 E ( X ) = ∞ 2.19 a) ∫ −∞ f ( x)dx = k ∫ xdx + 3k = ⇒ k = ⎧ ⎪ ⎪ x ⎪ F ( x) = ⎨ ⎪ + ( x − 1) ⎪7 ⎪ ⎩ 1 nÕu x ≤ nÕu < x ≤ nÕu < x ≤ nÕu < x 2 47 b EX = ∫ x dx + ∫ xdx = = 2, 238 7 21 EX = 85 x dx + ∫ x dx = ∫ 7 14 2.20 a) Vì 64 ∫ x ( − x ) dx = b) P { X < 1} = ∫ ⇒ k= ⇒ DX = EX − ( EX ) = 937 = 1, 062 882 64 13 x ( − x ) dx = 64 256 x =4 x =0 3 ⎛ x5 ⎞ c) EX = ∫ x ( − x ) dx = ⎜ x − ⎟ 64 64 ⎜⎝ ⎟⎠ ⎛ 16 ⎞ 12 = 3⎜ − ⎟ = 5⎠ ⎝ 173 (177) Hướng dẫn giải và đáp án bài tập x=4 3 ⎛ x5 x ⎞ ⎛ 1 ⎞ 32 − ⎟ = × 64 ⎜ − ⎟ = EX = ∫ x ( − x ) dx = ⎜ 64 64 ⎜⎝ ⎟⎠ ⎝5 6⎠ x =0 2 ⇒ DX = EX − ( EX ) = 32 ⎛ 12 ⎞ 16 −⎜ ⎟ = ⎝5⎠ 25 2.21 a) Kí hiệu Ai là biến cố : ”A bắn trúng i viên”, Bi là biến cố : ”B bắn trúng i viên”; i = 0, Dễ thấy P ( A0 ) = 0,36 ; P ( A1 ) = 0, 48 ; P ( A2 ) = 0,16 ; P ( B0 ) = 0, 25 ; P ( B1 ) = 0,5 ; P ( B2 ) = 0, 25 Từ đó P { X = −2} = P ( A0 ) P ( B2 ) = 0, 09 P { X = −1} = P ( A0 ) P ( B1 ) + P ( A1 ) P ( B2 ) = 0,18 + 0,12 = 0,3 P { X = 0} = P ( A0 ) P ( B0 ) + P ( A1 ) P ( B1 ) + P ( A2 ) P ( B2 ) = 0,37 P { X = 1} = P ( A1 ) P ( B0 ) + P ( A2 ) P ( B1 ) = 0, P { X = 2} = P ( A2 ) P ( B0 ) = 0, 04 Vậy bảng phân bố xác suất X X P −2 0, 09 −1 0,3 0,37 0, 0, 04 EX = ( −2 ) × 0, 09 + ( −1) × 0,3 + × 0,37 + 1× 0, + × 0, 04 = −0, 2 EX = ( −2 ) × 0, 09 + ( −1) × 0,3 + 02 × 0,37 + 12 × 0, + 22 × 0, 04 = 1, 02 2 DX = EX − ( EX ) = 1, 02 − ( −0, ) = 0,98 b) P {Y = 0} = 0,37 P {Y = 1} = P { X = 1} + P { X = −1} = 0,5 P {Y = 2} = P { X = 2} + P { X = −2} = 0,13 EY = × 0, 37 + 1× 0, + × 0,13 = 0, 76 2.22 Kí hiệu Ai là biến cố : ”ô tô thứ i bị hỏng”, i = 1, Dễ thấy P ( A1 ) = 0,1 ; P ( A2 ) = 0, 174 (178) Hướng dẫn giải và đáp án bài tập Gọi X là số ôtô bị hỏng thời gian làm việc ( ) ( ) P { X = 1} = P ( A1 ) P ( A2 ) + P ( A1 ) P ( A2 ) = 0,1× 0,8 + 0,9 × 0, = 0, 26 Từ đó P { X = 0} = P A1 P A2 = 0,9 × 0, = 0, 72 P { X = 2} = P ( A1 ) P ( A2 ) = 0, 02 X P 0, 72 0, 26 0, 02 EX = × 0, 72 + 1× 0, 26 + × 0, 02 = 0, EX = 02 × 0, 72 + 12 × 0, 26 + 22 × 0, 02 = 0,34 2 DX = EX − ( EX ) = 0,34 − ( 0,3) = 0, 25 ∞ 2.23 a) = ∫ −∞ f ( x)dx = k ∫ x dx = 9k ⇒ k = b) P { X > 2} = 19 x dx = ∫ 27 ⎧ nÕu x < ⎪ ⎪x c) Hàm phân bố F ( x) = ⎨ nÕu ≤ x ≤ ⎪ 27 ⎪ nÕu x > ⎩ d) F (α ) = α3 ⇒ = ⇒ α = 2, 726 27 ⎧k > ⎧ pi > ⎧⎪ k > ⎪ ⎪ ⇒ ⎨ ⎡ k = −1 ⇒ k = 1/10 2.24 a) Điều kiện ⎨ p = ⇒ ⎨ ∑ i ⎪⎩ i ⎩⎪10k + 9k = ⎪ ⎢ k = 1/10 ⎩⎣ b) P { X ≥ 5} = c) EX = 1 ; P { X < 3} = + = 10 10 10 10 12 12 1⎞ ⎛ + + + + + + 7⎜ + ⎟ = 3, 66 10 10 10 10 100 100 ⎝ 100 10 ⎠ d) EX = 18 48 25 72 1⎞ ⎛ + + + + + + 49 ⎜ + ⎟ = 16,8 10 10 10 10 100 100 ⎝ 100 10 ⎠ 175 (179) Hướng dẫn giải và đáp án bài tập 2 DX = EX − ( EX ) = 16,8 − ( 3, 66 ) = 3, 404 2.25 a) Gọi X là “số phế phẩm gặp phải”: EX = X P 0, 0, ; DX = 25 Y P b) Gọi Ị là “số chính phẩm gặp phải” ⇒ Y = − X : EY = E ( - X ) = − 0, 0, = ; DY = 5 25 2.26 Gọi X là “số nữ có nhóm chọn” P { X = 0} = P { X = 2} = C63 C10 , 30 = C42C61 = C10 ∞ 2.27 a) = ∫ −∞ C14C62 = C10 15 30 C1C 15 , P { X = 1} = = 30 30 C10 X P EX = × P { X = 1} = / 30 15 / 30 / 30 1/ 30 15 36 + 1× + × + × = = 30 30 30 30 30 f ( x)dx = k ∫ x (1 − x)dx = P {0, < X < 0, 6} = 12 0,6 ∫ k ⇒ k = 12 12 x (1 − x)dx = 0, 296 0,4 b) EX = 12∫ x3 (1 − x)dx = 2.28 Gọi X là biến ngẫu nhiên số rau bán ngày 176 X 1000 2000 3000 P 0,1 0,30 0,45 0,15 (180) Hướng dẫn giải và đáp án bài tập Ta xác định lượng rau bán trung bình ngày: EX = ⋅ 0,1 + 1000 ⋅ 0,3 + 2000 ⋅ 0,45 + 3000 ⋅ 0,15 = 1650 kg/ngày Gọi Y là biến ngẫu nhiên số tiền lãi trung bình ngày Ta thấy ⎧1650 ⋅ 50 − ( X − 1650) ⋅ 20 nÕu X > 1650 Y =⎨ nÕu X ≤ 1650 ⎩ X ⋅ 50 Do đó Y (1000) = 50.000 ; Y ( 2000 ) = 75.500 ; Y (3000 ) = 55.500 Vậy ngày nhập 2000kg rau thì có lãi nhiều ĐÁP ÁN CHƯƠNG III 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 Đúng Sai Sai Sai Sai Đúng Đúng Đúng Sai Sai 3.11 Thắng ván dễ 3.12 a) P = 0,238 b) P = 0,751 3.13 a) X tuân theo quy luật nhị thức B (n ; p) với n = và p = 0,8 b) E X = ; D X = 0,8 c) ModX = ; P{X = 4} = 0,4096 3.14 a) P = 0,9914 b) Số sản phẩm hỏng trung bình là 0,5 c) Số sản phẩm hỏng có khả xảy nhiều là 3.15 Gọi x là số câu hỏi học sinh trả lời đúng Số điểm nhận là x + (10 − x )( −2) = x − 20 a) Anh ta điểm trả lời đúng: x − 20 = ⇒ x = Vậy xác suất để điểm là P = C10 ()() 4 = 0,088 b) Anh ta điểm âm trả lời đúng: x − 20 < ⇒ x = 0,1, 2, Vậy xác suất để điểm âm là P = ∑ C104 ( 15 ) k =0 k () 10−k = 0,879 3.16 Gọi X là số lần thu tín hiệu lần phát độc lập thì X ~ B ( 5; 0, ) a) Xác suất thu tín hiệu lần P { X = 2} = C52 0, 0,33 = 0,132 177 (181) Hướng dẫn giải và đáp án bài tập b) Xác suất thu tín hiệu nhiều lần P { X ≤ 1} = 0, 031 c) Xác suất thu tín hiệu P { X ≥ 1} = − P { X = 0} = − 0, 002 = 0,998 3.17 Gọi X là số lần xạ thủ A bắn trúng bia lần bắn độc lập thì X ~ B ( 5; 0,8) a) Xác suất A bắn trúng bia lần P { X = 2} = C52 0,820, 23 = 0, 051 b) Xác suất A bắn trúng bia nhiều lần P { X ≤ 2} = 0, 058 c) Xác suất A bắn trúng bia P { X ≥ 1} = − P { X = 0} = 0,9996 3.18 Không đúng; P = 0,41 3.19 a) Gọi X là số gọi khoảng thời gian 10 giây thì X có phân bố Poisson tham số λ = 1/ Vậy xác suất có ít gọi khoảng thời gian 10 giây là P { X ≥ 1} = − P { X = 0} = − e −1/ = 0, 2825 b) Gọi Y là số gọi khoảng thời gian phút thì Ị có phân bố Poisson tham số λ = Vậy xác suất có nhiều ba gọi khoảng thời gian phút là P {Y ≤ 3} = 0,151 c) Gọi Z là số gọi khoảng thời gian phút thì Z có phân bố Poisson tham số λ = Xác suất có nhiều gọi khoảng thời gian phút là P {Z ≤ 1} = 0, 406 Vậy xác suất để khoảng thời gian phút liên tiếp phút có nhiều gọi là P {Z ≤ 1} = 0, 4063 = 0, 0067 3.20 Gọi X là số gọi điện thoại đến trạm điện thoại A khoảng thời gian phút thì X có phân bố Poisson tham số λ = 1, a) Xác suất trạm điện thoại A không nhận gọi nào: P { X = 0} = 0, 223 b) Xác suất trạm điện thoại A nhận nhiều gọi: P { X ≤ 2} = 0,809 c) Xác suất trạm điện thoại A nhận ít gọi P { X ≥ 4} = − P { X ≤ 3} = − 0,934 = 0, 066 3.21 P = 0,9 ⎛ 12 − 10 ⎞ ⎛ − 10 ⎞ 3.22 P{8 < X < 12} = Φ⎜ ⎟ − Φ⎜ ⎟ = 0,6826 ⎝ ⎠ ⎝ ⎠ 3.23 P = 0,3 178 (182) Hướng dẫn giải và đáp án bài tập 3.24 a) 95,44%; b) 4,56% 3.25 a) 20,33%; b) P = 0,9983 3.26 E ( X ) = μ ; D( X ) = { } ⎛ε n ⎞ σ2 ⎟ −1 ⇒ P X − μ < ε = 2Φ⎜⎜ ⎟ n σ ⎝ ⎠ ĐÁP ÁN CHƯƠNG IV 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 Sai Đúng Đúng Đúng Sai Sai Sai Đúng Đúng Sai 4.11 X x1 x2 Y y1 y2 y3 P 0,56 0,44 P 0,26 0,38 0,36 4.12 EX = −7 / 15 ; EY = ; cov( X , Y ) = −1 / ; ρ X,Y = −0,15 4.13 EX = −1 / ; EY = ; ρ X,Y = X và Y không độc lập vì P{X = 1} = / 15, P{Y = 1} = / 15 và P{X = Y = 1} = 4.14 Bảng phân bố xác suất biến ngẫu nhiên Z Z P 0,12 0,43 0,03 0,35 0,07 EX = 1,7 ; EY = 1,7 ; EZ = 2,89 4.15 Bảng phân bố xác suất đồng thời X và Y Y 0,04 0,12 0,16 0,06 0,02 0,03 0,09 0,12 0,045 0,015 0,02 0,06 0,08 0,03 0,01 0,01 0,03 0,04 0,015 0,005 X P{X > Y } = 0,19 179 (183) Hướng dẫn giải và đáp án bài tập 4.16 X , Y không độc lập vì P{X = 1} = 0,5, P{Y = 1} = 0,45 và P{X = Y = 1} = 0,15 ≠ 0,5 ⋅ 0,45 P{X = 1Y = 2} = / 11 4.17 X 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 Y P{X = 1} = 0,5, P{Y = 1} = 0,45 và P{X = Y = 1} = 0,15 ≠ 0,5 ⋅ 0,45 4.18 [ Y X = 26 23 27 P 0,357 0,643 X Y = 27 26 30 41 50 P 0,1268 0,4225 0,1549 0,2958 ] 4.19 E Y X = = EX = 2,93 ; EY = 4,5 ; DX = 4,83 ; DY = 2,25 4.20 a α = 15 ; EX = −0, ; EY = b cov ( X , Y ) = ⇒ ρ ( X , Y ) = c X , Y không độc lập vì P { X = 1} = P { X = 1, Y = 1} = , P {Y = 1} = 15 15 ĐÁP ÁN CHƯƠNG V 5.1 5.2 5.3 5.4 5.5 5.6 Đúng Đúng Sai Sai Đúng Đúng 5.7 Gọi X là số máy hỏng ca X có phân bố nhị thức EX = 0,5 , DX = Áp dụng bất đẳng thức Trêbưsép ta có 180 (184) Hướng dẫn giải và đáp án bài tập P { X − 0,05 < 2} ≥ − 0, 475 0, 475 ; = 0,88 P X − 0,05 ≥ ≤ = 0,12 { } 22 22 12 5.8 Đặt S = ∑ X n ; ES = 12 ⋅ 16 = 192 , DS = 12 Theo bất đẳng thức Trêbưsép n=1 P { S − 192 ≤ ε } ≥ − 5.9 Đặt S = DS ε2 ≥ 0,99 Chọn a = 157,36 ; b = 226,64 10000 ∑ X n ; ES = , DS = n =1 P { S ≥ 500} ≤ 10000 Theo bất đẳng thức Trêbưsép 12 DS = 500 300 5.10 Ta biết S là biến ngẫu nhiên có phân bố nhị thức tham số p = DS = n ES = và 6 5n Theo bất đẳng thức Trêbưsép 36 { } P S − ES < n ≥ − DS 31 n ⎧n ⎫ 31 = 1− = ⇔ P⎨ − n < S < + n⎬ ≥ n 36 36 ⎩6 ⎭ 36 12 ⎫⎪ ⎧⎪ 12 5.11 Đặt S = ∑ X n Ta cần tìm M nhỏ để P ⎨∑ X n ≤ M ⎬ ≥ 0,99 ⎪⎭ ⎪⎩n =1 n=1 Ta có ES = 192 , DS = 12 Theo bất đẳng thức Trêbưsép P{S − 192 ≤ ε} ≥ − DS ε2 ≥ 0,99 ⇒ ε = 34,64 Vậy M = 192+34,64 = 226,64 5.12 Thỏa mãn luật số lớn Trêbưsép 5.13 Thỏa mãn luật số lớn Trêbưsép 5.14 Thỏa mãn luật số lớn Trêbưsép 5.15 Áp dụng bất đẳng thức Trêbưsép tính xác suất P ≥ 0,9131 5.16 Áp dụng bất đẳng thức Trêbưsép cần kiểm tra 23.750 chi tiết 181 (185) Hướng dẫn giải và đáp án bài tập ĐÁP ÁN CHƯƠNG VI 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 6.10 Đúng Đúng Sai Đúng Đúng Đúng Đúng Đúng Đúng Sai 6.13 Đặt ui = xi − 26 ⇒ x = u + 26 = 26 ; ⎛ 02 ⎞ s = ⎜1080 − ⎟ = 10,909 99 ⎜⎝ 100 ⎟⎠ 6.14 x = 8, ; s = 2,18 6.15 x = 1111,1 (giờ); s = 37 6.16 Mẫu ngẫu nhiên có kích thước 10: W = ( X , X , , X 10 ) 1⎫ ⎧ P⎨ X = ⎬ = 2⎭ ⎩ ⎧⎪ 10 ⎫⎪ P⎨ ∑ X i = ⎬ = ⎪⎭ ⎪⎩10 i =1 ⎫⎪ ⎧⎪ 10 P ⎨∑ X i = 5⎬ Vì X có phân bố nhị thức nên ⎪⎭ ⎪⎩ i =1 ⎫⎪ ⎧⎪ 10 5 P ⎨∑ X i = 5⎬ = P10 (5) = C10 (0,5) ⋅ (0,5)10−5 = C10 (0,5)10 ⎪⎭ ⎪⎩ i =1 6.17 Ta có EX = p ; DX = p (1 − p ) Do đó E X = p ; D X = p (1 − p ) 10 6.18 X có phân bố chuẩn N (μ; σ ) nên X có phân bố chuẩn N (μ; σ2 ) Vậy n ⎛ε n ⎞ ⎛ −ε n ⎞ ⎛ε n ⎞ P X − μ < ε = P μ −ε < X < μ +ε = Φ⎜ ⎟ − Φ⎜ ⎟ = 2Φ ⎜ ⎟ ⎝ σ ⎠ ⎝ σ ⎠ ⎝ σ ⎠ { } { } Do đó ⎛ 0, 100 ⎞ P X − 20 < 0, = 2Φ ⎜ ⎟ = 2Φ (2) = 0,9545 ⎝ ⎠ { } 6.19 Bảng phân bố tần số 182 X Tần số 2 (186) Hướng dẫn giải và đáp án bài tập Bảng phân bố tần suất X Tần suất 1/5 2/5 1/5 1/5 Hàm phân bố thực nghiệm x ≤1 ⎧0 ⎪1 / < x ≤ ⎪⎪ F10 ( x) = ⎨3 / < x ≤ ⎪4 / < x ≤ ⎪ ⎪⎩1 x>4 x = 6,8 ; s = 1,15 , s = 1,072 6.20 Nhóm 1: x = 51,08 ; s = 220,13 , s = 14,83 Nhóm 2: x = 45,36 ; s = 287 ⇒ s = 16,9 Thời gian trung bình nhóm ít hơn, độ sai lệch lớn ĐÁP ÁN CHƯƠNG VII 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 7.10 Đúng Sai Sai Đúng Đúng Sai Đúng Sai Đúng Đúng 7.13 x = 38; 7.14 f = σ n uβ = 6, 2,575 = 2,331 Khoảng tin cậy [35, 669; 40,331] 50 1082 ; Điều kiện 2000 f − uβ ⎧nf = 1082 > 10 ⎨ ⎩n(1 − f ) = 918 > 10 f (1 − f ) n = 1082 918 × 1082 − 2,33 = 0,515 2000 2000 Vậy tối thiểu có 51,5% số phiếu bầu cho ứng cử viên A 7.15 x = ∑ xi = 34,15 = 0,976 n 35 2⎤ ⎡ 34,15 ) ⎤ ( ⎢ ⎡ ( ∑ xi ) ⎥ ⎢ s = ∑ xi − n ⎥ = 34 ⎢33,8943 − 35 ⎥⎥ = 0, 01687 n −1 ⎢ ⎣ ⎦ ⎣ ⎦ ⇒ s = 0,1299; uβ s 0,1299 = 1,96 × = 0, 043 n 35 183 (187) Hướng dẫn giải và đáp án bài tập Khoảng tin cậy 95%: [ 0,933 ; 1, 019] 53 , điều kiện 400 7.16 Tần suất mẫu f = ⎧nf = 53 > 10 ⎨ ⎩n(1 − f ) = 347 > 10 Gọi p là xác suất bắt cá có đánh dấu, khoảng tin cậy 95% p : f (1 − f ) uβ n = 1,96 53 × 347 = 0, 0332 400 400 Khoảng ước lượng [ 0, 0993 ; 0,1657] Mặt khác p = 2000 , đó N là số cá hồ N Vậy 0, 0993 < 2000 < 0,1657 N 2000 2000 <N< ⇒ 12070 < N < 20141 0,1657 0, 0993 ⇒ 7.17 Khoảng tin cậy 95% hao phí nguyên liệu trung bình cho đơn vị sản phẩm là σ σ ⎤ ⎡ ; x + uβ ⎢ x − uβ ⎥ , đó uβ = 1,96 là phân vị mức 0,975 phân bố chuẩn tắc n n⎦ ⎣ N(0;1) Theo mẫu ta tính x = 19,87 ; σ = 0, 03 ⇒ uβ Khoảng tin cậy σ 0, 03 = 1,96 = 0, 0098 n 36 [ 19,8602 ; 19,8798 ] x − 18, 25 ∑ ui + 18, 25 = −1,8 + 18, 25 = 18, 025 7.18 Đặt ui = i ⇒ x =5 40 n 2⎤ ⎡ ⎡ ( −1,8)2 ⎤⎥ = 0, 435 52 ⎢ ( ∑ ui ) ⎥ 25 ⎢ − = − 0, 76 s = u ∑i ⎥ 39 ⎢ 40 ⎥ n −1 ⎢ n ⎣ ⎦ ⎣ ⎦ ⇒ s = 0, 66; uβ s 0, 66 = 1, 64 × = 0,171 n 40 a) Khoảng tin cậy 90%: [17,854; 18,196] b) Kích thược mẫu cần thiết n ≥ 184 u 2β s2 ε2 = 116,99 chọn n = 117 (188) Hướng dẫn giải và đáp án bài tập x − 47 ∑ ui + 47 = −47 + 47 = 46, 06 7.19 Đặt ui = i ⇒ x =2 100 n 2⎤ ⎡ −47 ) ⎤ ( 22 ⎢ ⎡ ( ∑ ui ) ⎥ s = ∑ ui − n ⎥ = 99 ⎢⎢175 − 100 ⎥⎥ = 6,178 n −1 ⎢ ⎣ ⎦ ⎣ ⎦ s 2, 486 = 1,96 × = 0, 487 n 100 ⇒ s = 2, 486; uβ a) Khoảng tin cậy 95%: [ 45,573; 46,547 ] b) Kích thược mẫu cần thiết n ≥ 7.20 Đặt ui uβ = xi − 50 ⇒ x = ∑ ui n u 2β s2 ε2 = 148,33 chọn n = 149 −8 + 50 = 49, 704 27 + 50 = σ = 1,96 × = 0,377 n 27 a) Khoảng tin cậy 95%: [ 49,327 ; 50, 081] b) Kích thược mẫu cần thiết n ≥ u 2β σ ε2 = 384,16 chọn n = 385 x − 119 ∑ ui + 119 = −19 + 119 = 118, 62 7.21 Đặt ui = i ⇒ x =2 100 n 2⎤ ⎡ ( −19 )2 ⎤⎥ = 15,9752 22 ⎢ ⎡ ( ∑ ui ) ⎥ ⎢ − = − 399 s = u ∑i ⎥ 99 ⎢ 100 ⎥ n −1 ⎢ n ⎣ ⎦ ⎣ ⎦ ⇒ s = 3,9969; uβ s 3,9969 = 1,96 × = 0, 783 n 100 a) Khoảng tin cậy 95%: [117,837 ; 119, 403] b) Kích thược mẫu cần thiết n ≥ 7.22 a) Tần suất mẫu f = u 2β s2 ε2 = 245, 48 chọn n = 246 16 = 0, 04 , điều kiện 400 ⎧nf = 16 > 10 ⎨ ⎩n(1 − f ) = 384 > 10 185 (189) Hướng dẫn giải và đáp án bài tập Gọi p là xác suất phế phẩm lô hàng, khoảng tin cậy 95% p : uβ f (1 − f ) n = 1,96 16 × 384 = 0, 0192 400 400 Khoảng ước lượng [ 0, 0208 ; 0, 0592] Vậy tỷ lệ phế phẩm tối đa lô hàng là 5, 9% 7.23 x = × uβ ⎛ 142 ⎞ -14 + 91 = 90 , 72 ; s = × ⎜ 432 − ⎟ = 17,375 ⇒ s = 4,168 99 ⎜⎝ 100 ⎟⎠ 100 S = 0,817 Vậy khoảng tin cậy 95% giá trung bình loại hàng hoá trên là n [89,903 ; 91,537] 7.24 Khoảng tin cậy 95% phương sai tính theo công thức (7.22) ⎛ nS ⎞ nS ⎜ ⎟ ; ⎜ χα2 / (n) χ12−α / (n) ⎟ ⎝ ⎠ Tra bảng χ với 15 bậc tự và với giả thiết Sˆ = 0,5 ta tìm khoảng tin cậy: ⎛ 25 ⋅ 0,5 25 ⋅ 0,5 ⎞ ; ⎜ ⎟ = (0,3075 ; 0,9520) ⎝ 40,646 13,120 ⎠ ĐÁP ÁN CHƯƠNG VIII 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9 8.10 Sai Sai Đúng Đúng Sai Đúng Sai Đúng Sai Sai 8.11 Gọi μ là trọng lượng trung bình bao sản phẩm đóng gói Ta kiểm định giả thiết H : μ = 100 ; đối thiết H1 : μ < 100 Tiêu chuẩn kiểm định T = x − 99, 25 Đặt ui = i 186 ⇒ (100 − X ) S n ; Miền bác bỏ Wα = {T > 2,086} ∑ riui = 0, ; ∑ riui = 0, 42 (190) Hướng dẫn giải và đáp án bài tập ⇒ x = 5× Tqs = 0, + 99, 25 = 99,319 ; 29 s = 25 × ⎡ 0, 42 ⎤ 0, 42 − ⎢ ⎥ = 0,37 ⇒ s = 0, 608 28 ⎢⎣ 29 ⎥⎦ (100 − 99,319) 29 = 6,032 ∈ Wα 0,608 Vậy bác bỏ H chấp nhận H1 , nghĩa là sản phẩm bị đóng thiếu 8.12 Gọi μ là thời gian trung bình hoàn thành sản phẩm Ta kiểm định giả thiết H : μ = 14 Tiêu chuẩn kiểm định T = x − 15 Đặt ui = i ⇒ x = 15 ; ⇒ Tqs = ⇒ s2 = × ( X − 14 ) ; đối thiết H1 : μ ≠ 14 n S ; Miền bác bỏ Wα = {T > 1,96} ∑ riui = ; ∑ riui = 300 ⎡ ⎤ 300 − = 4,819 ⇒ s = 2,195 ⎢ 249 ⎣ 300 ⎥⎦ (115 − 14) 300 = 7,89 ∈ Wα 2,195 Vậy bác bỏ H chấp nhận H1 , nghĩa là cần thay đổi định mức 8.13 Gọi μ là mức hao phí xăng trung bình ôtô chạy từ A đến B Ta kiểm định giả thiết H : μ = 50 ; đối thiết H1 : μ < 50 Tiêu chuẩn kiểm định T = Theo mẫu ta có x = s2 = ( 50 − X ) S n ; Miền bác bỏ Wα = {T > 2,052} 1387,5 = 49,5536; 28 ⎛ 1387,52 ⎞ 8,1696 = 0,3026 ⇒ s = 0,55 ⎜⎜ 6876375 − ⎟= 27 ⎝ 28 ⎟⎠ 27 Tqs = (50 − 49,53) 30 = 4,2948 ∈ Wα 0,55 Vậy bác bỏ H chấp nhận H1 , nghĩa là mức hao phí xăng có giảm xuống 187 (191) Hướng dẫn giải và đáp án bài tập 8.14 Gọi μ là trọng lượng đóng bao trung bình sản phẩm nhà máy Ta kiểm định giả thiết H : μ = 20 ; đối thiết H1 : μ ≠ 20 Tiêu chuẩn kiểm định T = ( X − 20 ) σ Theo mẫu ta có x = u + 20 = Tqs = n ; Miền bác bỏ Wα = {T > 1,96} + 20 = 20, 05 100 (20,05 − 20) 100 = 0,25 ∉ Wα Vậy chưa có sở để bác bỏ H 8.15 Gọi μ là số hoá đơn trung bình hệ thống máy tính xử lý Ta kiểm định giả thiết H : μ = 1300 ; đối thiết H1 : μ > 1300 Tiêu chuẩn kiểm định T = Từ mẫu cụ thể ta có T = ( X − 1300 ) n S (1378 − 1300 ) ; Miền bác bỏ Wα = {T > 1,96} 40 215 = 2, 294 > 1,96 Vậy bác bỏ H chấp nhận H1 , nghĩa là hệ thống máy tính xử lý tốt 8.16 Gọi p là tỉ lệ phế phẩm nhà máy sản xuất Ta kiểm định giả thiết H : p = 0, 05 ; đối thiết H1 : p > 0, 05 Tiêu chuẩn kiểm định T = ( f − 0, 05) n 0, 05 (1 − 0, 05 ) Miền bác bỏ Wα = {T > 1,64} ⎧nf = 24 > Từ mẫu cụ thể ta có f = 0, 08 thoả mãn điều kiện ⎨ ⎩n(1 − f ) = 276 > Tqs = (0,08 − 0,05) 300 0,05(1 − 0,05) = 2,384 ∈ Wα Vậy bác bỏ H chấp nhận H1 , nghĩa là tỉ lệ phế phẩm nhà máy có xu hướng tăng lên 8.17 Ta kiểm định giả thiết H0: σ = σ 02 = ; đối thiết H1: σ > Tiêu chuẩn kiểm định T = 188 (n − 1) S σ 02 ~ χ (n − 1) ; Miền bác bỏ Wα = {T > 49,6} (192) Hướng dẫn giải và đáp án bài tập Từ mẫu cụ thể ta có Tqs = 35,09 ∉ Wα Vậy chưa có sở để bác bỏ H 8.18 Ta kiểm định giả thiết H0: μ1 = μ ; đối thiết H1: μ1 ≠ μ Tiêu chuẩn kiểm định T = X −Y S X2 n + SY2 ~ N (0;1) ; Miền bác bỏ Wα = {T > 1,96} m Từ mẫu cụ thể ta có Tqs ∉Wα Vậy chưa có sở để bác bỏ H 8.19 Ta kiểm định giả thiết H0: μ1 = μ ; đối thiết H1: μ1 > μ Tiêu chuẩn kiểm định T = X −Y S X2 SY2 + n m ~ N (0;1) ; Miền bác bỏ Wα = {T > 1,64} Từ mẫu cụ thể ta có Tqs ∈Wα Vậy bác bỏ H chấp nhận H1 8.20 Gọi X là thời gian hoàn thành sản phẩm công nhân A, Y là thời gian hoàn thành sản phẩm công nhân B X ~ N (μ1 , σ12 ) ; Y ~ N (μ , σ 22 ) Ta kiểm định giả thiết H0: μ1 = μ ; đối thiết H1: μ1 < μ Tiêu chuẩn kiểm định T = X1 − X S12 n1 C= S12 n1 S12 S 22 + n1 n2 + S 22 ; k= ( n1 − 1)( n2 − 1) (n2 − 1)C + ( n1 − 1)(1 − C ) ; n2 T có phân bố Student k bậc tự Miền bác bỏ Wα = { − T > Tα (k )} Từ mẫu cụ thể ta có Tqs ∉Wα Vậy chưa có sở để bác bỏ H 8.21 Gọi X là biến ngẫu nhiên số trai gia đình Kiểm định giả thiết luật phân bố xác suất, giả thiết H0: X tuân theo luật nhị thức, đối thiết H1: X không tuân theo luật nhị thức Giả sử X là biến ngẫu nhiên nhị thức với n = và p = 0,5 Ta có bảng phân bố lý thuyết X P 0.125 0.375 0.375 0.125 189 (193) Hướng dẫn giải và đáp án bài tập Từ bảng điều tra 4000 gia đình ta có (ni − npi ) npi X ni pi npi (ni − npi ) 450 0,125 500 2500 1460 0,375 1500 1600 1,06 1530 0,375 1500 900 0,6 560 0,125 500 3600 7,2 ∑ = 13,86 n = 4000 { } (ni − npi ) Miền bác bỏ Wα = T > χ α2 (k − r − 1) Ở đây np i i =0 Tiêu chuẩn kiểm định T = ∑ k = , r = 1; α = 0,05 Tra bảng ta Wα = {T > 6} Từ mẫu cụ thể ta có Tqs = 13,36 ∈ Wα Vậy bác bỏ H chấp nhận H1 { } (ni − npi ) Miền bác bỏ Wα = T > χ α2 (k − r − 1) Ở đây npi i =0 8.22 Tiêu chuẩn kiểm định T = ∑ k = , r = 1; α = 0,05 Tra bảng ta Wα = {T > 6} Từ mẫu cụ thể ta có Tqs = 0,318 ∉ Wα Chưa có sở để bác bỏ H Vậy số phụ nữ 25 tuổi tuân theo quy luật Poisson 8.23 Ta kiểm định giả thiết H0: “ X có phân bố chuẩn”, đối thiết H1: “ X không có phân bố chuẩn” Từ mẫu ta có ước lượng x = 1,26 , s = 0,490 Ta ϕ(u ) = tính 2π e − xác u2 suất xấp xỉ pi ≈ h ⎛⎜ xi − X ϕ S ⎜⎝ S ⎞ ⎟ ; h = xi − xi −1 = 0,2 ; ⎟ ⎠ đó (xem phụ lục I) { } (ni − npi ) Miền bác bỏ Wα = T > χ α2 (k − r − 1) Ở đây npi i =1 10 Tiêu chuẩn kiểm định T = ∑ k = 10 , r = ; α = 0,05 Tra bảng ta Wα = {T > 15,507} Từ mẫu cụ thể ta có Tqs = 12,425 ∉ Wα Chưa có sở để bác bỏ H Vậy có thể xem X tuân theo quy luật phân bố chuẩn 190 (194) Hướng dẫn giải và đáp án bài tập ⎛ h k ⎞ nij2 ⎜ 8.24 Tiêu chuẩn kiểm định T = n ∑∑ − 1⎟ ⎜ ⎟ n ⋅n ⎝ i =1 j =1 i∗ ∗ j ⎠ { } Miền bác bỏ Wα = T > χ α2 (h − 1)(k − 1) k = 2, h = 2, α = 0,01 ⇒ χ α2 (h − 1)(k − 1) = 6,6 Từ mẫu cụ thể trên ta có Tqs = 1,2 ∉ Wα Chưa có sở để bác bỏ H Vậy thành phần thức ăn bố mẹ không ảnh hưởng đến giới tính cái 191 (195) Phụ lục PHỤ LỤC PHỤ LỤC I: GIÁ TRỊ HÀM MẬT ĐỘ ϕ( x) = 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 192 0,3989 3970 3910 3814 3683 3521 3332 3123 2897 2661 0,2420 2179 1942 1714 1497 1295 1109 0940 0790 0656 0,0540 0440 0355 0283 0224 0175 0136 0104 0079 0060 0,0044 0033 0024 0017 0012 0009 0005 0004 0003 0002 3989 3965 3902 3802 3668 3503 3312 3101 2874 2637 2396 2155 1919 1691 1476 1276 1092 0925 0775 0644 0529 0431 0347 0277 0219 0171 0132 0101 0077 0058 0043 0032 0023 0017 0012 0008 0005 0004 0003 0002 3989 3961 3894 3790 3653 3485 3292 3079 2850 2613 2370 2131 1895 1669 1456 1257 1074 0909 0761 0632 0519 0422 0339 0270 0213 0167 0129 0099 0075 0056 0042 0031 0022 0016 0012 0008 0005 0004 0003 0002 3988 3956 3885 3778 3637 3467 3271 3056 2827 2589 2347 2107 1872 1647 1435 1238 1057 0893 0748 0620 0508 0413 0332 0264 0208 0163 0126 0096 0073 0055 0040 0030 0022 0016 0011 00080 0005 0004 0003 0002 3986 3951 3876 3765 3621 3448 3251 3034 2803 2565 2320 2083 1849 1626 1415 1219 1040 0878 0734 0608 0498 0404 0325 0258 0203 0158 0122 0093 0071 0053 0039 0029 0021 0015 0011 0008 0005 0004 0003 0002 3984 3945 3867 3752 3605 3429 3230 3011 2780 2541 2299 2059 1826 1604 1394 1200 1023 0863 0721 0596 0488 0396 0317 0252 0198 0154 0119 0091 0069 0051 0038 0028 0020 0015 0010 0007 0005 0004 0002 0002 2π e − 3982 3939 3857 3739 3589 3410 3209 2989 2756 2516 2275 2036 1804 1582 1374 1182 1006 0848 0707 0584 0478 0387 0310 0246 0194 0151 0116 0088 0067 0050 0037 0027 0020 0014 0010 0007 0005 0003 0002 0002 x2 3980 3932 3847 3726 3572 3391 3187 2966 2732 2492 2251 2012 1781 1561 1354 1163 0989 0833 0694 0573 0468 0379 0303 0241 0189 0147 0113 0086 000065 0048 0036 0026 0019 0014 0010 0007 0005 0003 0002 0002 3977 3925 3836 3712 3555 3372 3166 2943 2709 2468 2227 1989 1758 1539 1334 1145 0973 0818 0681 0562 0459 0371 0297 0235 0184 0143 0110 0084 0063 0047 0035 0025 0018 0013 0009 0007 0005 0003 0002 0001 3973 3918 3825 3697 3538 3352 3144 2920 2685 2444 2203 1965 1736 1518 1315 1127 0957 0804 0669 0551 0449 0363 0290 0229 0180 0139 0107 0081 0061 0046 0034 0025 0018 0013 0009 0006 0004 0003 0002 0001 (196) Phụ lục PHỤ LỤC II: GIÁ TRỊ HÀM PHÂN BỐ CHUẨN TẮC Φ (t ) = t ∫e − 2π −∞ x2 dx 2π Φ (t ) −a x t O t 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 0,5000 5398 5793 6179 6554 0,6915 7257 7580 7881 8159 0,8413 8643 8849 9032 9192 0,9332 9452 9554 9641 9712 0,9773 9821 9861 9893 9918 0,9938 9953 9965 9974 9981 5040 5438 5832 6217 6591 6950 7291 7611 7910 8186 8438 8665 8869 9049 9207 9345 9463 9564 9649 9719 9778 9826 9864 9896 9920 9940 9955 9966 9975 9982 5080 5478 5871 6255 6628 6985 7324 7642 7939 8212 8461 8686 8888 9066 9222 9357 9474 9573 9656 9726 9783 9830 9868 9898 9922 9941 9956 9967 9976 9982 5120 5517 5910 6293 6664 7019 7357 7673 7967 8238 8485 8708 8907 9082 9236 9370 9484 9582 9664 9732 9788 9834 9871 9901 9925 9943 9957 9968 9977 9983 5160 5557 5948 6331 6700 7054 7389 7703 7995 8264 8508 8729 8925 9099 9251 9382 9495 9591 9671 9738 9793 9838 9875 9904 9927 9945 9959 9969 9977 9984 5199 5596 5987 6368 6736 7088 7422 7734 8023 8289 8531 8749 8944 9115 9265 9394 9505 9599 9678 9744 9798 9842 9878 9906 9929 9946 9960 9970 9978 9984 5239 5636 6026 6406 6772 7123 7454 7764 8051 8315 8554 8770 8962 9131 9279 9406 9515 9608 9686 9750 9803 9846 9881 9909 9931 9948 9961 9971 9979 9985 5279 5675 6064 6443 6808 7156 7486 7794 8078 8340 8577 8790 8980 9147 9292 9418 9525 9616 9693 9756 9808 9850 9884 9911 9932 9949 9962 9972 9979 9985 5319 5714 6103 6480 6844 7190 7517 7823 8106 8365 8599 8810 8997 9162 9306 9429 9535 9625 9699 9761 9812 9854 9887 9913 9934 9951 9963 9973 9980 9986 5359 5753 6141 6517 6879 7224 7549 7852 8132 8389 8621 8830 9015 9177 9319 9441 9545 9633 9706 9767 9817 9857 9890 9916 9936 9952 9964 9974 9981 9986 t 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 Φ(t ) 0,9987 9990 9993 9995 9996 9997 9998 9999 9999 9999 193 (197) Phụ lục PHỤ LỤC III: GIÁ TRỊ TỚI HẠN CỦA PHÂN BỐ STUDENT f (t ) α O 194 tα (n) Bậc tự α = 0,05 α = 0,025 α = 0,01 α = 0,005 α = 0,001 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 inf 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,796 1,703 1,701 1,699 1,645 12,706 4,303 3,128 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 1,960 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,606 2,583 2,567 2,552 2,539 2,58 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,326 63,657 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,576 318,309 22,327 10,215 7,173 5,893 5,208 4,705 4,501 4,297 4,144 4,025 3,930 3,852 3,787 3,733 3,686 3,646 3,610 3,579 3,552 3,527 3,505 3,485 3,467 3,450 3,435 3,421 3,408 3,396 3,090 (198) Phụ lục PHỤ LỤC IV: GIÁ TRỊ TỚI HẠN CỦA PHÂN BỐ KHI BÌNH PHƯƠNG χ2 y α χ α2 (n) O Bậc tự χ 02,995 χ 02,99 χ 02,97 χ 02,95 χ 02,05 χ 02,025 χ 02,01 χ 02,005 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0,000 0,010 0,072 0,207 0,412 0,676 0,989 1,344 1,735 2,156 2,603 3,074 3,565 4,075 5,001 5,142 5,697 6,265 6,844 7,343 8,034 8,543 9,260 9,886 10,520 11,160 11,808 12,461 13,121 13,787 0,000 0,020 0,115 0,297 0,554 0,872 1,239 1,646 2,088 2,558 3,053 3,571 4,107 4,660 5,229 5,812 6,408 7,015 7,633 8,260 8,897 9,542 10,196 10,856 11,524 12,198 12,879 13,565 14,256 14,930 0,001 0,051 0,216 0,484 0,831 1,237 1,690 2,180 2,700 3,247 3,816 4,404 5,009 5,629 6,262 6,908 7,564 8,231 8,907 9,591 10,283 10,982 11,689 12,401 13,120 13,844 14,573 15,308 16,047 16,791 0,004 0,103 0,352 0,711 1,145 1,635 2,167 2,733 3,325 3,940 4,575 5,226 5,982 6,571 7,261 7,962 8,672 9,390 10,117 10,851 11,591 12,388 13,091 13,848 14,611 15,379 16,151 16,928 17,708 18,493 3,841 5,991 7,815 9,488 11,070 12,592 14,067 15,507 16,919 18,307 19,675 21,026 22,362 23,685 24,996 26,296 27,587 28,869 30,144 31,410 32,671 33,924 35,172 36,415 37,625 38,885 40,113 41,337 42,557 43,773 5,024 7,378 9,348 11,143 12,832 14,449 16,013 17,535 19,023 20,483 21,920 23,337 24,736 26,119 27,488 28,845 30,191 31,524 32,852 34,170 35,479 36,781 38,076 39,364 40,646 41,923 43,194 44,461 45,722 46,979 6,635 9,210 11,345 13,277 15,086 16,812 18,475 20,090 21,666 23,209 24,725 26,217 27,688 29,141 30,578 32,000 33,409 34,805 36,191 37,566 38,932 30,289 41,638 42,980 44,314 45,642 46,993 48,278 49,588 50,892 7,879 10,597 12,838 14,860 16,750 18,548 20,278 21,955 23,589 25,188 26,757 28,300 28,819 31,319 32,801 34,267 35,718 37,156 38,582 39,997 41,401 42,796 44,181 45,558 46,928 48,290 46,645 50,993 52,336 53,672 195 (199) Phụ lục PHỤ LỤC Va: GIÁ TRỊ TỚI HẠN CỦA PHÂN BỐ FISHER F (n1 , n2 ) MỨC α = 0,05 y α O Bậc tự n2 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 30 40 60 120 ∞ 196 f α (n1 , n2 ) Bậc tự n1 161 18.5 10,1 7,71 6,61 5,99 5,59 5,32 5,12 4,96 4,84 4,75 4,67 4,60 4,54 4,49 4,45 4,41 4,38 4,35 4,32 4,30 4,28 4,26 4,24 4,17 4,08 4,00 3,92 3,84 200 19,0 9,55 6,94 5,79 5,74 4,74 4,46 4,26 4,10 3,98 3,89 3,81 3,74 3,68 3,63 3,69 3,55 3,52 3,19 3,47 3,44 3,42 3,40 3,39 3,32 3,23 3,15 3,07 3,00 216 19,2 9,28 6,59 5,41 4,76 4,35 4,07 3,86 3,71 3,59 3,49 3,41 3,34 3,29 3,24 3,20 3,16 3,13 3,10 3,07 3,05 3,03 3,01 2,99 2,92 2,86 2,76 26,8 2,60 225 19,2 9,12 6,39 5,19 4,53 4,12 3,84 3,63 3,84 3,36 3,26 3,18 3,11 3,06 3,01 2,96 2,93 2,90 2,87 2,84 2,82 2,80 2,78 2,76 2,69 2,61 2,53 2,45 2,37 230 19,3 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3,33 3,20 3,11 3,03 2,96 2,90 2,85 2,81 2,77 2,74 2,71 2,68 2,66 2,64 2,62 2,60 2,53 2,45 2,37 2,29 2,21 234 19,3 8,94 6,16 4,95 4,28 3,87 3,58 3,37 3,22 3,09 3,00 2,92 2,85 2,79 2,74 2,70 2,66 2,63 2,60 2,57 2,55 2,53 2,51 2,49 2,42 2,34 2,25 2,18 2,10 237 19,4 8,89 6,09 4,88 4,21 3,79 3,50 3,29 3,14 3,01 2,91 2,83 2,76 2,71 2,66 2,61 2,58 2,54 2,51 2,49 2,46 2,44 2,42 2,40 2,33 2,25 2,17 2,09 2,01 239 19,4 8,85 6,04 4,82 4,15 3,73 3,44 3,23 3,07 2,95 2,85 2,77 2,70 2,64 2,59 2,55 2,81 2,48 2,45 2,42 2,40 2,37 2,36 2,34 2,27 2,18 2,10 2,02 1,94 241 19,4 8,81 6,00 4,77 4,10 3,68 3,39 3,18 3,02 2,90 2,80 2,71 2,65 2,59 2,54 2,49 2,46 2,42 2,39 2,37 2,34 2,32 2,30 2,28 2,21 2,12 2,04 1,96 1,88 10 242 19,4 8,79 5,96 4,74 4,06 3,64 3,32 3,14 2,98 2,85 2,75 2,67 2,60 2,54 2,49 2,45 2,41 2,38 2,35 2,32 2,30 2,27 2,25 2,24 2,16 2,08 1,99 1,91 1,83 (200) Phụ lục PHỤ LỤC Vb: GIÁ TRỊ TỚI HẠN CỦA PHÂN BỐ FISHER F (n1 , n2 ) MỨC α = 0,05 α O Bậc tự n2 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 30 40 60 120 ∞ f α (n1 , n2 ) Bậc tự n1 12 15 20 24 30 40 60 120 ∞ 244 19,4 8,74 5,91 4,68 4,00 3,57 3,28 3,07 2,91 2,79 2,69 2,60 2,53 2,48 2,42 2,38 2,34 2,31 2,28 2,25 2,23 2,20 2,18 2,15 2,09 2,00 1,92 1,83 1,75 246 19,4 8,70 5,86 4,62 3,94 3,51 3,22 3,01 2,85 2,72 2,62 2,53 2,46 2,40 2,35 2,31 2,27 2,23 2,20 2,18 2,15 2,13 2,11 2,09 2,01 1,92 1,84 1,75 1,67 248 19,4 8,66 5,80 4,56 3,87 3,44 3,15 2,94 2,77 2,65 2,54 2,46 2,39 2,33 2,28 2,23 2,19 2,16 2,12 2,10 2,07 2,05 2,03 2,01 1,93 1,84 1,75 1,66 1,57 249 19,5 8,64 5,77 4,53 3,84 3,41 3,12 2,90 2,74 2,61 2,51 2,42 2,35 2,29 2,24 2,19 2,15 2,11 2,08 2,05 2,03 2,01 1,98 1,96 1,89 1,79 1,70 1,61 1,52 250 19,5 8,62 5,75 4,50 3,81 3,38 3,08 2,86 2,70 2,57 2,47 2,38 2,31 2,25 2,19 2,15 2,11 2,07 2,04 2,01 1,98 1,96 1,94 1,92 1,84 1,74 1,65 1,55 1,46 251 19,5 8,59 5,72 4,46 3,77 3,34 3,04 2,83 2,66 2,53 2,43 2,34 2,27 2,20 2,15 2,10 2,06 2,03 1,99 1,96 1,94 1,91 1,89 1,78 1,79 1,69 1,59 1,59 1,39 252 19,5 8,57 5,69 4,43 3,74 3,30 3,01 2,79 2,62 2,49 2,38 2,30 2,22 2,16 2,11 2,06 2,02 1,98 1,95 1,74 1,64 1,53 1,43 1,32 2,53 29,5 8,55 5,66 4,40 3,70 3,27 2,97 2,75 2,58 2,45 2,34 2,25 2,18 2,11 2,06 2,01 1,79 1,73 1,90 1,87 1,84 1,81 1,79 1,77 1,68 1,58 1,47 1,35 1,22 2,54 19,5 8,53 5,63 4,37 3,67 3,23 2,93 2,71 2,54 2,40 2,30 2,21 2,13 2,07 2,40 2,30 2,21 2,13 2,07 2,01 1,96 1,92 1,88 1,84 1,81 1,78 1,76 1,73 1,71 1,62 1,51 1,39 1,25 1,00 197 (201) Phụ lục PHỤ LỤC Vc: GIÁ TRỊ TỚI HẠN CỦA PHÂN BỐ FISHER F (n1 , n2 ) MỨC α = 0,01 α O Bậc tự n2 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 30 40 60 120 ∞ 198 f α (n1 , n2 ) Bậc tự n1 4,052 98,5 34,1 21,2 16,3 13,7 12,2 11,3 10,6 10,0 9,65 9,33 9,07 8,86 8,68 8,53 8,40 8,29 8,19 8,10 8,02 7,95 7,88 7,82 7,77 7,56 7,31 7,08 6,85 6,63 5,000 99,0 30,8 18,0 13,3 10,9 9,55 8,65 8,02 7,56 7,21 6,93 6,70 6,51 6,36 5,23 6,71 6,01 5,93 5,85 5,78 5,72 5,66 5,61 5,57 5,39 5,18 4,98 4,79 4,61 5,403 99,2 29,5 16,7 12,1 9,78 8,45 7,59 6,99 6,55 6,22 5,95 5,74 5,56 5,42 5,29 5,19 5,09 5,01 4,94 4,87 4,82 4,76 4,72 4,68 4,51 4,31 4,13 3,95 3,78 5,625 99,2 28,7 16,0 11,4 9,15 7,85 7,01 6,42 5,99 5,67 5,41 5,21 5,04 4,89 4,77 4,67 4,58 4,50 4,43 4,37 4,31 4,26 4,22 4,78 4,02 3,83 3,65 3,48 3,32 5,764 99,3 28,2 15,5 11,0 8,75 7,46 6,63 6,06 5,64 5,32 5,06 4,86 4,70 4,56 4,44 4,34 4,25 4,17 4,10 4,04 3,99 3,94 3,90 3,86 3,70 3,51 3,34 3,17 3,02 5,859 99,3 27,9 15,2 10,7 8,47 7,19 6,37 5,80 5,39 5,07 4,82 4,62 4,46 4,32 4,20 4,10 4,01 3,94 3,87 3,81 3,76 3,71 3,67 3,63 3,47 3,29 3,12 2,96 2,80 5,928 99,4 27,7 15,0 10,5 8,26 6,99 6,18 5,61 5,20 4,89 4,64 4,44 4,28 4,14 4,03 3,93 3,84 3,77 3,70 3,64 3,59 3,54 3,50 3,46 3,30 3,12 2,95 2,79 2,64 5,982 99,4 27,5 14,8 10,3 8,10 6,84 6,03 5,47 5,06 4,74 4,50 4,30 4,14 4,00 3,89 3,79 3,71 3,63 3,56 3,51 3,45 3,41 3,36 3,32 3,17 2,99 2,82 2,66 2,51 6,023 99,4 27,3 14,7 10,2 7,98 6,72 5,91 5,35 4,94 4,63 4,39 4,19 4,03 3,89 3,78 3,68 3,60 3,52 3,46 3,40 3,34 3,30 3,26 3,22 3,07 2,89 2,72 2,56 2,41 10 6,056 99,4 27,2 14,5 10,1 7,87 6,62 5,81 5,26 4,85 4,54 4,30 4,10 3,94 3,80 3,69 3,59 3,51 3,43 3,37 3,31 3,26 3,21 3,17 3,13 2,98 2,80 2,63 2,47 2,32 (202) Phụ lục PHỤ LỤC Vd: GIÁ TRỊ TỚI HẠN CỦA PHÂN BỐ FISHER F (n1 , n2 ) MỨC α = 0,01 α f α (n1 , n2 ) Bậc tự n2 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 30 40 60 120 ∞ Bậc tự n1 12 15 20 24 30 40 60 120 ∞ 6,106 99,4 27,1 14,4 9,89 7,72 6,47 5,67 5,11 4,71 4,40 4,16 3,96 3,80 3,67 3,55 3,46 3,37 3,30 3,23 3,17 3,12 3.07 3,03 2,99 2,84 2,66 2,50 2,34 2,18 6,157 99,4 26,9 14,2 9,72 7,56 6,31 5,52 4,96 4,56 4,25 4,01 3,82 3,66 3,52 3,41 3,31 3,23 3,15 3,09 3,03 2,98 2.93 2,89 2,85 2,70 2,52 2,35 2,10 2,04 6,209 99,4 26,7 14,2 9,55 7,40 6,16 5,36 4,81 4,41 4,10 3,86 3,66 3,51 3,37 3,26 3,16 3,08 3,00 2,94 2,88 2,83 2.78 2,74 2,70 2,55 2,37 2,20 2,03 1,88 6,235 99,5 26,6 13,9 9,47 7,31 6,07 5,28 4,73 4,33 4,02 3,78 3,59 3,43 3,29 3,18 3,08 3,00 2,92 2,86 2,80 2,75 2.70 2,66 2,62 2,47 2,29 2,12 1,95 1,79 6,261 99,5 26,5 13,8 9,38 7,23 5,99 5,20 4,65 4,25 3,94 3,70 3,51 3,35 3,21 3,10 3,00 2,92 2,84 2,78 2,72 2,67 2,62 2,58 2,53 2,39 2,20 2,03 1,86 1,70 6,287 99,5 26,4 13,7 9,29 7,14 5,91 5,12 4,57 4,17 3,86 3,62 3,43 3,27 3,13 3,02 2,92 2,84 2,76 2,69 2,64 2,58 2,54 2,49 2,45 2,30 2,11 1,94 1,76 1,59 6,313 99,5 26,3 13,7 9,20 7,06 5,82 5,03 4,48 4,08 3,78 3,54 3,34 3,18 3,05 2,93 2,83 2,75 2,67 2,61 2,55 2,50 2,45 2,40 2,36 2,21 2,02 1,84 1,66 1,47 6,339 99,5 26,2 13,6 9,11 6,97 5,74 4,95 4,40 4,00 3,69 3,45 3,25 3,09 2,96 2,84 2,75 2,66 2,56 2,52 2,46 2,40 2,35 2,30 2,27 2,11 1,92 1,73 1,53 1,32 6,366 99,5 26,1 13,5 9,02 6,88 5,65 4,86 4,31 3,91 3,60 3,36 3,77 3,00 2,87 2,75 2,65 2,57 2,49 2,42 2,36 2,31 2,36 2,21 2,17 2,01 1,80 1,60 1,38 1,00 199 (203) Tµi PhụliÖu lục tham kh¶o TÀI LIỆU THAM KHẢO [1] Đào Hữu Hồ, Xác suất Thống kê, NXB Đại Học Quốc Gia Hà Nội, 1999 [2] Nguyễn Văn Phấn, Lương Hữu Thanh, Bài tập xác suất và thống kê, Đại Học Giao Thông Vận Tải, 1996 [3] Tống Đình Quỳ, Hướng dẫn giải bài tập xác suất thống kê, NXB Đại Học Quốc Gia Hà Nội, 2004 [4] Đặng Hùng Thắng, Mở đầu lý thuyết xác suất và các ứng dụng, NXB Giáo dục, 1997 [5] Đặng Hùng Thắng, Bài tập xác suất, NXB Giáo dục - 1998 [6] Đặng Hùng Thắng, Thống kê và ứng dụng, NXB Giáo dục,1999 [7] Nguyễn Duy Tiến, Vũ Việt Yên, Lý thuyết xác suất, NXB Giáo dục, 2000 [8] Nguyễn Duy Tiến (và tập thể), Các mô hình xác suất và ứng dụng, tập 1, 2, NXB Đại Học Quốc Gia Hà Nội, 2000 [9] Trần Mạnh Tuấn, Xác suất và Thống kê, lý thuyết và thực hành tính toán, NXB Đại Học Quốc Gia Hà Nội, 2004 [10] Nguyễn Bác Văn, Xác suất và xử lí số liệu thống kê, NXB Giáo dục,1996 [11] Nguyễn Cao Văn và Trần Thái Ninh, Bài giảng xác suất và thống kê toán, NXB Thống kê, Hà Nội 1999 [12] Nguyễn Cao Văn, Trần Thái Ninh và Nguyễn Thế Hệ, Bài tập lý thuyết xác suất và thống kê toán, NXB Giáo dục, Hà Nội 2002 [13] D L (Paul) Minh, Applied Probability Models, Duxbury, Thomson Learning, 2001 [14] B.V Gnedenko, The theory of probability, Mir publishers, Moscow 1976 [15] Harald Cramer, Phương pháp toán học thống kê, NXB Khoa học và Kỹ thuật, Hà Nội 1970 200 (204) LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN Mã số: 497XSU210 Chịu trách nhiệm thảo TRUNG TÂM ÐÀO TẠO BƯU CHÍNH VIỄN THÔNG (Tài liệu này ban hành theo Quyết định số: 375/QĐ-TTĐT1 ngày 22/05/2006 Giám đốc Học viện Công nghệ Bưu chính Viễn thông) In : Công ty cổ phần In Bưu điện Số lượng : 2000 cuốn, khổ 19 x 26 cm Ngày hoàn thành : 01/06/2006 (205)

Ngày đăng: 01/04/2021, 04:24

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan