ĐỊNH NGHĨA XÁC SUẤT VÀ CÁC TÍNH CHẤT Việc biến cố ngẫu nhiên xảy ra hay không trong kết quả của một phép thử là điều không thể biết hoặc đoán trước được.. Tuy nhiên bằng những cách khác [r]
(1)HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG SÁCH HƯỚNG DẪN HỌC TẬP XÁC SUẤT THỐNG KÊ (Dùng cho sinh viên ngành CNTT và ĐTVT hệ đào tạo đại học từ xa) Lưu hành nội HÀ NỘI - 2006 (2) HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG SÁCH HƯỚNG DẪN HỌC TẬP XÁC SUẤT THỐNG KÊ Biên soạn : Ts LÊ BÁ LONG (3) LỜI NÓI ĐẦU Lý thuyết xác suất thống kê là phận toán học, nghiên cứu các tượng ngẫu nhiên và ứng dụng chúng vào thực tế Ta có thể hiểu tượng ngẫu nhiên là tượng không thể nói trước nó xảy hay không xảy thực lần quan sát Tuy nhiên, tiến hành quan sát khá nhiều lần tượng ngẫu nhiên các phép thử nhau, ta có thể rút kết luận khoa học tượng này Lý thuyết xác suất là sở để nghiên cứu Thống kê – môn học nghiên cứu các các phương pháp thu thập thông tin chọn mẫu, xử lý thông tin, nhằm rút các kết luận định cần thiết Ngày nay, với hỗ trợ tích cực máy tính điện tử và công nghệ thông tin, lý thuyết xác suất thống kê ngày càng ứng dụng rộng rãi và hiệu lĩnh vực khoa học tự nhiên và xã hội Chính vì lý thuyết xác suất thống kê giảng dạy cho hầu hết các nhóm ngành đại học Có nhiều sách giáo khoa và tài liệu chuyên khảo viết lý thuyết xác suất thống kê Tuy nhiên, với phương thức đào tạo từ xa có đặc thù riêng, đòi hỏi học viên phải làm việc độc lập nhiều hơn, vì cần phải có tài liệu hướng dẫn học tập môn học thích hợp cho đối tượng này Tập tài liệu “Hướng dẫn học môn toán xác suất thống kê” này biên soạn nhằm mục đích trên Tập tài liệu này biên soạn cho hệ đại học chuyên ngành Điện tử-Viễn thông theo đề cương chi tiết chương trình qui định Học viện Công nghệ Bưu Chính Viễn Thông Nội dung sách bám sát các giáo trình các trường đại học khối kỹ thuật và theo kinh nghiệm giảng dạy nhiều năm tác giả Chính vì thế, giáo trình này có thể dùng làm tài liệu học tập, tài liệu tham khảo cho sinh viên các trường, các ngành đại học và cao đẳng khối kỹ thuật Giáo trình gồm chương tương ứng với đơn vị học trình (60 tiết): Chương I: Các khái niệm xác suất Chương II: Biến ngẫu nhiên và các đặc trưng chúng Chương III: Véc tơ ngẫu nhiên và các đặc trưng chúng Chương IV: Luật số lớn và định lý giới hạn Chương V:.Thống kê toán học Chương VI: Quá trình ngẫu nhiên và chuỗi Markov Điều kiện tiên môn học này là hai môn toán cao cấp đại số và giải tích chương trình toán đại cương Tuy nhiên vì hạn chế chương trình toán dành cho hình thức đào tạo từ xa, đó nhiều kết và định lý phát biểu và minh họa không có điều kiện để chứng minh chi tiết Giáo trình trình bày theo cách thích hợp người tự học, đặc biệt phục vụ đắc lực cho công tác đào tạo từ xa Trước nghiên cứu các nội dung chi tiết, người đọc nên xem phần giới thiệu chương để thấy mục đích ý nghĩa, yêu cầu chính chương đó Trong (4) chương, nội dung, người đọc có thể tự đọc và hiểu cặn kẽ thông qua cách diễn đạt và dẫn rõ ràng Đặc biệt bạn đọc nên chú ý đến các nhận xét, bình luận để hiểu sâu mở rộng tổng quát các kết và hướng ứng dụng vào thực tế Hầu hết các bài toán xây dựng theo lược đồ: đặt bài toán, chứng minh tồn lời giải lý thuyết và cuối cùng nêu thuật toán giải bài toán này Các ví dụ là để minh hoạ trực tiếp khái niệm, định lý các thuật toán, vì giúp người đọc dễ dàng tiếp thu bài học Sau các chương có phần tóm tắt các nội dung chính và cuối cùng là các câu hỏi luyện tập Có khoảng từ 20 đến 30 bài tập cho chương, tương ứng vói -5 câu hỏi cho tiết lý thuyết Hệ thống câu hỏi này bao trùm toàn nội dung vừa học Có câu kiểm tra trực tiếp các kiến thức vừa học có câu đòi hỏi học viên phải vận dụng cách tổng hợp và sáng tạo các kiến thức để giải Vì việc giải các bài tập này giúp học viên nắm lý thuyết và kiểm tra mức độ tiếp thu lý thuyết mình Tuy tác giả đã cố gắng, song vì thời gian bị hạn hẹp cùng với yêu cầu cấp bách Học viện, vì các thiếu sót còn tồn giáo trình là điều khó tránh khỏi Tác giả mong đóng góp ý kiến bạn bè đồng nghiệp, học viên xa gần và xin cám ơn vì điều đó Cuối cùng chúng tôi bày tỏ cám ơn Ban Giám đốc Học viện Công nghệ Bưu Chính Viễn Thông, Trung tâm Đào tạo Bưu Chính Viễn Thông và bạn bè đồng nghiệp đã khuyến khích động viên, tạo nhiều điều kiện thuận lợi để chúng tôi hoàn thành tập tài liệu này Hà Nội, đầu năm 2006 Lê Bá Long Khoa Học Viện CNBCVT (5) Chương 1: Các khái niệm xác suất CHƯƠNG I: CÁC KHÁI NIỆM CƠ BẢN VỀ XÁC SUẤT GIỚI THIỆU Các tượng tự nhiên hay xã hội xảy cách ngẫu nhiên (không biết trước kết quả) tất định (biết trước kết xảy ra) Chẳng hạn ta biết chắn lông quạ có mầu đen, vật thả từ trên cao chắn rơi xuống đất Đó là tượng diễn có tính quy luật, tất định Trái lại tung đồng xu ta không biết mặt sấp hay mặt ngửa xuất Ta không thể biết có bao nhiêu gọi đến tổng đài, có bao nhiêu khách hàng đến điểm phục vụ khoảng thời gian nào đó Ta không thể xác định trước số chứng khoán trên thị trường chứng khoán… Đó là tượng ngẫu nhiên Tuy nhiên, tiến hành quan sát khá nhiều lần tượng ngẫu nhiên hoàn cảnh nhau, thì nhiều trường hợp ta có thể rút kết luận có tính quy luật tượng này Lý thuyết xác suất nghiên cứu các qui luật các tượng ngẫu nhiên Việc nắm bắt các quy luật này cho phép dự báo các tượng ngẫu nhiên đó xảy nào Chính vì các phương pháp lý thuyết xác suất ứng dụng rộng rãi việc giải các bài toán thuộc nhiều lĩnh vực khác khoa học tự nhiên, kỹ thuật và kinh tế-xã hội Chương này trình bày cách có hệ thống các khái niệm và các kết chính lý thuyết xác suất: - Các khái niệm phép thử, biến cố - Quan hệ các biến cố - Các định nghĩa xác suất: định nghĩa xác suất theo cổ điển, theo thống kê - Các tính chất xác suất: công thức cộng và công thức nhân xác suất, xác suất biến cố đối - Xác suất có điều kiện, công thức nhân trường hợp không độc lập Công thức xác suất đầy đủ và định lý Bayes - Dãy phép thử Bernoulli và xác suất nhị thức Khi nắm vững các kiến thức đại số tập hợp hợp, giao tập hợp, tập con, phần bù tập … học viên dễ dàng việc tiếp thu, biểu diễn mô tả các biến cố Để tính xác suất các biến cố theo phương pháp cổ điển đòi hỏi phải tính số các trường hợp thuận lợi biến cố và số các trường hợp có thể Vì học viên cần nắm vững các phương pháp đếm - giải tích tổ hợp (đã học lớp 12 và chương toán đại số A2) Tuy nhiên để thuận lợi cho người học chúng tôi nhắc lại các kết chính mục Một khó khăn bài toán xác suất là xác định biến cố và sử dụng đúng các công thức thích hợp Bằng cách tham khảo các ví dụ và giải nhiều bài tập rèn luyện tốt kỹ này (6) Chương 1: Các khái niệm xác suất NỘI DUNG 1.1 PHÉP THỬ VÀ BIẾN CỐ 1.1.1 Phép thử (Experiment) Trong thực tế ta thường gặp nhiều thí nghiệm, quan sát mà các kết nó không thể dự báo trước Ta gọi chúng là các phép thử ngẫu nhiên Phép thử ngẫu nhiên thường ký hiệu chữ C Tuy không biết kết xảy nào, ta có thể liệt kê biểu diễn tất các kết phép thử C Mỗi kết phép thử C gọi là biến cố sơ cấp Tập hợp tất các biến cố sơ cấp phép thử gọi là không gian mẫu, ký hiệu Ω Ví dụ 1.1: Phép thử tung đồng xu có không gian mẫu là Ω = {S, N } Với phép thử tung xúc xắc, các biến cố sơ cấp có thể xem là số các nốt trên mặt xuất Vậy Ω = {1, 2, 3, 4, 5, 6} Phép thử tung đồng thời đồng xu có không gian mẫu là Ω = {( S , S ), ( S , N ), ( N , S ), ( N , N )} Chú ý chất các biến cố sơ cấp không có vai trò đặc biệt gì lý thuyết xác suất Chẳng hạn có thể xem không gian mẫu phép thử tung đồng tiền là Ω = {0, 1}, đó là biến cố sơ cấp mặt sấp xuất và để mặt ngửa xuất 1.1.2 Biến cố (Event) Với phép thử C ta thường xét các biến cố (còn gọi là kiện) mà việc xảy hay không xảy hoàn toàn xác định kết C Mỗi kết ω C là ω C gọi là kết thuận lợi cho biến cố A A xảy kết Ví dụ 1.2: Nếu gọi A là biến cố số nốt xuất là chẵn phép thử tung xúc xắc ví dụ 1.1 thì A có các kết thuận lợi là 2, 4, Tung hai đồng xu, biến cố xuất mặt sấp mặt ngửa (xin âm dương) có các kết thuận lợi là ( S , N ) ; ( N , S ) Như biến cố A đồng với tập không gian mẫu Ω bao gồm các kết thuận lợi A Mỗi biến cố có thể xảy phép thử thực hiện, nghĩa là gắn với không gian mẫu nào đó Có hai biến cố đặc biệt sau: • Biến cố chắn là biến cố luôn luôn xảy thực phép thử, biến cố này trùng với không gian mẫu Ω • Biến cố không thể là biến cố định không xảy thực phép thử Biến cố không thể ký hiệu φ (7) Chương 1: Các khái niệm xác suất Tung xúc xắc, biến cố xuất mặt có số nốt nhỏ hay là biến chắn, biến cố xuất mặt có nốt là biến cố không thể 1.1.3 Quan hệ các biến cố Trong lý thuyết xác suất người ta xét các quan hệ sau đây cho các biến cố a Quan hệ kéo theo Biến cố A kéo theo biến cố B , ký hiệu A ⊂ B , A xảy thì B xảy b Quan hệ biến cố đối Biến cố đối A là biến cố ký hiệu là A và xác định sau: A xảy và A không xảy c Tổng hai biến cố Tổng hai biến cố A, B là biến cố ký hiệu A ∪ B Biến cố A ∪ B xảy và có ít A B xảy Tổng dãy các biến cố {A1 , A2 , , An } là biến cố n ∪ Ai Biến cố này xảy có i =1 ít các biến cố Ai xảy d Tích hai biến cố Tích hai biến cố A, B là biến cố ký hiệu AB Biến cố AB xảy và hai biến cố A , B cùng xảy Tích dãy các biến cố {A1 , A2 , , An } là biến cố n ∏ Ai Biến cố này xảy tất i =1 các biến cố Ai cùng xảy e Biến cố xung khắc Hai biến số A, B gọi là xung khắc biến cố tích AB là biến cố không thể Nghĩa là hai biến cố này không thể đồng thời xảy Chú ý các biến cố với phép toán tổng, tích và lấy biến cố đối tạo thành đại số Boole đó các phép toán định nghĩa trên có các tính chất các phép toán hợp, giao, lấy phần bù các tập không gian mẫu f Hệ đầy đủ các biến cố Dãy các biến cố A1 , A2 , , An gọi là hệ đầy đủ các biến cố nếu: i Xung khắc đôi một, nghĩa là Ai A j = φ với i ≠ j = 1, , n , ii Tổng chúng là biến cố chắc, nghĩa là n ∪ Ai = Ω i =1 { } Đặc biệt với biến cố A , hệ A, A là hệ đầy đủ (8) Chương 1: Các khái niệm xác suất Ví dụ 1.3: Một nhà máy có ba phân xưởng sản xuất cùng loại sản phẩm Giả sử sản phẩm nhà máy ba phân xưởng này sản xuất Chọn ngẫu nhiên sản phẩm, gọi A1 , A2 , A3 là biến cố sản phẩm chọn phân xưởng thứ nhất, thứ hai, thứ ba sản xuất Khi đó hệ ba biến cố A1 , A2 , A3 là hệ đầy đủ g Tính độc lập các biến cố Hai biến cố A và B gọi là độc lập với việc xảy hay không xảy biến cố này không ảnh hưởng tới việc xảy hay không xảy biến cố Tổng quát các biến cố A1 , A2 , , An gọi là độc lập việc xảy hay không xảy nhóm k biến cố, đó ≤ k ≤ n , không làm ảnh hưởng tới việc xảy hay không xảy các biến cố còn lại Định lý 1.2: Nếu A, B độc lập thì các cặp biến cố: A, B ; A, B ; A, B độc lập Ví dụ 1.4: Ba xạ thủ A, B, C người bắn viên đạn vào mục tiêu Gọi A, B, C là biến cố A, B, C bắn trúng mục tiêu a Hãy mô tả các biến cố: ABC , A B C , A ∪ B ∪ C b Biểu diễn các biến cố sau theo A, B, C : - D : Có ít xạ thủ bắn trúng - E : Có nhiều xạ thủ bắn trúng - F : Chỉ có xạ thủ C bắn trúng - G : Chỉ có xạ thủ bắn trúng c Các biến cố A, B, C có xung khắc, có độc lập không ? Giải: a ABC : bắn trúng A B C : bắn trượt A ∪ B ∪ C : có ít người bắn trúng b D = AB ∪ BC ∪ CA Có nhiều xạ thủ bắn trúng có nghĩa là có ít hai xạ thủ bắn trượt, E = AB ∪ BC ∪C A F = ABC G = ABC ∪ ABC ∪ ABC c Ba biến cố A, B, C độc lập không xung khắc 1.2 ĐỊNH NGHĨA XÁC SUẤT VÀ CÁC TÍNH CHẤT Việc biến cố ngẫu nhiên xảy hay không kết phép thử là điều không thể biết đoán trước Tuy nhiên cách khác ta có thể định lượng khả xuất biến cố, đó là xác suất xuất biến cố (9) Chương 1: Các khái niệm xác suất Xác suất biến cố là số đặc trưng khả khách quan xuất biến cố đó thực phép thử Dựa vào chất phép thử (đồng khả năng) ta có thể suy luận khả xuất biến cố, với cách tiếp cận này ta có định nghĩa xác suất theo phương pháp cổ điển Khi thực nhiều lần lặp lại độc lập phép thử ta có thể tính tần suất xuất biến cố nào đó Tần suất thể khả xuất biến cố, với cách tiếp cận này ta có định nghĩa xác suất theo thống kê 1.2.1 Định nghĩa cổ điển xác suất Giả sử phép thử C thoả mãn hai điều kiện sau: (i) Không gian mẫu có số hữu hạn phần tử (ii) Các kết xảy đồng khả Khi đó ta định nghĩa xác suất biến cố A là P ( A) = sè tr−êng hîp thuËn lîi đèi víi A sè tr−êng hîp cã thÓ (1.1) Nếu xem biến cố A là tập không gian mẫu Ω thì P ( A) = A sè phÇn tö cña A = sè phÇn tö cña Ω Ω (1.1)’ Ví dụ 1.5: Biến cố A xuất mặt chẵn phép thử gieo xúc xắc ví dụ 1.1 có 3 trường hợp thuận lợi ( A = ) và trường hợp có thể ( Ω = ) Vậy P( A) = = Để tính xác suất cổ điển ta sử dụng phương pháp đếm giải tích tổ hợp 1.2.2 Các qui tắc đếm a Qui tắc cộng Nếu có m1 cách chọn loại đối tượng x1 , m cách chọn loại đối tượng x , , mn cách chọn loại đối tượng x n Các cách chọn đối tượng xi không trùng với cách chọn x j i ≠ j thì có m1 + m2 + + mn cách chọn các đối tượng đã cho b Qui tắc nhân Giả sử công việc H gồm nhiều công đoạn liên tiếp H1 , H , , H k và công đoạn H i có ni cách thực thì có tất n1 × n2 × × nk cách thực công việc H c Hoán vị Mỗi phép đổi chỗ n phần tử gọi là phép hoán vị n phần tử Sử dụng quy tắc nhân ta có thể tính được: Có n ! hoán vị n phần tử (10) Chương 1: Các khái niệm xác suất d Chỉnh hợp Chọn k phần tử không hoàn lại tập n phần tử ta chỉnh hợp chập k n phần tử Sử dụng quy tắc nhân ta có thể tính số các chỉnh hợp chập k n phần tử là Ank = n! (n − k )! (1.2) e Tổ hợp Một tổ hợp chập k n phần tử là tập k phần tử tập n phần tử Cũng có thể xem tổ hợp chập k n phần tử là cách chọn đồng thời k phần tử tập n phần tử Hai chỉnh hợp chập k n phần tử là khác nếu: có ít phần tử chỉnh hợp này không có chỉnh hợp các phần tử thứ tự khác Do đó với tổ hợp chập k n phần tử có k! chỉnh hợp tương ứng Mặt khác hai chỉnh hợp khác ứng với hai tổ hợp khác là khác Vậy số các tổ hợp chập k n phần tử là Ank k Cn = = k! n! k!(n − k )! (1.3) Ví dụ 1.6: Tung xúc xắc hai lần Tìm xác suất để đó có lần nốt Giải: Số các trường hợp có thể là 36 Gọi A là biến cố “ lần tung xúc xắc có lần mặt 6” Nếu lần thứ mặt thì lần thứ hai có thể các mặt từ đến 5, nghĩa là có trường hợp Tương tự có trường hợp xuất mặt lần tung thứ hai Áp dụng 10 quy tắc cộng ta suy xác suất để có lần mặt tung xúc xắc lần là 36 Ví dụ 1.7: Cho các từ mã bit tạo từ các chuỗi các bit và bit đồng khả Hãy tìm xác suất các từ có chứa k bit 1, với k = , , Giải: Số trường hợp có thể Ω = Đặt Ak là biến cố " từ mã có chứa k bit 1" Có thể xem từ mã có chứa k bit là tổ hợp chập k phần tử, số trường hợp thuận lợi 6! Ak là số các tổ hợp chập k Do đó Ak = C 6k = k!(6 − k )! Vậy xác suất các biến cố tương ứng P ( Ak ) = 6! k!(6 − k )!2 , k = , , Ví dụ 1.8: Một người gọi điện thoại quên hai số cuối số điện thoại và nhớ chúng khác Tìm xác suất để quay ngẫu nhiên lần đúng số cần gọi (11) Chương 1: Các khái niệm xác suất Giải: Gọi A là biến cố “quay ngẫu nhiên lần đúng số cần gọi” Số các trường hợp có thể là số các cặp hai chữ số khác từ 10 chữ số từ đến Nó số các chỉnh hợp 10 = 10 ⋅ = 90 Số các trường hợp thuận lợi A là chập Vậy số các trường hợp có thể là A10 Do đó P( A) = 90 Ví dụ 1.9: Một công ty cần tuyển nhân viên Có người nộp đơn đó có nữ và nam Giả sử khả trúng tuyển người là Tính xác suất biến cố: a Hai người trúng tuyển là nam b Hai người trúng tuyển là nữ c Có ít 1nữ trúng tuyển Giải: Số trường hợp có thể Ω = C62 = 15 a Chỉ có trường hợp nam trúng tuyển đó xác suất tương ứng là P = / 15 b Có C 42 = cách chọn nữ, xác suất tương ứng P = / 15 c Trong 15 trường hợp có thể có trường hợp nam chọn, có 14 trường hợp ít nữ chọn Do đo xác suất tương ứng P = 14 / 15 1.2.3 Định nghĩa thống kê xác suất Định nghĩa xác suất theo cổ điển trực quan, dễ hiểu Tuy nhiên số các kết có thể vô hạn không đồng khả thì cách tính xác suất cổ điển không áp dụng Giả sử phép thử C có thể thực lặp lại nhiều lần độc lập điều kiện giống hệt Nếu n lần thực phép thử C , biến cố A xuất k n ( A) lần thì tỉ số f n ( A) = k n ( A) n gọi là tần suất xuất biến cố A n phép thử Người ta chứng minh (định lý luật số lớn) n tăng lên vô hạn thì f n ( A) tiến đến giới hạn xác định Ta định nghĩa giới hạn này là xác suất biến cố A , ký hiệu P(A) P( A) = lim f n ( A) n →∞ (1.4) Trên thực tế P(A) tính xấp xỉ tần suất f n ( A) n đủ lớn Ví dụ 1.10: Một công ty bảo hiểm muốn xác định xác suất để người Mỹ 25 tuổi bị chết năm tới, người ta theo dõi 100.000 niên và thấy có 798 người bị chết vòng năm sau đó Vậy xác suất cần tìm xấp xỉ 0,008 Ví dụ 1.11: Thống kê cho thấy tần suất sinh trai xấp xỉ 0,513 Vậy xác suất để bé trai đời lớn bé gái Nhận xét: Định nghĩa xác suất theo thống kê khắc phục hạn chế định nghĩa cổ điển, nó hoàn toàn dựa trên các thí nghiệm quan sát thực tế để tìm xác suất biến cố Tuy nhiên (12) Chương 1: Các khái niệm xác suất định nghĩa thống kê xác suất áp dụng cho các phép thử mà có thể lặp lại nhiều lần cách độc lập điều kiện giống hệt Ngoài để xác định cách tương đối chính xác giá trị xác suất thì cần tiến hành số n đủ lớn lần các phép thử, mà việc này đôi không thể làm vì hạn chế thời gian và kinh phí Ngày với trợ giúp công nghệ thông tin, người ta có thể mô các phép thử ngẫu nhiên mà không cần thực các phép thử thực tế Điều này cho phép tính xác suất theo phương pháp thống kê thuận tiện 1.2.4 Định nghĩa xác suất theo hình học Định nghĩa 1.3: Giả sử không gian mẫu Ω có thể biểu diễn tương ứng với miền nào đó có diện tích (thể tích, độ dài) hữu hạn và biến cố A tương ứng với miền Ω thì xác suất biến cố A định nghĩa: P ( A) = diÖn tÝch A diÖn tÝch Ω y Ví dụ 1.12: Hai người bạn hẹn gặp địa điểm khoảng thời gian từ 12h đến 13h Mỗi người có thể đến điểm hẹn cách ngẫu nhiên thời điểm khoảng thời gian nói trên và họ quy ước đến trước thì đợi người vòng 15 phút Tính xác suất để hai người gặp Giải: Giả sử x, y là thời điểm người thứ 60 A 15 và thứ hai đến điểm hẹn thì ≤ x ≤ 60 , ≤ y ≤ 60 Vậy cặp thời điểm đến ( x ; y ) là điểm hình vuông Ω = [0, 60] O 15 x 60 Gọi A là biến cố hai người gặp thì { } A = ( x ; y ) ∈ Ω x − y ≤ 15 = {( x ; y ) ∈ Ω − 15 + x ≤ y ≤ x + 15 } ⇒ P( A) = 45 diÖn tÝch A = 1− = 1− = diÖn tÝch Ω 16 16 60 1.2.6 Các tính chất và định lý xác suất 1.2.6.1 Các tính chất xác suất Các định nghĩa trên xác suất thoả mãn các tính chất sau: Với biến cố A : ≤ P( A) ≤ (1.5) Xác suất biến cố không thể 0, xác suất biến cố chắn P (φ) = 0, P(Ω) = 10 (1.6) (13) Chương 1: Các khái niệm xác suất 1.2.6.2 Qui tắc cộng xác suất a Trường hợp xung khắc Nếu A, B là hai biến cố xung khắc thì P ( A ∪ B) = P( A) + P( B) (1.7) Tổng quát hơn, {A1 , A2 , , An } là dãy các biến cố xung khắc đôi thì ⎛ n ⎞ n P⎜ ∪ Ai ⎟ = ∑ P ( Ai ) ⎜ ⎟ ⎝ i =1 ⎠ i =1 (1.7)’ Từ công thức (1.6) và (1.7)’ ta có hệ quả: Nếu {A1 , A2 , , An } là hệ đầy đủ thì n ∑ P( Ai ) = (1.8) i =1 b Trường hợp tổng quát Nếu A, B là hai biến cố thì P ( A ∪ B) = P( A) + P( B) − P( AB) Nếu A, B, C là ba biến cố thì P ( A ∪ B ∪ C ) = P( A) + P( B) + P(C ) − P( AB) − P ( BC ) − P(CA) + P( ABC ) (1.9) (1.9)’ Nếu {A1 , A2 , , An } là dãy các biến cố ⎛n ⎞ n P⎜ ∪ Ai ⎟ = ∑ P( Ai ) − ∑ P( Ai A j ) + ∑ P( Ai A j Ak ) − ⎜ ⎟ i< j i< j <k ⎝ i =1 ⎠ i =1 + (−1) n −1 P( A1 A2 An ) (1.9)” Ví dụ 12: Một lô hàng có 25% sản phẩm loại I, 55% sản phẩm loại II và 20% sản phẩm loại III Sản phẩm cho là đạt chất lượng thuộc loại I loại II Chọn ngẫu nhiên sản phẩm tìm xác suất để sản phẩm này đạt tiêu chuẩn chất lượng Giải: Gọi A1 , A2 , A3 là biến cố sản phẩm chọn thuộc loại I, II, III Ba biến cố này xung khắc đôi P ( A1 ) = 0,25 , P ( A2 ) = 0,55 , P( A3 ) = 0,20 Gọi A là biến cố sản phẩm chọn đạt tiêu chuẩn chất lượng Vậy A = A1 ∪ A2 P ( A) = P ( A1 ) + P ( A2 ) = 0,25 + 0,55 = 0,8 { } Áp dụng công thức (1.8) cho hệ đầy đủ A, A ta quy tắc xác suất biến cố đối 1.2.6.3 Quy tắc xác suất biến cố đối Với biến cố A P( A ) = − P( A) 11 (1.10) (14) Chương 1: Các khái niệm xác suất 1.2.5 Nguyên lý xác suất lớn, xác suất nhỏ Một biến cố không thể có xác suất Tuy nhiên biến cố có xác suất có thể xảy số lớn các phép thử Qua thực nghiệm và quan sát thực tế, người ta thấy các biến cố có xác suất nhỏ không xảy ta thực phép thử hay vài phép thử Từ đó ta thừa nhận nguyên lý sau đây, gọi là “Nguyên lý xác suất nhỏ”: Nếu biến cố có xác suất nhỏ thì thực tế có thể cho phép thử biến cố đó không xảy Chẳng hạn máy bay có xác suất nhỏ bị xảy tai nạn Nhưng trên thực tế ta không từ chối máy bay vì tin tưởng chuyến bay ta kiện máy bay rơi không xảy Hiển nhiên việc quy định mức xác suất nào gọi là nhỏ phụ thuộc vào bài toán cụ thể Chẳng hạn xác suất để máy bay rơi là 0,01 thì xác suất đó chưa thể coi là nhỏ Song xác suất chuyến tàu khởi hành chậm là 0,01 thì có thể coi xác suất này là nhỏ Mức xác suất nhỏ này gọi là mức ý nghĩa Nếu α là mức ý nghĩa thì số β = − α gọi là độ tin cậy Khi dựa trên nguyên lý xác suất nhỏ ta tuyên bố rằng: “Biến cố A có xác suất nhỏ (tức là P( A) ≤ α ) không xảy trên thực tế” thì độ tin cậy kết luận trên là β Tính đúng đắn kết luận xảy 100 ⋅ β % trường hợp Tương tự ta có thể đưa “Nguyên lý xác suất lớn”: “Nếu biến cố A có xác suất gần thì trên thực tế có thể cho biến cố đó xảy phép thử” Cũng trên, việc quy định mức xác suất nào gọi là lớn tùy thuộc vào bài toán cụ thể 1.3 XÁC SUẤT CÓ ĐIỀU KIỆN 1.3.1 Định nghĩa cà các tính chất xác suất có điều kiện Xác suất biến cố B tính điều kiện biết biến cố A đã xảy gọi là xác suất B với điều kiện A Ký hiệu P (B A) Tính chất ¾ Nếu P( A) > thì P (B A) = ¾ P( AB) P( A) (1.11) Khi cố định A với P ( A) > thì xác suất có điều kiện P (B A) có tất các tính chất xác suất thông thường (công thức (1.5)-(1.10)”) biến cố B Chẳng hạn: ( ) P B A = − P(B A), P (B1 ∪ B2 A) = P(B1 A) + P(B2 A) − P (B1 B2 A) 12 (15) Chương 1: Các khái niệm xác suất Ví dụ 13: Gieo đồng thời hai xúc xắc cân đối Tính xác suất để tổng số nốt xuất trên hai xúc xắc ≥ 10 biết ít đã nốt ( ) 11 ⎛5⎞ Giải: Gọi A là biến cố " ít nốt 5" P ( A) = − P A = − ⎜ ⎟ = 36 ⎝6⎠ Gọi B là biến cố "tổng số nốt trên hai ≥ 10 " Biến cố AB có kết thuận lợi là (5,6), (6,5), (5,5) Vậy P ( AB ) = 3 11 ⇒ P ( B A) = = 36 36 11 36 1.3.2 Quy tắc nhân xác suất 1.3.2.1 Trường hợp độc lập: Nếu A, B là hai biến cố độc lập thì P( AB) = P( A) P( B) (1.12) Nếu {A1 , A2 , , An } là càc biến cố độc lập thì P( A1 A2 An ) = P( A1 )P( A2 ) P( An ) (1.13) 1.3.2.2 Trường hợp tổng quát: P ( AB ) = P ( A) P (B A) P ( A1 A2 An ) = P ( A1 ) P ( A2 A1 ) P ( A3 A1 A2 ) P ( An A1 A2 An−1 ) (1.14) (1.15) Ví dụ 1.14: Túi I chứa bi trắng, bi đỏ, 15 bi xanh Túi II chứa 10 bi trắng, bi đỏ, bi xanh Từ túi lấy ngẫu nhiên bi Tìm xác suất để bi rút từ túi là cùng màu Giải: Gọi At , Ađ , Ax là biến cố bi rút từ túi I là trắng, đỏ, xanh Bt , Bđ , B x là biến cố bi rút từ túi II là trắng, đỏ, xanh Các biến cố At , Ađ , Ax độc lập với các biến cố Bt , Bđ , B x Vậy xác suất để bi rút cùng mầu là P ( At Bt ∪ Ađ Bđ ∪ Ax Bx ) = P ( At Bt ) + P ( Ađ Bđ ) + P ( Ax Bx ) = P ( At ) P ( Bt ) + P ( Ađ ) P ( Bđ ) + P ( Ax ) P ( Bx ) = 10 15 207 + + = ≈ 0,331 25 25 25 25 25 25 625 13 (16) Chương 1: Các khái niệm xác suất Ví dụ 1.15: Một thủ kho có chùm chìa khóa gồm chiếc, bề ngoài chúng giống hệt đó có đúng mở kho Anh ta thử ngẫu nhiên chìa (chìa nào không trúng thì bỏ ra) Tính xác suất để mở kho lần thứ ba Giải: Ký hiệu Ai là biến cố "thử đúng chìa lần thứ i" Vậy xác suất cần tìm là ( ) ( ) ( ) ( ) P A1 A2 A3 = P A1 P A2 A1 P A3 A1 A2 = 762 = 987 1.3.3 Công thức xác suất đầy đủ Định lý 1.3: Nếu { A1, A2 , , An } là hệ đầy đủ các biến cố Với biến cố B cùng phép thử, ta có n P ( B) = ∑ P( Ai ) P ( B Ai ) (1.16) i =1 1.3.4 Công thức Bayes Định lý 1.4: Nếu { A1, A2 , , An } là hệ đầy đủ các biến cố Với biến cố B cùng phép thử cho P( B ) > ta có : P ( Ak B ) = P( Ak ) P ( B Ak ) P( Ak B) = n P( B) ∑ P( Ai ) P ( B Ai ) (1.17) i =1 Giải thích: Trong thực tế các xác suất { P ( A1 ), P ( A2 ), , P ( An )} đã biết và gọi là các xác suất tiền nghiệm Sau quan sát biết biến cố B xảy ra, các xác suất Ak tính trên thông tin này (xác suất có điều kiện P (Ak B ) ) gọi là xác suất hậu nghiệm Vì công thức Bayes còn gọi là công thức xác suất hậu nghiệm Ví dụ 1.16: Một trạm phát hai tín hiệu A và B với xác suất tương ứng 0,85 và 0,15 Do có nhiễu trên đường truyền nên 1/7 tín hiệu A bị méo và thu tín hiệu B còn 1/8 tín hiệu B bị méo và thu A a Tìm xác suất thu tín hiệu A b Giả sử đã thu tín hiệu A Tìm xác suất thu đúng tín hiệu lúc phát Giải: Gọi là A biến cố "phát tín hiệu A" và B là biến cố "phát tín hiệu B" Khi đó {A, B} là hệ đầy đủ Gọi là T A biến cố "thu tín hiệu A" và là TB biến cố "thu tín hiệu B" P ( A) = 0,85 , P ( B ) = 0,15 ; P (TB A) = a 1 , P (T A B ) = Áp dụng công thức xác suất đầy đủ ta có xác suất thu tín hiệu A: P(T A ) = P ( A) P(T A A) + P ( B) P(T A B ) = 0,85 × 14 + 0,15 × = 0,7473 (17) Chương 1: Các khái niệm xác suất b Áp dụng công thức Bayes ta có P(A T A ) = P( A) P (T A A) P(T A ) = 0,975 = 0,7473 0,85 × Ví dụ 1.17: Người ta dùng thiết bị để kiểm tra loại sản phẩm nhằm xác định sản phẩm có đạt yêu cầu không Biết sản phẩm có tỉ lệ phế phẩm là p % Thiết bị có khả phát đúng sản phẩm là phế phẩm với xác suất α và phát đúng sản phẩm đạt chất lượng với xác suất β Kiểm tra ngẫu nhiên sản phẩm, tìm xác suất cho sản phẩm này: a Được kết luận là phế phẩm (biến cố A ) b Được kết luận là đạt chất lượng thì lại là phế phẩm c Được kết luận đúng với thực chất nó Giải: Gọi H là biến cố “sản phẩm chọn là phế phẩm” Theo giả thiết ta có: ( ) P ( H ) = p, P ( A H ) = α , P A H = β { } a Áp dụng công thức đầy đủ cho hệ đầy đủ H , H ta có: ( ) ( ) P ( A) = P( H ) P ( A H ) + P H P A H = pα + (1 − p)(1 − β ) ( ) b P H A = ( P HA ( ) P A ( )= p(1 − α ) p(1 − α ) + (1 − p ) β ( ) ( ) ) c P ( AH ) + P A H = P ( H ) P ( A H ) + P H P A H = pα + (1 − p ) β 1.4 DÃY PHÉP THỬ BERNOULLI Dãy các phép thử lặp lại, độc lập, phép thử có kết cục: A , A và xác suất xuất biến cố A không đổi P ( A) = p , (0 < p < 1) gọi là dãy phép thử Bernoulli p là xác suất thành công lần thử Kí hiệu H k là biến cố " A xuất đúng k lần n phép thử" Đặt Pn (k ; p ) = P( H k ) Định lý 1.1: Pn (k ; p ) = C nk p k (1 − p ) n −k ; k = 0,1, , n (1.18) Chứng minh: H k là tổng C nk các biến cố xung khắc đôi nhận cách hoán vị các chữ A và A biến cố tích sau: A A A A k lÇn n − k lÇn 15 (18) Chương 1: Các khái niệm xác suất Mỗi biến cố này có xác suất P( A A A A ) = p k (1 − p ) n −k k lÇn n − k lÇn Vậy Pn (k ; p ) = C nk p k (1 − p) n − k Định lý 1.2: (i) Pn (k ; p) = (n − k + 1) p Pn (k − 1; p) kq (1.19) (ii) Khi k tăng từ đến n thì Pn (k ; p ) đầu tăng sau đó giảm và đạt giá trị lớn k = m thoả mãn: (n + 1) p − ≤ m ≤ (n + 1) p (1.20) Như vậy, Khi (n + 1) p không nguyên thì m = [(n + 1) p ] (là phần nguyên (n + 1) p ) Khi (n + 1) p nguyên thì m = (n + 1) p − m = (n + 1) p Pmax = Pn (m − 1; p) = Pn (m ; p) (1.20)’ Chứng minh: n! p k q n−k Pn (k ; p) (n − k + 1) p k! (n − k )! , từ đó có (1.19) = = n! kq Pn (k − ; p) k −1 n − k +1 p q (k − 1)! (n − k + 1)! (1.19) ⇒ Pn (k ; p ) Pn (k ; p ) (k + 1)(1 − p ) Do đó = < ⇔ k + < (n + 1) p Pn (k + 1; p ) (n − k ) p Pn (k + 1; p ) Vậy Pn (k ; p) < Pn (k + ; p) k < (n + 1) p − ⇒ Pn (k ; p) < Pn (m ; p) ∀ k < (n + 1) p − và Pn (k ; p ) > Pn (k + 1; p) k ≥ (n + 1) p ⇒ Pn (k ; p) < Pn (m ; p) ∀ k > (n + 1) p , đó m là số tự nhiên thỏa mãn (n + 1) p − ≤ m ≤ (n + 1) p Khi m = (n + 1) p thì Pn ( m − 1; p) ( n + 1)(1 − p) p = =1 (n − (n + 1) p + 1) p Pn ( m ; p) ⇒ Pn (m − ; p) = Pn (m ; p) Định nghĩa 1.1: m xác định công thức (1.20) (1.20)’ gọi là giá trị chắn số thành công hay giá trị có khả xảy lớn Pn (m ; p) là số hạng trung tâm phân bố nhị thức 16 (19) Chương 1: Các khái niệm xác suất Ví dụ 1.19: Tín hiệu thông tin phát lần độc lập Xác suất thu lần là 0.4 a) Tìm xác suất để nguồn thu nhận thông tin đúng lần b) Tìm xác suất để nguồn thu nhận thông tin đó c) Nếu muốn xác suất thu tin ≥ 0,9 thì phải phát ít bao nhiêu lần Giải: Có thể xem lần phát tin là phép thử Bernoulli mà thành công phép thử là nguồn thu nhận tin, theo giả thiết xác suất thành công mỗI lần thử là 0,4 Vậy: a) Xác suất để nguồn thu nhận thông tin đúng lần là P2 (3 ; 0,4) = C32 (0,4)2 (0,6) = 0,288 b) Xác suất để nguồn thu nhận thông tin là P = − (0,6 ) = 0,784 c) Xác suất để nguồn thu nhận thông tin phát n lần là P = − (0,6 )n Vậy muốn xác suất thu tin ≥ 0,9 thì phải phát ít n lần cho: − (0,6 )n ≥ 0,9 ⇔ (0,6 )n ≤ 0,1 ⇔ n ≥ lg(0,1) −1 = = 4,504 Chọn n = lg(0,6 ) − = 0,778 TÓM TẮT Phép thử Trong thực tế ta thường gặp nhiều thí nghiệm, quan sát mà các kết nó không thể dự báo trước Ta gọi chúng là các phép thử ngẫu nhiên Mỗi kết phép thử C gọi là biến cố sơ cấp Tập hợp tất các biến cố sơ cấp phép thử gọi là không gian mẫu, ký hiệu Ω Biến cố Mỗi biến cố A đồng với tập không gian mẫu Ω bao gồm các kết thuận lợi A Xác suất Xác suất biến cố là số đặc trưng khả khách quan xuất biến cố đó thực phép thử Định nghĩa cổ điển xác suất Xác suất biến cố A là P( A) = sè tr−êng hîp thuËn lîi đèi víi A sè tr−êng hîp cã thÓ Định nghĩa thống kê xác suất Xác suất biến cố A là P ( A) ≈ f n ( A) = k n ( A) đó k n ( A) số lần xuất biến n cố A n phép thử 17 (20) Chương 1: Các khái niệm xác suất Nguyên lý xác suất nhỏ Nếu biến cố có xác suất nhỏ thì thực tế có thể cho phép thử biến cố đó không xảy Nguyên lý xác suất lớn Nếu biến cố A có xác suất gần thì trên thực tế có thể cho biến cố đó xảy phép thử Quan hệ kéo theo Biến cố A kéo theo biến cố B , ký hiệu A ⊂ B , A xảy thì B xảy Quan hệ biến cố đối A là biến cố đối A A xảy và A không xảy Tổng hai biến cố Biến cố A ∪ B tổng hai biến cố A, B xảy và có ít A B xảy Biến cố tổng n ∪ Ai dãy các biến cố {A1 , A2 , , An } xảy có ít i =1 các biến cố Ai xảy Tích hai biến cố Biến cố AB hai biến cố A, B xảy và hai biến cố A , B cùng xảy Biến cố tích n ∏ Ai dãy các biến cố {A1 , A2 , , An } i =1 xảy tất các biến cố Ai cùng xảy Biến cố xung khắc Hai biến số A, B gọi là xung khắc AB là biến cố không thể Hệ đầy đủ các biến cố Dãy các biến cố A1 , A2 , , An gọi là hệ đầy đủ các biến cố chúng xung khắc đôi và tổng chúng là biến cố chắc Tính độc lập các biến cố Hai biến cố A và B gọi là độc lập với việc xảy hay không xảy biến cố này không ảnh hưởng tới việc xảy hay không xảy biến cố Tổng quát các biến cố A1 , A2 , , An gọi là độc lập việc xảy hay không xảy nhóm k biến cố, đó ≤ k ≤ n , không làm ảnh hưởng tới việc xảy hay không xảy các biến cố còn lại Qui tắc cộng 18 (21) Chương 1: Các khái niệm xác suất ⎛ n ⎞ n Trường hợp xung khắc: P ( A ∪ B) = P( A) + P( B) ; P⎜ ∪ Ai ⎟ = ∑ P ( Ai ) ⎟ ⎜ ⎝ i =1 ⎠ i =1 Trường hợp tổng quát P ( A ∪ B) = P( A) + P( B) − P( AB) P ( A ∪ B ∪ C ) = P( A) + P( B) + P(C ) − P( AB) − P ( BC ) − P(CA) + P( ABC ) ⎛n ⎞ n P⎜ ∪ Ai ⎟ = ∑ P ( Ai ) − ∑ P ( Ai A j ) + ∑ P ( Ai A j Ak ) − ⎜ ⎟ i< j i< j <k ⎝ i =1 ⎠ i =1 + (−1) n −1 P ( A1 A2 An ) Quy tắc xác suất biến cố đối P( A ) = − P( A) Xác suất có điều kiện Xác suất biến cố B tính điều kiện biết biến cố A đã xảy gọi là xác suất B với điều kiện A , ký hiệu P (B A) Quy tắc nhân Trường hợp độc lập: P( AB) = P( A) P( B) P( A1 A2 An ) = P( A1 )P( A2 ) P( An ) Trường hợp không độc lập: P( AB) = P( A) P(B A) ; P ( A1 A2 An ) = P ( A1 ) P ( A2 A1 ) P ( A3 A1 A2 ) P ( An A1 A2 An−1 ) Công thức xác suất đầy đủ Giả sử { A1, A2 , , An } là hệ đầy đủ Với biến cố B ta có: n P ( B) = ∑ P( Ai ) P ( B Ai ) i =1 Công thức Bayes Nếu { A1, A2 , , An } là hệ đầy đủ và với biến cố B cho P ( B) > ta có : P ( Ak B ) = P( Ak ) P ( B Ak ) P( Ak B) = n P( B) ∑ P( Ai ) P ( B Ai ) i =1 Dãy phép thử Bernoulli Dãy các phép thử lặp lại, độc lập, phép thử có kết cục: A , A và xác suất xuất biến cố A không đổi P ( A) = p , (0 < p < 1) gọi là dãy phép thử Bernoulli 19 (22) Chương 1: Các khái niệm xác suất Khi m = [(n + 1) p ] thì Pn (m ; p) = C nm p m (1 − p ) n − m đạt giá trị lớn Gọi m là giá trị có khả xảy lớn dãy phép thử Bernoulli CÂU HỎI ÔN TẬP VÀ BÀI TẬP 1.1 Ta có thể có hai không gian mẫu Ω các biến cố sơ cấp cho cùng phép thử Đúng Sai C? 1.2 Các biến cố A và A ∪ B là xung khắc Đúng Sai 1.3 Hai biến cố A và B xung khắc thì P ( A ∪ B) = P( A) + P( B) Đúng Sai 1.4 Thông tin liên quan đến việc xuất biến cố B làm tăng xác suất biến cố A , tức là P ( A B ) ≥ P ( A) ? Đúng Sai 1.5 Hai biến cố xung khắc là hai biến cố độc lập Đúng Sai 1.6 Các biến cố đối hai biến cố độc lập là độc lập Đúng Sai 1.7 Xác suất tổng hai biến cố độc lập tổng xác suất hai biến cố này Đúng Sai 1.8 Xác suất tích biến cố xung khắc tích xác suất Đúng Sai { } 1.9 Hệ biến cố A, A là hệ đầy đủ Đúng Sai 1.10 Cho Ω = {a, b, c, d } đó các biến cố sơ cấp là đồng khả Biến cố A = {a, b} và B = {a, c} là phụ thuộc vì chúng cùng xảy biến cố sơ cấp a xảy Đúng Sai 1.11 Trong hòm đựng 10 chi tiết đạt tiêu chuẩn và chi tiết là phế phẩm Lấy đồng thời chi tiết Tính xác suất: a) Cả chi tiết lấy thuộc loại đạt tiêu chuẩn b) Trong số chi tiết lấy có chi tiết đạt tiêu chuẩn 1.12 Thang máy tòa nhà tầng xuất phát từ tầng với khách Tìm xác suất để: a) Tất cùng tầng bốn 20 (23) Chương 1: Các khái niệm xác suất b) Tất cùng tầng c) Mỗi người tầng khác 1.13 Một người gọi điện thoại cho bạn lại quên chữ số cuối và nhớ chúng khác Tìm xác suất để người đó quay số lần đúng số điện thoại bạn 1.14 Ta kiểm tra theo thứ tự lô hàng có 10 sản phẩm Mỗi sản phẩm thuộc hai loại: Tốt Xấu Ký hiệu Ak ( k = 1,10 ) là biến cố sản phẩm kiểm tra thứ k thuộc loại xấu Biểu diễn các biến cố sau theo Ak : a) Cả 10 sản phẩm xấu b) Có ít sản phẩm xấu c) Có sản phẩm kiểm tra đầu là tốt, các sản phẩm còn lại là xấu d) Có sản phẩm kiểm tra đầu là xấu 1.15 Hai người cùng bắn vào mục tiêu Khả bắn trúng người là 0,8 và 0,9 Tìm xác suất: a) Chỉ có người bắn trúng mục tiêu b) Có người bắn trúng mục tiêu c) Cả hai người bắn trượt 1.16 Cơ cấu chất lượng sản phẩm nhà máy sau: 40% sản phẩm là loại I, 50% sản phẩm là loại II, còn lại là phế phẩm Lấy ngẫu nhiên sản phẩm nhà máy Tính xác suất sản phẩm lấy là phế phẩm 1.17 Có 1000 vé số đó có 20 vé trúng thưởng Một người mua 30 vé, tìm xác suất để người đó trúng vé 1.18 Để nhập kho, sản phẩm nhà máy phải qua vòng kiểm tra chất lượng độc lập Xác suất phát phế phẩm các vòng theo thứ tự là 0,8; 0,9 và 0,99 Tính xác suất phế phẩm nhập kho 1.19 Một thủ kho có chùm chìa khóa gồm trông giống hệt đó có mở kho Anh ta thử ngẫu nhiên chìa khóa một, nào thử thì không thử lại Tính xác suất mở cửa lần thử thứ 1.20 Một lô hàng có sản phẩm Mỗi lần kiểm tra chất lượng lấy ngẫu nhiên sản phẩm Sau kiểm tra xong trả lại vào lô hàng Tính xác suất để sau lần kiểm tra lô hàng, tất các sản phẩm kiểm tra 1.21 Một nhà máy ôtô có ba phân xưởng I, II, III cùng sản xuất loại pít-tông Phân xưởng I, II, III sản xuất tương ứng 36%, 34%, 30% sản lượng nhà máy, với tỷ lệ phế phẩm tương ứng là 0,12; 0,1; 0,08 a) Tìm tỷ lệ phế phẩm chung nhà máy b) Lấy ngẫu nhiên sản phẩm kiểm tra và sản phẩm là phế phẩm Tính xác suất để phế phẩm đó là phân xưởng I, II, III sản xuất 21 (24) Chương 1: Các khái niệm xác suất 1.22 Có bốn nhóm xạ thủ tập bắn Nhóm thứ có người, nhóm thứ hai có người, nhóm thứ ba có người và nhóm thứ tư có người Xác suất bắn trúng đích người nhóm thứ nhất, nhóm thứ hai, nhóm thứ ba và nhóm thứ tư theo thứ tự là 0,8; 0,7; 0,6 và 0,5 Chọn ngẫu nhiên xạ thủ và biết xạ thủ này bắn trượt Hãy xác định xem xạ thủ này có khả nhóm nào 1.23 Bắn hai lần độc lập với lần viên đạn vào cùng bia Xác suất trúng đích viên đạn thứ là 0,7 và viên đạn thứ hai là 0,4 Tìm xác suất để có viên đạn trúng bia (biến cố A) Sau bắn, quan trắc viên báo có vết đạn bia Tìm xác suất để vết đạn đó là vết đạn viên đạn thứ 1.24 Một nhà máy sản xuất chi tiết điện thoại di động có tỷ lệ sản phẩm đạt tiêu chuẩn chất lượng là 85% Trước xuất xưởng người ta dùng thiết bị kiểm tra để kết luận sản phẩm có đạt yêu cầu chất lượng hay không Thiết bị có khả phát đúng sản phẩm đạt tiêu chuẩn với xác suất là 0,9 và phát đúng sản phẩm không đạt tiêu chuẩn với xác suất là 0,95 Tìm xác suất để sản phẩm chọn ngẫu nhiên sau kiểm tra: a) Được kết luận là đạt tiêu chuẩn b) Được kết luận là đạt tiêu chuẩn thì lại không đạt tiêu chuẩn c) Được kết luận đúng với thực chất nó 22 (25) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng CHƯƠNG II: BIẾN NGẪU NHIÊN VÀ CÁC ĐẶC TRƯNG CỦA CHÚNG PHẦN GIỚI THIỆU Trong chương này ta khảo sát các biến cố gắn với các giá trị nào đó, các giá trị này thay đổi ta các biến ngẫu nhiên Khái niệm biến ngẫu nhiên (còn gọi là đại lượng ngẫu nhiên) và các đặc trưng chúng là khái niệm quan trọng lý thuyết xác suất Đối với biến ngẫu nhiên ta quan tâm đến vấn đề biên ngẫu nhiên này nhận giá trị nào đó nhận giá trị khoảng nào đó với xác suất bao nhiêu Nói cách khác biên ngẫu nhiên X có thể khảo sát thông qua hàm phân bố xác suất nó F ( x) = P { X < x} Như ta biết qui luật phân bố xác suất biến ngẫu nhiên thì ta đã nắm toàn thông tin biến ngẫu nhiên này Khi biến ngẫu nhiên nhận các giá trị rời rạc thì hàm phân bố xác suất hoàn toàn xác định bảng phân bố xác suất, đó là bảng ghi các giá trị mà biến ngẫu nhiên nhận với xác suất tương ứng Khi biến ngẫu nhiên nhận giá trị liên tục thì hàm phân bố xác suất xác định hàm mật độ xác suất Ngoài phương pháp sử dụng hàm phân bố để xác định biến ngẫu nhiên, nhiều trường hợp bài toán đòi hỏi cần khảo sát đặc trưng biến ngẫu nhiên Các đặc trưng biến ngẫu nhiên chia thành hai loại sau: Các đặc trưng cho vị trí trung tâm biến ngẫu nhiên như: Kỳ vọng, Trung vị, Mốt Các đặc trưng cho độ phân tán biến ngẫu nhiên như: Phương sai, Độ lệch chuẩn, Hệ số biến thiên, Hệ số bất đối xứng và Hệ số nhọn Trong các bài toán thực tế kỳ vọng sử dụng dạng lợi nhuận kỳ vọng còn phương sai để tính mức độ rủi ro định Trong kỹ thuật độ lệch chuẩn biểu diẽn sai số phép đo Trong chương này ta xét các quy luật phân bố xác suất quan trọng sau: - Quy luật nhị thức, quy luật này thường gặp dãy phép thử Bernoulli - Quy luật Poisson, quy luật này thường gặp bài toán quá trình đếm xuất biến cố A nào đó Quá trình đến các hệ phục vụ - Quy luật phân bố đều, quy luật phân bố trên đoạn là quy luật phân bố xác suất biến ngẫu nhiên liên tục đồng khả lấy giá trị khoảng đó Quy luật phân bố có ứng dụng rộng thống kê toán Nó có ý nghĩa to lớn các bài toán sử dụng phương pháp phi tham số 23 (26) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng - Quy luật phân bố mũ - Quy luật phân bố Erlang-k - Quy luật chuẩn - Quy luật bình phương - Quy luật Student Phân bố chuẩn thường gặp các bài toán sai số đo đạc các đại lượng vật lý, thiên văn Trong thực tế, nhiều biến ngẫu nhiên tuân theo quy luật chuẩn tiệm cận chuẩn (định lý giới hạn trung tâm) chẳng hạn: trọng lượng, chiều cao nhóm người nào đó, điểm thi thí sinh, suất cây trồng, mức lãi suất công ty, nhu cầu tiêu thụ mặt hàng nào đó Với quy luật phân bố xác suất ta khảo sát bảng phân bố xác suất hàm mật độ các tính chất và các đặc trưng nó Để học tốt chương này học viên phải nắm vững định nghĩa xác suất, biến cố và các tính chất chúng Các đặc trưng biến ngẫu nhiên xác định thông qua tính tổng các số hạng nào đó (trường hợp biến ngẫu nhiên rời rạc) tính tích phân xác định (trường hợp biến ngẫu nhiên liên tục) Vì học viên cần ôn tập tích phân xác định NỘI DUNG 2.1 BIẾN NGẪU NHIÊN 2.1.1 Khái niệm biến ngẫu nhiên Định nghĩa 2.1: Biến ngẫu nhiên X là đại lượng nhận các giá trị nào đó phụ thuộc vào các yếu tố ngẫu nhiên, nghĩa là với giá trị thực x ∈ thì {X < x} là biến cố ngẫu nhiên Như biến ngẫu nhiên người ta quan tâm xem nó nhận giá trị nào đó nhận giá trị khoảng nào đó với xác suất bao nhiêu Ví dụ 2.1: Các đại lượng sau là biến ngẫu nhiên • Số nốt xuất gieo xúc xắc • Tuổi thọ thiết bị hoạt động • Số khách hàng vào điểm phục vụ đơn vị thời gian • Số gọi đến tổng đài • Sai số đo lường đại lượng vật lý … 2.1.2 Phân loại Người ta phân các biến ngẫu nhiên thành hai loại: Biến ngẫu nhiên rời rạc nó nhận số hữu hạn vô hạn đếm các giá trị Nghĩa là có thể liệt kê các giá trị thành dãy x1 , x , 24 (27) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng Biến ngẫu nhiên liên tục các giá trị nó có thể lấp đầy các khoảng hữu hạn vô hạn và xác suất P{X = a} không với a Ví dụ 2.2: • Gọi X là số nốt xuất gieo xúc xắc thì X là biến ngẫu nhiên rời rạc nhận các giá trị 1, 2,3, 4,5, • Gọi Y là tuổi thọ thiết bị hoạt động thì Y là biến ngẫu nhiên liên tục nhận giá trị khoảng • Gọi Z là số khách hàng vào điểm phục vụ đơn vị thời gian, Z là biến ngẫu nhiên rời rạc nhận các giá trị 0,1, 2, • Số gọi đến tổng đài là biến ngẫu nhiên rời rạc nhận các giá trị 0,1, 2, • Sai số đo lường đại lượng vật lý Y nào đó là biến ngẫu nhiên liên tục nhận giá trị khoảng 2.1.3 Hàm phân bố xác suất Định nghĩa 2.2: Hàm phân bố xác suất (cumulative distribution function, viết tắt CDF) biến ngẫu nhiên X là hàm số F ( x) xác định với x ∈ công thức: F ( x) = P{X < x}; − ∞ < x < ∞ (2.1) Hàm phân bố có các tính chất sau: a ≤ F ( x) ≤ với x ∈ , (2.2) b F ( x) là hàm không giảm, liên tục bên trái Nếu X là biến ngẫu nhiên liên tục thì F ( x) là hàm liên tục c F (−∞) = lim F ( x) = ; F (+∞) = lim F ( x) = , (2.3) d P{a ≤ X < b} = F (b) − F (a ) (2.4) x →−∞ x → +∞ 2.2 BIẾN NGẪU NHIÊN RỜI RẠC 2.2.1 Bảng phân bố xác suất biến ngẫu nhiên rời rạc Với biến ngẫu nhiên rời rạc chúng ta có thể nghiên cứu thông qua bảng ghi các giá trị mà biến ngẫu nhiên nhận với xác suất tương ứng, đó là bảng phân bố xác suất Giả sử biến ngẫu nhiên X nhận các giá trị x1 , x , với xác suất tương ứng pi = P{X = xi } pi > và ∑ pi = i Bảng phân bố xác suất X có dạng sau: X P x1 p1 25 x2 p2 (28) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng • Nếu biến ngẫu nhiên rời rạc X nhận vô hạn các giá trị x1 , x , thì hàm phân bố có dạng: ⎧ F ( x) = ⎨ ⎩ p1 + p + nÕu + p k −1 nÕu x ≤ x1 x k −1 < x ≤ x k , ∀ k (2.5) Đồ thị F ( x) là hàm bậc thang có bước nhảy x1 , x , • Nếu X nhận các giá trị x1, x2 , , xn thì các biến cố { X = x1} , { X = x2 } , , { X = xn } (2.6) lập thành hệ đầy đủ các biến cố Hàm phân bố có dạng: ⎧ ⎪ F ( x) = ⎨ p1 + p + ⎪ ⎩ nÕu + p k −1 nÕu nÕu x ≤ x1 x k −1 < x ≤ x k (2.7) x > xn Ví dụ 2.3: Chọn ngẫu nhiên bi từ túi có bi đen, bi trắng Gọi X là số bi trắng bi vừa chọn thì X là biến ngẫu nhiên rời rạc Tìm bảng phân bố và hàm phân bố Giải: P { X = 0} = P { X = 2} = C61C42 C10 C63 C10 C43 = = , P { X = 3} = 30 C10 30 Bảng phân bố xác suất: Hàm phân bố: C62C14 15 = = , P { X = 1} = 30 30 C10 X P / 30 15 / 30 / 30 / 30 ⎧0 ⎪5 / 30 ⎪⎪ F ( x) = ⎨20 / 30 ⎪29 / 30 ⎪ ⎪⎩ nÕu x ≤ nÕu < x ≤ nÕu < x ≤ nÕu < x ≤ nÕu x > Đồ thị 26 (29) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng y 30 / 30 29 / 30 20 / 30 / 30 O 2.2.2 Qui luật nhị thức x B (n ; p) Định nghĩa 2.3: Biến ngẫu nhiên rời rạc X nhận các giá trị 0, 1, , n với xác suất tương ứng P{X = k } = C nk p k q n − k (2.8) đó n là số tự nhiên và < p < 1, q = − p , gọi là có phân bố nhị thức tham số n, p , ký hiệu X ~ B (n ; p) Bảng phân bố xác suất biến ngẫu nhiên có quy luật nhị thức B (n ; p) X … k … n P C n0 p q n C 1n p1 q n −1 … C nk p k q n−k … Cnn p n q Nhận xét: Thực n phép thử Bernoulli với xác suất thành công biến cố A lần thử là p Với i = 1, 2, , n ; lần thử thứ i biến cố A xuất ta cho X i nhận giá trị 1, biến cố A không xuất ta cho X i nhận giá trị Như X i là biến ngẫu nhiên rời rạc có bảng phân bố: Xi P 1− p p X i gọi là có phân bố không- A( p) Gọi X là số thành công n phép thử Bernoulli này thì 27 (2.9) (30) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng X = X1 + X + Từ (2.10) suy X ~ + X n ~ B (n ; p) B (n1 ; p) X +Y ~ và Y ~ B (n2 ; p) (2.10) thì B (n1 + n2 ; p) (2.11) 2.2.3 Phân bố Poisson Định nghĩa 2.4: Biến ngẫu nhiên X nhận các giá trị k = 0, 1, 2, với xác suất P { X = k } = e −λ gọi là có phân bố Poisson tham số λ > , ký hiệu X ~ λk k! (2.12) P (λ ) Trong thực tế với số giả thiết thích hợp thì các biến ngẫu nhiên là các quá trình đếm sau: 1) Số gọi đến tổng đài 2) Số khách hàng đến điểm phục vụ 3) Số xe cộ qua ngã tư 4) Số tai nạn (xe cộ); số các cố xảy địa điểm … khoảng thời gian xác định nào đó có phân bố Poisson với tham số λ là tốc độ trung bình diễn khoảng thời gian này Ví dụ 3.3: Ở tổng đài điện thoại các gọi đến cách ngẫu nhiên, độc lập và trung bình có gọi phút Tìm xác suất để: a) Có đúng gọi đến phút (biến cố A) b) Không có gọi nào 30 giây (biến cố B) c) Có ít gọi 10 giây (biến cố C) Giải: Nếu ký hiệu X (t ) là số gọi đến tổng đài khoảng thời gian t phút thì X (t ) ~ P (2t ) a) X (2) ~ P (4) , đó P( A) = P{X (2) = 5} = e −4 45 ≈ 0,156 5! P (1) , đó P( B) = P{X (1 / 2) = 0} = e −1 ≈ 0,3679 X (1 / 6) ~ P (1 / 3) , đó b) X (1 / 2) ~ c) P (C ) = P{X (1 / 6) ≥ 0} = − P{X (1 / 6) = 0} = − e −1 / ≈ 0,2835 Quy luật Poisson có ứng dụng rộng rãi nhiều lĩnh vực thực tế kiểm tra chất lượng sản phẩm, lý thuyết quản trị dự trữ, lý thuyết hàng, các hệ phục vụ đám đông, các bài toán chuyển mạch tổng đài … 28 (31) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng Nếu X , X là hai biến ngẫu nhiên độc lập có phân bố Poisson tham số λ1 , λ thì X + X có phân bố Poisson tham số λ1 + λ2 X1 + X ~ P (λ + λ ) (2.13) 2.3 BIẾN NGẪU NHIÊN LIÊN TỤC 2.3.1 Hàm mật độ phân bố xác suất biến ngẫu nhiên liên tục Định nghĩa 2.5: Giả sử X là biến ngẫu nhiên liên tục có hàm phân bố F (x) Nếu tồn hàm f (x) cho với x ∈ F ( x) = x ∫ f (t )dt (2.14) −∞ thì f ( x) gọi là hàm mật độ biến ngẫu nhiên X (probability density function, viết tắt PDF) Như giá trị hàm F (x) diện tích hình phẳng giới hạn đồ thị hàm mật độ f (x) , trục hoành và đường thẳng song song với trục tung có hoàng độ là x f ( x) F ( x) x x Tính chất hàm mật độ a F ' ( x) = f ( x) các điểm x mà f (x) liên tục b (2.15) f ( x) ≥ với x ∈ , (2.16) ∞ c ∫ f ( x)dx = , (2.17) −∞ b d P{a < X < b} = P{a ≤ X ≤ b} = P{a < X ≤ b} = P{a ≤ X < b} = ∫ f ( x)dx a Ví dụ 2.4: Hàm phân bố xác suất biến ngẫu nhiên liên tục X có dạng 29 (2.18) (32) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng ⎧0 ⎪ F ( x) = ⎨kx ⎪1 ⎩ víi x ≤ víi < x ≤ víi x > a Xác định hệ số k ; b Tìm hàm mật độ xác suất f (x) Giải: a Vì hàm phân bố xác suất F ( x) liên tục, đó x = ⇒ = F (1) = kx x =1 =k b Theo tính chất (2.10) hàm mật độ xác suất ta có ⎧0 ⎪ f ( x) = ⎨2 x ⎪0 ⎩ víi x ≤ víi < x < víi x ≥ Ví dụ 2.5: Biến ngẫu nhiên liên tục X có hàm mật độ dạng víi x < ⎧0 ⎪ f ( x) = ⎨ k ⎪ ⎩x víi x ≥ Hãy xác định: a Hệ số k ; b Hàm phân bố F ( x) ; c Xác suất P{2 < X < 3} ; d Xác suất để phép thử độc lập biến ngẫu nhiên X không lấy giá trị khoảng (2, 3) Giải: ∞ ∞ ⎛k a⎞ ⎟ = k , từ đó k = a Dựa vào tính chất (2.12) ta có = ∫ f ( x)dx = ∫ dx = − lim ⎜ ⎜ ⎟ a → ∞ x x −∞ ⎝ 1⎠ k b Từ công thức (2.9) xác định hàm mật độ ta có víi x < ⎧0 ⎪ F ( x) = ∫ f (t )dt = ⎨ x − víi x ≥ ⎪⎩ x −∞ x c Từ công thức (2.13) ta có P{2 < X < 3} = F (3) − F (2) = 30 1 − = (33) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng = 6 Vậy xác suất để phép thử độc lập biến ngẫu nhiên X không lấy giá trị khoảng d Xác suất để X không lấy giá trị khoảng (2;3) phép thử − ⎛5⎞ (2;3) ⎜ ⎟ ≈ 0,48 ⎝6⎠ 2.3.2 Quy luật phân bố U(a, b) Định nghĩa 2.6: Biến ngẫu nhiên X gọi là có phân bố trên [a , b ] hàm mật độ nó xác định bởi: ⎧ ⎪ f ( x) = ⎨ b − a ⎪⎩ nÕu a ≤ x ≤ b (2.19) nÕu ng−îc l¹i Hàm phân bố nÕu x < a ⎧ ⎪x − a ⎪ F ( x) = ∫ f (t )dt = ⎨ ⎪b − a −∞ ⎪⎩ x nÕu a ≤ x ≤ b (2.20) nÕu x > b Vậy X có khả nhận giá trị khoảng [a , b ] là “đều nhau” và không nhận giá trị ngoài [a , b ] f ( x) F (x) b−a O a x b x Đồ thị hàm mật độ phân bố U(a, b) F ( x) b−a O a b Đồ thị hàm phân bố U(a, b) 31 x (34) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng Quy luật phân bố có nhiều ứng dụng thống kê toán mô thống kê, đặc biệt phương pháp phi tham số Trong số lý thuyết kết luận thống kê người ta thường xuất phát từ quy tắc sau đây: Nếu ta không biết gì giá trị tham số cần ước lượng thì giá trị có thể có tham số đó là đồng khả Điều đó dẫn đến việc quan niệm tham số cần ước lượng biến ngẫu nhiên có quy luật phân bố 2.3.3 Phân bố mũ Định nghĩa 2.7: Biến ngẫu nhiên X gọi là có phân bố mũ tham số λ > có hàm mật độ: ⎧⎪λe −λx f ( x) = ⎨ ⎪⎩ nÕu x > nÕu x ≤ (2.21) Hàm phân bố F ( x) = x ⎧⎪ f t dt = ( ) ⎨ ∫ ⎪⎩1 − e −λx −∞ nÕu x ≤ nÕu x > (2.22) Phân bố mũ thường xuất các bài toán thời gian sống loài sinh vật, tuổi thọ thiết bị… khoảng thời gian hai lần xuất biến cố E nào đó mà số lần xuất E tuân theo luật phân bố Poisson Ví dụ 2.5: Tuổi thọ mạch điện tử máy tính là biến ngẫu nhiên có phân bố mũ tham số λ > Giả sử tuổi thọ trung bình mạch điện tử này là = 6,25 (năm) Thời gian λ bảo hành là năm Hỏi có bao nhiêu phần trăm mạch điện tử bán phải thay thời gian bảo hành Giải: Gọi X là tuổi thọ mạch điện tử Xác suất để mạch điện tử bị hỏng thời gian bảo hành là: P { X ≤ 5} = − e −5 λ = 1− e −5 6,25 = − e −0,8 = − 0, 449 = 0,551 Vậy có khoảng 55% số mạch điện tử bán phải thay thời gian bảo hành Biến ngẫu nhiên X gọi là không nhớ (memoryless) P { X > x + t X > t} = P { X > x} ∀ x, t > P{X > x + t} = P{X > x}P{X > t} ∀ x, t > (2.23) Gọi F ( x) là hàm phân bố X , đặt G ( x) = P{X > x} = − F ( x) Điều kiện (2.23) có thể viết lại G ( x + t ) = G ( x)G (t ) (2.24) Giải phương trình (2.24) với điều kiện G ( x) = 1, ∀x < và G (+∞) = ta G ( x) = e − λx Vậy biến ngẫu nhiên X không nhớ và X có phân bố mũ Vì phân bố mũ còn gọi là phân bố Markov 32 (35) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng 2.3.4 Quy luật phân bố Erlang − k Định nghĩa 2.8: Biến ngẫu nhiên X có phân bố Erlang − k tham số λ > hàm mật độ có dạng: ⎧ λk x k −1e λx ⎪ f ( x) = ⎨ (k − 1)! ⎪ ⎩ nÕu x > (2.25) nÕu x ≤ Có thể chứng minh X , X , , X k là k biến ngẫu nhiên độc lập cùng có phân bố mũ tham số λ > thì X = X + X + + X k có phân bố Erlang − k tham số λ 2.3.5 Quy luật chuẩn N(μ ; σ ) 2.3.5.1 Định nghĩa Định nghĩa 2.9: Biến ngẫu nhiên liên tục X có phân bố chuẩn N (μ ; σ ) , ký hiệu X ~ N (μ ; σ ) , hàm mật độ có dạng f ( x) = e σ 2π − ( x − μ )2 2σ ; ∀ x ∈ (2.26) Phân bố chuẩn Gauss tìm năm 1809 nên nó còn gọi là phân bố Gauss Phân bố chuẩn thường thấy các bài toán sai số gặp phải đo đạc các đại lượng vật lý, thiên văn Trong thực tế, nhiều biến ngẫu nhiên tuân theo quy luật chuẩn tiệm cận chuẩn (Định lý giới hạn trung tâm) Chẳng hạn: trọng lượng, chiều cao nhóm người nào đó, điểm thi thí sinh, suất cây trồng, mức lãi suất công ty, nhu cầu tiêu thụ mặt hàng nào đó 2.3.5.2 Tính chất đồ thị hàm mật độ quy luật chuẩn Từ công thức xác định hàm mật độ (2.26) ta suy các tính chất sau đồ thị: - Nhận trục x = μ làm trục đối xứng - Tiệm cận với trục hoành x → ±∞ - Diện tích giới hạn đồ thị và trục hoành - Đạt cực đại x = μ và có giá trị cực đại - Do đó μ tăng lên thì đồ thị dịch sang phải, còn μ giảm đồ thị dịch sang trái - Khi σ tăng lên thì đồ thị thấp xuống, còn σ giảm đồ thị cao lên và nhọn 33 σ 2π Có điểm uốn x = μ ± σ (36) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng y σ <1 σ =1 σ >1 x=μ O x Nếu X , X là hai biến ngẫu nhiên độc lập có phân bố chuẩn X ~ N (μ1 ; σ12 ) và X ~ N (μ ; σ 22 ) thì tổ hợp tuyến tính X , X có phân bố chuẩn, đặc biệt X + X ~ N (μ1 + μ ; σ12 + σ 22 ) (2.27) 2.3.5.3 Phân bố chuẩn tắc Phân bố chuẩn N (0 ;1) với kỳ vọng 0, phương sai gọi là phân bố chuẩn tắc Hàm mật độ N (0 ;1) 2π ϕ ( x) = − x2 e ; ∀ x ∈ (2.28) Hàm phân bố N (0 ;1) x Φ ( x) = ∫ ϕ (t )dt = 2π −∞ x ∫ −t e dt ; ∀ x ∈ −∞ Có bảng tính sẵn các giá trị ϕ ( x) và Φ ( x) (xem Phụ lục I và Phụ lục II) Đồ thị hàm mật độ ϕ (x) 34 (2.29) (37) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng y 2π Φ(−a) − Φ(a) O −a a x Các tính chất hàm phân bố Φ (x) 1) Φ ( x) + Φ ( − x ) = , Φ ( − x) = − Φ ( x) 2) Nếu X ~ N (0 ;1) thì ∀ a > 0, P { X < a} = 2Φ (a) − 1, P { X > a} = (1 − Φ (a) ) (2.30) Định nghĩa 2.10: Giá trị U α gọi là giá trị tới hạn phân bố chuẩn tắc mức α Φ −1 (1 − α) = U α (2.31) Nếu X ~ N (0 ;1) thì ⎧⎪ ⎫⎪ ⎧⎪ ⎫⎪ P { X > Uα } = α ; P ⎨ X > U α ⎬ = α ; P ⎨ X < U α ⎬ = − α 2⎪ 2⎪ ⎩⎪ ⎭ ⎩⎪ ⎭ (2.32) Người ta chứng minh được: Nếu X ~ N (μ ; σ ) thì X −μ ~ N (0 ;1) σ (2.33) Từ đó ta có ⎧ X − μ x − μ⎫ ⎛ x−μ⎞ < F ( x) = P{X < x} = P ⎨ ⎟ ⎬ = Φ⎜ σ ⎭ ⎩ σ ⎝ σ ⎠ ⎛a−μ⎞ ⎧a − μ X − μ b − μ⎫ ⎛b−μ⎞ < < P{a < X < b} = P ⎨ ⎟ ⎟ − Φ⎜ ⎬ = Φ⎜ σ ⎭ σ ⎝ σ ⎠ ⎩ σ ⎝ σ ⎠ (2.33)’ (2.33)” Xác suất sai lệch biến ngẫu nhiên có quy luật chuẩn X ~ N (μ ; σ ) và kỳ vọng nó tính theo công thức ⎛ε P { X − μ < ε } = 2Φ ⎜ ⎝σ 35 ⎞ ⎟ −1 ⎠ (2.34) (38) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng Ví dụ 3.4: Giả sử X ~ N (μ ; σ ) , μ = 2100, σ = 200 Hãy tìm: a) P{X > 2400} b) P{1700 < X < 2200} c) Xác định a để P{X > a} = 0,03 Giải: ⎛ 2400 − 2100 ⎞ a) P{X > 2400} = − Φ⎜ ⎟ = − Φ (1,5) = − 0,9332 = 0,0668 200 ⎠ ⎝ b) Áp dụng công thức (3.23): ⎛ 1700 − 2100 ⎞ ⎛ 2200 − 2100 ⎞ P{1700 < X < 2200} = Φ⎜ ⎟ = Φ(0,5) − Φ( −2) = 0,6688 ⎟ − Φ⎜ 200 200 ⎠ ⎝ ⎠ ⎝ ⎛ a − 2100 ⎞ ⎛ a − 2100 ⎞ c) P{X > a} = − Φ⎜ ⎟ = 0,97 ⎟ = 0,03 ⇒ Φ⎜ ⎝ 200 ⎠ ⎝ 200 ⎠ Tra bảng ta 0,97 = Φ (1,881) ⇒ a − 2100 = 1,881 ⇒ a = 2476,2 200 2.3.5.4 Quy tắc hai xích ma và ba xích ma Nếu công thức (3.27) ta đặt ε = 2σ tức là hai lần độ lệch chuẩn X thì P { X − μ < 2σ } = 2Φ ( ) − = 0,9544 Vậy P {μ − 2σ < X < μ + 2σ } = 0,9544 (2.35) Tương tự thay ε = 3σ ta P {μ − 3σ < X < μ + 3σ } = 0,9973 (2.36) Hai công thức trên là sở quy tắc hai xích ma và ba xích ma: Nếu X có phân bố chuẩn N (μ ; σ ) thì có đến 95,44% giá trị X nằm khoảng ( μ − 2σ ; μ + 2σ ) và toàn giá trị X nằm khoảng ( μ − 3σ ; μ + 3σ ) 2.3.6 Quy luật bình phương Định nghĩa 2.11: Biến ngẫu nhiên liên tục X có phân bố “khi bình phương” n bậc tự do, ký hiệu X ~ χ 2n hàm mật độ có dạng x ⎧ x n / −1 − ⎪ e f ( x) = ⎨ n / Γ(n / 2) ⎪ ⎩ 36 nÕu x > nÕu x ≤ (2.37) (39) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng đó Γ( x) = +∞ ∫t x −1 −t e dt là hàm Gamma Có thể chứng minh X , X , , X n là các biến ngẫu nhiên độc lập có cùng phân bố chuẩn tắc N (0,1) thì n ∑ X i2 = X 12 + X 22 + i =1 + X n2 ~ χ 2n (2.38) Phân bố χ Karl Pearson đưa vào năm 1900 Từ (3.34) suy X , X là hai biến ngẫu nhiên độc lập có phân bố bình phương n1 và n2 bậc tự thì X1 + X là biến ngẫu nhiên có phân bố bình phương n1 + n2 bậc tự X + X ~ χ 2n1 + n2 (2.39) y α O χ α2 (n) x Giá trị tới hạn bình phương n bậc tự mức α , ký hiệu χ α (n) , định nghĩa sau: { } P χ > χ α2 (n) = α (2.40) (n) tính sẵn bảng Phụ lục III Bảng các giá trị tới hạn χ α 2.3.7 Quy luật student T(n) Định nghĩa 2.12: Biến ngẫu nhiên liên tục T có phân bố Student n bậc tự do, ký hiệu T ~ T(n) , hàm mật độ có dạng: −( n +1) ⎛ n + 1⎞ Γ⎜ ⎟ ⎛ 2⎞ 2 ⎠ ⎜ t ⎟ f (t ) = ⎝ 1+ , −∞ < t < ∞ n ⎟⎠ nπΓ(n / ) ⎜⎝ 37 (2.41) (40) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng đó Γ(x) là hàm Gamma Người ta chứng minh Z ~ N (0 ;1) , V ~ χ 2n ; Z và V độc lập thì T= Z V n ~ T( n ) (2.42) Giá trị tới hạn mức α phân bố Student n bậc tự ký hiệu t n (α) thỏa mãn: P{T > t α (n)} = α (2.43) Bảng tính các giá trị tới hạn t α (n) cho Phụ lục IV Hàm mật độ (3.38) là hàm chẵn nên đồ thị đối xứng qua trục tung Khi số bậc tự tăng lên, phân bố Student hội tụ nhanh phân bố chuẩn tắc N (0;1) Do đó n đủ lớn ( n ≥ 30 ) có thể dùng phân bố chuẩn tắc thay cho phân bố Student Tuy nhiên n nhỏ ( n < 30 ) việc thay trên gặp sai số lớn f (t ) α α t α −1 (n) O t α (n) t 2.4 CÁC THAM SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN 2.4.1 Kỳ vọng toán 2.4.1.1 Định nghĩa Kỳ vọng giá trị trung bình (average, mean value, expected value) biến ngẫu nhiên X ký hiệu là EX và xác định sau: (i) Nếu X rời rạc nhận các giá trị xi với xác suất tương ứng pi = P{X = xi } thì E X = ∑ xi p i i (ii) Nếu X liên tục có hàm mật độ f ( x) thì 38 (2.44) (41) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng EX = ∞ ∫ xf ( x)dx (2.45) −∞ Kỳ vọng E X tồn chuỗi (2.44) (trường hợp rời rạc) hội tụ tuyệt đối tích phân (2.45) (trường hợp liên tục) hội tụ tuyệt đối Ví dụ 2.6: Tính kỳ vọng biến ngẫu nhiên X cho ví dụ 2.3 Giải: E X = × 15 + 1× + × + × = 30 30 30 30 Ví dụ 2.7: Theo thống kê việc người Mỹ 25 tuổi sống thêm trên năm có xác suất là 0,992, còn xác suất để người đó chết vòng năm tới là 0,008 Một chương trình bảo hiểm đề nghị người đó bảo hiểm sinh mạng cho năm với số tiền chi trả 1000 đô la, còn tiền đóng là 10 đô la Hỏi lợi nhuận công ty bảo hiểm nhận là bao nhiêu? Giải: Rõ ràng lợi nhuận là biến ngẫu nhiên X với giá trị là + 10 đô la (nếu người bảo hiểm không chết) và − 990 đô la (nếu người đó chết) Bảng phân bố xác suất tương ứng X − 990 + 10 P 0,008 0,992 Do đó kỳ vọng E X = (−990) ⋅ 0,008 + 10 ⋅ 0,992 = Ta thấy lợi nhuận trung bình là số dương vì công ty bảo hiểm có thể làm ăn có lãi Ví dụ 2.8: Tuổi thọ loại côn trùng nào đó là biến ngẫu nhiên X (đơn vị là tháng) với hàm mật độ sau: ⎧⎪kx (4 − x) nÕu ≤ x ≤ f ( x) = ⎨ ⎪⎩ nÕu ng−îc l¹i Tìm hàm phân bố và tìm tuổi thọ trung bình loài côn trùng trên Giải: Vì ∫x (4 − x)dx = 64 ⇒ k= Hàm phân bố xác suất 64 ⎧ ⎪ x ⎪ 3x ⎛ x ⎞ F ( x) = ∫ f (t )dt = ⎨ ⎜ − ⎟ 64 ⎝3 4⎠ ⎪ −∞ ⎪ ⎩ nÕu x≤0 nÕu < x ≤ nÕu x>4 3 ⎛⎜ x ⎞⎟ ( ) Tuổi thọ trung bình E X = x x dx x − − = 64 ∫0 64 ⎜⎝ ⎟⎠ = 12 (tháng) 2.4.1.2 Ý nghĩa kỳ vọng Kỳ vọng mang ý nghĩa là giá trị trung bình mà biến ngẫu nhiên nhận Giả sử biến ngẫu nhiên X nhận các giá trị x1 , x , , x m với các tần số tương ứng r1 , r2 , , rm 39 (42) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng ri xi là tổng giá trị X nhận với cùng giá trị xi Do đó r1 x1 + r2 x + tổng tất các giá trị X nhận đó r1 + r2 + r1 x1 + r2 x + n + rm x m + rm x m là là giá trị trung bình X , + rm = n ri gọi là tần suất nhận giá trị xi X Trong trường hợp tổng quát thì tần n suất f i thay xác suất pi fi = Trường hợp biến ngẫu nhiên liên tục phép tính tổng giá trị trung bình thay phép tính tích phân xác định Khái niệm kỳ vọng áp dụng rộng rãi nhiều lĩnh vực Trong kinh doanh và quản lý, kỳ vọng ứng dụng dạng lợi nhuận kỳ vọng hay doanh số kỳ vọng 2.4.1.3 Tính chất 1) E (C ) = C với số C 2) E (CX ) = CE ( X ) với số C (2.46) 3) E ( X + (2.47) + X n ) = E (X1 ) + + E (X n ) 4) Cho hàm số ϕ (x) , xét biến ngẫu nhiên Y = ϕ ( X ) thì { } ⎧ ∑ ϕ( xi ) pi nÕu X rêi r¹c cã pi = P X = xi ⎪ i ⎪ EY = ⎨ ∞ ⎪ ϕ(x)f(x)dx nÕu X liª n tôc cã hµm mËt đé f ( x) ⎪⎩ −∫∞ (2.48) Đặc biệt ta có các đẳng thức sau tổng tích phân sau tương ứng hội tụ: ⎧ ∑ xi2 pi nÕu X rêi r¹c ⎪ i ⎪ EX =⎨ ∞ ⎪ x f(x)dx nÕu X liª n tôc cã hµm mËt đé ∫ ⎪⎩ −∞ (2.49) f ( x) 5) Giả sử ϕ ( x, y ) là hàm hai biến cho ϕ ( X , Y ) còn là biến ngẫu nhiên, đó: { } ⎧ ∑ ϕ( xi , y j ) pij nÕu X rêi r¹c cã pij = P X = xi , Y = y j ⎪ i, j ⎪ E ϕ( X , Y ) = ⎨ ∞ ∞ ⎪ ϕ(x, y)f(x, y)dxdy nÕu ( X , Y ) liª n tôc cã hµm mËt đé f ( x, y ) ⎪ −∫∞ −∫∞ ⎩ 6) Nếu X , , X n độc lập thì E ( X X n ) = E (X1 ) E (X n ) Ví dụ 2.10: Chọn ngẫu nhiên bi từ túi có bi đen, bi trắng 40 (2.50) (2.51) (43) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng a) Nếu chọn bi trắng thưởng 200$ Gọi Y là số tiền nhận Tính kỳ vọng Y b) Nếu chọn bi trắng thưởng 200$ và chọn bi đen thưởng 300$ Gọi Z là số tiền nhận Tính kỳ vọng Z Giải: a) Gọi X là số bi trắng bi vừa chọn (xem ví dụ 2.3) thì Y = ϕ( X ) = 200 X là biến ngẫu nhiên rời rạc có bảng phân bố sau: Y = ϕ( X ) P EY = × 200 400 600 / 30 15 / 30 / 30 / 30 15 + 200 × + 400 × + 600 × = 240 = 200E X 30 30 30 30 b) Z = 200 X + 300(3 − X ) = 900 − 100 X ⇒ E Z = E (900 − 100 X ) = 900 − 100EX = 900 − 100 × = 780$ Ví dụ 2.11: Tung xúc xắc n lần Tìm kỳ vọng tổng số nốt thu Giải: Gọi X i (i = 1, , n) là số nốt thu lần tung thứ i , gọi X là tổng số nốt thu n n i =1 i =1 n lần tung Như X = ∑ X i Theo công thức (3.5) ta có E X = ∑ E X i Các biến ngẫu nhiên X i có bảng phân bố xác suất sau Xi P Do đó E X i = 1/ 1/ 1/ 1/ 1/ 1/ (1 + + + + + 6) = ⇒ EX = n 2.4.2 Phương sai 2.4.2.1 Định nghĩa Phương sai (variance) hay độ lệch bình phương trung bình biến ngẫu nhiên X là đại lượng đo phân tán bình phương trung bình X xung quanh giá trị trung bình EX Phương sai X ký hiệu là DX hay var X và định nghĩa sau: DX = E ( X − E X ) (2.52) σ X = DX gọi là độ lệch tiêu chuẩn (deviation) X Khai triển vế phải công thức (2.52) và áp dụng các tính chất kỳ vọng ta có thể tính phương sai theo công thức sau: 41 (44) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng DX = E X − ( E X ) (2.53) Theo công thức (2.49) thì phương sai có thể tính theo công thức sau: (i) Nếu X rời rạc nhận các giá trị với xác suất tương ứng pi = P{X = xi } thì D X = ∑ ( xi − E X )2 pi = ∑ xi2 pi − (E X )2 i (2.54) i (ii) Nếu X liên tục có hàm mật độ f (x) thì DX = ∞ ∫ (x − E X ) f ( x)dx = −∞ ∞ ∫x f ( x)dx − (E X )2 (2.55) −∞ Ví dụ 2.12: Tính phương sai biến ngẫu nhiên xét ví dụ 2.7 Giải: E X = (−990) ⋅ 0, 008 + 102 ⋅ 0,992 = 7940 ⇒ DX = EX − ( EX ) = 7940 − = 7936 ⇒ σ X = DX = 7936 ≈ 89,08 Điều này nói lên mặc dù kinh doanh bảo hiểm có lãi rủi ro khá lớn Ví dụ 2.13: Tính phương sai biến ngẫu nhiên xét ví dụ 2.8 Giải: E X 3 ⎛⎜ x x ⎞⎟ x (4 − x)dx = = − 64 ∫0 64 ⎜⎝ ⎟⎠ ⇒ DX = EX − (EX )2 = = 32 32 ⎛ 12 ⎞ 16 −⎜ ⎟ = ⇒ σX = ⎝5⎠ 25 Phương sai biến ngẫu nhiên X là độ lệch bình phương trung bình quanh giá trị trung bình E X Trong kỹ thuật phương sai đặc trưng cho mức độ phân tán các chi tiết gia công hay sai số thiết bị Trong quản lý và kinh doanh thì phương sai đặc trưng cho mức độ rủi ro các định Ví dụ 2.8 cho thấy đầu tư bảo hiểm cho người 25 tuổi là có lãi, ví dụ 2.12 cho thấy rủi ro bảo hiểm lớn 2.4.2.2 Tính chất 1) D(a) = với số a 2) D(aX ) = a D( X ) với số a 3) D(aX + b) = a D( X ) với số a, b 4) Nếu X , , X n độc lập có các phương sai hữu hạn thì D ( a1 X1 + (2.56) + an X n ) = a12 D ( X1 ) + 42 (2.57) + a 2n D ( X n ) (2.58) (45) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng Nói riêng: Nếu X , Y độc lập và DX , DY hữu hạn thì D ( X ± Y ) = DX + DY Ví dụ 2.15: Tung xúc xắc n lần độc lập Tìm phương sai tổng số nốt xuất n Giải: Xét X = ∑ X i ví dụ 2.11 Vì các X i (i = 1, , n) độc lập nhau, đó theo công i =1 n thức (2.58) ta có DX = ∑ DX i i =1 Mặt khác E X i = Do đó DX i = ( ) 91 ; E X i2 = 12 + 2 + + + + = 6 91 35 35 − = Vậy DX = n 12 12 2.4.3 Phân vị, Trung vị 2.4.3.1 Phân vị Phân vị mức α biến ngẫu nhiên X có hàm phân bố F (x) là giá trị vα thỏa mãn P{X < vα } ≤ α ≤ P{X ≤ vα } F (vα ) ≤ α ≤ F (vα + 0) Hay • (2.59) Nếu F (x) liên tục tăng chặt thì phân vị vα là nghiệm phương trình F (x) = α , nghĩa là vα = F −1 (α ) • Nếu X rời rạc có phân bố: X P x1 p1 x2 … p2 … ⎧ m, ∀ m ∈ [xi , xi +1 ] vα = ⎨ ⎩ xi +1 (2.60) đặt Pi = p1 + nÕu Pi = α < Pi +1 nÕu Pi < α < Pi +1 + pi thì (2.61) 2.4.3.2 Trung vị Phân vị mức 1/2 gọi là median hay trung vị X , ký hiệu MedX Như trung vị là điểm phân chia phân bố xác suất thành hai phần 2.4.4 Mốt Mốt (Mode) biến ngẫu nhiên X là giá trị mà biến ngẫu nhiên X nhận với xác suất lớn 43 (46) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng • X P Nếu X rời rạc có phân bố: x1 p1 xi0 = Mod X ⇔ • x2 … p2 … thì pi0 = max{p1 , p , } (2.62) Nếu X liên tục có hàm mật độ f ( x) c = Mod X ⇔ f (c) = max{ f ( x) , x ∈ } (2.63) Ví dụ 2.16: Biến ngẫu nhiên X ví dụ 2.3 có Mốt và trung vị ModX = MedX = Ví dụ 2.17: Tìm trung vị và Mốt biến ngẫu nhiên rời rạc có bảng phân bố xác suất X 20 21 22 23 24 P 0,3 0,25 0,18 0,14 0,13 Giải: Dễ thấy ModX = 20 Hàm phân bố xác suất X ⎧0 ⎪ 0,3 ⎪ ⎪⎪ 0,55 F ( x) = ⎨ ⎪ 0,73 ⎪ 0,87 ⎪ ⎪⎩ nÕu x ≤ 20 nÕu 20 < x ≤ 21 nÕu 21 < x ≤ 22 nÕu 22 < x ≤ 23 nÕu 23 < x ≤ 24 nÕu x > 24 Từ đó suy MedX = 21 Ví dụ 2.18: Tìm MedX và ModX biến ngẫu nhiên liên tục X xét ví dụ 2.4 Giải: MedX là nghiệm phương trình F ( x) = x = ⎧0 ⎪ Hàm mật độ f ( x) = ⎨2 x ⎪0 ⎩ 1 ⇒ MedX = 2 víi x ≤ víi < x ≤ đạt cực đại x = , ModX = víi x > Ví dụ 2.19: Tìm MedX và ModX biến ngẫu nhiên liên tục X có hàm mật độ xác định sau ⎧3 ⎪ x(2 − x ) f ( x) = ⎨ ⎪⎩ Giải: Hàm phân bố xác suất 44 víi ≤ x ≤ nÕu tr¸i l¹i (47) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng víi x ≤ ⎧ ⎪ x3 ⎞ ⎪3 ⎛ F ( x) = ⎨ ⎜ x − ⎟ víi < x ≤ ⎜ ⎟⎠ ⎪4 ⎝ ⎪ víi x > ⎩ ⎧⎪ x − 3x + = Từ đó MedX = ⇔⎨ ⎪⎩0 < x ≤ MedX là nghiệm phương trình F ( x) = ⎧3 ⎪ (1 − x ) víi < x < Hàm mật độ f (x) có đạo hàm f ' ( x) = ⎨ ⎪⎩ nÕu tr¸i l¹i sang âm qua x = , đó đạt cực đại điểm này Vậy ModX = đổi dấu từ dương 2.4.5 Moment, hệ số bất đối xứng, hệ số nhọn 1) Moment cấp k mk = EX k ; k = 1, 2, (2.64) 2) Moment quy tâm cấp k μ k = E ( X − EX )k ; k = 1, 2, (2.65) 3) Hệ số bất đối xứng α3 = 4) Hệ số nhọn α4 = μ3 σ3 μ4 σ4 với σ = DX (2.66) (2.67) Nhận xét: m1 = EX , μ1 = , μ = DX α đo mức độ bất đối xứng luật phân bố : Nếu α < thì phân bố xác suất và đồ thị hàm mật độ lệch bên trái α = thì phân bố xác suất và đồ thị hàm mật độ đối xứng α > thì phân bố xác suất và đồ thị hàm mật độ lệch bên phải Hệ số nhọn α đặc trưng cho độ nhọn đồ thị hàm mật độ so với đồ thị hàm mật độ phân bố chuẩn Với biến ngẫu nhiên có phân bố chuẩn thì α = α > thì đồ thị hàm mật độ nhọn so với đồ thị hàm mật độ chuẩn α < thì đồ thị hàm mật độ tù so với đồ thị hàm mật độ chuẩn Khi phân bố X đối xứng gần đối xứng thì dùng kỳ vọng để định vị là tốt nhất, song phân bố X quá lệch thì nên dùng Median và Mode để định vị 45 (48) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng 2.5 HÀM ĐẶC TRƯNG 2.5.1 Định nghĩa Hàm đặc trưng biến ngẫu nhiên X ký hiệu là ϕ X (t ) và định nghĩa biểu thức: ∞ ( ) = ∫ eitx f X ( x)dx ϕ X (t ) = E e itX (2.68) −∞ đó f X (x) hàm mật độ biến ngẫu nhiên X , i là đơn vị ảo thỏa mãn i = −1 2.5.2 Tính chất 1) Hàm đặc trưng là biến đổi Fourier ngược hàm mật độ ϕ X (t ) = F −1{ f X ( x)} Vì hàm đặc trưng có các tính chất biến đổi Fourier 2) ϕ X (t ) ≤ ϕ X (0) = 3) ϕ X (t ) xác định không âm 4) Nếu biến ngẫu nhiên X có môment cấp k thì ϕ X (t ) có đạo hàm đến cấp k và [ ] E Xk = i k ) ϕ (k X (0) (2.69) 5) Các biến ngẫu nhiên X , X , , X n độc lập và ϕ X1 + X + + X n (t ) = ϕ X1 (t ) ϕ X n (t ) (2.70) 6) Nếu hàm đặc trưng ϕ X (t ) có biến đổi Fourier (khả tích tuyệt đối và thỏa mãn điều kiện Dirichlet) thì hàm mật độ tính theo công thức: f X ( x) = 2π ∞ ∫e −itx −∞ ϕ X (t )dt (2.71) 2.5.3 Các đặc trưng các quy luật phân bố xác suất thường gặp Quy luật xác suất Kỳ vọng Phương sai Hàm đặc trưng (peit + q )n Nhị thức X ~ B (n ; p) EX = np DX = npq Poisson X ~ P (λ ) EX = λ DX = λ Đều X ~ U(a, b) X có phân bố mũ tham số λ > EX = a+b EX = DX = λ it ) −1 (b − a ) 12 e ibt − e iat it (b − a) λ λ − it DX = 46 e λ (e λ (49) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng Chuẩn X ~ N( μ ; σ ) EX = μ DX = σ Erlang-k X ~ E k (λ ) k EX = λ DX = iμt − σ2t 2 e λk k (λ − it )k λ2 TÓM TẮT Biến ngẫu nhiên Biến ngẫu nhiên X là đại lượng nhận các giá trị nào đó phụ thuộc vào các yếu tố ngẫu nhiên, nghĩa là với giá trị thực x ∈ thì {X < x} là biến cố ngẫu nhiên Người ta phân các biến ngẫu nhiên thành hai loại: Biến ngẫu nhiên rời rạc nó nhận số hữu hạn vô hạn đếm các giá trị Nghĩa là có thể liệt kê các giá trị thành dãy x1 , x , Biến ngẫu nhiên liên tục các giá trị nó có thể lấp đầy các khoảng hữu hạn vô hạn và xác suất P{X = a} không với a Hàm phân bố xác suất Hàm phân bố xác suất biến ngẫu nhiên X là hàm số F ( x) xác định với x ∈ công thức: F ( x) = P{X < x}; − ∞ < x < ∞ Bảng phân bố xác suất biến ngẫu nhiên rời rạc Giả sử biến ngẫu nhiên X nhận các giá trị x1 , x , với xác suất tương ứng pi = P{X = xi } pi > và ∑ pi = Bảng phân bố xác suất X có dạng sau: i X P x1 p1 x2 p2 Hàm mật độ phân bố xác suất biến ngẫu nhiên liên tục Giả sử X là biến ngẫu nhiên liên tục có hàm phân bố F ( x) Hàm mật độ biến ngẫu nhiên X là hàm f (x) cho với x ∈ , F ( x) = x ∫ f (t )dt −∞ Kỳ vọng Kỳ vọng giá trị trung bình biến ngẫu nhiên X ký hiệu là EX và xác định sau: Nếu X rời rạc nhận các giá trị xi với xác suất tương ứng pi = P{X = xi } thì E X = ∑ xi p i i 47 (50) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng Nếu X liên tục có hàm mật độ f (x) thì E X = ∞ ∫ xf ( x)dx −∞ Phương sai Phương sai hay độ lệch bình phương trung bình biến ngẫu nhiên X là đại lượng đo phân tán bình phương trung bình X xung quanh giá trị trung bình EX Phương sai X ký hiệu là DX hay var X và định nghĩa sau: DX = E ( X − E X ) Độ lệch tiêu chuẩn σ X = DX gọi là độ lệch tiêu chuẩn X Phân vị Phân vị mức α biến ngẫu nhiên X có hàm phân bố F (x) là giá trị vα thỏa mãn P{X < vα } ≤ α ≤ P{X ≤ vα } hay F (vα ) ≤ α ≤ F (vα + 0) Trung vị Phân vị mức 1/2 gọi là median hay trung vị X , ký hiệu MedX Như trung vị là điểm phân chia phân bố xác suất thành hai phần Mốt Mốt (Mode) biến ngẫu nhiên X là giá trị mà biến ngẫu nhiên X nhận với xác suất lớn Nếu X rời rạc có phân bố: X P x2 … p2 … x1 p1 thì xi0 = Mod X ⇔ pi0 = max{p1 , p , } Nếu X liên tục có hàm mật độ f (x) thì c = Mod X ⇔ f (c) = max{ f ( x) , x ∈ } Moment, hệ số bất đối xứng, hệ số nhọn Moment cấp k mk = EX k ; k = 1, 2, Moment quy tâm cấp k μ k = E ( X − EX )k ; k = 1, 2, Hệ số bất đối xứng α3 = Hệ số nhọn α4 = Hệ số bất đối xứng α đo mức độ bất đối xứng luật phân bố Hệ số nhọn α cho phép bổ sung thêm thông tin phương sai phân bố μ3 σ3 μ4 σ4 với σ = DX 48 (51) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng CÂU HỎI ÔN TẬP VÀ BÀI TẬP 2.1 Biến ngẫu nhiên luôn luôn nhận giá trị dương Đúng Sai 2.2 Biến ngẫu nhiên rời rạc nhận số hữu hạn các giá trị Đúng Sai 2.3 Nếu biến ngẫu nhiên X rời rạc nhận các giá trị x1 , , x n thì hệ các biến cố {X = x1 } , …, {X = x n } lập thành hệ đầy đủ Đúng Sai 2.4 Kỳ vọng biến ngẫu nhiên rời rạc là giá trị nó lấy thường xuyên Đúng Sai 2.5 Kỳ vọng tổng hai biến ngẫu nhiên luôn luôn tổng các kỳ vọng nó Đúng Sai 2.6 Hai biến ngẫu nhiên có cùng kỳ vọng có cùng phương sai Đúng Sai 2.7 Phương sai tổng hai biến ngẫu nhiên rời rạc luôn luôn tổng phương sai nó Đúng Sai 2.8 Biến ngẫu nhiên tồn phương sai thì tồn kỳ vọng Đúng Sai 2.9 Hàm mật độ f (x) biến ngẫu nhiên liên tục có tính chất f ( x) ≥ Đúng Sai 2.10 Tổng hai biến ngẫu nhiên phân bố theo quy luật nhị thức luôn luôn là biến ngẫu nhiên phân bố theo quy luật nhị thức Đúng Sai 2.11 Biến ngẫu nhiên phân bố theo quy luật Poisson là biến ngẫu nhiên rời rạc nên nhận số hữu hạn các giá trị Đúng Sai 2.12 Nếu X là biến ngẫu nhiên phân bố theo quy luật Poisson tham số λ >0 thì kỳ vọng, phương sai và mốt X λ Đúng Sai 2.13 Nếu biến ngẫu nhiên X phân bố theo quy luật chuẩn N (μ; σ ) thì xác suất sai lệch ⎛ε⎞ X và kỳ vọng nó thỏa mãn P{ X − μ < ε} = 2Φ⎜ ⎟ − ⎝σ⎠ Đúng Sai 49 (52) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng 2.14 Nếu biến ngẫu nhiên X phân bố theo quy luật chuẩn N (μ; σ ) thì X −μ phân bố theo σ quy luật chuẩn tắc N (0;1) Đúng Sai 2.15 Biến ngẫu nhiên phân bố theo quy luật Student nhận giá trị dương Đúng Sai 2.16 Biến ngẫu nhiên X có bảng phân bố X −5 P 0, 0,3 0,1 0, Tính kỳ vọng EX và phương sai DX 2.17 Biến ngẫu nhiên rời rạc X nhận ba giá trị có thể có là x1, x2 , x3 Biết x1 = 4, x2 = 0, với xác suất tương ứng p1 = 0,5 , p2 = 0,3 và có kỳ vọng EX = Tìm x3 và p3 2.18 Cho X và X là hai biến ngẫu nhiên độc lập có bảng phân bố xác suất sau: X1 X2 P 0,3 0,5 0,2 P 0,2 0,8 a) Tính EX ; EX ; DX ; DX b) Tính E( X + X ) và D( X + X ) 2.19 Cho X , X , X là ba biến ngẫu nhiên độc lập có bảng phân bố xác suất sau: X1 X2 X3 P 0,6 0,4 P 0,4 0.6 P 0,8 0.2 Lập X = X1 + X + X Tính E ( X ) ; D( X ) 2.20 Hai biến ngẫu nhiên X , Y độc lập Tính D(Z ) với: a) Z = X + 3Y b) Z = −3 X + Y Cho biết D( X ) = , D(Y) = 2.21 Biến ngẫu nhiên rời rạc X nhận các giá trị có thể có là x1 = −1; x = ; x3 = Tìm các xác suất tương ứng p1 ; p ; p3 biết E ( X ) = 0,1 và D( X ) = 0,89 2.22 Xếp ngẫu nhiên hành khách lên toa tầu I, II, III Gọi X là số khách lên toa I và Y là số khách lên toa II và III a) Tính xác suất để toa có khách b) Lập bảng phân bố xác suất biến ngẫu nhiên X và biến ngẫu nhiên Y 50 (53) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng 2.23 Tính kỳ vọng biến ngẫu nhiên liên tục X có hàm mật độ xác suất ⎧ cos x nÕu x ∈ ( −π / 2; π / ) ⎪ f ( x) = ⎨ ⎪0 nÕu x ∉ ( −π / 2; π / ) ⎩ 2.24 Tuổi thọ loài côn trùng nào đó là biến ngẫu nhiên X (đơn vị là tháng) với hàm mật độ sau ⎧⎪ kx (2 − x) nÕu ≤ x ≤ f ( x) = ⎨ nÕu tr¸i l¹i ⎪⎩0 a) Tìm k ; b) Tính xác suất để côn trùng chết trước nó tháng tuổi; c) Tìm EX , DX 2.25 Hai xạ thủ A và B tập bắn Mỗi người bắn hai phát Xác suất bắn trúng đích A lần bắn là 0,4; còn B là 0,5 a) Gọi X là số phát bắn trúng A trừ số phát bắn trúng B Tìm phân bố xác suất X , kỳ vọng EX và phương sai DX b) Tìm phân bố xác suất Y = X và kỳ vọng EY 2.26 Một xí nghiệp có hai ôtô vận tải hoạt động Xác suất ngày làm việc các ôtô bị hỏng tương ứng 0,1 và 0,2 Gọi X là số ôtô bị hỏng thời gian làm việc Lập bảng phân bố xác suất, tính kỳ vọng EX và phương sai DX X 2.27 Cho biến ngẫu nhiên rời rạc X có bảng phân bố xác suất X P k 2k 2k 3k k2 k2 k2 + k a) Xác định k b) Tính xác suất P { X ≥ 5} và P { X < 3} c) Tính kỳ vọng EX d) Tính phương sai DX 2.28 Có sản phẩm đó có chính phẩm và phế phẩm Người ta lấy sản phẩm (lấy không hoàn lại) a) Gọi X là "số phế phẩm có thể gặp phải" Lập bảng phân bố xác suất X Tính kỳ vọng EX và phương sai DX b) Gọi Y là "số chính phẩm có thể gặp phải" Lập hệ thức cho biết mối quan hệ Y và X Tính kỳ vọng EY và phương sai DY 51 (54) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng 2.29 Một nhóm có 10 người đó có nam và nữ Chọn ngẫu nhiên người Gọi X là số nữ có nhóm chọn Lập bảng phân bố xác suất X Tính kỳ vọng EX 2.30 Hai kiện tướng bóng bàn ngang sức thi đấu với Hỏi thắng ván dễ hay thắng ván dễ 2.31 Một nữ công nhân quản lý 12 máy dệt Xác suất để máy khoảng thời gian T cần đến chăm sóc nữ công nhân là 1/3 Tính xác suất: a) Trong khoảng thời gian T có máy cần đến chăm sóc nữ công nhân b) Trong khoảng thời gian T có từ đến máy cần đến chăm sóc nữ công nhân 2.32 Trong lô hàng có 800 sản phẩm loại và 200 sản phẩm loại Lấy ngẫu nhiên sản phẩm theo phương thức có hoàn lại Gọi X là số sản phẩm loại lấy a) X tuân theo quy luật phân bố gì? Viết biểu thức tổng quát quy luật b) Tìm kỳ vọng và phương sai X c) Tìm mốt X và tính khả để xảy điều đó 2.33 Xác suất để sản phẩm sản xuất bị hỏng 0,1 a) Tìm xác suất để sản phẩm sản xuất có không quá sản phẩm hỏng b) Tìm số sản phẩm hỏng trung bình sản phẩm đó c) Tìm số sản phẩm hỏng có khả xảy nhiều 2.34 Một bài thi trắc nghiệm gồm có 10 câu hỏi, câu hỏi có phương án trả lời, đó có phương án đúng Giả sử câu trả lời đúng điểm và câu trả lời sai bị trừ điểm Một học sinh kém làm bài cách chọn hú hoạ phương án cho câu hỏi Tính xác suất để: a) Anh ta điểm b) Anh ta bị điểm âm 2.35 Tín hiệu thông tin phát lần độc lập Xác suất thu tin lần phát là 0,7 Tính xác suât: a) Thu tín hiệu đúng lần b) Thu tín hiệu nhiều lần c) Thu tin 2.36 Một cầu thủ tiếng đá phạt đền, xác suất đá vào gôn là 4/5 Có người cho “sút” thì chắn có vào lưới Điều khẳng định đó có đúng không? Tìm xác suất để lần sút có đúng lần bóng vào lưới 2.37 Ỏ tổng đài bưu điện các điện thoại gọi đến xuất cách ngẫu nhiên, độc lập với và trung bình có gọi phút Tính xác suất để: a) Có ít gọi khoảng thời gian 10 giây b) Trong khoảng thời gian phút có nhiều ba gọi c) Trong khoảng thời gian phút liên tiếp phút có nhiều gọi 52 (55) Chương 2: Biến ngẫu nhiên và các đặc trưng chúng 2.38 Biến ngẫu nhiên X tuân theo quy luật chuẩn với kỳ vọng μ = 10 và phương sai σ = Tính xác suất để X nhận giá trị khoảng (8; 12) 2.39 Biến ngẫu nhiên X tuân theo quy luật chuẩn với kỳ vọng μ = 10 Xác suất để X nhận giá trị khoảng (10; 20) là 0,3 Tìm xác suất để X nhận giá trị khoảng (0; 10) 2.40 Trọng lượng sản phẩm X máy tự động sản xuất là biến ngẫu nhiên tuân theo quy luật chuẩn với μ = 100 gam và độ lệch chuẩn σ = 100 gam Sản phẩm coi là đạt tiêu chuẩn kỹ thuật trọng lượng nó đạt từ 98 đến 102gam a) Tìm tỷ lệ sản phẩm đạt tiêu chuẩn kỹ thuật nhà máy b) Tìm tỷ lệ phế phẩm nhà máy c) Giải thích đồ thị kết tìm phần a) 2.41 Chiều cao nam giới trưởng thành vùng dân cư là biến ngẫu nhiên phân bố chuẩn vớí kỳ vọng μ = 160 cm và độ lệch chuẩn σ = cm Một niên bị coi là lùn có chiều cao nhỏ 155 cm a) Tìm tỷ lệ niên lùn vùng đó b) Tìm xác suất để lấy ngẫu nhiên người thì có ít người không bị lùn 2.42 Cho X i ( i = 1, n )là các biến ngẫu nhiên độc lập, cùng tuân theo quy luật chuẩn với E( X ) = E( X ) = = E( X n ) = μ ; D( X ) = D( X ) = = D( X n ) = σ { } Lập công thức tính P X − μ < ε biết X = chuẩn, ε > tùy ý 53 n ∑ X i và tuân theo quy luật n i =1 (56) Chương 3: Véc tơ ngẫu nhiên CHƯƠNG III: VÉC TƠ NGẪU NHIÊN GIỚI THIỆU Véc tơ ngẫu nhiên là có thứ tự bao gồm nhiều biến ngẫu nhiên Mỗi biến ngẫu nhiên là thành phần véc tơ ngẫu nhiên Số biến ngẫu nhiên thành phần gọi là chiều véc tơ ngẫu nhiên Tương tự biến ngẫu nhiên, quy luật biến ngẫu nhiên nhiều chiều khảo sát thông qua hàm phân bố Trường hợp biến ngẫu nhiên nhiều chiều có các biến ngẫu nhiên thành phần rời rạc gọi là biến ngẫu nhiên nhiều chiều rời rạc Nếu tất các biến ngẫu nhiên thành phần liên tục thì biến ngẫu nhiên nhiều chiều tương ứng gọi là liên tục Biến ngẫu nhiên nhiều chiều rời rạc xác định bảng phân bố xác suất đồng thời, còn biến ngẫu nhiên liên tục xác định hàm mật độ xác suất đồng thời Với biến ngẫu nhiên hai chiều rời rạc ta có bảng phân bố xác suất đồng thời, đó là bảng ghi các giá trị hai biến ngẫu nhiên thành phần theo hàng, theo cột và xác suất tương ứng Dựa vào công thức cộng xác suất đầy đủ ta có thể tìm bảng phân bố xác suất hai biến ngẫu nhiên thành phần Tương tự, từ hàm mật độ đồng thời ta có thể tìm hàm mật độ biến ngẫu nhiên thành phần cách lấy tích phân theo các biến thích hợp Ngoài các đặc trưng kỳ vọng, phương sai các biến ngẫu nhiên thành phần, các véc tơ ngẫu nhiên còn đặc trưng hiệp phương sai và hệ số tương quan Hệ số tương quan đo mức độ phụ thuộc tuyến tính hai biến ngẫu nhiên thành phần, hệ số tương quan càng gần thì mức độ phụ thuộc tuyến tính càng chặt Hai biến ngẫu nhiên thành phần không tương quan thì hệ số tương quan Dựa vào đặc trưng này ta có thể xây dựng hàm hồi quy tương quan Hai biến ngẫu nhiên độc lập thì không tương quan Tính độc lập các biến ngẫu nhiên nhận biết thông qua dấu hiệu bảng phân bố, hàm phân bố hàm mật độ xác suất Đối với biến ngẫu nhiên không độc lập, cách áp dụng công thức tính xác suất có điều kiện suy quy luật phân bố xác suất có điều kiện các biến ngẫu nhiên thành phần Từ các biến ngẫu nhiên X , X , , X n và hàm nhiều biến ϕ( x1 , , x n ) ta có thể xây dựng các biến ngẫu nhiên ϕ( X , , X n ) đó là hàm các biến ngẫu nhiên đã cho Xác định bảng phân bố xác suất hay hàm mật độ xác suất ϕ( X , , X n ) Để học tốt chương này học viên cần nắm vững các tính chất xác suất, xác suất có điều kiện, phân bố xác suất biến ngẫu nhiên rời rạc; Tích phân suy rộng, hàm nhiều biến 54 (57) Chương 3: Véc tơ ngẫu nhiên NỘI DUNG 3.1 KHÁI NIỆM VÉC TƠ NGẪU NHIÊN 3.1.1 Khái niệm Trong các chương trước ta xét các biến ngẫu nhiên mà giá trị chúng nhận có thể biểu diễn số, đó là các biến ngẫu nhiên chiều Tuy nhiên thực tế có thể gặp các đại lượng ngẫu nhiên mà giá trị nhận là gồm hai, ba, …, n số Những đại lượng này gọi cách tương ứng là biến ngẫu nhiên hai chiều, ba chiều, …, n chiều và gọi chung là biến ngẫu nhiên nhiều chiều Các biến ngẫu nhiên hai chiều, ba chiều, …, n chiều còn gọi là véc tơ ngẫu nhiên hai chiều, ba chiều, …, n chiều Định nghĩa 3.1: Một véc tơ ngẫu nhiên n chiều là có thứ tự ( X , X , , X n ) với các thành phần X , X , , X n là các biến ngẫu nhiên Ta ký hiệu véc tơ ngẫu nhiên hai chiều là ( X , Y ) , đó X là biến ngẫu nhiên thành phần thứ và Y là biến ngẫu nhiên thành phần thứ hai Ví dụ 3.1: Một nhà máy sản xuất loại sản phẩm Nếu kích thước sản phẩm đo chiều dài X và chiều rộng Y thì ta có biến ngẫu nhiên hai chiều, còn xét thêm chiều cao Z thì ta có biến ngẫu nhiên ba chiều Nếu ta quan tâm đến trọng lượng và thể tích sản phẩm ta biến ngẫu nhiên hai chiều Véc tơ ngẫu nhiên n chiều ( X , X , , X n ) là liên tục hay rời rạc tất các biến ngẫu nhiên thành phần X , X , , X n là liên tục hay rời rạc 3.1.2 Hàm phân bố Định nghĩa 3.2: Hàm n biến F ( x1 , x , , x n ) xác định bởi: F ( x1 , x2 , , xn ) = P{X < x1 , X < x , , X n < x n } (3.1) gọi là hàm phân bố véc tơ ngẫu nhiên X = ( X , X , , X n ) hay gọi là phân bố đồng thời các biến ngẫu nhiên X , X , , X n Hàm phân bố đồng thời có các tính chất: ≤ F ( x1 , x , , x n ) ≤ (3.2) lim F ( x1 , x , , x n ) = , với k nào đó thuộc {1, , n} xk →−∞ lim ( x1 , , xn )→( ∞ , , ∞ ) F ( x1 , x , , x n ) = (3.3) (3.4) F ( x1 , x , , x n ) không giảm theo biến lim F ( x1 , , x k , , x n ) = P{X < x1 , , X k −1 < x k −1 , X k +1 < x k +1 , , X n < x n } xk → ∞ Đặc biệt F ( x, y ) là hàm phân bố véc tơ ngẫu nhiên hai chiều ( X , Y ) thì: 55 (58) Chương 3: Véc tơ ngẫu nhiên lim F ( x, y ) = P{X < x} = FX ( x) ; lim F ( x, y ) = P{Y < y} = FY ( y ) y →∞ (3.5) x →∞ FX ( x) , FY ( y ) là các hàm phân bố biến ngẫu nhiên X , Y hay còn gọi là các phân bố thành phần véc tơ ngẫu nhiên ( X , Y ) là phân bố biên duyên phân bố đồng thời F ( x, y ) 3.2 BẢNG PHÂN BỐ XÁC SUẤT CỦA VÉC TƠ NGẪU NHIÊN RỜI RẠC HAI CHIỀU 3.2.1 Bảng phân bố xác suất đồng thời Bảng phân bố xác suất đồng thời biến ngẫu nhiên rời rạc hai chiều ( X , Y ) là bảng liệt kê tất các giá trị X theo hàng, Y theo cột và các xác suất tương ứng Y ∑j y1 y2 … yj … ym x1 p( x1, y1 ) p( x1, y2 ) … p ( x1, y j ) … p ( x1, ym ) p( x1 ) x2 p( x2 , y1 ) p ( x2 , y2 ) … p ( x2 , y j ) … p( x2 , ym ) p( x2 ) p ( xi , ym ) p( xi ) X … xi p( xi , y1 ) p( xi , y2 ) … p ( xi , y j ) … … … … xn p( xn , y1 ) p ( xn , y2 ) … p ( xn , y j ) … p( xn , ym ) p( xn ) ∑i p ( y1 ) p ( y2 ) … p( y j ) … p ( ym ) Trong đó xi ( i = 1, n ) là các giá trị có thể có thành phần X ; y j ( j = 1, m ) là các giá trị có thể có thành phần Y p ( xi , y j ) là xác suất đồng thời biến ngẫu nhiên hai chiều ( X , Y ) nhận giá trị ( xi , y j ) , nghĩa là: { } p( xi , y j ) = P X = xi , Y = y j , các xác suất này thỏa mãn ⎧ p ( xi , y j ) ≥ , ∀ i = 1, n , j = 1, m ⎪⎪ ⎨ n m ⎪ ∑∑ p( xi , y j ) = ⎪⎩ i =1 j =1 56 (3.6) (59) Chương 3: Véc tơ ngẫu nhiên 3.2.2 Bảng phân bố xác suất biên Áp dụng công thức xác suất đầy đủ (1.16) cho hệ { X = x1} , { X = x2 } , , { X = xn } (xem công thức 2.7) ta có: { } n { } { } n p ( y j ) = P Y = y j = ∑ P X = xi , Y = y j = ∑ p ( xi , y j ) ; i =1 j = 1, m (3.7) i =1 Tương tự m m p( xi ) = P{ X = xi } = ∑ P X = xi , Y = y j = ∑ p( xi , y j ) ; i = 1, n j =1 (3.8) j =1 Như từ bảng phân bố xác suất đồng thời ( X , Y ) , ta cộng các xác suất theo cột thì ta các xác suất tương ứng với các giá trị Y , ta cộng các xác suất theo hàng ta các xác suất tương ứng với giá trị X Từ đó nhận phân bố xác suất biến ngẫu nhiên thành phần Y và biến ngẫu nhiên thành phần X X x1 x2 … xi … xn P p ( x1 ) p( x2 ) … p ( xi ) … p( xn ) Y y1 y2 … yj … ym P p( y1 ) p( y ) … p( y j ) … p( y m ) Ví dụ 3.2: Gieo đồng tiền cân đối A, B, C Gọi X là số mặt ngửa xuất đồng tiền A, B và Y là số mặt ngửa xuất đồng tiền A, B, C Hãy lập bảng phân bố xác suất đồng thời X , Y Giải: Chúng ta có bảng kết đồng khả việc gieo đồng tiền cân đối và tính các giá trị X , Y tương ứng, đó N là ký hiệu mặt ngửa xuất còn S là mặt sấp A B C X Y N N N N N S 2 N S N N S S 1 S N N 1 S N S S S N S S S 0 57 (60) Chương 3: Véc tơ ngẫu nhiên Sử dụng công thức tính xác suất cổ điển (1.1) ta có: P{X = 2, Y = 3} = 1 ; P{X = 2, Y = 2} = ; P{X = 1, Y = 2} = … 8 Vậy bảng phân bố xác suất đồng thời X và Y là Y ∑ 1/8 1/8 0 2/8 2/8 2/8 4/8 0 1/8 1/8 2/8 ∑ 1/8 3/8 3/8 1/8 X Phân bố xác suất biến ngẫu nhiên thành phần: Cộng các cột ta được: X P 2/8 4/8 2/8 Y P 1/8 3/8 3/8 1/8 Cộng các hàng ta được: Ví dụ 3.3: Có hai hộp, hộp đựng bi Hộp I có bi mang số 1, bi mang số 2, bi mang số Hộp II có bi mang số 1, bi mang số 2, bi mang số Rút ngẫu nhiên từ hộp bi Gọi X , Y là số ghi trên bi rút từ hộp I và hộp II Hãy lập bảng phân bố xác suất đồng thời X , Y Giải: Mỗi hộp có bi cho nên số các trường hợp có thể có phép thử là ⋅ = 36 , đó có trường hợp (1,1) , trường hợp (1, 2) , trường hợp (2,1) , … Vậy bảng phân bố xác suất đồng thời X , Y sau: 58 (61) Chương 3: Véc tơ ngẫu nhiên Y ∑ 2/36 3/36 1/36 1/6 4/36 6/36 2/36 2/6 6/36 9/36 3/36 3/6 ∑ 2/6 3/6 1/6 X Ví dụ 3.4: (Phân bố đa thức) Véc tơ ngẫu nhiên n chiều X = ( X , X , , X n ) gọi là có phân bố đa thức với các tham số N ; p1 , , p n ký hiệu X ~ MUT ( N ; p1 , , p n ) nếu: N! p1k1 p 2k2 k1!k ! k n+1! P{X = k1 , , X n = k n } = đó ≤ k i ≤ N , k n+1 = N − (k1 + + k n ) ; q = − ( p1 + p nkn q kn +1 + pn ) Trường hợp n = ta phân bố nhị thức Xét N phép thử độc lập, phép thử có n + kết quả; giả sử xác suất xuất kết thứ k là p k thì p1 + + p n + p n+1 = Gọi X k là số thành công kết thứ k N phép thử thì X = ( X , X , , X n ) có phân bố đa thức X ~ MUT ( N ; p1 , , p n ) Gieo xúc xắc cân đối 10 lần Tính các xác suất: 1) Có đúng lần xuất mặt chấm (biến cố A) 2) Có lần xuất mặt chấm, lần mặt chấm, lần mặt chấm và lần mặt chấm (biến cố B) Giải: 1) Gọi X là số lần xuất mặt 10 lần thử thì X ~ B (10 ;1 / 6) ⎛1⎞ ⎛5⎞ P ( A) = P{X = 3} = C10 ⎜ ⎟ ⎜ ⎟ = 0,155 ⎝6⎠ ⎝6⎠ 2) Gọi X k là số lần xuất mặt k 10 phép thử thì ( X , X , X , X , X ) có phân bố đa thức MUT (10 ;1 / 6, / 6, / 6, / 6, / ) P ( B) = P{X = 2, X = 0, X = 4, X = 1, X = 3} = 59 10 10! ⎛ ⎞ ⎜ ⎟ 2!0!4!1!3! ⎝ ⎠ ≈ 0,0002 (62) Chương 3: Véc tơ ngẫu nhiên 3.3 VÉC TƠ NGẪU NHIÊN LIÊN TỤC 3.3.1 Hàm mật độ véc tơ ngẫu nhiên liên tục Định nghĩa 3.3: Hàm mật độ véc tơ ngẫu nhiên liên tục X = ( X , X , , X n ) là hàm n biến f ( x1 , x , , x n ) ≥ thoả mãn: F ( x1 , x , , x n ) = P{X < x1 , X < x , , X n < x n } = x1 xn −∞ −∞ ∫ ∫ f (t1 , t , , t n ) dt1dt dt n f ( x1 , x , , x n ) còn gọi là hàm mật độ đồng thời X , X , , X n Tính chất: Để đơn giản cho cách biểu diễn ta xét trường hợp véc tơ ngẫu nhiên hai chiều ( X , Y ) có hàm mật độ f ( x, y ) 1) f ( x, y ) ≥ với ( x, y ) và ∞ ∞ ∫ ∫ f ( x, y)dxdy = (3.12) −∞ −∞ P{( X , Y ) ∈ A} = 2) ∫∫ f ( x, y)dxdy với A ⊂ 2 (3.13) ( x , y )∈A ⎧ ∂2 F ( x, y ) nÕu tån t¹i đ ¹o hµm t¹i ( x, y ) ⎪ f ( x, y ) = ⎨ ∂x∂y ⎪ nÕu ng−îc l¹i ⎩ 3) (3.14) ∞ 4) ∫ f ( x, y) dy = −∞ f X ( x) hàm mật độ biến ngẫu nhiên X (3.15) ∞ ∫ f ( x, y) dx = −∞ f Y ( y ) hàm mật độ biến ngẫu nhiên Y Ví dụ 3.5: Cho véc tơ ngẫu nhiên ( X , Y ) có hàm mật độ xác định sau: ⎧C f ( x, y ) = ⎨ ⎩0 nÕu x + y ≤ nÕu ng−îc l¹i y a) Tìm C b) Tìm các hàm mật độ các biến ngẫu nhiên X,Y Giải: −1 a) Miền D: x + y ≤ đối xứng qua hai trục toạ độ Ox, Oy Phần D nằm góc phần tư thứ là tam giác vuông cân ≤ x, ≤ y ; x + y ≤ 60 x (63) Chương 3: Véc tơ ngẫu nhiên Vậy D là hình vuông có độ dài cạnh 1= ∞ ∞ ∫∫ , đó: f ( x, y )dxdy = Cdt D = 2C ⇒ C = −∞ −∞ ⎧ x − ≤ y ≤ − x nÕu ≤ x ≤ b) x + y ≤ ⇔ x − ≤ y ≤ x + ⇔ ⎨ ⎩− x − ≤ y ≤ x + nÕu -1 ≤ x ≤ ⎧ 1+ x ⎪ ∫ dy = + x nÕu − ≤ x ≤ ⎪ -x-1 ⎧⎪1 − x ⎪ =⎨ f X ( x) = ⎨ nÕu ng−îc l¹i ⎪⎩ ⎪ 1− x ⎪ dy = − x nÕu ≤ x ≤ ⎪2 ∫ ⎩ x-1 nÕu x ≤ nÕu x > Do tính chất đối xứng X và Y nên ta có: ⎧⎪1 − y fY ( y) = ⎨ ⎪⎩ nÕu y ≤ nÕu y > 3.4 TÍNH ĐỘC LẬP CỦA CÁC BIẾN NGẪU NHIÊN Định nghĩa 3.4: Hai biến ngẫu nhiên X và Y gọi là độc lập biến ngẫu nhiên nhận giá trị này hay giá trị khác không ảnh hưởng gì đến phân bố xác suất biến ngẫu nhiên Định lý 3.1: Giả sử F ( x, y ) là hàm phân bố véc tơ ngẫu nhiên ( X , Y ) Khi đó X , Y độc lập và F ( x, y ) = FX ( x) FY ( y ) (3.16) đó FX ( x), FY ( y ) là hàm phân bố X và Y Định lý 3.2: Véc tơ ngẫu nhiên hai chiều rời rạc ( X , Y ) với phân bố xác suất đồng thời (3.6) là độc lập và p ( xi , y j ) = p ( xi ) p( y j ) ∀ i = 1, n , j = 1, m (3.17 ) Một dấu hiệu để nhận biết hai biến ngẫu nhiên rời rạc độc lập là bảng phân bố xác suất đồng thời có tính chất: • Hai hàng tỉ lệ • Hai cột tỉ lệ Ví dụ 3.6: Hai biến ngẫu nhiên X và Y ví dụ 3.2 không độc lập vì P{X = 2} = P{Y = 1} = P{X = 2, Y = 1} = 61 , (64) Chương 3: Véc tơ ngẫu nhiên Hai biến ngẫu nhiên X và Y ví dụ 3.3 độc lập vì thỏa mãn điều kiện (3.17) Định lý 3.3: Giả sử véc tơ ngẫu nhiên ( X , Y ) có hàm mật độ f ( x, y ) Khi đó X , Y độc lập và f ( x, y ) = f X ( x ) f Y ( y ) (3.18) đó f X ( x), f Y ( y ) là hàm mật độ X và Y Ví dụ 3.7: Véc tơ ngẫu nhiên ( X , Y ) ví dụ 3.5 không độc lập vì hàm mật độ f ( x, y ) ≠ f X ( x ) f Y ( y ) 3.5 HÀM CỦA CÁC BIẾN NGẪU NHIÊN 3.5.1 Hàm biến ngẫu nhiên Giả sử X là biến ngẫu nhiên và ϕ( x) là hàm liên tục biến số Khi đó Y = ϕ( X ) là biến ngẫu nhiên gọi là hàm biến ngẫu nhiên X a Trường hợp rời rạc: Nếu X có phân bố rời rạc: X x1 x2 … P p1 p2 … Y ϕ( x1 ) ϕ( x ) … P p1 p2 … thì Y có phân bố rời rạc: b Trường hợp liên tục: Nếu X liên tục có hàm phân bố FX (x) và hàm mật độ f X (x) thì phương pháp giải tích ta có thể tìm hàm phân bố và hàm mật độ biến ngẫu nhiên Y = ϕ( X ) Trường hợp ϕ( x) là song ánh Khi đó ϕ( x) đơn điệu tăng đơn điệu giảm: ♦ ϕ( x) đơn điệu tăng { } ( ) FY ( y ) = P{ϕ( X ) < y} = P X < ϕ −1 ( y ) = FX ϕ −1 ( y ) ⇒ FX ( x) = FY (ϕ( x) ) f X ( x) = f Y (ϕ( x) )ϕ' ( x) hay f Y ( y ) = ( ) = f X (ϕ−1 ( y)) = f X ( x) dx dy ϕ' (ϕ −1 ( y ) ) ϕ' (ϕ −1 ( y ) ) f X ϕ −1 ( y ) (3.19) ♦ ϕ( x) đơn điệu giảm { } ( ) FY ( y ) = P{ϕ( X ) < y} = P X > ϕ −1 ( y ) = − FX ϕ −1 ( y ) ⇒ FX ( x) = − FY (ϕ( x) ) 62 (65) Chương 3: Véc tơ ngẫu nhiên f X ( x) = − f Y (ϕ( x) )ϕ' ( x) hay f Y ( y ) = − ( ) = f X (ϕ −1 ( y)) = f X ( x) dx dy ϕ' (ϕ −1 ( y ) ) ϕ' (ϕ −1 ( y ) ) f X ϕ −1 ( y ) (3.20) Trường hợp ϕ(x) là hàm liên tục ta tính trực tiếp xác suất P{Y < y = ϕ(x)} từ đó suy hàm phân bố và hàm mật độ Y Ví dụ 3.8: Giả sử ϕ1 ( x) = x , ϕ ( x) = x , ϕ ( x) = e − x X là biến ngẫu nhiên liên tục có hàm phân bố FX (x) và hàm mật độ f X (x) : a) Tìm hàm mật độ Y = ϕ1 ( X ) b) Tìm hàm mật độ Z = ϕ ( X ) c) Tìm hàm mật độ T = ϕ ( X ) d) Tìm hàm mật độ f Y ( y ) và hàm phân bố FY ( y ) và xác suất biến cố P{2,5 < Y < 5} hàm mật độ f X (x) X xác định bởi: ⎧2 ⎪ f X ( x) = ⎨ x ⎪⎩ nÕu ≤ x ≤ nÕu ng−îc l¹i Giải: dx Áp dụng công thức (3.19) ta có: a y = ϕ1 ( x) = x đồng biến x = y , = dy 3 y f Y ( y ) = f X ( x) b Với z > ta có: { dx f X (3 y ) = dy 3 y } { } FZ ( z ) = P{Z < z} = P X < z = P − z < X < z = F X ( z ) − F X (− z ) Với z ≤ thì P{Z < z} = vì Z = X không nhận giá trị âm Vậy hàm mật độ Z ( ⎧ f X ( z ) + f X (− z ) ⎪ f Z ( z) = ⎨ z ⎪ ⎩ c Với t > ta có: { ) nÕu z > nÕu z ≤ } FT (t ) = P{T < t} = P e − X < t = P{X > − ln t} = − FX (− ln t ) t ≤ biến cố {T < t} là biến cố không thể vì T = e − X nhận giá trị dương, đó P{T < t} = Vậy hàm mật độ T xác định sau: Khi 63 (66) Chương 3: Véc tơ ngẫu nhiên ⎧ f X (− ln t ) nÕu t > ⎪ f T (t ) = ⎨ t ⎪⎩ nÕu t ≤ ⎧ f X (3 y ) ⎪ nÕu ≤ y ≤ d f Y ( y ) = = ⎨3 y 3 y2 ⎪ ⎩ nÕu ng−îc l¹i ⎧ ⎪ ⎞⎟ ⎪ ⎛ FY ( y ) = ⎨2⎜1 − ⎜ y⎟ ⎪ ⎝ ⎠ ⎪ ⎩ { nÕu y ≤ nÕu < y ≤ nÕu y > } { 3 } ∫ P{2,5 < Y < 5} = P 2,5 < X < = P 2,5 < X < = 3 ,5 x2 dx ≈ 0,3040 , ⎛ 1 ⎞⎟ − P{2,5 < Y < 5} = FY (5) − FY (2,5) = 2⎜ ⎜ 2,5 ⎟ ⎝ ⎠ 3.5.2 Hàm hai biến ngẫu nhiên Giả sử X , Y là hai biến ngẫu nhiên và ϕ( x, y ) là hàm hai biến liên tục cho trước Xét biến ngẫu nhiên Z xác định Z = ϕ( X , Y ) Khi đó Z là hàm hai biến ngẫu nhiên X và Y a) Trường hợp rời rạc: Nếu X , Y có tập các giá trị {x1 , x , , x m } và {y1 , y , , y n } thì Z = ϕ( X , Y ) có tập các { } giá trị là ϕ( xi , y j ) i = 1, m ; j = 1, , y n Định lý: Giả sử Z = ϕ( X , Y ) Khi đó: P{Z = a} = ∑ P{X = xi ; Y = y j } {(i, j ) ϕ( xi , y j ) =a} b) Trường hợp liên tục: Giả sử X , Y là hai biến ngẫu nhiên; u ( x, y ), v( x, y ) là hai hàm hai biến cho trước Khi đó ta có thể thiết lập cặp biến ngẫu nhiên U , V công thức: U = u ( X , Y ), V = v( X , Y ) Giả sử T là ánh xạ từ vào xác định bởi: T ( x, y ) = (u ( x, y ), v( x, y ) ) 64 (67) Chương 3: Véc tơ ngẫu nhiên Giả thiết T là ánh xạ - (đơn ánh) từ miền D ⊂ lên miền Δ ⊂ Khi đó T có ánh xạ ngược T −1 : Δ → D , với (u , v) ∈ Δ tồn ( x, y ) ∈ D cho T ( x, y ) = (u , v) , ta ký hiệu T −1 (u , v) = ( x, y ) Định thức Jacobi T −1 xác định theo công thức sau: ∂x D( x, y ) ∂u J (u , v) = = D(u , v) ∂y ∂u ∂u D (u , v) ∂x và định thức Jacobi T là: J ( x, y ) = = D( x, y ) ∂v ∂x ∂x ∂v ∂y ∂v ∂u ∂y = ∂v J (u , v) ∂y Định lý 3.4: Giả sử X , Y là hai biến ngẫu nhiên liên tục với mật độ đồng thời f X ,Y ( x, y ) Ký hiệu: { } D = ( x, y ) ∈ f X ,Y ( x, y ) > Giả sử T ( x, y ) = (u ( x, y ), v( x, y ) ) là ánh xạ - khả vi liên tục từ miền D ⊂ lên miền Δ ⊂ Khi đó U = u ( X , Y ), V = v( X , Y ) là hai biến ngẫu nhiên có mật độ đồng thời ⎧ D ( x, y ) ⎪ f X ,Y ( x(u , v), y (u , v) ) fU ,V (u , v) = ⎨ D(u , v) ⎪ ⎩ nÕu (u , v ) ∈ Δ nÕu ng−îc l¹i Định lý 3.5: Giả sử V = X + Y là tổng hai biến ngẫu nhiên X , Y (i) Nếu X , Y rời rạc thì phân bố xác suất V : P{V = v} = ∑ P{X = x; Y = v − x} = ∑ P{Y = y; X = v − y} x (3.21) y (ii) Nếu X , Y liên tục có hàm mật độ đồng thời f X ,Y ( x, y ) thì hàm mật độ V : f V (v ) = ∞ ∫ f X ,Y ( x, v − x)dx (3.22) −∞ Hệ quả: Giả sử V = X + Y là tổng hai biến ngẫu nhiên độc lập X , Y (i) Nếu X , Y rời rạc thì phân bố xác suất V : P{V = v} = ∑ P{X = x}P{Y = v − x} = ∑ P{Y = y}P{X = v − y} x (3.23) y (ii) Nếu X , Y liên tục có hàm mật độ đồng thời f X ( x) f Y ( y ) thì hàm mật độ V : 65 (68) Chương 3: Véc tơ ngẫu nhiên f V (v ) = ∞ ∫ f X ( x) fY (v − x)dx = −∞ f X * f Y (v ) (3.24) 3.6 CÁC THAM SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN 3.6.1 Kỳ vọng và phương sai các biến ngẫu nhiên thành phần Từ bảng phân bố xác suất thành phần (3.6)-(3.8) và hàm mật độ thành phần ta có công thức tính kỳ vọng và phương sai biến ngẫu nhiên thành phần X , Y véc tơ ngẫu nhiên ( X , Y ) : a Trường hợp X , Y rời rạc n n m i =1 i =1 j =1 EX = ∑ xi p ( xi ) = ∑∑ xi p ( xi , y j ) m m n j =1 j =1 i =1 EY = ∑ y j p ( y j ) = ∑∑ y j p( xi , y j ) n m DX = EX − (EX )2 = ∑∑ xi2 p ( xi , y j ) − (EX )2 (3.25) (3.26) (3.27) i =1 j =1 m n DY = EY − (EY )2 = ∑∑ y 2j p ( xi , y j ) − (EY )2 (3.28) j =1 i =1 b Trường hợp X , Y liên tục có hàm mật độ đồng thời f X ,Y ( x, y ) EX = EY = ∞ ∞ ∞ −∞ −∞ −∞ ∞ ∞ ∞ ∫ xf X ( x)dx = ∫ ∫ xf X ,Y ( x, y)dxdy ∫ yfY ( y)dy = ∫ ∫ yf X ,Y ( x, y)dxdy −∞ ∞ ∞ DX = EX − (EX ) = ∫ ∫x −∞ −∞ DY = EY − (EY ) = (3.30) −∞ −∞ 2 (3.29) ∞ ∞ ∫ ∫y −∞ −∞ f X ,Y ( x, y )dxdy − (EX )2 f X ,Y ( x, y )dxdy − (EY )2 (3.31) (3.32) 3.6.2 Hiệp phương sai Định nghĩa 3.5: Hiệp phương sai (hay còn gọi là Covariance) hai biến ngẫu nhiên X , Y , ký hiệu cov( X , Y ) , là kỳ vọng toán tích các sai lệch các biến ngẫu nhiên đó với kỳ vọng toán chúng: cov( X , Y ) = E ( X − EX )(Y − EY ) = E XY − EX EY 66 (3.33) (69) Chương 3: Véc tơ ngẫu nhiên Nếu X , Y rời rạc có bảng phân bố đồng thời (3.6) thì m n cov( X , Y ) = ∑∑ xi y j p ( xi , y j ) − E X E Y (3.34) j =1 i =1 Nếu X , Y liên tục có hàm mật độ đồng thời f X ,Y ( x, y ) thì cov( X , Y ) = ∞ ∞ ∫ ∫ xyf X ,Y ( x, y)dxdy − E X E Y (3.35) −∞ −∞ Tính chất 1) cov( X , Y ) = cov(Y , X ) (3.36) 2) cov( X , X ) = DX (3.37) 3) cov(aX + c, bY + d ) = ab cov(Y , X ) với số a, b, c, d (3.38) 4) Nếu X , Y độc lập thì cov( X , Y ) = ngược lại chưa đúng 3.6.3 Ma trận hiệp phương sai Định nghĩa 3.6: Cho véc tơ ngẫu nhiên X = ( X , X , , X n ) [ ]n×n với aij = cov( X i , X j ) Ma trận M = aij (3.39) gọi là ma trận hiệp phương sai (ma trận covariance, ma trận moment) véc tơ ngẫu nhiên X Tính chất 1) Ma trận hiệp phương sai là ma trận đối xứng 2) Với t1 , t , , t n ∈ n luôn có ∑∑ aij ti t j ≥ j i 3) Các định thức chính M không âm Nói cách khác ma trận hiệp phương sai M là ma trận dạng toàn phương không âm 3.6.4 Hệ số tương quan Định nghĩa 3.7: Hệ số tương quan hai biến ngẫu nhiên X , Y ký hiệu và định nghĩa công thức: ρ X ,Y = cov( X , Y ) σ X σY (3.40) Tính chất 1) − ≤ ρ X ,Y ≤ với X , Y (3.41) 2) Nếu X , Y độc lập thì ρ X ,Y = , điều ngược lại chưa đúng 67 (70) Chương 3: Véc tơ ngẫu nhiên 3) Với số a, b, c, d ⎧⎪ ρ X ,Y ρ aX +c,bY + d = ⎨ ⎪⎩− ρ X ,Y nÕu ab > (3.42) nÕu ab < 4) Y = aX + b , a ≠ và ⎧ nÕu a > ρ X ,Y = ⎨ ⎩− nÕu a < (3.43) Ý nghĩa hệ số tương quan Hệ số tương quan đo mức độ phụ thuộc tuyến tính X và Y Khi ρ X ,Y càng gần thì tính chất quan hệ tuyến tính càng chặt, ρ X ,Y càng gần thì phụ thuộc tuyến tính càng ít, càng lỏng lẻo Khi ρ X ,Y = ta nói X và Y không tương quan 3.7 PHÂN BỐ CÓ ĐIỀU KIỆN VÀ KỲ VỌNG CÓ ĐIỀU KIỆN 3.7.1 Phân bố có điều kiện và kỳ vọng có điều kiện biến ngẫu nhiên X rời rạc với điều kiện B Định nghĩa 3.8: Cho biến ngẫu nhiên X rời rạc nhận các giá trị {x1 , x , , x n } và biến cố B có xác suất P ( B) > Khi đó ta có bảng phân bố xác suất có điều kiện X với điều kiện B XB x1 x2 … xi … xn P p( x1 B) p( x2 B) … p ( xi B ) … p( xn B) đó: p ( xi B ) = P ({X = xi }B ) ; i = 1, n P( B) (3.44) và kỳ vọng X với điều kiện B : n E [X B ] = ∑ x i p ( x i B ) (3.45) i =1 3.7.2 Phân bố có điều kiện và kỳ vọng có điều kiện hai biến ngẫu nhiên X , Y rời rạc Nếu X , Y có tập các giá trị {x1 , x , , x n } và {y1 , y , , y m } Với y j , ta có bảng { } phân bố xác suất điều kiện X với điều kiện biến cố Y = y j : 68 (71) Chương 3: Véc tơ ngẫu nhiên X Y = yj x1 x2 … xi … xn P p ( x1 y j ) p( x2 y j ) … p ( xi y j ) … p( xn y j ) đó p ( xi y j ) = p ( xi , y j ) p( y j ) ; i = 1, n , j = 1, m (3.46) Tương tự ta có bảng phân bố xác suất có điều kiện Y với điều kiện {X = xi } Y X = xi y1 y2 … yj … ym P p ( y1 xi ) p ( y xi ) … p ( y j xi ) … p ( y m xi ) đó p ( y j xi ) = p ( xi , y j ) p ( xi ) ; i = 1, n , j = 1, m (3.47) Kỳ vọng có điều kiện X với điều kiện Y = y j và kỳ vọng có điều kiện Y với điều kiện X = xi tương ứng: [ ] n m i =1 j =1 E X Y = y j = ∑ xi p( xi Y = y j ) ; E[Y X = xi ] = ∑ y j p ( y j X = xi ) E[Y X = x ] là hàm x , gọi là hàm hồi qui Y X E[X Y = y ] là hàm y , gọi là hàm hồi qui X Y Ví dụ 3.9: Gieo liên tiếp đồng tiền Giả sử xác suất xuất mặt ngửa là p Gọi X là biến ngẫu nhiên lần gieo đầu tiên xuất mặt ngửa Gọi B là biến cố: "Trong n lần gieo đầu tiên có lần xuất mặt ngửa" a) Tìm phân bố X b) Tìm phân bố X với điều kiện B Giải: a) Ta có bảng phân bố xác suất X với q = − p : X … k … P p qp … q k −1 p … b) Phân bố X với điều kiện B : Khi P( B) > thì P ({X = k } B ) = 69 P({X = k }B ) P(B) (72) Chương 3: Véc tơ ngẫu nhiên ♦ Rõ ràng k > n thì biến cố {X = k } kéo theo biến cố n phép thử đầu tiên đồng tiền không xuất mặt ngửa Do đó P ({X = k }B ) = ♦ Khi k ≤ n , áp dụng công thức Bernoulli ta có: P ( B) = C n1 pq n−1 = npq n−1 Mặt khác P ({X = k }B ) = P{chØ xuÊt hiÖn mÆt ngöa ë lÇn gieo thø k } = pq n−1 Vậy ⎧1 nÕu k ≤ n ⎪ P ({X = k } B ) = ⎨ n ⎪⎩ nÕu k > n Ví dụ 3.10: Thống kê dân cư thành phố độ tuổi trưởng thành thu nhập hàng tháng X và lứa tuổi Y thu kết bảng sau Tìm thu nhập trung bình theo lứa tuổi Y 30 45 70 0,01 0,02 0,05 0,03 0,06 0,10 0,18 0,21 0,15 0,07 0,08 0,04 X đó X = 1, 2, 3, tương ứng thu nhập triệu đồng /tháng Y = 30, 45, 70 độ tuổi người dân khoảng: 25-35, 35-55, 55-85 Giải: Thu nhập trung bình theo lứa tuổi là kỳ vọng có điều kiện X theo Y Với Y = 30 bảng phân bố xác suất điều kiện tương ứng: Từ đó X Y = 30 P 0,01 0,29 0,03 0,29 0,18 0,29 0,07 0,29 E( X Y = 30) = ⋅ 18 + 1⋅ + 2⋅ + 3⋅ = 2,069 29 29 29 29 Tương tự E ( X Y = 45) = 1,946 E ( X Y = 70 ) = 1,529 Vậy thu nhập trung bình độ tuổi 30 là 2.069.000đ/tháng, độ tuổi 45 là 1.946.000đ/tháng và độ tuổi 70 là 1.529.000 đ/tháng 70 (73) Chương 3: Véc tơ ngẫu nhiên 3.7.3 Phân bố có điều kiện và kỳ vọng có điều kiện hai biến ngẫu nhiên X , Y liên tục Định nghĩa 3.9: Cho hai biến ngẫu nhiên X , Y Xác suất biến cố {Y < y} với điều kiện {X = x} xác định hàm số y phụ thuộc tham số x định nghĩa là hàm phân bố Y với điều kiện {X = x} FY | X ( y | x) = P{Y < y X = x} (3.49) Định lý 3.6: Nếu X , Y liên tục có hàm mật độ đồng thời là f ( x, y ) và X có mật độ f X (x) thì FY | X ( y | x) = y ∫ −∞ f ( x, v ) dv , f X ( x) > f X ( x) Đạo hàm hàm phân bố có điều kiện (3.50) d FY | X ( y | x) gọi là hàm mật độ có điều dy kiện Y với điều kiện X = x và ký hiệu là f Y | X ( y | x) (Đây là hàm biến y còn x đóng vai trò là tham số) Từ định lý trên ta có f Y | X ( y | x) = f ( x, y ) với y ∈ và x thoả mãn f X ( x) > f X ( x) (3.51) Tương tự ta có hàm phân bố và hàm mật độ có điều kiện X với Y = y f (u, y ) du , f Y ( y ) > fY ( y) (3.52) f ( x, y ) với x ∈ và y thoả mãn f Y ( y ) > fY ( y) (3.53) FX |Y ( x | y ) = f X |Y ( x | y ) = x ∫ −∞ Ví dụ 3.11: Nếu X , Y là hai biến ngẫu nhiên liên tục có mật độ đồng thời đã cho ví dụ 5.4 thì ⎧ ⎪ f X Y ( x y ) = ⎨ 2(1 − y ) ⎪ ⎩ nÕu y ≤ vµ x + y ≤ nÕu ng−îc l¹i Định nghĩa 3.10: Giả sử hai biến ngẫu nhiên X , Y có f Y | X ( y | x) là hàm mật độ có điều kiện Y với điều kiện X = x Khi đó kỳ vọng Y với điều kiện X = x ký hiệu và định nghĩa theo công thức sau E[Y X = x ] = ∞ ∫ yfY X ( y x)dy (3.54) −∞ Định lý sau đây cho công thức liên hệ giũa kỳ vọng và kỳ vọng có điều kiện tương tự công thức (2.48) và công thức xác suất đầy đủ (1.16) 71 (74) Chương 3: Véc tơ ngẫu nhiên [[ ]] Định lý 3.7: E[Y ] = E E Y X = x , nghĩa là E[Y ] = ∫ E[Y X = x ] f X ( x)dx , (3.55) D đó D = {x ∈ f X ( x) > 0} 3.8 PHÂN BỐ CHUẨN NHIỀU CHIỀU 3.8.1 Khái niệm phân bố chuẩn n chiều Định nghĩa 3.11: Véc tơ ngẫu nhiên ( X , X , , X n ) gọi là có phân bố chuẩn n chiều có mật độ đồng thời f ( x) = ⎫ ⎧ exp⎨− ( x − a) M −1 ( x − a) t ⎬ ⎭ ⎩ (2π) n det M (3.56) [ ]n×n là ma trận đối xứng đó x = ( x1 , x , , x n ) ∈ n ; a = (μ1 , μ , , μ n ) ∈ n ; M = Cij xác định dương; ma trận cột ( x − a ) t là chuyển vị ma trận hàng ( x − a) Định lý 3.8: Nếu véc tơ ngẫu nhiên X = ( X , X , , X n ) có phân bố chuẩn n chiều với mật độ đồng thời xác định định nghĩa trên thì i Hàm đặc trưng: ⎞ ⎛ ϕ X (t ) = exp⎜ i t , a − t , M −1t t ⎟ ; t = (t1 , t , , t n ) ⎝ ⎠ (3.57) ii Với i = 1, , n : μ i = EX i iii M là ma trận hiệp phương sai véc tơ ngẫu nhiên X = ( X , X , , X n ) : Cij = cov( X i , X j ) (3.58) iv Các biến ngẫu nhiên X , X , , X n độc lập và chúng không tương quan, nghĩa là M là ma trận chéo v Biến ngẫu nhiên thành phần X i có phân bố chuẩn N (μ i ; Cii ) (Y1 , Y2 , , Yn ) = H ( X , X , , X n )t có phân bố chuẩn, đó H là ma trận vuông cấp n có det H ≠ 3.8.2 Phân bố chuẩn hai chiều Định nghĩa 3.12: Véc tơ ngẫu nhiên ( X , Y ) gọi là có phân bố chuẩn hai chiều có mật độ đồng thời: f ( x, y ) = 2πσ1σ ⎛ ⎞ exp⎜ − Q( x, y ) ⎟ , ⎝ ⎠ − ρ2 72 (3.59) (75) Chương 3: Véc tơ ngẫu nhiên ⎧⎛ x − μ ⎞ ⎛ x − μ1 ⎞⎛ y − μ ⎞ ⎛ y − μ ⎞ ⎫⎪ ⎪ ⎟⎟ − 2ρ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟ ⎬ Q ( x, y ) = ⎨⎜⎜ (1 − ρ ) ⎪⎩⎝ σ1 ⎠ ⎝ σ1 ⎠⎝ σ ⎠ ⎝ σ ⎠ ⎪⎭ Định lý 3.9: Giả sử véc tơ ngẫu nhiên ( X , Y ) có phân bố chuẩn hai chiều với mật độ đồng thời xác định định nghĩa 9.3 Khi đó i X có phân bố chuẩn N (μ1 ; σ12 ) , Y có phân bố chuẩn N (μ ; σ 22 ) ii Hệ số tương quan ρ( X , Y ) = ρ iii X , Y không tương quan và X , Y độc lập iv Hàm mật độ X với điều kiện Y = y : f ( x, y ) = f ( x y) = fY ( y) σ − ρ đó ϕ( x) = 2π − x2 e ⎛ x − μ − (σ / σ )ρ( y − μ ) ⎞ 1 2 ⎟ ϕ⎜⎜ ⎟⎟ ⎜ σ1 − ρ ⎝ ⎠ (3.60) là mật độ biến ngẫu nhiên chuẩn tắc N (0;1) Nhận xét: Ma trận tương quan ( X , Y ) là ⎡ σ12 M =⎢ ⎢ρσ σ ⎣ ρσ1σ ⎤ ⎥ ⇒ ⎥ σ2 ⎦ M −1 ⎡ / σ12 − ρ /(σ1σ )⎤ ⎢ ⎥ = − ρ ⎢⎣− ρ /(σ1σ ) / σ ⎥⎦ (3.61) Từ định lý 3.9 suy phân bố X với điều kiện Y = y có phân bố chuẩn với kỳ σ vọng μ1 + ρ ( y − μ ) và phương sai σ12 (1 − ρ ) , đó kỳ vọng có điều kiện: σ2 E[X Y = y ] = μ1 + ρ σ1 ( y − μ2 ) σ2 (3.62) là hàm tuyến tính theo y Đây là tính chất quan trọng phân bố chuẩn chiều Định lý 3.10: Nếu ( X , Y ) có phân bố chuẩn hai chiều thì với số a, b ∈ biến ngẫu nhiên Z = aX + bY có phân bố chuẩn TÓM TẮT Biến ngẫu nhiên nhiều chiều Một biến ngẫu nhiên n chiều hay véc tơ ngẫu nhiên n chiều là ( X , X , , X n ) với các thành phần X , X , , X n là các biến ngẫu nhiên Biến ngẫu nhiên n chiều là liên tục hay rời rạc tất các biến ngẫu nhiên thành phần X , X , , X n là liên tục hay rời rạc 73 (76) Chương 3: Véc tơ ngẫu nhiên Ta ký hiệu biến ngẫu nhiên hai chiều là ( X , Y ) , đó X là biến ngẫu nhiên thành phần thứ và Y là biến ngẫu nhiên thành phần thứ hai Bảng phân bố xác suất đồng thời biến ngẫu nhiên rời rạc hai chiều Bảng phân bố xác suất đồng thời biến ngẫu nhiên rời rạc hai chiều ( X , Y ) là bảng liệt kê tất các giá trị X theo hàng, giá trị Y theo cột và các xác suất tương ứng Bảng phân bố xác suất biên Giả sử biến ngẫu nhiên thành phần X nhận các giá trị xi ( i = 1, n ) Y nhận các giá trị { } y j ( j = 1, m ) với xác suất tương ứng p ( xi , y j ) = P X = xi , Y = y j thì phân bố hai biến ngẫu nhiên thành phần { } n n { } { } p ( y j ) = P Y = y j = ∑ P X = xi , Y = y j = ∑ p ( xi , y j ) ; i =1 m j = 1, m i =1 m p ( xi ) = P{ X = xi } = ∑ P X = xi , Y = y j = ∑ p( xi , y j ) ; i = 1, n j =1 j =1 Quy luật phân bố xác suất có điều kiện các thành phần X Y = yj x1 x2 … xi … xn P p ( x1 y j ) p( x2 y j ) … p ( xi y j ) … p( xn y j ) p ( xi y j ) = p ( xi , y j ) p( y j ) ; i = 1, n , j = 1, m Y X = xi y1 y2 … yj … ym P p ( y1 xi ) p ( y xi ) … p ( y j xi ) … p ( y m xi ) p ( y j xi ) = p ( xi , y j ) p ( xi ) ; i = 1, n , j = 1, m Hàm mật độ có điều kiện các biến ngẫu nhiên liên tục: f Y | X ( y | x) = f ( x, y ) với y ∈ và x thoả mãn f X ( x) > f X ( x) Tính độc lập các biến ngẫu nhiên Hai biến ngẫu nhiên X và Y gọi là độc lập biến ngẫu nhiên nhận giá trị này hay giá trị khác không ảnh hưởng gì đến phân bố xác suất biến ngẫu nhiên Nghĩa là: p( xi , y j ) = p ( xi ) p( y j ) ∀ i = 1, n , j = 1, m Kỳ vọng và phương sai các biến ngẫu nhiên thành phần 74 (77) Chương 3: Véc tơ ngẫu nhiên n n m ∞ ∞ ∞ i =1 i =1 j =1 −∞ −∞ −∞ EX = ∑ xi p( xi ) = ∑∑ xi p( xi , y j ) EX = ∫ xf X ( x)dx = ∫ ∫ xf X ,Y ( x, y)dxdy m m n ∞ ∞ ∞ j =1 j =1 i =1 −∞ −∞ −∞ EY = ∑ y j p( y j ) = ∑∑ y j p( xi , y j ) EY = ∫ yfY ( y)dy = ∫ ∫ yf X ,Y ( x, y)dxdy n m DX = EX − (EX )2 = ∑∑ xi2 p( xi , y j ) − (EX )2 i =1 j =1 DX = EX − (EX ) = 2 ∞ ∞ ∫ ∫x −∞ −∞ f X ,Y ( x, y )dxdy − (EX )2 Hiệp phương sai m n cov( X , Y ) = E ( X − EX )(Y − EY ) = ∑∑ xi y j p( xi , y j ) − E X E Y j =1 i =1 Hệ số tương quan Hệ số tương quan hai biến ngẫu nhiên X , Y ký hiệu và định nghĩa công thức: ρ X ,Y = cov( X , Y ) σ X σY Kỳ vọng có điều kiện m ( ) Kỳ vọng có điều kiện Y với điều kiện {X = xi } : E(Y X = xi ) = ∑ y j p y j xi j =1 [ ∞ ] ∫ yfY X ( y x)dy Hoặc E Y X = x = −∞ Phân bố chuẩn n chiều Véc tơ ngẫu nhiên ( X , X , , X n ) gọi là có phân bố chuẩn n chiều có mật độ đồng thời f ( x) = ⎫ ⎧ exp⎨− ( x − a) M −1 ( x − a) t ⎬ ⎭ ⎩ (2π) n det M Phân bố chuẩn hai chiều Véc tơ ngẫu nhiên ( X , Y ) gọi là có phân bố chuẩn hai chiều có mật độ đồng thời: f ( x, y ) = 2πσ1σ ⎛ ⎞ exp⎜ − Q( x, y ) ⎟ , ⎝ ⎠ − ρ2 75 (78) Chương 3: Véc tơ ngẫu nhiên ⎧⎛ x − μ ⎞ ⎛ x − μ1 ⎞⎛ y − μ ⎞ ⎛ y − μ ⎞ ⎫⎪ ⎪ ⎟⎟ − 2ρ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟ ⎬ Q ( x, y ) = ⎨⎜⎜ (1 − ρ ) ⎪⎩⎝ σ1 ⎠ ⎝ σ1 ⎠⎝ σ ⎠ ⎝ σ ⎠ ⎪⎭ CÂU HỎI ÔN TẬP VÀ BÀI TẬP 3.1 Bảng phân bố xác suất X và Y cho phép xác định phân bố xác suất đồng thời ( X ,Y ) Đúng Sai 3.2 Bảng phân bố xác suất đồng thời ( X , Y ) xác định phân bố xác suất hai biến ngẫu nhiên thành phần X và Y Đúng Sai 3.3 Nếu hai biến ngẫu nhiên X , Y độc lập thì bảng phân bố xác suất X và Y cho phép xác định phân bố xác suất đồng thời ( X , Y ) Đúng Sai 3.4 Hai biến ngẫu nhiên độc lập có hiệp phương sai Đúng Sai 3.5 Hai biến ngẫu nhiên có hiệp phương sai thì độc lập Đúng Sai 3.6 Hiệp phương sai luôn nhận giá trị dương Đúng Sai 3.7 Nếu Y = aX + b , a ≠ thì hệ số tương quan ρ X ,Y luôn luôn Đúng Sai 3.8 Nếu {x1 , x , , x n } là tập giá trị X thì { f ( x1 ), f ( x ), , f ( x n )} là tập giá trị hàm hồi quy f ( x) = E (Y X = x ) Y X Đúng Sai 3.9 Nếu hai biến ngẫu nhiên X , Y độc lập thì hàm hồi quy f ( x) = E (Y X = x ) Y X và hàm hồi quy g ( y ) = E ( X Y = y ) X Y là hai hàm Đúng Sai 3.10 Nếu hiệp phương sai hai biến ngẫu nhiên thì hai kỳ vọng chúng ( cov( X , Y ) = thì EX = EY ) Đúng Sai 3.11 Hàm mật độ đồng thời véc tơ ngẫu nhiên liên tục ( X , Y ) tích hai hàm mật độ thành phần X và Y 76 (79) Chương 3: Véc tơ ngẫu nhiên Đúng Sai 3.12 Giả sử ( X , Y ) là véc tơ ngẫu nhiên phân bố chuẩn, đó X , Y độc lập và X , Y không tương quan Đúng Sai 3.13 Cho X , Y là hai biến ngẫu nhiên có phân bố xác suất đồng thời sau Y y1 y2 y3 x1 0,18 0,22 0,16 x2 0,08 0,16 0,20 X Tìm phân bố xác suất hai biến ngẫu nhiên thành phần X , Y 3.14 Cho X , Y là hai biến ngẫu nhiên có phân bố xác suất đồng thời sau Y −1 −1 1/6 1/4 1/6 1/8 1/6 1/8 X Hãy xác định EX , EY , cov( X , Y ) = và ρ X ,Y 3.15 Cho X , Y là hai biến ngẫu nhiên có phân bố xác suất đồng thời sau Y −1 −1 4/15 1/15 4/15 1/15 2/15 1/15 2/15 X Hãy xác định EX , EY , cov( X , Y ) = và ρ X ,Y X , Y có độc lập không? 3.16 Cho X , Y là hai biến ngẫu nhiên có phân bố xác suất đồng thời sau Y 0,12 0,15 0,03 0,28 0,35 0,07 X 77 (80) Chương 3: Véc tơ ngẫu nhiên a) Chứng minh X , Y có độc lập b) Tìm quy luật phân bố biến ngẫu nhiên Z = XY c) Tính các kỳ vọng EX , EY , EZ 3.17 Cho X , Y là hai biến ngẫu nhiên độc lập có phân bố xác suất sau: X P 0,4 0,3 0,2 0,1 Y P 0,1 0,3 0,4 0,15 0,05 Tìm phân bố xác suất đồng thời X , Y Tính xác suất P{X > Y } 3.18 Cho X , Y là hai biến ngẫu nhiên có phân bố xác suất đồng thời sau Y 0,15 0,20 0,10 0,35 0,05 0,15 X Hai biến ngẫu nhiên X , Y có độc lập không Tính xác suất P{X = 1Y = 2} 3.19 Gieo đồng thời xúc xắc và đồng tiền Gọi X là biến ngẫu nhiên số chấm xúc xắc và Y là biến ngẫu nhiên mặt sấp (1) hay mặt ngửa (0) đồng tiền Lập bảng phân bố xác suất đồng thời X và Y 3.20 Cho bảng phân bố xác suất đồng thời X , Y X 26 30 41 50 23 0,05 0,08 0,12 0,04 27 0,09 0,30 0,11 0,21 Y Tìm bảng phân bố xác suất điều kiện Y X = 26 và X Y = 27 3.21 Cho bảng phân bố xác suất đồng thời X , Y X 0,15 0,06 0,25 0,04 0,30 0,10 0,03 0,07 Y a) Tìm kỳ vọng có điều kiện Y X = b) Tìm các kỳ vọng EX , EY và phương sai DX , DY 78 (81) Chương 3: Véc tơ ngẫu nhiên 3.22 Cho X , Y là hai biến ngẫu nhiên có phân bố xác suất đồng thời Y −1 −1 4α α 4α α 2α α 2α X a) Tìm α Tính EX , EY b) Tính cov( X , Y ), ρ ( X , Y ) c) X và Y có độc lập không 3.23 Cho véc tơ ngẫu nhiên ( X , Y ) có hàm mật độ xác định sau: ⎧ Cx nÕu < y < x < f ( x, y ) = ⎨ nÕu ng−îc l¹i ⎩0 a) Tìm C b) Tìm các hàm mật độ X và Y c) X và Y có độc lập không? 3.24 Hàm phân bố véc tơ ngẫu nhiên ( X , Y ) có dạng ⎧⎪1 − e − x − e − y + e − x − y F ( x, y ) = ⎨ ⎪⎩ nÕu ng−îc l¹i nÕu x > 0, y > Tìm hàm mật độ đồng thời f ( x, y ) và hàm mật độ có điều kiện f ( x y ) 3.25 Cho véc tơ ngẫu nhiên ( X , Y ) có hàm mật độ xác định sau: f ( x, y ) = C (1 + x )(1 + y ) a) Tìm C b) Tìm hàm phân bố đồng thời mật độ X , Y c) X và Y có độc lập không? d) Tính xác suất để véc tơ ngẫu nhiên ( X , Y ) nhận giá trị nằm hình chữ nhật với các đỉnh là A(1,1); B( ,1); C (1,0) và D( ,0) 3.26 Cho véc tơ ngẫu nhiên ( X , Y ) có hàm mật độ xác định sau: 79 (82) Chương 3: Véc tơ ngẫu nhiên ⎧ ⎪ f ( x, y ) = ⎨ x y ⎪0 ⎩ nÕu x ≥ và ≤ y ≤ x, x nÕu ng−îcl¹i a) Tìm hàm mật độ X và Y , b) Tìm hàm mật độ có điều kiện f ( x y ) và f ( y x) 3.27 Cho X và Y là hai biến ngẫu nhiên có phân bố chuẩn đồng thời với EX = 35, EY = 20, DX = 36, DY = 16 và ρ X ,Y = 0,8 Tìm kỳ vọng và phương sai X − 3Y 80 (83) Chương 4: Luật số lớn và định lý giới hạn CHƯƠNG IV: LUẬT SỐ LỚN VÀ ĐỊNH LÝ GIỚI HẠN GIỚI THIỆU Lý thuyết xác suất nghiên cứu khả xuất các biến cố ngẫu nhiên Khi tung đồng xu ta không biết mặt sấp hay mặt ngửa xuất tung nhiều lần thì ta thấy số lần mặt sấp và mặt ngửa xuất là xấp xỉ gần Như thực nhiều lần phép thử ngẫu nhiên ta tìm quy luật xuất biến cố ngẫu nhiên, là nội dung luật số lớn Luật số lớn là sở để định nghĩa xác suất biến cố thông qua tần suất xuất biến cố đó Luật số lớn nghiên cứu hội tụ theo xác suất dãy các biến ngẫu nhiên Luật số lớn đầu tiên James Bernoulli công bố năm 1713 Về sau, kết này Poisson, Trêbưsép, Máckốp, Liapunốp mở rộng Trong chương này ta xét hai định lý luật số lớn Định lý Trêbưsép là dạng tổng quát luật số lớn còn định lý Bernoulli là trường hợp đơn giản áp dụng cho dãy các biến ngẫu nhiên độc lập có phân bố không – A( p) công thức (2.9) Để chứng minh định lý Trêbưsép ta sử dụng bất đẳng thức Trêbưsép Định lý giới hạn trung tâm khảo sát hội tụ theo phân bố xác suất cúa dãy các biến ngẫu nhiên Định lý giới hạn trung tâm áp dụng cho dãy các biến ngẫu nhiên độc lập X1, X , có cùng phân bố không – A( p) ta định lý Moivre –Laplace Áp dụng định lý Moivre –Laplace ta có công thức tính gần đúng phân bố nhị thức Luật số lớn và định lý giới hạn trung tâm là sở lý thuyết để giải các bài toán ước lượng và kiểm định giả thiết thống kê NỘI DUNG 4.1 CÁC DẠNG HỘI TỤ CỦA DÃY CÁC BIẾN NGẪU NHIÊN 4.1.1 Hội tụ theo xác suất Định nghĩa 5.1: Dãy các biến ngẫu nhiên X1, X , gọi là hội tụ theo xác suất biến P ngẫu nhiên X , ký hiệu X n ⎯⎯⎯→ X , nếu: n→∞ ∀ε > lim P { X n − X > ε } = n→∞ (4.1) Như dãy các biến ngẫu nhiên X1, X , hội tụ theo xác suất biến ngẫu nhiên X thì với n đủ lớn, thực tế ta có thể coi rằng, X n không khác so với X 81 (84) Chương 4: Luật số lớn và định lý giới hạn 4.1.2 Hội tụ theo phân bố Định nghĩa 4.2: Dãy các biến ngẫu nhiên X1, X , gọi là hội tụ theo phân bố biến { } ngẫu nhiên X dãy các hàm phân bố FX n ( x) ∞ hội tụ hàm phân bố FX (x) , nghĩa là với n =1 x ∈ : lim P{X n < x} = P{X < x} (4.2) n→∞ Trường hợp dãy các biến ngẫu nhiên rời rạc {X n }∞ n =1 và biến ngẫu nhiên rời rạc X có C = {c1 , c2 , } thì dãy {X n }∞n=1 và với c k ∈ C : cùng tập giá trị hội tụ theo phân bố biến ngẫu nhiên X lim P{X n = c k } = P{X = c k } (4.3) n→∞ 4.2 LUẬT SỐ LỚN 4.2.1 Bất đẳng thức trêbưsép Định lý 4.1: Cho Y là biến ngẫu nhiên không âm có kỳ vọng hữu hạn Khi đó với a > ta có: EY a P{Y > a} ≤ (4.4) Chứng minh: a) Trường hợp Y rời rạc có tập giá trị V = {y1 , y , } Đặt V1 = {yi ∈ V , yi ≤ a} ; V2 = {y i ∈ V , yi > a} Khi đó EY = ∑ yi P{Y = yi } = ∑ yi P{Y = yi } + ∑ yi P{Y = yi } yi∈V ≥ yi∈V1 ∑ yi P{Y = yi } ≥ a ∑ P{Y = yi } = aP{Y > a} yi∈V2 Suy yi∈V2 P{Y > a} ≤ yi∈V2 EY a b) Giả sử Y liên tục có hàm mật độ f ( x) Ta có EY = Suy +∞ a +∞ +∞ +∞ 0 a a a ∫ xf ( x)dx = ∫ xf ( x)dx + P{Y > a} ≤ ∫ xf ( x)dx ≥ ∫ xf ( x)dx ≥ a ∫ f ( x)dx = aP{Y > a} EY a Định lý 4.2: Nếu X là biến ngẫu nhiên có kỳ vọng và phương sai hữu hạn thì với ε > ta có: 82 (85) Chương 4: Luật số lớn và định lý giới hạn P{ X − EX > ε} ≤ DX ε2 (4.5) vậy, P{ X − EX ≤ ε} ≥ − DX ε2 (4.6) Chứng minh: Áp dụng công thức (4.4) cho biến ngẫu nhiên Y = ( X − EX )2 và a = ε ta có: { } P{ X − EX > ε} = P Y > ε ≤ EY ε = E( X − EX )2 ε = DX ε2 Bất đẳng thức (4.5)-(4.6) gọi là bất đẳng thức Trêbưsép Bất đẳng thức Trêbưsép có nhiều ứng dụng Trước hết nó cho phép ta đánh giá cận trên cận xác suất để biến ngẫu nhiên X nhận giá trị sai lệch so với kỳ vọng E X không quá ε Bất đẳng thức Trêbưsép có ý nghĩa to lớn mặt lý thuyết, nó sử dụng để chứng minh các định lý luật số lớn Ví dụ 4.1: Một cửa hàng muốn ước lượng nhanh chóng sai số số vải bán tháng mình Số vải khách hàng làm tròn số nguyên gần (ví dụ sổ ghi 195,6 m thì làm tròn là 196m ) Ký hiệu X i là sai số số mét vải thực bán và số mét vải đã làm tròn khách hàng thứ i Giải: Các sai số X1, X , , X n là các biến ngẫu nhiên độc lập có phân bố trên đoạn [ −0,5;0,5] Khi đó EX i = 0, DX i = Sai số tổng cộng tháng là S = X1 + + X n 12 (trong đó n là số khách hàng mua hàng tháng) Ta có: n n i =1 i =1 ES = ∑ EX i = 0, DS = ∑ DX i = n 12 Theo bất đẳng thức Trêbưsép, xác suất để sai số vượt quá ε mét đánh giá bởi: P{ S > ε} ≤ DS ε = n 12ε Giả sử có n = 104 khách hàng tháng Để xác suất P { S > ε } bé 0,01 ta phải có n 12ε ≤ 0, 01 hay ε ≥ n = 288, 67 12 ⋅ 0, 01 Vậy ta có thể kết luận: Với xác suất 0,99 sai số số vải thực bán với số vải đã tính tròn không vượt quá 289 m, số khách hàng là vạn 83 (86) Chương 4: Luật số lớn và định lý giới hạn 4.2.2 Luật số lớn Trêbưsép Định lý 4.3: Giả sử X1, X , là dãy các biến ngẫu nhiên độc lập, có các kỳ vọng hữu hạn và phương sai bị chặn trên số C ( DX i ≤ C ; ∀i = 1, 2, ) Khi đó ⎛ X + + X n EX1 + + EX n ⎞ − > ε ⎟= lim P ⎜ n n n→∞ ⎝ ⎠ Chứng minh: Xét biến ngẫu nhiên Sn = X1 + EX1 + biến ngẫu nhiên X1, X , ta suy ES n = n + Xn n + EX n (4.7) Từ giả thiết độc lập dãy các ; DSn = DX1 + n2 + DX n ≤ C n Áp dụng bất đẳng thức Trêbưsép (4.5) cho biến ngẫu nhiên S n ta có: ⎛ X + + X n EX1 + + EX n ⎞ C P⎜ − > ε ⎟ ≤ ⎯⎯⎯→ n→∞ n n ⎝ ⎠ nε Hệ 1: Giả sử X1, X , là dãy các biến ngẫu nhiên độc lập có cùng có kỳ vọng μ và phương sai bị chặn trên số C ( DX i ≤ C ; ∀i = 1, 2, ) Khi đó X1 + n + Xn P n→∞ ⎯⎯⎯→ μ (4.8) Hệ 2: Giả sử X1, X , là dãy các biến ngẫu nhiên độc lập có cùng phân bố, có kỳ vọng μ và phương sai σ Khi đó X1 + n + Xn P n→∞ ⎯⎯⎯→ μ (4.9) Định lý Trêbưsép chứng tỏ trung bình số học các biến ngẫu nhiên độc lập hội tụ theo xác suất trung bình số học kỳ vọng tương ứng nó Nói cách khác nó chứng tỏ ổn định trung bình số học số lớn các biến ngẫu nhiên xung quanh trung bình số học các kỳ vọng các biến ngẫu nhiên Như mặc dù biến ngẫu nhiên độc lập có thể nhận giá trị khác nhiều so với kỳ vọng chúng, song trung bình số học số lớn số lớn các biến ngẫu nhiên lại nhận giá trị gần trung bình số học chúng với xác suất lớn Điều đó cho phép dự đoán giá trị trung bình số học các biến ngẫu nhiên Chẳng hạn, gieo xúc xắc cân đối Giả sử X là số nốt xuất mặt trên xúc xắc Ta có EX = 3,5 Một nhà thống kê đã gieo xúc xắc cân đối triệu lần (nhờ trợ giúp máy vi tính) và ghi lại số nốt xuất mặt trên xúc xắc Số trung bình triệu lần gieo tìm thấy là x1 + + x106 106 ≈ 3,500867 ≈ 3,5 Định lý Trêbưsép có ứng dụng rộng rãi nhiều lĩnh vực, chẳng hạn nó chính là sở cho phương pháp đo lường vật lý Để xác định giá trị đại lượng vật lý nào đó người ta thường tiến hành đo n lần độc lập và lấy trung bình số học các kết đo làm giá trị thực đại lượng cần đo Thật vậy, giả sử xem kết n lần đo là các biến ngẫu nhiên 84 (87) Chương 4: Luật số lớn và định lý giới hạn X1, X , , X n Ta thấy các biến ngẫu nhiên này độc lập, có cùng kỳ vọng chính giá trị thực đại lượng vật lý (giả sử không có sai số hệ thống), các phương sai chúng bị chặn trên bình phương độ chính xác thiết bị đo Do đó theo định lý Trêbưsép ta có thể cho trung bình số học các kết đo sai lệch ít so với giá trị thực đại lượng vật lý với xác suất gần Định lý Trêbưsép còn là sở cho phương pháp mẫu ứng dụng thống kê 4.2.3 Luật số lớn Bernoulli Xét phép thử ngẫu nhiên C và A là biến cố liên quan đến phép thử thử C Tiến hành phép C n lần độc lập và gọi kn là tần số xuất biến cố A n phép thử đó f n = kn n gọi là tần suất xuất A n phép thử Định lý 4.4: Tần suất f n hội tụ theo xác suất xác suất p biến cố A , nghĩa là với ε > lim P { f n − p < ε } = n→∞ (4.10) Chứng minh: Xét dãy các biến ngẫu nhiên X1, X , , X n xác định sau: ⎧ nÕu A x¶y ë phÐp thö thø k Xk = ⎨ ⎩ nÕu A kh«ng x¶y ë phÐp thö thø k ta gọi dãy các biến ngẫu nhiên X1, X , , X n độc lập có cùng phân bố không – A( p) (công thức (2.9)) EX k = p, DX k = p (1 − p ) Ta có X1 + n + Xn = kn = fn n Vậy theo hệ định lý 4.2 suy f n hội tụ theo xác suất p Định lý Bernoulli tần suất xuất biến cố n phép thử độc lập hội tụ theo xác suất xác suất biến cố đó số lần thử tăng lên vô hạn Chính vì định lý Bernoulli là sở lý thuyết định nghĩa thống kê xác suất Ở kỷ 18, nhà toán học Pháp Buffon gieo đồng tiền 4040 lần và ghi 2048 lần xuất mặt ngửa, tần suất là 0,507 Một nhà thống kê người Anh gieo đồng tiền 12000 lần và thu 6019 lần xuất mặt ngửa, tần suất tương ứng 0,5016 Trong thí nghiệm khác, ông ta gieo 24000 lần và thu 12012 lần xuất mặt ngửa, tần suất tương ứng là 0,5005 Như vây ta thấy số phép thử tăng lên thì tần suất tương ứng càng gần 0,5 4.3 ĐỊNH LÝ GIỚI HẠN TRUNG TÂM Định lý 4.5: Giả sử X1, X , là dãy các biến ngẫu nhiên độc lập có cùng phân bố, có kỳ X + + X n − nμ hội tụ theo vọng μ và phương sai σ Khi đó dãy biến ngẫu nhiên Sn = σ n phân bố phân bố chuẩn tắc N (0;1) , nghĩa là: 85 (88) Chương 4: Luật số lớn và định lý giới hạn Với x ∈ , lim P {S n < x} = Φ ( x) (4.11) n→∞ Φ ( x) là hàm phân bố phân bố chuẩn tắc N (0;1) Áp dụng định lý giới hạn trung tâm cho dãy các biến ngẫu nhiên độc lập X1, X , có cùng phân bố không – A( p ) (công thức (2.9)) ta định lý Moivre –Laplace: Định lý 4.6 (Moivre –Laplace): Dãy các biến ngẫu nhiên X1, X , độc lập có cùng phân bố không – A( p) ta được: ⎧⎪ X + Với x ∈ , lim P ⎨ n→∞ ⎩ ⎪ + X n − np npq ⎫⎪ < x ⎬ = Φ( x) ⎭⎪ (4.12) 4.4 XẤP XỈ PHÂN BỐ NHỊ THỨC 4.4.1 Xấp xỉ phân bố nhị thức phân bố Poisson Định lý 4.7: Cho X1, X , là dãy các biến ngẫu nhiên có cùng phân bố nhị thức, đó với n , X n có phân bố nhị thức B (n, p n ) Giả sử tồn giới hạn lim np n = λ > Thì X n n→∞ hội tụ theo phân bố biến ngẫu nhiên X có phân bố Poisson tham số λ Trong thực tế n > 50 và p < 0,1 người ta có thể xấp xỉ P (np) tham số λ = np : P{X n = k } ≈ e − np (np ) k k! B (n ; p) với phân bố Poisson (4.13) Ví dụ 3.2: Giả sử xác suất để làm đinh ốc không đúng quy cách là p = 0,015 Người ta xếp đinh ốc vào hộp, hộp 100 a) Tính tỉ lệ hộp chứa toàn đinh ốc không đúng quy cách b) Cần phải xếp ít bao nhiêu đinh ốc hộp để tỉ lệ hộp chứa 100 đinh ốc tốt tối thiểu là 80% Giải: a) Nếu gọi X là số đinh ốc không đúng quy cách hộp chứa 100 đinh ốc thì X ~ B (n ; p) với n = 100, p = 0, 015 Tính gần đúng: P { X = 0} ≈ e − np (np )0 = e −1,5 = 0, 2231 0! Vậy có khoảng 22,3% số hộp chứa 100 đinh ốc tốt b) Giả sử hộp chứa 100 + k đinh ốc, k là số tự nhiên Gọi X là số đinh ốc không đúng quy cách hộp chứa 100 + k đinh ốc X ~ B (n ; p) với n = 100 + k , p = 0, 015 Ta phải xác định k nhỏ để 86 (89) Chương 4: Luật số lớn và định lý giới hạn k P { X ≤ k} = ∑ Cni ( 0, 015 ) ( 0,985 ) i n −i ≥ 0,8 i =0 i Dùng công thức xấp xỉ P { X = i} = Cni ( 0, 015 ) ( 0,985 ) n −i ≈ e−λ λi i! đó λ = np = (100 + k )(0, 015) ≈ 1,5 + 0, 015k ≈ 1,5 (vì k nhỏ) Vậy cần tìm k nhỏ để ⎧⎪ 1,5 1,52 + + e−1,5 ⎨1 + 2! ⎩⎪ 1! + 1,5k ⎫⎪ 1,5 1,52 + + ⎬ ≥ 0,8 ⇔ + k ! ⎭⎪ 1! 2! + 1,5k ≥ 0,8 e1,5 = 3,5853 k! Thử với k = 1, 2, , ta thấy k = bất đẳng thức trên thoả mãn Như dùng xấp xỉ Poisson ta có thể kết luận hộp cần đóng 102 đinh ốc Khi đó xác suất để có ít 100 đinh ốc tốt hộp 102 là 0,8022 4.4.2 Xấp xỉ phân bố nhị thức bằn phân bố chuẩn Giả sử X , X , , X n độc lập có cùng phân bố không – A(p) Theo công thức (2.9) và (2.10) ta có U n = X + X + + Xn ~ B (n, p) Công thức (2.8) cho phép tính xác suất P {U n = k } = Cnk p k q n−k Tuy nhiên n khá lớn ta không thể áp dụng công thức này để tính mà cần đến công thức xấp xỉ Định lý 4.8 (định lý giới hạn địa phương): Giả sử X là biến ngẫu nhiên có phân bố nhị k − np thức B (n, p ) Đặt x k = , đó npq ⎛ k − np ⎞ ⎟ (1 + ε n,k ) Pn (k ; p) = P{X = k } = ϕ⎜ ⎜ npq ⎟ nqp ⎝ ⎠ đó ε n,k < C n (4.14) với C là số Như n đủ lớn ta có thể xấp xỉ : ⎛ k − np ⎞ ⎟ P{X = k } ≈ ϕ⎜ ⎜ npq ⎟ nqp ⎝ ⎠ 2π e −( k − np ) 2 npq (4.15) Ngoài áp dụng định lý Moivre-Laplace và công thức (4.12) ta có công thức xấp xỉ giá trị hàm phân bố nhị thức ⎧⎪U − np x − np ⎪⎫ ⎛ x − np ⎞ P {U n < x} = P ⎨ n < ⎟⎟ ⎬ ≈ Φ ⎜⎜ npq ⎪⎭ npq ⎪⎩ npq ⎝ ⎠ Người ta thấy xấp xỉ là tốt np và nq lớn npq > 20 87 (4.16) (90) Chương 4: Luật số lớn và định lý giới hạn Ví dụ 3.3: Gieo 3200 lần đồng xu cân đối và đồng chất Gọi X là số lần xuất mặt sấp 3200 lần gieo đó a) Tìm số lần xuất mặt sấp có khả Tính xác suất tương ứng { } b) Tính xác suất P + 1600 ≤ X ≤ 10 + 1600 Giải: a) Ta có: n = 3200 , p = 0,5 ⇒ (n + 1) p = 1600,5 Vậy số lần xuất mặt sấp có khả là 1600 với xác suất tương ứng P3200 (1600; 0,5) = Mặt khác tính gần đúng ta có: xm = P3200 (1600; 0,5) ≈ 3200! 0,5 3200 160011600! 1600 − 3200 ⋅ 0,5 = Do đó 3200 ⋅ 0,5 ⋅ 0,5 3200 ⋅ 0,5 ⋅ 0,5 ϕ(0) = 40 π ≈ 0,014 X − 1600 ⎧ ⎫ e) P ≤ X − 1600 ≤ 10 = P ⎨0, 25 ≤ ≤ 0,5⎬ ≈ Φ (0,5) − Φ (0, 25) 20 ⎩ ⎭ { } Tra bảng ta có Φ(0,5) − Φ (0,25) = 0,6915 − 0,5987 = 0,0928 TÓM TẮT Hội tụ theo xác suất P n→∞ X n ⎯⎯⎯→ X , ∀ε > lim P { X n − X > ε } = n→∞ Hội tụ theo phân bố Nếu với x ∈ : lim P{X n < x} = P{X < x} n→∞ Bất đẳng thức Trêbưsép Cho Y là biến ngẫu nhiên không âm có kỳ vọng hữu hạn Khi đó với a > ta EY có: P{Y > a} ≤ a Nếu X là biến ngẫu nhiên có kỳ vọng và phương sai hữu hạn thì với ε > ta có: P{ X − EX > ε} ≤ DX ε và P{ X − EX ≤ ε} ≥ − DX ε2 Luật số lớn Trêbưsép Giả sử X1, X , là dãy các biến ngẫu nhiên độc lập, có các kỳ vọng hữu hạn và phương sai bị chặn trên số C ( DX i ≤ C ; ∀i = 1, 2, ) Khi đó 88 (91) Chương 4: Luật số lớn và định lý giới hạn ⎛ X + + X n EX1 + + EX n ⎞ − > ε ⎟= lim P ⎜ n n n→∞ ⎝ ⎠ Giả sử X1, X , là dãy các biến ngẫu nhiên độc lập có cùng có kỳ vọng μ và phương sai bị chặn trên số C ( DX i ≤ C ; ∀i = 1, 2, ) độc lập có cùng phân bố, có kỳ vọng μ và phương sai σ Khi đó X1 + n + Xn P n→∞ ⎯⎯⎯→ μ Luật số lớn Bernoulli Tần suất xuất biến cố A n phép thử f n hội tụ theo xác suất xác suất p biến cố A Nghĩa là với ε > lim P { f n − p < ε } = n→∞ Định lý giới hạn trung tâm Giả sử X1, X , là dãy các biến ngẫu nhiên độc lập có cùng phân bố, có kỳ vọng μ và X + + X n − nμ hội tụ theo phân bố phương sai σ Khi đó dãy biến ngẫu nhiên S n = σ n phân bố chuẩn tắc N (0;1) , nghĩa là: Với x ∈ , lim P {S n < x} = Φ ( x) n→∞ CÂU HỎI ÔN TẬP VÀ BÀI TẬP 4.1 Luật số lớn kết luận hội tụ theo xác suất trung bình cộng các biến ngẫu nhiên độc lập trung bình cộng kỳ vọng chúng các phương sai các biến ngẫu nhiên này bị chặn Đúng Sai 4.2 Giả sử {X n } là dãy các biến ngẫu nhiên có kỳ vọng và phương sai dần tới 0, đó dãy hội tụ theo xác suất đến kỳ vọng chung dãy biến ngẫu nhiên trên Đúng Sai 4.3 Bất đẳng thức Trêbưsép đúng các biến ngẫu nhiên rời rạc Đúng Sai 4.4 Bất đẳng thức Trêbưsép đúng các biến ngẫu nhiên nhận giá trị dương Đúng Sai 4.5 Luật số lớn Bernoulli là trường hợp đặc biết luật số lớn Trêbưsép dãy các biến ngẫu nhiên có cùng phân bố không – A( p ) Đúng Sai 4.6 Luật số lớn Bernoulli là sở lý thuyết định nghĩa thống kê xác suất Đúng Sai 4.7 Tổng dãy các biến ngẫu nhiên độc lập có cùng phân bố với kỳ vọng và phương sai hữu hạn tiệm cận phân bố chuẩn 89 (92) Chương 4: Luật số lớn và định lý giới hạn Đúng Sai 4.8 Luật số lớn xét hội tụ theo xác suất còn định lý giới hạn trung tâm xét hội tụ theo phân bố dãy các biến ngẫu nhiên Đúng Sai 4.9 Có 10 máy hoạt động độc lập với Xác suất để ca làm việc máy bị hỏng là 0,05 Dựa vào bất đẳng thức Trêbưsép hãy đánh giá xác suất sai lệch số máy hỏng và số máy hỏng trung bình a) Nhỏ b) Lớn 4.10 Cho X , X , , X 12 là các biến ngẫu nhiên độc lập với EX i = 16 , DX i = ( i = 1,12 ) Sử dụng bất đẳng thức Trêbưsép để tìm hai số a, b cho 12 ⎧⎪ ⎫⎪ P ⎨a ≤ ∑ X i ≤ b⎬ ≥ 0,99 ⎪⎩ ⎪⎭ i =1 4.11 Cho X , X , , X 10000 là các biến ngẫu nhiên độc lập có phân bố đoạn ⎧⎪ 10000 ⎫⎪ ⎡ 1⎤ Chứng minh P X 500 ≥ − , ⎨ ⎬≥ ∑ i ⎢ 2 ⎥⎦ ⎣ ⎪⎩ i =1 ⎪⎭ 300 4.12 Gieo xúc xắc cân đối n lần cách độc lập Gọi S là số lần xuất mặt lục n ⎧n ⎫ 31 Chứng minh P ⎨ − n < S < + n ⎬ ≥ ⎩6 ⎭ 36 4.13 Giả sử tiền điện gia đình phải trả tháng là biến ngẫu nhiên với trung bình 16USD và độ lệch tiêu chuẩn 1USD Sử dụng bất đẳng thức Trêbưsép, hãy xác định số M nhỏ để với xác suất 0,99 số tiền điện phải trả năm (12 tháng) không vượt quá M 4.14 Cho dãy các biến ngẫu nhiên độc lập {X n } xác định sau: Xn − 2n 2n P − ( n+1) − −2 n − ( n+1) Chứng minh dãy {X n } thỏa mãn luật số lớn Trêbưsép 4.15 Cho dãy các biến ngẫu nhiên độc lập {X n } xác định sau: Xn P − na 2n na 1− 1 n2 2n đó a là hàng số Dãy {X n } thỏa mãn luật số lớn Trêbưsép không? 90 (93) Chương 4: Luật số lớn và định lý giới hạn 4.16 Cho dãy các biến ngẫu nhiên độc lập {X n } xác định sau: Xn −a a P n +1 2n + n 2n + đó a là hàng số Dãy {X n } thỏa mãn luật số lớn Trêbưsép không? 4.17 Xác suất chậm tầu hành khách là 0,007 Dùng bất đẳng thức Trêbưsép hãy đánh giá xác suất để 20.000 hành khách có từ 100 đến 180 người chậm tầu 4.18 Phải kiểm tra bao nhiêu chi tiết để với xác suất không nhỏ 0,98 có thể hy vọng sai lệch tần suất xuất chi tiết tốt và xác suất để chi tiết là tốt 0,95 không vượt quá 0,01 4.19 Một xí nghiệp sản xuất máy tính có xác suất làm sản phẩm phế phẩm là 0,02 Chọn ngẫu nhiên 2500 máy tính để kiểm tra Tính xác suất để: a) Có đúng hai máy phế phẩm; b) Có không quá hai máy phế phẩm 4.20 Một nhà nghỉ có 1000 khách Nhà ăn phục vụ bữa trưa làm hai đợt liên tiếp Số chỗ ngồi nhà ăn phải ít là bao nhiêu để xác suất biến cố “không đủ chỗ cho người đến ăn” bé 1%? 4.21 Một trường đại học có tiêu tuyển sinh là 300 a) Giả sử có 325 người dự thi và xác suất thi đỗ người là 90% Tính xác suất để số người trúng tuyển không vượt quá tiêu b) Cần cho phép tối đa bao nhiêu người dự thi (xác suất đỗ họ là 90%) để biến cố “số người trúng tuyển không vượt nhỏ 0,99 91 (94) Chương 5: Thống kê toán học CHƯƠNG V: THỐNG KÊ TOÁN HỌC GIỚI THIỆU Thống kê toán là môn toán học nghiên cứu qui luật các tượng ngẫu nhiên có tính chất số lớn trên sở thu thập và xử lý số liệu thống kê các kết quan sát tượng ngẫu nhiên này Nếu ta thu thập tất các số liệu liên quan đến đối tượng cần nghiên cứu thì ta có thể biết đối tượng này Tuy nhiên thực tế điều đó không thể thực vì quy mô đối tượng nghiên cứu quá lớn quá trình nghiên cứu đối tượng nghiên cứu bị phá hủy Vì cần lấy mẫu để nghiên cứu Phương pháp mẫu là phương pháp quan trọng lý thuyết thống kê Trong chương này chúng ta tìm hiểu vấn đề lý thuyết thống kê toán học: - Cơ sở lý thuyết mẫu Các phương pháp chọn mẫu: mẫu ngẫu nhiên đơn, mẫu ngẫu nhiên hệ thống, mẫu chùm, mẫu phân tổ, mẫu nhiều cấp - Lý thuyết ước lượng - Lý thuyết kiểm định giả thiết thống kê Đối với mẫu ngẫu nhiên ta xét các vấn đề: Các phương pháp mô tả mẫu: bảng phân bố tần số và suất thực nghiệm, bảng phân bố ghép lớp Biểu đồ tần số hình gậy, đa giác tần suất và tổ chức đồ Thống kê mẫu ngẫu nhiên Các đặc trưng thống kê mẫu ngẫu nhiên Quy luật phân bố xác suất số thống kê đặc trưng mẫu Sử dụng phương pháp quy nạp thống kê ta có thể ước lượng các tham số đặc trưng tổng thể thông qua thống kê mẫu Ước lượng điểm là dùng thống kê để ước lượng tham số nào đó theo các tiêu chuẩn: Vững, không chệch, hiệu Có hai phương pháp ước lượng điểm là phương pháp môment và phương pháp hợp lý cực đại Khoảng tin cậy là khoảng mà tham số dấu hiệu nghiên cứu tổng thể rơi vào khoảng này với xác suất độ tin cậy Một dạng khác quy nạp thống kê là kiểm định giả thiết thống kê Đây là phương pháp quan trọng cho phép giải nhiều bài toán thực tế Nội dung kiểm định giả thiết thống kê là dựa vào mẫu cụ thể và các quy tắc hay thủ tục định dẫn đến bác bỏ hay chấp nhận giả thiết tổng thể 92 (95) Chương 5: Thống kê toán học Trong chương này ta xây dựng ước lượng cho kỳ vọng, phương sai dấu hiệu nghiên cứu có phân bố chuẩn và ước lượng cho tần suất tổng thể Kiểm định tham số đặc trưng biến ngẫu nhiên gốc tổng thể: kỳ vọng, phương sai, tần suất tổng thể Để học tốt chương này học viên cần nắm vững sở lý thuyết xác suất đã học các chương trước NỘI DUNG 5.1 LÝ THUYẾT MẪU 5.1.1 Khái niệm lý thuyết mẫu Nhiều bài toán thực tế dẫn đến nghiên cứu hay nhiều dấu hiệu định tính định lượng đặc trưng cho các phần tử tập hợp nào đó Chẳng hạn muốn điều tra thu nhập bình quân các gia đình Hà Nội thì tập hợp cần nghiên cứu là các hộ gia đình Hà Nội, dấu hiệu nghiên cứu là thu nhập gia đình Một doanh nghiệp muốn nghiên cứu các khách hàng mình dấu hiệu định tính có thể là mức độ hài lòng khách hàng sản phẩm dịch vụ doanh nghiệp, còn dấu hiệu định lượng là số lượng sản phẩm doanh nghiệp mà khách hàng có nhu cầu đáp ứng Khi khảo sát tín hiệu là quá trình ngẫu nhiên người ta tiến hành lấy mẫu thời điểm nào đó và thu các tín hiệu mẫu Để xử lý dấu hiệu cần nghiên cứu đôi người ta sử dung phương pháp nghiên cứu toàn bộ, đó là điều tra toàn các phần tử tập hợp theo dấu hiệu cần nghiên cứu để rút các kết luận cần thiết Tuy nhiên thực tế việc áp dụng phương pháp này gặp phải khó khăn sau: - Do qui mô tập hợp cần nghiên cứu quá lớn nên việc nghiên cứu toàn đòi hỏi nhiều chi phí vật chất và thời gian, có thể không kiểm soát dẫn đến bị chồng chéo bỏ sót - Trong nhiều trường hợp không thể nắm toàn các phần tử tập hợp cần nghiên cứu, đó không thể tiến hành toàn - Có thể quá trình điều tra phá hủy đối tượng nghiên cứu … Vì thực tế phương pháp nghiên cứu toàn thường áp dụng các tập hợp có qui mô nhỏ, còn chủ yếu người ta sử dụng phương pháp không toàn mà đặc biệt là phương pháp nghiên cứu chọn mẫu 5.1.2 Tổng thể nghiên cứu Toàn tập hợp các phần tử đồng theo dấu hiệu nghiên cứu định tính hay định lượng nào đó gọi là tổng thể, ký hiệu C Số lượng các phần tử tổng thể gọi là kích thước tổng thể, ký hiệu N Thường thì kích thước N tổng thể là hữu hạn, song tổng thể quá lớn không thể nắm toàn tổng thể ta có thể giả thiết kích thước tổng thể là vô hạn Mỗi phân tử tổng thể gọi là cá thể 93 (96) Chương 5: Thống kê toán học Các cá thể tổng thể nghiên cứu thông qua các dấu hiệu nghiên cứu Dấu hiệu nghiên cứu này có thể định tính định lượng Nếu dấu hiệu nghiên cứu có tính định lượng, nghĩa là thể cách cho tương ứng cá thể tổng thể C nhận giá trị thực nào đó thì dấu hiệu này gọi là biến lượng, ký hiệu X Bằng cách mô hình hóa ta có thể xem biến lượng X là biến ngẫu nhiên xác định trên tổng thể C Việc chọn từ tổng thể tập nào đó gọi là phép lấy mẫu Tập hợp này gọi là mẫu 5.1.3 Mẫu ngẫu nhiên Ta nói mẫu là mẫu ngẫu nhiên phép lấy mẫu đó cá thể tổng thể chọn cách độc lập và có xác suất chọn Giả sử các cá thể tổng thể nghiên cứu thông qua dấu hiệu X Với mẫu ngẫu nhiên kích thước n , gọi X i là dấu hiệu X phần tử thứ i mẫu ( i = 1, n ) Bằng cách đồng mẫu ngẫu nhiên với các dấu hiệu nghiên cứu mẫu ta có định nghĩa mẫu ngẫu nhiên sau: Mẫu ngẫu nhiên kích thước n là dãy gồm n biến ngẫu nhiên: X , X , , X n độc lập cùng phân bố với X , ký hiệu W = ( X , X , , X n ) Thực phép thử mẫu ngẫu nhiên W chính là thực phép thử thành phần mẫu Giả sử X i nhận giá trị xi ( i = 1, n ), đó các giá trị x1 , x , , x n tạo thành giá trị mẫu ngẫu nhiên, hay còn gọi là thể mẫu ngẫu nhiên, ký hiệu w = ( x1 , x , , xn ) Ví dụ 5.1: Gọi X là số nốt xuất tung xúc xắc cân đối, X là biến ngẫu nhiên có bảng phân bố xác suất sau X P 1/ 1/ 1/ 1/ 1/ 1/ Nếu tung xúc xắc lần và gọi X i là số nốt xuất lần tung thứ i ( i = 1,3 ) thì ta có biến ngẫu nhiên độc lập có cùng quy luật phân bố xác suất với X Vây ta có mẫu ngẫu nhiên kích thước 3, W = ( X , X , X ) Thực phép thử mẫu ngẫu nhiên này tức là tung xúc xắc lần Giả sử lần thứ nốt, lần thứ hai nốt lần ba nốt thì w = (2,5,3) là mẫu cụ thể mẫu ngẫu nhiên W 94 (97) Chương 5: Thống kê toán học 5.1.4 Các phương pháp mô tả mẫu ngẫu nhiên 5.1.4.1 Bảng phân bố tần số thực nghiệm Giả sử ta rút mẫu ngẫu nhiên kích thước n X nhận giá trị xi với tần số xuất ri , i = 1, , k ; đó x1 < < x k ; r1 + + rk = n (5.1) Khi đó ta có thể mô tả mẫu ngẫu nhiên trên qua bảng phân bố tần số thực nghiệm X TÇn sè x1 r1 x2 r2 xk rk (5.2) xk fk (5.3) 5.1.4.2 Bảng phân bố tần suất thực nghiệm Ký hiệu f i = ri gọi là tần suất xi n Ta có bảng phân bố tần suất thực nghiệm X X TÇn suÊt x1 f1 x2 f2 Ví dụ 5.2: Lấy mẫu ngẫu nhiên kích thược 120 ta có bảng phân bố thực nghiệm tần số và tần suất X 31 34 35 36 38 40 42 44 ∑ TÇn sè 10 20 30 15 10 10 20 120 TÇn suÊt / 24 / 24 / 24 / 24 / 24 / 24 / 24 / 24 5.1.4.3 Hàm phân bố thực nghiệm mẫu Với mẫu ngẫu nhiên xác định bới công thúc (5.1) Hàm số xác định sau Fn ( x) = ∑ fj ; − ∞ < x < +∞ (5.4) x j <x gọi là hàm phân bố thực nghiệm mẫu đã cho Định lý Glivenco hàm phân bố thực nghiệm Fn (x) xấp xỉ với phân bố lý thuyết F ( x) = P{X < x} n đủ lớn 5.1.4.4 Bảng phân bố ghép lớp Trong trường hợp mẫu điều tra có kích thước lớn, các giá trị cụ thể dấu hiệu X lấy giá trị khác song lại khá gần nhau, người ta thường xác định số các khoảng C1 , C , , C k cho giá trị dấu hiệu điều tra thuộc vào khoảng nào đó Các khoảng này lập thành phân hoạch miền giá trị X 95 (98) Chương 5: Thống kê toán học Việc chọn số khoảng và độ rộng khoảng là tuỳ thuộc vào kinh nghiệm người nghiên cứu, nói chung không nên chia quá ít khoảng Ngoài độ rộng các khoảng không thiết phải Chẳng hạn muốn thống kê tỉ lệ người nghiện thuốc lá thì ta tập trung nhiều vào độ tuổi niên và trung niên Ví dụ 5.3: Một mẫu chiều cao 400 cây trình bày bảng phân bố ghép lớp sau: Kho¶ ng 4,5 − 9,5 9,5 − 11,5 TÇn sè ri 18 58 TÇn suÊt f i 0,045 0,145 § é réng kho¶ ng l i y i = ri / l i 3,6 29 11,5 − 13,5 62 0,155 31 13,5 − 16,5 16,5 − 19,5 72 57 0,180 0,1425 3 24 19 19,5 − 22,5 22,5 − 26,5 26,5 − 36,5 42 36 55 0,105 0,090 0,1375 10 14 5,5 Giá trị yi = ri là tần số xuất đơn vị khoảng khoảng có độ dài li li Qui ước: Đầu mút bên phải khoảng thuộc vào khoảng đó mà không thuộc khoảng tính tần số khoảng Trong ví dụ trên ta có các khoảng [4,5 ; 9,5] , (9,5 ;11,5] , (11,5 ;13,5] , 5.1.4.5 Biểu diễn biểu đồ Giả sử dấu hiệu điều tra X có bảng phân bố tần số và tần suất thực nghiệm X TÇn sè x1 r1 x2 r2 xk rk X TÇn suÊt x1 f1 x2 f2 xk fk Trong mặt phẳng với hệ trục toạ độ Oxy Nối điểm trên trục hoành có toạ độ ( xi ,0) với điểm có toạ độ ( xi , ri ) ; i = 1, k ta biểu đồ tần số hình gậy Nối điểm có toạ độ ( xi , f i ) với điểm có toạ độ ( xi +1 , f i +1 ) ; i = 1, k − ta biểu đồ đa giác tần suất Bảng phân bố tần số và tần suất thực nghiệm ví dụ 5.2 có biểu đồ tần số hình gậy và đa giác tần suất 96 (99) Chương 5: Thống kê toán học ri 30 20 15 10 31 34 36 38 40 42 44 31 34 36 38 40 42 44 xi fi / 24 / 24 / 24 / 24 / 24 xi 1.4.6 Tổ chức đồ (histogram) Đối với bảng phân bố ghép lớp, người ta thường dùng tổ chức đồ để biểu diễn Trong mặt phẳng với hệ toạ độ Oxy , trên trục hoành ta chia các khoảng Ci có độ rộng li Với khoảng Ci ta dựng hình chữ nhật có chiều cao yi = yi = fi (đối với tổ chức đồ tần suất) li Tổ chức đồ tần số mẫu ghép lớp ví dụ 5.3 97 ri (đối với tổ chức đồ tần số), hay li (100) Chương 5: Thống kê toán học 31 29 24 19 14 5,5 3,6 4,5 9,5 11,5 13,5 16,5 19,5 22,5 26,5 36,5 Chú ý diện tích giới hạn tổ chức đồ tần số xuất Chẳng hạn số cây nằm khoảng (12; 25] chính là diện tích tổ chức đồ giới hạn đường thẳng x = 12 và x = 25 (13,5 − 12) × 31 + (16,5 − 13,5) × 24 + (19,5 − 16,5) × 19 + ( 22,5 − 19,5) × 14 + ( 25 − 22,5) × = 240 Vậy có 240 cây có chiều cao từ 12m đến 25m Với các dấu hiệu điều tra là định tính thì người ta thường mô tả các số liệu mẫu biểu đồ hình bánh xe Đó là hình tròn chia thành góc có diện tích tỷ lệ với các tần số tương ứng mẫu Ví dụ 5.4: Tổng kết kết học tập sinh viên Học viện ta năm 2005 số liệu sau: 19% 12% 31% Gioi Khá Trung bình Y?u 38% 5.1.5 Thống kê và các đặc trưng mẫu ngẫu nhiên 5.1.5.1 Định nghĩa thống kê Một thống kê mẫu là hàm các biến ngẫu nhiên thành phần mẫu Thống kê mẫu ngẫu nhiên W = ( X , X , , X n ) có dạng: T = T ( X , X , , X n ) 98 (5.5) (101) Chương 5: Thống kê toán học Như thống kê T là biến ngẫu nhiên tuân theo quy luật phân bố xác suất định và có các tham số đặc trưng kỳ vọng ET phương sai DT … Mặt khác, mẫu ngẫu nhiên nhận giá trị cụ thể w = ( x1 , x , , x n ) thì T nhận giá trị cụ thể là T = T ( x1 , x , , x n ) Các thống kê cùng với quy luật phân bố xác suất chúng là sở để suy rộng các thông tin mẫu cho dấu hiệu nghiên cứu tổng thể 5.1.5.2 Trung bình mẫu Trung bình mẫu mẫu ngẫu nhiên W = ( X , X , , X n ) biến ngẫu nhiên X định nghĩa và ký hiệu n X = ∑ Xi n i =1 (5.6) Giá trị trung bình mẫu cụ thể mẫu ngẫu nhiên cụ thể w = ( x1 , x , , x n ) là n x = ∑ xi n i =1 (5.7) Giả sử dấu hiệu nghiên cứu X có kỳ vọng và phương sai hữu hạn, áp dụng các công thức tính kỳ vọng và phương sai tổng các biến ngẫu nhiên độc lập (2.46), (2.50), (2.58) ta có ( ) ( ) DX n (5.8) k = ∑ ri X i − X n i =1 (5.9) E X = EX ; D X = 5.1.5.3 Phương sai mẫu Phương sai mẫu Ŝ : k ˆ S = ∑ ri X i − X n i =1 ( ( )2 Phương sai mẫu có hiệu chỉnh S : S2 = ) ( k ∑ ri X i − X n − i =1 ) = ( ) k n ri X i2 − X ∑ n − i =1 n −1 (5.9)’ Phương sai mẫu S * dấu hiệu nghiên cứu X tổng thể có kỳ vọng xác định EX = μ S *2 = k ri ( X i − μ )2 ∑ n i =1 (5.10) Áp dụng công thức tính kỳ vọng (2.46), (2.50) và (5.8) ta có: ES = DX và ES * = DX 99 (5.11) (102) Chương 5: Thống kê toán học 5.1.5.4 Độ lệch tiêu chuẩn mẫu ( k ∑ ri X i − X n − i =1 S = S2 = ) (5.12) 5.1.5.5 Tần suất mẫu Ta cần nghiên cứu dấu hiệu nghiên cứu A nào đó mà cá thể tổng thể có thể có không có dấu hiệu A Nếu cá thể có dấu hiệu A ta cho nhận giá trị 1, trường hợp ngược lại ta cho nhận giá trị Lúc đó dấu hiệu nghiên cứu có thể xem là biến ngẫu nhiên X có quy luật phân bố xác suất không – A( p) có kỳ vọng và phương sai EX = p , DX = p(1 − p) (công thức (2.9)) Lấy mẫu ngẫu nhiên: W = ( X , X , , X n ) , X , X , , X n là các biến ngẫu nhiên độc lập có cùng phân bố không – A( p) Tần số xuất dấu hiệu A mẫu là r = X1 + X + + Xn (5.13) Tần suất mẫu f = r n (5.14) Tương tự công thức (5.11) ta có công thức tính kỳ vọng và phương sai tần suất mẫu: E ( f ) = p ; D( f ) = p (1 − p ) n (5.15) 5.1.5.6 Cách tính giá trị cụ thể trung bình mẫu và phương sai mẫu x , s Nếu mẫu nhận các giá trị x1 , x , , x k với tần số tương ứng r1 , r2 , , rk thì giá trị trung bình mẫu và phương sai mẫu cụ thể tính theo công thức ∑ x= k ( s2 = ∑ ri xi − x n − i =1 ) k i =1 i i rx n , k ∑r = n i =1 (5.16) i ⎛ ⎜ k = ∑ ri xi2 − n − ⎜⎜ i =1 ⎝ ( ∑ i=1 ri xi k n ) ⎞ ⎟ ⎟ ⎟ ⎠ (5.17) Nếu giá trị mẫu cụ thể cho dạng bảng phân bố ghép lớp với các khoảng C1 , , C m và tần số Ci là ri thì giá trị trung bình mẫu và phương sai mẫu tính trên, đó xi là trung điểm khoảng Ci Mẫu thu gọn: Nếu các giá trị mẫu cụ thể xi không gọn (quá lớn quá bé phân tán) ta có thể thu gọn mẫu cách đổi biến: 100 (103) Chương 5: Thống kê toán học ui = Thật vậy: x = sx2 = xi − a ⇒ xi = hu i + a h ⇒ x = h u + a ; s x2 = h su2 (5.18) k k h k r x = r h u + a = ( ) ∑ i i n∑ ∑ rui i + a = h u + a i i n i =1 n i =1 i =1 ( k ∑ ri xi − x n − i =1 ) ( k ∑ ri h ui + a − h u − a n − i =1 = ) = h2 k ∑ ri ui − u n − i =1 ( ) = h su2 Các số a và h chọn phù hợp cho u , su2 tính dễ dàng Thông thường ta chọn a là điểm các giá trị xi Ví dụ 5.5: Giá trị trung bình mẫu và phương sai mẫu mẫu ví dụ 5.3 xi − 20 ru i i ru i i − 2,6 − 46,8 121,68 10,5 − 1,9 − 110,2 209,38 62 12,5 − 1,5 − 93 139,5 13,5 − 16,5 72 15 −1 − 72 72 16,9 − 19,5 57 18 − 0,4 − 22,8 9,12 19,5 − 22,5 42 21 0,2 8,4 1,68 22,5 − 26,5 36 24,5 0,9 32,4 29,16 26,5 − 36,5 55 31,5 2,3 126,5 290,95 − 177,5 873,47 Khoảng tần số ri xi 4,5 − 9,5 18 9,5 − 11,5 58 11,5 − 13,5 ∑ ui = 400 ( − 177,5 − 177,5)2 ⎞⎟ ⎛⎜ × 873,47 − = 1,9917 x = u + 20 = × + 20 = 17,78 su = 400 ⎟⎠ 399 ⎜⎝ 400 s x2 = × su2 = 49,79 ⇒ s = 49,79 = 7,056 5.1.6 Quy luật phân bố xác suất số thống kê đặc trưng mẫu Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân bố chuẩn Giả sử dấu hiệu nghiên cứu tổng thể có thể xem biến ngẫu nhiên X tuân theo quy luật chuẩn với kỳ vọng EX = μ và phương sai DX = σ Các tham số này có thể đã biết chưa biết Từ tổng thể rút mẫu ngẫu nhiên kích thước n : W = ( X , X , , X n ) 101 (104) Chương 5: Thống kê toán học Các biến ngẫu nhiên thành phần X , X , , X n độc lập có cùng quy luật phân bố chuẩn N (μ, σ ) X Theo định lý 3.10 tổ hợp tuyến tính các biến ngẫu nhiên có phân bố chuẩn là biến ngẫu nhiên có phân bố chuẩn Vì ta có các kết sau: 1) Thống kê trung bình mẫu: ( ) Trung bình mẫu X có quy luật phân bố chuẩn với kỳ vọng E X = μ và phương sai ( ) DX = σ2 , áp dụng công thức (2.33) suy thống kê sau có quy luật chuẩn tắc N (0;1) : n U= ( X − μ) n ~ N (0;1) σ (5.19) 2) Thống kê phương sai Ŝ n n nSˆ ⎛ X −μ⎞ Từ công thức (5.16) ta có: nSˆ = ∑ ( X i − μ )2 và = ∑ ⎜ i ⎟ σ ⎠ σ i =1 i =1 ⎝ Vì các biến ngẫu nhiên X i độc lập nên các biến ngẫu nhiên khác theo (2.33) Xi − μ độc lập Mặt σ Xi − μ ~ N (0;1) Do đó thống kê sau có phân bố bình phương n bậc tự σ χ2 = nSˆ σ2 n ⎛ X −μ⎞ = ∑⎜ i ⎟ ~ χ ( n) σ ⎠ i =1 ⎝ (5.20) 3) Thống kê phương sai S Tương tự thống kê sau có phân bố bình phương n − bậc tự χ = (n − 1) S σ2 ⎛X −X = ∑ ⎜⎜ i σ i =1 ⎝ n ⎞ ⎟ ~ χ (n − 1) ⎟ ⎠ 4) Từ (5.19), (5.21) và U , χ độc lập, áp dụng công thức (2.42) thì T = (5.21) U χ (n − 1) có phân bố Student n − bậc tự ( X − μ) n ( X − μ) n U σ = ~ T(n − 1) = T= S (n − 1) S χ (n − 1) (5.22) σ (n − 1) Khi n khá lớn thì quy luật Student T(n) hội tụ khá nhanh phân bố chuẩn tắc N (0;1) , đó thực tế n > 30 ta có thể xem thống kê T xấp xỉ N (0;1) 102 (105) Chương 5: Thống kê toán học Quy luật phân bố tần suất mẫu Giả sử tổng thể dấu hiệu nghiên cứu có thể xem biến ngẫu nhiên phân bố theo quy luật không – Từ tổng thể rút mẫu ngẫu nhiên kích thước n : W = ( X , X , , X n ) Từ công thức (5.13), (5.14), (5.15) ta đã biết tần suất mẫu f = nhị thức với các tham số đặc trưng là: E ( f ) = p ; D( f ) = X1 + n + Xn có quy luật pq n Áp dụng định lý Moivre-Laplace ta có: ⎪⎧ ( f − p) n ⎪⎫ < x ⎬ = Φ ( x) Với x ∈ , lim P ⎨ n→∞ ⎪ pq ⎪⎭ ⎩ Như có thể xấp xỉ thống kê U = (5.23) ( f − p) n với phân bố chuẩn tắc N (0;1) n đủ lớn pq Người ta thấy xấp xỉ là tốt np > và nq > npq > 20 U= ⎧ np > ( f − p) n npq > 20 ~ N (0;1) ⎨ pq ⎩ nq > (5.24) 5.2 LÝ THUYẾT ƯỚC LƯỢNG 5.2.1 Phương pháp ước lượng điểm Phương pháp ước lượng điểm chủ trương dùng giá trị để thay cho giá trị tham số θ chưa biết tổng thể Thông thường giá trị chọn này là giá trị cụ thể thống kê θ̂ nào đó mẫu ngẫu nhiên Với mẫu ngẫu nhiên W = ( X , X , , X n ) , thống kê ước lượng cho tham số θ có dạng công thức (5.5): θˆ = T ( X , X , , X n ) Khi đó với mẫu cụ thể w = ( x1 , x , , x n ) giá trị cụ thể thống kê θˆ = T (x1 , x , , x n ) là ước lượng θ Cùng với mẫu ngẫu nhiên có thể xây dựng nhiều thống kê θ̂ khác để ước lượng cho tham số θ Vì ta cần lựa chọn thống kê tốt để ước lượng cho tham số θ dựa vào các tiêu chuẩn sau: 103 (106) Chương 5: Thống kê toán học 5.2.2 Ước lượng không chệch Thống kê θˆ = T ( X , X , , X n ) là hàm các biến ngẫu nhiên X , X , , X n nên là biến ngẫu nhiên Do đó ta có thể xét các đặc trưng thống kê này Định nghĩa 5.1: Thống kê θˆ = T ( X , X , , X n ) gọi là ước lượng không chệch θ với giá trị tham số θ ˆ =θ E(θ) (5.25) ˆ ≠ θ thì θˆ = T ( X , X , , X ) gọi là ước lượng chệch θ Nếu E (θ) n 5.2.3 Ước lượng hiệu Điều kiện (5.25) ước lượng không chệch có nghĩa trung bình các giá trị θ̂ giá trị θ Từng giá trị θ̂ có thể sai lệch lớn so với θ Vì ta tìm ước lượng không chệch cho độ sai lệch trên bé Định nghĩa 5.2: Ước lượng không chệch có phương sai nhỏ so với ước lượng không chệch khác xây dựng trên cùng mẫu ngẫu nhiên gọi là ước lượng hiệu Như vậy, để xét xem ước lượng không chệch θ̂ có phải là ước lượng hiệu θ hay không ta cần phải tìm cận phương sai các ước lượng không chệch và so sánh phương sai θ̂ với cận này Điều này giải bất đẳng thức Cramer-Rao phát biểu sau: Cho mẫu ngẫu nhiên W = ( X , X , , X n ) lấy từ tổng thể có dấu hiệu nghiên cứu là biến ngẫu nhiên X có hàm mật độ xác suất (hay biểu thức xác suất ) f ( x, θ) thỏa mãn số điều kiện định (thường thỏa mãn thực tế, ít là các phân bố xác suất đã xét chương II) và θ̂ là ước lượng không chệch θ thì () D θˆ ≥ ⎛ ∂ (ln f ( x, θ) ) ⎞ nE⎜ ⎟ ∂θ ⎝ ⎠ (5.26) Ví dụ 5.6: Dựa vào bất đẳng thức trên ta có thể chứng minh trung bình mẫu X là ước lượng hiệu kỳ vọng μ dấu hiệu nghiên cứu X tổng thể có phân bố chuẩn N (μ, σ ) ( ) Thật theo công thức (5.8) ta có D X = σ2 Mặt khác theo (2.26) hàm mật độ X n có dạng f ( x, θ ) = σ 2π −( x− μ )2 e 2σ 104 (107) Chương 5: Thống kê toán học ( ) ⇒ ln f ( x, μ ) = − ln σ 2π − ( x − μ )2 Vậy 2σ ⇒ ∂ ln f ( x, μ ) x − μ = ∂μ σ ⎛ ∂ ( ln f ( X , θ ) ) ⎞ n n n ⎛ X −μ ⎞ nE ⎜ = E( X − μ) = D( X ) = ⎟ = nE ⎜ ⎟ ∂θ σ σ σ ⎝ σ ⎠ ⎝ ⎠ ( ) Như D X = σ2 n đạt giá trị cực tiểu bất đẳng thức Cramer-Rao, đó trung bình mẫu X là ước lượng hiệu μ 5.2.4 Ước lượng vững Định nghĩa 5.3: Thống kê θˆ = T ( X , X , , X n ) gọi là ước lượng vững tham số θ biến ngẫu nhiên gốc X θˆ = T ( X , X , , X n ) hội tụ theo xác suất đến θ n → ∞ Nghĩa là với ε > , luôn có { } lim P θˆ − θ < ε = n→∞ (5.27) Theo hệ luật số lớn Trêbưsep, công thức (4.9) chương IV, ta có trung bình mẫu X là ước lượng vững kỳ vọng μ , S và Ŝ là ước lượng vững phương sai σ biến ngẫu nhiên gốc X tổng thể Theo luật số lớn Bernoulli ta suy tần suất mẫu f là ước lượng vững tần suất p tổng thể Tóm lại ta có kết sau: ¾ Trung bình mẫu X là ước lượng không chệch, hiệu và vững kỳ vọng μ biến ngẫu nhiên gốc tổng thể ¾ Tần suất mẫu f là ước lượng không chệch, hiệu và vững tần suất p tổng thể ¾ Phương sai mẫu S và S * (trường hợp μ đã biết) là ước lượng không chệch và vững phương sai σ biến ngẫu nhiên gốc tổng thể 5.2.5 Phương pháp ước lượng khoảng tin cậy Các phương pháp ước lượng điểm nói trên có nhược điểm là kích thước mẫu bé thì ước lượng điểm có thể sai lệch nhiều so với giá trị tham số cần ước lượng Mặt khác phương pháp trên không thể đánh giá khả mắc sai lầm ước lượng là bao nhiêu Do đó kích thước mẫu bé người ta thường dùng phương pháp ước lượng khoảng tin cậy Nghĩa là từ mẫu ngẫu nhiên tìm khoảng [a; b] chứa tham số θ với xác suất β đủ lớn cho trước ( β gọi là độ tin cậy và thường chọn là 0,95 hay 0,99) 105 (108) Chương 5: Thống kê toán học Định nghĩa 5.4: Khoảng [a ; b ] có hai đầu mút là hai thống kê a = a( X , X , , X n ) , b = b( X , X , , X n ) (5.28) phụ thuộc mẫu ngẫu nhiên W = ( X , X , , X n ) biến ngẫu nhiên gốc X , gọi là khoảng tin cậy tham số θ với độ tin cậy β nếu: P{a( X , X , , X n ) ≤ θ ≤ b( X , X , , X n )} = β (5.29) Trong thực tế thường yêu cầu độ tin cậy β khá lớn, đó theo nguyên lý xác suất lớn biến cố {a ≤ θ ≤ b} chắn xảy phép thử Tiến hành phép thử với mẫu ngẫu nhiên W = ( X , X , , X n ) ta thu mẫu cụ thể w = ( x1 , x , , x n ) , tính giá trị cụ thể a = a( x1 , x , , x n ) , b = b( x1 , x , , x n ) Lúc đó có thể kết luận là: Qua mẫu cụ thể với độ tin cậy β tham số θ biến ngẫu nhiên gốc X nằm khoảng [a ; b ] , tức là a ≤ θ ≤ b 5.2.6 Khoảng tin cậy kỳ vọng biến ngẫu nhiên phân bố theo quy luật chuẩn Giả sử tổng thể biến ngẫu nhiên gốc X có phân bố chuẩn N ( μ ; σ ) chưa biết tham số μ nó Từ tổng thể rút mẫu ngẫu nhiên kích thước n : W = ( X , X , , X n ) , ta tìm khoảng tin cậy μ các trường hợp sau: 5.2.6.1 Trường hợp phương sai σ đã biết Định lý 5.1: Khoảng tin cậy tham số μ với độ tin cậy β có dạng: σ σ ⎤ ⎡ ; X + Uα / ⎢ X − Uα / ⎥ n n⎦ ⎣ đó: α = − β ; U α là giá trị tới hạn mức α Chứng minh: Theo công thức (5.19) ta có Mặt khác: X − Uα / σ n ≤ μ ≤ X + Uα / (5.30) phân bố chuẩn tắc N (0;1) (công thức 3.21) ( X − μ) n σ σ n ⇔ ~ N (0;1) (X − μ) n σ ≤ Uα / Áp dụng công thức (2.32) ta có σ σ ⎤ ⎡ ⎪⎧ ( X − μ ) n ⎪⎫ P ⎢ X − Uα / ≤ μ ≤ X + Uα / ≤ Uα / ⎬ = − α = β ⎥ = P⎨ σ n n⎦ ⎣ ⎪⎩ ⎪⎭ 106 (109) Chương 5: Thống kê toán học σ Định nghĩa 5.5: ε = Uα / n gọi là độ chính xác ước lượng Với độ chính xác ε và độ tin cậy β cho trước, thì kích thước mẫu cần thiết là số tự nhiên n nhỏ thỏa mãn: σ 2Uα2 / n≥ ε 02 (5.31) Ví dụ 5.7: Trọng lượng loại sản phẩm là biến ngẫu nhiên phân bố theo quy luật chuẩn với độ lệch tiêu chuẩn gram Cần thử 25 sản phẩm loại này ta thu kết quả: Trọng lượng (gram) 18 19 20 21 Số SP tương ứng 15 Với độ tin cậy 95% a Hãy tìm khoảng tin cậy trọng lượng trung bình loại sản phẩm trên b Nếu muốn độ chính xác ước lượng không vượt quá 0,3 thì cần cân thử ít bao nhiêu sản phẩm Giải: Gọi X là trọng lượng sản phẩm, theo giả thiết X có phân bố chuẩn N (μ; σ ) với σ = Trọng lượng trung bình sản phẩm là tham số μ Khoảng tin cậy có dạng (5.30) Với độ tin cậy β = 0,95 ⇒ α = 0, 025 ⇒ U α = 1,96 a Từ bảng số liệu tìm trung bình mẫu cụ thể: x = ⋅18 + ⋅19 + 15 ⋅ 20 + ⋅ 21 = 19, 64 25 Độ chính xác ước lượng ε = Uα / σ n = 1,96 ⋅ = 0,392 25 Vậy với độ tin cậy 95% qua mẫu cụ thể này, khoảng tin cậy tham số μ là: [19,64 − 0,392 ; 19,64 + 0,392] hay 19, 248 ≤ μ ≤ 20, 032 b Nếu muốn độ chính xác ước lượng không vượt quá 0,3 thì cần cân thử ít n sản phẩm cho: σ 2Uα2 / 1⋅1,962 = = 42, 68 n≥ 0,32 ε 02 Chọn n = 43 107 (110) Chương 5: Thống kê toán học 5.2.6.2 Trường hợp phương sai σ chưa biết, kích thước mẫu n ≥ 30 Trong nhiều bài toán thực tế, ta không biết phương sai σ biến ngẫu nhiên gốc X tổng thể Nhưng kích thước mẫu n đủ lớn ( n ≥ 30 ) ta có thể xấp xỉ độ lệch chuẩn σ độ lệch chuẩn mẫu S (vì S là ước lượng vững không chệch σ ), S xác định công thức (5.12) Mặt khác, theo định lý giới hạn trung tâm thì thống kê (X − μ) n σ xấp xỉ chuẩn, đúng với biến ngẫu nhiên gốc X (không đòi hỏi phân bố chuẩn) Do đó khoảng tin cậy tham số μ với độ tin cậy β có thể lấy là S S ⎤ ⎡ ; X + Uα / ⎢ X − Uα / ⎥ n n⎦ ⎣ (5.32) Ví dụ 5.8: Để xác định chiều cao trung bình các cây bạch đàn khu rừng rộng trồng bạch đàn, ta tiến hành đo ngẫu nhiên 35 cây và có kết cho bảng sau: Khoảng ri xi ui = xi − 8, 25 ri ui ri ui2 6,5 − 7, 6,75 −1,5 −3 4,5 7, − 7,5 7,25 −1, −4 7,5 − 8, 10 7,75 −0,5 −5 2,5 8, − 8,5 11 8,25 0 8,5 − 9, 8,75 0,5 2,5 1, 25 9, − 9,5 9,25 1, 3 ∑ 35 −6,5 15, 25 u = −6,5 = −0,1857 ⇒ x = 8, 25 − 0,1857 ≈ 8, 06 35 s X2 = sU2 = ⎛ (−6,5)2 ⎞ ⎜⎜ 15, 25 − ⎟ = 0, 413 ⇒ s = 0, 64 34 ⎝ 35 ⎟⎠ Với độ tin cậy β = 95% , U α = 1,96 Độ chính xác ước lượng ε = Uα / 0, 64 s = 1,96 ⋅ = 0, 21 35 n Vậy khoảng tin cậy cho chiều cao trung bình μ các cây bạch đàn là: 7,87 ≤ μ ≤ 8, 29 108 (111) Chương 5: Thống kê toán học 5.2.6.3 Trường hợp phương sai σ chưa biết, kích thước mẫu n < 30 Trong trường hợp này, theo công thức (5.22) thống kê T= (X − μ) n S (5.33) có phân bố Student n − bậc tự Vì khoảng tin cậy tính theo kết sau: Định lý 5.2: Khoảng tin cậy tham số μ với độ tin cậy β có dạng: S S ⎤ ⎡ ; X + tα / (n − 1) ⎢ X − tα / (n − 1) ⎥, n n⎦ ⎣ đó tα / (n − 1) là giá trị tới hạn mức α (5.34) phân bố Student n − bậc tự (công thức 2.43) Độ chính xác ước lượng: ε = tα / (n − 1) S n (5.35) Với độ tin cậy β và độ chính xác ε cho trước thì kích thước mẫu cần thiết là số tự nhiên n nhỏ thỏa mãn: ⎛ S ⋅ tα / (n − 1) ⎞ n≥⎜ ⎟ ε0 ⎝ ⎠ (5.36) Ví dụ 5.9: Năng suất loại giống là biến ngẫu nhiên có quy luật phân bố chuẩn N ( μ ; σ ) Gieo thử giống hạt này trên 16 mảnh vườn thí nghiệm thu sau (đơn vị kg/ha): 172, 173, 173,174, 174, 175, 176, 166, 166, 167, 165, 173, 171, 170, 171, 170 Hãy tìm khoảng tin cậy cho suất trung bình loại hạt giống này với độ tin cậy β = 95% Giải: Năng suất trung bình hạt giống là tham số μ Từ các số liệu trên ta tính được: x = 171; s = 3, 4254 α = 0, 05; α = 0, 025 Tra bảng phân bố Student với 15 bậc tự ta tìm tα / (n − 1) = t0,025 (15) = 2,131 Độ chính xác ε = tα / (n − 1) 3, 4254 S = 2,131 ⋅ = 1,885 16 n Vậy khoảng tin cậy cho suất trung bình loại hạt giống này là μ thỏa mãn: 169,115 ≤ μ ≤ 172,885 109 (112) Chương 5: Thống kê toán học 5.2.7 Khoảng tin cậy cho tần suất p Ta cần nghiên cứu dấu hiệu nghiên cứu A nào đó mà cá thể tổng thể có thể có không có dấu hiệu A Nếu cá thể có dấu hiệu A ta cho nhận giá trị 1, trường hợp ngược lại ta cho nhận giá trị Lúc đó dấu hiệu nghiên cứu có thể xem là biến ngẫu nhiên X có quy luật phân bố xác suất không – A( p ) có kỳ vọng và phương sai EX = p ; DX = p(1 − p ) Lấy mẫu ngẫu nhiên W = ( X1, X , , X n ) , đó X1, X , , X n là các biến ngẫu nhiên độc lập có cùng phân bố không – A( p ) f = X1 + + Xn n là tần suất mẫu Theo định lý Moivre-Laplace (4.12) thì n đủ lớn ta có thể xấp xỉ thống kê U = ( f − p) n với phân bố chuẩn tắc N (0;1) p (1 − p ) Tuy nhiên vì p chưa biết nên chưa biết p(1 − p) = DX Mặt khác theo công thức (5.21), (5.24) thì tần suất mẫu f là ước lượng vững, không chệch và hiệu tần suất p tổng thể Vì n đủ lớn ta có thể thay p f Do đó khoảng tin cậy cho tần suất p tổng thể với độ tin cậy β là: ⎡ ⎢ f − Uα / ⎣ f (1 − f ) ; f + Uα / n f (1 − f ) ⎤ ⎥ n ⎦ (5.37) Với điều kiện ⎧nf > 10 ⎨ ⎩n(1 − f ) > 10 đó U α là giá trị tới hạn mức α (5.38) phân bố chuẩn tắc N (0;1) với α = − β Độ chính xác khoảng tin cậy: ε = Uα / f (1 − f ) n (5.39) Với độ tin cậy β và độ chính xác ε cho trước thì kích thước mẫu cần thiết là số tự nhiên n nhỏ thỏa mãn: ⎛U ⎞ n ≥ f (1 − f ) ⎜ α / ⎟ ⎝ ε0 ⎠ đó f là tần suất mẫu mẫu ngẫu nhiên nào đó 110 (5.40) (113) Chương 5: Thống kê toán học Ví dụ 5.10: Trong đợt vận động bầu cử tổng thống nước nọ, người ta vấn ngẫu nhiên 1600 cử tri, biết có 960 người số đó bỏ phiếu cho ứng cử viên A Với độ tin cậy β = 95% tối thiếu ứng cử viên A chiếm bao nhiêu % số phiếu bầu Giải: Gọi p là tỉ lệ số phiếu bầu cho ứng cử viên A Tổng thể nghiên cứu là tập hợp tất các cử tri Dấu hiệu nghiên cứu là cử tri bỏ phiếu cho A, là biến ngẫu nhiên có quy luật phân bố không – A( p ) Khoảng tin cậy cho p có dạng (5.37) với điều kiện (5.38) Từ mẫu cụ thể trên ta có f = ⎧nf = 960 > 10 960 = 0, thỏa mãn điều kiện ⎨ 1600 ⎩n(1 − f ) = 640 > 10 Độ chính xác ước lượng ε = Uα / f (1 − f ) 0, ⋅ 0, = 1,96 = 0, 024 n 1600 Khoảng tin cậy: 0,576 ≤ p ≤ 0, 624 Vậy với độ tin cậy 95% thì tối thiểu có 57,6% cử tri bỏ phiếu cho ứng cử viên A 5.3 KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 5.3.1 Khái niệm chung Trong mục trước ta giải các bài toán ước lượng tham số đặc trưng dấu hiệu nghiên cứu tổng thể cách đưa ước lượng các tham số đặc trưng các biến ngẫu nhiên gốc Trong mục này ta nghiên cứu bài toán kiểm định giả thiết các tham số đặc trưng tổng thể 5.3.1.1 Giả thiết thống kê Giả thiết thống kê là giả thiết dạng phân bố xác suất, các đặc trưng tham số biến ngẫu nhiên gốc giả thiết độc lập các biến ngẫu nhiên gốc Giả thiết đưa kiểm nghiệm ký hiệu là H0, gọi là “giả thiết không” Đó là giả thiết mà ta nghi ngờ muốn bác bỏ giả thiết ta muốn bảo vệ Ngoài giả thiết H0 ra, ta còn phải định giả thiết cạnh tranh với H0 gọi là đối thiết, ký hiệu H1 Đối thiết H1 chấp nhận H0 bị bác bỏ Cần chú ý đối thiết H1 không thiết là phủ định giả thiết H0 Chẳng hạn giả thiết H0: nhu cầu thị trường loại hàng hóa này là μ = 1000 đơn vị/tháng Nếu ta nghi ngờ nhu cầu này không đúng thì đối thiết H1 là μ ≠ 1000 , tiếp thị tốt, chính sách hậu mãi tốt người ta nghĩ nhu cầu mặt hàng này tăng lên thì đối thiết H1 là μ > 1000 Qui tắc kiểm định dựa trên hai nguyên lý sau: - Nguyên lý xác suất nhỏ: "Nếu biến cố có xác nhỏ thì hay vài phép thử thì biến cố đó coi không xảy ra" - Phương pháp phản chứng: "Để bác bỏ A ta giả sử A đúng thì dẫn đến điều vô lý" Dựa vào hai nguyên lý này ta đưa phương pháp chung để kiểm định giả thiết thống kê sau: Để kiểm định H0 trước hết giả sử H0 đúng từ đó ta tìm biến cố A mà xác suất 111 (114) Chương 5: Thống kê toán học xuất biến cố A là bé và ta có thể xem A không thể xảy phép thử biến cố này Lúc đó trên mẫu cụ thể quan sát mà biến cố A xuất thì điều này trái với nguyên lý xác suất nhỏ Vậy H0 sai và bác bỏ nó Còn A không xảy thì ta chưa có sở để bác bỏ H0 Ta thực phương pháp trên các bước cụ thể sau: 5.3.1.2 Tiêu chuẩn kiểm định giả thiết thống kê Từ biến ngẫu nhiên gốc X tổng thể lập mẫu ngẫu nhiên W = ( X , X , , X n ) Chọn thống kê T = T ( X , X , , X n , θ ) (5.41) đó θ là tham số liên quan đến giả thiết cần kiểm định Nếu H0 đúng thì thống kê T có quy luật phân bố xác suất xác định Thống kê T gọi là tiêu chuẩn kiểm định 5.3.1.3 Miền bác bỏ giả thiết Sau đã chọn tiêu chuẩn kiểm định T , với α bé cho trước (thường α lấy 0,05 0,01) và với điều kiện H0 đúng ta có thể tìm miền Wα cho T nhận giá trị miền Wα với xác suất α : P {T ∈ Wα H } = α (5.42) Giá trị α gọi là mức ý nghĩa kiểm định và miền Wα gọi là miền bác bỏ giả thiết H0 với mức ý nghĩa α 5.3.1.4 Giá trị quan sát tiêu chuẩn kiểm định Thực phép thử với mẫu ngẫu nhiên W = ( X , X , , X n ) thu mẫu cụ thể w = ( x1 , x , , x n ) , thay giá trị này vào thống kê (5.41) ta giá trị quan sát tiêu chuẩn kiểm định: Tqs = ( x1 , x , , x n , θ ) (5.43) 5.3.1.5 Quy tắc kiểm định giả thiết thống kê So sánh giá trị quan sát tiêu chuẩn kiểm định với miền bác bỏ Wα và kết luận theo quy tắc sau: Nếu Tqs ∈Wα , theo nguyên tắc kiểm định thì H0 sai, đó ta bác bỏ H0 thừa nhận H1 Nếu Tqs ∉Wα thì điều này chưa khẳng định H0 đúng mà có nghĩa là qua mẫu cụ thể này chưa khẳng định là H0 sai Do đó ta có thể nói qua mẫu cụ thể này chưa có sở để bác bỏ H0 (trên thực tế là thừa nhận H0) 112 (115) Chương 5: Thống kê toán học 5.3.1.6 Sai lầm loại và sai lầm loại hai Với quy tắc kiểm định trên có thể mắc hai loại sai lầm sau: Sai lầm loại I: Đó là sai lầm mắc phải bác bỏ giả thiết H0 H0 đúng Ta thấy xác suất mắc sai lầm loại I đúng mức ý nghĩa α Thật vậy, xác suất ta bác bỏ H0 xác suất biến cố {T ∈Wα }, đó H0 đúng thì xác suất này P{T ∈ Wα H } = α Sai lầm loại I sinh kích thước mẫu quá nhỏ, phương pháp lấy mẫu v.v… Sai lầm loại II: Đó là sai lầm mắc phải thừa nhận giả thiết H0 H0 sai, điều này xảy giá trị quan sát Tqs không thuộc miền bác bỏ Wα H1 đúng Vậy xác suất sai lầm loại II là β xác định sau: P {T ∉ Wα H1} = β (5.44) Xác suất biến cố đối sai lầm loại II: P{T ∈ Wα H } = − β gọi là lực lượng kiểm định Thực tế Quyết định Bác bỏ H0 Không bác bỏ H0 H0 đúng H0 sai Sai lầm loại I Quyết định đúng Xác suất = α Xác suất = − β Quyết định đúng Sai lầm loại II Xác suất = − α Xác suất = β Ta muốn tìm qui tắc kiểm định mà hai loại sai lầm trên là cực tiểu Nhưng không tồn kiểm định lý tưởng vậy, vì nói chung giảm sai lầm loại I thì sai lầm loại II tăng và ngược lại Chẳng hạn lấy α = thì không bác bỏ giả thiết nào, kể giả thiết sai, β đạt cực đại Mặt khác bài toán kiểm định thì giả thiết H0 là giả thiết quan trọng, đó sai lầm nó càng nhỏ càng tốt Vì các nhà thống kê đưa phương pháp sau: Sau ta chọn sai lầm loại I nhỏ mức ý nghĩa α , với mẫu kích thước n xác định, ta chọn miền bác bỏ Wα cho xác suất sai lầm loại II là nhỏ hay lực lượng kiểm định là lớn Nghĩa là cần tìm miền bác bỏ Wα thỏa mãn điều kiện: P{T ∈ Wα H } = α và P{T ∈ Wα H1 } = − β → max Định lý Neymann - Pearson nhiều bài toán quan trọng thực tiễn có thể tìm miền bác bỏ Wα thỏa mãn điều kiện trên Việc chọn mức ý nghĩa α bao nhiêu tùy thuộc vào trường hợp cụ thể, tùy thuộc vào ý nghĩa bài toán 113 (116) Chương 5: Thống kê toán học 5.3.1.7 Thủ tục kiểm định giả thiết thống kê Qua nội dung trình bày trên ta có thể xây dựng thủ tục kiểm định giả thiết thống kê bao gồm các bước sau: a Phát biểu giả thiết H0 và đối thiết H1 b Từ tổng thể nghiên cứu lập mẫu ngẫu nhiên kích thước n c Chọn tiêu chuẩn kiểm định T và xác định quy luật phân bố xác suất T với điều kiện giả thiết H0 đúng d Với mức ý nghĩa α , xác định miền bác bỏ Wα tốt tùy thuộc vào đối thiết H1 e Từ mẫu cụ thể tính giá trị quan sát tiêu chuẩn kiểm định Tqs f So sánh giá trị quan sát tiêu chuẩn kiểm định Tqs với miền bác bỏ Wα và kết luận 5.3.2 Kiểm định giả thiết kỳ vọng biến ngẫu nhiên có phân bố theo quy luật chuẩn Giả sử biến ngẫu nhiên gốc X tổng thể có phân bố chuẩn N (μ; σ ) , cần kiểm định kỳ vọng μ Nếu có sở để giả thiết kỳ vọng μ giá trị μ ta đưa giả thiết thống kê H0 : μ = μ Ta xét các trường hợp sau: 5.3.2.1 Trường hợp đã biết phương sai Giả sử phương sai σ biến ngẫu nhiên gốc X tổng thể có phân bố chuẩn N (μ; σ ) đã biết Từ tổng thể rút mẫu ngẫu nhiên kích thước n : W = ( X , X , , X n ) Xét thống kê T= ( X − μ0 ) n σ (5.45) Nếu giả thiết H0 đúng, theo công thức (5.19) thì thống kê T có phân bố chuẩn tắc N (0;1) Ta xây dựng các miền bác bỏ dựa vào đối thiết H1 a Bài toán 1: H0: μ = μ ; H1: μ ≠ μ Ta nói đây là bài toán kiểm định hai phía Miền bác bỏ ⎧⎪ ⎫⎪ ( X − μ0 ) n Wα = ⎨T = ; T > Uα/2 ⎬ σ ⎪⎩ ⎪⎭ (5.46) b Bài toán 2: H0: μ = μ ; H1: μ > μ Đây là bài toán kiểm định phía Miền bác bỏ ⎧⎪ ⎫⎪ ( X − μ0 ) n Wα = ⎨T = ; T > Uα ⎬ σ ⎪⎩ ⎪⎭ c Bài toán 3: H0: μ = μ ; H1: μ < μ Đây là bài toán kiểm định phía 114 (5.47) (117) Chương 5: Thống kê toán học Miền bác bỏ ⎧⎪ ⎫⎪ ( X − μ0 ) n Wα = ⎨T = ; −T > Uα ⎬ σ ⎪⎩ ⎪⎭ đó U α / , U α là giá trị tới hạn mức α (5.48) và mức α phân bố chuẩn tắc N (0;1) Lập mẫu cụ thể w = ( x1 , x , , x n ) và tính giá trị quan sát tiêu chuẩn kiểm định Tqs = ( x − μ0 ) n và so sánh với miền bác bỏ Wα để kết luận σ 5.3.2.2 Trường hợp chưa biết phương sai, kích thước mẫu n ≥ 30 Trường hợp phương sai σ chưa biết: Với kích thước n đủ lớn ( n ≥ 30 ) và giả thiết H0 đúng, tương tự mục 5.2.6.2 ta có thống kê T= ( X − μ0 ) n S (5.49) xấp xỉ phân bố chuẩn tắc N (0;1) Ta xây dựng các miền bác bỏ dựa vào đối thiết H1 a Bài toán 1: H0: μ = μ ; H1: μ ≠ μ Ta nói đây là bài toán kiểm định hai phía Miền bác bỏ ⎧⎪ ⎫⎪ ( X − μ0 ) n Wα = ⎨T = ; T > Uα/2 ⎬ S ⎪⎩ ⎪⎭ (5.50) b Bài toán 2: H0: μ = μ ; H1: μ > μ Đây là bài toán kiểm định phía ⎧⎪ ⎫⎪ ( X − μ0 ) n Wα = ⎨T = ; T > Uα ⎬ S ⎪⎩ ⎪⎭ Miền bác bỏ (5.51) c Bài toán 3: H0: μ = μ ; H1: μ < μ Đây là bài toán kiểm định phía Miền bác bỏ ⎧⎪ ⎫⎪ (X − μ0 ) n Wα = ⎨T = ; − T >Uα ⎬ S ⎪⎩ ⎪⎭ (5.52) Ví dụ 5.11: Một hãng buôn muốn biết xem phải có không ổn định trung bình lượng hàng bán trung bình trên nhân viên bán hàng so với các năm trước (lượng đó 7,4) Một mẫu ngẫu nhiên gồm 40 nhân viên bán hàng lựa chọn và tìm thấy lượng hàng trung bình họ là x = 6,1 với độ lệch chuẩn là s = 2,5 Với mức ý nghĩa α = 1% có thể nói lượng hàng bán trung bình trên đầu người có thay đổi không? Giải: Gọi μ là lượng hàng bán trung bình trên nhân viên bán hàng hãng buôn Ta kiểm định: Giả thiết H0 : μ = 7,4 ; Đối thiết H1 : μ ≠ 7,4 Tiêu chuẩn kiểm định: T = ( X − 7,4) n S 115 (118) Chương 5: Thống kê toán học α = 0,01 ⇒ U α = 2,575 Tqs = ⎧ ⎫ ( X − 7,4) n ⇒ Miền bác bỏ: Wα = ⎨T = ; T > 2,575⎬ S ⎩ ⎭ (6,1 − 7,4) 40 = −3,289 2,5 Với mẫu cụ thể này giá trị quan sát tiêu chuẩn kiểm định rơi vào miền bác bỏ, ta có thể kết luận số lượng hàng bán trung bình nhân viên bán hàng là có thay đổi Ví dụ 5.12: Một công ti có hệ thống máy tính có thể xử lí 1200 hóa đơn Công ti nhập hệ thống máy tính Hệ thống này chạy kiểm tra 40 cho thấy số hóa đơn xử lí trung bình là 1260 với độ lệch chuẩn 215 Với mức ý nghĩa 5% hãy nhận định xem hệ thống có tốt hệ thống cũ hay không? Giải: Gọi μ là số hóa đơn trung bình mà hệ thống máy tính xử lí Ta kiểm định: Giả thiết H0 : μ = 1200; Đối thiết H1 : μ > 1200 Tiêu chuẩn kiểm định: T = ( X − 1200) n S ⎧ ⎫ ( X − 1200) n α = 0,05 ⇒ U α = 1,64 ⇒ Miền bác bỏ: Wα = ⎨T = ; T > 1,64⎬ S ⎩ ⎭ (1260 − 1200) 40 = 1,76 215 Với mẫu cụ thể này giá trị quan sát tiêu chuẩn kiểm định rơi vào miền bác bỏ, ta có thể kết luận hệ thống máy tính tốt hệ thống cũ Thay giá trị cụ thể mẫu vào công thức (5.49) ta Tqs = 5.3.2.3 Trường hợp chưa biết phương sai, kích thước mẫu n < 30 Giả sử giả thiết H0 đúng, xét thống kê T= ( X − μ0 ) n S (5.53) theo công thức (5.22) thống kê T có phân bố Student n − bậc tự Ta xây dựng các miền bác bỏ dựa vào đối thiết H1 a Bài toán 1: H0: μ = μ ; H1: μ ≠ μ Miền bác bỏ: ⎧⎪ ⎫⎪ ( X − μ0 ) n Wα = ⎨T = ; T > tα / (n − 1) ⎬ S ⎪⎩ ⎪⎭ đó tα / (n − 1) là giá trị tới hạn mức α phân bố Student n − bậc tự b Bài toán 2: H0: μ = μ ; H1: μ > μ 116 (5.54) (119) Chương 5: Thống kê toán học Miền bác bỏ: ( X − μ0 ) n ⎪⎧ ⎪⎫ Wα = ⎨T = ; T > tα (n − 1) ⎬ S ⎪⎩ ⎪⎭ (5.55) đó tα (n − 1) là giá trị tới hạn mức α phân bố Student n − bậc tự c Bài toán 3: H0: μ = μ ; H1: μ < μ Miền bác bỏ: ( X − μ0 ) n ⎪⎧ ⎪⎫ Wα = ⎨T = ; − T > tα (n − 1) ⎬ S ⎩⎪ ⎭⎪ (5.56) Ví dụ 5.13: Một công ty sản xuất hạt giống tuyên bố loại giống họ có suất trung bình là 21,5 tạ/ha Gieo thử hạt giống này 16 vườn thí nghiệm và thu kết quả: 19,2; 18,7; 22,4; 20,3; 16,8; 25,1; 17,0; 15,8; 21,0; 18,6; 23,7; 24,1; 23,4; 19,8; 21,7; 18,9 Dựa vào kết này hãy xác nhận xem quảng cáo công ty có đúng không Mức ý nghĩa lựa chọn là α = 0,05 Biết suất giống cây trồng là biến ngẫu nhiên có phân bố chuẩn N ( μ ; σ ) Giải: Gọi μ là suất trung bình loại giống Ta cần kiểm định giả thiết H0: μ = 21,5; Đối thiết H1: μ ≠ 21,5 Tiêu chuẩn kiểm định: T = ( X − 21,5) n S Tra bảng ta tính giá trị tới hạn mức 2,131 Do đó miền bác bỏ: α = 0,025 phân bố Student 15 bậc tự là ⎧⎪ ⎫⎪ ( X − 21,5) n Wα = ⎨T = ; T > 2,131⎬ S ⎪⎩ ⎪⎭ Từ mẫu cụ thể trên tính được: x = 20,406 , s = 3,038 ⇒ Tqs = (20,406 − 21,5) 16 = −1,44 3,038 Vì Tqs = 1, 44 < 2,131 nên chưa có sở để bác bỏ H0 Có nghĩa là với số liệu này thì có thể chấp nhận lời quảng cáo công ty 5.3.3 Kiểm định giả thiết tần suất Giả sử ta để ý đến đặc trưng A nào đó mà cá thể tổng thể có thể có tính chất này không Gọi p là tần suất có đặc trưng A tổng thể, đã thấy chương VII dấu hiệu nghiên cứu này là biến ngẫu nhiên X có phân bố không – A( p ) với kỳ vọng p Nếu p chưa biết, song có sở để giả thiết giá trị này p Ta kiểm định giả thiết H0: p = p 117 (120) Chương 5: Thống kê toán học Từ tổng thể rút mẫu ngẫu nhiên kích thước n , gọi f là tần suất mẫu (công thức (5.13)-(5.15)) Xét thống kê T= ( f − p0 ) n p (1 − p0 ) (5.57) Nếu giả thiết H0 đúng, áp dụng định lý giới hạn trung tâm (công thức (5.24)) thì n đủ lớn thống kê trên xấp xỉ phân bố chuẩn tắc N (0;1) Trong thực tế ⎧np > ⎨ ⎩n(1 − p ) > (5.58) thì có thể xem thống kê (5.57) có phân bố chuẩn tắc N (0;1) Do đó với mức ý nghĩa α và tùy thuộc đối thiết H1 ta có thể xây dựng các miền bác bỏ tương ứng a) H0: p = p ; H1: p ≠ p ⎧⎪ ⎫⎪ ( f − p0 ) n ; T > Uα ⎬ Wα = ⎨T = p0 (1 − p0 ) ⎪ ⎩⎪ 2⎭ (5.59) b) H0: p = p ; H1: p > p ⎫⎪ ⎧⎪ ( f − p0 ) n Wα = ⎨T = ; T > Uα ⎬ p0 (1 − p0 ) ⎪⎭ ⎪⎩ (5.60) c) H0: p = p ; H1: p < p ⎫⎪ ⎧⎪ ( f − p0 ) n Wα = ⎨T = ; −T > Uα ⎬ p0 (1 − p0 ) ⎪⎭ ⎪⎩ (5.61) Với mẫu cụ thể tính giá trị quan sát tiêu chuẩn kiểm định Tqs , so sánh với Wα và kết luận Ví dụ 5.14: Một đảng chính trị bầu cử tổng thống nước tuyên bố có 45% cử tri bỏ phiếu cho ứng cử viên A đảng họ Chọn ngẫu nhiên 2000 cử tri để thăm dò ý kiến và cho thấy có 862 cử tri tuyên bố bỏ phiếu cho A Với mức α = 5%, hãy kiểm định xem dự đoán đảng trên có đúng không Giải: Gọi p là tỉ lệ cử tri bỏ phiếu cho ứng cử viên A Ta cần kiểm định: Giả thiết H0: p = 0,45 ; Đối thiết H1: p ≠ 0,45 (Bởi vì ta không có sở nào dự đoán đảng trên là cao 0,45 hay thấp 0,45) 118 (121) Chương 5: Thống kê toán học ⎧np = 2000 ⋅ 0,45 = 900 > thỏa mãn nên có thể chọn tiêu ⎨ ⎩n(1 − p ) = 2000 ⋅ 0,55 = 1100 > 862 chuẩn kiểm định theo công thức (5.57) Thay mẫu cụ thể với f = = 0,431 ta giá trị 2000 Vì điều kiện quan sát tiêu chuẩn kiểm định Tqs = (0,431 − 0,45) 2000 0,45 ⋅ 0,55 = −1,708 Với mức ý nghĩa α = 0,05 ⇒ U α = 1,96 Ta thấy Tqs < 1,96 Vậy không có sở để bác bỏ H0 TÓM TẮT Tổng thể Toàn tập hợp các phần tử đồng theo dấu hiệu nghiên cứu định tính hay định lượng nào đó gọi là tổng thể Việc chọn từ tổng thể tập nào đó gọi là phép lấy mẫu Tập hợp này gọi là mẫu Mẫu ngẫu nhiên Nếu phép lấy mẫu đó cá thể tổng thể chọn cách độc lập và có xác suất chọn ta mẫu ngẫu nhiên Mẫu ngẫu nhiên dấu hiệu nghiên cứu X Mẫu ngẫu nhiên kích thước n dấu hiệu nghiên cứu X là dãy gồm n biến ngẫu nhiên: X , X , , X n độc lập cùng phân bố với X , ký hiệu W = ( X , X , , X n ) Bảng phân bố tần số thực nghiệm và tần suất thực nghiệm Nếu mẫu ngẫu nhiên kích thước n X nhận giá trị xi với tần số xuất ri , i = 1, , k : x1 < < x k ; r1 + + rk = n f i = ri gọi là tần suất xi n Khi đó ta có thể mô tả mẫu ngẫu nhiên trên qua bảng phân bố tần số thực nghiệm và tần suất thực nghiệm X X TÇn sè x1 r1 x2 r2 xk rk X TÇn suÊt x1 f1 x2 f2 xk fk Hàm phân bố thực nghiệm mẫu Hàm số xác định sau: Fn ( x) = ∑ x j <x rj n ; −∞ < x < +∞ Bảng phân bố ghép lớp Trong trường hợp mẫu điều tra có kích thước lớn, các giá trị cụ thể dấu hiệu X lấy giá trị khác song lại khá gần nhau, người ta thường xác định số các khoảng 119 (122) Chương 5: Thống kê toán học C1 , C , , C k cho giá trị dấu hiệu điều tra thuộc vào khoảng nào đó Các khoảng này lập thành phân hoạch miền giá trị X Biểu diễn biểu đồ Trong mặt phẳng với hệ trục toạ độ Oxy Nối điểm trên trục hoành có toạ độ ( xi ,0) với điểm có toạ độ ( xi , ri ) ; i = 1, k ta biểu đồ tần số hình gậy Nối điểm có toạ độ ( xi , f i ) với điểm có toạ độ ( xi +1 , f i +1 ) ; i = 1, k − ta biểu đồ đa giác tần suất Đối với bảng phân bố ghép lớp, người ta thường dùng tổ chức đồ để biểu diễn: Trên trục hoành ta chia các khoảng Ci có độ rộng li Với khoảng Ci ta dựng hình chữ nhật có chiều cao yi = ri f (đối với tổ chức đồ tần số), hay yi = i (đối với tổ chức đồ tần suất) li li Thống kê Một thống kê mẫu là hàm các biến ngẫu nhiên thành phần mẫu Thống kê mẫu ngẫu nhiên W = ( X , X , , X n ) có dạng: T = T ( X , X , , X n ) Trung bình mẫu Trung bình mẫu mẫu ngẫu nhiên W = ( X , X , , X n ) là: X = n ∑ Xi n i =1 Phương sai mẫu ( k ∑ ri X i − X n − i =1 ) ( ) k n ri X i2 − X ∑ n − i =1 n −1 Phương sai mẫu S : S = Phương sai mẫu Ŝ : dấu hiệu nghiên cứu X tổng thể có kỳ vọng xác định EX = μ S = n ( X i − μ )2 ∑ n i =1 S= k ∑ ri X i − X n − i =1 = Độ lệch tiêu chuẩn mẫu ( ) Tần suất mẫu Xét biến ngẫu nhiên gốc X có phân bố không – A( p) Lấy mẫu ngẫu nhiên kích thước n : W = ( X , X , , X n ) , X , X , , X n là các biến ngẫu nhiên độc lập có cùng phân bố 120 (123) Chương 5: Thống kê toán học với X Tần số xuất dấu hiệu A mẫu là: r = X + X + + X n Tần suất mẫu f = r n Cách tính giả trị cụ thể mẫu trung bình mẫu và phương sai mẫu x , s Nếu mẫu nhận các giá trị x1 , x , , x k với tần số tương ứng n1 , n2 , , nk thì giá trị trung bình mẫu và phương sai mẫu cụ thể tính theo công thức x= ∑ k rx i =1 i i n , k ∑ ri = n ; s2 = i =1 k ( ∑ ri xi − x n − i =1 ) ⎛ ⎜ k = ⎜ ∑ ri xi2 − n − ⎜ i =1 ⎜ ⎝ (∑ ) k r x i =1 i i n ⎞ ⎟ ⎟ ⎟ ⎟ ⎠ Quy luật phân bố xác suất số thống kê đặc trưng mẫu Trường hợp biến ngẫu nhiên gốc tuân theo quy luật phân bố chuẩn U= ( X − μ) n ~ N (0;1) σ nSˆ 2 (n − 1) S χ = χ = σ2 n ⎛ X −μ⎞ = ∑⎜ i ⎟ ~ χ ( n) σ ⎠ i =1 ⎝ σ2 ⎛X −X = ∑ ⎜⎜ i σ i =1 ⎝ n ⎞ ⎟ ~ χ (n − 1) ⎟ ⎠ ( X − μ) n ( X − μ) n U σ = T= = ~ T(n − 1) 2 S (n − 1) S χ (n − 1) σ (n − 1) Trường hợp tần suất mẫu U= ⎧ np > ( f − p) n npq > 20 ~ N (0;1) ⎨ pq ⎩ nq > Ước lượng không chệch Thống kê θˆ = T ( X , X , , X n ) gọi là ước lượng không chệch θ nếu: E (θˆ ) = θ Ước lượng hiệu Ước lượng không chệch có phương sai nhỏ so với ước lượng không chệch khác xây dựng trên cùng mẫu ngẫu nhiên gọi là ước lượng hiệu Ước lượng vững 121 (124) Chương 5: Thống kê toán học Thống kê θˆ = T ( X , X , , X n ) gọi là ước lượng vững tham số θ biến ngẫu nhiên gốc X θˆ = T ( X , X , , X n ) hội tụ theo xác suất đến θ n → ∞ Ước lượng hợp lý cực đại Giả sử đã biết quy luật phân bố xác suất dấu hiệu nghiên cứu biến ngẫu nhiên gốc X có hàm mật độ f ( x, θ) (hoặc có thể là biểu thức xác suất X là biến ngẫu nhiên rời rạc) Cần phải ước lượng tham số θ nào đó X Từ tổng thể rút mẫu ngẫu nhiên kích thước n : Hàm mật độ đồng thời có dạng mẫu ngẫu nhiên có dạng L( x1 , x , , x n , θ) = f ( x1 , θ) ⋅ f ( x , θ) ⋅ ⋅ ⋅ f ( x n , θ) Hàm L( x1 , x , , x n , θ) gọi là hàm hợp lý tham số θ Khi ta xem x1 , , x n là tham số còn θ là biến và giả sử hàm hợp lý L( x1 , , x n , θ) đạt cực đại θˆ = g ( x1 , x , , x n ) Thống kê θˆ = g ( X , X , , X n ) gọi là ước lượng hợp lý cực đại θ Khoảng tin cậy Khoảng [a ; b ] có hai đầu mút là hai thống kê a = a( X , X , , X n ) , b = b( X , X , , X n ) phụ thuộc mẫu ngẫu nhiên W = ( X , X , , X n ) biến ngẫu nhiên gốc X , gọi là khoảng tin cậy tham số θ với độ tin cậy β nếu: P{a ≤ θ ≤ b} = β Khoảng tin cậy kỳ vọng biến ngẫu nhiên phân bố theo quy luật chuẩn • Trường hợp phương sai σ đã biết: σ σ ⎤ α 1+ β ⎡ ; X + Uα / ⎢ X − Uα / ⎥ , Φ (U α ) = − = n n⎦ ⎣ • Trường hợp phương sai σ chưa biết n ≥ 30 : S S ⎤ α 1+ β ⎡ ; X + Uα / ⎢ X − Uα / ⎥ , Φ (U α ) = − = n n⎦ ⎣ • Trường hợp phương sai σ chưa biết n < 30 : S S ⎤ ⎡ ; X + tα / (n − 1) ⎢ X − tα / (n − 1) ⎥, n n⎦ ⎣ đó tα / (n − 1) là giá trị tới hạn mức α phân bố Student n − bậc tự Khoảng tin cậy cho tần suất p 122 (125) Chương 5: Thống kê toán học ⎡ ⎢ f − Uα / ⎣ f (1 − f ) ; f + Uα / n ⎧nf > 10 f (1 − f ) ⎤ ⎥ Với điều kiện ⎨ n ⎩n(1 − f ) > 10 ⎦ Trong đó α = − β ; U α là giá trị tới hạn mức α 2 phân bố chuẩn tắc N (0;1) Giải thiết thống kê Giả thiết thống kê là giả thiết dạng phân bố xác suất biến ngẫu nhiên gốc tổng thể, các tham số đặc trưng tính chất các biến ngẫu nhiên này Giả thiết thống kê là điều ta nghi ngờ muốn bác bỏ, phát biểu dạng H0 Cạnh tranh với giả thiết này là đối thiết H1, theo nghĩa bác bỏ H0 thì chấp nhận H1 và ngược lại Thủ tục kiểm định giả thiết thống kê Một thủ tục kiểm định giả thiết thống kê bao gồm các bước sau: a) Phát biểu giả thiết H0 và đối thiết H1 b) Từ tổng thể nghiên cứu lập mẫu ngẫu nhiên kích thước n c) Chọn tiêu chuẩn kiểm định T và xác định quy luật phân bố xác suất T với điều kiện giả thiết H0 đúng d) Với mức ý nghĩa α , xác định miền bác bỏ Wα tốt tùy thuộc vào đối thiết H1 e) Từ mẫu cụ thể tính giá trị quan sát tiêu chuẩn kiểm định Tqs So sánh giá trị quan sát tiêu chuẩn kiểm định Tqs với miền bác bỏ Wα và kết luận Kiểm định giả thiết kỳ vọng biến ngẫu nhiên có phân bố theo quy luật chuẩn 1) Trường hợp đã biết phương sai Tiêu chuẩn kiểm định : T = ( X − μ0 ) n σ a Bài toán 1: H0: μ = μ ; H1: μ ≠ μ Miền bác bỏ Wα = {T > U α / } b Bài toán 2: H0: μ = μ ; H1: μ > μ Miền bác bỏ Wα = { T > U α } c Bài toán 3: H0: μ = μ ; H1: μ < μ Miền bác bỏ Wα = { − T > U α } 2) Trường hợp chưa biết phương sai n ≥ 30 Tiêu chuẩn kiểm định : T = ( X − μ0 ) n S a Bài toán 1: H0: μ = μ ; H1: μ ≠ μ Miền bác bỏ Wα = {T > U α / } b Bài toán 2: H0: μ = μ ; H1: μ > μ Miền bác bỏ Wα = { T > U α } c Bài toán 3: H0: μ = μ ; H1: μ < μ Miền bác bỏ Wα = { − T > U α } 123 (126) Chương 5: Thống kê toán học 3) Trường hợp chưa biết phương sai n < 30 Tiêu chuẩn kiểm định : T = ( X − μ0 ) n S a) Bài toán 1: H0: μ = μ ; H1: μ ≠ μ Miền bác bỏ Wα = { T > tα / (n − 1)} b) Bài toán 2: H0: μ = μ ; H1: μ > μ Miền bác bỏ Wα = { T > tα (n − 1)} c) Bài toán 3: H0: μ = μ ; H1: μ < μ Miền bác bỏ Wα = { − T > tα (n − 1)} Kiểm định giả thiết tần suất Tiêu chuẩn kiểm định: T = ⎧np > với điều kiện ⎨ f là tần suất mẫu ( − ) > n p p0 (1 − p0 ) ⎩ ( f − p0 ) n a H0: p = p0 ; H1: p ≠ p0 Wα = { T > U α / } b H0: p = p0 ; H1: p > p0 Wα = { T > U α } c H0: p = p0 ; H1: p < p0 Wα = { − T > U α } CÂU HỎI ÔN TẬP VÀ BÀI TẬP 5.1 Mẫu ngẫu nhiên kích thước n dấu hiệu nghiên cứu X là dãy gồm n biến ngẫu nhiên: X , X , , X n độc lập cùng phân bố với X Đúng Sai 5.2 Một thống kê mẫu ngẫu nhiên là số cụ thể dấu hiệu nghiên cứu Đúng Sai 5.3 Trung bình mẫu dấu hiệu nghiên cứu có phân bố chuẩn có phân bố chuẩn Đúng Sai 5.4 Một thống kê mẫu là hàm các biến ngẫu nhiên thành phần mẫu đó là biến ngẫu nhiên Đúng Sai 5.5 Trung bình mẫu là ước lượng vững và hiệu kỳ vọng biến ngẫu nhiên gốc Đúng Sai 5.6 Có thể tìm ước lượng không chệch θ có phương sai nhỏ đại lượng ⎛ ∂ (ln f ( x, θ) ) ⎞ nE ⎜ ⎟ ∂θ ⎝ ⎠ Đúng Sai 124 (127) Chương 5: Thống kê toán học 5.7 Tống hai ước lượng không chệch là ước lượng không chệch Đúng Sai 5.8 Phương sai mẫu hiệu chỉnh S là ước lượng vững không chệch phương sai biến ngẫu nhiên gốc Đúng Sai 5.9 Hai đầu mút khoảng tin cậy là hai thống kê mẫu Đúng Sai 5.10 Muốn tìm khoảng tin cậy cho tham số μ biến ngẫu nhiên gốc có phân bố chuẩn N (μ; σ ) thì kích thước mẫu n phải lớn 30 Đúng Sai 5.11 Giả thiết thống kê là giả thiết nhà thống kê đặt cho mẫu ngẫu nhiên Đúng Sai 5.12 Bác bỏ giả thiết dẫn đến chấp nhận đối thiết và ngược lại đó đối thiết là phủ định giả thiết Đúng Sai 5.13 Qui tắc kiểm định dựa trên nguyên lý xác suất nhỏ và phép chứng minh phản chứng Đúng Sai 5.14 Sai lầm loại là sai lầm gặp phải thực tế giả thiết đúng ta bác bỏ Đúng Sai 5.15 Sai lầm loại luôn luôn lớn sai lầm loại Đúng Sai 5.16 Miền bác bỏ là miền có xác suất bé nên ta có thể bỏ qua phép kiểm định Đúng Sai 5.17 Khi xây dựng tiêu chuẩn kiểm định T ta luôn giả sử giả thiết H0 sai vì giả thiết H0 là điều ta nghi ngờ muốn bác bỏ Đúng Sai 5.18 Kiểm định hai phía là kiểm định tham số có thể nhận giá trị âm dương bất kỳ, còn kiểm định phía tham số cần kiểm định nhận giá trị dương âm Đúng Sai 5.19 Từ tổng thể có dấu hiệu nghiên cứu X có bảng phân bố xác suất sau X P 0,5 0,5 125 (128) Chương 5: Thống kê toán học lập mẫu ngẫu nhiên kích thước n = 10 Tính xác suất để trung bình mẫu mẫu ngẫu nhiên này nhận giá trị 0,5 5.20 Giả sử biến ngẫu nhiên gốc có phân bố chuẩn N (20;1) Chọn mẫu ngẫu nhiên kích thước n = 100 Hãy tính xác suất để trung bình mẫu X nằm khoảng: 19,8 < X < 20,2 5.21 Một mẫu cụ thể biến ngẫu nhiên X sau: ; ; ; ; ; ; ; ; ; ( n = 10 ) a) Lập bảng phân bố tần suất b) Xây dựng hàm phân bố thực nghiệm Tính x , s2 , s 5.22 Trong đợt vận động bầu cử tổng thống nước nọ, người ta vấn ngẫu nhiên 2000 cử tri thì biết có 1082 người số đó bỏ phiếu cho ứng cử viên A Với độ tin cậy 98% tối thiếu ứng cử viên A chiếm bao nhiêu % số phiếu bầu? Cho biết phân vị mức 0,975 phân bố chuẩn tắc N(0;1) là 1,96 5.23 Để xác định sản lượng khai thác điện thoại đơn vị mình, đơn vị đã tiến hành thống kê ngẫu nhiên 35 ngày và thu kết sau với đơn vị 100.000 phút/ngày: 0,84 0,96 1,02 1,08 0,88 0,80 0,91 0,97 1,07 0,98 1,04 1,13 0,87 0,82 1,01 0,93 1,03 1,10 0,97 1,05 0,83 0,76 0,95 1,15 1,00 1,05 1,14 0,89 0,81 0,95 1,20 1,16 1,24 0,79 0,77 Tìm khoảng tin cậy 95% cho sản lượng điện thoại trung bình ngày 5.24 Muốn ước lượng số cá hồ, người ta bắt 2000 cá hồ đánh dấu thả lại xuống hồ Sau đó bắt lại 400 và thấy có 53 có dấu Hãy ước lượng số cá hồ với độ tin cậy là 0,95 5.25 Để xác định chiều cao trung bình các cây vườn ươm người ta tiến hành đo ngẫu nhiên 40 cây Kết đo sau: Khoảng chiều cao (cm) 16,5-17 17-17,5 17,5-18 18-18,5 18,5-19 19-19,5 Số cây tương ứng 11 12 a) Tìm khoảng tin cậy 90% cho chiều cao trung bình vườn cây b) Nếu muốn khoảng ước lượng có độ chính xác ε = 0,1 thì cần lấy mẫu bao nhiêu cây 5.26 Trọng lượng loại sản phẩm A là biến ngẫu nhiên có phân bố theo quy luật chuẩn với độ lệch chuẩn là gam Cân thử 27 bao loại này ta thu kết quả: Trọng lượng(gam) 47,5 - 48,5 48,5 - 49,5 49,5 - 50,5 50,5 - 51,5 51,5 - 52,5 Số bao tương ứng 15 a) Tìm khoảng tin cậy 95% trọng lượng trung bình loại sản phẩm trên 126 (129) Chương 5: Thống kê toán học b) Nếu muốn độ chính xác ε = 0,1 thì kích thước mẫu cần thiết là bao nhiêu 5.27 Trọng lượng đóng bao loại sản phẩm X là biến ngẫu nhiên có phân bố theo quy luật chuẩn với trọng lượng trung bình theo quy định là 100kg Nghi ngờ sản phẩm bị đóng thiếu, người ta cân thử 29 bao loại này ta thu kết quả: Trọng lượng (kg) 98,0 -98,5 Số bao tương ứng 98,5– 99,0 99,0 - 99,5 99,5 - 100 10 100 -100,5 100,5-101 Với mức ý nghĩa α = 0, 025 hãy kết luận điều nghi ngờ nói trên 5.28 Định mức thời gian hoàn thành sản phẩm là 14 phút Liệu có cần thay đổi định mức không, theo dõi thời gian hoàn thành sản phẩm 250 công nhân ta thu kết sau: X (phút) 10 - 12 12 - 14 14 - 16 16 - 18 18 - 20 20 60 100 40 30 Số công nhân Với mức ý nghĩa α = 0, 05 hãy kết luận ý định nói trên 5.29 Mức hao phí xăng loại ô tô chạy từ A đến B là biến ngẫu nhiên có quy luật chuẩn với kỳ vọng 50 lít Đoạn đường sửa chữa lại Người ta cho mức hao phí xăng trung bình giảm xuống Quan sát 28 ô tô cùng loại thu X hao phí (lít) Số ô tô tương ứng 48,5 - 49,0 49,0 - 49,5 49,5 - 50,0 50,0 - 50,5 50,5-51 10 Với mức ý nghĩa α = 0, 025 hãy kết luận điều nghi ngờ nói trên 5.30 Một công ty có hệ thống máy tính có thể xử lý 1300 hoá đơn Công ty nhập hệ thống máy tính mới, hệ thống này chạy kiểm tra 40 cho thấy số hoá đơn xử lý trung bình là 1378 với độ lệch tiêu chuẩn 215 Với mức ý nghĩa 2,5% hãy nhận định xem hệ thống có tốt hệ thống cũ hay không? 127 (130) Chương 6: Quá trình ngẫu nhiên chuỗi Markov CHƯƠNG VI: QUÁ TRÌNH NGẪU NHIÊN CHUỖI MARKOV GIỚI THIỆU Hầu hết các tượng xảy tự nhiên và xã hội có tính chất ngẫu nhiên, điều đó phản ánh các mối ràng buộc phức tạp mà ta không biết trước Trong các chương trước chúng ta đã tìm hiểu khái niệm biến ngẫu nhiên, véc tơ ngẫu nhiên, đó là các biến nhận các giá trị nào đó phụ thuộc vào các yếu tố ngẫu nhiên Khi họ các biến ngẫu nhiên phụ thuộc vào thời gian ta có quá trình ngẫu nhiên Các tín hiệu truyền dẫn và nhiễu hệ thống viễn thông, quá trình hàng tổng đài là các quá trình ngẫu nhiên Quá trình ngẫu nhiên có nhiều ứng dụng viễn thông là quá trình có tính Markov (memoryless) và quá trình dừng Chuỗi Markov là quá trình Markov có không gian trạng thái rời rạc, thời gian rời rạc và Chuỗi Markov thường gặp bài toán chuyển mạch hệ thống viễn thông Quá trình Poisson là ví dụ chuỗi Markov với thời gian liên tục Quá trình Poisson X (t ) mô tả quá trình đếm số lần xuất biến cố A nào đó thời điểm t Quá trình Poisson ứng dụng nhiều viễn thông, liên quan đến bài toán truyền tín hiệu, các hệ phục vụ, bài toán chuyển mạch Nếu số gọi đến tổng đài là quá trình Poisson, gọi chiếm dụng thiết bị khoảng thời gian nào đó, giả sử các thời gian này là các biến ngẫu nhiên độc lập cùng phân bố, đó tổng số gọi là quá trình Poisson phức hợp Quá trình Poisson phức hợp và quá trình Poisson phân loại giúp ta tính sản lượng trung bình khai thác dịch vụ viễn thông Tín hiệu viễn thông, nhiễu không có tính Markov Các quá trình này quá khứ nó có ảnh hưởng lớn đến tiến triển quá trình tương lại Tuy nhiên hàm trung bình không đổi và hàm tương quan theo thời gian, đó quá trình dừng Khi các quá trình dừng là các tín hiệu nhiễu thì biến đổi Fourier hàm tương quan quá trình là mật độ phổ công suất tín hiệu nhiễu Một bài toán quan trọng lý thuyết chuyển mạch là vấn đề xung đột thông tin, nghẽn mạch rớt gọi Lý thuyết quá trình hàng (queueing process) xác định và tìm các phương án tối ưu để hệ thống phục vụ tốt Trong chương này ta nghiên cứu khái niệm quá trình ngẫu nhiên và chuỗi Markov, quá trình Poisson, quá trình dừng và lý thuyết hàng khảo sát giáo trình toán chuyên ngành Để học tốt chương này học viên cần nắm vững khái niệm xác suất, xác suất có điều kiện, biến ngẫu nhiên và kiến thức đại số tuyến tính: Ma trận, hệ phương trình tuyến tính 128 (131) Chương 6: Quá trình ngẫu nhiên chuỗi Markov NỘI DUNG 6.1 KHÁI NIỆM VÀ PHÂN LOẠI QUÁ TRÌNH NGẪU NHIÊN 6.1.1 Khái niệm quá trình ngẫu nhiên Các tín hiệu các hệ thống thông tin là các tín hiệu ngẫu nhiên vì ngoài thành phần mang tin còn có tác động giao thoa ngẫu nhiên và nhiễu thiết bị Giả sử tín hiệu nào đó mà thời điểm t xảy ứng với các biến cố {Ei , i ∈ N } không gian mẫu Tín hiệu này nhận giá trị là v(t , Ei ) thời điểm t và biến cố Ei xảy Như v(t , Ei ) là mẫu quá trình ngẫu nhiên v(t ) Quá trình ngẫu nhiên v(t ) vừa phụ thuốc thời gian t , vừa phụ thuộc yếu tố ngẫu nhiên Ei v(t , E1 ) t1 v(t , E ) t1 Quá trình ngẫu nhiên v(t ) v(t , E3 ) t1 v(t , E ) t1 {v(t1 , Ei ), i ∈ N } t2 t t2 t t2 t t2 t {v(t , Ei ), i ∈ N } Một cách tổng quát quá trình ngẫu nhiên là họ các biến ngẫu nhiên {X (t , ω); t ∈ I } Các quá trình này vừa phụ thuộc vào thời gian t và cố định tham số t thì X (t , ω) là biến ngẫu nhiên theo ω Tập số I thường biểu diễn tham số thời gian Hầu hết các quá trình xảy tự nhiên và xã hội là quá trình ngẫu nhiên Các tín hiệu video, tín hiệu thoại, liệu máy tính, nhiễu điện các thiết bị điện, số khách hàng đến điểm phục vụ, số chứng khoán thị trường chứng khoán… là các quá trình ngẫu nhiên Để đơn giản cách viết người ta ký hiệu quá trình ngẫu nhiên {X (t ); t ∈ I } thay cho {X (t , ω); t ∈ I } 129 (132) Chương 6: Quá trình ngẫu nhiên chuỗi Markov 6.1.2 Phân loại quá trình ngẫu nhiên Các yếu tố chính để phân biệt các quá trình ngẫu nhiên là không gian trạng thái, tập số I và quan hệ độc lập các biến ngẫu nhiên X (t ) Vì ta có thể phân loại quá trình ngẫu nhiên theo: 6.1.2.1 Tập trạng thái E Ta ký hiệu E là tập các giá trị X (t ) và gọi là không gian trạng thái quá trình ♦ Nếu E là tập đếm thì {X (t ); t ∈ I } gọi là quá trình có trạng thái rời rạc ♦ Nếu E là khoảng tập số thực thì {X (t ); t ∈ I } là quá trình thực ♦ Nếu E tập tập số phức thì ♦ Nếu E = k thì {X (t ); t ∈ I } là quá trình k-véc tơ {X (t ); t ∈ I } là quá trình phức 6.1.2.2 Tập các số I Nếu I ⊂ thì quá trình {X (t ); t ∈ I } gọi là quá trình có thời gian rời rạc Trường hợp này ta ký hiệu x(n) thay cho x(t ) Nếu I = [0; ∞) I = thì {X (t ); t ∈ I } gọi là quá trình có thời gian liên tục 6.1.2.3 Quan hệ độc lập Quá trình {X (t ); t ∈ I } gọi là: a) Quá trình có gia số độc lập: Nếu với cách chọn t1 < t < < t n thì các biến ngẫu nhiên sau độc lập X (t ) − X (t1 ), X (t ) − X (t ), , X (t n ) − X (t n −1 ) (6.1) Đặc biệt với quá trình rời rạc { X (n) } thì tính chất gia số độc lập dẫn đến dãy các biến ngẫu nhiên Z = X (0) , Z i = X (i ) − X (i − 1) ; i = 1, 2, là độc lập Ngoài ta biết luật phân bố biến ngẫu nhiên Z , Z1 , thì ta biết luật phân bố X (i ) , i = , 1, Thật vậy, điều này suy từ công thức (3.21)-(3.24) và X (i ) = Z + Z1 + + Z i b) Quá trình Martingal: Nếu với cách chọn t1 < t < < t n +1 và với cách chọn a1 , a2 , , an thì E ⎣⎡ X (tn+1 ) X (t1 ) = a1 , , X (tn ) = an ⎦⎤ = an (6.2) Martingal có thể xem là mô hình mô tả trò chơi may rủi, đó X (t ) là số tiền người chơi thời điểm t Tính chất Martingal nói số tiền trung bình người chơi có 130 (133) Chương 6: Quá trình ngẫu nhiên chuỗi Markov thời điểm t n +1 số tiền có thời điểm t n và không phụ thuộc vào gì có trước đó quá khứ Nếu {X (t ); t ≥ 0} là quá trình gia số độc lập với kỳ vọng thì {X (t ); t ≥ 0} là Martingal với thời gian liên tục c) Quá trình Markov: Nếu với cách chọn t1 < t < < t n và với cách chọn a1 , a2 , , an thì với t , với a < b , P{a < X (t ) ≤ b X (t1 ) = a1 , , X (t n ) = a n } = P{a < X (t ) ≤ b X (t n ) = a n } (6.3) Nghĩa là qui luật xác suất tương lai phụ thuộc và độc lập với quá khứ Nói cách khác quá trình Markov mô tả các hệ không có trí nhớ (memoryless) Với t > s; với tập giá trị A ⊂ và giá trị a ta ký hiệu p ( s, a; t , A) = P{X (t ) ∈ A X ( s ) = a} (6.4) và gọi là hàm xác suất chuyển từ thời điểm s đến thời điểm t Như công thức (6.3) viết lại P{a < X (t ) ≤ b X (t1 ) = a1 , , X (t n ) = a n } = p (t n , a n ; t , A) , đó A = (a; b] d) Quá trình dừng (stationary) Quá trình {X (t ); t ∈ I } , I = , + , , ² gọi là: Dừng theo nghĩa chặt (strictly stationary): Nếu ∀h > 0, ∀t1 , t , , t n ∈ I thì hàm phân bố đồng thời ( X (t1 + h), X (t + h), , X (t n + h) ) và ( X (t1 ), X (t ), , X (t n ) ) là Nói riêng X (t ) có cùng phân bố Dừng theo nghĩa rộng hay dừng hiệp phương sai (wide sense stationary or covariance stationary): Nếu i) EX (t ) = m =const ii) Với t , cov( X (t ), X (t + τ) ) = E[X (t ) − m, X (t + τ) − m] phụ thuộc τ Đặt K x (τ) = cov( X (t ), X (t + τ) ) (6.5) và gọi là hàm tự tương quan quá trình {X (t ); t ∈ I } 6.2 CHUỖI MARKOV Chuỗi Markov là quá trình Markov {X (t ); t ∈ I } có không gian trạng thái E đếm Tuỳ theo tập số I = {0,1,2, } I = (0; ∞) ta có tương ứng chuỗi Markov với thời gian rời rạc liên tục Với chuỗi Markov công thức xác suất chuyển (6.4) viết cụ thể 131 (134) Chương 6: Quá trình ngẫu nhiên chuỗi Markov p ( s, i; t , j ) = P{X (t ) = j X ( s ) = i}, t > s (6.6) Nếu xác suất chuyển phụ thuộc vào t − s nghĩa là p( s, i; t , j ) = p( s + h, i; t + h, j ) (6.7) với h , thì ta nói quá trình là theo thời gian 6.2.1 Chuỗi Markov với thời gian rời rạc Định nghĩa 6.1 Quá trình {X ( n), n = 0,1,2, } với thời gian rời rạc gọi là chuỗi Markov thời gian rời rạc i) Không gian trạng thái E X (n) là tập đếm ii) Hàm xác suất chuyển là theo thời gian, nghĩa là thoả mãn (6.7) Ta nói tắt chuỗi Markov thay cho chuỗi Markov thời gian rời rạc 6.2.2 Ma trân xác suất chuyển Giả sử {X (n), n = 0,1,2, } là chuỗi Markov thời gian rời rạc có không gian trạng thái E Các phần tử E ký hiệu i, j, k Với i, j ∈ E ; đặt pij = P{X (n + 1) = j X (n) = i} (6.8) không phụ thuộc vào n Đó là xác suất để từ trạng thái i sau bước chuyển thành trạng thái j Đặt pij( k ) = P{X (n + k ) = j X (n) = i} = P{X (k ) = j X (0) = i} (6.9) Định nghĩa 6.1: Ma trận vuông P = ⎡⎣ pij ⎤⎦ gọi là ma trận xác suất chuyển sau bước Ma trận vuông P ( k ) = ⎡⎣ pij( k ) ⎤⎦ gọi là ma trận xác suất chuyển sau k bước Ký hiệu P (0) = I , P (1) = P, I là ma trận đơn vị Định lý 6.1: Với n ≥ , ta có phương trình Chapman- Kolmogorov: P ( n +1) = PP ( n) = P ( n) P (6.10) Từ đó suy P ( n) = P n Chứng minh: 1) Áp dụng công thức xác xuất đầy đủ ta có 132 (6.11) (135) Chương 6: Quá trình ngẫu nhiên chuỗi Markov pij ( n+1) = P{ X (n + 1) = j X (0) = i} = ∑ P{ X (n + 1) = k∈E = ∑ P{ X (n + 1) = j k∈E ⇒ j X (0) = i , X (1) = k }P{ X (1) = k X (0) = i} X (1) = k }P{ X (1) = k X (0) = i} = ∑ pik pkj (n) k ∈E P ( n +1) = PP ( n ) Ta có: pij ( n+1) = P{ X (n + 1) = j X (0) = i} = ∑ P{ X (n + 1) = j X (0) = i , X (n) = k }P{ X (n) = k X (0) = i} ∑ P{ X (n + 1) = j X (n) = k }P{ X (n) = k X (0) = i} = k∈E = k∈E ⇒ ∑ pik (n) pkj k ∈E P ( n +1) = P ( n ) P 2) Từ 1) suy P ( 2) = PP , quy nạp ta có P ( n ) = P n Đặt p (jn) = P{X (n) = j}, n = 0,1,2, (6.12) Ma trận hàng ∏ ( n ) = ⎡⎣ p (jn ) ⎤⎦ gọi là phân bố hệ thời điểm n Khi n = , ma trận ∏ = ∏ (0) gọi là phân bố ban đầu Định lý 6.2: Với n ≥ , m ≥ : ∏ (n) = ∏ P (n) ; (6.13) ∏ ( n +1) = ∏ ( n) P (6.14) ∏ ( n + m) = ∏ ( n) P ( m) (6.15) Chứng minh: Từ định lý 6.1 ta suy điều trên là tương đương Vì để chứng minh định lý 6.2 ta cần chứng minh (6.15) p j ( n+ m) = P{ X (n + m) = j } = = ∑ pi (n) pij (m) ∑ P{ X (n) = i }P{ X (n + m) = k∈E j X (n) = i} i∈E Vậy chuỗi Markov rời rạc hoàn toàn xác định ba ( X (n), ∏, P ) đó X (n) là dãy các biến ngẫu nhiên rời rạc 133 (136) Chương 6: Quá trình ngẫu nhiên chuỗi Markov Ví dụ 6.1: n trạm thu phát hai tín hiệu 0, dạng kênh đối xứng nhị phân với xác suất lỗi n 1− p x0 = p: y0 = p p x1 = y1 = 1− p p 1− p 1− p p Đây là mô hình chuỗi Markov có không gian trạng thái E = {0,1} , thời gian I = {1,2, , n} có ma trận xác suất chuyển p ⎤ ⎡1 − p P=⎢ ⎥ ⎢⎣ p − p ⎥⎦ 6.2.3 Một số mô hình chuỗi Markov quan trọng 6.2.3.1 Mô hình phục vụ đám đông Xét mô hình phục vụ đám đông (lý thuyết hàng) Khách đến hàng chờ phục vụ theo nguyên tắc FIFO (first in first out) và chu kỳ cửa hàng phục vụ khách Số khách đến chu kỳ thứ n là biến ngẫu nhiên ξ n Giả sử ξ1 , ξ , là các biến ngẫu nhiên độc lập cùng phân bố với biến ngẫu nhiên ξ có phân bố xác suất P{ξ = k } = a k ; k = 0,1,2, ; ak > 0; ∑ ak = (6.16) k Trạng thái hệ (cửa hàng) thời điểm đầu chu kỳ là số khách xếp hàng chờ phục vụ Nếu hệ trạng thái i và sau chu kỳ hệ rơi vào trạng thái j thì ⎧i − + ξ j=⎨ ⎩ξ nÕu i ≥ 1, nÕu i = 134 (6.17) (137) Chương 6: Quá trình ngẫu nhiên chuỗi Markov Ký hiệu X (n) là số khách hàng thời điểm đầu chu kỳ thứ n thì X (n + 1) = ( X (n) − 1)+ + ξ n , đó X + = max(0, X ) , Từ 6.16-6.17 suy {X (n); n = 0,1, } là chuỗi Markov với ma trận xác suất chuyển ⎡a ⎢ ⎢a ⎢ P=⎢0 ⎢ ⎢0 ⎢ ⎢⎣ a1 a2 a1 a2 a0 a1 a0 a3 …⎤ ⎥ a3 …⎥ ⎥ a …⎥ ⎥ a1 …⎥ ⎥ ⎥⎦ (6.18) 6.2.3.2 Mô hình kiểm kê (Inventory Model) Giả thiết phải dự trữ kho loại hàng nào đó để đáp ứng nhu cầu liên tục khách hàng Hàng nhập kho cuối chu kỳ n = 0,1,2, Giả sử tổng số lượng hàng cần phải đáp ứng nhu cầu chu kỳ n là biến ngẫu nhiên ξ n có phân bố độc lập với chu kỳ thời gian Nghĩa là dãy { ξ n } độc lập có cùng phân bố với ξ P{ ξ = k } = a k ; a k > và ∑ ak = (6.19) k Mức hàng dự trữ kiểm kê cuối chu kỳ Cách nhập hàng vào số tiêu chuẩn s và S ( s < S ) sau: Nếu cuối chu kỳ lượng hàng dự trữ ≤ s thì tức khắc nhập hàng để có số hàng dự trữ S ; Nếu hàng có > s thì không cần nhập hàng Ký hiệu X (n) là lượng hàng có cuối chu kỳ n và trước nhập hàng, ⎧ X (n) − ξ n+1 X (n + 1) = ⎨ ⎩ S − ξ n+1 Các trạng thái quá trình nÕu s < X (n) ≤ S , nÕu X (n) ≤ s (6.20) { X (n)} là các số lượng hàng dự trữ: S , S − 1, ,1, 0, − 1, − 2, đó giá trị âm là nhu cầu chưa phục vụ mà đáp ứng sau nhập hàng ⎧ P{ ξ n+1 = i − j } nÕu s < i ≤ S , pij = P{ X (n + 1) = j X (n) = i} = ⎨ ⎩ P{ ξ n+1 = S − j } nÕu i ≤ s (6.21) Ví dụ 6.2 Xét mô hình kiểm kê phụ tùng thay thế, đó yêu cầu có thể là 0, đơn vị phụ tùng cần thay chu kỳ với phân bố xác suất sau P{ ξ = } = 0,5 ; P{ ξ = } = 0,4 ; P{ ξ = } = 0,1 và giả sử s = ; S = 135 (138) Chương 6: Quá trình ngẫu nhiên chuỗi Markov Không gian trạng thái là E = { − 1, 0,1, } p −1, −1 = P{ X (n + 1) = −1 X (n) = −1 } = P (φ) = , Ta có: p −1,0 = P{ X (n + 1) = X (n) = −1 } = P (ξ = 2) = 0,1 , p −1,1 = P{ X (n + 1) = X (n) = −1 } = P (ξ = 1) = 0,4 , Ma trận xác suất chuyển: ⎡0 ⎢ ⎢0 P=⎢ ⎢0,1 ⎢ ⎢⎣ 0,1 0,4 0,5⎤ ⎥ 0,1 0,4 0,5⎥ ⎥ 0,4 0,5 ⎥ ⎥ 0,1 0,4 0,5⎥⎦ 6.2.4 Phân bố dừng, phân bố giới hạn, phân bố ergodic Định nghĩa 6.3 ∏ * = [π1 , π , ] gọi là phân bố dừng thoả mãn điều kiện: 1) ∑ π j = 1; 2) Π * = Π * P (6.22) j Từ 2) suy Π * = Π * P = Π * P = = Π * P n ; ∀ n Do đó lấy Π * làm phân bố đầu chuỗi Markov thì Π *(n ) = Π * , ∀ n Định nghĩa 6.4: Ta nói chuỗi Markov có phân bố giới hạn là [π , π , ] thoả mãn điều kiện: 1) Với j tồn giới hạn lim pij ( n ) = π j không phụ thuộc i , n →∞ 2) ∑π j =1 , j π j ≥ 0, (6.23) (6.24) Nếu điều kiện 2) thay 2') ∑π j =1 , j πj >0 (6.25) thì chuỗi Markov gọi là có tính ergodic còn [π , π , ] là phân bố ergodic Định lý 6.3: Nếu tồn phân bố giới hạn thì đó là phân bố dừng Chứng minh: Giả sử [π , π , ] là phân bố giới hạn thì với j ⎛ ⎞ π j = lim pij ( n +1) = lim ⎜ ∑ pik ( n) pkj ⎟ = ∑ π k pkj ⎟ n → ∞⎜⎝ k n→∞ ⎠ k 136 (139) Chương 6: Quá trình ngẫu nhiên chuỗi Markov [π1 , π , ] = [π1 , π , ]P Do đó [π , π , ] là phân bố dừng ⇒ Ngược lại giả sử [π1 , π , ] là phân bố dừng chuỗi Markov này thì π j = ∑ πk pkj = ∑ πk pkj ( 2) = = ∑ πk pkj k k (n) k ⎛ ⎞ π j = lim ⎜ ∑ πk pkj ( n) ⎟ = ∑ πk π j = π j ⎟ n → ∞⎜⎝ k ⎠ k ⇒ Nghĩa là phân bố giới hạn là phân bố dừng Định lý 6.4: Nếu chuỗi Markov có không gian trạng thái hữu hạn thì chuỗi này là ergodic và tồn n0 cho pij ( n0 ) > i, j Chú ý: Từ định lý 6.3 và 6.4 ta thấy chuỗi Markov với ma trận xác suất chuyển [ ] P = pij tồn n0 cho pij ( n0 ) > thì chuỗi này là ergodic Phân bố ergodic là i, j phân bố dừng nhất, đó là nghiệm hệ phương trình: ⎧ ⎪ ⎨ ⎪ ⎩ ⎧ ⎡ x1 ⎤ ⎡ x1 ⎤ ⎪ ⎥ ⎢ ⎥ t ⎢ ⎡⎣ x1 , x2, ⎤⎦ = ⎡⎣ x1 , x2, ⎤⎦ P ⎪⎪ P ⎢ x2 ⎥ = ⎢ x2 ⎥ hay ⎨ ⎢⎣ ⎥⎦ ⎢⎣ ⎥⎦ x j ≥ 0, ∑ x j = ⎪ j ⎪ x j ≥ 0, ∑ x j = ⎪⎩ j (6.26) Ví dụ 6.3: Cho chuỗi Markov có ma trận xác suất chuyển a ⎤ ⎡1 − a P=⎢ ⎥ , < a, b < ⎣⎢ b − b⎦⎥ là chuỗi Markov có tính ergodic với phân bố ergodic là nghiệm hệ phương trình b ⎧ b ⎤ ⎡ x1 ⎤ ⎡ x1 ⎤ ⎡1 − a ⎪⎪ x1 = a + b ⎧− ax1 + bx2 = ⇔⎨ ⎥⎢ ⎥ = ⎢ ⎥ ⇔ ⎨ ⎢ ⎢⎣ a − b⎥⎦ ⎣ x2 ⎦ ⎣ x2 ⎦ ⎩ x1 + x2 = ⎪x = a ⎪⎩ a + b ⇒ lim P ( n) n→∞ ⎡ b ⎢ = ⎢a + b b ⎢ ⎣a + b a ⎤ a + b⎥ a ⎥ ⎥ a + b⎦ Ví dụ 6.4: Trong bài báo viết năm 1913 A A Markov đã chọn dãy gồm 20.000 chữ cái trường ca Evghenhi Onheghin A X Puskin và thấy các chữ cái này chuyển đổi liên hai trạng thái nguyên âm (Na) và phụ âm (Pa) với ma trận xác suất chuyển là 137 (140) Chương 6: Quá trình ngẫu nhiên chuỗi Markov ⎡ 0,128 0,872⎤ Na P=⎢ ⎥ ⎢⎣0,663 0,337⎥⎦ Pa Na Pa Phân bố giới hạn (cũng là phân bố dừng) chuỗi Markov này là (0,423; 0,568) Vậy có khoảng 42,3% nguyên âm và 56,8% phụ âm tác phẩm trên 6.3 PHÂN LOẠI TRẠNG THÁI CHUỖI MARKOV Định lý 6.4 cho ta dấu hiệu nhận biết chuỗi Markov hữu hạn trạng thái tồn phân bố ergodic Trong trường hợp tổng quát, cách phân tích trạng thái chuỗi Markov ta tìm điều kiện để tồn phân bố giới hạn thỏa mãn (6.23)-(6.24) 6.3.1 Các trạng thái liên thông và phân lớp Định nghĩa 6.5: Ta nói trạng thái j đạt từ trạng thái i tồn n ≥ (n) cho pij > (xác suất để sau n bước chuyển từ trạng thái i sang trạng thái j lớn 0) Ký hiệu i → j ( 0) Quy ước pii = và pij(0) = i ≠ j Hai trạng thái i và j gọi là liên thông với i → j và j → i , lúc đó ta ký hiệu i ↔ j Có thể chứng minh ↔ là quan hệ tương đương trên tập các trạng thái Do đó ta có thể phân hoạch không gian trạng thái thành các lớp tương đương Các lớp tương đương này rời nhau, hai trạng thái cùng lớp thì liên thông với nhau, còn hai trạng thái thuộc hai lớp khác không thể liên thông với Định nghĩa 6.6: Chuỗi Markov gọi là tối giản hai trạng thái không gian trạng thái liên thông với Như chuỗi Markov tối giản có lớp tương đương Giả sử không gian trạng thái tách thành các lớp tương đương E = E1 ∪ E ∪ Trong nhiều trường hợp có thể xem E k ( k = 1, 2, ) là không gian trạng thái chuỗi Markov tối giản Vì E1 , E , gọi là các lớp tối giản chuỗi Ví dụ 6.5: Cho chuỗi Markov với ma trận xác suất chuyển ⎡1 / / ⎢ ⎢1 / / ⎢ P=⎢ 0 ⎢ ⎢ 0 1/ ⎢ ⎢⎣ 0 0 1 138 ⎤ ⎥ ⎥ ⎥ ⎡ P1 ⎥=⎢ ⎥ ⎣⎢ / 2⎥ ⎥ ⎥⎦ 0⎤ ⎥ P2 ⎦⎥ (141) Chương 6: Quá trình ngẫu nhiên chuỗi Markov 2/3 1/ 1/ 3/ 1/ 1/ Không gian trạng thái E = {1, 2, 3, 4, 5} phân thành hai lớp E1 = {1, 2} , E = {3, 4, 5} và có thể xem E1 , E là không gian trạng thái chuỗi Markov với ma trận xác suất chuyển tương ứng là P1 và P2 6.3.2 Chu kỳ trạng thái Định nghĩa 6.7: Ước chung lớn tất các số tự nhiên n ≥ thỏa mãn điều kiện pii( n) > gọi là chu kỳ trạng thái i ký hiệu d (i ) Nếu pii( n) = n ≥ thì đặt d (i ) = Định lý 6.7: Nếu i ↔ j thì d (i ) = d ( j ) Do đó các trạng thái thuộc cùng lớp có cùng chu kỳ Đối với chuỗi Markov tối giản trạng thái có cùng chu kỳ ta gọi d là chu kỳ chung củ trạng thái chuỗi • Nếu d = thì ma trận xác suất chuyển P có khối • Nếu d > thì tập trạng thái E tách thành d lớp con: C , C1 , , C d −1 Trong trường hợp này sau bước hệ xuất phát từ C chuyển sang C1 ; xuất phát từ C1 chuyển sang C ; v.v… Ma trận xác suất chuyển P có dạng khối sau C0 C d −1 C1 C0 C1 (6.27) C d −1 6.3.3 Trạng thái hồi quy và trạng thái không hồi quy Với trạng thái i ta đặt: 139 (142) Chương 6: Quá trình ngẫu nhiên chuỗi Markov f ij( n) = P{X n = j , X ≠ j , X n−1 ≠ j X = i}; j ∈ E (n ) Như f ij (n ) Đặc biệt f ii (6.28) là xác suất để hệ xuất phát từ i lần đầu tiên chuyển sang j bước thứ n là xác suất để hệ xuất phát từ i lần đầu tiên quay i bước thứ n Từ tính Markov và công thức xác suất đầy đủ ta có: pij( n) = ( 0) đó ta quy ước f ij n ∑ f ij(k ) p (jjn−k ) , n ≥ 1; k =0 f ij(1) = pij (6.29) = với i, j Định nghĩa 6.7: Đặt f ij = ∞ ∑ n =0 f ij( n) , f ii = ∞ ∑ f ii(n) (6.30) n =0 • Nếu f ii = thì i gọi hồi là trạng thái quy • Nếu f ii < thì i gọi là trạng thái không hồi quy Như trạng thái i hồi quy và hệ xuất phát từ i , với xác suất hệ lại trở i thời điểm hữu hạn nào đó ( ) (n ) Trường hợp trạng thái i hồi quy f ii = , theo công thức (6.30) thì f ii lập thành phân bố xác suất Do đó ta có thể tính giá trị trung bình, đó là thời gian trung bình hệ trở lại i μi = ∞ ∑ nf ii(n) (6.31) n =0 Định nghĩa 6.9: Giả sử i là trạng thái hồi quy Ta nói: • i là trạng thái hồi quy dương μ i < ∞ • i là trạng thái hồi quy không μ i = ∞ 6.3.4 Tiêu chuẩn hồi quy và không hồi quy Định lý 6.8: 1) Trạng thái i là hồi quy và ∞ ∑ pii(n) = ∞ n =1 2) Trạng thái i là không hồi quy và ∞ ∑ pii(n) < ∞ n =1 3) Nếu i → j và i hồi quy thì j → i và j hồi quy 4) Nếu i ↔ j và j hồi quy thì f ij = 140 (143) Chương 6: Quá trình ngẫu nhiên chuỗi Markov 6.3.5 Định lý giới hạn chuỗi Markov Định lý 6.9: Giả sử j là trạng thái hồi quy, chu kỳ d ( j ) = Khi đó: Nếu i và j liên thông thì lim n →∞ pij( n) ⎧ ⎪ = ⎨μ j ⎪0 ⎩ đèi víi j lµ tr¹ng th¸i d− ong (6.32) đèi víi j lµ tr¹ng th¸i kh«ng Nếu i và j không liên thông thì lim pij( n) n→∞ ⎧ f ij ⎪ = ⎨μ j ⎪ ⎩0 đèi víi j lµ tr¹ng th¸i d− ong (6.33) đèi víi j lµ tr¹ng th¸i kh«ng Định lý 6.10: Giả sử j là trạng thái hồi quy, chu kỳ d ( j ) = d > Khi đó: Nếu i và j liên thông; i thuộc vào lớp C r còn j thuộc vào lớp C r + a thì lim pij( nd + a ) = n→∞ d , ( a = 0,1, , d − ) μj (6.34) Nếu i và j không liên thông thì ⎡∞ ⎤ d lim pij( nd + a ) = ⎢ ∑ f ij( rd + a ) ⎥ , ( a = 0,1, , d − ) n→∞ ⎢⎣r =0 ⎥⎦ μ j (6.35) 6.3.6 Sự tồn phân bố dừng Định lý 6.11: Điều kiện cần và đủ để tồn phân bố giới hạn là không gian trạng thái E có đúng lớp hồi quy dương C , chu kỳ d (C) = cho f ij = 1; ∀j ∈ C , ∀i ∈ E Khi đó phân bố giới hạn là phân bố dừng có π j = Định lý 6.12: Giả sử μj {X (n)} là chuỗi Markov có không gian trạng thái hữu hạn Khi đó các điều sau là tương đương: (i) {X (n)} tối giản có chu kỳ (ii) {X (n)} tối giản có chu kỳ và tất các trạng thái là hồi quy dương (iii) {X (n)} có tính ergodic, nghĩa là tồn phân bố ergodic ( n) (iv) Tồn n0 cho pij i, j > với n ≥ n0 (xem định lý 6.4) 6.4 DI ĐỘNG NGẪU NHIÊN TRÊN ĐƯỜNG THẲNG 141 (144) Chương 6: Quá trình ngẫu nhiên chuỗi Markov 6.4.1 Di động ngẫu nhiên trên đường thẳng không có trạng thái hấp thụ Giả sử {ε n }n =1 là dãy các biến ngẫu nhiên độc lập có cùng phân bố không – A( p) : ∞ ε n , ( n = 1, 2, ) Khi đó { X n }n =1 lập thành chuỗi Markov với ma trận xác ∞ Đặt X n = ε1 + ε + suất chuyển là ⎧ p víi j = i + ⎪ P = ⎡⎣ pij ⎤⎦ đó pij = ⎨1 − p víi j = i − ; < p < ⎪ víi j ≠ i ± ⎩ (6.36) Không gian trạng thái chuỗi này là E = {0, ± 1, ± 2, } p p p p p 1− p 1− p 1− p 1− p 1− p Chuỗi này dùng để mô tả di động ngẫu nhiên trên đường thẳng hạt vật chất nào đó: Sau chu kỳ hạt dịch chuyển sang phải với xác suất p dịch sang trái với xác suất − p Di động ngẫu nhiên trên đường thẳng là chuỗi Markov tối giản, có chu kỳ d = chuỗi không tồn phân bố dừng, không có tính ergodic 6.4.2 Di động ngẫu nhiên trên đường thẳng có trạng thái hấp thụ Đó là di động hạt vật chất với không gian trạng thái E = {0,1, 2, } và ma trận xác suất chuyển là P = ⎡⎣ pij ⎤⎦ , đó ⎧ p víi j = i + 1, i ≠ 0, ⎪ p00 = 1, pij = ⎨1 − p víi j = i − 1, i ≠ 0, ; < p < ⎪ víi j ≠ i ± 1, i ≠ 0, ⎩ p p p 1 1− p 1− p 1− p 142 1− p (6.37) (145) Chương 6: Quá trình ngẫu nhiên chuỗi Markov Lúc này {0} lập thành lớp hồi quy dương với chu kỳ d = : E = {0} ∪ {1, 2, } Tất các trạng thái 1, 2, là không hồi quy Vì theo định lý 6.11 tồn phân bố dừng nhất, đó là ⎧1 víi j = 0, ⎩0 víi j ≠ πj =⎨ (6.38) Hơn có thể chứng minh i ≥ thì (n) i0 lim p n →∞ ⎧⎪( q / p )i =⎨ ⎪⎩ nÕu p > q, (6.39) nÕu p ≤ q; q = − p Vì vậy: Khi p > q thì lim pi(0n ) = ( q / p ) phụ thuộc vào i , đó không tồn phân bố giới hạn i n →∞ ⎧1 víi j = 0, Khi p ≤ q thì tồn phân bố giới hạn, đó là π j = ⎨ ⎩0 víi j ≠ 6.4.3 Di động ngẫu nhiên trên đường thẳng có hai trạng thái hấp thụ Đó là mô hình di động hình vẽ p p p 1 1− p 1− p 1− p N −1 N Trong trường hợp này có hai lớp hồi quy dương là {0} và { N } Các trạng thái còn lại không hồi quy: E = {0} ∪ { N } ∪ {1, 2, , N − 1} Di động ngừng lại hạt rơi vào trạng thái trạng thái N Do đó tồn vô số phân bố dừng Π = [π , π , , π N ] , đó π = a, π N = − a, π = π = = π N −1 = , với ≤ a ≤ Không tồn phân bố giới hạn Hơn có thể chứng minh rằng: 143 (6.40) (146) Chương 6: Quá trình ngẫu nhiên chuỗi Markov lim pi(0n ) n →∞ ⎧ ( q / p )i − ( q / p ) N nÕu p ≠ q, ⎪ ⎪ − ( q / p )N =⎨ ⎪ i nÕu p = q = 1/ ⎪ 1− N ⎩ lim piN( n ) = − lim pi(0n ) , n →∞ n →∞ lim pij( n ) = ( ∀ j = 1, 2, , N − ) n →∞ 6.4.4 Di động ngẫu nhiên trên đường thẳng có trạng thái phản hồi Đó là chuỗi Markov có dạng hình vẽ p p 1− p p 1− p 1− p p 1− p 1− p 0<p<1 Chuỗi tối giản, có chu kỳ d = Khi p > q , hạt có xu hướng sang phải, chuỗi không tồn phân bố giới hạn và phân bố dừng Khi p = q = 1/ , tất các trạng thái là hồi quy không Không tồn phân bố dừng Khi p < q , tất các trạng thái là hồi quy dương Tồn phân bố dừng q− p q− p q− p⎛ p⎞ x0 = , x1 = , , x j = ⎜ ⎟ 2q 2q 2q ⎝ q ⎠ j −1 ; j ≥ (6.41) 6.4.5 Di động ngẫu nhiên trên đường thẳng có hai trạng thái phản hồi Đó là chuỗi Markov có dạng hình vẽ p 1− p p 1− p 1− p 144 p N −1 N 0<p<1 (147) Chương 6: Quá trình ngẫu nhiên chuỗi Markov Chuỗi tối giản, có hữu hạn trạng thái Tất các trạng thái chuỗi là hồi quy dương, có chu kỳ d = Chuỗi tồn phân bố dừng không tồn phân bố giới hạn Phân bố dừng là nghiệm hệ phương trình (6.26) N ⎧ x = ⎪ j ∑ xi pij ( j = 0,1, , N ), ⎪ i =0 ⎨ N ⎪ x ≥ 0, xi = ∑ ⎪⎩ i i =0 Từ đó suy x0 = x1q , xN = xN −1 p ; xi = ( p / q) i −1 ⎛ p⎞ 1+ ∑ ⎜ ⎟ j =1 ⎝ q ⎠ N −1 j −1 ;(1 ≤ i ≤ N − 1) (6.42) TÓM TẮT Khái niệm quá trình ngẫu nhiên Quá trình ngẫu nhiên là họ các biến ngẫu nhiên {X (t , ω); t ∈ I } Các quá trình này vừa phụ thuộc vào thời gian t và cố định tham số t thì X (t , ω) là biến ngẫu nhiên theo ω Tập số I thường biểu diễn tham số thời gian Quá trình Markov Quá trình {X (t ); t ∈ I } là quá trình Markov với cách chọn t1 < t < < t n và với cách chọn a1 , a2 , , an thì P{a < X (t ) ≤ b X (t1 ) = a1 , , X (t n ) = a n } = P{a < X (t ) ≤ b X (t n ) = a n } đúng với t > tn , với a < b Chuỗi Markov Chuỗi Markov là quá trình Markov {X (t ); t ∈ I } có không gian trạng thái E đếm Tuỳ theo tập số I = {0,1,2, } I = (0; ∞) ta có tương ứng chuỗi Markov với thời gian rời rạc liên tục Chuỗi Markov với thời gian rời rạc Quá trình {X (n), n = 0,1,2, } với thời gian rời rạc gọi là chuỗi Markov thời gian rời rạc i) Không gian trạng thái E X (n) là tập đếm ii) Hàm xác suất chuyển là theo thời gian, nghĩa là thoả mãn: p ( s, i; t , j ) = p ( s + h, i; t + h, j ) 145 (148) Chương 6: Quá trình ngẫu nhiên chuỗi Markov Ta nói tắt chuỗi Markov thay cho chuỗi Markov thời gian rời rạc Ma trận xác suất chuyển Với i, j ∈ E ; đặt pij = P{X (n + 1) = j X (n) = i} pij( k ) = P{X (n + k ) = j X (n) = i} = P{X (k ) = j X (0) = i} Ma trận vuông P = ⎡⎣ pij ⎤⎦ gọi là ma trận xác suất chuyển sau bước Ma trận vuông P ( k ) = ⎡⎣ pij( k ) ⎤⎦ gọi là ma trận xác suất chuyển sau k bước Đặt p (jn) = P{X (n) = j}, n = 0,1,2, Ma trận hàng ∏ ( n ) = ⎡⎣ p (jn ) ⎤⎦ gọi là phân bố hệ thời điểm n Phân bố dừng, phân bố giới hạn, phân bố ergodic ∏ * = [π1 , π , ] gọi là phân bố dừng thoả mãn: ∑ π j = ; Π* = Π*P j Ta nói chuỗi Markov có phân bố giới hạn là [π , π , ] thoả mãn điều kiện: 1) Với j tồn giới hạn lim pij ( n) = π j không phụ thuộc i , n →∞ 2) ∑π j =1 , j π j ≥ 0, Nếu điều kiện 2) thay 2') ∑π j =1 , j πj >0 thì chuỗi Markov gọi là có tính ergodic còn [π , π , ] là phân bố ergodic CÂU HỎI ÔN TẬP VÀ BÀI TẬP 6.1 Quá trình ngẫu nhiên X (t , ω ) là hàm số hai biến (t , ω ) Đúng Sai 6.2 Mọi quá trình có gia số độc lập là quá trình Markov Đúng Sai 6.3 Chuỗi Markov là quá trình Markov {X (t ); t ∈ I } có không gian trạng thái E đếm Đúng Sai 6.4 Ma trận xác suất chuyển sau n bước chuỗi Markov tích n lần ma trận xác suất chuyển bước chuỗi Markov này Đúng Sai 146 (149) Chương 6: Quá trình ngẫu nhiên chuỗi Markov 6.5 Nếu tồn phân bố giới hạn thì nó là phân bố dừng Đúng Sai 6.6 Mọi chuỗi Markov có hữu hạn trạng thái luôn tồn phân bố dừng đó là phân bố ergodic Đúng Sai 6.7 Cho chuỗi Markov {X n }∞ n =1 với không gian trạng thái E = {0, 1, 2} và ma trận xác suất chuyển ⎡ 0,1 0,2 0,7⎤ ⎥ ⎢ P = ⎢0,9 0,1 0,0⎥ ⎥ ⎢ ⎢⎣ 0,1 0,8 0,1⎥⎦ Biết phân bố ban đầu: p = P{X = 0} = ; p1 = P{X = 1} = ; p = P{X = 2} = Tính P { X = 0, X1 = 2, X = 1} 6.8 Cho chuỗi Markov {X n }∞ n =1 với không gian trạng thái E = {0, 1, 2} và ma trận xác suất chuyển ⎡ 0,1 0,2 0,7⎤ ⎥ ⎢ P = ⎢0,2 0,2 0,6⎥ ⎥ ⎢ ⎢⎣0,6 0,1 0,3⎥⎦ a) Tính ma trận xác suất chuyển bước b) Tính P{X = X = 0}; P{X = X = 0} c) Tìm phân bố dừng 6.9 Xét bài toán truyền điện gồm gồm các tín hiệu 0, thông qua kênh có nhiều trạm và trạm nhận sai tín hiệu với xác suất không đổi α ∈ (0,1) Giả sử X là tín hiệu truyền và X n là tín hiệu nhận trạm n Cho biết {X n ; n = 0, 1, 2, } lập thành chuỗi Markov với ma trận xác suất chuyển ⎡ α − α⎤ P=⎢ ⎥ ⎢⎣1 − α α ⎥⎦ a) Tính P{X = 0, X = 0, X = 0} b) Tính P{X = 0, X = 0, X = 0} + P{X = 0, X = 1, X = 0} c) Tính P{ X = X = 0} 147 (150) Chương 6: Quá trình ngẫu nhiên chuỗi Markov 6.10 Xét mô hình kiểm kê phụ tùng thay với s = và S = là các mức để nhập hàng cùng với ξ n là lượng hàng khách yêu cầu chu kỳ n Biết P{ξ n = 0} = 0,4 ; P{ξ n = 1} = 0,3 ; P{ξ n = 2} = 0,3 Xác định xác suất chuyển chuỗi Markov {X n } , đó X n là số phụ tùng còn lại cuối chu kỳ n 6.11 Cho chuỗi Markov ergodic với trạng thái có phân bố giới hạn là [ p, − p ] Hãy xác định ma trận xác suất chuyển? 6.12 Tìm các lớp liên thông trạng thái chuỗi Markov có không gian trạng thái E = {0, 1, 2, 3, 4} và ma trận xác suất chuyển 0 ⎤ ⎡1 / / ⎢ ⎥ ⎢1 / / 0 ⎥ ⎢ ⎥ P=⎢ 0 1/ 1/ ⎥ ⎢ ⎥ ⎢ 0 1/ 1/ ⎥ ⎢ ⎥ ⎢⎣1 / / / / 4⎥⎦ 148 (151) Hướng dẫn bài tập HƯỚNG DẪN GIẢI BÀI TẬP ĐÁP ÁN CHƯƠNG I 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.10 Đúng Sai Đúng Đúng Sai Đúng Sai Sai Đúng Đúng 1.11 a) P = 0,246 b) P = 0,495 1.12 Mỗi khách có khả để tầng còn lại tòa nhà Do đó số kết cục đồng khả có thể N = A63 = 216 Gọi A là biến cố tất cùng tầng bốn, biến cố này có trường hợp thuận lợi Do đó P ( A) = 216 Lý luận tương tự trên ta có Pb = 1.13 P = A5 ; Pc = = = 216 216 36 720 1.15 Gọi A1 và A2 tương ứng là biến cố người thứ và thứ hai bắn trúng mục tiêu, A là biến cố có người bắn trúng mục tiêu A = A1 A + A1 A2 Sử dụng qui tắc cộng xác suất trường hợp xung khắc và qui tắc nhân trường hợp độc lập ta có: P ( A) = P( A1 A ) + P( A1 A2 ) = P ( A1 ) P( A ) + P( A1 ) P( A2 ) = 0,8 ⋅ 0,1 + 0,2 ⋅ 0,9 = 0,26 Tương tự ta có: Pb = 0,98 ; Pc = 0,02 1.16 Gọi A1 là biến cố sản phẩm lấy thuộc loại Gọi A2 là biến cố sản phẩm lấy thuộc loại Gọi A là biến cố sản phẩm lấy thuộc loại loại 2: A = A1 + A2 Vì A1 , A2 xung khắc đó 25 P ( A ) = P ( A1 + A2 ) = P ( A1 ) + P ( A2 ) = 0, + 0,5 = 0,9 1.17 ⎛ ⎞ ⎛ 49 ⎞ P = C30 ⎜ ⎟ ⎜ ⎟ ⎝ 50 ⎠ ⎝ 50 ⎠ 1.18 Gọi Ai là biến cố sản phẩm đã qua kiểm tra chất lượng phòng thứ i, i=1,2,3 = 0, 00027 149 (152) Hướng dẫn bài tập Gọi B là biến cố phế phẩm nhập kho ( ) ( ) ( ) P ( B ) = P A1 P A2 P A3 = (1 − 0,8 )(1 − 0,9 )(1 − 0,99 ) = 0, 0002 1.19 P = 0,11 1.20 Gọi Ai là biến cố lần thứ i lấy sản phẩm để kiểm tra, ( i = 1, ) Gọi A là biến cố sau lần kiểm tra tất các sản phẩm kiểm tra A = A1 A2 A3 Vì các biến cố phụ thuộc nên P ( A) = P ( A1 ) P ( A2 A1 ) P ( A3 A1 A2 ) = ⋅ 5 ⋅ = 21 84 1764 1.21 Gọi A là biến cố sản phẩm kiểm tra là phế phẩm Gọi Bi là biến cố sản phẩm lấy kiểm tra thuộc phân xưởng thứ i, i=1,2 P ( B1 ) = 0,36; P ( B2 ) = 0,34; P ( B3 ) = 0,30 Hệ { B1, B2 , B3} đầy đủ P ( A B1 ) = 0,12; P ( A B2 ) = 0,10; P ( A B3 ) = 0, 08 a P ( A ) = P ( B1 ) P ( A B1 ) + P ( B2 ) P ( A B2 ) + P ( B3 ) P ( A B3 ) = 0,1012 P ( B1 ) P ( A B1 ) b P ( B1 A ) = P ( A) P ( B2 A ) = P ( B3 A ) = = P ( B2 ) P ( A B2 ) P ( A) P ( B3 ) P ( A B3 ) P ( A) 0,36 × 0,12 = 0, 427 0,1012 = 0,34 × 0,10 = 0,336 0,1012 = 0,30 × 0, 08 = 0, 237 0,1012 1.22 Gọi Bi là biến cố xạ thủ xét thuộc nhóm thứ i, i=1,2,3,4 Gọi A là biến cố xạ thủ bắn trượt Theo đề bài ta có: P ( B1 ) = , P ( B2 ) = , P ( B3 ) = , P ( B4 ) = 18 18 18 18 P ( A B1 ) = 0, 2, P ( A B2 ) = 0,3, P ( A B3 ) = 0, 4, P ( A B4 ) = 0,5 P ( A ) = P ( B1 ) P ( A B1 ) + P ( B2 ) P ( A B2 ) + P ( B3 ) P ( A B3 ) + P ( B4 ) P ( A B4 ) = 57 × 0, + × 0,3 + × 0, + × 0,5 = 18 18 18 18 180 Áp dụng công thức Bayer, ta thu P ( B1 A ) = P ( B1 ) P ( A B1 ) P ( A) × 0, 10 18 = = , 57 57 180 150 (153) Hướng dẫn bài tập tương tự P ( B2 A ) = 21 16 10 , P ( B3 A ) = , P ( B4 A ) = 57 57 57 Vậy xạ thủ có khả nhóm thứ hai 1.23 Gọi B1 là biến cố viên đạn thứ trúng mục tiêu, P ( B1 ) = 0, Gọi B2 là biến cố viên đạn thứ hai trúng mục tiêu, P ( B2 ) = 0, Hai biến cố này độc lập Xác suất biến cố có viên đạn thứ trúng mục tiêu ( ) ( ) ( P ( A ) = P B1 B2 ∪ B2 B1 = P B1 B2 + P B2 B1 ) = 0, × 0, + 0, × 0,3 = 0,54 b ( ) ( ) P B1 B2 P ( B1 A ) P B1 ⎡⎣ B1 B2 ∪ B2 B1 ⎤⎦ 0, × 0, = = = = 0, 778 P ( B1 A ) = P ( A) P ( A) P ( A) 0,54 1.24 Gọi A là biến cố sản phẩm kiểm tra có kết luận đạt tiêu chuẩn chất lượng Gọi BT là biến cố sản phẩm đạt tiêu chuẩn chất lượng Gọi BH là biến cố sản phẩm không đạt tiêu chuẩn chất lượng P ( BT ) = 0,85; P ( BH ) = 0,15 Hệ { BT , BH } đầy đủ P ( A BT ) = 0,9; P ( A BH ) = 0,95 ⇒ P ( A BT ) = 0,1; P ( A BH ) = 0, 05 a) P ( A ) = P ( BT ) P ( A BT ) + P ( BH ) P ( A BH ) = 0,85 × 0,9 + 0,15 × 0, 05 = 0, 7725 b) P ( BH A ) = ( P ( BH ) P ( A BH ) P ( A) ) = 0,15 × 0, 05 = 0, 0097 0, 7725 ( ) c) P ABT ∪ ABH = P ( ABT ) + P ABH = 0,85 × 0,9 + 0,15 × 0,95 = 0,9075 ĐÁP ÁN CHƯƠNG II 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 Sai Sai Đúng Sai Đúng Sai Sai Đúng Đúng Sai 2.11 2.12 2.13 2.14 2.15 Sai Sai Đúng Đúng Sai 151 (154) Hướng dẫn bài tập 2.16 E ( X ) = 0,3; D ( X ) = 15, 21 2.17 x3 = 29,1; p3 = 0, 2.18 E( X ) = 3,1; E( X ) = 3,4 ; D( X ) = 1,09 ; D( X ) = 1,44 E( X + X ) = 6,5 ; D( X + X ) = 2,53 2.19 E( X ) = 0,8 ; D( X ) = 0,12 2.20 a) D( Z ) = 61 b) D( Z ) = 41 2.21 p1 = 0,4 ; p = 0,1; p3 = 0,5 2.22 a) Gọi Ai là biến cố toa i có người ngồi ( i = 1,3 ) Gọi A là biến cố toa có người ngồi Khi đó: A = A1 A2 A3 ⇒ A = A1 + A2 + A3 P( A) = P( A1 ) + P( A ) + P( A3 ) − P( A1 A ) − P( A1 A3 ) − P( A A3 ) + P( A1 A A3 ) = ⇒ P( A) = 150 243 b) X P 32 243 80 243 80 243 40 243 10 243 243 Y P 243 10 243 40 243 80 243 80 243 32 243 ⇒ k= 64 2.23 E ( X ) = 2.24 a) Vì 64 ∫ x ( − x ) dx = b) P { X < 1} = ∫ 13 x ( − x ) dx = 64 256 152 93 243 (155) Hướng dẫn bài tập x=4 x =0 3 ⎛ x5 ⎞ c) EX = ∫ x ( − x ) dx = ⎜ x − ⎟ 64 64 ⎜⎝ ⎟⎠ ⎛ 16 ⎞ 12 = 3⎜ − ⎟ = 5⎠ ⎝ x =4 4 ⎛ x5 x ⎞ ⎛ 1 ⎞ 32 − ⎟ = × 64 ⎜ − ⎟ = EX = ∫ x ( − x ) dx = ⎜ ⎜ ⎟ 64 64 ⎝ ⎠ ⎝5 6⎠ x =0 ⇒ DX = EX − ( EX ) 2 32 ⎛ 12 ⎞ 16 = −⎜ ⎟ = ⎝ 5⎠ 25 2.25 a) Kí hiệu Ai là biến cố : ”A bắn trúng i viên”, Bi là biến cố : ”B bắn trúng i viên”; i = 0, Dễ thấy P ( A0 ) = 0,36 ; P ( A1 ) = 0, 48 ; P ( A2 ) = 0,16 ; P ( B0 ) = 0, 25 ; P ( B1 ) = 0,5 ; P ( B2 ) = 0, 25 Từ đó P { X = −2} = P ( A0 ) P ( B2 ) = 0, 09 P { X = −1} = P ( A0 ) P ( B1 ) + P ( A1 ) P ( B2 ) = 0,18 + 0,12 = 0,3 P { X = 0} = P ( A0 ) P ( B0 ) + P ( A1 ) P ( B1 ) + P ( A2 ) P ( B2 ) = 0,37 P { X = 1} = P ( A1 ) P ( B0 ) + P ( A2 ) P ( B1 ) = 0, P { X = 2} = P ( A2 ) P ( B0 ) = 0, 04 Vậy bảng phân bố xác suất X −2 0, 09 X P −1 0,3 0,37 0, 0, 04 EX = ( −2 ) × 0, 09 + ( −1) × 0,3 + × 0,37 + 1× 0, + × 0, 04 = −0, 2 EX = ( −2 ) × 0, 09 + ( −1) × 0,3 + 02 × 0,37 + 12 × 0, + 22 × 0, 04 = 1, 02 2 DX = EX − ( EX ) = 1, 02 − ( −0, ) = 0,98 b) P {Y = 0} = 0,37 P {Y = 1} = P { X = 1} + P { X = −1} = 0,5 P {Y = 2} = P { X = 2} + P { X = −2} = 0,13 EY = × 0,37 + 1× 0,5 + × 0,13 = 0, 76 2.26 Kí hiệu Ai là biến cố : ”ô tô thứ i bị hỏng”, i = 1, 153 (156) Hướng dẫn bài tập Dễ thấy P ( A1 ) = 0,1 ; P ( A2 ) = 0, Gọi X là số ôtô bị hỏng thời gian làm việc ( ) ( ) Từ đó P { X = 0} = P A1 P A2 = 0,9 × 0,8 = 0, 72 ( ) ( ) P { X = 1} = P ( A1 ) P A2 + P A1 P ( A2 ) = 0,1× 0,8 + 0,9 × 0, = 0, 26 P { X = 2} = P ( A1 ) P ( A2 ) = 0, 02 X P 0, 72 0, 26 0, 02 EX = × 0, 72 + 1× 0, 26 + × 0, 02 = 0,3 EX = 02 × 0, 72 + 12 × 0, 26 + 22 × 0, 02 = 0,34 2 DX = EX − ( EX ) = 0,34 − ( 0,3) = 0, 25 ⎧k > ⎧ pi > ⎧⎪ k > ⎪ ⎪ ⇒ k = 1/10 2.27 a) Điều kiện ⎨ p = ⇒ ⎨ ⇒ ⎨ ⎡ k = −1 ∑ ⎪⎩10k + 9k = ⎪ ⎢ ⎪⎩ i i ⎩ ⎣ k = 1/10 b) P { X ≥ 5} = c) EX = 1 ; P { X < 3} = + = 10 10 10 10 12 12 1⎞ ⎛ + + + + + + 7⎜ + ⎟ = 3, 66 10 10 10 10 100 100 ⎝ 100 10 ⎠ d) EX = 18 48 25 72 1⎞ ⎛ + + + + + + 49 ⎜ + ⎟ = 16,8 10 10 10 10 100 100 ⎝ 100 10 ⎠ 2 DX = EX − ( EX ) = 16,8 − ( 3, 66 ) = 3, 404 2.28 a) Gọi X là “số phế phẩm gặp phải”: EX = X P 0, 0, ; DX = 25 b) Gọi Ị là “số chính phẩm gặp phải” ⇒ Y = − X : EY = E ( - X ) = − = ; DY = 5 25 2.29 Gọi X là “số nữ có nhóm chọn” 154 Y P 0, 0, (157) Hướng dẫn bài tập P { X = 0} = P { X = 2} = EX = × C63 C10 = C42C61 C10 , 30 = P { X = 1} = C14C62 C10 15 30 = C1C 15 , P { X = 1} = = 30 30 C10 X P / 30 15 / 30 / 30 1/ 30 15 36 + 1× + × + × = = 30 30 30 30 30 2.30 Thắng ván dễ 2.31 a) P = 0,238 b) P = 0,751 2.32 a) X tuân theo quy luật nhị thức B (n ; p) với n = và p = 0,8 b) E X = ; D X = 0,8 c) ModX = ; P{X = 4} = 0,4096 2.33 a) P = 0,9914 b) Số sản phẩm hỏng trung bình là 0,5 c) Số sản phẩm hỏng có khả xảy nhiều là 2.34 Gọi x là số câu hỏi học sinh trả lời đúng Số điểm nhận là x + (10 − x)(−2) = x − 20 a) Anh ta điểm trả lời đúng: x − 20 = ⇒ x = Vậy xác suất để điểm là P = C10 ()() 4 = 0,088 b) Anh ta điểm âm trả lời đúng: x − 20 < ⇒ x = 0,1, 2,3 Vậy xác suất để điểm âm là P = ∑ C104 k =0 ()() k 10−k = 0,879 2.35 Gọi X là số lần thu tín hiệu lần phát độc lập thì X ~ B ( 5; 0, ) a) Xác suất thu tín hiệu lần P { X = 2} = C52 0, 20,33 = 0,132 b) Xác suất thu tín hiệu nhiều lần c) Xác suất thu tín hiệu P { X ≤ 1} = 0, 031 P { X ≥ 1} = − P { X = 0} = − 0, 002 = 0,998 2.36 Không đúng; P = 0,41 155 (158) Hướng dẫn bài tập 2.37 a) Gọi X là số gọi khoảng thời gian 10 giây thì X có phân bố Poisson tham số λ = 1/ Vậy xác suất có ít gọi khoảng thời gian 10 giây là P { X ≥ 1} = − P { X = 0} = − e−1/ = 0, 2825 b) Gọi Y là số gọi khoảng thời gian phút thì Ị có phân bố Poisson tham số λ = Vậy xác suất có nhiều ba gọi khoảng thời gian phút là P {Y ≤ 3} = 0,151 c) Gọi Z là số gọi khoảng thời gian phút thì Z có phân bố Poisson tham số λ = Xác suất có nhiều gọi khoảng thời gian phút là P {Z ≤ 1} = 0, 406 Vậy xác suất để khoảng thời gian phút liên tiếp phút có nhiều gọi là P {Z ≤ 1} = 0, 4063 = 0, 0067 ⎛ 12 − 10 ⎞ ⎛ − 10 ⎞ 2.38 P{8 < X < 12} = Φ⎜ ⎟ − Φ⎜ ⎟ = 0,6826 ⎝ ⎠ ⎝ ⎠ 2.39 P = 0,3 2.40 a) 95,44%; b) 4,56% 2.41 a) 20,33%; b) P = 0,9983 { } ⎛ε n ⎞ σ2 ⎟ −1 ⇒ P X − μ < ε = 2Φ⎜⎜ 2.42 E( X ) = μ ; D( X ) = ⎟ σ n ⎝ ⎠ ĐÁP ÁN CHƯƠNG III 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 Sai Đúng Đúng Đúng Sai Sai Sai Đúng Đúng Sai 3.11 3.12 Sai Đúng 3.13 X x1 x2 Y y1 y2 y3 P 0,56 0,44 P 0,26 0,38 0,36 3.14 EX = −7 / 15 ; EY = ; cov( X , Y ) = −1 / ; ρ X,Y = −0,15 3.15 EX = −1 / ; EY = ; ρ X,Y = X và Y không độc lập vì 156 (159) Hướng dẫn bài tập P{X = 1} = / 15, P{Y = 1} = / 15 và P{X = Y = 1} = 3.16 Bảng phân bố xác suất biến ngẫu nhiên Z Z P 0,12 0,43 0,03 0,35 0,07 EX = 1,7 ; EY = 1,7 ; EZ = 2,89 3.17 Bảng phân bố xác suất đồng thời X và Y Y 0,04 0,12 0,16 0,06 0,02 0,03 0,09 0,12 0,045 0,015 0,02 0,06 0,08 0,03 0,01 0,01 0,03 0,04 0,015 0,005 X P{X > Y } = 0,19 3.18 X , Y không độc lập vì P{X = 1} = 0,5, P{Y = 1} = 0,45 và P{X = Y = 1} = 0,15 ≠ 0,5 ⋅ 0,45 P{X = 1Y = 2} = / 11 3.19 X 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 Y P{X = 1} = 0,5, P{Y = 1} = 0,45 và P{X = Y = 1} = 0,15 ≠ 0,5 ⋅ 0,45 3.20 23 27 0,357 0,643 Y X = 26 P X Y = 27 P 26 30 41 50 0,1268 0,4225 0,1549 0,2958 157 (160) Hướng dẫn bài tập 3.21 E[Y X = 1] = EX = 2,93 ; EY = 4,5 ; DX = 4,83 ; DY = 2,25 a α = 15 ; EX = −0, ; EY = 3.22 b cov ( X , Y ) = ⇒ ρ ( X , Y ) = c X , Y không độc lập vì P { X = 1} = P { X = 1, Y = 1} = , P {Y = 1} = 15 15 3.23 a) k = ; b) c) ⎧3 ⎧⎪ 3x nÕu < x < ⎪ (1 − y ) nÕu < y < ; f Y ( y) = ⎨ f X ( x) = ⎨ ⎪⎩ nÕu ng−îc l¹i ⎪⎩ nÕu ng−îc l¹i 1⎫ 1⎫ 1⎫ ⎧ ⎧ ⎧ X và Y không độc lập vì P ⎨ X < , Y > ⎬ = P ⎨ X < ⎬ ≠ , P ⎨ Y > ⎬ ≠ 2⎭ 2⎭ 2⎭ ⎩ ⎩ ⎩ 3.24 Áp dụng công thức (3.14) ta ∂ F ⎧⎪ e − x − y f ( x, y ) = =⎨ ∂x∂y ⎪⎩ nÕu x > 0, y > 0; nÕu ng−îc l¹i Áp dụng công thức (3.53) ta ⎧⎪ e − x f ( x y) = ⎨ ⎪⎩ 3.25 a) C = π2 nÕu x > 0, nÕu x ≤ ; ⎞⎛ 1⎞ ⎛1 b) F ( x, y ) = ⎜ arctg x + ⎟⎜ arctg y + ⎟ ; ⎠⎝ π 2⎠ ⎝π c) F X ( x) = lim F ( x, y ) = y →∞ 1 1 arctg x + ; FY ( y ) = lim F ( x, y ) = arctg y + ; 2 π π x →∞ Vì F ( x, y ) = F X ( x) FY ( y ) nên ta kết luận X và Y độc lập { } { } d) P < X < , < Y < = P < X < P{ < Y < 1} = ⎧ ln x ⎪ 3.26 Hàm mật độ X là f X ( x) = ⎨ x ⎪ ⎩ nÕu x ≥ 1, nÕu x < 158 1 ⋅ = 12 48 (161) Hướng dẫn bài tập ⎧ ⎪ ⎪ Hàm mật độ Y là f Y ( y ) = ⎨ ⎪ ⎪⎩ 2y2 nÕu ≤ y < ∞, nÕu ≤ y ≤ Từ đó hàm mật độ có điều kiện Y với điều kiện X = x ( x > 1) là f ( y x) = f ( x, y ) 1 = ≤ y≤x; f X ( x) y ln x x Hàm mật độ có điều kiện X với điều kiện Y = y ( y > 0) là ⎧ ⎪ f ( x, y ) ⎪ f ( x y) = =⎨ f Y ( y) ⎪ ⎪⎩ nÕu ≤ y ≤ 1, x ≥ y x2 y y nÕu y ≥ 1, y ≤ x x2 3.27 E (2 X − 3Y ) = 2E ( X ) − 3E (Y ) = 10 ; D(2 X − 3Y ) = 4D( X ) + 9D(Y ) − 12 D( X )D(Y ) ρ X ,Y = 57,6 ĐÁP ÁN CHƯƠNG IV 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 Đúng Đúng Sai Sai Đúng Đúng Đúng Đúng 4.9 Gọi X là số máy hỏng ca X có phân bố nhị thức EX = 0,5 , DX = Áp dụng bất đẳng thức Trêbưsép ta có P{ X − 0,05 < 2} ≥ − 0,475 22 = 0,88 ; P{ X − 0,05 ≥ 2} ≤ 0,475 22 = 0,12 12 4.10 Đặt S = ∑ X n ; ES = 12 ⋅ 16 = 192 , DS = 12 Theo bất đẳng thức Trêbưsép n =1 P{S − 192 ≤ ε} ≥ − 4.11 Đặt S = DS ε2 10000 ∑ X n ; ES = , ≥ 0,99 Chọn a = 157,36 ; b = 226,64 DS = n =1 P{S ≥ 500} ≤ DS 500 = 10000 Theo bất đẳng thức Trêbưsép 12 300 159 (162) Hướng dẫn bài tập 4.12 Ta biết S là biến ngẫu nhiên có phân bố nhị thức tham số p = DS = n ES = và 6 5n Theo bất đẳng thức Trêbưsép 36 { } P S − ES < n ≥ − n DS 31 ⎧n ⎫ 31 = 1− = ⇔ P⎨ − n < S < + n ⎬ ≥ 36 36 n ⎩6 ⎭ 36 12 ⎫⎪ ⎧⎪ 12 4.13 Đặt S = ∑ X n Ta cần tìm M nhỏ để P ⎨∑ X n ≤ M ⎬ ≥ 0,99 ⎪⎭ ⎪⎩n=1 n =1 Ta có ES = 192 , DS = 12 Theo bất đẳng thức Trêbưsép P{S − 192 ≤ ε} ≥ − DS ε2 ≥ 0,99 ⇒ ε = 34,64 Vậy M = 192+34,64 = 226,64 4.14 Thỏa mãn luật số lớn Trêbưsép 4.15 Thỏa mãn luật số lớn Trêbưsép 4.16 Thỏa mãn luật số lớn Trêbưsép 4.17 Áp dụng bất đẳng thức Trêbưsép tính xác suất P ≥ 0,9131 4.18 Áp dụng bất đẳng thức Trêbưsép cần kiểm tra 23.750 chi tiết 4.19 Gọi X là số sản phẩm hỏng Ta có X ~ với λ = 250 ⋅ 0,02 = Từ đó tra bảng ta được: B (250 ; 0,02) X có xấp xỉ phân bố Poisson a) P{X = 2} = 0,0842 ; b) P{X ≤ 2} = 0,1247 4.20 Giả sử X là số người chọn ăn đợt Khi đó 1000 − X là số người chọn ăn đợt Gọi k là số chỗ ngồi nhà ăn Ta phải chọn k nhỏ để P{X < k , 1000 − X < k } ≥ 0,99 ⇔ P{1000 − k < X < k } ≥ 0,99 Ta xem X có phân bố chuẩn với μ = 500 , σ = 250 Vậy ta phải có ⎛ k − 500 ⎞ ⎛ 500 − k ⎞ ⎛ k − 500 ⎞ ⎛ k − 500 ⎞ ⎟⎟ − Φ⎜⎜ ⎟⎟ ≥ 0,99 ⇔ 2Φ⎜⎜ ⎟⎟ ≥ 1,99 ⇔ Φ⎜⎜ ⎟⎟ ≥ Φ(2,58) Φ⎜⎜ ⎝ 250 ⎠ ⎝ 250 ⎠ ⎝ 250 ⎠ ⎝ 250 ⎠ Từ đó k ≥ 500 + 2,58 250 = 540,49 Vậy k = 541 4.21 a) Gọi X là số người trúng tuyển Ta có X ~ B (350 ; 0,9) X có phân bố xấp xỉ chuẩn ⎛ ⎞ với μ = 292,5 , σ = 5,4 Vậy P{X ≤ 300} ≈ Φ⎜ ⎟ = Φ(1,48) = 0,9306 ⎝ 5,4 ⎠ b) Giả sử n là số người gọi Phân bố X xấp xỉ phân bố chuẩn với μ = 0,9n , σ = 0,3 n Vậy 160 (163) Hướng dẫn bài tập ⎛ 300 − 0,9n ⎞ ⎟ ≥ 0,99 = Φ (2,33) ⇔ 300 − 0,9n ≥ (0,3)(2,33) n P{X ≤ 300} ≈ Φ⎜⎜ ⎟ ⎝ 0,3 n ⎠ Giải bất phương trình ta n ≤ 319,99 Vậy n = 319 ĐÁP ÁN CHƯƠNG V 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 5.10 Đúng Sai Đúng Đúng Đúng Sai Sai Đúng Đúng Sai 5.11 5.12 5.13 5.14 5.15 5.16 5.17 5.18 Sai Sai Đúng Đúng Sai Sai Sai Sai 5.19 Mẫu ngẫu nhiên có kích thước 10: W = ( X , X , , X 10 ) ⎫⎪ 1⎫ ⎪⎫ ⎪⎧ 10 ⎪⎧ 10 ⎧ P ⎨ X = ⎬ = P ⎨ ∑ X i = ⎬ = P ⎨∑ X i = 5⎬ Vì X có phân bố nhị thức nên 2⎭ ⎪⎭ ⎪⎭ ⎪⎩ i =1 ⎪⎩10 i =1 ⎩ ⎫⎪ ⎧⎪ 10 5 P ⎨∑ X i = 5⎬ = P10 (5) = C10 (0,5) ⋅ (0,5)10−5 = C10 (0,5)10 ⎪⎭ ⎪⎩ i =1 5.20 X có phân bố chuẩn N (μ; σ ) nên X có phân bố chuẩn N (μ; { } { { } σ2 ) Vậy n ⎛ε n ⎞ ⎛−ε n ⎞ ⎛ε n ⎞ ⎟ − Φ⎜ ⎟ = 2Φ⎜ ⎟ P X − μ < ε = P μ − ε < X < μ + ε = Φ⎜⎜ ⎟ ⎜ σ ⎟ ⎜ σ ⎟ Do đó σ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ } ⎛ 0,2 100 ⎞ ⎟ = 2Φ (2) = 0,9545 P X − 20 < 0,2 = 2Φ⎜⎜ ⎟ ⎝ ⎠ 5.21 Bảng phân bố tần số X Tần số 2 X Tần suất 1/5 2/5 1/5 1/5 Bảng phân bố tần suất Hàm phân bố thực nghiệm 161 (164) Hướng dẫn bài tập x ≤1 ⎧0 ⎪1 / < x ≤ ⎪⎪ F10 ( x) = ⎨3 / < x ≤ ⎪4 / < x ≤ ⎪ ⎪⎩1 x>4 5.22 f = x = 6,8 ; s = 1,15 , s = 1,072 ⎧nf = 1082 > 10 1082 ; Điều kiện ⎨ 2000 ⎩n(1 − f ) = 918 > 10 f (1 − f ) f − uβ n = 1082 918 ×1082 − 2,33 = 0,515 2000 2000 Vậy tối thiểu có 51,5% số phiếu bầu cho ứng cử viên A 5.23 x = ∑ xi = 34,15 = 0,976 35 n 2⎤ ⎡ ( 34,15)2 ⎤⎥ = 0, 01687 ⎢ ⎡ ( ∑ xi ) ⎥ ⎢ − = − s = x 33,8943 ∑i ⎥ 34 ⎢ n −1 ⎢ n 35 ⎥ ⎣ ⎦ ⎣ ⎦ ⇒ s = 0,1299; uβ 5.24 Tần suất mẫu f = s 0,1299 = 1,96 × = 0, 043 Khoảng tin cậy 95%: 35 n [0,933 ; 1, 019] ⎧nf = 53 > 10 53 , điều kiện ⎨ 400 ⎩ n(1 − f ) = 347 > 10 Gọi p là xác suất bắt cá có đánh dấu, khoảng tin cậy 95% p : f (1 − f ) uβ n = 1,96 53 × 347 = 0, 0332 400 400 Khoảng ước lượng [ 0, 0993 ; 0,1657 ] Mặt khác p = 2000 , đó N là số cá hồ N Vậy 0, 0993 < 2000 2000 2000 < 0,1657 ⇒ <N< ⇒ 12070 < N < 20141 N 0,1657 0, 0993 x − 18, 25 ∑ ui + 18, 25 = −1,8 + 18, 25 = 18, 025 ⇒ x =5 5.25 Đặt ui = i 40 n 2⎤ ⎡ ⎡ −1,8 ) ⎤ ( 52 ⎢ ( ∑ ui ) ⎥ 25 ⎢ s = ∑ ui − n ⎥ = 39 ⎢0, 76 − 40 ⎥⎥ = 0, 435 n −1 ⎢ ⎣ ⎦ ⎣ ⎦ 162 (165) Hướng dẫn bài tập s 0, 66 = 1, 64 × = 0,171 40 n ⇒ s = 0, 66; uβ [17,854; 18,196] a) Khoảng tin cậy 90%: b) Kích thược mẫu cần thiết n ≥ = xi − 50 ⇒ x = ∑ 5.26 Đặt ui uβ ui n σ n = 1,96 × u 2β s ε2 + 50 = = 116,99 chọn n = 117 −8 + 50 = 49, 704 27 = 0,377 27 [ 49,327 ; 50, 081] a) Khoảng tin cậy 95%: b) Kích thược mẫu cần thiết n ≥ u 2β σ ε2 = 384,16 chọn n = 385 5.27 Gọi μ là trọng lượng trung bình bao sản phẩm đóng gói Ta kiểm định giả thiết H : μ = 100 ; đối thiết H1 : μ < 100 Tiêu chuẩn kiểm định T = x − 99, 25 Đặt ui = i ⇒ x = 5× Tqs = (100 − X ) n S ; Miền bác bỏ Wα = {T > 2,086} ∑ riui = 0, ; ∑ riui = 0, 42 ⇒ 0, + 99, 25 = 99,319 ; 29 s = 25 × ⎡ 0, 42 ⎤ ⎢0, 42 − ⎥ = 0,37 ⇒ s = 0, 608 28 ⎣⎢ 29 ⎦⎥ (100 − 99,319) 29 = 6,032 ∈ Wα 0,608 Vậy bác bỏ H chấp nhận H1 , nghĩa là sản phẩm bị đóng thiếu 5.28 Gọi μ là thời gian trung bình hoàn thành sản phẩm Ta kiểm định giả thiết H : μ = 14 ; đối thiết Tiêu chuẩn kiểm định T = x − 15 Đặt ui = i ⇒ x = 15 ; ⇒ s2 = × ( X − 14 ) S n H1 : μ ≠ 14 ; Miền bác bỏ Wα = {T > 1,96} ∑ riui = ; ∑ riui = 300 ⎡ ⎤ = 4,819 ⇒ s = 2,195 300 − ⎢ 249 ⎣ 300 ⎥⎦ 163 (166) Hướng dẫn bài tập ⇒ Tqs = (115 − 14) 300 = 7,89 ∈ Wα 2,195 Vậy bác bỏ H chấp nhận H1 , nghĩa là cần thay đổi định mức 5.29 Gọi μ là mức hao phí xăng trung bình ôtô chạy từ A đến B Ta kiểm định giả thiết H : μ = 50 ; đối thiết H1 : μ < 50 Tiêu chuẩn kiểm định T = Theo mẫu ta có x = s2 = ( 50 − X ) n S ; Miền bác bỏ Wα = {T > 2,052} 1387,5 = 49,5536; 28 ⎛ 1387,52 ⎞ 8,1696 = 0,3026 ⇒ s = 0,55 ⎜⎜ 6876375 − ⎟= 27 ⎝ 28 ⎟⎠ 27 Tqs = (50 − 49,53) 30 = 4,2948 ∈ Wα 0,55 Vậy bác bỏ H chấp nhận H1 , nghĩa là mức hao phí xăng có giảm xuống 5.30 Gọi μ là số hoá đơn trung bình hệ thống máy tính xử lý Ta kiểm định giả thiết H : μ = 1300 ; H1 : μ > 1300 đối thiết Tiêu chuẩn kiểm định T = Từ mẫu cụ thể ta có T = ( X − 1300 ) S (1378 − 1300 ) 215 n ; Miền bác bỏ Wα = {T > 1,96} 40 = 2, 294 > 1,96 Vậy bác bỏ H chấp nhận H1 , nghĩa là hệ thống máy tính xử lý tốt ĐÁP ÁN CHƯƠNG VI 6.7 6.1 6.2 6.3 6.4 6.5 6.6 Sai Sai Đúng Đúng Đúng Sai P { X = 0, X1 = 2, X = 1} = P { X = 0} P { X = X = 0} P { X = X = 0, X1 = 2} 164 (167) Hướng dẫn bài tập = P { X = 0} P { X = X = 0} P { X = X = 2} = 0,3 ⋅ 0,7 ⋅ 0,8 = 0,168 ⎡0, 47 0,13 0,40 ⎤ ⎢ ⎥ 6.8 a) P = 0,42 0,14 0,44 ⎢ ⎥ ⎢⎣ 0,26 0,17 0,57 ⎥⎦ { } b) P { X = X1 = 0} = P X = X = = 0,13 ; P{X = X = 0} = P{X = 1, X = X = 0} + P{X = 1, X = X = 0} + P{X = 1, X = X = 0} = P{X = X = 0}P{X = X = 0, X = 0} + P{X = X = 0}P{X = X = 0, X = 1}+ P{X = X = 0}P{X = X = 0, X = 2} = P{X = X = 0}P{X = X = 0} + P{X = X = 0}P{X = X = 1} + P{X = X = 0}P{X = X = 2} = 0,47 ⋅ 0,2 + 0,13 ⋅ 0,2 + 0,40 ⋅ 0,1 = 0,16 c) Phân bố dừng [x, y, z ] là nghiệm hệ phương trình ⎧[x y z ]P = [x y z ] ⎨ ⎩ x, y , z ≥ ; x + y + z = Như x, y, z là nghiệm không âm hệ phương trình ⎧− x + y + z = ⎪⎪ ⎨ 2x − y + z = ⎪ +y +z = ⎩⎪ x có nghiệm x = 6.9 Đặt 50 21 68 , y= ,z= 139 139 139 p0 = P { X = 0} a) P { X = 0, X = 0, X = 0} = P { X = 0} P { X = 0, X = X = 0} = P { X = 0} P { X1 = X = 0} P { X = X = 0, X1 = 0} = p0α ( ) b) P { X = 0, X = 0, X = 0} + P { X = 0, X1 = 1, X = 0} = p0 α + (1 − α ) c) P { X = X = 0} = 16(α − 1)5 + 40(α − 1) + 40(α − 1)3 + 20(α − 1) + 5(α − 1) + 6.10 Không gian trạng thái là E = {−1, 0,1, 2,3} 165 (168) Hướng dẫn bài tập ⎧⎪ P {ξ = − j} nÕu i ≤ 0, Theo công thức (6.21) ta có pij = P { X (n + 1) = j X (n) = i} = ⎨ ⎪⎩ P {ξ = i − j} nÕu < i ≤ p −1, −1 = P{ X (n + 1) = −1 X (n) = −1 } = P(φ) = , p−1,0 = P { X (n + 1) = X (n) = −1} = P(ξ = 3) = P(φ) = , p−1,1 = P { X (n + 1) = X (n) = −1} = P (ξ = 2) = 0,3 , p−1,2 = P { X (n + 1) = X (n) = −1} = P(ξ = 1) = 0,3 , p−1,3 = P { X (n + 1) = X (n) = −1} = P(ξ = 0) = 0, , Ma trận xác suất chuyển: 0,3 0,3 0, ⎤ ⎡ ⎢ 0 0,3 0,3 0, ⎥⎥ ⎢ P = ⎢0,3 0,3 0, 0 ⎥ ⎢ ⎥ ⎢ 0,3 0,3 0, ⎥ ⎢⎣ 0 0,3 0,3 0, ⎥⎦ 6.12 Các trạng thái có chu kỳ Có lớp liên thông là {0,1} , {2,3} , {4} 1/ 1/ 1/2 1/ 1/2 1/2 1/2 1/2 1/2 1/2 1/2 166 1/ (169) Phụ lục PHỤ LỤC PHỤ LỤC I: GIÁ TRỊ HÀM MẬT ĐỘ ϕ( x) = 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 0,3989 3970 3910 3814 3683 3521 3332 3123 2897 2661 0,2420 2179 1942 1714 1497 1295 1109 0940 0790 0656 0,0540 0440 0355 0283 0224 0175 0136 0104 0079 0060 0,0044 0033 0024 0017 0012 0009 0005 0004 0003 0002 3989 3965 3902 3802 3668 3503 3312 3101 2874 2637 2396 2155 1919 1691 1476 1276 1092 0925 0775 0644 0529 0431 0347 0277 0219 0171 0132 0101 0077 0058 0043 0032 0023 0017 0012 0008 0005 0004 0003 0002 3989 3961 3894 3790 3653 3485 3292 3079 2850 2613 2370 2131 1895 1669 1456 1257 1074 0909 0761 0632 0519 0422 0339 0270 0213 0167 0129 0099 0075 0056 0042 0031 0022 0016 0012 0008 0005 0004 0003 0002 3988 3956 3885 3778 3637 3467 3271 3056 2827 2589 2347 2107 1872 1647 1435 1238 1057 0893 0748 0620 0508 0413 0332 0264 0208 0163 0126 0096 0073 0055 0040 0030 0022 0016 0011 00080 0005 0004 0003 0002 3986 3951 3876 3765 3621 3448 3251 3034 2803 2565 2320 2083 1849 1626 1415 1219 1040 0878 0734 0608 0498 0404 0325 0258 0203 0158 0122 0093 0071 0053 0039 0029 0021 0015 0011 0008 0005 0004 0003 0002 167 3984 3945 3867 3752 3605 3429 3230 3011 2780 2541 2299 2059 1826 1604 1394 1200 1023 0863 0721 0596 0488 0396 0317 0252 0198 0154 0119 0091 0069 0051 0038 0028 0020 0015 0010 0007 0005 0004 0002 0002 2π e − 3982 3939 3857 3739 3589 3410 3209 2989 2756 2516 2275 2036 1804 1582 1374 1182 1006 0848 0707 0584 0478 0387 0310 0246 0194 0151 0116 0088 0067 0050 0037 0027 0020 0014 0010 0007 0005 0003 0002 0002 x2 3980 3932 3847 3726 3572 3391 3187 2966 2732 2492 2251 2012 1781 1561 1354 1163 0989 0833 0694 0573 0468 0379 0303 0241 0189 0147 0113 0086 000065 0048 0036 0026 0019 0014 0010 0007 0005 0003 0002 0002 3977 3925 3836 3712 3555 3372 3166 2943 2709 2468 2227 1989 1758 1539 1334 1145 0973 0818 0681 0562 0459 0371 0297 0235 0184 0143 0110 0084 0063 0047 0035 0025 0018 0013 0009 0007 0005 0003 0002 0001 3973 3918 3825 3697 3538 3352 3144 2920 2685 2444 2203 1965 1736 1518 1315 1127 0957 0804 0669 0551 0449 0363 0290 0229 0180 0139 0107 0081 0061 0046 0034 0025 0018 0013 0009 0006 0004 0003 0002 0001 (170) Phụ lục PHỤ LỤC II: GIÁ TRỊ HÀM PHÂN BỐ CHUẨN TẮC t ∫e 2π −∞ Φ (t ) = − 2π x2 dx Φ (t ) t t 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 0,5000 5398 5793 6179 6554 0,6915 7257 7580 7881 8159 0,8413 8643 8849 9032 9192 0,9332 9452 9554 9641 9712 0,9773 9821 9861 9893 9918 0,9938 9953 9965 9974 9981 5040 5438 5832 6217 6591 6950 7291 7611 7910 8186 8438 8665 8869 9049 9207 9345 9463 9564 9649 9719 9778 9826 9864 9896 9920 9940 9955 9966 9975 9982 5080 5478 5871 6255 6628 6985 7324 7642 7939 8212 8461 8686 8888 9066 9222 9357 9474 9573 9656 9726 9783 9830 9868 9898 9922 9941 9956 9967 9976 9982 5120 5517 5910 6293 6664 7019 7357 7673 7967 8238 8485 8708 8907 9082 9236 9370 9484 9582 9664 9732 9788 9834 9871 9901 9925 9943 9957 9968 9977 9983 5160 5557 5948 6331 6700 7054 7389 7703 7995 8264 8508 8729 8925 9099 9251 9382 9495 9591 9671 9738 9793 9838 9875 9904 9927 9945 9959 9969 9977 9984 5199 5596 5987 6368 6736 7088 7422 7734 8023 8289 8531 8749 8944 9115 9265 9394 9505 9599 9678 9744 9798 9842 9878 9906 9929 9946 9960 9970 9978 9984 5239 5636 6026 6406 6772 7123 7454 7764 8051 8315 8554 8770 8962 9131 9279 9406 9515 9608 9686 9750 9803 9846 9881 9909 9931 9948 9961 9971 9979 9985 5279 5675 6064 6443 6808 7156 7486 7794 8078 8340 8577 8790 8980 9147 9292 9418 9525 9616 9693 9756 9808 9850 9884 9911 9932 9949 9962 9972 9979 9985 5319 5714 6103 6480 6844 7190 7517 7823 8106 8365 8599 8810 8997 9162 9306 9429 9535 9625 9699 9761 9812 9854 9887 9913 9934 9951 9963 9973 9980 9986 5359 5753 6141 6517 6879 7224 7549 7852 8132 8389 8621 8830 9015 9177 9319 9441 9545 9633 9706 9767 9817 9857 9890 9916 9936 9952 9964 9974 9981 9986 t 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 Φ (t ) 0,9987 9990 9993 9995 9996 9997 9998 9999 9999 9999 168 (171) Phụ lục PHỤ LỤC III: GIÁ TRỊ TỚI HẠN CỦA PHÂN BỐ STUDENT α t α (n) Bậc tự α = 0,05 α = 0,025 α = 0,01 α = 0,005 α = 0,001 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 inf 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,796 1,703 1,701 1,699 1,645 12,706 4,303 3,128 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 1,960 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,606 2,583 2,567 2,552 2,539 2,58 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,326 63,657 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,576 318,309 22,327 10,215 7,173 5,893 5,208 4,705 4,501 4,297 4,144 4,025 3,930 3,852 3,787 3,733 3,686 3,646 3,610 3,579 3,552 3,527 3,505 3,485 3,467 3,450 3,435 3,421 3,408 3,396 3,090 169 (172) Phụ lục PHỤ LỤC IV: GIÁ TRỊ TỚI HẠN CỦA PHÂN BỐ KHI BÌNH PHƯƠNG χ2 α χ α2 (n) Bậc tự χ 02,995 χ 02,99 χ 02,97 χ 02,95 χ 02,05 χ 02,025 χ 02,01 χ 02,005 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0,000 0,010 0,072 0,207 0,412 0,676 0,989 1,344 1,735 2,156 2,603 3,074 3,565 4,075 5,001 5,142 5,697 6,265 6,844 7,343 8,034 8,543 9,260 9,886 10,520 11,160 11,808 12,461 13,121 13,787 0,000 0,020 0,115 0,297 0,554 0,872 1,239 1,646 2,088 2,558 3,053 3,571 4,107 4,660 5,229 5,812 6,408 7,015 7,633 8,260 8,897 9,542 10,196 10,856 11,524 12,198 12,879 13,565 14,256 14,930 0,001 0,051 0,216 0,484 0,831 1,237 1,690 2,180 2,700 3,247 3,816 4,404 5,009 5,629 6,262 6,908 7,564 8,231 8,907 9,591 10,283 10,982 11,689 12,401 13,120 13,844 14,573 15,308 16,047 16,791 0,004 0,103 0,352 0,711 1,145 1,635 2,167 2,733 3,325 3,940 4,575 5,226 5,982 6,571 7,261 7,962 8,672 9,390 10,117 10,851 11,591 12,388 13,091 13,848 14,611 15,379 16,151 16,928 17,708 18,493 3,841 5,991 7,815 9,488 11,070 12,592 14,067 15,507 16,919 18,307 19,675 21,026 22,362 23,685 24,996 26,296 27,587 28,869 30,144 31,410 32,671 33,924 35,172 36,415 37,625 38,885 40,113 41,337 42,557 43,773 5,024 7,378 9,348 11,143 12,832 14,449 16,013 17,535 19,023 20,483 21,920 23,337 24,736 26,119 27,488 28,845 30,191 31,524 32,852 34,170 35,479 36,781 38,076 39,364 40,646 41,923 43,194 44,461 45,722 46,979 6,635 9,210 11,345 13,277 15,086 16,812 18,475 20,090 21,666 23,209 24,725 26,217 27,688 29,141 30,578 32,000 33,409 34,805 36,191 37,566 38,932 30,289 41,638 42,980 44,314 45,642 46,993 48,278 49,588 50,892 7,879 10,597 12,838 14,860 16,750 18,548 20,278 21,955 23,589 25,188 26,757 28,300 28,819 31,319 32,801 34,267 35,718 37,156 38,582 39,997 41,401 42,796 44,181 45,558 46,928 48,290 46,645 50,993 52,336 53,672 170 (173) Tài liệu tham khảo TÀI LIỆU THAM KHẢO [1] Đặng Hùng Thắng, 1997 Mở đầu lý thuyết xác suất và các ứng dụng NXB GD [2] Đặng Hùng Thắng, Bài tập xác suất, NXB Giáo dục – 1998 [3] Đặng Hùng Thắng, Thống kê và ứng dụng, NXB Giáo dục,1999 [4] Nguyễn Cao Văn, Trần Thái Ninh và Nguyễn Thế Hệ, Bài tập lý thuyết xác suất và thống kê toán, NXB Giáo dục, Hà Nội 2002 [5] Nguyễn Phạm Anh Dũng, 1999 Các hàm và xác suất ứng dụng viễn thông Trung Tâm Đào Tạo Bưu Chính Viễn Thông [6] Nguyễn Duy Tiến, Vũ Việt Yên, 2000 Lý thuyết xác suất NXB GD [7] Nguyễn Duy Tiến (và tập thể), 2000 Các mô hình xác suất và ứng dụng, tập 1, 2, NXB Đại học Quốc gia Hà Nội [8] Tống Đình Quỳ, Hướng dẫn giải bài tập xác suất thống kê, NXB Đại Học Quốc Gia Hà Nội, 2004 [9] Trần Mạnh Tuấn, Xác suất và Thống kê, lý thuyết và thực hành tính toán, NXB Đại Học Quốc Gia Hà Nội, 2004 [10] B.V Gnedenko, The theory of probability, Mir publishers, Moscow 1976 [11] D L (Paul) Minh, Applied Probability Models, Duxbury, Thomson Learning, 2001 [12] J L Doob, 1953 Stochastic Processes Willey and Sons, New York [13] S Karlin, 1966 A first Course in Stochastic Processes Academic Press, New York and London [14] M Loeve, 1977 Probability Theory, I, II 4th ed, Springer - Verlag, Berlin and New York 171 (174) Mục lục MỤC LỤC LỜI NÓI ĐẦU CHƯƠNG I: CÁC KHÁI NIỆM CƠ BẢN VỀ XÁC SUẤT GIỚI THIỆU NỘI DUNG 1.1 PHÉP THỬ VÀ BIẾN CỐ 1.2 ĐỊNH NGHĨA XÁC SUẤT VÀ CÁC TÍNH CHẤT 1.3 XÁC SUẤT CÓ ĐIỀU KIỆN 12 1.4 DÃY PHÉP THỬ BERNOULLI 15 TÓM TẮT 17 CÂU HỎI ÔN TẬP VÀ BÀI TẬP 20 CHƯƠNG II: BIẾN NGẪU NHIÊN VÀ CÁC ĐẶC TRƯNG CỦA CHÚNG 23 PHẦN GIỚI THIỆU 23 NỘI DUNG 24 2.1 BIẾN NGẪU NHIÊN 24 2.2 BIẾN NGẪU NHIÊN RỜI RẠC 25 2.3 BIẾN NGẪU NHIÊN LIÊN TỤC 29 2.4 CÁC THAM SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN 38 2.5 HÀM ĐẶC TRƯNG 46 TÓM TẮT 47 CÂU HỎI ÔN TẬP VÀ BÀI TẬP 49 CHƯƠNG III: VÉC TƠ NGẪU NHIÊN 54 GIỚI THIỆU 54 NỘI DUNG 55 3.1 KHÁI NIỆM VÉC TƠ NGẪU NHIÊN 55 3.2 BẢNG PHÂN BỐ XÁC SUẤT CỦA VÉC TƠ NGẪU NHIÊN RỜI RẠC HAI CHIỀU 56 3.3 VÉC TƠ NGẪU NHIÊN LIÊN TỤC 60 3.4 TÍNH ĐỘC LẬP CỦA CÁC BIẾN NGẪU NHIÊN 61 3.5 HÀM CỦA CÁC BIẾN NGẪU NHIÊN 62 3.6 CÁC THAM SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN 66 3.7 PHÂN BỐ CÓ ĐIỀU KIỆN VÀ KỲ VỌNG CÓ ĐIỀU KIỆN 68 3.8 PHÂN BỐ CHUẨN NHIỀU CHIỀU 72 TÓM TẮT 73 CÂU HỎI ÔN TẬP VÀ BÀI TẬP 76 CHƯƠNG IV: LUẬT SỐ LỚN VÀ ĐỊNH LÝ GIỚI HẠN 81 172 (175) Mục lục GIỚI THIỆU 81 NỘI DUNG 81 4.1 CÁC DẠNG HỘI TỤ CỦA DÃY CÁC BIẾN NGẪU NHIÊN 81 4.2 LUẬT SỐ LỚN 82 4.3 ĐỊNH LÝ GIỚI HẠN TRUNG TÂM 85 4.4 XẤP XỈ PHÂN BỐ NHỊ THỨC 86 TÓM TẮT 88 CÂU HỎI ÔN TẬP VÀ BÀI TẬP 89 CHƯƠNG V: THỐNG KÊ TOÁN HỌC 92 GIỚI THIỆU 92 NỘI DUNG 93 5.1 LÝ THUYẾT MẪU 93 5.2 LÝ THUYẾT ƯỚC LƯỢNG 103 5.3 KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 111 TÓM TẮT 119 CÂU HỎI ÔN TẬP VÀ BÀI TẬP 124 CHƯƠNG VI: QUÁ TRÌNH NGẪU NHIÊN CHUỖI MARKOV 128 GIỚI THIỆU 128 NỘI DUNG 129 6.1 KHÁI NIỆM VÀ PHÂN LOẠI QUÁ TRÌNH NGẪU NHIÊN 129 6.2 CHUỖI MARKOV 131 6.3 PHÂN LOẠI TRẠNG THÁI CHUỖI MARKOV 138 CÂU HỎI ÔN TẬP VÀ BÀI TẬP 146 HƯỚNG DẪN GIẢI BÀI TẬP 149 ĐÁP ÁN CHƯƠNG I 149 ĐÁP ÁN CHƯƠNG II 151 ĐÁP ÁN CHƯƠNG III 156 ĐÁP ÁN CHƯƠNG IV 159 ĐÁP ÁN CHƯƠNG V 161 ĐÁP ÁN CHƯƠNG VI 164 PHỤ LỤC 167 PHỤ LỤC I: GIÁ TRỊ HÀM MẬT ĐỘ ϕ( x ) = 2π e − x2 167 PHỤ LỤC II: GIÁ TRỊ HÀM PHÂN BỐ CHUẨN TẮC 168 PHỤ LỤC III: GIÁ TRỊ TỚI HẠN CỦA PHÂN BỐ STUDENT 169 173 (176) Mục lục PHỤ LỤC IV: GIÁ TRỊ TỚI HẠN CỦA PHÂN BỐ KHI BÌNH PHƯƠNG χ 170 TÀI LIỆU THAM KHẢO 171 MỤC LỤC 172 174 (177) XÁC SUẤT THỐNG KÊ Mã số : 491XSU210 Chịu trách nhiệm thảo TRUNG TÂM ÐÀO TẠO BƯU CHÍNH VIỄN THÔNG (178)