XÁC SUẤT
Không gian mẫu và biến cố
Trong thực tế, có nhiều thí nghiệm có thể được lặp lại nhiều lần trong cùng một điều kiện, nhưng kết quả của chúng vẫn không thể dự đoán chính xác Những thí nghiệm này được gọi là phép thử ngẫu nhiên.
- Gieo một con xúc xắc.
- Hỏi tháng sinh của một sinh viên được chọn ngẫu nhiên.
Đo chiều cao của một sinh viên được chọn ngẫu nhiên là một phép thử, trong đó kết quả thu được hoàn toàn ngẫu nhiên Định nghĩa này nhấn mạnh rằng, ngay cả khi thí nghiệm được lặp lại nhiều lần trong cùng một điều kiện, kết quả vẫn có thể khác nhau.
1.1.2 Không gian mẫu. Định nghĩa 1.3 Tập tất cả các kết quả có thể xảy ra của một phép thử được gọi là không gian mẫu Kí hiệu không gian mẫu là Ω.
Khi tung một đồng xu, có hai kết quả có thể xảy ra: mặt sấp (S) hoặc mặt ngửa (N) Do đó, không gian mẫu trong trường hợp này được xác định là Ω = {S; N}.
Ví dụ 1.5 Hỏi tháng sinh của một sinh viên được chọn ngẫu nhiên trong lớp học Ta có không gian mẫu:
Khi gieo đồng thời hai con xúc xắc, không gian mẫu sẽ bao gồm tất cả các kết quả có thể từ số chấm xuất hiện trên hai mặt của chúng.
Ví dụ 1.7 Đo chiều cao của một sinh viên được chọn ngẫu nhiên trong lớp học (đơn vị: mét) Ta có không gian mẫu:
1.1.3 Biến cố. Định nghĩa 1.8 Mỗi tập con của không gian mẫu được gọi làbiến cố Biến cố chỉ có
1 phần tử được gọi là biến cố sơ cấp, biến cố rỗng (∅) gọi là biến cố không thể, không gian mẫu (Ω) gọi là biến cố chắc chắn.
Một biến cố xảy ra khi thực hiện phép thử nếu kết quả của thực hiện phép thử rơi vào biến cố đó.
Ví dụ 1.9 Cho không gian mẫu tuổi thọ (năm) của một thiết bị điện tử là Ω ={x∈
R : x ≥ 0} Biến cố thiết bị điện tử bị hỏng trước 5 năm là A ={x∈R : 0 ≤ x < 5}.
Ví dụ 1.10 Hỏi tháng sinh của một sinh viên được chọn ngẫu nhiên trong lớp học.
- Biến cố sinh viên sinh vào tháng chẵn là
- Biến cố sinh viên có tháng sinh 32 ngày là ∅.
- Biến cố sinh viên có tháng sinh bé hơn 32 ngày là Ω.
Các phép toán trên biến cố
Cho A và B là hai biến cố của không gian mẫu Ω. a) Phép giao
A∩B (hoặc kí hiệu là: A.B hay đơn giản là AB), là biến cố xảy ra khi và chỉ khi đồng thời hai biến cố A và B cùng xảy ra.
Nếu hai biến cố A và B không thể đồng thời xảy ra (A∩B = ∅) thì ta nói A và B xung khắc.
A∪B, là biến cố xảy ra khi và chỉ khi có ít nhất một trong hai biến cố A, B xảy ra.
A∪B ={ω ∈Ω :ω ∈A hoặcω ∈B}. c) Phép lấy phần bù
Biến cố A = Ω\A được gọi là biến cố đối của A Nếu A xảy ra thì A không xảy ra và ngược lại.
Biểu đồ Ven minh họa biến cố giao, biến cố hợp và biến cố đối.
Ví dụ 1.11 Tung một con xúc xắc cân đối đồng chất, khi đó có thể xuất hiện mặt 1chấm, 2 chấm, 3 chấm, , 6 chấm.
+ biến cố A ={số chấm của mặt xuất hiện bé hơn 4}={1; 2; 3};
+ biến cố B ={xuất hiện mặt chẵn}={2; 4; 6}.
Ví dụ 1.12 Đo chiều cao một sinh viên được chọn ngẫu nhiên trong lớp học (đơn vị: mét)
Trong ví dụ 1.13, hai xạ thủ cùng nhắm vào một mục tiêu, với A là biến cố xạ thủ 1 bắn trúng và B là biến cố xạ thủ 2 bắn trúng Các biến cố có thể được biểu diễn như sau: a) Xạ thủ 1 không bắn trúng mục tiêu được biểu thị bằng ¬A b) Cả hai xạ thủ bắn trúng mục tiêu là A ∩ B c) Có ít nhất một xạ thủ bắn trúng mục tiêu là A ∪ B d) Có đúng một xạ thủ bắn trúng mục tiêu là (A ∩ ¬B) ∪ (¬A ∩ B) e) Không có xạ thủ nào bắn trúng mục tiêu được thể hiện bằng ¬A ∩ ¬B.
Xác suất của biến cố
1.2.1 Hệ tiên đề xác suất
Trong một phép thử, không gian mẫu được ký hiệu là Ω Để đánh giá khả năng xảy ra của một biến cố, chúng ta sẽ gán cho mỗi biến cố A thuộc Ω một xác suất P(A) tuân thủ ba tiên đề cơ bản.
Tiên đề 1: 0≤P(A)≤1 với mọi biến cố A.
Tiên đề 3: nếuA 1 , A 2 , , A n , là một dãy các biến cố đôi một xung khắc nhau thì
Khi đó P(A) được gọi là xác suất của biến cố A.
Ví dụ 1.14 Tung một đồng xu Giả sử khả năng xuất hiện mặt sấp (S) và mặt ngửa (N) là như nhau trong mỗi lần tung, tức là
Mặt khác, do không gian mẫu Ω = {S, N}={S} ∪ {N} nên
Ví dụ 1.15 Gieo một con xúc xắc Giả sử rằng 6 mặt của xúc xắc có khả năng xuất hiện như nhau trong mỗi lần gieo Khi đó ta có
Vì vậy xác suất xuất hiện mặt chẵn sẽ là
1.2.2 Một số tính chất cơ bản của xác suất
Chứng minh Từ Tiên đề 3 lấy A 1 = Ω, A n =∅ với mọi n ≥2 ta được
Chứng minh Vì Ω =A∪A và A∩A=∅ nên
Chứng minh Vì A⊂B nên B =A∪AB do đó
Tính chất 1.4 Với A và B là hai biến cố bất kì,
Chứng minh Áp dụng Tiên đề 3 ta có các đẳng thức sau
Cộng vế với vế hai đẳng thức (1.1) và (1.2) sau đó trừ vế với vế đẳng thức (1.3) ta được điều phải chứng minh.
Sử dụng tính chất trên ta chứng minh được tính chất sau cho ba biến cố.
Tính chất 1.5 Với A, B và C là hai biến cố bất kì,
1.2.3 Không gian mẫu gồm các biến cố sơ cấp đồng khả năng
Cho không gian mẫu Ω gồm N biến cố sơ cấp có khả năng xảy ra bằng nhau, tức là
Khi đó, theo Tiên đề 2 ta có
Kết hợp Tiên đề 3 ta có: với A là một biến cố bất kì của Ω
|Ω|, trong đó |A| là số phần tử của A.
Trong một hộp chứa 4 viên bi xanh, 5 viên bi đỏ và 6 viên bi vàng, với các viên bi đồng chất và giống nhau về kích thước cũng như khối lượng, ta tiến hành lấy ngẫu nhiên 5 viên bi Ta cần tính xác suất cho các biến cố sau: a) Biến cố A: lấy được 1 bi xanh, 2 bi đỏ và 2 bi vàng; b) Biến cố B: lấy được 3 bi xanh; c) Biến cố C: lấy được ít nhất 4 bi đỏ; d) Biến cố D: lấy được ít nhất 1 bi vàng.
Đại số tổ hợp
Nếu một công việc được thực hiện qua k bước.
Bước 1 có n1 cách thực hiện,
Bước 2 có n2 cách thực hiện,
Bước k có n k cách thực hiện.
Khi đó, có n 1 ×n 2 × ×n k cách thực hiện công việc đó.
Số cách sắp xếp n phần tử vào n vị trí sao cho mỗi vị trí có đúng 1 phần tử là n!.
Số tập con k phần tử của một tập n phần tử là
Trong một lớp học có 17 sinh viên nam và 13 sinh viên nữ, có thể chọn ngẫu nhiên 3 người theo nhiều cách khác nhau Cụ thể, số cách chọn 3 sinh viên từ tổng số 30 sinh viên là một phép toán kết hợp Nếu yêu cầu chọn 2 nam và 1 nữ, ta cũng có thể tính số cách thực hiện theo công thức kết hợp cho từng nhóm.
Số cách lấy ra k phần tử từ tập n phần tử rồi sắp xếp theo một thứ tự nào đó là
Xác suất có điều kiện
Trong một lớp học môn Triết học có 30 sinh viên, bao gồm 17 nam và 13 nữ, có 12 sinh viên nam và 11 sinh viên nữ đã thi đỗ.
Chọn ngẫu nhiên một sinh viên, xác suất sinh viên đó thi qua môn Triết học là 23/30.
Nhưng nếu chọn ngẫu nhiên một sinh viên nam thì xác suất sinh viên đó thi qua môn Triết học sẽ là 12/17.
Rõ ràng 2 xác suất trên không bằng nhau Để phân biệt 2 xác suất trên ta kí hiệu
Xác suất của biến cố A, tức là sinh viên thi qua môn Triết học, với điều kiện B, là sinh viên nam, được tính bằng P(A|B)/17.
P(B) Định nghĩa 1.18 Cho hai biến cố A và B với P(B) 6= 0, xác suất của A với điều kiện B đã xảy ra, kí hiệu P(A|B), xác định bởi
Ví dụ 1.19 Một hộp đựng 20 bóng đèn tốt, 7 bóng đèn sẽ hỏng sau 1 giờ sử dụng và
3 bóng đèn hỏng Lấy ngẫu nhiên một chiếc sử dụng thấy rằng nó không phải là bóng đèn hỏng Tính xác suất đó là chiếc bóng đèn tốt.
Giải Gọi A là biến cố lấy được bóng đèn tốt, B là biến cố lấy được bóng đèn không phải là bóng đèn hỏng.
Trong một khu vực dân cư, tỷ lệ người hút thuốc là 60%, trong khi tỷ lệ người vừa hút thuốc vừa mắc viêm phổi là 35% Khi chọn ngẫu nhiên một người trong khu vực này và thấy người đó hút thuốc, cần tính xác suất để người đó bị viêm phổi.
Giải Gọi A là biến cố người được chọn hút thuốc, B là biến cố người được chọn bị viêm phổi Xác suất để người này bị viêm phổi là:
3) Nếu A1 và A2 xung khắc thì
Công thức nhân xác suất
Định lý 1.21 Cho A1, A2, , An là các biến có của không gian mẫu Ω thỏa mãn
Trong một hộp có 4 chiếc bút mới và 6 chiếc bút cũ, mỗi ngày người dùng ngẫu nhiên lấy ra một chiếc bút để sử dụng và sau đó trả lại Câu hỏi đặt ra là tính xác suất rằng sau 3 ngày sử dụng, hộp còn lại đúng 1 bút mới, và sau 2 ngày sử dụng, hộp còn lại đúng 3 bút mới.
Giải Kí hiệu A k là biến cố ngày thứ k lấy được bút mới. a) P(A 1 A 2 A 3 ) =P(A 1 )P(A 2 |A 1 )P(A 3 |A 1 A 2 ) = 4
Trong một trường đại học, có 40% sinh viên học tiếng Anh và 30% học tiếng Pháp Trong số sinh viên học tiếng Anh, 55% cũng học tiếng Pháp Khi chọn ngẫu nhiên một sinh viên biết rằng họ học tiếng Pháp, ta cần tính xác suất để sinh viên đó cũng học tiếng Anh.
Giải Gọi A là biến cố chọn được sinh viên biết tiếng Anh, B là biến cố chọn được sinh viên biết tiếng Pháp.
Các biến cố độc lập
Hai biến cố A và B được coi là độc lập khi sự xảy ra hoặc không xảy ra của một biến cố không ảnh hưởng đến xác suất xảy ra của biến cố kia.
Từ đó ta định nghĩa hai biến cố độc lập như sau. Định nghĩa 1.24 Hai biến cố A vàB được gọi là độc lập nếu
Trong lý thuyết xác suất, một tập hợp hữu hạn các biến cố T = {A1, A2, , An} (với n ≥ 2) được coi là độc lập nếu đối với mọi k (2 ≤ k ≤ n), bất kỳ biến cố nào An1, An2, , An k trong T đều thỏa mãn tính độc lập.
Trường hợp n = 3, ba biến cố A,B,C độc lập khi và chỉ khi thỏa mãn 4 đẳng thức sau:
P(ABC) = P(A)P(B)P(C). Định lý 1.26 Nếu A và B độc lập thì A và B,A và B, A và B là những cặp biến cố độc lập.
Trong ví dụ 1.27, hộp I chứa 3 bi đỏ và 7 bi xanh, trong khi hộp II có 6 bi đỏ và 4 bi xanh Khi lấy ngẫu nhiên một viên bi từ mỗi hộp, xác suất để lấy được hai viên bi cùng màu đỏ là một trong những bài toán xác suất thú vị Ngoài ra, xác suất để lấy được một bi xanh và một bi đỏ cũng là một trường hợp đáng chú ý trong việc phân tích xác suất.
Trong bài toán xác suất, chúng ta định nghĩa biến cố A là việc lấy được viên bi màu đỏ từ hộp I và biến cố B là việc lấy được viên bi màu đỏ từ hộp II Hai biến cố A và B được coi là độc lập Do đó, xác suất của cả hai biến cố xảy ra đồng thời được tính bằng tích của xác suất của từng biến cố: P(AB) = P(A) * P(B) = 3.
Công thức xác suất toàn phần và công thức Bayes
1.7.1 Hệ đầy đủ Định nghĩa 1.28 Một hệ gồm n biến cố E 1 , E 2 , , E n được gọi là hệ đầy đủ nếu thỏa mãn hai điều kiện
(i) E i ∩E j =∅ nếu i6=j (các biến cố đôi một xung khắc);
(ii) E1∪E2∪ .∪En = Ω (chắc chắn có 1 biến cố xảy ra).
Từ định nghĩa hệ đầy đủ ta suy ra: nếu E 1 , E 2 , , E n là hệ đầy đủ thì
Ví dụ 1.29 Hỏi tháng sinh của một sinh viên được chọn ngẫu nhiên Kí hiệu
E 1 là biến cố sinh viên được hỏi sinh vào quý 1 (gồm các tháng 1,2,3);
E 2 là biến cố sinh viên được hỏi sinh vào quý 2 (gồm các tháng 4,5,6);
E3 là biến cố sinh viên được hỏi sinh vào quý 3 (gồm các tháng 7,8,9);
E4 là biến cố sinh viên được hỏi sinh vào quý 4 (gồm các tháng 10,11,12);
Khi đó E 1 , E 2 , E 3 , E 4 là hệ đầy đủ.
Ví dụ 1.30 Một hộp đựng 5 bi xanh, 6 bi đỏ và 7 bi vàng Lấy ngẫu nhiên 2 viên bi. Hãy chỉ ra một số hệ đầy đủ.
1.7.2 Công thức xác suất toàn phần và công thức Bayes Định lý 1.31 Giả sử {Ei; 1≤i≤n} là một hệ đầy đủ sao cho P(Ei)>0, A là biến cố bất kì Khi đó
2)Nếu thêm điều kiện P(A)>0 thì
Hộp I chứa 4 bi xanh, 3 bi đỏ và 2 bi vàng, trong khi hộp II có 5 bi xanh, 2 bi đỏ và 3 bi vàng Sau khi ngẫu nhiên lấy một viên bi từ hộp I và cho vào hộp II, ta sẽ lấy ngẫu nhiên hai viên bi từ hộp II Cần tính xác suất để hai viên bi lấy ra ở lần thứ hai có màu sắc nhất định.
Giải Gọi E là biến cố viên bi lấy từ hộp I bỏ vào hộp II là bi xanh, A là biến cố 2 viên bi lấy lần 2 là 2 viên bi xanh.
Trong một nhà máy có ba phân xưởng sản xuất, phân xưởng I chiếm 50% sản phẩm, phân xưởng II chiếm 30%, và phân xưởng III chiếm 20% Tỷ lệ phế phẩm từ phân xưởng I là 2%, từ phân xưởng II là 1%, và từ phân xưởng III là 3% Khi lấy ngẫu nhiên một sản phẩm, cần tính xác suất để sản phẩm đó là phế phẩm Nếu sản phẩm được lấy ra là chính phẩm, cần xác định xác suất để sản phẩm đó được sản xuất từ phân xưởng I.
Gọi E1, E2, E3 lần lượt là các biến cố sản phẩm được lấy ra từ phân xưởng I, II và III, tạo thành một hệ đầy đủ Đặt A là biến cố sản phẩm được lấy ra là phế phẩm Theo công thức xác suất toàn phần, chúng ta có thể tính toán xác suất của biến cố A dựa trên các biến cố E1, E2 và E3.
Một công ty sử dụng hai máy để sản xuất cùng một loại sản phẩm, với tỷ lệ phế phẩm của máy I là 3% và máy II là 2% Máy I sản xuất 2/3 tổng sản phẩm, trong khi máy II sản xuất 1/3 Để tính tỷ lệ phế phẩm chung của công ty, ta cần xem xét tỷ lệ sản phẩm và tỷ lệ phế phẩm từ từng máy.
Giải Chọn ngẫu nhiên 1 sản phẩm Kí hiệuE là biến cố chọn được sản phẩm của nhà máy I, A là biến cố chọn được phế phẩm.
Vậy tỉ lệ phế phẩm của công ty là 2,7%.
Công thức Bernoulli
Định lý 1.35 Cho Ω là không gian mẫu của một phép thử và A là một biến cố thỏa mãn P(A) =p∈(0; 1).
Thực hiện phép thử n lần độc lập, xác suất có đúng k lần xuất hiện biến cố A là pn(k) =C n k p k (1−p) n−k
Trong ví dụ 1.36, khi tung một con xúc xắc cân đối đồng chất 10 lần, chúng ta cần tính xác suất cho các trường hợp sau: a) xác suất xuất hiện đúng 6 lần mặt một chấm; b) xác suất xuất hiện ít nhất 9 lần mặt một chấm; c) xác suất xuất hiện ít nhất 1 lần mặt một chấm.
Giải GọiAlà biến cố xuất hiện mặt một chấm ở mỗi lần tung xúc xắc,p=P(A) = 1/6. a) p 10 (6) =C 10 6 (1
6) 10 ≈0,84. Định lý 1.37 Cho n ∈Z, n ≥1 và p∈(0; 1) Hàm số p n (k) = C n k p k (1−p) n−1 với k∈ {0,1,2 , n} đạt giá trị lớn nhất tại k [(n+ 1)p] nếu (n+ 1)p6∈Z (n+ 1)p−1 và (n+ 1)p nếu (n+ 1)p∈Z
Xạ thủ có xác suất bắn trúng mục tiêu là 0,6 Khi xạ thủ này thực hiện 20 phát bắn độc lập, ta cần xác định số lần bắn trúng mục tiêu có xác suất xảy ra lớn nhất.
Giải (n+ 1)p= 21.0,6 = 12,66∈Z nên số lần bắn trúng mục tiêu có xác suất lớn nhất là k = 12.
Nội dung trọng tâm Chương 1
1 Hệ tiên đề xác suất.
Tiên đề 1: 0≤P(A)≤1 với mọi biến cố A.
Tiên đề 3: nếu A 1 , A 2 , , A n , là một dãy các biến cố đôi một xung khắc nhau thì
2 Các tính chất cơ bản. i) P(∅) = 0. ii)P(A) +P(A) = 1. iii) Nếu A⊂B thì P(A)≤P(B). iv) Với A vàB là hai biến cố bất kì,
3 Không gian mẫu gồm các biến cố sơ cấp đồng khả năng.
4 Xác suất có điều kiện.
5 Công thức nhân xác suất.
Hai biến cố A và B độc lập nếu P(A∩B) = P(A)P(B).
7 Công thức xác suất toàn phần và công thức Bayes.
Giả sử {E i ; 1≤i≤n} là một hệ đầy đủ sao cho P(E i )>0,A là biến cố bất kì Khi đó i) P(A) = P(E 1 )P(A|E 1 ) +P(E 2 )P(A|E 2 ) + +P(E n )P(A|E n ). ii)Nếu thêm điều kiện P(A)>0 thì
Cho Ω là không gian mẫu của một phép thử và A là một biến cố với xác suất P(A) nằm trong khoảng p∈(0; 1) Khi thực hiện phép thử n lần độc lập, xác suất để biến cố A xuất hiện đúng k lần được tính toán dựa trên các quy tắc xác suất.
1.1 Gieo đồng thời 2 con xúc xắc Tính xác suất để: a) tổng số chấm xuất hiện trên 2 con là 7. b) tổng số chấm xuất hiện trên 2 con hơn kém nhau 2.
Trong một khách sạn có 6 phòng đơn, có 10 khách đến thuê, bao gồm 6 nam và 4 nữ Người quản lý sẽ chọn 6 khách từ số này Ta cần tính xác suất cho các trường hợp sau: a) Tất cả 6 người được chọn đều là nam; b) Có 4 nam và 2 nữ; c) Có ít nhất 2 nữ; d) Có ít nhất 1 nữ.
1.3 Một hộp đựng 6 quả cầu trắng, 4 quả cầu đỏ và 2 quả cầu đen Chọn ngẫu nhiên 6 quả cầu Tìm xác suất để chọn được 3 quả trắng, 2 đỏ và 1 đen.
Trong một bộ thẻ đánh số từ 1 đến 30, có tổng cộng 30 tấm thẻ Khi chọn ngẫu nhiên 10 tấm thẻ, xác suất để tất cả 10 tấm đều mang số chẵn là một yếu tố quan trọng cần xem xét Ngoài ra, xác suất để có đúng 5 tấm thẻ mang số chia hết cho 3 cũng là một phần không thể thiếu trong bài toán xác suất này.
Trong một quốc gia có 50 tỉnh, mỗi tỉnh cử 2 đại biểu Quốc hội, tổng số đại biểu là 100 Khi chọn ngẫu nhiên 50 đại biểu để thành lập một ủy ban, xác suất để trong ủy ban có ít nhất 1 đại biểu từ thủ đô là một vấn đề cần được tính toán Đồng thời, việc tính xác suất để mỗi tỉnh đều có đúng 1 đại biểu trong ủy ban cũng là một bài toán thú vị.
Để tính xác suất để có được một số chẵn từ các chữ số 1, 2, 3, 4, 5, 6, 7, 8 và 9, trước tiên, ta viết các chữ số này lên các tấm phiếu và sắp xếp chúng ngẫu nhiên Xác suất để có một số chẵn có thể được tính bằng cách xác định số lượng chữ số chẵn trong tập hợp Ngoài ra, khi chọn ngẫu nhiên 4 tấm phiếu từ 9 tấm và sắp xếp chúng thành hàng, xác suất để có ít nhất một số chẵn cũng cần được tính toán, dựa trên các trường hợp có thể xảy ra.
1.7 Bộ bài có 52 lá, trong đó có 4 lá Át Lấy ngẫu nhiên 3 lá Tính xác suất có: a) 1 lá Át. b) 2 lá Át. c) có ít nhất 1 lá Át.
1.8 Một bình có 10 bi, trong đó có 3 bi đỏ, 4 bi xanh, 3 bi đen Lấy ngẫu nhiên 4 viên Tính xác suất để có: a) 2 bi xanh. b) 1 xanh, 1 đỏ, 2 đen.
1.9 Có 15 sản phẩm, trong đó có 3 phế phẩm, được bỏ ngẫu nhiên vào 3 cái hộp I,
II, III, mỗi hộp 5 sản phẩm Tính xác suất: a) Ở hộp thứ I chỉ có 1 phế phẩm. b) Các hộp đều có phế phẩm. c) Các phế phẩm đều ở hộp thứ III.
Một cửa hàng đồ điện nhập một lô bóng đèn điện, mỗi hộp chứa 12 chiếc Chủ cửa hàng kiểm tra chất lượng bằng cách chọn ngẫu nhiên 3 bóng để thử nghiệm Nếu cả 3 bóng đều tốt, hộp bóng điện sẽ được chấp nhận Để tính xác suất chấp nhận một hộp bóng điện có 4 bóng hỏng, cần xem xét số lượng bóng tốt và hỏng trong hộp.
Trong đề cương ôn tập môn học, có 10 câu hỏi lý thuyết và 30 bài tập, với mỗi đề thi bao gồm 1 câu hỏi lý thuyết và 3 bài tập được chọn ngẫu nhiên Học sinh A đã học 4 câu lý thuyết và 12 bài tập Khi thi, học sinh A chọn ngẫu nhiên 1 đề thi từ các đề thi có sẵn Để tính xác suất, ta cần xác định khả năng học sinh A không trả lời được câu lý thuyết, chỉ trả lời được 2 câu bài tập, và đạt yêu cầu, trong đó yêu cầu đạt là phải trả lời đúng câu hỏi lý thuyết và ít nhất 2 bài tập.
Để tính xác suất cho một vé xổ số 5 chữ số từ 0 đến 9, ta xem xét các trường hợp sau: a) Xác suất vé không có chữ số 1 là 0.8^5, tương đương với 32% b) Xác suất vé không có chữ số 2 cũng là 0.8^5, tức là 32% c) Xác suất vé không có chữ số 1 hoặc không có chữ số 2 có thể tính bằng công thức xác suất hợp: P(A ∪ B) = P(A) + P(B) - P(A ∩ B), dẫn đến kết quả là 0.64 + 0.64 - 0.64^2, tương đương khoảng 62.72%.
1.13 Xếp ngẫu nhiên 5 người A, B, C, D và E vào một cái bàn dài có 5 chỗ ngồi, tính xác suất: a) A và B đầu bàn. b) A và B cạnh nhau.
Trong bài toán xác suất này, một máy bay có ba bộ phận A, B, C với tầm quan trọng khác nhau, trong đó A chiếm 15%, B chiếm 30% và C chiếm 55% diện tích máy bay Máy bay sẽ rơi nếu bị trúng một viên đạn vào bộ phận A, hai viên đạn vào B hoặc ba viên đạn vào C Khi bắn 3 phát vào máy bay, xác suất để máy bay rơi sẽ được tính như sau: a) Nếu máy bay bị trúng 2 viên đạn, xác suất rơi phụ thuộc vào sự phân bố của các viên đạn trúng vào các bộ phận b) Nếu máy bay bị trúng 3 viên đạn, xác suất rơi sẽ cao hơn do các điều kiện rơi đã được thỏa mãn.
Một công ty sử dụng hai hình thức quảng cáo là quảng cáo trên đài phát thanh và quảng cáo trên tivi Trong đó, 25% khách hàng biết thông tin qua tivi, 34% biết qua đài phát thanh, và 10% biết qua cả hai hình thức Để tính xác suất một khách hàng ngẫu nhiên biết thông tin quảng cáo của công ty, ta cần tổng hợp các tỷ lệ này.
Trong một lớp sinh viên, 50% học tiếng Anh, 40% học tiếng Pháp, và 30% học tiếng Đức Có 20% sinh viên học cả tiếng Anh và tiếng Pháp, 15% học cả tiếng Pháp và tiếng Đức, và 10% học cả tiếng Anh và tiếng Đức Đặc biệt, 5% sinh viên học cả ba thứ tiếng Khi chọn ngẫu nhiên một sinh viên, xác suất để sinh viên đó học ít nhất một trong ba ngoại ngữ là 85% Xác suất để sinh viên đó chỉ học tiếng Anh và tiếng Đức là 5% Nếu biết rằng sinh viên đó học tiếng Anh, xác suất để sinh viên đó cũng học tiếng Pháp là 40%.
Một công ty đang đầu tư vào hai dự án A và B, với xác suất thua lỗ cho dự án A là 0,1 và cho dự án B là 0,2 Xác suất thua lỗ cả hai dự án cùng một lúc là 0,05 Để tính xác suất công ty có đúng một dự án bị thua lỗ, ta cần xem xét các khả năng xảy ra riêng biệt cho từng dự án.
Một sinh viên phải thi hai môn triết học và toán với xác suất qua môn triết là 0,6 và môn toán là 0,7 Nếu sinh viên đã qua môn triết, xác suất để qua môn toán là 0,8 Cần tính các xác suất: a) xác suất qua cả hai môn; b) xác suất qua ít nhất một môn; c) xác suất qua đúng một môn; d) xác suất qua môn toán biết rằng sinh viên đã không qua môn triết.
BIẾN NGẪU NHIÊN
Biến ngẫu nhiên
Biến ngẫu nhiên là quy tắc X liên kết mỗi biến cố sơ cấp ω trong không gian mẫu Ω với một số thực duy nhất, ký hiệu là X(ω) Tập hợp tất cả các giá trị mà X có thể nhận được được gọi là miền giá trị của X, ký hiệu là X(Ω).
Quy tắc X được gọi là biến ngẫu nhiên vì mỗi lần thực hiện phép thử, ta nhận được kết quả là một biến cố sơ cấp ω ngẫu nhiên Do đó, giá trị X(ω) sẽ là một số thực ngẫu nhiên.
Ví dụ 2.2 Tung đồng thời 2 con xúc xắc Gọi X là tổng số chấm trên mặt xuất hiện của hai con xúc xắc.
Ta có không gian mẫu Ω ={(m;n) :m = 1,2, ,6;n= 1, ,6}.
Khi đó X xác định bởiX((m, n)) =m+n.
Miền giá trị củaX là X(Ω) ={2,3, ,12}.
Ví dụ 2.3 Tung một đồng xu cho đến khi nào xuất hiện mặt sấp thì dừng lại Gọi
Kí hiệu hai mặt sấp và ngửa của đồng xu là S và N Ta có không gian mẫu
Ví dụ 2.4 Chọn ngẫu nhiên một sinh viên của trường đại học A, gọi X là chiều cao của sinh viên đó.
Ta có không gian mẫu Ω ={toàn bộ sinh viên của đại học A}.
Khi đó với mỗi sv∈Ω, X(sv) = chiều cao của sv. Để cho gọn trong trình bày, ta kí hiệu
Hai loại biến ngẫu nhiên
2.2.1 Biến ngẫu nhiên rời rạc Định nghĩa 2.5 Nếu biến ngẫu nhiên X có miền giá trị hữu hạn hoặc vô hạn đếm được thì X được gọi là biến ngẫu nhiên rời rạc.
Giả sử biến ngẫu nhiên rời rạc X có miền giá trị X(Ω) = {x 1 , x 2 , }, hàm số p:R→R xác định bởi p(x) P(X =x) nếu x∈X(Ω)
0 nếu x6∈X(Ω) được gọi là hàm xác suất (the probability mass function) của X Trong trường hợp X(Ω) hữu hạn thì ta có thể lập bảng các giá trị của p(x) như sau x x 1 x 2 x n p(x) P(X =x 1 ) P(X =x 2 ) P(X =x n )
Bảng trên được gọi là bảng phân bố xác suất của X.
Trong một hộp chứa 3 viên bi xanh và 4 viên bi đỏ, chúng ta lấy ngẫu nhiên 3 viên bi và ký hiệu X là số viên bi xanh trong số 3 viên bi được lấy ra Để lập bảng phân bố xác suất của X, ta cần xác định các giá trị có thể của X và xác suất tương ứng Sau đó, để tính xác suất P(X ≤ 1), chúng ta sẽ cộng xác suất của các trường hợp mà X nhận giá trị từ 0 đến 1.
Giải. a) P(X = 0) =P(lấy được 3 bi đỏ) = C C 4 3 3
7 = 35 4 Tương tự, P(X = 1) = 18 35 , P(X 2) = 12 35 , P(X = 3) = 35 1 Bảng phân bố xác suất của X là x 0 1 2 3 p(x) 35 4 18 35 12 35 35 1 b) P(X ≤1) =P({X = 0} ∪ {X = 1}) = P(X = 0) +P(X = 1) = 22/35.
Trong ví dụ 2.7, chúng ta thực hiện việc tung một con xúc xắc liên tục cho đến khi xuất hiện mặt một chấm và dừng lại Gọi X là số lần tung xúc xắc Để giải bài toán này, trước tiên, ta cần tìm hàm xác suất của X Tiếp theo, chúng ta sẽ tính xác suất P(2≤X ≤5) để xác định khả năng xuất hiện số lần tung nằm trong khoảng từ 2 đến 5.
Giải a) Miền giá trị của X là X(Ω) ={1,2, }=N ∗ Hàm xác suất củaX là p(k) 5 6 k−1
7776. Định lý 2.8 Cho biến ngẫu nhiên X có miền giá trị X(Ω) = {x 1 , x 2 , , x n , } và hàm xác suất là p(x) Khi đó
2.2.2 Biến ngẫu nhiên liên tục Định nghĩa 2.9 Nếu biến ngẫu nhiên X có miền giá trị là hợp một số khoảng trên trục số thì X được gọi là biến ngẫu nhiên liên tục.
Nếu tồn tại hàm số y=f(x) thỏa mãn f(x)≥0 ∀x sao cho với mọia≤b ta có
P(a≤X ≤b) Z b a f(x)dx thì f(x) được gọi là hàm mật độ xác suất của X. Định lý 2.10 Cho biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x) Khi đó,
Ví dụ 2.11 Tuổi thọ (năm) của một loại thiết bị điện là biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x) 0,5.e −0,5x nếu x >0
Chọn ngẫu nhiên một thiết bị điện và tính xác suất: a) thiết bị có tuổi thọ thấp hơn 1 năm; b) thiết bị có tuổi thọ cao hơn 2 năm.
Ví dụ 2.12 Cho biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x) kx 2 nếu x∈[0; 3]
0 nếu x6∈[0; 3] a) Tìm hằng số k. b) Tính xác suất P(|X| ≤1).
Hàm phân phối xác suất
2.3.1 Định nghĩa Định nghĩa 2.13 Cho biến ngẫu nhiênX, hàm số
F(x) = P(X < x), x∈R được gọi là hàm phân phối xác suất của X.
1 Nếu biến ngẫu nhiên rời rạc X có miền giá trị {x 1 , x 2 , , x n , } thì
2 Nếu biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x)thì
Ví dụ 2.14 Cho biến ngẫu nhiên X có bảng phân phối xác suất
P 0,1 0,6 0,3 Tìm hàm phân phối xác suất F(x) của X.
Giải Hàm phân phối xác suất của X là
Ví dụ 2.15 Cho biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x) e −x nếu x >0
Tìm hàm phân phối xác suất F(x) của X.
Giải Hàm phân phối xác suất của X là
Tính chất 2.1 Hàm phân phối xác suất F(x) của biến ngẫu nhiên X có một số tính chất sau:
3) Nếu X là biến ngẫu nhiên rời rạc thì F(x) không liên tục trên R.
4) Nếu X là biến ngẫu nhiên liên tục có hàm mật độ xác suất f(x) thì
Kì vọng
Định nghĩa 2.16 Cho biến ngẫu nhiên X xác định trên không gian mẫu Ω Kì vọng của biến ngẫu nhiên X, kí hiệu là E(X), được xác định như sau:
1 Nếu biến ngẫu nhiên rời rạc X có hàm xác suấtp(x) thì thì
2 Nếu biến ngẫu nhiên liên tục X có hàm mật độ xác suấtf(x) thì
1) Nếu X =C là hằng số thì E(C) = C
2) Nếu a, b∈R và X, Y là hai biến ngẫu nhiên thì
Ví dụ 2.17 Tính kì vọng của các biến ngẫu nhiên trong Ví dụ 2.6 và Ví dụ 2.12.
Phương sai và độ lệch chuẩn
Định nghĩa 2.18 Cho biến ngẫu nhiênX Khi đó, đại lượng
V(X) =E(X−E(X)) 2 được gọi là phương sai của X, SD(X) =p
V(X) được gọi là độ lệch chuẩn của X. Tính chất 2.3.
1) V(X)≥0, V(X) = 0 khi và chỉ khi X =C (hằng số).
3) V(aX+b) =a 2 V(X) với mọi a, b∈R. Định lý 2.19.
1) Nếu biến ngẫu nhiên rời rạc X có hàm xác suất p(x) thì
2) Nếu biến ngẫu nhiên liên tục X có hàm mật độ f(x) thì
Phương sai là một chỉ số quan trọng dùng để đo lường độ phân tán của các giá trị của biến ngẫu nhiên so với kỳ vọng của nó Khi phương sai càng lớn, điều này cho thấy độ phân tán giữa các giá trị càng rộng, phản ánh sự biến động lớn hơn trong dữ liệu.
Ví dụ 2.20 Tính phương sai và độ lệch chuẩn của các biến ngẫu nhiên trong Ví dụ2.6 và Ví dụ 2.12.
Trung vị
Định nghĩa 2.21 Số thực m được gọi là trung vị của biến ngẫu nhiênX nếu
Ví dụ 2.22 Tìm trung vị của biến ngẫu nhiên X có bảng phân phối xác suất
Ví dụ 2.23 Tìm trung vị của biến ngẫu nhiên X có bảng phân phối xác suất
M ed(X) =m ∈[1; 2] vì P(X < m) = 0,5 và P(X > m) = 0,5với mọi m∈[1; 2]. Định lý 2.24 Nếu biến ngẫu nhiên X có hàm phân phối xác suất F(x) liên tục trên
R thì trung vị là nghiệm phương trình F(x) = 0,5.
Chứng minh Thật vậy, P(X < m)≤0,5 tương đương với
Do X là biến ngẫu nhiên liên tục nên bất đẳng thức trên tương đương với
Kết hợp (2.1) và (2.2) ta được F(m) = 0,5.
Ví dụ 2.25 Tìm trung vị của biến ngẫu nhiên X có hàm mật độ xác suất f(x) e −x nếu x >0
Giải Hàm phân phối xác suất của biến ngẫu nhiên X là
Biến ngẫu nhiên độc lập
Các biến ngẫu nhiênX 1 , X 2 , , X n (n ≥2) được gọi làđộc lập nếu với mọix 1 , x 2 , , x n ∈
{X k < x k }) =P({X 1 < x 1 })P({X 2 < x 2 }) P({X n < x n }). Định lý 2.27 Nếu hai biến ngẫu nhiên X và Y độc lập thì
Một số phân bố xác suất quan trọng
2.8.1 Phân bố Bernoulli Định nghĩa 2.28 Biến ngẫu nhiên rời rạc X có phân bố Bernoulli với tham số p
(0< p 0).
Giải GọiX là lói suất đầu tư vào 1 dự ỏn trong 1 năm, khi đú X ∼N(à;σ 2 ) Từ giả thiết ta có
Chiều cao X (mét) của nam thanh niên trưởng thành ở quốc gia A tuân theo phân bố chuẩn N(µ; 0,1²) Khi chọn ngẫu nhiên 100 nam thanh niên, cần tính xác suất sai số tuyệt đối giữa chiều cao trung bình của nhóm 100 người này và µ không vượt quá 0,03.
Giải Gọi X k là chiều cao của nam thanh niên thứ k (k= 1,2, ,100) Khi đó,
100 là phõn bố chiều cao trung bỡnh của 100 nam thanh niờn được chọn VỡX ∼N(à; 0,01 2 ) nên ta có
Như vậy khi chọn ngẫu nhiên 100 nam thanh niên thì hầu như chắc chắn rằng chiều cao trung bỡnh của 100 nam thanh niờn đú rơi vào đoạn[à−0,03;à+ 0,03].
2.8.5 Phân bố đều Định nghĩa 2.44 Biến ngẫu nhiên liên tục X có phân bố đều trên đoạn [a;b](a < b) nếu có hàm mật độ xác suất f(x) 1 b−a nếu x∈[a;b]
2.8.6 Phân bố mũ Định nghĩa 2.45 Biến ngẫu nhiên liên tục X có phân bố mũ với tham số λ (λ >0) nếu có hàm mật độ f(x) λe −λx nếu x >0
Trong cuộc sống, phân bố mũ thể hiện phân bố thời gian sống của các đối tượng,
Tính chất 2.9 Nếu X ∼Exp(λ) thì E(X) = 1/λ, V(X) = 1/λ 2
Trong ví dụ 2.46, giả sử tuổi thọ (X) của một chiếc quạt trong máy tính tuân theo phân phối mũ với tuổi thọ trung bình là 3300 giờ Cần tính xác suất a) chiếc quạt hỏng trước 10000 giờ, và b) tuổi thọ lớn hơn 7000 giờ.
Giải Theo giả thiết E(X) = 1 λ = 3300 nên: a) P(X 0 ta có
P(X ≥a)≤ E(X) a Chứng minh Với a >0, xét biến ngẫu nhiên I có bảng phân bố xác suất như sau
I ≤ X a. Lấy kì vọng hai vế ta được
P(X ≥a)≤ E(X) a Định lý 2.50 (Bất đẳng thức Chebyshev) Cho X là biến ngẫu nhiên Khi đó, với mọi ε >0 ta có
Để chứng minh định lý 2.51 (Luật yếu số lớn), với ε > 0 tùy ý, ta đặt a = ε² và Y = |X - E(X)|² Áp dụng bất đẳng thức Markov, ta có thể chứng minh được điều cần thiết Dãy {Xn, n ≥ 1} gồm các biến ngẫu nhiên độc lập và có cùng phân bố xác suất với biến ngẫu nhiên X có kỳ vọng E(X) hữu hạn và phương sai.
V(X) =σ 2 hữu hạn thì với mọi ε >0, n→∞lim P(|X−à|< ε) = 1, trong đó X = 1 n
Chứng minh Đặt T =X1+X2+ +Xn Do các biến ngẫu nhiên X k độc lập, cùng phõn bố xỏc suất nờn E(T) =nà và V(T) =nσ 2 Áp dụng bất đẳng thức Chebyshev, ta có
Khi n tiến tới vô cùng, giới hạn P(|X−à|< ε) sẽ tiến gần đến 1 Điều này thể hiện ý nghĩa của luật số lớn: Nếu X1, X2, , Xn là các biến ngẫu nhiên độc lập và cùng phân bố xác suất với biến ngẫu nhiên X, thì khi n đủ lớn, các giá trị của chúng sẽ hội tụ gần về giá trị kỳ vọng.
Khi xét dãy {X n , n ≥ 1} các biến ngẫu nhiên độc lập và cùng phân bố xác suất với kỳ vọng E(X) = à hữu hạn và phương sai V(X) = σ 2 hữu hạn, ta có thể khẳng định rằng với mọi ε > 0, khi n tiến tới vô cùng, xác suất P(|S 2 −σ 2 |< ε) sẽ tiến tới 1 Trong đó, S 2 được định nghĩa là 1/n.
2.9.2 Định lí giới hạn trung tâm Định lý 2.53 Nếu {X n , n≥1} là dãy các biến ngẫu nhiên độc lập, cùng phân bố xác suất với biến ngẫu nhiờn X cú kỡ vọng E(X) = à hữu hạn và phương sai V(X) = σ 2 hữu hạn thì n→∞lim P(T −nà
Định lý giới hạn trung tâm cho biết rằng nếu X1, X2, , Xn là các biến ngẫu nhiên độc lập và có cùng phân bố xác suất, thì khi n đủ lớn, tổng T = X1 + X2 + + Xn sẽ tuân theo phân bố chuẩn, bất kể phân bố ban đầu của các biến ngẫu nhiên đó Điều này có ý nghĩa quan trọng trong thống kê và xác suất, cho phép chúng ta áp dụng các phương pháp phân tích chuẩn cho các tập hợp dữ liệu lớn.
T =X1+X2+ +Xn cú phõn bố xấp xỉ phõn bố chuẩn N(nà;nσ 2 ).
Tuổi thọ làm việc của một linh kiện điện tử, được ký hiệu là biến ngẫu nhiên X, có kì vọng 250 giờ và độ lệch chuẩn 250 giờ Để tính xác suất cho 100 linh kiện được chọn ngẫu nhiên có tổng tuổi thọ ít nhất 1 năm (365 ngày), ta cần áp dụng các phương pháp thống kê phù hợp.
Giải GọiX k là tuổi thọ của linh kiện thứk (1≤k ≤100), khi đó các biến ngẫu nhiên
X 1 , X 2 , , X n độc lập, cùng phân bố xác suất với X Theo Định lí giới hạn trung tâm ta có
T =X 1 +X 2 + +X n có phân bố xấp xỉ phân bố chuẩn N(100.250; 100.250 2 ) Do đó
Hệ quả 2.55 (Định lý giới hạn tích phân Moivre-Laplace) Giả sử X n là biến ngẫu nhiên có phân bố nhị thức B(n;p) Đặt
Z n = X n −np pnp(1−p). Khi đó với mọi x∈R, n→∞lim P(Z n < x) = Φ(x).
Nói cách khác, với n đủ lớn, B(n;p)có phân bố xấp xỉ phân bố chuẩn N(np;np(1−p)). Xấp xỉ trên tốt nhất khi np >5 và n(1−p)>5.
Xác suất bắn trúng mục tiêu của xạ thủ là 0,7 Khi xạ thủ thực hiện 100 phát bắn độc lập, ta cần tính xác suất có ít nhất 75 phát trúng mục tiêu.
Giải Gọi X là số phát trúng trong 100 phát đã bắn Khi đó, X ∼ B(100; 0,7) Áp dụng hệ quả trên, X xấp xỉ phân bố chuẩn N(70; 21) Do đó,
Trong một năm, có 10.000 xe máy tham gia bảo hiểm từ một công ty, với mỗi chủ xe đóng phí 100.000 đồng Trung bình, nếu xe máy gặp tai nạn giao thông, chủ xe sẽ nhận lại 5 triệu đồng Thống kê cho thấy tỷ lệ xe máy gặp tai nạn giao thông là một yếu tố quan trọng cần xem xét trong việc đánh giá hiệu quả của chương trình bảo hiểm này.
1 năm là 0,006 Tính xác suất để: a) Trong một năm hoạt động công ty bị lỗ. b) Trong một năm hoạt động công ty lãi ít nhất 800 triệu.
Giải GọiX là số xe máy mua bảo hiểm của công ty bị tai nạn trong một năm, khi đó
X ∼B(10 4 ; 0,006) Vì np = 60 và np(1−p) = 59,64 nên ta có thể xấp xỉ X bởi phân bố chuẩn N(60; 59,64). a) Xác suất sau một năm hoạt động công ty bị lỗ là
= 1−Φ(18,13) = 0. b) Xác suất sau một năm hoạt động công ty lãi ít nhất 800 triệu
Nội dung trọng tâm Chương 2
1 Biến ngẫu nhiên rời rạc. i) Hàm xác suất p(x) P(X =x) nếu x∈X(Ω)
0 nếu x6∈X(Ω) ii) Bảng phân bố xác suất x x1 x2 xn p(x) P(X =x 1 ) P(X =x 2 ) P(X =x n )
2 Biến ngẫu nhiên liên tục.
Hàm mật độ xác suất: Nếu tồn tại hàm sốy=f(x) thỏa mãn f(x)≥0 ∀x sao cho với mọi a ≤b ta có
P(a≤X ≤b) Z b a f(x)dx thì f(x) được gọi là hàm mật độ xác suất của X 3 Hàm phân phối xác suất.
4 Các số đặc trưng. i) Kì vọng.
- Nếu biến ngẫu nhiên rời rạc X có hàm xác suất p(x)thì thì
- Nếu biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x) thì
−∞ xf(x)dx. ii) Phương sai
- Nếu biến ngẫu nhiên rời rạc X có hàm xác suất p(x)thì
- Nếu biến ngẫu nhiên liên tục X có hàm mật độ f(x) thì
−∞ xf(x)dx) 2 iii) Độ lệch chuẩn.
Số thực m được gọi là trung vị của biến ngẫu nhiên X nếu
Biến ngẫu nhiên rời rạcX cóphân bố nhị thức với tham sốn vàp(n ∈N ∗ và0< p 0) nếu có hàm mật độ xác suất f(x) = 1 σ√
6 Định lí giới hạn trung tâm.
Nếu {X_n, n ≥ 1} là dãy các biến ngẫu nhiên độc lập và cùng phân bố xác suất, với kỳ vọng E(X) = a hữu hạn và phương sai V(X) = σ^2 hữu hạn, thì khi n tiến tới vô cùng, xác suất P(T - nà sẽ có những đặc điểm nhất định.
Trong một thiết bị gồm ba bộ phận hoạt động độc lập, xác suất hỏng hóc của các bộ phận trong thời gian T lần lượt là 0,4; 0,2 và 0,1 Gọi X là số bộ phận bị hỏng trong thời gian T Để lập bảng phân bố xác suất của X, chúng ta cần tính xác suất cho từng trường hợp có 0, 1, 2 và 3 bộ phận bị hỏng Cuối cùng, để tìm xác suất có không quá 2 bộ phận bị hỏng trong thời gian T, chúng ta sẽ cộng xác suất của các trường hợp X = 0, X = 1 và X = 2.
Trong bài toán này, có ba xạ thủ độc lập bắn vào một mục tiêu với xác suất trúng lần lượt là 0,7, 0,8 và 0,5 Gọi X là số viên trúng Để lập bảng phân phối của X, ta tính xác suất cho các trường hợp X = 0, 1, 2, 3 Kỳ vọng và phương sai của X cũng được xác định để đánh giá hiệu suất bắn Cuối cùng, ta tính xác suất có ít nhất 2 viên trúng, giúp hiểu rõ hơn về khả năng thành công của nhóm xạ thủ.
Trong nghiên cứu này, có hai lô sản phẩm: lô 1 gồm 8 chính phẩm và 2 phế phẩm, trong khi lô 2 có 7 chính phẩm và 3 phế phẩm Sau khi ngẫu nhiên chuyển 2 sản phẩm từ lô 1 sang lô 2, tiến hành lấy ngẫu nhiên 2 sản phẩm từ lô 2 Mục tiêu là lập bảng phân phối xác suất cho số lượng chính phẩm được lấy ra trong lần rút thứ hai.
Một thiết bị có 3 bộ phận hoạt động độc lập, với số bộ phận hỏng trong thời gian T được ký hiệu là X và có bảng phân bố xác suất như sau: p(0) = 0,024, p(1) = 0,452, p(2) = 0,188, p(3) = 0,336 Cần tính kì vọng và phương sai của X Ngoài ra, nếu xác suất bộ phận 1 hỏng trong thời gian T là 0,8, cần xác định xác suất hỏng của mỗi bộ phận còn lại trong thời gian T.
Một công ty khai thác dầu đang triển khai hai dự án, một ở châu Á và một ở châu Âu Biến X đại diện cho số dự án thành công, với bảng phân bố xác suất như sau: P(X=0) = 0,02, P(X=1) = 0,26, và P(X=2) = 0,72.
Giả sử xác suất thành công mỗi dự án là độc lập nhau Tìm xác suất thành công của mỗi dự án.
Xác suất để một người bắn trúng bia là 0,8, tức là xác suất bắn trượt là 0,2 Khi người đó bắn từng viên đạn cho đến khi trúng bia, biến ngẫu nhiên X đại diện cho số viên đạn bắn trượt Hàm xác suất của biến ngẫu nhiên X có thể được mô tả bằng phân phối hình học, trong đó xác suất để bắn trượt k lần trước khi trúng bia là P(X=k) = (0,2)^k * (0,8), với k là số lần bắn trượt.
VECTƠ NGẪU NHIÊN HAI CHIỀU
Định nghĩa
Định nghĩa 3.1 Cho X : Ω → R và Y : Ω → R là hai biến ngẫu nhiên Ánh xạ
Z : Ω→R×R xác định bởiZ(ω) = (X(ω), Y(ω))được gọi làvectơ ngẫu nhiên 2 chiều và kí hiệu làZ = (X, Y) Miền giá trị của Z = (X, Y) được kí hiệu Z(Ω).
Phân bố xác suất của vectơ ngẫu nhiên
3.2.1 Vectơ ngẫu nhiên 2 chiều rời rạc Định nghĩa 3.2 Cho vectơ ngẫu nhiên Z = (X, Y) có miền giá trị
Hàm xác suất đồng thời của Z = (X, Y)là hàm số p:Z(Ω)→R xác định bởi p(x, y) P(X =x, Y =y) nếu (x, y)∈Z(Ω),
Trong trường hợp X vàY có miền giá trị lần lượt là {x 1 , x 2 , , x m }, {y 1 , y 2 , , y n }, đặt pij =P(X =xi;Y =yj).
Bảng chữ nhật sau được gọi là bảng phân bố xác suất đồng thời của vectơ ngẫu nhiên (X, Y). x y y 1 y 2 y n x 1 p 11 p 12 p 1n x 2 p 21 p 22 p 2n x m p m1 p m2 p mn
Khi gieo đồng thời một đồng xu và một con xúc xắc cân đối đồng chất, ta có thể xác định biến ngẫu nhiên X là số mặt sấp của đồng xu và biến Y là số chấm trên mặt con xúc xắc Để lập bảng phân phối xác suất đồng thời cho cặp biến (X, Y), ta cần tính xác suất cho mỗi cặp giá trị có thể xảy ra của X và Y Bảng phân phối xác suất sẽ giúp chúng ta hiểu rõ hơn về mối quan hệ giữa số lần xuất hiện của mặt sấp của đồng xu và số chấm trên xúc xắc.
Giải Gọi X là số mặt sấp xuất hiện của đồng xu X(Ω) ={0,1}
Gọi Y là số chấm xuất hiện trên mặt con xúc xắc Y(Ω) ={1,2,3,4,5,6}.
Bảng phân bố xác suất đồng thời của X và Y là: x y 1 2 3 4 5 6
Trong một hộp chứa 5 quả bóng bàn, bao gồm 3 quả mới và 2 quả cũ, ta thực hiện hai lần lấy ngẫu nhiên 2 quả Ở lần đầu tiên, gọi X là số bóng mới được lấy ra, và ở lần thứ hai, gọi Y là số bóng mới được lấy ra Mục tiêu là lập bảng phân phối xác suất đồng thời cho cặp biến ngẫu nhiên (X, Y).
Bảng phân bố xác suất đồng thời của (X, Y) sau: x y 0 1 2
2 0.18 0.12 0 Định lý 3.5 Cho vectơ ngẫu nhiên Z = (X, Y) có miền giá trị
Z(Ω) ={(xi, yj) :xi∈X(Ω), yj ∈Y(Ω)}. Khi đó
2) Hàm xác suất của biến ngẫu nhiên X p X (x) = X y j ∈Y (Ω)
3) Hàm xác suất của biến ngẫu nhiên Y p Y (y) = X x i ∈X(Ω)
3.2.2 Vectơ ngẫu nhiên 2 chiều liên tục Định nghĩa 3.6 Cho X và Y là hai biến ngẫu nhiên liên tục Nếu tồn tại hàm số f(x, y)≥0 ∀ x, y sao cho với mọi a < b và c < d ta có
Hàm f(x, y) được định nghĩa là hàm mật độ xác suất đồng thời của hai biến ngẫu nhiên (X, Y) nếu tồn tại tích phân Z d c f(x, y)dxdy Theo định lý 3.7, nếu f(x, y) là hàm mật độ đồng thời của (X, Y), thì f X (x) và f Y (y) lần lượt là hàm mật độ xác suất của X và Y.
Ví dụ 3.8 Cho vectơ ngẫu nhiên (X, Y)có hàm mật độ xác suất đồng thời f(x, y) ce −x−y nếu x >0 và y >0
0 nếu trái lại. a) Tìm hằng số c. b) Tìm hàm mật độ xác suất của X và của Y. c) Tìm xác suất để (X, Y) nhận giá trị trong miền chữ nhật
0 nếu trái lại. b) f X (x) 0 nếu x≤0 e −x nếu x >0 f Y (y) 0 nếu y≤0 e −y nếu y >0. c) P(1≤x≤2,0< y < 2) =R2
3.2.3 Hàm phân phối xác suất đồng thời Định nghĩa 3.9 Cho 2 biến ngẫu nhiên X và Y Hàm số
F X,Y (x, y) =P(X < x, Y < x) được gọi là hàm phân phối xác suất đồng thời của vectơ ngẫu nhiên (X, Y).
1 Nếu vectơ ngẫu nhiên(X;Y) có hàm xác suất đồng thời p(x;y) thì
2 Nếu vectơ ngẫu nhiên(X;Y) có hàm mật độ xác suất đồng thời f(x, y) thì
Ví dụ 3.10 Tìm hàm phân phối xác suất đồng thời ở Ví dụ 3.8.
Giải Với x >0 và y >0ta có
Hai biến ngẫu nhiên X và Y được coi là độc lập nếu và chỉ nếu hàm mật độ xác suất chung f(x, y) bằng tích của hai hàm mật độ xác suất riêng lẻ f X (x) và f Y (y) Điều này có nghĩa là sự phân phối xác suất của biến X không bị ảnh hưởng bởi biến Y và ngược lại.
Kì vọng có điều kiện
Cho (X, Y) có bảng phân bố xác suất đồng thời x y y 1 y j y n x 1 p 11 p 1j p 1n x 2 p 21 p 2j p 2n x m p m1 p mj p mn
Từ đó ta có hàm xác suất của X với điều kiện Y =y j như sau: p y j (x) ( p ij p 1j +p 2j + +p mj nếu x=xi ∈X(Ω)
Kì vọng của X với điều kiện Y =y j :
3.3.2 Trường hợp liên tục Định nghĩa 3.12 ChoX và Y là hai biến ngẫu nhiên liên tục vày∈R Nếu tồn tại hàm số f y (x)≥0 ∀x sao cho với mọi a < b ta có
P(a≤X ≤b|Y =y) Z b a f y (x)dx thì f y (x) được gọi làhàm mật độ xác suất của biến ngẫu nhiênX với điều kiện Y =y. Hàm mật độ xác suất f y (x) còn được kí hiệu bởi f(x|y) Khi đó
Định lý 3.13 nêu rằng cho hai biến ngẫu nhiên (X, Y) có hàm mật độ xác suất đồng thời f(x, y), hàm mật độ xác suất có điều kiện f(x|y) của X khi Y = y và hàm mật độ xác suất có điều kiện f(y|x) của Y khi X = x có mối liên hệ chặt chẽ với nhau.
Chứng minh 1) Với a < b ta có:
Ry+t y f Y (v)dv Áp dụng quy tắc l’Hôpital ta được
. Áp dụng Định lý giá trị trung bình d dt
Rb a lim t→0 f(u, y+t)du lim t→0 f Y (y+t) Z b a f(x, y) f Y (y) dx.
Vì vậy f(x|y) = f(x, y) f Y (y) Chứng minh tương tự cho trường hợp (2).
Ví dụ 3.14 Cho vectơ ngẫu nhiên (X, Y) có hàm mật độ xác suất đồng thời f(x, y) 2e −x−y nếu y > x >0
0 nếu trái lại. a) Cho x >0, tìmf(y|x). b) Cho y >0, tìm f(x|y).
Hiệp phương sai, hệ số tương quan
Định nghĩa 3.15 Cho vectơ ngẫu nhiên (X, Y).Hiệp phương sai của X vàY là một số xác định bởi công thức
3) Nếu X và Y độc lập thì Cov(X, Y) = 0. Định lý 3.17 Cho vectơ ngẫu nhiên Z = (X, Y).
Trong bài viết này, chúng ta xem xét hàm xác suất p(x, y) cho vectơ ngẫu nhiên rời rạc (X, Y) và hàm mật độ xác suất f(x, y) cho vectơ ngẫu nhiên liên tục (X, Y) Định lý 3.18 sẽ được áp dụng để phân tích các khía cạnh liên quan đến tính liên tục của hàm xác suất và hàm mật độ xác suất trong bối cảnh này.
1) NếuX vàY là các biến ngẫu nhiên rời rạc có miền giá trị lần lượt là{x 1 , x 2 , , x m }, {y 1 , y 2 , , y n } thì
2) Nếu (X, Y) có hàm mật độ xác suất đồng thời f(x, y) thì
Hệ số tương quan giữa hai biến ngẫu nhiên X và Y, ký hiệu là ρ(X, Y), được xác định thông qua công thức ρ(X, Y) = Cov(X, Y) / (pV(X) * pV(Y)) Để chứng minh, ta sử dụng công thức Cov(X, Y) = E(XY) - E(X)E(Y) và áp dụng Định lý 3.17, từ đó có thể rút ra các kết quả cần thiết.
2) Nếu X và Y độc lập thì ρ(X, Y) = 0;
Chứng minh 1) ĐặtX 0 =X−EX, Y 0 =Y −EY ∀t∈R, ta có:
⇔E(X−EX) 2 t 2 + 2tE(X−EX)(X−EY) +E(Y −EY) 2 ≥0
⇔V(X)t 2 + 2tCov(X, Y) +V(Y)≥0. Đây là tam thức bậc hai theo t, do đó:
2) Nếu X, Y độc lập thì theo Định lý 3.15, ta có Cov(X, Y) = 0, do đó
Cov(aX +b, X) =E[(aX+b)X]−E(aX+b)EX X 2 −a(EX) 2 =aV(X). Suy ra ρ(aX+b, X) = aV(X)
Nội dung trọng tâm Chương 3
1 Vectơ ngẫu nhiên rời rạc.
Hàm xác suất đồng thời của Z = (X, Y) là hàm số p:Z(Ω)→R xác định bởi p(x, y) P(X =x, Y =y) nếu (x, y)∈Z(Ω),
2 Vectơ ngẫu nhiên liên tục.
Nếu tồn tại hàm số f(x, y)≥0 ∀ x, y sao cho với mọi a < b và c < d ta có
Z d c f(x, y)dxdy thì f(x, y) được gọi là hàm mật độ xác suất đồng thời của (X, Y).
3 Kì vọng có điều kiện. i) Vectơ ngẫu nhiên rời rạc
E(X|Y =y j ) = x 1 p 1j +x 2 p 2j + +x m p mj p1j+p2j + +pmj ii) Vectơ ngẫu nhiên liên tục.
5 Hệ số tương quan. ρ(X, Y) = Cov(X, Y) pV(X)p
3.1 Số trẻ em sinh ra trong 1 tuần ở làng A là 1 biến ngẫu nhiên X có bảng phân bố xác suất x 0 1 2 3 p(x) 0,4 0,3 0,2 0,1
Số người chết trong 1 tuần ở làng đó là biến ngẫu nhiên Y có bảng phân phối xác suất y 0 1 2 3 4 p(y) 0,1 0,3 0,4 0,15 0,05
Giả sử X và Y độc lập. a) Tìm bảng phân phối xác suất của vectơ (X, Y). b) Tính P(X > Y).
3.2 Cho (X, Y) có bảng phân bố xác suất đồng thời
3.3 Cho (X, Y) có bảng phân bố xác suất đồng thời
Chứng minh X và Y không độc lập.
3.4 Cho(X, Y) có hàm mật độ f(x, y) cx nếu 0< y < x x >0
0 nếu trái lại. a)Với x >0, tính E(Y|X =x). b)Với y >0, tính E(X|Y =y).
THỐNG KÊ MÔ TẢ
Khái niệm mẫu và tổng thể
Giả sử ta cần nghiên cứu tính chất X nào đó của các phần tử trong tập hợp Ω mà
Khi tập hợp Ω có số lượng phần tử lớn (|Ω| có thể vô cùng), việc nghiên cứu tính chất X trên tất cả các phần tử trở nên khó khăn Do đó, phương pháp thống kê được áp dụng bằng cách chọn ngẫu nhiên một số lượng hữu hạn n phần tử để phân tích Kết quả nghiên cứu từ n phần tử này sẽ giúp đưa ra kết luận cho toàn bộ tổng thể Chúng ta sẽ giới thiệu các khái niệm liên quan.
1)Tổng thể là tập hợp tất cả các phần tử của Ω mà ta cần nghiên cứu tính chất
2) Mẫu là một tập con n phần tử của tổng thể được chọn ngẫu nhiên đề nghiên cứu n được gọi là kích thước mẫu (hoặc cỡ mẫu).
3) Nếu mỗi phần tử của tổng thể có tính chất X là một số thực thì với phương pháp chọn mẫu ngẫu nhiên, ta có X là biến ngẫu nhiên, tập các giá trị của X trong mẫu được gọi là mẫu số liệu.
Ví dụ 4.1 X là chiều cao của thanh niên Việt Nam 22 tuổi hiện nay Khi đó:
- Tổng thể là tập hợp toàn bộ thanh niên Việt Nam 22 tuổi.
Do số lượng thanh niên 22 tuổi trên toàn quốc rất lớn, việc điều tra toàn bộ là không khả thi, vì vậy chúng ta chỉ có thể chọn một tập hợp con để nghiên cứu Tập hợp này được gọi là mẫu, trong khi số lượng cá thể trong mẫu được gọi là kích thước mẫu Tất cả các giá trị chiều cao của các cá thể trong mẫu sẽ được gọi là mẫu số liệu.
Các số đặc trưng của một mẫu số liệu
4.2.1 Trung bình mẫu, phương sai mẫu và độ lệch chuẩn mẫu
Cho {x 1 , x 2 , , x n } là mẫu số liệu của biến ngẫu nhiên X.
1) Trung bình mẫu, kí hiệu là x, được tính theo công thức: x= x 1 +x 2 + +x n n = 1 n n
2) Phương sai mẫu, kí hiệu là s 2 , được tính theo công thức: s 2 = 1 n−1 n
Ví dụ 4.2 Giả sử ta có mẫu số liệu về chiều cao (mét) của 10 sinh viên một trường đại học như sau:
Tìm trung bình mẫu, phương sai mẫu và độ lệch chuẩn mẫu.
1) Mẫu số liệu cho dạng bảng phân bố tần số rời rạc:
2) Mẫu số liệu cho dạng bảng phân bố tần số liên tục:
X x 1 x 2 x m n i n 1 n 2 n m ta đưa về Chú ý 1 để tính x, s 2 và s.
Ví dụ 4.4 Doanh thu X (triệu đồng) trong 100 ngày được chọn ngẫu nhiên của 1 cửa hàng cho bởi bảng sau
Tìm trung bình mẫu, phương sai mẫu và độ lệch chuẩn mẫu.
Giải Đưa về bảng tần số rời rạc:
X 19,2 19,6 20,0 20,4 20,8 n i 15 25 30 20 10 Áp dụng Chú ý 1 ta tính được x= 19,94; s 2 ≈0,23; s≈0,48.
Sắp xếp mẫu số liệu theo thứ tự tăng dần, giả sử x 1 < x 2 < < x n Trung vị mẫu, kí hiệu x˜, xác định bởi ˜ x
4.2.3 Hệ số tương quan mẫu
Cho{(x 1 , y 1 ); (x 2 , y 2 ); ; (x n , y n )}là mẫu hai chiều của vectơ ngẫu nhiên(X, Y).Hệ số tương quan mẫu được xác định bởi r Pn i=1(x i −x)(y i −y) pPn i=1(x i −x) 2 Pn i=1(y i −y) 2
Biểu đồ
4.3.1 Biểu đồ phân bố tần số (Histogram)
Cho (x 1 , x 2 , , x n ) là mẫu số liệu của biến ngẫu nhiên X.
Trường hợp 1: X là biến ngẫu nhiên rời rạc.
Lập bảng phân bố tần số rời rạc của số liệu đã cho như sau:
Sử dụng hệ trục tọa độ Descartes vuông góc để vẽ biểu đồ, trong đó trục hoành biểu thị các giá trị x ∗ 1, x ∗ 2, , x ∗ m, còn trục tung thể hiện tần số hoặc tần số tương đối.
Ví dụ 4.5 Trong 1 cuộc thi game online có 27 màn được tổ chức có 19383 game thủ tham gia Kết quả cho bởi bảng sau
Hình 4.1 là biểu đồ tần số của số liệu trên.
Trường hợp 2: X là biến ngẫu nhiên liên tục.
Lập bảng phân bố tần số liên tục.
Trong đó, số khoảng cần chia tốt nhất là từ 5 đến 20 khoảng, có thể chọn xấp xỉ bằng
√n (hoặc1 + log 2 (n)) Nếu ta chia dữ liệu thànhm khoảng thì độ dài mỗi khoảng xấp xỉ (max{x k } −min{x k })/m.
Sử dụng hệ trục tọa độ Descartes vuông góc với trục hoành là các khoảng giá trị [a k−1 ;a k ), trục tung là tần số (hoặc tần số tương đối).
Ví dụ 4.6 Đo chiều dài (mm) của 50 con bọ cánh cứng ở một khu vực, nhà sinh học thu được kết quả sau:
Vì n = 50, √50≈ 7 nên ta sẽ chia số liệu thành 7 khoảng, mỗi khoảng có độ dài d= (max{x i } −min{x i })/7≈0,13 Từ đó ta có bảng phân bố tần số liên tục:
Hình 4.2 là biểu đồ tần số của số liệu trên.
4.3.2 Biểu đồ thân-lá(Stem-and-Leaf Plots)
Biểu đồ thân - lá là một dạng biểu đồ tương tự như histogram, nhưng thay vì sử dụng các cột để trình bày dữ liệu, nó sử dụng các giá trị dữ liệu Biểu đồ này bao gồm ba thành phần chính: phần thân, gồm một hoặc hai chữ số đầu của số liệu; phần lá, chứa những chữ số còn lại; và tần số Biểu đồ thân - lá thường được áp dụng cho các nhóm dữ liệu nhỏ Để tạo biểu đồ thân - lá, bạn cần thực hiện một số bước nhất định.
(1) Chia mỗi số liệu x k thành 2 phần: phần thân gồm một hoặc 2 chữ số đầu, phần lá là những chữ số còn lại;
(2) Ghi phần thân thành một cột;
(3) Mỗi số liệu x k ghi lại phần lá ứng với phần thân trên cùng một hàng;
(4) Với mỗi x k ghi lại phần lá trên hàng của cột 2 ứng với phần thân;
(5) Ghi tần số trên cột thứ 3 (số phần lá ứng với phần thân).
(Tốt nhất chia số liệu từ 5 đến 20 thân)
Ví dụ 4.7 Vẽ biểu đồ thân - lá trong ví dụ 4.6
Lấy phần thân là các số 7,8,9, ,24, khi đó ta được biểu đồ Thân - Lá như sau:
4.3.3 Biểu đồ xác suất chuẩn
Giả sử mẫu số liệu của biến ngẫu nhiên X đã sắp thứ tự tăng dần: x 1 ≤x 2 ≤x 3 ≤ ≤x n Hàm phân phối tần số thực nghiệm củaX được xác định như sau
F(x) = số phần tử của mẫu số liệu Make Patterned Data -> Simple Set of Numbers.
Store Patterned Data in: chọn C1
From first value: chọn 1 To last value: chọn N
Number of times to list each value: chọn 1
Number of times to list the sequence: chọn 1
- Chọn ngẫu nhiên n phần tử từ danh sách: Calc ->Random Data-> Sample fromColumns.
Number of rows to sample: chọn n
From Colmns: chọn C1 Store sample in: chọn C2
Nếu chọn mẫu có hoàn lại: chọn sample with replacement.
4.5.2 Chọn mẫu từ tổng thể vô hạn
Khi chọn mẫu kích thước n từ một tổng thể có vô hạn phần tử (N = ∞), như trong trường hợp sản phẩm từ một nhà máy hoặc khách hàng vào cửa hàng, mẫu ngẫu nhiên (X1, X2, , Xn) cần phải đáp ứng một số điều kiện nhất định.
1) Mỗi phần tử được chọn vào mẫu là ngẫu nhiên.
2) Các phần tử phải được chọn độc lập nhau.
Phân bố của trung bình mẫu
Trong mục này ta sẽ nghiên cứu phân bố của trung bình mẫu Trước hết ta xét ví dụ sau:
Ví dụ 4.13 Cho tổng thể Ω = {1,2,3,4,5,6} Tìm phân bố của trung bình mẫu có kích thước n= 2 chọn theo phương pháp có hoàn lại.
Kí hiệu (X 1 , X 2 ) là mẫu ngẫu nhiên Ta có bảng các giá trị của (X 1 , X 2 )
Như vậy ta có 36 giá trị của mẫu ngẫu nhiên (X 1 , X 2 ) nên sẽ có 36 giá trị trung bình mẫu Bảng phân bố tần số của trung bình mẫu: x 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6 n i 1 2 3 4 5 6 5 4 3 2 1
Biểu đồ tần số của trung bình mẫu:
Trung bình mẫu x có phân bố chuẩn, theo định lý 4.14 Nếu (X1, X2, , Xn) là mẫu ngẫu nhiên từ biến ngẫu nhiên X với phân bố chuẩn N(μ; σ²), thì phân bố của trung bình mẫu x cũng sẽ có hình dạng chuẩn.
X = 1 n(X 1 +X 2 + +X n ) cũng cú phõn bố chuẩn với kỡ vọng E(X) =à và độ lệch chuẩn SD(X) = σ
Khi tổng thể không có phân bố chuẩn, chúng ta nên chọn mẫu có kích thước n > 30 Theo Định lý giới hạn trung tâm, biến ngẫu nhiên X sẽ xấp xỉ phân bố chuẩn với kỡ vọng à và độ lệch chuẩn σ/√n Định lý 4.15 chỉ ra rằng nếu (X1, X2, , Xn) là mẫu ngẫu nhiên của biến ngẫu nhiên X có phân bố chuẩn N(à; σ²), thì biến ngẫu nhiên này sẽ có những đặc điểm nhất định.
X−à S/√ n có phân phối Student n−1 bậc tự do (T n−1 ) Trong đó
Nội dung trọng tâm Chương 4
1 Công thức tính các số đặc trưng của mẫu. i) Trung bình mẫu x= x1+x2+ +xn n = 1 n n
X i=1 xi. ii) Phương sai mẫu s 2 = 1 n−1 n
# iii) Độ lệch chuẩn mẫu. s√ s 2 v u u t
2 Biiểu đồ xác suất chuẩn.
Là tập hợp các điểm có tọa độ (z i ;x i ) với i = 1,2, , n (x 1 ≤ x 2 ≤ ≤ x n ) trên hệ trục tọa độ Descartes vuông góc Ozx Trong đó Φ(zj) = j −0,5 n
3 Phân bố trung bình mẫu Nếu (X 1 , X 2 , , X n ) là mẫu ngẫu nhiên của biến ngẫu nhiờn X cú phõn bố chuẩnN(à;σ 2 ) thỡ
X = 1 n(X1+X2+ +Xn) cũng cú phõn bố chuẩn với kỡ vọng E(X) = àvà độ lệch chuẩn SD(X) = σ
Chỉ số khối cơ thể (BMI) được tính bằng tỉ số giữa cân nặng (kg) và bình phương chiều cao (m²), giúp đo lường mức độ béo hay gầy của một người Trong nghiên cứu này, phân bố chỉ số BMI của nam giới được giả định có phân bố chuẩn với độ lệch chuẩn σ = 3 (kg/m²) Một mẫu ngẫu nhiên gồm 49 nam giới được chọn để ước lượng chỉ số BMI trung bình Mục tiêu là tính xác suất sai số tuyệt đối giữa chỉ số BMI trung bình và trung bình mẫu không vượt quá 1 (kg/m²).
Một sinh viên đã thực hiện thí nghiệm gieo 8 hạt đậu vào 8 cái cốc riêng biệt, đặt dưới ánh sáng liên tục của đèn huỳnh quang Sau 14 ngày, sinh viên tiến hành đo chiều cao (cm) của các cây đậu và ghi nhận kết quả.
Tìm trung bình mẫu, độ lệch chuẩn mẫu và trung vị mẫu.
4.3 Đo nồng độ cholesterol trong huyết thanh của 1067 đàn ông Mỹ tuổi từ 25 đến
34 được chọn ngẫu nhiên, nhà nghiên cứu thu được kết quả như sau.
Nồng độ cholesterol (mg/100 ml) Số người
320–399 14 a) Vẽ biểu đồ tần số. b) Tìm trung bình mẫu, độ lệch chuẩn mẫu và trung vị mẫu.
4.4 Nồng độ hemoglobin trong máu của 60 người được làm xét nghiệm ở một địa phương nghi có dịch sốt xuất huyết cho bởi:
87 67 72 52 35 67 99 81 97 74 61 62 a) Vẽ biểu đồ tần số, biểu đồ xác suất chuẩn. b) Tìm trung bình mẫu, độ lệch chuẩn mẫu và trung vị mẫu.
4.5 Đo chiều cao (đơn vị là cm) 10 nam thanh niên trưởng thành được chọn ngẫu nhiên ở vùng A và 10 nam thanh niên trưởng thành được chọn ngẫu nhiên ở vùng B.
Số đo chiều cao của hai nhóm người này được cho như sau.
Hãy vẽ biểu đồ xác suất chuẩn của hai mẫu số liệu của X vàY trên cùng 1 hệ trục tọa độ Nhận xét về độ lệch chuẩn của X vàY.
4.6 Hàm lượng asen trong 20 mẫu nước ngầm được lấy ngẫu nhiên ở hai vùng dân cư A và B được cho như sau (đơn vị: 10 −3 mg/l):
Hãy vẽ biểu đồ xác suất chuẩn của hai mẫu số liệu của X và Y trên cùng 1 hệ trục tọa độ Nhận xét về độ lệch chuẩn của X và Y.
Các nhà khoa học (Peacock, L., Carter, P., Powers, S và Karp, A 2003) đã đo kích thước chiều dài (mm) và chiêu rộng (mm) của 50 con bọ cánh cứng khác nhau tại một khu vực gần Bristol, Vương quốc Anh.
TT Dài Rộng TT Dài Rộng TT Dài Rộng
17 4.45 1.60 34 4.35 1.55 a) Vẽ biểu đồ xác suất chuẩn của các số liệu về chiều dài và chiều rộng. b) Tìm hệ số tương quan mẫu.
ƯỚC LƯỢNG THAM SỐ
Ước lượng điểm
5.1.1 Ước lượng điểm và hàm ước lượng
Biến ngẫu nhiên X có các số đặc trưng như kì vọng và phương sai, được gọi là tham số, nhưng giá trị chính xác của chúng thường khó xác định nếu không biết phân bố xác suất Ví dụ, để ước lượng chiều cao trung bình của nam thanh niên trưởng thành ở một địa phương, ta có thể chọn ngẫu nhiên 10 nam thanh niên và tính trung bình mẫu x = (x1 + x2 + + x10)/10 Ngoài ra, hàm trung vị ˜x cũng có thể được sử dụng để ước lượng tham số này Hàm ước lượng, được xây dựng từ mẫu số liệu, dùng để ước lượng tham số θ thông qua công thức θˆ = ˆθ(x1, x2, , xn).
Cho biến ngẫu nhiên X có tham số θ, gọi (X 1 , X 2 , , X n ) là mẫu ngẫu nhiên của
X Khi đó hàm θˆ= ˆθ(X 1 , X 2 , , X n ) cũng được gọi là hàm ước lượng Hàm ước lượng θˆđược gọi là ước lượng không chệch đối với tham sốθ nếu E(ˆθ) =θ Ngược lạị, ta gọi θˆlà ước lượng chệch và E(ˆθ)−θ gọi là độ chệch của ước lượng.
5.1.3 Ước lượng không chệch của kì vọng và phương sai Định lý 5.1 Cho biến ngẫu nhiờn X của 1 tổng thể cú E(X) = à, V(X) = σ 2 Với (X 1 , X 2 , , X n ) là mẫu ngẫu nhiên của X Khi đó
1) X = X 1 +X 2 + +X n n là ước lượng khụng chệch của à.
(X i −X) 2 là ước lượng không chệch của σ 2
Chứng minh Thật vậy, ta có
= E(X 1 ) +E(X 2 + +E(X n ) n = nà n =à. Đối với S 2 ta có
5.1.4 Ước lượng không chệch tỉ lệ
Giả sử p là tỷ lệ phần tử có tính chất A trong một tổng thể, như tỷ lệ phế phẩm trong dây chuyền sản xuất hoặc tỷ lệ nam giới ở một địa phương Chúng ta sẽ sử dụng phân bố Bernoulli để mô tả, trong đó mỗi phần tử được gán giá trị 1 nếu có tính chất A và giá trị 0 nếu không có Khi chọn ngẫu nhiên một phần tử từ tổng thể, ta sẽ tiến hành phân tích dựa trên các giá trị này.
X 1 nếu phần tử đó có tính chất A,
Biến ngẫu nhiên X có phân bố Bernoulli với tham số p, có nghĩa là nếu phần tử không có tính chất A, thì X sẽ tuân theo phân bố này Định lý 5.2 chỉ ra rằng khi (X₁, X₂, , Xn) là mẫu ngẫu nhiên của X, các thuộc tính của phân bố Bernoulli sẽ được áp dụng cho mẫu này.
Pˆ= X1+X2+ +Xn n là một ước lượng không chệch của tham số p.
Nguyên lí xác suất nhỏ và nguyên lí xác suất lớn
Một biến cố có xác suất bằng 0 không thể xảy ra, nhưng một biến cố có xác suất rất nhỏ vẫn có thể xảy ra qua nhiều lần thử nghiệm Thực tế cho thấy rằng biến cố có xác suất bé hầu như không xảy ra khi chỉ thực hiện một hoặc hai lần thử Do đó, các nhà thống kê đã đưa ra "nguyên lý xác suất nhỏ", cho rằng một biến cố có xác suất rất nhỏ gần bằng 0 sẽ không xảy ra khi thực hiện phép thử một lần Ví dụ, khi mua một vé xổ số, xác suất trúng giải đặc biệt rất nhỏ, vì vậy có thể coi rằng biến cố trúng giải đặc biệt sẽ không xảy ra khi chỉ mua 1 vé.
Tương tự như vậy ta có nguyên lí xác suất lớn: Một biến cố có xác suất gần bằng
1 thì biến cố đó sẽ xảy ra khi thực hiện phép thử.
Trong ví dụ 5.3, một hộp chứa 9999 viên bi xanh và 1 viên bi đỏ, tất cả các viên bi đều có kích thước và khối lượng giống nhau Khi lấy ngẫu nhiên một viên bi từ hộp, chúng ta ký hiệu kết quả này để phân tích.
A là biến cố lấy được viên bi xanh,
B là biến cố lấy được viên bi đỏ.
Trong bài toán xác suất, với P(A) = 0,999 và P(B) = 0,001, theo nguyên lý xác suất lớn và nhỏ, khi lấy ngẫu nhiên một viên bi, khả năng cao là ta sẽ chọn được viên bi xanh, trong khi việc chọn viên bi đỏ gần như không xảy ra.
Đại học A có khoảng 5000 nam sinh viên, với chiều cao trung bình là 1,65 m và độ lệch chuẩn là 0,1 m.
Gọi (X 1 , X 2 , , X 36 ) là mẫu ngẫu nhiên của X Khi đó,
Tại Đại học A, với 5000 nam sinh viên, có tổng cộng 344774.10^86 mẫu kích thước n=36 khác nhau Trong số đó, 99,87% mẫu có trung bình mẫu nằm trong khoảng (1,6; 1,7), trong khi chỉ 0,13% mẫu có trung bình mẫu nằm ngoài khoảng này Theo nguyên lý xác suất lớn và nguyên lý xác suất nhỏ, khả năng chọn ngẫu nhiên một mẫu 36 nam sinh viên có trung bình mẫu X nằm trong (1,6; 1,7) là rất cao, trong khi khả năng chọn mẫu có trung bình mẫu X không nằm trong khoảng này là rất thấp.
Khoảng tin cậy cho kì vọng
Cho biến ngẫu nhiờn X của một tổng thể cú E(X) = à chưa biết, khoảng tin cậy cho kỡ vọng àcú dạng l < à < u Đề tỡm l và u ta tiến hành cỏc bước như sau:
(1) Cho trước một số α ∈(0; 1) khá bé gọi là mức ý nghĩa;
(2) Với mẫu ngẫu nhiên (X1, X2, , Xn), tìm hai hàm ngẫu nhiên
(3) Nếu kết quả chọn mẫu ngẫu nhiên thu được mẫu số liệu (x 1 , x 2 , , x n ) thì thay
X 1 =x 1 , X 2 =x 2 , , X n =x n vàoL vàU ta đượcL(x 1 , x 2 , , x n ), U(x 1 , x 2 , , x n ) Khi đú khoảng tin cậy với mức ý nghĩa α là L(x1, x2, , xn)< à < U(x1, x2, , xn)
1−α gọi là độ tin cậy của ước lượng.
Phương pháp ước lượng được xây dựng dựa trên nguyên lý xác suất lớn, với α nhỏ dẫn đến 1−α lớn Khi chọn một mẫu ngẫu nhiên (X₁, X₂, , Xn), biến cố L < à < U sẽ xảy ra Kết quả từ mẫu ngẫu nhiên X₁ = x₁, X₂ = x₂, , Xn = xn cho phép chúng ta ước lượng khoảng giá trị.
Bài toỏn Cho biến ngẫu nhiờn X của một tổng thể cú phõn bố chuẩn N(à;σ 2 ) với à chưa biết và σ 2 đó biết Tỡm khoảng tin cậy cho à với mức ý nghĩaα.
Nếu (X 1 , X 2 , , X n ) là mẫu ngẫu nhiên của X thì
Từ đó ta có định nghĩa:
Cho biến ngẫu nhiên X có phân bố chuẩn N(μ;σ²) với μ chưa biết và σ² đã biết Nếu (x₁, x₂, , xₙ) là mẫu số liệu của X, thì với độ tin cậy 1−α, khoảng tin cậy cho μ được tính bằng công thức x̄ - zₐ * (σ/√n) đến x̄ + zₐ * (σ/√n).
Trong ví dụ 5.5, trọng lượng sản phẩm của công ty A tuân theo phân phối chuẩn N(μ; σ²) với σ = 1 kg Khi chọn ngẫu nhiên 25 sản phẩm, trung bình mẫu được tính là x = 50,1 kg Để xác định khoảng tin cậy cho trọng lượng trung bình của sản phẩm công ty A với độ tin cậy 95%, cần sử dụng công thức tính khoảng tin cậy cho trung bình mẫu.
Với độ tin cậy 95%, khoảng tin cậy cho trọng lượng trung bình của sản phẩm:
Để đảm bảo sai số của ước lượng |x−à| không vượt quá ∆ với độ tin cậy 1−α, cần xác định cỡ mẫu n phù hợp, thỏa mãn điều kiện z α/2 σ n.
Khoảng tin cậy một phía
Khoảng tin cậy đối xứng trong trường hợp l = ∞ hoặc u =∞, thay z α
2 bởi z α ta thu được khoảng tin cậy một phía như sau:
Với độ tin cậy 1−α, khoảng tin cậy tối đa của à là à < x+zα
√σ n, với độ tin cậy 1−α, khoảng tin cậy tối thiểu của à là à > x−z α σ
Bài toỏn: Cho biến ngẫu nhiờn X của một tổng thể cú phõn bố chuẩn N(à;σ 2 ) với à chưa biết và σ 2 chưa biết Tỡm khoảng tin cậy cho à với độ tin cậy1−α.
Nếu (X 1 , X 2 , , X n )là mẫu ngẫu nhiên của X thì theo Định lí 4.15 ta có biến ngẫu nhiên
T = X−à S/√ n có phân bố Student n−1 bậc tự do.
Với mức ý nghĩaα lấy giá trị t n−1; α
2) =α trong đó T n−1 là phân bố Student n−1 bậc tự do Khi đó ta có
Vỡ vậy ta định nghĩa khoảng tin cậy cho à cho trường hợp chưa biết phương sai như sau:
Cho biến ngẫu nhiờnX cú phõn bố chuẩnN(à;σ 2 )vớiàchưa biết vàσ 2 chưa biết. Nếu (x 1 , x 2 , , x n ) là mẫu số liệu của X thì với độ tin cậy 1−α, khoảng tin cậy cho àlà x−t n−1; α
Ví dụ 5.6 Một mẫu 16 pin dùng cho smartphone được chọn ngẫu nhiên của công ty
Tuổi thọ trung bình của pin smartphone của công ty A là 24.308 giờ, với độ lệch chuẩn 727 giờ Giả sử rằng tuổi thọ pin tuân theo phân bố chuẩn, khoảng tin cậy 95% cho tuổi thọ trung bình có thể được tính toán để xác định độ tin cậy của thông tin này.
Khoảng tin cậy tuổi thọ trung bình của pin smartphone công ty A với độ tin cậy 95% là
Ví dụ 5.7 Kết quả khảo sát hàm lượng asen trong nước máy sinh hoạt của 25 mẫu được chọn ngẫu nhiên ở thành phố A thu được như sau (đơn vị 10 −3 mg/l)
Với độ tin cậy 95%, hãy tìm khoảng tin cậy cho hàm lượng asen trung bình trong nước máy sinh hoạt.
Giải. Để kiểm tra điều kiện phân bố chuẩn của tổng thể ta vẽ biểu đồ xác suất chuẩn.
Từ biểu đồ xác suất chuẩn (Hình 5.4) có thể kết luận hàm lượng asen trong nước máy sinh hoạt có phân bố chuẩn. x= 10,75; s= 2,49 t n−1; α
Với độ tin cậy 95%, khoảng tin cậy cho hàm lượng asen trung bình trong nước máy sinh hoạt là:
Một nghiên cứu năm 1993 của Hiệp hội Thủy sản Mỹ đã điều tra ô nhiễm thủy ngân trong loài cá vược miệng rộng, với mẫu cá được chọn từ 53 hồ ở Florida Kết quả cho thấy nồng độ thủy ngân trong cá được đo bằng đơn vị 10 −4 %.
Với độ tin cậy 95% hãy tìm khoảng tin cậy cho nồng độ thủy ngân trung bình có trong loài cá trên.
Biểu đồ xác suất chuẩn cho thấy nồng độ thủy ngân trong cá không phân bố chuẩn Tuy nhiên, với cỡ mẫu n=53 lớn hơn 30, theo Định lý giới hạn trung tâm, chúng ta vẫn có thể tiến hành ước lượng nồng độ thủy ngân này.
Với độ tin cậy 95%, khoảng tin cậy cho nồng độ thủy ngân trung bình trong cá vược là:
Khoảng tin cậy một phía
Với độ tin cậy 1−α,khoảng tin cậy tối đa cho kỡ vọng àlà à < x+t n−1;α s
Với độ tin cậy 1−α, khoảng tin cậy tối thiểu cho kỡ vọng àlà x−t n−1;α s
Ví dụ 5.9 Với độ tin cậy 95%, hãy tìm khoảng tin cậy tối đa và khoảng tin cậy tối thiểu hàm lượng asen trung bình trong Ví dụ 5.7.
Với độ tin cậy 95%, khoảng tin cậy tối đa hàm lượng asen trung bình trong nước máy sinh hoạt là: à 10,314.
Khoảng tin cậy cho tỉ lệ
Giả sử biến ngẫu nhiên X tuân theo phân bố Bernoulli với tham số p, đại diện cho tỷ lệ phần tử trong tổng thể có tính chất A Trong phần này, chúng ta sẽ phát triển công thức khoảng tin cậy cho p với mức ý nghĩa α.
Gọi (X 1 , X 2 , , X n ) mẫu ngẫu nhiên của X Đặt
Theo Định lí giới hạn trung tâm, với n đủ lớn ta có
√n có xấp xỉ phân phối chuẩn tắcN(0; 1) Nên vớiα ∈(0; 1)cho trước, lấyz α
Mặt khác do E(X) =p nên Pˆ là một ước lượng của p Vì vậy ta có
Vì vậy ta định nghĩa khoảng tin cậy cho p như sau.
Nếupˆ=k/n là một ước lượng của tỉ lệptừ 1 mẫu ngẫu nhiên kích thước n thì với độ tin cậy1−α, khoảng tin cậy cho p là ˆ p−z α
2 rp(1ˆ −p)ˆ n Ước lượng trên tốt nhất khi k ≥10và n−k≥10.
Để tìm khoảng tin cậy 95% cho tỷ lệ phế phẩm của nhà máy, ta có 100 sản phẩm được kiểm tra và phát hiện có 10 phế phẩm Tỷ lệ phế phẩm là 10% Sử dụng công thức khoảng tin cậy cho tỷ lệ, ta tính được khoảng tin cậy cho tỷ lệ phế phẩm là [0.1 - Z * √(p(1-p)/n), 0.1 + Z * √(p(1-p)/n)], với Z tương ứng với độ tin cậy 95% Kết quả cho thấy khoảng tin cậy này cung cấp thông tin hữu ích về chất lượng sản phẩm của nhà máy.
100 = 0,059. Với độ tin cậy 95%, khoảng tin cậy cho tỉ lệ phế phẩm của nhà máy là
Khoảng tin cậy một phía
Chopˆ=k/n là ước lượng tỉ lệ p từ mẫu ngẫu nhiên kích thước n Với độ tin cậy 1−α, khoảng tin cậy tối đa cho p được xác định là p < pˆ + z(α) √(pˆ(1−pˆ)/n) Ngược lại, khoảng tin cậy tối thiểu cho p là p > pˆ − z(α) √(pˆ(1−pˆ)/n).
Nội dung trọng tâm Chương 5
1 Khoảng tin cậy kì vọng của phân bố chuẩn. i) Đã biết phương sai. x−z α
√σ n. ii) Chưa biết phương sai. x−t n−1; α
2 Khoảng tin cậy tỉ lệ. ˆ p−z α
Công ty bao bì HP vừa nhập 20.000 bao hạt nhựa từ một nhà cung cấp quen thuộc, với dữ liệu quá khứ cho thấy khối lượng của các bao này có phân bố chuẩn và phương sai là 36 kg² Sau khi chọn ngẫu nhiên 25 bao để cân, giá trị trung bình mẫu thu được là 96 kg/bao Với độ tin cậy 95%, chúng ta có thể ước lượng khoảng tin cậy cho khối lượng trung bình của 20.000 bao hạt nhựa này.
Doanh số của một cửa hàng được mô hình hóa như một biến ngẫu nhiên phân phối chuẩn với độ lệch chuẩn là 2 triệu đồng/tháng Qua khảo sát 600 cửa hàng có quy mô tương tự, doanh số trung bình ghi nhận được là 8,5 triệu đồng Với độ tin cậy 95%, khoảng tin cậy cho doanh số trung bình của các cửa hàng này cần được ước lượng chính xác để phục vụ cho việc phân tích và ra quyết định kinh doanh.
5.3 Cho một ô tô chạy thử 32 lần trên đoạn đường từ A đến B người ta ghi nhận được lượng xăng hao phí như sau:
Lượng xăng hao phí (lít) Tần số
Để phân tích dữ liệu, chúng ta cần vẽ biểu đồ tần số nhằm kiểm tra sự phân bố chuẩn của lượng xăng hao phí Tiếp theo, với độ tin cậy 95%, chúng ta sẽ ước lượng khoảng tin cậy cho lượng xăng hao phí trung bình của xe khi di chuyển từ A đến B.
5.4 Để định mức thời gian gia công một chi tiết máy, người ta theo dõi ngẫu nhiên quá trình gia công 25 chi tiết và thu được số liệu sau:
Thời gian gia công (phút) Tần số
Để thực hiện phân tích thống kê, trước tiên, cần vẽ biểu đồ tần số để kiểm tra phân bố chuẩn của dữ liệu Tiếp theo, tiến hành ước lượng khoảng tin cậy cho thời gian gia công trung bình của một chi tiết máy với độ tin cậy 1−α = 0,95.
Để ước lượng kích thước trung bình của các chi tiết máy được gia công bởi một máy gia công, tiến hành lấy ngẫu nhiên 25 chi tiết do máy đó sản xuất và thực hiện đo đạc kích thước của chúng.
Để kiểm tra phân bố chuẩn, chúng ta sẽ vẽ biểu đồ tần số và biểu đồ xác suất chuẩn cho các giá trị 26,4, 25,4, 23,3, 23,0, 24,3 Với độ tin cậy 95%, chúng ta sẽ ước lượng khoảng tin cậy cho kích thước trung bình các chi tiết do máy gia công.
Một nghiên cứu về lương của 100 kỹ sư tốt nghiệp từ trường Đại học Bách Khoa sau 3 năm làm việc cho thấy mức lương trung bình đạt khoảng 5.6 triệu đồng Kết quả này được thu thập từ một mẫu ngẫu nhiên, phản ánh tình hình thu nhập của kỹ sư trong giai đoạn đầu sự nghiệp.
Để phân tích dữ liệu, trước tiên, chúng ta cần vẽ biểu đồ tần số và biểu đồ xác suất chuẩn từ các giá trị đã cho Sau đó, với độ tin cậy 95%, chúng ta sẽ ước lượng khoảng tin cậy cho lương trung bình của các kỹ sư tốt nghiệp sau 3 năm Việc này sẽ giúp đánh giá chính xác hơn về mức lương mà các kỹ sư có thể nhận được trong giai đoạn đầu sự nghiệp của họ.
Để ước lượng khoảng tin cậy tỷ lệ chính phẩm của một nhà máy với độ tin cậy 0,95, ta tiến hành kiểm tra 100 sản phẩm và phát hiện có 10 phế phẩm Từ đó, tỷ lệ chính phẩm được tính toán là 90% Khoảng tin cậy cho tỷ lệ này sẽ giúp xác định độ chính xác của ước lượng, cho thấy rằng nhà máy có khả năng sản xuất sản phẩm chất lượng cao.
Trong một nghiên cứu về chất lượng đồ hộp, sau khi mở 200 hộp từ kho, có 28 hộp bị biến chất Với độ tin cậy 0,95, ta có thể ước lượng khoảng tin cậy cho tỷ lệ đồ hộp biến chất trong kho Tỷ lệ này cho thấy mức độ an toàn và chất lượng của sản phẩm, giúp người tiêu dùng có thông tin cần thiết khi lựa chọn đồ hộp.
Trong một cuộc khảo sát ngẫu nhiên với 1.600 cử tri trong đợt vận động bầu cử tổng thống, có 960 người cho biết sẽ bỏ phiếu cho ứng cử viên A Với độ tin cậy 90%, khoảng tin cậy cho tỉ lệ phiếu bầu của ứng cử viên A được xác định để phản ánh sự ủng hộ của cử tri.
Nhà máy A sản xuất một loại sản phẩm và để ước lượng tỷ lệ thành phẩm, 400 sản phẩm đã được chọn ngẫu nhiên và chia thành 40 nhóm để kiểm tra Kết quả thu được từ quá trình này sẽ cung cấp thông tin quan trọng về chất lượng sản phẩm.
Số thành phẩm trong nhóm 1 2 3 4 5 6 7 8 9 10
Với độ tin cậy 90% hãy ước lượng khoảng tin cậy tỉ lệ thành phẩm của nhà máy.
KIỂM ĐỊNH GIẢ THUYẾT
Khái niệm chung
6.1.1 Giả thuyết thống kê và kiểm định giả thuyết thống kê
Cho biến ngẫu nhiên X của một tổng thể có tham số θ.
Giả thuyết thống kê về θ là các khẳng định về giá trị của θ.
(1) à là tuổi thọ trung bỡnh của người Việt Nam Giả thuyết thống kờ cú thể là: à= 60 (tuổi) hoặc à >60, hoặc à6= 60,
(2) X là biến ngẫu nhiên đo trọng lượng sản phẩm của một nhà máy vàσ 2 là phương sai của X Giả thuyết thống kê có thể làσ 2 = 1, hoặc σ 2 6= 0,5,
(3) p là tỉ lệ phế phẩm của nhà máy A Giả thuyết thống kê có thể là: p à 0 , miền bác bỏ H 0 là W α = [z α ; +∞) (xem Hình 6.2 (a)).
- Đối với bài toán kiểm định giả thuyết
H 1 : à < à 0 ,miền bác bỏ H 0 là W α = (−∞;−z α ] (xem Hình 6.2 (b)).
Giỏ trị kiểm định thống kờ: z= (x−à0) σ
√n. Đối thuyết Miền bác bỏ H0
H 1 :à < à 0 W α = (−∞;−z α ] Nếu z ∈W α thì bác bỏ H 0 , nếu z 6∈W α thì chấp nhận H 0
Một nhà sản xuất máy tính xách tay đang đánh giá nguồn cấp điện cho máy tính, với tiêu chuẩn là 19 volt Sau khi đo nguồn cấp điện của 25 mẫu sạc pin ngẫu nhiên từ hãng A, kết quả cho thấy trung bình mẫu là x = 19,25 volt Giả sử nguồn cấp điện của sạc pin này có phân bố chuẩn với độ lệch chuẩn σ = 0,5 volt Với mức ý nghĩa α = 0,05, cần tiến hành kiểm định giả thuyết để xác định tính hợp lệ của nguồn cấp điện này.
H0 :à= 19 (volt) với đối thiết H1 :à6= 19 (volt) với à là nguồn cấp điện trung bỡnh của loại xạc pin trên.
Miền bác bỏH0 là W = (−∞;−1,96]∪[1,96; +∞). z = x−à σ 0 √ n = 2,5∈W nên bác bỏ H0.
Trong năm trước, trọng lượng trung bình của bò xuất chuồng tại một trang trại là 380 kg Năm nay, trang trại áp dụng một chế độ ăn mới nhằm tăng trọng lượng bò nhanh hơn Sau khi thử nghiệm, 50 con bò được cân và có trọng lượng trung bình là 390 kg Với mức ý nghĩa α = 0,05, cần xem xét liệu trọng lượng trung bình của bò xuất chuồng đã tăng lên hay chưa, giả định rằng trọng lượng bò có phân phối chuẩn với độ lệch chuẩn σ = 25,2 kg.
Gọi à là trọng lượng trung bỡnh của bũ ỏp dụng chế độ ăn mới Bài toỏn kiểm định giả thuyết H0 :à= 380, H1 :à >380.
√n ≈2,8∈W nên có cơ sở bác bỏ H 0 Tức là với mức ý nghĩa α= 0,05có thể cho rằng trọng lượng trung bình của bò xuất chuồng đã tăng lên. p-giá trị
Trở lại bài toán kiểm định giả thuyết
H1 : à6=à0. Với mức ý nghĩa α, giả thuyết gốc H 0 bị bác bỏ khi và chỉ khi z ≤ −z α
Giá trị xác suất2(1−Φ(|z|))được gọi là p-giá trị Khi đó thủ tục kiểm định được thực hiện như sau:
2 Nếu p-giá trị ≤α thì bác bỏ H 0 , nếu p-giá trị> α thì chấp nhận H 0
- Đối với bài toán kiểm định giả thuyết
- Đối với bài toán kiểm định giả thuyết
Cho biến ngẫu nhiờnX của một tổng thể cú phõn bố chuẩnN(à;σ 2 )với kỡ vọng à chưa biết và phương sai σ 2 chưa biết.
Xét bài toán kiểm định giả thuyết:
H 1 : à6=à 0 ,trong đú à 0 là một số thực đó cho.
Giả sử H 0 đỳng, khi đú à=à 0 Với (X 1 , X 2 , , X n ) là mẫu ngẫu nhiờn của X Khi đó
S/√ n có phân bố student n−1 bậc tự do.
Với một số α∈(0; 1)cho trước, lấy t n−1; α
2) = α 2 với T n−1 là phân bố student n−1 bậc tự do, khi đó ta có
Vớiαlà một số khá bé thì biến cố chọn được một mẫu kích thướcncóT ∈(−∞;−t n−1; α
2; +∞)sẽ không xảy ra Vì vậy nếu chọn ngẫu nhiên được 1 mẫu số liệu(x 1 , x 2 , , x n ) thỏa mãn t = x−à 0 s/√ n ∈(−∞;−t n−1; α
Như vậy, miền bác bỏ H 0 là W α = (−∞;−t n−1; α
Lý luận tương tự như trên ta có:
- Bài toán kiểm định giả thuyết
- Bài toán kiểm định giả thuyết
H 1 : à < à 0 ,miền bác bỏ H 0 là W α = (−∞;−t n−1;α ] Kết luận
√n. Đối thuyết Miền bác bỏ H 0 p-giá trị
Sau khi cải tiến kỹ thuật, tuổi thọ trung bình của bóng đèn do nhà máy A sản xuất đã được kiểm tra bằng cách chọn ngẫu nhiên 25 bóng đèn, cho kết quả tuổi thọ trung bình mẫu là 2010 giờ với độ lệch chuẩn 15 giờ Với mức ý nghĩa 0,025, có thể kết luận rằng tuổi thọ bóng đèn đã tăng lên so với mức 2000 giờ ban đầu, dựa trên giả thuyết rằng tuổi thọ bóng đèn có phân phối chuẩn.
Gọi à là tuổi thọ trung bỡnh của búng đốn sau cải tiến kĩ thuật Bài toỏn kiểm định giả thuyết H 0 :à= 2000, H 1 :à >2000. t n−1;α =t 24;0,025 = 2,0639.
√n= 3,33∈W có cơ sở bác bỏ H 0 tức là có cơ sở để kết luận "sau khi cải tiến kĩ thuật, tuổi thọ bóng đèn có tăng lên".
Trong một nghiên cứu về nồng độ glycerol trong rượu vang trắng của công ty A, các mẫu số liệu cho thấy nồng độ glycerol (mg/ml) lần lượt là 2,67; 4,62; 4,14; 3,81; và 3,83 Theo tiêu chuẩn, nồng độ glycerol trung bình cần đạt tối thiểu 4 mg/ml Với mức ý nghĩa 5%, cần xác định xem nồng độ glycerol trung bình của công ty A có đạt tiêu chuẩn hay không.
Từ biểu đồ xác suất chuẩn (Hình 6.6) ta có thể chấp nhận tổng thể có phân bố chuẩn.
Gọi à là nồng độ glycerol trung bỡnh trong rượu vang trắng của cụng ty A Bài toán kiểm định giả thuyết:
Từ mẫu số liệu ta có n= 5; x= 3.814; s= 0,718. t= 3.814−4
√5≈ −0,66∈W nên chưa có cơ sở bác bỏ H 0
Hiện tượng mưa axit chủ yếu do khí thải SO2 và NOx phát sinh từ hoạt động sản xuất và tiêu thụ than đá, dầu mỏ, cũng như từ khí thải công nghiệp Nước mưa được coi là mưa axit khi có độ pH dưới 6,0 Trong một nghiên cứu với 12 mẫu nước mưa lấy ngẫu nhiên tại một thành phố, các kết quả phân tích cho thấy độ pH của nước mưa có sự biến đổi đáng kể.
Với mức ý nghĩa α= 0,05 có thể cho rằng độ pH trung bình trong nước mưa ở thành phố trên thấp hơn 6,0 không?
Từ biểu đồ xác suất chuẩn (Hình 6.7) có thể chấp nhận nồng độ pH trong nước mưa có phân bố chuẩn.
Gọiàlà độ pH trung bỡnh trong nước mưa Bài toỏn kiểm định giả thuyết H 0 :à= 6;
√n =−1,256∈W nên chưa thể bác bỏH 0
Trong một nghiên cứu, 121 sản phẩm của xí nghiệp được kiểm tra ngẫu nhiên, cho thấy trọng lượng trung bình mẫu là 5,8 kg với độ lệch chuẩn mẫu là 1,4 kg Với mức ý nghĩa α= 5%, cần xác định xem có thể kết luận rằng trọng lượng trung bình sản phẩm của xí nghiệp đạt 6 kg hay không, trong bối cảnh trọng lượng sản phẩm tuân theo phân phối chuẩn.
Gọi à là trọng lượng sản phẩm trung bỡnh của sản phẩm Bài toỏn kiểm định giả thuyết H 0 :à= 6, H 1 :à6= 6. t n−1; α
√n =−1,5716∈W nên chưa có cơ sở bác bỏ H 0
So sánh 2 kì vọng
ChoX và Y biến số ngẫu nhiên của hai tổng thể độc lập nhau và lần lượt có phân bố chuẩn N(à x ;σ x 2 ) và N(à y ;σ y 2 ).
Trong mục này ta xột bài toỏn so sỏnh hai kỡ vọng à x và à y Giả thiết quan trọng cho bài toán này là
(i) (X 1 , X 2 , , X m ) là một mẫu ngẫu nhiờn của biến ngẫu nhiờn X ∼N(à x ;σ x 2 ). (ii) (Y 1 , Y 2 , , Y n ) là một mẫu ngẫu nhiờn của biến ngẫu nhiờn Y ∼N(à y ;σ y 2 ). (iii) Hai mẫu ngẫu nhiên trên độc lập nhau.
Từ các giả thiết trên ta có
E(X−Y) =à x −à y , và phương sai của X−Y là
Vì vậy, biến ngẫu nhiên
Z = (X−Y)−(à x −à y ) rσ x 2 m + σ 2 y n có phân phối chuẩn tắc N(0; 1).
Khi chưa biết hai phương sai σ²ₓ và σ²ᵧ nhưng có cỡ mẫu lớn, chúng ta có thể sử dụng sx và sy để ước lượng σₓ và σᵧ tương ứng Áp dụng Định lý giới hạn trung tâm, ta có thể rút ra các kết luận quan trọng về phân phối của các biến ngẫu nhiên này.
Z = (X−Y)−(à x −à y ) rs 2 x m + s 2 y n có xấp xỉ phân phối chuẩn tắc N(0; 1).
Từ đó ta có kết quả sau.
X ∼ N(àx;σ x 2 ) và Y ∼ N(ày;σ 2 y ) trong đú σ x 2 và σ y 2 đều chưa biết; m > 30 và n >30.
Giá trị kiểm định thống kê: z = x−y−∆ 0 qs 2 x m + s n 2 y Đối thuyết Miền bác bỏ H 0 p-giá trị
Ví dụ 6.10 Người ta cân trẻ sơ sinh ở hai khu vực thành thị và nông thôn, kết quả thu được như sau:
Khu vực Số trẻ Trung bình mẫu Phương sai mẫu Nông thôn m= 60 x= 3,0 kg s 2 x = 0,4kg 2 Thành thị n = 50 y= 3,1 kg s 2 y = 0,5 kg 2
Với mức ý nghĩa 0,05, có thể xác định liệu trọng lượng trung bình của trẻ sơ sinh ở hai khu vực khác nhau có sự khác biệt hay không, dựa trên giả thuyết rằng trọng lượng trẻ sơ sinh ở hai khu vực này tuân theo phân phối chuẩn.
Trong nghiên cứu trọng lượng trung bình của trẻ sơ sinh ở nông thôn và thành thị, giả thuyết H0 được đặt ra là trọng lượng trung bình của trẻ sơ sinh ở nông thôn (à x) bằng trọng lượng trung bình ở thành thị (à y) Ngược lại, giả thuyết đối H1 cho rằng trọng lượng trung bình của trẻ sơ sinh ở nông thôn và thành thị là khác nhau (à x ≠ à y) Việc kiểm định này nhằm xác định sự khác biệt về trọng lượng giữa hai nhóm trẻ sơ sinh.
= −0,77 6∈ W nên chưa có cơ sở bác bỏ H0, tức là có thể coi trọng lượng trung bình của trẻ sơ sinh ở hai khu vực bằng nhau.
6.3.2 Cỡ mẫu nhỏ và hai phương sai bằng nhau
Giả sử rằng chưa biết hai phương sai σ 2 x và σ y 2 nhưng σ x 2 =σ 2 y =σ 2 Khi đó
V(X−Y) = σ x 2 m + σ 2 y n =σ 2 (1 m + 1 n). Để ước lượng σ 2 ta sử dụng hàm ước lượng
Ta có định lí sau. Định lý 6.11.
S p p 1/m+ 1/n có phân phối Student m+n−2 bậc tự do. Áp dụng định lí trên ta có kết quả sau.
Giá trị kiểm định thống kê t= (x−y)−∆ 0 s p r1 m + 1 n với s 2 p = (m−1)s 2 x + (n−1)s 2 y m+n−2 Đối thuyết Miền bác bỏ H 0 p-giá trị
Một nghiên cứu đã được tiến hành với 20 người ở phường A và 19 người ở phường B nhằm so sánh thu nhập trung bình hàng năm giữa hai phường Kết quả cho thấy, ở phường A, thu nhập trung bình là 18,27 với phương sai là 8,74 Nghiên cứu này giúp xác định sự khác biệt về thu nhập giữa cư dân hai phường.
Với mức ý nghĩa 0,05, chúng ta có thể xác định xem thu nhập trung bình của cư dân ở hai phường có khác nhau hay không, giả định rằng thu nhập hàng năm của họ có phân phối chuẩn và hai phương sai là bằng nhau.
Giải Gọià x vàà y tương ứng là thu nhập trung bỡnh hàng năm của dõn cư hai phường
A và B Ta cần kiểm định giả thuyết H0:àx=ày với đối thiếtH1:àx6=ày.
Từ giả thuyết bài toán ta tính được s 2 p = (m−1)s 2 x + (n−1)s 2 y m+n−2 = 2,773.
1/m+ 1/n = 1,6676∈W. nên chấp nhận H 0 , tức là chưa có cơ sở cho rằng thu nhập trung bình của dân cư hai phường đó khác nhau.
Để so sánh chiều cao trung bình của nam thanh niên trưởng thành ở hai vùng A và B, một nghiên cứu đã chọn ngẫu nhiên 10 nam thanh niên ở mỗi vùng Số liệu chiều cao của hai nhóm này được ghi nhận và phân tích để đưa ra kết luận về sự khác biệt giữa hai khu vực.
B 172 170 167 169 171 167 173 165 163 174Với mức ý nghĩa 5% hãy so sánh chiều cao trung bình của nam thanh niên trưởng thành ở hai vùng dân cư trên.
Từ biểu đồ xác suất chuẩn (Hình 6.8) ta có thể chấp nhận hai tổng thể có phân phối chuẩn và hai phương sai bằng nhau.
Gọiàx vàày lần lượt là chiều cao trung bỡnh của nam thanh niờn trưởng thành ở vựng dân cư A và B.
Xột bài toỏn so sỏnh H 0 :à x =à y , H 1 :à x 6=à y x= 169,3; s x = 3,33; y = 169,1; s y = 3,57; s p = 3,64.
Miền bác bỏH 0 :W = (−∞;−2,1]∪[2,1; +∞) Giá trị kiểm định thống kêt= 0,16∈W nên chưa có cơ sở bác bỏ H0.
6.3.3 Cỡ mẫu nhỏ và hai phương sai không bằng nhau
Giả sử rằng chưa biết hai phương sai σ x 2 và σ 2 x vàσ x 2 6=σ 2 y Nếu giả thuyết thống kê
T = X−Y −∆ 0 rS x 2 m +S y 2 n có phân phối Student ϑ bậc tự do (T ϑ ), trong đó ϑ là phần nguyên của
Giá trị kiểm định thống kê t= (x−y)−∆ 0 r s 2 x m +s 2 y n Đối thuyết Miền bác bỏH 0 p-giá trị
H 1 :à x −à y F AB ).
Miền bác bỏH 0 là W = [f(m−1)(n−1);rmn−mn;α; +∞).
Trong đó, F x,y là phân phối Fisher, f x;y;α là phân vị mức α của phân phối Fisher.
Ví dụ 8.4 Hàm lượng saponin (mg) của cùng một loại dược liệu được thu hái trong
2 mùa (khô và mưa: trong mỗi mùa lấy mẫu 3 lần (đầu mùa, giữa mùa, cuối mùa) và từ 3 miền (Nam, Trung, Bắc) thu được kết quả sau:
Nam Trung Bắc Đầu mùa 2.4 2.1 3.2
Với mức ý nghĩa α = 0.05, cần xác định xem hàm lượng saponin có sự khác biệt theo mùa và miền hay không Nếu có sự khác biệt, cần xem xét liệu hai yếu tố mùa và miền có tương tác với nhau hay không.
Ta có bảng các giá trị của Tij:
Suy ra bảng ANOVA 2 nhân tố sau:
Nguồn Bậc tự do SS MS F
Kết quả phân tích cho thấy miền bác bỏ giả thuyết H 0 A là W = [4.7472; +∞), H 0 B là W = [3.8853; +∞), và H 0 AB cũng là W = [3.8853; +∞) Điều này cho thấy hàm lượng saponin trong dược liệu thay đổi theo mùa và theo miền, đồng thời không có sự tương tác giữa mùa và miền đối với hàm lượng saponin.
Để kiểm tra giả thuyết của mô hình với sai số ngẫu nhiên có phân bố chuẩn N(0;σ²), chúng ta cần vẽ biểu đồ xác suất chuẩn của phần dư Dữ liệu phần dư sẽ được sử dụng để thực hiện phân tích này.
Biểu đồ xác suất chuẩn của phần dư, như thể hiện trong Hình 8.3, gần như nằm trên đường thẳng đi qua gốc tọa độ, cho thấy giả thiết về sai số ngẫu nhiên với phân bố chuẩn N(0;σ²) được thỏa mãn.
Đại cương về bố trí thí nghiệm
Bố trí thí nghiệm là quá trình lập kế hoạch chi tiết cho các bước thực hiện nhằm thu thập dữ liệu cho vấn đề nghiên cứu Mục tiêu chính là đạt được nhiều kết luận chính xác nhất với chi phí tối ưu.
Nghiệm thức là các mức nhân tố, với mỗi mức được coi là một nghiệm thức riêng biệt Đơn vị thí nghiệm là đơn vị nghiên cứu trong thí nghiệm, cụ thể là đơn vị nhỏ nhất mà một nghiệm thức được áp dụng.
8.3.2 Hai nguyên tắc cơ bản về bố trí thí nghiệm
1 Lặp lại Một nghiệm thức phải được lặp lại nhiều hơn 1 đơn vị thí nghiệm Số nghiệm thức càng tăng thì sai số chuẩn càng nhỏ và độ chính xác của thí nghiệm càng cao.
2 Ngẫu nhiên hoá Mẫu phải được chọn sao cho tất cả các đơn vị thí nghiệm được bố trí ngẫu nhiên vào các nghiệm thức Điều này giúp tránh được các thành kiến của người làm thí nghiệm cũng như các biến động sinh học, môi trường, .
8.3.3 Kỹ thuật ngẫu nhiên hoá Để thực hiện việc ngẫu nhiên hoá, tránh những sai sót chủ quan của người thí nghiệm Có hai phương pháp ngẫu nhiên thường dùng là dùng bảng số ngẫu nhiên và tạo các số ngẫu nhiên bằng phần mềm thống kê.
8.3.4 Các kiểu bố trí thí nghiệm phổ biến
1 Bố trí ngẫu nhiên hoàn toàn (CRD) Đây là kiểu bố trí thí nghiệm đơn giản nhất, trong đó tất cả các đơn vị thí nghiệm được bố trí vào các nghiệm thức Kiểu bố trí này được dùng khi các đơn vị thí nghiệm không có những sai khác mang tính hệ thống Chẳng hạn tất cả các động vật thí nghiệm có cùng độ tuổi, tất cả các nông trại đều có kỹ thuật canh tác giống nhau . Kiểu bố trí thí nghiệm này được sử dụng trong phân tích phương sai một nhân tố.
Ví dụ 8.5 Ta cần bố trí 20 con gà tương đương nhau vào 4 khẩu phần ăn, mỗi khẩu phần ăn có 5 con gà.
Để sử dụng phần mềm thống kê Minitab, trước tiên, ta cần ký hiệu các khẩu phần ăn là KP1, KP2, KP3 và KP4
6 đến dòng 10 là KP2, từ dòng 11 đến dòng 15 là KP3 và từ dòng 16 đến dòng 20 là KP4 Sau đó vào Calc -> Random Data -> Integer.
- Number of rows of data to generate: nhập 20
- Maximum value: nhập 20 kết thúc chọn OK.
Trình bày số liệu của CRD
Sử dụng phân tích phương sai 1 nhân tố để so sánh hiệu quả của các nghiệm thức.
2 Bố trí khối hoàn toàn ngẫu nhiên (RCBD)
Trong thiết kế thí nghiệm, kiểu bố trí khối (block design) là phương pháp tổ chức các đơn vị thí nghiệm thành từng khối, mỗi khối bao gồm đầy đủ các nghiệm thức và có tính chất đồng đều Sự khác biệt giữa các khối có thể ảnh hưởng đến kết quả thí nghiệm Thông tin này cần được trình bày rõ ràng trong số liệu của thiết kế CRD.
Sử dụng phân tích phương sai hai nhân tố để so sánh hiệu quả của các nghiệm thức, trong đó nhân tố hàng đại diện cho các khối và nhân tố cột đại diện cho các nghiệm thức Phương pháp này giúp xác định sự khác biệt rõ rệt giữa các nghiệm thức và đánh giá tác động của chúng trong các khối khác nhau.
3 Bố trí ô vuông La tinh (LSD)
Bố trí thí nghiệm kiểu RCBD giúp khắc phục vấn đề của CRD khi đơn vị thí nghiệm không đồng nhất theo một hướng Tuy nhiên, trong thực tế, khi biến động xảy ra theo cả hai hướng, việc sử dụng RCBD có thể dẫn đến mất độ chính xác và kết luận sai.
Vì vậy chúng ta cần bố trí khối theo hai hướng.
Trình bày số liệu của LSD
Các kết quả nói trên được trình bày trong bảng ANOVA sau đây.
Nguồn SS Bậc tự do MS Tỉ số F
Nghiệm thức SST r m−1 M ST F =M ST r/M SE
Trong đóSSA,SSB,SSE,SST,M SA,M SB tính tương tự trong phân tích phương sai 2 nhân tố không lặp,
T i 2 m − Q m 2 2 với T i là tổng theo nghiệm thức,
M SE =M ST −M SA−M SB−M ST r,
Bài toán kiểm định giả thuyết
H 0 : Giá trị trung bình của các nghiệm thức bằng nhau
H 1 : có ít nhất 2 giá trị trung bình của các nghiệm thức khác nhau.
Miền bác bỏ H 0 là W = [fm−1,(m−1)(m−2)(α); +∞).
Nội dung trọng tâm Chương 8
1 Mô hình phân tích phương sai một nhân tố:
Trong đó ij là các biến ngẫu nhiên độc lập, có cùng phân phối chuẩn N(0;σ 2 ); α j là tác dụng của mức nhân tố A j lên biến số ngẫu nhiên X.
Bài toán kiểm định giả thuyết
Nguồn Bậc tự do Tổng bình phương
Trung bình bình phương Tỉ số F
Nhân tố k-1 SSF MSF M SF
2 Mô hình phân tích phương sai hai nhân tố không lặp:
Trong đó ij là các biến ngẫu nhiên độc lập, có cùng phân phối chuẩnN(0;σ 2 ). i) Bài toán kiểm định giả thuyết 1
(Các mức A 1 , , A m có hiệu quả như nhau)
(Có ít nhất 2 mức A i và A j có hiệu quả khác nhau) ii) Bài toán kiểm định giả thuyết 2
(Các mức B 1 , B n có hiệu quả như nhau)
(có ít nhất hai mức B i và B j có hiệu quả khác nhau) Bảng ANOVA 2 nhân tố không lặp:
Nguồn Bậc tự do SS MS Tỉ số F
3 Mô hình phân tích phương sai hai nhân tố có lặp:
Trong đó ijk là các biến ngẫu nhiên độc lập, có cùng phân phối chuẩn N(0;σ 2 ). i) Bài toán kiểm định giả thuyết 1
H 0 A :α1=α2 = =α k = 0 (Các mức A 1 , , A m có hiệu quả trung bình như nhau) với đối thuyết
H 1 A :α 2 1 +α 2 2 + +α 2 k 6= 0 (Có ít nhất 2 mức A i và A j có hiệu quả khác nhau) ii) Bài toán kiểm định giả thuyết 2
H 0 B :β 1 =β 2 = =β k = 0 (Các mức B 1 , , B n có hiệu quả như nhau) với đối thuyết
H 1 B :β 1 2 +β 2 2 + +β k 2 6= 0 (Có ít nhất 2 mức Bi và Bj có hiệu quả khác nhau) iii) Bài toán kiểm định giả thuyết 3
H 0 AB :γ ij = 0 với mọi i, j (không có sự tương tác giữa hai nhân tố A và B) với đối thuyết
H 1 AB : có ít nhất mộtγ ij 6= 0 ( có sự tương tác giữa hai nhân tố A và B) Bảng ANOVA 2 nhân tố có lặp:
Nguồn Bậc tự do SS MS Tỉ số F
Tương tác (m−1)(n−1) SSI MSI F AB
Sai số rmn−mn SSE MSE
Hàm lượng oxy trong nước là một chỉ tiêu quan trọng để đánh giá mức độ ô nhiễm môi trường Trong một khảo sát, 24 mẫu nước đã được lấy ngẫu nhiên từ 4 khu vực khác nhau, ký hiệu KV1, KV2, KV3 và KV4, để phân tích hàm lượng oxy hòa tan (đơn vị tính theo phần triệu) Kết quả của các mẫu này được ghi nhận trong bảng dưới đây.
Với mức ý nghĩa 5%, nghiên cứu này nhằm xác định sự khác biệt về hàm lượng oxy hòa tan giữa bốn khu vực Kết quả sẽ giúp rút ra kết luận về mức độ ô nhiễm của từng khu vực.
.8.2 Nghiên cứu năng suất của 5 giống bắp lai được thụ phấn ngẫu nhiên, thí nghiệm được lặp lại 5 lần trên mỗi giống, kết quả ghi nhận trong bảng sau:
Giống 1 Giống 2 Giống 3 Giống 4 Giống 5
Hãy kiểm tra xem năng suất của 5 giống bắp nầy có phụ thuộc vào phẩm chất giống hay không.
8.3 Một nhà nông học khảo sát hàm lượng phosphorus của lá cây từ 3 giống táo
(1, 2 và 3) Mẫu được lấy ngẫu nhiên từ 5 lá của mỗi giống đem phân tích hàm lượng phosphorus Dữ liệu được trình bày trong bảng sau:
Hãy kiểm tra giả thuyết "hàm lượng phosphorus trung bình của ba giống táo là giống nhau".
Trong một nghiên cứu, một phòng thí nghiệm lớn đã sử dụng 4 loại thiết bị để đo độ pH của 24 mẫu đất đã biết độ pH Các mẫu đất được phân chia ngẫu nhiên thành 4 nhóm, mỗi nhóm gồm 6 mẫu, tương ứng với từng thiết bị Mục tiêu của nghiên cứu là xác định sự khác biệt về giá trị trung bình độ pH đọc được từ các thiết bị này Kết quả của thí nghiệm đã được ghi nhận và trình bày trong bảng.
Hãy xác định xem trung bình pH đọc được từ bốn thiết bị có sai khác nhau hay không?
Các nhà nghiên cứu đã tiến hành thí nghiệm nhằm so sánh hàm lượng tinh bột của khoai tây trồng trên đất cát với ba nhóm khác nhau Nhóm A là nhóm đối chứng, được tưới bằng nước cất, trong khi nhóm B nhận chất dinh dưỡng Hoagland với nồng độ thấp và nhóm C nhận chất dinh dưỡng Hoagland với nồng độ cao.
Sau 25 ngày trồng, 18 cây khoai tây cùng một giống đã được phân chia ngẫu nhiên thành ba nhóm, và hàm lượng tinh bột ở cuống lỏ (àg/mg) được ghi nhận trong bảng dưới đây.
Hàm lượng dinh dưỡng A 22 20 21 18 16 14 Hàm lượng dinh dưỡng B 12 14 15 10 9 6 Hàm lượng dinh dưỡng C 7 9 7 6 5 3
Hãy phân tích phương sai để kiểm tra sự khác biệt về hàm lượng tinh bột của cây thuộc ba nhóm.