1 không gian xác suất A.- Biến cố ngẫu nhiên Trong vô số tợng xảy chung quanh, ta phân biệt thành hai loại: a) Hiện tợng tất yếu: tợng mà đợc thực điều kiện nh chúng cho kết giống b) Hiện tợng ngẫu nhiên: tợng mà dù đợc thực điều kiện chúng cho kết khác 1.- Khái niệm: Ví dụ: ã Gieo đồng xu, kết sấp hay ngữa tợng ngẫu nhiên, ã Khi gieo xúc sắc, số nốt xuất mặt tợng ngẫu nhiên Đối tợng nghiên cứu lý thuyết xác suất biến cố ngẫu nhiên, ta cần trang bị cho chúng cấu trúc toán học thích hợp Đó đại số biến cố ngẫu nhiên Ta coi biến cố đại số biến cố có liên quan tới kết "phép thử" "phép thử" đợc hiểu thực số điều kiện định Mỗi phép thử gắn với tập hợp kết xảy với biến cố thuộc đại số biến cố ta phải khẳng định đợc rằng: kết phép thử đợc thực xảy hay không xảy Giả Sử A, B, C, biến cố ngẫu nhiên có liên quan tới kết phép thử F ã Ta nói A, B đồng nhất, viết A = B, với kết phép thử chúng xảy không xảy ã Sự không xuất A đợc xem xuất biến cố ®èi A, ký hiƯu Ac , hay A • Sù xuất đồng thời hai biến cố A, B đợc coi lµ sù xt hiƯn cđa biÕn cè giao A giao B, ký hiƯu A ∩ B hay A.B • Sự xuất đợc coi biến cố, gọi biến cố có hay không, ký hiệu hay V ã A, B gọi xung khắc AB = ã Sự xuÊt hiÖn Ýt nhÊt mét hai biÕn cè A, B đợc coi xuất biến cố hỵp A hỵp B, ký hiƯu A ∪ B Khi A.B = ∅ ta viÕt A + B thay A B ã Sự chắn xuất đợc coi biến cố, gọi biến cố ch¾n, ký hiƯu Ω A This lesson was typed by pdfLTEX ã Ta định nghĩa A \ B = A.B c • NÕu sù xt hiƯn cđa A kÐo theo sù xt hiƯn cđa B th× ta nãi A kÐo theo B, ký hiƯu A ⊂ B • Ta nãi hä biÕn cè {B1 , B2 , , Bn } đầy đủ chúng đôi xung n khắc Bi = i=1 2.- Một sè tÝnh chÊt: NÕu A = B th× B = A; A.A = A (Ac )c = A; A.Ac = ∅ A.B = B.A; (A.B).C = A(B.C) A ∪ B = B ∪ A; (A ∪ B) ∪ C = A ∪ (B ∪ C) A + Ac = Ω, ®ã Ac = Ω \ A A = B ⇐⇒ A ⊂ B vµ B ⊂ A A ⊂ B ⇐⇒ B c ⊂ Ac A ∪ (B.C) = (A ∪ B).(A ∪ C) A.(B ∪ C) = A.B ∪ A.C 10 (A.B)c = Ac ∪ B c ; (A ∪ B)c = Ac B c 11 A ∪ B = A + B.Ac ViƯc chøng minh c¸c tÝnh chất đơn giản, cần áp dụng định nghĩa qui tắc lôgic Chú ý: Từ tính chÊt suy c¸c phÐp to¸n lÊy giao, hợp mở rộng cho họ hữu hạn biến cố ngẫu nhiên Các hệ thức 10 có thĨ më réng thµnh: c n Ai i=1 n = c n c Ai ; i=1 Ai i=1 n = Ai c i=1 VÝ dơ: XÐt phÐp thư F: gieo ®ång thêi hai xóc s¾c ®Ịu, ®ång chÊt Gäi A, B, C, D, E biến cố ngẫu nhiên liên quan đợc xác định nh sau: A: "Tổng số nốt xuất hai xúc sắc số chẵn" B: "Tổng số nốt xuất hai xúc sắc số lẻ" C: "Số nốt xuất xúc sắc số lẻ" D: "Số nốt xuất xúc sắc số chẵn" E: "Số nốt xuất hai xúc sắc lẻ chẵn" Khi ta có hệ thức (dễ dàng kiểm tra đợc): A = E; Ac = B; A.B = ∅; A = C + D; D ⊂ A; 3.- Định nghĩa đại số đại số: A This lesson was typed by pdfLTEX TËp A phần tử tùy ý A, B, C, đợc gọi đại số Boole hay trờng điều kiện sau đợc thực hiện: A A ∈ A =⇒ Ac ∈ A n Ak ∈ A =⇒ Ak ∈ A k=1 NhËn xÐt: Trong đại số, phép toán lấy giao (tích), hợp thực đợc với số hữu hạn phần tử ã Đại số Boole đợc gọi đại số ( trờng) đóng kín với phép lấy hợp đếm đợc hay với phép giao đếm đợc ã Giả sử C đại số, đại số nhỏ chứa C đợc gọi đại số sinh bëi C, ký hiƯu σ(C) VÝ dơ: 1) TËp hỵp kết có liên quan tới phép thử với cách xác định biến cố đối, giao biến cố, hợp biến cố, biến cố có, biến cố chắn nh trên, lập nên đại số Boole (dễ dàng kiểm tra) Nó đợc gọi đại số biến cố 2) Giả sử tập khác rỗng, ký hiệu C() lớp mäi tËp cđa Ω Víi c¸c phÐp to¸n tËp hợp đà biết (lấy giao, hợp, phần bù) với tập rỗng, C() lập nên đại số Boole 3) Gi¶ sư A ⊂ Ω, Ω = ∅ XÐt líp CA = {∅, Ω, A, Ac } víi c¸c phÐp toán tập hợp thông thờng CA tạo nên - đại số 4.- Liên hệ đại số biến cố đại số tập hợp: Mối liên hệ nầy đợc thể qua định lý Stone dới đây: Định lý: Mỗi đại số biến cố có đại số tập hợp đẳng cấu với ã Một biến cố A đợc gọi phức hợp biểu diễn dới dạng hợp hai biến cố không đồng với ã Một biến cố A phức hợp đợc gọi biến cố sơ cấp Từ kết ta suy ra: mét biÕn cè phøc hỵp cã thĨ xt hiƯn theo nhiều cách khác Một biến cố sơ cấp chØ xt hiƯn theo mét c¸ch nhÊt C¸c biÕn cố sơ cấp xung khắc Trong đại số biến cố, biến cố ngẫu nhiên biểu diễn đợc dới dạng tổng số hữu hạn biến cố sơ cấp cách Nh biÕn cè A øng víi mét tËp c¸c biÕn cè sơ cấp mà xuất biến cố nầy kéo theo xuất A Chúng đợc gọi biến cố thích hợp với A Tơng ứng nầy bảo tồn phép toán A; biến cố "không thể có" ứng với tập rỗng Biến cố "chắc chắn" ứng với tập tất biến cố sơ cấp phép thử đợc đồng với không gian biến cố sơ cấp A This lesson was typed by pdfLTEX B.- X¸c suất Quan sát tợng ngẫu nhiên ta thấy có tợng thờng xảy ra, có tợng xảy Xác suất đại lợng thể mức độ xảy (thờng xuyên hay khi) biến cố lịch sử toán học đà có nhiều định nghĩa cho khái niệm xác suất giáo trình nầy ta tiếp xúc với số định nghĩa tiêu biểu 1.- Định nghĩa cổ điển xác suất: Nếu A biến cố có n(A) biến cố sơ cấp thích hợp với không gian n(A) biến cố sơ cấp gồm n() biến cố khả xuất tỉ số P (A) = n() đợc gọi xác suất A Nh điều kiện để áp dụng định nghĩa nầy là: n() < Các biến cố sơ cấp phải có khả xuất Ví dụ: 1) Gieo hạt xúc sắc cân đối đồng chất cách ngẫu nhiên Tìm xác suất để mặt có sè nèt ch½n xt hiƯn 2) Tõ mét hép cã 13 bi đỏ bi trắng có kích thớc nh nhau, rút ngẫu nhiên bi Khi đó: 13 Xác suất để rút đợc bi đỏ là: P (Đ) = 20 Xác suất để rút đợc bi trắng là: P (T ) = 20 Chú ý: Để tính xác suất theo định nghĩa cổ điển ta phải tìm n() n(A) công cụ đợc sử dụng nhiều giải tích tổ hợp đà đợc chuẩn bị trung học 2.- Định nghĩa xác suất theo quan điểm hình học: Khi n() vô hạn, ta áp dụng định nghĩa cổ điển để tính xác st nhiỊu tr−êng hỵp ta cã thĨ sư dơng định nghĩa xác suất theo quan điểm hình học nh sau: Giả sử điểm đợc rơi ngẫu nhiên vào miỊn D, A lµ mét miỊn cđa D Khi xác suất để điểm rơi ngẫu nhiên vào miền A đợc xác định công thức: số đo miềnA P (A) = số đo miềnD (Số đo độ dài, diện tích hay thể tích tùy thuộc vào miền xét đờng thẳng, mặt phẳng hay không gian ba chiều) Một ví dụ điển hình "bài toán gặp gỡ": Hai ngời hẹn gặp địa điểm vào khoảng từ 11 đến 12 giê Hä qui −íc r»ng ng−êi ®Õn tr−íc sÏ đợi 20 phút, không gặp Giả sư viƯc A This lesson was typed by pdfLTEX đến điểm hẹn hai ngời ngẫu nhiên tìm xác suất để hai ngời gặp nhau? 3.- Định nghĩa xác suất theo quan điểm thống kê: Tiến hành n phép thử độc lập, nh theo dõi xt hiƯn biÕn cè A cã liªn quan Gäi n số phép thử đà tiến hành, n(A) số phép thử có A xuất hiện, n(A) đợc gọi tÇn st xt hiƯn A tØ sè n Khi sè phép thử n đủ lớn ta lấy tần st cđa A thay cho x¸c st P (A) n(A) (mà ta cha biết) Nếu tồn lim giới hạn nầy P (A) n n 4.- Định nghĩa tiên đề xác suất: Cho không gian; gọi A - đại số tập P (.) hàm tập xác định A Ta gọi P hàm xác suất tiên đề sau đợc thỏa mÃn: (i) P (A) ≥ 0, ∀A ∈ A ∞ ∞ (ii) P An P (An ) = n=1 n=1 (iii) P (Ω) = Bộ ba (; A; P ) đợc gọi không gian xác suất Từ hệ tiên đề ngời ta chứng minh đợc tính chất xác suất sau (ta chấp nhận không chứng minh để sử dụng tính toán xác suất): Mệnh đề 1: Trên không gian xác suất (; A; P ) ta có: a) P (∅) = b) NÕu {A1 , A2 , , An } họ hữu hạn biến cố ngẫu nhiên đôi xung n khắc P n Ak k=1 = P (Ak ) k=1 MƯnh ®Ị 2: Giả sử A, B là biến cố ngẫu nhiên Khi đó: a) P (A B) = P (A) + P (B) − P (A.B) b) chulucNÕu A ⊂ B th× P (A) ≤ P (B) c) ∀A ∈A, cã ≤ P (A) ≤ vµ P (Ac ) = − P (A) Ví dụ: Một hộp chứa cầu trắng, cầu xanh cầu đen kích thớc Chọn ngẫu nhiên lúc cầu Tìm xác suất để: a) Cả ba cầu màu b) Có hai cầu màu c) Có hai cầu màu d) Cả ba cầu khác màu C.- Xác suất điều kiÖn A This lesson was typed by pdfLTEX Trong mục nầy ta xây dựng đại lợng để biểu thị khả xuất biến cố A có biên cố B đà xuất với xác suất 1.- Định nghĩa: Xét không gian xác suất (; A, P ) Giả sử B biÕn cè ngÉu nhiªn cã P (B) > 0, A A Đại lợng P (A/B) = P (A B) đợc gọi xác suất A với điều kiện B P (B) Cã tµi liƯu dïng ký hiƯu: PB (A), P B (A) NhËn xÐt: n(A ∩ B) , nghĩa xác n(B) suất điều kiện P (A/B) xem nh xác suất A xét không gian B • Víi B ∈ A, P (B) > 0, ánh xạ P (./B) từ A vào R+ hàm xác suất Ta có mệnh đề sau: Mệnh đề 1: (công thức nhân xác suất) ã Trong định nghĩa xác suất cổ điển ta có: P (A/B) = Gi¶ sư {A1 , A2 , , An } họ biến cố ngẫu nhiên cho P (A1 A2 An ) > 0, ®ã: P (A1 A2 An ) = P (A1 ).P (A2 /A1 ).P (A3 /A1 A2 ) P (An /A1 A2 An−1 ) Mệnh đề nầy chứng minh đợc phơng pháp qui nạp Ví dụ: (Sơ đồ hộp Polia) Một hộp lúc đầu chứa a cầu trắng, b cầu đỏ Sau lần chọn ngẫu nhiên cầu, ta trả cầu vào hộp với c cầu màu với cầu đà chọn Tìm xác suất để cầu trắng đợc chọn ba lần đầu Đặt Ai : "cầu trắng đợc chọn lần i' (i = 1, 2, 3) Ta cÇn tÝnh P (A1 A2 A3 ) Theo công thức nhân xác suất: P (A1 A2 A3 ) = P (A1 ).P (A2 /A1 ).P (A3 /A1 A2 ) = = a a+c a + 2c a + b a + b + c a + b + 2c Mệnh đề 2: (công thức xác suất toàn phần ) Giả sử {B1 , B2 , , Bn } họ đầy đủ biến cố ngẫu nhiên có xác suất dơng Khi với A A ta cã: n P (A) = P (Bi ).P (A/Bi ) i=1 tổng sản lợng nông 1 sản nông trờng Đội sản xuất tổng sản lợng Đội sản xuất tổng sản 4 Ví dụ: Một nông trờng có đội sản xuất Đội s¶n A This lesson was typed by pdfLTEX tổng sản lợng Tỉ lệ phế phẩm tơng ứng với đội sản xuất 0, 15; 0, 08; 0, 05; 0, 01 Lấy ngẫu nhiên sản phẩm kho nông trờng Tìm xác suất để lấy phải phế phẩm lợng Đội sản xuất Mệnh đề 3: (công thức Bayès ) Nếu A biến cố có xác suất dơng, {B1 , B2 , , Bn } họ đầy đủ biến cố ngẫu nhiên có xác suất dơng Khi với j(j = 1, n), ta cã: P (Bj ).P (A/Bj ) P (Bj /A) = n P (Bi ).P (A/Bi ) i=1 Ví dụ: Hai nhà máy sản x uất loại sản phẩm Nhà máy số sản xuất gấp k lần nhà máy số Tỉ lệ thứ phẩm hai nhà máy p1 , p2 Lấy ngẫu nhiên sản phẩm kho chung hai nhà máy để kiểm tra gặp phải thứ phẩm Tìm xác suất để thứ phẩm nhà máy thứ hai sản xuất D.- Sự độc lập ngẫu nhiên Xét không gian xác suất (, A, P ) 1.- Định nghĩa: Giả sử B lớp biến cố ngẫu nhiên (B A) Ta nói lớp B độc lập xác suất giao hữu hạn biến cố B b»ng tÝch cđa c¸c x¸c st cđa c¸c biÕn cè ®ã VÝ dô: B1 = {A, B} ®éc lËp ⇐⇒ P (A.B) = P (A).P (B) B2 = {A, B, C} ®éc lËp ⇐⇒ P (A.B) P (A.C) = P (A).P (B) = P (A).P (C) P (B.C) P (A.B.C) = P (B).P (C) = P (A).P (B).P (C) Chó ý: 1) Khi B có hai biến cố rõ ràng B độc lập lúc xác suất giao hai biÕn cè bÊt kú B cịng b»ng tÝch c¸c xác suất biến cố Ta nói có độc lập đôi Nhng độc lập ®«i B kh«ng ®đ suy B ®éc lËp XÐt thÝ dơ sau: Mét khèi tø diƯn ®Ịu, ®ång chất có ba mặt sơn tơng ứng màu trắng, xanh, đỏ Mặt thứ t sơn ba màu trắng, xanh, đỏ Gieo ngẫu nhiên khối lên mặt phẳng Nếu gọi A, B, C tơng ứng là: "mặt có màu trắng (xanh, đỏ) tứ diện tiếp với mặt phẳng" Khi ta thấy B = {A, B, C} ®éc A This lesson was typed by pdfLTEX lập đôi 2) Dễ thấy P (B) > {A, B} độc lập chØ P (A/B) = P (A) ThËt vËy: • Giả sử A, B độc lập, P (B) > cã P (A.B) P (A).P (B) P (A/B) = = = P (A) P (B) P (B) ã Ngợc lại, P (A/B) = P (B) từ xác st cã ®iỊu kiƯn suy P (A.B) P (A) = P (A/B) = P (B) =⇒ P (A.B) = P (A).P (B), nghĩa {A, B} độc lập Điều khẳng định có ý nghĩa: {A, B} độc lập (theo định nghĩa) xuất B không ảnh hởng đến xuất A (vì P (A/B) = P (A)) ngợc lại Nh ta cã thĨ nhËn biÕt sù ®éc lËp b»ng trùc giác, hay kinh nghiệm quan sát Điều có ý nghÜa thùc tiƠn MƯnh ®Ị 1: NÕu {A, B} ®éc lËp th× {A, B c } ®éc lËp Chó ý: Bằng qui nạp hữu hạn ta dễ dàng chứng minh đợc: Nếu {A1 , A2 , , An } ®éc lËp th× {A1 , A2 , , An−1 , Ac } độc lập áp dụng nhiều lần kết nầy ta n đợc mệnh đề sau: Mệnh ®Ò 2: NÕu {A1 , A2 , , An } họ biến cố độc lập, (j1 , j2 , , jn ) hoán vị cđa {1, 2, , n} Khi ®ã hä {Aj1 , Aj2 , , Ajn }, Aji = Aji Aci j họ độc lập Ví dụ: Bắn ba viên đạn độc lập vào mục tiêu Xác suất trích đích viên tơng ứng 0, 3; 0, 4; 0, NÕu chØ mét viªn trúng mục tiêu bị phá hủy với xác suất 0, Nếu hai viên trúng mục tiêu chắn bị phá hủy HÃy tìm xác suất để mục tiêu bị phá hủy bắn ba viên đạn nh A This lesson was typed by pdfLTEX đại lợng ngẫu nhiên A.- Đại lợng ngẫu nhiên 1.- Định nghĩa: Giả sử không gian mẫu ứng với phép thử G ánh xạ: X : −→ R ω −→ X(ω) cho ∀x ∈ R, {ω ∈ Ω/X(ω) < x} ⊂ Ω (lµ mét biÕn cố) đợc gọi đại lợng ngẫu nhiên Có thể hiểu đại lợng ngẫu nhiên đại lợng mà giá trị ngẫu nhiên, tùy thuộc vào kết phép thử Đại lợng ngẫu nhiên thờng đợc ký hiệu mẫu tự la tinh in hoa: X, T, · · · C¸c gi¸ trị chúng thờng đợc ký hiệu mẫu tù la tinh th−êng x, y, · · · Ng−êi ta phân biệt hai đại lợng ngẫu nhiên (ĐLNN) ĐLNN rời rạc ĐLNN liên tục 2.- Đại lợng ngẫu nhiên rời rạc: a) Định nghĩa: Một ĐLNN đợc gọi ĐLNN rời tập giá trị tập hữu hạn hay vô hạn đếm đợc cđa tËp sè thùc R VÝ dơ 1: 1) Gieo xúc sắc cân xứng đồng chất Gọi X số chấm xuất mặt xúc sắc Khi X ĐLNN rời có tập giá trị X() = {1, 2, 3, 4, 5, 6} 2) Chọn ngẫu nhiên đứa trẻ từ nhóm gồm bé trai bé gái Gọi X số bé gái nhóm chọn đợc X đại lợng ngẫu nhiên rời có tập giá trị X() = {0, 1, 2, 3} 3) Bắn liên tiếp phát vào bia trúng bia dừng lại Gọi X số viên đạn cần bắn Khi X ĐLNN rời có tập giá trị X() = {1, 2, 3, à à à , n, à à à } b) Bảng phân phối xác suất: Ngoài việc xác định tập giá trị ĐLNN rời, điều quan trọng ta phải biết đợc xác suất để ĐLNN nhận giá trị Bảng phân phối xác suất ĐLNN rời bảng ghi giá trị mà X nhận, kèm theo xác suất để nhận giá trị A This lesson was typed by pdfLTEX X(Ω) x1 x2 xn pk p1 p2 pn ®ã pk = P ({X = xk }); n pk = X() hữu hạn k=1 pk = X() vô hạn đếm đợc k=1 Ví dụ 2: ë vÝ dô 1) môc 1.2.1, ta cã: X(Ω) = {0, 1, 2, 3} ta cã: 120 C4 C6 C6 = ; P ({X = 2}) = = P ({X = 0}) = = C10 720 30 C10 30 15 C4 C C P ({X = 1}) = = ; P ({X = 3}) = = C10 10 C10 30 Vậy bảng phân phối xác st cđa X lµ: X p 30 15 30 30 30 VÝ dô 3: Một túi chứa thẻ đợc đánh số 1, 2, vµ tói thø hai chøa tÊm thẻ đợc đánh số 4, 5, 6, Chọn ngẫu nhiên từ túi thẻ cộng hai số ghi hai thẻ lại Gọi X kết quả, hÃy lập bảng phân phối xác suất X Gi¶i: Cã 12 kÕt qu¶ cã thĨ: (1, 4); (1, 5); (1, 6); (1, 8) (2, 4); (2, 5); (2, 6); (2, 8) (3, 4); (3, 5); (3, 6); (3, 8) Các kết nầy đồng khả năng, với xác suất xuất chúng 12 X(Ω) = {5, 6, 7, 8, 9, 10, 11} P ({X = 5}) = P ({1, 4}) = ; 12 P ({X = 8}) = P ({(2, 6), (3, 5)}) = 12 A This lesson was typed by pdfLTEX 15 Tra bảng phân vị với bậc tự n = 25 ta đợc: 2 = = 14, 6; χ2 = χ2 = 37, 0,95 1−α α 0,05 VËy KTC thĨ cđa DX = σ lµ (0, 046 < σ < 0, 120) Trong vÝ dơ nµy, nÕu ch−a biÕt EX = 20 th× ta tÝnh S Víi sè liệu đà cho ta tính đợc s = 0, 065 Tra bảng phân vị với n = 24 bậc tự ta đợc 2 = 13, 80; 1−α VËy KTC lµ: χ2 = χ2 = 36, α 0,05 (0, 0423 < σ < 0, 113) 2.5 Xác định kích thớc mẫu Ta thấy chất lợng ớc lợng đợc phản ảnh qua độ tin cậy độ xác ε Mét −íc l−ỵng tèt nÕu − α lín nhỏ Nhng độ xác lại phụ thuộc vào kích thớc mẫu n độ tin cậy Vấn đề đặt là: ta muốn độ tin cậy độ xác đạt đợc mức cho trớc cần kích thớc mẫu n tối thiểu ? a) Xác định kích thớc mẫu trờng hợp ớc lợng trung bình: * Nếu biết DX = , từ công thức ε = uγ √ ta suy ra: n n= 2 σ uγ ε * NÕu cha biết , ta vào mẫu cụ thể đà cho (nếu cha có mẫu lấy mẫu sơ kích thớc n1 30) để tính s Từ xác ®Þnh kÝch th−íc mÉu 2 s n = uγ Chú ý: Nếu toán đòi hỏi n số nguyên mà tính n theo công thức ta lại thu đợc n số không nguyên ta lấy phần nguyªn cđa nã céng víi Tøc: 2 s σ n = uγ hc n = uγ + ε ε b) X¸c định kích thớc mẫu trờng hợp ớc lợng tỷ lƯ: f (1 − f ) Tõ c«ng thøc: ε = uγ , ta suy n n = u2 γ f (1 − f ) ε2 Biªn soạn: GVC.ThS Phan văn Danh Kiểm định giả thuyết thống kê Các khái niệm 1.1 Giả thuyết thống kê chơng IV đà nghiên cứu ĐLNN, cha biết tham số đà xây dựng phơng pháp ớc lợng tham số Chơng tiếp tục nghiên cứu ĐLNN trờng hợp thông tin không đầy đủ thể nhiều mặt, cụ thể là: ã Cha biết xác tham số qui luật phân phối xác suất ĐLNN X, nhng có sở để nêu lên giả thuyết, chẳng hạn = o (o số đà biÕt), hay: X tu©n theo qui luËt ph©n phèi chuÈn ã Khi nghiên cứu hai hay nhiều ĐLNN, vấn đề cần quan tâm là: đại lợng độc lập với hay có phụ thuộc tơng quan? Các tham số chúng có hay không ? Những câu hỏi thờng cha đợc trả lời khẳng định mà nêu lên nh giả thiết Vậy định nghĩa: Giả thuyết thông kê giả thuyết nói tham số, dạng qui luật phân phối tính độc lập ĐLNN Việc tìm kết luận tính thừa nhận đợc hay không thừa nhận đợc giả thuyết gọi kiểm định giả thuyết thống kê Đây toán thông kê toán Trớc hết ta đề cập đến tham số ĐLNN Giả sử cần nghiên cứu tham số ĐLNN X có sở để nêu giả thuyết = o Giả thuyết đợc ký hiệu H : = o (đợc gọi giả thuyết cần kiểm định hay giả thuyết bản) Mệnh đề đối lập với giả thuyết H đợc gọi giả thuyết đối H ký hiệu H Dạng tổng quát H là: = o Biên soạn: GVC.ThS Phan văn Danh Trong nhiều trờng hợp, giả thuyết đối phát biểu cụ thể nh: H : > θo hay H : θ < θo Nh− vËy giả thuyết kiểm định giả thuyết đối thờng đợc nêu lên thành cặp Chẳng hạn: H : = θo ; H : θ = θo hc H : θ = θo ; H : θ > θo hc H : θ = θo ; H : θ < o Nhiệm vụ lý thuyết kiểm định giả thuyết thống kê là: Bằng thực nghiệm (thông qua mẫu cụ thể) kiểm tra tính (sai) giả thuyết H 1.2 Mức ý nghĩa, miền bác bỏ Phơng pháp kiểm định giả thuyết thống kê dựa sở lập luận nh sau: Xuất phát từ yêu cầu toán thực tế, ta đa giả H giả thuyết đối Trớc hết giả sử H đúng, xây dựng đợc biến cố A đó, cho xác suất xảy biến cố A b»ng α, bÐ ®Õn møc cã thĨ sư dơng nguyên lý xác suất nhỏ, tức coi A không xảy phép thử Khi thực hiƯn phÐp thư ®èi víi biÕn cè A: - NÕu A xảy ta bác bỏ giả thuyết H - Nếu A không xảy ta cha có sở để bác bỏ H Trên có sở lập luận trên, xây dựng thủ tục kiểm định gồm bớc sau: Bớc 1: Từ ĐLNN X lập mÉu ngÉu nhiªn cã kÝch th−íc n : WX = (X1 , X2 , · · · , Xn ) chọn thống kê G = f (X1 , X2 , · · · , Xn , θ), cho H qui luật phân phối xác suất G hoàn toàn xác định mẫu thĨ wX = (x1 , x2 , · · à , xn ) giá trị G đợc tính Thống kê G đợc gọi tiêu chuẩn kiểm định giả thuyết H Bớc 2: Do qui luật phân phối xác suất G đà biết nên với xác suất bé tuỳ ý tìm đợc miÒn Wα cho P (G ∈ Wα ) = (G W ) đóng vai trò nh biến cố A nói Sự tồn biểu thức P (G ∈ Wα ) = α chØ víi gi¶ thut H đúng, nên để nhấn mạnh điều kiện ngời ta ký hiÖu P (G ∈ Wα |H) = α Vì bé nên theo nguyên Biên soạn: GVC.ThS Phan văn Danh lý xác suất nhỏ coi G không nhận giá trị miền W mét phÐp thư B−íc 3: Thùc hiƯn mét phÐp thư mẫu ngẫu nhiên WX ta thu đợc mẫu thĨ wX = (x1 , x2 , · · · , xn ) Tõ mÉu thĨ nµy ta tính đợc giá trị G (ký hiệu g), giá trị đợc gọi giá trị quan sát hay giá trị thực nghiệm ký hiệu g = f (x1 , x2 , · · · , xn , o ) Bớc 4: Xem xét giá trị quan sát g có thuộc miền W hay không để kÕt luËn: a) NÕu g ∈ Wα : biÕn cè (G W ) xảy ra, ta bác bỏ H, thõa nhËn H b) NÕu g ∈ Wα : biÕn cố (G W ) không xảy ra, ta chấp nhận giả thuyết H / Miền W đợc gọi miền bác bỏ giả thuyết H; đợc gọi mức ý nghĩa kiểm định, thực tế th−êng lÊy α kho¶ng (0, 01 ; 0, 05) 1.3 Sai lầm loại I sai lầm loại II Khi kiểm định giả thuyết thống kê, mắc hai sai lầm sau đây: a) Sai lầm loại I: sai lầm mắc phải ta bác bỏ giả thuyết H H Xác suất mắc phải sai lầm loại mức ý nghĩa Thật vậy, H xác suất để (G W ) α, nghÜa lµ P (G ∈ Wα |H) = α Nhng (G W ) bác bỏ H Theo qui tắc nh vậy, rõ ràng có xác suất mắc sai lầm Nếu bé khả gặp phải sai lầm loại I b) Sai lầm loại II: Là sai lầm mắc phải thừa nhận H H sai Xác suất mắc phải sai lầm loại II xác suất để G nhận giá trị không thuộc miền bác bỏ Wα H sai (tøc H ®óng) P (G ∈ Wα |H) = − P (G ∈ Wα |H) = / đợc gọi lực kiểm định H Nó xác suất "không mắc sai lầm loại II" lớn xác suất mắc sai lầm loại II P (G W |H) = nhỏ / Các trờng hợp xảy tiến hành kiểm định tóm tắt dới dạng bảng sau: H H sai Bác bỏ Sai lầm loại I Kết luận Thừa nhận Kết luận Sai lầm loại II Biên soạn: GVC.ThS Phan văn Danh Khi kiểm định giả thuyết thống kê, mức ý nghĩa đà chọn, kích thớc mẫu n đà xác định; tiêu chuẩn kiểm định G, ta tìm đợc vô số miỊn b¸c bá Wα Th−êng lùa chän miỊn b¸c bỏ W cho xác suất mắc sai lầm loại II nhỏ (hay lực kiểm định lớn nhất) Miền bác bỏ W đợc xây dựng dới có tính chất trên, tức đảm bảo sai lầm loại II nhá nhÊt víi víi møc ý nghÜa vµ kÝch thớc mẫu n xác định trớc Kiểm định giả thiết trung bình Giả thuyết trung bình tổng thể (cũng kỳ vọng toán ĐLNN X), m cha biết Nhng có sở nêu giả thuyết H : m = mo , (mo giá trị đà biết) Cần kiểm định giả thuyết với giả thuyết đối nh sau: H : m = m o ; H : m > mo ; H : m < m o ta xét trờng hợp sau: 2.1 Trờng hợp n 30 (hoặc n < 30 nhng X có phân phối chuẩn); đà biết phơng sai DX = B−íc 1: LËp mÉu ngÉu nhiªn WX = (X1 , X2 , · · · , Xn ) Chän thèng kª √ (X − mo ) n U= σ làm tiêu chuẩn kiểm định Nếu giả thuyết H U có phân phối chuẩn tắc Bớc 2: Miền bác bỏ phụ thuộc giả thuyết đối H nh sau: a) H : m = mo ; H : m = mo : Wα = (−∞, −u1− α ) ∪ (u1− α + ∞) 2 hay Wα = {u : |u| > u1− α } b) H : m = mo ; H : m > mo : Wα = (u1−α , +∞) c) H : m = mo ; H : m < mo : Biên soạn: GVC.ThS Phan văn Danh W = (, u1 ) B−íc 3: LÊy mÉu thĨ wX √ (x1 , x2 , · · · , xn ) TÝnh gi¸ trÞ thĨ cđa u hay = (x − mo ) n gọi uqs , uqs = σ n víi x = xi n i=1 Bớc 4: Xét xem uqs W hay không để kết luận: Nếu uqs W bác bỏ H, uqs W cha có sở bác bỏ H / Ví dụ 1: Nếu máy móc hoạt động bình thờng trọng lợng sản phẩm có kỳ vọng toán 100 gam, độ lệch chuẩn = Qua mét thêi gian s¶n xuÊt, ng−êi ta nghi nghờ trọng lợng sản phẩm có xu hớng tăng lên Cân thử 100 sản phẩm trọng lợng trung bình chúng 100, gam Với mức ý nghÜa α = 0, 05, h·y kÕt luËn vÒ điều nghi ngờ nói có hay không ? Giải: Gọi X trọng lợng sản phẩm Gọi trọng lợng trung bình loại sản phẩm sau thời gian sản xuất m (m cha biết) Đặt gi¶ thuyÕt H : m = 100; H : m > 100 Víi α = 0, 05 th× u1−α = 1, 645 MiỊn b¸c bá víi møc ý nghÜa α = 0, 05 lµ: Wα = W0,05 = [1, 645; +∞) √ 100 TÝnh uqs = (100, − 100) = W Ta bác bỏ giả thiết H Điều nghi ngờ nói Ví dụ 2: Tuổi thọ bóng đèn X ĐLNN phân phối chuẩn với trung bình EX = 2000 độ lệch tiêu chuẩn = 15 Víi møc ý nghÜa α = 5%, h·y kÕt luËn điều nghi ngờ nói Giải: H : EX = 2000; H : EX = 2000 √ (H − 2000) 25 Chọn tiêu chuẩn kiểm định U = 15 Nếu H U N (0, 1) Miền b¸c bá: Wα = (−∞, −u1− α ) ∪ (u1− α , +∞) = (−∞, −1, 96) ∪ (1, 96, +∞) 2 (1990 − 2000)5 10 = − ∈ Wα 15 Nh− vËy b¸c bá H, tøc thừa nhận tuổi thọ bóng đèn đà thay đổi Tính uqs = Biên soạn: GVC.ThS Phan văn Danh 2.2 Tr−êng hỵp n ≥ 30; σ ch−a biÕt: (H mo ) n Trờng hợp chọn thống kê U = làm tiêu chuẩn kiểm định S Nếu H U có phân phối chuẩn tắc, miền bác bỏ giả thuyết H qui tắc kiểm định giống nh trờng hợp 2.1 khác tính uqs theo công thức: (x mo ) n uqs = s 2.3 Tr−êng hỵp n < 30, σ ch−a biÕt, X cã ph©n phèi chuÈn: √ (x − mo ) n Chän thèng kê T = làm tiêu chuẩn kiểm định Nếu H T s có phân phối theo qui luật Student víi n − bËc tù do: MiỊn b¸c bỏ xây dựng phụ thuộc vào dạng giả thuyết đối H nh− sau: a) H : m = mo ; H : m = mo : Wα = (−∞, −t1− α ) ∪ (t1− α , +∞) = {|T | > t1− α } 2 b) H : m = mo ; H : m > mo : Wα = (t1−α , +∞) c) H : m = mo ; H : m < mo : Wα = (, t1 ) Với mẫu cụ thể, ta tính đợc giá trị x, s tính đợc giá trÞ: √ (x − mo ) n tqs = s Xem xét tqs có htuộc W hay không để kết luận Ví dụ 3: Trọng lợng bao gạo ĐLNN X tuân theo qui luật phân phối chuẩn với EX = 50 kg Nghi ngờ máy đóng bao làm việc không bình thờng làm cho trọng lợng bao gạo có xu hớng giảm, ngời ta cân thử 25 bao thu đợc kết nh sau: Biên soạn: GVC.ThS Phan văn Danh X (kg) Số bao 48, − 49, 48, − 49, 49, − 49, 10 49, − 50, 50, − 50, Víi møc ý nghÜa α = 0, 01, h·y kết luận nghi ngờ nói Giải: Gọi m trọng lợng trung bình thực tế bao gạo (m cha biết) Đặt giả thuyết H : m = 50; H : m < 50 B−íc 1: LËp mÉu ngÉu nhiªn kÝch th−íc n = 25 √ (X 50) 25 làm tiêu chuẩn WX = (X1 , X2 , · · · , Xn ) vµ chän thống kê T = S kiểm định Bớc 2: Xây dựng miền bác bỏ Nếu H T tuân theo qui luËt Student víi n − = 24 bËc tù t1−α = t0,99 = 2, 492 =⇒ Wα = W0,01 = (−∞, −2, 5) B−íc 3: Tõ mẫu cụ thể, tính đợc: x = 49, 27; S = 0, 25 =⇒ S = 0, 24 √ (49, 27 − 50) 25 s = 0, 49 =⇒ tqs = = −7, 46 0, 49 B−íc 4: Rõ ràng tqs W Vậy bác bỏ H: trọng lợng đà có giảm Kiểm định giả thiết tỉ lệ Giả sử tỷ lệ phần tử có tính chất A tổng thể p (cha biết) Cần kiểm định giả thuyết H : p = po (po : số) với giả thuyÕt ®èi: H : p = p o ; H : p > po ; H : p < po Gọi X số phần tử có tính chất A lấy ngẫu nhiên phần tử tổng thể X ĐLNN tuân theo qui luật phân phối "không - một" với bảng phân phối xác suất nh sau: Biên soạn: GVC.ThS Phan văn Danh X p 1−p p DƠ dµng thÊy r»ng EX = p; DX = pq; q = − p Tõ X lËp mÉu ngÉu nhiªn kÝch th−íc n: WX = (X1 , X2 , · · · , Xn ) vµ chän thèng kª: √ (X − po ) n U= po (1 po ) làm tiêu chuẩn kiểm định Nếu H với điều kiện n lớn U xấp xỉ chuẩn tắc Miền bác bỏ đợc x©y dùng tõ H nh− sau: a) H : p = po ; H : p = po : Wα = {u : |u| > u1− α } b) H : p = po ; H : p > po : Wα = {u : u > u1−α } c) H : p = po ; H : p < po : Wα = {u : u < −u1−α } Víi mÉu thĨ wX = (x1 , x2 , à à à , xn ) tính đợc x tính đợc (x po ) n uqs = po (1 − po ) Xem uqs có thuộc W hay không để kết luận Vì x mẫu cụ thể tần suất biến cè (X = 1) Do vËy ta cã thÓ ký hiƯu x = f nªn: √ (f − po ) n uqs = po (1 − po ) Biªn soạn: GVC.ThS Phan văn Danh Ví dụ 4: Tỉ lệ phế phẩm nhà máy 10% Sau cải tiến kỹ thuật, điều tra 400 sản phẩm th× thÊy cã 32 phÕ phÈm Víi møc ý nghÜa α = 0, 01; h·y kÕt ln vỊ viƯc c¶i tiến kỹ thuật có làm giảm tỷ lệ phế phẩm không ? Giải: Gọi tỷ lệ phế phẩm nhà máy sau cải tiến kỹ thuật p Đặt giả thut H : p = 0, víi gi¶ thut ®èi H : p < 0, 10 √ (f − 0, 1) 400 Tiêu chuẩn kiểm định: U = 0, 1(1 − 0, 1) Do n = 400 kh¸ lớn nên H U N (0, 1) Miền bác bỏ với = 0, 01 là: Wα = W0,01 = (−∞, −u0,99 ) = (−∞, −2, 326) 32 = 0, 08 400 √ (0, 08 − 0, 1) 400 √ ®ã uqs = =− 0, 1.0, VËy uqs ∈ Wα nªn cha có sở để bác bỏ H Nghĩa cã c¶i tiÕn kü thuËt / nh−ng ch−a cã tác dụng làm giảm tỷ lệ phế phẩm nhà m¸y Tõ mÉu thĨ ta cã: f = Kiểm định giả thiết kỳ vọng hai ĐLNN Giả sử hai ĐLNN X Y ®éc lËp cïng ph©n phèi chn víi EX, EY ch−a biết Cần kiểm định giả thuyết H : EX = EY với dạng giả thuyết đối đà biết Từ X, Y lập mẫu ngẫu nhiên WX = (X1 , X2 , · · · , Xn ); WY = (Y1 , Y2 , · · · , Ym ) X −Y a) §· biÕt DX, DY : Chän thống kê U = làm tiêu chuẩn kiểm DX DY n + m định Nếu H U N (0, 1) Do miền bác bỏ nh Đ2 ®· xÐt LËp hai mÉu thĨ tõ X vµ Y : wX = (x1 , x2 , · · · , xn ); wY = (y1 , y2 , à à à , ym ) Ta tính đợc: uqs = x−y σx n + σy m Xét uqs thuộc W hay không để kết luận Biên soạn: GVC.ThS Phan văn Danh 10 Ví dụ 5: Trọng lợng sản phẩm hai máy sản xuất ĐLNN tuân theo qui luật phân phối chuẩn có độ lệch tiêu chuẩn = Víi møc ý nghÜa α = 0, 05 cã thể xem trọng lợng trung bình sản phẩm hai máy sản xuất nh không? Nếu cân 25 sản phẩm máy I ta thấy trọng lợng chúng 1250kg cân 20 sản phẩm máy II trọng lợng chúng 1012kg Giải: Gọi trọng lợng sản phẩm sản xuất máy I X máy II Y Theo giả thuyết ta có X, Y tuân theo qui luật chn víi DX = DY = Gi¶ thiÕt H : EX = EY ; H : EX = EY X Y Tiêu chuẩn kiểm định: U = DX DY n + m Wα = W0,01 = {u : |u| > 1, 96} 1012 Theo điều kiện toán: x = 1250 : 25 = 50; y = = 50, 20 50 − 50, = −2 VËy uqs = 1 25 + 26 Nh− vËy uqs W nên bác bỏ H, tức trọng lợng trung bình hai máy có khác b) Cha biết DX DY : Nếu kích thớc mẫu WX WY lớn (n 30, m 30) ta chän thèng kª: X −Y Sx2 n + Sy2 m N (0, 1) điều trờng hợp X Y có qui luật phân phối Phơng pháp kiểm định giống nh trờng hợp đà xét Qua hai mẫu cụ thể wX = (x1 , x2 , · · · , xn ) vµ wY = (y1 , y2 , · · · , ym ) ta tính đợc đặc trng mẫu x, sy2 , y, sy ®ã ta tÝnh ®−ỵc: x−y sx2 n + sy2 m XÐt uqs W hay không để kết luận Ví dụ 6: Ngời ta cân trẻ sơ sinh hai khu vực thành thị nông thôn, thu đợc kết nh sau: Biên soạn: GVC.ThS Phan văn Danh 11 K.vực số trẻ T.lợng t.bình S2 x = 3, sx = 200 Nông thôn n = 2500 Thành thị m = 500 y = 3, sy2 = Víi møc ý nghÜa α = 0, 01 cã thÓ coi trọng lợng trung bình hai khu vực đợc hay không? Giải: Gọi trọng lợng trẻ sơ sinh nông thôn X thành thị Y Cần kiểm định giả thuyết: H : EX = EY ; H : EX = EY Tuy qui luËt phân phối X Y cha biết, nhng kÝch th−íc mÉu n = 2500; m = 500 kh¸ lín nªn thèng kª: U= X −Y Sx2 n + Sy2 m ∼ N (0, 1) Wα = {u : |u| > u1− α } = {u : |u| > 2, 58} uqs = x−y sx2 n + sy2 m = 3, − 3, 200 2500 + 500 =− Nh− vËy uqs ∈ W : sở để bác bỏ H ta cho trọng / lợng trung bình thành thị nông thôn nh Kiểm định giả thiết hai tỉ lệ Giả thiết p1 , p2 tơng ứng tỷ lệ phần tử mang tính chất A tổng thể thứ nhất, thứ hai Cần kiểm định gi¶ thuyÕt: H : p1 = p2 = po (po đà biết) Với dạng đối thuyết: H : p1 = p1 ; H : p1 > p2 ; H : p1 < p2 fn1 − fm2 Chän thèng kê: U = làm tiêu chuẩn kiểm định 1 po (1 − po )( n + m ) Trong đó: fn1 tỷ lệ phần tử có dấu hiệu A mẫu ngẫu nhiên kích thớc n đợc xây dựng từ X ( X số phần tử có tính chất A lấy ngẫu nhiên phần tử từ tổng thể thứ nhất) X ĐLNN phân phối theo qui luật Biên soạn: GVC.ThS Phan văn Danh 12 fm2 tỷ lệ phần tử có tÝnh chÊt A cđa mÉu ngÉu nhiªn kÝch th−íc m đợc xây dựng Y (Y số phần tử có tính chất A lấy ngẫu nhiên phần tư tõ tỉng thĨ thø hai) Víi kÝch th−íc mÉu lớn giả thuyết H U N (0, 1) NÕu ch−a biÕt po th× ta thay po ớc lợng hợp lý cực đại là: p∗ = nfn1 + mfm2 m+n Khi ®ã ta chän thèng kª: U= fn1 − fm2 1 p∗ (1 p )( n + m ) làm tiêu chuẩn kiểm định Ví dụ 7: Kiểm tra sản phẩm đợc chọn ngẫu nhiên hai nhà máy sản xuất loại hàng, ta có số liệu Nhà máy Số sản phẩm Số phế phẩm A n = 1000 n1 = 20 B m = 900 m2 = 30 Víi møc ý nghi· α = 0, 05 cã thể coi tỷ lệ phế phẩm hai nhà máy sản xuất nh không ? Giải: Gọi p1 tỷ lệ phế phẩm nhà máy A p2 tỷ lệ phế phẩm nhà máy B Cần kiểm định giả thuyết H : p1 = p2 víi H : p1 = p2 Tõ sè liƯu ®· cho ta tÝnh ®−ỵc f1 = 20 : 1000 = 0, 02; f2 = p∗ = 30 = 0, 033 900 37 20 + 30 = =⇒ − p∗ = 1000 + 900 38 38 uqs = 0, 02 − 0, 033 37 38 38 ( 1000 + = −1, 81 900 ) Víi α = 0, 05 vµ víi H nh− Biên soạn: GVC.ThS Phan văn Danh 13 W = {u : |u| > u1− α } = {u : |u| > 1, 96} VËy uqs ∈ Wα nên ta chấp nhận giả thuyết H tức coi tỷ lệ phế phẩm hai nhà máy nh Kiểm định giả thiết phơng sai ĐLNN chuẩn Giả sử ĐLNN X tuân theo qui luật phân phối chuẩn, cha biết phơng sai DX, nhng có sở để nêu giả thuyết H : DX = o (o số đà biết) Cần kiểm định giả thuyết H với đối thuyết H : 2 H : DX = σo ; H : DX > σo ; H : DX < σo LËp mÉu ngÉu nhiªn WX = (X1 , X2 , · · · , Xn ) Chän thèng kª (n1 )S 2 = làm tiêu chuẩn kiểm định Nếu H phân phối theo qui luật "chi bình phơng" với (n 1) bậc tù Víi møc ý nghÜa α, miỊn b¸c bá giả thiết H phụ thuộc vào dạng H 2 a) H : DX = σo ; H : DX = σo α Wα = {χ2 : χ2 < χ2 hc χ2 > χ2 α } 1− 2 2 b) H : DX = σo ; H : DX > σo Wα = {χ2 : χ2 > χ2 } 1−α 2 c) H : DX = σo ; H : DX < σo Wα = {χ2 : χ2 < α2 } VÝ dô 8: Nếu máy móc hoạt động bình thờng trọng lợng sản phẩm ĐLNN X phân phối theo qui luật chuẩn với DX = 12 Nghi ngờ máy hoạt động không bình thờng, ngời ta cần thử n = 13 sản phẩm tính đợc s = 14, Víi møc ý nghÜa α = 0, 01 H·y kết luận nghi ngờ nói Giải: Để giải toán trên, ta cần kiểm định giả thuyết H : DX = 12; H : DX > 12 Biªn soạn: GVC.ThS Phan văn Danh 14 Với = 0, 02; n = 13; ta bảng phân vị "chi bình ph−¬ng" ta cã: χ2 = χ2 = 26, 1−α 0,99 Wα = (26, 2; +∞) χqs = (13 − 1).14, = 14, 12 χqs ∈ W Vậy cha có sở để bác bỏ H, hay điều nghi ngờ không / Máy làm việc bình thờng Biên soạn: GVC.ThS Phan văn Danh ... phân phối xác suất ĐLNN hai chiều: Đối với vectơ ngẫu nhiên hai chiều ngời ta dùng bảng phân phối xác suất, hàm phân phối xác suất, hàm mật độ xác suất để thiết lập bảng phân phối xác suất chúng... phối xác suất dùng hàm mật độ xác suất biểu diễn phân phối xác suất Hàm mật độ xác suất cđa VTNN hai chiỊu liªn tơc (X, Y ); ký hiệu f (x, y) đạo hàm riêng hỗn hợp cấp hai hàm phân phối xác suất. .. phối xác suất: Ngoài việc xác định tập giá trị ĐLNN rời, điều quan trọng ta phải biết đợc xác suất để ĐLNN nhận giá trị Bảng phân phối xác suất ĐLNN rời bảng ghi giá trị mà X nhận, kèm theo xác suất