Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 44 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
44
Dung lượng
786,63 KB
Nội dung
Bài 7: Kiểm định giả thuyết thống kê BÀI 7: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Các kiến thức cần có Mục tiêu Trong chương bạn cần nắm vững kiến thức sau: • Giới thiệu toán kiểm định giả thuyết xây dựng phương pháp kiểm định giả thuyết cho tham số tổng thể Phương pháp kiểm định giả thuyết cho tham số biến ngẫu nhiên có phân phối chuẩn Kiểm định giả thuyết cho tỷ lệ Kiểm định giả thuyết hai tham số hai biến ngẫu nhiên có phân phối chuẩn Kiểm định giả thuyết hai tỷ lệ • Các khái niệm giả thuyết thống kê, miền bác bỏ bước làm toán kiểm định giả thuyết • Các quy tắc kiểm định cho tham số biến ngẫu nhiên • Các quy tắc kiểm định phi tham số • Cần xem kỹ ví dụ học làm tập phần tương ứng Thời lượng • 12 tiết • Phương pháp kiểm định phi tham số hay gọi phương pháp bình phương dùng để kiểm định giả thuyết mang tính chất định tính Kiểm định giả thuyết phân phối biến ngẫu nhiên, Kiểm định tính độc lập hai biến ngẫu nhiên Dùng tiêu chuẩn phi tham số để kiểm định cho toán mở rộng so sánh nhiều tỷ lệ • Cung cấp kiến thức quan trọng cho sinh viên tiếp thu kiến thức môn học Kinh tế lượng sau 147 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ Nội dung • Khái niệm giả thuyết thống kê • Khái niệm • Miền bác bỏ • Các bước làm toán kiểm định • Kiểm định tham số Kiểm định so sánh kỳ vọng biến ngẫu nhiên có phân phối chuẩn • Kiểm định giả thuyết phương sai biến ngẫu nhiên phân phối chuẩn • Kiểm định giả thuyết cho xác suất (hay tỷ lệ) • Kiểm định giả thuyết so sánh kỳ vọng hai biến ngẫu nhiên phân phối chuẩn • Kiểm định giả thuyết so sánh hai xác suất • Kiểm định giả thuyết so sánh phương sai hai biến ngẫu nhiên có phân phối chuẩn • Một số tiêu chuẩn kiểm định phi tham số • Kiểm định giả thuyết phân phối biến ngẫu nhiên • So sánh nhiều tỷ lệ • Kiểm tra tính độc lập 148 Bài 7: Kiểm định giả thuyết thống kê TÌNH HUỐNG KHỞI ĐỘNG BÀI Tình Công ty Hoàng Lâm sản xuất mỳ theo dây chuyền Đức Theo tiêu chuẩn trọng lượng gói mì đóng máy tự động 453 g Nghi ngờ máy tự động làm việc không đủ xác, công ty Hoàng Lâm tiến hành kiểm tra ngẫu nhiên 81 gói ta thấy trọng lượng trung bình 448 g Với mức ý nghĩa 0,05 cho trọng lượng gói mì không đạt tiêu chuẩn hay không, biết trọng lượng gói mì biến ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn 36g? Câu hỏi Trọng lượng trung bình 01 gói mỳ theo điều tra bao nhiêu? Để bác bỏ giả thuyết “dây chuyền hoạt động tốt – trọng lượng mỳ tiêu chuẩn” tiêu chuẩn kiểm định phải không nằm khoảng nào? Dây chuyền hoạt động tốt không? 149 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ 7.1 Khái niệm giả thuyết thống kê 7.1.1 Khái niệm Giả thuyết thống kê mệnh đề nhận định tham số tổng thể Khi ta đồng tổng thể với biến ngẫu nhiên giả thuyết thống kê nhận định phân phối xác suất biến ngẫu nhiên Ký hiệu H giả thuyết tham số tổng thể, kèm với giả thuyết H mệnh đề đối lập gọi đối thuyết, ký hiệu H1 Bài toán kiểm định giả thuyết thống kê gồm cặp giả thuyết H đối thuyết H1 Dựa vào thông tin mẫu lấy từ tổng thể ta phải đưa định bác bỏ hay chấp nhận giả thuyết H , việc chấp nhận giả thuyết H tương đương với bác bỏ đối thuyết H1 ngược lại Ví dụ: Ta quan tâm tới thu nhập trung bình người dân Việt Nam năm 2008 Khi ta có giả thuyết H đối thuyết H1 mức thu nhập trung bình μ là: ⎧⎪H : μ = 750$ ⎨H : μ ≠ 750$ ⎪⎩ Giả thuyết H gọi giả thuyết gốc toán toán kiểm định hai phía Đối thuyết H1 phát biểu khác μ > 750 μ < 750 Khi ta có hai toán kiểm định phía ⎧⎪H : μ = 750$ ⎨H : μ > 750$ ⎪⎩ ⎧⎪ H : μ = 750$ ⎨ ⎪⎩ H1 : μ < 750$ Khi đưa giả thuyết H thường vào nghiên cứu từ trước từ lý thuyết Trong ví dụ việc đưa giả thuyết H : μ = 750 vào nghiên cứu năm 2007 7.2 Miền bác bỏ Một cách giải toán kiểm định giả thuyết dùng thống kê G, gọi tiêu chuẩn thống kê Định nghĩa: Thống kê T = G(X1 , X , , X n ) gọi tiêu chuẩn thống kê (test statistics) giá trị dùng để xem xét bác bỏ hay chấp nhận giả thuyết H Ứng với mẫu cụ thể quan sát được, giá trị tiêu chuẩn thống kê T ký hiệu t qs Ta dựa vào giá trị để đưa kết luận chấp nhận hay bác bỏ giả thuyết xét cách so sánh giá trị với miền tiêu chuẩn 150 Bài 7: Kiểm định giả thuyết thống kê Định nghĩa : Miền W R gọi miền bác bỏ hay miền tiêu chuẩn miền dùng với tiêu chuẩn thống kê T giá trị cụ thể t qs tiêu chuẩn để đưa kết luận giả thuyết H : • Nếu t qs ∈ W bác bỏ giả thuyết H • Ngược lại, t qs ∈ W c chấp nhận H Khi bác bỏ hay chấp nhận giả thuyết H ta gặp phải hai loại sai lầm: • Sai lầm loại I: Bác bỏ giả thuyết H thực tế H • Sai lầm loại II: Chấp nhận giả thuyết H0 thực tế H sai Quyết định bác bỏ hay chấp nhận giả thuyết hoàn toàn dựa vào thông tin mẫu, ta có xác suất mắc sai lầm loại I sai lầm loại II Ký hiệu α xác suất mắc sai lầm loại I α = P(sai lầm loại I) = P(bác bỏ H | H đúng) Lúc α gọi mức ý nghĩa Ký hiệu β xác suất mắc sai lầm loại II β = P(sai lầm loại II) = P (chấp nhận H | H sai) = P(chấp nhận H | H1 đúng) Trường hợp đặc biệt, dùng tiêu chuẩn T miền bác bỏ W để tiến hành kiểm định giả thuyết, ta có: α = P(T ∈ W | H ) β = P(T ∈ W c | H ) Khi tiến hành kiểm định, người ta mong muốn cho cực tiểu hóa hai loại sai lầm loại I loại II, nhiên cỡ mẫu cố định mong muốn không thực được, nói chung sai lầm loại I giảm xuống kéo theo sai lầm loại II tăng lên Chẳng hạn, dùng tiêu chuẩn T miền bác bỏ W để tiến hành kiểm định giả thuyết, để giảm bớt sai lầm loại I ( α ), ta phải thu nhỏ miền bác bỏ W, thay miền W ⊂ W Tuy nhiên điều dẫn đến W c ⊃ W c sai lầm loại II ( β ) lại tăng lên 1 Vì lý trên, thực hành người ta thường cố định xác suất mắc sai lầm loại I tìm cách làm cực tiểu xác suất mắc sai lầm loại II Thông thường giá trị α thường lấy nhỏ, 0,05, 0,02 0,01 151 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ 7.2.1 Các bước làm toán kiểm định Để tiến hành kiểm định giả thuyết, thông thường người ta sử dụng miền tiêu chuẩn, xác suất ý nghĩa ước lượng khoảng tiêu chuẩn hay tham số thống kê, với bước thực tương ứng • Sử dụng miền tiêu chuẩn Để giải toán kiểm định giả thuyết thống kê thông qua việc sử dụng miền tiêu chuẩn, người ta thường thực bước sau: Bước 1: Xác định tham số cần kiểm định, đặt giả thuyết đối thuyết Bước 2: Xác định tiêu chuẩn thống kê tính giá trị tiêu chuẩn thống kê giá trị mẫu cho Bước 3: Xác định miền bác bỏ W Bước 4: So sánh giá trị tiêu chuẩn thống kê với miền bác bỏ W kết luận bác bỏ hay chấp nhận giả thuyết H0 • Sử dụng xác suất ý nghĩa (p−value) Nếu ta bác bỏ giả thuyết H thấy giá trị cụ thể a mẫu xuất hiện, ta phải bác bỏ giả thuyết cho giá trị khác mẫu thuộc vào miền xác định a Chẳng hạn với giả thuyết cần kiểm định “Chi tiết máy gia công có kích thước đạt tiêu chuẩn”, ta bác bỏ giả thuyết đo thấy sản phẩm có kích lệch so với quy định milimét ta phải bác bỏ giả thuyết cho sản phẩm khác đo kích thước lệch so với quy định nhiều milimét Có thể thực chất sản phẩm có kích thước đạt tiêu chuẩn tác động ngẫu nhiên trình đo đạc mà ta có kết luận sai, dẫn đến việc phạm sai lầm với xác suất Tập hợp chứa giá trị mẫu phải bác bỏ bác bỏ giá trị cụ thể cho trước mẫu có xác suất phạm sai lầm gọi xác suất ý nghĩa ứng với giá trị cụ thể Chính xác hơn, ta có định nghĩa sau Định nghĩa: Ứng với giá trị mẫu cụ thể tiêu chuẩn thống kê dùng kiểm định giả thuyết, xác suất ý nghĩa (p−value) giá trị xác suất phạm sai lầm bác bỏ giả thuyết H0 ta có giá trị mẫu cụ thể giả thuyết mẫu xét Ta thấy xác suất ý nghĩa xác suất phạm sai lầm loại I trình bày phía Xác suất nhỏ tương ứng với khả phạm sai lầm bác bỏ giả thuyết nhỏ ta bác bỏ giả thuyết mà không e ngại có sai lầm Ngược lại ta phải chấp nhận giả thuyết khả phạm sai lầm lớn Như ta sử dụng xác suất ý 152 Bài 7: Kiểm định giả thuyết thống kê nghĩa để giải toán kiểm định theo thủ tục sau: Tiến hành Bước trình bày làm tiếp Bước 3’: Tính xác suất ý nghĩa tương ứng với giá trị cụ thể tiêu chuẩn thống kê có Bước 2: Bước 4’: So sánh xác suất ý nghĩa với mức ý nghĩa định trước (thường cho 5%, 1%, 0,5% 0,1%), xác suất ý nghĩa nhỏ mức ý nghĩa bác bỏ giả thuyết, ngược lại phải chấp nhận giả thuyết CHÚ Ý Việc xác định miền bác bỏ tiến hành thông qua việc tra bảng giá trị tới hạn làm tay Trong việc tính toán xác suất ý nghĩa cách tra bảng lại chưa quen dùng Do nhiều giáo trình trình bày thủ tục a) nói đền quy trình kiểm định giả thuyết Tuy nhiên máy tính ngày phổ biến phần mềm sẵn sàng cung cấp tính toán liên quan đến xác suất ý nghĩa thủ tục b) tỏ thuận tiện Ngoài hai thủ tục trên, nhiều toán kiểm định tiến hành cách sử dụng ước lượng khoảng tham số tiêu chuẩn thống kê, tiện dụng tính toán tay có trợ giúp máy tính • Sử dụng khoảng tin cậy (ước lượng khoảng) tham số tiêu chuẩn thống kê Để tiến hành kiểm định khoảng tin cậy, sau Bước nêu phần trên, ta tiếp tục tiến hành bước sau: Bước 2: Xác định tiêu chuẩn thống kê tìm khoảng tin cậy (ước lượng khoảng) tiêu chuẩn (hoặc tham số cần quan tâm) ứng với mẫu có độ tin cậy định trước Bước 3: So sánh khoảng tin cậy với giá trị định, khoảng tin cậy không chứa giá trị bác bỏ giả thuyết, khoảng tin cậy chứa giá trị phải chấp nhận giả thuyết Tiếp sau trình bày chi tiết số toán kiểm định giả thuyết cụ thể, qua làm sáng tỏ cách vận dụng thủ tục 7.3 Kiểm định tham số 7.3.1 Kiểm định so sánh kỳ vọng biến ngẫu nhiên có phân phối chuẩn (với giá trị cho trước kỳ vọng) Trong phần ta xét giả thuyết kỳ vọng μ biến ngẫu nhiên X có phân phối chuẩn N(μ; σ2 ) Giả sử ta có mẫu ngẫu nhiên (X1, X2, …, Xn) với giá trị mẫu (x1, x2, …, xn) rút từ biến ngẫu nhiên X Trong phần trước ta biết X ước lượng không chệch cho kỳ vọng μ Tuy nhiên ta chưa biết giá trị thực μ muốn kiểm tra xem giá trị có thực khác giá trị μ0 cho trước hay không Ta thành lập toán kiểm định sau: 153 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ Giả thuyết H : μ = μ , đối thuyết H1 : μ ≠ μ H1 : μ > μ H1: μ < μ 0 0 • Trường hợp σ biết: Bài toán H0 : μ = μ0 H1 : μ ≠ μ0 Hình 1: Miền tiêu chuẩn phân phối chuẩn o Kiểm định miền tiêu chuẩn Ta thấy giả thuyết H thống kê U = (X − μ ) σ n có phân phối chuẩn N(0; 1), đồng thời X ước lượng không chệch cho μ Vậy với mức ý nghĩa α giả thuyết bị bác bỏ H Ρ { U > u α / } = α , Φ ( u α / ) = − α / Cụ thể, ta thấy: { } P[bác bỏ H đúng] = P U > u α / μ = μ = ( α / ) = α Do ta có miền bác bỏ (miền tiêu chuẩn, xem Hình 1): ( ) ( ) W= -∞; -u α ∪ u α ; + ∞ Với mẫu cụ thể ta có giá trị tiêu chuẩn thống kê U là: u qs = x − μ0 n σ Nếu giá trị thuộc vào miền tiêu chuẩn ta bác bỏ giả thuyết, kết luận kỳ vọng biến X thực khác μ0 Ngược lại, giá trị nằm miền chấp nhận phải kết luận kỳ vọng X không khác μ0 cách có ý nghĩa o Kiểm định xác suất ý nghĩa Nếu ta bác bỏ giả thuyết với giá trị cụ thể u qs tiêu chuẩn thống kê U tính trên, giả thuyết phải bị bác bỏ cho trường hợp giá trị cụ thể tiêu chuẩn thống kê U có trị tuyệt đối lớn trị tuyệt đối u qs (Hình 2) Lúc xác suất ý nghĩa tính qua công thức: b=P ({ U > u } = 2[1 − Φ( u ) ) qs qs 154 Bài 7: Kiểm định giả thuyết thống kê Hình 2: Diện tích biểu diễn xác suất ý nghĩa phép kiểm định Nếu b ≤ a bác bỏ giả thuyết kết luận X có kỳ vọng khác μ0 Ngược lại, b > a ta phải chấp nhận giả thuyết cho X có kỳ vọng μ0 o Kiểm định khoảng tin cậy Theo nội dung trước, với độ tin cậy 1− α kỳ vọng X có khoảng tin cậy xác định bởi: σ σ ⎛ ⎞ uα ; x + uα ⎟ ⎜x − n n ⎝ ⎠ Lúc ta chấp nhận giả thuyết μ0 điểm nằm khoảng bác bỏ giả thuyết μ0 không thuộc khoảng Nhận xét: Ta dễ dàng kiểm tra thấy ba cách kiểm định cho kết Ví dụ 1: Theo tiêu chuẩn trọng lượng gói mì đóng máy tự động 453 g Kiểm tra ngẫu nhiên 81 gói ta thấy trọng lượng trung bình 448 g Với mức ý nghĩa 0,05 cho trọng lượng gói mì không đạt tiêu chuẩn hay 155 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ không, biết trọng lượng gói mì biến ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn 36g? Giải: ( ) Gọi X trọng lượng gói mì chính, ta có Χ Ν μ; σ2 , với σ = 36 tham số cần kiểm định μ Ta xây dựng toán kiểm định: ⎧ H : μ = 453 ⎨ ⎩ H1 : μ ≠ 453 Với mức ý nghĩa α = 0, 05 , tra bảng phân phối chuẩn ta có u 0,025 = 1,96 Vậy miền bác bỏ là: W= ( -∞; -1,96 ) ∪ (1,96; + ∞ ) Ta có x = 448 Vậy: u qs = 448 − 453 81 = −1, 25 ∉ W 36 Vậy ta chấp nhận giả thuyết H , kết luận gói mì đóng gói đạt tiêu chuẩn Để xác định xác suất ý nghĩa, ta tra bảng thấy: ( ) Φ u qs = Φ (1, 25 ) = 0,8944 Vậy xác suất ý nghĩa x (1 – 0,8944) = x 0,1056 = 0,2112 > 5%, ta phải chấp nhận giả thuyết Nếu sử dụng ước khoảng, ta thấy khoảng tin cậy 95% trung bình trọng lượng gói mì là: σ σ 36 36 ⎞ ⎛ ⎞ ⎛ uα ; x + u α ⎟ = ⎜ 448 − 1,96; 488 + 1,96 ⎟ = ( 440,16; 455,84 ) ⎜x − n n 81 81 ⎝ ⎠ ⎝ ⎠ Rõ ràng 453 ∈ ( 440,16; 455,84 ) ta phải chấp nhận giả thuyết, coi gói mì đạt tiêu chuẩn mặt trọng lượng Với toán kiểm định phía phải, ta dùng thủ tục tương ứng sau Bài toán ⎧⎪H : μ = μ0 ⎨ ⎪⎩H : μ > μ Hình 3: Miền bác bỏ phép kiểm định phía phải • Kiểm định miền tiêu chuẩn Với mức ý nghĩa α , ta tìm giá trị u α cho Ρ {U > u α } = α Rõ ràng giá trị xác định thông qua phân vị phân phối chuẩn tắc 156 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ ngẫu nhiên kiểm định giả thuyết cho nhiều xác suất hay tỷ lệ Tiêu chuẩn phù hợp Khi−bình phương loại kiểm định phi tham số 7.4.1 Kiểm định giả thuyết phân phối biến ngẫu nhiên Cho biến ngẫu nhiên X có hàm phân phối F(x), ta có toán kiểm định sau: H0: X có phân phối F0 (x, θ1 , θ2 , , θr ) H1: X phân phối F0 (x, θ1 , θ2 , , θr ), θ1 , θ2 , , θr tham số phân phối F0 Để giải toán ta tiến hành sau: xét mẫu ngẫu nhiên (X1,X2, …,Xn) rút từ X với giá trị mẫu (x1, x2, …, xn) Chia miền giá trị X thành k miền không giao S1, S2, …, Sk Ký hiệu ni số giá trị mẫu rơi vào khoảng Si (i = 1,2, ,k), ni gọi tần số thực nghiệm Nếu giả thuyết H0 X có phân phối xác định F0, ta tính xác suất: pi = P {X ∈ Si } ,i = 1, 2, , k Đặt Ei = n.pi, i = 1,2,…,k; n = n1 + n + + n k Các Ei tần số lý thuyết miền Si Ta xét trường hợp sau: • Trường hợp tham số θ1 ,θ , ,θr biết Xét thống kê: k χ2 = ∑ i =1 (n i − E i ) Ei Khi thống kê cho có phân phối Khi−bình phương với k−1 bậc tự Giả thuyết H bác bỏ giá trị tiêu chuẩn thống kê đủ lớn, với mức ý nghĩa α cho trước miền bác bỏ W = (χα2 ,k-1 ; + ∞) Với mẫu cụ thể ta tính giá trị tiêu chuẩn thống kê χqs so sánh giá trị với miền bác bỏ để đưa kết luận phân phối biến xét Ví dụ 13: Quan sát biến ngẫu nhiên X ta thu số liệu mẫu sau Giá trị X Số lần 0-1 1-3 3-6 6-7 7-10 Với mức ý nghĩa 5% kiểm định xem biến ngẫu nhiên X có phân phối [0; 10] hay không Giải: 176 Bài 7: Kiểm định giả thuyết thống kê Ta cần kiểm định giả thuyết H : X có phân phối [0; 10] với đối thuyết H1 : X phân phối [0; 10] Ta có cỡ mẫu n = 18 khoảng: S1 = (0,1), n1 = 3; S2 = (1; 3), n2 = 4; S3 = (3; 6), n3 = 2; S4 = (6;7), n4 = 5; S5 = (7;10), n5 = Các xác suất tương ứng là: p1 = P {0 < X < 1} = 1/10; p = P {1 < X < 3} = /10 = 1/ 5; p3 = /10; p = 1/10; p5 = /10 Các tần số lý thuyết: E1 = 18 ×1/10 = 1,8; E = 18 ×1/ = 3, 6; E = 18 × /10 = 5, 4; E = 18 ×1/10 = 1,8; E = 18 × /10 = 5, Vậy ta có: χqs = (3 − 1,8) (4 − 3.6) (2 − 5, 4) (5 − 1,8) (4 − 5, 4) + + + + = 9, 037 1,8 3.6 5, 1,8 5, = 9, 488 miền bác bỏ Tra bảng phân phối Khi−bình phương ta χ0,05;4 W = (9,488; + ∞) So sánh giá trị quan sát tiêu chuẩn kiểm định với miền ∉ W, chưa thể bác bỏ giả thuyết H bác bỏ, ta thấy χqs Ví dụ 14: Người ta cho số lỗi in ấn đại lượng tuân theo luật phân phối Poisson với cường độ 0,75 Để khẳng định điều ta lấy mẫu gồm 60 trang in thu kết sau: Số lỗi in Số trang 32 15 Với mức ý nghĩa 5% đánh giá ý kiến Giải: Gọi X lỗi xuất trình in ấn trang sách, ta cần kiểm định giả thuyết H : X có phân phối Poisson với tham số 0,75 H1 : X phân phối Poisson với tham số 0,75 Ta có khoảng: S1 = {0}, n1 = 32; S2 = {1}, n2 = 15; S3 = {2}, n3 = 9; S4 = [3; + ∞), n4 = Với tham số λ = 0, 75 ta tính xác suất: 177 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ e −0,75 0, 750 = 0, 472 ⇒ E1 = 60 × 4, 72 = 28,32 0! e −0,75 0, 751 = 0,354 ⇒ E = 60 × 0,354 = 21, 24 p = P(X = 1) = 1! e −0,75 0, 752 = 0,133 ⇒ E = 60 × 0,133 = 7,98 p3 = P(X = 2) = 2! p = P(X ≥ 3) = − (p1 + p + p3 ) = 0, 041 ⇒ E = 60 × 0, 041 = 2, 46 p1 = P(X = 0) = Từ ta có: χqs = (32 − 28,32) (15 − 21, 24) (9 − 7,98) (4 − 2, 46) + + + = 2,94 283, 21, 24 7,98 2, 46 = 7,814 , miền bác bỏ Với mức ý nghĩa 5% tra bảng ta χ0,05;3 W = (7,814; + ∞) So sánh giá trị cụ thể tiêu chuẩn kiểm định với miền bác bỏ, ta thấy χqs ∉ W, chưa thể bác bỏ giả thuyết H • Trường hợp tham số θ1 ,θ , ,θr chưa biết Trong trường hợp ta tiến hành bước tương tự trước xác suất pi = P(X ∈ Si ) phụ thuộc vào tham số ta thay tham số ước lượng điểm tương ứng Ta xét tiêu chuẩn thống kê trường hợp trước lưu ý tiêu chuẩn thống kê có phân phối Khi−bình phương với k − r − bậc tự Cụ thể là: o Đối với phân phối chuẩn N(μ; σ2 ) , ta có tham số θ1 = μ; θ2 = σ , r = , ta thay μ x , thay σ s '2 o Đối với phân phối Poisson với tham số λ , r = 1, thay tham số λ x o Đối với phân phối nhị thức B(n; p), r = 1, tham số p thay tần suất f = m/n o Đối với phân phối mũ với tham số λ , r = 1, thay tham số λ 1/ x o Đối với phân phối [a; b], số tham sô r = tham số a thay x − 3s , tham số b thay x + 3s Ví dụ 15: Quan sát biến ngẫu nhiên X ta thu giá trị mẫu sau: Giá trị X ni 1-3 3-5 5-7 7-9 9-11 Với mức ý nghĩa 5% cho biến ngẫu nhiên X có phân phối chuẩn hay không? Giải: Ta cần kiểm định toán 178 Bài 7: Kiểm định giả thuyết thống kê H : X có phân phối chuẩn N(μ; σ2 ) H1 : X phân phối chuẩn N(μ; σ ) Ta có miền giá trị X R ta phải gộp khoảng lại S1 = (−∞; 3), n1 = 3; S2 = (3; 5), n = 6; S3 = (5; 7), n = 4; S4 = (7; 9), n = 7; S5 = (9; + ∞), n = Với mẫu cho ta tính x = 5,91; s′2 = 6, 25 Thay tham số chưa biết ước lượng tương ứng, μ = x = 5,91; σ = s '2 = 6, 25 Khi giả sử biến ngẫu nhiên X có phân phối chuẩn N(5,91; 6,25), ta tính xác suất: p1 = P{−∞ < X < 3} = 0,181 ⇒ E1 = 22 × 0,181 = 3,982 p = P{3 < X < 5} = 0, 275 ⇒ E = 22 × 0, 275 = 6, 05 p3 = P{5 < X < 7} = 0, 299 ⇒ E = 22 × 0, 299 = 6,578 p = P{7 < X < 9} = 0,177 ⇒ E = 22 × 0,177 = 3,894 p5 = P{9 < X < +∞} = 0, 068 ⇒ E = 22 × 0, 068 = 1, 496 Từ ta có: χqs = (3 − 3,982) (6 − 6, 05) (4 − 6,578) (7 − 3,894) (2 − 1, 496) + + + + = 3,9 3,982 6, 05 6,578 3,894 1, 496 = 5,99 Vậy miền Với mức ý nghĩa 5% số tham số r = 2, tra bảng ta χ0,05;2 bác bỏ W = (5,99; + ∞) So sánh giá trị cụ thể tiêu chuẩn kiểm định với miền ∉ W, chưa thể bác bỏ giả thuyết H bác bỏ, ta thấy χqs 7.4.2 So sánh nhiều tỷ lệ Phần xét toán mở rộng toán kiểm định so sánh hai xác suất Giả sử ta có k biến ngẫu nhiên X1, X2,…, Xk độc lập phân phối 0-1 với xác suất tương ứng p1, p2, …, pk Ta kiểm định toán sau: ⎧⎪H : p1 = p = = p k ⎨ ⎪⎩H1 : ∃pi ≠ p j ,i ≠ j Để kiểm định toán ta thành lập mẫu n quan sát biến ngẫu nhiên nói có bảng số liệu mẫu sau: X1 … n11 … Xi nli E11 n21 … … Xk ∑ u1k u1 Eli … n2i E1k … n2k u2 179 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ E21 ∑ E2i v1 … vi E1k … vk n Trong đó: k s =1 i =1 vi = ∑ n si ; u s = ∑ n si v1 + v2 +…+ vk = n, vi cỡ mẫu biến ngẫu nhiên Xi (i = 1,2, ,k) Đặt: E si = u s vi ; s = 1,2, i = 1,2, ,k n Ta viết giá trị Esi cạnh giá trị nsi bảng số liệu Lúc giả thuyết k thống kê: χ = ∑∑ s =1 i =1 (n si − E si ) có phân phối xấp xỉ phân phối Khi−bình E si phương với k−1 bậc tự Với mức ý nghĩa α , tra bảng phân phối khi−bình phương ( ) ta giá trị phân vị χ α2 ,k −1 , từ xác định miền bác bỏ W = x α2 ,k −1 ; + ∞ Ví dụ 16: Có ba nhà máy sản xuất loại sản phẩm, người ta tiến hành kểm tra sản phẩm ba nhà máy thu số liệu sau: Nhà máy Nhà máy Nhà máy Nhà máy A B C chất lượng Phế phẩm 12 16 13,14 Chính phẩm 88 15,77 104 86,86 ∑ 18 100 46 17,09 112 104,23 120 ∑ 304 112,91 130 350 Với mức ý nghĩa 5% cho tỷ lệ phế phẩm ba nhà máy hay không? Giải: Gọi p1, p2, p3 tỷ lệ phế phẩm ba nhà máy A, B C Ta cần kiểm định giả thuyết: ⎧⎪H : p1 = p = p3 ⎨ ⎪⎩H1 : ∃pi ≠ p j ,i ≠ j 180 Bài 7: Kiểm định giả thuyết thống kê Tính toán với số liệu cho, ta Esi ghi bảng Từ ta có: (12 − 13,14) (88 − 86,86) (16 − 15, 77) χ = + + 13,14 86,86 15, 77 qs (104 − 104, 23) (18 − 17,09) (112 − 112,91) + + + = 0,174 104, 23 17,09 112,09 Với mức ý nghĩa 5%, k = 3, tiến hành tra bảng ta có χ0,05;2 = 5,99 miền bác bỏ W = (5,99; + ∞) So sánh giá trị cụ thể tiêu chuẩn kiểm định với miền bác bỏ xác định trên, ta thấy χqs ∉ W, ta chấp nhận giả thuyết H coi tỷ lệ phế phẩm ba nhà máy 7.4.3 Kiểm tra tính độc lập Trong lý thuyết xác suất việc kiểm tra tính độc lập hai biến ngẫu nhiên toán quan trọng Phần đưa phương pháp thống kê để kiểm định tính độc lập hai biến ngẫu nhiên hay hai tổng thể Ta xét hai biến ngẫu nhiên X Y với giả thuyết H : X độc lập với Y, đối thuyết H1 : X không độc lập với Y Để giải toán kiểm định ta lấy mẫu ngẫu nhiên hai chiều (X1, Y1), (X2, Y2),…,(Xn, Yn) rút từ véc tơ ngẫu nhiên (X, Y) có giá trị mẫu (x1, y1), (x2, y2), …, (xn, yn) Thu gọn giá trị mẫu ta có bảng biểu diễn sau: y1 yj … yj … … n1j … ys xi x1 n11 (E11) n1s (E1j) ∑ b1 (E1s) ni1 … nij … nis bi xi (Ei1) ( Eij) (Eis) xr nr1 nrj … nrs br … (Er1) ∑ a1 (Erj) aj (Ers) … as n nij số lần cặp giá trị (xi, yj) xuất giá trị mẫu: 181 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ s a i = ∑ n ij ,i = 1, 2, , r j=1 r b j = ∑ n ij , j = 1, 2, ,s i =1 Đặt E ij = a i b j , ta viết giá trị Eij vào ngoặc bên cạnh nij ô (i;j) Nếu giả n thuyết thống kê: r s (n ij − E ij ) χ = ∑∑ n i =1 j=1 E ij có quy luật phân phối xấp xỉ phân phối khi−bình phương với (r − 1)(s − 1) bậc tự Với mức ý nghĩa α ta tra bảng phân phối khi-bình phương thu giá trị phân vị χα2 ,(r −1)(s −1) , từ xác định miền bác bỏ W = (χα2 ,(r-1)(s-1) ; +∞) Ví dụ 17: Nghiên cứu tình trạng hôn nhân trước ngày cưới 542 cặp vợ chồng ta có bảng số liệu: Tình trạng hôn nhân Chưa kết Tình trạng vợ hôn lần hôn nhân chồng Chưa kết hôn lần 180 Ly hôn 34 Goá 36 ∑ 250 (53,97) (129,61) (66,42) 182 Bài 7: Kiểm định giả thuyết thống kê Ly hôn Goá ∑ 58 76 54 188 (40,58) (97,47) (49,95) 43 34 27 104 (22,45) (53,92) (27,63) 281 144 117 542 Với mức ý nghĩa 5% cho tình trạng hôn nhân vợ chồng độc lập với hay không? Giải: Ta cần kiểm định giả thuyết H : Tình trạng hôn nhân chồng độc lập với vợ H1 : Tình trạng hôn nhân chồng không độc lập với vợ Theo số liệu cho, tính toán giá trị E ij ghi vào ô tương ứng Ta có E 11 = 281x250/542 = 129,61 Tính toán tương tự ta số liệu cho bảng Tiếp ta tính giá trị cụ thể tiêu chuẩn thống kê: (180 − 129, 61) (58 − 97, 47) (43 − 53,92) (34 − 66, 42) (76 − 49,95) χ = + + + + 129, 61 97, 47 53,92 66, 42 49,95 qs (34 − 27, 63) (36 − 53,97) (54 − 40,58) (27 − 22, 45) + + + + = 80 27, 63 53,97 40,58 22, 45 Ta có r = s = Với mức ý nghĩa 5%, tra bảng phân phối Khi−bình phương ta χ0,05,4 = 9, 48, ta có miền bác bỏ W = ( 9, 48; +∞ ) So sánh giá trị tiêu chuẩn ∈ W Do ta bác bỏ giả thuyết H thống kê với miền bác bỏ, ta thấy χqs 183 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ TÓM LƯỢC CUỐI BÀI Trong ta xét toán quan trọng thống kê kiểm định giả thuyết Bài trước ta xem xét toán làm để ước lượng tham số tổng thể Tuy nhiên nhiều toán khoa học, kỹ thuật kinh tế đòi hỏi ta phải đưa định chấp nhận hay bác bỏ nhận định tham số tổng thể Lúc ta phải giải toán kiểm định giả thuyết thống kê 184 Bài 7: Kiểm định giả thuyết thống kê BÀI TẬP TRẮC NGHIỆM Mức ý nghĩa a) giá trị z b) giá trị tham số c) giá trị nằm khoảng d) giá trị α Với toán kiểm định giả thuyết Giả thuyết H : μ = μ Đối thuyết H1 : μ > μ với mức ý nghĩa α , mẫu lớn phương sai chưa biết, giả thuyết H bị bác bỏ giá trị thống kê a) z > z α b) z < −z α c) z > z α d) z < −z α Năng suất trung bình giống lúa nước ta năm trước 32,5 tạ/ha Năm người ta đưa vào phương pháp chăm sóc hy vọng suất cao năm trước Bài toán kiểm định giả thuyết a) Giả thuyết H : μ = 32,5 Đối thuyết H1 : μ > 32,5 b) Giả thuyết H : μ = 32,5 Đối thuyết H1 : μ < 32,5 c) Giả thuyết H : μ ≠ 325 Đối thuyết H1 : μ > 325 d) Giả thuyết H : μ < 325 Đối thuyết H1 : μ > 325 Một phương pháp ăn kiêng quảng cáo rằng: làm giảm trọng lượng 45 pound tháng Bài toán kiểm định giả thuyết a) Giả thuyết H : μ = 45 Đối thuyết H1 : μ > 45 b) Giả thuyết H : μ = 45 Đối thuyết H1 : μ < 45 c) Giả thuyết H : μ ≠ 45 185 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ Đối thuyết H1 : μ < 45 d) Giả thuyết H : μ ≠ 45 Đối thuyết H1 : μ > 45 Cho thông tin sau n = 16, μ = 15, x = 16, σ = 16 Giả sử mẫu tuân theo luật phân phối chuẩn Giá trị thống kê a) z = 1 b) z = c) z = d) z = −1 Cho thông tin sau n = 16, μ = 15, x = 16, σ = 16 Giả sử mẫu tuân theo luật phân phối chuẩn Nếu thực kiểm định phía bên phải a) Bác bỏ giả thuyết α = 0,1 b) Không bác bỏ giả thuyết α = 0,1 c) Không thể thực toán kiểm định cần nhiều thông tin d) Bác bỏ giả thuyết α > 0,1 Cho thông tin sau Mẫu A: n = 81, x = 51,s12 = 16 Mẫu B: m = 64, y = 48,s 22 = 12 Khoảng tin cậy cho hiệu x − yz với độ tin cậy 95% a (1,784; 4,216 ) b (1,584; 4,216 ) c (1,784;5,216 ) d (1,84; 4,416 ) Một giáo sư toán học muốn xác định xem liệu có khác điểm trung bình học kỳ I học kỳ II Môn Thống kê kinh tế hay không Chọn ngẫu nhiên 16 sinh viên học kỳ I, tính điểm trung bình 75 với độ lệch tiêu chuẩn Chọn ngẫu nhiên sinh viên học kỳ II, tính điểm trung bình 73 với độ lệch tiêu chuẩn Điểm học kỳ I II giả sử tuân theo phân phối chuẩn có phương sai Giá trị Thống kê a z = 1,9964 b t = 0,5009 186 Bài 7: Kiểm định giả thuyết thống kê c t = 0,956 d z = 0,5009 Một nhóm sinh viên nước muốn du học Hoa Kỳ đăng ký thi TOFEL chuẩn bị cho khóa học Lấy mẫu kiểm tra vào ngày học sau kiểm tra lại vào cuối khóa học Kết thu sau Trước 325 495 525 480 525 480 Sau 375 520 510 510 550 490 Ký hiệu μd = μ T − μS hiệu trung bình điểm thi trước trung bình điểm thi sau Ta muốn kiểm định xem liệu khoá học có giúp sinh viên học TOFEL tốt không Bài toán kiểm định giả thuyết a) Giả thuyết : H : μd = Đối thuyết: H1 : H : μd > b) Giả thuyết : H : μd = Đối thuyết: H1 : H : μd < c) Giả thuyết : H : μd ≥ Đối thuyết: H1 : H : μd ≠ d) Giả thuyết : H : μd ≤ Đối thuyết: H1 : H : μd ≠ 10 Một nhóm sinh viên nước muốn du học Hoa Kỳ đăng ký thi TOEFL chuẩn bị cho khóa học Lấy mẫu kiểm tra vào ngày học sau kiểm tra lại vào cuối khóa học Kết thu sau Trước 325 495 525 480 525 480 Sau 375 520 510 510 550 490 Ta muốn kiểm định xem liệu khoá học có giúp sinh viên học TOEFL tốt không Giá trị Thống kê a) z = 2,3814 b) t = 0, 0169 c) z = - 0, 0169 d) t = 2,3814 11 Công ty nước giải khát Coca-Cola nghiên cứu việc đưa vào công thức để cải tiến sản phẩm Với công thức cũ cho 500 người dùng thử có 150 người ưa thích Với công thức cho 1000 người khác dùng thử có 350 người ưa thích Giá trị Thống kê a) 2,4 b) 3,0 c) 1,96 d) 2,12 187 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ BÀI TẬP Theo tiêu chuẩn trọng lượng gói mỳ máy đóng gói tự động 453 gam Kiểm tra ngẫu nhiên 90 gói thấy trọng lượng trung bình 448gam Biết trọng lượng gói mỳ biến ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn 36gam Với mức ý nghĩa 5% kết luận gói mỳ bị đóng thiếu hay không? Để định mức thời gian gia công chi tiết máy, người ta theo dõi ngẫu nhiên trình gia công 25 chi tiết thu số liệu sau: Thời gian 15-17 17-19 19-21 21-23 23-25 Số chi tiết 7 Biết thời gian gia công chi tiết biến ngẫu nhiên có phân phối chuẩn, với mức ý nghĩa 5% cho thời gian trung bình gia công chi tiết lớn 18 phút không? Trước định mức tiêu hao nhiên liệu cho máy sản xuất ca 1,5 lít Do điều kiện thay đổi, người ta theo dõi 35 máy sản xuất thu số liệu sau: Lượng tiêu hao (lít) Số máy 1,0-1,2 1,2-1,4 1,4-1,6 1,6-1,8 1,8-2,0 12 Giả thiết lượng tiêu hao nhiên liệu biển ngẫu nhiên có phân phối chuẩn Với mức ý nghĩa 3% kết luận xem có cần thay đổi mức tiêu hao nhiên liệu hay không? Tỷ lệ phế phẩm máy tự động sản xuất 5% Kiểm ngẫu nhiên 300 sản phẩm thấy có 24 phế phẩm Hãy kết luận với mức ý nghĩa 4% ý kiến cho tỷ lệ phế phẩm có xu tăng lên Tỷ lệ bệnh nhân khỏi bệnh T điều trị thuốc A 85% Thử nghiệm dùng loại thuốc B để chữa trị 900 người mắc bệnh T có 810 người chữa khỏi Có thể cho thuốc B hiệu thuốc A hay không? Hãy kết luận với mức ý nghĩa 5% Theo số liệu điều tra quốc tế, tỷ lệ mắc bệnh A nước X 0,15% Điều tra ngẫu nhiên 12500 người dân nước Y thấy có 38 người mắc bệnh A Với mức ý nghĩa 2% kiểm định ý kiến cho tỷ lệ mắc bệnh A nước Y cao nước X Để so sánh trọng lượng trung bình trẻ sơ sinh thành thị nông thôn, người ta cân thử trọng lượng 10000 cháu thu kết bảng sau: Vùng Số cháu Trọng lượng Tb Độ lệch chuẩn mẫu Nông thôn 8000 3,0kg 0,9kg Thành thị 2000 3,2kg 0,4kg 188 Bài 7: Kiểm định giả thuyết thống kê Biết lượng trẻ biến ngẫu có phân phối chuẩn, với mức ý nghĩa 5% cho trọng lượng trung bình trẻ sơ sinh thành thị cao nông thôn hay không? Tiến trình thí nghiệm phương pháp chăn nuôi gia cầm sau tháng thu kết sau: Phương pháp Số gia cầm Mức tăng TB Độ lệch chuẩn mẫu Phương pháp I 100 1,1 0,2 Phương pháp II 150 1,2 0,3 Giả thiết mức tăng trọng gia cầm biến ngẫu nhiên phân phối chuẩn Với mức ý nghĩa 4% kết luận phương pháp II hiệu phương pháp I hay không? Điều tra tình trạng công nhân bỏ việc xí nghiệp A B ta có số liệu sau: Xí nghiệp A có 200 công nhân năm 2001 có 30 người bỏ việc Xí nghiệp B có 350 công nhân năm 2001 có 65 bỏ việc Với mức ý nghĩa 3% cho rẳng tỉ lệ công nhân bỏ việc xí nghiệp A thấp xí nghiệp B hay không? 10 Trọng lượng sản phẩm biến ngẫu nhiên có phân phối chuẩn máy móc coi hoạt động bình thường , độ lệch chuẩn 1kg Có thể coi máy móc hoạt động bình thường hay không cân thử 30 sản phẩm thấy độ lệch chuẩn mẫu 1,1 kg Hãy kết luận với mức ý nghĩa 5% 11 Cho biến ngẫu nhiên X ~ N( μ1 , σ12 ) ;( μ σ22 ) Tiến hành lấy mẫu ngẫu nhiên X Y ta thu kết sau: Biến ngẫu nhiên X: n1 = , X = 5,sx = Biến ngẫu nhiên Y: n2 = 10 , Y = 3,sy = Với mức ý nghĩa 5% kết luận phương sai σ12 lớn phương sai σ 22 hay không? 12 Đo phần trăm giãn nở thép dụng cụ đo A B thu số liệu sau: Phương pháp A 28 29 31 33 30 Phương pháp B 34 27 30 36 33 Với mức ý nghĩa 1% kết luận khác biệt phương sai hai phương pháp A B, biết độ giãn nở biến ngẫu nhiên có phân phối chuẩn 13 Nghiên cứu thành phần ảnh hưởng thức ăn bố mẹ X giới tính Y cái,thu kết sau: 189 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ X Không có Vitamin Có Vitamin Tộng cộng Nam 123 145 268 Nữ 152 150 303 Y Với mức ý nghĩa 3% xem X Y độc lập với hay không? 14 Sử dụng phương pháp xử lý hạt giống thu kêt quả: Kết Phương pháp Phương pháp Phương pháp số hạt mọc 360 603 490 số hạt không mọc 40 97 180 Kiểm định xem tỷ lệ nảy mầm phương pháp có khác hay không, kết luận với mức ý nghĩa 5%? 190 [...]... ra kết quả x = 92, 255; s 2x = 4,998; y = 92, 73 3; s 2y = 7, 77 và giá trị tiêu chuẩn thống kê: t qs = So sánh ta thấy t qs 92, 255 − 92, 73 3 = −0,353 8 × 4,998 + 8 × 7, 77 8 + 8 8+8−2 8×8 ∉ W, vậy phải chấp nhận H 0 , kết luận công nhân hai nhà máy thu nhập như nhau 171 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ 7. 3.5 Kiểm định giả thuyết so sánh hai xác suất Cho hai biến ngẫu nhiên X và Y có phân phối... quá trình in ấn một trang sách, ta cần kiểm định giả thuyết H 0 : X có phân phối Poisson với tham số 0 ,75 H1 : X không có phân phối Poisson với tham số 0 ,75 Ta có các khoảng: S1 = {0}, n1 = 32; S2 = {1}, n2 = 15; S3 = {2}, n3 = 9; S4 = [3; + ∞), n4 = 4 Với tham số λ = 0, 75 ta tính các xác suất: 177 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ e −0 ,75 0, 75 0 = 0, 472 ⇒ E1 = 60 × 4, 72 = 28,32 0! e −0 ,75 ... tức là máy đóng chai vẫn đạt chuẩn 7. 3.3 Kiểm định giả thuyết cho xác suất (hay tỷ lệ) Cho biến cố A với xác suất p chưa biết Thực hiện n lần thử về biến cố A, gọi m là số lần A xảy ra Ta có f = m/n là tần suất xuất hiện biến cố A Ta cần so sánh xác suất p với một giá trị cho trước p0 Xét thống kê: U= (f − p ) 0 n p (1 − p ) 0 0 166 Bài 7: Kiểm định giả thuyết thống kê ơ Khi đó U có phân phối xấp xỉ... N(5,91; 6,25), ta tính các xác suất: p1 = P{−∞ < X < 3} = 0,181 ⇒ E1 = 22 × 0,181 = 3,982 p 2 = P{3 < X < 5} = 0, 275 ⇒ E 2 = 22 × 0, 275 = 6, 05 p3 = P{5 < X < 7} = 0, 299 ⇒ E 3 = 22 × 0, 299 = 6, 578 p 4 = P {7 < X < 9} = 0, 177 ⇒ E 4 = 22 × 0, 177 = 3,894 p5 = P{9 < X < +∞} = 0, 068 ⇒ E 5 = 22 × 0, 068 = 1, 496 Từ đó ta có: 2 χqs = (3 − 3,982) 2 (6 − 6, 05) 2 (4 − 6, 578 ) 2 (7 − 3,894) 2 (2 − 1, 496)... phân phối xác suất của biến ngẫu nhiên ban đầu Trong phần này chúng ta sẽ sử dụng phân phối Khi−bình phương như một tiêu chuẩn để giải quyết các bài toán liên quan tới kiểm định giả thuyết cho phân phối của biến 175 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ ngẫu nhiên cũng như kiểm định giả thuyết cho nhiều xác suất hay tỷ lệ Tiêu chuẩn phù hợp Khi−bình phương là một loại kiểm định phi tham số 7. 4.1 Kiểm... Kiểm định bằng xác suất ý nghĩa Với giá trị cụ thể u qs của thống kê U, ta tính được (bằng máy tính hoặc tra bảng) xác suất ý nghĩa b = P {U > u qs } = 1 − Φ ( u qs ) So sánh với mức ý nghĩa α , nếu b ≤ α thì ta bác bỏ giả thuyết Còn nếu b > α thì ta chấp nhận giả thuyết Hình 4: Xác suất ý nghĩa của phép kiểm định một phía phải • Kiểm định bằng khoảng tin cậy Theo nội dung trình bày ở bài trước, khoảng... hợp σ12 ;σ 22 đã biết Xét thống kê: U= (X − Y) − (μ1 − μ 2 ) σ12 σ22 + n m khi đó U có phân phối chuẩn N(0; 1) Nếu giả thuyết H0 là đúng thì: 168 Bài 7: Kiểm định giả thuyết thống kê ơ U= (X − Y) 2 2 σ σ 1 + 2 n m Với mẫu cụ thể giá trị của tiêu chuẩn thống kê là: u qs = (x − y) σ12 σ22 + n m Lập luận tương tự như phần 6.2.1 a, ta có miền bác bỏ của các bài toán như sau: Bài toán 1: ⎧H 0 : μ1 = μ... Xét thống kê: T= X−Y nS2 + mS2 x y n+m n+m−2 nm Khi đó T có quy luật phân phối Student với n + m – 2 bậc tự do Với mẫu cụ thể x−y giá trị của tiêu chuẩn thống kê T: t qs = ns 2x + ms 2y n + m n+m−2 nm Lập luận tương tự như trong phần 7. 2.1 b, ta có: Bài toán 1: ⎧H 0 : μ1 = μ 2 ⎨ ⎩H1 : μ1 ≠ μ 2 ( ) có miền bác bỏ W = −∞; − t n + m − 2 ) ∪ (t n + m − 2 ; +∞ α/2 α/2 170 Bài 7: Kiểm định giả thuyết thống. .. cụ thể đã cho ta tính được X = 34, 613 , giá trị tiêu chuẩn thống kê là: u qs = x − μ0 34, 613 − 32,5 n= 15 = 2,5 87 σ 10 Ta có u qs = 2,5 87 ∈ W , vậy ta bác bỏ giả thuyết H 0 , kết luận năng suất lúa đã tăng lên Ta cũng có thể tra bảng để tìm ra xác suất ý nghĩa ứng với giá trị quan sát được của tiêu chuẩn thống kê: Φ 0 ( u qs ) = Φ ( 2,5 87 ) = 0,9952 Như vậy, b = 1 – 0,9952 = 0,0048 < 0,01, ta có... p1 < p2 Xét thống kê U= f −f 1 2 ⎛1 1 ⎞ f (1 − f ) ⎜ + ⎟ ⎝n m⎠ Nếu giả thuyết đúng thì thống kê U có quy luật phân phối tiệm cận phân phối chuẩn N(0,1), do vậy với mức ý nghĩa α cho trước ta có miền bác bỏ ứng với các bài toán kiểm định sau Bài toán 1: ⎧⎪H o : p = p 1 2 ⎨ ⎪⎩H1 : p1 ≠ p2 có miền bác bỏ W = (-∞; -u α/2 ) ∪ (u α/2 ; + ∞) Bài toán 2: ⎧H 0 : p1 = p 2 ⎨ ⎩H1 : p1 > p 2 172 Bài 7: Kiểm định ... giả thuyết thống kê Ơơ[ e −0 ,75 0, 75 0 = 0, 472 ⇒ E1 = 60 × 4, 72 = 28,32 0! e −0 ,75 0, 75 1 = 0,354 ⇒ E = 60 × 0,354 = 21, 24 p = P(X = 1) = 1! e −0 ,75 0, 75 2 = 0,133 ⇒ E = 60 × 0,133 = 7, 98 p3... Goá 36 ∑ 250 (53, 97) (129,61) (66,42) 182 Bài 7: Kiểm định giả thuyết thống kê Ly hôn Goá ∑ 58 76 54 188 (40,58) ( 97, 47) (49,95) 43 34 27 104 (22,45) (53,92) ( 27, 63) 281 144 1 17 542 Với mức ý nghĩa... nào? Dây chuyền hoạt động tốt không? 149 Bài 7: Kiểm định giả thuyết thống kê Ơơ[ 7. 1 Khái niệm giả thuyết thống kê 7. 1.1 Khái niệm Giả thuyết thống kê mệnh đề nhận định tham số tổng thể Khi