Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 49 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
49
Dung lượng
529,66 KB
Nội dung
ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM KHOA TOÁN PHAN THỊ THANH NHẠN PHƯƠNG PHÁP P -giá trị KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ KHÓA LUẬN TỐT NGHIỆP Chuyên ngành : Xác Suất - Thống Kê Giáo viên hướng dẫn: ThS.LÊ VĂN DŨNG Đà Nẵng - 2013 LỜI CẢM ƠN Trong suốt khoá học (2009- 2013) Trường Đại học Sư phạm - ĐHĐN, với nổ lực thân giúp đỡ thầy cô giáo trường, đặc biệt thầy giáo khoa Tốn giúp em có vốn tri thức vững vàng để hoàn thành luận văn tốt nghiệp Trong thời gian làm luận văn, giúp đỡ giáo viên hướng dẫn ThS Lê Văn Dũng mặt, từ nhiều phía em hồn thành thời gian qui định Em xin chân thành gửi lời cảm ơn đến : - Các thầy cô giáo khoa Toán giảng dạy cho em kiến thức chuyên môn làm sở để thực tốt luận văn tốt nghiệp tạo điều kiện cho em hồn thành tốt khố học - Đặc biệt, em xin gửi lời cảm ơn chân thành đến ThS Lê Văn Dũng người theo sát bảo hướng cho em lời khuyên quí báu cung cấp thông tin khoa học để em định hướng tốt làm luận văn tốt nghiệp - Nhân em xin gởi lời cảm ơn đến gia đình, bạn bè giúp đỡ động viên vật chất lẫn tinh thần suốt trình làm luận văn tốt nghiệp Mặc dù luận văn hoàn thành thời gian qui định điều kiện thời gian kiến thức hạn chế nên luận văn em khơng tránh khỏi thiếu sót Vì vậy, em mong nhận đóng góp ý kiến thầy cô bạn để tạo điều kiện cho luận văn em hoàn thiện Đà Nẵng, tháng 05 năm 2013 Sinh viên thực Phan Thị Thanh Nhạn Phương pháp p-giá trị kiểm định giả thiết SVTH: Phan Thị Thanh Nhạn Đà Nẵng, 05 - 2013 Trang LỜI MỞ ĐẦU Lí chọn đề tài Ngày nay, Xác suất thống kê môn học sở giảng dạy trường đại học, cao đẳng Khơng cịn ứng dụng nhiều ngành kinh tế, kỹ thuật, sinh học, y học, Nó giúp cách tổ chức đạo, sản xuất, phân phối lưu thơng, góp phần dự báo kinh tế, đánh giá chất lượng sản phẩm, suất lao động, thu nhập xử lý khối lượng lớn số liệu thông tin, Kiểm định giả thiết thống kê phần thiếu phân mơn Nó khơng giúp ta kiểm chứng sai giả thiết đặt mà cịn giúp ta có định đắn trước vấn đề Trong đời sống, kiểm định công việc tất yếu kinh doanh, y khoa, sản xuất, học tập Chính vậy, kiểm định khơng quan trọng lý thuyết mà hữu dụng thực tế Để thực kiểm định giả thiết thống kê Phương pháp p- giá trị, cần có kiến thức Xác suất- Thống kê như: mẫu số liệu đại lượng đặc trưng mẫu số liệu, quy luật phân phối xác suất, ước lượng điểm, hàm ước lượng Cùng với phương pháp kiểm định truyền thống, phương pháp p- giá trị kiểm định giả thiết thống kê phương pháp đơn giản, dễ thực dựa số xác suất để đưa kết luận Với lí tơi định chọn đề tài nghiên cứu cho luận văn : Phương pháp p- giá trị kiểm định giả thiết thống kê Mục đích nghiên cứu Phương pháp p- giá trị dùng để kiểm định giả thiết đưa từ đại lượng ngẫu nhiên rời rạc hay từ mẫu số liệu Đây Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013 phương pháp hữu hiệu hạn chế số nhược điểm thống kê cổ điển Phương pháp đánh giá cách mạng quan trọng xác suất thống kê Đối tượng nghiên cứu Đề tài nghiên cứu Phương pháp p- giá trị kiểm định giả thiết thống kê Phạm vi nghiên cứu Nghiên cứu tài liệu xác suất, phương pháp kiểm định P- giá trị Phạm vi nghiên cứu tập trung chủ yếu vào phần Kiểm định giả thuyết thống kê Phương pháp nghiên cứu Để thuận tiện cho việc nghiên cứu soạn thảo luận văn này, sử dụng phần mềm latex để thực hiện, Latex phần mềm tương đối dễ sử dụng, linh hoạt việc tìm sửa lỗi Và đặc biệt phần mềm miễn phí Bên cạnh tơi cịn sử dụng phần mềm EXCEL để tính tốn Thu thập báo khoa học, tài liệu liên quan đến đề tài Tham khảo tài liệu mạng Internet Địa : http://math.mercyhurst.edu/ Ý nghĩa khoa học Luận văn trình bày có hệ thống với mục rõ ràng chặt chẽ Phương pháp P-giá trị để kiểm định giả thuyết thơng kê Bên cạnh đó, luận văn cịn đưa ví dụ áp dụng thực tế việc kiểm định giả thuyết phương pháp kiệm định Do đó, luận văn góp phần tạo số tài liệu tham khảo cho sinh viên ngành toán Cấu trúc luận văn Bố cục bao gồm chương : • Chương Kiến thức sở • Chương Phương pháp P- giá trị kiểm định giả thuyết Do thời gian thực khóa luận khơng nhiều, kiến thức cịn hạn chế nên làm khóa luận khơng tránh khỏi hạn chế sai sót Tơi SVTH: Phan Thị Thanh Nhạn Trang Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013 mong nhận góp ý quý thầy cô bạn Tôi xin chân thành cảm ơn! Đà Nẵng, tháng 05 năm 2013 Sinh viên Phan Thị Thanh Nhạn SVTH: Phan Thị Thanh Nhạn Trang MỤC LỤC Chương KIẾN THỨC CƠ SỞ 1.1 Một số phân phối xác suất quan trọng 9 1.1.1 1.1.2 Phân phối nhị thức Phân phối chuẩn 9 1.1.3 1.1.4 Phân phối Student 10 Phân phối bình phương 10 1.2 Mẫu số liệu 11 1.3 1.4 Các đại lượng đặc trưng mẫu số liệu 11 Mẫu ngẫu nhiên 12 1.5 Ước lượng điểm 12 1.5.1 Ước lượng điểm hàm ước lượng 12 Chương PHƯƠNG PHÁP P -GIÁ TRỊ KIỂM ĐỊNH GIẢ THIẾT 2.1 14 Kiểm định giả thiết kì vọng phân phối chuẩn 14 2.1.1 Đã biết phương sai 14 2.2 2.1.2 Chưa biết phương sai 18 Kiểm định phương sai phân phối chuẩn 21 2.3 2.4 Kiểm định tham số p phân phối nhị thức B(n; p) 25 So sánh hai kì vọng hai phân phối chuẩn 29 2.4.1 2.4.2 Đã biết phương sai σ12 σ22 29 Chưa biết hai phương sai hai phương sai 32 2.4.3 Chưa biết hai phương sai hai phương sai không 35 Phương pháp p-giá trị kiểm định giả thiết 2.5 Đà Nẵng, 05 - 2013 So sánh hai tỉ lệ 38 SVTH: Phan Thị Thanh Nhạn Trang CHƯƠNG KIẾN THỨC CƠ SỞ 1.1 1.1.1 Một số phân phối xác suất quan trọng Phân phối nhị thức Biến ngẫu nhiên rời rạc X gọi có phân phối nhị thức với tham số n, p miền giá trị X {0, 1, , n} P (X = k) = Cnk pk (1 − p)n−k , k = 0, 1, , n Khi E(X) = np V ar(X) = np(1 − p) Kí hiệu: X ∼ B(n, p) 1.1.2 Phân phối chuẩn Biến ngẫu nhiên liên tục X gọi có phân phối chuẩn có hàm mật độ: − (x−µ) f (x) = √ e 2σ , x ∈ R, σ 2π đó, −∞ < µ < +∞, σ > Khi đó, E(X) = µ, V ar(X) = σ Kí hiệu X ∼ N (µ, σ ) Trường hợp đặc biệt µ = σ = N (0; 1) gọi phân phối chuẩn tắc Khi đó: hàm mật độ xác suất ϕ(x) = √12π e−x /2 , x hàm phân phối xác suất Φ(x) = √12π −∞ e−t Kí hiệu phân phối chuẩn tắc Z = N (0; 1) /2 dt Giá trị tới hạn phân phối chuẩn tắc Cho α ∈ (0; 1) Z ∼ N (0; 1) Ta gọi giá trị z(α) giá trị tới hạn mức α phân phối chuẩn tắc Z P (Z > z(α)) = α Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013 Giải Gọi X, Y số sâu thuộc Nhóm Nhóm Theo giả thiết, X Y có phân phối chuẩn với σ12 , σ22 chưa biết số sâu trung bình µ1 ,µ2 chưa biết Ta cần kiểm định giả thiết H0 : µ1 = µ2 với đối thiết H1 : µ1 > µ2 Từ mẫu số liệu cụ thể trên, ta tính được: n1 = 7, X = 28, 57, s21 = 198, 62 n2 = 7, Y = 40, s22 = 215, 33 Cách • tn1 +n2 −2 (α) = t12 (0, 05) = 1, 7832 • Miền bác bỏ Wα = (1, 7832; +∞) • υ= = (x − y) (n1 + n2 − 2).n1 n2 (n1 + n2 )((n√1 − 1).s21 + (n2 − 1).s22 ) (28, 57 − 40) 12.7.7 = −2, 067 ∈ Wα 14.(6.198, 62 + 6.215, 33) Nên chưa có sở bác bỏ H0 Cách P − giá trị = P (T12 > −2, 067) ≈ (1 − Φ(−2, 067)) = Φ(2, 067) = 0, 98 > α = 0, 05 nên chưa có sở bác bỏ H0 Ví dụ 2.17 Tiến hành nghiên cứu để so sánh mức lương trung bình phụ nữ nam giới công ty, người ta thu mẫu số liệu sau: - Mẫu 1: 100 nữ có mức lương trung bình 7,23 triệu đồng/tháng với độ lệch chuẩn 1,6 triệu đồng/tháng - Mẫu 2: 75 nam có mức lương trung bình 8,06triệu đồng/tháng với độ lệch chuẩn 1,9 triệu đồng/tháng Với mức ý nghĩa α = 0, 01, kết luận mức lương trung bình phụ nữ cơng ty thấp nam giới không? Giả sử mức lương trung bình phụ nữ nam giới cơng ty có phân phối chuẩn phương sai Giải Từ hai mẫu số liệu cho ta có: - n1 = 100; x = 7, 23; s1 = 1, - n2 = 75; y = 8, 06; s2 = 1, Ta cần kiểm định cặp giả thiết: H0 : µ1 = µ2 SVTH: Phan Thị Thanh Nhạn Trang 34 Phương pháp p-giá trị kiểm định giả thiết với đối thiết Đà Nẵng, 05 - 2013 H1 : µ2 > µ1 Cách • tn1 +n2 −2 (α) = t100+75−2 (0, 01) = t173 (0, 01) ≈ z(0, 01) = 2, 326 • Miền bác bỏ Wα = (2, 326; +∞) (x − y) (n1 + n2 − 2).n1 n2 2 (n1 + n2 )((n √ − 1).s1 + (n2 − 1).s2 ) (7, 23 − 8, 06) 173.100.75 = = −3, 13 ∈ Wα 175.(99.1, 62 + 74.1, 92 ) • υ= Nên khơng có sở để bác bỏ H0 Vậy kết luận rằng: "Mức lương trung bình phụ nữ cơng ty thấp nam giới công ty này" Cách P − giá trị = P (T173 > −3, 13) ≈ (1 − Φ(−3, 13)) = P hi(3, 13) = 0, 99 > α = 0, 01 nên khơng có sở để bác bỏ H0 Nghĩa khơng thể kết luận rằng: "Mức lương trung bình phụ nữ công ty thấp nam giới công ty này" Kết luận X ∼ N (µ1 ; σ12 ) Y ∼ N (µ2 ; σ22 ) (chưa biết phương sai σ12 σ22 σ12 = σ22 ) H0 H1 H0 H1 : µ1 : µ1 : µ1 : µ1 Trong đó, υ = = µ2 = µ2 = µ2 > µ2 Miền bác bỏ H0 Wα = (−∞; −tn1 +n2 −2 (α/2) ∪(tn1 +n2 −2 (α/2); +∞) P -giá trị Wα = (tn1 +n2 −2 (α); +∞) P (Tn1 +n2 −2 > υ) 2P (Tn1 +n2 −2 > |υ|) (x − y) (n1 + n2 − 2).n1 n2 (n1 + n2 )((n1 − 1).s21 + (n2 − 1).s22 ) tn1 +n2 −2 (α/2) tra Bảng III 2.4.3 , giá trị tn1 +n2 −2 (α) Chưa biết hai phương sai hai phương sai không Cho X Y có phân phối chuẩn N1 (µ1 ; σ12 ) N2 (µ2 ; σ22 ) với kì vọng E(X) = µ1 E(Y ) = µ2 chưa biết phương sai V ar(X) = σ12 V ar(Y ) = σ22 chưa biết hai phương sai chưa biết SVTH: Phan Thị Thanh Nhạn Trang 35 Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013 hay không Cho {x1 , , xm } (m > 30) {y1 , , ym = n} (n > 30) mẫu số liệu X Y Giả sử với mức ý nghĩa α, ta cần kiểm định giả thiết H0 : µ1 = µ2 với đối thiết H1 : µ1 = µ2 Phương pháp kiểm định cổ điển - Miền bác bỏ H0 : W √α = (−∞; −z(α/2) ∪ (z(α/2); +∞) (x − y) m.n - Tính υ = n.s21 + m.s22 - Nếu υ ∈ Wα bác bỏ H0 , cịn υ ∈ Wα chấp nhận H0 Phương pháp P -giá trị √ (x − y) m.n P-giá trị=2P (Z > |υ|), với υ = n.s21 + m.s22 Ví dụ 2.18 Một cơng ty vận tải lớn muốn so sánh số ô tô gặp trục trặc kĩ thuật trung bình ngày mùa đông với ngày mùa hè Chọn ngẫu nhiên 35 ngày mùa đơng người ta tính trung bình số tơ gặp trục trặc 16,6 với độ lệch chuẩn 7,1 Trong mẫu gồm 32 ngày mùa hè,số trung bình thu 12,4 với độ lệch chuẩn 5,8 Với mức ý nghĩa α = 0, 02, kết luận xem có khác hay không? Giải Từ hai mẫu số liệu cho ta có: - m = 35; x = 16, 6; s1 = 7, - n = 32; y = 12, 4; s2 = 5, Ta cần kiểm định cặp giả thiết: H0 : µ1 = µ2 với đối thiết H1 : µ2 = µ1 Cách • α = 0, 02 ⇒ z(α/2) = z(0, 01) = 2, 326 • Miền bác bỏ Wα = (−∞; −2, 326) ∪ (2, 326; +∞) √ √ (x − y) m.n (16, − 12, 4) 32.35 • υ= = = 2, 661 ∈ Wα n.s21 + m.s22 32.7, 12 + 35.5, 82 SVTH: Phan Thị Thanh Nhạn Trang 36 Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013 Nên bác bỏ H0 Vậy kết luận rằng: "Có khác số ô tô gặp trục trặc kĩ thuật trung bình ngày mùa đơng với ngày mùa hè" Cách P-giá trị=2P (Z > |υ|) = 2P (Z > 2, 661) = 2.(1 − Φ(2, 661)) = 2.(1 − 0, 9961) = 0, 0078 < α = 0, 02, nên bác bỏ H0 Nghĩa kết luận rằng: "Có khác số ô tô gặp trục trặc kĩ thuật trung bình ngày mùa đơng với ngày mùa hè" Kiểm định phía Ta cần kiểm định giả thiết H0 : µ1 = µ2 với đối thiết H1 : µ1 > µ2 Phương pháp kiểm định cổ điển - Miền bác bỏ H0 : W √α = (z(α); +∞) (x − y) m.n - Tính υ = n.s21 + m.s22 - Nếu υ ∈ Wα bác bỏ H0 , cịn υ ∈ Wα chấp nhận H0 Phương pháp P -giá trị √ (x − y) m.n P-giá trị=P (Z > υ) với υ = n.s21 + m.s22 Ví dụ 2.19 Một nghiên cứu dược tiến hành để so sánh thời gian nằm viện trung bình bệnh nhân nam bệnh nhân nữ điều trị bệnh A.Thu mẫu ngẫu nhiên sau: - Mẫu 1: 50 bệnh nhân nam, thời gian nằm viện trung bình 5,3 ngày với độ lệch chuẩn 2,1 ngày - Mẫu 2: 60 bệnh nhân nữ, thời gian nằm viện trung bình 6,2 ngày với độ lệch chuẩn 1,8 ngày Với mức ý nghĩa α = 0, 05, kết luận thời gian nằm viện trung bình nam ngắn nữ không? Giải Từ hai mẫu số liệu cho ta có: - m = 50; x = 5, 3; s1 = 2, - n = 60; y = 6, 2; s2 = 1, Ta cần kiểm định cặp giả thiết: H0 : µ1 = µ2 SVTH: Phan Thị Thanh Nhạn Trang 37 Phương pháp p-giá trị kiểm định giả thiết với đối thiết Đà Nẵng, 05 - 2013 H1 : µ2 > µ1 Cách • α = 0, 05 ⇒ z(α) = z(0, 05) = 1, 6449 • Miền bác bỏ Wα = (1, 6449; +∞) √ √ (x − y) m.n (5, − 6, 2) 50.60 • υ= = = −2, 387 ∈ Wα n.s21 + m.s22 60.2, 12 + 50.1, 82 Nên chấp nhận H0 Vậy kết luận rằng: " Thời gian nằm viện trung bình nam ngắn nữ" Cách P-giá trị=P (Z > υ) = P (Z > −2, 387) = (1−Φ(−2, 387)) = Φ(2, 387) = 0, 9915 > α = 0, 05, nên chấp nhận H0 Nghĩa kết luận rằng: "Thời gian nằm viện trung bình nam ngắn nữ" Kết luận: X ∼ N (µ1 ; σ12 ), Y ∼ N (µ2 ; σ22 ) với σ12 σ22 chưa biết Miền bác bỏ H0 H0 H1 H0 H1 P -giá trị = µ2 = µ2 Wα = (−∞; −z(α/2) ∪ (z(α/2); +∞) 2(1 − Φ(|υ|)) = µ2 − Φ(υ) > µ2 Wα = (z(α); +∞) √ (x − y) m.n Trong đó, υ = , giá trị z(α) z(α/2) tra Bảng II n.s21 + m.s22 2.5 : µ1 : µ1 : µ1 : µ1 So sánh hai tỉ lệ Cho X, Y có phân phối nhị thức B(n1 ; p1 ); B(n2 ; p2 ) với n1 ; n2 lớn Giả sử với mức ý nghĩa α, ta cần kiểm định giả thiết H0 : p1 = p2 với đối thiết H1 : p1 = p2 Phương pháp kiểm định cổ điển k1 k2 k1 + k2 - Đặt f1 = ; f2 = ;f= n1 n2 n1 + n2 SVTH: Phan Thị Thanh Nhạn Trang 38 Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013 - Miền bác bỏ H0 : Wα √ = (−∞; −z(α/2)) ∪ ((z(α/2); +∞) (f1 − f2 ) n1 n2 -Tính υ = f (1 − f ).(n1 + n2 ) - Nếu υ ∈ Wα bác bỏ H0 , cịn υ ∈ Wα chấp nhận H0 Phương pháp P -giá trị √ (f1 − f2 ) n1 n2 P − giá trị = 2P (Z > |υ|) với υ = f (1 − f ).(n1 + n2 ) k1 ; k2 giá trị quan sát X Y ; f1 = f= k1 + k2 n1 + n2 k1 k2 ; f2 = n1 n2 Ví dụ 2.20 Kiểm tra sản phẩm loại nhà máy sản xuất, thu số liệu sau: Nhà máy Số sản phẩm kiểm tra Số phế phẩm Nhà máy A 1000 20 Nhà máy B 900 30 Với mức ý nghĩa α = 5%, coi tỷ lệ phế phẩm cuả hai nhà máy không? Giải : Gọi p1 , p2 tỷ lệ phế phẩm Nhà máy A Nhà máy B Ta cần kiểm định cặp giả thiết H0 : p1 = p2 với đối thiết H1 : p1 = p2 Cách 1: 20 k2 30 k1 - Đặt f1 = = = 0, 02 ; f2 = = = 0, 033 ; n1 1000 n2 900 k1 + k2 20 + 30 f= = = 0, 0263 n1 + n2 1000 + 900 • α = 0, 05 ⇒ z(α/2) = z(0, 025) = 1, 96 • Miền bác bỏ Miền bác bỏ Wα = {(−∞; −1, 96) ∪ (1, 96; +∞)} √ (0, 02 − 0, 033) 1000.900 • υ= = −1, 786 ∈ Wα 0, 0263.(1 − 0, 0263).(1000 + 900) SVTH: Phan Thị Thanh Nhạn Trang 39 Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013 Vậy chấp nhận H0 , tức coi tỷ lệ phế phẩm nhà máy Cách 2: k1 20 k2 30 - Đặt f1 = = = 0, 02 = ; f2 = = = 0, 033 ; n1 1000 n2 900 k1 + k2 20 + 30 f= = = 0, 0263 n1 + n2 1000 + 900 P − giá trị = 2P (Z > 1, 786) = 2(1 − Φ(1, 786)) = 0, 074 > α Vậy chấp nhận H0 , tức coi tỷ lệ phế phẩm nhà máy Kiểm định phía Ta cần kiểm định giả thiết H0 : p1 = p2 với đối thiết H1 : p1 > p2 k1 k2 k1 + k2 - Đặt f1 = ; f2 = ;f= n1 n2 n1 + n2 - Miền bác bỏ H0 : Wα √ = (z(α); +∞) (f1 − f2 ) n1 n2 -Tính υ = f (1 − f ).(n1 + n2 ) - Nếu υ ∈ Wα bác bỏ H0 , cịn υ ∈ Wα chấp nhận H0 Phương pháp P -giá trị √ (f1 − f2 ) n1 n2 P − giá trị = P (Z > υ) với υ = , f (1 − f ).(n1 + n2 ) k1 ; k2 giá trị quan sát X Y ; f1 = f= k1 + k2 n1 + n2 k2 k1 ; f2 = n1 n2 Ví dụ 2.21 Với mức ý nghĩa α = 0, 05, kiểm định giả thiết sau: H0 : p1 = p2 với đối thiết H1 : p1 > p2 Biết : n1 = 80; k1 = 40 n2 = 80; k2 = 30 SVTH: Phan Thị Thanh Nhạn Trang 40 Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013 Giải : Cách 1: k1 40 k2 30 - Đặt f1 = = = 0, = ; f2 = = = 0, 375 ; n1 80 n2 80 k1 + k2 40 + 30 f= = = 0, 4375 n1 + n2 80 + 80 • α = 0, 05 ⇒ z(α) = z(0, 05) = 1, 6449 • Miền bác bỏ Miền bác bỏ Wα = (1, 6449; +∞) √ (0, − 0, 375) 80.80 • υ= = 1, 594 ∈ Wα 0, 4375.(1 − 0, 4375).(80 + 80) Vậy chấp nhận H0 Cách 2: 40 30 k2 k1 = = = 0, = ; f2 = = 0, 375 ; -Đặt Đặt f1 = n1 80 n2 80 40 + 30 k1 + k2 = = 0, 4375 f= n1 + n2 80 + 80 P − giá trị = P (Z > 1, 594) = − Φ(1, 594) = 0, 055 > α Vậy chấp nhận H0 Ví dụ 2.22 Điều tra tỷ lệ dùng ga khu dân cư, thu số liệu sau: Khu dân cư Số hộ gia đình kiểm tra Số hộ dùng ga Khu dân cư 500 120 Khu dân cư 1000 300 Với mức ý nghĩa α = 0, 02, coi tỷ lệ số hộ dùng ga khu dân cư cao khu dân cư không? Giải : Gọi p1 , p2 tỷ lệ số hộ dùng ga khu dân cư khu dân cư Ta cần kiểm định cặp giả thiết H0 : p1 = p2 với đối thiết H1 : p2 > p1 Cách 1: k1 120 k2 300 - Đặt f1 = = = 0, 24 = ; f2 = = = 0, 03 ; n1 500 n2 1000 k1 + k2 120 + 300 f= = = 0, 28 n1 + n2 500 + 1000 SVTH: Phan Thị Thanh Nhạn Trang 41 Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013 • α = 0, 02 ⇒ z(α) = z(0, 02) = 0, 508 • Miền bác bỏ Miền bác bỏ Wα = {(0, 508; +∞)} √ (0, 24 − 0, 03) 500.1000 • υ= = 8, 539 ∈ Wα 0, 28.(1 − 0, 28).(500 + 1000) Vậy bác bỏ H0 , tức coi tỷ lệ số hộ dùng ga khu dân cư Cách 2: k1 k2 120 300 -Đặt f1 = = 0, 24 ; f2 = = 0, 03 ; = = n1 500 n2 1000 k1 + k2 120 + 300 f= = = 0, 28 n1 + n2 500 + 1000 P − giá trị = P (Z > 8, 539) = − Φ(8, 539) ≈ < α = 0, 02 Vậy bác bỏ H0 , tức coi tỷ lệ số hộ dùng ga khu dân cư Kết luận: Cho X ∼ B(n1 ; p1 ) Y ∼ B(n2 ; p2 ) Miền bác bỏ H0 P -giá trị = p2 = p2 Wα = (−∞; −z(α/2)) ∪ (z(α/2); +∞; ) 2(1 − Φ(|υ|)) = p2 − Φ(υ) > p2 Wα = (z(α); +∞; ) √ (f1 − f2 ) n1 n2 Trong đó, υ = , k1 , k2 giá trị quan sát f (1 − f ).(n1 + n2 ) X Y , giá trị z(α) z(α/2)tra Bảng II H0 H1 H0 H1 : p1 : p1 : p1 : p1 SVTH: Phan Thị Thanh Nhạn Trang 42 Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013 KẾT LUẬN Qua thời gian nghiên cứu, học hỏi tìm tịi, tơi thấy kết quả: Nêu tóm tắt nội dung quan trọng cần cho nội dung Phân tích Phương pháp p-giá trị kiểm định giả thiết thống kê phương pháp kiểm định cổ điển Đưa ví dụ thực tế phương pháp p-giá trị kiểm định giả thiết thống kê Thấy tiện lợi dùng phương pháp p-giá trị kiểm định giả thiết thống kê Đóng góp khóa luận bao gồm: Tìm hiểu trình bày lại nội dung kiến thức sở xác suất thống kê Đề cập số phân phối dùng nội dung Nêu Phương pháp p-giá trị kiểm định giả thiết thống kê, số phương pháp kiểm định cổ điển Tuy nhiên thời gian thực khóa luận khơng nhiều, kiến thức cịn hạn chế nên khơng tránh sai sót, mong nhận góp ý quý thầy cô bạn SVTH: Phan Thị Thanh Nhạn Trang 43 TÀI LIỆU THAM KHẢO [1] Lê Văn Dũng, Tôn Thất Tú (2012), Bài giảng Lý thuyết xác suất ứng dụng [2] Nguyễn Duy Tiến (2007), Cơ sở lý thuyết xác suất, NXB ĐHQG Hà Nội [3] Đặng Hùng Thắng (2009), Thống kê ứng dụng, NXB Giáo dục 44 Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013 BẢNG I: CÁC GIÁ TRỊ CỦA HÀM PHÂN PHỐI CHUẨN TẮC Φ( x) = 2π x ∫ − t2 e dt −∞ Hàm tìm Φ ( x) Excel: Φ ( x) = NORMDIST ( x, 0,1,1) x 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4 0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.9987 0.9990 0.9993 0.9995 0.9997 0.01 0.5040 0.5438 0.5832 0.6217 0.6591 0.6950 0.7291 0.7611 0.7910 0.8186 0.8438 0.8665 0.8869 0.9049 0.9207 0.9345 0.9463 0.9564 0.9649 0.9719 0.9778 0.9826 0.9864 0.9896 0.9920 0.9940 0.9955 0.9966 0.9975 0.9982 0.9987 0.9991 0.9993 0.9995 0.9997 0.02 0.5080 0.5478 0.5871 0.6255 0.6628 0.6985 0.7324 0.7642 0.7939 0.8212 0.8461 0.8686 0.8888 0.9066 0.9222 0.9357 0.9474 0.9573 0.9656 0.9726 0.9783 0.9830 0.9868 0.9898 0.9922 0.9941 0.9956 0.9967 0.9976 0.9982 0.9987 0.9991 0.9994 0.9995 0.9997 SVTH: Phan Thị Thanh Nhạn 0.03 0.5120 0.5517 0.5910 0.6293 0.6664 0.7019 0.7357 0.7673 0.7967 0.8238 0.8485 0.8708 0.8907 0.9082 0.9236 0.9370 0.9484 0.9582 0.9664 0.9732 0.9788 0.9834 0.9871 0.9901 0.9925 0.9943 0.9957 0.9968 0.9977 0.9983 0.9988 0.9991 0.9994 0.9996 0.9997 0.04 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988 0.9992 0.9994 0.9996 0.9997 0.05 0.5199 0.5596 0.5987 0.6368 0.6736 0.7088 0.7422 0.7734 0.8023 0.8289 0.8531 0.8749 0.8944 0.9115 0.9265 0.9394 0.9505 0.9599 0.9678 0.9744 0.9798 0.9842 0.9878 0.9906 0.9929 0.9946 0.9960 0.9970 0.9978 0.9984 0.9989 0.9992 0.9994 0.9996 0.9997 0.06 0.5239 0.5636 0.6026 0.6406 0.6772 0.7123 0.7454 0.7764 0.8051 0.8315 0.8554 0.8770 0.8962 0.9131 0.9279 0.9406 0.9515 0.9608 0.9686 0.9750 0.9803 0.9846 0.9881 0.9909 0.9931 0.9948 0.9961 0.9971 0.9979 0.9985 0.9989 0.9992 0.9994 0.9996 0.9997 0.07 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989 0.9992 0.9995 0.9996 0.9997 0.08 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986 0.9990 0.9993 0.9995 0.9996 0.9997 0.09 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 0.9990 0.9993 0.9995 0.9997 0.9998 Trang 45 Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013 BẢNG II: GIÁ TRỊ TỚI HẠN CỦA PHÂN PHỐI CHUẨN TẮC α= 2π −∞ ∫ e − t2 dt u (α ) Hàm tìm u(α) Excel u(α) =NORMSINV(1- α) α 0.50 0.49 0.48 0.47 0.46 0.45 0.44 0.43 0.42 0.41 0.40 0.39 0.38 0.37 0.36 0.35 0.34 0.33 0.32 0.31 0.30 0.29 0.28 0.27 0.26 u(α) 0.0000 0.0251 0.0502 0.0753 0.1004 0.1257 0.1510 0.1764 0.2019 0.2275 0.2533 0.2793 0.3055 0.3319 0.3585 0.3853 0.4125 0.4399 0.4677 0.4959 0.5244 0.5534 0.5828 0.6128 0.6433 SVTH: Phan Thị Thanh Nhạn α 0.250 0.240 0.230 0.220 0.210 0.200 0.190 0.180 0.170 0.160 0.150 0.140 0.130 0.120 0.110 0.100 0.095 0.090 0.085 0.080 0.075 0.070 0.065 0.060 0.055 u(α) 0.6745 0.7063 0.7388 0.7722 0.8064 0.8416 0.8779 0.9154 0.9542 0.9945 1.0364 1.0803 1.1264 1.1750 1.2265 1.2816 1.3106 1.3408 1.3722 1.4051 1.4395 1.4758 1.5141 1.5548 1.5982 α 0.050 0.049 0.048 0.047 0.046 0.045 0.044 0.043 0.042 0.041 0.040 0.039 0.038 0.037 0.036 0.035 0.034 0.033 0.032 0.031 0.030 0.029 0.028 0.027 0.026 u(α) 1.6449 1.6546 1.6646 1.6747 1.6849 1.6954 1.7060 1.7169 1.7279 1.7392 1.7507 1.7624 1.7744 1.7866 1.7991 1.8119 1.8250 1.8384 1.8522 1.8663 1.8808 1.8957 1.9110 1.9268 1.9431 α 0.025 0.024 0.023 0.022 0.021 0.020 0.019 0.018 0.017 0.016 0.015 0.014 0.013 0.012 0.011 0.010 0.009 0.008 0.007 0.006 0.005 0.004 0.003 0.002 0.001 u(α) 1.9600 1.9774 1.9954 2.0141 2.0335 2.0537 2.0749 2.0969 2.1201 2.1444 2.1701 2.1973 2.2262 2.2571 2.2904 2.3263 2.3656 2.4089 2.4573 2.5121 2.5758 2.6521 2.7478 2.8782 3.0902 Trang 46 Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013 BẢNG III: GIÁ TRỊ TỚI HẠN CỦA PHÂN PHỐI STUDENT Hàm tìm tn(α) Excel tn(α) =TINV(2α, n) α n 0.250 0.100 0.050 0.025 0.010 0.005 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 1.0000 0.8165 0.7649 0.7407 0.7267 0.7176 0.7111 0.7064 0.7027 0.6998 0.6974 0.6955 0.6938 0.6924 0.6912 0.6901 0.6892 0.6884 0.6876 0.6870 0.6864 0.6858 0.6853 0.6848 0.6844 0.6840 0.6837 0.6834 0.6830 0.6828 0.6825 0.6822 0.6820 0.6818 0.6816 0.6814 0.6812 0.6810 0.6808 0.6807 3.0777 1.8856 1.6377 1.5332 1.4759 1.4398 1.4149 1.3968 1.3830 1.3722 1.3634 1.3562 1.3502 1.3450 1.3406 1.3368 1.3334 1.3304 1.3277 1.3253 1.3232 1.3212 1.3195 1.3178 1.3163 1.3150 1.3137 1.3125 1.3114 1.3104 1.3095 1.3086 1.3077 1.3070 1.3062 1.3055 1.3049 1.3042 1.3036 1.3031 6.3138 2.9200 2.3534 2.1318 2.0150 1.9432 1.8946 1.8595 1.8331 1.8125 1.7959 1.7823 1.7709 1.7613 1.7531 1.7459 1.7396 1.7341 1.7291 1.7247 1.7207 1.7171 1.7139 1.7109 1.7081 1.7056 1.7033 1.7011 1.6991 1.6973 1.6955 1.6939 1.6924 1.6909 1.6896 1.6883 1.6871 1.6860 1.6849 1.6839 12.7062 4.3027 3.1824 2.7764 2.5706 2.4469 2.3646 2.3060 2.2622 2.2281 2.2010 2.1788 2.1604 2.1448 2.1314 2.1199 2.1098 2.1009 2.0930 2.0860 2.0796 2.0739 2.0687 2.0639 2.0595 2.0555 2.0518 2.0484 2.0452 2.0423 2.0395 2.0369 2.0345 2.0322 2.0301 2.0281 2.0262 2.0244 2.0227 2.0211 31.8205 6.9646 4.5407 3.7469 3.3649 3.1427 2.9980 2.8965 2.8214 2.7638 2.7181 2.6810 2.6503 2.6245 2.6025 2.5835 2.5669 2.5524 2.5395 2.5280 2.5176 2.5083 2.4999 2.4922 2.4851 2.4786 2.4727 2.4671 2.4620 2.4573 2.4528 2.4487 2.4448 2.4411 2.4377 2.4345 2.4314 2.4286 2.4258 2.4233 63.6567 9.9248 5.8409 4.6041 4.0321 3.7074 3.4995 3.3554 3.2498 3.1693 3.1058 3.0545 3.0123 2.9768 2.9467 2.9208 2.8982 2.8784 2.8609 2.8453 2.8314 2.8188 2.8073 2.7969 2.7874 2.7787 2.7707 2.7633 2.7564 2.7500 2.7440 2.7385 2.7333 2.7284 2.7238 2.7195 2.7154 2.7116 2.7079 2.7045 SVTH: Phan Thị Thanh Nhạn Trang 47 Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013 BẢNG IV: GIÁ TRỊ TỚI HẠN CỦA PHÂN PHỐI KHI BÌNH PHƯƠNG Hàm tìm χ n2 (α ) Excel χ n2 (α ) =CHINV(α, n) α n 0.995 0.99 0.975 0.95 0.9 0.1 0.05 0.025 0.01 0.005 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 0.0000 0.0100 0.0717 0.2070 0.4117 0.6757 0.9893 1.3444 1.7349 2.1559 2.6032 3.0738 3.5650 4.0747 4.6009 5.1422 5.6972 6.2648 6.8440 7.4338 8.0337 8.6427 9.2604 9.8862 10.5197 11.1602 11.8076 12.4613 13.1211 13.7867 14.4578 15.1340 15.8153 16.5013 17.1918 17.8867 18.5858 19.2889 19.9959 20.7065 0.0002 0.0201 0.1148 0.2971 0.5543 0.8721 1.2390 1.6465 2.0879 2.5582 3.0535 3.5706 4.1069 4.6604 5.2293 5.8122 6.4078 7.0149 7.6327 8.2604 8.8972 9.5425 10.1957 10.8564 11.5240 12.1981 12.8785 13.5647 14.2565 14.9535 15.6555 16.3622 17.0735 17.7891 18.5089 19.2327 19.9602 20.6914 21.4262 22.1643 0.0010 0.0506 0.2158 0.4844 0.8312 1.2373 1.6899 2.1797 2.7004 3.2470 3.8157 4.4038 5.0088 5.6287 6.2621 6.9077 7.5642 8.2307 8.9065 9.5908 10.2829 10.9823 11.6886 12.4012 13.1197 13.8439 14.5734 15.3079 16.0471 16.7908 17.5387 18.2908 19.0467 19.8063 20.5694 21.3359 22.1056 22.8785 23.6543 24.4330 0.0039 0.1026 0.3518 0.7107 1.1455 1.6354 2.1673 2.7326 3.3251 3.9403 4.5748 5.2260 5.8919 6.5706 7.2609 7.9616 8.6718 9.3905 10.1170 10.8508 11.5913 12.3380 13.0905 13.8484 14.6114 15.3792 16.1514 16.9279 17.7084 18.4927 19.2806 20.0719 20.8665 21.6643 22.4650 23.2686 24.0749 24.8839 25.6954 26.5093 0.0158 0.2107 0.5844 1.0636 1.6103 2.2041 2.8331 3.4895 4.1682 4.8652 5.5778 6.3038 7.0415 7.7895 8.5468 9.3122 10.0852 10.8649 11.6509 12.4426 13.2396 14.0415 14.8480 15.6587 16.4734 17.2919 18.1139 18.9392 19.7677 20.5992 21.4336 22.2706 23.1102 23.9523 24.7967 25.6433 26.4921 27.3430 28.1958 29.0505 2.7055 4.6052 6.2514 7.7794 9.2364 10.6446 12.0170 13.3616 14.6837 15.9872 17.2750 18.5493 19.8119 21.0641 22.3071 23.5418 24.7690 25.9894 27.2036 28.4120 29.6151 30.8133 32.0069 33.1962 34.3816 35.5632 36.7412 37.9159 39.0875 40.2560 41.4217 42.5847 43.7452 44.9032 46.0588 47.2122 48.3634 49.5126 50.6598 51.8051 3.8415 5.9915 7.8147 9.4877 11.0705 12.5916 14.0671 15.5073 16.9190 18.3070 19.6751 21.0261 22.3620 23.6848 24.9958 26.2962 27.5871 28.8693 30.1435 31.4104 32.6706 33.9244 35.1725 36.4150 37.6525 38.8851 40.1133 41.3371 42.5570 43.7730 44.9853 46.1943 47.3999 48.6024 49.8018 50.9985 52.1923 53.3835 54.5722 55.7585 5.0239 7.3778 9.3484 11.1433 12.8325 14.4494 16.0128 17.5345 19.0228 20.4832 21.9200 23.3367 24.7356 26.1189 27.4884 28.8454 30.1910 31.5264 32.8523 34.1696 35.4789 36.7807 38.0756 39.3641 40.6465 41.9232 43.1945 44.4608 45.7223 46.9792 48.2319 49.4804 50.7251 51.9660 53.2033 54.4373 55.6680 56.8955 58.1201 59.3417 6.6349 9.2103 11.3449 13.2767 15.0863 16.8119 18.4753 20.0902 21.6660 23.2093 24.7250 26.2170 27.6882 29.1412 30.5779 31.9999 33.4087 34.8053 36.1909 37.5662 38.9322 40.2894 41.6384 42.9798 44.3141 45.6417 46.9629 48.2782 49.5879 50.8922 52.1914 53.4858 54.7755 56.0609 57.3421 58.6192 59.8925 61.1621 62.4281 63.6907 7.8794 10.5966 12.8382 14.8603 16.7496 18.5476 20.2777 21.9550 23.5894 25.1882 26.7568 28.2995 29.8195 31.3193 32.8013 34.2672 35.7185 37.1565 38.5823 39.9968 41.4011 42.7957 44.1813 45.5585 46.9279 48.2899 49.6449 50.9934 52.3356 53.6720 55.0027 56.3281 57.6484 58.9639 60.2748 61.5812 62.8833 64.1814 65.4756 66.7660 SVTH: Phan Thị Thanh Nhạn Trang 48 ... Phân tích Phương ph? ?p p- giá trị kiểm định giả thiết thống kê phương ph? ?p kiểm định cổ điển Đưa ví dụ thực tế phương ph? ?p p- giá trị kiểm định giả thiết thống kê Thấy tiện lợi dùng phương ph? ?p. .. ch? ?p nhận H0 Phương ph? ?p P -giá trị √ (k/n − p0 ) n , P − giá trị = 2P (Z > |υ|) với υ = p0 (1 − p0 ) k giá trị quan sát X SVTH: Phan Thị Thanh Nhạn Trang 25 Phương ph? ?p p- giá trị kiểm định giả. .. liệu, quy luật phân phối xác suất, ước lượng điểm, hàm ước lượng Cùng với phương ph? ?p kiểm định truyền thống, phương ph? ?p p- giá trị kiểm định giả thiết thống kê phương ph? ?p đơn giản, dễ thực