1. Trang chủ
  2. » Thể loại khác

KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

20 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Bài 4: Kiểm định giả thuyết thống kê BÀI KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Hướng dẫn học Bài giới thiệu vấn đề chung liên quan đến việc kiểm định giả thuyết thống kê Học viên cần hiểu giả thuyết thống kê, sai lầm mức ý nghĩa kiểm định, tiêu chuẩn kiểm định nắm bước tiến hành để kiểm định giả thuyết thống kê Từ học viên thực kiểm định thực tế giá trị trung bình hay tỷ lệ theo tiêu thức tổng thể hay hai tổng thể với Để học tốt này, sinh viên cần tham khảo phương pháp học sau:  Học lịch trình môn học theo tuần, làm luyện tập đầy đủ tham gia thảo luận diễn đàn  Đọc tài liệu: Giáo trình Lý thuyết Thống kê, PGS TS Trần Thị Kim Thu chủ biên, NXB Đại học KTQD, 2012  Sinh viên làm việc theo nhóm trao đổi với giảng viên trực tiếp lớp học qua email  Tham khảo thông tin từ trang Web mơn học Nội dung Bài trình bày khái niệm giả thuyết thống kê vấn đề liên quan sai lầm mức ý nghĩa kiểm định, tiêu chuẩn kiểm định Ngoài học hướng dẫn bước tiến hành kiểm định giả thuyết thống kê nói chung vào trường hợp cụ thể kiểm định giả thuyết thống kê giá trị trung bình tỷ lệ theo tiêu thức tổng thể chung hai tổng thể chung Mục tiêu Sau học xong này, sinh viên có khả năng:  Trình bày khái niệm giả thuyết thống kê  Phân biệt dạng giả thuyết thống kê khác  Phân biệt sai lầm kiểm định  Mô tả bước tiến hành kiểm định giả thuyết thống kê  Vận dụng để kiểm định giả thuyết giá trị trung bình tổng thể chung hai tổng thể chung thực tế  Vận dụng để kiểm định giả thuyết tỷ lệ tổng thể chung hai tổng thể chung thực tế STA303_Bai4_v1.0013111226 63 Bài 4: Kiểm định giả thuyết thống kê Tình dẫn nhập Liệu sản phẩm có mang lại hiệu quảng cáo? Cũng chiến dịch quảng bá sản phẩm kem dưỡng làm trắng da nhãn hàng Pond’s, phận truyền thông hãng chọn hai nhóm nữ niên tuổi từ 15-25 để tiến hành khảo sát Một nhóm gồm bạn có sử dụng sản phẩm kem dưỡng làm trắng da Pond’s, nhóm cịn lại sử dụng sản phẩm kem dưỡng da thông thường Thông qua khảo sát này, nhãn hàng muốn khẳng định chất lượng tính trung thực quảng cáo sản phẩm hãng Làm để chứng minh chất lượng tính trung thực quảng cáo sản phẩm nhãn hàng Pond’s? Có thể kiểm tra từ khảo sát này? 64 STA303_Bai4_v1.0013111226 Bài 4: Kiểm định giả thuyết thống kê Khi nghiên cứu tượng kinh tế xã hội phương pháp thống kê, với mục đích suy rộng tham số như: trung bình, tỷ lệ theo tiêu thức tổng thể mẫu cho tham số tổng thể chung, đồng thời dựa vào quy luật phân phối xác suất sử dụng để kiểm định giả thuyết tổng thể chung 4.1 Một số vấn đề chung kiểm định giả thiết 4.1.1 Giả thuyết thống kê Giả thuyết thống kê giả thuyết vấn đề tổng thể chung Đó giả thuyết dạng phân phối xác suất; tham số trung bình, tỷ lệ, phương sai, tính độc lập Ví dụ như: phương pháp điều trị A chữa khỏi 90% bệnh nhân; tuổi thọ hai loại bóng đèn A B Giả thuyết mà ta muốn kiểm định gọi giả thuyết không ký hiệu H0 Giả thuyết đối lập với gọi giả thuyết đối (hay giả thuyết thay thế) ký hiệu H1 Giả thuyết không giả thuyết đối tạo nên cặp giả thuyết thống kê Vì giả thuyết thống kê sai nên cần kiểm định, tức tìm kết luận việc thừa nhận hay bác bỏ giả thuyết Việc kiểm định gọi kiểm định thống kê thực việc dựa vào thông tin thực nghiệm mẫu để rút kết luận Giả thuyết thống kê trình bày nhiều dạng khác Đối với giả thuyết không tồn dấu (=) biểu thức, (=), lớn (≥) hay nhỏ (≤) Tuỳ theo dạng giả thuyết mà lựa chọn áp dụng kiểm định hai phía hay kiểm định phía  Kiểm định phía bác bỏ giả thuyết H0 tham số đặc trưng mẫu cao thấp so với giá trị giả thuyết tổng thể chung Kiểm định phía có miền bác bỏ Ví dụ: Giả thuyết H0:  = 0 Giả thuyết H1:   0 Miền bác bỏ kiểm định hai phía  Kiểm định phía trái bác bỏ giả thuyết H0 tham số đặc trưng mẫu nhỏ cách đáng kể so với giá trị giả thuyết H0 Miền bác bỏ nằm phía trái đường phân phối Ví dụ: Giả thuyết H0:  = 0 Giả thuyết H1:  < 0 STA303_Bai4_v1.0013111226 65 Bài 4: Kiểm định giả thuyết thống kê Miền bác bỏ kiểm định phía trái  Kiểm định phía phải bác bỏ giả thuyết H0 tham số đặc trưng mẫu lớn cách đáng kể so với giá trị giả thuyết H0 Miền bác bỏ nằm phía phải đường phân phối Ví dụ: Giả thuyết H0:  = 0 Giả thuyết H1:  > 0 Miền bác bỏ kiểm định phía phải Mặc dù ý tưởng việc đặt giả thuyết khơng khó, nhiên trường hợp cụ thể điều lại khơng đơn giản Việc đặt giả thuyết đắn công việc quan trọng, không công việc trở nên vô nghĩa 4.1.2 Sai lầm mức ý nghĩa kiểm định Khi phải lựa chọn hai giả thuyết H0 H1 ta mắc phải hai loại sai lầm: Sai lầm loại bác bỏ giả thuyết H0 đúng; ngược lại, thừa nhận H0 sai sai lầm loại Một kiểm định thống kê lý tưởng kiểm định làm cho sai lầm loại sai lầm loại nhỏ nhất, điều khơng tồn thực tế Nếu làm giảm sai lầm loại làm tăng sai lầm loại ngược lại Có khả xảy tiến hành kiểm định giả thuyết thống kê sau: Kết luận Chấp nhận H0 Bác bỏ H0 nhận H1 H0 Kết luận Sai lầm loại H0 sai Sai lầm loại Kết luận Thực tế Xác suất việc mắc sai lầm loại gọi mức ý nghĩa, ký hiệu  Xác suất mắc sai lầm loại ký hiệu  Trị số -  gọi lực kiểm định Lực kiểm định xác suất bác bỏ H0 H0 sai Giữa   có mối liên hệ tương tự mối liên hệ hai loại sai lầm Xác suất mắc sai lầm loại giảm 66 STA303_Bai4_v1.0013111226 Bài 4: Kiểm định giả thuyết thống kê tăng xác suất mắc sai lầm loại Sử dụng mối liên hệ để định cần chọn mức ý nghĩa thích hợp sở xem xét chi phí tổn thất xảy hai loại sai lầm Chẳng hạn, bệnh nhân chuẩn đốn bệnh, mắc sai lầm loại I có nghĩa bác bỏ tình trạng bệnh tật (cho người khơng có bệnh) thực tế người có bệnh dẫn đến bệnh nhân tử vong khơng điều trị, bác sĩ nghiêng phía sai lầm loại 2, chữa bệnh cho người khơng bị bệnh cịn dẫn đến bệnh nhân tử vong chọn mức ý nghĩa kiểm định thấp Thông thường  lấy 0,01; 0,02; 0,05 0,10 Từ mức ý nghĩa kiểm định  xác định miền bác bỏ miền chấp nhận giả thuyết H0 4.1.3 Tiêu chuẩn kiểm định Tiêu chuẩn kiểm định thống kê tuân theo quy luật phân phối xác suất xác định (một số quy luật phân phối thông dụng như: quy luật phân phối chuẩn, phân phối T-Student, phân phối 2, phân phối Fisher ) giả thuyết không Trong tập hợp kiểm định thống kê có mức ý nghĩa  (tức có xác suất mắc sai lầm loại nhau), kiểm định có xác suất mắc sai lầm loại nhỏ xem “tốt nhất” 4.1.4 Các bước tiến hành kiểm định giả thuyết thống kê Để tiến hành kiểm định giả thuyết thống kê cần thực bước sau:  Phát biểu giả thuyết H0 giả thuyết đối H1  Định rõ mức ý nghĩa  (xác suất mắc sai lầm loại 1)  Chọn tiêu chuẩn kiểm định  Tính giá trị tiêu chuẩn kiểm định từ mẫu quan sát  Kết luận bác bỏ hay chấp nhận H0 tuỳ theo giá trị tiêu chuẩn kiểm định rơi vào miền bác bỏ hay chấp nhận Cụ thể: o Nếu giá trị tiêu chuẩn kiểm định thuộc miền bác bỏ: H0 sai, bác bỏ giả thuyết H0 o Nếu giá trị tiêu chuẩn kiểm định thuộc miền chấp nhận: Trong trường hợp khơng nên hiểu H0 hồn tồn mà nên hiểu qua mẫu cụ thể chưa đủ sở để bác bỏ H0 4.2 Kiểm định giả thiết giá trị trung bình 4.2.1 Kiểm định giả thiết giá trị trung bình tổng thể chung Giả sử lượng biến tiêu thức X tổng thể chung phân phối theo quy luật chuẩn với trung bình  phương sai 2 Ký hiệu: N (, 2) Ta chưa biết , có sở 0, ta đưa giả thuyết thống kê H0:  = 0 Để kiểm định giả thuyết này, từ tổng thể chung ta tiến hành điều tra chọn mẫu ngẫu nhiên n đơn vị tính trung bình mẫu x Để chọn tiêu chuẩn kiểm định thích hợp, ta xét trường hợp sau: STA303_Bai4_v1.0013111226 67 Bài 4: Kiểm định giả thuyết thống kê 4.2.1.1 Phương sai tổng thể chung 2 biết Tiêu chuẩn kiểm định chọn thống kê z: z x  μ σ/ n Nếu giả thuyết H0 đúng, ta có: z  x  μ0  σ/ n Đại lượng z phân phối theo quy luật chuẩn hoá N(0,1) Tuỳ thuộc vào dạng giả thuyết đối H1 mà miền bác bỏ xây dựng theo trường hợp sau: Kiểm định phía phải: Giả thuyết H0:  = 0 H1:  > 0 Với mức ý nghĩa kiểm định  cho trước, tra bảng N(0,1) tìm Z Nếu z > Z, ta bác bỏ giả thuyết H0 Kiểm định phía trái: Giả thuyết H0:  = 0 H1:  < 0 Với mức ý nghĩa kiểm định  cho trước, tra bảng N(0,1) tìm Z Nếu z < - Z ; ta bác bỏ giả thuyết H0 Kiểm định hai phía: Giả thuyết H0:  = 0 H1:   0 Với mức ý nghĩa kiểm định  cho trước, tra bảng N(0,1) tìm Z/2 Nếu z > Z/2; ta bác bỏ giả thuyết H0 Ví dụ: Bánh qui bơ hãng Hải hà đóng máy với trọng lượng tịnh 454 gram/hộp với độ lệch tiêu chuẩn 7,9 gram Mặc dù trọng lượng tịnh thực tế hộp bánh dao động chút xung quanh mức 454 gram với công ty, điều quan trọng trọng lượng tịnh trung bình hộp phải 454 gram Để kiểm tra xem liệu bánh có đóng đủ mức cần thiết hay khơng, phận đảm bảo chất lượng chọn điều tra ngẫu nhiên mẫu gồm 50 hộp Trọng lượng tịnh trung bình mẫu tính 451,2 gram Với mức ý nghĩa 5%, nhận định xem liệu bánh có đóng đủ trọng lượng cho hộp khơng? Gọi  trọng lượng tịnh trung bình hộp bánh Ta cần kiểm định cặp giả thuyết sau: H0:  = 454 (Bánh đóng đủ trọng lượng cần thiết) H1:  < 454 (Bánh không đóng đủ trọng lượng cần thiết) z  x  μ   451,  454  2,51 σ/ n 7,9 50 Tra bảng: Z = Z0,05 = 1,64 Ta thấy z < - Z nên với mẫu nghiên cứu, ta bác bỏ H0 kết luận bánh khơng đóng đủ trọng lượng cần thiết mức ý nghĩa 0,05 68 STA303_Bai4_v1.0013111226 Bài 4: Kiểm định giả thuyết thống kê 4.2.1.2 Phương sai tổng thể chung 2 chưa biết Trong thực tế tiến hành kiểm định thường trước phương sai tổng thể chung Khi để lựa chọn tiêu chuẩn kiểm định cần xét đến kích thước mẫu điều tra a Trường hợp mẫu lớn (n  30) Mặc dù chưa biết phương sai tổng thể chung tổng thể mẫu có quy mơ lớn, theo định lý giới hạn trung tâm, trường hợp ta dùng tiêu chuẩn kiểm định trường hợp biết phương sai tổng thể chung, độ lệch tiêu chuẩn () thay độ lệch tiêu chuẩn mẫu (S) t x  μ  S/ n n Trong đó: S  x  x  i 1 i n 1 Nếu H0 t phân phối theo quy luật Student với (n - 1) bậc tự Tuỳ thuộc vào giả thuyết đối H1 mà miền bác bỏ xây dựng theo trường hợp sau: Kiểm định phía phải: Giả thuyết H0:  = 0 H1:  > 0 Với mức ý nghĩa kiểm định  cho trước, tra bảng tìm giá trị t,(n t > t,(n -1) , ta bác bỏ giả thuyết H0 -1) Nếu -1) Nếu Kiểm định phía trái: Giả thuyết H0:  = 0 H1:  < 0 Với mức ý nghĩa kiểm định  cho trước, tra bảng tìm giá trị t,(n t < - t,(n -1), ta bác bỏ giả thuyết H0 Kiểm định hai phía: Giả thuyết H0:  = 0 H1:   0 Với mức ý nghĩa kiểm định  cho trước, tra bảng tìm giá trị t/2,(n -1) Nếu |t| > t/2,(n -1), ta bác bỏ giả thuyết H0 Trong thực tế quy mơ mẫu lớn (n ≥30) nên thống kê t phân phối xấp xỉ chuẩn, so sánh tiêu chuẩn kiểm định với giá trị Z Ví dụ: Chủ đầu tư dự án nhà tiết lộ với khách hàng tiềm rằng, hộ có phịng ngủ tịa nhà xây thuộc dự án cho thuê với giá 587$/tháng Để kiểm tra, người khách hàng thu thập thơng tin 50 hộ có phòng ngủ thuộc dự án xác định tiền cho thuê hộ trung bình 599,5$/tháng với độ lệch tiêu chuẩn 84,84$ Với mức ý nghĩa 0,02 kiểm định xem thông tin chủ đầu tư dự án có khơng Gọi  giá th trung bình hộ có phòng ngủ thuộc dự án Ta cần kiểm định giả thuyết: H0:  = 587 H1:   587 STA303_Bai4_v1.0013111226 69 Bài 4: Kiểm định giả thuyết thống kê Ta có: t  x  0 599,5  587   1, 042 S/ n 84,84 50 Tra bảng: t/2,(n-1) = Z0,01 (49) = 2,403 Vì t < t/2, (n-1) nên với mẫu nghiên cứu kết luận chưa đủ sở để bác bỏ H0, tạm thời chấp nhận thông tin từ chủ đầu tư dự án b Trường hợp mẫu nhỏ (n < 30) Trong trường hợp chưa biết phương sai tổng thể chung quy mơ mẫu nhỏ, tiêu chuẩn kiểm định chọn thống kê t: t x  μ  S/ n Người ta chứng minh H0 t phân phối theo quy luật Student với (n - 1) bậc tự Tuỳ thuộc vào giả thuyết đối H1 mà miền bác bỏ xây dựng theo trường hợp sau: Kiểm định phía phải: Giả thuyết H0:  = 0 ; H1:  > 0 Với mức ý nghĩa kiểm định  cho trước, tra bảng tìm giá trị t,(n -1) Nếu -1) Nếu t > t,(n -1) , ta bác bỏ giả thuyết H0 Kiểm định phía trái: Giả thuyết H0:  = 0 H1:  < 0 Với mức ý nghĩa kiểm định  cho trước, tra bảng tìm giá trị t,(n t < - t,(n -1), ta bác bỏ giả thuyết H0 Kiểm định hai phía: Giả thuyết H0:  = 0 H1:   0 Với mức ý nghĩa kiểm định  cho trước, tra bảng tìm giá trị t/2,(n -1) Nếu |t| > t/2,(n -1), ta bác bỏ giả thuyết H0 Ví dụ: Theo cơng bố nghiên cứu chi tiêu hộ gia đình thành thị, năm 2012, trung bình hộ phải trả 1123 nghìn đồng tháng cho tiêu dùng lượng Để kiểm tra thông tin này, người ta chọn 15 hộ gia đình tính chi tiêu dùng lượng trung bình hộ 1344,27 nghìn đồng tháng với độ lệch tiêu chuẩn 231 nghìn đồng Ở mức ý nghĩa 5%, liệu kết luận nghiên cứu có thấp thực tế hay khơng? Gọi µ mức chi cho tiêu dùng lượng trung bình hộ tháng Ta cần kiểm định giả thuyết: H0:  = 1123 H1:  > 1123 70 STA303_Bai4_v1.0013111226 Bài 4: Kiểm định giả thuyết thống kê Ta có: t  x  0 1344, 27  1123   3, 71 S/ n 231 15 Tra bảng phân phối Student với 14 bậc tự ta tìm t0,05;14 = 1,761 Vì t > t,(n -1) với mẫu nghiên cứu, bác bỏ H0 Các hộ gia đình chi tiêu dùng lượng nhiều mức công bố nghiên cứu 4.2.2 Kiểm định hai giá trị trung bình hai tổng thể chung Đây tốn so sánh hai trung bình hai tổng thể chung, vấn đề có ý nghĩa thống kê Trong thực tế phải làm phép so sánh: so sánh chất lượng hai loại sản phẩm, hai loại dịch vụ; so sánh hai hội đầu tư; so sánh hai phương pháp dạy học, Để giải vấn đề ta dùng phương pháp kiểm định thống kê kiểm định tham số trường hợp hai mẫu độc lập hai mẫu phụ thuộc Bài giảng tập trung giải kiểm định hai trung bình hai tổng thể chung trường hợp hai mẫu độc lập Khi đề cập đến hai mẫu, khái niệm độc lập hiểu đơn vị chọn từ tổng thể theo cách thức cho việc đơn vị chọn vào mẫu không ảnh hưởng đến việc chọn đơn vị vào mẫu Giả sử có hai tổng thể chung: Tổng thể chung thứ có lượng biến tiêu thức X1 phân phối theo quy luật chuẩn N(1, σ12 ) tổng thể chung thứ hai có lượng biến tiêu thức X2 phân phối theo quy luật chuẩn N(2, σ 22 ) Nếu 1 2 chưa biết song có sở để giả thuyết giá trị chúng chênh lệch giá trị đó, ta có giả thuyết không sau: H0: 1 = 2 H0: 1 - 2 = 0 Để kiểm định giả thuyết trên, từ hai tổng thể chung người ta rút hai mẫu ngẫu nhiên độc lập với kích thước mẫu tương ứng n1 n2, từ tính trung bình mẫu x x Để chọn tiêu chuẩn kiểm định thích hợp, ta xét trường hợp sau: 4.2.2.1 Phương sai hai tổng thể chung σ 12 σ 22 biết Tiêu chuẩn kiểm định chọn là: z  x1  x    1  2   12 n1   22 n2 Đại lượng z phân phối theo quy luật chuẩn hoá N (0, 1) Nếu giả thuyết H0 thì: x  x    có phân phối N (0, 1) z σ12 σ 22  n1 n2 Với mức ý nghĩa kiểm định  cho trước tuỳ thuộc vào giả thuyết đối H1 mà ta xây dựng miền bác bỏ sau: Kiểm định phía phải: Giả thuyết H0: 1 - 2 = 0 H1: 1 - 2 > 0 Với mức ý nghĩa kiểm định  cho trước, tra bảng N(0,1) tìm Z Nếu STA303_Bai4_v1.0013111226 71 Bài 4: Kiểm định giả thuyết thống kê z > Z, ta bác bỏ giả thuyết H0 Kiểm định phía trái: Giả thuyết H0: 1 - 2 = 0 H1: 1 - 2 < 0 Nếu z < - Z ; ta bác bỏ giả thuyết H0 Kiểm định hai phía: Giả thuyết H0: 1 - 2 = 0 H1: 1 - 2  0 Với mức ý nghĩa kiểm định  cho trước, tra bảng N(0,1) tìm Z/2 Nếu z > Z/2; ta bác bỏ giả thuyết H0 Ví dụ: Có ý kiến cho chiều cao nam niên sống khu vực thành thị cao chiều cao nam niên sống khu vực nông thôn, người ta tiến hành chọn 10 nam niên sống khu vực thành thị 12 nam niên sống khu vực nông thôn để đo chiều cao thu kết sau (cm): Thành thị: 168, 171, 165, 169, 168, 173, 165, 162, 167, 169 Nông thôn: 162, 168, 174, 164, 165, 166, 160, 163, 165, 167, 167, 163 Với xác suất 95%, đưa kết luận nhận định trên, biết chiều cao nam niên sống khu vực thành thị sống khu vực nông thôn biến ngẫu nhiên phân phối chuẩn với độ lệch tiêu chuẩn 2,5cm 2,8cm Gọi 1 2 chiều cao trung bình nam niên sống khu vực thành thị khu vực Trong trường hợp có cặp giả thuyết sau: H :   2 H : 1  2     H1 : 1  2  H1 : 1  2  Ta có tiêu chuẩn kiểm định sau: z Trong  x1  x   0 167,  165,33  x1  σ12 σ 22  n1 n  2,52 2,82  10 12  2, 093 xi 1677   167,7 n 10 x2  xi 1984   165,33 n 12 Với mức ý nghĩa 0,05 tra bảng ta có Z/2 = Z0,025 = 1,960, ta có z > Z0,025 Với mẫu nghiên cứu, ta bác bỏ giả thuyết H0, có sở chiều cao nam niên sống khu vực thành thị cao chiều cao nam niên sống khu vực nông thôn 4.2.2.2 Phương sai hai tổng thể chung σ 12 σ 22 chưa biết a Trường hợp phương sai hai tổng thể Trong trường hợp tiêu chuẩn kiểm định chọn thống kê t: 72 STA303_Bai4_v1.0013111226 Bài 4: Kiểm định giả thuyết thống kê t (x1  x )  ( 1  2 ) 2 S S  n1 n  (x1  x )  ( 1  2 ) 1 S  n1 n Trong đó: S2 giá trị chung của hai phương sai mẫu s12 s 22 S n1  1 S12   n  1 S22   n1  n  Người ta chứng minh H0 đúng, hai tổng thể chung có phân phối chuẩn t có phân phối Student với (n1 + n2 - 2) bậc tự Tuỳ thuộc vào giả thuyết đối H1 mà miền bác bỏ xây dựng theo trường hợp sau: Kiểm định phía phải: Giả thuyết H0: 1 - 2 = 0 H1: 1 - 2 > 0 Với mức ý nghĩa kiểm định  cho trước, tra bảng tìm giá trị t  , n  n  2 Nếu t > t  , n  n  2 , ta bác bỏ giả thuyết H0 Kiểm định phía trái: Giả thuyết H0: 1 - 2 = 0 H1: 1 - 2 < 0 Nếu t < - t α ,n1  n 2  , ta bác bỏ giả thuyết H0 Kiểm định hai phía: Giả thuyết H0: 1 - 2 = 0 H1: 1 - 2 ≠ 0 Với mức ý nghĩa kiểm định  cho trước, tra bảng tìm giá trị t α/2, n  n |t| > t α/2, n  n 2  2 Nếu , ta bác bỏ giả thuyết H0 b Trường hợp phương sai hai tổng thể không Trong trường hợp ta dùng thống kê t làm tiêu chuẩn kiểm định Thống kê t có dạng: t  x1  x   ( 1  2 ) S12 S22  n1 n Nếu giả thuyết H0 thống kê t tuân theo quy luật phân phối Student với bậc tự v  S12 S22      n1 n2  Trong v  2  S12   S22       n1   n1  n2   n2  Trong tính tốn thực tế v tính số lẻ, làm trịn xuống để có giá trị t lớn Với mức ý nghĩa kiểm định  cho trước tuỳ thuộc vào giả thuyết đối H1 mà ta xây dựng miền bác bỏ sau: STA303_Bai4_v1.0013111226 73 Bài 4: Kiểm định giả thuyết thống kê Kiểm định phía phải: Giả thuyết H0: 1 - 2 = 0 H1: 1 - 2 > 0 Nếu t > t ,v  , ta bác bỏ giả thuyết H0 Kiểm định phía trái: Giả thuyết H0: 1 - 2 = 0 H1: 1 - 2 < 0 Nếu t <  t ,v  , ta bác bỏ giả thuyết H0 Kiểm định hai phía: Giả thuyết H0: 1 - 2 = 0 H1: 1 - 2  0 Nếu t  t / ,v  , ta bác bỏ giả thuyết H0 Trở lại ví dụ chiều cao nam niên thành thị nông thôn Giả sử chưa biết độ lệch chuẩn chiều cao nam niên, giả sử phương sai Trong trường hợp dùng tiêu chuẩn t để tiến hành kiểm định Gọi 1 2 chiều cao trung bình nam niên sống khu vực thành thị nông thôn Trong trường hợp ta có cặp giả thuyết sau:  H : 1  2   H : 1  2    H1 : 1  2   H1 : 1  2 Tiêu chuẩn kiểm định là: x  x   0  167 ,7  165,33   1,6272 t 1 1 11,53 S   n1 n2 10 12 xi 1677   167,7 n 10 x 1984 x2  i   165,33 n 12 Trong x1  S12  (x i2  n  x ) (281323  10 167, )   10, 01 n 1 10  (x i2  n  x ) (328162  12 165,332 )   12, 79 S  n 1 12  2 S n1  1 S12   n  1 S22   n1  n   10, 01  1112, 79  11,53 20 Với xác suất 95%, tra bảng t ,n1  n2 2   t 0, 05,20   1,725 Ta có t  t ,n1  n2   với mẫu nghiên cứu, chưa có sở bác bỏ giả thuyết H0 Như cho chiều cao nam niên sống khu vực thành thị cao chiều cao nam niên khu vực nông thôn 74 STA303_Bai4_v1.0013111226 Bài 4: Kiểm định giả thuyết thống kê 4.3 Kiểm định giả thiết tỷ lệ 4.3.1 Kiểm định giả thiết tỷ lệ tổng thể chung Giả sử tổng thể chung, tỷ lệ theo tiêu thức A p Nếu p chưa biết song có sở để giả thuyết giá trị p0, ta đưa giả thuyết: H0: p = p0 Để kiểm định giả thuyết ta lấy mẫu ngẫu nhiên kích thước n thấy có nA đơn vị có biểu nghiên cứu tiêu thức A (và n - nA đơn vị khơng có biểu đó) Như ta có tỷ lệ mẫu: f = nA/ n Với n đủ lớn (np0  n(1- p0)  5) ta chọn tiêu chuẩn kiểm định Z: z (f  p ) p (1  p0 ) n Nếu H0 đại lượng z phân phối theo quy luật chuẩn hoá N(0,1) Tuỳ thuộc vào dạng giả thuyết đối H1 mà miền bác bỏ xây dựng sau: Kiểm định phía phải: Giả thuyết H0: p = p0 H1: p > p0 Với mức ý nghĩa kiểm định  cho trước, ta tra bảng N(0,1) tìm Z Nếu z > Z, ta bác bỏ giả thuyết H0 Kiểm định phía trái: Giả thuyết H0: p = p0 H1: p < p0 Với mức ý nghĩa kiểm định  cho trước, ta tra bảng N(0,1) tìm Z Nếu z < - Z; ta bác bỏ giả thuyết H0 Kiểm định hai phía: Giả thuyết H0: p = p0 H1: p  p0 Với mức ý nghĩa kiểm định  cho trước, ta tra bảng N(0,1) tìm Z/2 Nếu z > Z/2; ta bác bỏ giả thuyết H0 Ví dụ: Trong nghiên cứu thị trường công ty phân phối máy tính HP, người ta thực vấn 758 sinh viên trường A xem liệu họ có sở hữu laptop hay không 394 người số hỏi trả lời có Với mức ý nghĩa 5%, kiểm định xem liệu có đa số (>50%) sinh viên trường A sở hữu laptop hay không? Gọi p tỷ lệ sinh viên trường A sở hữu laptop Giả thuyết cần kiểm định là: H0: p = 0,5 H1: p > 0,5 Ta có np0 = 758×0,5 = 379  n(1- p0) = 758×0,5 = 379  điều kiện kiểm định thỏa mãn STA303_Bai4_v1.0013111226 75 Bài 4: Kiểm định giả thuyết thống kê Tỷ lệ mẫu f=394/758=0,52 tiêu chuẩn kiểm định là: z (f  p ) (0,52  0,5)   1,1 p (1  p ) 0,5(1  0,5) 758 n Tra bảng ta Z = Z0,05 = 1,645 Vì z < Z với mẫu nghiên cứu, chưa đủ sở để bác bỏ giả thuyết H0, kết luận đa số sinh viên trường A sở hữu laptop 4.3.2 Kiểm định giả thiết tỷ lệ hai tổng thể chung Giả sử có hai tổng thể chung, tỷ lệ theo tiêu thức A tổng thể chung thứ p1 tổng thể chung thứ hai p2 Nếu p1 p2 chưa biết, song có sở để giả thuyết chúng nhau, ta có giả thuyết cần kiểm định là: H0: p1 = p2 Để kiểm định giả thuyết này, từ hai tổng thể chung ta rút hai mẫu ngẫu nhiên với kích thước tương ứng n1 n2; thấy có n1A n2A đơn vị có biểu tiêu thức A Ta tính tỷ lệ mẫu f1 = n1A/ n1 f2 = n2A/ n2 Tiêu chuẩn kiểm định chọn là: z (f1  f )  (p1  p ) 1  f (1  f )     n1 n  Trong đó, f tỷ lệ chung hai mẫu tính theo cơng thức: f n1f1  n f n1A  n 2A  n1  n n1  n Khi n1 n2 tương đối lớn (n1f1; n1(1- f1); n2f2; n2(1- f2)  5) Z phân phối xấp xỉ chuẩn N(0, 1) Nếu giả thuyết H0 tiêu chuẩn kiểm định có dạng: z f1  f 1  f (1  f )     n1 n  z có phân phối xấp xỉ chuẩn N(0, 1) Với mức ý nghĩa  cho trước, tuỳ thuộc vào dạng giả thuyết đối H1 mà miền bác bỏ xây dựng theo trường hợp sau: Kiểm định phía phải: Giả thuyết H0: p1 = p2 H1: p1 > p2 Nếu z > Z, ta bác bỏ giả thuyết H0 Kiểm định phía trái: Giả thuyết H0: p1 = p2 H1: p1 < p2 Nếu z < - Z, ta bác bỏ giả thuyết H0 Kiểm định hai phía: Giả thuyết H0: p1 = p2 H1: p1  p2 Nếu z > Z/2; ta bác bỏ giả thuyết H0 76 STA303_Bai4_v1.0013111226 Bài 4: Kiểm định giả thuyết thống kê Ví dụ: Nghiên cứu hãng nước giải khát cho thấy, dường tỷ lệ nam giới ưa thích sản phẩm hãng nhiều tỷ lệ nữ giới ưa thích chúng Để kiểm tra, người ta tiến hành khảo sát với mẫu ngẫu nhiên độc lập gồm 21150 nam 22852 nữ Kết cho thấy có 6598 nam 6147 nữ trả lời có ưa thích loại nước giải khát hãng Hãy kiểm định xem liệu có tỷ lệ nam giới ưa thích loại nước giải khát cao tỷ lệ nữ giới hay không với mức ý nghĩa 2% Gọi p1 tỷ lệ nam giới ưa thích loại nước giải khát hãng, p2 tỷ lệ nữ giới ưa thích loại nước giải khát hãng Ta cần kiểm định giả thuyết: H0: p1 = p2 H1: p1 > p2 Với số liệu cho ta tính được: f1 = n1A/ n1 = 6598/ 21150 = 0,312; f2 = n2A/ n2 = 6147/ 22852 =0,269 6598  6147 Và tỷ lệ chung: f   0, 29 21150  22852 Trong trường hợp n1 n2 lớn, tiêu chuẩn kiểm tính sau: f1  f 0,312  0, 269 z   9,93 1 1    0, 29(1  0, 29)   f (1  f )     21150 22852    n1 n  Vì z = 9,93 > Z  = 2,06, nên với mẫu nghiên cứu, ta bác bỏ giả thuyết H0 kết luận: tỷ lệ nam giới ưa thích loại nước giải khát so với tỷ lệ nữ giới ưa thích sản phẩm STA303_Bai4_v1.0013111226 77 Bài 4: Kiểm định giả thuyết thống kê Tóm lược cuối  Khi nghiên cứu tượng kinh tế xã hội, với việc suy rộng tham số, người ta đưa giả thuyết thống kê để kiểm định vấn đề tham số tổng thể chung, từ thông tin mẫu để đưa nhận định chưa có đầy đủ thơng tin tổng thể  Giả thuyết thống kê gồm có giả thuyết khơng giả thuyết đối Vì giả thuyết sai nên cần kiểm định thống kê Tùy theo dạng giả thuyết mà lựa chọn áp dụng kiểm định hai phía hay kiểm định phía  Khi lựa chọn hai giả thuyết không giả thuyết đối, ta mắc phải hai sai lầm: sai lầm loại sai lầm loại Xác suất việc mắc sai lầm loại gọi mức ý nghĩa Để bác bỏ hay chấp nhận giả thuyết không, ta phải sử dụng tiêu chuẩn kiểm định  Kiểm định giả thuyết thống kê phải thực theo trình tự định Các trường hợp phổ biến kiểm định giá trị trung bình tỷ lệ tổng thể chung so với giá trị xác định Hoặc so sánh hai giá trị trung bình hai tỷ lệ hai tổng thể chung với 78 STA303_Bai4_v1.0013111226 Bài 4: Kiểm định giả thuyết thống kê Câu hỏi ôn tập Thế kiểm định giả thuyết thống kê? Giả thuyết thống kê gì? Trình bày dạng giả thuyết thống kê khác Phân biệt sai lầm loại sai lầm loại Tiêu chuẩn kiểm định gì? Trình bày bước tiến hành kiểm định giả thuyết thống kê Trình bày nội dung, phương pháp kiểm định số trung bình tổng thể chung Trình bày nội dung, phương pháp kiểm định tỷ lệ theo tiêu thức tổng thể chung Trình bày nội dung, phương pháp kiểm định hai giá trị trung bình hai tổng thể chung hai mẫu độc lập Trình bày nội dung, phương pháp kiểm định hai tỷ lệ theo tiêu thức hai tổng thể chung STA303_Bai4_v1.0013111226 79 Bài 4: Kiểm định giả thuyết thống kê Bài tập Bài Người quản lý nhà hàng chuyên giao pizza tận nhà vừa thay đổi trình giao hàng nhằm làm giảm thời gian đưa bánh Một mẫu gồm 40 đơn hàng sử dụng cách thức giao hàng tính thời gian chờ trung bình 28,5 phút với độ lệch tiêu chuẩn phút Với mức ý nghĩa 0,05, liệu có chứng để khẳng định rằng, cách thức giao hàng có thời gian giao hàng nhanh so với thời gian giao hàng trước (30 phút) hay không? Bài Ngân hàng S.C có hiệu “mỗi khách hàng phục vụ vòng phút” Tuy nhiên, chi nhánh Hà Nội, nhiều khách hàng phàn nàn rằng, họ phải chờ đợi lâu cam kết Nhà quản lý ngân hàng định kiểm tra lại thông tin cách theo dõi ngẫu nhiên 20 khách hàng đến chi nhánh Thời gian chờ phục vụ (phút) khách ghi lại bảng sau: 5,0 8,2 8,0 4,5 7,5 8,5 3,0 8,2 8,0 7,5 5,2 6,0 6,5 5,0 7,0 7,5 7,0 6,0 9,0 8,5 Vậy ngân hàng S.C có phục vụ khách hàng hiệu đưa hay không? Hãy kết luận với mức ý nghĩa 0,05 Bài Thị phần công ty nhạy cảm với mức độ quảng cáo họ lẫn quảng cáo đối thủ Một hãng biết có 56% thị phần muốn kiểm định xem liệu giá trị cịn hay không gần đây, họ lẫn đối thủ tăng cường chiến dịch quảng cáo Một mẫu ngẫu nhiên hỏi với 500 khách hàng cho biết có 298 người sử dụng sản phẩm cơng ty Với kết đó, liệu kết luận thị phần cơng ty khơng cịn 56% hay không mức ý nghĩa 0,01 Bài Theo khuyến nghị Uỷ ban dinh dưỡng lương thực thuộc Viện khoa học quốc gia Mỹ hàm lượng sắt cho phép dung nạp hàng ngày phụ nữ 51 tuổi không 18mg Một nghiên cứu thực nhằm kiểm tra xem liệu phụ nữ 51 tuổi có thực tuân theo khuyến nghị hay không Kết điều tra 45 phụ nữ 51 tuổi cho thấy hàm lượng sắt dung nạp vòng 24 họ sau: Lượng sắt dung nạp 24 (mg) 6-8 8-10 10-12 12-14 14-16 16-18 18-20 20-22 Tổng Số người 1 9 45 Từ kết trên, đưa kết luận với mức ý nghĩa 5% 80 STA303_Bai4_v1.0013111226 Bài 4: Kiểm định giả thuyết thống kê Bài Theo báo cáo gần hãng hàng khơng A.V bốn chuyến bay, có chuyến bị trễ lịch Để kiểm tra tính xác báo cáo, mẫu với 300 chuyến bay cho thấy có 30% số bị trễ lịch Hãy thực kiểm định giả thuyết với mức ý nghĩa 0,05 Bài Nhiều công ty chuyên phục vụ khách hàng tuổi vị thành niên rút điều người trẻ thường thích thú với quảng cáo có tiết tấu nhanh với âm nhạc sơi động, phiêu lưu quảng cáo lời Trong thử nghiệm, người ta vấn hai nhóm thiếu niên ghi lại số lần mua sản phẩm quảng cáo họ tháng coi số điểm người Nhóm gồm 128 thiếu niên xem quảng cáo có nhạc rock làm Nhóm gồm 212 thiếu niên xem quảng cáo loại sản phẩm nhóm âm nhạc thay thuyết phục lời Sau tổng hợp lại, người ta tính điểm số trung bình cho nhóm âm nhạc 23,5 với độ lệch tiêu chuẩn 12,2 Điểm số trung bình cho nhóm cịn lại 18,0 với độ lệch tiêu chuẩn 10,5 Giả sử hai nhóm lựa chọn hồn tồn ngẫu nhiên tổng số khách hàng tuổi vị thành niên Giả sử phương sai không Sử dụng mức ý nghĩa 0,01, phát biểu xem liệu hai phương pháp quảng cáo có hiệu hay không? Nếu không cho biết phương pháp hiệu Giải thích Bài Một nhà quản lý bán hàng khu vực chọn hai phòng kinh doanh tương tự để nghiên cứu ảnh hưởng chương trình đào tạo nhằm mục đích tăng doanh số bán hàng Phịng A gồm 47 nhân viên kinh doanh không tiếp cận với chương trình đào tạo cịn phịng B với 51 nhân viên kinh doanh tiếp cận Sau tháng, người ta tính doanh số bán hàng bình qn nhân viên kinh doanh phòng A 31,97 triệu đồng với độ lệch tiêu chuẩn 1,02 triệu đồng Con số tương tự phòng B 32,29 triệu đồng 1,07 triệu đồng Liệu chương trình đào tạo có làm tăng doanh số bán hàng hay không Kết luận mức ý nghĩa 5% Giả sử phương sai Bài Một ngân hàng muốn thu hút thêm nhiều khách hàng nên kéo dài thời gian phục vụ khách vào buổi trưa (từ 12-13 giờ) Nhằm mục đích làm cho khách hàng hài lịng hơn, nên họ tìm cách để giảm bớt thời gian chờ đợi khách (tính từ lúc khách bắt đầu xếp hàng phục vụ quầy) Để có giải pháp đắn với chi nhánh, nhà quản lý ngân hàng chọn hai chi nhánh, chi nhánh A nằm khu vực thương mại, chi nhánh B khu vực đông dân cư sinh sống Thời gian chờ đợi khách (phút) hai chi nhánh ghi lại bảng sau: Chi nhánh A Chi nhánh B 4,21 5,13 3,54 6,10 6,46 9,66 5,79 8,01 6,68 6,17 5,55 4,77 3,20 0,38 6,19 5,90 8,73 8,35 5,64 9,91 3,02 2,34 4,50 5,12 3,79 8,02 3,82 10,49 4,08 5,47 Giả sử phương sai tổng thể chung hai chi nhánh nhau, liệu có chứng cho thấy có khác thời gian chờ đợi trung bình khách hàng hai chi nhánh hay không? Sử dụng mức ý nghĩa 5% STA303_Bai4_v1.0013111226 81 Bài 4: Kiểm định giả thuyết thống kê Bài Ở nhóm tuổi, người lại có cách thức thu nhận thông tin khác Một nghiên cứu tiến hành vấn 300 người dân lứa tuổi 35-50 300 người dân lứa tuổi 50 Kết cho thấy, có 82 người lứa tuổi 35-50 104 người lứa tuổi 50 trả lời, họ có tin tức chủ yếu từ xem tivi Với kết trên, liệu có chứng minh có khác đáng kể tỷ lệ người thu nhận tin tức chủ yếu từ tivi hai lứa tuổi hay không? Sử dụng mức ý nghĩa 5% 82 STA303_Bai4_v1.0013111226

Ngày đăng: 24/03/2022, 13:44

HÌNH ẢNH LIÊN QUAN

Với mức ý nghĩa của kiểm định  cho trước, tra bảng N(0,1) tìm được Z. Nếu z &gt; Z, ta bác bỏ giả thuyết H0 - KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
i mức ý nghĩa của kiểm định  cho trước, tra bảng N(0,1) tìm được Z. Nếu z &gt; Z, ta bác bỏ giả thuyết H0 (Trang 6)
Tra bảng: t/2,(n-1) = Z0,01 (49) = 2,403 - KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
ra bảng: t/2,(n-1) = Z0,01 (49) = 2,403 (Trang 8)
Với mức ý nghĩa của kiểm định  cho trước, tra bảng N(0,1) tìm được Z/2. Nếu - KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
i mức ý nghĩa của kiểm định  cho trước, tra bảng N(0,1) tìm được Z/2. Nếu (Trang 10)
Với mức ý nghĩa của kiểm định  cho trước, tra bảng tìm giá trị của  12 - KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
i mức ý nghĩa của kiểm định  cho trước, tra bảng tìm giá trị của  12 (Trang 11)
Tra bảng ta được Z = Z0,05 = 1,645. Vì z &lt; Z do đó với mẫu đã nghiên cứu, chưa đủ cơ sở để bác bỏ giả thuyết H 0, và kết luận không phải đa số sinh viên trường A đang  sở hữu laptop - KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
ra bảng ta được Z = Z0,05 = 1,645. Vì z &lt; Z do đó với mẫu đã nghiên cứu, chưa đủ cơ sở để bác bỏ giả thuyết H 0, và kết luận không phải đa số sinh viên trường A đang sở hữu laptop (Trang 14)