- Sai lầm của một bài toán kiểm định giả thuyết thống kê Kiểm định giả thuyết về so sánh tham số với một giá trị.
b/ Với độ tin cậy 95% có thể nói điểm trung bình trườn gA cao nhất là bao nhiêu, trường B thấp nhất là bao nhiêu?
4.7.3 So sánh nhiều tỷ lệ
Trong mục 4.7 ta đã kiểm định về so sánh hai tỷ lệ. Bây giờ ta xét bài toán so sánh s tỷ lệ s2. Gọi p = P(A) là một tỷ lệ nào đó đang cần nghiên cứu; p p1, 2,..., ps là các giá trị chưa biết của p tương ứng ở s tập hoặc s biến.
* Giả thuyết kiểm định: + H: p1 p2 ... ps s2
+ K: Các tỷ lệ không như nhau
Để giải bài toán này ta đưa về áp dụng bài toán kiểm tra tính độc lập. (Lưu ý là ở đây r = 2) Chọn thống kê: 2 2 2 1 1 1 . s ij i j i j n n d c
làm tiêu chuẩn kiểm định Nếu H đúng thì 22s1.
* Bác bỏ giả thiết H khi: 2 2 1 ;1
s
* Kết luận: Nếu thỏa điều kiện bác bỏ giả thiết H thì bác bỏ giả thiết H, chấp nhận đối thiết K. Ngược lại chấp nhận giả thiết H, bác bỏ đối thiết K.
(Bởi vì khi xét một tỷ lệ chưa biết, chúng ta cần hai con số n và m, tức là tập số liệu mẫu sẽ chia làm hai lớp: số lần xảy ra biến cố A (m) và số lần không xảy ra A, tức là xảy ra A (n-m). Nếu hai dấu hiệu A, A độc lập với các đối tượng (các tập) thì tỷ lệ p đang xét sẽ như nhau đối với s đối tượng, còn nếu dấu hiệu A phụ thuộc vào các đối tượng thì tỷ lệ p đang xét sẽ thay đổi theo đối tượng. Nghĩa là, giả thiết H ở trên tương đương với tính độc lập của dấu hiệu A với s đối tượng, đối thiết K tương đương với tính phụ thuộc của A với s đối tượng. Vì vậy, lời giải của bài toán này hoàn toàn tương tự như bài toán kiểm tra tính độc lập).
Ví dụ 12: Một hãng sản xuất ô tô muốn tìm hiểu xem có sự phụ thuộc nào giữa giới tính của người sở hữu ô tô với kiểu dáng của ô tô hay không. Một mẫu ngẫu nhiên gồm 2000 chủ sở hữu ô tô đã được chọn và phân loại như sau:
Kiểu dáng ô tô
Giới tính I II III
Nam 350 270 380
Nữ 340 400 260
Với mức ý nghĩa 0,025, tỷ lệ nữ dùng 3 loại ô tô trên có như nhau không?
Giải: Gọi pi là tỷ lệ nữ dùng ô tô kiểu dáng loại i (i = 1, 2, 3) Ta cần kiểm định: + H: p1 p2 p3
Tài liệu giảng dạy Môn Thống kê xã hội học 58 Chọn thống kê: 2 2 1 1 1 . r s ij i j i j n n d c
làm tiêu chuẩn kiểm định. Nếu H đúng thì 22(r1).(s1).
Với mức ý nghĩa 0,025, suy ra miền bác bỏ W của giả thiết H là 2 2 2 2;0,975 1 ;1 : s 7,378 W Ta có: 2 2 2 2 2 350 345 340 345 270 335 400 335 345 335 2 2 380 320 260 320 47,869 320 W
Suy ra bác bỏ giả thiết H, chấp nhận đối thiết K
Vậy: kiểu dáng ô tô có phụ thuộc vào giới tính của chủ sở hữu.
* Bài tập cũng cố chƣơng 4
Bài 1: Theo cuộc điều tra về lương của tổ chức National Association of Colleges and Employers tại Mỹ, lương trung bình được đề nghị cho các sinh viên tốt nghiệp ngành Công nghệ thông tin vào tháng 5 năm 2002 là $50.352 (Nguồn Journal of Accoutancy, September, 2002). Giả sử rằng kết quả này cũng đúng đối với tất cả sinh viên tốt nghiệp ngành CNTT ở Mỹ vào tháng 5 năm 2002. Một mẫu ngẫu nhiên bao gồm 200 sinh viên tốt nghiệp ngành CNTT trong năm nay cho thấy họ được đề nghị mức lương trung bình là $51.750 và độ lệch tiêu chuẩn điều chỉnh là $5240. Với mức ý nghĩa 1%liệu bạn có kết luận rằng lương trung bình đề nghị cho các sinh viên tốt nghiệp ngành CNTT trong năm nay sẽ cao hơn $50.352 không?
Bài 2: Một nhà tâm lý học tuyên bố rằng tuổi trung bình của các trẻ bắt đầu tập đi là 12,5 tháng tuổi. Giả sử một chuyên gia muốn kiểm tra xem lời tuyên bố này có đúng không. Chuyên gia này đã lấy ra một mẫu ngẫu nhiên gồm 18 trẻ và tìm ra rằng tuổi trung bình mà những trẻ này bắt đầu tập đi là 12,9 tháng tuổi và có độ lệch chuẩn là 0,64 tháng tuổi. Dùng mức ý nghĩa 0,01ta có thể kết luận rằng tuổi trung bình mà trẻ tập đi khác với 12,5 tháng tuổi không? (Giả sử rằng tuổi mà trẻ tập đi có phân phối chuẩn).
Tài liệu giảng dạy Môn Thống kê xã hội học 59
Bài 3: Điểm trung bình môn Toán năm học trước là 5,72. Năm nay theo dõi 100 sinh viên được số liệu:
Điểm 3 4 5 6 7 8 9
Số sinh viên 3 5 27 43 12 6 4
Với mức ý nghĩa 1%, phải chăng điểm trung bình môn Toán năm nay cao hơn năm trước?
Bài 4: Một loại thuốc chữa bệnh được nhà sản xuất khẳng định xác suất khỏi bệnh khi dùng thuốc này là 80%. Đưa thuốc ra sử dụng ở một bệnh viện. Theo dõi trong 150 người dùng thấy có 110 người khỏi bệnh. Với mức ý nghĩa 0,05 có thể chấp nhận ý kiến của nhà sản xuất hay không?
Bài 5: Thống kê thời gian tự học ở nhà trong mộttuần lễ của 70 sinh viên năm thứ nhất khoa A, ta có số liệu mẫu sau:
Thời gian T (giờ)
< 5 [5;10) [10;15) [15;20) [20;25) [25;30) [30;35) [35;40) 40
Số sinh viên 3 7 10 18 12 8 5 4 3
Giả sử thời gian T tuân theo luật phân phối chuẩn.
a/ Hãy ước lượng thời gian tự học ở nhà trung bình của một sinh viên khoa A. b/ Từ ước lượng nhận được có thể kết luận thời gian tự học ở nhà trung bình của một sinh viên khoa A là trên 20 giờ/1 tuần hay không? (xét với mức ý nghĩa 10%).
c/ Với độ tin cậy 95% có thể nói thời gian tự học ở nhà trung bình của một sinh viên khoa A cao nhất là bao nhiêu?
Bài 6: Gọi p là tỷ lệ các vụ tai nạn giao thông đường bộ do thanh thiếu niên gây ra ở thành phố Z. Theo tổng kết của năm trước thì tỷ lệ p là 62%. Sau một năm thực hiện Nghị định 36/CP, các trường học đưa giáo dục về luật giao thông vào dạy cho học sinh, trong số 1500 vụ tai nạn có 720 vụ là do thanh thiếu niên gây ra. Có thể nói tỷ lệ p đã giảm so với năm trước hay không? Thậm chí có kết luận p nhỏ hơn 50% hay không? (xét với mức ý nghĩa
0,05 ).
Bài 7: Một công ty tiến hành khảo sát thăm dò thị trường tiêu dùng tại một thành phố có 400.000 hộ gia đình về một loại sản phẩm A, khảo sát ngẫu nhiên 400 hộ gia đình trong thành phố dược số liệu về các hộ sử dụng sản phẩm A như sau:
Số lượng (kg/tháng) 0 - 1 1 – 1,5 1,5 - 2 2 – 2,5 2,5 - 3 3 - 4
Số hộ 50 80 100 80 60 30
Một công ty khác đã khảo sát thị trường trước đây để lại một tài liệu cho biết sức tiêu thụ sản phẩm A trung bình trong một tháng tại thành phố này là 740 tấn. Hãy nhận xét về tài liệu này với mức ý nghĩa 2%.
Tài liệu giảng dạy Môn Thống kê xã hội học 60
Bài 8: Khảo sát về doanh số bán hàng của một siêu thị, ta thu được số liệu sau: Doanh số (triệu đồng/ngày) Số ngày Doanh số (triệu đồng/ngày) Số ngày
24 5 48 15
30 12 54 12
36 25 60 10
42 35 65 6
70 24
Những ngày có doanh số bán hàng từ 60 triệu đồng/ngày trở lên là những ngày bán đắt hàng. a/ Nếu siêu thị này báo cáo tỷ lệ những ngày bán đắt hàng là 20% thì có chấp nhận được không? (với mức ý nghĩa 2%).
b/ Trước đây doanh số bán hàng trung bình của siêu thị là 35 triệu đồng/ngày. Số liệu ở bảng trên được thu thập sau khi siêu thị áp dụng một phương thức bán hàng mới. Hãy cho nhận xét về phương thức bán hàng mới với mức ý nghĩa 5%.
Bài 9: Hàm lượng dầu trung bình trong một trái cây lúc đầu là 5%. Người ta chăm sóc bằng một loại phân N và sau một thời gian, kiểm tra một số trái ta được kết quả như sau:
Hàm lượng dầu (%) Số trái Hàm lượng dầu (%) Số trái
1 – 5 51 21 – 25 8
5 – 9 47 25 – 29 7
9 – 13 39 29 – 33 3
13 – 17 36 33 – 37 2
17 – 21 32
a/ Cho biết kết luận về loại phân N trên với mức ý nghĩa 1%.
b/ Những trái có hàm lượng dầu từ 21% trở lên là loại A. Có thể xem tỷ lệ loại A là 15% được không với mức ý nghĩa 5%.
Bài 10: Điều tra 120 sinh viên của trường Sư phạm Ngoại Ngữ, ta thấy có 71 sinh viên nữ và điều tra 110 sinh viên trường Sư phạm Kỹ Thuật ta thấy có 28 nữ. Có thể xem tỷ lệ nữ ở hai trường như nhau không? Với mức ý nghĩa 5%.
Bài 11: Trước và sau dịp tết giá của mặt hàng A tại 8 cửa hiệu trong thành phố như sau:
Cửa hiệu Trước Tết Sau Tết Cửa hiệu Trước Tết Sau Tết
1 95 98 5 105 109
2 109 105 6 99 105
3 99 99 7 109 115
Tài liệu giảng dạy Môn Thống kê xã hội học 61 Với mức ý nghĩa 5%, hãy kiểm định xem có phải có khuynh hướng tăng giá sau Tết đối với mặt hàng A hay không?
Bài 12: Tham gia dự ántrồng 5 triệu ha rừng, nhân dân xã Z đã được giao trồng 100 ha rừng bằng hai loại cây: bổ đề và keo lai. Sau hai tuần lễ người ta lấy mẫu ngẫu nhiên và kết quả nhận được như sau: trong số 200 cây bổ đề thì có 175 cây sống, trong số 150 cây keo lai thì có 110 cây sồng. Với mức ý nghĩa 0,1 có thể kết luận tỷ lệ cây bổ đề sống cao hơn cây keo lai hay không?
Bài 13: Theo các nhà nhân trắc học, hiện nay chiều cao của các em lứa tuổi 14 – 15 ở thành thị cao hơn ở nông thôn từ 2cm đến 3cm. Ở nông thôn, lấy ra một mẫu với
1 100
n , tính được x140,5cm. Ở thành thị ta lấy ra một mẫu với n2 80, tính được 142,9
y cm. Giả sửDX = DY = 9. Với mức ý nghĩa 10% có thể khẳng định chiều cao trung bình của các em lứa tuổi 14 –15 ở thành thị cao hơn ở nông thôn hay không?
Bài 14: Để xem doanh số bán hàng trong một năm của một công ty bảo hiểm giữa những người đã tốt nghiệp trường thương nghiệp và những người không qua trường thương nghiệp có khác nhau không, người ta lấy ra hai mẫu ngẫu nhiên với kết quả như sau (đơn vị triệu đồng)
Nhóm I xi
Nhóm 2 yi