Với độ tin cậy đó, chiều cao trung bình tối đa của giống cây trồng trên là bao nhiêu?. b Nếu muốn ước lượng chiều cao trung bình của giống cây trồng trên với độ tin cậy 99% và độ chính x
Trang 1Ví dụ 3 Khảo sát chỉ tiêu X của một loại sản phẩm ta thu
được kết quả sau:
Xi 20-22 22-24 24-26 26-28 28-30 Số sản phẩm 7 14 33 27 19 Kiểm định giả thiết X có phân phối chuẩn với mức ý nghĩa 2%
Giải Bài toán yêu cầu kiểm định giả thiết với mức ý nghĩa α = 2%
= 0,02:
H0: X có phân phối chuẩn X ∼ N(μ,σ2) (μ, σ2 chưa biết)
với giả thiết đối:
H1: X không có phân phối chuẩn
Trước hết xấp xỉ:
i i
i i
1
X X n 25,74;
n 1
n
∑
∑
Ta tính các pi = P(xi-1≤ X ≤ xi) theo công thức:
trong đó ϕ là hàm Laplace, và lập bảng:
Xi ni pi npi (ni-npi)2/npi
Bước 1: Ta có 2 k i i 2
i
i 1
(n np ) 1,8898 np
=
−
Bước 2: Số tham số chưa biết là r = 2 (do μ, σ2 chưa biết) Ta
có k – r – 1 = 5 – 2 – 1 = 2 Tra bảng phân phối Chi bình phương
χ2 ∼ χ2 (2) với 2 bậc tự do, ta được: 2 2
0,02 7,824
α
Bước 3: Kiểm định:
Vì χ2= 1,8898 < 7,824 = 2
α
χ nênta chấp nhận giả thiết H0 Kết luận: Với mức ý nghĩa 2%, X có phân phối chuẩn:
X ∼ N(μ,σ2) với μ = 25,74; σ2 = (2,3034)2
Trang 23.7 Kiểm định giả thiết về tính độc lập
1) Bài toán Từ hai đám đông X và Y ta tiến hành quan sát
và được kết quả trong bảng sau:
Y
X
y1 yj yk m X
x1 n11 n1j n1k m1
xi ni1 nij nik m i
xh nh1 nhj nhk mh
n Y n 1 n j n k n
trong đó
• nij là số lần (X,Y) = (xi,yj) với 1 ≤ i ≤ h; 1 ≤ j ≤ k;
• mi = k ij
j 1
n
=
∑ là số lần X = xi với 1 ≤ i ≤ h;
• nj = h ij
i 1
n
=
∑ là số lần Y = yj với 1 ≤ j ≤ k;
• n = h k ij
i 1 j 1
n
= =
∑∑ là cỡ mẫu (X,Y)
Với mỗi số α (0 < α < 1) khá bé, hãy dựa vào mẫu trên để
kiểm định giả thiết: H 0: X và Y độc lập
với giả thiết đối H1: X và Y không độc lập
với mức ý nghĩa α
2) Qui tắc kiểm định:
BẢNG 11 KIỂM ĐỊNH GIẢ THIẾT VỀ TÍNH ĐỘC LẬP H0: X và Y độc lập (mức ý nghĩa α)
Bước 1: Tính χ2 h k
2
ij
i 1 j 1
= =
χ = ⎜⎜ α − ⎟⎟
⎝∑∑ ⎠ với ij 2
ij
i j
(n )
m n
α =
α
χ
Bước 3a: Chấp nhận H 0 χ2 ≤ 2
α
χ
Bước 3b: Bác bỏ H 0 χ2 > 2
α
χ
2
α
χ tra từ Bảng Phân phối Chi bình phương χ 2 với (h–1)(k–1) bậc tự do
Trang 3Ví dụ Một công ty điều tra sở thích của khách hàng về 3
loại mẫu khác nhau của cùng một mặt hàng Kết quả thu được như
sau:
Mẫu hàng
Ý kiến
A B C
Không thích 35 53 39 Không có ý kiến 22 17 19 Hỏi đối với mặt hàng trên, có sự phân biệt về sở thích của khách
hàng đối với 3 loại mẫu hàng A, B, C hay không với mức ý nghĩa
3%?
Giải Gọi
- X là ý kiến của khách hàng;
- Y là mẫu hàng
Bài toán yêu cầu kiểm định giả thiết sau với mức ý nghĩa α =
3% = 0,03:
H0: X độc lập với Y với giả thiết đối: H1: X không độc lập với Y
Ta lập bảng:
Y
X
Thích 43
11 0,160783
α = α =12 0,07826130 α =13 0,15339142 115
Không thích 35
21 0,096457
α = α22 =0,22118153 α =23 0,11976439 127
Không ý kiến 22
31 0,083448
α = α32 = 0,04982817 α =33 0,06224119 58
Tổng 100 100 100 n=300
trong đó αij được tính theo công thức: ij 2
ij
i j
(n )
m n
α = Cụ thể:
2
115 100
× , (kết quả được ghi chi tiết trong bảng)
Bước 1: Ta có 2
ij
Bước 2: Ta có (h-1)(k-1) = 4 (do h = k = 3) Tra bảng phân
phối chi bình phương χ2∼χ2(4) với 4 bậc tự do, ta được:
0,03 10,7119
α
Bước 3: Kiểm định:
Trang 4Vì χ2=7,6062 < 10,7119 = 2
α
χ nên ta chấp nhận giả thiết H0 Kết luận: Với mức ý nghĩa 3%, không có sự phân biệt về sở thích của khách hàng đối với các loại mẫu hàng
BÀI TẬP
Bài 1 Để khảo sát chiều cao X của một giống cây trồng, người ta
quan sát một mẫu và có kết qủa sau:
X(cm) 95-105 105-115 115-125 125-135 135-145 145-155 155-165 Số cây 10 10 15 30 10 10 15
a) Ước lượng chiều cao trung bình của giống cây trồng trên với độ tin cậy 96% Với độ tin cậy đó, chiều cao trung bình tối đa của giống cây trồng trên là bao nhiêu? Tối thiểu là bao nhiêu?
b) Nếu muốn ước lượng chiều cao trung bình của giống cây trồng trên với độ tin cậy 99% và độ chính xác 4 cm thì cần phải điều tra thêm bao nhiêu cây nữa?
c) Nếu ước lượng chiều cao trung bình của giống cây trồng trên với độ chính xác 4,58cm thì sẽ đạt được độ tin cậy là bao nhiêu? d) Một tài liệu thống kê cũ cho rằng chiều cao trung bình của giống cây trồng trên là 127cm Hãy cho kết luận về tài liệu đó với mức ý nghĩa 1%
e) Những cây trồng có chiều cao từ 135cm trở lên được gọi là những cây “cao” Hãy ước lượng tỉ lệ cây cao với độ tin cậy 95% Với độ tin cậy đó, tỉ lệ cây cao đạt giá trị tối đa là bao nhiêu? Tối thiểu là bao nhiêu?
f) Nếu ước lượng tỉ lệ cây cao với độ chính xác 10% thì sẽ đạt được độ tin cậy là bao nhiêu?
g) Nếu ước lượng tỉ lệ cây cao với độ tin cậy 95% và độ chính xác 11% thì cần phải điều tra thêm bao nhiêu cây nữa?
h) Trước đây, tỉ lệ cây cao của loại cây trồng trên là 40% Các số liệu trên thu thập được sau khi đã áp dụng một kỹ thuật mới Hãy cho kết luận về kỹ thuật mới với mức ý nghĩa 5%
i) Những cây trồng có chiều cao từ 105cm đến 125cm được gọi là những cây loại A Hãy ước lượng chiều cao trung bình của những cây loại A với độ tin cậy 95% (GS X có phân phối chuẩn) j) Bằng phương pháp mới, sau một thời gian người ta thấy chiều cao trung bình của những cây loại A là 119,5cm Hãy cho kết
Trang 5luận về phương pháp mới với mức ý nghĩa 1% (GS X có phân phối chuẩn)
k) Giả sử X có phân phối chuẩn Với độ tin cậy 95%, hãy ước lượng phương sai của X trong hai trường hợp :
α) Biết kỳ vọng của X là 130 cm
β) Chưa biết kỳ vọng của X
l) Khi canh tác bình thường thì phương sai của chiều cao X là 300cm2 Hãy nhận định về tình hình canh tác với mức ý nghĩa 5% (GS X có phân phối chuẩn)
Bài 2 Để nghiên cứu nhu cầu của một loại hàng ở một khu vực,
người ta khảo sát 400 hộ gia đình Kết quả như sau:
Nhu cầu (kg/tháng/hộ) 0-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8
Số hộ 10 35 86 132 78 31 18 10
Cho biết trong khu vực có 4000 hộ
a) Ước lượng nhu cầu trung bình về mặt hàng này của toàn khu vực trong một năm với độ tin cậy 95%
b) Khi ước lượng nhu cầu trung bình về mặt hàng này của toàn khu vực trong một năm, nếu ta muốn đạt được độ tin cậy 99% và độ chính xác là 4,8tấn thì cần khảo sát ở ít nhất bao nhiêu hộ gia đình?
Bài 3 Để khảo sát chỉ tiêu X của một loại sản phẩm của xí nghiệp
I, người ta quan sát một mẫu trong kho và có kết qủa sau:
X(cm) 11-15 15-19 19-23 23-27 27-31 31-35 35-39 Số sphẩm 8 9 20 16 16 13 18
a) Những sản phẩm có chỉ tiêu X từ 19cm trở xuống được gọi là những sản phẩm loại B Hãy ước lượng tỉ lệ sản phẩm loại B với độ tin cậy 92%
b) Giả sử trong kho có 1000 sản phẩm loại B Hãy ước lượng số sản phẩm trong kho với độ tin cậy 92%
c) Giả sử trong kho có 10.000 sản phẩm Hãy ước lượng số sản phẩm loại B có trong kho với độ tin cậy 92%
d) Giả sử trong kho để lẫn 1000 sản phẩm của xí nghiệp II và trong 100 sản phẩm lấy từ kho có 9 sản phẩm của xí nghiệp II Hãy ước lượng số sản phẩm của xí nghiệp I có trong kho với độ tin cậy 82%
Trang 6Bài 4 Trái cây của một chủ hàng được đựng trong các sọt, mỗi sọt
100 trái Người ta kiểm tra 50 sọt thì thấy có 450 trái không đạt tiêu chuẩn
a) Ước lượng tỉ lệ trái không đạt tiêu chuẩn của lô hàng trên với độ tin cậy 95%
b) Nếu muốn ước lượng tỉ lệ trái không đạt tiêu chuẩn với độ chính xác 0,5% thì sẽ đạt được độ tin cậy là bao nhiêu?
c) Nếu muốn ước lượng tỉ lệ trái không đạt tiêu chuẩn với độ chính xác 1% và độ tin cậy 99% thì phải điều tra thêm ít nhất bao nhiêu sọt nữa?
Bài 5 Để biết số lượng cá trong hồ lớn người ta bắt lên 2000 con
đánh dấu xong rồi thả chúng xuống hồ Sau đó người ta bắt lên 400 con và thấy có 80 con được đánh dấu
a) Với độ tin cậy 95%, hãy ước lượng số cá có trong hồ
b) Ước lượng số cá tối đa có trong hồ với độ tin cậy 96%
c) Ước lượng số cá tối thiểu có trong hồ với độ tin cậy 94%
Bài 6 Cho các số liệu như Bài 1
a) Giả sử trung bình tiêu chuẩn của chiều cao X là 125cm Có thể khẳng định rằng việc canh tác làm tăng chiều cao trung bình của giống cây trồng trên với mức ý nghĩa 1% hay không?
b) Giả sử trung bình tiêu chuẩn của chiều cao X là 134cm Có thể khẳng định rằng việc canh tác làm giảm chiều cao trung bình của giống cây trồng trên với mức ý nghĩa 2% hay không?
c) Sau khi áp dụng phương pháp canh tác mới, người ta thấy chiều cao trung bình của các cây loại A là 114cm Hãy kết luận xem phương pháp mới có làm giảm chiều cao trung bình của các cây loại A hay không với mức ý nghĩa 3% (Giả sử X có phân phối chuẩn)
d) Trước đây, chiều cao trung bình của các cây loại A là 120cm Các số liệu trên thu thập được sau khi đã áp dụng một kỹ thuật mới Hãy kết luận xem kỹ thuật mới có làm giảm chiều cao trung bình của các cây loại A hay không với mức ý nghĩa 2% (Giả sử X có phân phối chuẩn)
e) Sau khi áp dụng một phương pháp sản xuất, người ta thấy tỉ lệ các cây loại A là 35% Hãy kết luận xem phương pháp mới có làm tăng tỉ lệ các cây loại A lên hay không với mức ý nghĩa 2%
Trang 7f) Theo tài liệu thống kê, tỉ lệ cây loại A là 20% Hãy xét xem hiện nay việc canh tác có làm tăng tỉ lệ các cây loại A hay không với mức ý nghĩa 5%?
g) Theo tài liệu cũ, phương sai của chiều cao X là 250cm2 Với mức
ý nghĩa 5%, xét xem hiện tại chiều cao của cây trồng có biến động hơn so với trước đây hay không (GS X có phân phối chuẩn)? h) Trước đây, phương sai của chiều cao X là 350cm2 Các số liệu trên thu thập được sau khi đã áp dụng một kỹ thuật mới Với mức ý nghĩa 5%, hãy xét xem kỹ thuật mới có làm chiều cao của giống cây trồng trên ít biến động hơn hay không (GS X có phân phối chuẩn)?
Bài 7 Để khảo sát đường kính của một chi tiết máy người ta kiểm
tra một số sản phẩm của hai nhà máy Trong kết quả sau đây, X là đường kính của chi tiết máy do nhà máy I sản xuất còn Y là đường kính của chi tiết máy do nhà máy II sản xuất Những sản phẩm có chi tiết máy nhỏ hơn 19cm được xếp vào loại C
X(cm) 11-15 15-19 19-23 23-27 27-31 31-35 35-39
Y(cm) 13-16 16-19 19-22 22-25 25-28 28-31 31-34
a) Có thể kết luận rằng đường kính trung bình của một chi tiết máy do hai nhà máy sản xuất bằng nhau hay không với mức ý nghĩa 1%?
b) Có thể cho rằng đường kính trung bình của một chi tiết máy do nhà máy I sản xuất lớn hơn đường kính trung bình của một chi tiết máy do nhà máy II sản xuất hay không với mức ý nghĩa 5%? c) Xét xem đường kính trung bình của một chi tiết máy do nhà máy II sản xuất có nhỏ hơn đường kính trung bình của một chi tiết máy do nhà máy I sản xuất hay không với mức ý nghĩa 2%? d) Với mức ý nghĩa 4%, tỉ lệ sản phẩm loại C do hai nhà máy sản xuất có như nhau không?
e) Với mức ý nghĩa 3%, có thể cho rằng tỉ lệ sản phẩm loại C do nhà máy I sản xuất lớn hơn tỉ lệ sản phẩm loại C do nhà máy
II sản xuất hay không?
Trang 8f) Hãy nhận xét về ý kiến cho rằng tỉ lệ sản phẩm loại C do nhà máy II sản xuất nhỏ hơn tỉ lệ sản phẩm loại C do nhà máy thứ
I sản xuất với mức ý nghĩa 5%?
Bài 8 Sản phẩm sản xuất ra trên một dây chuyền tự động được
đóng gói theo qui cách 3 sản phẩm/hộp Với mức ý nghĩa 1%, hãy xét xem số sản phẩm loại I có trong mỗi hộp có phải là ĐLNN có phân phối nhị thức hay không Biết rằng khi kiểm tra 100 hộp người ta thấy có 75 hộp có 3 sản phẩm loại I, 20 hộp có 2 sản phẩm loại I; 5 hộp có 1 sản phẩm loại I
Bài 9 Qua sát trong một số ngày về số tai nạn giao thông X xảy
mỗi ngày ở một thành phố ta được số liệu sau:
Số tai nạn X 0 1 2 3 4 ≥ 5 Số ngày 10 32 46 35 20 13 Với mức ý nghĩa 1%, có thể xem số tai nạn giao thông xảy mỗi ngày ở thành phố trên là ĐLNN có phân phối Poisson được hay không?
Bài 10 Quan sát năng suất X của một giống lúa thử nghiệm trên
100 thửa ruộng ta có kết quả sau:
Năng suất (tấn/ha) 8-9 9-10 10-11 11-12 12-13 13-14 14-15
Với mức ý nghĩa 5% có thể xem năng suất X là ĐLNN có phân phối chuẩn hay không?
Bài 11 Bảng số liệu điều tra về tình hình học tập của 10.000 sinh
viên của một trường đại học như sau:
Giỏi Khá Trung bình và kém
Với mức ý nghĩa 5%, xét xem có sự khác biệt về chất lượng học tập của nam và nữ hay không
Trang 9ĐÁP SỐ
Bài 1 1a) 127,2447cm - 134,7553cm; 134,1902cm; 127,8098cm
1d) |z| = 2,1942 < 2,58 = zα : Tài liệu cũ còn phù hợp
1e) 25,65% - 44,35%; 42,87%; 27,13%
1h) |z| = 1,0206 < 1,96 = zα : Làm thay đổi tỉ lệ cây cao
1i) 113,936cm - 118,064cm
1j) |z| = 3,5 > 2,492 = tαk: Làm thay đổi chiều cao trung bình của cây loại A, theo hướng tăng
1kα) 254,7082(cm2) - 444,6121(cm2)
1kβ) 253,9354(cm2) - 443,2631(cm2)
1l) 2
1
2
74,222
α
−
2
129,56 = χα: Bình thường
Bài 2 2a) 166,9584tấn - 180,5616tấn 2b) 1392
Bài 3 3a) 10,43% - 23,57% 4b) 4261-9587 4c) 1043- 2357
3d) 6795 - 18342
Bài 4 4a) 8,21% - 9,79% 4b) 79,5% 4c) 5
Bài 5 5a) 8362 - 12437 5b) 12121 5c) 8651
Bài 6 6a) z = 3,2913 > 2,33 = z2α : Tăng chiều cao trung bình
6b) –z = 1,6457 < 2,06 = z2α : Không làm giảm chiều cao TB
6c) z = 2 > 1,974 = t2α: Làm giảm chiều cao trung bình cây loại A
6d) –z = 4 > 2,1715 = t2α: Làm giảm chiều cao TB cây loại A
6e) –z= 2,0966 > 2,06 = z2α Làm tăng tỉ lệ cây loại A
6f) z = 1,25 < 1,65 = z2α Không làm tăng tỉ lệ cây loại A
6g) χ2 = 131,5995 ≤ 124,3 = χ2α: Chiều cao biến động hơn
6h) χ2 = 93,9996 ≤ 77,93= χ12−α: Chiều cao không ít biến động hơn
Bài 7 7a) |z| = 1,7188 < 2,58 = zα : Bằng nhau
7b) z = 1,7188 > 1,65 = z2α : Của nhà máy I sản xuất lớn hơn
7c) z =1,7188 < 2,06 = z2α: Không thể xem của nhà máy II nhỏ hơn
7d)|z| = 1,6942 < 2,06 = zα : Như nhau
7e) z = 1,6942 < 1,88 = z2α : Của nhà máy I lớn hơn
7f) z = 1,6942 > 1,65 = z2α : Của nhà máy II nhỏ hơn
0,01
χ = < χ = : X có PP nhị thức X ∼ B(3 ; 0,9)
Bài 9. χ2 =17,968 > χ0,052 = 9,49: X không có phân phối Poisson
0,05
χ = > χ = : X không có phân phối chuẩn
0,05
χ = > χ = : Có sự khác biệt
-