5 Lý thuyết thống kê toán
5.3.1 Kiểm định giả thiết về giá trị trung bình
Giả sử X là biến ngẫu nhiên có phân phối chuẩn X ∼ N(µ, σ2). Tập hợp chính ở đây là tập hợp tất cả các giá trị có thể có của X. Một mẫu có kích thước n là một tập hợp gồm n giá trị x1, . . . , xn thu được từ n quan sát độc lập về X. Ta muốn kiểm định về µ.
+ TH1: Phương sai σ2 đã biết
* Bài toán 1: Ta muốn kiểm định bài toán H0 : µ = µ0/H1 : µ 6= µ0, µ0 là giá trị cho trước.
Chọn test thống kê U = (X −µ0)√ n
σ .
Miền bác bỏ giả thiết Wα = {|U| > c}, c là hằng số phụ thuộc vào mức ý nghĩa α. Nếu H0 đúng (tức là µ = µ0) thì U là biến ngẫu nhiên có phân phối chuẩn tắc. Ta có P(|U| > c) = α ⇔ P(|U| ≤ c) = 1−α ⇔ Φ(c) = 1− α 2 ⇔c = Φ−1(1− α 2), trong đó Φ(x) = √1 2π Rx −∞e−t 2 2dt. Nếu dùng hàm Laplace Φ0(x) = √1 2π Rx 0 e−t 2 2dt thì ta có c = Φ−01(1−α 2 ).
Ví dụ 5.8. Khối lượng quy định cho mỗi gói mỳ là 80g. Kiểm tra bất thường 100 gói sau một ca sản xuất người ta thấy khối lượng trung bình là 78,5g với độ lệch chuẩn mẫu 3,5g. Với mức ý nghĩa α = 0,01, hãy kết luận về chất lượng sản xuất của ca làm việc đó, coi rằng khối lượng gói mỳ có đặc tính chuẩn.
Giải: Bài toán kiểm định giả thiết:
H0 : µ= 80/H1 : µ 6= 80 Ta tính được X = 78,5; µ0 = 80; n = 100, σ = 3,5; α = 0,01. Và: U = (X −µ0)√ n σ = −4,286. Ta có c = Φ−01(1−α 2 ) = Φ −1 0 (1−0,01 2 ) = Φ −1 0 (0,495) = 2,58. Vì |U| > c nên mẫu quan sát thuộc vào miền bác bỏ giả thiết.
Kết luận: Bác bỏ giả thiết H0, tức là khối lượng của gói mỳ có sự thay đổi.
* Bài toán 2: Ta muốn kiểm định bài toán H0 : µ = µ0/H1 : µ > µ0, µ0 là giá trị cho trước.
Chọn test thống kê U = (X −µ0)√ n
σ .
Miền bác bỏ giả thiết Wα = {U > c}, c là hằng số phụ thuộc vào mức ý nghĩa α. Ta có P(U > c) = α ⇔ Φ(c) = 1−α ⇔c = Φ−1(1−α).
Nếu dùng hàm Laplace ta có Φ0(c) = 1
2 −α ⇔ c = Φ−01(1
2 −α).
Ví dụ 5.9. Từ một tập hợp chính có phân bố chuẩn với kỳ vọng µ (chưa biết) và độ lệch chuẩn σ = 40, người ta lấy ra một mẫu gồm 64 quan sát và tính được
x = 136,5.
Với mức ý nghĩa α = 0,01 hãy kiểm định bài toán: H0 : µ = 130/H1 : µ > 130. Giải:
Bài toán kiểm định giả thiết:
H0 : µ = 130/H1 : µ > 130
Ta có X = 136,5; µ0 = 130; n= 64, σ = 40; α = 0,01. Tính được: U = (X −µ0)√
n
Ta có c = Φ−01(1
2 −α) = Φ−01(0,49) = Φ−01(0,49) = 2,33. Vì U > c nên mẫu quan sát thuộc vào miền bác bỏ giả thiết. Kết luận: Bác bỏ giả thiết H0.
* Bài toán 3: Ta muốn kiểm định bài toán H0 : µ = µ0/H1 : µ < µ0, µ0 là giá trị cho trước.
Chọn test thống kê U = (µ0 −X)√ n
σ .
Miền bác bỏ giả thiết Wα = {U > c}, c là hằng số phụ thuộc vào mức ý nghĩa α. Ta có P(U > c) = α ⇔ Φ(c) = 1−α ⇔c = Φ−1(1−α).
Nếu dùng hàm Laplace ta có Φ0(c) = 1
2 −α ⇔ c = Φ−01(1
2 −α).
Ví dụ 5.10. Từ một tập hợp chính có phân bố chuẩn với kỳ vọng µ (chưa biết) và độ lệch chuẩn σ = 0,4, người ta lấy ra một mẫu gồm 100 quan sát và tính được
x = 31,9.
Với mức ý nghĩa α = 0,01 hãy kiểm định bài toán: H0 : µ = 32/H1 : µ < 32. Giải:
Bài toán kiểm định giả thiết:
H0 : µ= 32/H1 : µ < 32 Ta có X = 31,9; µ0 = 32; n= 100, σ = 0,4; α = 0,01. Tính được U = (µ0 −X)√ n σ = 2,5. Và c = Φ−1(1−α) = Φ−01(1 2 −α) = Φ−01(0,49) = Φ−01(0,49) = 2,33. Vì U > c nên mẫu quan sát thuộc vào miền bác bỏ giả thiết.
Kết luận: Bác bỏ giả thiết H0.
+ TH2: Phương sai σ2 chưa biết, n ≥30
Trong trường hợp này ta vẫn dùng test thống kê như trên trong đó độ lệch chuẩn σ được thay bằng độ lệch tiêu chuẩn mẫu hiệu chỉnh. Theo định lý giới hạn trung tâm thống kê U có phân bố xấp xỉ chuẩn dù tập hợp chính có phân bố như thế nào không nhất thiết là phân bố chuẩn.
+ TH3: Phương sai σ2 chưa biết, n < 30, và X có phân phối chuẩn Xét thống kê U = (X −µ0)√
n
σ , U sẽ có phân phối Student với (n−1) bậc tự do. * Bài toán 1: Ta muốn kiểm định bài toán H0 : µ = µ0/H1 : µ 6= µ0, µ0 là giá trị cho trước.
Xét thống kê U = (X −µ0)√ n
σ .
Miền bác bỏ giả thiết
Wα = {|U| > c}, trong đó c = tn−1; α
2.
* Bài toán 2: Ta muốn kiểm định bài toán H0 : µ = µ0/H1 : µ > µ0. Xét thống kê U = (X −µ0)√
n
σ .
Miền bác bỏ giả thiết
Wα = {U > c}, trong đó c = tn−1; α.
* Bài toán 3: Ta muốn kiểm định bài toán H0 : µ = µ0/H1 : µ < µ0. Xét thống kê U = (µ0 −X)√
n
σ .
Miền bác bỏ giả thiết
Wα = {U > c}, trong đó c = tn−1; α.
Ví dụ 5.11. Một nhóm nghiên cứu cho rằng trung bình một người vào siêu thị Prime tiêu hết 550.000đ. Chọn ngẫu nhiên 20 người mua hàng ta tính được số tiền trung bình họ tiêu là 635.000đ với độ lệch tiêu chuẩn là 95.000đ. Với mức ý nghĩa 0,02 hãy kiểm định xem công bố của nhóm nghiên cứu có đúng hay không?
Giải: Bài toán kiểm định giả thiết
H0 :µ = 550/H1 : µ 6= 550. Ta có X = 635; µ0 = 550; n= 20, σ = 95; α = 0,02. Tính được U = (µ0 −X)√ n σ = −6,33. Và c = tn−1; α 2 = t19; 0.02 2 = 2,54.
Vì |U| > c nên mẫu quan sát thuộc vào miền bác bỏ giả thiết. Kết luận: Bác bỏ giả thiết H0.
Ví dụ 5.12. Năng suất trung bình của giống lúa Tám thơm được công bố là 55 tạ/ha. Một nhóm gồm 25 thửa ruộng thí nghiệm được kiểm tra cho thấy năng suất trung bình của nhóm là 61 tạ/ha với độ lệch chuẩn là 10 tạ/ha. Với mức ý nghĩa
α = 5%, nhận định xem có phải công bố là thấp hơn so với sự thật không?
Giải: Bài toán kiểm định giả thiết:
H0 : µ= 55/H1 : µ > 55 Ta có X = 61; µ0 = 55; n= 60, σ = 10; α = 0,05. Tính được U = (X −µ0)√ n σ = 4,65. Và c = tn−1; α = t24; 0,05 = 1,71.
Vì U > c nên mẫu quan sát thuộc vào miền bác bỏ giả thiết. Kết luận: Bác bỏ giả thiết H0.
Ví dụ 5.13. Một loại dây cáp được đánh giá là có thể treo được vật nặng trung bình là 1800kg không đứt. Người ta đem thử một mẫu gồm 16 dây cáp trên và kết quả cho thấy vật nặng trung bình dây cáp treo được là 1700kg với độ lệch tiêu chuẩn là 60kg. Với mức ý nghĩa α = 0,05 nhận định xem sự đánh giá có phải là quá cao.
Giải: Bài toán kiểm định giả thiết:
H0 : µ= 1800/H1 : µ < 1800 Ta có X = 1700; µ0 = 1800; n= 16, σ = 60; α = 0,05. Tính được U = (µ0 −X)√ n σ = 6,67. Và c = t24; α = t24; 0,05 = 1,71.
Vì U > c nên mẫu quan sát thuộc vào miền bác bỏ giả thiết. Kết luận: Bác bỏ giả thiết H0.
Tiết 39 5.3.2 Kiểm định giả thiết về phương sai
Giả sử X là biến ngẫu nhiên có phân phối chuẩn X ∼ N(µ, σ2). Tập hợp chính ở đây là tập hợp tất cả các giá trị có thể có của X. Một mẫu có kích thước n là
một tập hợp gồm n giá trị x1, . . . , xn thu được từ n quan sát độc lập về X. Ta muốn kiểm định về σ2.
Chọn thống kê G= (n−1)Sb2
σ02
Nếu giả thiết H0 đúng thì thống kê G có phân phối χ2n−1.
* Bài toán 1 : Kiểm định bài toán H0 : σ2 = σ02/H1 : σ2 6= σ02, σ02 là giá trị cho trước.
Miền bác bỏ giả thiết Wα = {G < χ2
n−1,α2 hoặc G > χ2n−1,1−α 2}.
* Bài toán 2 : Kiểm định bài toán H0 : σ2 = σ02/H1 : σ2 > σ02, σ02 là giá trị cho trước.
Miền bác bỏ giả thiết Wα = {G > χ2
n−1,1−α}.
* Bài toán 3 : Kiểm định bài toán H0 : σ2 = σ02/H1 : σ2 < σ02, σ02 là giá trị cho trước.
Miền bác bỏ giả thiết Wα = {G < χ2
n−1,α}. Chú ý: Nếu thay thế (n−1)Sb2 = n P i=1
(xi −µ0)2, trong đó µ0 = EX đã cho vào thống kê G thì thống kê G sẽ tuân theo luật phân phối khi bình phương với n bậc tự do. Và ta cũng có cách làm tương tự.
Ví dụ 5.14. Để kiểm tra độ chính xác của một máy người ta đo ngẫu nhiên kích thước của 25 chi tiết do máy đó sản xuất và tính được sb2 = 14,6. Với mức ý nghĩa
α = 0,01, hãy cho kết luận xem máy móc có hoạt động bình thường không, biết rằng kích thước chi tiết là biến ngẫu nhiên có phân phối chuẩn có dung sai theo thiết kế là σ2 = 12.
Giải:
Bài toán kiểm định giả thiết: H0 :σ2 = 12/H1 : σ2 6= 12. Trong đó σ02 = 12; α = 0,01; n = 25; sb2 = 14,6. Ta tính được: G= (n−1)Sb2 σ02 = 29,2. Và χ2n−1,1−α 2 = χ224;0,995 = 10,9;χ2n−1,α 2 = χ224;0,005 = 44,3. Mẫu quan sát không thuộc miền bác bỏ giả thiết.
Kết luận: Chấp nhận giả thiết.
của sai số (giả sử nó tuân theo luật chuẩn) là 5mm. Kiểm tra ngẫu nhiên một mẫu gồm 19 thiết bị đo thì thấy Sb2 = 33mm2. Với α = 0,05 có thể kết luận gì về ý kiến của chủ hãng? Giải: Ta chọn H0 :σ2 = 25/H1 : σ2 6= 25, hoặc H1 : σ2 > 25. Tính được: G = (n−1)Sb2 σ20 = 18,33 25 = 23,76.
+ Nếu đối thiết H1 : σ2 6= 25 thì miền bác bỏ là: Wα = {G < χ2 n−1,α 2 hoặc G > χ2n−1,1−α 2}. Do α = 0,05 nên χ2n−1,α 2 = χ218;0,025 = 8,2; χ2n−1,1−α 2 = χ218;0,95 = 31,5.
Vì G = 23,76 ∈/ Wα (không thuộc vào miền bác bỏ giả thiết) nên tạm thời chấp nhận giả thiết H0 để chờ có thêm thông tin mới.
+Nếu đối thiết H1 : σ2 > 25 thì χ21−α = χ20,95 = 28,9. Vì G= 23,76 ∈/ Wα nên tạm thời chấp nhận giả thiết.
Như vậy trong cả hai trường hợp ý kiến của chủ hãng đều có thể chấp nhận được. Ví dụ 5.16. Thử độ chịu lực của 35 chốt khoá thì thấy độ lệch chuẩn mẫu hiệu chỉnh là 2,9 pound (1pound=450g). Có thể cho rằng bảo đảm của người sản xuất là độ lệch chuẩn thật bằng 3 pound được không? Với mức ý nghĩa α = 0,01, hãy cho kết luận?
Giải:
Bài toán kiểm định giả thiết: H0 :σ2 = 32/H1 : σ2 6= 32. Ta tính thống kê G = (n−1)Sb2 σ02 = 34.2,92 32 = 31,77. Do α = 0,01 nên χ2n−1,α 2 = χ234;0,005 = 16,5; χ2n−1,1−α 2 = χ234;0,995 = 58,96. Vì G= 31,77 ∈/ Wα nên tạm thời chấp nhận giả thiết H0.
Dựa vào dữ liệu bài toán ta cũng có thể xét bài toán kiểm định giả thiết sau: H0 : σ2 = 32/H1 : σ2 < 32.
Tương tự như bài toán trên ta cũng có G = (n−1)Sb2 σ2 0 = 34.2,9 2 32 = 31,77.
Do α = 0,01 nên χ2n−1,1−α = χ234,0,99 = 56,06. Vì G /∈ Wα nên tạm thời chấp nhận giả thiết H0.
Tiết 40 5.3.3 Kiểm định giả thiết về tỷ lệ
Xét phép thử ngẫu nhiên C và biến cố A liên quan đến phép thử. Tiến hành phép thử n lần một cách độc lập và quan sát thấy biến cố A xuất hiện k lần.Giả sử tỷ lệ các phần tử mang một dấu hiệu A nào đó trong một tổng thể là p (chưa biết). Tần suất f = k
n cho ta hình ảnh xấp xỉ của p. Ta muốn kiểm định giả thiết p = p0, trong đó p0 là một số đã cho.
* Bài toán 1: Kiểm định bài toán H0 : p= p0/H1 :p 6= p0 Chọn thống kê T = (f −p)√
n
p
p(1−p).
Một cách hợp lý là ta sẽ bác bỏ giả thiết H0 khi |T| lớn một cách có ý nghĩa. Người ta chứng minh được rằng nếu n lớn (np0 ≥ 5;n(1−p0) ≥ 5) thì f có phân phối xấp xỉ chuẩn với kì vọng Ef = p0 và phương sai Df =
r
p0(1−p0)
n . Nên khi đó T sẽ có phân phối chuẩn tắc.
Miền bác bỏ giả thiết Wα = {|T| > c}, clà một hằng số phụ thuộc mức ý nghĩa α. Ta có P(|T| > c) =α ⇔Φ(c) = 1− α 2 ⇔ c = Φ−1(1− α 2) hay c = Φ −1 0 (1−α 2 ).
Ví dụ 5.17. Một đảng chính trị trong một cuộc bầu cử tổng thống ở Mỹ tuyên bố rằng 45% cử tri sẽ bỏ phiếu cho ứng cử viên A của họ. Chọn ngẫu nhiên 200 cử tri để thăm dò ý kiến cho thấy 80 người trong số đó sẽ bỏ phiếu cho ông A.
Với mức ý nghĩa α = 5%, hãy kiểm định xem dự đoán của đảng trên có đúng hay không?
Giải: Bài toán kiểm định giả thiết
H0 : p = 0,45/H1 : p 6= 0,45
Ta có f = 80
200 = 0,4.
Ta tính được T = (f −p0)√ n p p0(1−p0) = (0,4−0,45)√ 200 √ 0,45.0,55 = −1,43. Với mức α = 0,05 thì c = Φ−01(1−α 2 ) = Φ −1 0 (0,475) = 1,96. Do |T| = 1,43 < 1,96 = c nên chưa có cơ sở để bác bỏ H0.
Kết luận: Chấp nhận giả thiết H0 nghĩa là dự đoán của đảng trên có thể đúng. * Bài toán 2: Kiểm định bài toán H0 : p= p0/H1 :p > p0
Chọn thống kê T = (f −p)√ n
p
p(1−p).
Miền bác bỏ giả thiết Wα = {T > c}, c là một hằng số phụ thuộc mức ý nghĩa α. Ta có P(T > c) =α ⇔Φ(c) = 1−α ⇔c = Φ−1(1−α) hay c = Φ−01(1
2 −α). Ví dụ 5.18. Một báo cáo nói rằng 18% sinh viên ở một trường đại học nọ có máy tính laptop. Để kiểm tra người ta chọn ngẫu nhiên 80 em trong trường đó để kiểm tra và thấy có 22 sinh viên có máy tính laptop. Với mức ý nghĩa α = 0,02 hãy kiểm định xem liệu trong số các sinh viên ở trường tỷ lệ các sinh viên có máy tính laptop có cao hơn tỷ lệ chung hay không?
Giải:
Ta cần kiểm định bài toán sau đây: H0 :p = 0,18/H1 :p > 0,18. Ta có np0 = 80.0,18 = 14,4> 5; n(1−p0) = 80.0,82 = 65,6 > 5. Và f = 22 80 = 0,275. Ta tính được T = (f −p0)√ n p p0(1−p0) = (0,275−0,18)√ 80 0,18.0,82 = 2,211. Do mức ý nghĩa α = 0,02 nên c = Φ−01(1 2 −α) = 2,05. Vậy T > c do đó ta bác bỏ giả thiết H0.
Kết luận: Trong số các sinh viên ở trường, tỷ lệ sinh viên có máy tính laptop lớn hơn tỷ lệ chung.
* Bài toán 3: Kiểm định bài toán H0 : p= p0/H1 :p < p0 Chọn thống kê T = (p−f)√
n
p
Miền bác bỏ giả thiết Wα = {T > c}, c là một hằng số phụ thuộc mức ý nghĩa α. Ta có P(T > c) =α ⇔Φ(c) = 1−α ⇔c = Φ−1(1−α) hay c = Φ−01(1
2 −α). Ví dụ 5.19. Một công ty sản xuất kem (Merino) tuyên bố rằng 3
4 số trẻ em thích