Trong quá trình ñi ñến một quyết ñịnh, chúng ta thường dựa vào một qui luật hay một kinh nghiệm nào ñó ñể ñặt ra một giả thiết thống kê; sau ñó, xây dựng những thủ tục, theo ñó, những gi
Trang 11.1 Định nghĩa Một giả thiết thống kê là một khẳng ñịnh về phân phối
của một hoặc nhiều biến ngẫu nhiên Nếu giả thiết thống kê xác ñịnh hoàn toàn
một phân phối, thì nó ñược gọi là một giả thiết thống kê ñơn; trường hợp ngược lại, nó ñược gọi là một giả thiết thống kê hợp
Trong quá trình ñi ñến một quyết ñịnh, chúng ta thường dựa vào một qui luật hay một kinh nghiệm nào ñó ñể ñặt ra một giả thiết thống kê; sau ñó, xây dựng những thủ tục, theo ñó, những giả thiết ñã ñặt ra ñược chấp nhận hay bác bỏ Những thủ tục ñó ñược gọi là những phép kiểm ñịnh (trắc nghiệm) giả thiết thống
kê
Phép kiểm ñịnh thường là phép so sánh giữa hai hay nhiều giá trị Giả thiết ñược ñặt ra ttường ñược gọi là Giả thiết không, ký hiệu Ho Chữ “không” ở ñây
có nghĩa là không có sự khác biệt có ý nghĩa về mặt thống kê giữa các giá trị cần
so sánh Khi bác bỏ Ho, chúng ta sẽ chấp nhận một giả thiết H1 khác, ñược gọi là
giả thiết ñối của Ho
Thí dụ, ñể so sánh hiệu quả ñiều trị của hai loại thuốc A và B ñối với một bệnh X, ñiều tra trên mẫu chúng ta có kết quả tỉ lệ khỏi bệnh p(A) > p(B) Với ý muốn chứng minh hiệu quả của hai loại thuốc trên là khác nhau, chúng ta ñặt giả thiết Ho là “ không có sự khác nhau về hiệu quả ñiều trị của hai loại thuốc A và B
Trang 2Xét mẫu kích thước n (X1, X2, …, Xn) ñược thành lập từ tổng thể X Người
ta chia Im(X1, X2, …, Xn) (còn gọi là không gian mẫu ) thành hai tập con, lần
lượt ñược ký hiệu là W và W* = Im(X1, X2, …, Xn) −−−− W Khi mẫu cụ thể (x1, x2,
…, xn) ñược thực hiện, nếu (x1, x2, …, xn) ∈ W thì giả thiết Ho bị bác bỏ (chấp nhận H1); nếu (x1, x2, …, xn) ∈ W* thì Ho ñược chấp nhận (bác bỏ H1) Tập hợp
W ñược gọi là miền bác bỏ (hay miền tới hạn) của phép kiểm ñịnh Như vậy,
chúng ta có ñịnh nghĩa
1.2 Định nghĩa Một phép kiểm ñịnh (hay trắc nghiệm) một giả thiết
thống kê là một qui tắc, theo ñó, dựa vào một mẫu cụ thể ñược thực hiện, chúng ta
có thể quyết ñịnh chấp nhận hay bác bỏ giả thiết ñang xét
1.3 Định nghĩa Nếu chúng ta bác bỏ giả thiết Ho khi, thực ra, nó phải ñược chấp nhận thì chúng ta ñã mắc phải sai lầm gọi là Sai lầm loại I Nếu chúng ta chấp nhận Ho trong khi, thực ra, nó phải bị bác bỏ thì chúng ta ñã mắc
phải sai lầm gọi là Sai lầm loại II
Xác suất mắc phải sai lầm loại I, thường ký hiệu là α, gọi là Mức ý nghĩa của trắc nghiệm Như vậy, xác suất ñể chấp nhận Ho khi nó ñúng là (1 − α) Nếu ký hiệu β là xác suất mắc phải sai lầm loại II, thì xác suất ñể bác bỏ
Ho khi nó sai là (1 − β), ñược gọi là Năng lực của phép kiểm ñịnh
Như vậy, một báo cáo kết quả so sánh là “ sự khác biệt có ý nghĩa về mặt thống kê ở mức ý nghĩa 5% ” có nghĩa là “giả thiết không” Ho ñã bị bác bỏ với nguy cơ sai lầm là 5% Các bước cơ bản của một phép kiểm ñịnh giả thiết thống kê:
1 Đặt giả thiết không Ho và giả thiết ñối H1,
2 Xác ñịnh mức ý nghĩa α của phép kiểm ñịnh,
3 Với cặp giả thiết và mức ý nghĩa α ñã xác ñịnh, chúng ta thiết lập ñược một Qui luật quyết ñịnh dùng ñể quyết ñịnh chấp nhận hay bác bỏ giả thiết Ho Qui luật này bao gồm việc chọn một thống kê thích hợp ñể dùng cho phép kiểm ñịnh và ñưa ra một giá trị tới hạn ñể so sánh
• Khác với phép kiểm ñịnh một giả thiết với mức ý nghĩa α cho trước, các nhà nghiên cứu thường xác ñịnh mức ý nghĩa nhỏ nhất, tại ñó, “giả thiết không”
Ho bị bác bỏ Từ ñó, người ta có ñịnh nghĩa
1.4 Định nghĩa Trong một phép kiểm ñịnh, mức ý nghĩa nhỏ nhất, tại ñó,
“giả thiết không” Ho có thể bị bác bỏ ñược gọi là giá trị xác suất hay p −−−− giá trị
(p – value) của phép kiểm ñịnh
Trang 3(a) nếu H1 là θ ≠ θo thì trắc nghiệm ñược gọi là hai ñuôi
(b) nếu H1 là θ < θo hay θ > θo thì trắc nghiệm ñược gọi là một ñuôi
2 KIỂM ĐỊNH GIẢ THIẾT VỀ TRUNG BÌNH TỔNG THỂ
Giả sử tổng thể X có phân phối chuẩn, với trung bình µ chưa biết Chúng ta
cần kiểm ñịnh giả thiết
Ho: µ = µo ñối với H1: µ ≠ µo, với mức ý nghĩa α cho trước
Phân biệt hai trường hợp:
C ñược gọi là giá trị tới hạn ( viết tắt là gtth) của trắc nghiệm
Như vậy, trong trường hợp này, gtth = u1−αα α α
α αα α
1 1 2
Với mẫu cụ thể, chúng ta tính ñược giá trị u của U
Trang 4
* H o bị bác bỏ nếu |||| t |||| > gtth
2.3 Chú ý Trong trường hợp cỡ mẫu lớn ( n > 30), không cần giả thiết
tổng thể X có phân phối chuẩn (do Định lý giới hạn trung tâm)
2.4 Thí dụ Công ty ABC muốn sản xuất loại bóng ñèn có tuổi thọ trung
bình µ = 1600 giờ Nếu thời gian dùng ngắn hơn 1600 giờ thì công ty sẽ mất khách hàng; nếu thời gian dùng dài hơn thì chi phí sản xuất tăng lên Để biết xem qui trình sản xuất có tốt không, công ty chọn một mẫu ngẫu nhiên gồm 64 bóng ñèn ñốt thử và thấy tuổi thọ trung bình của chúng là 1570 giờ với ñộ lệch chuẩn là 121 giờ Hãy cho kết luận về qui trình sản xuất ở mức ý nghĩa 5%
Giải.
Gọi X là BNN chỉ tuổi thọ của loại bóng ñèn do công ty ABC sản xuất
Kiểm ñịnh giả thiết:
Ho: µ = µo = 1600 giờ ñối với H1: µ ≠ µo Nếu Ho ñúng thì BNN (X o) 64
Giả thiết Ho là µ = µo, còn H1 là µ > µo hay µ < µo
Cụ thể
2.5.1 Kiểm ñịnh giả thiết:
Ho: µ = µo ñối với H1: µ > µo, với mức ý nghĩa α cho trước
Giá trị tới hạn C ñược xác ñịnh bởi:
P(U > C) = α ⇔ gtth = u1−α ( nếu biết σ ),
Trang 5− α ( nếu không biết σ )
Với mẫu cụ thể, nếu giá trị u hoặc t lớn hơn gtth thì Ho bị bác bỏ
2.5.2 Kiểm ñịnh giả thiết:
Ho: µ = µo ñối với H1: µ < µo, với mức ý nghĩa α cho trước
2.6 Thí dụ Trở lại công ty ABC trong Thí dụ 5.2.4, Công ty tuyên bố
rằng tuổi thọ trung bình của bóng ñèn do họ sản xuất là không dưới 1600 giờ Với mẫu trên, bạn hãy cho kết luận về lời tuyên bố của công ty, ở mức ý nghĩa 4%
Giải.
Kiểm ñịnh giả thiết:
Ho: µ = µo = 1600 giờ; ñối với H1: µ < µo Nếu Ho ñúng thì BNN
Trang 6
Giả sử tổng thể X có phân phối B(p) Với mẫu cỡ n > 30 thoả np ≥ 5 và
n(1 − p) ≥ 5 thì phân phối nhị thức tiệm cận phân phối chuẩn nên có thể dùng trắc nghiệm U
Chúng ta cần kiểm ñịnh giả thiết:
Ho: p = po ñối với H1 là: p ≠ po hay p < po hay p > po Dùng trắc nghiệm U (2 ñuôi hoặc 1 ñuôi), với
Thí dụ Tại một ñịa phương, bệnh B có tỉ lệ 34% Sau một ñợt ñiều trị,
kiểm tra lại trên 100 người, thấy có 24 người bị bệnh B
Hỏi ñợt ñiều trị có thực sự làm giảm tỉ lệ bệnh B ở ñịa phương trên không? ( kết luận ở mức α = 0,05 )
Giải. Gọi p là tỉ lệ bệnh B ở ñịa phương sau ñợt ñiều trị
Kiểm ñịnh giả thiết:
Ho: p = po = 0,34 ñối với H1: p < poGiá trị tỉ lệ bệnh B trên mẫu: p = 0,24
4 SO SÁNH HAI TRUNG BÌNH VỚI HAI MẪU ĐỘC LẬP
Xét hai mẫu (X1, X2, , Xn), ñặc tính X có phân phối chuẩn, với kỳ vọng
µX, ñộ lệch chuẩn σX và mẫu (Y1, Y2, , Ym), ñặc tính Y có phân phối chuẩn, với kỳ vọng µY, ñộ lệch chuẩn σY Giả sử hai mẫu trên ñộc lập nhau Chúng ta muốn kiểm ñịnh xem giữa µX và µY, thể hiện qua x và y, có khác nhau không? Phân biệt 2 trường hợp:
4.1 Trường hợp 1: Biết σσσσX và σσσσ Y
Trang 7Chúng ta ñặt giả thiết không Ho là “sự khác nhau giữa x và y, là không
có ý nghĩa về mặt thống kê”, hay hai mẫu trên ñược rút từ cùng một tổng thể, i.e
µX = µY, và σX = σY Vậy, chúng ta phải có quyết ñịnh giữa hai giả thiết:
=
tuân theo luật phân phối chuẩn N(0, 1)
Thí dụ Người ta cho hai nhóm học sinh, theo thứ tự, ñại diện cho hai trường A và B, làm một bài kiểm tra Nhóm thứ nhất gồm 40 học sinh, có ñiểm trung bình 7,4; nhóm thứ hai gồm 50 học sinh, có ñiểm trung bình 7,8 Dựa vào mẫu trên, có thể kết luận rằng: Điểm trung bình của trường B tốt hơn ñiểm trung bình của trường A không? (kết luận ở mức ý nghĩa 4%) Biết rằng ñiểm số của mỗi học sinh của hai trường A và B có phân phối chuẩn với ñộ lệch chuẩn, theo thứ tự, là 0,8 và 0,7
Giải
Gọi X và Y, theo thứ tự, là biến ngẫu nhiên chỉ ñiểm số của mỗi học sinh
của hai trường A và B thì X ~ N(µX, (0,8)2 ) và Y ~ N(µY, (0,7)2 )
Chúng ta phải có quyết ñịnh giữa hai giả thiết:
Ho: µX = µY và H1: µX < µYNếu Ho ñúng thì BNN
Trang 8tuân theo luật phân phối Student với (n + m − 2) bậc tự do
Trắc nghiệm t ñược sử dụng như trong trường hợp kiểm ñịnh giả thiết về
trung bình
Thí dụ Trong một công ty sản xuất bóng ñèn, người ta muốn kiểm tra sự làm việc của hai phân xưởng A và B Một mẫu gồm n = 10 bóng ñèn của phân xưởng A cho tuổi thọ trung bình 4000 giờ với ñộ lệch chuẩn 200 giờ Một mẫu gồm m = 8 bóng ñèn của phân xưởng B cho tuổi thọ trung bình 4300 giờ với ñộ lệch chuẩn 250 giờ Biết rằng tuổi thọ của mỗi bóng ñèn của haơ phân xưởng A
và B, theo thứ tự, tuân theo luật phân phối chuẩn có cùng phương sai Hãy cho kết luận về sự khác nhau giữa tuổi thọ trung bình của hai loại bóng ñèn trên ở mức ý nghĩa 1%
Giải.
Gọi X và Y lần lượt là BNN chỉ tuổi thọ của bóng ñèn của phân xưởng A
và B Kiểm ñịnh giả thiết:
Ho: µX = µY ñối với H1: µX ≠ µY Nếu Ho ñúng thì BNN
−
=
+ ~ t(10 + 8 −−−− 2)
Trang 910 8 2
X + Y
= + − = 49 843 75 . , ;
10 8
4000 430049843,75 0,225 2,8329
x y s
×+
Vì |t |< gtth nên không thể bác bỏ giả thiết Ho ở mức 1%
Vậy, chúng ta kết luận rằng: Với mức ý nghĩa 1%, sự khác nhau về tuổi thọ trung bình của hai loại bóng ñèn trên là không có ý nghĩa về mặt thống kê
5 SO SÁNH HAI TRUNG BÌNH VỚI DÃY SỐ LIỆU TỪNG CẶP
Phép kiểm ñịnh trên về hiệu hai trung bình nêu trên dựa trên cơ sở hai mẫu ñộc lập Tuy nhiên, trong nhiều trường hợp, hai mẫu ñược chọn như là các giá trị ñược quan sát từng cặp (xi,yi), không ñộc lập; e.g ño huyết áp của mỗi bệnh nhân trước và sau khi ñiều trị bằng một loại thuốc
Trong trường hợp này, ñặt D = X − Y, chúng ta có dãy số liệu trên mẫu tương ứng: di = xi− yi, (i = 1, 2, ., n) ( hiệu giữa hai giá trị của cặp thứ i) Chúng ta trở về trường hợp một mẫu (D1, D2, ., Dn), ñặc tính D và giả thiết không:
Giải
Trang 106 SO SÁNH HAI TỈ LỆ VỚI HAI MẪU LỚN ĐỘC LẬP
Giả sử mẫu (X1, X2, , Xn), ñặc tính X ~ b(p1), có tỉ lệ mẫu P1 và giá trị tỉ
lệ mẫu p1 ; mẫu (Y1, Y2, , Ym), ñặc tính Y ~ b(p2), có tỉ lệ mẫu P2 và giá trị
tỉ lệ mẫu p2 Chúng ta muốn kiểm ñịnh xem sự khác nhau giữa p1 và p2 là có ý nghĩa về mặt thống kê không? Trắc nghiệm U sẽ ñược dùng khi n ≥ 30, m ≥ 30,
1
np ≥ 5, n(1 − p1) ≥ 5, mp2 ≥ 5 và m(1− p2) ≥ 5
Chúng ta ñặt giả thiết không Ho là “ sự khác nhau giữa p1 và p2là không
có ý nghĩa về mặt thống kê ”, i.e hai mẫu trên ñược rút từ cùng một tổng thể có ước lượng tỉ lệ là
Trang 11Thí dụ Để so sánh về tỉ lệ một loại bệnh B ñối với trẻ sơ sinh trai và trẻ sơ
sinh gái, người ta quan sát 100 bé trai thấy có 20 cháu mắc bệnh B; quan sát 120
bé gái thấy có 30 cháu mắc bệnh B, Hỏi tỉ lệ nhiễm bệnh B ñối với bé trai và gái
có như nhau không? ( kết luận với mức ý nghĩa α = 0,01 )
Giải.
Giả sử p 1 và p2 lần lượt là tỉ lệ bệnh B của bé trai và bé gái
Kiểm ñịnh giả thiết:
Ho: p1 = p2 ñối với H1: p1 ≠ p2Nếu Ho ñúng, thì hai mẫu trên ñược xem như rút từ cùng một tổng thể
7 KIỂM ĐỊNH GIẢ THIẾT VỀ PHƯƠNG SAI
Giả sử tổng thể X có phân phối N(µ, σ2), trong ñó σ chưa biết Dựa vào mẫu
cỡ n, chúng ta kiểm ñịnh giả thiết H0: σ2 = σ20 ở mức ý nghĩa α cho trước Nếu H0 ñúng thì biến ngẫu nhiên
Trang 12tuân theo luật phân phối χ 2 (n − 1)
Trắc nghiệm dựa trên phân phối của Y có thể là trắc nghiệm 1 ñuôi hay 2 ñuôi Chúng ta dễ dàng tìm ñược giá trị tới hạn trong mỗi trường hợp
(a) Trường hợp giả thiết ñối là H1: σ 2 < σ20:
gtth = χ2α( n − 1) và H0 bị bác bỏ nếu y < gtth (b) Trường hợp giả thiết ñối là H1: σ 2 > σ20:
Thí dụ Bằng phương pháp cũ, người ta tìm ñược hàm lượng ñạm trong
một loại hạt ñạt mức trung bình là 4,2% với ñộ lệch chuẩn 0,45% Người ta làm với phương pháp mới lặp lại 5 lần với kết quả như sau: 2,3%; 2,4%; 4,0%; 5,5%; 5,8% Hãy cho kết luận về hiệu quả của hai phương pháp trên ở mức ý nghĩa 1%
Giải.
Gọi X là BNN chỉ hàm lượng ñạm trong loại hạt ñang khảo sát
Giá trị trung bình mẫu: x = 4,0%, ñộ lệch chuẩn chuẩn mẫu: s = 1,654% Nếu chỉ so sánh giá trị trung bình thì hiệu quả của hai phương pháp không khác nhau mấy Để ñánh giá hiệu quả của hai phương pháp, chúng ta hãy kiểm ñịnh về phương sai của hai phương pháp Gọi σ2 là phương sai của phương pháp mới, chúng ta kiểm ñịnh giả thiết:
Ho: σ2 = σ02 = (0,45)2 ñối với H1: σ2 > (0,45)2
Trang 13
Nếu Ho ñúng thì biến ngẫu nhiên
22
8 TRẮC NGHIỆM χχχχ2
Trong nhiều trường hợp, các kết quả thu thập ñược trên mẫu thường không hoàn toàn phù hợp với những kết quả tương ứng trên lý thuyết Thí dụ, mặc dù theo lý thuyết, khi chúng ta gieo một ñồng tiền vô tư 100 lần thì sẽ xuất hiện 50 lần mặt sấp và 50 lần mặt ngửa, nhưng thật hiếm khi chúng ta quan sát ñược ñúng kết quả trên
Giả sử với một tổng thể nhất ñịnh, dựa trên một số tiêu chuẩn nào ñó, người
ta chia tổng thể ñó thành nhiều lớp (biến cố ) rời nhau: B1, B2, , Bk, với các xác suất, theo thứ tự, là p1, p2, , pk, với p1+ p2 + + pk = 1
Một mẫu cỡ n ñược thành lập từ tổng thể trên Ký hiệu oi là tần số quan sát ñược trên mẫu của biến cố Bi, i = 1, 2, , k
Giả thiết Ho: Xác suất ñể một phần tử rơi vào một trong các lớp B1, B2, ., Bk, lần lượt là p1, p2, , pk
Giả thiết H1: Phủ ñịnh mệnh ñề trên
Nếu Ho ñúng thì số phần tử kỳ vọng rơi vào một trong các lớp B1, B2,
., Bk , gọi là tần số lý thuyết, lần lượt là:
Trang 14
e1 = np1, e2 = np2, , ek = npkNhư vậy, chúng ta có bảng:
8.1 Định lý Phân phối mẫu của Q2 rất tiệm cận với phân phối χ2 ñịnh bởi:
Bậc tự do ν ñược cho bởi:
a) ν = k − 1 nếu các tần số lý thuyết có thể ñược tính mà không có một sự ước lượng nào từ mẫu
b) ν = k − 1− m nếu các tần số lý thuyết có thể ñược tính nhờ vào
m ước lượng từ mẫu
Trong thực hành, các tần số lý thuyết ñược tính trên cơ sở của giả thiết H0 Nếu với giả thiết này và với mức ý nghĩa α cho trước, giá trị của Q2 lớn hơn 2
Dữ liệu dùng trong trắc nghiệm χ2
thường ñược trình bày dưới dạng bảng Thí dụ như bảng nêu trên gọi là bảng một chiều, bảng 1 × c Mở rộng, chúng ta có
Trang 15
bảng hai chiều dạng h × c, trong ñó, các tần số quan sát ñược viết trong h hàng và
c cột Các báng như thế ñược gọi là các Bảng ngẫu nhiên
Tương ứng với mỗi tần số quan sát trong bảng ngẫu nhiên h × c, có một tần
số lý thuyết ñược tính dựa trên giả thiết không Những tần số trong những ô của
một bảng ngẫu nhiên ñược gọi là những Tần số ô Tổng các tần số theo hàng
hoặc theo cột ñược gọi là Tần số lề
Theo Định lý 6.8.1, phân phối mẫu của BNN Q2 tiệm cận phân phối χ2 với bậc tự do ν, với h > 1 và c > 1, ñược cho bởi:
a) ν = (h − 1)(c − 1) nếu các tần số lý thuyết có thể ñược tính mà không có một sự ước lượng nào từ mẫu
b) ν = (h − 1)(c − 1) − m nếu các tần số lý thuyết có thể ñược tính nhờ vào m ước lượng từ mẫu
8.2 Thí dụ Quan sát khối lượng X (kg) của một nhóm người cùng lứa
tuổi, kết quả ñược ghi lại như sau:
Xi (30, 40] (40, 45] (45, 50] (50, 55] (55, 60] (60, 70]
Có tài liệu cho rằng khối lượng của những người cùng lứa tuổi trên tuân theo luật phân phối chuẩn Tài liệu trên có phù hợp với kết quả quan sát trên mẫu không? ( kết luận ở mức α = 0,05 )
Ước lượng trung bình và phương sai của X bằng các giá trị của trung bình
và phương sai mẫu
Từ mẫu, chúng ta tính ñược: x = 50,075 và s2 = 60,032
Nếu H0 ñúng thì X ~ N(50 ; 60) Khi ñó: