D. Công th c tính xác su tứ ấ
4.1.5 Kiểm định giả thiêt thông kê
Bài toán kiểm nghiệm gi thiêt th ng kê t ng quáả ố ổ t đượ đặt dước i dạng sau: i. Cho i l ng ng u nhiên X và mđạ ượ ẫ ột giả thiết H v0 ề ân ph i xác suph ố ất
của X. M t mộ ệnh đề khác v i H ớ 0đưuọc gọi là đói thiết H1. Cần kiểm nghiệm xem H dúng hay sao trên c s m0 ở ở ẫu lấy được là (𝑋1, 𝑋2, … , 𝑋𝑛) Trên không gian mẫu ta xác định miền W g i là ọ miền bác b ỏgiả thiêt H , ph n bù 0 ầ
của W ký hiệu là 𝑊 là miền ch p nh n gi thiêt H . ấ ậ ả 0
Mẫu đã l y ấ được (𝑥1, 𝑥2, … , 𝑥𝑛) là một điểm xác định c a ông gian m u. ủ kh ẫ
Mẫu đã l y ấ được (𝑥1, 𝑥2, … , 𝑥𝑛) ∈ 𝑤 ì ta coi gi thiêt H là sai và bác b th ả 0 ỏgiả thiết
đó.
Mẫu đã l y ấ được (𝑥1, 𝑥2, … , 𝑥𝑛) ∈ 𝑊 ì ta coi gi thiêt H là ng và th ả 0 đú chấp nhận giả thiet đó
ii. Các lo i sai l m: Trong vi c ch n mạ ầ ệ ọ ột quy tắc có thể mắc cá sai lc ầm Sai l m lo i I: Bác b ầ ạ ỏgiả thuy t H ế 0nhưng thự ếc t H0 là đúng. Sai l m n ầ ày
được c trđặ ưng b i ở 𝑃 = (𝑊
𝐻0)
Sai l m lo i II: Ch p nh n gi thuyầ ạ ấ ậ ả ết H 0nhưng thực tế H là sai. Sai l0 ầm này
được c trđặ ưng b i ở P=(𝑊𝐻1)
Quyết định bác b hay ỏ chấp nh n gi thuy t hoàn toàn d a vào thông tin m u, do ậ ả ế ự ẫ đó ta sẽ có xác su t m c sai l m lo i I và sai l m lo i II. Ký hiấ ắ ầ ạ ầ ạ ệu α l xác suất mắc sai l m lo i I. ầ ạ
Lúc đó α được gọi là mức ý nghĩa. Ký hiệu β l xác suất mắc sai l m loầ ại II.
α = P(sai lầm lo i I) = P(bác b Hạ ỏ 0 | H0 đúng)= P(chấp nh n H | H sai). ậ 0 1
β = P(sai lầm lo i II) = P (ch p nh n H | H sai) = P(ch p nh n Hạ ấ ậ 0 0 ấ ậ 0 | H 1đúng).
+Ví d : ụ
Giả thi t H cho rế 0 ằng:” bệnh nh ân A uống được thuốc B”.
Sai l m lo i 1 dầ ạ ẫn đến vi c ph i i tìm thuôcs ác khi b h nhân uệ ả đ kh ên ống được thuốc B.
Còn sai l m lo i 2 l i dầ ạ ạ ẫn đến k t lu n là cho bế ậ ệnh nhân u ng thu c B trong lúố ố c bệnh nhân không uống được thuốc đó.
iii. Các bước kiểm định giả thiết thống kê
Bước 1: Xác định tham s c n kiố ầ ểm định, đặt giả thuyết v đối thuyết.
Bước 2: Xác định tiêu chu n th ng kê và tính giá tr c a tiêu chu n thẩ ố ị ủ ẩ ống kê đối với giá tr mị ẫu đã cho.
Bước 3: Xác định mi n bác b ề ỏW.
Bước 4: So sánh giá tr c a tiêu chu n th ng kê v i mi n bác b W và k t lu n bác ị ủ ẩ ố ớ ề ỏ ế ậ
bỏ hay ch p nh n gi thuy t Hấ ậ ả ế 0.
4.2 Kiểm định giả thi t tham s ế ố
4.2.1 Kiểm định á kì vgi trị ọng của ân phph ối chu n ẩ
i. Giả s t ng th có trung bình (k v ng) . M u có kích ử ổ ể ỳ ọ μ ẫ thước n, trung bình mẫu 𝑥, ph ng sai mươ ẫu hiệu chỉnh 2. Hãy kiểm định giảthiết H0:μ=μ0 với mức ý nghĩa α A.Trường hợp 1: 2đãbiết, H1:μ≠μ0 Tiêu chu n kiẩ ểm định:𝑍 =𝑋−𝜇0 √𝑛 Ta th y n u gi thuy t H ấ ế ả ế 0 đúng thì thống kê 𝑍0=𝑋−𝜇0 √𝑛 có phân ph i chuố ẩn
N(0; 1), đồng thời X là một ước lượng không ch ch cho . ệ μ
Từ ta có quy t c kiđó ắ ểm định sau :
Tìm 𝑍𝛼 từ h ệthức 2𝛷 𝑍( 𝛼) = 1 − 𝛼
Nếu 𝑍0≤ 𝑍𝛼, thì chấp nhận H. Nếu 𝑍0> 𝑍𝛼 ì bác b H th ỏ
Nếu giá tr ị đó thuộc vào mi n tiêu chu n thì ta bác b ề ẩ ỏgiả thuy t, k t lu n k v ng ế ế ậ ỳ ọ
của bi n X th c s khác ế ự ự μ0. Ngượ ạc li, n u giá trế ịđó nằm trong mi n ề chấp nhận thì ph i k t lu n k v ng c a X không khác mả ế ậ ỳ ọ ủ μ0 ột cách có ý nghĩa.
+Ví d : ụ
Điểm trung bình n m nay c a 100 h c sinh là 5.9 ă ủ ọ điểm toán cuối kì, có lđộ ệch chuẩn là 1.21. Điểm trung bì mnh ới v a ừ thay đổ đểi đạt danh hiệu thi đua c a môn ủ
toán n m ngo là 5.72. V i mă ái ớ ức ý ngh a 1% có ĩ phả đi iểm trung b h n m nay có ìn ă đạt tiêu chu n nẩ ăm ngo ông? ái kh
Giải: Gi ảthiết H0:μ=μ0 =5.72 ( điểm n m naă y bằng năm trước) 2𝛷 𝑍( 𝛼) = 1 − 𝛼 = 1 − 0. => 𝑍01 𝛼= 2.58 𝑍0=|𝑋 − 𝜇 0|√𝑛 =|5.9 − 5.72|1.21 √100 = 1.49
Vì 𝑍0< 𝑍𝛼 nên ch p ấ nhận H 0. Vậy điểm môn toán n m nay không cao h n nă ơ ăm
trước với mức ý ngh a ĩ 1%, nên không đạt được êu chu n nh n danh hi u thi ua. ti ẩ ậ ệ đ
B.Trường hợp 2 2đãbiết, H1:μ>μ0 Tiêu chu n kiẩ ểm định:𝑍 =𝑋−𝜇0 √𝑛 Ta th y n u gi thuy t H ấ ế ả ế 0 đúng thì thống kê 𝑍0=𝑋−𝜇0 √𝑛 có phân ph i chuố ẩn
Từ ta có quy t c kiđó ắ ểm định sau : 𝑃 (𝑋 − 𝜇 0√𝑛 > 𝑍𝛼) = 1 − 𝛼 Tìm 𝑍𝛼 từ h ệthức 2𝛷 𝑍( 𝛼) = 1 − 𝛼 Nếu 𝑍0> 𝑍𝛼 ì th chấp nhận H. C.Trường hợp 3 2đãbiết, H1:μ<μ0 Tiêu chu n kiẩ ểm định:𝑍 =𝑋−𝜇0 √𝑛 Ta th y n u gi thuy t H ấ ế ả ế 0 đúng thì thống kê 𝑍0=𝑋−𝜇0 √𝑛 có phân ph i chuố ẩn
N(0; 1), đồng thời X là một ước lượng không ch ch cho . ệ μ
Từ ta có quy t c kiđó ắ ểm định sau :
𝑃 (𝑋 − 𝜇 0√𝑛 < 𝑍𝛼) = 1 − 𝛼
Tìm 𝑍𝛼 từ h ệthức 2𝛷 𝑍( 𝛼) = 1 − 𝛼 Nếu 𝑍0> 𝑍𝛼 ì bác b H th ỏ
ii. Giả s t ng th có trung bình (kử ổ ể ỳ vọng) μ. Mẫu có kích thước n, trung bình mẫu 𝑥, phương sai mẫu hiệu chỉnh 2 chưa biết. Hãy kiểm định giảthiết H0:μ=μ0 v i mớ ức ý nghĩa α
2 chưabiết, H1:μ≠μ0 Tiêu chu n kiẩ ểm định:𝑇 =𝑋−𝜇0
√𝑛
Ta th y n u gi thuy t H ấ ế ả ế 0 đúng thì thống kê 𝑇0=𝑋−𝜇0
√𝑛 có phân ph i Student ố
T(n-1), đồng thời X là một ước lượng không ch ch cho . ệ μ
Từ ta có quy t c kiđó ắ ểm định sau :
𝑃 (|𝑋 − 𝜇0|√𝑛 ≤ 𝑇𝛼(𝑛 − 1) = 1 − 𝛼)
Tìm 𝑇𝛼 t bừ ảng phân ph i Student ố
Nếu 𝑇0≤ 𝑇𝛼, thì chấp nhận H. Nếu 𝑇0> 𝑇𝛼 ì bác b H th ỏ
+Ví d : ụ
Một vưòn ươm cây gi ng, theo quy ố định khi n cây cao trung bình trên 1m thì ào
đem ra tr ng. ồ Đongẫu nhiên 25 cây, đượ ốc s liệu:
Chiều cao 0.8 0.9 1.0 1.1 1.2 1.3
Số c ây 1 2 9 7 4 2
Với mức ý nghĩa 5%, có thể em cây ra trđ ồng không, g i thi t chi u cao c a câả ế ề ủ y theo lu t phân ph i chuậ ố ẩn.
Giải:
Gọi à chiμ l ều cao trung bình c a câủ y trong vườn. Từ mẫu ta có: H0:μ=μ0 =1 ( ch nêưa n đem cây ra trồng)
-𝑇𝛼= 𝑇0.05(24) = 2.064 -𝑇0=|1.068 |−1
0.122 √25 = 2.787
Vì 𝑇0> 𝑇𝛼 ì bác b H, nên ta k t th ỏ ế luận nên đem c ra trây ồng
B.Trường hợp 2 2 chưabiết, H1:μ>μ0 Tiêu chu n kiẩ ểm định:𝑇 =𝑋−𝜇0 √𝑛 Ta th y n u gi thuy t H ấ ế ả ế 0 đúng thì thống kê 𝑇0=𝑋−𝜇0 √𝑛 có phân ph i Student ố
T(n-1), đồng thời X là một ước lượng không ch ch cho . ệ μ
Từ ta có quy t c kiđó ắ ểm định sau : 𝑃 (𝑋 − 𝜇0√𝑛 > 𝑇𝛼(𝑛 − 1) = 1 − 𝛼) Tìm 𝑇𝛼 t bừ ảng phân ph i Student ố Nếu 𝑇0> 𝑇𝛼, thì chấp nhận H. C.Trường hợp 3 2 chưabiết, H1:μ<μ0 Tiêu chu n kiẩ ểm định:𝑇 =𝑋−𝜇0 √𝑛 Ta th y n u gi thuy t H ấ ế ả ế 0 đúng thì thống kê 𝑇0=𝑋−𝜇0 √𝑛 có phân ph i Student ố
Từ ta có quy t c kiđó ắ ểm định sau :
𝑃 (𝑋 − 𝜇0√𝑛 < 𝑇𝛼(𝑛 − 1) = 1 − 𝛼) Tìm 𝑇𝛼 t bừ ảng phân ph i Student ố
Nếu 𝑇0> 𝑇𝛼, thì bác b H. ỏ
4.2.2 Kiểm định so sánh hai trung bình
Cho hai bi n ngế ẫu nhiên độ ập X v Y, trong đó X có phân phốc l i chuẩn 𝑁(𝜇1; 𝜎12) mẫu kích thước n1,biến Y có phân ph i chuố ẩn 𝑁(𝜇 ; 𝜎2 22) m u kí ẫ ch thước n . Ta có 2 giả thi t Hế 0:𝜇1= 𝜇2, ta có các d ng b toán: ạ ài
i. Trường hợp 𝜎12; 𝜎22 đãbiết: chia th h 3 i thuy t Hàn đố ế 1:μ1>μ2 ;H1:μ1<μ2 ;H1:μ1≠μ2 Ta có quy t c kiắ ểm định như sau: Tìm 𝑍𝛼 từ h ệthức 2𝛷 𝑍( 𝛼) = 1 − 𝛼;Tính th ng kê ố 𝑍𝛼= |𝑋 − 𝑌| √𝜎12 𝑛1+ 𝜎22 𝑛2 Nếu 𝑍0≤ 𝑍𝛼, thì chấp nhận H. Nếu 𝑍0> 𝑍𝛼 ì bác b H th ỏ
ii. Trường h p ợ 𝜎12; 𝜎22chưabiết: chia th h 3 i thuy t Hàn đố ế 1:μ1>μ2 ;H1:μ1<μ2 ;H1:μ1≠μ2 ài toán Behrens Fisher) (B
- Trong th ng kê, bài toán Behrens-ố Fisher, được đặt theo tên của Walter
Behrens v Ronald Fisher, l bi toán ước lượng khoảng thời gian và kiểm
định giả thuyết liên quan đến sự khác biệt gi a giá trữ ị trung bình c a hai ủ
quần th phân b chuể ố ẩn khi phương sai của hai qu n thầ ểkhông được gi ả định là b ng nhau , d a trên hai mằ ự ẫu độc lập.
- Các gi i pháp cho vả ấn đề Behrens-Fisher đã được trình bày sử dụng quan
điểm cổđiển hoặc suy luận Bayes và một trong hai gi i pháp s không hả ẽ ợp lệ v m t hình thề ặ ức được đánh giá theoquan điểm khác. N u vi c xem xét ế ệ
chỉ bịgiới h n trong suy lu n th ng kê cạ ậ ố ổ điển, thì có th tìm ki m các giể ế ải pháp cho vấn đề suy lu n d áp dậ ễ ụng theo nghĩa thự ế, ưu tiên sực t đơn giản
ny hơn bất kỳ sự không chính xác nào trong các câu xác suất tươngứng. Khi yêu cầu độ chính xác c a các mủ ức ý nghĩa của các th nghi m th ng kê, ử ệ ố
có th có yêu c u b sung r ng th t c ph i s d ng tể ầ ổ ằ ủ ụ ả ử ụ ối đa thông tin thống kê trong t p dậ ữ liệu. Ai cũng biế ằt r ng có thểđạt được m t th nghi m chính ộ ử ệ
xác b ng cách lo i bằ ạ ỏ ngẫu nhiên dữ liệ ừ ậu t t p dữ liệ ớn hơn cho đếu l n khi
các kích thước mẫu bằng nhau, tập hợp dữ liệu theo từng cặp và lấy chênh lệch, sau đó sử dụng phân phối Student thông thường để kiểm tra sựđộ
chênh lệch giữa hai k v ng bỳ ọ ằng 0 rõ rng điều này s không ẽ phải là "tối
ưu" theo bất kỳnghĩa no.
- Nhiệm vụ chỉđịnh ước lượng khoảng thời gian cho vấn đề này là một nhiệm vụ mà cách ti p c n theo suy lu n Frenquentist không cung c p gi i pháp ế ậ ậ ấ ả
chính xác, m c dù có s n mặ ẵ ột số phép gần đúng. Các phương pháp tiếp c n ậ
Bayes tiêu chuẩn cũng không đưa ra được câu tr l i có thả ờ ểđược bi u th ể ị dưới dạng các công thức đơn giản, nhưng các phương pháp tính toán hiện
đại của phân tích Bayes cho phép tìm ra các gi i pháp chính xác vả ềcơ bản. giữa phương pháp tiếp cận thường xuyên v Bayes để ước lượng khoảng thời gian.
Ta có quy t c kiắ ểm định như sau: Tìm 𝑇𝛼= 𝑇𝛼/2(𝑛1+ 𝑛2− 2) t b ng phân ph i Student ừ ả ố Tính th ng kê ố 𝑇0= |𝑋−𝑌| √𝜎12𝑛1+𝑛2𝜎22 Nếu 𝑇0≤ 𝑇𝛼, thì chấp nhận H. Nếu 𝑇0> 𝑇𝛼 ì bác b H th ỏ +Ví d : ụ
Có hai ph ng pháp s n ươ ả xuất . Ph ng án 1ươ thử 6 m u thì trung bình c n 2.5 ẫ ầ
nguyên liệu,với phương sai là 0.1. Phương án 2 thử 5 m u thì trung bình c n 3.3 ẫ ầ
nguyên li u , v i ệ ớ phương sai là 195. C n 0. ầ chọn ph ng án nào phù h p, v i mươ ợ ớ ức ý ngh a 0.05? ĩ
Giải: H0:𝜇1= 𝜇2(số trung bình các đơn v nguyên li u c n thi t s n xu t ra ị ệ ầ ế để ả ấ
một s n ph m c a hai ph ng pháp là bả ẩ ủ ươ ằng nhau) -𝑇𝛼= 𝑇0.025(9) = 2.26
-𝑇0= |2.5−3.3|
√0.16+0.1955 = 3.39
Vì 𝑇0> 𝑇𝛼 thì bác b H, nêỏ n số trung bình các đơn vị nguyên li u s n xu t ra ệ để ả ấ
một s n ph m là ông bả ẩ kh ằng nhau
4.2.3 Kiểm định phương sai
A.Kiểm định phương sai (A chi-square test)
i. Phép th ử chi bình phương (Cochran, 1989)có th ể đượ ử ụng đểc s d kiểm
tra xem phương sai của một tập h p có b ng m t giá tr ợ ằ ộ ị xác định hay không. Th nghi m này có th là th nghi m hai phía ho c th nghiử ệ ể ử ệ ặ ử ệm
một phía. ép thPh ử hai ph ía kiểm tra phương án thay thế ằng phương sai r thực nhỏhơn hoặ ớn hơn giá trịc l được ch nh. ỉ đị Phép thử ộ m t phía ch ỉ
kiểm tra theo một hướng. Vi c l a ch n ki m tra hai phía hay m t phía là ệ ự ọ ể ộ
do vấn đề quyết định.
ii. Giả s t ng th có ử ổ ể phân ph i chu n, ph ng sai , M u có kích ố ẩ ươ 2 ẫ thước n, trung bình mẫu n, phương sai mẫu hi u ệ chỉnh s2. Hãy kiểm định giảthiết H0:=0 v i mớ ức ý nghĩ αa Nếu H đúng thì:(Huy, 2019) (𝑛 − 1 𝑆) 2 𝜎12 ~𝝌𝟐(𝒏 − 𝟏) 𝑃 (𝝌𝟐 𝟏−𝜶𝟐(𝒏 − 𝟏) ≤(𝑛 − 1)𝑆𝜎 2 02 ≤ 𝝌𝟐𝜶 𝟐(𝒏 − 𝟏 ) = 𝟏 − 𝜶) Từ ta có quy t c kiđó ắ ểm định: Tìm 𝝌𝟐𝜶 𝟐(𝒏 − 𝟏) và 𝝌𝟐 𝟏−𝜶𝟐(𝒏 − 𝟏) từ b ng phân ph i ả ố 𝝌𝟐 Tính th ng kê ố 𝜒2=(𝑛−1)𝑆𝜎 2 02 Nếu 𝜒2 1−𝛼2< 𝜒2< 𝜒2 𝛼 2 thì ch p nhấ ận H; Nếu 𝜒2 1−𝛼2> 𝜒2ℎ𝑜ặ𝑐𝜒2> 𝜒2 𝛼 2 thì bác b H ỏ +Ví d : ụ
Một ki m tra chi-ể bình phương đã được thực hiện cho t p d ậ ữliệu. Phương sai quan sát được đố ới 100 phép đo đường kính bánh răng l 0,00003969 (đội v lệch chuẩn
là 0,0063). Chúng tôi s ẽkiểm tra gi thuy t r ng v i ân phả ế ỗ ớ ph ối chuẩn v i ớ phương
sai th c b ng 0,01 và mự ằ ức ý ngh a là 5%. ĩ
Giải: G i Họ 0: = 0 =0.01( giả thi t ế phương sai hi n t i bệ ạ ằng phương sai thực) Ta có N-1=99, α=0.05 Cận dưới 𝜒2𝛼 2(𝑛 − 1) = 73 361. ;Cận trên, 𝜒2 1−𝛼2(𝑛 − 1) = 128.422 𝜒2=(𝑛−1)𝑆𝜎 2 02 =99×0.000039690.01 = 0.393
Giá tr ịthống kê kiểm định 0,393 nh ỏ hơn nhiều so với giá tr t i h n thị ớ ạ ấp
hơn, vì vậy chúng tôi bác b ỏgiả thuyết không và k t lu n rế ậ ằng phương sai
không b ng 0,01. ằ
B.So sánh phương sai ( F-test)
Cho hai bi n ngế ẫu nhiên độc lập X v Y, trong đó X có phân phối chuẩn 𝑐ó 𝑝ℎươ𝑛𝑔 𝑠𝑎𝑖 𝜎12 mẫu kích th c n , bi n Y có phân phướ 1 ế ối chuẩn 𝑐ó 𝑝ℎươ𝑛𝑔 𝑠𝑎𝑖 𝜎22 m u kích ẫ thước n . Ta có 2 giả thiết H0:𝜎1= 𝜎2
Xét th ng kê ố : 𝐹 =𝑆12
𝑆22Khi đó thống kê F có phân ph i Fisher v i n -1 và n -1 bố ớ 1 2 ậc tự do, n u gi thuy t H ế ả ế 0l đúng thì: 𝑃(𝑭 > 𝒇𝜶) = 𝜶 Từ ta có quy t c kiđó ắ ểm định: Tìm 𝒇𝜶 𝟐,n1−1,n2−1 và 𝒇𝜶,n1−1,n2−1 và𝒇𝟏−𝜶/𝟐,n1−1,n2−1từ b ng phân ph i ả ố 𝑭 +Ví d : ụ
Kiểm tra F sau đây đã được tạo cho tập dữ liệu. Bộ dữ liệu bao gồm 480 phép đo độ bền gốm cho hai lô v t liậ ệu. Các thống kê tóm tắt cho mỗi lô được hiển thị bên
dưới. ĐỢT 1: SỐLƯỢNG QUAN SÁT = 240 Trung bì = 688,9987 nh Độ lệch chu n = 65,54909 ẩ Đợt 2: SỐLƯỢNG QUAN SÁT = 240 Trung bì = 611.1559 nh Độ lệch chuẩn = 61,85425
Chúng tôi đang kiểm tra giả thuyết r ng rỗ ằng phương sai của hai lô là b ng nhau. ằ
H0: 𝜎12 = 𝜎22 Thống kê thử nghi m: F = 1.123037 ệ Bậc tự do c a tủ ử số: N - 1 = 239; B c t do c1 ậ ự ủa mẫu s : N - 1 = 239 ố 2