Miền bác bỏ giả thuyếtKhi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó đượcchia thành 2 tập hợp không giao nhau: Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đógi
Trang 1Chương 8: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
CÁC KHÁI NIỆM
KIỂM ĐỊNH THAM SỐ
KIỂM ĐỊNH PHI THAM SỐ
Trang 2CÁC KHÁI NIỆM
Giả thuyết thống kêTiêu chuẩn kiểm địnhMiền bác bỏ giả thuyếtQuy tắc kiểm định giả thuyếtCác sai lầm mắc phải
Thủ tục kiểm định giả thuyết
Trang 3CÁC KHÁI NIỆM
Giả thuyết thống kê
Tiêu chuẩn kiểm định
Miền bác bỏ giả thuyếtQuy tắc kiểm định giả thuyếtCác sai lầm mắc phải
Thủ tục kiểm định giả thuyết
Trang 4Giả thuyết thống kê
Định nghĩa
Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất củabiến ngẫu nhiên về các tham số đặc trưng của biến ngẫu nhiênhoặc về tính độc lập của các biến ngẫu nhiên
Giả thuyết thống kê được ký hiệu là H0
Ví dụ
Khi nghiên cứu nhu cầu thị trường X về một loại hàng hóa nào đó,
ta có thể có các giả thuyết:
H0: X phân phối chuẩn
H0: Nhu cầu trung bình µ = 50 tấn/tháng
H0: Nhu cầu X và giá Y là độc lập
Trang 5Giả thuyết thống kê
Định nghĩa
Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất của
biến ngẫu nhiên về các tham số đặc trưng của biến ngẫu nhiên
hoặc về tính độc lập của các biến ngẫu nhiên
Giả thuyết thống kê được ký hiệu là H0
Ví dụ
Khi nghiên cứu nhu cầu thị trường X về một loại hàng hóa nào đó,
ta có thể có các giả thuyết:
H0: X phân phối chuẩn
H0: Nhu cầu trung bình µ = 50 tấn/tháng
H0: Nhu cầu X và giá Y là độc lập
Trang 6Giả thuyết thống kê
Định nghĩa
Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất củabiến ngẫu nhiên về các tham số đặc trưng của biến ngẫu nhiênhoặc về tính độc lập của các biến ngẫu nhiên
Giả thuyết thống kê được ký hiệu là H0
Ví dụ
Khi nghiên cứu nhu cầu thị trường X về một loại hàng hóa nào đó,
ta có thể có các giả thuyết:
H0: X phân phối chuẩn
H0: Nhu cầu trung bình µ = 50 tấn/tháng
H0: Nhu cầu X và giá Y là độc lập
Trang 7Giả thuyết thống kê
Ứng với mỗi giả thuyết gốc H0, luôn tồn tại một mệnh đề đối lập,
gọi là giả thuyết đối, ký hiệu H1 H0 và H1 tạo nên một cặp giả
thuyết thống kê
Ví dụ
Tiếp ví dụ 1 ta có giả thuyết đối của từng H0 tương ứng:
H1: X không phân phối chuẩn
H1: µ > 50; H1: µ < 50; H1: µ 6= 50
H1: X và Y phụ thuộc
Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểmđịnh, tức là tìm ra kết luận về tính thừa nhận được hay khôngthừa nhận được của giả thuyết đó
Trang 8Giả thuyết thống kê
Ứng với mỗi giả thuyết gốc H0, luôn tồn tại một mệnh đề đối lập,
gọi là giả thuyết đối, ký hiệu H1 H0 và H1 tạo nên một cặp giả
thuyết thống kê
Ví dụ
Tiếp ví dụ 1 ta có giả thuyết đối của từng H0 tương ứng:
H1: X không phân phối chuẩn
H1: µ > 50; H1: µ < 50; H1: µ 6= 50
H1: X và Y phụ thuộc
Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểmđịnh, tức là tìm ra kết luận về tính thừa nhận được hay khôngthừa nhận được của giả thuyết đó
Trang 9Giả thuyết thống kê
Ứng với mỗi giả thuyết gốc H0, luôn tồn tại một mệnh đề đối lập,gọi là giả thuyết đối, ký hiệu H1 H0 và H1 tạo nên một cặp giảthuyết thống kê
Ví dụ
Tiếp ví dụ 1 ta có giả thuyết đối của từng H0 tương ứng:
H1: X không phân phối chuẩn
H1: µ > 50; H1: µ < 50; H1: µ 6= 50
H1: X và Y phụ thuộc
Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểmđịnh, tức là tìm ra kết luận về tính thừa nhận được hay khôngthừa nhận được của giả thuyết đó
Trang 10Tiêu chuẩn kiểm định
Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫungẫu nhiên: W = (X1, X2, , Xn) và chọn lập thống kê:
G = f (X1, X2, , Xn, θ0)trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G
có quy luật phân phối xác suất xác định nếu H0 đúng
G được gọi là tiêu chuẩn kiểm định giả thuyết
Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thểđược gọi là giá trị quan sát của tiêu chuẩn kiểm định
Gqs = f (x1, x2, , xn, θ0)
Trang 11Tiêu chuẩn kiểm định
Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫu
ngẫu nhiên: W = (X1, X2, , Xn) và chọn lập thống kê:
G = f (X1, X2, , Xn, θ0)trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G
có quy luật phân phối xác suất xác định nếu H0 đúng
G được gọi là tiêu chuẩn kiểm định giả thuyết
Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thểđược gọi là giá trị quan sát của tiêu chuẩn kiểm định
Gqs = f (x1, x2, , xn, θ0)
Trang 12Tiêu chuẩn kiểm định
Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫu
ngẫu nhiên: W = (X1, X2, , Xn) và chọn lập thống kê:
G = f (X1, X2, , Xn, θ0)trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G
có quy luật phân phối xác suất xác định nếu H0 đúng
G được gọi là tiêu chuẩn kiểm định giả thuyết
Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thểđược gọi là giá trị quan sát của tiêu chuẩn kiểm định
Gqs = f (x1, x2, , xn, θ0)
Trang 13Tiêu chuẩn kiểm định
Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫungẫu nhiên: W = (X1, X2, , Xn) và chọn lập thống kê:
G = f (X1, X2, , Xn, θ0)trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G
có quy luật phân phối xác suất xác định nếu H0 đúng
G được gọi là tiêu chuẩn kiểm định giả thuyết
Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thểđược gọi là giá trị quan sát của tiêu chuẩn kiểm định
Gqs = f (x1, x2, , xn, θ0)
Trang 14Miền bác bỏ giả thuyết
Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó đượcchia thành 2 tập hợp không giao nhau:
Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đógiả thuyết H0 bị bác bỏ
Miền không bác bỏ giả thuyết, ¯Wα, bao gồm các giá trị của Gtại đó giả thuyết H0 không bị bác bỏ
Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát
từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm đượcmiền Wα sao cho: P(G ∈ Wα/H0) = α
Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wαbằng α
α được gọi là mức ý nghĩa của kiểm định
Trang 15Miền bác bỏ giả thuyết
Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được
chia thành 2 tập hợp không giao nhau:
Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đógiả thuyết H0 bị bác bỏ
Miền không bác bỏ giả thuyết, ¯Wα, bao gồm các giá trị của Gtại đó giả thuyết H0 không bị bác bỏ
Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát
từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm đượcmiền Wα sao cho: P(G ∈ Wα/H0) = α
Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wαbằng α
α được gọi là mức ý nghĩa của kiểm định
Trang 16Miền bác bỏ giả thuyết
Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được
chia thành 2 tập hợp không giao nhau:
Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó
giả thuyết H0 bị bác bỏ
Miền không bác bỏ giả thuyết, ¯Wα, bao gồm các giá trị của Gtại đó giả thuyết H0 không bị bác bỏ
Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát
từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm đượcmiền Wα sao cho: P(G ∈ Wα/H0) = α
Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wαbằng α
α được gọi là mức ý nghĩa của kiểm định
Trang 17Miền bác bỏ giả thuyết
Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được
chia thành 2 tập hợp không giao nhau:
Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó
giả thuyết H0 bị bác bỏ
Miền không bác bỏ giả thuyết, ¯Wα, bao gồm các giá trị của G
tại đó giả thuyết H0 không bị bác bỏ
Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát
từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm đượcmiền Wα sao cho: P(G ∈ Wα/H0) = α
Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wαbằng α
α được gọi là mức ý nghĩa của kiểm định
Trang 18Miền bác bỏ giả thuyết
Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được
chia thành 2 tập hợp không giao nhau:
Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó
giả thuyết H0 bị bác bỏ
Miền không bác bỏ giả thuyết, ¯Wα, bao gồm các giá trị của G
tại đó giả thuyết H0 không bị bác bỏ
Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát
từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được
miền Wα sao cho: P(G ∈ Wα/H0) = α
Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wαbằng α
α được gọi là mức ý nghĩa của kiểm định
Trang 19Miền bác bỏ giả thuyết
Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được
chia thành 2 tập hợp không giao nhau:
Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó
giả thuyết H0 bị bác bỏ
Miền không bác bỏ giả thuyết, ¯Wα, bao gồm các giá trị của G
tại đó giả thuyết H0 không bị bác bỏ
Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát
từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được
miền Wα sao cho: P(G ∈ Wα/H0) = α
Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα
bằng α
α được gọi là mức ý nghĩa của kiểm định
Trang 20Miền bác bỏ giả thuyết
Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó đượcchia thành 2 tập hợp không giao nhau:
Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đógiả thuyết H0 bị bác bỏ
Miền không bác bỏ giả thuyết, ¯Wα, bao gồm các giá trị của Gtại đó giả thuyết H0 không bị bác bỏ
Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát
từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm đượcmiền Wα sao cho: P(G ∈ Wα/H0) = α
Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wαbằng α
α được gọi là mức ý nghĩa của kiểm định
Trang 21Quy tắc kiểm định giả thuyết
Từ P(G∈Wα/H0) = α, với α khá nhỏ, biến cố (G ∈ Wα) có thểcoi như không xảy ra trong một phép thử (theo nguyên lý xác suấtnhỏ)
Với giá trị Gqs cụ thể, ta kết luận theo quy tắc sau:
Nếu Gqs ∈ Wα: Bác bỏ H0, thừa nhận H1.Nếu Gqs /∈ Wα: Chưa có cơ sở bác bỏ H0, trên thực tế làthừa nhận H0 và bác bỏ H1
Trang 22Quy tắc kiểm định giả thuyết
Trang 23Quy tắc kiểm định giả thuyết
Từ P(G∈Wα/H0) = α, với α khá nhỏ, biến cố (G ∈ Wα) có thểcoi như không xảy ra trong một phép thử (theo nguyên lý xác suấtnhỏ)
Với giá trị Gqs cụ thể, ta kết luận theo quy tắc sau:
Nếu Gqs ∈ Wα: Bác bỏ H0, thừa nhận H1
Nếu Gqs /∈ Wα: Chưa có cơ sở bác bỏ H0, trên thực tế làthừa nhận H0 và bác bỏ H1
Trang 24Sai lầm loại II: Thừa nhận giả thuyết saiThừa nhận H0 trong khi H0 sai, hay Gqs ∈ Wα trong khi H1
đúng
Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β
Trang 25Các sai lầm mắc phải
Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm
thuộc hai loại sau:
Sai lầm loại I: Bác bỏ giả thuyết đúngMức ý nghĩa α chính là xác suất mắc sai lầm loại I
Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈ Wα) vẫnbằng α Nhưng khi G ∈ Wα, ta lại bác bỏ H0 Do đó xác suấtmắc sai lầm loại I đúng bằng α
Sai lầm loại II: Thừa nhận giả thuyết saiThừa nhận H0 trong khi H0 sai, hay Gqs ∈ Wα trong khi H1
đúng
Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β
Trang 26Các sai lầm mắc phải
Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm
thuộc hai loại sau:
Sai lầm loại I: Bác bỏ giả thuyết đúng
Mức ý nghĩa α chính là xác suất mắc sai lầm loại I
Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈ Wα) vẫnbằng α Nhưng khi G ∈ Wα, ta lại bác bỏ H0 Do đó xác suấtmắc sai lầm loại I đúng bằng α
Sai lầm loại II: Thừa nhận giả thuyết saiThừa nhận H0 trong khi H0 sai, hay Gqs ∈ Wα trong khi H1
đúng
Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β
Trang 27Các sai lầm mắc phải
Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm
thuộc hai loại sau:
Sai lầm loại I: Bác bỏ giả thuyết đúng
Mức ý nghĩa α chính là xác suất mắc sai lầm loại I
Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈ Wα) vẫn
bằng α Nhưng khi G ∈ Wα, ta lại bác bỏ H0 Do đó xác suất
Trang 28Các sai lầm mắc phải
Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm
thuộc hai loại sau:
Sai lầm loại I: Bác bỏ giả thuyết đúng
Mức ý nghĩa α chính là xác suất mắc sai lầm loại I
Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈ Wα) vẫn
bằng α Nhưng khi G ∈ Wα, ta lại bác bỏ H0 Do đó xác suất
mắc sai lầm loại I đúng bằng α
Sai lầm loại II: Thừa nhận giả thuyết sai
Thừa nhận H0 trong khi H0 sai, hay Gqs ∈ Wα trong khi H1
đúng
Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β
Trang 29Các sai lầm mắc phải
Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầmthuộc hai loại sau:
Sai lầm loại I: Bác bỏ giả thuyết đúng
Mức ý nghĩa α chính là xác suất mắc sai lầm loại I
Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈ Wα) vẫnbằng α Nhưng khi G ∈ Wα, ta lại bác bỏ H0 Do đó xác suấtmắc sai lầm loại I đúng bằng α
Sai lầm loại II: Thừa nhận giả thuyết sai
Thừa nhận H0 trong khi H0 sai, hay Gqs ∈ Wα trong khi H1đúng
Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β
Trang 31Các sai lầm mắc phải
Ví dụ
Sau khi xây dựng xong một tòa nhà thì cơ quan chức năng phát
hiện 1/2 số sắt đã bị "rút ruột" Gọi H0: Chất lượng công trình
đảm bảo, H1: Chất lượng công trình không đảm bảo Vậy sai lầm
loại I hay loại II nghiêm trọng hơn
GiảiGiả sử chất lượng công trình đảm bảo nhưng ta loại bỏ H0 =⇒đập nhà đi =⇒ gây tốn kém tiền của
Giả sử chất lượng công trình không đảm bảo nhưng ta vẫn thừanhận H0 loại bỏ H1 =⇒ vẫn đưa vào sử dụng =⇒ nhà sập =⇒vừa tốn kèm tiền của vừa nguy hiểm đến tính mạng
Vậy sai lầm loại II nghiêm trọng hơn =⇒ chọn α lớn để β nhỏ
Trang 32Các sai lầm mắc phải
Ví dụ
Sau khi xây dựng xong một tòa nhà thì cơ quan chức năng pháthiện 1/2 số sắt đã bị "rút ruột" Gọi H0: Chất lượng công trìnhđảm bảo, H1: Chất lượng công trình không đảm bảo Vậy sai lầmloại I hay loại II nghiêm trọng hơn
Vậy sai lầm loại II nghiêm trọng hơn =⇒ chọn α lớn để β nhỏ
Trang 33Thủ tục kiểm định giả thuyết
Xây dựng giả thuyết gốc H0 cần kiểm định
Từ tổng thể lập mẫu ngẫu nhiên kích thước n
Chọn tiêu chuẩn kiểm định G và tìm quy luật phân phối xácsuất của nó với điều kiện H0 đúng; tìm Gqs trên mẫu cụ thể.Với mức ý nghĩa α cho trước, tìm miền bác bỏ tốt nhất Wα
So sánh Gqs với Wα và kết luận
Nếu Gqs ∈ W α : Bác bỏ H 0 , thừa nhận H 1 Nếu Gqs / ∈ W α : Thừa nhận H 0 và bác bỏ H 1
Trang 34Thủ tục kiểm định giả thuyết
Xây dựng giả thuyết gốc H0 cần kiểm định
Từ tổng thể lập mẫu ngẫu nhiên kích thước n
Chọn tiêu chuẩn kiểm định G và tìm quy luật phân phối xácsuất của nó với điều kiện H0 đúng; tìm Gqs trên mẫu cụ thể.Với mức ý nghĩa α cho trước, tìm miền bác bỏ tốt nhất Wα
So sánh Gqs với Wα và kết luận
Nếu Gqs ∈ W α : Bác bỏ H 0 , thừa nhận H 1
Nếu Gqs / ∈ W : Thừa nhận H và bác bỏ H
Trang 37Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên
phân phối chuẩn
Giả sử X ∼ N(µ, σ2) Nếu chưa biết µ, song có thể cho rằng giá trịcủa nó bằng µ0 thì đưa ra giả thuyết thống kê H0: µ = µ0 Đểkiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kíchthước n: W = (X1, X2, , Xn)
Để chọn tiêu chuẩn kiểm định thích hợp, xét các trường hợp sau:Trường hợp đã biết phương sai σ2
Trường hợp chưa biết phương sai σ2
Trang 38Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên
phân phối chuẩn
Giả sử X ∼ N(µ, σ2) Nếu chưa biết µ, song có thể cho rằng giá trị
của nó bằng µ0 thì đưa ra giả thuyết thống kê H0: µ = µ0 Để
kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích
Trang 39Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn
Giả sử X ∼ N(µ, σ2) Nếu chưa biết µ, song có thể cho rằng giá trịcủa nó bằng µ0 thì đưa ra giả thuyết thống kê H0: µ = µ0 Để
kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kíchthước n: W = (X1, X2, , Xn)
Để chọn tiêu chuẩn kiểm định thích hợp, xét các trường hợp sau:Trường hợp đã biết phương sai σ2
Trường hợp chưa biết phương sai σ2
Trang 40Trường hợp đã biết phương sai σ2
Chọn tiêu chuẩn kiểm định
G = U = ( ¯X − µ0)
√nσNếu H0 đúng thì U ∼ N(0; 1) Các miền bác bỏ tốt nhất Wα đượcxác định như sau:
a H0: µ = µ0; H1: µ > µ0: Với mức ý nghĩa α cho trước tìm đượcgiá trị tới hạn uα sao cho P(U>uα) = α, ta thu được miền bác bỏbên phải