mà mới nêu lên nh− một giả thiết.Vậy có thể định nghĩa: Giả thuyết thông kê là những giả thuyết nói về các tham số, dạng qui luật phân phối hoặc tính độc lập của các ĐLNN... mà mới nêu l
Trang 2Kiểm định giả thuyết thống kê
Trang 4cô thÓ lµ:
Trang 5cụ thể là:
• Ch−a biết chính xác các tham số θ hoặc qui luật phânphối xác suất của ĐLNN X, nh−ng có cơ sở nào đó đểnêu lên giả thuyết, chẳng hạn θ = θo (θo là hằng số đãbiết), hay: X tuân theo qui luật phân phối chuẩn
Trang 6cụ thể là:
• Ch−a biết chính xác các tham số θ hoặc qui luật phânphối xác suất của ĐLNN X, nh−ng có cơ sở nào đó để
Trang 9mµ míi nªu lªn nh− mét gi¶ thiÕt.
Trang 10mà mới nêu lên nh− một giả thiết.
Vậy có thể định nghĩa:
Giả thuyết thông kê là những giả thuyết nói về các tham
số, dạng qui luật phân phối hoặc tính độc lập của các
ĐLNN
Trang 11mà mới nêu lên nh− một giả thiết.
Vậy có thể định nghĩa:
Giả thuyết thông kê là những giả thuyết nói về các tham
số, dạng qui luật phân phối hoặc tính độc lập của các
ĐLNN
Việc tìm ra kết luận về tính thừa nhận đ−ợc hay khôngthừa nhận đ−ợc của một giả thuyết gọi là kiểm định giả
thuyết thống kê.
Trang 12mà mới nêu lên nh− một giả thiết.
Vậy có thể định nghĩa:
Giả thuyết thông kê là những giả thuyết nói về các tham
số, dạng qui luật phân phối hoặc tính độc lập của các
ĐLNN
Việc tìm ra kết luận về tính thừa nhận đ−ợc hay không
Trang 14Đây là một trong những bài toán cơ bản của thông kêtoán Trước hết ta đề cập đến các tham số ĐLNN
Giả sử cần nghiên cứu tham số θ của ĐLNN X và có cơ
sở nào đó để nêu giả thuyết θ = θo
Trang 15Giả sử cần nghiên cứu tham số θ của ĐLNN X và có cơ
sở nào đó để nêu giả thuyết θ = θo.Giả thuyết này đ−ợc ký hiệu H : θ = θo (đ−ợc gọi là giảthuyết cần kiểm định hay giả thuyết cơ bản)
Trang 16Đây là một trong những bài toán cơ bản của thông kêtoán Trước hết ta đề cập đến các tham số ĐLNN
Giả sử cần nghiên cứu tham số θ của ĐLNN X và có cơ
sở nào đó để nêu giả thuyết θ = θo.Giả thuyết này được ký hiệu H : θ = θo (được gọi là giảthuyết cần kiểm định hay giả thuyết cơ bản)
Mệnh đề đối lập với giả thuyết H được gọi là giả thuyết
đối của H và ký hiệu là H Dạng tổng quát của H là:
θ 6= θo.
Trang 17Giả sử cần nghiên cứu tham số θ của ĐLNN X và có cơ
sở nào đó để nêu giả thuyết θ = θo.Giả thuyết này được ký hiệu H : θ = θo (được gọi là giảthuyết cần kiểm định hay giả thuyết cơ bản)
Mệnh đề đối lập với giả thuyết H được gọi là giả thuyết
đối của H và ký hiệu là H Dạng tổng quát của H là:
θ 6= θo.
Trong nhiều trường hợp, giả thuyết đối có thể phát biểu
cụ thể hơn như: H : θ > θo hay H : θ < θo.
Trang 18Đây là một trong những bài toán cơ bản của thông kêtoán Trước hết ta đề cập đến các tham số ĐLNN
Giả sử cần nghiên cứu tham số θ của ĐLNN X và có cơ
sở nào đó để nêu giả thuyết θ = θo.Giả thuyết này được ký hiệu H : θ = θo (được gọi là giảthuyết cần kiểm định hay giả thuyết cơ bản)
Mệnh đề đối lập với giả thuyết H được gọi là giả thuyết
đối của H và ký hiệu là H Dạng tổng quát của H là:
θ 6= θo.
Trong nhiều trường hợp, giả thuyết đối có thể phát biểu
cụ thể hơn như: H : θ > θo hay H : θ < θo.
Trang 19Giả sử cần nghiên cứu tham số θ của ĐLNN X và có cơ
sở nào đó để nêu giả thuyết θ = θo.Giả thuyết này đ−ợc ký hiệu H : θ = θo (đ−ợc gọi là giảthuyết cần kiểm định hay giả thuyết cơ bản)
Mệnh đề đối lập với giả thuyết H đ−ợc gọi là giả thuyết
đối của H và ký hiệu là H Dạng tổng quát của H là:
Trang 21Nhiệm vụ của lý thuyết kiểm định giả thuyết thống kê là:
Bằng thực nghiệm (thông qua mẫu cụ thể) kiểm tra tính
đúng (sai) của giả thuyết H.
Trang 221.2 Møc ý nghÜa, miÒn b¸c bá
Trang 241.2 Mức ý nghĩa, miền bác bỏ
Phương pháp kiểm định giả thuyết thống kê dựa trên cơ
sở lập luận như sau:
Xuất phát từ yêu cầu bài toán thực tế, ta đưa ra một giả
H và giả thuyết đối của nó
Trang 25Xuất phát từ yêu cầu bài toán thực tế, ta đưa ra một giả
H và giả thuyết đối của nó
Trước hết giả sử H đúng, và do đó xây dựng được biến
cố A nào đó, sao cho xác suất xảy ra biến cố A bằng α,
bé đến mức có thể sử dụng nguyên lý xác suất nhỏ, tức
là có thể coi A không xảy ra trong một phép thử
Trang 261.2 Mức ý nghĩa, miền bác bỏ
Phương pháp kiểm định giả thuyết thống kê dựa trên cơ
sở lập luận như sau:
Xuất phát từ yêu cầu bài toán thực tế, ta đưa ra một giả
H và giả thuyết đối của nó
Trước hết giả sử H đúng, và do đó xây dựng được biến
cố A nào đó, sao cho xác suất xảy ra biến cố A bằng α,
bé đến mức có thể sử dụng nguyên lý xác suất nhỏ, tức
là có thể coi A không xảy ra trong một phép thử
Khi thực hiện phép thử đối với biến cố A:
- Nếu A xảy ra thì ta bác bỏ giả thuyết H
Trang 27Xuất phát từ yêu cầu bài toán thực tế, ta đưa ra một giả
H và giả thuyết đối của nó
Trước hết giả sử H đúng, và do đó xây dựng được biến
cố A nào đó, sao cho xác suất xảy ra biến cố A bằng α,
bé đến mức có thể sử dụng nguyên lý xác suất nhỏ, tức
là có thể coi A không xảy ra trong một phép thử
Khi thực hiện phép thử đối với biến cố A:
- Nếu A xảy ra thì ta bác bỏ giả thuyết H
- Nếu A không xảy ra thì ta chưa có cơ sở để bác bỏ H.
Trang 28Trên có sở lập luận trên, có thể xây dựng thủ tục kiểm
định gồm các bước sau:
Trang 30thuyết H.
Bước 2: Do qui luật phân phối xác suất của G đã biếtnên với xác suất α bé tuỳ ý có thể tìm được miền Wα saocho P (G ∈ Wα) = α (G ∈ Wα) đóng vai trò như biến cố
Trang 31thuyết H.
Bước 2: Do qui luật phân phối xác suất của G đã biếtnên với xác suất α bé tuỳ ý có thể tìm được miền Wα saocho P (G ∈ Wα) = α (G ∈ Wα) đóng vai trò như biến cố
A nói trên
Sự tồn tại biểu thức P (G ∈ W ) = α chỉ với giả thuyết H
Trang 32đúng, nên để nhấn mạnh điều kiện này người ta ký hiệu
P (G ∈ Wα|H) = α Vì α bé nên theo nguyên lý xác suấtnhỏ có thể coi G không nhận giá trị trong miền Wα đốivới một phép thử
Trang 33Next
Back
đúng, nên để nhấn mạnh điều kiện này người ta ký hiệu
P (G ∈ Wα|H) = α Vì α bé nên theo nguyên lý xác suấtnhỏ có thể coi G không nhận giá trị trong miền Wα đốivới một phép thử
Bước 3: Thực hiện một phép thử đối với mẫu ngẫu nhiên
WX ta thu được mẫu cụ thể wX = (x1, x2, ã ã ã , xn) Từ mẫu
cụ thể này ta tính được giá trị của G (ký hiệu là g), giá trịnày được gọi là giá trị quan sát hay giá trị thực nghiệm
và ký hiệu g = f (x1, x2, ã ã ã , xn, θo).
Trang 34đúng, nên để nhấn mạnh điều kiện này người ta ký hiệu
P (G ∈ Wα|H) = α Vì α bé nên theo nguyên lý xác suấtnhỏ có thể coi G không nhận giá trị trong miền Wα đốivới một phép thử
Bước 3: Thực hiện một phép thử đối với mẫu ngẫu nhiên
WX ta thu được mẫu cụ thể wX = (x1, x2, ã ã ã , xn) Từ mẫu
cụ thể này ta tính được giá trị của G (ký hiệu là g), giá trịnày được gọi là giá trị quan sát hay giá trị thực nghiệm
và ký hiệu g = f (x1, x2, ã ã ã , xn, θo).
Bước 4: Xem xét giá trị quan sát của g có thuộc miền
Wα hay không để kết luận:
Trang 35Next
Back
đúng, nên để nhấn mạnh điều kiện này người ta ký hiệu
P (G ∈ Wα|H) = α Vì α bé nên theo nguyên lý xác suấtnhỏ có thể coi G không nhận giá trị trong miền Wα đốivới một phép thử
Bước 3: Thực hiện một phép thử đối với mẫu ngẫu nhiên
WX ta thu được mẫu cụ thể wX = (x1, x2, ã ã ã , xn) Từ mẫu
cụ thể này ta tính được giá trị của G (ký hiệu là g), giá trịnày được gọi là giá trị quan sát hay giá trị thực nghiệm
Trang 36b) NÕu g / ∈ Wα: biÕn cè (G ∈ Wα) kh«ng x¶y ra, ta chÊpnhËn gi¶ thuyÕt H.
Trang 37Miền Wα được gọi là miền bác bỏ của giả thuyết H; α
được gọi là mức ý nghĩa của kiểm định, trong thực tếthường lấy α trong khoảng (0, 01 ; 0, 05).
Trang 38b) Nếu g / ∈ Wα: biến cố (G ∈ Wα) không xảy ra, ta chấpnhận giả thuyết H.
Miền Wα được gọi là miền bác bỏ của giả thuyết H; α
được gọi là mức ý nghĩa của kiểm định, trong thực tếthường lấy α trong khoảng (0, 01 ; 0, 05).
1.3 Sai lầm loại I và sai lầm loại II
Trang 39Miền Wα được gọi là miền bác bỏ của giả thuyết H; α
được gọi là mức ý nghĩa của kiểm định, trong thực tếthường lấy α trong khoảng (0, 01 ; 0, 05).
1.3 Sai lầm loại I và sai lầm loại II
Khi kiểm định một giả thuyết thống kê, chúng ta có thểmắc một trong hai sai lầm sau đây:
Trang 40b) Nếu g / ∈ Wα: biến cố (G ∈ Wα) không xảy ra, ta chấpnhận giả thuyết H.
Miền Wα được gọi là miền bác bỏ của giả thuyết H; α
được gọi là mức ý nghĩa của kiểm định, trong thực tếthường lấy α trong khoảng (0, 01 ; 0, 05).
1.3 Sai lầm loại I và sai lầm loại II
Khi kiểm định một giả thuyết thống kê, chúng ta có thểmắc một trong hai sai lầm sau đây:
a) Sai lầm loại I: là sai lầm mắc phải khi ta bác bỏ giảthuyết H trong khi H đúng
Trang 41Miền Wα được gọi là miền bác bỏ của giả thuyết H; α
được gọi là mức ý nghĩa của kiểm định, trong thực tếthường lấy α trong khoảng (0, 01 ; 0, 05).
1.3 Sai lầm loại I và sai lầm loại II
Khi kiểm định một giả thuyết thống kê, chúng ta có thểmắc một trong hai sai lầm sau đây:
a) Sai lầm loại I: là sai lầm mắc phải khi ta bác bỏ giảthuyết H trong khi H đúng
Xác suất mắc phải sai lầm loại này bằng mức ý nghĩa α
Trang 42Thật vậy, mặc dù H đúng thì xác suất để (G ∈ Wα) vẫnbằng α, nghĩa là P (G ∈ Wα|H) = α
Trang 43Next
Back
Thật vậy, mặc dù H đúng thì xác suất để (G ∈ Wα) vẫnbằng α, nghĩa là P (G ∈ Wα|H) = α
Nh−ng nếu (G ∈ Wα) thì lập tức bác bỏ H Theo qui tắcnh− vậy, rõ ràng có xác suất mắc sai lầm bằng α Nếu α
càng bé khả năng gặp phải sai lầm loại I càng ít
Trang 44Thật vậy, mặc dù H đúng thì xác suất để (G ∈ Wα) vẫnbằng α, nghĩa là P (G ∈ Wα|H) = α
Nh−ng nếu (G ∈ Wα) thì lập tức bác bỏ H Theo qui tắcnh− vậy, rõ ràng có xác suất mắc sai lầm bằng α Nếu α
càng bé khả năng gặp phải sai lầm loại I càng ít
b) Sai lầm loại II: Là sai lầm mắc phải khi thừa nhận H
trong khi H sai
Trang 45Next
Back
Thật vậy, mặc dù H đúng thì xác suất để (G ∈ Wα) vẫnbằng α, nghĩa là P (G ∈ Wα|H) = α
Nh−ng nếu (G ∈ Wα) thì lập tức bác bỏ H Theo qui tắcnh− vậy, rõ ràng có xác suất mắc sai lầm bằng α Nếu α
càng bé khả năng gặp phải sai lầm loại I càng ít
b) Sai lầm loại II: Là sai lầm mắc phải khi thừa nhận H
trong khi H sai
Xác suất mắc phải sai lầm loại II là xác suất để G nhậngiá trị không thuộc miền bác bỏ Wα khi H sai (tức H
đúng)
P (G ∈ / Wα|H) = 1 − P (G ∈ Wα|H) = 1 − β.
Trang 46Thật vậy, mặc dù H đúng thì xác suất để (G ∈ Wα) vẫnbằng α, nghĩa là P (G ∈ Wα|H) = α
Nh−ng nếu (G ∈ Wα) thì lập tức bác bỏ H Theo qui tắcnh− vậy, rõ ràng có xác suất mắc sai lầm bằng α Nếu α
càng bé khả năng gặp phải sai lầm loại I càng ít
b) Sai lầm loại II: Là sai lầm mắc phải khi thừa nhận H
trong khi H sai
Xác suất mắc phải sai lầm loại II là xác suất để G nhậngiá trị không thuộc miền bác bỏ Wα khi H sai (tức H
đúng)
P (G ∈ / W |H) = 1 − P (G ∈ W |H) = 1 − β.
Trang 47Next
Back
β đ−ợc gọi là lực kiểm định H Nó chính là xác suất
"không mắc sai lầm loại II" β càng lớn thì xác suất mắcsai lầm loại II P (G / ∈ Wα|H) = 1 − β càng nhỏ
Trang 48β được gọi là lực kiểm định H Nó chính là xác suất
"không mắc sai lầm loại II" β càng lớn thì xác suất mắcsai lầm loại II P (G / ∈ Wα|H) = 1 ư β càng nhỏ
Các trường hợp xảy ra khi tiến hành kiểm định có thểtóm tắt dưới dạng bảng sau:
H đúng H saiBác bỏ Sai lầm loại I Kết luận đúngThừa nhận Kết luận đúng Sai lầm loại II
Trang 49Next
Back
β được gọi là lực kiểm định H Nó chính là xác suất
"không mắc sai lầm loại II" β càng lớn thì xác suất mắcsai lầm loại II P (G / ∈ Wα|H) = 1 ư β càng nhỏ
Các trường hợp xảy ra khi tiến hành kiểm định có thểtóm tắt dưới dạng bảng sau:
H đúng H saiBác bỏ Sai lầm loại I Kết luận đúngThừa nhận Kết luận đúng Sai lầm loại II
Khi kiểm định giả thuyết thống kê, nếu mức ý nghĩa α đãchọn, kích thước mẫu n đã xác định; đối với một tiêu
chuẩn kiểm định G, ta có thể tìm được vô số miền bác
bỏ Wα
Trang 50sai lầm loại II là nhỏ nhất (hay lực kiểm định lớn nhất)
Trang 51ý nghĩa và kích thước mẫu n xác định trước.
Trang 52sai lầm loại II là nhỏ nhất (hay lực kiểm định lớn nhất).Miền bác bỏ Wα được xây dựng dưới đây có tính chấttrên, tức là đảm bảo sai lầm loại II nhỏ nhất với với mức
ý nghĩa và kích thước mẫu n xác định trước
Trang 53ý nghĩa và kích thước mẫu n xác định trước.
Trang 54sai lầm loại II là nhỏ nhất (hay lực kiểm định lớn nhất).Miền bác bỏ Wα được xây dựng dưới đây có tính chấttrên, tức là đảm bảo sai lầm loại II nhỏ nhất với với mức
ý nghĩa và kích thước mẫu n xác định trước
Giả thuyết trung bình của tổng thể (cũng chính là kỳvọng toán của ĐLNN X), là m chưa biết Nhưng có cơ sở
Trang 55ý nghĩa và kích thước mẫu n xác định trước.
Giả thuyết trung bình của tổng thể (cũng chính là kỳvọng toán của ĐLNN X), là m chưa biết Nhưng có cơ sởnào đó nêu giả thuyết H : m = mo, (mo là giá trị nào đó
đã biết)
Trang 58Nếu giả thuyết H đúng thì U có phân phối chuẩn tắc
Trang 59Next
Back
Nếu giả thuyết H đúng thì U có phân phối chuẩn tắc
Bước 2: Miền bác bỏ phụ thuộc giả thuyết đối H như sau:
Trang 60Nếu giả thuyết H đúng thì U có phân phối chuẩn tắc
Bước 2: Miền bác bỏ phụ thuộc giả thuyết đối H như sau:a) H : m = mo; H : m 6= mo:
Trang 61Next
Back
Nếu giả thuyết H đúng thì U có phân phối chuẩn tắc
Bước 2: Miền bác bỏ phụ thuộc giả thuyết đối H như sau:a) H : m = mo; H : m 6= mo:
Trang 62Bước 2: Miền bác bỏ phụ thuộc giả thuyết đối H như sau:a) H : m = mo; H : m 6= mo:
Trang 63Next
Back
Wα = (−∞, −u1−α).
Trang 64Wα = (−∞, −u1−α).
B−íc 3: LÊy mÉu cô thÓ wX = (x1, x2, · · · , xn) TÝnh gi¸ trÞ
cô thÓ cña u hay cßn gäi lµ uqs, uqs = (x − mo).
√ n
σ .
Trang 65Next
Back
Wα = (−∞, −u1−α).
B−íc 3: LÊy mÉu cô thÓ wX = (x1, x2, · · · , xn) TÝnh gi¸ trÞ
cô thÓ cña u hay cßn gäi lµ uqs, uqs = (x − mo).
√ n
Trang 66Wα = (−∞, −u1−α).
B−íc 3: LÊy mÉu cô thÓ wX = (x1, x2, · · · , xn) TÝnh gi¸ trÞ
cô thÓ cña u hay cßn gäi lµ uqs, uqs = (x − mo).
√ n
Trang 67Next
Back
Wα = (ư∞, ưu1ưα).
Bước 3: Lấy mẫu cụ thể wX = (x1, x2, ã ã ã , xn) Tính giá trị
cụ thể của u hay còn gọi là uqs, uqs = (x ư mo).
√ n
Bước 4: Xét xem uqs ∈ Wα hay không để kết luận:
Nếu uqs ∈ Wα thì bác bỏ H, nếu uqs ∈ W / α thì chưa có cơ
sở bác bỏ H.
Trang 68Wα = (ư∞, ưu1ưα).
Bước 3: Lấy mẫu cụ thể wX = (x1, x2, ã ã ã , xn) Tính giá trị
cụ thể của u hay còn gọi là uqs, uqs = (x ư mo).
√ n
Bước 4: Xét xem uqs ∈ Wα hay không để kết luận:
Nếu uqs ∈ Wα thì bác bỏ H, nếu uqs ∈ W / α thì chưa có cơ
sở bác bỏ H.
Ví dụ 1: Nếu máy móc hoạt động bình thường thì trọng
Trang 69Với mức ý nghĩa α = 0, 05, hãy kết luận về điều nghi ngờnói trên có đúng hay không ?
Trang 70nghi nghờ trọng lượng của sản phẩm có xu hướng tănglên Cân thử 100 sản phẩm thì trọng lượng trung bình củachúng là 100, 3 gam
Với mức ý nghĩa α = 0, 05, hãy kết luận về điều nghi ngờnói trên có đúng hay không ?
Giải: Gọi X là trọng lượng sản phẩm Gọi trọng lượngtrung bình của loại sản phẩm đó sau một thời gian sảnxuất là m (m chưa biết) Đặt giả thuyết
H : m = 100; H : m > 100.
Trang 71Với mức ý nghĩa α = 0, 05, hãy kết luận về điều nghi ngờnói trên có đúng hay không ?
Giải: Gọi X là trọng l−ợng sản phẩm Gọi trọng l−ợngtrung bình của loại sản phẩm đó sau một thời gian sảnxuất là m (m ch−a biết) Đặt giả thuyết
H : m = 100; H : m > 100.
Với α = 0, 05 thì u1−α = 1, 645.
Miền bác bỏ với mức ý nghĩa α = 0, 05 là:
Wα = W0,05 = [1, 645; +∞).
Trang 72nghi nghờ trọng lượng của sản phẩm có xu hướng tănglên Cân thử 100 sản phẩm thì trọng lượng trung bình củachúng là 100, 3 gam
Với mức ý nghĩa α = 0, 05, hãy kết luận về điều nghi ngờnói trên có đúng hay không ?
Giải: Gọi X là trọng lượng sản phẩm Gọi trọng lượngtrung bình của loại sản phẩm đó sau một thời gian sảnxuất là m (m chưa biết) Đặt giả thuyết
H : m = 100; H : m > 100.
Với α = 0, 05 thì u1ưα = 1, 645.
Miền bác bỏ với mức ý nghĩa α = 0, 05 là:
Trang 74Ví dụ 2: Tuổi thọ của bóng đèn X là ĐLNN phân phốichuẩn với trung bình là EX = 2000 giờ và độ lệch tiêuchuẩn σ = 15 giờ Với mức ý nghĩa α = 5%, hãy kết luận
điều nghi ngờ nói trên
Trang 75điều nghi ngờ nói trên.
Giải: H : EX = 2000; H : EX 6= 2000.
Chọn tiêu chuẩn kiểm định U = (H − 2000)
√ 25
15 .
Trang 76Ví dụ 2: Tuổi thọ của bóng đèn X là ĐLNN phân phốichuẩn với trung bình là EX = 2000 giờ và độ lệch tiêuchuẩn σ = 15 giờ Với mức ý nghĩa α = 5%, hãy kết luận
điều nghi ngờ nói trên
Giải: H : EX = 2000; H : EX 6= 2000.
Chọn tiêu chuẩn kiểm định U = (H − 2000)
√ 25