Kiểm địnhgiảthiết
Nguồn: thunhan.wordpress.com
1. Khái niệm:
Kiểm địnhgiảthiết là một bài toán quan trọng trong đời sống cũng như trong
thống kê, kiểm toán. Ta thường gặp 1 cặp giảthiết đối nghịch nhau, bằng khả năng
của mình, ta phải xác định xem giảthiết nào đúng.
- Giảthiết thống kê là các giảthiết về trung bình (μ), phương sai mẫu (σ
2
), tỉ lệ
(f),… của đám đông (mẫu ) đang xét.
- Nội dung của bài toán kiểm định: Cho hai giảthiết H
0
, H
1
(thường là đối
nghịch nhau). Dựa vào các số liệu thu được, ta phải quyết định xem giảthiết H
0
đúng hay sai. Giảthiết H
1
đối nghịch với giảthiết H
0
gọi là đối thiết của H
0
. Việc
đưa ra quyết định chấp nhận hay bác bỏ một giảthiết thống kê gọi là làm kiểm
định (hay kiểmđịnh thống kê).
Ví dụ: Khi ta cảm thấy mệt mỏi, ta nghi rằng “mình bị bệnh” – đây là giảthiết H
0
,
(H
1
là “mình không mắc bệnh”) và việc đi khám bệnh để xác định xem mình có
bệnh hay không, chính là xác định xem giảthiết H
0
có đúng hay không. Việc này
chính là kiểmđịnhgiả thiết.
Khi giảthiết H
0
có dạng: H
0
: a = a
0
(a là 1 tham số nào đó của đại lượng ngẫu
nhiên ta đang nghiên cứu; a
0
là giá trị đã biết)
Khi đó: H
1
có thể là: H
1
: a ≠ a
0
. Việc kiểmđịnhgiảthiết với đối thiết dạng này
được gọi là
kiểm định hai phía (vì miền bác bỏ nằm về hai phía của miền chấp
nhận).
Giả thiết đối dạng H
1
: a ≠ a
0
thường được áp dụng khi ta chưa biết rõ trong thực tế
a > a
0
hay a< a
0
.
Nhưng nếu qua quan sát, phân tích ta biết được xu hướng là a > a
0
thì ta có thể đặt
đối thiết H
1
: a > a
0
. Hoặc ta biết được khả năng a <a
0
thì đặt đối thiết H
1
: a < a
0
.
Nếu kiểmđịnhgiảthiết với giảthiết đối dạng H
1
: a > a
0
thì được gọi là kiểmđịnh
giả thiết về phía bên phải
. Nếu kiểmđịnhgiảthiết với giảthiết đối dạng H
1
: a <
a
0
thì được gọi là kiểmđịnhgiảthiết về phía bên trái
2. Các sai lầm mắc phải khi làm kiểm định:
Khi làm kiểm định, ta có thể mắc phải các sai lầm sau đây:
• Sai lầm loại 1: Bác bỏ 1 giảthiết đúng ( Bác bỏ H
0
khi H
0
đúng).
• Sai lầm loại 2: Chấp nhận 1 giảthiết sai (Nhận H
0
khi H
0
sai).
Kết luận
Thực tế
Chấp nhận H
0
Bác bỏ H
0
H
0
đúng Kết luận đúng Sai lầm loại 1
H
0
sai Sai lầm loại 2 Kết luận đúng
Ví dụ:
1. Dựa vào các thông tin dự báo thời tiết, trung tâm khí tượng thủy văn dự báo 1
cơn bão sắp đến sẽ đổ bộ vào miền Nam thì H
0
: “Bão đổ bộ vào miền Nam” (H
1
:”bão không đổ bộ vào miền Nam). Khi đó sai lầm loại 1 là rất tai hại vì khi đó, do
không kịp thời chuẩn bị ứng phó nên bão sẽ gây ra những thiệt hại nặng nề.
2. Cho đậu 1 thí sinh yếu kém (mà đáng ra phải rớt) hoặc cho rớt 1 thí sinh giỏi
(mà đáng lẽ ra phải đậu) đều là những sai lầm tai hại. Thực tế, cho thấy, có những
cuộc thi mà kết quả chỉ dựa vào số lượng tin nhắn bình chọn thì chứa đựng nhiều
sai lầm.
Tất nhiên, khi kiểmđịnh một giả thiết. Ta cố gắng hạn chế các sai lầm, tức là cần
giảm thiểu tối đa xác suất phạm cả hai sai lầm. Tuy nhiên, đây là điều trong thực
tế không thể làm được vì nếu ta muốn giảm sai lầm loại 1 thì sẽ làm tăng xác suất
sai lầm loại 2 và ngược lại.
Trong thống kê, ta quy ước rằng lỗi lầm loại 1 là tai hại hơn, và cần tránh trước.
Do đó, với xác suất α nhỏ cho trước, ta cần ra quyết định sao cho:
P(Phạm sai
lầm loại 1) ≤ α .
α gọi là mức ý nghĩa của kiểm định.
3. Một số bài toán kiểmđịnh thường gặp:
3.1 Kiểmđịnhgiảthiết về số trung bình:
Giả sử đại lượng ngẫu nhiên gốc X trong tổng thể phân phối theo qui luật chuẩn
với kỳ vọng là μ và phương sai mẫu
σ
2
, Cần kiểm địnhgiả thiết:
( là 1 giá trị đã biết khi đặt )
Để kiểm địnhgiảthiết trên, ta tiến hành lấy mẫu với kích thước n và xét các
trường hợp sau:
1. Trường hợp 1: σ đã biết:
2
Giả sử là mẫu độc lập của X. Khi đó:
Với mức ý nghĩa , chọn miền bác bỏ giảthiết
trong đó thỏa:
Rõ ràng
và được xác định bởi bảng giá trị tích phân Laplace.
Ví dụ: mức ý nghĩa ;
Hoàn toàn tương tự cho các phép kiểmđịnh trung bình 1 phía, ta có thể tóm tắt bởi
bảng sau:
2. Trường hợp 2: σ chưa
biết:
2
Giả sử là mẫu độc lập của X. Khi đó:
Với mức ý nghĩa , chọn miền bác bỏ giảthiết :
trong đó là phân phối Student n-1 bậc tự do.
Nếu n đủ lớn
thì
Hoàn toàn tương tự cho các phép kiểmđịnh trung bình 1 phía, ta có thể tóm tắt bởi
bảng sau:
3.2. Kiểmđịnh so sánh 2
giá trị trung bình :
Cho là mẫu độc lập của X.
là mẫu độc lập của X.
Trường hợp 1: Nếu đã biết.
Xét phép kiểm định:
Khi đó:
Với mức ý nghĩa , chọn miền bác bỏ giảthiết :
được tra từ bảng phạn phối Student (m+n-2) bậc tự do.
Trường hợp 2: Nếu chưa biết.
Khi đó:
Với mức ý nghĩa
, chọn miền bác bỏ giảthiết :
trong đó: được tra từ bảng phân phối Student (m+n-2) bậc tự do. tương
ứng là phương sai mẫu của X và Y.
3.3 Kiểm địnhgiảthiết về tỉ lệ:
1. Kiểmđịnh tỉ lệ:Giả sử trong 1 đám đông Ω , tỉ lệ các phần tử mang dấu hiệu A
nào đó là p chưa biết. Từ mẫu
ta có tỉ lệ quan sát được là:
Cần kiểmđịnhgiả thiết:
Với mức ý nghĩa , chọn miền bác bỏ giảthiết :
, với
Hoàn toàn tương tự cho các phép kiểmđịnh trung bình 1 phía, ta có thể tóm tắt bởi
bảng sau:
2. Kiểmđịnh sự bằng
nhau của 2 tỉ lệ:
Giả sử tương ứng là tỉ lệ các phần tử mang một dấu hiệu A nào đó từ 2 đám
đông ma ta chưa biết.
Mẫu 1 có kích thước n có
cá thể mang dấu hiệu A
Mẫu 2 có kích thước n có
cá thể mang dấu hiệu A
Ta đặt:
Khi đó:
Xét phép kiểm định:
Với mức ý nghĩa , chọn miền bác bỏ giảthiết :
Phản hồi (20) Trackbacks (0) Để lại phản hồi Trackback
1.
quang hùng
16.12.2008 lúc 09:03 | #1
Trả lời | Trích dẫn
thầy cho em hỏi về 1 bài như sau:
có tàiliệu khẳng định rằng: thời gian chờ phục vụ trung bình của mỗi khách
hàng ở 1 hệ thống phục vụ A tối đa là 22 phút. Một mẫu điều tra qua 1 số
khách hàng của hệ thống khách hàng này cho bảng kết quả sau:
thời gian phục vụ/1khách | số khách
[5-10) | 5
[10-15) | 15
[15-20) | 40
[20-25) | 80
[25-30) | 50
[30-35) | 15
[35-40] | 5
a) với mức ý nghĩa 5% hãy kiểm địnhgiảthiết trên
b) với độ tin cậy 95% thì dựa vào kết quả điều tra , thời gian chờ phục vụ
của mỗi khách hàng ở hệ thống này trung bình vào khoảng bao nhiêu?
c) với độ tin cậy 95% , dựa vào kết quả điều tra hãy ước lượng khoảng tin
cậy cho tỷ lệ khách hàng có thời gian chờ phục vụ không dưới 22 phút
Đầu tiên em phải tính trung bình mẫu và phương sai hiệu chỉnh của mẫu.
a. Ta có bài toán kiểm định:
Do kích thước mẫu lớn hơn 30, và sigma chưa biết nên ta chọn phép kiểm định:
với miền bác bỏ:
Với mức ý nghĩa 5% thì u(0,475) = 1,96
b. Dùng công thức ước lượng giá trị trung bình, với trường hợp n > 30 và sigma
chưa biết:
Ta có khoảng tin cậy: s là độ lệch chuẩn hiệu chỉnh. Khi đó:
c. Dùng công thức ước lượng tỉ lệ với tần suất
ta có: khoảng tin cậy:
. gọi là kiểm định
giả thiết về phía bên phải
. Nếu kiểm định giả thiết với giả thiết đối dạng H
1
: a <
a
0
thì được gọi là kiểm định giả thiết về. a
0
. Việc kiểm định giả thiết với đối thiết dạng này
được gọi là
kiểm định hai phía (vì miền bác bỏ nằm về hai phía của miền chấp
nhận).
Giả thiết đối