V. Bố cục luận văn
3.1. TỔNG QUAN VỀ BÀI TOÁN KIỂM ĐỊNH THỐNG KÊ
Trong thực tế, dựa vào số liệu mẫu thu đƣợc ngƣời ta thƣờng có nhu cầu kiểm tra một vấn đề thống kê nào đó là đúng hay sai. Vấn đề thống kê đƣợc đặt ra ở đây đƣợc gọi là giả thiết thống kê. Việc kiểm định các giả thiết thống kê có liên quan đến các tham số đặc trƣng của tổng thể đƣợc gọi là kiểm đinh tham số thống kê. Để kiểm tra giả thiết thống kê là đúng hay sai, trƣớc tiên ta xây dựng hai mệnh đề trái ngƣợc nhau có liên quan đến tham số cần kiểm định đƣợc gọi là giả thiết (H) và đối thiết (𝐻 )
Trong bài toán kiểm định về tham số thống kê , ta sử dụng cặp giả thiết, đối thiết nhƣ sau
H: 0, H: 0
H: 0, H: 0
H: 0, H: 0.
Trong bài toán kiểm định về hai tham số thống kê 1 và 2, ta sử dụng cặp giả thiết, đối thiết nhƣ sau
H:1 2, H:1 2
H:12, H:12
H:1 2, H:1 2.
Khi thực hiện kiểm định tham số thống kê ta phải đƣa ra đƣợc kết luận là chấp nhận hay bác bỏ giả thiết hoặc đối thiết. Tuy nhiên, khi thực hiện kiểm định không phải lúc nào cũng cho ta một kết luận chính xác. Việc chấp nhận hay bác bỏ giả thiết đều có thể dẫn tới hai loại sai lầm sau
Sai lầm loại 1: Là sai lầm khi ta bác bỏ giả thiết trong khi nó thật sự đúng (bác bỏ giả thiết đúng).
Sai lầm loại 2: Là sai lầm khi ta chấp nhận giả thiết trong khi nó thật sự sai (chấp nhận giả thiết sai).
Ta không thể khẳng định sai lầm nào nghiêm trọng hơn, nhƣng đã gọi là sai lầm thì tất cả đều không tốt và cần phải đƣợc hạn chế. Ta mong muốn tìm một tiêu chuẩn kiểm định giả thiết để đồng thời làm cho các xác suất sai lầm loại 1, sai lầm loại 2 là nhỏ nhất. Các nhà thống kê hạn chế các sai lầm đó theo nghĩa xác suất xảy ra mỗi sai lầm là nhỏ nhất. Tuy nhiên, khi ta làm giảm sai lầm loại này thì có thể sai lầm loại kia sẽ tăng lên và ngƣợc lại. Do đó trong bài toán kiểm định ngƣời ta tiến hành nhƣ sau: Ấn định trƣớc mức xác suất sai lầm loại 1 qua mức ý nghĩa và xây dựng lý thuyết sao cho khả năng mắc phải sai lầm loại 2 ( ) là nhỏ nhất trong khả năng có thể. Trong thực tế chúng ta chọn đủ bé (từ 1% đến 10%).
25
Việc thực hiện việc kiểm định tham số thống kê với mức ý nghĩa cho trƣớc theo phƣơng pháp Bayes có thể đƣợc thực hiện theo quy trình nhƣ sau
Chọn giả thiết, đối thiết
Tính giá trị 𝑝𝑣
Kết luận
𝑛ế𝑢 𝑝𝑣 ≤ 𝛼 𝑡𝑎 𝑏á𝑐 𝑏ỏ 𝑔𝑖ả 𝑡𝑖ế𝑡 𝑛ế𝑢 𝑝𝑣 > 𝛼 𝑡𝑎 𝑐ấ𝑝 𝑛ậ𝑛 𝑔𝑖ả 𝑡𝑖ế𝑡
Trong đó việc xác định 𝑝𝑣 sẽ dựa vào phân phối hậu nghiệm của tham số cần kiểm định.
Sau đây là một số bài toán kiểm định về tham số trung bình và tỷ lệ.