- Sai lầm của một bài toán kiểm định giả thuyết thống kê Kiểm định giả thuyết về so sánh tham số với một giá trị.
4.2 Sai lầm của bài toán kiểm định giả thuyết thống kê
Làm theo quy tắc của bài toán kiểm định trên sẽ phạm phải hai sai lầm:
* Sai lầm loại I:Bác bỏ giả thiết H, nhưng thực tế H đúng.
* Sai lầm loại II: Chấp nhận giả thiết H, nhưng thực tế H sai.
Hai loại sai lầm này có tính chất đối kháng, tức là muốn hạn chế khả năng phạm sai lầm loại I, ta có xu hướng làm tăng khả năng phạm sai lầm loại II và ngược lại. Vì muốn hạn chế sai lầm loại I ta có xu hướng dè dặt trong việc bác bỏ và sẽ có khuynh hướngdễ dãi trong việc chấp nhận, khi đó lại dễ phạm sai lầm loại II. Còn muốn giảm sai lầm loại II, ta dè dặt trong việc chấp nhận và dẫn đến dễ dãi trong việc bác bỏ, điều này làm cho nguy cơ phạm sai lầm loại I tăng lên. Tức là:
Tài liệu giảng dạy Môn Thống kê xã hội học 44 P(Sai lầm loại I) P(Sai lầm loại II)
P(Sai lầm loại II) P(Sai lầm loại I)
Tất nhiên có một cách làm giảm cả 2 xác suất sai lầm là tăng kích thước mẫu n lên. Nhưng khi đó chi phí cũng tăng lên và đôi khi ta không phải trực tiếp làm ra được số liệu.
Giải quyết mâu thuẩn này bằng cách nào?
Thực ra sai lầm loại I và loại II rất tương đối, nó không có sẵn từ đầu, mà chỉ xác định khi ta đã đặt giả thuyết.
Chẳng hạn: Đối với một bác sĩ khám bênh, ông ta có thể phạm phải một trong hai tình huống sai lầm sau:
i/ Người có bệnh, sau khi thử nghiệm, ông kết luận không có bệnh. ii/ Người không bệnh, sau khi thử nghiệm, ông kết luận nhập viện.
Sai lầm nào là loại I? Sai lầm nào là loại II? Tất nhiên chưa thể nói được.Nếu bác sĩ đặt giả thiết H là “người này có bệnh” thì trường hợp (i) là sai lầm loại I, còn (ii) là sai lầm loại II. Còn nếu bác sĩ đặt giả thiết H là “người này không bệnh” thì trường hợp (i) là sai lầm loại II, còn (ii) là sai lầm loại I.
Nên đặt giả thuyết thế nào?
Muốn vậy người ta phải xem xét sai lầm nào quan trọng hơn, tức là khi phạm phải sẽ chịu tổn thất lớn hơn, thì ta sẽ đặt bài toán để sai lầm đó là loại I.
Chẳng hạn: Bác sĩ điều trị bệnh lao phổi. Đó là bệnh mà nếu phát hiện để điều trị gần như chắc chắn sẽ khỏi, còn nếu không được phát hiện kịp thời để điều trị thì bệnh sẽ nặng dần và dẫn đến tử vong. Khi đó sai lầm (i) “có bệnh bảo không” là quan trọng hơn, nó có thể dẫn đến tử vong, còn sai lầm (ii) “không bệnh bảo có”, cũng gây tổn hại, nhưng ít tổn hại hơn sai lầm (i). Vì vậy với trường hợp này ta nên đặt giả thiết H là “người này có bệnh”.