- Thu thập, xử lý và khai thác nhanh Toàn diện.
§1 GIÁ THIẾT VÀ ĐÔI THIẾT
Ở Chương 3 đã nghiên cứu ĐLNN, khi chưa biết tham số của nó và đã xây dựng các
phương phấp ước lượng các tham số đó. Chương này tiếp tục nghiên cứu ĐLNN trong trường
hợp thông tin không đầy đủ thể hiện ở nhiều mặt, cụ thể là:
Chưa biết chính xác các tham số Ø hoặc qui luật phân phối xác suất của ĐLNN X, nhưng có cơ sở nào đó để nêu lên giả thiết, chẳng hạn Ø = Øạ (Ø là hằng số đã biết), hay: X tuân theo qui luật phân phối chuẩn.
Khi nghiên cứu hai hay nhiều ĐLNN, một trong những vấn đề cần quan tâm nhất là: các
đại lượng này độc lập với nhau hay có sự phụ thuộc tương quan? Các tham số của chúng có
bằng nhau hay không?
Những câu hỏi này thường chưa được trả lời khẳng định mà mới nêu lên như một giả
thiết. Vậy có thể định nghĩa:
Giả thiết thống kê là những giả thiết nói về các tham số, dạng qui luật phân phối hoặc
tính độc lập của các ĐLNN.
Việc tìm ra kết luận về tính thừa nhận được hay không thừa nhận được của một giả thiết gọi là kiểm định giả thiết thống kê.
Đây là một trong những bài toán cơ bản của thông kê toán. Trước hết ta đề cập đến các tham số ĐLNN.
Giả sử cần nghiên cứu tham số Ø của ĐLNN X và có cơ sở nào đó để nêu giả thiết Ø =
6ạ
Giả thiết này được ký hiệu Họ : Ø = Øạ (được gọi là giả thiết cần kiểm định hay giả thiết
cơ bản).
Mệnh đề đối lập với giả thiết Hạ được gọi là đối thiết của Họ và ký hiệu là H;. Dạng
tổng quát của Hạ là: Ø # 6g.
Trong nhiều trường hợp, đối thiết có thể phát biểu cụ thể hơn như: H : 0 < 8g hay Hì
: >9ạ
Như vậy giả thiết kiếm định và đối thiết thường được nêu lên thành từng cặp. Chẳng hạn:
Nhiệm vụ của lý thuyết kiểm định giả thiết thống kê là: Bằng thực nghiệm (thông qua mẫu cụ thể) kiểm tra tính đúng (sai) của giả thiết Họ. Khi kết luận thì hoặc chấp nhận Ïọ hoặc
bác bỏ Họ và trong trường hợp này, tuy không hoàn toàn tương đương, nhưng coi như chấp
nhận #7, ta có thể phạm hai loại sai lầm. Sai lầm loại 1. Bác bỏ Hạ khi thực ra Họ đúng. Sai lầm loại 2. Chấp nhận Họ khi thực ra Hạ saị
Sai lầm loại 1 tương tự như sai lầm của quan tòa khi "kết án nhầm người vô tội", còn sai lầm loại 2 tương tự như khi "tha bỗng kẻ đó tội".
Một kiểm định thống kê lý tưởng là kiểm định làm cực tiểu cả hai loại sai lầm. Tuy nhiên
chúng ta làm giảm sai lầm loại 1 sẽ tăng sai lầm loại 2 và ngược lạị Trong một xã hội văn
minh, người ta có xu hướng thừa nhận rằng việc kết án nhầm người vô tội là một sai lầm
nghiêm trọng hơn nhiều so với sai lầm tha bỗng kẻ có tộị Trong bài toán kiểm định giả
thiết thống kê cũng vậỵ Ta coi sai lầm loại 1 là nghiêm trọng hơn sai lầm loại 2. Thành thử người ta cố định trước xác suất mắc sai lầm loại 1. Xác suất của mắc sai lầm loại 1 còn gọi
là mức ú nghĩa, được kỹ hiệu là œ. Sau đó sẽ cực tiểu sai lầm loại 2. Kiểm định nào có xác
suất sai lầm loại 2 nhỏ nhất được xem là tốt nhất. Các kiểm định thống kê trình bày trong chương này đều đã được chứng minh chặt chẽ về Toán học là các kiểm định tốt nhất.
Trong phạm vi tài liệu này chỉ đề cập đến đối thiết hai phíạ