Bài toỏn và phương phỏp chung giải quyết kiểm định giả thuyết

Một phần của tài liệu Bài giảng xác suất thống kê đh lâm nghiệp (Trang 100 - 102)

Cho X là một biến ngẫu nhiờn cú phõn phối ( , ), ( , , … , ) là mẫu về X.

Định nghĩa 1: Giả thuyết là một khẳng định về phõn phối hay về tham số chưa biết của biến ngẫu nhiờn, thụng thường ta kớ hiệu là H hoặc .

Định nghĩa 2: Đối thuyết là khẳng định về phõn phối hay tham số của biến ngẫu nhiờn nhưng trỏi ngược với giả thuyết được nờu, kớ hiệu là K hoặc .

Vớ dụ 1:

Giả thuyết H: Biến ngẫu nhiờn X cú phõn phối chuẩn tắc.

Đối thuyết K: Biến ngẫu nhiờn X khụng cú phõn phối chuẩn tắc.

Đõy là giả thuyết đặt ra đối với phõn phối chưa biết của biến, tức là ta đang ngờ rằng biến cú phõn phối chuẩn tắc.

Vớ dụ 2: Giả sử ~ ( , 4), biến X cú phõn phối chuẩn và phương sai

= 4 đó biết, kỡ vọng = là tham số chưa biết. Ta cú thể đặt ra cỏc giả thuyết và đối thuyết tương ứng với như sau:

Giả thuyết : =

Đối thuyết : ≠

Đối thuyết cú thể được thay bằng cỏc đối thuyết : > hoặc

: < .

Bài toỏn đặt ra như sau: Ta quan tõm tới biến ngẫu nhiờn X cú phõn phối chưa biết. Cú hai khẳng định trỏi ngược nhau về biến X là giả thuyết và đối thuyết. Với dữ liệu thu được về X (mẫu ngẫu nhiờn), ta phải quyết định lựa chọn một trong hai khẳng định đú theo một cỏch “hợp lớ nhất”.

Phương phỏp chung giải bài toỏn kiểm định giả thuyết:

Để giải bài toỏn kiểm định giả thuyết, người ta làm như sau:

Dựa trờn mẫu ngẫu nhiờn ( , , … , )thu được về X, người ta xõy dựng tiờu chuẩn kiểm định (test thống kờ) T là hàm của mẫu, tức là = ( , , … , ). Núi đơn giản, tiờu chuẩn T đo sự sai khỏc giữa giả thuyết đặt ra và thực tế quan sỏt được về X.

Ta sẽ đưa ra quyết định chấp nhận hay bỏc bỏ giả thuyết dựa vào tiờu chuẩn T một cỏch “hợp lớ”. Thụng thường, nếu cú sự khỏc biệt lớn hay T nhận giỏ trị lớn ta sẽ bỏc bỏ giả thuyết. Nếu T nhận giỏ trị nhỏ thỡ ta sẽ chấp nhận giả thuyết, tức là, sự sai khỏc khụng đỏng kể (sai do yếu tố ngẫu nhiờn- lấy mẫu).

Vỡ ta khụng cú toàn bộ thụng tin về biến X nờn quyết định mà ta đưa ra dựa trờn tiờu chuẩn T hoàn toàn cú thể dẫn tới sai lầm. Cú hai sai lầm cú thể mắc phải như sau:

a) Sai lầm loại 1: Giả thuyết sai nhưng ta lại chấp nhận nú. b) Sai lầm loại 2: Giả thuyết đỳng nhưng ta lại bỏc bỏ nú.

Một cỏch tự nhiờn, ta cố gắng tỡm một tiờu chuẩn sao cho khi đưa ra quyết định dựa trờn nú thỡ khả năng mắc hai sai lầm trờn là nhỏ nhất. Tuy nhiờn, người ta chứng minh được rằng một tiờu chuẩn như vậy là khụng tồn tạị Trong tỡnh huống này, người ta xử lớ như sau:

Ta khống chế xỏc suất mắc sai lầm loại 1 nhỏ hơn một mức đó ấn định trước (thường nhỏ) và tỡm một tiờu chuẩn cực tiểu xỏc suất mắc sai lầm loại 2. May mắn thay, một tiờu chuẩn như vậy luụn tồn tạị

Nguyờn tắc đưa ra quyết định: Người ta đưa ra quyết định dựa trờn “nguyờn lớ xỏc suất nhỏ”.

Nguyờn lớ xỏc suất nhỏ: Nếu một biến cố cú xỏc suất nhỏ thỡ nú sẽ khụng xảy ra trong một hoặc một vài lần thực hiện phộp thử.

Đến đõy, bài toỏn kiểm định giả thuyết được giải quyết bằng phương phỏp phản chứng như sau:

Giả sử, giả thuyết đặt ra là đỳng, khi ấy tiờu chuẩn T cú một phõn phối hoàn toàn xỏc định. Dựa vào phõn phối này, ta tỡm một miền S thỏa món

( ∈ | ) = . Miền S được gọi là miền tiờu chuẩn hay miền bỏc bỏ giả thuyết. Từ dữ liệu thực tế cú được, ta tớnh ra giỏ trị của T và đối chiếu giỏ trị của T với miền tiờu chuẩn. Nếu ∈ thỡ ta sẽ bỏc bỏ giả thuyết. Nếu ngược lại, ta chấp nhận giả thuyết. Đú là lời giải của bài toỏn kiểm định giả thuyết.

Cơ sở của quyết định trờn được giải thớch: Nếu giả thuyết là đỳng đắn thỡ S là miền cú xỏc suất nhỏ (vỡ được chọn nhỏ). Do đú, biến cố ∈ cú xỏc suất nhỏ. Một biến cố cú xỏc suất nhỏ phải khụng xảy ra trong một hoặc một vài lần lấy mẫu mới là hợp lớ. Do đú, nếu trong lần đầu lấy mẫu, ta thấy rằng T rơi vào miền S, điều này mõu thuẫn với nguyờn lớ xỏc suất nhỏ và quyết định ta đưa ra là bỏc bỏ giả thuyết. Khả năng phạm sai lầm loại 1 khi chọn quyết định này nhỏ hơn hoặc bằng .

Chỳ ý:

Phương phỏp giải trờn được gọi là phương phỏp kiểm định truyền thống. Một phương phỏp khỏc thường được dựng trong cỏc phần mềm thống kờ là phương phỏp P-value (P- giỏ trị).

Tiờu chuẩn T là một biến ngẫu nhiờn. Ta đưa ra quyết định dựa trờn T hay chớnh dựa trờn mẫu (những bằng chứng thu thập được). Nếu hai mẫu khỏc nhau cú thể dẫn tới hai quyết định trỏi ngược nhaụ

Xỏc suất mắc sai lầm loại 1 được ưu tiờn khống chế vỡ người ta cho rằng sai lầm này nghiờm trọng hơn nếu phạm phảị

Xỏc suất mắc sai lầm loại 2 chưa được xỏc định. Do vậy, quyết định bỏc bỏ giả thuyết núi chung “an toàn” hơn quyết định chấp nhận giả thuyết vỡ nhỏ và đó biết.

Một phần của tài liệu Bài giảng xác suất thống kê đh lâm nghiệp (Trang 100 - 102)

Tải bản đầy đủ (PDF)

(163 trang)