1. Trang chủ
  2. » Giáo Dục - Đào Tạo

chương 6 kiểm định giả thiết thống kê

27 473 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 27
Dung lượng 341,96 KB

Nội dung

Trong quá trình ñi ñến một quyết ñịnh, chúng ta thường dựa vào một qui luật hay một kinh nghiệm nào ñó ñể ñặt ra một giả thiết thống kê; sau ñó, xây dựng những thủ tục, theo ñó, những gi

Trang 1

1.1 Định nghĩa Một giả thiết thống kê là một khẳng ñịnh về phân phối

của một hoặc nhiều biến ngẫu nhiên Nếu giả thiết thống kê xác ñịnh hoàn toàn

một phân phối, thì nó ñược gọi là một giả thiết thống kê ñơn; trường hợp ngược lại, nó ñược gọi là một giả thiết thống kê hợp

Trong quá trình ñi ñến một quyết ñịnh, chúng ta thường dựa vào một qui luật hay một kinh nghiệm nào ñó ñể ñặt ra một giả thiết thống kê; sau ñó, xây dựng những thủ tục, theo ñó, những giả thiết ñã ñặt ra ñược chấp nhận hay bác bỏ Những thủ tục ñó ñược gọi là những phép kiểm ñịnh (trắc nghiệm) giả thiết thống

Phép kiểm ñịnh thường là phép so sánh giữa hai hay nhiều giá trị Giả thiết ñược ñặt ra ttường ñược gọi là Giả thiết không, ký hiệu Ho Chữ “không” ở ñây

có nghĩa là không có sự khác biệt có ý nghĩa về mặt thống kê giữa các giá trị cần

so sánh Khi bác bỏ Ho, chúng ta sẽ chấp nhận một giả thiết H1 khác, ñược gọi là

giả thiết ñối của Ho

Thí dụ, ñể so sánh hiệu quả ñiều trị của hai loại thuốc A và B ñối với một bệnh X, ñiều tra trên mẫu chúng ta có kết quả tỉ lệ khỏi bệnh p(A) > p(B) Với ý muốn chứng minh hiệu quả của hai loại thuốc trên là khác nhau, chúng ta ñặt giả thiết Ho là “ không có sự khác nhau về hiệu quả ñiều trị của hai loại thuốc A và B

Trang 2

Xét mẫu kích thước n (X1, X2, …, Xn) ñược thành lập từ tổng thể X Người

ta chia Im(X1, X2, …, Xn) (còn gọi là không gian mẫu ) thành hai tập con, lần

lượt ñược ký hiệu là W và W* = Im(X1, X2, …, Xn) −−−− W Khi mẫu cụ thể (x1, x2,

…, xn) ñược thực hiện, nếu (x1, x2, …, xn) ∈ W thì giả thiết Ho bị bác bỏ (chấp nhận H1); nếu (x1, x2, …, xn) ∈ W* thì Ho ñược chấp nhận (bác bỏ H1) Tập hợp

W ñược gọi là miền bác bỏ (hay miền tới hạn) của phép kiểm ñịnh Như vậy,

chúng ta có ñịnh nghĩa

1.2 Định nghĩa Một phép kiểm ñịnh (hay trắc nghiệm) một giả thiết

thống kê là một qui tắc, theo ñó, dựa vào một mẫu cụ thể ñược thực hiện, chúng ta

có thể quyết ñịnh chấp nhận hay bác bỏ giả thiết ñang xét

1.3 Định nghĩa Nếu chúng ta bác bỏ giả thiết Ho khi, thực ra, nó phải ñược chấp nhận thì chúng ta ñã mắc phải sai lầm gọi là Sai lầm loại I Nếu chúng ta chấp nhận Ho trong khi, thực ra, nó phải bị bác bỏ thì chúng ta ñã mắc

phải sai lầm gọi là Sai lầm loại II

Xác suất mắc phải sai lầm loại I, thường ký hiệu là α, gọi là Mức ý nghĩa của trắc nghiệm Như vậy, xác suất ñể chấp nhận Ho khi nó ñúng là (1 − α) Nếu ký hiệu β là xác suất mắc phải sai lầm loại II, thì xác suất ñể bác bỏ

Ho khi nó sai là (1 − β), ñược gọi là Năng lực của phép kiểm ñịnh

Như vậy, một báo cáo kết quả so sánh là “ sự khác biệt có ý nghĩa về mặt thống kê ở mức ý nghĩa 5% ” có nghĩa là “giả thiết không” Ho ñã bị bác bỏ với nguy cơ sai lầm là 5% Các bước cơ bản của một phép kiểm ñịnh giả thiết thống kê:

1 Đặt giả thiết không Ho và giả thiết ñối H1,

2 Xác ñịnh mức ý nghĩa α của phép kiểm ñịnh,

3 Với cặp giả thiết và mức ý nghĩa α ñã xác ñịnh, chúng ta thiết lập ñược một Qui luật quyết ñịnh dùng ñể quyết ñịnh chấp nhận hay bác bỏ giả thiết Ho Qui luật này bao gồm việc chọn một thống kê thích hợp ñể dùng cho phép kiểm ñịnh và ñưa ra một giá trị tới hạn ñể so sánh

• Khác với phép kiểm ñịnh một giả thiết với mức ý nghĩa α cho trước, các nhà nghiên cứu thường xác ñịnh mức ý nghĩa nhỏ nhất, tại ñó, “giả thiết không”

Ho bị bác bỏ Từ ñó, người ta có ñịnh nghĩa

1.4 Định nghĩa Trong một phép kiểm ñịnh, mức ý nghĩa nhỏ nhất, tại ñó,

“giả thiết không” Ho có thể bị bác bỏ ñược gọi là giá trị xác suất hay p −−−− giá trị

(p – value) của phép kiểm ñịnh

Trang 3

(a) nếu H1 là θ ≠ θo thì trắc nghiệm ñược gọi là hai ñuôi

(b) nếu H1 là θ < θo hay θ > θo thì trắc nghiệm ñược gọi là một ñuôi

2 KIỂM ĐỊNH GIẢ THIẾT VỀ TRUNG BÌNH TỔNG THỂ

Giả sử tổng thể X có phân phối chuẩn, với trung bình µ chưa biết Chúng ta

cần kiểm ñịnh giả thiết

Ho: µ = µo ñối với H1: µ ≠ µo, với mức ý nghĩa α cho trước

Phân biệt hai trường hợp:

C ñược gọi là giá trị tới hạn ( viết tắt là gtth) của trắc nghiệm

Như vậy, trong trường hợp này, gtth = u1−αα α α

α αα α

1 1 2

Với mẫu cụ thể, chúng ta tính ñược giá trị u của U

Trang 4

* H o bị bác bỏ nếu |||| t |||| > gtth

2.3 Chú ý Trong trường hợp cỡ mẫu lớn ( n > 30), không cần giả thiết

tổng thể X có phân phối chuẩn (do Định lý giới hạn trung tâm)

2.4 Thí dụ Công ty ABC muốn sản xuất loại bóng ñèn có tuổi thọ trung

bình µ = 1600 giờ Nếu thời gian dùng ngắn hơn 1600 giờ thì công ty sẽ mất khách hàng; nếu thời gian dùng dài hơn thì chi phí sản xuất tăng lên Để biết xem qui trình sản xuất có tốt không, công ty chọn một mẫu ngẫu nhiên gồm 64 bóng ñèn ñốt thử và thấy tuổi thọ trung bình của chúng là 1570 giờ với ñộ lệch chuẩn là 121 giờ Hãy cho kết luận về qui trình sản xuất ở mức ý nghĩa 5%

Giải.

Gọi X là BNN chỉ tuổi thọ của loại bóng ñèn do công ty ABC sản xuất

Kiểm ñịnh giả thiết:

Ho: µ = µo = 1600 giờ ñối với H1: µ ≠ µo Nếu Ho ñúng thì BNN (X o) 64

Giả thiết Ho là µ = µo, còn H1 là µ > µo hay µ < µo

Cụ thể

2.5.1 Kiểm ñịnh giả thiết:

Ho: µ = µo ñối với H1: µ > µo, với mức ý nghĩa α cho trước

Giá trị tới hạn C ñược xác ñịnh bởi:

P(U > C) = α ⇔ gtth = u1−α ( nếu biết σ ),

Trang 5

− α ( nếu không biết σ )

Với mẫu cụ thể, nếu giá trị u hoặc t lớn hơn gtth thì Ho bị bác bỏ

2.5.2 Kiểm ñịnh giả thiết:

Ho: µ = µo ñối với H1: µ < µo, với mức ý nghĩa α cho trước

2.6 Thí dụ Trở lại công ty ABC trong Thí dụ 5.2.4, Công ty tuyên bố

rằng tuổi thọ trung bình của bóng ñèn do họ sản xuất là không dưới 1600 giờ Với mẫu trên, bạn hãy cho kết luận về lời tuyên bố của công ty, ở mức ý nghĩa 4%

Giải.

Kiểm ñịnh giả thiết:

Ho: µ = µo = 1600 giờ; ñối với H1: µ < µo Nếu Ho ñúng thì BNN

Trang 6

Giả sử tổng thể X có phân phối B(p) Với mẫu cỡ n > 30 thoả np ≥ 5 và

n(1 − p) ≥ 5 thì phân phối nhị thức tiệm cận phân phối chuẩn nên có thể dùng trắc nghiệm U

Chúng ta cần kiểm ñịnh giả thiết:

Ho: p = po ñối với H1 là: p ≠ po hay p < po hay p > po Dùng trắc nghiệm U (2 ñuôi hoặc 1 ñuôi), với

Thí dụ Tại một ñịa phương, bệnh B có tỉ lệ 34% Sau một ñợt ñiều trị,

kiểm tra lại trên 100 người, thấy có 24 người bị bệnh B

Hỏi ñợt ñiều trị có thực sự làm giảm tỉ lệ bệnh B ở ñịa phương trên không? ( kết luận ở mức α = 0,05 )

Giải. Gọi p là tỉ lệ bệnh B ở ñịa phương sau ñợt ñiều trị

Kiểm ñịnh giả thiết:

Ho: p = po = 0,34 ñối với H1: p < poGiá trị tỉ lệ bệnh B trên mẫu: p = 0,24

4 SO SÁNH HAI TRUNG BÌNH VỚI HAI MẪU ĐỘC LẬP

Xét hai mẫu (X1, X2, , Xn), ñặc tính X có phân phối chuẩn, với kỳ vọng

µX, ñộ lệch chuẩn σX và mẫu (Y1, Y2, , Ym), ñặc tính Y có phân phối chuẩn, với kỳ vọng µY, ñộ lệch chuẩn σY Giả sử hai mẫu trên ñộc lập nhau Chúng ta muốn kiểm ñịnh xem giữa µX và µY, thể hiện qua xy, có khác nhau không? Phân biệt 2 trường hợp:

4.1 Trường hợp 1: Biết σσσσX và σσσσ Y

Trang 7

Chúng ta ñặt giả thiết không Ho là “sự khác nhau giữa xy, là không

có ý nghĩa về mặt thống kê”, hay hai mẫu trên ñược rút từ cùng một tổng thể, i.e

µX = µY, và σX = σY Vậy, chúng ta phải có quyết ñịnh giữa hai giả thiết:

=

tuân theo luật phân phối chuẩn N(0, 1)

Thí dụ Người ta cho hai nhóm học sinh, theo thứ tự, ñại diện cho hai trường A và B, làm một bài kiểm tra Nhóm thứ nhất gồm 40 học sinh, có ñiểm trung bình 7,4; nhóm thứ hai gồm 50 học sinh, có ñiểm trung bình 7,8 Dựa vào mẫu trên, có thể kết luận rằng: Điểm trung bình của trường B tốt hơn ñiểm trung bình của trường A không? (kết luận ở mức ý nghĩa 4%) Biết rằng ñiểm số của mỗi học sinh của hai trường A và B có phân phối chuẩn với ñộ lệch chuẩn, theo thứ tự, là 0,8 và 0,7

Giải

Gọi X và Y, theo thứ tự, là biến ngẫu nhiên chỉ ñiểm số của mỗi học sinh

của hai trường A và B thì X ~ N(µX, (0,8)2 ) và Y ~ N(µY, (0,7)2 )

Chúng ta phải có quyết ñịnh giữa hai giả thiết:

Ho: µX = µY và H1: µX < µYNếu Ho ñúng thì BNN

Trang 8

tuân theo luật phân phối Student với (n + m − 2) bậc tự do

Trắc nghiệm t ñược sử dụng như trong trường hợp kiểm ñịnh giả thiết về

trung bình

Thí dụ Trong một công ty sản xuất bóng ñèn, người ta muốn kiểm tra sự làm việc của hai phân xưởng A và B Một mẫu gồm n = 10 bóng ñèn của phân xưởng A cho tuổi thọ trung bình 4000 giờ với ñộ lệch chuẩn 200 giờ Một mẫu gồm m = 8 bóng ñèn của phân xưởng B cho tuổi thọ trung bình 4300 giờ với ñộ lệch chuẩn 250 giờ Biết rằng tuổi thọ của mỗi bóng ñèn của haơ phân xưởng A

và B, theo thứ tự, tuân theo luật phân phối chuẩn có cùng phương sai Hãy cho kết luận về sự khác nhau giữa tuổi thọ trung bình của hai loại bóng ñèn trên ở mức ý nghĩa 1%

Giải.

Gọi X và Y lần lượt là BNN chỉ tuổi thọ của bóng ñèn của phân xưởng A

và B Kiểm ñịnh giả thiết:

Ho: µX = µY ñối với H1: µX ≠ µY Nếu Ho ñúng thì BNN

=

+ ~ t(10 + 8 −−−− 2)

Trang 9

10 8 2

X + Y

= + − = 49 843 75 . , ;

10 8

4000 430049843,75 0,225 2,8329

x y s

×+

Vì |t |< gtth nên không thể bác bỏ giả thiết Ho ở mức 1%

Vậy, chúng ta kết luận rằng: Với mức ý nghĩa 1%, sự khác nhau về tuổi thọ trung bình của hai loại bóng ñèn trên là không có ý nghĩa về mặt thống kê

5 SO SÁNH HAI TRUNG BÌNH VỚI DÃY SỐ LIỆU TỪNG CẶP

Phép kiểm ñịnh trên về hiệu hai trung bình nêu trên dựa trên cơ sở hai mẫu ñộc lập Tuy nhiên, trong nhiều trường hợp, hai mẫu ñược chọn như là các giá trị ñược quan sát từng cặp (xi,yi), không ñộc lập; e.g ño huyết áp của mỗi bệnh nhân trước và sau khi ñiều trị bằng một loại thuốc

Trong trường hợp này, ñặt D = X − Y, chúng ta có dãy số liệu trên mẫu tương ứng: di = xiyi, (i = 1, 2, ., n) ( hiệu giữa hai giá trị của cặp thứ i) Chúng ta trở về trường hợp một mẫu (D1, D2, ., Dn), ñặc tính D và giả thiết không:

Giải

Trang 10

6 SO SÁNH HAI TỈ LỆ VỚI HAI MẪU LỚN ĐỘC LẬP

Giả sử mẫu (X1, X2, , Xn), ñặc tính X ~ b(p1), có tỉ lệ mẫu P1 và giá trị tỉ

lệ mẫu p1 ; mẫu (Y1, Y2, , Ym), ñặc tính Y ~ b(p2), có tỉ lệ mẫu P2 và giá trị

tỉ lệ mẫu p2 Chúng ta muốn kiểm ñịnh xem sự khác nhau giữa p1p2 là có ý nghĩa về mặt thống kê không? Trắc nghiệm U sẽ ñược dùng khi n ≥ 30, m ≥ 30,

1

np ≥ 5, n(1 − p1) ≥ 5, mp2 ≥ 5 và m(1− p2) ≥ 5

Chúng ta ñặt giả thiết không Ho là “ sự khác nhau giữa p1p2là không

có ý nghĩa về mặt thống kê ”, i.e hai mẫu trên ñược rút từ cùng một tổng thể có ước lượng tỉ lệ là

Trang 11

Thí dụ Để so sánh về tỉ lệ một loại bệnh B ñối với trẻ sơ sinh trai và trẻ sơ

sinh gái, người ta quan sát 100 bé trai thấy có 20 cháu mắc bệnh B; quan sát 120

bé gái thấy có 30 cháu mắc bệnh B, Hỏi tỉ lệ nhiễm bệnh B ñối với bé trai và gái

có như nhau không? ( kết luận với mức ý nghĩa α = 0,01 )

Giải.

Giả sử p 1 và p2 lần lượt là tỉ lệ bệnh B của bé trai và bé gái

Kiểm ñịnh giả thiết:

Ho: p1 = p2 ñối với H1: p1 ≠ p2Nếu Ho ñúng, thì hai mẫu trên ñược xem như rút từ cùng một tổng thể

7 KIỂM ĐỊNH GIẢ THIẾT VỀ PHƯƠNG SAI

Giả sử tổng thể X có phân phối N(µ, σ2), trong ñó σ chưa biết Dựa vào mẫu

cỡ n, chúng ta kiểm ñịnh giả thiết H0: σ2 = σ20 ở mức ý nghĩa α cho trước Nếu H0 ñúng thì biến ngẫu nhiên

Trang 12

tuân theo luật phân phối χ 2 (n − 1)

Trắc nghiệm dựa trên phân phối của Y có thể là trắc nghiệm 1 ñuôi hay 2 ñuôi Chúng ta dễ dàng tìm ñược giá trị tới hạn trong mỗi trường hợp

(a) Trường hợp giả thiết ñối là H1: σ 2 < σ20:

gtth = χ2α( n − 1) và H0 bị bác bỏ nếu y < gtth (b) Trường hợp giả thiết ñối là H1: σ 2 > σ20:

Thí dụ Bằng phương pháp cũ, người ta tìm ñược hàm lượng ñạm trong

một loại hạt ñạt mức trung bình là 4,2% với ñộ lệch chuẩn 0,45% Người ta làm với phương pháp mới lặp lại 5 lần với kết quả như sau: 2,3%; 2,4%; 4,0%; 5,5%; 5,8% Hãy cho kết luận về hiệu quả của hai phương pháp trên ở mức ý nghĩa 1%

Giải.

Gọi X là BNN chỉ hàm lượng ñạm trong loại hạt ñang khảo sát

Giá trị trung bình mẫu: x = 4,0%, ñộ lệch chuẩn chuẩn mẫu: s = 1,654% Nếu chỉ so sánh giá trị trung bình thì hiệu quả của hai phương pháp không khác nhau mấy Để ñánh giá hiệu quả của hai phương pháp, chúng ta hãy kiểm ñịnh về phương sai của hai phương pháp Gọi σ2 là phương sai của phương pháp mới, chúng ta kiểm ñịnh giả thiết:

Ho: σ2 = σ02 = (0,45)2 ñối với H1: σ2 > (0,45)2

Trang 13

Nếu Ho ñúng thì biến ngẫu nhiên

22

8 TRẮC NGHIỆM χχχχ2

Trong nhiều trường hợp, các kết quả thu thập ñược trên mẫu thường không hoàn toàn phù hợp với những kết quả tương ứng trên lý thuyết Thí dụ, mặc dù theo lý thuyết, khi chúng ta gieo một ñồng tiền vô tư 100 lần thì sẽ xuất hiện 50 lần mặt sấp và 50 lần mặt ngửa, nhưng thật hiếm khi chúng ta quan sát ñược ñúng kết quả trên

Giả sử với một tổng thể nhất ñịnh, dựa trên một số tiêu chuẩn nào ñó, người

ta chia tổng thể ñó thành nhiều lớp (biến cố ) rời nhau: B1, B2, , Bk, với các xác suất, theo thứ tự, là p1, p2, , pk, với p1+ p2 + + pk = 1

Một mẫu cỡ n ñược thành lập từ tổng thể trên Ký hiệu oi là tần số quan sát ñược trên mẫu của biến cố Bi, i = 1, 2, , k

Giả thiết Ho: Xác suất ñể một phần tử rơi vào một trong các lớp B1, B2, ., Bk, lần lượt là p1, p2, , pk

Giả thiết H1: Phủ ñịnh mệnh ñề trên

Nếu Ho ñúng thì số phần tử kỳ vọng rơi vào một trong các lớp B1, B2,

., Bk , gọi là tần số lý thuyết, lần lượt là:

Trang 14

e1 = np1, e2 = np2, , ek = npkNhư vậy, chúng ta có bảng:

8.1 Định lý Phân phối mẫu của Q2 rất tiệm cận với phân phối χ2 ñịnh bởi:

Bậc tự do ν ñược cho bởi:

a) ν = k − 1 nếu các tần số lý thuyết có thể ñược tính mà không có một sự ước lượng nào từ mẫu

b) ν = k − 1− m nếu các tần số lý thuyết có thể ñược tính nhờ vào

m ước lượng từ mẫu

Trong thực hành, các tần số lý thuyết ñược tính trên cơ sở của giả thiết H0 Nếu với giả thiết này và với mức ý nghĩa α cho trước, giá trị của Q2 lớn hơn 2

Dữ liệu dùng trong trắc nghiệm χ2

thường ñược trình bày dưới dạng bảng Thí dụ như bảng nêu trên gọi là bảng một chiều, bảng 1 × c Mở rộng, chúng ta có

Trang 15

bảng hai chiều dạng h × c, trong ñó, các tần số quan sát ñược viết trong h hàng và

c cột Các báng như thế ñược gọi là các Bảng ngẫu nhiên

Tương ứng với mỗi tần số quan sát trong bảng ngẫu nhiên h × c, có một tần

số lý thuyết ñược tính dựa trên giả thiết không Những tần số trong những ô của

một bảng ngẫu nhiên ñược gọi là những Tần số ô Tổng các tần số theo hàng

hoặc theo cột ñược gọi là Tần số lề

Theo Định lý 6.8.1, phân phối mẫu của BNN Q2 tiệm cận phân phối χ2 với bậc tự do ν, với h > 1 và c > 1, ñược cho bởi:

a) ν = (h − 1)(c − 1) nếu các tần số lý thuyết có thể ñược tính mà không có một sự ước lượng nào từ mẫu

b) ν = (h − 1)(c − 1) − m nếu các tần số lý thuyết có thể ñược tính nhờ vào m ước lượng từ mẫu

8.2 Thí dụ Quan sát khối lượng X (kg) của một nhóm người cùng lứa

tuổi, kết quả ñược ghi lại như sau:

Xi (30, 40] (40, 45] (45, 50] (50, 55] (55, 60] (60, 70]

Có tài liệu cho rằng khối lượng của những người cùng lứa tuổi trên tuân theo luật phân phối chuẩn Tài liệu trên có phù hợp với kết quả quan sát trên mẫu không? ( kết luận ở mức α = 0,05 )

Ước lượng trung bình và phương sai của X bằng các giá trị của trung bình

và phương sai mẫu

Từ mẫu, chúng ta tính ñược: x = 50,075 và s2 = 60,032

Nếu H0 ñúng thì X ~ N(50 ; 60) Khi ñó:

Ngày đăng: 22/01/2015, 23:04

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w