Bài giảng Lý thuyết xác suất thống kê toán - Chương 8: Kiểm định giả thiết thống kê

73 45 0
Bài giảng Lý thuyết xác suất thống kê toán - Chương 8: Kiểm định giả thiết thống kê

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài giảng Lý thuyết xác suất thống kê toán - Chương 8: Kiểm định giả thiết thống kê trình bày các vấn đề của kiểm định giả thiết thống kê như khái niệm, tiêu chuẩn kiểm định giả thuyết thống kê, miền bác bỏ giả thuyết, giá trị quan sát của tiêu chuẩn kiểm định, quy tắc kiểm định thống kê. Mời các bạn cùng tham khảo.

CHƯƠNG Kiểm định giả thiết thống kê (3LT + 3BT) Khái niệm Giả thiết thống kê (giả thiết) phát biểu liên quan đến số đặc trưng ĐLNN, quy luật phân phối ĐLNN, tính độc lập ĐLNN… Kiểm định dựa vào mẫu cụ thể, thực số thủ tục để đưa định chấp nhận bác bỏ giả thiết thống kê Giả thiết cần kiểm định ký hiệu Ho Giả thiết phải chấp nhận bác bỏ Ho ký hiệu H1 Vì định đưa dựa mẫu cụ thể nên định bị sai Ta gọi sai lầm loại I định bác bỏ Ho Ho đúng, sai lầm loại II định chấp nhận Ho Ho sai Xác suất mắc sai lầm loại I gọi mức ý nghóa, ký hiệu α Để tiến hành thủ tục kiểm định, trước tiên người ta xây dựng tiêu chuẩn kiểm định sau: Xét ĐLNN X giả thiết Ho, H1 Xét mẫu ngẫu nhiên X1, X2, …, Xn Tiêu chuẩn kiểm định thống kê G = G(X1, X2, …, Xn) chọn cho Ho quy luật phân phối xác suất ĐLNN G xác định Với mức ý nghóa α, chọn miền bác bỏ Ho laø Wα cho: P(G∈Wα /Ho) = α Sau lấy mẫu cụ thể, hàm G có giá trị kiểm định g Quy tắc định sau: * g∈Wα : bác bỏ Ho * g∉Wα : chấp nhận Ho Kiểm định số đặc trưng tổng thể 2.1 Kiểm định trung bình tổng thể 2.1.1 Kiểm định hai phía (H1 : µ ≠ µo) Cho trước mẫu cụ thể kích thước n, xét phát biểu cho giá trị µo trung bình tổng thể µ với mức ý nghóa α Để xem phát biểu có chấp nhận hay không, ta cần kiểm định giả thiết: Ho: µ = µo với H1: µ ≠ µo TH1,2,3 n > 30 "n ≤ 30, biết σ2 tổng thể có phân phối Chuẩn" Khi trường hợp xảy với X −µ mẫu ngẫu nhiên kích thước n, có phân phối σ/ n Chuẩn Chính Tắc hay xấp xỉ với phân phối Chuẩn Chính Tắc Trường hợp chưa biết σ thay S Phân tích vấn đề theo cách I Giả định Ho đúng, tức µ = µo Lúc ĐLNN X − µo có phân phối Chuẩn Chính Tắc, biến σ/ n X − µo ≤ zα/2 xảy với xác suất 1–α Với α từ 5% cố σ/ n X − µo trở xuống, ta cho biến cố ≤ zα/2 σ/ n chắn xảy thực tế, tức với mẫu cụ thể kích x − µo thước n phải có ≤ zα/2 Nếu với σ/ n x − µo > zα/2 mẫu cụ thể kích thước n, ta thấy σ/ n điều vô lý, chứng tỏ giả định µ = µo sai Vậy dấu hiệu xảy ta định bác bỏ giả thiết Ho X − µo Khi có phân phối Chuẩn Chính Tắc σ/ n X − µo biến cố > zα/2 xảy với xác suất σ/ n α Vậy lập luận để dẫn đến điều vô lý nêu bị sai với xác suất α, tức định bác bỏ giả thiết Ho gặp sai lầm với xác suất α Phân tích vấn đề theo cách II Kết việc ước lượng µ với độ tin cậy 1–α cho thấy biến cố µ∈[ X – ε, X + ε], viết cách khác  X – µ≤ ε, xảy với xác suất 1–α Giả định Ho đúng, tức µ = µo, biến cố  X – µo≤ ε phải xảy với xác suất 1–α Với α từ 5% trở xuống, ta cho biến cố  X – µo≤ ε chắn xảy thực tế, tức với mẫu cụ thể kích thước n ta phải có  x – µo≤ ε Nếu với mẫu cụ thể kích thước n, ta thấy  x – µo> ε điều vô lý, chứng tỏ giả định µ = µo sai Vậy dấu hiệu xảy ta định bác bỏ giả thiết Ho Ta có: x − µo  x – µo > ε = zα/2 σ ⇔ > zα/2 σ/ n n Vì độ tin cậy 1–α nên Ho đúng, biến cố  X – µo > ε xảy với xác suất α Vậy lập luận để dẫn đến điều vô lý nêu bị sai với xác suất α, tức định bác bỏ giả thiết Ho gặp sai lầm với xác suất α Các phân tích gợi ý cho ta chọn: X − µo Tiêu chuẩn kiểm định: G = σ/ n (Nếu chưa biết σ thay S) Miền bác bỏ Ho: Wα = (–∞, –zα/2)∩(zα/2, +∞) TH4 n ≤ 30, chưa biết phương sai tổng thể σ2, tổng thể có phân phối Chuẩn X −µ Lúc có phân phối Student n–1 bậc tự S/ n Tất lập luận bên áp dụng được, miễn thay zα/2 t(n–1)α/2 Vậy ta chọn: X − µo Tiêu chuẩn kiểm định: G = S/ n Miền bác bỏ Ho: Wα = (–∞, –tα/2)∩(tα/2, +∞) Tóm tắt – Kiểm định hai phía trung bình tổng thể (H1: µ ≠ µo) Cho trước mẫu cụ thể mức ý nghóa α Tính giá trị kiểm định (KĐ) tra giá trị tới hạn (TH) Nếu giá trị kiểm định có trị tuyệt đối lớn giá trị tới hạn bác bỏ Ho (KĐ > TH) x − µo Công thức tính giá trị kiểm định: σ/ n (Nếu chưa biết σ thay s) Giá trị tới hạn tra theo hai trường hợp: n > 30 "n ≤ 30, biết σ2 tổng thể có phân phối Chuẩn" Giá trị tới hạn: zα/2 n ≤ 30, chưa biết σ2 tổng thể có phân phối Chuẩn Giá trị tới hạn: t(n–1)α/2 k = r = α = 5% 2 ⇒ TH = χ (k–r–1)α = χ (4)0,05 = 9,48773 =CHIINV(0,05;4) Điều kiện bác bỏ Ho KĐ > TH không thoả Quyết định chấp nhận giả thiết Ho Dự đoán (mức ý nghóa 5%) (2) Gọi X lượng khách vào quán khoảng thời gian 30 phút Quan sát 100 lần bảng số liệu sau: X Tần số 35 30 15 15 Với mức ý nghóa 5%, cho biết X có phải ĐLNN có phân phối Poisson không? Ta cần kiểm định giả thiết: Ho : X có phân phối (λ) H1 : X có phân phối không theo quy luật Poisson Giả định Ho đúng, tức xem X có phân phối (λ) Tham số λ theo giá trị ước lượng hợp lý tối đa: ∑ nixi = λ= ∑ ni Miền giá trị X tập hợp số nguyên không âm Dựa theo mẫu cụ thể, chia miền giá trị X thành tập hợp S1, S2, , S5 Tính giá trị pi = P(x∈Si) theo công thức phân phối (3) Lập bảng tính giá trị tới hạn: ni Si ≤1 35 30 15 ≥ 15 Σ 100 pi 0,19915 0,22404 0,22404 0,16803 0,18474 npi 19,915 22,404 22,404 16,803 18,474 (ni–npi)2 (ni–npi)2/npi 222,4572 11,17034 158,6592 7,08174 57,69922 2,57540 3,250809 0,19347 12,06868 0,65328 21,67421 Giaù trị kiểm định: KĐ = 21,67421 Giá trị tới hạn: k = r = α = 5% 2 ⇒ TH = χ (k–r–1)α = χ (3)0,05 = 7,815 =CHIINV(0,05;3) Điều kiện bác bỏ Ho KĐ > TH thoả Quyết định bác bỏ giả thiết Ho, chấp nhận giả thiết H1 ĐLNN X có phân phối không theo quy luật Poisson (mức ý nghóa 5%) (3) Gọi X chiều cao (m) loại Lấy mẫu số đo chiều cao bảng số liệu sau: X Số 4,5-5,5 10 5,5-6,5 22 6,5-7,5 26 7,5-8,5 28 8,5-9,5 14 Với mức ý nghóa 5%, cho biết chiều cao loại có phải ĐLNN có phân phối Chuẩn không? Ta cần kiểm định giả thiết: Ho : X có phân phối (µ, σ2) H1 : X có phân phối không theo quy luật Chuẩn Giả định Ho đúng, tức xem X có phân phối (µ , σ2) Tính tham số µ, σ2 theo giá trị ước lượng hợp lý tối đa Lấy trung điểm xi khoảng, ta có: nixi ∑ µ= = 7,14 n i ∑ ∑ ni xi2  ni xi  σ2 = −∑  = 1,4404 ⇒ σ 1,2 ∑ ni  ∑ ni  Miền giá trị X tập số thực Dựa theo mẫu cụ thể, chia tập số thực thành tập hợp S1, S2, , S5 Tính giá trị pi = P(x∈Si) theo công thức phân phối (16,35; 5) Lập bảng tính giá trị kiểm ñònh: ni pi npi (ni–npi)2 (ni–npi)2/npi Si ≤ 5,5 10 0,08586 8,586 1,99801 0,23269 5,5-6,5 22 0,21104 21,104 0,80344 0,03807 6,5-7,5 26 0,32101 32,101 37,22219 1,15953 7,5-8,5 28 0,25355 25,355 6,99527 0,27589 ≥ 8,5 14 0,12854 12,854 1,31397 0,10222 Σ 100 1,80841 Giá trị kiểm định: KĐ = 1,80841 Giá trị tới hạn: k = r = α = 5% 2 ⇒ TH = χ (k–r–1)α = χ (2)0,05 = 5,9915 =CHIINV(0,05; 2) Điều kiện bác bỏ Ho KĐ > TH không thoả Quyết định chấp nhận giả thiết Ho ĐLNN X có phân phối Chuẩn (mức ý nghóa 5%) 3.2 Kiểm định tính độc lập hai dấu hiệu Xét hai thuộc tính phần tổng thể mà ta gọi hai dấu hiệu A B Giả sử dấu hiệu A có h trạng thái A1, A2,…, Ah dấu hiệu B có k trạng thái B1, B2,…, Bk Gọi Ci (Dj) biến cố gặp phần tử có trạng thái Ai (Bj) Hai dấu hiệu A B gọi độc lập cặp biến cố Ci Dj độc lập, tức là: P(Ci.Dj) = P(Ci).P(Dj) i = 1, k; j = 1, h Ta cần kiểm định giả thiết: Ho : Dấu hiệu A B độc lập H1 : Dấu hiệu A B không độc lập Xét mẫu ngẫu nhiên kích thước n Gọi Mi số lần gặp phần tử có trạng thái Ai, Nj số lần gặp phần tử có trạng thái Bj, Nij số lần gặp phần tử có trạng thái Ai Bj mi, nj, nij giá trị Mi, Nj, Nij ứng với mẫu cụ thể kích thước n Khi n đủ lớn, theo định nghóa Thống Kê Xác Suất, Mi/n, Nj/n Nij/n xấp xỉ với P(Ci), P(Dj) P(Ci.Dj) Vậy A B độc lập tần số Nij gần tần số kỳ vọng Mi.Nj/n Giả định Ho đúng, n đủ lớn ĐLNN sau có phân phối xấp xỉ phân phối Chi Bình (h–1)(k–1) bậc tự do: h k ∑∑ i =1 j =1 h Với lưu ý ( Nij − Mi N j / n ) Mi N j / n k ∑ ∑ Nij = n i =1 j =1 h vaø k ∑ ∑ Mi N j = n2, bieåu i =1 j =1  h k N ij2  −  Ta thức rút gọn thành n  ∑ ∑  i =1 j=1 Mi N j    coù:  h k N ij2  P( n  ∑ ∑ −  < χ α) = 1–α  i =1 j=1 Mi N j    Vậy với mẫu cụ thể kích thước n, ta thấy  h k n ij2  n∑∑ −  > χ α giả thiết Ho bị bác bỏ  i =1 j=1 m i n j    Theo phân tích trên, ta chọn:  h k N ij2  − 1 Tiêu chuẩn kiểm định: G = n  ∑ ∑  i =1 j=1 Mi N j    Miền bác bỏ Ho: Wα = (χ α, +∞) Vậy thủ tục kiểm định dấu hiệu A B độc lập sau: Cho trước mẫu cụ thể kích thước n dạng bảng có tần số ((Ai, Bj), nij) mức ý nghóa α Từ số liệu mẫu ta lập bảng ghi tần số xuất biến cố Ci.Dj nij Tính tần số xuất biến cố Ci (Dj) mi = k ∑ nij j =1 (ni = h ∑ nij ) Tính giá trị kiểm định KĐ i =1 tra giá trị tới hạn TH Nếu giá trị kiểm định lớn giá trị tới hạn bác bỏ Ho (KĐ > TH) Công thức tính giá trị kiểm định:  h k n ij2  n∑∑ − 1  i =1 j=1 m i n j    Giá trị tới hạn: χ ((h–1)(k–1))α Ví dụ (1) Để đánh giá ảnh hưởng khuyến mại đến thời gian sử dụng điện thoại di động, MobiVN điều tra số khách hàng thu số liệu sau: Hình thức Thời gian sử dụng đtdd khuyến mại Không đổi Có tăng Tăng mạnh Giảm cước 26 24 10 Miễn phí sms 25 50 15 Với mức ý nghóa 5% khuyến mại có ảnh hưởng đến thời gian sử dụng điện thoại di động không? Ta cần kiểm định giả thiết: Ho : Khuyến mại không ảnh hưởng đến thời gian sử dụng điện thoại di động H1 : Khuyến mại có ảnh hưởng đến thời gian sử dụng điện thoại di động Lập bảng để tính giá trị kiểm định: nij Σ 26 24 10 60 25 50 15 90 Σ 51 74 25 150 Σ nij2/minj 0,2209 0,1297 0,0667 0,4173 0,1362 0,3754 0,1000 0,6115 1,0289 Σ Giaù trị kiểm định: KĐ = 150(1,0289 – 1) = 4,3279 Giá trị tới hạn: h = k = α = 5% 2 ⇒ TH = χ ((h–1)(k–1))α = χ (2)0,05 = 5,9915 =CHIINV(0,05; 2) Điều kiện bác bỏ Ho KĐ > TH không thoả Quyết định chấp nhận giả thiết Ho Khuyến mại không ảnh hưởng đến thời gian sử dụng điện thoại di động (với mức ý nghóa 5%) (2) Để biết giới tính sinh viên có ảnh hưởng hay không đến loại hình giải trí, người ta thăm dò 50 sinh viên thu số liệu sau: Giới tính Nam Nữ Loại hình giải trí Xem bóng đá Xem phim Nghe nhạc 20 5 5 10 "Giới tính sinh viên có ảnh hưởng đến loại hình giải trí" có không với mức ý nghóa 5%? Ta cần kiểm định giả thiết: Ho : Giới tính sinh viên không ảnh hưởng đến loại hình giải trí H1 : Giới tính sinh viên có ảnh hưởng đến loại hình giải trí Lập bảng để tính giá Σ nij 20 5 30 5 10 20 Σ 25 10 15 50 trị kiểm định: Σ nij2/minj 0,5333 0,0833 0,0556 0,6722 0,0500 0,1250 0,3333 0,5083 1,1806 Σ Giá trị kiểm định: KĐ = 50(1,1806 – 1) = 9,0278 Giá trị tới hạn: h = k = α = 5% 2 ⇒ TH = χ ((h–1)(k–1))α = χ (2)0,05 = 5,9915 =CHIINV(0,05; 2) Điều kiện bác bỏ Ho KĐ > TH thoả Quyết định chấp bác bỏ giả thiết Ho, chấp nhận giả thiết H1 Nhận xét giới tính sinh viên có ảnh hưởng đến loại hình giải trí (với mức yù nghóa 5%) ... với xác suất α Vậy lập luận để dẫn đến điều vô lý nêu bị sai với xác suất α, tức định bác bỏ giả thiết Ho gặp sai lầm với xác suất α Các phân tích gợi ý cho ta chọn: X − µo Tiêu chuẩn kiểm định: ... tiến hành thủ tục kiểm định, trước tiên người ta xây dựng tiêu chuẩn kiểm định sau: Xét ĐLNN X giả thiết Ho, H1 Xét mẫu ngẫu nhiên X1, X2, …, Xn Tiêu chuẩn kiểm định thống kê G = G(X1, X2, …,... bỏ Ho KĐ < TH thoả, định bác bỏ giả thiết Ho, chấp nhận giả thiết H1 Tỷ lệ người hút thuốt có giảm sau vận động tuyên truyền (với mức ý nghóa 5%) b) Ta cần kiểm định giả thiết: Ho: p = po "Tỷ

Ngày đăng: 05/11/2020, 19:20

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan