Bài giảng Toán ứng dụng - P
Cao Hào Thi 89 Chương 8 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (Tests of Hypotheses) Thông thường đối với tham số θ chưa biết của tập hợp chính ta có thể đưa ra nhiều giả thuyết về θ. Vấn đề đặt ra là làm thế nào kiểm định được giả thuyết nào thích hợp với các số liệu của mẫu quan sát được (x1, x2, …, xn ). 8.1 NHỮNG KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 8.1.1 Giả thuyết thống kê ( Statistical Hypothesis) Là một giả sử hay một phát biểu có thể đúng, có thể sai liên quan đến tham số của một hay nhiều tập hợp chính. 8.1.2 Giả thuyết không (giả thuyết đơn) và giả thuyết ngược lại (đối thuyết) (Null Hypothesis & Alternative Hypothesis) Giả thuyết không: là sự giả sử mà ta muốn kiếm định thường được ký hiệu là Ho. Giả thuyết ngược lại: Việc bác bỏ giả thuyết không sẽ dẫn đến việc chấp nhận giả thuyết ngược lại. Giả thuyết ngược lại thường được ký hiệu là H1. Ví dụ Kiếm định giả thuyết Ho: θ ≥ θo có thể θ = θo Với H1: θ < θo Kiếm định giả thuyết Ho: θ ≤ θo có thể θ = θo Với H1: θ > θo Kiếm định giả thuyết Ho: θ = θo Với H1: θ ≠ θo 8.1.3 Các loại sai lầm trong việc kiểm định giả thuyết thống kê Việc kiểm định giả thuyết thống kê có thể phạm phải 2 loại sai lầm a) Sai lầm loại I (type I error) Là loại sai lầm mà chúng ta phạm phải trong việc bác bỏ giả thuyết Ho khi Ho đúng. Xác suất của việc bác bỏ Ho khi Ho đúng là xác suất của sai lầm loại I và được ký hiệu là α α = P ( bác bỏ Ho / Ho đúng) = P(type I error) α : còn được gọi là mức ý nghĩa ( level of significance) α = 0,05; 0,01 ; 0,001 … Cao Hào Thi 90 b) Sai lầm II (type II error) Là loai sai lầm mà chúng ta phạm phải khi không bác bỏ giả thuyết Ho khi Ho sai. Xác suất của việc không bác bỏ Ho khi Ho sai là xác suất của sai lầm loại II và được ký hiệu là β. β = P (không bác bỏ Ho /Ho sai) = P(type II error) Bản chất của Ho Quyết định về giả thuyết không Ho Ho đúng Ho sai Không bác bỏ (chấp nhận ) Quyết định đúng Prob = 1- α P (không bác bỏ Ho / Ho) = 1-α Sai lầm loại II Prob = β Bác bỏ Sai lầm loại I Prob = α (α = mức ý nghĩa kiểm định) Quyết định đúng Prob = 1 - β (1 - β: năng lực kiểm định) 8.1.4 Miền bác bỏ và miền chấp nhận ( Rejection Region & Acceptance Region ) Tất cả các giá trị có thể có của các đại lượng thống kê trong kiểm định có thể chia làm 2 miền: miền bác bỏ và miền chấp nhận. Miền bác bỏ là miền chứa các giá trị làm cho giả thuyết Ho bị bác bỏ. Miền chấp nhận là miền chứa các giá trị giúp cho giả thuyết Ho không bị bác bỏ. Trong thực tế khi Ho không bị bác bỏ cùng nghĩa là nó được chấp nhận. Giá trị chia đôi hai miền được gọi là giá trị giới hạn (Critical value) 8.1.5 Kiểm định một đầu và kiểm định 2 đầu (one – tailed test & two – tailed test) a) Kiểm định một đầu Khi giả thuyết ngược lại H1 có tính chất 1 phía (one – sided) thì việc kiểm định được gọi là kiểm định 1 đầu. Ho: θ ≤ θo hay Ho: θ ≥ θo H1: θ > θo H1: θ < θo b) Kiểm định hai đầu: Khi giả thuyết ngược lại H1 có tính chất 2 phía (two – sided) thì việc kiểm định được gọi là kiểm định 2 đầu. Ho: θ = θo H1: θ ≠ θo Cao Hào Thi 91 8.2 CÁC BƯỚC CỦA VIỆC KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ: Gồm 6 bước: Bước 1: Thành lập giả thuyết Ho Ví dụ: Ho: θ = θo Ho: θ ≤ θo Ho: θ ≥ θo Bước 2: Thành lập giả thuyết H1 Ví dụ: H1: θ < θo H1: θ > θo H1: θ ≠ θo Bước 3: Xác định mức ý nghĩa α Bước 4: Chọn các tham số thống kê thích hợp cho việc kiếm định và xác định các miền bác bỏ, miền chấp nhận và giá trị giới hạn. Bước 5: Tính toán các giá trị của các tham số thống kê trong việc kiểm định dựa trên số hiệu của mẫu ngẫu nhiên. Bước 6: Ra quyết định: Nếu các giá trị tính toán rơi vào miền bác bỏ Ho thì ra quyết định bác bỏ Ho. Ngược lại sẽ chấp nhận Ho. 8.3 KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH µ CỦA PHÂN PHỐI CHUẨN N(µ,σ2) KHI ĐÃ BIẾT σ2 Cho ( x1, x2 , …, xn) là mẫu ngẫu nhiên cỡ n được lấy từ tập họp chính tuân theo phân phối chuẩn N (µ,σ2 ) trong đó σ2 đã biết. 8.3.1 Trường hợp 1 Ho : µ = µo hay µ ≥ µo H1 : µ < µo ZαKhông bác bỏ H00Bác bỏ H0 Cao Hào Thi 92 Miền bác bỏ R: Bác bỏ Ho nếu Ztt = nX/0σµ−< - αZ 8.3.2 Trường hợp 2: Ho : µ = µo hay µ ≤ µo H1 : µ > µo ZαKhông bác bỏ H00Bác bỏ H0α Miền bác bỏ R: Bác bỏ Ho nếu Ztt = nX/0σµ− > αZ 8.3.3 Trường hợp 3: Ho : 0µ=µ H1 : 0µ≠µ -Zα/2Không bác bỏ H00Bác bỏ H0α/2 α/2Zα/2Bác bỏ H0 Miền bác bỏ R: Bác bỏ Ho nếu Ztt < -2/αZ hoặc Ztt > 2/αZ Với : Ztt = nX/0σµ− Thí dụ Trong một nhà máy bánh kẹo, một máy tự động sản xuất ra các thanh sô cô la với trọng lượng qui định 250g. Biết rằng trọng lượng các thanh sô cô la được sản xuất ra có phân bố chuẩn N(µ,52). Trong một ngày bộ phân kiểm tra kỹ thuật chọn một mẫu ngẫu nhiên gồm 16 thanh sô cô la và tính trọng lượng trung bình của chúng được 244g. Có thể khẳng Cao Hào Thi 93 định máy tự động sản xuất ra các thanh sô cô la có trọng lượng nhỏ hơn qui định không? Với mức ý nghĩa α=0,05 kiểm định giả thuyết thống kê tương ứng. Giải 1/ Ho : µ = 250g 2/ H1 : µ < 250g 3/ α = 0,05 4/ ==05,0ZZα 16,45 ⇒ -=αZ-1,645 5/ 8,416/5250246/0−=−=−=nXZttσµ =2σ52 ⇒ σ = 5 n = 16 X = 244g , 0µ = 250g 6/ Ztt = -4,8 < -05,0Z = -1,645 Ra quyết định: Bác bỏ giả thuyết Ho ở mức ý nghĩa 5%. Nghĩa là: máy tự động sản xuất sô cô la có trọng lượng nhỏ hơn qui định ⇒ Phải điều chỉnh lại máy Thí dụ Một máy khoan trong dây chuyền sản xuất dùng để khoan lỗ trên các bản thép. Khi máy khoan hoạt động đúng chức năng thiết kế đường kính các lỗ khoan sẽ tuân theo phân phối chuẩn với số trung bình là 2 inches và độ lệch chuẩn là 0,06 inches. Trong quá trình kiểm tra định kỳ xem máy khoan có hoạt động đúng hay không, người ta lấy đo ngẫu nhiên các lỗ đã khoan. Giả sử độ lệch chuẩn không thay đổi. Mẫu ngẫu nhiên gồm 9 lỗ khoan cho ta đường kính trung bình của mẫu là 1,95 inches. Kiểm định giả thuyết Ho : số trung bình của tập hợp chính là 2 inches. Với H1 : số trung bình của tập hợp chính khác 2 inches. Trong quá trình kiểm định dùn α = 5% Giải: 1/ Ho : µ = µ0 = 2 2/ H1 : µ ≠ 2 3/ α = 0,05 4/ 96,1025,02/==ZZα ⇒ -96,12/−=αZ 5/ X= 1,95; µ0 =2; σ = 0,06; n = 9 50,29/06,0295,1/0−=−=−=nXZttσµ 6/ Ta có : Ztt < - 96,12/−=αZ Ra quyết định : Bác bỏ giả thuyết Ho ở mức ý nghĩa 5%. ⇒ Máy hoạt động không đúng chức năng thiết kế. Cao Hào Thi 94 8.4 KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH µ CỦA PHÂN PHỐI CHUẨN N(µ,σ2) KHI CHƯA BIẾT σ2 Giả sử ta có mẫu ngẫu nhiên cỡ mẫu là n được lấy từ tập hợp chính tuân theo phân phối chuẩn có số trung bình là µ. Gọi X và Sx là số trung bình và độ lệch chuẩn của mẫu, ta sẽ có 3 trường hợp kiểm định µ với mức ý nghĩa α. 8.4.1 Trường hợp 1: Ho : µ = µo hay µ ≥ µo H1 : µ < µo Miền bác bỏ R : Bác bỏ Ho nếu tn-1 < tn-1,α Với tn-1= nXx/0σµ− , tn-1 tuân theo phân phối Student t với độ tự do n-1 8.4.2 Trường hợp 2: Ho : µ = µo hay µ ≤ µo H1 : µ > µo Miền bác bỏ R: Bác bỏ Ho nếu tn-1 > tn-1,α 8.4.3 Trường hợp 3: Ho : 0µ=µ H1 : 0µ≠µ Miền bác bỏ R: Bác bỏ Ho nếu tn-1 > tn-1,α/2 Hay tn-1 < - tn-1,α/2 t*n-1,αKhông bác bỏ H0Bác bỏ H0α t*n-1,αKhông bác bỏ H0Bác bỏ H0α t*n-1,α/2Không bác bỏ H0Bác bỏ H0Bác bỏ H0-t*n-1,α/2α/2α/2 Cao Hào Thi 95 Thí dụ Nhà quản lý các cửa hàng bán lẻ nhận thấy rằng số lượng hàng bán ra trung bình trong tháng 12 cao hơn 20% so với tháng 11. Theo dõi sổ sách của sáu cửa hàng (được chọn một cách ngẫu nhiên) nhà quản lý nhận thấy phần trăm độ tăng trung bình của lượng hàng bán ra tại 6 cửa hàng trong tháng 12 như sau: 19,2%; 18,4%; 19,8%; 20,2%; 20,4% và 19,0% Giả sử phần trăm độ tăng trung bình của lượng hàng bán ra tại tất cả các cửa hàng trong hệ thống bán lẻ tuân theo phân phối chuẩn Kiểm định giả thuyết rằng phần trăm độ tăng trung bình của lượng hàng bán ra trong tháng 12 là 20% so với tháng 11 với α = 10% Giải: Giả thuyết: Ho : µ = µ0 = 20 H1 : µ ≠ 20 Ta có: α = 10% tn-1, α/2 = t5, 0.05 = 2,015 -tn-1, α/2 = -t5 , 0.05 = -2,015 Xác định X và Sx 5,196117nXix==∑= Sx2 = 0,588 ⇒ Sx = 588,0 = 0,767 tn-1 =nSxx/0µ−= 597,16/767,0205,19−=− Ra quyết định: tn-1, α/2 < tn-1 < tn-1, α/2 -2,015 < -1,597 < 2,015 ⇒ Chấp nhận giả thuyết Ho (Những dữ kiện từ mẫu không đủ mạnh để bác bỏ Ho) 8.5 KIỂM ĐỊNH PHƯƠNG SAI CỦA PHÂN PHỐI CHUẨN N(µ,σ2) Giả sử ta có mẫu ngẫu nhiên cỡ mẫu là n được lấy ra từ tập hợp chính tuân theo phân phối chuẩn có phương sai là σ2 . Gọi S2x là phương sai của mẫu, ta sẽ có 3 trường hợp kiểm định σ2 với mức ý nhĩa là α 8.5.1 Trường hợp 1: Ho : σ2 = σ02 hay Ho : σ2 ≥ σ02 H1 : σ2 < σ02 R : Bác bỏ Ho nếu χ2n-1 < χ2n-1,1-α Với 20221)1(σχxnSn−=− χ2n-1 tuân theo phân phối X2 với độ tự do n-1. Cao Hào Thi 96 8.5.2 Trường hợp 2: Ho : σ2 = σ02 hay Ho : σ2 ≤ σ02 H1 : σ2 > σ02 R : Bác bỏ Ho nếu χ2n-1 > χ2n-1,α 8.5.3 Trường hợp 3: Ho : σ2 = σ02 H1 : σ2 ≠ σ02 R : Bác bỏ Ho nếu χ2n-1 > χ2n-1,α/2 hay χ2n-1 < χ2n-1,1-α/2 Thí dụ Để thỏa mãn tiêu chuẩn đã được ấn định trong hợp đồng là phương sai của hàm lượng chất bẩn trong các lò hàng hoá chất không được vượt quá 4%. Lấy ngẫu nhiên 20 lô hàng ta có phương sai của hàm lượng chất bẩn trong các lô hàng mẫu là 5,62%. Kiểm định giả thuyết phương sai của hàm lượng chất bẩn trong tất cả các lô hàng không quá 4% với α =10%. Giả sử rằng tập hợp chính tuân theo phân phối chuẩn. Giải: Giả thuyết: Ho : σ2 ≤ σ02 = 4 H1 : σ2 > 4 R : Bác bỏ Ho nếu χ2n-1 > Ta có: α = 0,1, n = 20 → χ2n-1,α = χ219,0,1 = 27,20 S2x = 5,62, n = 20, σ20 =4 χ2n-1 = 695,26462,5*19)1(202==−σσxn Ra quyết định: Vì χ2n-1 =26,695 < χ2n-1,α =27,20 ⇒ Không bác bỏ Ho tại mức α =10% 8.6 KIỂM ĐỊNH GIÁ TRỊ TỶ SỐ P CỦA TẬP HỢP CHÍNH TRONG ĐIỀU KIỆN CỠ MẪU LỚN: Gọi P là tỉ số của số lần thành công trong tập hợp chính f là tỉ số của số lần thành công trong n phép thử Khi cỡ mẫu n lớn, thì biến ngẫu nhiên chuẩn hóa n/)p1(ppf−−=∑ sẽ gần đúng có phân phối chuẩn hóa. Ta có 3 trường hợp p với mức ý nghĩa α. Cao Hào Thi 97 8.6.1 Trường hợp 1: Ho : P = P0 hay Ho : P ≥ P0 H1 : P < P0 R : Bác bỏ Ho nếu Ztt < - Zα Với npppfZ/)1( −−= , Z ∼ N (0,1) 8.6.2 Trường hợp 2: Ho : P = P0 hay Ho : P ≤ P0 H1 : P > P0 R : Bác bỏ Ho nếu Z > Zα 8.6.3 Trường hợp 3: Ho : P = P0 H1 : P ≠ P0 R : Bác bỏ Ho nếu Z > Zα/2 Hay Z < -Zα/2 Thí dụ Lấy ý kiến 199 giảng viên về việc day học theo lối tín chỉ thì có 104 giảng viên đồng ý. Kiếm định với mức về giả thuyết cho rằng có một nửa số giảng viên trong trường Bách khoa đồng ý dạy theo lối tín chỉ. Giải Gọi P là tỉ lệ số giảng viên trường Đại học Bách Khoa đồng ý dạy theo lối tín chỉ Giả thuyết: Ho : P = Po =0,5 H1 : P ≠ 0,5 Zα/2 = Z0,05 = 1,645 vì α = 10% -Zα/2 = -Z0,05 = -1,645 n =199, Po = 0,5 ⇒ f =523,0199104= 65,0199/50,0*50,050,0523,0/)1(000=−=−−=npppfZ Ra quyết định: -Zα/2 < Z < Zα/2 -1,645 < 0,65 < 1,645 ⇒ Không bác bỏ Ho Cao Hào Thi 98 Thí dụ Cũng ví dụ trên, kiếm định giả thuyết số giảng viên đồng ý hơn hoặc bằng một nửa số giảng viên trong trường. Giải: Giả thuyết: Ho : P ≥ Po = 0,5 H1 : P < 0,5 Zα = Z0,1 = 1,28 ⇒ -Zα = -1,28 Ra quyết định: Z = 0,65 > -Zα = 1,28 ⇒ Không bác bỏ Ho. 8.7 KIỂM ĐỊNH GIẢ THUYẾT VỀ QUY LUẬT PHÂN PHỐI LÝ THUYẾT 8.7.1 Kiểm định tính phù hợp (A Goddness-of-Fit Test) Giả sử ta có mẫu ngẫu nhiên với cỡ mẫu là n. Mỗi giá trị quan sát của mẫu ngẫu nhiên có thể xếp vào 1 trong K lớp. Gọi số phần tư của lớp thứ i là Oi với i = 1,2, …,K. Trong việc kiểm định tính phù hợp ta có: Ho : Xác suất để cho các giá trị quan sát rơi vào lớp thứ i = Pi (i =1,2, … k) H1 : Xác suất để cho các giá trị quan sát rơi vào lớp thứ i ≠ Pi R : Bác bỏ Ho nếu χ2k-1 > χ2k-1,α Với : iiikikEEO2121)( −=∑=−χ Ei : Kỳ vọng của số phần tử trong lớp thứ i. Với giả thuyết Ho ta có: Ei = n*Pi χ2k-1 tuân theo phân phối χ2 với độ tự do là k-1. Ví dụ Một công ty chất đốt dựa vào kinh nghiệm trong quá khứ cho rằng đến cuối mùa đông sẽ có 80% lượng khách hàng trả đầy đủ tiền ngay 10% trả chậm 1 tháng, 6% trả chậm 2 tháng và 4% trả châm hơn 2 tháng. Đến cuối mùa đông để kiểm định lại điều này, Cty lấy ngẫu nhiên mẫu gồm 400 khách hàng và nhận thấy có 287 khách hàng trả ngay, 49 trả chậm 1 tháng, 30 trả chậm 2 tháng và 34 trả chậm hơn 2 tháng. Hỏi những kinh nhiệm trong quá khứ có thể áp dựng cho mùa đông năm nay không? Kiểm định với mức ý nghĩa 5%. Giải Ho : Xác suất lượng khách hàng trả tiền ở mùa đông hiện tại phù hợp với các số liệu trong quá khứ. Nghĩa là xác suất tương ứng với 4 loại khách hàng là: P1 = 0,8, P2 = 0,1, P3 = 0,06, P4 = 0,04 H1 : P1 ≠ 0,8, P2 ≠ 0,1, P3 ≠ 0,06, P4 ≠ 0,04 α = 0,05 , k = 4 ⇒ χ2k-1,α = χ23,0,05 = 7,81 [...]... 0,016 = P (-2 ,5 < Z χ2k-1,α ⇒ Bác bỏ Ho Nghĩa là không thể áp dụng kinh nghiệm trong quá khứ vào năm nay Số lượng khách hàng trả chậm trong năm nay nhiều hơn các năm trước 8.7.2 Kiểm định giả thuyết về qui luật phân phối... 6,58 (54,865 - +∞) 5,20 Tổng n ≈ 200 (n = 197,38) n = 200 Tính X2: Oi Ei (Oi – Ei) (Oi –Ei)2 ( O ii − E i ) 2 Ei 6 6,02 -0 ,02 0,0004 ≈0 14 14,74 -0 ,74 0,5476 0,037 33 31,46 1,54 2,3716 0,075 47 46,18 0,82 0,6724 0,014 45 46,74 -1 ,74 3,0276 0,069 33 32,52 0,48 0,2304 0,007 15 15,76 -0 ,76 0,5776 0,036 7 6,58 0,42 0,1764 0,027 n = 20 n = 200 X2 = 0,265 Tính χ2γ,α : γ = K – r –1 = 8 –2 – 1 Số lớp K = 8;... tư nằm trong khoảng i (Ei được tính dựa vào qui luật phân phối lý thuyết) Ei = n Pi Pi = xác suất để cho các phần tử nằm trong khoảng i 2 Tính χ χ2k-1 = (O i − E i ) 2 ∑ E i =1 i 4 χ2 gần đúng tuân theo phân phối Chi Squared với độ tự do là ν, ν = k -r -1 r : số tham số cần phải ước lượng Cao Hào Thi 99 Với phân phối chuẩn r = 2 Với phân phối Poisson r = 1 Tìm miền bác bỏ R Nếu χ2 > χ2ν,α ta bác bỏ... i , j − E ij ) 2 E ij (8 − 20)2 + (92 − 80)2 + (192 − 180)2 + (708 − 720)2 = 20 80 180 720 χ 2 = 10 2 Tính χ υ,α α = 0,05 Tra bảng Cao Hào Thi ν = (r-1)(c-1) = 1 χ21;0,05 = 3,84 103 Ra quyết định: χ2 > χ21;0,05 ⇒ Bác bỏ giả thuyết H0 Nghĩa là việc áp dụng công nghệ mới đã làm tăng chất lượng sản phẩm Cao Hào Thi 104 ... là ν Cao Hào Thi 102 ν = (r -1 )(C –1) Ví dụ Để đánh giá hiệu quả làm tăng chất lượng của một biện pháp công nghệ mới trên một dây chuyền sản xuất người ta thu thập được các số liệu sau: Chất lượng Phế phẩm (cái) Chính phẩm (cái) Tổng số (cái) Sau khi thay đổi công nghệ 8 192 200 Trước khi thay đổi công nghệ 92 708 800 Tổng số 100 900 1000 Công nghệ Vấn đề đặt ra là việc áp dụng công nghệ mới và chất . số phần tử nằm trong lớp i Ei (- 54,795 54,805 54,815 54,825 54,835 54,845 54,855 54,865 (54,865 - - - - - - - - - - 54,805) 54,805 54,815 54,825 54,835. Ho nếu χ2n-1 > χ2n-1,α 8.5.3 Trường hợp 3: Ho : σ2 = σ02 H1 : σ2 ≠ σ02 R : Bác bỏ Ho nếu χ2n-1 > χ2n-1,α/2 hay χ2n-1 < χ2n-1, 1- /2 Thí