Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 17 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
17
Dung lượng
149,03 KB
Nội dung
G.V Cao Haò Thi Chương6 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (Tests of Hypotheses) Thông thường đối với tham số • chưa biết của tập hợp chính ta có thể đưa ra nhiều giả thuyết về •. Vấn đề đặt ra là làm thế nào kiểm đònh được giả thuyết nào thích hợp với các số liệu của mẫu quan sát được (x 1 , x 2, …, x n ). 6.1 NHỮNG KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Giả thuyết thống kê ( Statistical Hypothesis) Là một giả sử hay một phát biểu có thể đúng, có thể sai liên quan đến tham số của một hay nhiều tập hợp chính. Giả thuyết không (giả thuyết đơn) và giả thuyết ngược lại (đối thuyết) (Null Hypothesis & Alternative Hypothesis) Giả thuyết không: là sự giả sử mà chúng ta muốn kiếm đònh thường được ký hiệu là H o. Giả thuyết ngược lại: Việc bác bỏ giả thuyết không sẽ dẫn đến việc chấp nhận giả thuyết ngược lại. Giả thuyết ngược lại thường được ký hiệu là H 1. Ví dụ Kiếm đònh giả thuyết H o : • ≥ • o có thể •=• o Với H 1 : • < • o Kiếm đònh giả thuyết H o : • ≤ • o Với H 1 : • > • o Kiểm đònh giả thuyết H o : • = • o Với H 1 : • ≠ • o 6.1.3 Các loại sai lầm trong việc kiểm đònh giả thuyết thống kê Việc kiểm đònh giả thuyết thống kê có thể phạm phải 2 loại sai lầm 1.3.1 Sai lầm loại I (type I error) Là loại sai lầm mà chúng ta phạm phải trong việc bác bỏ giả thuyết H o khi H o đúng. Xác suất của việc bác bỏ H o khi H o đúng lkà xác suất của sai lầm loại I và được ký hiệu là α G.V Cao Haò Thi α = P ( bác bỏ H o / H o đúng) = P(type I error) α : còn được gọi là mức ý nghóa ( level of sigui ficance) α = 0.05, 0,01 ,0,001 … 1.3.2 Sai lầm II (type II error) Là loai sai lầm mà chúng ta phạm phải khi không bác bỏ giả thuyết H o khi H o sai. Xác suất của việc không bác bỏ H o khi H o sai là xác suất của sai lầm loải II và đưkợc ký hiệu làβ. β = P (không bác bỏ H o /H o sai) = P(type II error) Quyết đònh về giả thuyết không Ho Bản chất của Ho Ho đúng Ho sai Không bác bỏ ( chấp nhận ) Quyết đònh đúng Prob = 1- α P (không bác bỏ Ho / Ho) = 1-α Sai lầm loại II Prob = β Bác bỏ Sai lầm loại I Prob = α (α = significance level of the test) Quyết đònh đúng Prob = 1 - β (1 - β: power of the test) năng lực cuả kiểm đònh 1.4 Miền bác bỏ và miền chấp nhận ( rejection region & acceptance region ) Tất cả các giá trò có thể có của các đại lượng thống kê trong kiểm đònh có thể chia làm 2 miền: miền bác bỏ và miền chấp nhận. - Miền bác bỏ là miền chứ các giá trò làm cho giả thuyết Ho bò bác bỏ. -Miền chấp nhận là miền chứa các giá trò giúp cho giả thuyết Ho không bò bác bỏ. Trong thực tế khi Ho không bò bác bỏ cùng nghóa là nó được chấp nhận. Giá trò chia đôi hai miền được gọi là giá trò giới hạn ( Gitical value) - Kiểm đònh một đầu và kiểm đònh 2 đầu (one – tailed test & two – tailed test) Kiểm đònh một đầu Khi giả thuyết ngược lại H 1 có tính chất 1 phía (one – sided) thì việc kiểm đònh được gọi là kiểm đònh 1 đầu. Ví dụ: H o : • = • o hay H o : • = • o G.V Cao Haò Thi H 1 : • > • o H 1 : • < • o Kiểm đònh hai đầu : Khi giả thuyết ngược lại H 1 có tính chất 2 phía( two – sided_ thì việc kiểm được gọi là kiểm đònh 2 đầu. Ví dụ H o : • = • o H 1 : • ≠ • o 2. Các bước của việc kiểm đònh giả thuyết thống kê Gồm 6 bước: Bước 1 : Thành lập giả thuyết Ho Ví dụ : H o : • = • o H o : • ≤ • o H o : • ≥ • o Bước 2 : Thành lập giả thuyết H 1 Ví dụ: H 1 : • < • o H 1 : • > • o H 1 : • ≠ • o Bước 3: Xác đònh mức ý nghóa α Bước 4 : Chọn các tham số thống kê thích hợp chko việc kiếm đònh và xác đònh các miền bác bỏ, miền chấp nhận và giá trò giới hạn. Bước 5 : Tính toán các giá trò của các tham số thống kê trong việc kiểm đònh dựa trên số hiệu của mẫu ngẫu nhiên. Bước 6: Ra quyết đònh: Nếu các giá trò tính toán rồi vào miền bác bỏ Ho thì ra quyết đònh bác bỏ Ho. Ngược lại sẽ chấp nhận Ho. 3. Kiểm đònh giá trò trung bình µ của phân phối chuẩn N (µ,δ 2 ) khi đã biết δ 2 Cho ( x1, x2 , …, xn) là mẫu ngẫu nhiên cỡ n được lấy từ tập họp chính tuân theo phân phối chuẩn N (µ,δ 2 ) trong đó δ 2 đã biết. Vấn đề : Kiểm đònh giả thuyết Ho : µ ≤ µ ο hay µ ≥ µ ο hay µ = µ ο với giả thuyết ngược lại H 1: µ > µ ο hay µ < µ ο hay µ ≠ µ ο . Sự kiểm đònh có mức ý nghóa là α. Ta có 3 trường hợp: G.V Cao Haò Thi 3.1 Trường hợp 1 Ho : µ = µ ο hay µ ο : µ ≥ µ ο H 1 : µ < µ ο Miền bác bỏ R: Bác bỏ Ho nếu Σ = n/ X 0 δ µ− < − α ∑ 3.2 Trường hợp 2: Ho : 0 µ=µ hay Ho 0 µ≤µ H 1 : µ > 0 µ Miền bác bỏ R : Bác bỏ Ho nếu α ∑> δ µ− =∑ n/ X 0 3.3 Trường hợp 3: α α ∑ − α ∑ F z Miền bác bỏ Ho Miền không bác bỏ Ho G.V Cao Haò Thi Ho : 0 µ=µ H 1 : 0 µ≠µ Miền bác bỏ R: Bác bỏ Ho nếu 2 α ∑>∑ hay 2 α ∑−<∑ Với n/ X 0 δ µ− =∑ Thí dụ Trong một nhà máy bánh kẹo, một máy tự động sản xuất ra các thanh sô cô la với trọng lượng qui đònh 250g. Biết rằng trọng lượng các thanh sô cô la được sản xuất ra có phân bố chuẩn N( µ ,5 2 ). Trong một ngày bộ phân kiểm tra kỹ thuật chọn một mẫu ngẫu nhiên gồm 16 thanh sô cô la và tính trọng lượng trung bình của chúng được 244g. Có thể khẳng đònh máy tự động sản xuất ra các thanh sô cô la có trọng lượng nhớ hơn qui đònh không? Với mức ý nghóa α =0.05 kiểm đònh giả thuyết thống kê tương ứng. Giải 1/ Ho : µ = 250g 2/ H 1 : µ < 250g 3/ α = 0.05 4/ =∑=∑ α 05.0 16.45 - =∑ α -1.645 5/ 8.4 16/5 250246 n/ X 0 −= − = δ µ− =∑ =δ 2 5 2 ⇒ δ = 5 n = 16 X = 244g , 0 µ = 250g 6/ Σ = -4.8 < - 05.0 ∑ = -1,645 Ra quyết đònh : Bác bỏ giả thuyết Ho ⇒ Chấp nhận H 1 nghóa là máy tự động sản xuất sô cô la có trọng lượng nhỏ hơn qui đònh. ⇒ Phải điều chỉnh lại máy Thí dụ Một máy khoan trong dây chuyền sản xuất dùng để khkoan lỗ trên các bản thép. Khi máy khoan hoạt động đúng chứ năng thiết kế đường kính các lỗ khoan sẽ tuân theo phân phối chuần với số trung bình là 2 inches và độ lệch chuẩn là 0,06 inches. Trong quá trình kiểm tra đònh kỳ xem máy khoan có hoạt động đúng hay không, người ta lấy đo ngẫu nhiên các lỗ đã khoan. Giả sử độ lệch chuẩn không thay đổi. Mẫu ngẫu nhiên G.V Cao Haò Thi gồm 9 lỗ khoan cho ta đường kính trung bình của mẫu là 1.95 inches. Kiểm đònh giả thuyết Ho : số trung bình của tập hợp chính là 2 inches. Với H 1 : số trung bình của tập hợp chính khác 2 inches. Trong quá trình kiểm đònh dùn α = 5% Giải: 1/ Ho : µ = µ 0 = 2 2/ H 1 : µ ≠ 2 3/ α = 0.05 4/ 96.1 025,0 2 =∑=∑ α - 196 025.0 2 −=∑−=∑ α 5/ X = 1,95 , µ 0 =2 , δ = 0.06 ,n = 9 50,2 9/06.0 295.1 n/ X 0 −= − = δ µ− =∑ 6/ Ta có 2 α ∑−<∑ Ra quyết đònh : Bác bỏ giả thuyết Ho ở mức ý nghóa 5% ⇒ Máy hoạt động không đúng chức năng thiết kế. 4. Kiểm đònh giá trò trung bình m của phân phối chuẩn N ( µ , δ 2 ) khi chưa biết δ 2 Giả sử ta có mẫu ngẫu nhiên cỡ mẫu là n được lấy từ tập hợp chính tuân theo phân phối chuẩn có số trung bình là µ . Gọi • và S x là số trung bình và độ lệch chuẩn của mẫu, ta sẽ có 3 trường hợp kiểm đònh µ với mức ý nghóa α . 4.1 Trường hợp 1: Ho : µ = µ 0 hay µ ≥ µ 0 H 1 : µ > µ 0 Miền bác bỏ R : Bác bỏ Ho nếu t n-1 > t n-1 , α Với t n-1 = n/ X x 0 δ µ− , t n-1 tuân theo phân phối. Student t với độ tự do n-1 4.2 Trường hợp 2: Ho : µ = µ 0 hay Ho : µ ≤ µ 0 H 1 : µ > µ 0 Miền bác bỏ R: Bác bỏ Ho nếu t n-1 > t n-1 , α 4.3 Trường hợp 3: G.V Cao Haò Thi Ho : µ = µ 0 H 1 : µ ≠ µ 0 Miền bác bỏ R: Bác bỏ Ho nếu t n-1 > t n-1 , α /2 Hay t n-1 < - t n-1 , α /2 Thí dụ Nhà quản lý các cửa hàng bán lẻ nhận thấy rằng số lượng hàng bán ra trung bình trong tháng 12 cao hơn 20% so với tháng 11. Theo dõi sổ sách của sáu cửa hàng ( được chọn một cách ngẫu nhiên ) nhà quản lý nhận thấy Phần trăm độ tăn trung bình của lượng hàn bán ra tại6 cửa hàng trong tháng 12 như sau: 19.2%, 18.4, 19.8, 20.2, 20.4, 19,0 Giả sử phần trăm độ tăng trung bình của lượng hàng bán ra tại tất cả các cửa hàng trong hệ thống bán lẻ tuân theo phân phối chuẩn Kiểm đònh giả thuyết rằng phần trăm độ tăng trung bình của lượng hàng bán ra trong tháng 12 là 20% so với tháng 11 với α = 10% Giải: 1/ Ho : µ = µ 0 = 20 2/ H 1 : µ ≠ 20 3/ α = 10% = 0.1 t n-1 , α /2 = t 5 , 0.05 = 2,015 -t n-1 , α /2 = -t 5 , 0.05 = -2,015 4/ Xác đònh X và δ x x I x i 2 19.2 368,64 18.4 338,56 19.8 392,04 20.2 408,04 20.4 416,16 19.0 361,00 Tổng 117,0 2.284,44 5,19 6 117 n X i x == ∑ = 22 i 2 x xnx( )1n( 1 −∑ − =δ ) = )5,19*644,2284( 5 1 2 − G.V Cao Haò Thi δ x 2 = 0.588 ⇒ δ x = 588.0 = 0.767 5/ t n-1 = n/ x x 0 δ µ− = 597.1 6/767.0 205,19 −= − 6/ Ra quyết đònh : Ta có t n-1, α /2 < t n-1 < t n-1 , α /2 -2,015 < -1,597 < 2,015 ⇒ Chấp nhận giả thuyết Ho (Những dữ kiện từ mẫu không đủ mạnh để bác bỏ Ho) 5. Kiểm đònh phương sai của phân phối chuẩn Giả sử ta có mẫu ngẫu nhiên cỡ mẫu là n được lấy ra từ tập hợp chính tuân theo phân phối chuẩn có phương sai la δ 2 ø . Gọi S 2 x là phương sai của mẫu, ta sẽ có 3 trường hợp kiểm đònh δ 2 với mức ý nhóa là α 5.1 Trường hợp 1: Ho : δ 2 = δ 0 2 hay Ho : δ 2 = δ 0 2 H 1 : δ 2 < δ 0 2 R : Bác bỏ Ho nếu X 2 n-1 < X 2 n-1 , 1- α Với X 2 n-1 = 2 0 2 x )1n( δ δ− X 2 n-1 tuân theo phân phối X 2 với độ tự do n-1. 5.2 Trường hợp 2: Ho : δ 2 = δ 0 2 hay Ho : δ 2 ≤ δ 0 2 H 1 : δ 2 > δ 0 2 R : Bác bỏ Ho nếu X 2 n-1 > X 2 n-1 , α 5.3 Trường hợp 3: Ho : δ 2 = δ 0 2 H 1 : δ 2 ≠ δ 0 2 R : Bác bỏ Ho nếu X 2 n-1 > X 2 n-1 , 2 α Hay X 2 n-1 < X 2 n-1 , 1- 2 α G.V Cao Haò Thi Thí dụ Để thỏa mãn tiêu chuẩn đã được ấn đònh trong họp đồng là phương sai của hàm lượng chất bẩn trong các lò hàng hoá chất không được vượt quá 4%. Lấy ngẫu nhiên 20 lô hàng ta có phương sai của hàm lượng chất bẩn trong các lô hàng mẫu là 5,62%. Kiểm đònh giả thuyết phương sai của hàm lượng chất bẩn trong tất cả các lô hàng không quá 4% với α =10%. Giả sử rằng tập hợp chính tuân theo phân phối chuẩn. Giải : 1/ Ho : δ 2 ≤ δ 0 2 = 4 2/ H 1 : δ 2 > 4 3/ α = 0.1 , n = 20 X 2 n-1 , α = X 2 19,0.1 = 27,20 4/ δ 2 x =5.62 ,n = 20 , δ 2 0 =4 5/ X 2 n-1 = 695,26 4 62.5*19 )1n( 2 0 2 x == δ δ− 6/ Ra quyết đònh: Vì X 2 n-1 =26,695 < X 2 n-1 , α =27,20 ⇒ Không bác bỏ Ho tại mức α =10% 6. Kiểm đònh giá trò tỉ số P của tập họp chính trong điều kiện cỡ mẫu lớn - Gọi P là tỉ số của số lần thành công trong tập hợp chính f là tỉ số của số lần thành công trong n phép thực - Khi cỡ mẫu n lớn, thì biến ngẫu nhiên chuẩn hóa n/)p1(p pf − − =∑ sẽ gần đúng cơ phân phối chuẩn hóa - Ta có 3 trường hợp p với mức ý nghóa α . 6.1 Trường hợp 1: Ho : P = P 0 hay Ho : P ≥ P 0 H 1 : P < P 0 R : Bác bỏ Ho nếu Σ <- Σ α Với n/)p1(p pf − − =∑ , Σ ∼ N (0,1) G.V Cao Haò Thi 6.2 Trường hợp 2: Ho : P = P 0 hay Ho : P ≤ P 0 H 1 : P > P 0 R : Bác bỏ Ho nếu Σ > Σ α 6.3 Trường hợp 3: Ho : P = P 0 H 1 : P ≠ P 0 R : Bác bỏ Ho nếu Σ > Σ α/2 Hay Σ < - Σ α/2 Thí dụ Lấy ý kiến 199 giảng viên về việc day học theo lối tín chỉ thì có 104 giảng viên đồng ý . Kiếm đònh với mức về giả thuyết cho rằng có một nửa số giảng viên trong trường Bách khoa đồng ý dạy theo lối tín chỉ. Giải Gọi P là tỉ lệ số giảng viên trường Đại học Bách Khoa đồng ý dạy theo lối tín chỉ 1/ Ho : P = P o =0.05 2/ H 1 : P ≠ 0.05 3/ Σ α/2 = Σ 0.05 = 1,645 vì α = 10% - Σ α/2 = - Σ 0.05 = -1,645 4/ n =199 , P o = 0.05 f = 523.0 199 104 = 5/ 65.0 199/50.0*50.0 50.0523.0 n/)p1(p pf 00 0 = − = − − =∑ 6/ Ra quyết đònh: - Σ α/2 < Σ < Σ α/2 -1,645 < 0.65 < 1,645 ⇒ Không bác bỏ Ho Thí dụ Cũng ví dụ trên, kiếm đònh giả thuyết số giảng viên đồng ý hơn hoặc bằng một nửa số giảng viên trong trường. Giải: 1/ Ho : P ≥ P o = 0.05 2/ H 1 : P < 0.05 3/ Σ α = Σ 0.1 = 1,28 - Σ α = -1,28 6/ Ra qui đònh: Σ = 0.65 > - Σ α = 1,28 ⇒ Không bác bỏ Ho. 7. Kiểm đònh giả thuyết về qui luanä phân phối lý thuyết [...]... 31. 46 46. 18 46. 74 32.52 15. 76 6.58 5.20 n = 200 Tổng n ≈ 200 (n = 197.38) 54.805) 54.805 54.815 54.825 54.835 54.845 54.855 54. 865 54.875 +∞) 4 Tính X2: Oi Ei (Oi – Ei) (Oi –Ei)2 ( O ii − E i ) 2 Ei 6 14 33 47 45 33 15 7 6. 02 14.74 31. 46 46. 18 46. 74 32.52 15. 76 6.58 -0.02 -0.74 1.54 0.82 -1.74 0.48 -0. 76 0.42 0.0004 0.54 76 2.37 16 0 .67 24 3.02 76 0.2304 0.57 76 0.1 764 ≈0 0.037 0.075 0.014 0. 069 0.007 0.0 36. .. δx = 0,0 16 (độ lệch của mẫu) Ví dụ: Tính P1 , E1 54,795 − 54,835 54,805 − 54,835 X2k-1, α ⇒ Bác bỏ Ho Nghóa là không thể áp dụng... các số liệu trong quá khứ Nghóa là xác suất tương ứng với 4 loại khách hàng là: P1 = 0.8, P2 = 0.1, P3 = 0. 06, P4 = 0.04 2/ H1 : P1 ≠ 0.8, P2 ≠ 0.1, P3 ≠ 0. 06, P4 ≠ 0.04 3/ α = 0.05 , k = 4 ⇒ X2k-1, α = X23,0.05 = 7.81 4/ Dưới giả thuyết Ho, kỳ vọng của số khách hàng trong mỗi loại từ tổng số 400 khách hàng sẽ là E1 = 400 * 0.8 = 320 E2 = 400 * 0.1 = 40 E3 = 400 * 0. 06 = 24 E4 = 400 * 0.04 = 16 G.V... 0.007 0.0 36 0.027 n = 20 n = 200 2 5/ Tính X γ,α : γ = K – r –1 = 8 –2 – 1 Số lớp K = 8 r = 2 (phân phối chuẩn) α = 0.05 Tra bảng X25,0.05 = 11.07 06 X2 = 0. 265 6/ Ra quyết đònh : Vì X2 = 0. 265 < X25,0.05 = 11.07 06 ⇒ Không bác bỏ Ho G.V Cao Haò Thi ⇒ Số liệu quan sát tuân theo phân phối chuẩn 8 Bảng Dữ Kiện Ngẫu Nhiên ( Contingency tables) 8.1 Bảng dữ kiện ngẫu nhiên 2 chiều ( two way contingency tables)... về qui luật phân phối lý thuyết Trong việc kiểm đònh giả thuyết tính phù họp của số liệu quan sát với qui lkuật phân phối lý thuyết ta có: Ho : Số liệu quan sát tuân theo qui luật phân phối lý thuyết H1 : Số liệu quan sát không tuân theo qui luật phân phối lý thuyết Cách tìm miền bác bỏ R bằng kiểm đònh X2 1) Chia n số liệu quan sát ra làm K kkhoảng 2) Gọi Oi là số phần tử của mẫu quan sát nằm trong... giá trò quan sát của mẫu ngẫu nhiên có thể xếp vào 1 trong K lớp Gọi số phần tư của lớp thứ i là Oi với i= 1,2, …,K Trong việc kiểm đònh tính phù hợp ta có: Ho : Xác suất để cho các giá trò quan sát rơi vào lớp thứ i = Pi (i =1,2, … k) H1 : Xác suất để cho các giá trò quan sát rơi vào lớp thứ i ≠ Pi R : Bác bỏ Ho nếu X2k-1 > X2k-1, α Với : • 2 X (O i − E i ) 2 = ∑ Ei i =1 k k-1 Ei : Kỳ vọng của số phần... phối lý thuyết) Ei = n Pi Pi = xác suất để cho các phần tử năm trong khoảng i 4) Tính X2 k (O − E i ) 2 X2 = ∑ i Ei i =1 X2 gần đúng tuân theo phân phối chi Squared với độ tự do là γ = k -r -1 γ G.V Cao Haò Thi r : số tham số cần phải ước lượng • Với phân phối chuẩn r = 2 • Với phân phối Poisson r = 1 5) Tìm miền bác bỏ R Nếu X2 > X2γ,α ta bác bỏ giả thuyết Ho Nghóa là số liệu quan sát không tuân theo... 10% trả chậm 1 tháng, 6% trả chậm 2 tháng và 4% trả châm hơn 2 tháng Đến cuối mùa đông để kiểm đònh lại điều này, Cty lấy ngẫu nhiên mẫu gồm 400 khách hàng và nhận thấy có 287 khách hàng trả ngay, 49 trả chậm 1 tháng, 30 trả chậm 2 tháng và 34 trả chậm hơn 2 tháng Hỏi những kinh nhiệm trong quá khứ có thể áp dựng cho mùa đông năm nay không? Kiểm đònh với mức ý nghóa 5% Giải 1/ Ho : Xác suất lượng khách . )EO( − 6 14 33 47 45 33 15 7 6. 02 14.74 31. 46 46. 18 46. 74 32.52 15. 76 6.58 -0.02 -0.74 1.54 0.82 -1.74 0.48 -0. 76 0.42 0.0004 0.54 76 2.37 16 0 .67 24 3.02 76 0.2304. 54. 865 (54. 865 - - - - - - - - - - 54.805) 54.805 54.815 54.825 54.835 54.845 54.855 54. 865 54.875 + ∞ ) 4.78 6. 02 14.74 31. 46 46. 18 46. 74 32.52 15. 76 6.58