Bài giảng Xử lý thống kê với phần mềm SPSS - Bài 2: Ước lượng và kiểm định giá trị trung bình của một biến chuẩn

12 164 0
Bài giảng Xử lý thống kê với phần mềm SPSS - Bài 2: Ước lượng và kiểm định giá trị trung bình của một biến chuẩn

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài giảng cung cấp cho người học các kiến thức: Ước lượng và kiểm định giá trị trung bình của một biến chuẩn, Ước lượng tham số của tổng thể, kiểm định giả thiết,... Hi vọng đây sẽ là một tài liệu hữu ích dành cho các bạn sinh viên đang theo học môn dùng làm tài liệu học tập và nghiên cứu. Mời các bạn cùng tham khảo chi tiết nội dung tài liệu.

BÀI ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH CỦA MỘT BIẾN CHUẨN I –NỘI DUNG a- ƯỚC LƯỢNG THAM SỐ CỦA TỔNG THỂ Khảo sát đám đông gồm nhiều cá thể ( theo nghĩa có nguồn gốc chung sống lâu vùng, thí dụ giống địa phương, đàn gà trại chăn nuôi, em học sinh lớp huyện, bao đường nhà máy đường v.v ) Đo nhiều số sinh học cá thể đám đông biến ngẫu nhiên X, Y, Z , Các biến chia thành hai nhóm lớn: biến định tính biến định lượng Đối với biến định lượng nhiều trường hợp qua khảo sát biết dạng phân phối lại chưa biết tham số phân phối Phổ biến trường họp biến khảo sát giả thiết phân phối chuẩn N(m,2 ) Vấn đề lại xác định hay gọi ước lượng m 2 a1- Ước lượng tham số m phân phối chuẩn N(m,2 ) Các bước cần làm: Lấy mẫu quan sát ( mẫu ngẫu nhiên) Sắp xếp số liệu tính hai tham số: trung bình cộng x , phương sai mẫu s2 Chọn mức tin cậy kết luận thống kê P ( từ có mức ý nghĩa  = 1- P) Trường hợp biết phương sai 2 Tìm trị u = u(/2) cho (u) = 1- /2 từ bảng hàm phân phối chuẩn (u) xu  n  m  x u  n Trường hợp khơng biết phưong sai 2 Tìm t = t(/2, n-1) từ bảng Student T xt N D Hien s n  m  x t s n 12 Ý nghĩa khoảng ước lượng, mức tin cậy P mức ý nghĩa  Vì khoảng tin cậy dựa mẫu quan sát nên kết luận thống kê Mỗi lần quan sát ta có khoảng ước lượng, tức kết luận m, kết luận m thực nằm khoảng đưa sai m nằm khoảng ước lựong (khi trung bình cộng x nhỏ hay to so với trung bình m) Xác st (hay gọi mức đúng) mức tin cậy P xác suất sai mức ý nghĩa  a2- Ước lượng phương sai 2 Tính trung bình cộng x , phương sai mẫu s2 hai trị phân phối 2 21 = 2(/2,n-1) vµ 22 = 2(1-/2, n-1) (n  1) s (n  1) s 2    12  22 a3- Ước lượng xác suất p dung lượng mẫu n >= 30 Tính tần suất f = m /n trị u(/2) f  u ( / 2) f (1  f )  p  f  u ( / 2) n f (1  f ) n b- KIỂM ĐỊNH GIẢ THIẾT Giả thiết đối thiết Khi khảo sát tổng thể (hoặc nhiều tổng thể) xem xét (hoặc nhiều) biến ngẫu nhiên đưa giả thiết liên quan đến phân phối biến ngẫu nhiên biết phân phối đưa giả thiết tham số phân phối Để đưa kết luận thống kê giả thiết phải chọn mẫu ngẫu nhiên, tính tham số mẫu, chọn mức ý nghĩa  sau đưa kết luận Bài tốn kiểm định tham số  phân phối có dạng: Căn vào kết nghiên cứu đưa giả thiết H o:  = o với o tham số cho Kết luận thống kê có dạng:“chấp nhận Ho” hay “bác bỏ Ho” Nhưng đặt vấn đề cách giải khó khơng chấp nhận H o:  = o điều có nghĩa chấp nhận vơ số  khác o, thường đưa toán N D Hien 13 dạng cụ thể nữa: cho giả thiết Ho đối thiết H1, kết luận chấp nhận Ho bác bỏ Ho, trường hợp này, khơng hồn toàn tương đương, coi chấp nhận đối thiết H1 Nếu chấp nhận Ho lúc giả thiết H1 mắc sai lầm loại hai xác suất mắc sai lầm gọi rủi ro loại hai  Ngược lại bác bỏ Ho lúc giả thiết Ho mắc sai lầm loại xác suất mắc sai lầm gọi rủi ro loại  Có thể đưa sơ đồ sau: Quyết định Giả thiết Bác bỏ Ho Chấp nhận H0 Ho Sai lầm loại Quyết định P = 1- = xác suất chấp nhận H0 gọi mức tin cậy  H0 sai Quyết định 1- = xác suất bác bỏ H0 gọi lực lượng kiểm định Sai lầm loại  Như toán kiểm định giả thiết ln ln có hai loại rủi ro, loại loại hai, tuỳ vấn đề mà nhấn mạnh loại rủi ro Thông thường người ta hay tập trung ý vào sai lầm loại kiểm định phải khống chế cho rủi ro loại không vượt mức  gọi mức ý nghĩa Trước hết xem xét cụ thể toán kiểm định giả thiết H0:  = o, đối thiết H1:  = 1 với 1 giá trị khác o Đây toán kiểm định giả thiết đơn Quy tắc kiểm định vào hai giá trị cụ thể 1 o, vào mức ý nghĩa  vào sai lầm loại hai Việc lý thuyết thống kê khơng gặp khó khăn Sau mở rộng quy tắc sang cho toán kiểm định giả thiết kép H 1: o;  > o  < o, việc mở rộng có khó khăn nhà nghiên cứu lý thuyết xác suất thống kê giải sau kiểm định giả thiết H :  = o chọn đối thiết H1 sau: N D Hien 14 H1 :   o gọi đối thiết hai phía hay hai đuôi(Two side hay two tail) H1 :  > o gọi đối thiết phải H1 :  < o gọi đối thiết trái Hai đối thiết sau gọi đối thiết phía.hay (one side hay one tail) Việc chọn đối thiết tuỳ thuộc vấn đề khảo sát cụ thể b1- Kiểm định giá trị trung bình m biến phân phối chuẩn N (m, 2) Trường hợp 1: Kiểm định giả thiết H0: m = m0 biết phương sai 2 Tiến hành bước sau: + Chọn mẫu dung lượng n, tính trung bình cộng x + Chọn mức ý nghĩa , tìm giá trị tới hạn u (/2) bảng hàm (u) (Nếu kiểm định phía tìm u () cho (u) = 1-  ) + Tính giá trị thực nghiệm Utn = ( x  0 )   ( x  0 ) n  n Kết luận: Với H1: m  m0 (Kiểm định hai phía) Nếu Utn (giá trị tuyệt đối Utn) nhỏ hay u(/2) chấp nhận Ho ngược lại bác bỏ H0, tức chấp nhận H1 Với H1: m > m0 (Kiểm định phía) Nếu Utn nhỏ hay giá trị tới hạn u () chấp nhận H0, ngược lại chấp nhận H1 Với H1: m < m0 (Kiểm định phía) Nếu Utn lớn hay giá trị tới hạn - u() chấp nhận H0, ngược lại chấp nhận H1 Trường hợp 2: Kiểm định giả thiết H0: m = m0 phương sai Đây trường hợp phổ biến kiểm định giá trị trung bình phân phối chuẩn Tiến hành bước sau: + Lấy mẫu, tính x s2 + Tính giá trị T thực nghiệm Ttn N D Hien = ( x  0 ) n s 15 + Tìm giá trị tới hạn t (/2, n-1) bảng (nếu kiểm định phía tìm t (, n-1)) Kết luận: Với H1 : m  m0 (Kiểm định hai phía) Nếu Ttn (giá trị tuyệt đối Ttn)  t(/2,n-1) chấp nhận Ho ngược lại bác bỏ Ho, tức chấp nhận H1 Với H1 :  > 0 (Kiểm định phía) Nếu Ttn t(,n-1) t(, n-1) chấp nhận H0, ngược lại chấp nhận H1 Với H1:  < 0 (Kiểm định phía) Nếu Ttn  - t(,n-1) chấp nhận H0, ngược lại chấp nhận H1 Trường hợp 3: Kiểm định xác suất H0: p = p0 Đối thiết hai phía H1: p  p0 Tính U tn ( f  p0 ) p0 (1  p ) n so với giá trị tới hạn hai phía u= u(/2) Nếu Utn  u chấp nhận H0 Nếu Utn > u bác bỏ H0 Nếu đối thiết phía H1: p > p0 hay p < p0 phải so với giá trị tới hạn phía u = u() tính từ đẳng thức (u) = 1-  b2- So sánh hai trung bình hai biến chuẩn Khảo sát biến chuẩn tổng thể, tổng thể I biến X phân phối N(mX, 2X) , tổng thể II biến Y phân phối N(mY, 2Y) Để so sánh hay kiểm định giả thiết H0: my = mx với đối thiết H1: mY  mX (hoặc đối thiết phía H1: my > mx) có hai phương pháp lấy mẫu: Phương pháp lấy mẫu theo cặp (đôi) Dựa vào quan hệ tự nhiên (vợ chồng, anh em), quan hệ trước sau (trước chữa bệnh sau chữa bệnh) chủ động bố trí (đối chứng thí nghiệm) có mẫu quan sát với n cặp số liệu, cặp gồm số liệu tổng thể thứ gọi x i số liệu tổng thể thứ hai gọi yi N D Hien 16 Chuyển toán so sánh hai trung bình thành tốn kiểm định biến hiệu số D = Y - X Từ n cặp số liệu (x i, yi) tạo cột hiệu số d i = yi -xi Tính trung bình cộng d , độ lệch chuẩn sd ( dùng ký hiệu Dtb sD) Để kiểm định giả thiết H0 : mx = my đối thiết H1: mx  my chuyển sang H0 : md = đối thiết H1: md  Tính Ttn  d n so với giá trị tới hạn t = t(/2,n-1) sd Nếu Ttn  t chấp nhận H0 ngược lại bác bỏ H0 Trường hợp phía so Ttn với t(,n-1) Phương pháp lấy mẫu độc lập Từ tổng thể I rút mẫu gồm nx cá thể tính trung bình x , độ lệch chuẩn sx, phương sai s2x (hoặc dùng ký hiệu xtb, sX, sX2) Từ tổng thể II rút mẫu gồm ny cá thể tính trung bình y , độ lệch chuẩn sy, phương sai s2y (hoặc dùng ký hiệu ytb, sY, sY2) Trường hợp 1: biết phương sai 2x , 2y phương sai mẫu lớn (nX  30; nY  30) Nếu biết phương sai Utn  ( y  x)  2X nX   Y2 nY Nếu phương sai mẫu lớn Utn  ( y  x) s X2 s2  Y n X nY So Utn  với giá trị tới hạn hai phía u = u(/2) kiểm định phía Nếu Utn   u chấp nhận H0, ngược lại bác bỏ H0 Nếu kiểm định phía so Utn giá trị tới hạn phía u= u() N D Hien 17 Trường hợp 2: phương sai mẫu nhỏ Trước hết phải kiểm định giả thiết H0 : 2Y = 2X với đối thiết H1: 2 Y  2X Giả sử s2y > s2x lấy Ftn = s2y/ s2x sau tìm giá trị tới hạn Flt qua hàm F( , ny-1, nx-1), (nếu s2x > s2y lấy Ftn = s2x / s2y Flt = F(, nx -1, ny-1)) Nếu Ftn  Flt chấp nhận H0, ngược lại bác bỏ H0 Chấp nhận H0 ta có trường hợp hai phương sai (equal variance), ngược lại có trường hợp hai phương sai khác (unequal variance) Trường hợp 2a: hai phương sai Giả thiết H0: my = mx đối thiết H1 : mY  mX Tính phương sai chung s2c = (( nx -1) s2x + (ny -1) s2y)/(nx + ny -2) Tính Ttn  ( y  x) so với giá trị tới hạn phía t = t(/2, nx+ ny- 2) 1 sc2 (  ) nx n y Nếu |Ttn|  t chấp nhận H0 ngược lại bác bỏ Nếu kiểm định phía H1: m Y > mX hay H1: mY < mX so với giá trị tới hạn phía t = t(, nx + ny- 2) Trường hợp 2b: hai phương sai khác Tính Ttn  ( y  x) s x2 s y2  nx n y Tính giá trị tới hạn hai phía t = t(/2,Df) với bậc tự Df tính sau: vx = s2x / nx ; vy = s2y / ny Tính tỷ số : (vx + vy )2 / (v2x / (nx -1) + v2y /(ny -1) ) sau quy tròn Thí dụ : s2x = 0,67 ; nx = 4; vx = 0.67/ = 0.17 s2y = 17,71 ; vy = 17.71/ = 2.21 vx + vy = 2.38 Quy tròn: 2.382 /(0.172/3 + 2.212/ 7)  N D Hien ny = 8 bậc tự Df 18 Kết luận: Nếu |Ttn|  t chấp nhận H0 ngược lại bácbỏ H0 Nếu kiểm định phía so Ttn với giá trị tới hạn phía t =t(,Df) b3- So sánh hai xác suất Hai tổng thể có tỷ lệ cá thể loại A p1 p2 Để so sánh p1 p2 lấy mẫu quan sát: Mẫu dung lượng n1 lấy từ tổng thể I có m1 cá thể loại A Mẫu dung lượng n2 lấy từ tổng thể II có m2 cá thể loại A Giả thiết H0: p1 = p2 đối thiết H1: p1 p2 Tính tần suất f1 = m1/n1 f2 = m2 / n2 tần suất chung f = (m1+ m2)/ (n1 + n2) Utn  ( f  f 1) so với giá trị tới hạn hai phía u(/2) 1 f (1  f )(  ) n1 n2 NếuUtn  u(/2) chấp nhận H0 Nếu Utn > u(/2) bác bỏ H0 Nếu kiểm định phía so Utn với giá trị tới hạn phía u() II XỬ LÝ TRONG SPSS a- Ước lượng kiểm định giá trị m biến chuẩn Mở tệp Baitap2 Vào Analyse Compare means One sample T-test Chọn Thoigian (Thời gian mang thai bò) Test value (giá trị cần kiểm định) 285 N D Hien 19 One-Sample Statistics Biên N thoigian T bình Mean 294.50 DL chuẩn Std Deviation 7.740 Sai số chuẩn Std Error Mean 3.160 One-Sample Test thoigian Giá trị cần kiểm định Test Value = 285 Mức ý nghĩa Khoảng tin cậy 95% Ttn Bậc tự Sig (2Hiệu số xtb -285 95% Confidence Interval of t df tailed) Mean Difference the Difference Cận Cận Lower Upper 3.007 030 9.500 1.38 17.62 b- So sánh cặp Vào analyse Compare means Paired samples T-test Chon Ration A Ration B Kết quả: Paired Samples Statistics N D Hien 20 Mean Pair N Std Deviation Ration A 1.0387 15 13352 03447 Ration B 1.1287 15 11294 02916 Paired Samples Correlations (hệ số tương quan biến Ration A Ration B) N Pair Std Error Mean Ration A & Ration B Correlation Sig 15 633 Paired Samples Test 011 Paired Differences 95% Confidence Interval of the Difference Pair Mean -.09000 Ration A - Ration B Std Deviation 10724 Std Error Mean 02769 Ttn Bậc tự Mức ý nghĩa t df sig -3.250 14 Lower -.14939 Upper -.03061 006 c- So sánh hai giá trị trung bình hai biến chuẩn lấy mẫu độc lập Xét trọng lượng nước tăng thêm hai loại lưỡng thê ngâm nước Số liệu để cột, có cột Species để phân biệt hai loại Vào analyse Compare means Independent samples T-test Chon Test variables Log(cha), grouping Variable Species Define groups nhập tên Cóc (Toad) ếch (Frog) N D Hien 21 d- So sánh nhiều giá trị trung bình biến chuẩn lấy mẫu độc lập Khi có biến chuẩn tính trung bình theo Analyse Compare means Mở tệp Baitap3 Vào Analyse Compare means Means Chọn biến Tluong vào Dependent list Chọn diet vào Inedependent List N D Hien 22 Trong options chọn thống kê hệ số đo mối quan hệ Diet Tluong phân tích tồn biến động Tluơng thành thành phần: Biến động khác loại thức ăn (diet) biến động ngẫu nhiên (Giống Between group Within group one way anova) sau lại tách biến động đầu thành phần: Biến động tuyến tính theo Diet, biến động lại sau tách biến động tuyến tính Report tluong diet Mean 79.00 N Std Deviation 24.474 Variance 599.000 962.500 71.00 31.024 81.40 22.876 523.300 142.80 34.903 1218.200 93.55 20 39.523 1562.050 Total ANOVA Table tluong * diet Between Groups (Combined) (Tuyến tính) Linearity (Còn lại) Sum Sq Df Mean sq Ftn Sig 16466.950 5488.983 6.647 004 10180.810 10180.810 12.329 003 3.806 044 Deviation from Linearity Within Groups (ngấu nhiên) 6286.140 3143.070 13212.000 16 825.750 Total 29678.950 19 Measures of Association R tluong * diet N D Hien R Squared 586 343 Eta 745 Eta Squared 555 23 ... thể b 1- Kiểm định giá trị trung bình m biến phân phối chuẩn N (m, 2) Trường hợp 1: Kiểm định giả thiết H0: m = m0 biết phương sai 2 Tiến hành bước sau: + Chọn mẫu dung lượng n, tính trung bình. .. TRONG SPSS a- Ước lượng kiểm định giá trị m biến chuẩn Mở tệp Baitap2 Vào Analyse Compare means One sample T-test Chọn Thoigian (Thời gian mang thai bò) Test value (giá trị cần kiểm định) 285 N... nghĩa Trước hết xem xét cụ thể toán kiểm định giả thiết H0:  = o, đối thiết H1:  = 1 với 1 giá trị khác o Đây toán kiểm định giả thiết đơn Quy tắc kiểm định vào hai giá trị cụ thể 1 o, vào

Ngày đăng: 30/01/2020, 14:22

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan