Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 23 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
23
Dung lượng
0,93 MB
Nội dung
ĐẠI HỌ ỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯ ƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM oOo BÁO CÁO BÀITẬPLỚN N MÔNXÁC SU SUẤTTHỐNG NG KÊ GVHD: Nguyễn n Đình Đ Huy SVTH: MSSV: Nhóm : TP HỒ CHÍ MINH - 8/2012 BÀI SỐ Trình bày lại ví dụ 3.4 trang 207 ví dụ 4.2 trang 216 Sách BT XSTK 2012 (N.Đ.HUY) Ví dụ 3.4 trang 207 sách BT Hiệu suất phần trăm (%) phản ứng hoá học nghiên cứu theo ba yếu tố pH (A), nhiệt độ (B) chất xúc tác (C) trình bày bảng sau: Yếu tố B Yếu tố A B1 B2 B3 B4 A1 C1 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Hãy đánh giá ảnh hưởng yếu tố hiệu suất phản ứng? Giải • Dạng toán: Phân tích phương sai ba yếu tố • Cơ sở lý thuyết: Sự phân tích dùng để đánh giá ảnh hưởng ba yếu tố giá trị quan sát G (i = 1, r: yếu tố A; j = 1, r: yếu tố B; k = 1, r: yếu tố C) • Mô hình: Khi nghiên cứu ảnh hưởng yếu tố, yếu tố có n mức, người ta dùng mô hình vuông latinh n*n Ví dụ mô hình vuông latinh 4*4: B C D A C D A B D A B C A B C D Mô hình vuông latinh yếu tố trình bày sau: Yếu tố C (T k ví dụ: T = Y111 + Y421 + Y331 + Y241) Trắc nghiệm Giả thiết: H0: µ = µ = ….= µ k Các giá trị trung bình H1: µ j ≠ µ k Có hai giá trị trung bình khác Giá trị thống kê: ۵ሶ ۵ሶ - Biện luận: Nếu ۵ሶ nhận H0(yếu tố A) Nếu ۵ሶ (chấp nhận H0(yếu tố B)) Nếu ۵ሶ (chấp nhận H0(yếu tố C)) Áp dụng MS-EXCEL: Thiết lập bảng tính sau: Tính giá trị Ti (tổng theo hàng từ B đến E) Chọn ô B7 nhập biểu thức =SUM(B2:E2) Chọn ô C7 nhập biểu thức =SUM(B3:E3) Chọn ô D7 nhập biểu thức =SUM(B4:E4) Chọn ô E7 nhập biểu thức =SUM(B5:E5) Tính giá trị T.j.(tổng theo cột từ hàng thứ đến hàng thứ 5) Chọn ô B8 nhập biểu thức =SUM(B2:B5) Dùng trỏ kéo kí hiệu tự điền từ ô B8 đến ô E8 Tính giá trị T k Chọn ô B9 nhập biểu thức =SUM(B2,C5,D4,E3) Chọn ô C9 nhập biểu thức =SUM(B3,C2,D5,E4) Chọn ô D9 nhập biểu thức =SUM(B4,C3,D2,E5) Chọn ô E9 nhập biểu thức =SUM(B5,C4,D3,E2) Tính giá trị T (tổng phẩn tử bảng) Chọn ô B10 nhập biểu thức =SUM(B2:E5) Tính giá trị ۵ሶ ۵ሶ Các giá trị ۵ሶ ۵ሶ Chọn ô G7 nhập biểu thức =SUMSQ(B7:E7) Dùng trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9 Giá trị ۵ሶ Chọn ô G10 nhập biểu thức =POWER(B10,2) Giá trị ۵ሶ Chọn ô G11 nhập biểu thức =SUMSQ(B2:E5) Tính giá trị SSR,SSC,SSF,SST SSE Các giá trị SSR,SSC SSF Chọn ô I7 nhập biểu thức =G7/4-39601/POWER(4,2) Dùng trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9 Giá trị SST Chọn ô I11 nhập biểu thức =G11-G10/POWER(4,2) Giá trị SSE Chọn ô I10 nhập biểu thức =I11-SUM(I7:I9) Tính giá trị MSR,MSC,MSF MSE Các giá trị MSR,MSC MSF Giá trị SST Chọn ô K7 nhập biểu thức =I7/(4-1) Dùng trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9 Giá trị MSE Chọn ô K10 nhập biểu thức =I10/((4-1)*(4-2)) Tính giá trị ۵ሶ F Chọn ô M7 nhập biểu thức =K7/0.3958 Dùng trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9 Kết luận Biện luận: • FR=3.10 < F0.05(3.6)= 4.76 =>chấp nhận H0(pH) • FC=11.95> F0.05(3.6) = 4.76 =>bác bỏ H0(nhiệt độ) • F =30.05 > F0.05(3.6) = 4.76 => bác bỏ H0(chất xúc tác) Kết luận: Vậy có nhiệt độ chất xúc tác ảnh hưởng đến hiệu suất VÍ DỤ 4.2 Người ta dùng mức nhiệt độ gồm 105, 120, 135oC kết hợp với khoảng thời gian 15,30 60 phút để thực phản ứng tổng hợp hiệu suất phản ứng(%) trình bày bảng sau: Thời gian(ph) nhiệt độ( độ C) hiệu suất % X1 X2 Y 15 105 1.87 30 105 2.02 60 105 3.28 15 120 3.05 30 120 4.07 60 120 5.54 15 135 5.03 30 135 6.45 60 135 7.26 Hãy cho biết yếu tố nhiệt độ thời gian / yếu tố thời gian có liên quan tuyến tính với hiệu suất phản ứng tổng hợp? Nếu có điều kiện nhiệt độ 1500C vòng 50 phút hiệu suất phản ứng bao nhiêu? Giải Áp dụng MS EXCEL Nhập liệu vào bảng tính ta sau: Sử dụng chương trình “ Regression” thẻ Data => Data Analysis Chọn OK hộp thoại Regression xuất Trong hộp Regression,lần lượt ấn định chi tiết - Phạm vi biến số Y (Input Y Range) - Phạm vi biến số X (Input Y Range) - Nhãn liệu (Labels) - Mức tin cậy (Confidence Level) - Tọa độ đầu (Output Range) - Và số tùy chọn khác đường hồi quy (Line Fit Plots), biểu thức sai số (Residuals Plots)… Phương trình hồi quy tương ứng X1 Kiểm định giả thiết Ho: thời gian không liên quan tuyến tính với hiệu suất phản ứng tổng hợp Phương trình hồi quy Y x1 = f ( x1) (R2=0.21 ; S=1.81) (1) Ta có to = 2.12903 < t0.05 = 2.365 (Pv = 0.0708 > a = 0.05) ⇒ chấp nhận giả thiết Ho t1= 1.3802 < t0.05 = 2.365 (Pv= 0.2099 > a = 0.05) (Tra bảng STUDENT) ⇒ chấp nhận giả thiết Ho F = 1.905 < F0.05(1,7) = 5.590 (hay Fs = 0.209 > a = 0.05) (Tra bảng FISHER) ⇒ chấp nhận giả thiết Ho Vậy hệ số 2.73(B0) 0.04(B4) phương trình hồi quy (1) ý nghĩa Y x1 = 2.73 + 0.04 x1 thốngkê Do phương trình hồi quy không thích hợp Kết luận: Vậy yếu tố thời gian không liên quan tuyến tính với hiệu suất phản ứng tổng hợp Phương trình hồi quy tương ứng X2 Kiểm định giả thiết Ho: nhiệt độ không liên quan tuyến tính với hiệu suất phản ứng tổng hợp Ta có kết quả: Phương trình hồi quy Y x = f ( x 2) Y x = −11.141 + 0.1286 x (R2 = 0.76 : S = 0.99) (2) Ta có to =3.418 > t0.05 = 2.365 (Pv2 = 0.0111< a = 0.05) ⇒ bác bỏ giả Ho t2 = 4.757> t0.05 = 2.365 (Pv = 0.0021< a = 0.05) (Tra bảng STUDENT) ⇒ bác bỏ giả thiết Ho F= 22.631>F0.05(1,7)= 5.59 (Fs =0.0021< a = 0.05) (Tra bảng FISHER) ⇒ bác bỏ giả thiết H0 Ta kết luận: Hai hệ số -11.141(B0) 0.1286(B2) phương trình hồi quy(2) có ý nghã thốngkê Hay nói phương trình hồi quy phù hợp Vậy yếu tố nhiệt độ liên quan tuyến tính với hiệu suất phản ứng tổng hợp Phương trình hồi quy tương ứng X1,X2 Kiểm định giả thiết Ho: thời gian nhiệt độ không liên quan tuyến tính với hiệu suất phản ứng tổng hợp Phương trình hồi quy Y x1, x = f ( x1, x 2) Y x1, x = −12.70 + 0.04 x1 + 0.1286 x (R2 = 0.9776 ; S = 0.3297) (3) Ta có to= 11.528 > t0.05 = 2.365 ( Pv= 2.56x10^-5 < a = 0.05) ⇒ bác bỏ giả thiết H0 t1= 7.5827> t0.05 = 2.365 (Pv=0.00027 < a = 0.05) ⇒ bác bỏ giả thiết Ho t2 = 14.3278 > t0.05 = 2.365 (Pv = 7.234x10^-6< a = 0.05) (Tra bảng STUDENT) ⇒ bác bỏ giả thiết H0 F= 131.392 >F0.05(2,6)= 5.140 ( hay Fs =1.112x10^-5 < a = 0.05) (Tra bảng FISHER) ⇒ bác bỏ giả thiết H0 Vậy hệ số -12.7(B0) , 0.04(B1) 0.1286(B0) phương trình hồi quy (3) có ý nghĩa thốngkê Vậy phương trình phù hợp Kết luận: thời gian nhiệt độ có liên quan tuyến tính với hiệu suất phản ứng tổng hợp Sự tuyến tính phương trình Y x1, x = −12.70 + 0.04 x1 + 0.1286 x Dự đoán hiệu suất phản ứng phương trình hồi quy (3) ta làm sau Hiệu suất dự đoán = B0 + B1*50 + B2*115 Với B0, B1, B2 hệ số phương trình hồi quy (3) Kết thu sau: Coefficients Intercept X1 X2 -12.7 0.04454 0.128556 Dự đoán 4.310873 Standard Error t Stat 1.101639 -11.5283 0.005874 7.582718 0.008972 14.32782 BÀI 2 Đo đường kính X chiều cao Y 20 ta thu số liệu sau: X 2,3 2,5 2,6 3,1 3,4 3,7 7,3 Y 4 6 14 X Y 3,9 12 4,2 4,4 X Y 4,7 5,1 10 4,1 5,5 13 4,1 5,8 6,2 11 6,9 11 6,9 16 a) Tìm đường hồi quy Y X b) Tính sai số tiêu chuẩn đường hồi quy c) Tính tỷ số F để kiểm định giả thiết có hồi quy tuyến tính Y với X Nhận xét :Đây toán phân tích hồi quy tuyến tính Giả thiết : H0 : βi = “Phương trình hồi quy không thích hợp” H0 : βi ≠ “Phương trình hồi quy thích hợp” Giá trị thống kê: F = MSF MSE Phân bố Fisher v1 = 1, v2 = N-2 Kết luận Nếu F < Fα (1,N-2) => Chấp nhận giả thiết H0 Thực toán Excel Thiết lập bảng tính Regression: Nhập liệu vào bảng tính : Sau vào Data /Data analysis, chọn Regression Trong hộp thoại Regression ấn định: • Phạm vi đầu vào: Input Y Range, quét vùng(B3:B23) Input X Range, quét vùng(A3:A23) • Chọn Labels (thêm nhãn liệu) • Phạm vi đầura: Output Range, chọn ô D3 • Chọn Line Fit Plots Residuals để vẽ đường hồi quy Sau nhấn OK ta có kết : Kết luận : Đường hồi quy Y đốivới X : Y=1.67689X+1.045276 X Line Fit Plot Y Y Predicted Y X Sai số tiêu chuẩn đường hồi quy : 2,22 Ta thấy: F = 24,3 > c = 4,41 (tra bảng phân tố Fisher với bậc tự (1,18) mức 0,05) Vậy: có hồi quy tuyến tính Y với X Có hồi quy tuyến tính đường kính chiều cao BÀI Một công ty muốn mở rộng việc bán sản phẩm sang thị trường nước Để đánh giá xem thị phần mà công ty chiếm lĩnh ba thị trường so với đối thủ cạnh tranh có khác hay không người ta thủ nghiệm thị trường cách bán thử sản phẩm cho 150 khách hàng tiềm thị trường thu kết sau: Thị trường A B C Công ty 55 38 24 Đối thủ cạnh tranh 28 30 21 Đối thủ cạnh tranh 20 18 31 Các đối thủ khác 47 64 74 Hãy tìm P-value để kiểm định xem cấu ba thị trường có khác hay không CƠ SỞ LÍ THUYẾT: Dạng so sánh tỷ số đơn giản Giả thiết: H0 : P1=P1,0; P2= P2,0;….; Pk,0 cặp Pi Pi,0 giống H1 : có cặp Pi Pi,0 khác Giá trị thốngkê మ ߯ ሺை ିா ሻ =∑ୀଵ ா Oi : tần số thực nghiệm Ei : tần số lý thuyết • Biện luận: χ > χ 2(a) bác bỏ giả thiết Ho (DF=K-1) Trong Excel có hàm Chitest tính giá trị χ theo biểu thức: ߯ ሺைịೕ ିாịೕ ሻమ =∑ୀଵ ∑ୀଵ ா ịೕ Oi j : tần số thực nghiệm ô thuộc hàng thứ I cột j Ei j : tần số lý thuyết ô thuộc hàng thứ I cột j; r số hàng; c số cột • Xácsuất P(X > ߯ 2) với bậc tự DF= (r-1) (c-1) Nếu P(X > ߯ ଶ ) ⇒ ןchấp nhận giả thiết Ho ngược lại THỰC HIỆN BÀI TOÁN BẰNG EXCEL Nhập giá trị vào bảng tính: Tính tổng số: • Tổng hàng: Chọn F3, nhập =SUM(B3:D3), Enter, dùng trỏ kéo nút tự điều khiển từ điền từ F3 đến F6 • Tổng cột: Chọn B8, nhập =SUM(B3:B6), Enter, dùng trỏ kéo nút tự điều khiển từ B8 đến D8 • Tổng cộng: chọn F8 nhập =SUM(F3:F6) hay nhập =SUM(B8:D8) Tính tần số lý thuyết: (tổng hàng*tổng cột)/tổng cộng • A: Chọn B12: nhập =F3*$B$8/$F$8, Enter, dùng trỏ kéo nút tự điều khiển từ B12 đến B15 • B: Chọn C12: nhập =F3*$C$8/$F$8, Enter, dùng trỏ kéo nút tự điều khiển từ C12 đến C15 • C: Chọn D12: nhập =F3*$D$8/$F$8, Enter, dùng trỏ kéo nút tự điều khiển từ D12 đến D15 • Áp dụng hàm số CHITEST tính giá trị ܲሺܺ ߯ ଶ ሻ Chọn B17, nhập =CHITEST(B3:D6,B12:D15), Enter Hoặc chọn Formulas → Insert Function → chitest → OK Xuất hộp thoại Function Agruments • Nhập giá trị tần số quan sát vào mục Actual_range • Nhập giá trị tần số lí thuyết vào mục Expected_range Chọn OK Ta P = 0.00044854 0.05 nên bác bỏ giả thuyết ܪ Kết luận: Như cấu thị trường không giống BÀI 4.Người ta tiến hành đo mực nước sông số địa điểm thuộc tỉnh X ngày (số lần đo không giống nhau) thu bảng số liệu sau đây: Thời điểm đo F1 5,5 5,6 5,8 5,9 6,0 6,7 7,2 Địa điểm đo F2 F3 4,9 4,6 5,1 4,8 6,5 5,8 5,4 5,1 6,1 6,2 7,1 F4 4,5 6,2 4,8 4,8 6,5 6,8 Với mức ý nghĩa α = 2%.Mực nước sông trung bình/ngày điểm nói có thực khác không? BÀIGIẢI I.Cở sở lý thuyết: a.Dạng toán : Phân tích phương sai yếu tố b.Khái niệm thốngkê giả thuyết toán: Sự phân tích phương sai yếu tố đánh giá ảnh hưởng yếu tố (nhân tạo hay tự nhiên) giá trị quan sát , Yi ,(i=1,2,…,k) Y11 Y12 … Y1N Tổng cộng Trung bình T.1 Y.1 Yếu tố thí nghiệm … Y21 … Y22 … … … Y2N … T.2 Y.2 … … K Yk1 Yk2 … YkN Tk Y.c T Y Bảng ANOVA Nguồn sai số Yếu tố Bậc tự (k-1) Tổng số bình phương Ti T SSF = ∑ − N N i =1 k N-k Sai số SSE = SST – SSF Tổng cộng (N-1) T SST = ∑∑ Y − N i =1 j =1 k N Bình phương trung bình MSF = MSE = SSF ( k − 1) SSE (N − k) ij Trắc nghiệm Giả thiết: H0: µ1 = µ = µ k ⇔ “ Các giá trị trung bình nhau” H1: µ i ≠ µ j ⇔ “ Ít có hai giá trị trung bình khác nhau” Giá trị thống kê: F = MSF MSE Biện luận : Nếu F < Fa [k − 1, N − k ] ⇒ chấp nhận giả thiết H0 Giá trị thốngkê F= MSF MSE FC = MSF MSE Ta gỉa thiết: Mực nước sông trung bình/ngày điểm đo THỰC HIỆN BÀI TOÁN BẰNG EXEL Nhập bảng số liệu: Nhấp vào lệnh Data va lệnh Data Analysis Chọn chương trình Anova:Single Factor hộp thoại Data Analysis nhấn OK Trong hộp Anova:Single Factor ấn định: Phạm vi đầu vào (Input Range):ta kéo từ B2 đến E9 Cách xếp theo hàng hay cột (Group By):Chọn Columns Nhấn liệu (Labels in Fisrt row/column) Phạm vi đầu (Output Range):Chọn A12 Được kết quả: Biện luận: F=0.598833 < F0,02 =4.113404 Chấp nhận giả thiết H0 Vậy mực nước sông trung bình điểm cho BÀI 5 Với mức ý nghĩa α = 5% So sánh chi phí cho ba loại dịch vụ ba thành phố khác phương phương phân tích phương sai sở bảng số liệu sau đây: Thành phố Loại dịch vụ II 52 51 64 I 61 58 68 I II III III 69 61 79 Các số ô chi phí trung bình cho lần dịch vụ (đơn vị: 1000đ) Cơ sở lý thuyết : a Dạng toán : Phân tích phương sai nhân tố không liên quan b Khái niệm thốngkê giả thiết toán : Sự phân tích nhằm đánh giá ảnh hưởng hai yếu tố giá trị quan sát Yij ( i = 1.2…r : yếu tố A; j = 1.2…c : yếu tố B) Mô hình Yếu tố B Yếu tố A … r Y11 Y21 … Yr1 Y12 Y22 … Yr2 … … … … … C Y1c Y2c … Yrc Tổng cộng Y1 Y2 … Yr Tổng cộng Trung bình T.1 T.2 T.c T Y.1 Y.2 … … Y.c Y Bảng ANOVA Nguồn sai Bậc tự số Yếu tố A (r-1) (hàng) Yếu tố B (cột) (c-1) Tổng số bình phương Ti T SSB = ∑ − c rc i =1 Bình phương trung bình r c SSB = ∑ j =1 T j2 T − r rc Sai số (r-1)(c-1) SSE = SST – (SSF + SSB) Tổng cộng (rc-1) T SST = ∑∑ Y − r i =1 j =1 r c ij MSB = SSB (r − 1) MSF = SSF (c − 1) MSB = SSB ( r − 1) Trung bình Y1 Y2 … Yr Giá trị thốngkê FR = MSB MSE FC = MSF MSE Trắc nghiệm • Giả thiết: H0: µ1 = µ = µ k ⇔ “ Các giá trị trung bình nhau” H1: µ i ≠ µ j ⇔ “ Ít có hai giá trị trung bình khác nhau” • Giá trị thống kê: FR = MSB MSF F = C MSE MSE • Biện luận : Nếu FR < Fa [b − 1, (k − 1)(b − 1)] ⇒ chấp nhận H0 (yếu tố A) Nếu FC < Fa [k − 1, (k − 1)(b − 1)] ⇒ chấp nhận H0 (yếu tố B) Áp dụng MS Excel : a.Nhập số liệu vào bảng b Nhấp Data tab Data Analysis tab c Chọn chương trình Anova : Two-Factor Without Replication hộp thoại Data Analysis rồinhấp nút OK d Trong hộp thoại Anova: Single Factor xác định: - Phạm vi đầu vào (Input Range) - Cách xếp theo hàng hay cột (Group by) - Nhãn liệu (Label in First Row/Column) - Phạm vi đầu (Output Range) e Được kết sau : Biện luận : FR = 24,91589 > F0,05 = 6.944272 → Bác bỏ giả thuyết H0( Thành phố) FC = 24,7477 > F0,05 = 6.944272 → Bác bỏ giả thuyết H0( Loại dịch vụ) Vậy chi phí cho loại dich vụ thành phố khác không chịu ảnh hưởng thành phố hay loại dịch vụ nên chúng giống ... nước sông trung bình/ngày điểm nói có thực khác không? BÀI GIẢI I.Cở sở lý thuyết: a.Dạng toán : Phân tích phương sai yếu tố b.Khái niệm thống kê giả thuyết toán: Sự phân tích phương sai yếu tố đánh... hai giá trị trung bình khác nhau” Giá trị thống kê: F = MSF MSE Biện luận : Nếu F < Fa [k − 1, N − k ] ⇒ chấp nhận giả thiết H0 Giá trị thống kê F= MSF MSE FC = MSF MSE Ta gỉa thiết: Mực... trị thống kê FR = MSB MSE FC = MSF MSE Trắc nghiệm • Giả thiết: H0: µ1 = µ = µ k ⇔ “ Các giá trị trung bình nhau” H1: µ i ≠ µ j ⇔ “ Ít có hai giá trị trung bình khác nhau” • Giá trị thống kê: