Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 22 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
22
Dung lượng
498 KB
Nội dung
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ BÀI 1 A. Ví dụ 3.4/161 SGK Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo ba yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau: Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 9 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Hãy đánh giá về ảnh hưởng của các yếu tố trên đến hiệu suất phản ứng? Phương pháp: PHÂN TÍCH PHƯƠNG SAI BA YẾU TỐ Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các giá trị quan sát G (i = 1, 2 r: yếu tố A; j = 1, 2 r: yếu tố Bảo: k = 1, 2 r: yếu tố C). Mô hình: Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình vuông la tinh n×n. Ví dụ như mô hình vuông la tinh 4×4: B C D A C D A B D A B C A B C D Mô hình vuông la tinh ba yếu tố được trình bày như sau: Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 Y 111 C2 Y 122 C3 Y 133 C4 Y 144 T 1 A2 C2 Y 212 C3 Y 223 C4 Y 234 C1 Y 241 T 2 A3 C3 Y 313 C4 Y 324 C1 Y 331 C2 Y 342 T 3 A4 C4 Y 414 C1 Y 421 C2 Y 432 C3 Y 443 T 4 T .i. T .1. T .2. T .3. T .4. BÙI MINH CHUNG_G0804070 Page 1 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Bảng ANOVA: Nguồn sai số Bậc tự do Tổng số bình phương Bình phương trung bình Giá trị thống kê Yếu tố A (Hàng) (r-1) SSR= ∑ = − r i i r T r T 1 2 2 2 MSR= )1( −r SSR F R = MSE MSR Yếu tố B (Cột) (r-1) SSC= ∑ = − r j j r T r T 1 2 2 2 MSC= )1( −r SSC F C = MSE MSC Yếu tố C (r-1) SSF= ∑ = − r k k r T r T 1 2 2 2 MSF= )1( −r SSF F= MSE MSF Sai số (r-1)(r-2) SSE=SST – (SSF+SSR+SSC) MSE= )2)(1( −− rr SSE Tổng cộng (r 2 -1) SST= 2 2 2 r T Y ijk −ΣΣΣ Trắc nghiệm • Giả thiết: H 0 : μ 1 = μ 2 = = μ k ↔ Các giá trị trung bình bằng nhau H 1 : μ i ≠ μ j ↔ Có ít nhất hai giá trị trung bình khác nhau • Giá trị thống kê: F R , F C , F • Biện luận Nếu F R < F α (r-1)(r-2) → Chấp nhận H 0 đối với yếu tố A Nếu F C < F α (r-1)(r-2) → Chấp nhận H 0 đối với yếu tố B Nếu F < F α (r-1)(r-2) → Chấp nhận H 0 đối với yếu tố C Bài làm: Nhập dữ liệu vào bảng tính BÙI MINH CHUNG_G0804070 Page 2 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Thiết lập các biểu thức và tính các giá trị thống kê 1. Tính các giá trị Ti , T.j., T k và T • Các giá trị Ti Chọn ô B7 và chọn biểu thức =SUM(B2:E2) Chọn ô C7 và nhập biểu thức =SUM(B3:E3) Chọn ô D7 và nhập biểu thức =SUM(B4:E4) Chọn ô E7 và nhập biểu thức =SUM(B4:E4) • Các giá trị T.j. Chọn ô B8 và nhập biểu thức =SUM(B2:B5) Dùng con trỏ kéo ký hiệu tự điền từ ô B8 đến ô E8 • Các giá trị T k Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3) Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4) Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5) Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2) • Giá trị T… Chọn ô B10 và nhập biểu thức=SUM(B2:B5) 2. Tính các giá trị G Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7) Dùng con trỏ kéo ký hiệu tự điền từ ô G7 đến ô G9 Chọn ô G10 và nhập biểu thức =POWER(B10,2) Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5) 3. Tính các giá trị SSR, SSC, SSF, SST và SSE • Các giá trị SSR, SSC, SSF Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2) Dùng con trỏ kéo ký hiệu tự điền từ ô I7 đến ô I9 • Giá trị SST Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2) • Giá trị SSE Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9) 4. Tính các giá trị MSR, MSC, MSF và MSE • Giá trị MSR, MSC, MSF BÙI MINH CHUNG_G0804070 Page 3 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Chọn ô K7 và nhập biểu thức =I7/(4-1) Dung con trỏ kéo ký hiệu tự điền từ ô K7 đến ô K9 • Giá trị MSE Chọn ô K10 và nhập biểu thức =I/((4-1)*(4-2)) 5. Tính các giá trị F: Chọn ô M7 và nhập biểu thức =K7/$K$10 Dùng con trỏ kéo ký hiệu tự điền từ ô M7 đến M9. Kết quả và biện luận F R =3.10 < F 0.05 (3,6)=4.76 => chấp nhận H 0 (pH) F C =11.95 > F 0.05 (3,6)=4.76 => bác bỏ H 0 (nhiệt độ) F=30.05 > F 0.05 (3,6)=4.76 => bác bỏ H 0 (chất xúc tác) Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng đến hiệu suất phản ứng. B. Ví dụ 4.2/170 SGK Người ta dùng ba mức nhiệt độ gồm 105, 120 và 135°C kết hợp với ba khoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản ứng (%) được trình bày trong bảng sau: Thời gian (phút) Nhiệt độ (°C) Hiệu suất (%) X 1 X 2 Y 15 105 1.87 30 105 2.02 60 105 3.28 15 120 3.05 30 120 4.07 60 120 5.54 15 135 5.03 BÙI MINH CHUNG_G0804070 Page 4 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 30 135 6.45 Hãy cho biết yếu tố nhiệt độ và thời gian/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115°C trong vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu? Phương pháp: HỒI QUY TUYẾN TÍNH ĐA THAM SỐ Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên quan đến k biến số độc lập X i (i=1,2, ,k) thay vì chỉ có một như trong hồi quy tuyến tính đơn giản. Phương trình tổng quát Ŷx 0 ,x 1 , ,x k = B 0 + B 1 X 1 + + B k X k Bảng ANOVA Nguồn sai số Bậc tự do Tổng số bình phương Bình phương trung bình Giá trị thống kê Hồi quy K SSR MSR= k SSR F= MSE MSR Sai số N-k-1 SSE MSE = )1( −− kN SSE Tổng cộng N-1 SST = SSR + SSE Giá trị thống kê Giá trị R-bình phương: kFkN kF SST SSR R +−− == )1( 2 ( 81.0 2 ≥R là khá tốt) Độ lệch chuẩn: )1( −− = kN SSE S ( 30.0 ≤ S là khá tốt) Trắc nghiệm • Giá trị thống kê: F • Trắc nghiệm t: H 0 : β i = 0 ↔ Các hệ số hồi quy không có ý nghĩa. H 1 : β i ≠ 0 ↔ Có ít nhất vài hệ số hồi quy có ý nghĩa. BÙI MINH CHUNG_G0804070 Page 5 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ F < 2 α t (r-1)(r-2) → Chấp nhận H 0 • Trắc nghiệm F H 0 : β i = 0 ↔ Phương trình hồi quy không thích hợp. H 1 : β i ≠ 0 ↔ Phương trình hồi quy thích hợp với ít nhất vài hệ số B i . F < F α (1,N-k-1) → Chấp nhận H 0 Bài làm: Nhập dữ liệu vào bảng tính Dữ liệu nhất thiết phải được nhập theo cột. Áp dụng Regression Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis Chọn chương trình Regression trong hộp thoại Data Analysis rồi nhấp OK BÙI MINH CHUNG_G0804070 Page 6 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Trong hộp thoại Regression, lần lượt ấn định các chi tiết: − Phạm vi của biến số Y (input Y range) − Phạm vi của biến số X (input X range) − Nhãn dữ liệu (Labels) − Mức tin cậy (Confidence level) − Tọa độ đầu ra (Output range) − Đường hồi quy (Line Fit Plots),… Các giá trị đầu ra cho bảng sau: Phương trình hồi quy: Ŷx 1 =f(X 1 ) BÙI MINH CHUNG_G0804070 Page 7 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Ŷx 1 =2.73 + 0.04X 1 (R 2 =0.21, S=1.81) t 0 =2.19 < t 0.05 = 2.365 (hay P v 2 =0.071>α=0.05) => Chấp nhận giả thiết H 0 t 1 =1.38 < t 0.05 = 2.365 (hay P v =0.209>α=0.05) => Chấp nhận giả thiết H 0 F=1.95 < F 0.05 = 5.590 (hay F s =0.209>α=0.05) => Chấp nhận giả thiết H 0 Vậy cả hai hệ số 2.73 (B 0 ) và 0.04 (B 1 ) của phương trình hồi quy Ŷx 1 = 2.73 + 0.04X 1 đều không có ý nghĩa thống kê. Nói cách khác phương trình hồi quy này không thích hợp. Phương trình hồi quy: Ŷx 2 = f(X 2 ) Ŷx 2 = -11.141 + 0.129X 2 (R 2 =0.76,S=0.99) BÙI MINH CHUNG_G0804070 Page 8 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ t 0 = 3.418 > t 0.05 = 2.365 (hay P v 2 =0.011 > α=0.05) =>Bác bỏ giả thiết H 0 t 1 = 4.757 > t 0.05 = 2.365(hay P v =0.00206 < α=0.05) =>Bác bỏ giả thiết H 0 F= 22.631 > F=5.590(hay F s =0.00206 < α=0.05) =>Bác bỏ giả thiết H 0 Vậy cả hai hệ số -11.141 (B 0 ) và 0.129 (B1) của phương trình hồi quy Ŷx 2 = -11.141 + 0.129X 2 đều có ý nghĩa thống kê. Nói cách khác phương trình hồi quy này thích hợp. Kết luận: yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp. Phương trình hồi quy: Ŷx 1 ,x 2 =f(X 1 ,X 2 ) Ŷx 1 ,x 2 = -12.70 + 0.04X 1 + 0.13X 2 (R 2 =0.97; S=0.33) t 0 =11.528 > t 0.05 =2.365 (hay P v 2 =2.260.10 -5 <α=0.05)=>Bác bỏ giả thiết H 0 BÙI MINH CHUNG_G0804070 Page 9 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ t 1 =7.583 > t 0.05 =2.365 (hay P v =0.00027<α=0.05) =>Bác bỏ giả thiết H 0 F=131.392 > 5.14 (hay F s =1.112*10 -5 <α=0.05) =>Bác bỏ giả thiết H 0 Vậy cả hai hệ số -12.70 (B 0 ), 0.04 (B1) và 0.13 (B1) của phương trình hồi quy Ŷx 1 ,x 2 =-12.7 + 0.04X 1 + 0.13X 2 đều có ý nghĩa thống kê. Nói cách khác, phương trình hồi quy này thích hợp. Kết luận: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thời gian và nhiệt độ. Sự tuyến tính của phương trình Ŷx 1 ,x 2 = -12.70 + 0.04X 1 + 0.13X 2 . Có thể được trình bày trong biểu đồ phân tán (scatter plots): Nếu muốn dự đoán hiệu suất bằng phương trình hồi quy Y= -12.70 + 0.04X 1 + 0.13X 2 chỉ cần chọn một ô, ví dụ như: E20, sau đó nhập hàm=E17+E18*50+E19*115 và được kết quả như sau: BÙI MINH CHUNG_G0804070 Page 10 [...]...BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Ghi chú: E17 tọa độ của B0 ,E18 tọa độ của B1,E19 tọa độ của B2, 50 là giá trị của X1(thời gian) và 115 là giá trị của X2 (nhiệt độ) Vậy hiệu suất phản ứng theo dự đoán ở 115°C trong vòng 50 phút là 4.3109% BÙI MINH CHUNG_G0804070 Page 11 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ BÀI 2: Một nhà nông học tiến hành việc kiểm định hiệu... Giá trị thống kê F= MSF MSE Page 12 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ SSE=SST-SSF Tổng cộng N-1 k n 2 SST= ∑∑ Y n − i =1 j =1 MSE= SSE N −k T2 N Trắc nghiệm: • Giả thiết: H0: µ1 = µ 2 = = µ k ⇔ “Các giá trị trung bình bằng nhau” H1: µ i ≠ µ j ⇔ “Ít nhất có hai giá trị trung bình khác nhau” MSF MSE • Giá trị thống kê: F= • Biện luận: Nếu F < Fα(k-1;N-k) => chấp nhận giả thiết H0 Bài làm Đây là bài toán... 13 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Bảng Anova: Kết luận: Từ giá trị trong bảng Anova: F= 3.8557 > Fα= 2.3597 => Bác bỏ H0 => Lượng quả cà chua mọc trung bình khi sử dụng các loại phân khác nhau là khác nhau => Số lượng quả cà chua mọc trung bình khi sử dụng 3 loại phân: Loại A là : 24,2 Loại B là : 26 Loại C là : 21 => Loại B > Loại A > Loại C BÙI MINH CHUNG_G0804070 Page 14 BÀI TẬP LỚN XÁC SUẤT THỐNG... Loại B > loại A BÙI MINH CHUNG_G0804070 Page 16 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ BÀI 4: Bảng sau đây cho ta số liệu về màu tóc của 422 người: Màu tóc Nam Nữ Đen 56 32 Hung 37 66 Nâu 84 90 Vàng 19 38 Với mức ý nghĩa 1%, nhận định xem liệu có mối quan hệ giữa màu tóc và giới tính hay không Phương pháp: KIỂM ĐỊNH TÍNH ĐỘC LẬP Khái niệm thống kê và giả thuyết bài toán: - Mục đích: Xét một tổng thể gồm 2 dấu... Tính thống kê dựa vào các công thức sau: BÙI MINH CHUNG_G0804070 Page 17 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ ( nij −γij ) 2 k k i= 1 j= 1 χ =∑ ∑ 2 0 γij γij = ni m j n Cách 2: Sử dụng hàm CHITEST trong Excel: CHITEST(nij,γij), với lưu ý số lượng các giá trị của nij và γij phải bằng nhau Kết luận 2 2 Nếu χ 0 < χ α → Chấp nhận giả thiết H0 Hoặc kết quả hàm CHITEST > α = 0.01 → Chấp nhận giả thiết H0 Bài làm... - 1) = 11.34 − Nhập bảng số liệu như hình sau − Sử dụng hàm =SUM(B2:B5) và nút tự điền – Tính thống kê dựa vào các công thức sau: k k i= 1 j= 1 ( nij −γij ) 2 χ =∑ ∑ 2 0 γij γij = ni m j n Sau khi sử dụng với Excel ta có bảng số liệu γij như sau: BÙI MINH CHUNG_G0804070 Page 18 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2 χ0 = − (56 −40.872) 2 (32 −47.128) 2 (38 −30, 5261) 2 + + + 40.872 47.128 30, 5261 Hoặc sử... sánh mức độ nhiễm chì đối với công nhân ở các phân xưởng của nhà máy nói trên Bài làm Đây là bài toán phân tích phương sai một yếu tố Giả thiết: H0: µ1 = µ2 = µ3 = µ4 = µ5; tức mức độ nhiễm chì của các công nhân ở 5 phân xưởng là bằng nhau Nhập dữ liệu vào bảng: BÙI MINH CHUNG_G0804070 Page 20 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Áp dụng Anova: Single Factor Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis... – Kết luận: 2 2 Vì χ 0 > χα → Bác bỏ giả thiết H0 Hoặc γij = 0.0002468 < α = 0.01 → Bác bỏ giả thiết H0 Vậy: Màu tóc và giới tính có mối liên hệ với nhau BÙI MINH CHUNG_G0804070 Page 19 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ BÀI 5: Kiểm tra sức khỏe của 29 công nhân ở năm phân xưởng của nhà máy sản xuất pin – ắc quy người ta đo được mật độ nhiễm chì của họ như sau: Mức nhân tố Số thứ tự quan sát F1 F3 0,22 1... định − Phạm vi đầu vào(input range) − Cách xắp xếp theo hang hay cột(group by) − Nhấn dữ liệu(labels in fisrt row/column) − Phạm vi đầu ra(output range) BÙI MINH CHUNG_G0804070 Page 15 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Sau khi nhấn OK xuất hiện bảng Anova: Kết luận: Từ giá trị trong bảng Anova: F = 7.5864 > Fα = 6.9266 => Bác bỏ H0 => Lượng tiêu thụ của 3 loại giày trên là khác nhau Lượng tiêu thụ... range) − Cách xắp xếp theo hàng hay cột (Group by) − Nhấn dử liệu (Labels in fisrt row/column) − Phạm vi đầu ra (Output range) − Chọn α = 0.05 Bảng Anova: BÙI MINH CHUNG_G0804070 Page 21 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Kết luận: Từ giá trị trong bảng Anova: F=1.5828 < Fα=2.7763 => Chấp nhận H0 Vậy mức độ nhiễm chì của các công nhân ở 5 phân xưởng là bằng nhau BÙI MINH CHUNG_G0804070 Page 22 . bảng số liệu γij như sau: BÙI MINH CHUNG_G0804 070 Page 18 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2 2 2 2 0 (56 40. 872 ) (32 47. 128) (38 30,5261) 40. 872 47. 128 30,5261 χ − − − = + + + − Hoặc sử dụng hàm. thức =I11-SUM(I7:I9) 4. Tính các giá trị MSR, MSC, MSF và MSE • Giá trị MSR, MSC, MSF BÙI MINH CHUNG_G0804 070 Page 3 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Chọn ô K7 và nhập biểu thức =I7/(4-1) Dung con. điền từ ô K7 đến ô K9 • Giá trị MSE Chọn ô K10 và nhập biểu thức =I/((4-1)*(4-2)) 5. Tính các giá trị F: Chọn ô M7 và nhập biểu thức =K7/$K$10 Dùng con trỏ kéo ký hiệu tự điền từ ô M7 đến M9.