Báo cáo xác suất thống kê, thầy vũ đình huy, nhóm 6Dạng bài: PHÂN TÍCH PHƯƠNG SAI BA YẾU TỐSự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các giá trị quan sát G (i = 1, 2... r: yếu tố A; j = 1, 2...r: yếu tố B; k = 1, 2...r: yếu tố C).Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình vuông la tinh n×n. Ví dụ như mô hình vuông la tinh 4×4:
Mục Lục Bài 1: 2 Ví dụ 3.4: 2 Ví dụ 4.2: 6 Bài 2: 16 Bài 3: 22 Bài 4: 31 Bài 5: 37 Bài 1a (vd 3.4) Hiệu suất (%) của một phản ứng hóa học được nghiên cứu theo ba yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau: Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 9 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng? Cơ sở lý thuyết: Dạng bài: PHÂN TÍCH PHƯƠNG SAI BA YẾU TỐ Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các giá trị quan sát G (i = 1, 2 r: yếu tố A; j = 1, 2 r: yếu tố B; k = 1, 2 r: yếu tố C). Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình vuông la tinh n×n. Ví dụ như mô hình vuông la tinh 4×4: B C D A C D A B D A B C A B C D Mô hình vuông la tinh ba yếu tố được trình bày như sau: Yếu tố C (T k. ví dụ: T 1 = Y111 + Y421 + Y331 + Y241) Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 Y 111 C2 Y 122 C3 Y 133 C4 Y 144 T 1 A2 C2 Y 212 C3 Y 223 C4 Y 234 C1 Y 241 T 2 A3 C3 Y 313 C4 Y 324 C1 Y 331 C2 Y 342 T 3 A4 C4 Y 414 C1 Y 421 C2 Y 432 C3 Y 443 T 4 T .i. T .1. T .2. T .3. T .4. Bảng ANOVA: Nguồn sai số Bậc tự do Tổng số bình phương Bình phương trung bình Giá trị thống kê Yếu tố A (Hàng) (r-1) SSR= MSR= F R = Yếu tố B (Cột) (r-1) SSC= MSC= F C = Yếu tố C (r-1) SSF= MSF= F= Sai số (r-1)(r-2) SSE=SST – (SSF+SSR+SSC) MSE= Tổng cộng (r 2 -1) SST= Trắc nghiệm • Giả thiết: H 0 : μ 1 = μ 2 = = μ k ↔ Các giá trị trung bình bằng nhau. H 1 : μ i ≠ μ j ↔ Có ít nhất hai giá trị trung bình khác nhau. • Giá trị thống kê: F R , F C , F • Biện luận: Nếu F R < F α (r-1)(r-2) → Chấp nhận H 0 đối với yếu tố A. Nếu F C < F α (r-1)(r-2) → Chấp nhận H 0 đối với yếu tố B. Nếu F < F α (r-1)(r-2) → Chấp nhận H 0 đối với yếu tố C. Kết quả tính toán: Về bản chất, đây vẫn là một bài toán kiểm định giả thiết thống kê, do đó ta giả thiết: H 0 : Các giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) bằng nhau. H 1 : có ít nhất hai giá trị trung bình của ba yếu tố pH(A), nhiệt độ (B) và chất xúc tác (C) khác nhau. Nhập dữ liệu vào bảng tính: Tính các giá trị Ti…(Tổng theo hàng từ B đến E) Chọn ô B7 và nhập vào biểu thức = SUM(B2:E2) Chọn ô C7 và nhập biểu thức =SUM(B3:E3) Chọn ô D7 và nhập vào biểu thức =SUM(B4:E4) Chọn ô E7 và nhập vào biểu thức =SUM(B5:E5) Tính các giá trị T.j. Chọn ô B8 và nhập vào biểu thức = SUM(B2:B5) Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến ô E8 Tính các giá trị T k Chọn ô B9 và nhập biểu thức = SUM(B2.C5.D4.E3) Chọn ô C9 và nhập biểu thức = SUM(B3.C2.D5.E4) Chọn ô D9 và nhập biểu thức = SUM(B4.C3.D2.E5) Chọn ô E9 và nhập biểu thức = SUM(B5.C4.D4.E2) Tính giá trị T…(Tổng các phần tử trong bảng) Chọn ô B10 và nhập biểu thức =SUM(B2:E5) Tính các giá trị G và G -Các giá trị G và G: Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7) Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9 -Giá trị G: Chọn ô G10 và nhập biểu thức =POWER(B10.2) -Giá trị G: Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5) Tính các giá trị SSR . SSC . SSF . SST và SSE: -Các giá trị SSR . SSC và SSF: Chọn ô I7 và nhập biểu thức = G7/4-39601/POWER(4.2) Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9 -Giá trị SST Chọn ô I11 và nhập vào biểu thức = G11-G10/POWER(4.2) -Giá trị SSE: Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9) Tính các giá trị MSR . MSC . MSF . và MSE: -Các giá trị MSR. MSC và MSF: Chọn ô K7 và nhập biểu thức = I7/(4-1) Dùng con trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9 -Giá trị MSE: Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2)) Tính các giá trị G và F: Chọn ô M7 và nhập vào biểu thức = K7/0.3958 Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9 Kết quả và biện luận: F R = 3.10 < F 0.05 (3.6) = 4.76 → chấp nhận H 0 (pH). F C = 11.95 > F 0.05 (3.6) = 4.76 → bác bỏ H 0 (nhiệt độ). F = 30.05 > F 0.05 (3.6) = 4.76 → bác bỏ H 0 (chất xúc tác). Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng đến hiệu suất. Bài 1b (vd 4.2) Người ta đã dùng ba mức nhiệt độ gồm 105, 120 và 135°C kết hợp với ba khoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản ứng (%) được trình bày trong bảng sau: Thời gian (phút) Nhiệt độ (°C) Hiệu suất (%) X 1 X 2 Y 15 105 1.87 30 105 2.02 60 105 3.28 15 120 3.05 30 120 4.07 60 120 5.54 15 135 5.03 30 135 6.45 60 135 7.26 Hãy cho biết yếu tố nhiệt độ và thời gian/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115°C trong vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu? Cơ sở lý thuyết: Dạng bài: BÀI TOÁN HỒI QUY TUYẾN TÍNH ĐA THAM SỐ. Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên quan đến k biến số độc lập X i (i=1,2, ,k) thay vì chỉ có một như trong hồi quy tuyến tính đơn giản. Phương trình tổng quát Ŷx 0 ,x 1 , ,x k = B 0 + B 1 X 1 + + B k X k Bảng ANOVA: Nguồn sai số Bậc tự do Tổng số bình phương Bình phương trung bình Giá trị thống kê Hồi quy K SSR MSR= F= Sai số N-k-1 SSE MSE = Tổng cộng N-1 SST = SSR + SSE Trắc nghiệm thống kê: • Giá trị thống kê: F • Trắc nghiệm T: H 0 : β i = 0 ↔ “Các hệ số hồi quy không có ý nghĩa”. H 1 : β i ≠ 0 ↔ “Có ít nhất vài hệ số hồi quy có ý nghĩa”. Bậc tự do của giá trị T: γ = N – k - 1 F < (r - 1)(r - 2) → Chấp nhận H 0 Trắc nghiệm F H 0 : β i = 0 ↔ Phương trình hồi quy không thích hợp. H 1 : β i ≠ 0 ↔ Phương trình hồi quy thích hợp với ít nhất vài hệ số B i . F < F α (1,N-k-1) → Chấp nhận H 0 . Bậc tự do của giá trị F: v 1 =1; v 2 = N – k – 1. Kết quả tính toán: Nhập dữ liệu vào bảng tính Dữ liệu nhất thiết phải được nhập theo cột. Sử dụng lệnh “ Regression” : Data → Data Analysis → chọn Regression → OK, xuất hiện hộp thoại. Trong hộp thoại Regression, lần lượt ấn định các chi tiết: − Phạm vi của biến số Y (input Y range) − Phạm vi của biến số X (input X range) − Nhãn dữ liệu (Labels) − Mức tin cậy (Confidence level) − Tọa độ đầu ra (Output range) Đường hồi quy (Line Fit Plots),… Phương trình hồi quy: Ŷx 1 = f(X 1 ) Ŷx 1 = 2.73 + 0.04X 1 (R 2 = 0.21, S = 1.81) Các giá trị đầu ra cho ở bảng sau: [...]... 19 Báo cáo Xác Suất Thống Kê Sư dụng lệnh Data Analysis Chọn chương trình Correlation o Nhập vùng dữ liệu (A1:B29) o Check mục labels in first column ENTER o MS EXCEL suất hiện cho ta bảng sau: 20 Báo cáo Xác Suất Thống Kê Vâỵ hệ số tương quan r=0.971131 Do ta có 13 cặp quan sát nên n = 28 có phân bố Student với 26 bậc tự do T==20.75829 Với bậc tư do là 26, =5%, ta tìm được hằng số c = 2.0 56 bằng... đầu vào (Input Range) Nhãn dữ liệu (Labels) Ngưỡng tin cậy (Alpha) Lựa chọn đầu ra (Output Options) 26 Báo cáo Xác Suất Thống Kê Ta có bảng ANOVA 27 Báo cáo Xác Suất Thống Kê Kết quả và biện luận: F0.05= - FA = 0 .64 10 < F0.05 = 4.2597 = finv(0.05,1,24)→ Chấp nhận giả thiết H0(Giới Tính) - FB = 14 .61 20 > F0.05 = 3.4028 = finv(0.05,2,24) → Bác bỏ giả thiết H0(Tín Hiệu) - FAB=3.4952 > F0.05 = 3.4028... thí nghiệm 21 Báo cáo Xác Suất Thống Kê được yêu cầu nhấn nút ENTER trên bàn phím máy tính ngay khi nhận biết tín hiệu thời gian (đo bằng giây) giữa lúc tín hiệu phát ra và lúc đối tượng nhận biết được ghi lại Sau đây là kết quả trên 15 nam và 15 nữ Âm thanh Ánh sáng Xung Nam 10,0 7,2 6, 8 6, 0 5,0 6, 0 3,7 5,1 4,0 3,2 9,1 5,8 6, 0 4,0 5,1 Nữ 10,5 8,8 9,2 8,1 13,4 6, 6 4,9 2,5 4,2 1,8 7,3 6, 1 5,2 2,5 3,9... có liêm quan tuyến tính với hiệu suất của phản ứng tổng hợp Phương trình hồi quy: Ŷx2 = f(X2) Ŷx2 = -11.141 + 0.129X2 (R2 = 0. 76, S = 0.99) 11 Báo cáo Xác Suất Thống Kê • • • t0 = 3.418 > t0.05 = 2. 365 (hay Pv2 = 0.011 > α = 0.05) → Bác bỏ giả thiết H0 t1 = 4.757 > t0.05 = 2. 365 (hay Pv = 0.002 06 < α = 0.05) → Bác bỏ giả thiết H0 F = 22 .63 1 > F = 5.590(hay Fs = 0.002 06 < α = 0.05) → Bác bỏ giả thiết... quảng cáo đối với khách hàng H1: Quy mơ cơng ty có ảnh hưởng đến hiệu quả của quảng cáo đối với khách hàng o Ta lập bảng số liệu sau đây: 30 Báo cáo Xác Suất Thống Kê o Tính tổng hàng và tổng cột: Trên bảng số liệu, ta dùng chuột qt một vùng B3:E6, sau đó trên thanh Menu > chọn tab Formulas > Click vào AutoSum o Tính các tần số lý thuyết: Cơng thức: o Ta lập bảng tính tần số lý thuyết: 31 Báo cáo Xác Suất. .. bảng số liệu) o Expexted_range : chọn B10:D12 (vùng chứa dữ liệu tần số lý thuyết) 33 Báo cáo Xác Suất Thống Kê Sau đó Enter ta sẽ có được kết quả giá trị : Kết quả: = 5.79949E- 06 < α = 0.1 Khơng chấp nhận giả thiết H0 Kết luận: Quy mơ cơng ty ảnh hưởng đến hiệu quả quảng cáo đối với khách hàng 34 Báo cáo Xác Suất Thống Kê Bài 5: Với mức ý nghĩa 1 % , theo dõi số học sinh đến lớp muộn của 4 trường... = -12.70 + 0.04X1 + 0.13X2 Có thể được trình bày trong biểu đồ phân tán (scatter plots): 13 Báo cáo Xác Suất Thống Kê Muốn dự đốn hiệu suất của phản ứng bằng phương trình hồi quy Y X1,.X2 = -12,7 +0,04X1 +0,13X2 chỉ cần chọn một ơ, ví dụ như B21, sau đó nhập hàm và được kết quả như sau: 14 Báo cáo Xác Suất Thống Kê -Chọn ơ B21 và nhập: = B17+B18*50+B19*115 Ghi chú: B17 là tọa độ của B0, B18 là tọa... 28 Báo cáo Xác Suất Thống Kê Bài 4: Để nghiên cứu xem quy mơ của một cơng ty có ảnh hưởng đén hiệu quả quảng cáo đối với khách hàng hay khơng người ta đã điều tra ý kiến của 3 56 khách hàng và thu được kết quả: Quy mơ cơng ty Hiệu quả quảng cáo Mạnh Vừa phải Yếu Nhỏ Vừa 20 53 52 47 32 28 Lớn 67 32 25 Với mức ý nghĩa α = 0,1, có thể cho rằng quy mơ của cơng ty có ảnh hưởng đến hiệu quả của quảng cáo. .. tính và tín hiệu Cơ sở lý thuyết: 22 Báo cáo Xác Suất Thống Kê Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Trong đó có sự lập lại k lần thí nghiệm, mỗi hàng sẽ biểu thị một bản sao của dữ liệu và trong đầu ra sẽ thêm một đại lượng tương tác (Interaction term ) F1giữa hai yếu tố A và B MƠ HÌNH : 23 Báo cáo Xác Suất Thống Kê Yếu tố A A1 1 Y111 Y112 … Y11r... đều có ý nghĩa thống kê Nói cách khác phương trình hồi quy này thích hợp Kết luận: yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp Phương trình hồi quy: Ŷx1,x2 = f(X1,X2) Ŷx1,x2 = -12.70 + 0.04X1 + 0.13X2 (R2 = 0.97; S = 0.33) 12 Báo cáo Xác Suất Thống Kê t0 = 11.528 > t0.05 = 2. 365 (hay Pv2 = 2. 260 .10-5 < α = 0.05) → Bác bỏ giả thiết H0 t1 = 7.583 > t0.05 = 2. 365 (hay Pv = . đến hiệu suất. Bài 1b (vd 4.2) Người ta đã dùng ba mức nhiệt độ gồm 105, 120 và 135°C kết hợp với ba khoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của. yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115°C trong vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu? Cơ sở lý thuyết:. X 2 (nhiệt độ). Vậy hiệu suất phản ứng theo dự đoán ở 115°C trong vòng 50 phút là 4.3109%. BÀI 2: Tỷ số tương quan của Y đối với X và hệ số xác đònh của tập số liệu