DẠNG BÁO CÁO XÁC SUẤT NHÓM 10 B1 a) Dạng Kiểm định giá trị trung bình; Phương pháp Phân tích phương sai 3 yêu tố b) Dạng Phân tích tương quan và hồi quy tuyến tính; Phương pháp Hồi quy tuyến tính đa t[.]
DẠNG BÁO CÁO XÁC SUẤT NHÓM 10 B1 a) Dạng: Kiểm định giá trị trung bình; Phương pháp: Phân tích - phương sai - yêu tố b) Dạng: Phân tích tương quan hồi quy tuyến tính; Phương pháp: Hồi quy tuyến tính đa tham số B2 Dạng: Phân tích tương quan hồi quy tuyến tính; Phương pháp: Hồi quy tuyến tính B3 Dạng: Kiểm định so sánh - tỷ lệ; Phương pháp: So sánh tỷ số B4 Dạng: Kiểm định tính độc lập; Phương pháp: Kiểm định tính độc lập B5 Dạng: Kiểm định giá trị Trung bình; Phương pháp: Phân tích - phương sai - yếu tố - có lặp Bài 1a Đề bài: Hiệu suất phần trăm (%) phản ứng hóa học nghiên cứu theo ba yếu tố: pH (A), nhiệt độ (B) chất xúc tác (C) trình bày bảng sau Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Yêu cầu Hãy đánh giá ảnh hưởng yếu tố đến hiệu suất phản ứng? Dạng bài: Kiểm định giá trị trung bình Phương pháp giải: Phân tích phương sai yếu tố (A, B, C) Giả thiết: H0: μ1 = μ2 = = μk ↔ Các giá trị trung bình Giá trị thống kê: FR, FC, F Biện luận: Nếu FR< Fα [r-1, (r-1)(r-2)] → Chấp nhận H0 yếu tố A Nếu FC < Fα [r-1, (r-1)(r-2)] → Chấp nhận H0 yếu tố B Nếu F < Fα [r-1, (r-1)(r-2)] → Chấp nhận H0 yếu tố C Excel Tính giá trị Ti , T.j , T k, T… Tính SUMSQTi , SUMSQT.j , SUMSQT k , SQT SUMSOYijk (Tổng số bình phương) Tính giá trị SSR, SSC, SSF, SST SSE (Tổng số bình phương) Tính giá trị MSR, MSC, MSF MSE (Bình phương trung bình) Tính giá trị FR, FC F (Giá trị thống kê) Kết quả: So sánh giá trị kết luận : FR=3.10 < F0.05(3,6) = 4.76 => chấp nhận H0 (pH) FC=11.95 > F0.05(3,6) = 4.76 => bác bỏ H0 (nhiệt độ) F=30.05 > F0.05(3,6) = 4.76 => bác bỏ H0 (chất xúc tác) Kết luận có nhiệt độ chất xúc tác gây ảnh hưởng đến hiệu suất phản ứng Bài 1b Đề bài: Người ta dùng ba mức nhiệt độ gồm 105, 120 135°C kết hợp với ba khoảng thời gian 15, 30 60 phút để thực phản ứng tổng hợp Các hiệu suất phản ứng (%) trình bày bảng sau: Thời gian (phút) Nhiệt độ (°C) Hiệu suất (%) X1 X2 Y 15 105 1.87 30 105 2.02 60 105 3.28 15 120 3.05 30 120 4.07 60 120 5.54 15 135 5.03 30 135 6.45 Yêu cầu: Hãy cho biết yếu tố nhiệt độ thời gian/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất phản ứng tổng hợp? Nếu có điều kiện nhiệt độ 115°C vịng 50 phút hiệu suất phản ứng bao nhiêu? Dạng bài: Phân tích tương quan hồi quy tuyến tính; Phương pháp giải :Hồi quy tuyến tính đa tham số Giá trị thống kê: F Trắc nghiệm t: H0: βi = ↔ Các hệ số hồi quy khơng có ý nghĩa t Chấp nhận giả thiết H0 t1= 1.38 < t0.05 = 2.365 (hay Pv =0.209> α=0.05) =>Chấp nhận giả thiết H0 F= 1.95 < F0.05 = 5.590 (hay Fs=0.209 > α=0.05) =>Chấp nhận giả thiết H0 Vậy hai hệ số 2.73(B0) 0.04(B1) phương trình hồi quy Ŷx1=2.73+0.04X1 khơng có ý nghĩa thống kê Nói cách khác phương trình hồi quy khơng thích hợp Kết luận 1: Yếu tố Thời gian khơng có liên quan tuyến tính với hiệu suất phản ứng tổng hợp (2) Phương trình hồi quy: Ŷx2=f(X2) Ŷx2= -11.141 +0.129X2 (R2=0.76, S=0.99) t0=3.418> t0.05=2.365(hay Pv2=0.011>α=0.05) =>Bác bỏ giả thiết H0 t1= 4.757>t0.05=2.365(hay Pv =0.00206Bác bỏ giả thiết H0 F=22.631>F=5.590(hay Fs=0.00206Bác bỏ giả thiết H0 Vậy hai hệ số -11.141 (B0) 0.129 (B1) phương trình hồi quy Ŷx2=-11.141 +0.129X2 có ý nghĩa thống kê Nói cách khác phương trình hồi quy thích hợp Kết luận 2: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất phản ứng tổng hợp (3) Phương trình hồi quy: Ŷx1, x2=f(X1, X2) Ŷx1, x2 =-12.70+0.04X1+0.13X2 (R2=0.97; S=0.33) t0=11.528 > t0.05=2.365 (hay Pv2=2.260*10-5>α=0.05) => Bác bỏ giả thiết H0 t1= 7.583 > t0.05=2.365 (hay Pv =0.00027 Bác bỏ giả thiết H0 t2= 14.328 > t0.05=2.365 (hay Pv =7.233*10 Bác bỏ giả thiết H0 -6 F=131.392 > F=5.140 (hay Fs=1.112*10-5 Bác bỏ giả thiết H0 Vậy hai hệ số -12.70 (B0), 0.04(B1) 0.13(B1) phương trình hồi quy Ŷx1,x2 =-12.7 +0.04X1+0.13X2 có ý nghĩa thống kê Nói cách khác, phương trình hồi quy thích hợp Kết luận 3: Hiệu suất phản ứng tổng hợp có liên quan tuyến tính với hai yếu tố thời gian nhiệt độ Dự đốn hiệu suất phương trình hồi quy Y=-12.70+0.04X1+0.13X2 Với: 50 giá trị X1 thời gian) 115 giá trị X2 (nhiệt độ) Kết luận hiệu suất phản ứng theo dự đốn 115°C vịng 50 phút 4.3109% Bài 2: Đề Bảng sau cho ta mẫu gồm 11 quan sát (xi, yi) từ tập hợp giá trị cặp ĐLNN (X,Y): X 0,9 1,22 1,32 0,77 1,3 1,2 Y -0,3 0,1 0,7 -0,28 -0,25 0,02 X 1,32 0,95 1,45 1,3 1,2 Y 0,37 -0,70 0,55 0,35 0,32 Yêu cầu: a) Tìm đường hồi quy Y X b) Tính sai số tiêu chuẩn đường hồi quy c) Tính tỷ số F để kiểm định đắn giả thiết: Có hồi quy tuyến tính Y theo X Dạng bài: Phân tích tương quan hồi quy tuyến tính; Phương pháp :Phân tích hồi quy tuyến tính Kiểm định hệ số a, b: Giả thuyết Ho: Hệ số quy hồi khơng có ý nghĩa (= 0) Trắc nghiệm : chấp nhận Ho Kiểm định phương trình hồi quy: Giả thuyết Ho: “Phương trình hồi quy tuyến tính khơng phù hợp” Trắc nghiệm : chấp nhận Ho Excel Chọn Data/Data Analysis/ Regression Bước 1: Nhâp bảng số liệu Bước 2: Chọn Data/Data Analysis/ Regression Kết + biện luận a) Đường quy hồi tuyến tính Y X là: Y= 1.547892 X- 1.73948 b) Sai số tiêu chuẩn đường hồi quy SY.X= 0.28965 c) Tỷ số F = 12.6267 Với mức ý nghĩa a=0.05, Ta thấy F=12.6367 > 5.12 (bảng Fisher [1, 9]) Pv=0.006169 < 0.05 Bác bỏ giả thiết Ho Vậy hai hệ số -1.73948(Bo) 1.547892(B1) pt hồi quy Y= 1.547892 X- 1.73948 có ý nghĩa Nói cách khác, phương trình hồi quy thích hợp Kết luận: Y có liên quan tuyến tính với X Bài 3: Đề Bảng sau cho ta phân bố thu nhập nhóm tuổi: Nhóm từ 40 – 50 tuổi nhóm từ 50 – 60 tuổi số công nhân lành nghề Thụy Điển năm 1930 Nhóm tuổi 40 – 50 50 – 60 0–1 71 54 1–2 430 324 2–3 1072 894 Thu nhập 3–4 1609 1202 4–6 1178 903 >=6 158 112 Yêu cầu: Có khác phân bố thu nhập hai nhóm tuổi số công nhân lành nghề hay không? Mức ý nghĩa = 2% Dạng toán: Kiểm định so sánh - tỷ lệ; Phương pháp: So sánh tỷ số Bài làm excel Bước 1: Lập giả thiết H0: Phân bố thu nhập hai nhóm tuổi số công nhân lành nghề Bước 2: Tính tổng hàng tổng cột Bước 3: Tính tần số lý thuyết Bước 4: Dùng hàm CHITEST để tính Kết P = 0.511582 Vì giá trị P > α = 2% => Chấp nhận giả thuyết H0 Kết luận: Phân bố thu nhập hai nhóm tuổi số cơng nhân lành nghề BÀI Đề Một nhóm gồm 105 nhà doanh nghiệp Mỹ phân loại theo thu nhập năm tuổi thọ họ Kết thu hình sau: Thu nhập Tuổi Dưới 100 000 $ Từ 100 000 $ đến 399 599 $ Trên 400 000 $ Dưới 40 Từ 40 đến 54 18 19 Trên 54 11 12 17 Yêu cầu: Với mức ý nghĩa 1%, kiểm định giả thiết cho tuổi mức thu nhập có quan hệ với hay khơng? Dạng: Kiểm định tính độc lập; Phương pháp: Kiểm định tính độc lập Bài làm excel Bước 1: Lập giả thiết H0: Tuổi thu nhập không phụ thuộc Bước 2: Tính tổng hàng tổng cột Bước 3: Tính tần số lý thuyết Tần số = (tổng hàng * tổng cột) / tổng cộng Bước 4: Dùng hàm CHITEST để tính Nhấn vào Tab Fomulas chọn Insert Function chọn CHITEST nhấn OK Kết Ta P = 0.14376 Vì giá trị P > α = 1% => Chấp nhận giả thuyết H0, tuổi thu nhập không phụ thuộc Kết luận: Tuổi thu nhập không phụ thuộc Bài 5: Đề + yêu cầu Với mức ý nghĩa 1%, Hãy phân tích tình hình kinh doanh số ngành nghề quận nội thành sơ sở số liệu doanh thu số cửa hàng sau: Ngành nghề kinh Khu vực kinh doanh doanh Q1 Q2 Q3 Q4 Điện lạnh Vật liệu xây dựng Dịch vụ tin học 2.0:2.4 9.5:9.3:9.1 1.2:1.3:1.2 5.0:5.4 19.5:17.5 5.0:4.8:5.2 2.5:2.7:2.0:3.0 0.6:10.4 1.2:1.0:9.8:1.8 3.1:3.5:2.7 15.0 2.0:2.2:1.8 Dạng: Kiểm định giá trị Trung bình; Phương pháp: Phân tích - phương sai - yếu tố - có lặp Excel Bước 1: Giả thuyết Ho: -HA (yếu tố ngành nghề): doanh thu không phụ thuộc vào ngành nghề -HB (yếu tố quận): doanh thu không phụ thuộc vào quận -HAB(sự tương tác yếu tố): doanh thu ngành nghề quận khơng có liên quan tới Bước 2: Áp dụng: “Anova: Two-Factor With Replication” Vào Data -> Data Analysis Chọn mục Anova: Two-Factor With Replication Chọn OK Phạm vi đầu vào (Input Range): $A$3:$E$15 Số hàng mẫu (Rows per sample): Ngưỡng tin cậy (Alpha): 0.01 (mức ý nghĩa = 1%) Phạm vi đầu (Output Range): $A$17 Biện luận: ( n: hàng, m: cột, r: số giá trị ô) a Nếu FA Chấp nhận giả thiết H0 →Tình hình kinh doanh quận Ảnh hưởng: F = 0.6498 < F0.01 = 3.3507 => Chấp nhận giả thiết H0 → Khơng có tương tác khu vực kinh doanh (quận) ngành nghề kinh doanh Kết luận: Vậy tình hình kinh doanh khơng ngành nghề mà cịn quận Ngồi ra, khơng có tương tác hai yếu tố ngành nghề kinh doanh địa điểm kinh doanh (quận)