báo cáo bài tập lớn môn xác suất thống kê học kỳ hè 2012

26 361 0
báo cáo bài tập lớn môn xác suất thống kê học kỳ hè 2012

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Báo Cáo Bài Tập Lớn Xác Xuất Thống Nhóm 1A BÁO CÁO BÀI TẬP LỚN MÔN XÁC SUẤT THỐNG HỌC KỲ 2012 Mục lục: Bài 1: Ví dụ 3.4: 02 Ví dụ 4.2: 04 Bài 2: 11 Bài 3: 13 Bài 4: 16 Bài 5: 20 GVHD: PGS TS Nguyễn Đình Huy Trang Báo Cáo Bài Tập Lớn Xác Xuất Thống Nhóm 1A Bài 1: Trình lại ví dụ 3.4 trang 207 ví dụ 4.2 trang 216 sách tập Xác suất thống 2012 (Nguyễn Đình Huy) Ví dụ 3.4: Hiệu suất phần trăm (%) phản ứng hóa học nghiên cứu theo yếu tố: pH (A), nhiệt độ (B) chất xúc tác (C) trình bày bảng sau: Yếu tố A A1 A2 A3 A4 Yếu tố B B1 C1 C2 C3 C4 B2 12 13 10 B3 C2 C3 C4 C1 14 15 14 11 C3 C4 C1 C2 B4 16 12 11 13 C4 C1 C2 C3 12 10 14 13 Hãy đánh giá ảnh hưởng yếu tố hiệu suất phản ứng? Bài làm: • Ta giả thiết: H0: Các giá trị trung bình ba yếu tố pH (A), nhiệt độ (B) chất xúc tác (C) H1: Có hai giá trị trung bình ba yếu tố pH (A), nhiệt độ (B) chất xúc tác (C) khác Ta tiến hành phân tích phương sai ba yếu tố dựa bảng ANOVA để kết luận ảnh hưởng yếu tố đến hiệu suất phản ứng • Cơ sở lý thuyết: Khi phân tích phương sai ba yếu tố ta thường dung mô hình vuông La tinh có dạng sau: Yếu tố A A1 A2 A3 A4 T.i Yếu tố B B1 C1 C2 C3 C4 B2 Y111 Y212 Y313 Y414 T.1 C2 C3 C4 C1 B3 Y122 Y223 Y324 Y421 T.2 C3 C4 C1 C2 B4 Y133 Y234 Y331 Y432 T.3 C4 C1 C2 C3 Y144 Y241 Y342 Y443 T.4 Ti T1 T2 T3 T4 Bảng ANOVA: Nguồn sai số Bậc tự Yếu tố A (hàng) r-1 Yếu tố B (cột) r-1 Bình phương trung bình Giá trị thống SSR = MSR = SSR / (r - 1) FR = MSR / SSE SSC = MSC = SSC / (r - 1) FC = MSC /SSE Tổng số bình phương GVHD: PGS TS Nguyễn Đình Huy Trang Báo Cáo Bài Tập Lớn Xác Xuất Thống Yếu tố C r-1 Sai số (r-1)(r-2) Tổng cộng r2 - MSF = SSF / (r - 1) SSF = SSE = SST – (SSF + SSR + SSC) SST = Giải toán Excel: Nhập liệu vào bảng sau: • Tính giá trị Ti… T.j T k T Các giá trị Ti Chọn ô B7 nhập biểu thức =SUM(B2:E2) Chọn ô C7 nhập biểu thức =SUM(B3:E3) Chọn ô D7 nhập biểu thức =SUM(B4:E4) Chọn ô E7 nhập biểu thức =SUM(B5:E5) Các giá trị T.j Chọn ô B8 nhập biểu thức =SUM(B2:B5) Dùng trỏ kéo kí hiệu tự điền từ ô B8 đến E8 Các giá trị T k Chọn ô B9 nhập biểu thức =SUM(B2;C5;D4;E3) Chọn ô C9 nhập biểu thức =SUM(B3;C2;D5;E4) Chọn ô D9 nhập biểu thức =SUM(B4;C3;D2;E5) Chọn ô E9 nhập biểu thức =SUM(B5;C4;D3;E2) Giá trị T… Chọn ô B10 nhập biểu thức =SUM(B5;C4;D3;E2) • Tính giá trị - Các giá trị Chọn ô G7 nhập biểu thức =SUMSQ(B7:E7) Dùng trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9 - Giá trị Chọn ô G10 nhập biểu thức =POWER(B10,2) GVHD: PGS TS Nguyễn Đình Huy Nhóm 1A Trang MSE = F = MSF / SSE Báo Cáo Bài Tập Lớn Xác Xuất Thống • • • Nhóm 1A Giá trị Chọn ô G11 nhập biểu thức =SUMSQ(B2:E5) Tính giá trị SSR, SSC, SSF, SST SSE - Các giá trị SSR, SSC SSF Chọn ô I7 nhập biểu thức =G7/4-39601/POWER(4,2) Dùng trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9 - Giá trị SST Chọn ô I11 nhập biểu thức =G11-G10/POWER(4,2) - Giá trị SSE Chọn ô I10 nhập biểu thức =I11-SUM(I7:I9) Tính giá trị MSR, MSC, MSF, MSE - Các giá trị MSR, MSC MSF Chọn ô K7 nhập biểu thức =I7/(4-1) Dùng trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9 - Giá trị MSE Chọn ô K10 nhập biểu thức =I10/((4-1)*(4-2)) Tính giá trị G F Chọn ô M7 nhập biểu thức =K7/0.3958 Dùng trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9 Kết biện luận: FR = 3,1 < F0.05(3.6) =4,76 => Chấp nhận H0 (pH) Fc = 11,95 < F0.05(3.6) =4,76 => Bác bỏ H0 (Nhiệt độ) F = 30,05 < F0.05(3.6) =4,76 => Bác bỏ H0 (Chất xúc tác) Vậy có nhiệt độ chất xúc tác gây ảnh hưởng tới hiệu suất Ví dụ 4.2: Người ta dung ba mức nhiệt độ gồm 105, 120 135oC kết hợp với ba khoảng thời gian 15, 30 60 phút để thực phản ứng tổng hợp Các hiệu suất phản ứng (%) trình bày bảng sau đây: Thời gian (phút) X1 15 30 60 15 30 60 15 30 60 Nhiệt độ (oC) X2 105 105 105 120 120 120 135 135 135 Hiệu suất (%) Y 1.87 2.02 3.28 3.05 4.07 5.54 5.03 6.45 7.26 Hãy cho biết yếu tố nhiệt độ yếu tố thời gian có liên quan tính tuyến với hiệu suất phản ứng tổng hợp? Nếu có điều kiện nhiệt độ 115oC vòng 50 phút hiệu suất phản ứng bao nhiêu? Bài làm: GVHD: PGS TS Nguyễn Đình Huy Trang Báo Cáo Bài Tập Lớn Xác Xuất Thống • Nhóm 1A Ta giả thiết: H0: Phương trình hồi quy không thích hợp H1: Phương trình hồi quy thích hợp Ta tìm phương trình hồi quy tính tuyến đa tham số để phụ thuộc không phụ thuộc yếu tố thời gian (X1) nhiệt độ (X2) với hiếu suất phản ứng tổng hợp (Y) • Cơ sở lý thuyết: Phương trình tổng quát cho biến phụ thuộc Y có liên quan đến k biến số độc lập X i (i=1,2, ,k): B0 + B1X1 + B2X2 + … + BkXk Bảng ANOVA: Nguồn sai số Bậc tự Tổng số bình phương Bình phương trung bình Giá trị thống Hồi quy k SSR MSR = SSR / k F = MSR / MSE Sai số N-k-1 SSE MSE = SSE / (N - k - 1) Tổng cộng N-1 SST = SSR + SSE Giá trị thống kê: • Giá trị R-bình phương: Giá trị R2: (R3 ≤ 0.81 tốt) Giá trị R2 hiệu chỉnh (Adjusted R Square) trở nên âm hay không xác định R2 hay N nhỏ • Độ lệch chuẩn: (S ≤ 0.30 tốt) Trắc nghiệm thống kê: GVHD: PGS TS Nguyễn Đình Huy Trang Báo Cáo Bài Tập Lớn Xác Xuất Thống • Trắc nghiệm t: Bậc tự t: =N-k-1 ; • Trắc nghiệm F: Bậc tự giá trị F: v1 = 1, v2 = N -k - Giải toán Excel: Nhập liệu theo cột: Sử dụng Regression: Data -> Data Analysis Trong cửa sổ Data Analysis chọn Regression: GVHD: PGS TS Nguyễn Đình Huy Trang Nhóm 1A Báo Cáo Bài Tập Lớn Xác Xuất Thống Nhóm 1A Hồi quy theo Thời gian (X1): Các thông số: - Input Y Range: Phạm vi biến số Y Input X Range: Phạm vi biến số X Labels: Dữ liệu bao gồm nhãn Confidence Level: Mức tin cậy (chọn 95%) Output options: Chọn New Worksheet Ply (Xuất kết sheet Thời gian) Kết quả: GVHD: PGS TS Nguyễn Đình Huy Trang Báo Cáo Bài Tập Lớn Xác Xuất Thống Nhóm 1A Phương trình hồi quy: YX1 = f(X1) = 2.7667 + 0.0445X1 với R2 = 0.2139 S = 1.8112 t0 = 2.1290 < t0.05 = 2.365 (tra bảng VII với n = 7, α = 0.025) hay = 0.0708 > α = 0.05  Nên chấp nhận giả thiết H0 t1 = 1.3802 < t0.05 = 2.365 hay PV = 0.2100 > α = 0.05  Nên chấp nhận giả thiết H0 F = 1.9049 < = 5.590 (tra bảng VIII với n1 = n2 = 7) hay = 0.2100 > α = 0.05  Nên chấp nhận giả thiết H0 Vậy phương trình hồi quy ý nghĩa thống Kết luận: Yếu tố thời gian liên quan tính tuyến với hiệu suất phản ứng tổng hợp Hồi quy theo Nhiệt độ (X2): Các thông số cửa sổ Regression Hồi quy theo X1, trừ Input X Range $B$1:$B$10 Kết quả: GVHD: PGS TS Nguyễn Đình Huy Trang Báo Cáo Bài Tập Lớn Xác Xuất Thống Nhóm 1A Phương trình hồi quy: YX2 = f(X2) =11.1411 + 0.1286X2 với R2 = 0.7638 S = 0.9929 t0 = 3.4179 > t0.05 = 2.365 hay = 0.0112 < α = 0.05  Nên bác bỏ giả thiết H0 t1 = 4.7572 > t0.05 = 2.365 hay PV = 0.0021 < α = 0.05  Nên bác bỏ giả thiết H0 F = 22.6309 > = 5.590 hay = 0.0021 < α = 0.05  Nên bác bỏ giả thiết H0 Vậy phương trình hồi quy có ý nghĩa thống Kết luận: Yếu tố nhiệt độ có liên quan tính tuyến với hiệu suất phản ứng tổng hợp Hồi quy theo Thời gian (X1) Nhiệt độ (X2): Các thông số cửa sổ Regression Hồi quy theo X1, trừ Input X Range $A$1:$B$10 Kết quả: GVHD: PGS TS Nguyễn Đình Huy Trang Báo Cáo Bài Tập Lớn Xác Xuất Thống Nhóm 1A Phương trình hồi quy: YX1, X2 = f(X1,X2) = -12.7000 + 0.0445X1 + 0.1286X2 với R2 = 0.9777 S = 0.3297 t0 = 11.5283 > t0.05 = 2.365 hay = 2.5607E-05 < α = 0.05  Nên bác bỏ giả thiết H0 t1 = 7.5827 > t0.05 = 2.365 hay PV = 0.0003 < α = 0.05  Nên bác bỏ giả thiết H0 t2 = 14.3278 > t0.05 = 2.365 hay PV = 7.2338E-6 < α = 0.05  Nên bác bỏ giả thiết H0 F = 131.3921 > F0.05 = 5.140 (tra bảng VII với n1 = n2 = 6) hay FS = 0.0021 < α = 0.05  Nên bác bỏ giả thiết H0 Vậy phương trình hồi quy có ý nghĩa thống Kết luận: Hiệu suất phản ứng có liên quan tính tuyến với hai yếu tố thời gian nhiệt độ Dữ liệu với hàm hồi quy Y = -12.7000 + 0.0445X1 + 0.1286X2: GVHD: PGS TS Nguyễn Đình Huy Trang 10 Báo Cáo Bài Tập Lớn Xác Xuất Thống Nhóm 1A Bài 2: Một nghiên cứu tiến hành thành phố công nghiệp X để xác định tỷ lệ người làm xe máy, xe đạp buýt Việc điều tra tiến hành hai nhóm Kết sau: Nữ Nam Xe máy 25 75 Buyt 100 120 Xe đạp 125 205 Với mức ý nghĩa α = 5%, nhận định xem có khác cấu sử dụng phương tiện giao thông làm hai nhóm công nhân nam công nhân nữ hay không Bài làm: • • Ta giả thiết: Ho: Cơ cấu sử dụng phương tiện giao thông công nhân nam công nhân nữ không khác Cơ sở lý thuyết: Giá trị thống kê: Oi - tần số thực nghiệm (observed frequency) Ei - tần số lý thuyết (expected frequency) Biện luận: Nếu Giá trị => bác bỏ giả thiết H0 tính theo biểu thức: Oi - tần số thực nghiệm ô thuộc hàng i cột j Ei - tần số lý thuyết ô thuộc hàng i cột j, r số hàng c số cột Xác xuất với bậc tự DF = (r - 1)(c - 1); r số hàng c số cột bảng VI Nếu => Chấp nhận giả thiết H0 ngược lại Giải toán Excel: GVHD: PGS TS Nguyễn Đình Huy Trang 12 Báo Cáo Bài Tập Lớn Xác Xuất Thống Nhóm 1A Nhập giá trị vào bảng tính: Tính tổng: • • • • Tổng hàng: Chọn E2 nhập biểu thức =SUM(B2:D2) Dùng trỏ kéo nút tự điền từ E2 tới E3 Tổng cột: Chọn B4 nhập biểu thức =SUM(B2:B3) Dùng trỏ kéo nút tự điền từ B4 tới D4 Tổng cộng: Chọn E5 nhập biểu thức =SUM(B2:D3) Tính tần số lí thuyết: Tần số lí thuyết = (tổng hàng x tổng cột) / tổng cộng Chọn ô B6 nhập công thức =B$4*$E2/$E$4, dùng trỏ kéo nút tự điền từ ô B6 đến ô D7 GVHD: PGS TS Nguyễn Đình Huy Trang 13 Báo Cáo Bài Tập Lớn Xác Xuất Thống GVHD: PGS TS Nguyễn Đình Huy Trang 14 Nhóm 1A Báo Cáo Bài Tập Lớn Xác Xuất Thống Nhóm 1A Áp dụng hàm CHITEST: Chọn B9 nhập biểu thức =CHITEST(B2:D3,B8:D9) Ta có kết Biện luận: = 0.0022 < α = 0.05 => Bác bỏ giả thuyết Ho Kết luận: Cơ cấu sử dụng phương tiện giao thông làm nhóm công nhân nam nữ khác Bài 3: Một điều tra xã hội học tiến hành thành phố A, B, C, D, E yêu cầu người hỏi diễn tả mức độ thỏa mãn thành phối mà họ sống Kết cho sau: Thành phố Mức độ thỏa mãn Rất thỏa mãn Tương đối Không 220 130 84 156 122 121 207 54 95 164 63 75 24 43 73 A B C D E Với mức ý nghĩa α = 3%, kiểm định xem mức độ thỏa mãn sống có phân bố giống thành phố hay không? Bài làm: Dạng bài: kiểm tra tính độc lập, sử dụng MS Excel để giải Sử dụng Excel B1 Khởi động chương trình Excel B2 Nhập bảng liệu vào chương trình B3 Thêm dòng tổng cột dòng tổng hàng B4 Tính tổng cột tổng hàng GVHD: PGS TS Nguyễn Đình Huy Trang 15 Báo Cáo Bài Tập Lớn Xác Xuất Thống GVHD: PGS TS Nguyễn Đình Huy Trang 16 Nhóm 1A Báo Cáo Bài Tập Lớn Xác Xuất Thống B5 Tính tổng: nhập vào ô F9 =SUM(F4:F8) Kết ta được: B6 Tính bảng tần số lý thuyết: ɣij = mj*ni/n Nhập vào ô C12 = C$9*$F4/$F$9) Dùng trỏ tự diền kéo từ ô C12 đến ô E16 Kết ta được: GVHD: PGS TS Nguyễn Đình Huy Trang 17 Nhóm 1A Báo Cáo Bài Tập Lớn Xác Xuất Thống B7 Nhấp chọn ô C17 Gọi hàm CHITEST để tính giá trị P Nhập giá trị Actual_range: C4:E8 Nhập giá trị Expectd_range: C12:E16 Kết ta được: Kết quả: P= 3.5299E-13 Biện luận: = 3.5299E-13 < α = 0.03 bc bỏ giả thuyết H0 GVHD: PGS TS Nguyễn Đình Huy Trang 18 Nhóm 1A Báo Cáo Bài Tập Lớn Xác Xuất Thống Kết luận: Mức độ thỏa mãn sống phân bố khác thành phố GVHD: PGS TS Nguyễn Đình Huy Trang 19 Nhóm 1A Báo Cáo Bài Tập Lớn Xác Xuất Thống Nhóm 1A Bài 4: Sau số liệu số lượng loại báo ngày bán quận nội thành: Quận nội thành Ngày khảo sát Thứ hai Thứ ba Thứ tư Thứ năm Thứ sáu Thứ bảy Q1 Q2 Q3 Q4 Q5 22 21 25 24 28 30 18 18 25 24 19 22 22 22 25 18 15 28 18 18 19 20 22 25 18 19 20 22 25 25 Lượng báo bán quận có khác thực không? Chọn α = 2% Lượng báo bán có chịu tác động yếu tố ngày tuần không? Bài làm: Cơ sở lí thuyết: Phân tích phương sai hai yếu tố không lặp: Sự phân tích nhằm đánh giá ảnh hưởng hai yếu tố giá trị quan sát Y ij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B) Mô hình: Yếu tố A … r Yếu tố B … … Tổng cộng Trung bình … … … … … c … … … Tổng cộng Trung bình … … … Bảng ANOVA Nguồn sai số Bậc tự Yếu tố A (hàng) (r–1) Tổng số bình phương SSB = GVHD: PGS TS Nguyễn Đình Huy Bình phương trung bình MSB = Trang 20 Giá trị thống = Báo Cáo Bài Tập Lớn Xác Xuất Thống Yếu tố B ( cột ) ( c -1 ) Sai số (r-1)(c-1) Tổng cộng ( rc – 1) MSF = Nhóm 1A = SSF = SSE = SST - (SSF + SSB) SST = MSB = - Giả thuyết:  “Các giá trị trung bình nhau”  “Ít có hai giá trị trung bình khác nhau” Giá trị thống kê: Biện luận: Nếu => Chấp nhận H0 (yếu tố A) Nếu => Chấp nhận H0 (yếu tố B) Giải toán Excel: Áp dụng “Anova: Two-Factor Without Replication” Vào Data -> Data Analysis Chọn mục Anova: Two-Factor Without Replication Chọn OK GVHD: PGS TS Nguyễn Đình Huy Trang 21 Báo Cáo Bài Tập Lớn Xác Xuất Thống Nhóm 1A Trong hộp thoại Anova: Two-Factor Without Replication ấn định chi tiết: • • • Phạm vi đầu vào (Input Range): $A$2:$F$8 Nhãn liệu (Labels in First Row/Column) Ngưỡng tin cậy (Alpha): 0.02 (mức ý nghĩa = 2%) Nhấn OK Ta bảng sau: GVHD: PGS TS Nguyễn Đình Huy Trang 22 Báo Cáo Bài Tập Lớn Xác Xuất Thống Kết biện luận: FR = 3,5672 > F0.02 = 3,4817 =>không chấp nhận giả thiết H0(thứ) → Vậy lượng báo bán có khác theo thứ FC = 2,4748< F0.02 = 3,7313=> chấp nhận giả thiết H0 (quận) → Vậy lượng báo bán theo quận khác GVHD: PGS TS Nguyễn Đình Huy Trang 23 Nhóm 1A Báo Cáo Bài Tập Lớn Xác Xuất Thống Nhóm 1A Bài 5: Theo dõi ngẫu nhiên giá thuê nhà thành phố (với điều kiện thuê nhà nhau) thu số liệu sau: Thành phố A Thành phố B Thành phố C Thành phố D Thành phố E 900 625 415 410 340 1200 640 400 310 425 850 775 420 320 275 1320 1000 560 280 210 1400 690 780 500 575 1150 550 620 385 360 975 840 800 440 750 390 Hãy tìm P-value để kiểm định xem có khác biệt giá thuê nhà thành phố nói hay không Bài làm: Nhận xét: Đây toán phân tích phương sai yếu tố Giả thiết H0: khác biệt giá thuê nhà thành phố Cơ sở lí thuyết: Phân tích phương sai yếu tố Sự phân tích nhằm đánh giá ảnh hưởng yếu tố giá trị quan sát Y i (i=1,2,…,k) Mô hình: Yếu tố thí nghiệm … … K … … … … … Tổng cộng Trung bình … T … … Bảng ANOVA Nguồn sai số Bậc tự Tổng số bình phương Bình phương trung bình MSF = Yếu tố k-1 Sai số N-k SSF = SSE = SST - SSF GVHD: PGS TS Nguyễn Đình Huy Trang 24 MSB = Giá trị thống = Báo Cáo Bài Tập Lớn Xác Xuất Thống Tổng cộng ( rc – 1) SST = Giả thuyết:  “Các giá trị trung bình nhau”  “Ít có hai giá trị trung bình khác nhau” Giá trị thống kê: Biện luận: Nếu => Chấp nhận giả thiết H0 Giải toán Excel: Nhập bảng số liệu hình dưới: Vào Data /Data analysis, chọn Anova: Single Factor bấm OK Trên màng hình lên hộp thoại Anova: Single Factor Ta nhập thông số hình • Phạm vi biến số Y(Input Range): ta kéo chuột từ ô A1 tới ô I5 • Alpha: 0.05 • Group by: Rows • Xuất kết (Output options): kích vào New Worksheet Ply GVHD: PGS TS Nguyễn Đình Huy Trang 25 Nhóm 1A Báo Cáo Bài Tập Lớn Xác Xuất Thống Ta kết sau: Kết Quả Và Biện Luận P-Value = 6.46E-10 < Alpha=0.05 F=28.0899> F0.05 = 2.6787 Suy ra: Không chấp nhận giả thuyết Ho Vậy có khác biệt giá thuê nhà thành phố GVHD: PGS TS Nguyễn Đình Huy Trang 26 Nhóm 1A ... 1A Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê Kết luận: Mức độ thỏa mãn sống phân bố khác thành phố GVHD: PGS TS Nguyễn Đình Huy Trang 19 Nhóm 1A Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê Nhóm 1A Bài. .. GVHD: PGS TS Nguyễn Đình Huy Trang 13 Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê GVHD: PGS TS Nguyễn Đình Huy Trang 14 Nhóm 1A Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê Nhóm 1A Áp dụng hàm CHITEST: Chọn... GVHD: PGS TS Nguyễn Đình Huy Trang 15 Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê GVHD: PGS TS Nguyễn Đình Huy Trang 16 Nhóm 1A Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê B5 Tính tổng: nhập vào ô F9 =SUM(F4:F8)

Ngày đăng: 29/08/2017, 08:51

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan