Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
1,74 MB
Nội dung
BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A BÁOCÁOBÀITẬPLỚN MÔN XÁC SUẤT THỐNGKÊ HỌC KỲ I 2013-2014 Mục lục: Bài 1: Ví dụ 3.4: 02 Ví dụ 4.2: 04 Bài 2: 12 Bài 3: 15 Bài 4: 18 Bài 5: 22 GVHD: PGS TS Nguyễn Đình Huy Trang BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Bài 1: Trình lại ví dụ 3.4 trang 207 ví dụ 4.2 trang 216 sách tậpXác suất thốngkê 2012 (Nguyễn Đình Huy) Ví dụ 3.4: Hiệu suất phần trăm (%) phản ứng hóa học nghiên cứu theo yếu tố: pH (A), nhiệt độ (B) chất xúc tác (C) trình bày bảng sau: Yếu tố Yếu tố B A A1 A2 A3 A4 B1 C1 C2 C3 C4 B2 12 13 10 B3 C2 C3 C4 C1 14 15 14 11 C3 C4 C1 C2 B4 16 12 11 13 C4 C1 C2 C3 12 10 14 13 Hãy đánh giá ảnh hưởng yếu tố hiệu suất phản ứng? Bài làm: Ta giả thiết: H0: Các giá trị trung bình ba yếu tố pH (A), nhiệt độ (B) chất xúc tác (C) H1: Có hai giá trị trung bình ba yếu tố pH (A), nhiệt độ (B) chất xúc tác (C) khác Ta tiến hành phân tích phương sai ba yếu tố dựa bảng ANOVA để kết luận ảnh hưởng yếu tố đến hiệu suất phản ứng Cơ sở lý thuyết: Khi phân tích phương sai ba yếu tố ta thường dung mơ hình vng La tinh có dạng sau: Yếu tố A A1 A2 A3 A4 T.i Yếu tố B B1 C1 C2 C3 C4 B2 Y111 Y212 Y313 Y414 T.1 C2 C3 C4 C1 B3 Y122 Y223 Y324 Y421 T.2 C3 C4 C1 C2 B4 Y133 Y234 Y331 Y432 T.3 C4 C1 C2 C3 Y144 Y241 Y342 Y443 T.4 Ti T1 T2 T3 T4 Bảng ANOVA: Nguồn sai số Bậc tự Yếu tố A (hàng) r–1 Tổng số bình phương SSR = GVHD: PGS TS Nguyễn Đình Huy Trang Bình phương trung bình Giá trị thốngkê MSR = SSR / (r - 1) FR = MSR / SSE BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Yếu tố B (cột) r–1 SSC = MSC = SSC / (r - 1) FC = MSC /SSE Yếu tố C r–1 SSF = MSF = SSF / (r - 1) F = MSF / SSE Sai số (r-1)(r-2) Tổng cộng r2 – SSE = SST – (SSF + SSR + SSC) SST = Giải toán Excel: Nhập liệu vào bảng sau: Tính giá trị Ti… T.j T k T - Các giá trị Ti Chọn ô B7 nhập biểu thức =SUM(B2:E2) Chọn ô C7 nhập biểu thức =SUM(B3:E3) Chọn ô D7 nhập biểu thức =SUM(B4:E4) Chọn ô E7 nhập biểu thức =SUM(B5:E5) - Các giá trị T.j Chọn ô B8 nhập biểu thức =SUM(B2:B5) Dùng trỏ kéo kí hiệu tự điền từ ô B8 đến E8 - Các giá trị T k Chọn ô B9 nhập biểu thức =SUM(B2,C5,D4,E3) Chọn ô C9 nhập biểu thức =SUM(B3,C2,D5,E4) Chọn ô D9 nhập biểu thức =SUM(B4,C3,D2,E5) Chọn ô E9 nhập biểu thức =SUM(B5,C4,D3,E2) - Giá trị T… Chọn ô B10 nhập biểu thức =SUM(B2:E5) Tính giá trị GVHD: PGS TS Nguyễn Đình Huy Trang MSE = BáoCáoBàiTậpLớnXácXuấtThốngKê - Các giá trị Nhóm 1A Chọn ô G7 nhập biểu thức =SUMSQ(B7:E7) Dùng trỏ kéo kí hiệu tự điền từ G7 đến G9 - Giá trị Chọn ô G10 nhập biểu thức =POWER(B10,2) - Giá trị Chọn ô G11 nhập biểu thức =SUMSQ(B2:E5) Tính giá trị SSR, SSC, SSF, SST SSE - Các giá trị SSR, SSC,SSF SST Chọn ô I7 nhập biểu thức =G7/4-39601/POWER(4,2) Dùng trỏ kéo kí hiệu tự điền từ ô I7 đến ô I10 - Giá trị SSE Chọn I10 nhập biểu thức =I11-SUM(I7:I9) Tính giá trị MSR, MSC, MSF, MSE - Các giá trị MSR, MSC MSF Chọn ô K7 nhập biểu thức =I7/(4-1) Dùng trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9 - Giá trị MSE Chọn K10 nhập biểu thức =I10/((4-1)*(4-2)) Tính giá trị G F Chọn ô M7 nhập biểu thức =K7/0.3958 Dùng trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9 Kết biện luận: FR = 3,1 < F0.05(3.6) =4,76 => Chấp nhận H0 (pH) Fc = 11,95 > F0.05(3.6) =4,76 => Bác bỏ H0 (Nhiệt độ) F = 30,05 > F0.05(3.6) =4,76 => Bác bỏ H0 (Chất xúc tác) Vậy có nhiệt độ chất xúc tác gây ảnh hưởng tới hiệu suất Ví dụ 4.2: Người ta dung ba mức nhiệt độ gồm 105, 120 135oC kết hợp với ba khoảng thời gian 15, 30 60 phút để thực phản ứng tổng hợp Các hiệu suất phản ứng (%) trình bày bảng sau đây: Thời gian (phút) X1 15 30 60 15 30 60 GVHD: PGS TS Nguyễn Đình Huy Nhiệt độ (oC) X2 105 105 105 120 120 120 Trang Hiệu suất (%) Y 1.87 2.02 3.28 3.05 4.07 5.54 BáoCáoBàiTậpLớnXácXuấtThốngKê 15 30 60 135 135 135 Nhóm 1A 5.03 6.45 7.26 Hãy cho biết yếu tố nhiệt độ yếu tố thời gian có liên quan tính tuyến với hiệu suất phản ứng tổng hợp? Nếu có điều kiện nhiệt độ 115oC vòng 50 phút hiệu suất phản ứng bao nhiêu? Bài làm: Ta giả thiết: H0: Phương trình hồi quy khơng thích hợp H1: Phương trình hồi quy thích hợp Ta tìm phương trình hồi quy tính tuyến đa tham số để phụ thuộc không phụ thuộc yếu tố thời gian (X1) nhiệt độ (X2) với hiếu suất phản ứng tổng hợp (Y) Cơ sở lý thuyết: Phương trình tổng quát cho biến phụ thuộc Y có liên quan đến k biến số độc lập Xi (i=1,2, ,k): B0 + B1X1 + B2X2 + … + BkXk Bảng ANOVA: Nguồn sai số Bậc tự Tổng số bình phương Bình phương trung bình Giá trị thốngkê Hồi quy K SSR MSR = SSR / k F = MSR / MSE Sai số N-k–1 SSE MSE = SSE / (N - k 1) Tổng cộng N–1 SST = SSR + SSE Giá trị thống kê: Giá trị R-bình phương: Giá trị R2: (R3 ≤ 0.81 tốt) Giá trị R2 hiệu chỉnh (Adjusted R Square) GVHD: PGS TS Nguyễn Đình Huy Trang BáoCáoBàiTậpLớnXácXuấtThốngKê trở nên âm hay không xác định R2 hay N nhỏ Độ lệch chuẩn: (S ≤ 0.30 tốt) Trắc nghiệm thống kê: Trắc nghiệm t: Bậc tự t: =N-k-1 ; Trắc nghiệm F: Bậc tự giá trị F: v1 = 1, v2 = N -k - Giải toán Excel: Nhập liệu theo cột: Sử dụng Regression: Data -> Data Analysis Trong cửa sổ Data Analysis chọn Regression: GVHD: PGS TS Nguyễn Đình Huy Trang Nhóm 1A BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Hồi quy theo Thời gian (X1): Các thơng số: - Input Y Range: Phạm vi biến số Y Input X Range: Phạm vi biến số X Labels: Dữ liệu bao gồm nhãn Confidence Level: Mức tin cậy (chọn 95%) Output options: Chọn New Worksheet Ply (Xuất kết sheet Thời gian) Kết quả: GVHD: PGS TS Nguyễn Đình Huy Trang BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Phương trình hồi quy: YX1 = f(X1) = 2.7267 + 0.0445X1 với R2 = 0.2139 S = 1.8112 t0 = 2.1290 < t0.05 = 2.365 (tra bảng VII với n = 7, α = 0.025) hay = 0.0708 > α = 0.05 Nên chấp nhận giả thiết H0 t1 = 1.3802 < t0.05 = 2.365 hay PV = 0.2100 > α = 0.05 Nên chấp nhận giả thiết H0 F = 1.9049 < = 5.590 (tra bảng VIII với n1 = n2 = 7) hay = 0.2100 > α = 0.05 Nên chấp nhận giả thiết H0 Vậy phương trình hồi quy khơng có ý nghĩa thốngkê Kết luận: Yếu tố thời gian khơng có liên quan tính tuyến với hiệu suất phản ứng tổng hợp Hồi quy theo Nhiệt độ (X2): Các thông số cửa sổ Regression Hồi quy theo X1, trừ Input X Range $B$1:$B$10 Kết quả: GVHD: PGS TS Nguyễn Đình Huy Trang BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Phương trình hồi quy: YX2 = f(X2) = -11.1411 + 0.1286X2 với R2 = 0.7638 S = 0.9929 t0 = 3.4179 > t0.05 = 2.365 hay = 0.0112 < α = 0.05 Nên bác bỏ giả thiết H0 t1 = 4.7572 > t0.05 = 2.365 hay PV = 0.0021 < α = 0.05 Nên bác bỏ giả thiết H0 F = 22.6309 > = 5.590 hay = 0.0021 < α = 0.05 Nên bác bỏ giả thiết H0 Vậy phương trình hồi quy có ý nghĩa thốngkê Kết luận: Yếu tố nhiệt độ có liên quan tính tuyến với hiệu suất phản ứng tổng hợp Hồi quy theo Thời gian (X1) Nhiệt độ (X2): Các thông số cửa sổ Regression Hồi quy theo X1, trừ Input X Range $A$1:$B$10 Kết quả: GVHD: PGS TS Nguyễn Đình Huy Trang BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Phương trình hồi quy: YX1, X2 = f(X1,X2) = -12.7000 + 0.0445X1 + 0.1286X2 với R2 = 0.9777 S = 0.3297 t0 = 11.5283 > t0.05 = 2.365 hay = 2.5607E-05 < α = 0.05 Nên bác bỏ giả thiết H0 t1 = 7.5827 > t0.05 = 2.365 hay PV = 0.0003 < α = 0.05 Nên bác bỏ giả thiết H0 t2 = 14.3278 > t0.05 = 2.365 hay PV = 7.2338E-6 < α = 0.05 Nên bác bỏ giả thiết H0 F = 131.3921 > F0.05 = 5.140 (tra bảng VII với n1 = n2 = 6) hay FS = 0.0021 < α = 0.05 Nên bác bỏ giả thiết H0 Vậy phương trình hồi quy có ý nghĩa thốngkê Kết luận: Hiệu suất phản ứng có liên quan tính tuyến với hai yếu tố thời gian nhiệt độ GVHD: PGS TS Nguyễn Đình Huy Trang 10 BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Bài 2: Một nghiên cứu tiến hành thành phố công nghiệp X để xác định tỷ lệ người làm xe máy, xe đạp buýt Việc điều tra tiến hành hai nhóm Kết sau: Nữ Nam Xe máy 25 75 Buyt 100 120 Xe đạp 125 205 Với mức ý nghĩa = 5%, nhận định xem có khác cấu sử dụng phương tiện giao thông làm hai nhóm cơng nhân nam cơng nhân nữ hay không Bài làm: Ta giả thiết: Ho: Cơ cấu sử dụng phương tiện giao thông công nhân nam công nhân nữ không khác Cơ sở lý thuyết: Giá trị thống kê: Oi - tần số thực nghiệm (observed frequency) Ei - tần số lý thuyết (expected frequency) Biện luận: Nếu Giá trị => bác bỏ giả thiết H0 tính theo biểu thức: Oi - tần số thực nghiệm ô thuộc hàng i cột j Ei - tần số lý thuyết ô thuộc hàng i cột j, r số hàng c số cột Xácxuất với bậc tự DF = (r - 1)(c - 1); r số hàng c số cột bảng VI Nếu GVHD: PGS TS Nguyễn Đình Huy => Chấp nhận giả thiết H0 ngược lại Trang 12 BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Giải tốn Excel: Nhập giá trị vào bảng tính: Tính tổng: Tổng hàng: Chọn E2 nhập biểu thức =SUM(B2:D2) Dùng trỏ kéo nút tự điền từ E2 tới E3 Tổng cột: Chọn B4 nhập biểu thức =SUM(B2:B3) Dùng trỏ kéo nút tự điền từ B4 tới D4 Tổng cộng: Chọn E5 nhập biểu thức =SUM(B2:D3) Tính tần số lí thuyết: Tần số lí thuyết = (tổng hàng x tổng cột) / tổng cộng Chọn ô B6 nhập công thức =B$4*$E2/$E$4, dùng trỏ kéo nút tự điền từ ô B6 đến ô D7 GVHD: PGS TS Nguyễn Đình Huy Trang 13 BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Áp dụng hàm CHITEST: Chọn B9 nhập biểu thức =CHITEST(B2:D3,B6:D7) Ta có kết Biện luận: = 0.0022 < α = 0.05 => Bác bỏ giả thuyết Ho Kết luận: Cơ cấu sử dụng phương tiện giao thơng làm nhóm cơng nhân nam nữ khác GVHD: PGS TS Nguyễn Đình Huy Trang 14 BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Bài 3: Một điều tra xã hội học tiến hành thành phố A, B, C, D, E yêu cầu người hỏi diễn tả mức độ thỏa mãn thành phối mà họ sống Kết cho sau: Thành phố Mức độ thỏa mãn Rất thỏa mãn Tương đối Không 220 130 84 156 122 121 207 54 95 164 63 75 24 43 73 A B C D E Với mức ý nghĩa = 3%, kiểm định xem mức độ thỏa mãn sống có phân bố giống thành phố hay khơng? Bài làm: Dạng bài: kiểm tra tính độc lập, sử dụng MS Excel để giải Sử dụng Excel B1 Khởi động chương trình Excel B2 Nhập bảng liệu vào chương trình B3 Thêm dòng tổng cột dòng tổng hang B4 Tính tổng cột tổng hàng GVHD: PGS TS Nguyễn Đình Huy Trang 15 BáoCáoBàiTậpLớnXácXuấtThốngKê B5 Tính tổng: nhập vào F9 =SUM(F4:F8) Kết ta được: B6 Tính bảng tần số lý thuyết: ɣij = mj*ni/n Nhập vào ô C12 = C$9*$F4/$F$9) Dùng trỏ tự diền kéo từ ô C12 đến ô E16 Kết ta được: GVHD: PGS TS Nguyễn Đình Huy Trang 16 Nhóm 1A BáoCáoBàiTậpLớnXácXuấtThốngKê B7 Nhấp chọn C17 Gọi hàm CHITEST để tính giá trị P Nhập giá trị Actual_range: C4:E8 Nhập giá trị Expectd_range: C12:E16 Kết ta được: Kết quả: P= 3.5299E-13 Biện luận: = 3.5299E-13 < α = 0.03 bác bỏ giả thuyết H0 GVHD: PGS TS Nguyễn Đình Huy Trang 17 Nhóm 1A BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Kết luận: Mức độ thỏa mãn sống phân bố khác thành phố GVHD: PGS TS Nguyễn Đình Huy Trang 18 BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Bài 4: Sau số liệu số lượng loại báo ngày bán quận nội thành: Quận nội thành Ngày khảo sát Thứ hai Thứ ba Thứ tư Thứ năm Thứ sáu Thứ bảy Q1 Q2 Q3 Q4 Q5 22 21 25 24 28 30 18 18 25 24 19 22 22 22 25 18 15 28 18 18 19 20 22 25 18 19 20 22 25 25 Lượng báo bán quận có khác thực khơng? Chọn = 2% Lượng báo bán có chịu tác động yếu tố ngày tuần không? Bài làm: Cơ sở lí thuyết: Phân tích phương sai hai yếu tố khơng lặp: Sự phân tích nhằm đánh giá ảnh hưởng hai yếu tố giá trị quan sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B) Mơ hình: Yếu tố A … r Yếu tố B … … Tổng cộng Trung bình … … … … … c Tổng cộng Trung bình … … … … … … Bảng ANOVA Nguồn sai số Bậc tự Yếu tố A (hàng) (r–1) Tổng số bình phương SSB = GVHD: PGS TS Nguyễn Đình Huy Bình phương trung bình MSB = Trang 19 Giá trị thốngkê = BáoCáoBàiTậpLớnXácXuấtThốngKê Yếu tố B ( cột ) ( c -1 ) Sai số (r-1)(c-1) Tổng cộng ( rc – 1) MSF = SSF = SSE = SST - (SSF + SSB) SST = Nhóm 1A = MSB = - Giả thuyết: “Các giá trị trung bình nhau” “Ít có hai giá trị trung bình khác nhau” Giá trị thống kê: Biện luận: Nếu => Chấp nhận H0 (yếu tố A) Nếu => Chấp nhận H0 (yếu tố B) Giải toán Excel: Áp dụng “Anova: Two-Factor Without Replication” Vào Data -> Data Analysis Chọn mục Anova: Two-Factor Without Replication Chọn OK GVHD: PGS TS Nguyễn Đình Huy Trang 20 BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Trong hộp thoại Anova: Two-Factor Without Replication ấn định chi tiết: Phạm vi đầu vào (Input Range): $A$2:$F$8 Nhãn liệu (Labels in First Row/Column) Ngưỡng tin cậy (Alpha): 0.02 (mức ý nghĩa = 2%) Nhấn OK Ta bảng sau: GVHD: PGS TS Nguyễn Đình Huy Trang 21 BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Kết biện luận: FR = 3,5672 > F0.02 = 3,4817 =>không chấp nhận giả thiết H0(thứ) → Vậy lượng báo bán có khác theo thứ FC = 2,4748< F0.02 = 3,7313=> chấp nhận giả thiết H0 (quận) → Vậy lượng báo bán theo quận khơng có khác GVHD: PGS TS Nguyễn Đình Huy Trang 22 BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Bài 5: Theo dõi ngẫu nhiên giá thuê nhà thành phố (với điều kiện thuê nhà nhau) thu số liệu sau: Thành phố A Thành phố B Thành phố C Thành phố D Thành phố E 900 625 415 410 340 1200 640 400 310 425 850 775 420 320 275 1320 1000 560 280 210 1400 690 780 500 575 1150 550 620 385 360 975 840 800 440 750 390 Hãy tìm P-value để kiểm định xem có khác biệt giá thuê nhà thành phố nói hay khơng Bài làm: Nhận xét: Đây tốn phân tích phương sai yếu tố Giả thiết H0: khơng có khác biệt giá thuê nhà thành phố Cơ sở lí thuyết: - Phân tích phương sai yếu tố - Sự phân tích nhằm đánh giá ảnh hưởng yếu tố giá trị quan sát Yi (i=1,2,…,k) Mơ hình: Yếu tố thí nghiệm … … K … … … … … Tổng cộng Trung bình … T … … Bảng ANOVA Nguồn sai số Yếu tố Sai số Bậc tự k-1 Tổng số bình phương SSF = MSF = N-k SSE = SST - SSF GVHD: PGS TS Nguyễn Đình Huy Bình phương trung bình Trang 23 Giá trị thốngkê = BáoCáoBàiTậpLớnXácXuấtThốngKê MSB = Tổng cộng ( rc – 1) SST = Giả thuyết: “Các giá trị trung bình nhau” “Ít có hai giá trị trung bình khác nhau” Giá trị thống kê: Biện luận: Nếu => Chấp nhận giả thiết H0 Giải toán Excel: Nhập bảng số liệu hình dưới: Vào Data /Data analysis, chọn Anova: Single Factor bấm OK GVHD: PGS TS Nguyễn Đình Huy Trang 24 Nhóm 1A BáoCáoBàiTậpLớnXácXuấtThốngKê Nhóm 1A Trên màng hình lên hộp thoại Anova: Single Factor Ta nhập thơng số hình Phạm vi biến số Y(Input Range): ta kéo chuột từ ô A1 tới ô I5 Alpha: 0.05 Group by: Rows Xuất kết (Output options): kích vào New Worksheet Ply Ta kết sau: Kết Quả Và Biện Luận P-Value = 6.46E-10 < Alpha=0.05 GVHD: PGS TS Nguyễn Đình Huy Trang 25 BáoCáoBàiTậpLớnXácXuấtThốngKê F=28.0899> F0.05 = 2.6787 Suy ra: Khơng chấp nhận giả thuyết Ho Vậy có khác biệt giá thuê nhà thành phố GVHD: PGS TS Nguyễn Đình Huy Trang 26 Nhóm 1A ... 1A Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê Nhóm 1A Kết luận: Mức độ thỏa mãn sống phân bố khác thành phố GVHD: PGS TS Nguyễn Đình Huy Trang 18 Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê Nhóm 1A Bài. . .Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê Nhóm 1A Bài 1: Trình lại ví dụ 3.4 trang 207 ví dụ 4.2 trang 216 sách tập Xác suất thống kê 2012 (Nguyễn Đình Huy) Ví dụ... trị thống kê = Báo Cáo Bài Tập Lớn Xác Xuất Thống Kê MSB = Tổng cộng ( rc – 1) SST = Giả thuyết: “Các giá trị trung bình nhau” “Ít có hai giá trị trung bình khác nhau” Giá trị thống kê: Biện