bài tập lớn môn xác suất thống kê đề bài số 8

35 310 1
bài tập lớn môn xác suất thống kê đề bài số 8

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BÀI TẬP LỚN MÔN XÁC SUẤT THỐNG ĐỀ BÀI SỐ Người viết Mã số sinh viên Nhóm Giảng viên hướng dẫn PGS.TS Nguyễn Đình Huy ĐỀ BÀI Trình bày lại ví dụ 3.4 trang 207 ví dụ 4.2 trang 216 Sách BT XSTK 2012 (N.Đ.HUY) Đo đường kính X chiều cao Y 20 ta thu số liệu sau: X Y X Y X Y 2,3 2,5 3,9 12 4,7 2,6 4 5,1 10 3,1 4,1 5,5 13 3,4 4,1 5,8 6,2 11 3,7 4,2 6,9 11 7,3 14 4,4 6,9 16 a) Tìm đường hồi quy Y X b) Tính sai số tiêu chuẩn đường hồi quy c) Tính tỷ số F để kiểm định giả thiết có hồi quy tuyến tính Y với X Một công ty muốn mở rộng việc bán sản phẩm sang thị trường nước Để đánh giá xem thị phần mà công ty chiếm lĩnh ba thị trường so với đối thủ cạnh tranh có khác hay không người ta thủ nghiệm thị trường cách bán thử sản phẩm cho 150 khách hàng tiềm thị trường thu kết sau: Công ty Đối thủ cạnh tranh Đối thủ cạnh tranh Các đối thủ khác A 55 28 20 47 Thị trường B 38 30 18 64 C 24 21 31 74 Hãy tìm P-value để kiểm định xem cấu ba thị trường có khác hay không 4.Người ta tiến hành đo mực nước sông số địa điểm thuộc tỉnh X ngày (số lần đo không giống nhau) thu bảng số liệu sau đây: Thời điểm Địa điểm đo đo F1 F2 F3 F4 5,5 4,9 4,6 4,5 5,6 5,1 4,8 6,2 5,8 6,5 5,8 4,8 5,9 5,4 5,1 4,8 6,0 6,1 6,2 6,5 6,7 7,1 6,8 7,2 Với mức ý nghĩa α = 2%.Mực nước sông trung bình/ngày điểm nói có thực khác không? Với mức ý nghĩa α = 5% So sánh chi phí cho ba loại dịch vụ ba thành phố khác phương phương phân tích phương sai sở bảng số liệu sau đây: Thành phố I II III I 61 58 68 Loại dịch vụ II 52 51 64 III 69 61 79 Các số ô chi phí trung bình cho lần dịch vụ (đơn vị: 1000đ) BÀI BÁO CÁO BÀI 1: Trình bày lại ví dụ 3.4 trang 207 ví dụ 4.2 trang 216 Giáo Trình XSTK 216 Ví dụ 3.4 trang 207 Hiệu suất phần tram(%) phản ứng hóa học nghiên cứu theo ba yếu tố:Ph(A), nhiệt độ (B) chất xúc tác (C) trình bày b ảng sau: Yếu tố Yếu tố B A B1 B2 B3 B4 A1 C1 C2 14 C3 16 C4 A2 C2 12 C3 15 C4 12 C1 A3 C3 13 C4 14 C1 11 C2 A4 C4 10 C1 11 C2 13 C3 Hãy đánh giá ảnh hưởng yếu tố hiệu suất phản ứng? 12 10 14 13 BÀI LÀM 1/ Cơ sở lí thuyết: Dạng bài: Đây toán Kiểm định giá trị trung bình Phương Pháp : Phân tích phương sai yếu tố Trong đó: A độ pH, Blà nhiệt độ C chất xúc tác Sự phân tích dùng để đánh giá ảnh hưởng yếu tố giá trị quan sát G (yếu tố A:i=1 r, yếu tố B: j=1 r, yếu tố C: k=1 r) Ta phải tìm giá trị thống để đánh giá ảnh hưởng ba yếu t ố hiệu suất phản ứng Mô hình vuông la tinh ba yếu tố trình bày nh sau: Yếu tố C ( T k Ví dụ: T 1= Y111+Y421+Y334+Y241) Yếu Yếu tố B tố A A1 B1 B2 B3 B4 C1 C2 C3 C4 A2 C2 C3 C4 C1 A3 C3 C4 C1 C2 A4 C4 C1 C2 C3 Bảng ANOVA Nguồn sai số Yếu tố A (hàng) Bậc tự Tổng số bình phương Bình phương trung bình Giá trị thống (r-1) Yếu tố B (cột) (r-1) Yếu tố C (r-1) Sai số (r-1)(r2) SSE=SST(SSF+SSR+SSC) Tổng cộng Sau tìm giá trị thống kê, ta có hai ph ần tr ắc nghiệm g ồm : Trắc nghiệm: • Giả thiết: ”các giá trị trung bình nhau” ” có có hai giá trị trung bình khác nhau” • Giá trị thống kê: , F • Biện luận: So sánh giá trị F với b = ( tra bảng Fisher, Bảng VIII) (cụ k=3 ( biến A , B , C ) với k số biến, Nếu < : chấp nhận ( yếu tố A) ngược lại Nếu < : chấp nhận ( yếu tố B) ngược lại Nếu < : chấp nhận ( yếu tố C) ngược lại 2/ Áp dụng MS-EXCEL: Nhập bảng số liệu: Thiết lập biểu thức tính số liệu thống kê: • Tính giá trị Ti Tj… T….k T… + Các giá trị Ti… Chọn ô B7 nhập biểu thức =SUM(B2:E2) Chọn ô C7 nhập biểu thức =SUM(B3:E3) Chọn ô D7 nhập biểu thức =SUM(B4:E4) Chọn ô E7 nhập biểu thức =SUM(B5:E5) + Các giá trị Tj Ô B8 nhập biểu thức =SUM(B2:B5) Ô C8 nhập biểu thức =SUM(C2:C5) Ô D8 nhập biểu thức =SUM(D2:D5) Ô E8 nhập biểu thức =SUM(E2:E5) + Các giá trị T k Ô B9 nhập biểu thức =SUM(B2,C5,D4,E3) Ô C9 nhập biểu thức =SUM(B3,C2,D5,E4) Ô D9 nhập biểu thức =SUM(B4,C3,D2,E5) Ô E9 nhập biểu thức =SUM(B5,C4,D3,E2) + Gía trị T… Ô B10 nhập biểu thức =SUM(B2:E5) Tính giá trị G G + Các giá trị G G Ô G7 nhập biểu thức =SUMSQ(B7:E7) Ô G8 nhập biểu thức =SUMSQ(B8:E8) Ô G9 nhập biểu thức =SUMSQ(B9:E9) + Gía trị G Ô G10 nhập biểu thức =POWER(B10,2) Ô G11 nhập biểu thức =SUMSQ(B2:E5) • Tính giá trị tổng số bình phương SSR, SSC, SSF, SST SSE + Các giá trị SSR, SSC SSF Ô I7 nhập biểu thức =G7/4-39601/POWER(4,2) Ô I8 nhập biểu thức =G8/4-39601/POWER(4,2) Ô I9 nhập biểu thức =G9/4-39601/POWER(4,2) + Gía trị SST Ô I11 nhập biểu thức =G11-G10/POWER(4,2) + Gía trị SSE Ô I10 nhập biểu thức =I11-SUM(I7:I9) • Tính giá trị bình phương trung bình MSR, MSC, MSF MSE + Các giá trị MSR, MSC MSF Ô K7 nhập biểu thức = I7/(4-1) Ô K8 nhập biểu thức = I8/(4-1) Ô K9 nhập biểu thức = I9/(4-1) + Giá trị MSE Ô K10 nhập biểu thức =I10/((4-1)*(4-2)) • Tính giá trị giá trị thông F: Ô M7 nhập biểu thức =K7/0.3958 Ô M8 nhập biểu thức =K8/0.3958 Ô M9 nhập biểu thức =K9/0.3958 • Ta kết sau: • Kết biện luận Chấp nhận Bác bỏ (nhiệt dộ) Bác bỏ (chất xúc tác) Vậy nhiệt độ chất xúc tác gây ảnh hưởng đến hiệu su ất Ví dụ 4.2: Người ta dùng ba mức nhiệt độ gồm 105, 120, 135oC kết hợp với ba khoảng thời gian 15, 30, 60 phút để thực phản ứng tổng hợp Các hiệu suất phản ứng (%) trình bày bảng sau : Thời gian (phút) Nhiệt độ (oC) Hiệu suất (%) X1 15 30 60 15 30 60 15 30 60 X2 105 105 105 120 120 120 135 135 135 Y 1,87 2,02 3,28 3,05 4,07 5,54 5,03 6,45 7,26 Hãy cho biết yếu tố nhiệt độ và/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất phản ứng tổng hợp? Nếu có với điều kiện nhiệt độ 115oC vòng 50 phút, hiệu suất phản ứng bao nhiêu? BÀI LÀM 1/ Cơ sở lý thuyết: Dạng Bài : Phân tích tương quan hồi quy Phương pháp : Phân tích hồi quy tuyến tính đa tham số Đây toán hồi quy tuyến tính đa tham số , : Y (hiệu suất) liên quan đến hai biến số X1 (thời gian), X2 ( nhiệt độ) Ta phải tim phương trình hồi quy tuyến tính đa tham số để phụ thuộc không phụ thuộc yếu tố thời gian (X1) nhiệt độ (X2) với hiệu suất phản ứng tổng hợp (Y) Đối với dạng ta có phương trình hồi quy tuyến tính đa tham số : = ( i=1,2,…,k) BẢNG ANOVA : Nguồn sai số Bậc tự Tổng số bình phương Bình phương trung bình Giá trị thống Kết luận: - Phương trình hồi quy Y X: Y=1,0453+1,6769X Sai số tiêu chuẩn đường hồi quy :S=2,2204 Tỉ số F=24,3003 Vì F=24,3003> (1, 18)=4.41 (tra bảng phân bố Fischer mức α=0,05, cột 1,hàng 18) =>Bác Bỏ giả thiết phương trình hồi quy thích h ợp hay có hồi quy tuyến tính Y với X BÀI : Một công ty muốn mở rộng việc bán sản phẩm sang thị trường nước Để đánh giá xem thị phần mà công ty chiếm lĩnh ba thị trường so với đối thủ cạnh tranh có khác hay không người ta thử nghiệm thị trường cách bán thử sản phẩm cho 150 khách hang tiềm thị trường thu kết sau: A 55 28 20 47 Công ty Đối thủ cạnh tranh Đối thủ cạnh tranh Các đối thủ khác Thị trường B 38 30 18 64 C 24 21 31 74 Hãy tìm P-value để kiểm định xem cấu ba thị trường có khác hay không Bài làm Cơ sở lý thuyết : Dạng Bài: Kiểm định tỉ lệ Kiểm định giả thuyết nhiều tỉ lệ Phương Pháp : So Sánh Tỉ Số Sử dụng phương pháp để kiểm định cấu thị trường A, B, C Đối với thí nghiệm có hai kết (binomial experiment) – ví dụ, thuốc đơn: có hay không – bạn thường so sánh hai tỉ số với (thực nghiệm với lý thuyết hay thực nghiệm với thực nghiệm) Song thí nghiệm có nhiều kết (multinomial experiment) – ví dụ, ác đánh giá tình trạng bệnh nhân điều trị thuốc khoảng thời gian – bạn cần so sánh nhiều tỉ số Trắc nghiệm “khi” bình phương () cho phép bạn so sánh hai mà nhiều tỉ số (hay tỉ lệ xác suất) cách tiện lợi phân phối xác suất, tính đối xứng có giá trị Giả sử bạn có công trình nghiên cứu với N thử nghiệm độc lập, thử nghiệm có k kết kết mang xác suất thực nghiệm Nếu gọi giá trị lý thuyết tương ứng với tần số lý thuyết Điều kiện để áp dụng trắc nghiệm cách thành công tần số lý thuyết phải Giả thiết: , ,…, “Các cặp giống nhau” : “Ít có cặp khác nhau” Giá trị thống kê: – tần số thực nghiệm (observed frequency) – tần số lý thuyết (expected frequency) Biện luận: Nếu Bác bỏ giá thiết (DF = k – 1) Trong chương trình MS-EXCEL có hàm số CHITEST (dùng với 2007 trở trước) hàm số CHISQ.TEST (dùng với 2010, 2013) tính: - Giá trị theo biểu thức: – tần số thực nghiệm ô thuộc hàng i cột j – tần số lý thuyết ô thuộc hàng i cột j – số hàng; c – số cột - Xác suất ) với bậc tự ; đó, r số hàng c số cột bảng ngẫu nhiên (contingency table) Nếu Chấp nhận giả thiết ngược lại Áp dụng MS-EXCEL để giải toán: - Nhập liệu vào bảng tính - Tính tổng số: o Tổng số (Row totals): Chọn ô F6 nhập biểu thức =SUM(B6:E6) o Dùng trỏ để kéo nút tự điều từ ô F6 đến ô F8 o Tổng cột (Column totals): Chọn ô B9 nhập biểu thức =SUM(B6:B8) o Dùng trỏ để kéo nút tự điền từ ô B9 đến ô D9 o Tổng cộng (Grand totals): Chọn ô F9 nhập biểu thức =SUM(F6:F8) Tính tần số lý thuyết: o Tần số lý thuyết = (tổng hàng tổng cột) / tổng cộng o Công ty thị trường A: Chọn ô B12 nhập biểu thức =F6*$B$9/$F$9 o Dùng trỏ để kéo nút tự điền từ ô B12 đến ô B14 o Đối thủ thị trường A: Chọn ô C12 nhập biểu thức =F6*$C$9/$F$9 o Dùng trỏ để kéo nút tự điền từ ô C12 đến ô C14 o Đối thủ thị trường A: Chọn ô D12 nhập biểu thức =F6*$D$9/$F$9 o Dùng trỏ để kéo nút tự điền từ ô D12 đến ô D14 o Đối thủ thị trường A: Chọn ô E12 nhập biểu thức =F6*$E$9/$F$9 o Dùng trỏ để kéo nút tự điền từ ô E12 đến ô E14 - - Áp dụng hàm số “CHISQ.TEST” / “CHITEST”: o Tính xác suất cách chọn ô B15 nhập biểu thức • Kết quả: =CHISQ.TEST(B6:E8,B12:E14) (hoặc sử dụng hộp thoại 0.000448454 Do đó, bác bỏ giá thiết Kết luận: Vậy, cấu ba thị trường khác Bài : Người ta tiến hành đo mực nước sông số địa điểm thuộc tỉnh X ngày (số lần đo không giống nhau) thu bảng số liệu sau đây: Thời điểm đo Địa điểm đo F1 5.5 5.6 5.8 5.9 6.7 7.2 F2 4.9 5.1 6.5 5.4 6.1 F3 4.6 4.8 5.8 5.1 6.2 7.1 F4 4.5 6.2 4.8 4.8 6.5 6.8 Với mức ý nghĩa a = 2%.Mực nước sông trung bình/ngày điểm nói có thực khác không? BÀI LÀM Cơ sở lý thuyết: Dạng Bài : Kiểm định giá trị trung bình Phương pháp : Phân tích phương sai yếu tố Khái niệm thống kê: • Phép phân tích phương sai dùng trắc nghiệm để so sánh giá trị trung bình hai hay nhiều mẫu lấy từ phân số.Đây xem phần mở rộng trắc nghiệm t hay z (so sánh hai giá trị trung bình) • Mục đích phân tích phương sai yếu tố đánh giá ảnh hưởng yếu tố nhân tạo tự nhiên giá trị quan sát Mô hình Yếu tố thí nghiệm … K … … … … … … Tổng cộng Trung bình Bảng ANOVA: Nguồn sai số Bậc tự Tổng số bình phương Bình phương trung bình Giá trị thống SSF = Yếu tố k-1 Sai số N-k Tổng cộng N-1 MSF = SSE = SST - SSF MSE = Trắc nghiệm:  “Các giá trị trung bình nhau”  “Ít có hai giá trị trung bình khác nhau” F= * Giá trị thống kê: F= * Biện luận:  Chấp nhận giả thiết Nếu *Phân tích phương sai yếu tố Giả thiết : Mực nước song trung bình/ngày điểm Đối giả thiết : Mực nước song trung bình/ngày điểm khác 2.Áp dụng Excel : Nhập liệu vào bảng tính Áp dụng “Annova: Single Factor” a)Tại nhóm lệnh Data analysis, chọn Anova: “Single Factor” b)Trong hộp thoại Anova: Single Factor, ấn định giá trị: (hình a) - Phạm vi đầu vào (input range): chọn bảng tính ta vừa tạo: $A$2:$E$9 -Nhãn liệu (labels in first row/column) -Mức ý nghĩa: = anpha = 2%= 0.02 -Phạm vi đầu (output Range): $G$1 Hình a: Hộp thoại Anova: Single Factor Kết Excel Kết biện luận : F = 2.7613 < F0.02 = 3.5224 Chấp nhận giả thiết Mực nước sông trung bình/ngày điểm nói thực Bài 5: Với mức ý nghĩa α =5% So sánh chi phí cho ba loại dịch vụ ba thành phố khác phương pháp phân tích phương sai sở bảng số liệu sau đây: Loại dịch vụ Thành phố I II III I 61 52 69 II 58 51 61 III 68 64 79 Các số ô chi phí trung bình cho lần dịch vụ (dơn vị: 1000đ) Bài làm Cơ sở lý thuyết : DẠng : Kiểm định giá trị trung bình Phương Pháp :Phân tích phương sai yêu tố không lặp Sự phân tích nhằm đánh giá ảnh hưởng hai yếu tố giá trị quan sát Xij ( i=1,2…n: yếu tố A; j=1,2…m: yếu tố B) Mô hình: Yếu tố A Yếu tố B Tổng cộng n X11 X21 Xn1 X12 X22 Xn2 … … … … … m X1m X2m Xnm T1* T2* … Tn* Tổng cộng T*1 T*2 … T*m T= Bảng ANOVA: Nguồn Bậc tự Yếu tố A (hàng) (n– 1) Yếu tố B (cột) (m – 1) Sai số Tổng cộng Tổng số bình phương (n – 1)(m – 1) SSE = SST - (SSA + SSB) (n.m– 1) Bình phương trung bình Giá trị thống Trắc nghiêm: • • • Giả thiết  “các giá trị trung bình nhau” Đối giả thiết H1:  “có hai giá trị trung bình khác nhau” Giá trị thống kê: • Biện luận: Nếu [n – 1,(n – 1)(m – 1)] Nếu [m – 1,(n – 1)(m – 1)]  chấp nhận (yếu tố A)  chấp nhận (yếu tố B) Giải toán excel : Giả thiết : H01: yếu tố thành phố khác không ảnh hưởng đến chi phí H02: yếu tố dịch vụ khác không ảnh hưởng đến chi phí Nhập liệu vào bảng tính: Áp dụng: “Anova: Two – Factor without Replication” a)Tại nhóm lệnh Data analysis, chọn Anova:Two – Factor without Replication” b)Trong hộp thoại Anova:Two – Factor without Replication, ấn định giá trị: - Phạm vi đầu vào (input range): chọn bảng tính ta vừa tạo: $A$1:$D$4 -Nhãn liệu (labels in first row/column) -Mức ý nghĩa: Alpha = 5% = 0.05 -Phạm vi đầu (output Range): $G$1 Sau click OK ta kết quả: Kết luận: FA=24.91588785 > Fcrit = 6.94427191 : Bác bỏ giả thiết H01 (thành phố) FB=24.74766355 > Fcrit = 6.94427191 : Bác bỏ giả thiết H02 (loại dịch vụ) Vậy yếu tố thành phố dịch vụ ảnh hưởng đến chi phí ... không giống nhau) thu bảng số liệu sau đây: Thời điểm Địa điểm đo đo F1 F2 F3 F4 5,5 4,9 4,6 4,5 5,6 5,1 4 ,8 6,2 5 ,8 6,5 5 ,8 4 ,8 5,9 5,4 5,1 4 ,8 6,0 6,1 6,2 6,5 6,7 7,1 6 ,8 7,2 Với mức ý nghĩa α... ANOVA Nguồn sai số Bậc tự Tổng số bình phương Bình phương trung bình Hồi quy SSR= MSR=SSR Sai số N-2 SSE= MSE=SSE/(N-2) Tổng cộng N-1 Giá trị thống kê F= SST==SSR+SSE Trắc nghiệm thống kê: Đối với... trước) hàm số CHISQ.TEST (dùng với 2010, 2013) tính: - Giá trị theo biểu thức: – tần số thực nghiệm ô thuộc hàng i cột j – tần số lý thuyết ô thuộc hàng i cột j – số hàng; c – số cột - Xác suất )

Ngày đăng: 29/08/2017, 08:50

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan