1. Trang chủ
  2. » Cao đẳng - Đại học

Bài tập lớn môn Xác suất TK excel

31 891 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 31
Dung lượng 1,01 MB

Nội dung

Giải chi tiết bài tập xác suất thống kê Các dạng bài tập ôn thi cuối kỳ Cách giải bằng phần mềm Excel chi tiết Vd: Bài làm 1. Dạng toán: Phân Tích Phương Sai 3 Yếu Tố 2. Cơ sở lý thuyết: Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các giá trị quan sát G (i = 1, 2... r: yếu tố A; j = 1, 2...r: yếu tố B: k = 1, 2...r: yếu tố C). Mô hình: Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình vuông la tinh n×n. Ví dụ như mô hình vuông la tinh 4×4:

BÀI 1: Câu A.Ví dụ 3.4/207/Sách BT XSTK 2012 ( NGUYỄN ĐÌNH HUY ) Hiệu suất phần trăm (%) phản ứng hóa học nghiên cứu theo yếu tố : pH(A), nhiệt độ (B), va chất xúc tác (C) trình bày bảng sau: Yếu tố Yếu tố B A B1 B2 B3 B4 A1 C1 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Hãy đánh giá ảnh hưởng yếu tố hiệu suất phản ứng Bài làm Dạng toán: Phân Tích Phương Sai Yếu Tố Cơ sở lý thuyết: Sự phân tích dùng để đánh giá ảnh hưởng ba yếu tố giá trị quan sát G (i = 1, r: yếu tố A; j = 1, r: yếu tố B: k = 1, r: yếu tố C) Mô hình: Khi nghiên cứu ảnh hưởng hai yếu tố, yếu tố có n mức, người ta dùng mô hình vuông la tinh n×n Ví dụ mô hình vuông la tinh 4×4: ThienPhuoc.Tk B C D A C D A B D A B C A B C D Page Mô hình vuông la tinh ba yếu tố trình bày sau: Yếu tố C (T k Ví dụ: T = Y111 + Y421 + Y331 + Y241) Yếu tố B Yếu tố A B1 B2 B3 B4 A1 C1 Y111 C2 Y122 C3 Y133 C4 Y144 T1 A2 C2 Y212 C3 Y223 C4 Y234 C1 Y241 T2 A3 C3 Y313 C4 Y324 C1 Y331 C2 Y342 T3 A4 C4 Y414 C1 Y421 C2 Y432 C3 Y443 T4 T.i T.1 T.2 T.3 T.4 Bảng ANOVA: Nguồn sai số Bậc tự Yếu tố A Tổng số bình phương Bình phương trung bình Giá trị thống kê (r-1) (Hàng) Yếu tố B SSR = MSR= FR= SSC = MSC= FC= SSF = MSF= F= (r-1) (Cột) Yếu tố C (r-1) Sai số (r-1)(r-2) SSE = SST – (SSF + SSR + SSC) MSE= (r2-1) Tổng cộng SST = Trắc nghiệm ∗ Giả thiết: H0: μ1 = μ2 = = μk ⇔ “Các giá trị trung bình nhau” H1: μi ThienPhuoc.Tk μj ⇔ “Có hai giá trị trung bình khác nhau” Page Giá trị thống kê: FR ,FC , F Biện luận: Nếu FR < Fα(r-1)(r-2) → Chấp nhận H0 yếu tố A Nếu FC < Fα(r-1)(r-2) → Chấp nhận H0 yếu tố B Nếu F < Fα(r-1)(r-2) → Chấp nhận H0 yếu tố C ∗ ∗ 3.Phương pháp giải toán Excel : Giả thiết H0: pH không ảnh hưởng đến hiệu suất phản ứng Giả thiết H0: Nhiệt độ không ảnh hưởng đến hiệu suất phản ứng Giả thiết H0: Chất xúc tác không ảnh hưởng đến hiệu suất phản ứng - Bước 1: Nhập liệu - Bước 2: Thiết lập giá trị biểu thức tính giá trị thống kê ∗ - - - ∗ Tính giá trị Ti…,Tj T k ,T… Các giá trị Ti : Chọn ô B7 nhập biểu thức “=SUM(B2:E2)” Chọn ô C7 nhập biểu thức “=SUM(B3:E3)” Chọn ô D7 nhập biểu thức “=SUM(B4:E4)” Chọn ô E7 nhập biểu thức “=SUM(B5:E5)” Các giá trị T.j : Chọn ô B8 nhập “=SUM(B2:B5)” Dùng trỏ kéo kí hiệu tự điền từ ô B8 tới ô E8 Các giá trị T k : Chọn ô B9 nhập biểu thức “=SUM(B2,C5,D4,E3)” Chọn ô C9 nhập biểu thức “=SUM(B3,C2,D5,E4)” Chọn ô D9 nhập biểu thức “=SUM(B4,C3,D2,E5)” Chọn ô E9 nhập biểu thức “=SUM(B5,C4,D3,E2)” Giá trị T : Chọn ô B10 nhập biểu thức “=SUM(B2:E5)” Tính giá trị SUMSQ:Ti,Tj,Tk,T,Yij -Các giá trị SUMSQ Ti Tj Tk: Chọn ô G7 nhập biểu thức “=SUMSQ(B7:E7)” ThienPhuoc.Tk Page ∗ ∗ ∗ Dùng trỏ kéo kí hiệu tự điền từ ô G7 tới G9 -Giá trị SQT Chọn ô G10 nhập biểu thức “=POWER(B10,2)” -Giá trị SUMSQ YIJ: Chọn ô G11 nhập biểu thức “=SUMSQ(B2:E5)” Tính giá trị SSR, SSC, SSF, SST SSE -Các giá trị SSR , SSC SSF Chọn ô I7 nhập biểu thức “=G7/4-39601/POWER(4,2)” Dùng trỏ kéo kí hiệu tự điền từ ô I7 tới I9 -Giá trị SSE Chọn ô I10 nhập biểu thức “=I11-SUM(I7:I9)” -Giá trị SST Chọn ô I11 nhập biểu thức “=G11-G10/POWER(4,2)” Tính giá trị MSR MSC MSF MSE -Các giá trị MSR, MSC MSF: Chọn ô K7 nhập biểu thức “=I7/(4-1)” Dùng trỏ kéo kí hiệu tự điền từ ô K7 tới ô K9 -Giá trị MSE: Chọn ô K10 nhập biểu thức “=I10/((4-1)*(4-2))” Tính giá trị FR ,FC F Chọn ô M7 nhập biểu thức “=K7/0.3958” Dùng trỏ kéo kí hiệu tự điền từ ô M7 tới ô M9 - Bước 3: Kết biện luận + Tính F0.05(3,6) Excel sau: ta nhập hàm “=FINV(0.05,3,6)” sau ta kết F0.05(3,6)=4.7570 ThienPhuoc.Tk Page + Ta có: FR = 3.10 < F0.05(3,6) = 4.76 ⇒ chấp nhận Ho (pH) FC = 11.95 > F0.05(3,6) = 4.76 ⇒ bác bỏ Ho (nhiệt độ) F = 30.05 > F0.05 (3,6)=4.76 ⇒ bác bỏ Ho (chất xúc tác) Vậy có nhiệt chất xúc tác gây ảnh hưởng đến hiệu suất CÂU B Ví dụ 4.2/216/Sách BT XSTK 2012 ( NGUYỄN ĐÌNH HUY ) Người ta dùng ba mức nhiệt độ gồm 105, 120 135 0C kết hợp với ba khoảng thời gian 15, 30, 60 phút để thực phản ứng tổng hợp Các hiệu suất phản ứng (%) trình bày bảng sau đây: Thời gian (phút) X1 Nhiệt độ (0C) X2 Hiệu suất (%) Y 15 105 1.87 30 105 2.02 60 105 3.28 15 120 3.05 30 120 4.07 60 120 5.54 15 135 5.03 30 135 6.45 60 135 7.26 Hãy cho biết yếu tố nhiệt độ thời gian/ yếu tố thời gian có liên quan tuyến tính với hiệu suất phản ứng tổng hợp? Nếu có điều kiện nhiệt độ 115 0C vòng 50 phút hiệu suất phản ứng bao nhiêu? Bài làm Dạng toán: Hồi Quy Tuyến Tính Đa Tham Số Cơ sở lý thuyết: Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên quan đến k biến số độc lập Xi (I = 1,2, ,k) thay có hồi quy tuyến tính đơn giản Phương trình tổng quát: ThienPhuoc.Tk Page Ŷx0,x1, ,xk = B0 + B1X1 +B2X2 + + BkXk Bảng ANOVA: Nguồn sai số Bậc tự Tổng số bình phương Hồi quy K SSR Bình phương trung bình MSR= Sai số N-k-1 SSE MSE = Tổng cộng N-1 SST = SSR + SSE Giá trị thống kê: Giá trị R-bình phương: Giá trị R2 hiệu chỉnh (Adjusted R Square) ( tốt) Giá trị R2 hiệu chỉnh (Adjusted R Square) ( trở nên âm hay không xác định R2 hay N nhỏ) Độ lệch chuẩn: ( tốt) Trắc nghiệm thống kê: - Trong trắc nghiệm t: H0: βi = “Các hệ số hồi quy ý nghĩa” H1: βi “Có vài hệ số hồi quy có ý nghĩa” Bậc tự giá trị t: γ = N – k – ThienPhuoc.Tk Page Giá trị thống kê F= - Trong trắc nghiệm F: H0: βi = “Phương trình hồi quy không thích hợp” H1: βi “Phương trình hồi quy thích hợp với vài hệ số Bi” Bậc tự giá trị F: v1 = 1, v2 = N – k – 3.Phương pháp giải Excel : - Bước 1: Nhập liệu vào bảng tính: Dữ kiệu thiết phải nhập theo cột: - Bước 2: Sử dụng “Regression” a) b) c) - Nhấp đơn lệnh Tools lệnh Data Analysis Chọn chương trình Regression hộp thoại Data Analysis nhấn nút OK Trong hộp Regression, ấn định chi tiết: Phạm vi biến số Y (Input Y Range) Phạm vi biến số X (Input X Range) Nhãn liệu (Labels) Mức tin cậy (Confidence Level) Tọa độ đầu (Output Range) Và số tùy chọn khác đường hồi quy (Line Fit Plots), biểu thức sai số (residuals plots ) ThienPhuoc.Tk Page - Phương trình hồi quy * ThienPhuoc.Tk Page - = 2,73 + 0,04X1 (R2 = 0,21; S = 1.81) t0 = 2,1290 < t0,05 = 2,365 ( hay = 0,071 > α = 0,05) ⇒ Chấp nhận giả thiết H0 (Cách tính t0,05 Excel ta nhập biểu thức sau “=TINV(0.05,7)” kết ta thu t0,05 = 2,365) t1 = 1,3801 < t0,05 = 2,365 ( hay PV = 0,209 > α = 0,05) ⇒ Chấp nhận giả thiết H0 F = 1,905 < (Cách tính = 5,591) = 5,591 (hay = 0,209 > α = 0,05) ⇒Chấp nhận giả thiết H0 Excel ta nhập biểu thức sau “=FINV(0.05,1,7)” kết ta thu ThienPhuoc.Tk Page Vậy hệ số 2,37 (B0) 0,04(B1) phương trình hồi quy = 2,73 + 0.04X1 ý nghĩa thống kê Nói cách khác, phương trình hồi quy không thích hợp Kết Luận: Yếu tố thời gian không liên quan tuyến tính tới hiệu suất phản ứng tổng hợp Phương trình hồi quy: = -11,141 + 0,13X2 ThienPhuoc.Tk Page 10 (R2 = 0,76; S = 0,99) + Tính tần số lí thuyết: • Tần số lí thuyết = (tổng hàng tổng cột) / tổng cộng Các tần số thành phố A,B,C,D: - Chọn ô B10 nhập biểu thức sau : “ =$E2*B$7/$E$7 ” - Sau kéo tự động điền từ ô B10 sang ô lại , ta giá trị cần tính + Tính xác suất P(X> 2) áp dụng hàm số “CHITEST” Excel : * Tính xác suất P(X > 2) cách chọn B15 nhập biểu thức sau: “ =CHITEST(B2:D6,B10:D14) ” * Hoặc tab menu chọn tab Formulas -> Insert Funcion hộp thoại chọn khung Selection a Funcion->CHITEST.Hộp thoại xuất mục Actual_rage (Tần số thực nghiệm) điền B2:D6 ,mục Expected_rage (Tần số lý thuyết) điền B10:D14 ThienPhuoc.Tk Page 17 Kết : P(X > 2) = 3.5299.10-13 < α =0.02 => bác bỏ giả thiết H0 Kết Luận: Như mức độ thỏa mãn sống thành phố không giống BÀI : Bảng sau cho ta số liệu màu tóc 422 người: Màu tóc Nam Nữ Đen 56 32 Hung 37 66 Nâu 84 90 Vàng 19 38 Với mức ý nghĩa 1%, nhận định xem số liệu có mối quan hệ màu tóc giới tính hay không Bài làm Dạng toán: Kiểm Định Tính Độc Lập Cơ sở lý thuyết: - Mục đích: Xét tổng thể gồm dấu X, Y Các dấu hiệu dấu hiệu định tính định lượng Trong trường hợp toán nêu dấu hiệu dấu hiệu định tính - Lấy mẫu kích thước n ta có bảng số liệu sau: ThienPhuoc.Tk Page 18 Trong đó: - ni (i =1,k) – số lần X nhận xi - mj (j =1,h) – số lần Y nhận yj nij (i = 1, ,k ; j = 1, ,h) – số lần đồng thời X nhận xi Y nhận yj Kiểm định giả thiết: H0: X Y độc lập, với mức ý nghĩa α  từ bảng phân vị χ2 “khi bình phương” Tìm Cách 1: Tính thống kê dựa vào công thức sau: Cách 2: Sử dụng hàm CHITEST Excel: CHITEST(nij,γij), với lưu ý số lượng giá trị nij γij phải  Kết luận Nếu → Chấp nhận giả thiết H0 Hoặc kết hàm CHITEST > α = 0.01 → Chấp nhận giả thiết H0 Phương pháp giải Excel : – Giả thuyết H0: Màu tóc độc lập với giới tính – Nhập bảng số liệu hình sau: ThienPhuoc.Tk Page 19 Tính tổng số + Tổng hàng (ni) tổng cột (mj) :Tương tự 2,ta chọn từ ô B2 đến ô D6,nhấn “AutoSum” tab Home ta kết cần tính + Tổng cộng: Vị trí ô D6 Tính tần số lý thuyết dựa vào công thức sau: - Chọn từ ô G2->H5 ta nhấn dấu “=” nhập tiếp biểu thức sau: “$D2*B$6/$D$6” sau nhấn CTRL+ENTER Sau ta kết quả: ThienPhuoc.Tk Page 20 Áp dụng hàm số “CHITEST” Tính xác suất P(X> Kết quả: P(X> ) cách chọn ô G7và nhập biểu thức “=CHITEST(B2:C5,G2:H5)” ) = 0,000247 < α =0,01 Bác bỏ giả thuyết Ho Kết Luận: Vậy màu tóc giới tính có mối liên hệ với BÀI : Với mức ý nghĩa 1%, Hãy phân tích vai trò ngành nghề (chính, phụ) hoạt động kinh tế hộ gia đình vùng nông thôn sở bảng số liệu thu nhập trung bình hộ tương ứng với ngành nghề nói sau: Nghề Nghề phụ (1) (2) (3) (4) Trồng lúa (1) 3.5 7.4 8.0 3.5 Trồng ăn (2) 5.6 4.1 6.1 9.6 Chăn nuôi (3) 4.1 2.5 1.8 2.1 ThienPhuoc.Tk Page 21 Dịch vụ (4) 7.2 3.2 2.2 1.5 Dạng toán: Toán Phân Tích Phương Sai Hai Yếu Tố (Không Lặp): Cơ sở lý thuyết: Sự phân tích nhằm đánh giá ảnh hưởng hai yếu tố giá trị quan sát Yij(i=1,2….r:yếu tố A;j=1,2…c:yếu tố B) Mô hình Yếu tố A Y11 Y12 … Yr1 T1 Ŷ.1 Tổng cộng Trung bình Y12 Y22 … Yr2 T2 Ŷ.2 Yếu tố B … … … … … … … Tổng cộng Trung bình c Y1c Y2c Y1 Y2 Ŷ1 Ŷ2 … … … Yr Tc Ŷ.c Yr T Ŷ Ŷr Bảng ANOVA: Nguồn sai số Yếu tố A (Hàng) Yếu tố B (Cột) Sai số Tổng cộng Bậc tự Tổng số bình phương Bình phương trung bình Giá trị thống kê (r-1) SSB = MSB= FR= SSB = MSF= FC= (c-1) (r-1)(c-2) SSE = SST – (SSF + SSR) MSB= (rc-1) SST = Trắc nghiệm ThienPhuoc.Tk Page 22 ∗ Giả thiết: H0: μ1 = μ2 = = μk ⇔ “Các giá trị trung bình nhau” H1: μi μj ⇔ “Ít hai giá trị trung bình khác nhau” ∗ Giá trị thống kê: FR FC ∗ Biện luận: Nếu FR < Fα[(b-1),(k-1)(b-1)] → Chấp nhận H0 yếu tố A Nếu FC < Fα[(k-1),(k-1)(b-1)] → Chấp nhận H0 yếu tố B Phương pháp giải Excel : Giả thiết H0: Các giá trị trung bình Đối giả thiết H1: Các giá trị trung bình không - Bước 1: Nhập liệu - Bước 2: Áp dụng “Anova: Two – Factor without Replication” + Nhấp đơn lệnh Data lệnh Data Analysis + Chọn chương trình Anova: Two-Factor Without Replication hộp thoại Data Analysis nhấp nút OK + Trong hộp thoại Anova: Two-Factor Without Replication ấn định chi tiết:      Phạm vi đầu vào (Input Rangle) Chọn từ A1 kéo đến E5 Nhãn liệu (Labels in First Row / Column) Bấm check Ngưỡng tin cậy (Alpha).Nhập Alpha=0.01 Chọn đầu (Output Option) điền thông tin mong muốn check newWorksheet Ply Nhấp OK ThienPhuoc.Tk Page 23 + Bảng Anova sau hoàn thành - Bước 3:Kết biện luận • • FR(rows-Thực nghiệm) = 1,99662 chấp nhận giả thiết H0 (các nghề tạo thu nhập trung bình nhau.) FC(columns-Thực nghiệm) = 0,11057 < F (crit-Lý thuyết)=6,99192 => chấp nhận giả thiết H0( nghề phụ tạo thu nhập trung bình nhau) Vậy, thu nhập gia đình giống xét cho nghề hay nghề phụ ThienPhuoc.Tk Page 24 BÀI : Bảng sau ghi lại kỷ lục giới chạy dặm kỷ 20: Năm(X) 1911 1913 1915 1923 Thời gian 4:15.4 4:14.6 4:12.6 4:10.4 (Y) Năm(X) Thời gian (Y) 1931 4:09.2 1933 4:07.6 1934 4:06.8 1937 4:06.4 X Y 1942 4:06.2 1942 4:06.2 1942 4:04.6 1943 4:02.6 1944 4:01.6 X Y 1945 4:01.4 1954 3:59.4 1954 3:58 1957 3:57.2 1958 3:54.5 X Y 1962 3:54.4 1964 3:54.1 1965 3:53.6 1966 3:51.3 1967 3:51.1 X Y 1975 3:51 1975 3:49.4 1979 3:49 1980 3:48.9 1981 3:48.8 X Y 1981 3:48.7 1981 3:47.6 1985 3:46.5 a) Tính hệ số tương quan X Y (đơn vị Y giây) b) Tìm đường thẳng hồi quy Y X c) Tìm sai số tiêu chuẩn đường thẳng hồi quy Kiểm định giả thiết có hồi quy d) Dựa phương trình ước lượng kỷ lục giới năm 2050 e) Ước lượng năm mà kỷ lục giới phút 30 giây f) Dựa phương trình hồi quy ước lượng kỷ lục giới năm 2500.Kết có hợp lý hay không? (Chú thích: 3:48.7 = phút 48.7 giây) Dạng toán: Phân Tích Tương Quan Và Phân Tích Hồi Quy Cơ sở lý thuyết: Hai biến số ngẫu nhiên Y X liên quan tuyến tính (ρ=1,ρ=-1), có khuynh hướng tuyến tính (0 Bác bỏ giả thiết H0 (t0.05 ta tính sau: “=TINV(0.05,29)” ) t1=36.677>t0.05=2.045 => Bác bỏ giả thiết H0 (t0.05 ta tính sau: “=TINV(0.05,29)” ) F=1345.2 > = 4.18 => Bác bỏ giả thiết H0 ( ta tính sau “=FINV(0.05,1,29)” ) Kết luận: Vậy hai hệ số phương trình hồi quy YXi=1022.8-0.4X có ý nghĩa thống kê Vậy X Y có liên quan tuyến tính với Phương trình đường thẳng hồi quy Y X :YX=1022.8-0.4X ThienPhuoc.Tk Page 30 Câu c: Sai số tiêu chuẩn (Standard Error) là: 21.3721915 Câu d: Dựa phương trình ước lượng kỷ lục giới 2050 Kỷ lục giới 2050 ta có X=2050 vào phương trình ta Y=1022.8-0.4*2050=202.8 (giây) =3 phút 22.8 giây Vậy kỷ lục giới năm 2050 phút 22.8 giây Câu e: Năm kỷ lục giới phút 30 giây = 210 giây Ta có YX=210=1022.8-0.4X  X=2032 Vậy kỷ lục giới phút 30 giây ước lượng đạt năm 2032 Câu f: Ước lượng kỷ lục năm 2500 Ta có X=2500.Thay vào phương trình hồi quy: YX=1022.8-0.4*2500=22.8 giây Kết không hợp lý ThienPhuoc.Tk Page 31 ... (chất xúc tác) Vậy có nhiệt chất xúc tác gây ảnh hưởng đến hiệu suất CÂU B Ví dụ 4.2/216/Sách BT XSTK 2012 ( NGUYỄN ĐÌNH HUY ) Người ta dùng ba mức nhiệt độ gồm 105, 120 135 0C kết hợp với ba khoảng

Ngày đăng: 17/03/2017, 11:16

TỪ KHÓA LIÊN QUAN

w