1. Trang chủ
  2. » Giáo Dục - Đào Tạo

xác suất thống kê hoàn chỉnh

30 136 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 30
Dung lượng 847,19 KB

Nội dung

BÀI 1: A Ví dụ 3.4/207 SBT XSTK: Hiệu suất phần trăm (%) phản ứng hóa học nghiên cứu theo ba yếu tố: pH (A), nhiệt độ (B) chất xúc tác (C) trình bày bảng sau: Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Hãy đánh giá ảnh hưởng yếu tố đến hiệu suất phản ứng? Bài giải Dạng bài: phân tích phương sai nhân tố Phần mềm: Microsoft Excel 2010 Cơ sở lý thuyết: Sự phân tích dùng để đánh giá ảnh hưởng ba yếu tố giá trị quan sát G (i = 1, r: yếu tố A; j = 1, r: yếu tố Bảo: k = 1, r: yếu tố C) Mô hình:  Khi nghiên cứu ảnh hưởng hai yếu tố, yếu tố có n mức, người ta dùng mô hình vuông la tinh n×n Ví dụ mô hình vuông la tinh 4×4: B C D A C D A B D A B C A B C D  Mô hình vuông la tinh ba yếu tố trình bày sau: Yếu tố B Yếu tố A B1 B2 B3 B4 A1 C1 Y111 C2 Y122 C3 Y133 C4 Y144 T1 A2 C2 Y212 C3 Y223 C4 Y234 C1 Y241 T2 A3 C3 Y313 C4 Y324 C1 Y331 C2 Y342 T3 A4 C4 Y414 C1 Y421 C2 Y432 C3 Y443 T4 T.i T.1 T.2 T.3 T.4  Bảng ANOVA: Nguồn sai Bậc tự Tổng số Bình phương Giá trị số bình phương trung bình thống Yếu tố A (Hàng) Yếu tố B (Cột) Ti T ∑ − r2 SSR= i =1 r r (r-1) r ∑ (r-1) SSC= j =1 T 2j (r-1) SSF= Sai số Tổng cộng (r-1)(r-2) T − r r MSC= T 2k T − ∑ r k =1 r r Yếu tố C MSR= MSF= SSE=SST – (SSF+SSR+SSC) T ΣΣΣY − r ijk (r2-1) SST= MSE= SSR (r − 1) SSC (r − 1) SSF (r − 1) SSE (r − 1)( r − 2) FR= FC= F= MSR MSE MSC MSE MSF MSE Trắc nghiệm: Giả thiết: • H0: μ1 = μ2 = = μk ↔ Các giá trị trung bình H1 : μi ≠ μj ↔ Có hai giá trị trung bình khác • Giá trị thống kê: FR, FC, F • Biện luận: Nếu FR < Fα(r-1)(r-2) → Chấp nhận H0 yếu tố A Nếu FC < Fα(r-1)(r-2) → Chấp nhận H0 yếu tố B Nếu F < Fα(r-1)(r-2) → Chấp nhận H0 yếu tố C Các bước thực máy tính: Bước 1: Nhập liệu vào bảng tính: Bước 2: Thiết lập biểu thức tính giá trị thống kê: a.Tính giá trị Ti , T.j., T k T : • Các giá trị Ti : Chọn ô B7 chọn biểu thức =SUM(B2:E2) Chọn ô C7 nhập biểu thức =SUM(B3:E3) Chọn ô D7 nhập biểu thức =SUM(B4:E4) Chọn ô E7 nhập biểu thức =SUM(B4:E4) • Các giá trị T.j.: Chọn ô B8 nhập biểu thức =SUM(B2:B5) Dùng trỏ kéo ký hiệu tự điền từ ô B8 đến ô E8 • Các giá trị T k: Chọn ô B9 nhập biểu thức =SUM(B2,C5,D4,E3) Chọn ô C9 nhập biểu thức =SUM(B3,C2,D5,E4) Chọn ô D9 nhập biểu thức =SUM(B4,C3,D2,E5) Chọn ô E9 nhập biểu thức =SUM(B5,C4,D3,E2) • Giá trị T : Chọn ô B10 nhập biểu thức=SUM(B2:B5) b.Tính giá trị G: Chọn ô G7 nhập biểu thức =SUMSQ(B7:E7) Dùng trỏ kéo ký hiệu tự điền từ ô G7 đến ô G9 Chọn ô G10 nhập biểu thức =POWER(B10;2) Chọn ô G11 nhập biểu thức =SUMSQ(B2:E5) c.Tính giá trị SSR, SSC, SSF, SST SSE: • Các giá trị SSR, SSC, SSF: Chọn ô I7 nhập biểu thức =G7/4-39601/POWER(4,2) Dùng trỏ kéo ký hiệu tự điền từ ô I7 đến ô I9 • Giá trị SST: Chọn ô I11 nhập biểu thức =G11-G10/POWER(4,2) • Giá trị SSE: Chọn ô I10 nhập biểu thức =I11-SUM(I7:I9) d.Tính giá trị MSR, MSC, MSF MSE: • Giá trị MSR, MSC, MSF: Chọn ô K7 nhập biểu thức =I7/(4-1) Dung trỏ kéo ký hiệu tự điền từ ô K7 đến ô K9 • Giá trị MSE: Chọn ô K10 nhập biểu thức =I10/((4-1)*(4-2)) e Tính giá trị F: Chọn ô M7 nhập biểu thức =K7/$K$10 Dùng trỏ kéo ký hiệu tự điền từ ô M7 đến M9 Ta kết bảng sau:  Kết biện luận:    FR=3.10 < F0.05(3,6)=4.76=> chấp nhận H0 (pH) FC=11.95 > F0.05(3,6)=4.76 => bác bỏ H0 (nhiệt độ) F=30.05 > F0.05(3,6)=4.76 => bác bỏ H0 (chất xúc tác)  Vậy có nhiệt độ chất xúc tác gây ảlmnh hưởng đến hiệu suất phản ứng B Ví dụ 4.2/216 SBT SXTK: Người ta dùng ba mức nhiệt độ gồm 105, 120 135°C kết hợp với ba khoảng thời gian 15, 30 60 phút để thực phản ứng tổng hợp Các hiệu suất phản ứng (%) trình bày bảng sau: Thời gian Nhiệt độ Hiệu suất (phút) (°C) (%) X1 X2 Y 15 105 1.87 30 105 2.02 60 105 3.28 15 120 3.05 30 120 4.07 60 120 5.54 15 135 5.03 30 135 6.45 60 135 7.26 Hãy cho biết yếu tố nhiệt độ thời gian/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất phản ứng tổng hợp? Nếu có điều kiện nhiệt độ 115°C vòng 50 phút hiệu suất phản ứng bao nhiêu? Bài làm Dạng bài: hồi quy tuyến tính đa tham số Phần mềm: Microsoft Excel 2010 Cơ sở lý thuyết: Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên quan đến k biến số độc lập Xi (i=1,2, ,k) thay có hồi quy tuyến tính đơn giản Phương trình tổng quát: Ŷx0,x1, ,xk = B0 + B1X1 + + BkXk Bảng ANOVA: Nguồn sai Bậc tự Tổng số bình số Phương Hồi quy K Bình phương trung bình SSR MSR= Sai số N-k-1 SSE MSE = Tổng cộng N-1 SST = SSR + SSE Giá trị thống kê:  R2 = Giá trị R-bình phương: SSR kF = SST ( N − k − 1) + kF  S= ( R ≥ 0.81 tốt) Độ lệch chuẩn: SSE ( N − k − 1) ( S ≤ 0.30 tốt) Trắc nghiệm: • Giá trị thống kê: F • Trắc nghiệm t: H0: βi = ↔ Các hệ số hồi quy ý nghĩa H1 : β i ≠ ↔ Có vài hệ số hồi quy có ý nghĩa SSR k SSE ( N − k − 1) Giá trị thống F= MSR MSE tα F< (r-1)(r-2) → Chấp nhận H0 • Trắc nghiệm F: H0: βi = ↔ Phương trình hồi quy không thích hợp H1 : β i ≠ ↔ Phương trình hồi quy thích hợp với vài hệ số Bi F < Fα(1,N-k-1) → Chấp nhận H0 Các bước thực máy tính: Bước 1: Nhập liệu vào bảng tính: Dữ liệu thiết phải nhập theo cột X1 15 30 60 15 30 60 15 30 60 X2 105 105 105 120 120 120 135 135 135 Y 1.87 2.02 3.28 3.05 4.07 5.54 5.03 6.45 7.26 Bước 2: Áp dụng Regression: Nhấn đơn lệnh Tools lệnh Data Analysis Chọn chương trình Regression hộp thoại Data Analysis nhấp OK Trong hộp thoại Regression, ấn định chi tiết:  Phạm vi biến số Y (input Y range)  Phạm vi biến số X (input X range)  Nhãn liệu (Labels)  Mức tin cậy (Confidence level)  Tọa độ đầu (Output range)  Đường hồi quy (Line Fit Plots),… Các giá trị đầu cho bảng sau:  Phương trình hồi quy: Ŷx1=f(X1): Ŷx1=2.73 + 0.04X1 (R =0.21, S=1.81) Kết biện luận:  T0=2.129 < t0.05 = 2.365 (hay Pv2=0.071>α=0.05) t1=1.38 < t0.05 = 2.365 (hay Pv=0.209>α=0.05) F=1.95 < F0.05 = 5.590 (hay Fs=0.209>α=0.05)  => Chấp nhận giả thiết H0 => Chấp nhận giả thiết H0 => Chấp nhận giả thiết H0 Cả hai hệ số 2.73 (B0) 0.04 (B1) phương trình hồi quy Ŷx1 = 2.73 + 0.04X1 ý nghĩa thống Nói cách khác phương trình hồi quy không thích hợp  Yếu tố thời gian liên quan tuyến tính với hiệu suất phản ứng tổng hợp   Phương trình hồi quy: Ŷx2 = f(X2): Ŷx2 = 2.73 + 0.0.04X2 (R2=0.76, S=0.99) Kết biện luận:  t0 = 3.418 > t0.05 = 2.365 (hay Pv2=0.011 < α=0.05)  t1= 4.757 > t0.05 = 2.365(hay Pv=0.00206 < α=0.05)  F= 22.631 > F=5.590(hay Fs=0.00206 < α=0.05)  =>Bác bỏ giả thiết H0 =>Bác bỏ giả thiết H0 =>Bác bỏ giả thiết H0 Vậy hai hệ số -11.141 (B0) 0.129 (B1) phương trình hồi quy Ŷx2= -11.141 + 0.129X2 có ý nghĩa thống Nói cách khác phương trình hồi quy thích hợp Cách 1: Ta gọi hộp thoại chi test Cách 2: Ta gõ lệnh trực tiếp  Kết biện luận:  P( X > χ ) = 6,0949E-215 < 0.01  Bác bỏ giả thuyết H  Tình hình đau mắt hột tỉnh A, B, C khác Bài 3: bảng sau cho số liệu người chết ung thư nước Mĩ, Nhật Anh Người chết phân loại theo quan bị ung thư sau: Chỗ ung thư Ruột Ngực Dạ dày Bộ phận khác Mỹ 11 15 41 Nước Nhật 22 30 Anh 15 a) Hãy tính tần số lý thuyết bảng số liệu b) Có thể áp dụng tiêu chuẩn χ2 không? c) Với ý nghĩa 1% so sánh tỉ lệ chết ung thư ba nước nói Bài giải:  Cơ sở lý thuyết: so sánh tỉ số  Phần mềm: Microsoft Excel 2010 Nhập liệu vào bảng tính sau tính tổng:     Tổng hàng( Row tatals): chọn ô E2 nhập biểu thức =SUM(B2:D2) Dùng trỏ kéo nút tự điền từ ô E2 đến E4 Tổng cột( Column tatals): chọn ô B6 nhập biểu thức =SUM(B2:B5) Dùng trỏ kéo nút tự điền từ ô B6 đến E6 a/ tính tần số lý thuyết: Tần số lý thuyết =( tổng hàng × tổng cột)/ tổng cộng: Người chết Mỹ bệnh ung thư ruột: chọn ô B8 nhập biểu thức =B6*$E$2/$E$6  Kéo tự động điền kết từ ô B8 đến ô D8  Sửa ô vừa kéo lại thành: =$B$6*E2/$E$6; =$C$6*E2/$E$6; =$D$6*E2/$E$6  Chọn ô B8, C8, D8 kéo cho tự điền kết từ dòng đến dòng 11 ta bảng tần số lý thuyết  Ta kết tần số lý thuyết: Chỗ ung thư Ruột Ngực Dạ dày Bộ phận khác Tổng cột Tần số lý thuyết Ruột Ngực Dạ dày Bộ phận khác Giá trị "P" Mỹ 11 15 41 70 Nhật 22 30 60 Anh 15 30 9,1875 10,9375 12,25 37,625 7,875 9,375 10,5 32,25 3,9375 4,6875 5,25 16,125 Tổng hàng 21 25 28 86 160 b/ Do có tần số lý thuyết nhỏ nên áp dụng tiêu chuẩn χ² c/ Do không áp dụng tiêu chuẩn χ² nên ta ghép cột Nhật cột Anh lại với nhau:    Giả thuyết: H0:P1=P1,0 , P2=P2,0 , PK,0  tỉ lệ chết ung thư nước giống H1: có cặp Pi Pi,j khác  tỉ lệ chết ung thư nước khác  Thao tác máy tính: Bước 1: ghép cột Nhật cột Anh lại với nhau, ta được: Bước 2: tính tần số lý thuyết, tương tự câu a, ta bảng sau: Bước 3: tương tự câu 2, ta sử dụng CHITEST, ta kết quả:  Kết biện luận:  P( X > χ2) = 0,000996501 < 0.01  Bác bỏ giả thuyết H0  Tỉ lệ chết ung thư ba nước khác Bài 4: theo dõi doanh thu bốn cửa hàng thuộc công ty( triệu đồng/tháng), người ta số liệu sau: Tháng kinh doanh Cửa hàng 14,2 15,6 12,4 17,1 11,5 18,2 11,6 12,5 11,8 12,3 17,2 12,6 15,8 11,6 12,2 15,2 18,6 17,1 Hãy so sánh mức doanh thu trung bình/ tháng cửa hàng thuộc công ty nói Mức ý nghĩa 5% Bài Giải:   Dạng bài: phân tích phương sai nhân tố Phần mềm: microsoft Excel 2010 Giả thuyết:  H0: µ1= µ2= µk:  doanh thu trung bình tháng cửa hàng thuộc công ty nói giống  H1: µ1 ≠ µ2 có hai giá trị trung bình khác Thao tác máy tính: Bước 1: nhập liệu: Bước 2: áp dụng " Anova Single Factor": Vào Tool chọn Data Analysis Chọn chương trình Anova: Single Factor hộp thoại Data Analysis rồichọn OK Trong hộp thoại Anova: Single Factor ấn định chi tiết:  Phạm vi đầu vào(Input Range)  Cách xếp theo hàng hay cột(Group By)   Nhãn liệu(Labels in First Row/column) Alpha (độ tin cậy): 0.05 Kết ta có bảng Anova:  Kết biện luận:  F = 0,980529221125816< F0.05 = 3,34388867811891  Chấp nhận giả thiết H0  Doanh thu trung bình tháng cửa hàng công ty giống Bài 5: Mức ý nghĩa 5% Hãy phân tích tình hình kinh doanh cuar số nghành nghề quận quận nội thành sở số liệu doanh thu số cửa hàng sau: Nghành nghề kinh doanh Điện lạnh Khu vực kinh doanh Q2 Q3 3.1:3.5:2.7 2.0:2.4 Q1 2.5:2.7:2.0:3.0 Vật liệu xây dựng 0.6:10.4 15.0 9.5:9.3:9.1 19.5:17.5 1.2:1.0:9.8:1.8 2.0:2.2:1.8 1.2:1.3:1.2 5.0:4.8:5.2 Q4 5.0:5.4 Dịch vụ tin học Bài giải:   Dạng : Phân tích phương sai hai nhân tố có lặp Phần mềm: microsoft Excel 2010  Giả thuyết:  H : µ = µ = µ :  giá trị trung bình  H : µ ≠ µ  có hai giá trị trung bình khác  Thao tác máy tính: 1 k Bước 1: nhập liệu vào bảng tính: Bước 2: áp dụng “ two-factor with replication”: Các yếu tố cần nhập:    Input Range: vùng liệu Rows per sample: số dòng lặp Alpha: mức ý nghĩa 0.05 Chọn ok ta kết sau: Anova: Two-Factor With Replication SUMMARY Q1 Q2 Q3 10,2 2,55 0,17666 9,3 2,325 2,50916 Count Sum Average 11 2,75 15 3,75 Variance 26,09 56,25 13,8 3,45 18,0366 1,5 1,02666 12 35 2,91666 12,2451 Q4 Total Điện lạnh Count Sum Average Variance 4,4 1,1 10,4 2,6 1,64 9,04 27,9 6,975 21,6491 37 9,25 16 34,3 2,14375 3,07195 Vật liệu xây dựng 114,75 16 90,9 5,68125 50,8762 0,3825 15 3,75 6,27666 16 38,5 2,40625 6,72062 12 30,3 12 36 12 62,4 2,525 5,2 17,2475 15,08 44,66 MS 62,1558 17,5952 13,9608 F 2,89290 0,81892 0,64977 Dịch vụ tin học Count Sum Average Variance 3,7 0,925 Total Count Sum Average Variance ANOVA Source of Variation Sample Columns Interaction SS 124,311 52,7856 83,765 df P-value 0,06838 0,49195 0,68994 F crit 3,25944 2,86626 2,36375 Within 773,482 36 Total 1034,34 47 21,4856  Kết biện luận:  FR=2.892903

Ngày đăng: 29/08/2017, 11:20

TỪ KHÓA LIÊN QUAN

w