1. Trang chủ
  2. » Thể loại khác

BÀI TẬP XÁC SUẤT THỐNG KÊ ĐẠI HỌC BÁCH KHOA

35 267 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 35
Dung lượng 1,27 MB

Nội dung

BÀI TẬP 1: A. Ví dụ 10 trang 172 Đề bài: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau: Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 9 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Yêu cầu: Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng ? Dạng bài: Kiểm định giá trị trung bình. Cơ sở lý thuyết: Mô hình: Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình vuông la tinh n × n. Thí dụ như mô hình vuông la tinh 4 × 4 : B C D A C D A B D A B C A B C D BÀI TẬP 1: A. Ví dụ 10 trang 172 Đề bài: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau: Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 9 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Yêu cầu: Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng ? Dạng bài: Kiểm định giá trị trung bình. Cơ sở lý thuyết: Mô hình: Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình vuông la tinh n × n. Thí dụ như mô hình vuông la tinh 4 × 4 : B C D A C D A B D A B C A B C D BÀI TẬP 1: A. Ví dụ 10 trang 172 Đề bài: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau: Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 9 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Yêu cầu: Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng ? Dạng bài: Kiểm định giá trị trung bình. Cơ sở lý thuyết: Mô hình: Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình vuông la tinh n × n. Thí dụ như mô hình vuông la tinh 4 × 4 : B C D A C D A B D A B C A B C D BÀI TẬP 1: A. Ví dụ 10 trang 172 Đề bài: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau: Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 9 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Yêu cầu: Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng ? Dạng bài: Kiểm định giá trị trung bình. Cơ sở lý thuyết: Mô hình: Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình vuông la tinh n × n. Thí dụ như mô hình vuông la tinh 4 × 4 : B C D A C D A B D A B C A B C D

BÀI TẬP 1: A Ví dụ 10 trang 172 Đề bài: Hiệu suất phần trăm (%) phản ứng hóa học nghiên cứu theo yếu tố: pH (A), nhiệt độ (B) chất xúc tác (C) trình bày bảng sau: Yếu tố B Yếu tố A B1 B2 B3 B4 A1 C1 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Yêu cầu: Hãy đánh giá ảnh hưởng yếu tố hiệu suất phản ứng ?  Dạng bài: Kiểm định giá trị trung bình  Cơ sở lý thuyết: • Mơ hình: Khi nghiên cứu ảnh hưởng hai yếu tố, yếu tố có n mức, người ta dùng mơ hình vng la tinh Thí dụ mơ hình vng la tinh : B C D A C D A B D A B C A B C D Mơ hình vng la tinh ba yếu tố trình bày sau: Yếu tố B Yếu tố A B1 B2 B3 B4 A1 C1 Y111 C2 Y122 C3 Y133 C4 Y144 T1 A2 C2 Y212 C3 Y223 C4 Y234 C1 Y241 T2 A3 C3 Y313 C4 Y324 C1 Y331 C2 Y342 T3 A4 C4 Y414 C1 Y421 C2 Y432 C3 Y443 T4 T.i T.1 T.2 T.3 T.4 Yếu tố C (T k, thí dụ: T 1=Y111 + Y421 + Y331 + Y241)  Phương pháp giải: Phân tích phương sai yếu tố (A, B, C) Sự phân tích dùng để đánh giá ảnh hưởng yếu tố giá trị quan sát Yijk (i = 1, r: yếu tố A; j = 1, r: yếu tố B: k = 1, r: yếu tố C) Bảng ANOVA : Nguồn sai số Yếu tố A (Hàng) Yếu tố B (Cột) Bậc tự Tổng số bình phương Bình phương trung bình Giá trị thống kê (r-1) (r-1) Yếu tố C (r-1) Sai số (r-1)(r-2) Tổng cộng (r2-1) Trắc nghiệm: - Giả thiết: H0: μ1 = μ2 = = μk ↔ Các giá trị trung bình H1 : μ i μj ↔ Có hai giá trị trung bình khác - Giá trị thống kê: FR, FC, F - Biện luận: + Nếu (Yếu tố A) + Nếu (Yếu tố B) + Nếu (Yếu tố C) Bài làm: Các bước thực MS Excel • Tính tốn giá trị: Tính giá trị Ti Chọn B7 nhập vào biểu thức: Chọn ô C7 nhập vào biểu thức: Chọn ô D7 nhập vào biểu thức: Chọn ô E7 nhập vào biểu thức: • Tính giá trị T.j Chọn ô B8 nhập vào biểu thức: Dùng trỏ chuột kéo kí hiệu tự điền từ B8 đến E8 • Tính giá trị T k Chọn ô B9 nhập vào biểu thức: Chọn ô C9 nhập vào biểu thức: Chọn ô D9 nhập vào biểu thức: Chọn E9 nhập vào biểu thức: • Tính giá trị T… Chọn ô B10 nhập vào biểu thức: • Tính giá trị SUMSQTi , SUMSQT.j., SUMSQT k, SQT…, SUMSOY ijk Chọn ô G7 nhập vào biểu thức : Dùng trỏ chuột kéo kí hiệu tự điền từ ôn G7 đến G9 Chọn ô G10 nhập vào biểu thức : Chọn ô G11 nhập vào biểu thức : • Tính giá trị SSR, SSC, SSF, SST, SSE Các giá trị SSR, SSC, SSF • Chọn I7 nhập vào biểu thức : Dùng trỏ chuột kéo kí hiệu tự điền từ ơn I7 đến I9 Giá trị SST Chọn ô I11 nhập vào biểu thức Giá trị SSE Chọn ô I10 nhập vào biểu thức • Tính giá trị MSR, MSC, MSF, MSE MSR, MSC, MSF Chọn ô K7 nhập vào biểu thức : Dùng trỏ chuột kéo kí hiệu tự điền từ ôn K7 đến K9 MSE Chọn ô K10 nhập vào biểu thức : • Tính cá giá trị FR , FC, F Chọn ô M7 nhập vào biểu thức: Dùng trỏ chuột kéo kí hiệu tự điền từ ơn M7 đến M9 • Kết sau tính tốn: • Kết biện luận:  Kết luận: Vậy có nhiệt độ chất xúc tác gây ảnh hưởng đến hiệu suất B Ví dụ 12 trang 181: Đề bài: Người ta dùng mức nhiệt độ gồm 105, 120 135 kết hợp với khoảng thời gian 15, 30 60 phút để thực phản ứng tổng hợp Các hiệu suất phản ứng (%) đưuọc trình bày bảng đây: Thời gian (phút) Nhiệt độ (°C) Hiệu suất (%) X1 X2 Y 15 105 1,87 30 105 2,02 60 105 3,28 15 120 3,05 30 120 4,07 60 120 5,54 15 135 5,03 30 135 6,45 60 135 7,26 Yêu cầu: Hãy cho biết yếu tố nhiệt độ thời gian/ yếu tố thời gian có liên quan tuyến tính với hiệu suất phản ứng tổng hợp? Nếu có điều kiện nhiệt độ vịng 50 phút hiệu suất phản ứng ?  Dạng bài: Phân tích tương quan hồi quy tuyến tính  Cơ sở lý thuyết: • Phương pháp giải: Hồi quy tuyến tính đơn giản o Phương trình tổng quát: Y: Biến số phụ thuộc (dependent / reponse variable) X: Biến số độc lập (independent / predictor variable) B0, B: Các hệ số hồi quy (regression coefficients)  Bảng ANOVA: Nguồn sai số Hồi quy Sai số Tổng cộng  Bậc tự Tổng số bình phương Bình phương trung bình Giá trị thống kê N–2 N–1 Giá trị thống kê Giá trị R-bình phương: (100R2: % biến đổi Y giải thích X) Độ lệch chuẩn: (Sự phân tán liệu giá trị S gần zero)  - Trắc nghiệm Trắc nghiệm t: H0: βi = ↔ Hệ số hồi quy khơng có ý nghĩa H1 : β i ↔ Hệ số hồi quy có ý nghĩa Giá trị thống kê: ; Phấn bố Student Biện luận: Nếu t < (N-2) → Chấp nhận H0 - Trắc nghiệm F: H0: βi = ↔ Phương trình hồi quy khơng thích hợp H1 : β i ↔ Phương trình hồi quy thích hợp Giá trị thống kê: Biện luận: Nếu F < Fα(1,N-2) → Chấp nhận H0  Phương pháp giải: Hồi quy tuyến tính đa tham số Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên quan đến k biến số độc lập Xi ( i = 1, 2, 3, …, k) thay có hồi quy tuyến tính đơn giản o Phương trình tổng quát: Phương trình hồi quy đa tham số trình bày dạng ma trận  Bảng ANOVA Nguồn sai số Bậc tự Tổng số bình phương Hồi quy K SSR Bình phương trung bình MSR= Giá trị thống kê F= Sai số N-k-1 SSE MSE = Tổng cộng  N-1 SST = SSR + SSE Giá trị thống kê Giá trị R-bình phương: ( tốt) Độ lệch chuẩn: (  tốt) Trắc nghiệm Giá trị thống kê: F - Trắc nghiệm t: H0: βi = ↔ Các hệ số hồi quy khơng có ý nghĩa H1 : β i ↔ Có vài hệ số hồi quy có ý nghĩa t < (N-k-1) → Chấp nhận H0 - Trắc nghiệm F: H0: βi = ↔ Phương trình hồi quy khơng thích hợp H1 : β i ↔ Phương trình hồi quy thích hợp với vài hệ số Bi F ) (Hay = 0,210 > ) Vậy hai hệ số 2,37() 0,04() phương trình hồi quy khơng có ý nghĩa thống kê Nói cách khác, phương trình hồi quy khơng thích hợp 10 (6’) (7’) Trước hết ta cần tính đại lượng T jk Tiếp theo tính giá trị T jo, njo, nok, Tok, n, T A theo công thức (1), (2), (3) Từ tính SST, SSFA, SSFB, SSE SSI theo công thức (4), (5), (6), (7) (hoặc (5’), (6’), (7’) njk = m)  Bài làm: Giả thuyết: H01(yếu tố ngành nghề) : tình hình kinh doanh số ngành nghề bốn quận H02(yếu tố quận):tình hình kinh doanh quận  Nhập bảng số liệu  Vào DataData AnalysisTwo – Factor With Replication 21  Điền thông số vào cửa sổ Nhấn OK, ta thu bảng sau: 22  Kết luận: FR = 2.8929 < F0.05 =3.2595 => chấp nhận giả thuyết H0 (Tình hình kinh doanh ngành nghề nhau) FC = 0.8189 < F0.05 = 2.86627 => chấp nhận giả thuyết H0 (Tình hình kinh doanh quận nhau) FI = 0.6498 < F 0.05 = 2.36375 => chấp nhận giả thuyết H0 ( Tình hình kinh doanh quận ngành nghề ) BÀI TẬP 4: Đề bài: Một nhóm gồm 105 nhà doanh nghiệp Mỹ phân loại theo thu nhập hàng năm tuổi họ Kết thu sau: Thu nhập Tuổi Dưới 40 Từ 40 đến 54 Trên 54 Dưới 100 000 $ 18 11 Từ 100 000 $ - 399 599 $ 19 12 Trên 400 000 $ 17 Với mức ý nghĩa 1%, kiểm định giả thiết cho tuổi mức thu nhập có quan hệ với hay khơng  Cơ sở lý thuyết: 23  Dạng toán: Kiểm định tính độc lập Giả thuyết: H0: P1 = P1,0; P2 = P2,0; … ; Pk = Pk,0 ⇔ “Các cặp Pi Pi,0 giống nhau” H1 : “Ít có cặp Pi Pi,0 khác nhau” Giá trị thống kê: Oi: tần số thực nghiệm (observed frequency); Ei: tần số lý thuyết (expected frequency) Biện luận: • Nếu ⇒ Bác bỏ giả thuyết H0 (DF = k-1) Trong chương trình MS-EXCEL có hàm CHITEST tính: - Giá trị χ2 theo biểu thức: Oij: tần số thực nghiệm ô thuộc hàng i cột j; Eij: tần số lý thuyết ô thuộc hàng i với cột j; r: số hàng; c: số cột - • Xác suất P(X >χ2) với bậc tự DF = (r-1)(c-1); đó, r số hàng c số cột bảng ngẫu nhiên (contingency table) Nếu P(X >χ2) > α ⇒ Chấp nhận giả thuyết H0 ngược lại  Phương pháp giải - Tính tổng số - Tổng hàng (row totals) - Tổng cột (column totals) 24 -Tổng cộng (grand total) - Tính tần số lý thuyết - Tần số lý thuyết = tổng hàng x tổng cột / tổng cộng  Bài làm Nhập bảng số liệu vào excel: Tính tổng hàng : Chọn ô E4 nhập biểu thức =SUM(B4:D4) Dùng trỏ kéo kí hiệu tự điền ô E4 đến ô E6 Tính tổng cột : Chọn ô B7 nhập biểu thức =SUM(B4:B6) Dùng trỏ kéo kí hiệu tự điền B7 đến E7 Chọn ô B10 nhập biểu thức =B$7*$E4/$E$7 Dùng trỏ kéo đến ô B10 tới ô D10, B11 tới D11, B12 tới D12 nhập biểu thức tương ứng theo cơng thức 25 Tính giá trị “P” : Chọn ô B14 nhập biểu thức =CHITEST(B4:D6,B10:D12) P(X >χ2) =0.14375984 > α=0.01  Chấp nhận giả thuyết H0 *Hoặc là: tính Miền bác bỏ χ0.01 (3-1)(3-1) biểu thức = CHIINV(0,01;4) 26 Sau tính giá trị χ02 theo biểu thức =CHIINV(B14;4) Ta thấy: ⇒ Bác bỏ giả thuyết H0 Kết luận: Tuổi mức thu nhập khơng có mối quan hệ với BÀI TẬP 5: Sau số liệu loại báo ngày bán quận nội thành 27 Ngày khảo sát Quận nội thành Thứ hai Q1 22 Q2 18 Q3 22 Q4 18 Q5 18 Thứ ba 21 18 22 18 19 Thứ tư 25 25 25 19 20 Thứ năm 24 24 18 20 22 Thứ sáu 28 19 15 22 25 Thứ bảy 30 22 28 25 25 Lượng báo bán quận có thực khác không ? Chọn α = 1% Lượng báo bán có chịu tác động yếu tố ngày tuần không? Bài làm Lượng báo bán quận có thực khác hay khơng?  Dạng bài: Kiểm định giá trị trung bình nhân tố  Phương pháp giải: Phân tích phương sai nhân tố - Mục tiêu phân tích phương sai so sánh trung bình nhiều nhóm (tổng thể) dựa số trung bình mẫu quan sát từ nhóm thơng qua kiểm định giả thuyết để kết luận số trung bình - Phân tích phương sai yếu tố phân tích ảnh hưởng yếu tố nguyên nhân (dạng biến liệu định tính) đến yếu tố kết (dạng biến liệu định lượng) nghiên cứu  Công cụ giải: Anova Single Factor  Cơ sở lý thuyết: + Mô hình Tổng cộng Trung bình Y11 Y12 … Y1N T1 Yếu tố thí nghiệm … Y21 … Y22 … … … Y2N … T2 … … k Yk1 Yk2 … YN Tk T k + Bảng ANOVA: 28 Nguồn sai số Bậc tự Yếu tố k-1 Tổng bình phương SS Tổng cộng n-k Giá trị thống kê F Ti T − ∑ N i =1 N k SSF Sai số Bình phương trung bình MS SSE SST SSF n-1 SST k n ∑∑Y n − i =1 j =1 T2 N + Giả thuyết: H0: u1 u2 … uk  “Các giá trị trung bình nhau” H1: ui uj  “Ít có hai giá trị trung bình khác nhau” + Giá trị thống kê: F= + Biện luận: Nếu F Fα Chấp nhận giả thuyết H0  Thực toán excel: + Nhập bảng số liệu vào mẫu excel: + Vào Data/ Data Analysis/Anova: Single Factor 29 + Chọn mục hình: - Phạm vi đầu vào (Input range) Cách xắp xếp theo hàng hay cột (Group by): chọn Column(Cột) Nhãn liệu (Labels in fisrt row/column) Mức ý nghĩa (Alpha): 0.01 Phạm vi đầu (Output range) + Kết 30 + Giả thuyết: H0: Trung bình lượng báo bán quận H1: Trung bình lượng báo bán quận không + Biện luận F1,6352 F0,01 4,1774 Chấp nhận H0 Vậy trung bình lượng báo bán quận Lượng báo bán có chịu tác động của yếu tố của ngày tuần khơng?  Nhận dạng tốn: Phân tích phương sai hai yếu tố ( Không lặp)  Cơ sở lý thuyết: Phân tích phương sai yếu tố nhằm xem xét lúc yếu tố nguyên nhân (dưới dạng liệu định tính) ảnh hưởng đến yếu tố kết (dưới dạng liệu định lượng) nghiên cứu + Mơ hình: 31 + Bảng ANOVA: + Giả thuyết: H0: u1 u2 … uA  “Các giá trị trung bình nhau” H1: ui uj  “Ít có hai giá trị trung bình khác nhau” + Giá trị thống kê: FA , F B + Biện luận: Nếu FA Fα Chấp nhận giả thuyết H0 (Yếu tố A) Nếu FB Fα Chấp nhận giả thuyết H0 (Yếu tố B)  Thực toán excel: + Nhập bảng số liệu vào mẫu excel: 32 + Vào Data/ Data Analysis/Anova: Two-Factor Without Replication + Trong hộp thoại Anova: Two-Factor Without Replication, ấn định chi tiết: - Phạm vi đầu vào (Input range) Nhãn liệu (Labels in fisrt row/column) Mức ý nghĩa (Alpha): 0.01 Phạm vi đầu (Output range) + Kết quả: 33 + Giả thuyết: H0 : Số lượng báo bán yếu tố thời gian ngày tuần có liên quan với H1 : Số lượng báo bán yếu tố thời gian ngày tuần không liên quan với + Biện luận: FA= 3,5672 F0.01 = 4,1027 Chấp nhận H0 Vậy số lượng báo bán yếu tố thời gian ngày tuần có liên quan tới 34 ... MSR= Giá trị thống kê F= Sai số N-k-1 SSE MSE = Tổng cộng  N-1 SST = SSR + SSE Giá trị thống kê Giá trị R-bình phương: ( tốt) Độ lệch chuẩn: (  tốt) Trắc nghiệm Giá trị thống kê: F - Trắc nghiệm... giá trị X2 (nhiệt độ) BÀI TẬP 2:  Dạng toán: Bài toán kiểm định tỉ lệ  Cơ sở lý thuyết ✓ Giả thiết: - , = , , “ Các cặp giống nhau” : “ Ít có cặp khác 14 ✓ Giá trị thống kê: - Các tần số thực... quy Sai số Tổng cộng  Bậc tự Tổng số bình phương Bình phương trung bình Giá trị thống kê N–2 N–1 Giá trị thống kê Giá trị R-bình phương: (100R2: % biến đổi Y giải thích X) Độ lệch chuẩn: (Sự

Ngày đăng: 17/05/2019, 13:27

w