BÁO cáo bài tập lớn môn xác SUẤT THỐNG kê hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố ph (a), nhiệt độ (b) và chất xúc tác (c) được
Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 30 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
30
Dung lượng
16,76 MB
Nội dung
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍNH MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA ……………⁂…………… BÁO CÁO BÀI TẬP LỚN MÔN XÁC SUẤT THỐNG KÊ Giáo viên hướng dẫn : NGUYỄN ĐÌNH HUY Sinh viên : Trần Thị Ngọc Phượng MSSV : 1914789 Nhóm - Lớp: L15 MỤC LỤC CÂU 1A: Đề : Dạng bài: Phân tích phương sai yếu tố 3 Cơ sở lý thuyết: Giải toán phần mềm IBM SPSS CÂU 1B: Đề bài: Dạng bài: hồi quy tuyến tính đa tham số .9 Cơ sở lí thuyết: 4.Giải toán phần mềm IBM SPSS 10 CÂU 2: 19 Đề bài: 19 Dạng bài: Phân tích phương sai yếu tố 19 Cơ sở lý thuyết: 19 Giải toán phần mềm EXCEL 19 CÂU 3: 20 Đề bài: 20 Dạng bài: Kiểm định tính độc lập 21 Cơ sở lý thuyết: 21 Giải toán phần mềm EXCEL 21 CÂU 4: 24 Đề bài: 24 Dạng bài: Kiểm định phân bố .25 Cơ sở lý thuyết: 25 Giải toán phần mềm EXCEL 25 CÂU 28 Đề bài: 28 Dạng bài: Phân tích phương sai yếu tố khơng lặp 28 Cơ sở lý thuyết: 28 Giải toán phần mềm EXCEL 28 BÀI TẬP LỚN SỐ 7: CÂU 1A: Đề : Hiệu suất phần trăm (%) phản ứng hóa học nghiên cứu theo yếu tố: pH (A), nhiệt độ (B) chất xúc tác (C) trình bày bảng sau: Yếu tố B Yếu tố A B1 B2 B3 B4 A1 C1 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Hãy đánh giá ảnh hưởng yếu tố hiệu suất phản ứng Dạng bài: Phân tích phương sai yếu tố Cơ sở lý thuyết: - Sự phân tích dùng để đánh giá ảnh hưởng yếu tố giá trị quan sát G (i=1, 2, ….r: yếu tố A; j=1, 2, ….r: yếu tố B; k=1, 2, ….r: yếu tố C) - Mơ hình: Khi nghiên cứu ảnh hưởng hai yếu tố, yếu tố có n mức, người ta dùng mơ hình vng la tinh n x m Ví dụ mơ hình vng la tinh x B C D A C D A B D A B C A B C D Mơ hình vng la tinh yếu tố trình bày sau: Yếu tố B Yếu tố A B1 B2 B3 B4 A1 C1 C2 C3 C4 A2 C2 C3 C4 C1 A3 C3 C4 C1 C2 A4 C4 C1 C2 C3 Bảng ANOVA Bậc tự Tổng số bình phương Yếu tố A (hàng) Yếu tố B (cột) Bình phương trung bình Giá trị thống kê Yếu tố C Sai số Tổng cộng Trắc nghiệm - Giả thiết: ⬄ “Các giá trị trung bình nhau” ⬄ “Có hai giá trị trung bình khác nhau” - Giá trị thống kê FR, FC, F - Biện luận: Nếu -> Chấp nhận H0(Yếu tố A) Nếu -> Chấp nhận H0(Yếu tố B) Nếu -> Chấp nhận H0(Yếu tố C) Giải toán phần mềm IBM SPSS Bước 1: Đặt giả thiết: H1: Hiệu suất phản ứng trung bình phản ứng không phụ thuộc vào pH (Yếu tố pH khơng ảnh hưởng đến hiệu suất phản ứng trung bình) : Tồn pH có hiệu suất phản ứng trung bình khác H2: Hiệu suất phản ứng trung bình phản ứng khơng phụ thuộc vào nhiệt độ (Yếu tố nhiệt độ không ảnh hưởng đến hiệu suất phản ứng trung bình) : Tồn nhiệt độ có hiệu suất phản ứng trung bình khác H3: Hiệu suất phản ứng trung bình phản ứng không phụ thuộc vào chất xúc tác (Yếu tố chất xúc tác không ảnh hưởng đến hiệu suất phản ứng trung bình) : Tồn chất xúc tác có hiệu suất phản ứng trung bình khác Bước 2: Khai báo biến liệu cửa sổ Varible view: Bước 3: Nhập số liệu vào cửa sổ Data view: Bước 4: Chọn Analyze → General Linear Model → Univariate Bước 5: Đưa biến Hieusuatphanung vào khung Dependent Variable; đưa biến pH, Nhietdo Chatxuctac vào khung Fixed Factor(s) Bước 6: Chọn Model → Build terms → đưa biến pH, Nhietdo Chatxuctac vào khung Model → Continue Bước 7: Chọn Options, nhập mức ý nghĩa ô Significance level = 0,05 → Continue Bước 8: Kết biện luận - Dò bảng phân phối Fischer mức ý nghĩa 5% với bậc tự [ (r-1);(r-1)(r-2)]=(3;6) ta F0,05(3;6)=4,76 ( dò bảng VIII trang 201 Giáo trình với n1=3, n2=6) - Bảng Test of Between-Subjects Effects cho ta kết quả:F0,05(3;6)=4,76 ( ) → Chấp nhận giả thiết H1(pH) ( ) → Bác bỏ giả thiết H2(Nhietdo) ( ) → Bác bỏ giả thiết H3(Chatxuctac) Bước 9: Kết luận: - Yếu tố pH không ảnh hưởng đến hiệu suất phản ứng trung bình - Tồn nhiệt độ có hiệu suất phản ứng trung bình khác - Tồn chất xúc tác có hiệu suất phản ứng trung bình khác CÂU 1B: Đề bài: Người ta dùng ba mức nhiệt độ gồm 105, 120, 135℃ kết hợp với ba khoảng thời gian 15, 30 60 phút để thực phản ứng tổng hợp Các hiệu suất phản ứng (%) trình bày bảng sau đây: Thời gian (phút) X1 Hiệu suất (%) Y Nhiệt độ (℃) X2 105 1.87 15 30 105 2.02 60 105 3.28 15 120 3.05 30 120 4.07 60 120 5.54 15 135 5.03 30 135 6.45 135 60 7.26 Hãy cho biết yếu tố nhiệt độ và/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất phản ứng tổng hợp? Nếu có điển kiện nhiệt độ 115℃ vịng 50 phút hiệu suất phản ứng bao nhiêu? Dạng bài: hồi quy tuyến tính đa tham số Cơ sở lí thuyết: Chúng ta xem xét mối liên hệ tuyến tính biến phụ thuộc Y biến độc lập Xi (i = 1, 2, k) Đồ thị phân tán biến gợi ý cho loại hàm số tốn học thích hợp để mơ tả tóm tắt liệu quan sát Phương trình tổng quát: Bảng ANOVA: Nguồn sai số Bậc tự Tổng số bình phương Bình phương trung bình Giá trị thống kê Hồi quy Sai số Tổng cộng Giá trị thống kê Giá trị R bình phương: Giá R2được hiệu chỉnh( Adjusted R Square) Giá trị R2 hiệu chỉnh (Adjusted R Square) (R2ii trở nên âm hay không xác định R2 hay N nhỏ ) Độ lệch chuẩn: (S≤ 0,30 tốt) Trắc nghiệm thống kê: Đối với phương trình hồi quy YX=B0 +BX, ý nghĩa thống kê hệ số Bi (B0 hay B) đánh giá trắc nghiệm t (phân phối Student) tính chất thích hợp phương trình YX=f(X) đánh giá trắc nghiệm F (phân bố Fischer) Trắc nghiệm t: - Giả thiết: “Các hệ số hồi quy ý nghĩa” “Có vài hệ số hồi quy có ý nghĩa” Bậc tự giá trị t: - Giá trị thống kê: Phân bố Student Biện luận: Nếu Trắc nghiệm F Giả thiết: →Chấp nhận giả thiết H0 “Phương trình hồi quy khơng thích hợp” “Phương trình hồi quy thích hợp” với vài Bi ��� Giá trị thống kê: F=��� Phân bố Fischer v1=k, v2= N−k−1 Biện luận: Nếu F< Fα(k, N−k−1) →Chấp nhận giả thiết H0 4.Giải toán phần mềm IBM SPSS Bước 1: Đặt giả thiết: H: “Hệ số tự hệ số góc khơng có ý nghĩa thống kê” : “Hệ số tự hệ số góc có ý nghĩa thống kê” H0: “Phương trình hồi quy khơng thích hợp” : “Phương trình hồi quy thích hợp” Bước 2: Khai báo biến liệu cửa sổ Variable View 10 Dựa vào bảng Coefficientsa, cột B ta xác định hệ số : B0=2,73 B1=0,045 Suy phương trình hồi quy: Dị bảng phân phối Fischer mức ý nghĩa 5% với bậc tự (1; N-k-1) = (1; 7) (N = k = số biến độc lập), ta F0.05(1;7) = 5,59 Dò bảng phân phối Student mức ý nghĩa 5% với bậc tự (N-k-1) = (N = k = số biến độc lập), ta t0.025 = 2,365 t0 = 2,129 < t0,025 = 2,365 (Hay Sig = 0,071 > = 0,05) → Chấp nhận giả thiết H t1 =1,381 < t0,025 = 2,365 (Hay Sig = 0,21 > = 0,05) → Chấp nhận giả thiết H F = 1,908 < F0,05 = 5,59 (Hay Sig = 0,21 > = 0,05) → Chấp nhận giả thiết H0 Kết luận: - Vậy hệ số 2,37(B0); 0,045(B1) phương trình hồi quy YX1=2,73+0,045X1 khơng có ý nghĩa thống kê - Phương trình hồi quy khơng thích hợp - Yếu tố thời gian khơng có liên quan tuyến tính với hiệu suất phản ứng tổng hợp *Phương trình hồi quy: YX2=f(X2) 16 Dò bảng phân phối Student mức ý nghĩa 5% với bậc tự (N-k-1) = (N = k = số biến độc lập), ta t0.025 = 2,365 t0 = 3,415 > t0,025 = 2,365 (Hay Sig.= 0,011 < = 0,05) → Bác bỏ giả thiết H t1 =4,754 > t0,025 = 2,365 (Hay Sig.= 0,002 < = 0,05) → Bác bỏ giả thiết H F = 22,598 > F0,05 = 5,59 (Hay Sig.= 0,002 < = 0,05) → Bác bỏ giả thiết H0 Kết luận: - Vậy hệ số -11,14 (B0); 0,13 (B2) phương trình hồi quy 17 YX2 = -11,14 + 0,13X2 có ý nghĩa thống kê - Phương trình hồi quy thích hợp - Yếu tố nhiêt độ có liên quan tuyến tính với hiệu suất phản ứng tổng hợp *Phương trình hồi quy: Dựa vào bảng Coefficientsa, cột B ta xác định hệ số:B0= -12,7 B1= 0,045 Suy phương trình hồi quy: Dị bảng phân phối Fischer mức ý nghĩa 5% với bậc tự (2; N-k-1) = (2; 6) (N = k = số biến độc lập), ta F0.05(2;6) = 5,14 Dò bảng phân phối Student mức ý nghĩa 5% với bậc tự (N-k-1) = (N = k = số biến độc lập), ta t0.025 = 2,447 t0 = 11,519 > t0,025 = 2,447 (Hay Sig.= 0,000026 < = 0,05) → Bác bỏ giả thiết H t1 = 7,582 > t0,025 = 2,447 (Hay Sig = 0,000274 < = 0,05) → Bác bỏ giả thiết H t2 = 14,328 > t0,025 = 2,447 (Hay Sig = 0,000007 < = 0,05) → Bác bỏ giả thiết H F = 131,204 > F0,05 = 5,14 (Hay Sig.= 0,000011 < = 0,05) → Bác bỏ giả thiết Ho Kết luận: - Vậy hệ số -12,70 (B0); 0,045 (B1); 0,13 (B2) phương trình hồi quy YX1X2= -12,70 + 0,045X1 + 0,13X2 có ý nghĩa thống kê - Phương trình hồi quy thích hợp 18 - Hiệu suất suất phản ứng tổng hợp có liên quan tuyến tính với hai yếu tố nhiệt độ thời gian - Hiệu suất phản ứng điều kiện nhiệt độ 115℃ vòng 50 phút là: CÂU 2: Đề bài: Một nhà nông học tiến hành việc kiểm định hiệu ba loại phân cà chua theo dõi số cà chua mọc cây, kết thu sau: Loại phân A B C 24 21 16 18 26 22 27 32 19 28 25 17 Với mức ý nghĩa 5%, so sánh số cà chua mọc trung bình bón loại phân A, B, C nói Dạng bài: Phân tích phương sai yếu tố Cơ sở lý thuyết: Giải toán phần mềm EXCEL Bước 1: Đặt giả thiết: H0: Số cà chua mọc trung bình bón loại phân A, B, C H1: Tồn loại phân bón có số cà chua mọc trung bình khác Bước 2: Nhập bảng số liệu: Bước 3: Chọn Data → Data Analysis → Anova: Single – Factor 19 Bước 4: Input range: quét vùng số liệu, Grouped By: Rows, Anpha: 0,05, chọn labels in first Column, Ouput range: chọn địa ô cần xuất liệu → OK Bước 5: Kết biện luận F = 3,8557 < Fcrit = 4,2565 (hay P-value = 0,0617 > = 0,05) → Chấp nhận giả thiết H0 Bước 6: Kết luận: - Số cà chua mọc trung bình bón loại phân A, B, C CÂU 3: Đề bài: Cho bảng số liệu màu tóc 422 người sau: Màu tóc Nam Đen 56 Hung 37 Nâu 84 Vàng 19 Nữ 32 66 90 38 20 Với mức ý nghĩa 3%, nhận định xem số liệu có mối quan hệ màu tóc giới tính hay khơng? Dạng bài: Kiểm định tính độc lập Cơ sở lý thuyết: Giải toán phần mềm EXCEL Bước 1: Đặt giả thiết: H0: Màu tóc giới tính độc lập với H1: Màu tóc giới tính phụ thuộc Bước 2: Nhập bảng số liệu: Bước 3: Tính tổng hàng, tổng cột: Quét bảng số liệu dư hàng cột: Vào Formulas → chọn Autosum Kết quả: Bước 3: Lập bảng tần số lý thuyết: 21 Tần số lý thuyết tính theo cơng thức: TSLT= �ổ�� ℎà��× �ổ�� �ộ� �ổ�� �ộ�� Qt có chứa giá trị tần số lý thuyết cần tìm: Sử dụng tổ hợp phím F2 + (Ctrl Enter) Kết quả: Bước 4: Tính P – Value: Vào Formulas → chọn Insert Function 22 Gõ CHITEST vào tìm kiếm hàm → Go Chọn hàm CHITEST → OK 23 Actual_Range: quét vùng số liệu đề bài, Expected_Range: quét vùng tần số lý thuyết → OK Bước 5: Kết biện luận: p-value = 0,0002 < α=0,03 → Bác bỏ giả thiết H0 Bước 6: Kết luận: - Màu tóc giới tính có mối quan hệ với CÂU 4: Đề bài: Tiến hành thăm dị ba nhóm xã hội khác nhau: cơng nhân, nơng dân, trí thức Kết thăm dị sau: Tầng lớp Cơng nhân Nơng dân Trí thức Tổng số Ý kiến Tăng Như cũ Giảm Không ý kiến Tổng số 100 200 50 30 380 300 400 80 70 850 20 30 5 60 420 630 135 105 1290 Với mức ý nghĩa 2%, có khác ý kiến tầng lớp xã hội hay không? 24 Dạng bài: Kiểm định phân bố Cơ sở lý thuyết: Giải toán phần mềm EXCEL Bước 1: Đặt giả thiết: H0: Phân bố tỷ lệ ý kiến tầng lớp H1: Tồn tầng lớp có phân bố tỷ lệ ý kiến khác Bước 2: Nhập bảng số liệu: Bước 3: Lập bảng tần số lý thuyết: Tần số lý thuyết tính theo cơng thức: TSLT= �ổ�� �ộ� ×�ổ�� ℎà�� �ổ�� �ộ�� Quét 12 ô có chứa giá trị tần số lý thuyết cần tìm: Sử dụng tổ hợp phím F2 + (Ctrl Enter) 25 Kết quả: Bước 4: Tính P – Value: Vào Formulas → chọn Insert Function Gõ CHITEST vào tìm kiếm hàm → Go 26 Chọn hàm CHITEST → OK Actual_Range: quét vùng số liệu đề bài, Expected_Range: quét vùng tần số lý thuyết → OK Bước 5: Kết biện luận p-value = 0,0612 > α=0,02 → Chấp nhận giả thiết H Bước 6: Kết luận: - Khơng có khác ý kiến tầng lớp xã hội 27 CÂU Đề bài: Với mức ý nghĩa 2%, phân tích vai trị ngành nghề (chính, phụ) hoạt động kinh tế hộ gia đình vùng nơng thôn sở bảng số liệu thu nhập trung bình hộ vùng với ngành nghề sau: Nghề Trồng lúa (1) Trồng ăn (2) Chăn nuôi (3) Dịch vụ (4) (1) 3.5 5.6 4.1 7.2 Nghề phụ (2) (3) 7.4 8.0 4.1 6.1 2.5 1.8 3.2 2.2 (4) 3.5 9.6 2.1 1.5 Dạng bài: Phân tích phương sai yếu tố không lặp Cơ sở lý thuyết: Giải toán phần mềm EXCEL Bước 1: Đặt giả thiết: H1: Thu nhập trung bình hộ vùng khơng phụ thuộc vào nghề : Tồn nghề có thu nhập trung bình hộ vùng khác H2: Thu nhập trung bình hộ vùng không phụ thuộc vào nghề phụ : Tồn nghề phụ có thu nhập trung bình hộ vùng khác Bước 2: Nhập bảng số liệu Bước 3: Chọn Data → Data Analysis → Anova: Two-Factor Without Replication 28 Bước 4: Input range: quét vùng số liệu, chọn Labels, Anpha: 0,02, Ouput range: chọn địa ô cần xuất liệu → OK Bước 5: Kết biện luận: FRows = 1,9966 < Fcrit = 5,5097→ Chấp nhận giả thiết H1 FColumns = 0,1106 < Fcrit = 5,5097→ Chấp nhận giả thiết H2 Bước 6: Kết luận: - Thu nhập trung bình hộ vùng khơng phụ thuộc vào nghề - Thu nhập trung bình hộ vùng không phụ thuộc vào nghề phụ 29 30 ... hưởng đến hiệu suất ph? ??n ứng trung bình) : Tồn nhiệt độ có hiệu suất ph? ??n ứng trung bình khác H3: Hiệu suất ph? ??n ứng trung bình ph? ??n ứng không ph? ?? thuộc vào chất xúc tác (Yếu tố chất xúc tác không... tố pH không ảnh hưởng đến hiệu suất ph? ??n ứng trung bình) : Tồn pH có hiệu suất ph? ??n ứng trung bình khác H2: Hiệu suất ph? ??n ứng trung bình ph? ??n ứng khơng ph? ?? thuộc vào nhiệt độ (Yếu tố nhiệt độ. .. hóa học nghiên cứu theo yếu tố: pH (A), nhiệt độ (B) chất xúc tác (C) trình bày bảng sau: Yếu tố B Yếu tố A B1 B2 B3 B4 A1 C1 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11