Dạng bài: Phân tích phương sai 3 yếu tố3.. Giải toán bằng phần mềm IBM SPSSBước 1: Đặt giả thiết:H1: Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào pH Yếu tốpH không
Trang 1………⁂………
BÁO CÁO BÀI TẬP LỚNMÔN XÁC SUẤT THỐNG KÊ
Giáo viên hướng dẫn: NGUYỄN ĐÌNH HUYSinh viên : Trần Thị Ngọc Phượng
Trang 3Yếu tố AB1B2Yếu tố BB3B4A1C19C214C316C412A2C212C315C412C110A3C313C414C111C214A4C410C111C213C313
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng
2 Dạng bài: Phân tích phương sai 3 yếu tố3 Cơ sở lý thuyết:
- Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 2 yếu tố trên các giá trịquan sát G (i=1, 2, ….r: yếu tố A; j=1, 2, ….r: yếu tố B; k=1, 2, ….r: yếu tố C).
- Mô hình:
Trang 4Bảng ANOVABậc tự doTổng số bình phươngBình phương trungbìnhthống kêGiá trịYếu tốA(hàng)Yếu tốB(cột)Yếu tốCSai sốTổngcộngTrắc nghiệm- Giả thiết:
⬄ “Các giá trị trung bình bằng nhau”⬄ “Có ít nhất hai giá trị trung bình khác nhau”- Giá trị thống kê FR, FC, F- Biện luận:Nếu-> Chấp nhận H0(Yếu tố A)Nếu-> Chấp nhận H0(Yếu tố B)Nếu-> Chấp nhận H0(Yếu tố C)
4 Giải toán bằng phần mềm IBM SPSSBước 1: Đặt giả thiết:
H1: Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào pH (Yếu tốpH không ảnh hưởng đến hiệu suất phản ứng trung bình).
: Tồn tại 2 pH có hiệu suất phản ứng trung bình khác nhau.
H2: Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào nhiệt độ (Yếutố nhiệt độ không ảnh hưởng đến hiệu suất phản ứng trung bình).
Trang 5H3: Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào chất xúc tác(Yếu tố chất xúc tác không ảnh hưởng đến hiệu suất phản ứng trung bình).
: Tồn tại 2 chất xúc tác có hiệu suất phản ứng trung bình khác nhau.
Bước 2: Khai báo biến dữ liệu trong cửa sổ Varible view:
Bước 3: Nhập số liệu vào cửa sổ Data view:
Trang 6Bước 5: Đưa biến Hieusuatphanung vào khung Dependent Variable; đưa các biến pH,
Trang 7Bước 6: Chọn Model → Build terms → đưa các biến pH, Nhietdo và Chatxuctac vào
khung Model → Continue.
Bước 7: Chọn Options, nhập mức ý nghĩa ở ô Significance level = 0,05 → Continue.
Trang 8- Dò bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do [ (r-1);(r-1)(r-2)]=(3;6)ta được F0,05(3;6)=4,76 ( dò bảng VIII trang 201 Giáo trình với n1=3, n2=6)
- Bảng Test of Between-Subjects Effects cho ta kết quả:F0,05(3;6)=4,76
( hoặc) → Chấp nhận giả thiết H1(pH)
( hoặc) → Bác bỏ giả thiết H2(Nhietdo)
() → Bác bỏ giả thiết H3(Chatxuctac)
Bước 9: Kết luận:
- Yếu tố pH không ảnh hưởng đến hiệu suất phản ứng trung bình - Tồn tại 2 nhiệt độ có hiệu suất phản ứng trung bình khác nhau.- Tồn tại 2 chất xúc tác có hiệu suất phản ứng trung bình khác nhau.
CÂU 1B:1 Đề bài:
Người ta đã dùng ba mức nhiệt độ gồm 105, 120, 135℃ kết hợp với ba khoảng thời gianlà 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp Các hiệu suất của phản ứng (%)được trình bày trong bảng sau đây:
Trang 9601357.26
Hãy cho biết yếu tố nhiệt độ và/hoặc yếu tố thời gian có liên quan tuyến tính với hiệusuất của phản ứng tổng hợp? Nếu có thì điển kiện nhiệt độ 115℃ trong vòng 50 phútthì hiệu suất phản ứng sẽ là bao nhiêu?
2 Dạng bài: hồi quy tuyến tính đa tham số3 Cơ sở lí thuyết:
Chúng ta xem xét mối liên hệ tuyến tính giữa một biến phụ thuộc Y và các biến độc lậpXi(i = 1, 2, k) Đồ thị phân tán giữa các biến là một gợi ý cho chúng ta loại hàm số toánhọc thích hợp để mô tả và tóm tắt các dữ liệu quan sát.Phương trình tổng quát:Bảng ANOVA:Nguồn saisốBậc tự doTổng số bìnhphươngBình phương trungbìnhGiá trị thốngkêHồi quySai sốTổng cộngGiá trị thống kêGiá trị R bình phương:
Giá R2được hiệu chỉnh( Adjusted R Square)
Giá trị được R2hiệu chỉnh (Adjusted R Square)
(R2iisẽ trở nên âm hay không xác định nếu R2hay N nhỏ )Độ lệch chuẩn:
(S≤ 0,30 là khá tốt)
Trắc nghiệm thống kê:
Đối với một phương trình hồi quy YX=B0+BX, ý nghĩa thống kê của các hệ số Bi (B0
hay B) được đánh giá bằng trắc nghiệm t (phân phối Student) trong khi tính chất thích
hợp của phương trình YX=f(X) được đánh giá bằng trắc nghiệm F (phân bố Fischer).
Trắc nghiệm t:- Giả thiết:
Trang 10“Có ít nhất vài hệ số hồi quy có ý nghĩa”Bậc tự do của giá trị t:.- Giá trị thống kê:Phân bố StudentBiện luận: Nếu→Chấp nhận giả thiết H0Trắc nghiệm FGiả thiết:
“Phương trình hồi quy không thích hợp”.
“Phương trình hồi quy thích hợp” với ít nhất vài Bi.Giá trị thống kê: F=������
Phân bố Fischer v1=k, v2= N−k−1Biện luận:
Nếu F< Fα(k, N−k−1) →Chấp nhận giả thiết H0
4.Giải toán bằng phần mềm IBM SPSSBước 1: Đặt giả thiết:
H: “Hệ số tự do và hệ số góc không có ý nghĩa thống kê”: “Hệ số tự do và hệ số góc có ý nghĩa thống kê”H0: “Phương trình hồi quy không thích hợp”
: “Phương trình hồi quy là thích hợp”
Trang 11Bước 3: Nhập số liệu vào cửa sổ Data View:
Bước 4: Chọn Analyze → Regression → Linear Regression
Bước 5: Hộp thoại Linear Regression hiện lên, nếu:
+ Tìm phương trình YX1=f(X1), ta đưa biến phụ thuộc Y vào ô Dependent, biến độc lập
Trang 12+ Tìm phương trình YX2=f(X2), ta đưa biến phụ thuộc Y vào ô Dependent, biến độc lập
X2, vào ô Independent(s).
+ Tìm phương trình, ta đưa biến phụ thuộc Y vào ô Dependent, biến
Trang 13Bước 6: Chọn Statistics → click chọn R squared change và Descriptives…→Continue
Với mức ý nghãi mặc định là 0,05 chọn OK.
Bước 7: Vẽ đồ thị: trong cửa sổ Output chọn Graphs → Legacy Dialogs →
Trang 16Dựa vào bảng Coefficientsa, cột B ta xác định được các hệ số : B0=2,73 và B1=0,045Suy ra phương trình hồi quy:
Dò bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do (1; N-k-1) = (1; 7) (N = 9 vàk = 1 là số biến độc lập), ta được F0.05(1;7) = 5,59
Dò bảng phân phối Student ở mức ý nghĩa 5% với bậc tự do (N-k-1) = 7 (N = 9 và k = 1là số biến độc lập), ta được t0.025= 2,365
t0= 2,129 < t0,025= 2,365 (Hay Sig = 0,071 > = 0,05) → Chấp nhận giả thiết Ht1=1,381 < t0,025= 2,365 (Hay Sig = 0,21 > = 0,05) → Chấp nhận giả thiết HF = 1,908 < F0,05= 5,59 (Hay Sig = 0,21 > = 0,05) → Chấp nhận giả thiết H0
Kết luận:
- Vậy các hệ số 2,37(B0); 0,045(B1) của phương trình hồi quy YX1=2,73+0,045X1đềukhông có ý nghĩa thống kê.
- Phương trình hồi quy không thích hợp.
- Yếu tố thời gian không có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
Trang 17Dò bảng phân phối Student ở mức ý nghĩa 5% với bậc tự do (N-k-1) = 7 (N = 9 và k = 1là số biến độc lập), ta được t0.025= 2,365
t0= 3,415 > t0,025= 2,365 (Hay Sig.= 0,011 < = 0,05) → Bác bỏ giả thiết Ht1=4,754 > t0,025= 2,365 (Hay Sig.= 0,002 < = 0,05) → Bác bỏ giả thiết HF = 22,598 > F0,05= 5,59 (Hay Sig.= 0,002 < = 0,05) → Bác bỏ giả thiết H0
Trang 18YX2= -11,14 + 0,13X2đều có ý nghĩa thống kê.- Phương trình hồi quy này thích hợp.
- Yếu tố nhiêt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
*Phương trình hồi quy:
Dựa vào bảng Coefficientsa, cột B ta xác định được các hệ số:B0= -12,7 và B1= 0,045 vàSuy ra phương trình hồi quy:
Dò bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do (2; N-k-1) = (2; 6) (N = 9 vàk = 2 là số biến độc lập), ta được F0.05(2;6) = 5,14
Dò bảng phân phối Student ở mức ý nghĩa 5% với bậc tự do (N-k-1) = 6 (N = 9 và k = 2là số biến độc lập), ta được t0.025= 2,447
t0= 11,519 > t0,025= 2,447 (Hay Sig.= 0,000026 < = 0,05) → Bác bỏ giả thiết Ht1= 7,582 > t0,025= 2,447 (Hay Sig = 0,000274 < = 0,05) → Bác bỏ giả thiết Ht2= 14,328 > t0,025= 2,447 (Hay Sig = 0,000007 < = 0,05) → Bác bỏ giả thiết HF = 131,204 > F0,05= 5,14 (Hay Sig.= 0,000011 < = 0,05) → Bác bỏ giả thiết Ho
Kết luận:
- Vậy các hệ số -12,70 (B0); 0,045 (B1); 0,13 (B2) của phương trình hồi quyYX1X2= -12,70 + 0,045X1+ 0,13X2đều có ý nghĩa thống kê.
Trang 19- Hiệu suất suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là nhiệtđộ và thời gian.
- Hiệu suất phản ứng trong điều kiện nhiệt độ 115℃ trong vòng 50 phút là:
CÂU 2:1 Đề bài:
Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân này trên các cây càchua và theo dõi số quả cà chua mọc trên mỗi cây, kết quả thu được như sau:Loại phânABC242116182622273219282517Với mức ý nghĩa 5%, hãy so sánh số quả cà chua mọc trung bình khi bón 3 loại phân A,B, C nói trên.2 Dạng bài: Phân tích phương sai 1 yếu tố3 Cơ sở lý thuyết:
4 Giải bài toán bằng phần mềm EXCELBước 1: Đặt giả thiết:
H0: Số quả cà chua mọc trung bình khi bón 3 loại phân A, B, C là bằng nhau.H1: Tồn tại 2 loại phân khi bón có số quả cà chua mọc trung bình khác nhau.
Bước 2: Nhập bảng số liệu:
Trang 20Bước 4: Input range: quét vùng số liệu, Grouped By: Rows, Anpha: 0,05, chọn labels in
first Column, Ouput range: chọn địa chỉ ô cần xuất dữ liệu → OK
Bước 5: Kết quả và biện luận.
F = 3,8557 < Fcrit = 4,2565 (hay P-value = 0,0617 > = 0,05) → Chấp nhận giả thiết H0
Trang 21Với mức ý nghĩa 3%, nhận định xem số liệu có mối quan hệ giữa màu tóc và giới tínhhay không?
2 Dạng bài: Kiểm định tính độc lập3 Cơ sở lý thuyết:
4 Giải toán bằng phần mềm EXCELBước 1: Đặt giả thiết:
H0: Màu tóc và giới tính độc lập với nhau.H1: Màu tóc và giới tính phụ thuộc nhau.
Bước 2: Nhập bảng số liệu:
Bước 3: Tính tổng hàng, tổng cột:
Quét bảng số liệu dư 1 hàng 1 cột:
Vào Formulas → chọn Autosum
Kết quả:
Trang 23Gõ CHITEST vào thanh tìm kiếm hàm → Go
Trang 24Actual_Range: quét vùng số liệu đề bài, Expected_Range: quét vùng tần số lý thuyết →OK
Bước 5: Kết quả và biện luận:
p-value = 0,0002 < α=0,03 → Bác bỏ giả thiết H0
Bước 6: Kết luận: - Màu tóc và giới tính có mối quan hệ với nhau.
CÂU 4:1 Đề bài:
Trang 252 Dạng bài: Kiểm định về phân bố3 Cơ sở lý thuyết:
4 Giải toán bằng phần mềm EXCELBước 1: Đặt giả thiết:
H0:Phân bố tỷ lệ về các ý kiến giữa các tầng lớp là như nhau.H1: Tồn tại 2 tầng lớp có phân bố tỷ lệ về các ý kiến là khác nhau.
Bước 2: Nhập bảng số liệu:
Bước 3: Lập bảng tần số lý thuyết:
Tần số lý thuyết được tính theo công thức: TSLT=�ổ�� �ộ� ×�ổ�� ℎà���ổ�� �ộ��
Qt 12 ơ có chứa các giá trị tần số lý thuyết cần tìm:
Trang 26Kết quả:
Bước 4: Tính P – Value:
Vào Formulas → chọn Insert Function
Trang 27Chọn hàm CHITEST → OK
Actual_Range: quét vùng số liệu đề bài, Expected_Range: quét vùng tần số lý thuyết →OK
Bước 5: Kết quả và biện luận
p-value = 0,0612 > α=0,02 → Chấp nhận giả thiết H0
Trang 28CÂU 51 Đề bài:
Với mức ý nghĩa 2%, hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinhtế của các hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu về thu nhập trungbình của mỗi hộ trong vùng với các ngành nghề trên như sau:Nghề chính(1)(2)Nghề phụ(3)(4)Trồng lúa (1)3.57.48.03.5Trồng cây ăn quả (2)5.64.16.19.6Chăn nuôi (3)4.12.51.82.1Dịch vụ (4)7.23.22.21.52 Dạng bài: Phân tích phương sai 2 yếu tố khơng lặp3 Cơ sở lý thuyết:
4 Giải tốn bằng phần mềm EXCELBước 1: Đặt giả thiết:
H1: Thu nhập trung bình của các hộ trong vùng không phụ thuộc vào nghề chính.: Tồn tại 2 nghề chính có thu nhập trung bình của các hộ trong vùng khác nhau.H2: Thu nhập trung bình của các hộ trong vùng không phụ thuộc vào nghề phụ.
: Tồn tại 2 nghề phụ có thu nhập trung bình của các hộ trong vùng khác nhau.
Bước 2: Nhập bảng số liệu
Trang 29Bước 4: Input range: quét vùng số liệu, chọn Labels, Anpha: 0,02, Ouput range: chọn địa
chỉ ô cần xuất dữ liệu → OK
Bước 5: Kết quả và biện luận:
FRows= 1,9966 < Fcrit= 5,5097→ Chấp nhận giả thiết H1
FColumns= 0,1106 < Fcrit= 5,5097→ Chấp nhận giả thiết H2
Bước 6: Kết luận: