BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 1TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HCM KHOA: KHOA HỌC ỨNG DỤNG BỘ MÔN: TOÁN ỨNG DỤNG.. Ví dụ 10: Hiệu suất phần trăm % của một phả
Trang 1BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 1
TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HCM
KHOA: KHOA HỌC ỨNG DỤNG
BỘ MÔN: TOÁN ỨNG DỤNG.
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ.
Nhóm: 2 GVHD: Nguyễn Đình Huy
SVTH: Lê Hải Đăng
MSSV: 1410857
Tp HCM, tháng 7 năm 2016.
Trang 2BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 2
BÀI 1: Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015
(N.Đ.HUY)
Ví dụ 10: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH
(A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
H 0: Các giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) bằng nhau.
Ta tiến hành phân tích phương sai ba yếu tố trên và dựa trên bảng ANOVA để kết luận ảnh hưởng
của các yếu tố đến hiệu suất của phản ứng
Trang 3BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 3
Bảng ANOVA:
Nguồn
sai số Bậc tự do Tổng số bình phương
Bình phương trung bình Giá trị thống kê Yếu tố A
Giải toán trên Excel:
Nhập dữ liệu vào bảng như sau:
Trang 4BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 4
Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến E8
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9
Kết quả và biện luận:
Trang 5BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 5
Ví dụ 12: Người ta dung ba mức nhiệt độ gồm 105, 120 và 135oC kết hợp với ba khoảng thời
gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp Các hiệu suất của phản ứng (%)
được trình bày trong bảng sau đây:
Hãy cho biết yếu tố nhiệt độ hoặc yếu tố thời gian có liên quan tính tuyến với hiệu suất của phản
là bao nhiêu?
Bài làm:
Dạng bài: Hồi quy tuyến tính đa tham số.
Ta giả thiết:
H 0: Phương trình hồi quy không thích hợp.
Ta tìm phương trình hồi quy tính tuyến đa tham số để chỉ ra sự phụ thuộc hoặc không phụ thuộc giữa yếu tố thời gian (X1) và nhiệt độ (X2) với hiệu suất phản ứng tổng hợp (Y)
sai số Bậc tự do Tổng số bình phương Bình phương trung bình Giá trị thống kê
Sai số N - k - 1 SSE MSE = SSE / (N - k -1)
Trang 6BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 6
R ii2 sẽ trở nên âm hay không xác định nếu R 2 hay N nhỏ
Trang 7BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY Sử dụng Data -> Data Analysis ->Regression 7
Các thông số:
- Input Y Range: Phạm vi biến số Y
- Input X Range: Phạm vi biến số X
- Labels: Dữ liệu bao gồm nhãn
- Confidence Level: Mức tin cậy (chọn 95%)
- Output options: Chọn New Worksheet Ply (Xuất kết quả ở sheet Thời gian)
Trang 8BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 8
Trang 9BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 9
t1 = 1.3802 < t0.05 = 2.365 hay PV = 0.2100 > α = 0.05
F = 1.9049 < F0.053 = 5.590 (tra bảng VIII với n1 = 1 và n2 = 7) hay F S4 = 0.2100 > α = 0.05
Vậy phương trình hồi quy trên không có ý nghĩa thống kê Nói 1 cách khác, phương trình hồi
quy này không thích hợp
Kết luận: Yếu tố thời gian không có liên quan tính tuyến với hiệu suất của phản ứng tổng hợp.
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là $B$1:$B$10
Trang 10BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 10
Nên bác bỏ giả thiết H0
Vậy phương trình hồi quy trên có ý nghĩa thống kê Nói 1 cách khác, phương trình hồi quy này
thích hợp
Kết luận: Yếu tố nhiệt độ có liên quan tính tuyến với hiệu suất của phản ứng tổng hợp.
Hồi quy theo Thời gian (X1 ) và Nhiệt độ (X 2 ):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là $A$1:$B$10
Kết quả:
Phương trình hồi quy:
Ŷ X1, X2 = f(X 1 ,X 2 ) = -12.7000 + 0.0445X 1 + 0.1286X 2 với R2 = 0.9777 và S = 0.3297
t0 = 11.5283 > t0.05 = 2.365 hay P V2 = 2.5607E-05 < α = 0.05
Trang 11BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 11
Nên bác bỏ giả thiết H0
t1 = 7.5827 > t0.05 = 2.365 hay PV = 0.0003 < α = 0.05
Nên bác bỏ giả thiết H0
t2 = 14.3278 > t0.05 = 2.365 hay PV = 7.2338E-6 < α = 0.05
Nên bác bỏ giả thiết H0
F = 131.3921 > F0.05 = 5.140 (tra bảng VII với n1 = 2 và n2 = 6) hay FS = 0.0021 < α = 0.05
Nên bác bỏ giả thiết H0
Vậy phương trình hồi quy trên có ý nghĩa thống kê Nói 1 cách khác, phương trình hồi quy này
thích hợp
Kết luận: Hiệu suất phản ứng có liên quan tính tuyến với cả hai yếu tố là thời gian và nhiệt độ.
Vẽ biểu đồ: chọn ô C2, vào Insert -> Scatter -> Scatter with only Maker
Sự tính tuyến của phương trình hồi quy YX1, X2 = -12.7000 + 0.0445X 1 + 0.1286X 2 có thể được trình
bày trên biểu đồ phân tán:
Trang 12BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 12
0 2 4 6 8 10 12
Hàm lượng thực nghiệm (Y)
Mức nhân tố
1234567
0,250,280,320,220,22
0,220,250,240,280,310,210,22
0,250,260,280,250,220,280,31
0,310,330,300,290,25
0,220,280,280,250,30
So sánh mức độ nhiễm chì đối với công nhân ở các phân xưởng của nhà máy nói trên
Mức ý nghĩa = 3%
Cơng thức ơ E3:
=B1+B2*E1+B3*E2
Kết quả: 4.3109
Trang 13BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 13
Bài làm:
Dạng bài: Phân tích phương sai một yếu tố.
Ta giả thiết:
H 0: Các giá trị trung bình mức độ nhiễm chì của các công nhân của năm phân xưởng bằng nhau.
Ta tiến hành phân tích phương sai một yếu tố trên và dựa trên bảng ANOVA để so sánh mức độ
nhiễm chì của các công nhân của nhà máy nói trên
Cơ sở lý thuyết:
Trang 14BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUYKhi phân tích phương sai một nhân tố ta tiến hành dựng mô hình: 14
Giải toán trên Excel:
Nhập dữ liệu vào bảng như sau:
Vào Data/Data Analysis
Chọn Anova: Single Factor
Trong hộp thoại Anova Single Factor điền dữ liệu vào: Chọn vùng dữ liệu, chỉnh lại chỉ
số Alpha: 0,03
Trang 15BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 15
Sau đó bấm OK để cho ra kết quả:
Phân tích kết quả: F = 1.582784 < F0.03 = 3.21831
Kết luận: Vậy mức độ nhiễm chì ở mỗi phân xưởng là như nhau.
Trang 16BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 16
BÀI 3: Bảng sau đây cho ta phân bố thu nhập của 2 nhóm tuổi: Nhóm tuổi từ 40 – 50 và nhóm tuổi từ 50
– 60 trong số các công nhân lành nghề ở Thụy Điển năm 1930
Có sự khác nhau về phân bố thu nhập giữa 2 nhóm tuổi này trong số các công nhân lành nghề hay không ?
Mức ý nghĩa = 5%
Bài làm:
Dạng bài: Phân tích phương sai một yếu tố.
Ta giả thiết:
H 0: Các giá trị trung bình mức độ nhiễm chì của các công nhân của năm phân xưởng bằng nhau.
Ta tiến hành phân tích phương sai một yếu tố trên và dựa trên bảng ANOVA để so sánh mức độ
nhiễm chì của các công nhân của nhà máy nói trên
Cơ sở lý thuyết:
Nhóm tuổi
Thu nhập
0 –1
1 –2
40 –50
50 –60
Trang 17BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUYKhi phân tích phương sai một nhân tố ta tiến hành dựng mơ hình: 17
Giải tốn trên Excel:
Gỉa thiết: Khơng cĩ sự khác nhau về phân bố thu nhập giữa hai nhĩm tuổi này trong số các cơng
nhân lành nghề
Ta nhập bảng:
Vào Data /Data analysis,
chọnAnova: Single Factor sẽ hiện lên hộp thoại bấm OK
Trang 18BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 18
Trang 19BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 19
Trên màng hình sẽ hiện lên hộp thoại của chọnAnova: Single Factor
Ta nhập các thông số như hình dưới:
-Phạm vi của biến số Y(Input Range):ta kéo chuột từ ô B3 tới G4
-Mức ý nghĩa : α=0.05
-Tọa độ đầu ra (Output Range):kích chuột vào A9
Ta được kết quả như sau:
Trang 20BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 20
Kết luận:
Ta thấy F =0.2856< F0.05 =4.964603=> chấp nhận H0
Vậy:sự phân bố thu nhập giữa hai nhĩm tuổi này trong số các cơng nhân lành nghề là
bằng nhau
BÀI 4: Theo dõi số học sinh đến muộn của 5 trường PTTH vào các ngày khác nhau trong
tuần người ta thu được số liệu về số lượng học sinh trung bình đến lớp muộn của các trường đĩ
vào 1 ngày tiêu biểu trong tuần như sau:
Ngày Trong Tuần
Trường THPT
Thứ Hai Thứ Ba Thứ Tư Thứ Năm
5 4 4 4
4 5 3 4
5 3 4 3
7 2 5 2
Bạn cĩ nhận xét gì về số lượng học sinh đến lớp muộn của các trường Cĩ sự khác biệt gì về số lượng học
sinh đến lớp muộn vào các ngày khác nhau trong tuần? Mức ý nghĩa = 1%
Trang 21BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 21
H 02 : Số lượng học sinh đi muộn theo trường là như nhau.
“Các giá trị trung bình bằng nhau”Các giá trị trung bình bằng nhau”
“Các giá trị trung bình bằng nhau”Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
F R=MSB
MSE và F C=MSF
MSE
Trang 22BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 22
Biện luận:
Nếu F R<F a[b−1,(k −1) (b−1 )] => Chấp nhận H0 (yếu tố A)
Nếu F C<F a[b−1, (k−1) (b−1)] => Chấp nhận H0 (yếu tố B)
Giải toán trên Excel:
Áp dụng Anova: “Two-Factor Without Replication”
Vào Data->DataAnalysis Chọn mục Anova: Two-Factor Without Replication Chọn OK.
Trong hộp thoại Anova: Two-Factor Without Replicationlần lượt ấn định các chi tiết:
Trang 23BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 23
Nhấn OK Ta được bảng sau:
Phân tích kết quả: FR = 2.0357 < F0.01 = 6.9919 => Chấp nhận H 01 (Ngày trong tuần).
Vậy số lượng học sinh đến lớp muộn vào các ngày khác nhau trong tuần là như nhau
Phân tích kết quả: FC = 0.1071 < F0.01 = 6.9919 => Chấp nhận H 02 (Trường THPT).
Vậy Số lượng học sinh đến lớp muộn của các trường là như nhau
Trang 24BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 24
Kết luận: Số lượng học sinh đến muộn của các trường là như nhau.
BÀI5: Trong một thí nghiệm khoa học, người ta nghiên cứu dộ dày của lớp mạ kền khi dùng ba loại bể
mạ khác nhau Sau một thời gian mạ, người ta đo độ dày của lớp mạ nhận được ở các bể:
Độ dày lớp mạ kền tính bằng µm
Với mức ý nghĩa α = 0.05, hãy kiểm định giả thiết: độ dày lớp mạ sau khoảng thời gian nói trên không
phụ thuộc loại bể mạ được dùng
Bài làm:
Dạng bài: Kiểm Định Tính Độc Lập
Ta giả thiết:
H 0 : Độ dày lớp mạ không phụ thuộc vào bể mạ được dùng.
Ta tiến hành tính toán các tỉ số và so sánh để có thể kết luận được rằng độ dày lớp mạ không phụ
thuộc vào bể mạ được dùng
Giải toán trên Excel:
Nhập dữ liệu và tính tổng ni và mj vào bảng như sau:
Trang 25BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 25
Trang 26BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – GVHD: NGUYỄN ĐÌNH HUY 26
Phân tích kết quả: P(X > ²) = 8.67E-06 < = 0.05
Kết luận: Vậy độ dày lớp mạ phụ thuộc vào bể mạ được dùng