Báo cáo BTL Xác suất và thống kê ĐHBK TPHCM

16 259 0
Báo cáo BTL Xác suất và thống kê ĐHBK TPHCM

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Báo cáo bài tập lớn môn xác suất và thống kê của Lê Đình Hiệp, giảng viên thầy Nguyễn Bá Thi trường Đại học Bách Khoa Thành phố Hồ Chí Minh. Bài tập bao gồm các dạng thống kê thường gặp, cách sử dụn.g Excel để tính toán và kết luận từ các kết quả tính được. Chúc các bạn học tốt

ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM BÁO CÁO BÀI TẬP LỚN XÁC SUẤT & THỐNG GV: Nguyễn Bá Thi Họ tên SV: Lê Đình Hiệp Nhóm lớp DT07-A Bài 1: Một nghiên cứu tiến hành thành phố công nghiệp X để xác định tỷ lệ người làm xe máy, xe đạp xe buýt Việc điều tra tiến hành nhóm, kết sau: Nữ Xe máy Xe buýt Xe đạp 25 100 125 Nam 75 120 205 Với mức ý nghĩa α = 5%, nhận định xem có khác tỷ lệ sử dụng phương tiện giao thông làm hai nhóm cơng nhân nam cơng nhân nữ hay không Bài giải - - Dạng bài: Kiểm định giả thiết tỷ lệ Phương pháp giải:  Giả thuyết H0 : tỷ lệ công nhân nữ công nhân nam việc sử dụng phương tiện giao thông làm  Công cụ giải: Sử dụng hàm SUM, hàm CHITEST Excel Các bước thực Excel:  Nhập số liệu vào bảng  Tính tổng số:  Tổng hàng: Chọn ô E3 nhập biểu thức =SUM(B3:D3) Dùng trỏ kéo nút tự điền từ ô E3 tới ô E5  Tổng cột: Chọn ô B5 nhập biểu thức =SUM(B3:B4) Dùng trỏ kéo nút tự điền từ B5 tới D5  Tính tần số lý thuyết:  Tần số lý thuyết = (tổng hàng x tổng cột)/tổng cộng  Nhập vào B8 biểu thức =B$5*$E3/$E$5, sau kéo nút tự điền đến D9, ta có bảng:  Áp dụng hàm số “CHITEST”:  Cú pháp hàm CHITEST: CHITEST (actual_range, expected_range)  Nhập vào ô C11 biểu thức = CHITEST(B3:D4, B9:D10) - Biện luận : P = 0.00219 < α = 0.05 nên bác bỏ giả thiết H0 Kết luận : tỷ lệ công nhân nữ công nhân nam việc sử dụng phương tiện giao thông làm khác Bài 2: Để nghiên cứu chiều cao nam niên hai nước A B, người ta lấy ngẫu nhiên nước 28 nam niên tiến hành đo chiều cao (tính cm) kết là: Nước A: Chiều cao 163-167 167-171 171-175 175-179 179-183 183-187 Số người Chiều cao 163-167 167-171 171-175 175-179 179-183 183-187 Số người Nước B: a) Với độ tin cậy 95%, ước lượng chiều cao trung bình nam niên nước b) Có ý kiến cho chiều cao nam niên hai quốc gia khác Với mức ý nghĩa 0,05 nhận xét ý kiến Giả sử chiều cao nam niên nước có quy luật phân phối chuẩn Bài giải - Dạng bài: Thống mô tả phân tích phương sai yếu tố Phương pháp giải:  Câu a): Dùng “Descriptive Statistics” Excel để tính toán giá trị thống giới hạn tin cậy 95%, độ lệch chuẩn (S) hệ số phân tán (CV)  Câu b): Dùng “Single Factor”: Mục đích phân tích phương sai yếu tố đánh giá ảnh hưởng yếu tố (nhân tạo hay tự nhiên) giá trị quan sát * Giả thiết: H0: µ1= µ2=…µk ”Các giá trị trung bình nhau” H1: µ1≠ µ2 ”Có hai giá trị trung bình khác nhau” * Giá trị thống kê: F = * Biện luận : Nếu F < Fα (k -1; N-k) => Chấp nhận giả thiết H0 - Các bước thực Excel:  Nhập liệu vào bảng tính  Nhấp Data Analysis, hộp thoại chọn chương trình Descriptive Statistics  Trong hộp thư thoại Data Analysis:  Nhập Input Range: $A$29:$G$31  Chọn Grouped By: Rows  Output Range: $A$33  Đánh dấu Summary statistics Confidence Level for Mean ghi 95%  Ta bảng:  Kết câu a): Vậy ta ước lượng giá trị trung bình chiều cao niên 175 ± 7,853  Sau sang câu b), dùng “Single Factor”:  Trong hộp thoại Single Factor:  Input Range: Nhập $A$15:$G$16  Grouped By: Rows  Đánh dấu Labels in first column  Output Range: Nhập $A$19  Ta bảng:  Biện luận: Ta thấy F =1,21.10-15 < F crit = 4,9646 => Chấp nhận giả thuyết H0 mức ý nghĩa 5%  Kết luận: Vậy chiều cao nam niên hai quốc gia Bài 3: Tính tỷ số tương quan Y X, hệ số tương quan hệ số xác định tập số liệu sau Với mức ý nghĩa α = 5%, có kết luận mối tương quan Y X (Có phi tuyến khơng? Có tuyến tính khơng?) Tìm đường hồi quy Y X X Y - - 15 13 25 22 10 15 17 20 21 10 10 20 25 25 18 30 14 30 10 Dạng bài: Phân tích tương quan hồi quy Phương pháp giải:  Áp dụng “Correlation” Excel để tìm hệ số tương quan  Kiểm định giả thiết H0: “X Y khơng có tương quan tuyến tính” qua T  Sử dụng “Regression” Excel để kiểm định giả thiết H0: X Y hồi quy tuyến tính Các bước trình bày Excel:  Nhập liệu vào bảng tính  Áp dụng “Correlation”: Nhấp đơn lệnh Tools lệnh Data Analysis, sau chọn phương trình Correlation hộp thoại Data Analysis nhấp nút OK  Trong hộp thoại Correlation, ấn định chi tiết:  Phạm vi đầu vào (Input Range) nhập vùng $A$54:$B$64  Grouped By: Chọn Columns (sắp xếp theo cột)  Đánh dấu Labels in first row  Phạm vi đầu (Output Range): Nhập $D$55 10  Ta bảng hình  Thu hệ số tương quan r = 0.319844 hệ số xác định r2 = 0.1023  Giả thiết H0: X Y tương quan tuyến tính  Tính T = = 0.954811  Với c = 2,306 (Dùng hàm =TINV(0,05,10-2), bậc tự n=10-2)  |T| < c nên ta chấp nhận H0, X Y khơng có tương quan tuyến tính  Tiếp theo ta kiểm định giả thiết H0: Hệ số khơng thích hợp  Vào Data Analysis chọn Regression : 11  Trong hộp thoại Regression ấn định:  Phạm vi đầu vào Input Y Range quét ($B$54: $B$64), Input X Range quét vùng ($A$54: $A$64)  Đánh dấu Label  Phạm vi đầu (Output Range), chọn ô $H$55  Đánh dấu Line fit Plots Residuals để vẽ đường hồi quy 12  Ta bảng: Biện luận:  Hệ số góc = 0,26  Hệ số tự = 10,4  Giá trị P hệ số tự (P-value) = 0,109484317> α = 0,05 => Chấp nhận giả thiết H0 =>Hệ số tự khơng có ý nghĩa thống  Giá trị P hệ số góc (P-value) = 0,36763004> α = 0,05 => Chấp nhận giả thiết H0 =>Hệ số góc khơng có ý nghĩa thống  Giá trị F (Significance F) = 0,36763> α = 0,05 => Chấp nhận giả thiết H0 =>Phương trình đường hồi quy khơng thích hợp Kết luận:     Hệ số tương quan r = 0,319844 Hệ số xác định r² = 0,1023 X Y khơng có tương quan tuyến tính với mức ý nghĩa 5% Khơng có phương trình hồi quy thích hợp 13 Bài 4: Trên sở tập số liệu sau phân tích xem tỷ lệ đỗ loại giỏi có phụ thuộc vào trường phổ thông ban hay không với mức ý nghĩa α = 0,05 Ở z tỷ lệ đỗ loại giỏi (%); f trường phổ thông số 1, 2, 3, 4; g ban (1 = Ban A, = Ban B) Stt z 38 38 42 42 41 42 44 45 f 1 1 2 2 g 1 2 2 Stt 10 11 12 13 14 15 16 z 35 32 33 34 31 33 33 35 f 3 3 4 4 g 1 1 2 - Dạng bài: Bài tốn phân tích phương sai hai yếu tố có lặp S phân tích nhằm đánh giá s ảnh hưởng hai yếu tố giá trị quan sát Yij(i=1, 2…r: yếu tố A; j= ,2…c: yếu tố B) * Giả thiết: H0: µ1= µ2 =… µk ”Các giá trị trung bình nhau” H1: µ1≠ µ1 ”ít hai giá trị trung bình khác nhau” * Giá trị thống kê: FR = FC = * Biện luận: Nếu FR < Fα[b-1,(k-1)(b-1)] => chấp nhận H0 (yếu tố A) Nếu FC < Fα[b-1,(k-1)(b-1)] => chấp nhận H0 (yếu tố B) Ta giả thiết H01: yếu tố Ban không ảnh hưởng đến tỷ lệ đỗ loại giỏi trường Ta giả thiết H02: yếu tố trường phổ thông không ảnh hưởng đến tỷ lệ đỗ loại giỏi trường - Phương pháp giải: Tính FR FC cách sử dụng “Anova: Two-Factor With Repli cation” 14 - Các bước thực hiện:  Nhập liệu vào bảng tính  Áp dụng “Anova: Two-Factor With Repli cation” Sau nhập vào yếu tố cần thiết hộp thoại Input Range, Rows per sample (Số hàng mẫu), Alpha, Output Range tương tự 15  Sau ta kết Biện  luận:  FR = 11,571429 > F0.05 = 5,317655 => Bác bỏ giả thiết H01  FC = 55,380952 > F0.05 =4,066181=> Bác bỏ giả thiết H02  Kết luận: Như yếu tố Ban trường phổ thông ảnh hưởng đến tỷ lệ đỗ loại giỏi trường 1, 2, 3, 16 ...Bài 1: Một nghiên cứu tiến hành thành phố công nghiệp X để xác định tỷ lệ người làm xe máy, xe đạp xe buýt Việc điều tra tiến hành nhóm, kết sau:

Ngày đăng: 12/12/2018, 22:12

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan