báo cáo bài tập lớn xstk thầy nguyễn bá thi học kì 183 trường ĐH bách khoa tp HCM học kì 183 ........................................................................................................................................................................................................................................................................................................................................................
ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA ………………∞∞∞∞∞…………… BÁO CÁO BÀI TẬP LỚN MÔN: XÁC SUẤT THỐNG KÊ Giáo viên hướng dẫn: Nguyễn Bá Thi Tên sinh viên: MSSV: Lớp: DT-05-C Nhóm: 10 ĐỀ TÀI NHĨM 10: Bài 1: Một nơng trường ni ba giống bò sữa A, B, C Lượng sữa bò thống kê bảng sau đây: Ngày Loại bòtuần Ít A Thứ hai 92 B Thứ tư 53 CThứ sáu 75 Trường PTTH Lượng sữa TrungA bình 375 154 194 Nhiều B 46 19 12 4 Thứ bảy C D Với mức ý nghĩa α = 0.05 , nhận định xem có phải ba giống bò có phân bố tỉ lệ phương diện sản lượng sữa hay không? Bài 2: Điều tra ý kiến nhà kinh tế làm việc quan phủ mức lạm phát năm tới thu giá trị 4.2% , 5.1% , 3.9% , 4.7% , 4.9% 5.8% Trong hỏi ý kiến nhà kình tế làm việc cơng ty vấn đề thu kết 5.7%, 6.1%, 5.2%, 4.9%, 4.6%, 5.5% Với độ tin cậy 95% ước lượng mức lạm phát nhà kinh tế làm việc hai khu vực kinh tế nói dự báo Với mức ý nghĩa 5% cho ý kiến khác biệt dự đoán Giả thiết mức lạm phát biến ngẫu nhiên phân phối chuẩn Bài Tính tỷ số tương quan Y X, hệ số tương quan X Y, hệ số tương quan hệ số xác định tập số liệu sau Với mức ý nghĩa α = 5%, có kết luận mối tương quan X Y( Có phi tuyến khơng ? Có tính tuyến khơng?) Tìm đường hồi quy tuyến tính Y X X 50 130 210 240 90 210 Y 75 235 255 195 115 295 X 90 90 270 130 50 270 Y 135 175 115 255 15 75 X 50 240 170 270 210 50 Y 35 235 295 135 315 55 X 170 210 270 170 170 90 Y 355 275 95 335 315 155 Bài 4: Theo dõi số học sinh đến lớp muộn trường PTTH người ta thu số liệu số lượng học sinh trung bình đến lớp muộn trường sau: Bạn có nhận xét số lượng học sinh đến lớp muộn trường Chọn α = 10% BÁO CÁO Bài 1: Một nơng trường ni ba giống bò sữa A, B, C Lượng sữa bò thống kê bảng sau đây: Loại bò A B C Ít 92 53 75 Lượng sữa Trung bình 37 15 19 Nhiều 46 19 12 Với mức ý nghĩa α = 0.05 , nhận định xem có phải ba giống bò có phân bố tỉ lệ phương diện sản lượng sữa hay không? BÀI LÀM Dạng bài: Kiểm định giả thuyết tỷ lệ Phương pháp giải: Áp dụng kiểm định bình phương �2 + Giả thiết: H0 : P1=P1.0; P2=P2.0; … ;Pk=Pk.0 ↔ Các cặp Pi Pi.0 giống Hi : có cặp Pi Pi.0 khác + Giá trị thống kê: k � (O E ) � �� i i � Ei i 1 � � Oi: tần số thực nghiệm Ej: tần số lý thuyết Biện luận: �2 > �� => bác bỏ giả thiết H0( DF=k-1) Theo hàm Chitest tính giá trị �2 theo biểu thức: r c (Oij Eij ) �� Eij �ij - tần số thực nghiệm ô thuộc hàng i cột j �ij - tần số lý thuyết ô thuộc hàng I với cột j; r – số hàng; c – số cột i 1 j 1 Xác suất P ( X > �2) với bậc tự DF= ( r-1)(c-1) Trong đó: r - số hàng c - số cột bảng ngẫu nhiên ( contingency table) Nếu P ( X > �2) > α => chấp nhận giả thiết H0 ngược lại Công cụ giải: Áp dụng MS-EXCEL : Sử dụng hàm tính tổng SUM CHITEST Bảng số liệu nhập vào; xuất ra; cơng thức tính, kết tính sẵn, tra sẵn Giả thuyết H0 : Tỷ lệ sữa ba giống bò có phân bố tỉ lệ THỰC HIỆN BÀI TOÁN BẰNG EXCEL Nhập giá trị vào bảng tính: Tính tổng số: Theo hàng: Chọn E3, nhập =SUM(B3:D3), sau dùng trỏ chuột kéo nút tự điền từ E4 đến E5 Theo cột: Chọn B6, nhập =SUM(B3:B5), sau dùng trỏ chuột kéo nút tự điền từ C6 đến E6 Tính tần số lý thuyết: Tần số lý thuyết = (Tổng hàng * Tổng cột/ Tổng cộng) Chọn B11 nhập =$E3*B$6/$E$6 , , sau dùng trỏ chuột kéo nút tự điền từ B11 đến D3 ta tính tần số lý thuyết lại Tính xác suất P ( X > �2) áp dụng hàm số “ CHITEST” Excel: Chọn ô B15 nhập =CHITEST(B3:D5,B11:D13) Kết P ( X > �2)=0.022515147 < α=0.05 => Bác bỏ giả thiết H0 Kết luận: Ba giống bò có tỉ lệ khác phương diện sữa Bài 2: Điều tra ý kiến nhà kinh tế làm việc quan phủ mức lạm phát năm tới thu giá trị 4.2% , 5.1% , 3.9% , 4.7% , 4.9% 5.8% Trong hỏi ý kiến nhà kình tế làm việc công ty vấn đề thu kết 5.7%, 6.1%, 5.2%, 4.9%, 4.6%, 5.5% Với độ tin cậy 95% ước lượng mức lạm phát nhà kinh tế làm việc hai khu vực kinh tế nói dự báo Với mức ý nghĩa 5% cho ý kiến khác biệt dự đoán Giả thiết mức lạm phát biến ngẫu nhiên phân phối chuẩn BÀI LÀM Dạng bài: Kiểm định giá trị trung bình với phương sai ước lượng hai trung bình tổng thể Phương pháp giải: Ước lượng giá trị trung bình: Ta tính khoảng ước lượng trung bình theo cơng thức sau: S x �t x n t Sx n độ xác Với x giá trị trung bình, So sánh giá trị trung bình với phương sai Giả thiết: Trường hợp hai mẫu có liệu tương ứng cặp: H0: Mức lạm phát nhà kinh tế làm việc hai khu vực kinh tế dự báo giống H1: Mức lạm phát nhà kinh tế làm việc hai khu vực kinh tế dự báo khác Giá trị thống kê: ( X X ) ( 1 2 ) ( X1 X ) t 1 1 S2p( ) S2p ( ) N1 N N1 N N1 N bậc tự Có phân phối Student với ( N 1).S12 ( N 1).S2 S p2 N1 N t ( N1 N 2) t t Biện luận: Nếu hay => Chấp nhận giả thiết H0 THỰC HIỆN THUẬT TOÁN BẰNG EXCEL Nhập liệu vào EXCEL Phần Ước lượng mức lạm phát nhà kinh tế làm việc hai khu vực kinh tế nói dự báo a Tính ước lượng trung bình mức lạm phát nhà kinh tế làm việc phủ dự đoán Mở hộp thoại Data Analysis chọn Descriptive Statistics Nhập vào hộp thoại vừa mở sau: + Input Range: phạm vi liệu nhập vào ( ô A1 -> G1) + Grouped By: nhóm liệu theo hang cột Chọn hàng + Labels in first now: phạm vi cột ( chọn) + Output Range: phạm vi liệu xuất ( H15) + Tích dấu chọn vào Summary statistics + Confidence Level for Mean: Nhập 95% Từ cách làm ta thu kết sau Kết luận: ước lượng trung bình mức lạm phát nhà kinh tế làm việc phủ dự đốn 0.047666667 ± 0.007076237 b Tính ước lượng trung bình mức lạm phát nhà kinh tế làm việc tư nhân dự đốn Áp dụng cách tính tương tự cách tính ước lượng trung bình mức giới hạn lạm phát nhà kinh tế làm việc phủ dự đốn trên, ta tính kết sau: Kết luận: ước lượng trung bình mức làm phát nhà kinh tế làm việc tư nhân dự đoán là: 0.053333333 ± 0.005735208 Tổng kết: + Ước lượng trung bình mức lạm phát nhà kinh tế làm việc phủ dự đốn 0.047666667 ± 0.007076237 + Ước lượng trung bình mức làm phát nhà kinh tế làm việc tư nhân dự đoán là: 0.053333333 ± 0.005735208 Phần So sánh khác biệt dự đoán mức lạm phát hai lĩnh vực dự đoán Mở hộp thoại Data Analysis, sau chọn t-Test: Two-Sample Assuming Equal Variances Nhập vào hộp thoại t-Test: Two-Sample Assuming Equal Variances + Variable Range: Nhập “ $A$1:$G$1” ( ô A1 -> G1) + Variable Range: Nhập “ $ A$2:$G$2” ( ô A2 -> G2) + Labels: Chọn + Alpha: Nhập 0,05 + Output Range: Phạm vi liệu xuất ( ô H1) Ta thu kết Kết luận: Vì t Start = -1,599225476 < = 2,228138852 nên chấp nhận giả thuyết Ho Mức lạm phát nhà kinh tế làm việc hai khu vực kinh tế dự báo giống t Bài Tính tỷ số tương quan Y X, hệ số tương quan X Y, hệ số tương quan hệ số xác định tập số liệu sau Với mức ý nghĩa α = 5%, có kết luận mối tương quan X Y( Có phi tuyến khơng ? Có tính tuyến khơng?) Tìm đường hồi quy tuyến tính Y X X 50 130 210 240 90 210 Y 75 235 255 195 115 295 X 90 90 270 130 50 270 Y 135 175 115 255 15 75 X 50 240 170 270 210 50 Y 35 235 295 135 315 55 X 170 210 270 170 170 90 Y 355 275 95 335 315 155 BÀI LÀM Dạng bài: Bài toán kiểm định tương quan hồi quy Phương pháp giải: Xét tương quan tuyến tính + Bước 1: Xét giả thuyết H0: X Y khơng có tương quan tuyến tính + Bước 2: Tìm hệ số tương quan r + Bước 3: Xác định T theo công thức: r n2 T 1 r2 + Bước 4: Tìm c với phân phối Student mức α = 0.05 với bậc tự n-2 T + Bước 5: Nếu > c bác bỏ H0 ngược lại Xét tương quan phi tuyến tính + Bước 1: Xét giả thiết H1: X Y khơng có tương quan phi tuyến tính + Bước 2: Xét cơng thức: ( 2Y / X r )(n k ) F (1 2Y / X )(k 2) + Bước 3: Phân phối Fisher mức α = 0.05 với bậc tự ( k-2, n-k) + Bước 4: Xét Fc nên khơng chấp nhận giả thuyết H0 Kết luận Vậy X Y có tương quan phi tuyến F III Tìm đường hồi quy X Y + Giả thuyết H0: X Y khơng có tương quan phi tuyến + Nhập số liệu vào excel + Mở hộp thoại Data Analysis , chọn Regression + Nhập vào hộp thoại Regression số liệu hình sau: Ta thu kết quả: Kết luận: Đường hồi quy Y đới với X là: Y = 115.3657817 + 0.454159292X Bài 4: Theo dõi số học sinh đến lớp muộn trường PTTH người ta thu số liệu số lượng học sinh trung bình đến lớp muộn trường sau: Ngày tuần Thứ hai Thứ tư Thứ sáu Thứ bảy Trường PTTH A 4 B C D Bạn có nhận xét số lượng học sinh đến lớp muộn trường Chọn α = 10% BÀI LÀM Dạng bài: Phân tích phương sai yếu tố không lặp Phương pháp giải: Giả sử nhân tố A có n mức a1 , a2 , … , an (nhân tố hàng) ; B có m mức b1 , b2 , … , bm (nhân tố cột) Mẫu điều tra bảng: Giả thiết H0: � “Các giá trị trung bình nhau” � “Ít có hai giá trị trung bình khác nhau” Tiến hành tính toán theo bảng đây: Bảng ANOVA: Giá trị thống kê: Kết luận: Công cụ giải: Sử dụng hộp thoại Anova: Two-Factor Without Replication THỰC HIỆN BÀI TOÁN BẰNG EXCEL Giả sử giả thuyết: + H01 : Số lượng học sinh muộn theo ngày + H02 : Số lượng học sinh muộn theo trường Nhập bảng số liệu vào EXCEL, ta bảng số liệu sau: Sau chọn Data ~> Data Analysis ~> Two-Factor Without Replication Sau nhập sau: Từ ta kết sau: Biện luận: +Frow ( theo ngày) = 2.035714 < F0.1 = 2.812863 nên chấp nhận giả thuyết H01 +Fcol ( theo trường) = 0.107143 < F0.1 = 2.812863 nên chấp nhận giả thuyết H02 Kết luận: Số lượng học sinh muộn theo ngày số lượng học sinh muộn theo trường ... Giả thi t: Trường hợp hai mẫu có liệu tương ứng cặp: H0: Mức lạm phát nhà kinh tế làm việc hai khu vực kinh tế dự báo giống H1: Mức lạm phát nhà kinh tế làm việc hai khu vực kinh tế dự báo khác... bình đến lớp muộn trường sau: Bạn có nhận xét số lượng học sinh đến lớp muộn trường Chọn α = 10% BÁO CÁO Bài 1: Một nông trường nuôi ba giống bò sữa A, B, C Lượng sữa bò thống kê bảng sau đây: Loại... lượng mức lạm phát nhà kinh tế làm việc hai khu vực kinh tế nói dự báo Với mức ý nghĩa 5% cho ý kiến khác biệt dự đoán Giả thi t mức lạm phát biến ngẫu nhiên phân phối chuẩn BÀI LÀM Dạng bài: