BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

20 262 2
BÁO CÁO BÀI TẬP  LỚN  XÁC SUẤT THỐNG KÊ

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài giải: - Dạng bài : bài toán kiểm định giả thuyết tỉ lệ. - Giả thuyết H0 : tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô là như nhau. - Quy trình thực hiện bằng EXCEL + Nhập dữ liệu vào bảng tính : + Tính các tổng số trên bảng Theo hàng : nhập vào J23 biểu thức “=SUM(G22:I23)”, sau đó kéo nút tự điền đến J25. Theo cột : nhập vào G25 biểu thức “=SUM(G23:G24)”, sau đó kéo nút tự điền đến I25. Ta được bảng : + Tính các tần số lí thuyết : Nhập vào G30 biểu thức =G$25*$J23/$J$25, sau đó kéo nút tự điền đến I31 Bài giải: - Dạng bài : bài toán kiểm định giả thuyết tỉ lệ. - Giả thuyết H0 : tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô là như nhau. - Quy trình thực hiện bằng EXCEL + Nhập dữ liệu vào bảng tính : + Tính các tổng số trên bảng Theo hàng : nhập vào J23 biểu thức “=SUM(G22:I23)”, sau đó kéo nút tự điền đến J25. Theo cột : nhập vào G25 biểu thức “=SUM(G23:G24)”, sau đó kéo nút tự điền đến I25. Ta được bảng : + Tính các tần số lí thuyết : Nhập vào G30 biểu thức =G$25*$J23/$J$25, sau đó kéo nút tự điền đến I31 Bài giải: - Dạng bài : bài toán kiểm định giả thuyết tỉ lệ. - Giả thuyết H0 : tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô là như nhau. - Quy trình thực hiện bằng EXCEL + Nhập dữ liệu vào bảng tính : + Tính các tổng số trên bảng Theo hàng : nhập vào J23 biểu thức “=SUM(G22:I23)”, sau đó kéo nút tự điền đến J25. Theo cột : nhập vào G25 biểu thức “=SUM(G23:G24)”, sau đó kéo nút tự điền đến I25. Ta được bảng : + Tính các tần số lí thuyết : Nhập vào G30 biểu thức =G$25*$J23/$J$25, sau đó kéo nút tự điền đến I31

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA ………… o O o………… BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Giáo viên hướng dẫn : Nguyễn Bá Thi Sinh viên : Lê Anh Duy MSSV : 1410560 Nhóm - Lớp DT04 Một hãng sản xuất ôtô tiến hành nghiên cứu nhằm xác định xem có khác tỷ lệ đàn ông đàn bà việc chọn mua loại ôtô hãng hay không Kết thu sau: Loại ôtô Phụ nữ Nam giới A 70 40 B 80 60 C 150 100 Với mức ý nghĩa = 5%, ta cần phải đưa kết luận gì? Bài giải: - Dạng : tốn kiểm định giả thuyết tỉ lệ Giả thuyết H0 : tỷ lệ đàn ông đàn bà việc chọn mua loại ơtơ Quy trình thực EXCEL + Nhập liệu vào bảng tính : + Tính tổng số bảng Theo hàng : nhập vào J23 biểu thức “=SUM(G22:I23)”, sau kéo nút tự điền đến J25 Theo cột : nhập vào G25 biểu thức “=SUM(G23:G24)”, sau kéo nút tự điền đến I25 Ta bảng : + Tính tần số lí thuyết : Nhập vào G30 biểu thức =G$25*$J23/$J$25, sau kéo nút tự điền đến I31 Ta có bảng: + Áp dụng hàm Chitest để tìm kết : Cú pháp hàm chitest : CHITEST (actual_range, expected_range) Điền vào ô H33 biểu thức =CHITEST(G23:I24,G30:I31) Ta kết P(X α = 0.05 nên chấp nhận giả thuyết H0 Kết luận : Tỷ lệ đàn ông đàn bà việc chọn mua loại ôtô Bài 2: Để xác định hiệu loại thức ăn phụ tăng trọng bò, người ta lấy ngẫu nhiên bò trọng lượng chia thành hai nhóm, nhóm con, nhóm ăn bình thường, nhóm cho ăn thêm thức ăn phụ Sau tháng thu kết sau: Nhóm ăn thêm thức ăn phụ Nhóm thức ăn bình thường (A) (B) 330 290 360 320 400 340 350 370 Với mức ý nghĩa 5% cho kết luận tác dụng loại thức ăn phụ đó, biết trọng lượng bò biến ngẫu nhiên phân phối chuẩn Với độ tin cậy 95% ước lượng trọng lượng trung bình bò với loại thức ăn Bài làm: - Dạng bài: Kiểm định giá trị trung bình với phương sai & Ước lượng hai trung bình tổng thể - Quy trình thực EXCEL: Phần 1: Tìm kết luận tác dụng loại thức ăn phụ ◦ Giả thuyết H0: Trọng lượng trung bình bò nhóm ăn thêm thức ăn phụ (A) nhóm thức ăn bình thường (B) ◦ Nhập liệu vào bảng tính Assuming Mở hộp thoại chọn t-Test Two-Sample 4) Nhập vào hộp thoại t-Test Two-Sample Assuming Equal Variances  Variable Range: Nhập “$A$13:$E$13” (ô A13 → E13)  Variable Range: Nhập “$A$14:$E$14” (ô A14 → E14)  Labels: Chọn   Alpha: Nhập 0,05 Output Range: phạm vi liệu xuất (ô I13) 5) Ta bảng kết 5) Kết luận: Vì t Stat = 1,341640786 < tα/2 = 2,446911851 nên chấp nhận giả thuyết H0 Vậy thức ăn phụ khơng có tác dụng số cân nặng bò Phần 2: Ước lượng trọng lượng trung bình bò với loại thức ăn Mở hộp thoại Data Analysis chọn Descriptive Statistics 3) Nhập vào hộp thoại Desciptive Statistics  Input Range: phạm vi liệu nhập vào (ô A13 → E13)  Grouped By: nhóm liệu theo hàng cột (chọn hàng) 4)   Labels in first row: nhãn cột (chọn)  Tích dấu chọn vào Summary statistics  Confidence Level for Mean: Nhập 95 (%) Output Range: phạm vi liệu xuất (ô I29) Ta bảng kết   Kết luận: Trọng lượng trung bình bò nhóm ăn thêm thức ăn phụ (A) là: 360 ± 46,84434123 5) Mở hộp thoại chọn Descriptive Statistics 6) Nhập vào hộp thoại Desciptive Statistics  Input Range: phạm vi liệu nhập vào (ô A14 → E14)  Grouped By: nhóm liệu theo hàng cột (chọn hàng)   Labels in first row: nhãn cột (chọn)  Tích dấu chọn vào Summary statistics  Confidence Level for Mean: Nhập 95 (%) Output Range: phạm vi liệu xuất (ô I47)  7) Ta bảng kết   Tổng kết: Thức ăn phụ khơng có tác dụng số cân nặng bò  Trọng lượng trung bình bò nhóm ăn thêm thức ăn phụ (A) là: 360 ± 46,84434123  Trọng lượng trung bình bò nhóm thức ăn bình thường (B) là: 330 ± 53,56855363 ·  Kết luận: Trọng lượng trung bình bò nhóm thức ăn bình thường (B) là: 330 ± 53,56855363 3 Tính tỷ số tương quan Y X ,hệ số tương quan hệ số xác định tập số liệu sau Với mức ý nghĩa α = 5%, có kết luận mối tương quan X Y (Có phi tuyến khơng ? Có tuyến tính khơng ?).Tìm đường hồi quy Y X X Y 210 90 240 50 240 270 130 270 90 240 130 170 50 170 210 255 115 255 35 275 315 135 355 135 295 175 235 75 195 235 Bài giải  Dạng : toán kiểm định tương quan hồi quy  Quy trình thực EXCEL 1)Phân tích tương quan tuyến tính • Giả thuyết H0 : X Y khơng có tương quan tuyến tính • Nhập liệu vào máy tính Mở hộp thoại thẻ Data, chọn Corelation • Nhập vào hộp thoại Correlation • Input Range: phạm vi đầu vào (ơ B7 → Q8) • Grouped By: nhóm liệu theo hàng cột (chọn hàng) • Labels in first row: nhãn cột (chọn) • Output Range: phạm vi liệu xuất (ô B12) • Ta nhận bảng kết Biện luận : n = 15 Từ bảng, ta có hệ số tương quan r = 0.974356 Hệ số xác định = 0,9493696147 Giá trị T = 15,61290524 xác định theo công thức T= Phân phối Student mức α = 0,05 với bậc tự n-2 = 13, dung hàm TINV excel để tính ta c = 2,16036865646279 Vì |T|>c nên bác bỏ H0 Kết luận : X Y tương quan tuyến tính 2) Phân tích tương quang phi tuyến : • Giả thiết H1: X Y khơng có tương quan phi tuyến o Nhập liệu vào bảng tính sau xếp lại o o      Mở hộp thoại chọn Anova Single Factor Nhập vào hộp thoại Anova Single Factor Input Range: phạm vi đầu vào (ô F20 → L23) Grouped By: nhóm liệu theo hàng cột (chọn cột) Labels in first column: nhãn cột (chọn) Alpha: giá trị α =0,05 Output Range: phạm vi liệu xuất E26 Ta nhận bảng kết :        n = 15 , k = Tổng bình phương nhóm SSF = 114693.33 Tổng bình phương nhân tố SST = 119093.33 η2Y/X = SSF/SST = 0.963054187  Tỷ số tương quan : ηY/X 0.981353243 Giá trị F = 0.592653396 Phân bố Fisher mức α = 0,05 với bậc tự (k-2, n-k) = (5,8) Dùng hàm FINV tính C = 3.68749867 Vì F < c nên chấp nhận giả thuyết H1 Kết luận: Vậy X Y tương quan phi tuyến 3) Phân tích hồi quy (sử dụng Regression) Giả thiết H: Hệ số khơng thích hợp Nhập bảng: Mở Data Analysis chọn Regression Hộp thoại Regression xuất Input Y Range: $C$55:$C$70 Input X Range: $B$55:$B$70 Labels: nhãn (chọn) Line Fit Plots: vẽ đồ thị (chọn) Output Range: $E$55 Ta bảng kết quả: Biện luận: Hệ số góc = 1.169300226 Hệ số tự = 6.10609480812639 Giá trị P hệ số tự (P-value) = 0.668535974062108> α = 0,05 => chấp nhận giả thiết H ->Hệ số tự khơng có ý nghĩa thống kê Giá trị P hệ số góc (P-value) = 8.41537970890307E-10< α = 0,05 => bác bỏ giả thiết H ->Hệ số góc có ý nghĩa thống kê Giá trị F (Significance F) = 8.41537970890307E-10< α = 0,05 => Bác bỏ giả thiết H ->Phương trình đường hồi quy thích hợp Kết luận: Tỷ số tương quan ηY/X =0.9813532 Hệ số tương quan r = 0.9743558 Hệ số xác định r² = 0.9493691 X Y có tương quan tuyến tính với mức ý nghĩa 5% X Y có tương quan phi tuyến với mức ý nghĩa 5% Phương trình đường hồi quy Y X: Y = 01.169300226X + Hãy phân tích vai trò ngành nghề (chính, phụ) hoạt động kinh tế hộ gia đình vùng nơng thơn sở bảng số liệu thu nhập số hộ tương ứng với ngành nghề nói sau(mức ý nghĩa %): Nghề Nghề phụ (1) (2) (3) (4) Trồng lúa (1) 3.5:3.4:4.0 7.4:7.6:7.1 8.3:8.1:8.0 3.5:3.4:3.7 Trồng ăn (2) 5.6:5.2:5.8 4.1:4.4:3.9 6.1:6.4:5.8 9.6:9.7:9.2 Chăn nuôi (3) 4.1:4.4:3.8 2.5:2.5:2.7 1.8:1.6:1.4 2.1:2.3:2.0 Dịch vụ (4) 7.2:7.0:7.7 3.2:3.5:3.1 2.2:2.6:2.3 1.5:1.7:1.4 Bài giải:  Dạng bài: tốn phân tích phương sai hai yếu tố khơng lặp  Giả thiết H: Các giá trị trung bình  Quy trình thực EXCEL Nhập liệu : Tách xuất liệu: Nhập vào ô B165 phép toán “=(VALUE(LEFT(C7,FIND(":",C7)-1)) +VALUE(MID(C7,FIND(":",C7)+1,FIND(":",C7,FIND(":",C7)+1)-FIND(":",C7)-1)) +VALUE(RIGHT(C7,LEN(C7)-FIND(":",C7,FIND(":",C7)+1))))/3” Ta bảng số liệu trung bình: Mở hộp thoại thẻ Data, chọn Anova : Two-Factor without replication Hộp thoai Anova: Two-Factor Without Replication xuất hiện,ta chọn: Input range: $B$16:$F$21 Labels: chọn Alpha: 0.05 Output range: $B$24 Ta bảng kết sau: Biện luận : Frows (Nghề chính)= 2.004372056 < F0.05 = 3.862548 nên chấp nhận giả thuyết H(nghề chính) Fcol (Nghề phụ)= 0.119184704 < F0.05 = 3.862548 nên chấp nhận giả thuyết H(Nghề phụ) Kết luận : Vậy nghề nghề phụ ảnh hưởng đến thu nhập ... thiết H ->Hệ số tự khơng có ý nghĩa thống kê Giá trị P hệ số góc (P-value) = 8.41537970890307E-10< α = 0,05 => bác bỏ giả thiết H ->Hệ số góc có ý nghĩa thống kê Giá trị F (Significance F) = 8.41537970890307E-10

Ngày đăng: 07/12/2018, 15:26

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan