Bài Báo Cáo Bài Tập Lớn Xác Suất Thống Kê mà bạn đang xem đã bị trang web làm đảo trộn hình để tránh tình trạng sao chép không bản quyền. Khi bạn tải file Word về thì bạn sẽ có một file Word Báo Cáo Bài Tập Lớn Xác Suất Thống Kê hoàn chỉnh tuyệt vời, đã đánh sẵn số trang. Việc của bạn là in ra và đem nộp cho Giảng Viên Hướng Dẫn. Thân ái.
Trang 1Hướng dẫn chi tiết Bài Tập Lớn môn Xác Suất Thống Kê
(Tài liệu dùng tham khảo)
Các bạn sinh viên thân
mến!
Lời nói đầu
Nhằm tạo điều kiện thuận lợi cho các bạn làm bài tập lớn môn Xác Suất
Thống Kê, cuốn sách này ra đời với mục đích giúp các bạn thuận tiện hơn
trong việc làm bài và đạt được điểm số cao Mỗi bài gồm có các phần: dạng
bài, công cụ, cách giải với đầy đủ các hình ảnh minh họa dễ hiểu Ở đây mình
dùng Bài Thực Hành Nhóm 1 để làm ví dụ điển hình cho các bạn Lưu ý rằng
cuốn sách này dùng với mục đích tham khảo và bổ sung thêm kiến thức,
muốn có kỹ năng thì các bạn còn phải tự tìm tòi để phát triển bản thân Chúc
các bạn học tốt và đạt được kết quả cao trong môn học này Thân ái!
Tác Giả
Q B Đ T
Trang 2MỤC LỤC Bài 1 - Trang
01 Bài 2 - Trang
02 Bài 3 - Trang
07 Bài 4 - Trang
13
Trang 3Trang 1
1 Một hãng sản xuất ôtô tiến hành một nghiên cứu nhằm xác định xem có sự khác
nhau giữa tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô của hãng hay không Kết quả thu được như sau:
Với mức ý nghĩa α = 5%, ta cần phải đưa ra kết luận gì?
Bài làm:
Dạng bài: Bài toán kiểm định giả thuyết tỷ lệ
Giả thuyết H0: Tỷ lệ nam giới và phụ nữ trong việc chọn mua các loại ôtô là như nhau
Quy trình thực hiện bằng EXCEL:
1) Nhập dữ liệu vào bảng tính
2) Tính các tổng số trên bảng
Theo hàng: Nhập vào E2 biểu thức “=SUM(B2:D2)”, sau đó kéo nút
tự điền đến E3
Theo cột: Nhập vào B4 biểu thức “=SUM(B2:B3)”, sau đó kéo nút tự điền đến E4
3) Tính các tần số lý thuyết
Nhập vào B9 biểu thức “=B$4*$E2/$E$4”, sau đó kéo nút tự điền đến
D10 4) Áp dụng Chitest để tìm kết quả
Cú pháp hàm Chitest: “CHITEST (actual_range; expected_range)” Điền vào ô B12 biểu thức “=CHITEST(B2:D3; B9:D10)”
→ Ta được kết quả của P(X < χ2).
Biện luận: Vì P(X < χ2) = 0,582093 > α = 0,05 nên chấp nhận giả thuyết H0.
Kết luận: Tỷ lệ nam giới và phụ nữ trong việc chọn mua các loại ôtô là như nhau
Trang 42 Để xác định hiệu quả của một loại thức ăn phụ đối với sự tăng trọng của bò,
người ta lấy ngẫu nhiên 8 con bò cùng trọng lượng chia thành hai nhóm, mỗi nhóm 4 con, một nhóm ăn bình thường, một nhóm cho ăn thêm thức ăn phụ Sau
6 tháng thu được kết quả sau:
Nhóm ăn thêm thức ăn phụ (A) Nhóm thức ăn bình thường (B)
Với mức ý nghĩa 5% hãy cho kết luận về tác dụng của loại thức ăn phụ đó, biết rằng trọng lượng của bò là biến ngẫu nhiên phân phối chuẩn Với độ tin cậy 95% hãy ước lượng trọng lượng trung bình của các con bò với mỗi loại thức ăn trên.
Bài làm:
Dạng bài: So sánh giá trị trung bình với phương sai bằng nhau & Ước lượng hai trung bình tổng thể
Quy trình thực hiện bằng EXCEL:
Phần 1: Tìm kết luận về tác dụng của loại thức ăn phụ.
1) Giả thuyết H0: Trọng lượng trung bình của bò ở nhóm ăn thêm thức ăn phụ (A) và nhóm thức ăn bình thường (B) là như nhau
2) Nhập dữ liệu vào bảng tính
Equal Variances
4) Nhập vào hộp thoại t-Test Two-Sample Assuming Equal Variances
Variable 1 Range: Nhập “$A$1:$E$1” (ô A1 → E1)
Variable 2 Range: Nhập “$A$2:$E$2” (ô A2 → E2)
Labels: Chọn
Alpha: Nhập 0,05
Output Range: phạm vi dữ liệu xuất ra (ô G1)
Trang 5Mở hộp thoại chọn Descriptive Statistics.
5) Ta được bảng kết quả
6) Kết luận:
Vì t Stat = 1,341640786 < t α/2 = 2,446911851 nên chấp nhận giả thuyết H0
Vậy thức ăn phụ không có tác dụng đối với số cân nặng của bò.
Phần 2: Ước lượng trọng lượng trung bình của các con bò với mỗi loại thức ăn.
1) Nhập dữ liệu vào bảng tính
2)
Trang 63) Nhập vào hộp thoại Desciptive Statistics.
Input Range: phạm vi dữ liệu nhập vào (ô A1 → A5)
Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
Labels in first row: nhãn ở cột đầu tiên (chọn)
Output Range: phạm vi dữ liệu xuất ra (ô D1)
Tích dấu chọn vào Summary statistics
Confidence Level for Mean: Nhập 95 (%)
4) Ta được bảng kết quả
Trang 7 Kết luận:
Trọng lượng trung bình của các con bò ở nhóm ăn thêm thức ăn phụ (A) là: 360 ± 46,84434123.
6) Nhập vào hộp thoại Desciptive Statistics
Input Range: phạm vi dữ liệu nhập vào (ô B1 → B5)
Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
Labels in first row: nhãn ở cột đầu tiên (chọn)
Output Range: phạm vi dữ liệu xuất ra (ô G1)
Tích dấu chọn vào Summary statistics
Confidence Level for Mean: Nhập 95 (%)
Trang 87) Ta được bảng kết quả.
kết:
Trọng lượng trung bình của các con bò ở nhóm thức ăn bình thường (B) là: 330 ± 53,56855363.
Thức ăn phụ không có tác dụng đối với số cân nặng của bò.
Trọng lượng trung bình của các con bò ở nhóm ăn thêm thức ăn phụ (A) là: 360 ± 46,84434123.
Trọng lượng trung bình của các con bò ở nhóm thức ăn bình thường (B) là: 330 ± 53,56855363.
Trang 9X21090240502402701302709024013017050170210 Y255 115 25535275315135355 135 29517523575195235
Mở hộp thoại
3 Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của
tập số liệu sau đây Với mức ý nghĩa α = 5%, có kết luận gì về mối tương quan giữa X và Y (Có phi tuyến không? Có tuyến tính không? ) Tìm đường hồi quy của Y đối với X.
Bài làm:
Dạng bài: Bài toán kiểm định tương quan và hồi quy
Quy trình thực hiện bằng EXCEL:
1) Phân tích tương quan tuyến tính
o Giả thuyết H0: X và Y không có tương quan tuyến tính
o Nhập dữ liệu vào bảng tính
Trang 10o Nhập vào hộp thoại Correlation.
Input Range: phạm vi đầu vào (ô A1 → B16)
Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
Labels in first row: nhãn ở cột đầu tiên (chọn)
Output Range: phạm vi dữ liệu xuất ra (ô D1)
o Ta nhận được bảng kết quả
Biện luận:
Từ bảng kết quả ta được hệ số tương quan r (X/Y) = 0,974356
→ Hệ số xác định r2 = 0,9493696147
r √ n − 2
√ 1 − 𝑟2
α
Sử dụng hàm TINV để tìm đơn vị phân mức
2
phân bố Student với n – 2 = 13 bậc tự do
→ c = 2,16036865646279
= 0,025 của
Trang 11Vì │T│> c nên bác bỏ giả thuyết H0.
Kết luận:
Vậy X và Y có tương quan tuyến tính.
2) Phân tích tương quan phi tuyến
o Giả thuyết H0: X và Y không có tương quan phi tuyến
o Nhập dữ liệu vào bảng tính sau khi đã sắp xếp lại
o Nhập vào hộp thoại Anova Single Factor
Input Range: phạm vi đầu vào (ô B1 → H4)
Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
Labels in first row: nhãn ở cột đầu tiên (chọn)
Trang 12 Alpha: mức ý nghĩa (0,05).
Output Range: phạm vi dữ liệu xuất ra (ô A6)
o Ta nhận được bảng kết quả
Biện luận:
Tổng bình phương giữa các nhóm: SSF = 114693,3
Tổng bình phương nhân tố: SST = 119093,3
Tính tỷ số tương quan η2
→ η = 0,9813532376
Y/
X
= SSF = 0,9630541769
SST
(η2Y/X−r2)(n−k))
F =
(1−η2Y/X)(k)−2)
→ F = 0,5926326086
α
Sử dụng hàm FINV để tìm đơn vị phân mức
2= 0,025 của phân bố Fisher bậc tự do (k ˗ 2; n ˗ k) = (5; 8)
→ c = 3,68749866634003
Vì F < c nên chấp nhận giả thuyết H0
Trang 13Mở hộp thoại
Kết luận:
Vậy X và Y không có tương quan phi tuyến.
3) Phân tích hồi quy (sử dụng Regression).
o Nhập dữ liệu vào bảng tính
o Nhập vào hộp thoại Regression
Phạm vi đầu vào:
Input Y Range: quét vùng (ô B2 → B16)
Input X Range: quét vùng (ô A2 → A16)
Output Range: phạm vi đầu ra (ô D11)
Confidence Level: Nhập 95 (%)
Chọn Line Pit Plots trong Residuals để vẽ đường hồi
quy
Trang 14o Ta nhận được bảng kết quả.
Kết Luận:
Đường hồi quy của Y đối với X là:
Y = 6,159101 + 1,167563X
Trang 152) Mở hộp thoại chọn Anova Two-Factor With Replication.
4 Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của các
hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu về thu nhập của một
số hộ tương ứng với các ngành nghề nói trên như sau (mức ý nghĩa 5%):
Nghề phụ
Bài làm:
Dạng bài: phân tích phương sai hai yếu tố có lặp.
Giả thuyết:
HA là năng suất không phụ thuộc vào nghề chính
HB là năng suất không phụ thuộc vào nghề phụ
HAB là năng suất giữa nghề chính và nghề phụ không có liên quan đến nhau
Quy trình thực hiên bằng EXCEL:
1) Nhập dữ liệu vào bảng tính
3) Nhập vào hộp thoại Anova Two-Factor With Replication
Nghề chính
Trồng lúa (1) 3.5:3.4:4.0 7.4:7.6:7.1 8.3:8.1:8.0 3.5:3.4:3.7 Trồng cây ăn quả (2) 5.6:5.2:5.8 4.1:4.4:3.9 6.1:6.4:5.8 9.6:9.7:9.2 Chăn nuôi (3) 4.1:4.4:3.8 2.5:2.5:2.7 1.8:1.6:1.4 2.1:2.3:2.0 Dịch vụ (4) 7.2:7.0:7.7 3.2:3.5:3.1 2.2:2.6:2.3 1.5:1.7:1.4
Trang 16 Input Range: phạm vi đầu vào (ô A2 → E14).
Rows per sample: nhập 3
Alpha: điền 0,05
Output Range: phạm vi dữ liệu xuất ra (ô G1) 4) Ta nhận được bảng kết quả
Trang 17 Kết luận:
602,7073 = FA > Fn – 1; nm(r – 1); 1 – α = 2,90112 → Bác bỏ yếu tố HA.
→ Năng suất phụ thuộc vào nghề chính.
35,55285 = FB > Fm – 1; nm(r – 1); 1 – α = 2,90112 → Bác bỏ yếu tố HB.
→ Năng suất phụ thuộc vào nghề phụ.
301,7487 = FAB > F(n – 1)(m – 1); nm(r – 1); 1 – α = 2,188766 → Bác bỏ yếu tố HAB
→ Có sự tương tác năng suất giữa nghề chính và nghề phụ.