1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Báo cáo bài tập lớn xstk nhóm 3

18 1,2K 5

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 18
Dung lượng 570,95 KB
File đính kèm btl.rar (616 KB)

Nội dung

Báo cáo bài tập lớn xstk nhóm 3 Báo cáo bài tập lớn xstk nhóm 3 Báo cáo bài tập lớn xstk nhóm 3 Báo cáo bài tập lớn xstk nhóm 3 Báo cáo bài tập lớn xstk nhóm 3 Báo cáo bài tập lớn xstk nhóm 3 Báo cáo bài tập lớn xstk nhóm 3 Báo cáo bài tập lớn xstk nhóm 3 Báo cáo bài tập lớn xstk nhóm 3Báo cáo bài tập lớn xstk nhóm 3

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HỒ CHÍ MINH BÁO CÁO BÀI TẬP LỚN Bộ môn: XÁC SUẤT THỐNG KÊ GVHD:Nguyễn Bá Thi Tên : Trần Văn Huy MSSV: Lớp : Nhóm : L02-A Nhóm : 03 Câu 1: Một xí nghiệp may sản xuất áo khoác với màu: đỏ, xanh, vàng tím than So khách hàng nam nữ mua áo khoác với màu ghi bảng sau Đỏ Xanh Vàng Tím than Nữ 62 34 71 42 Nam 125 223 52 54 Với mức ý nghĩa 1% so sánh tỷ lệ khách hàng nam nữ ưa chuộng màu sắc nói Dạng bài: toán kiểm định giả thiết tỷ lệ Phương pháp giải: Giả thiết H0: Tỷ lệ khách hàng ưa chuộng màu sắc nói nhóm Giá trị thống kê: Oi – tần số thực nghiệm (TSTN) Ei – tần số lý thuyết (TSLT) Trong Excel có hàm CHITEST nhận giá trị theo công thức: Oij – tần số thực nghiệm ô thuộc hàng i cột j Eij - tần số lý thuyết ô thuộc hàng i cột j r số hàng c số cột Xác suất P (X>χ²) với bậc tự DF = (r-1)(c-1) Biện luận: P (X>χ²) > α => chấp nhận giả thuyết : Công cụ giải: Microsolf Excel Cú pháp hàm CHITEST(actual_range,expected_range) Trong đó: - actual_range: Phạm vi liệu chứa giá trị cần đối chiếu với giá trị dự kiến, tham số bắt buộc - expected_range: Phạm vi liệu chứa tỷ lệ phép nhân tổng hàng tổng cột với tổng cộng Ý nghĩa hàm CHITEST: trả giá trị hàm xác suất từ phân phối chisquared số bậc tự tương ứng Thực toán Excel: Nhập số liệu vào Excel: Tính tổng số: Tổng hàng: chọn ô F2 nhập biểu thức = SUM(B2:E2) Dùng trỏ kéo nút tự điền từ ô F2->F3 Tổng cột: chọn ô B4 nhập biểu thức =SUM(B2:B3) Dùng trỏ kéo nút tự điền từ ô B4->E4 Tổng cộng: chọn ô F4 nhập biểu thức = SUM(B4:E4) Tính tần số lý thuyết: Nữ thích màu đỏ: chọn ô B7 nhập biểu thức = B4*F2/F4 Nữ thích màu xanh: chọn ô C7 nhập biểu thức = C4*F2/F4 Nữ thích màu vàng: chọn ô D7 nhập biểu thức = D4*F2/F4 Nữ thích màu tím than: chọn ô E7 nhập biểu thức = E4*F2/F4 Nam thích màu đỏ: chọn ô B8 nhập biểu thức =B4*F3/F4 Nam thích màu xanh: chọn ô C8 nhập biểu thức =C4*F3/F4 Nam thích màu vàng: chọn ô D8 nhập biểu thức =D4*F3/F4 Nam thích màu tím than: chọn ô E8 nhập biểu thức =E4*F3/F4 Áp dụng hàm số CHITEST: Chọn ô B10 nhập vào =CHITEST(B2:E3,B7:E8) Ta có kết P(X>X²): Biện luận: Giá trị P = 0.0000000000000000017151444 < α = 0.01 => bác bỏ giả thiết H0 Kết luận: Tỷ lệ khách hàng ưa chuộng màu sắc nói khác nhóm nam nữ Câu 2: Điểm môn toan học sinh khối hai trường có số liệu sau: Với độ tin cậy 95%, ước lượng điểm trung bình mon toán hai trường Với mức ý nghĩa 5%,haỹ xem xét trung bình môn toán hai trường có thực khác không ? Giả sử điểm môn toán co quy luật phân phối chuẩn Dạng bài: Kiểm định giả thiết giá trị trung bình, Giả thiết: điểm trung bình môn toán hai trường giống Thực toán Excel: Nhập liệu: Vào Data-Data Analysis-Descriptive Statistics Thiết lập hình: Ta kết quả: Theo công thức: - ξ , + ξ Ta có khoảng ước lượng điểm trung bình môn toán Trường A là: (7.6 - 0.5958; 7.6 + 0.5958) Ta có khoảng ước lượng điểm trung bình môn toán Trường B là: (7.32 – 0.5424 ; 7.32 +0.5424) Xét giả thiết điểm trung bình môn toán hai trường có thực khác không Vào Data-Data Analysis-(t-Test:Two-Sample Assuming Unequal Variances)-Ok Ta thấy giá trị Tqs < Tα(n1 + n2 -2)  0.71724 < 2.01063  nên điểm môn toán trung bình trường giống Câu Từ 12 cặp quan sát (xi, yi) sau cặp hai biến (X, Y), tính tỷ số tương quan, hệ số tương quan hệ số xác định Y X Với mức ý nghĩa α = 5%, có kết luận mối tương quan X Y (Có phi tuyến không? Có tuyến tính không?) Tìm đường hồi quy Y X X Y 12 4,2 35 4,1 11 3,7 11 3,9 12 4,5 35 4,1 11 11 3,8 12 35 3,1 11 3,4 11 Dạng bài:Phân tích tương quan hồi quy Phương pháp giải: Phân tích tương quan tuyến tính: Tìm hệ số tương quan r Tìm hệ số xác định r2 Tính giá trị T theo công thức So sánh T với c tra từ bảng với bậc tự (n-2) mức ý nghĩa α = 5% để đưa kết luận Phân tích tương quan phi tuyến : TÌm F theo công thức: - Tính tỉ số tương quan : Với tổng bình phương nhân tố tổng bình phương chung => Tỷ số tương quan: ηY/X Sử dụng Phân bố Fisher Sau xét F so với c để đưa kết luận Phân tích đường hồi quy: Tìm đường hồi quy từ Excel Dạng y=A+Bx Công cụ giải: Excel- Data Analysis Phân tích tương quan tuyến tính Giả thuyết H0: X Y không tương quan tuyến tính Nhập bảng số liệu sau: Mở Data Analysis chọn Correlation Hộp thoại Correlation xuất Input Range: phạm vi đầu vào (ô A1  ô M2) Grouped By: nhóm liệu theo hàng cột (chọn hàng) Labels in first column: nhãn cột (chọn) Output Range: phạm vi liệu xuất (ô A4) Ta kết quả: Biện luận:      n = 12 Từ bảng kết quả, ta tìm hệ số tương quan r = 0,177098 Hệ số xác định r² = 0,031364 Giá trị T = 0,569028 Phân phối Student mức α = 0,05 với bậc tự n-2 = 10: c = T.INV.2T(0,05;10) = 2,228139  |T| < c nên chưa bác bỏ giả thiết H0 (chấp nhận giả thiết H0) Kết luận: Vậy X Y tương quan tuyến tính  Phân tích tương quan phi tuyến Giả thiết H1: X Y tương quan phi tuyến Nhập liệu vào bảng tính sau xếp lại: Mở Data Analysis chọn Anova Single Factor Hộp thoại Anova Single Factor xuất Input Range: phạm vi đầu vào (ô B8  ô E11) Grouped By: nhóm liệu theo hàng cột (chọn cột) Labels in first row: nhãn cột (chọn) Alpha: giá trị α (0,05) Output Range: phạm vi liệu xuất (ô A13) Ta kết quả: Biện luận: n = 12 , k = Tổng bình phương nhóm SSF = 0,24 Tổng bình phương nhân tố SST = 5,366667 η2Y/X = SSF/SST = 0,04472  Tỷ số tương quan : ηY/X = 0,211472  Giá trị F = 0,055929  Phân bố Fisher mức α = 0,05 với bậc tự (k-2, n-k) = (2, 8)     c = F.INV.RT(0,05; 2; 8) = 4,45897  F < c chấp nhận giả thiết H1 Kết luận: X Y tương quan phi tuyến  Phân tích đường hồi quy Giả thiết H: Hệ số không thích hợp Nhập liệu vào bảng tính theo cột dọc: Mở Data Analysis chọn Regression Hộp thoại Regression xuất Input Y Range: phạm vi đầu vào (ô B30  ô B42) Input X Range: phạm vi đầu vào (ô A30  ô A42) Labels: nhãn (chọn) Line Fit Plots: vẽ đồ thị (chọn) Output Range: phạm vi liệu xuất (ô A44) Ta kết quả: Biện luận:  Hệ số góc = 0,001145  Hệ số tự = 3,363998  Giá trị P hệ số tự (P-value) = 9,95x10-6 < α = 0,05 => Bác bỏ giả thiết H  Hệ số tự có ý nghĩa thống kê  Giá trị P hệ số góc (P-value) = 0,581892 > α = 0,05 => Chấp nhận giả thiết H  Hệ số góc ý nghĩa thống kê  Giá trị F (Significance F) = 0,581892 > α = 0,05 => Chấp nhận giả thiết H  Phương trình đường hồi quy không thích hợp Kết luận phân tích đường hồi quy: Phương trình đường hồi quy không thích hợp Kết luận: Tỷ số tương quan ηY/X = 0,211472 Hệ số tương quan r = 0,177098 Hệ số xác định r² = 0,031364 X Y tương quan tuyến tính với mức ý nghĩa 5% X Y tương quan phi tuyến với mức ý nghĩa 5% Phương trình đường hồi quy Y X: Y = 0,001145X + 3,363998 không thích hợp Câu Với mức ý nghĩa 0,05 , phân tích biến động thu nhập ($/tháng/người) sở số liệu điều tra thu nhập trung bình loại ngành nghề khu vực khác sau đây: Loại ngành nghề V1 212 222 241 240 Nơi làm việc V2 V3 200 230 205 222 250 245 228 230 V4 220 225 235 240 Dạng bài: toán phân tích phương sai hai yếu tố không lặp Giả thiết H: Các giá trị trung bình Thực toán Excel: Nhập liệu bảng: Áp dụng chương trình Anova : Two Factor Without Replication thẻ Data => Data Analysis Ta kết quả: Biện luận: FR = 8.78 > F0.05 = 3.86 FC = 1.23 < F0.05 = 3.86 => Bác bỏ giả thiết H ( Ngành nghề ) => Chấp nhận giả thiết H ( Nơi làm việc ) Kết luận: Chỉ có Ngành nghề ảnh hưởng đến thu nhập trung bình [...]... nghề 1 2 3 4 V1 212 222 241 240 Nơi làm việc V2 V3 200 230 205 222 250 245 228 230 V4 220 225 235 240 Dạng bài: bài toán phân tích phương sai hai yếu tố không lặp Giả thiết H: Các giá trị trung bình bằng nhau Thực hiện bài toán bằng Excel: Nhập dữ liệu bảng: Áp dụng chương trình Anova : Two Factor Without Replication trong thẻ Data => Data Analysis Ta được kết quả: Biện luận: FR = 8.78 > F0.05 = 3. 86 FC... không thích hợp Kết luận: Tỷ số tương quan ηY/X = 0,211472 Hệ số tương quan r = 0,177098 Hệ số xác định r² = 0, 031 364 X và Y không có tương quan tuyến tính với mức ý nghĩa 5% X và Y không có tương quan phi tuyến với mức ý nghĩa 5% Phương trình đường hồi quy của Y đối với X: Y = 0,001145X + 3, 3 639 98 là không thích hợp Câu 4 Với mức ý nghĩa 0,05 , hãy phân tích sự biến động của thu nhập ($/tháng/người)... Analysis chọn Regression Hộp thoại Regression xuất hiện Input Y Range: phạm vi đầu vào (ô B30  ô B42) Input X Range: phạm vi đầu vào (ô A30  ô A42) Labels: nhãn (chọn) Line Fit Plots: vẽ đồ thị (chọn) Output Range: phạm vi dữ liệu xuất ra (ô A44) Ta được kết quả: Biện luận:  Hệ số góc = 0,001145  Hệ số tự do = 3, 3 639 98  Giá trị P của hệ số tự do (P-value) = 9,95x10-6 < α = 0,05 => Bác bỏ giả thiết... hiện Input Range: phạm vi đầu vào (ô B8  ô E11) Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột) Labels in first row: nhãn ở cột đầu tiên (chọn) Alpha: giá trị α (0,05) Output Range: phạm vi dữ liệu xuất ra (ô A 13) Ta được kết quả: Biện luận: n = 12 , k = 4 Tổng bình phương giữa các nhóm SSF = 0,24 Tổng bình phương nhân tố SST = 5 ,36 6667 η2Y/X = SSF/SST = 0,04472  Tỷ số tương quan : ηY/X =... hiện bài toán bằng Excel: Nhập dữ liệu bảng: Áp dụng chương trình Anova : Two Factor Without Replication trong thẻ Data => Data Analysis Ta được kết quả: Biện luận: FR = 8.78 > F0.05 = 3. 86 FC = 1. 23 < F0.05 = 3. 86 => Bác bỏ giả thiết H ( Ngành nghề ) => Chấp nhận giả thiết H ( Nơi làm việc ) Kết luận: Chỉ có Ngành nghề ảnh hưởng đến thu nhập trung bình

Ngày đăng: 25/11/2016, 23:54

TỪ KHÓA LIÊN QUAN

w