bài tập lớn xác xuất thống kê
BÀI TẬP LỚN MÔN XÁC SUẤT THỐNG KÊ Bài 1: Bảng sau đây cho ta phân bố thu nhập của hai nhóm tuổi: Nhóm từ 40-50 tuổi và nhóm từ 50-60 tuổi trong tất cả các công nhân viên chức của Thụy Điển năm 1930 (đơn vị:1000 curon) Nhóm tuổi Thu nhập 0-1 1-2 2-3 3-4 4-6 ≥ 6 40-50 7831 26740 35572 20009 11527 6919 50-60 7858 20685 24186 12280 6776 4222 Có sự khác nhau về phân bố thu nhập giữa hai nhóm tuổi này không? Mức ý nghĩa α=1% Bài làm: Dạng bài: So sánh các phân số Phần mềm: Microsoft Excel 2007 Hàm: CHITEST Giả thiết : 0 H : Sự phân bố thu nhập giữa 2 nhóm tuổi 40-50 và 50-60 là như nhau Bước 1: Nhập bảng dữ liệu thực tế và tính các tổng ni, mj: i n =SUM(hàng) j m =SUM(cột) Bước 2: Tính dữ liệu kỳ vọng γij theo công thức γij= ni* nj/n ta được bảng sau: Bước 3: Tính P(X > χ²) = CHITEST(Bảng_thực_tế,Bản_kỳ_vọng) =CHITEST(C2:H3,C7:H8) Bước 4: Phân tích kết quả: ' α = P(X > χ²) = 3.73E-204 < = 0.01. = = > = 15.09 nên ta bác bỏ Bước 5 : Kết luận Vậy, phân bố thu nhập của hai nhóm tuổi này trong các công nhân viên chức là khác nhau Bài 2 :Số kilomet đi được nhờ 1 lít xăng của 4 loại xe ôtô A, B, C, D được ghi lại như sau trên các xe chạy thí nghiệm : Loại A : 25, 23, 20, 27, 20 Loại B : 28, 31, 27, 28, 26 Loại C : 32, 33, 30, 28, 32 Loại D : 24, 24, 23, 27, 22 Với mức ý nghĩa = 5% , hãy so sánh mức tiêu thụ xăng trung bình của 4 loại xe nói trên Bài làm : Dạng bài : Phân tích phương sai 1 nhân tố : Phần mềm : Microsoft Excel Phương pháp giải bài toán : Giả thiết : : số kilomet đi được nhờ 1 lít xăng của 4 loại xe A, B, C, D là như nhau Bảng ANOVA Nguồn Tổng bình phương Bậc tự do Trung bình bình phương Tỷ số F Nhân tố SSF k-1 MSF MSF/MSE Sai số SSE n-k MSE Tổng số SST n-1 Nếu làm bằng Excel , ta có các bước sau : Bước 1 : 1. Nếu trong menu Tools chưa có mục Data Analysis… thì tiến hành cài Analysis ToolPak như sau: Tools \ Add-Ins \ chọn Analysis ToolPak\ OK Bước 2 : Nhập dữ liệu theo cột : B3 : Chọn Tools\ Data Analysis … như trong hình : Chọn ANOVA : Single Factor Nhập dữ liệu như trong hình : + Input Range : khoảng dữ liệu đầu vào + Group by : Cách sắp xếp theo dòng hay cột + Nhãn dữ liệu : (Labels First Row/Column) + Out put range : phạm vi dữ liệu ra + Alpha : mức ý nghĩa B4: Sau khi nhập đủ các thông số , bảng số liệu ANOVA được gọi ra như sau : B5 : Kết luận : nên ta bác bỏ : số kilomet đi được nhờ 1 lít xăng của 4 loại xe ôtô A, B ,C ,D là như nhau Vậy mức tiêu thụ xăng trung bình của 4 loại xe A, B, C, D là không giống nhau Bài 3: Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số liệu sau đây. Với mức ý nghĩa α = 5%, có kết luận gì về mối tương quan giữa X và Y (phi tuyến hay tuyến tính)? X 0.9 1.22 1.32 0.77 1.3 1.2 Y -0.3 0.1 0.7 -0.28 -0.25 0.02 X 0.9 1.22 1.32 0.77 1.3 1.2 Y 0.3 0.5 0.4 -0.2 -0.3 0.08 Bài làm: Dạng bài: Phân tích tương quan và hồi quy Phần mềm: Microsoft Excel Hàm: FINV, chương trình Correlation, Anova: Single Factor Bước 1: Nhập bảng số liệu: Bước 2 : Tính STT, SSF và tỷ số tương quan của Y đối với X: Áp dụng “ANOVA: Single Factor” • Nhấp lần lượt đơn lệnh Data (hoặc Tools đối với MS Excel 2003) và lệnh Data Analysis rồi nhấn nút OK, • Chọn chương trình Anova: Single Factor trong hộp thoại Data Analysis rồi nhấn nút OK, • Trong hộp thoại Anova: Single Factor lần lượt ấn định: o Phạm vi đầu vào (Input Range), o Cách sắp xếp theo hang hay cột (Group By), o Nhãn dữ liệu (Labels in First Row/Column), o Rồi nhấn OK. [...]... của khẳng định này là 5% Bài 4 : Cho bảng số liệu sau : X Y X Y 2.3 7 3.9 12 2.5 8 2.6 4 4 8 3.1 4 4.1 5 3.4 6 4.1 7 3.7 6 4.2 8 7.3 14 4.4 7 X Y 4.7 9 5.1 10 5.5 13 5.8 7 6.2 11 6.9 11 6.9 16 a ) Tìm đường hồi quy tuyến tính của Y đối với X : b ) Tính sai số tiêu chuẩn của đường hồi quy c ) Tính tỷ số F để kiểm định giả thiết có hồi quy tuyến tính giữa Y với X Bài Làm : Dạng bài toán : Phân tích hồi... tương quan R, hệ số xác định R²: Áp dụng Correlation: + Click Data trên thanh công cụ + Click hộp thoại Data Analysic và chọn Conrelation: + Trong Correlation, lần lượt ấn định các chi tiết: • Phạm vi đầu vào (Input Range), • Cách xắp xếp theo hàng hay cột (Group By), • Nhãn dữ liệu (Labels First Row/Column), • Phạm vi đầu ra (Output Range) Ta có được Hệ số tương quan r và hệ số xác định r²: Bước 4:... Nhập dữ liệu vào như trong hình : + Input Y Range : khoảng dữ liệu của Y + Input X Range : khoảng dữ liệu của X + Confidence Level : mức ý nghĩa + Labels : Nhãn dữ liệu +Output Range : Khoảng dữ liệu xuất ra B3 : Sau khi nhập đủ các thông số , ta gọi ra được bảng sau : B4 : Kết luận : 1.Đường hồi quy tuyến tính của Y đối với X là : Y = 1.676896*X + 1.045276 2.Sai số tiêu chuẩn của đường hồi quy là . BÀI TẬP LỚN MÔN XÁC SUẤT THỐNG KÊ Bài 1: Bảng sau đây cho ta phân bố thu nhập của hai nhóm tuổi: Nhóm từ 40-50. thụ xăng trung bình của 4 loại xe nói trên Bài làm : Dạng bài : Phân tích phương sai 1 nhân tố : Phần mềm : Microsoft Excel Phương pháp giải bài toán : Giả thiết : : số kilomet đi được. bình của 4 loại xe A, B, C, D là không giống nhau Bài 3: Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số liệu sau đây. Với mức ý nghĩa α = 5%, có kết