Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 27 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
27
Dung lượng
1,75 MB
Nội dung
ĐẠI HỌC BÁCH KHOA TP-HCM BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Giáo viên hướng dẫn: Nguyễn Kiều Dung Nhóm 09: Sinh viên thực hiện: 1.Nguyễn Văn Cường 1410462 2.Châu Thanh Hải(NT) 1411037 3.Nguyển Đức Huy 1411454 4.Hà Gia Lộc 1412123 5.Đặng Đình Nguyên 1412528 6.Nguyễn Mạnh Thi 1413701 7.Tạ Minh Thành 1413587 8.Đỗ Phạm Quang Trí 1414201 Thủ Đức, tháng 11 năm 2015 BÀI 1: Tìm liệu định lượng (A) liệu định tính (B) thích hợp, sử dụng liệu cho yêu cầu sau: 1) Thực phương pháp phân tổ liệu (A) 2) Vẽ đồ thị phân phối tần số đa giác tần số (A) 3) Tính đặc trưng mẫu ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 96% (A) 4) Trình bày liệu định tính (B) dạng phân loại đồ thị BÀI LÀM: + Dạng bài: Thống kê mô tả + Dữ liệu A : Thống kê sản lượng tiêu thụ điện năm 2010 qua tháng Sản lượng điện tiêu thụ năm 2010 Tháng Sản lượng tiêu thụ (nghìn kWh) 1453 1267 2162 1931 2168 2074 2058 1867 2078 10 2219 11 1963 12 2086 a) Thực phương pháp phân tổ liệu (A): +Nhập liệu (A) vào Excel + Xác định số tổ cần chia k=( Chọn ô E1 nhập vào biểu thức =CEILING((2*COUNT(B3:B14))^0.33,1) Ta kết k=3 + Xác định trị số khoảng cách h theo công thức h = Chọn ô D3 nhập vào biểu thức =CEILING((MAX(B3:B14)-MIN(B3:B14))/E1,1) Ta kết h =318 +Ta xác định cận cận Nhóm :1267-1585 Nhóm : 1585-1903 Nhóm : 1903-2221 + Nhập vào ô từ A16 tới A18 +Chọn chức Data/ Data Analysis/Histogram - Input Range: địa tuyệt đối chứa dư liệu - Bin Range: địa chứa bảng phân nhóm - Output options: vị trí xuất kết - Confidence Level for Mean: độ tin cậy cho trung bình - Chọn Cumulative Percentage để tính tần suất tích lũy khơng Excel tính tần số +Ta nhập giá trị bảng + Ta nhận bảng giá trị sau | + Ta chỉnh sửa lại sau b) Vẽ đồ thị phân phối tần số đa giác tần số (A) * Vẽ đồ thị phân phối tần số: +Quét chọn bảng tần số B2:B4 +Dùng chức Insert Column Chart menu Insert +Nhấp chuột phải vào bảng chọn Select Data chỉnh sửa thông số cần thiết +Sau chỉnh sửa ta có *Vẽ đa giác tần số (A) + Sử dụng bảng phân phối tần số liệu (A): + Thêm giá trị vào đầu cuối bảng phân phối tần số: +Quét chọn A9:B13, dùng chức Insert Line Chart menu Insert + Nhấp chuột phải vào bảng có, chọn Select Data chỉnh sửa thông số cần thiết + Sau chỉnh sửa ta có c) Tính đặc trưng mẫu ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 96% (A) + Chọn chức Data/Data Analysis/Descriptive Statistics -Input Range: địa tuyệt đối chứa dư liệu -Output options: vị trí xuất kết -Confidence Level for Mean: độ tin cậy cho trung bình + Nhập vào bảng số liệu cần thiết +Kết nhận d) Trình bày liệu định tính (B) dạng phân loại đồ thị: Nhập liệu bảng tính : Tính tỉ lệ sinh viên cho ngành: +Nhập vào C3: =B3/$B$9, copy cho cịn lại Vẽ biểu đồ đứng thể số lượng sinh viên chuyên ngành: + Quét chọn cột Số sinh viên (B3:B8) + Dùng chức Insert /Insert Column Chart/2-D Column menu Insert Kết thu được: Vẽ biểu đồ tròn thể tỉ lệ sinh viên chuyên ngành + Quét chọn cột Số sinh viên (C3:C8) + Dùng chức Insert/Insert Pie/2-D Pie menu Insert Kết thu được: Bài 2: Hai máy gia công loại chi tiết Để kiểm tra xem máy có củng độ xác hay không, người ta lấy ngẫu nhiên từ máy chi tiết, đem đo thu kết sau (đơn vị mm): Máy A 137 138 135 140 138 137 139 Máy B 142 135 140 138 136 138 141 Có thể cho máy có độ xác hay khơng, với mức ý nghĩa 2%? Giả thiết kích thước chi tiết có phân phối chuẩn Nhận dạng toán: Đây tốn so sánh hai phương sai Cơ sở lí thuyết: Trắc nghiệm so sánh hai phương sai thường áp dụng để so sánh độ xác hai phương pháp định lượng khác Giả thuyết: H0: H1: Giá trị thống kê: F= Phân phối Fisher: Biện luận Nếu F < Chấp nhận giả thuyết H0 với xác suất (1 - α )100% Bài làm Nhập liệu vào bảng: So sánh phương sai: Áp dụng F-Test Two-Sample for Variances: Dùng lệnh Data Analysis -> F-Test Two-Sample for Variances BÀI 3: Theo giới thiệu nhà phân phối , mức tiêu thụ nhiên liệu trung bình loại xe ô tô Sau thời gian chạy xe, người ta đo đạt lại quãng đường kết sau : Loại xe Mức tiêu thụ nhiên liệu I 20 21.2 18.7 19.5 20.1 22 21 II 21.2 21.2 20.4 19.6 22 21.1 20 III 21.5 21.2 21 21.5 22 20.7 IV 19.9 22 21 23 21.2 20.6 21.7 21.3 Có thể coi mức tiêu thụ nhiên liệu loại xe cịn giống hay khơng, với mức ý nghĩa 4%.Tìm hệ số xác định R2 tốn giải thích ý nghĩa Phương pháp PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ Phép phân tích phương sai dùng trắc nghiệm để so sánh giá trị trung bình hai hay nhiều mẫu lấy từ phân số.Đây xem phần mở rộng trắc nghiệm t hay z (so sánh hai giá trị trung bình) Mục đích phân tích phương sai yếu tố đánh giá ảnh hưởng yếu tố (nhân tạo hay tự nhiên) giá trị quan sát, Yi(i=0,1,2,…,k) Mơ hình: Yếu tố thí nghiệm Tổng cộng trung bình … K Y11 Y21 … Yk1 Y12 Y22 … Yk2 … … … … Y1N Y2N … YkN T1 T2 … Tk _ _ Y2 Y1 T _ … _ Yk Y Bảng ANOVA: Nguồn sai số Bậc sai số Tổng số bình phương Yếu tố k-1 Sai số N-k T T2 SSF= ∑ i − N i =1 N MSF= SSF k −1 SSE=SST-SSF MSE= SSE N −k k Bình phương trung bình Giá trị thống kê F= MSF MSE Tổng cộng N-1 k n SST= ∑∑ Y i =1 j =1 n − T2 N Trắc nghiệm: Gi thit: ã H0: à1 = = = µ k ⇔ “Các giá trị trung bình nhau” H1: µ i ≠ µ j ⇔ “Ít có hai giá trị trung bình khác nhau” MSF MSE • Giá trị thống kê: F= • Biện luận: Nếu F < Fα(k-1;N-k) => chấp nhận giả thiết H0 Hệ số xác định R-square ý nghĩa Cơ sở lý thuyết : Nhân tố F … i … p X11 X12 … X1i … X1p X21 X22 … X2i … X2p Nk N1 N2 Ni Np STT quan sát - TSS ( Total sum of squares) : tổng bình phương tất sai lệch giá trị quan sát X ki giá trị trung bình mẫu chung chúng Ký hiệu : ni X = X = (∑ X ki ) k =1 ni ∑∑ X Ta có : i k n , i = 1, p ki , n = ∑ ni , i = 1, p, k = 1, ni ∑ Ti i TSS = ∑∑ ( X ki − X ) = ∑ Qi − n i k i - Trong : Qi = ∑ X ki2 ; Ti = ∑ X ki k k MSS (Model sum of squares) : tổng bình phương sai lệch giá trị trung bình mẫu nhóm quan sát ( phân theo mức nhân tố i) trung bình mẫu MSS = ∑ i - ( Ti ∑ T X i − X ni = ∑ i − i n i ni ) R2 : tỷ lệ hay số phần trăm chiếm tổng số 100% toàn sai lệch X ki so với giá trị trung bình chúng R2 sử dụng để đo mức độ ảnh hưởng nhân tố chứa mơ hình biến động giá trị biến ngẫu nhiên X xung quanh giá trị trung bình R gọi hệ số xác định mơ hình phân tích phương sai, mức độ thích hợp mơ hình R lớn mơ hình thích hợp , giải thích nhiều biến động giá trị biến ngẫu nhiên X tác động nhân tố có mơ hình R2 = MSS TSS Tính Excel : R2 = SSF SST Bài làm • Kiểm định phương sai yếu tố : Đây tốn phân tích phương sai yếu tố, mức tiêu thụ nhiên liệu trung bình phụ thuộc vào loại xe Giả thiết H0: µ1 = µ2 = µ3= µ4; tức mức tiêu thụ nhiên liệu trung bình Nhập liệu vào bảng: Áp dụng Anova: Single Factor Nhấn đơn lệnh Tools lệnh Data Analysis Chọn trương trình Anova: Single Factor hộp thoại Data Analysis nhấn nút OK Trong hộp thoại Anova: Single Factor ấn định − Phạm vi đầu vào (Input range) − Cách xắp xếp theo hàng hay cột (Group by) − Nhấn dử liệu (Labels in fisrt row/column) − Phạm vi đầu (Output range) Bảng Anova: Kết luận: Miền bác bỏ : Wα=( Fα(k-1;N-k),+∞) = (3.234466,+∞) Từ giá trị bảng Anova: F= 1.284075 < Fα= 3.234466 => Không thể bác bỏ giả thuyết H0 => Mức tiêu thụ nhiên liệu loại xe • Hệ số xác định R2 ý nghĩa : R2 = SSF SST Hệ số xác định R2 = 0.138309 Ý nghĩa : Nhân tố loại xe ảnh hưỡng 13.83% đến mức tiêu thụ nhiên liệu loại xe ( hay 13.83% khác biệt mức tiêu thụ nhiên liệu trung bình cũa loại xe) Bài : Một điều tra xã hội tiến hành thành phố A,B,C,D,E Người ta yêu cầu người đươc đòi hỏi diễn tả mức độ thỏa mãn thành phố mà họ sống Kết cho sau : Mức độ thỏa mãn Thành phố Rất thỏa mãn Tương đối Không A 220 121 63 B 130 207 75 C 84 54 24 D 156 95 43 E 122 164 73 Với mức ý nghĩa α=3% Hãy kiểm định xem mức độ thõa mãn có phân bố giống thành phố hay không ? Bài làm : Nhận xét: Giả thuyết H0: Giả thuyết H1 : Đây toán kiểm định giả thuyết vể tỷ lệ Mức độ thỏa mãn thành phố Mức độ thỏa mãn thành phố khác THỰC HIỆN BÀI TỐN BẰNG EXCEL Nhập giá trị vào bảng tính: Tính tổng số: • Tổng hàng: Chọn E3, nhập =SUM(B3:D3), Enter, dùng trỏ kéo nút tự điều khiển từ điền từ E3 đến E7 • Tổng cột: Chọn B8, nhập =SUM(B3:B7), Enter, dùng trỏ kéo nút tự điều khiển từ B8 đến E7 • Tổng cộng: chọn E8 nhập =SUM(E3:E7) Tính tần số lý thuyết: (tổng hàng*tổng cột)/tổng cộng • A: Chọn B13: nhập =E3*$B$8/$E$8, rùi Enter, dùng trỏ kéo nút tự điều khiển từ B13 đến B17 • B: Chọn C13: nhập =E3*$C$8/$E$8, Enter, dùng trỏ kéo nút tự điều khiển từ C13 đến C17 • C: Chọn D13: nhập =E3*$D$8/$E$8, Enter, dùng trỏ kéo nút tự điều khiển từ D13 đến D17 • Áp dụng hàm số CHITEST tính giá trị Chọn B19, nhập =CHITEST(B3:D7,B13:D17), Enter Kết luận: Bài 5: Biện luận: P(X > χ2)=3,5299.10-13 < 0,03 Bác bỏ giả thuyết H0 Vậy mức độ thỏa mãn thành phố khác Tìm liệu ngẫu nhiên chiều (X, Y) có kích thước n >10 để sử dụng mơ hình hồi quy tuyến tính đơn Thực yêu cầu: 1/ Tìm hệ số tương quan X,Y 2/ Quan hệ X,Y có coi quan hệ tuyến tính hay khơng? Hãy ước lượng đường hồi quy tuyến tính Y theo X biểu thị hình vẽ 3/ Tìm hệ số xác định R2 4/ Tìm sai số chuẩn ước lượng Bài làm * Dạng bài: Hồi quy tuyến tính đa tham số * Số liệu thu thập được: Tìm hệ số tương quan X, Y a Cơ sở lý thuyết - Sự phân tương quan khảo sát khuynh hướng mức độ liên quan, phân tích hồi quy xác định liên quan định lượng hai biến số ngẫu nhiên Y X Hệ số tương quan ước tính biểu thức: - Hệ số tương quan dùng việc đánh giá mức độ liên quan Giá trị |R| 0,90 Mức độ Nghèo nàn Khá Tốt Xuất sắc b Áp dụng MS-EXCEL * Nhập liệu vào bảng tính MS-EXCEL * Sử dụng “Correlation” - Nhấp Data – Data Analysis - Chọn chương trình “Correlation” hộp thoại Data Analysis nhấn nút OK - Trong hộp thoại “Correlation” ấn định chi tiết hình sau, sau nhấn OK: * Kết quả: - Từ bảng kết trả ta rút hệ số tương quan đại lượng X (Tiết diện ruột) Y (Dòng điện cho phép) RX,Y=0,9837 Quan hệ X,Y có coi quan hệ tuyến tính hay khơng? Hãy ước lượng đường hồi quy tuyến tính Y theo X biểu thị hình vẽ a Cơ sở lý thuyết - Đối với phương trình hồi quy ŶX = B0 + BX, ý nghĩa thống kê hệ số B i (B0 hay B) đánh giá trắc nghiệm t (phân phối Student) tính chất thích hợp phương trình ŶX = f(X) đánh giá trắc nghiệm F (phân bố Fischer) Trắc nghiệm t - Giả thiết: H0: βi = “Các hệ số hồi quy khơng có ý nghĩa” H1: βi ≠ “Có vài hệ số hồi quy có ý nghĩa” - Giá trị thống kê: B − βi S2 t= i S = ; n ∑ ( X i − X )2 Sn2 Phân bố Student: γ=N–k–1 - Biện luận: Nếu t t0,05 = 2.365 Bác bỏ giả thiết H0 Trắc nghiệm F: Giả thiết: H0: βi = “Hệ số hồi quy khơng thích hợp” H1: βi ≠ “Hệ số hồi quy thích hợp” Do F = 328,3986 > F0,05(1,10) = 242 Bác bỏ giả thiết H0 Vậy hai hệ số 27,1782(B0) 3,2022(B1) phương trình hồi quy ŶX = 27,1782 + 3,2022X có ý nghĩa thống kê Nói cách khác, phương trình hồi quy thích hợp -Kết luận: Quan hệ X Y xem quan hệ tuyến tính - Ước lượng đường hồi quy tuyến tính Y theo X hình vẽ đồ thị phân tán Line Fit Plot: Tìm hệ số xác định R2 Dựa vào bảng SUMMARY OUTPUT ta có kết hệ số xác định R2 = 0.9676 Tìm sai số chuẩn ước lượng Dựa vào bảng SUMMARY OUTPUT ta có kết sai số chuẩn ước lượng S = 13,5368