Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
0,96 MB
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH KHOA KHOA HỌC ỨNG DỤNG BỘ MƠN TỐN ỨNG DỤNG BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ ĐỀ TÀI GVHD: NGUYỄN KIỀU DUNG THỰC HIỆN: NHÓM – L08 1) VĂN CÔNG BẰNG - 1410258 2) NGUYỄN KHÁNH BÌNH - 1410284 3) VÕ MINH ĐẠI - 1410756 4) PHAN THẾ HIỀN - 1411231 5) TRẦN VĂN HUY - 1411514 6) BÙI LÊ NGỌC MIN - 1412249 7) ĐẶNG HỒNG NHẬT - 1412670 8) LƯƠNG HÀ PHƯƠNG – 1413016 Thành phố Hồ Chí Minh, tháng 05 năm 2016 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Bài 1: Tìm liệu định lượng (A) liệu định tính (B) thích hợp, sử dụng liệu cho yêu cầu sau: 1) Thực phương pháp phân tổ liệu (A) 2)Vẽ đồ thị phân phối tần số đa giác tần số (A) 3) Tính đặc trưng mẫu ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 91% (A) 4) Trình bày liệu định tính (B) dạng phân loại đồ thị 5) Hãy kiểm định xem liệu (A) (B) có phù hợp với phân bố xác suất hay khơng Bài làm: Dạng bài: Thống kê mô tả Dữ liệu A: Khảo sát 50 sinh viên năm thứ 2, ngành Máy Tính số ngơn ngữ lập trình mà sinh viên sử dụng thành thạo bao gồm (được học tự học) 4 2 5 1 3 4 4 5 8 Dữ liệu B: Kết phân ngành sinh viên khoa Máy Tính: Kỹ sư tài Khoa Học Máy Tính 40 Kỹ sư tài Kỹ Thuật Máy Tính 17 Khoa Học Máy Tính 190 Kỹ Thuật Máy Tính 53 Thực phân tổ liệu A: Nhập liệu (A) vào Excel: 1.1 Phân tổ liệu (A) - Xác định số tổ cần chia: k = - Nhập vào ô A7 biểu thức: = (2*COUNT(A1:J5))^(1/3) - Kết quả: 4.641589, chọn k = Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm - Xác định trị số khoảng cách h theo công thức + Nhập vào ô B6 công thức: = (MAX(A1:J5)-MIN(A1:J5))/4 + Kết quả: + Chọn h = - Xác định cận cận tổ: + Tổ 1: - + Tổ 2: - + Tổ 3: - + Tổ 4: - - Nhập vào ô K2->K10 giá trị: - Chọn chức Data/Data Analysis/Histogram - Input Range: Địa tuyệt đối chứa liệu - Bin Range: Địa chứa bảng phân nhóm - Output options: Vị trí xuất kết - Chọn Cumulative Percentage để tính tần suất tích lũy khơng Excel tính tần số Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm - Kết quả: 1.2) Vẽ đồ thị tần số đa giác tần số (A): - Quét bảng tần số B11:B14 - Insert Column Chart - Kết quả: - Vẽ đa giác tần số: + Sử dụng bảng phân phối tần số liệu (A): + Thêm giá trị vào đầu cuối bảng phân phối tần số: Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm + Quét chọn B24:B29, dung chức Insert Line Chart - Kết sau chỉnh sửa: 1.3) Tính mẫu đặc trưng với ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 91% (A) * Nhập liệu vào bảng tính: Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm * Chọn chức Data/Data Analysis/Descriptive Statistics - Input Range: Địa tuyệt đối chứa liệu - Output options: Vị trí xuất kết - Confidence Level for Mean: Độ tin cậy cho trung bình * Kết quả: 1.4) Trình bày liệu định tính (B) dạng phân loại đồ thị Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm * Nhập liệu vào bảng tính * Tính tỉ lệ sinh viên cho ngành: Nhập vào: + C91 = B91/$B$95 + C92 = B92/$B$95 + C93 = B93/$B$95 + C94 = B94/$B$95 Kết quả: * Vẽ biểu đồ đứng thể số lượn sinh viên chuyên ngành - Quét chọn cột Số sinh viên (B2:B7) - Dùng chức Insert/Insert Column Chart/2-D Column menu Insert * Kết quả: Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm * Vẽ biểu đồ tròn thể tỉ lệ sinh viên chuyên ngành: - Quét chịn cột Số sinh viên (C2:C7) - Dùng chức Insert/Insert Pie/2-D menu Insert * Kết quả: Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1.5) Hãy kiểm định xem liệu (A) (B) có phù hợp với phân bố xác suất hay khơng Kiểm định A: Với mức ý nghĩa 1%, coi mẫu A phù hợp với phân phối chuẩn hay không? Giả thuyết kđ H0: Mẫu phù hợp với phân phối chuẩn Giả thuyết đối kđ H1: Mẫu không phù hợp với phân phối chuẩn - Tính đặc trưng mẫu: n = 50 (COUNT(A37:A86) = 3.64 (AVERAGE(A37:A86)) = 2.0274 (STDEVP(A37:A86)) + ước lượng hợp lý cực đại cho a => a = 3.64 + ước lượng hợp lý cực đại cho Với k = 4, r = => Miền bác bỏ: => σ = 2.0274 = 6.6349 (CHISQ.INV(0.99,1)) = (6.6349;+ ∞) Tính tiêu chuẩn kiểm định: Khoảng ni (-∞;2) 17 (2;4) 18 (4;6) (6;+∞) = Pi= P( ) – P( ) (Hàm NORMSDIST) 0.2093 =NORM.S.DIST((2-A118)/A120,TRUE) – 0.3612 =NORM.S.DIST((4-A118)/A120,TRUE)-NORM.S.DIST((2-A118)/A120,TRUE) 0.3073 =NORM.S.DIST((6-A118)/A120,TRUE)-NORM.S.DIST((4-A118)/A120,TRUE) 0.1222 =1 - NORM.S.DIST((6-A118)/A120,TRUE) = 6.7221 => Chấp nhận H1, bác bỏ H0 =(1/A119)*((B124^2/C124)+(B125^2/C125)+(B126^2/C126)+(B127^2/C127))-A119 Vậy Mẫu (A) khơng có phân phổi chuẩn 10 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Bài 2: Theo dõi doanh số bán hàng ( triệu đồng/ ngày) cửa hàng 12 ngày tháng 12 ngày tháng 10, người ta thu kết sau: Ngày tháng 10 13 17 20 24 27 Tháng 7.6 10.2 9.3 4.4 3.2 5.6 6.3 7.4 8.4 3.9 7.2 Tháng 10 6.3 8.8 5.1 4.2 4.1 5.8 6.3 6.7 5.6 6.7 Với mức ý nghĩa 3%, cho doanh số bán trung bình hàng ngày tháng 10 30 6.5 6.7 có giảm sút so với tháng hay khơng? Tìm thêm giá trị P kiểm định Bài làm: * Dạng bài: So sánh trung bình với cặp liệu Đặt : Doanh số bán hàng tháng : Doanh số bán hàng tháng 10 * Công cụ: t-test Paired Two Sample for Means - Giả thiết đặt kiểm định hai bên: H0: H1: * Thực toán Excel: - Nhập liệu vào bảng tính: 12 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm - Vào Data/Data Analysis/ t-test: Paired Two Sample for Means - Chọn mục hình: + Input: địa tuyệt đối chứa liệu tương ứng mẫu + Output options: vị trí xuất kết + Apha: mức ý nghĩa α * Kết quả: - Biện luận:Giả thuyết H0: “Doanh số bán cửa hàng tháng nhau” H1: “Doanh số bán cửa hàng tháng khác nhau” = 1.2400 < giả thuyết H0 = 2.4907 => Chấp nhận Vậy doanh số bán hang tháng Giá trị P cần tìm: P = 0.2408 13 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Bài 3: Sau số liệu loại báo ngày bán quận nội thành: Ngày khảo sát Các quận nội thành Quận Quận Quận Quận Quận Thứ hai 254 236 267 223 245 Thứ ba 245 212 256 213 234 Thứ tư 236 223 245 230 232 Thứ năm 235 197 243 213 224 Thứ sáu 250 210 232 215 233 Thứ bảy 247 196 223 207 242 Lượng báo thực bán quận có khác khơng? Lượng báo bán có chịu yếu tố tác động ngày tuần hay không? Kết luận với mức ý nghĩa % 1.Cơ sở lý thuyết: Đây là dạng toán phân tích phương sai hai yếu tố (không lặp): 2.Tính toán máy tính: Giả thiết: H0 – các giá trị trung bình là bằng Đối giả thiết: H1 – các giá trị trung bình là không bằng Nhập dữ liệu vào máy tính: Các bước thực hiện: Sử dụng công cụ “Anova: Two – Factor without Replication”: a)Tại nhóm lệnh Data analysis, chọn Anova:Two – Factor without Replication” b)Trong hộp thoại Anova:Two – Factor without Replication, lần lượt ấn định các giá trị: Page | 14 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm - Phạm vi đầu vào (input range): chọn bảng tính ta vừa tạo -Nhãn dữ liệu (labels in first row/column) -Ngưỡng tin cậy: Alpha = 5% = 0.05 -Phạm vi đầu (output Range) Sau click Ok thì kết quả được hiện wooksheet mới: Page | 15 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Nhận xét: Ta thấy FA > F5 (4.305483 > 2.71089) -> Lượng báo bán chịu yếu tố tác động trực tiếp ngày tuần Tương tự, FB > F4 -> Lượng báo bán quận có khác Page | 16 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Bài 4: Ba loại vật liệu thử sức bền ảnh hưởng việc thay đổi nhiệt độ vô lớn, có số liệu: Kết cục Vật liệu Vật liệu Vật liệu Vỡ vụn 25 45 41 Bị phá hủy phần 40 35 33 Cịn tồn vẹn 35 20 26 Hãy kiểm định xem có mối liên hệ phụ thuộc loại vật liệu với tác động thay đổi nhiệt độ không? Sử dụng mức ý nghĩa 2% BÀI LÀM: Dạng bài: Kiểm định giả thiết tỉ lệ Phương pháp giải: Áp dụng Kiểm định chi bình phương 2 Cơng cụ giải: hàm CHITEST Excel Cơ sở lý thuyết: - Trong thống kê, kiểm định chi bình phương hay kiểm tra 2 (đơi đọc "khi bình phương") họ phương pháp kiểm định giả thiết thống kê thống kê kiểm định tuân theo phân bố 2 giả thuyết khơng Chúng gồm: Kiểm định chi bình phương Pearson Kiểm định chi bình phương Yates Kiểm định chi bình phương Mantel-Haenszel - Dạng thống kê kiểm định thông dụng là: 2 ( o−e) γ= e Với o liệu đo đạc, e giá trị dự đốn xác Xét A gồm r tính trạng, A = (A1, A2, Ar), cá thể tập hợp H có có tính trạng (hay phạm trù) Ai Gọi pi (i = 1, 2, r) tỷ lệ cá thể tính trạng Ai tập hợp H Khi véctơ =(p1 , p2, pr) gọi phân bố A tập hợp H Giả sử (p1, p2, pr) phân bố (A1, A2, Ar) tập hợp H (q1, q2, qr) phân bố A = (A1, A2, Ar) tập hợp Y Ta nói (A1, A2, Ar) có phân bố X Y (p1, p2, pr) = (q1, q2, qr) p1 = q1, pr = qr Chúng ta muốn kiểm định xem A = (A1, A2, Ar) có phân số X Y hay không dựa mẫu ngẫu nhiên rút từ X Y Tổng quát hơn, giả sử ta có k tập hợp H1, H2, Hk Gọi π i=(p i1 , pi2 , … , pir ) phân bố A = (A1, A2, Ar) tập hợp Hi Ta muốn kiểm định giả thuyết sau: Page | 17 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1 k H :π =π =…=π (Các phân bố tập hợp Hi) Chú ý H0 tương đương với hệ đẳng thức sau: { k p 1= p1=…= p1 k p 2= p2=…= p2 k p i = pi =…= pi k p r = pr =…= pr Từ tập hợp chọn mẫu ngẫu nhiên Mẫu ngẫu nhiên chọn từ tập hợp Hi gọi mẫu ngẫu nhiên thứ i (i = 1, 2, k) Giả sử mẫu ngẫu nhiên thứ i: Có n1i cá thể có tính trạng A1 n2i cá thể có tính trạng A2 nri cá thể có tính trạng Ar k r j=1 i=1 Ký hiệu: nio =∑ nij ; n oj =∑ nij Như n0j kích thước mẫu thứ j, cịn nio tổng số cá thể có tính trạng Ai tồn k mẫu xét: r k i=1 j=1 nio =∑ nio =∑ n oj tổng số tất cá thể k mẫu xét { Nếu giả thiết H0 nghĩa là: k p 1= p1=…= p1= p 1 k p 2= p2=…= p2= p 2 k −−−−−−−−−−−¿ pi = pi =…= pi =p i k −−−−−−−−−−−¿ pr = pr =…= p r = pr tỷ lệ chung p1, p2, pr ước lượng bởi: ^ pi= nio n Đó ước lượng cho xác suất để cá thể có mang tính trạng Ai Khi số cá thể có tính trạng Ai mẫu thứ j xấp xỉ bằng: n oj nio n Các số n^ij (i = 1,2, r; j = 1,2, k)được gọi tần số lý thuyết (TSLT), số nij gọi tần số quan sát (TSQS) Ta định bác bỏ Ho TSLT cách xa TSQS cách bất thường Khoảng cách TSQS TSLT đo test thống kê sau đây: k r ( nij −n^ij )2 (TSQS −TSLT ) T =∑ ∑ =∑ n^ij TSLT f =1 i=1 n^ij =noj ^ pi= Page | 18 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Người ta chứng minh H0 TSLT không nhỏ T có phân bố xấp xỉ phân bố với (k-1)(r-1) bậc tự Thành thử miền bác bỏ có dạng {T > c} c tìm từ điều kiện P{T > c} = Vậy c phân vị mức của phân bố 2 với (k1)(r-1) bậc tự Đối với thí nghiệm có kết quả, để so sánh tỉ số kết đó, ta dùng kiểm định 2 (chi-quared): r c (n −n^ ) tổnghàng x tổngcột nij: tần số thực nghiệm; γ 2=∑ ∑ ij ij với n pi= n^ij n i=1 j=1 npij: tần số lý thuyết ô (i,j); r: số hàng; c: số cột Dùng hàm CHITEST (actual_range,expected_range) Tính giá trị: P ( X > χ ) = CHITEST Nếu: P ( X > χ ) > ∝thì chấp nhận H0 ngược lại Thực toán excel: Nhập liệu vào bảng tính tính tổng hàng cột: Tính tần số lý thuyết: tần số lý thuyết = (Tổng hàng × Tổng cột)/(Tổng cộng): Page | 19 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Sử dụng hàm CHITEST tính xác suất P(X> 2 ): Kết biện luận: Giả thiết H0: có mối liên hệ phụ thuộc loại vật liệu với tác động thay đổi nhiệt độ H1: Khơng có mối liên hệ phụ thuộc loại vật liệu với tác động thay đổi nhiệt độ Ta có: P(X> 2 ) = 0.026580894 > α=0.02 Bác bỏ giả thiết H1, chấp nhận giả thiết H0 Vậy: có mối liên hệ phụ thuộc loại vật liệu với tác động thay đổi nhiệt độ Page | 20