(TIỂU LUẬN) tìm một dữ liệu định lượng (a) và một dữ liệu định tính (b) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau

29 3 0
(TIỂU LUẬN) tìm một dữ liệu định lượng (a) và một dữ liệu định tính (b) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH KHOA KHOA HỌC ỨNG DỤNG BỘ MƠN TỐN ỨNG DỤNG BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ ĐỀ TÀI GVHD: NGUYỄN KIỀU DUNG THỰC HIỆN: NHÓM – L08 1) VĂN CÔNG BẰNG - 1410258 2) NGUYỄN KHÁNH BÌNH - 1410284 3) VÕ MINH ĐẠI - 1410756 4) PHAN THẾ HIỀN - 1411231 5) TRẦN VĂN HUY - 1411514 6) BÙI LÊ NGỌC MIN - 1412249 7) ĐẶNG HỒNG NHẬT - 1412670 8) LƯƠNG HÀ PHƯƠNG – 1413016 Thành phố Hồ Chí Minh, tháng 05 năm 2016 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Bài 1: Tìm liệu định lượng (A) liệu định tính (B) thích hợp, sử dụng liệu cho yêu cầu sau: 1) Thực phương pháp phân tổ liệu (A) 2)Vẽ đồ thị phân phối tần số đa giác tần số (A) 3) Tính đặc trưng mẫu ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 91% (A) 4) Trình bày liệu định tính (B) dạng phân loại đồ thị 5) Hãy kiểm định xem liệu (A) (B) có phù hợp với phân bố xác suất hay khơng Bài làm: Dạng bài: Thống kê mô tả Dữ liệu A: Khảo sát 50 sinh viên năm thứ 2, ngành Máy Tính số ngơn ngữ lập trình mà sinh viên sử dụng thành thạo bao gồm (được học tự học) Dữ liệu B: Kết phân ngành sinh viên khoa Máy Tính: Kỹ sư tài Khoa Học Máy Tính Kỹ sư tài Kỹ Thuật Máy Tính Khoa Học Máy Tính Kỹ Thuật Máy Tính Thực phân tổ liệu A: Nhập liệu (A) vào Excel: 1.1 Phân tổ liệu (A) - Xác định số tổ cần chia: k = Nhập vào ô A7 biểu thức: = (2*COUNT(A1:J5))^(1/3) Kết quả: 4.641589, chọn k = Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm - - Xác định trị số khoảng cách h theo công thức + Nhập vào ô B6 công thức: = (MAX(A1:J5)-MIN(A1:J5))/4 + Kết quả: + Chọn h = Xác định cận cận tổ: + Tổ1:0-2 + Tổ2:2-4 + Tổ3:4-6 + Tổ4:6-8 Nhập vào ô K2->K10 giá trị: - Chọn chức Data/Data Analysis/Histogram - Input Range: Địa tuyệt đối chứa liệu - Bin Range: Địa chứa bảng phân nhóm - Output options: Vị trí xuất kết - Chọn Cumulative Percentage để tính tần suất tích lũy khơng Excel tính tần số - Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm - Kết quả: 1.2) Vẽ đồ thị tần số đa giác tần số (A): - Quét bảng tần số B11:B14 - Insert Column Chart - Kết quả: - Vẽ đa giác tần số: + Sử dụng bảng phân phối tần số liệu (A): + Thêm giá trị vào đầu cuối bảng phân phối tần số: Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm + Quét chọn B24:B29, dung chức Insert Line Chart -Kết sau chỉnh sửa: 1.3) Tính mẫu đặc trưng với ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 91% (A) * Nhập liệu vào bảng tính: Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm * Chọn chức Data/Data Analysis/Descriptive Statistics - Input Range: Địa tuyệt đối chứa liệu - Output options: Vị trí xuất kết - Confidence Level for Mean: Độ tin cậy cho trung bình * Kết quả: 1.4) Trình bày liệu định tính (B) dạng phân loại đồ thị Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm * Nhập liệu vào bảng tính * Tính tỉ lệ sinh viên cho ngành: Nhập vào: + C91 = B91/$B$95 + C92 = B92/$B$95 + C93 = B93/$B$95 + C94 = B94/$B$95 Kết quả: * Vẽ biểu đồ đứng thể số lượn sinh viên chuyên ngành - Quét chọn cột Số sinh viên (B2:B7) - Dùng chức Insert/Insert Column Chart/2-D Column menu Insert * Kết quả: Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm * Vẽ biểu đồ tròn thể tỉ lệ sinh viên chuyên ngành: - Quét chịn cột Số sinh viên (C2:C7) - Dùng chức Insert/Insert Pie/2-D menu Insert * Kết quả: Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1.5) Hãy kiểm định xem liệu (A) (B) có phù hợp với phân bố xác suất hay khơng Kiểm định A: Với mức ý nghĩa 1%, coi mẫu A phù hợp với phân phối chuẩn hay không? Giả thuyết kđ H0: Mẫu phù hợp với phân phối chuẩn Giả thuyết đối kđ H1: Mẫu không phù hợp với phân phối chuẩn - Tính đặc trưng mẫu: n = 50 (COUNT(A37:A86) = 3.64 (AVERAGE(A37:A86)) = 2.0274 (STDEVP(A37:A86)) + ước lượng hợp lý cực đại cho a => a = 3.64 + ước lượng hợp lý cực đại cho Với k = 4, r = => Miền bác bỏ: => σ = 2.0274 = 6.6349 (CHISQ.INV(0.99,1)) = (6.6349;+ ∞) Tính tiêu chuẩn kiểm định: Khoảng ni (-∞;2) (2;4) (4;6) (6;+∞) = = 6.7221 => Chấp nhận H1, bác bỏ H0 17 18 0.2 =N 0.3 =N 0.3 =N 0.1 =1 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Bài 3: Sau số liệu loại báo ngày bán quận nội thành: Lượng báo thực bán quận có khác khơng? Lượng báo bán có chịu yếu tố tác động ngày tuần hay không? Kết luận với mức ý nghĩa % 1.Cơ sở lý thuyết: Đây la dang toan phân tich phương sai hai yêu tô (không lăp): 2.Tính toán máy tính: Gia thiêt: H0 – cac gia tri trung binh la băng Đôi gia thiêt: H1 – cac gia tri trung binh la không băng Nhâp dư liêu vao may tinh: Các bước thực hiện: Sử dụng công cụ “Anova: Two – Factor without Replication”: a)Tai nhom lênh Data analysis, chon Anova:Two – Factor without Replication” b)Trong hôp thoai Anova:Two – Factor without Replication, lân lươt ân đinh cac gia tri: Page | 14 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm - Pham vi đâu vao (input range): chon bang tinh ta vưa tao -Nhãn dư liêu (labels in first row/column) -Ngưỡng tin cây: Alpha = 5% = 0.05 -Pham vi đâu (output Range) Sau click Ok thi kêt qua đươc hiên wooksheet mơi: Page | 15 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Nhận xét: Ta thấy FA > F5 (4.305483 > 2.71089) -> Lượng báo bán chịu yếu tố tác động trực tiếp ngày tuần Tương tự, FB > F4 -> Lượng báo bán quận có khác Page | 16 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Bài 4: Ba loại vật liệu thử sức bền ảnh hưởng việc thay đổi nhiệt độ vô lớn, có số liệu: Kết cục Vỡ vụn Bị phá hủy phần Cịn tồn vẹn Hãã̃y kiểm định xem có mối liên hệ phụ thuộc loại vật liệu với tác động thay đổi nhiệt độ không? Sử dụng mức ý nghĩa 2% BÀI LÀM: Dạng bài: Kiểm định giả thiết tỉ lệ Phương pháp giải: Áp dụng Kiểm định chi bình phương Cơng cụ giải: hàm CHITEST Excel Cơ sở lý thuyết: - Trong thống kê, kiểm định chi bình phương hay kiểm tra (đơi đọc "khi bình phương") họ phương pháp kiểm định giả thiết thống kê thống kê kiểm định tuân theo phân bố giả thuyết không Chúng gồm: Kiểm định chi bình phương Pearson Kiểm định chi bình phương Yates Kiểm định chi bình phương Mantel-Haenszel - Dạng thống kê kiểm định thông dụng là: γ2=(o−e) e Với o liệu đo đạc, e giá trị dự đốn xác Xét A gồm r tính trạng, A = (A1, A2, Ar), cá thể tập hợp H có có tính trạng (hay phạm trù) Ai Gọi pi (i = 1, 2, r) tỷ lệ cá thể tính trạng Ai tập hợp H Khi véctơ =(p1 , p2, pr) gọi phân bố A tập hợp H Giả sử (p1, p2, pr) phân bố (A1, A2, Ar) tập hợp H (q1, q2, qr) phân bố A = (A1, A2, Ar) tập hợp Y Ta nói (A1, A2, Ar) có phân bố X Y (p1, p2, pr) = (q1, q2, qr) p1 = q1, pr = qr Chúng ta muốn kiểm định xem A = (A1, A2, Ar) có phân số X Y hay không dựa mẫu ngẫu nhiên rút từ X Y Tổng quát hơn, giả sử ta có k tập hợp H1, H2, Hk Gọi πi=(pi1 , pi2 , … , pir ) phân bố A = (A1, A2, Ar) tập hợp Hi Page | 17 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Ta muốn kiểm định giả thuyết sau: H0 :π =π =…=π (Các phân bố tập hợp Hi) Chú ý H0 tương đương với hệ đẳng thức sau: k {p = p =…= p 1 k 1 p1= p2=…= pk i i i Từ tập hợp chọn mẫu ngẫu nhiên Mẫu ngẫu nhiên chọn từ tập hợp Hi gọi mẫu ngẫu nhiên thứ i (i = 1, 2, k) Giả sử mẫu ngẫu nhiên thứ i: Có n1i cá thể có tính trạng A1 n2i cá thể có tính trạng A2 nri cá thể có tính trạng Ar k Ký hiệu: nio=∑ nij ;noj=∑ nij r j=1i=1 Như n0j kích thước mẫu thứ j, cịn nio tổng số cá thể có tính trạng Ai toàn k mẫu xét: r nio=∑ nio=∑ noj tổng số tất cá thể k mẫu xét i=1 tỷ lệ chung p1, p2, pr ước lượng bởi: ^pi= n io n Đó ước lượng cho xác suất để cá thể có mang tính trạng Ai Khi số cá thể có tính trạng Ai mẫu thứ j xấp xỉ bằng: Các số n^ij n^ij=noj ^pi = noj nio n (i = 1,2, r; j = 1,2, k) gọi tần số lý thuyết (TSLT), số nij gọi tần số quan sát (TSQS) Ta định bác bỏ Ho TSLT cách xa TSQS cách bất thường Khoảng cách Page | 18 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm TSQS TSLT đo test thống kê sau đây: T=∑∑ Người ta chứng minh H0 TSLT không nhỏ T có phân bố xấp xỉ phân bố với (k-1)(r-1) bậc tự Thành thử miền bác bỏ có dạng {T > c} c tìm từ điều kiện P{T > c} = Vậy c phân vị mức phân bố với (k-1)(r-1) bậc tự Đối với thí nghiệm có kết quả, để so sánh tỉ số kết đó, ta dùng kiểm định (chi-quared): r c γ2=∑∑ i=1 j=1 npij: tần số lý thuyết ô (i,j); r: số hàng; c: số cột Dùng hàm CHITEST (actual_range,expected_range) Tính giá trị: P (X > χ2 ) = CHITEST Nếu: P ( X > χ2 ) > ∝thì chấp nhận H0 ngược lại Thực tốn excel: Nhập liệu vào bảng tính tính tổng hàng cột: Tính tần số lý thuyết: tần số lý thuyết = (Tổng hàng × Tổng cột)/(Tổng cộng): Page | 19 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Sử dụng hàm CHITEST tính xác suất P(X> ): Kết biện luận: Giả thiết H0: có mối liên hệ phụ thuộc loại vật liệu với tác động thay đổi nhiệt độ H1: Khơng có mối liên hệ phụ thuộc loại vật liệu với tác động thay đổi nhiệt độ Ta có: P(X> ) = 0.026580894 > α=0.02 Bác bỏ giả thiết H1, chấp nhận giả thiết H0 Vậy: có mối liên hệ phụ thuộc loại vật liệu với tác động thay đổi nhiệt độ Page | 20 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Bài 5: Tìm liệu ngẫu nhiên chiều (X, Y) có kích thước n >10 để sử dụng mơ hình hồi quy tuyến tính đơn Thực yêu cầu: 1) Tìm hệ số tương quan X,Y 2) Quan hệ X,Y có coi quan hệ tuyến tính hay khơng? Hãã̃y ước lượng đường hồi quy tuyến tính Y theo X biểu thị hình vẽ 3) Tìm sai số chuẩn ước lượng Bài làm:  1) Cơ sở lý thuyết : Tìm hệ số tương quan X Y: 2) Quan hệ X Y có coi tuyến tính hay khơng: Giả thiết H0: X Y khơng có tương quan tuyến tính: Page | 21 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm  Ước lượng hồi quy tuyến tính Y theo X: - Cơ sở lý thuyết: - + Giả thiết + Giả thiết nghiệm t < + Trắc + Giả thiết + Giả thiết nghiệm F < F + Trắc Bảng số liệu thời gian thí nghiệm mạch điện tử với cơng suất tiêu thụ tải lấy ngẫu nhiên thiết bị : Thơi gian (phut) Công suât(W) 1) Tìm hệ số tương quan X Y:  Thực Excel: Nhập số liệu vào bảng tính: Chọn chức Data/Data Analysis/Correlation Page | 22 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm  Kết quả: => Ta có hệ số tương quan R = 0.74871046 chứng tỏ thời gian công suất tiêu thụ có quan hệ chặt chẽ có tương quan thuận 2) Quan hệ X,Y có coi quan hệ tuyến tính hay khơng? Nếu có, ước lượng đường hồi quy tuyến tính Y theo X  Thực Excel: Tính T : chọn ô B10 nhập biểu thức =B7*SQRT(10-2)/SQRT(1- B7^2) - Tính c: chọn ô B11 nhập biểu thức =TINV(0.05,8) (c phân vị mức α/2 = 0.025 phân bố Student với n-2=8 bậc tự do) Page | 23 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Vì |T| > c nên bác bỏ giả thiết H0 Vậy: X Y có tương quan tuyến tính  Ước lượng đường hồi quy tuyến tính Y theo X:  Thực Excel: Dùng chức Data/Data Analysis/Regression Page | 24 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Kết quả:  Biện luận: Phương trình hồi quy: = -90.4433 + 11.4218x Hệ số hồi quy: 0.6762> 0.05 => Hệ số tự có ý nghĩa 0.0256< 0.05 => Hệ số x khơng có ý nghĩa => Phương trình hồi quy tuyến tính khơng thích hợp 0.02560< 0.05 3) Tìm hệ số xác định R 2: => Dùng kết từ bảng SUMMARY OUTPUT từ câu ta xác định Page | 25 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm hệ số hồi quy: R2 = 0.5326 4) Tìm sai số chuẩn ước lượng: - Đối với biến tự do: SE = 207.61709 Đối với biến X: SE = 4.0436 -HếtPage | 26 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Page | 27 ... Kê_Nhóm Bài 1: Tìm liệu định lượng (A) liệu định tính (B) thích hợp, sử dụng liệu cho yêu cầu sau: 1) Thực phương pháp phân tổ liệu (A) 2)Vẽ đồ thị phân phối tần số đa giác tần số (A) 3) Tính đặc trưng... Khoa Học Máy Tính Kỹ sư tài Kỹ Thuật Máy Tính Khoa Học Máy Tính Kỹ Thuật Máy Tính Thực phân tổ liệu A: Nhập liệu (A) vào Excel: 1.1 Phân tổ liệu (A) - Xác định số tổ cần chia: k = Nhập vào ô A7 biểu... Tính đặc trưng mẫu ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 91% (A) 4) Trình bày liệu định tính (B) dạng phân loại đồ thị 5) Hãy kiểm định xem liệu (A) (B) có phù hợp với phân

Ngày đăng: 16/12/2022, 14:53

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan