1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Tìm một dữ liệu định lượng (a) và một dữ liệu định tính (b) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau

27 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 27
Dung lượng 917,69 KB

Nội dung

TRƯỜNG ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH KHOA KHOA HỌC ỨNG DỤNG BỘ MƠN TỐN ỨNG DỤNG BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ ĐỀ TÀI GVHD: NGUYỄN KIỀU DUNG THỰC HIỆN: NHÓM – L08 1) VĂN CÔNG BẰNG - 1410258 2) NGUYỄN KHÁNH BÌNH - 1410284 3) VÕ MINH ĐẠI - 1410756 4) PHAN THẾ HIỀN - 1411231 5) TRẦN VĂN HUY - 1411514 6) BÙI LÊ NGỌC MIN - 1412249 7) ĐẶNG HỒNG NHẬT - 1412670 8) LƯƠNG HÀ PHƯƠNG – 1413016 Thành phố Hồ Chí Minh, tháng 05 năm 2016 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Bài 1: Tìm liệu định lượng (A) liệu định tính (B) thích hợp, sử dụng liệu cho yêu cầu sau: 1) Thực phương pháp phân tổ liệu (A) 2)Vẽ đồ thị phân phối tần số đa giác tần số (A) 3) Tính đặc trưng mẫu ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 91% (A) 4) Trình bày liệu định tính (B) dạng phân loại đồ thị 5) Hãy kiểm định xem liệu (A) (B) có phù hợp với phân bố xác suất hay khơng Bài làm: Dạng bài: Thống kê mô tả Dữ liệu A: Khảo sát 50 sinh viên năm thứ 2, ngành Máy Tính số ngơn ngữ lập trình mà sinh viên sử dụng thành thạo bao gồm (được học tự học) 4 2 5 1 3 4 4 5 8 Dữ liệu B: Kết phân ngành sinh viên khoa Máy Tính: Kỹ sư tài Khoa Học Máy Tính 40 Kỹ sư tài Kỹ Thuật Máy Tính 17 Khoa Học Máy Tính 190 Kỹ Thuật Máy Tính 53 Thực phân tổ liệu A: Nhập liệu (A) vào Excel: 1.1 Phân tổ liệu (A) - Xác định số tổ cần chia: k = - Nhập vào ô A7 biểu thức: = (2*COUNT(A1:J5))^(1/3) - Kết quả: 4.641589, chọn k = Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm - Xác định trị số khoảng cách h theo công thức + Nhập vào ô B6 công thức: = (MAX(A1:J5)-MIN(A1:J5))/4 + Kết quả: + Chọn h = - Xác định cận cận tổ: + Tổ 1: - + Tổ 2: - + Tổ 3: - + Tổ 4: - - Nhập vào ô K2->K10 giá trị: - Chọn chức Data/Data Analysis/Histogram - Input Range: Địa tuyệt đối chứa liệu - Bin Range: Địa chứa bảng phân nhóm - Output options: Vị trí xuất kết - Chọn Cumulative Percentage để tính tần suất tích lũy khơng Excel tính tần số Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm - Kết quả: 1.2) Vẽ đồ thị tần số đa giác tần số (A): - Quét bảng tần số B11:B14 - Insert Column Chart - Kết quả: - Vẽ đa giác tần số: + Sử dụng bảng phân phối tần số liệu (A): + Thêm giá trị vào đầu cuối bảng phân phối tần số: Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm + Quét chọn B24:B29, dung chức Insert Line Chart - Kết sau chỉnh sửa: 1.3) Tính mẫu đặc trưng với ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 91% (A) * Nhập liệu vào bảng tính: Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm * Chọn chức Data/Data Analysis/Descriptive Statistics - Input Range: Địa tuyệt đối chứa liệu - Output options: Vị trí xuất kết - Confidence Level for Mean: Độ tin cậy cho trung bình * Kết quả: 1.4) Trình bày liệu định tính (B) dạng phân loại đồ thị Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm * Nhập liệu vào bảng tính * Tính tỉ lệ sinh viên cho ngành: Nhập vào: + C91 = B91/$B$95 + C92 = B92/$B$95 + C93 = B93/$B$95 + C94 = B94/$B$95 Kết quả: * Vẽ biểu đồ đứng thể số lượn sinh viên chuyên ngành - Quét chọn cột Số sinh viên (B2:B7) - Dùng chức Insert/Insert Column Chart/2-D Column menu Insert * Kết quả: Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm * Vẽ biểu đồ tròn thể tỉ lệ sinh viên chuyên ngành: - Quét chịn cột Số sinh viên (C2:C7) - Dùng chức Insert/Insert Pie/2-D menu Insert * Kết quả: Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1.5) Hãy kiểm định xem liệu (A) (B) có phù hợp với phân bố xác suất hay khơng Kiểm định A: Với mức ý nghĩa 1%, coi mẫu A phù hợp với phân phối chuẩn hay không? Giả thuyết kđ H0: Mẫu phù hợp với phân phối chuẩn Giả thuyết đối kđ H1: Mẫu không phù hợp với phân phối chuẩn - Tính đặc trưng mẫu: n = 50 (COUNT(A37:A86) = 3.64 (AVERAGE(A37:A86)) = 2.0274 (STDEVP(A37:A86)) + ước lượng hợp lý cực đại cho a => a = 3.64 + ước lượng hợp lý cực đại cho Với k = 4, r = => Miền bác bỏ: => σ = 2.0274 = 6.6349 (CHISQ.INV(0.99,1)) = (6.6349;+ ∞) Tính tiêu chuẩn kiểm định: Khoảng ni (-∞;2) 17 (2;4) 18 (4;6) (6;+∞) = Pi= P( ) – P( ) (Hàm NORMSDIST) 0.2093 =NORM.S.DIST((2-A118)/A120,TRUE) – 0.3612 =NORM.S.DIST((4-A118)/A120,TRUE)-NORM.S.DIST((2-A118)/A120,TRUE) 0.3073 =NORM.S.DIST((6-A118)/A120,TRUE)-NORM.S.DIST((4-A118)/A120,TRUE) 0.1222 =1 - NORM.S.DIST((6-A118)/A120,TRUE) = 6.7221 => Chấp nhận H1, bác bỏ H0 =(1/A119)*((B124^2/C124)+(B125^2/C125)+(B126^2/C126)+(B127^2/C127))-A119 Vậy Mẫu (A) khơng có phân phổi chuẩn 10 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm - Vào Data/Data Analysis/ t-test: Paired Two Sample for Means - Chọn mục hình: + Input: địa tuyệt đối chứa liệu tương ứng mẫu + Output options: vị trí xuất kết + Apha: mức ý nghĩa α * Kết quả: - Biện luận:Giả thuyết H0: “Doanh số bán cửa hàng tháng nhau” H1: “Doanh số bán cửa hàng tháng khác nhau” = 1.2400 < giả thuyết H0 = 2.4907 => Chấp nhận Vậy doanh số bán hang tháng Giá trị P cần tìm: P = 0.2408 13 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Bài 3: Sau số liệu loại báo ngày bán quận nội thành: Ngày khảo sát Các quận nội thành Quận Quận Quận Quận Quận Thứ hai 254 236 267 223 245 Thứ ba 245 212 256 213 234 Thứ tư 236 223 245 230 232 Thứ năm 235 197 243 213 224 Thứ sáu 250 210 232 215 233 Thứ bảy 247 196 223 207 242 Lượng báo thực bán quận có khác khơng? Lượng báo bán có chịu yếu tố tác động ngày tuần hay không? Kết luận với mức ý nghĩa % 1.Cơ sở lý thuyết: Đây là dạng toán phân tích phương sai hai yếu tố (không lặp): 2.Tính toán máy tính: Giả thiết: H0 – các giá trị trung bình là bằng Đối giả thiết: H1 – các giá trị trung bình là không bằng Nhập dữ liệu vào máy tính: Các bước thực hiện: Sử dụng công cụ “Anova: Two – Factor without Replication”: a)Tại nhóm lệnh Data analysis, chọn Anova:Two – Factor without Replication” b)Trong hộp thoại Anova:Two – Factor without Replication, lần lượt ấn định các giá trị: Page | 14 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm - Phạm vi đầu vào (input range): chọn bảng tính ta vừa tạo -Nhãn dữ liệu (labels in first row/column) -Ngưỡng tin cậy: Alpha = 5% = 0.05 -Phạm vi đầu (output Range) Sau click Ok thì kết quả được hiện wooksheet mới: Page | 15 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Nhận xét: Ta thấy FA > F5 (4.305483 > 2.71089) -> Lượng báo bán chịu yếu tố tác động trực tiếp ngày tuần Tương tự, FB > F4 -> Lượng báo bán quận có khác Page | 16 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Bài 4: Ba loại vật liệu thử sức bền ảnh hưởng việc thay đổi nhiệt độ vô lớn, có số liệu: Kết cục Vật liệu Vật liệu Vật liệu Vỡ vụn 25 45 41 Bị phá hủy phần 40 35 33 Cịn tồn vẹn 35 20 26 Hãy kiểm định xem có mối liên hệ phụ thuộc loại vật liệu với tác động thay đổi nhiệt độ không? Sử dụng mức ý nghĩa 2% BÀI LÀM: Dạng bài: Kiểm định giả thiết tỉ lệ Phương pháp giải: Áp dụng Kiểm định chi bình phương 2 Cơng cụ giải: hàm CHITEST Excel Cơ sở lý thuyết: - Trong thống kê, kiểm định chi bình phương hay kiểm tra 2 (đơi đọc "khi bình phương") họ phương pháp kiểm định giả thiết thống kê thống kê kiểm định tuân theo phân bố 2 giả thuyết khơng Chúng gồm: Kiểm định chi bình phương Pearson Kiểm định chi bình phương Yates Kiểm định chi bình phương Mantel-Haenszel  - Dạng thống kê kiểm định thông dụng là: ( o−e) γ 2= e Với o liệu đo đạc, e giá trị dự đốn xác Xét A gồm r tính trạng, A = (A1, A2, Ar), cá thể tập hợp H có có tính trạng (hay phạm trù) Ai Gọi pi (i = 1, 2, r) tỷ lệ cá thể tính trạng Ai tập hợp H Khi véctơ =(p1 , p2, pr) gọi phân bố A tập hợp H Giả sử (p1, p2, pr) phân bố (A1, A2, Ar) tập hợp H (q1, q2, qr) phân bố A = (A1, A2, Ar) tập hợp Y Ta nói (A1, A2, Ar) có phân bố X Y (p1, p2, pr) = (q1, q2, qr) p1 = q1, pr = qr Chúng ta muốn kiểm định xem A = (A1, A2, Ar) có phân số X Y hay không dựa mẫu ngẫu nhiên rút từ X Y Tổng quát hơn, giả sử ta có k tập hợp H1, H2, Hk Gọi π i=(p i1 , pi2 , … , pir ) phân bố A = (A1, A2, Ar) tập hợp Hi Page | 17 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Ta muốn kiểm định giả thuyết sau: H :π =π =…=π (Các phân bố tập hợp Hi) Chú ý H0 tương đương với hệ đẳng thức sau: k { p 11= p21=…= pk1 p 12= p22=…= pk2 k p i = pi =…= pi p 1r = p2r =…= pkr Từ tập hợp chọn mẫu ngẫu nhiên Mẫu ngẫu nhiên chọn từ tập hợp Hi gọi mẫu ngẫu nhiên thứ i (i = 1, 2, k) Giả sử mẫu ngẫu nhiên thứ i: Có n1i cá thể có tính trạng A1 n2i cá thể có tính trạng A2 nri cá thể có tính trạng Ar k r j=1 i=1 Ký hiệu: nio =∑ nij ; n oj =∑ nij Như n0j kích thước mẫu thứ j, cịn nio tổng số cá thể có tính trạng Ai tồn k mẫu xét: r k i=1 j=1 nio =∑ nio =∑ n oj tổng số tất cá thể k mẫu xét { Nếu giả thiết H0 nghĩa là: k p 1= p1=…= p1= p1 p 12= p22=…= pk2= p2 k −−−−−−−−−−−¿ p i = pi =…= pi = p i −−−−−−−−−−−¿ p1r = p2r =…= prk = pr tỷ lệ chung p1, p2, pr ước lượng bởi: ^ pi= nio n Đó ước lượng cho xác suất để cá thể có mang tính trạng Ai Khi số cá thể có tính trạng Ai mẫu thứ j xấp xỉ bằng: n oj nio n Các số n^ij (i = 1,2, r; j = 1,2, k)được gọi tần số lý thuyết (TSLT), số nij gọi tần số quan sát (TSQS) Ta định bác bỏ Ho TSLT cách xa TSQS cách bất thường Khoảng cách n^ij =noj ^ pi = Page | 18 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm TSQS TSLT đo test thống kê sau đây: k r ( n −n^ )2 (TSQS −TSLT ) T =∑ ∑ ij ij =∑ n^ij TSLT f =1 i=1 Người ta chứng minh H0 TSLT khơng nhỏ T có phân bố xấp xỉ phân bố với (k-1)(r-1) bậc tự Thành thử miền bác bỏ có dạng {T > c} c tìm từ điều kiện P{T > c} =  Vậy c phân vị mức của phân bố 2 với (k1)(r-1) bậc tự Đối với thí nghiệm có kết quả, để so sánh tỉ số kết đó, ta dùng kiểm định 2 (chi-quared): r c (n −n^ ) tổng hàng x tổng cột nij: tần số thực nghiệm; γ 2=∑ ∑ ij ij với n pi= n^ij n i=1 j=1 npij: tần số lý thuyết ô (i,j); r: số hàng; c: số cột Dùng hàm CHITEST (actual_range,expected_range) Tính giá trị: P ( X > χ ) = CHITEST Nếu: P ( X > χ ) > ∝thì chấp nhận H0 ngược lại Thực toán excel: Nhập liệu vào bảng tính tính tổng hàng cột: Tính tần số lý thuyết: tần số lý thuyết = (Tổng hàng × Tổng cột)/(Tổng cộng): Page | 19 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Sử dụng hàm CHITEST tính xác suất P(X> 2 ): Kết biện luận: Giả thiết H0: có mối liên hệ phụ thuộc loại vật liệu với tác động thay đổi nhiệt độ H1: Khơng có mối liên hệ phụ thuộc loại vật liệu với tác động thay đổi nhiệt độ Ta có: P(X> 2 ) = 0.026580894 > α=0.02 Bác bỏ giả thiết H1, chấp nhận giả thiết H0 Vậy: có mối liên hệ phụ thuộc loại vật liệu với tác động thay đổi nhiệt độ Page | 20 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Bài 5: Tìm liệu ngẫu nhiên chiều (X, Y) có kích thước n >10 để sử dụng mơ hình hồi quy tuyến tính đơn Thực yêu cầu: 1) Tìm hệ số tương quan X,Y 2) Quan hệ X,Y có coi quan hệ tuyến tính hay khơng? Hãy ước lượng đường hồi quy tuyến tính Y theo X biểu thị hình vẽ 3) Tìm sai số chuẩn ước lượng Bài làm:  1) Cơ sở lý thuyết : Tìm hệ số tương quan X Y: 2) Quan hệ X Y có coi tuyến tính hay khơng: Giả thiết H0: X Y khơng có tương quan tuyến tính: Page | 21 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm  Ước lượng hồi quy tuyến tính Y theo X: - Cơ sở lý thuyết: - Phương trình hồi quy tuyến tính: 𝑦̅𝑥 = 𝑎 + 𝑏𝑥, 𝑎 = 𝑟 - ,𝑏= − 𝑎𝑥̅ Kiểm định hệ số a,b : + Giả thiết 𝐻0: Hệ số hồi quy ý nghĩa (=0) + Giả thiết 𝐻1: Hệ số hồi quy có ý nghĩa (≠ 0) + Trắc nghiệm t < 𝑡𝛼,𝑛−2: chấp nhận 𝐻0 - Kiểm định phương trình hồi quy: + Giả thiết 𝐻0: “Phương trình hồi quy tuyến tính khơng thích hợp.” + Giả thiết 𝐻1: “Phương trình hồi quy tuyến tính thích hợp.” + Trắc nghiệm F < F𝛼,1,𝑛−2: chấp nhận 𝐻0 Bảng số liệu thời gian thí nghiệm mạch điện tử với cơng suất tiêu thụ tải lấy ngẫu nhiên thiết bị : Thời gian (phút) Công suất(W) 12 150 34 120 20 600 30 122 45 148 72 700 20 120 56 346 70 900 75 950 1) Tìm hệ số tương quan X Y:  Thực Excel:  Nhập số liệu vào bảng tính:  Chọn chức Data/Data Analysis/Correlation Page | 22 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm  Kết quả: => Ta có hệ số tương quan R = 0.74871046 chứng tỏ thời gian cơng suất tiêu thụ có quan hệ chặt chẽ có tương quan thuận 2) Quan hệ X,Y có coi quan hệ tuyến tính hay khơng? Nếu có, ước lượng đường hồi quy tuyến tính Y theo X  Thực Excel: - Tính T : chọn ô B10 nhập biểu thức =B7*SQRT(10-2)/SQRT(1- B7^2) - Tính c: chọn B11 nhập biểu thức =TINV(0.05,8) (c phân vị mức α/2 = 0.025 phân bố Student với n-2=8 bậc tự do) Page | 23 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Vì |T| > c nên bác bỏ giả thiết H0 Vậy: X Y có tương quan tuyến tính  Ước lượng đường hồi quy tuyến tính Y theo X:  Thực Excel:  Dùng chức Data/Data Analysis/Regression Page | 24 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm  Kết quả:  Biện luận: Phương trình hồi quy: = -90.4433 + 11.4218x Hệ số hồi quy: 0.6762> 0.05 => Hệ số tự có ý nghĩa 0.0256< 0.05 => Hệ số x khơng có ý nghĩa => Phương trình hồi quy tuyến tính khơng thích hợp 0.02560< 0.05 3) Tìm hệ số xác định R2: => Dùng kết từ bảng SUMMARY OUTPUT từ câu ta xác định Page | 25 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm hệ số hồi quy: R2 = 0.5326 4) Tìm sai số chuẩn ước lượng: - Đối với biến tự do: SE = 207.61709 Đối với biến X: SE = 4.0436 -HếtPage | 26 Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm Page | 27 ... Kê_Nhóm Bài 1: Tìm liệu định lượng (A) liệu định tính (B) thích hợp, sử dụng liệu cho yêu cầu sau: 1) Thực phương pháp phân tổ liệu (A) 2)Vẽ đồ thị phân phối tần số đa giác tần số (A) 3) Tính đặc trưng... Máy Tính: Kỹ sư tài Khoa Học Máy Tính 40 Kỹ sư tài Kỹ Thuật Máy Tính 17 Khoa Học Máy Tính 190 Kỹ Thuật Máy Tính 53 Thực phân tổ liệu A: Nhập liệu (A) vào Excel: 1.1 Phân tổ liệu (A) - Xác định. .. Tính đặc trưng mẫu ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 91% (A) 4) Trình bày liệu định tính (B) dạng phân loại đồ thị 5) Hãy kiểm định xem liệu (A) (B) có phù hợp với phân

Ngày đăng: 15/03/2022, 15:55

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w