BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ ĐỀ TÀI 01 GVHD: NGUYỄN KIỀU DUNG NHÓM: 1 Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1) Thực hiện phương pháp phân tổ dữ liệu (A). 2) Vẽ biểu đồ histogram ( biểu đồ phân bố tần số), biểu đồ tích lũy tần số, biểu đồ mật độ với dữ liệu (A). 3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 91% với dữ liệu (A). 4) Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. 5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không ( lưu ý phải sử dụng các hàm thống kê trong excel). Dữ liệu định lượng A: Khảo sát 20 đoạn đường betong chiều dài 1200 m, rộng 3 m, dày 10cm, để biết được số bao xi măng cần dùng để thi công các đoạn đường ấy 2450 2578 2752 2456 2766 2759 2812 2891 2672 2678 2563 2684 2558 2795 2739 2794 2678 2565 2657 2864 Dữ liệu định tính B: Khảo sát hãng xi măng ưa dùng của 1000 hộ dân TT Tên hãng 1 Xi măng Thăng Long 137 2 Xi măng Hạ Long 119 3 Xi măng Holcim 269 4 Xi măng Hà Tiên Đa dụng xây tô 253 5 Xi măng Fico 76 6 Xi măng Nghi Sơn 146 1.1 Phân tổ dữ liệu A: Nhập dữ liệu A vào excel Xác định số tổ cần chia Nhập vào ô A7 biểu thức: =(2COUNT(A2:E5))(13) ta được kết quả như hình: Kết quả 3.419952 .Suy ra chọn k=3 Xác định trị số khoảng cách h theo công thức h = Nhập vào ô B7 công thức =(MAX(A2:E5)MIN(A2:E5))3 ta được kết quả như hình: Suy ra h=147 Vì k=3 nên có 3 tổ, ta cần xác định cận trên và cận dưới của 3 tổ: Tổ 1: 24502597 Tổ 2: 25972744 Tổ 3: 27442891 Nhập vào ô G2 đến G4 các giá trị như hình: Chọn chức năng DataData AnalysisHistogram. Input Range: Địa chỉ tuyệt đối chứa dữ liệu Bin Range: Địa chỉ chứa bảng phân nhóm. Output options: Vị trí xuất kết quả. Confidence Level for Mean: độ tin cậy cho trung bình. Chọn Cumulative Percentage để tính tần suất tích lũy nếu không Excel chỉ tính tần số Kết quả: 1.2 Vẽ biểu đồ histogram ( biểu đồ phân bố tần số), biểu đồ tích lũy tần số, biểu đồ mật độ với dữ liệu (A) • Vẽ biểu đồ Phân Bố Tần Số Quét bảng tần số Insert Column Chart Kết quả:
TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM KHOA KỸ THUẬT XÂY DỰNG BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ ĐỀ TÀI 01 GVHD: NGUYỄN KIỀU DUNG NHÓM: Bài 1: Tìm liệu định lượng (A) liệu định tính (B) thích hợp, sử dụng liệu cho yêu cầu sau: 1) Thực phương pháp phân tổ liệu (A) 2) Vẽ biểu đồ histogram ( biểu đồ phân bố tần số), biểu đồ tích lũy tần số, biểu đồ mật độ với liệu (A) 3) Tính đặc trưng mẫu ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 91% với liệu (A) 4) Trình bày liệu định tính (B) dạng phân loại đồ thị 5) Hãy kiểm định xem liệu (A) (B) có phù hợp với phân bố xác suất hay khơng ( lưu ý phải sử dụng hàm thống kê excel) Dữ liệu định lượng A: Khảo sát 20 đoạn đường betong chiều dài 1200 m, rộng m, dày 10cm, để biết số bao xi măng cần dùng để thi công đoạn đường 2450 2578 2752 2456 2766 2759 2812 2891 2672 2678 2563 2684 2558 2795 2739 2794 2678 2565 2657 2864 Dữ liệu định tính B: Khảo sát hãng xi măng ưa dùng 1000 hộ dân TT Tên hãng Xi măng Thăng Long 137 Xi măng Hạ Long 119 Xi măng Holcim 269 Xi măng Hà Tiên Đa dụng / xây tô 253 Xi măng Fico 76 Xi măng Nghi Sơn 146 Phân tổ liệu A: Nhập liệu A vào excel -Xác định số tổ cần chia - Nhập vào ô A7 biểu thức: =(2*COUNT(A2:E5))^(1/3) ta kết hình: - Kết 3.419952 Suy chọn k=3 - Xác định trị số khoảng cách h theo công thức h = -Nhập vào ô B7 công thức =(MAX(A2:E5)-MIN(A2:E5))/3 ta kết hình: Suy h=147 -Vì k=3 nên có tổ, ta cần xác định cận cận tổ: Tổ 1: 2450-2597 Tổ 2: 2597-2744 Tổ 3: 2744-2891 -Nhập vào ô G2 đến G4 giá trị hình: Chọn chức Data/Data Analysis/Histogram - Input Range: Địa tuyệt đối chứa liệu - Bin Range: Địa chứa bảng phân nhóm - Output options: Vị trí xuất kết - Confidence Level for Mean: độ tin cậy cho trung bình - Chọn Cumulative Percentage để tính tần suất tích lũy khơng Excel tính tần số Kết quả: Vẽ biểu đồ histogram ( biểu đồ phân bố tần số), biểu đồ tích lũy tần số, biểu đồ mật độ với liệu (A) • Vẽ biểu đồ Phân Bố Tần Số - Quét bảng tần số - Insert Column Chart - Kết quả: • Vẽ biểu đồ tích lũy tần số: -Quét bảng tích lũy tần số -Chọn Insert > Column > 2-D Column Kết quả: • Vẽ biểu đồ mật độ liệu 1.3 Tính đặc trưng mẫu ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 91% với liệu (A) +Tính đặc trưng mẫu * Nhập liệu vào bảng tính * Chọn chức Data/Data Analysis/Descriptive Statistics - Input Range: Địa tuyệt đối chứa liệu - Output options: Vị trí xuất kết - Confidence Level for Mean: Độ tin cậy cho trung bình Kết Nhìn vào bảng kết ta biết đặc trưng mẫu với: -Mean: trung bình mẫu -Standard Deviation: độ lệch mẫu -Sample Variance: phương sai mẫu +Ước lượng giá trị trung bình Để ước lượng ta cân tính Trong Lúc nảy ta tính Đề cho ta: độ tin cậy =91% suy n=20 suy với 1.392 tính excel sau 10 - Dùng hàm CHITEST để tính xác suất P(X > ): - Kết biện luận: + Gỉa thuyết: H0: có mối liên hệ phụ thuộc loại vật liệu với tác động thay đổi nhiệt độ H1: Khơng có mối liên hệ phụ thuộc loại vật liệu với tác động thay đổi nhiệt độ + Kết quả: P(X > ) = 0.0266 > = 0.02 => Bác bỏ giả thuyết H1 , chấp nhận giả thuyết H0 Vậy: có mối liên hệ phụ thuộc loại vật liệu với tác động thay đổi nhiệt độ 26 Bài 5: a)Tìm liệu ngẫu nhiên chiều (X, Y) có kích thước n >10 để sử dụng mơ hình hồi quy tuyến tính đơn Thực u cầu: 1) Tìm hệ số tương quan X,Y 2) Quan hệ X,Y có coi quan hệ tuyến tính hay khơng? Hãy ước lượng đường hồi quy tuyến tính Y theo X biểu thị hình vẽ 3) Tìm sai số chuẩn ước lượng b) Tìm liệu ngẫu nhiên k chiều (k >2) để sử dụng mô hình hồi quy tuyến tính đa biến Tìm hệ số hồi quy tuyến tính mẫu kết luận thích hợp Bài làm • Cơ sở lý thuyết 1.Tìm hệ số tương quan X Y 27 2) Quan hệ X,Y có coi quan hệ tuyến tính hay khơng ? Giả thiết H0: X Y khơng có tương quan tuyến tính: T= r n−2 1− r2 3) Ước lượng đường hồi quy tuyến tính Y theo X * Cơ sở lý thuyết: Hồi quy đơn tuyến tính: a) Bảng số liệu mức độ ảnh hưởng thời gian trộn đến cường độ chịu nén bê tông xi măng (với độ tin cậy 5%) : Thời gian trộn t (s) 60 70 80 90 100 110 120 130 140 150 Cường độ chịu nén bê tông ngày tuổi C7 (MPa) 30.9 31.6 31.1 30.5 29.7 28.3 27.2 25.8 23.7 28.7 28 1) Tìm hệ số tương quan Xvà Y Thực excel: Nhập số liệu vào bảng tính • Chọn chức Data/Data Analysis/Correlation: • Kết quả: 29 Với kết ta có hệ số tương quan R = -0.80164 Chứng tỏ thời gian mức cường đọ chịu lực nén có quan hệ chặt chẽ tương quan nghịch 2) Quan hệ X,Y có coi quan hệ tuyến tính hay khơng? Hãy ước lượng đường hồi quy tuyến tính X Y * Thực Excel: - Nhập liệu: (dữ liệu thiết phải nhập theo cột) - Lần lượt thực bước: + Nhấn lệnh Tools lệnh Data Analysis + Chọn chương trình Regression hộp thoại Data Analysis nhấp OK + Trong hộp thoại Regression ấn định chi tiết: 30 - Phạm vi biến số Y (Input Y Range) Phạm vị biến số X (Input X Range) Nhãn liệu (Labels) Mức tin cậy (Confidence Level0 Tọa độ đầu (Output Range) Đường hồi quy (Line Fit Plots) Biểu thức sai số (Residuals Plots) 31 - Kết quả: - Phương trình hồi quy: = 35,87 – 0,07X ( - Biện luận: + = 7,74E-08 < hay > => Bác bỏ + = 0,0053 < hay t > => Bác bỏ + = 0,0053 < hay F > => Bác bỏ phương trình hồi quy thích hợp Vậy quan hệ X Y coi tuyến tính 32 - Đường hồi quy tuyến tính X Y: 3) Sai số chuẩn ước lượng: - Đối với biến tự do: SE = 1,9464 - Đối với biến X: SE= 0,0179 c) Mô hình hồi quy tuyến tính đa biến: Bảng phân tích tính hàn thép kết cấu: C (%) Mn (%) CE (%) 0.17 1.4 0.35 0.21 1.5 0.40 0.24 1.6 0.45 0.2 1.7 0.47 0.18 1.5 0.40 0.13 1.5 0.43 0.14 1.6 0.48 0.16 1.7 0.53 33 0.2 1.7 0.34 0.16 1.65 0.39 Hãy cho biết yếu tố %C %Mn có mối quan hệ tuyến tính với %CE hay khơng? Nếu có vẽ đường biểu diễn quan hệ tuyến tính Gỉa thuyết với độ tin cậy 95% Bài làm: - Nhập số liệu: - Thực bước tương tự hộp thoại Regression: 34 - Kết quả: 35 - Phương trình hồi quy: ) = 0,09 – 0,43+ 0,26 - Biện luận: + = 0.7817 > hay < => Chấp nhận giả thuyết + = 0,4886 > hay < => Chấp nhận giả thuyết + = 0,2085 > hay < => Chấp nhận giả thuyết + = 0,3846 > hay F < => Chấp nhận giả thuyết Phương trình đồng quy tuyến tính khơng tồn Vậy yếu tố %C %Mn khơng quan hệ đồng quy tuyến tính với yếu tố %CE - Đồ thị biểu diễn không phụ thuộc %C %Mn với %CE 36 Bài 6: Hàm lượng carbon thép SD390 hãng thép trình bày bảng sau: 37 VNSTEEL POMINA 0.26 0.29 0.21 0.17 0.24 0.18 0.15 0.22 0.25 0.24 Hàm lượng carbon có khác theo cơng ty khơng? Giả sử sử dụng mức ý nghĩa 5% Bài làm - Dạng bài: phân tích phương sai yếu tố - Cơ sở lý thuyết: Gọi phương sai hàm lượng carbon có thép SD390 thép POMINA phương sai hàm lượng carbon có chai nhựa SD390 thép VNSTEEL Giả thiết kiểm định Ho : 12 = 22 Giả thiết đối H1 : 12 a 38 2 Dùng Excel: Nhập liệu vào bảng tính b c Nhấp đơn lệnh Tools lệnh Data Analysis Chọn Anova: Singel Factor d Chọn mục hình: e Kết quả: 39 F=0.1283< Fk-1;n-k;1-a = 5,987378 nên chưa bác bỏ Ho Vậy hàm lượng carbon hai hang thép - Giải trực tiếp công thức: Ta có s2= 0.03436 ; n1=n2=5 s1=0,04386 Miền bác bỏ W=(f0,05/2 (4;4),+)=(6.39, +) Tiêu chuẩn kiểm định: Fqs= s12/s22 = 0.043862 / 0.034362 = 1.6294 Do Fqs không thuộc W nên chưa bác bỏ Ho Vậy hàm lượng carbon thép SD390 hai hãng 40 ... (hay tỉ lệ xác suất) cách tiện lợi phân phối xác suất, khơng có tính đối xứng có giá trị Giả sử bạn có cơng trình nghiên cứu với N thử nghiệm độc lập, thử nghiệm có k kết kết mang xác suất thực... bảy 247 196 223 207 242 Lượng báo thực bán quận có khác khơng? Lượng báo bán có chịu yếu tố tác động ngày tuần hay không? Kết luận với mức ý nghĩa % Bài làm: * Dạng bài: Phân tích phương sai hai... - Biện luận: + + Vậy: - Lượng báo bán quận khác - Lượng báo bán chịu tác động ngày tuần 22 Bài 4: Ba loại vật liệu thử sức bền ảnh hưởng việc thay đổi nhiệt độ vô lớn, có số liệu: Kết cục Vật