Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 23 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
23
Dung lượng
3,48 MB
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH KHOA CƠ KHÍ BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ ĐỀ TÀI GVHD: NGUYỄN KIỀU DUNG THỰC HIỆN: NHĨM 06 – L08 1) 1410272 Hồng Thái Bình 2) 1410611 Phan Thái Duy 3) 1411564 Phạm Hoàng Hùng (L06) 4) 1412373 Nguyễn Hữu Nam 5) 1412449 Lê Trung Nghĩa 6) 1412854 Từ Tấn Phát (L10) 7) 1414174 Nguyễn Quốc Khánh Triều 8) 1414402 Nguyễn Bá Tuấn Thành phố Hồ Chí Minh, tháng năm 2016 Mục lục: Bài Trang Bài 3-8 Bài - 10 Bài 10 - 15 Bài 16 - 17 Bài 18 - 23 Bài 1: Tìm liệu định lượng (A) liệu định tính (B) thích hợp, sử dụng liệu cho yêu cầu sau: 1)Thực phương pháp phân tổ liệu (A) 2)Vẽ đồ thị phân phối tần số đa giác tần số (A) 3) Tính đặc trưng mẫu ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 96% (A) 4)Trình bày liệu định tính (B) dạng phân loại đồ thị 5) Hãy kiểm định xem liệu (A) (B) có phù hợp với phân bố xác suất hay khơng Bài làm: 1) Thực phương pháp phân tổ liệu A: A: Khảo sát thời gian hoàn thành sản phẩm tiện 40 sinh viên học thực tập Cơ khí ta có bảng số liệu: Thời gian (phút) - Xác định số tổ cần chia: k =( 2× n ) Biểu thức nhập vào Excel: =(2*COUNT(A1:J4))^(1/3) Kết 4,31 Chọn k = - Xác định trị số khoảng cách h: h= ( X max −X ) k Biểu thức Excel: =(MAX(A1:J4)-MIN(A1:J4))/4 Kết quả: 4,25 - Các tổ là: o Tổ 1: 12 - 16 o Tổ 2: 16 - 20 o Tổ 3: 20 - 24 o Tổ 4: 24 - 29 - - Chọn chức Data/ Data Analysis/Histogram o Trong ô Input Range nhập địa khu vực chứa liệu vào: A1:J4 o Trong ô Bin Ran Range đưa địa phạm vi chứa giá trị cận vào: A10:A13 o Trong mục Output option chọn Cumulative percentage (tính tần số tần suất tích lũy) Nhấn Ok Kết quả: 2) Vẽ đồ thị phân phối tần số đa giác tần số (A) - Đồ thị phân phối tần số: o Chọn bảng: A15:C19 o Chọn Insert/ Insert Column Chart/Chọn chart o Chỉnh sửa o Kết quả: - Đa giác tần số: o Thêm vào đầu cuối hàng bảng phân phối tần số o o o o Chọn bảng: A16:B21 Chọn Insert/ Insert Line Chart/Chọn chart Chỉnh sửa Kết 3) Tính đặc trưng mẫu ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 96% (A) - Nhập lại liệu: - - Chọn Data/ Data Analysis/ Descriptive Statistics Nhấn OK o Trong ô Input Range nhập địa khu vực chứa liệu vào o Mục Grouped by chọn Columns o Chọn Summary statistics o Confidence level for mean( độ tin cậy): chọn 96% Kết quả: 4) Trình bày liệu định tính (B) dạng phân loại đồ thị B: Phân ngành sinh viên khoa Cơ khí khóa 2014 trường Đại học Bách Khoa thành phố Hồ Chí Minh - Chọn bảng A1:B8 Chọn Insert/ Insert Pie: Chỉnh sửa: Kết quả: 5) Hãy kiểm định xem liệu (A) (B) có phù hợp với phân bố xác suất hay khơng Ho : Mẫu phù hợp phân phối chuẩn H1 : Mẫu không phù hợp phân phối chuẩn Tính đặc trưng mẫu: n = 40 ; x=18,375=a ; s^ =4,46=σ x ước lượng hợp lý cực đại cho a 2 ^s làước lượng hợp lý cực đại cho σ Tra bảng Chi-BP với k = ; r = ; α =0,04 ¿> χ 0,04 ( k−r −1 )=3,5575 ¿> Miền bác bỏW α =( 3,5575;+ ∞) ni ≡O i (α ; β) (-∞ ; 16 ¿ (16;20) (20;24) (24;+∞ ¿ Pi=∅ 16 11 n=40 α −a −∅( ) ( β−a ) σ σ 0.2972 0.3475 0.2542 0.1036 =1 n Do χ 2qs= {∑ i }−n=3.8087 ∈ W α ¿> Bác bỏ H o n i pi ¿> Mẫu không tuân theo phân phốichuẩn Dùng hàm tính pi Hàm NORMDIST Vd: C3=NORMDIST(20,18.375,4.46,TRUE)NORMDIST(16,18.375,4.46,TRUE) C6=1-NORMDIST(20,18.375,4.46,TRUE) Bài 2: Người ta dùng loại nguyên liệu A B để sản xuất thử đế 10 đơi giày trẻ em, đơi có trọng lượng ban đầu Sau người ta cho cho em thử vòng tháng với cường độ sử dụng tương tự Sau thử nghiệm, trọng lượng đế giày lại cho bảng sau: Thứ tự Loại vật liệu Giày trái Giày phải A 180 183 A 162 154 A 203 189 A 194 181 A 205 200 B 189 185 B 168 171 B 185 179 B 176 175 10 B 169 173 Với mức ý nghĩa 0,07 cho dùng loại nguyên liệu A làm đế giày bền dùng loại ngun liệu B hay khơng? Tìm thêm giá trị P kiểm định Bài làm: 1) Nhận dạng: tốn thuộc dạng kiểm định so sánh hai trung bình chưa biết σ 12 σ 22 2) Cơ sở lý thuyết - Được dùng mẫu bé,độc lập có phương sai khác - √ X −X Tiêu chẩn kiểm định: t= S12 S 22 n1 + n2 - Phân vị phía t ∝/2 : t Critical two-tail - Nếu |t |> t ∝/2 bác bỏ H 0, chấp nhận H - Nếu |t |≤ t ∝/2 chấp nhận H 0, bác bỏ H - Giá trị P: - P=∫ f ( x ) dx , với +∞ |t | k +1 ( ) x f ( x )= 1+ ) ( k k √ kπ Γ ( ) Γ k+ 3) Thực Excel - Gọi a 1, a 2là độ bền đề giày làm từ vật liệu A B - Giả thuyết kiểm định: H o :a1 =a2 - Giả thuyết đối: H : a1 >a2 - Nhập số liệu vào bảng tính: - - Chọn Data/ Data Analysis/ T-Test: Two-Sample Assuming Unequal Variances Nhấn Ok Hộp thoại T-Test: Two-Sample Assuming Unequal Variances Trong đó: o Phạm vi liệu 1( variable range): Chọn B2:K2 o Phạm vi liệu ( variable range): Chọn B3:K3 o Alpha (độ tin cậy): 0,07 Kết quả: - Ta thấy t = 1,3894 < t ∝/2 = 1,9889 nên chấp nhận H 0, bác bỏ H Hay đế giày dùng nguyên liệu A B bền Bài 3: Doanh số bán hàng ( triệu đồng) cửa hàng tuần đầu mùa hè cho bảng số liệu: Tuần Cửa hàng Cửa hàng Cửa hàng Cửa hàng 1430 980 1780 2300 2200 1400 2890 2682 1140 1200 1500 2000 880 1300 1470 1900 1670 1350 2380 1540 990 650 1930 1900 Hãy sử dụng mức ý nghĩa 5% để so sánh doanh thu cửa hàng có khơng; có liên quan yếu tố doanh thu yếu tố thời gian hay không Bài làm: a) So sánh doanh thu cửa hàng Cơ sở lý thuyết : - Dạng toán: Kiểm định giá trị trung bình (Kiểm định giả thuyết có tham số) 10 - Phương pháp: PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ Phép phân tích phương sai dùng trắc nghiệm để so sánh giá trị trung bình hai hay nhiều mẫu lấy từ phân số.Đây xem phần mở rộng trắc nghiệm t hay z (so sánh hai giá trị trung bình) Mục đích phân tích phương sai yếu tố đánh giá ảnh hưởng yếu tố (nhân tạo hay tự nhiên) giá trị quan sát, Yi(i=0,1,2,…,k) - Mơ hình: Yếu tố thí nghiệm … K Y11 Y21 … Yk1 Y12 Y22 … Yk2 … … … … Y1N Y2N … YkN T1 T2 Tk _ _ … … Yk Tổng cộng trung bình Y2 Y1 _ T _ Y Bảng ANOVA: Nguồn sai số Bậc sai số Yếu tố k-1 Sai số N-k Tổng số bình phương Bình phương trung bình k ∑ i=1 SSF= T i2 N − T2 N MSF= SSE=SST-SSF MSE= Tổng cộng N-1 k n ∑∑Y SST= i=1 j =1 n − SSF k−1 SSE N −k T2 N Trắc nghiệm: H0: H1: Giả thiết: μ1 =μ2 = =μ k ⇔ μi ≠μ j ⇔ “Các giá trị trung bình nhau” “Ít có hai giá trị trung bình khác nhau” 11 Giá trị thống kê F= MSF MSE MSF MSE Giá trị thống kê: F= Biện luận: Nếu F < Fα(k-1;N-k) => chấp nhận giả thiết H0 Bài làm: Giả thiết: - H0 : doanh thu cửa hàng Đối giả thiết: - H1 : Ít có hai giá trị trung bình doanh thu khác Nhập liệu vào bảng: Áp dụng “ Anova: Single Factor” a Nhấn đơn lệnh Data lệnh Data Analysis b Chọn trương trình Anova: Single Factor hộp thoại Data Analysis nhấn nút OK c Trong hộp thoại Anova: Single Factor ấn định - Phạm vi đầu vào (Input range) - Cách xắp xếp theo hàng hay cột (Group by) - Nhãn dử liệu (Labels in fisrt row/column) - Phạm vi đầu (Output range) 12 Bảng Anova: Từ giá trị bảng Anova: 13 F= 6.16276> Fα=3.098391 => Không chấp nhận H0 Kết luận: Doanh số bán hàng cửa hàng không b) Xét liên quan yếu tố doanh thu yếu tố thời gian Bài làm: Giả thiết: H0: Doanh thu yếu tố thời gian có liên quan với Đối giả thiết: H1: Doanh thu yếu tố thời gian không liên quan với Nhập liệu vào bảng tính: Áp dụng “Anova: Two-Factor Without Replication” a) Nhập đơn lệnh Tools lệnh Data Analysis b) Chọn chương trình Anova: Two- hộp thoại Data Anylysis nhấp OK c) Trong hộp thoại Anova: Two-Factor Without Replication, ấn định chi tiết: - Phạm vi đầu vào ( Input Range) - Nhãn liệu (Labels in Fisrt Row/ Column) - Ngưỡng tin cậy (Alpha) - Phạm vi đầu ( Output Range) 14 Từ giá trị bảng Anova: FR= 4.879478 > F0.05=2.901295 => Không chấp nhận giả thiết H0 Kết luận: Khơng có liên quan yếu tố doanh thu yếu tố thời gian 15 Bài 4: Trong thí nghiệm khoa học, người ta nghiên cứu dộ dày lớp mạ kền dùng ba loại bể mạ khác Sau thời gian mạ, người ta đo độ dày lớp mạ nhận bể: Độ dày lớp mạ kền tính µm 4-8 - 12 12 - 16 16 - 20 20 - 24 Số lần đo bể mạ B 51 108 26 24 20 A 32 123 10 41 19 C 68 80 26 28 28 Với mức ý nghĩa α = 0.05, kiểm định giả thiết: độ dày lớp mạ sau khoảng thời gian nói không phụ thuộc loại bể mạ dùng Bài làm: Dạng bài: Kiểm Định Tính Độc Lập Ta giả thiết: H0: Độ dày lớp mạ không phụ thuộc vào bể mạ dùng Ta tiến hành tính tốn tỉ số so sánh để kết luận độ dày lớp mạ không phụ thuộc vào bể mạ dùng Giải toán Excel: Nhập liệu tính tổng ni mj vào bảng sau: ni = SUM (hàng) mj = SUM (cột) Tính liệu kỳ vọng ij theo cơng thức ij = ni* mj /n ta bảng sau: 16 Tính P(X > ²) = CHITEST (Bảng thực tế, Bảng kỳ vọng) = CHITEST (C3:E7,C13:E17) = 8.67E-06 Phân tích kết quả: P(X > ²) = 8.67E-06 < = 0.05 Do giả thuyết Ho khơng chấp nhận Kết luận: Vậy độ dày lớp mạ phụ thuộc vào bể mạ dùng Bài 5: 17 Tìm liệu ngẫu nhiên chiều (X, Y) có kích thước n >10 để sử dụng mơ hình hồi quy tuyến tính đơn Thực yêu cầu: 1) Tìm hệ số tương quan X,Y 2) Quan hệ X,Y có coi quan hệ tuyến tính hay khơng? Hãy ước lượng đường hồi quy tuyến tính Y theo X biểu thị hình vẽ 3) Tìm sai số chuẩn ước lượng Bài làm: Dữ liệu: Bảng số liệu thời gian thao tác máy tiện so với khối lượng phoi thải gia công tiện lấy ngẫu nhiên số máy tiện xưởng C1: 1) Tìm hệ số tương quan X, Y - Cơ sở lý thuyết: o Hệ số tương quan: R= o o o o o o - ∑ x i y i −∑ x i ∑ y i √ [ n∑ x2i −( ∑ x i )2 ][ n ∑ y2i −(∑ yi )2 ] Nếu R > X, Y tương quan thuận Nếu R < X, Y tương quan nghịch Nếu R = X, Y khơng tương quan Nếu |R| = X, Y có quan hệ hàm bậc Nếu |R| → X, Y có tương quan chặt (tương quan mạnh) Nếu |R| → X, Y có tương quan khơng chặt (tương quan yếu) Thực Excel o Chọn Data/Data Analysis/Correlation 18 o Kết quả: R = 0,790711973 > R → nên thời gian khối lượng phoi thải có tương quan chặt tương quan thuận 2) Quan hệ X,Y có coi quan hệ tuyến tính hay khơng? Hãy ước lượng đường hồi quy tuyến tính Y theo X biểu thị hình vẽ Xét quan hệ X, Y: - Cơ sở lý thuyết: Giả thiết Ho: X Y khơng có tương quan tuyến tính: T= - r √ n−2 √ 1−r Thực Excel o Tính T: =B8*SQRT(12-2)/SQRT(1-B8^2) o Tính c: =TINV(0.05,10) (c phân vị mức α/2 = 0,025 phân bố Student với n – = 10 bậc tự do) o Vì |T| > c nên bác bỏ Ho o Vậy X Y có tương quan tuyến tính Ước lượng đường hồi quy tuyến tính Y theo X: - Cơ sở lý thuyết: 19 o Phương trình hồi quy tuyến tính: y x =a+bx , a=r Sy ,b= y−a x Sx o Kiểm định hệ số a, b: Giả thiết Ho: Hệ số hồi quy khơng có ý nghĩa ( = ) H1: Hệ số hồi quy có ý nghĩa ( ≠ ) Trắc nghiệm t