bài đã chỉnh sửa và hướng dẫn cách để thuyết trình dễ dàng và điểm cao.trong file đã tích hợp thêm một số bài hướng dẫn khi mình làm.đã xóa một số bản cho nhẹ rồi nên chưa khá đủ để đọc...............................................................................................................................................................
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM
KHOA XÂY DỰNG
Giảng viên hướng dẫn : Nguyễn Bá Thi Sinh viên thực hiện : Phạm Trí Đạt Lớp : L12 nhóm A3 MSSV :1410838
(đã sửa)
TPHCM 5-11-2015
Báo Cáo BTL
XSTK
Trang 2I.BÀI TẬP SỐ 1
Một xí nghiệp may sản xuất áo khoác với 4 màu: đỏ, xanh, vàng và tím than
Số khách hàng nam và nữ mua áo khoác với các màu được ghi trong bảng sau:
Tím than
với mức ý nghĩa 1% hãy so sánh tỉ lệ khách hàng nam và nữ ưa chuộng các màu sắc nói trên
• Dạng bài: Kiểm định giả thiết về tỉ lệ
• Đặt giả thiết tỉ lệ H0: tỉ lệ khách hàng nam và nữ ưa chuộng các màu sắc là như nhau
• Tính toán:
1.Tính tổng
2.Tính tần số lý thuyết
Tại B6=$F$2*B4/$F$4, rồi ta kéo tương tự sang bên phải
Tại B7=$F$3*B4/$F$4, rồi ta kéo tương tự sang bên phải
Lưu ý: $F$3 nghĩa là các ô tính đều có giá trị của F3, còn B4 thì giá trị
sẽ là giá trị của các cột tương ứng(khi kéo sang ngang)
3.Dùng Chitest để tính α
Cú Pháp: CHITEST(actual_range, expected_range)
Trong Đó:(hàm chitest dùng tính anpha, xác suất P)
Trang 3-actual_range: Phạm vi dữ liệu chứa các giá trị để đối chiếu -expected_range: Phạm vi dữ liệu chứa tỷ lệ của phép nhân tổng hàng và tổng cột đối với tổng thành phần
Tại B8==CHITEST(B2:E3,B6:E7)= 0.0000000000000000017151
4.Vì α<0.01-> =>Loại H0 (Do α càng nhỏ giá trị
càng lớn)
• Kết luận: tỉ lệ khách hàng nam và nữ ưa chuộng các màu sắc là khác nhau
• Để chi tiết hơn về sự khác nhau này ta so so sánh tỉ lệ khách hàng nam
nữ ưa chuộng từng màu
Ta xác định theo công thức sau:
Tại
(B2+B3)/($F$2+$F$3))).(chú ý bài toán này có 4 giá trị tỉ lệ)
Trang 4II.BÀI TẬP SỐ 2
Điểm môn toán của một học sinh khối 5 của 2 trường có số liệu như sau: Trường A
Trường B
Với độ tin cậy 95%, hãy ước lượng điểm trung bình môn toán của hai trường Với mức ý nghĩa 5% ,hãy:
Xem xét trung bình môn toán của hai trường có thật sự khác nhau không? Giả
sử điểm môn toán có quy luật phân phối chuẩn
• Dạng bài: ước lượng và kiểm định giả thiết về trung bình
• Dùng công cụ excel:
1.Nhập lại bảng số liệu
2.Vào Data-Data Analysis-Descriptive Statistics-OK
Số học sinh
Số học sinh
2 5 7 6 4 1
Trang 5chú ý:mean trung bình mẫu,độ chính xác ký hiệu là e-si-lon
Trang 64.Theo công thức: - ξ , + ξ
Ta có khoảng ước lượng điểm trung bình môn toán của Trường A là: (7.6 - 0.5958; 7.6 + 0.5758)
Ta có khoảng ước lượng điểm trung bình môn toán của Trường A là: (7.32 – 0.5424 ; 7.32 +0.5424)
5.Xét giả thiết điểm trung bình môn toán của hai trường có thực sự khác nhau không
Vào Data-Data Analysis-(t-Test:Two-Sample Assuming Unequal Variances)-Ok lưu ý unequal do nhìn bảng trên có phương sai khác nhau
Chú ý: ta dùng 2 phía để xét vì để kiểm tra có khác nhau giữa 2 trường ko Chứ ko phải là xét xem trường A điểm trung bình cao hơn trường B (1 phía)
Trang 7Ta thấy rằng giá trị Tqs < Tα(n1 + n2 -2) 0.71724 < 2.01063
vậy nên điểm môn toán trung bình của 2 trường là giống nhau
III.BÀI TẬP SỐ 3
Từ 12 cặp quan sát (xi,yi) sau đây của cặp hai biến (X,Y), tính tỷ số tương quan, hệ số tương quan và hệ số xác định của Y đối với X Với mức ý nghĩa
α = 5%, có kết luận gì về mối tương quan giữa X và Y (Có phi tuyến tính không ? Có tuyến tính không ?) Tìm đường hồi quy của Y đối với X
Dạng bài: (Tương quan và hồi quy)
Dùng công cụ excel:
1.Tính hệ số tương quan, hệ số xác định:
- Nhập số liệu vào bảng tính
+ Dùng Corelation trong hộp thoại Data analysis.
Trang 8
Kết luận:
+ Hệ số tương quan: r = 0.177098=> tương quan yếu.
+ Hệ số xác định: Bằng bình phương của hệ số tương quan:
r2 = 0.0313637
2 Phân tích tương quan tuyến tính và phi tuyến
Giả thiết H0: X,Y không có tương quan tuyến tính
Ta có:
Mà : t0.025,10=2.228 =TINV(0.05,10)
(t là phân vị mức của phân bố Student với n-2=10 bậc tự do)
Vì:
KL: X,Y Không đủ cơ sở để xác định là tương quan tuyến tính
Trang 9 Giả thiết H0: X,Y không có tương quan phi tuyến.
- Sắp xếp lại các giá trị:
- Sử dụng bảng Anova: Single Factor
-Từ bảng Anova: Single Factor ta rút ra được SST và SSF:
+ SST = 5.366667(= Total)
+ SSF = 0.24 ( = Between Groups)
+ Từ đó ta tính được tỷ số tương quan: η2
Y/X = SSF/SST = 0.0447205
- Ta có:
Bậc tự do (k-2, n-k) = (2, 8) với k là số nguyên nhân (111,123,118,356)
F = 0.053534
Tra bảng phân phối Fisher với bậc tự do (2, 8) ở mức 5% bằng cách nhập hàm f = FINV(0.05,2,8) ta được giá trị f = 4.458970108
- Biện luận: F < f
/ 2
Y X
Y X
F
k
=
Trang 10Suy ra chấp nhận giả thuyết H0 Vậy X và Y không có tương quan phi tuyến
Chú ý khi dùng bảng thì giá trị F quan sát và giá trị f ngưỡng khác nhau Do cái này phải hỏi lại ,dù sao vẫn ra kết luận giống nhau.(xem hình)
- Vào Regression ( hồi quy).Ta xuất ra được:
Ta có đường hồi quy: Y=0.00114502 + 3.363998068
- Mối tương quan giữa X và Y :
Hệ số hồi quy:
9.95241E-06 < 0.05 : hệ số tự do không có ý nghĩa
0.581892224 > 0.05: hệ số của X có ý nghĩa
Phương trình hồi quy: 0.00114502 < 0.05 : phương trình hồi quy không thích hợp
KL: X, Y không có tương quan tuyến tính, và không có tương quan phi tuyến
II.BÀI TẬP SỐ 4
với mức ý nghĩa 0.05, hãy phân tích sự biến động của thu nhập ($/tháng/người) trên cơ sở số liệu điều tra về thu nhập của 4 loại ngành nghề ở
4 khu vực khác nhau sau đây:
Trang 11Loại ngành nghề Nơi làm việc
Dạng bài: Kiểm định giả thuyết về giá trị trung bình ( nhằm đánh giá sự ảnh hưởng của 2 nhân tố A và B trên các giá trị quan sát)
Đặt giả thuyết H0: -Trung bình thu nhập 4 loại ngành nghề bằng nhau
-Trung bình thu nhập 4 khu vực bằng nhau
-Không có sự tương tác giữa ngành nghề và khu vực
Áp dụng excel để giải:
1.Nhập bảng:
2 Dùng Tools\Data Analysis \Anova: Two-Factor without
replication.
Trang 12
Biện luận:
=> Bác bỏ giả thiết H ( Ngành nghề ) => Chấp nhận giả thiết H ( Nơi làm việc ) Kết luận:
Chỉ có Ngành nghề ảnh hưởng đến thu nhập trung bình