Bài 4: Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số liệu sau đây.. THỰC HIỆN BÀI TOÁN BẰNG EXCEL Nhập giá trị vào bảng tính: Tính tổng các số: T
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ
Trang 2Giáo viên hướng dẫn: Nguyễn Bá Thi.
MỤC LỤC
Trang 3Đề tài nhóm 10
Bài 1: Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C Lượng sữa của các con bò
được thống kê trong bảng sau đây
Loại bò Lượng sữa
Ít Trung Bình Nhiều
ABC
925374
371519
461912Với mức ý nghĩa α=0,05, hãy nhận định xem có phải ba giống bò này có phân bố
tỉ lệ như nhau về phương diện sữa hay không?
Bài 2: So sánh mức lợi nhuận trung bình trong kinh doanh của một Công ty tại 5 thị
trường khác nhau trên cơ sở bảng số liệu thống kê sau đây với α=10 %:
7,37,68,38,3
5,47,17,4
6,48,1
7,99,59,6
7,1
Bài 3: Theo dõi số học sinh đến lớp muộn của 4 trường PTTH người ta thu được về số
lượng học sinh trung bình đến lớp muộn của các trường đó như sau:
Ngày trong tuần
Trường PTTH
Trang 4Thứ haiThứ tưThứ sáuThứ bảy
5444
4534
5343
7252Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của trường Chọn α=10 %
Bài 4: Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập
số liệu sau đây Với mức ý nghĩa α=5 %, có kết luận gì về mối tương quan giữa X và Y (Có phi tuyến không? Có tuyến tính không ? ) Tìm đường hồi quy của Y đối với X
909027013050270
1351751152551575
5024017027021050
3523529513531555
17021027017017090
35527595335315155
Trang 5371519
461912Với mức ý nghĩa α=0,05, hãy nhận định xem có phải ba giống bò này có phân bố
tỉ lệ như nhau về phương diện sữa hay không?
BÀI LÀM
Nhận xét: Đây là bài toán kiểm định giả thuyết vể tỷ lệ
Giải thuyết H 0: Tỷ lệ sữa của ba giống bò này có phân phân bố tỉ lệ như nhau
THỰC HIỆN BÀI TOÁN BẰNG EXCEL
Nhập giá trị vào bảng tính:
Tính tổng các số:
Tổng hàng: Chọn E3, nhập =SUM(B3:D3), rồi Enter, dùng con trỏ kéo nút
tự điều khiển từ điền từ E4 đến E5.
Tổng cột: Chọn B6, nhập =SUM(B3:B5), rồi Enter, dùng con trỏ kéo nút tự điều khiển từ B6 đến D6.
Trang 7 Biện luận: P(X > χ2)=0,02251515<0.05
Bác bỏ giả thuyết H0
Kết luận: Ba giống bò này có tỉ lệ khác nhau về phương diện sữa
Trang 85,47,17,4
6,48,1
7,99,59,6
7,1
BÀI LÀM
Nhận xét: Đây là bài toán phân tích phương sai một yếu tố
Sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu
tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát, Yi (i=1,2,…,k)
Giả thuyết :
H❑0: μ1=μ2=… μ k “Các giá trị trung bình bằng nhau”Các giá trị trung bình bằng nhau”
H1: μ1≠ μ2 “Các giá trị trung bình bằng nhau”Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê :
F= MSF
MSE
Biện luận :
Nếu F<F a(k−1 ; N−k) Chấp nhận giả thiết H0
Ta giả thuyết H 0: mức lợi lợi nhuận trung bình trong kinh doanh của một Công
ty tại 5 thị trường là như nhau
THỰC HIỆN BÀI TOÁN BẰNG EXCEL
Trang 9Nhập bản số liệu:
Vào Data/Data analysis, chọn Anova: Singer Factor.
Trên màn hình sẽ hiện ra hội thoại của Anova: Single Factor.
Ta nhập thông sô như hình bên dưới:
+ Phạm vi biến số Y (Input Range): ta kéo từ A1 đến E5
+ Group By: chọn Columns
+ Nhấp vào Labels in First Row
Trang 10+ Nhận giá trị 0.1 vào Alpha.
+ Tọa độ đầu ra Output Range: nhấp vào A8 Nhấn OK
Ta được kết quả như sau:
Biện luận:
Trang 11Ta thấy F=2.946947> F a=2.806426
=> Bác bỏ giả thuyết H0 với mức ý nghĩ α=10 %
Vậy mức lợi nhuận trung bình trong kinh doanh của một Công ty tại 5 thị trường khác nhau thì khác nhau.
Trang 12BÀI 3
Theo dõi số học sinh đến lớp muộn của 4 trường PTTH người ta thu được về số lượnghọc sinh trung bình đến lớp muộn của các trường đó như sau:
Ngày trong tuần
Trường PTTH
Thứ haiThứ tưThứ sáuThứ bảy
5444
4534
5343
7252Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của trường Chọn α=10 %
BÀI LÀM
Nhận xét: Đây là bài toán phân tích phương sai hai tố không lặp
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trịquan sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)
Giả thuyế t:
H0: μ1=μ2=…μ k “Các giá trị trung bình bằng nhau”Các giá trị trung bình bằng nhau”
H1: μ1≠ μ2 “Các giá trị trung bình bằng nhau”Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê :
F R=MSB MSE và F C=MSF
MSE
Biện luận :
Nếu F R<F a[b−1,(k −1) (b−1 )] => Chấp nhận H0 (yếu tố A)Nếu F C<F a[b−1, (k−1) (b−1)] => Chấp nhận H0 (yếu tố B)
Ta giả thuyết:
Trang 13H 01: yếu tố ngày không ảnh hưởng đến số lượng học sinh trung bình đến lớpmuộn của các trường đó.
H 02: yếu tố trường khác không ảnh hưởng đến số lượng học sinh trung bình đến lớp muộn của các trường đó
THỰC HIỆN BÀI TOÁN BẰNG EXCEL
Nhập bảng số liệu như hình dưới:
Vào Data/Data analysis, chọn Anova: Two-Factor Without Replication, bấm
OK.
Trên màn hình sẽ hiện lên hộp thoại của Anova: Two-Factor Without
Replication như hình dưới:
Trang 14Ta nhập các thông số như hình bên dưới:
+ Phạm vi của biến sô Y (Input Range): ta kéo từ ô A2 tới ô E6+ Nhấp vào Labels, điền giá trị Alpha 0.1
+ Tọa độ đầu ra Output Range: nhấp vào A8
+ Nhấn OK
Ta được kết quả như sau:
Trang 16BÀI 4
Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập sốliệu sau đây Với mức ý nghĩa α=5 %, có kết luận gì về mối tương quan giữa X và Y (Cóphi tuyến không? Có tuyến tính không ? ) Tìm đường hồi quy của Y đối với X
909027013050270
1351751152551575
5024017027021050
3523529513531555
17021027017017090
35527595335315155
BÀI LÀM
Nhận xét: Đây là bài toán phân tích tương quan, phân tích hồi quy tuyến tính
THỰC HIỆN BÀI TOÁN BẰNG EXCEL
(i) Phân tích tương quan tuyến tính
Nhập bảng giá trị:
Trang 17Vào Data/Data analysis, chọn Correlation:
Trên màn hình xuất hiện hộp thoại Correlation, ta nhập vào như hình sau:
+ Phạm vi đầu vào (Input Range), ta kéo từ ô A1 đến ô B25
+ Ở Grouped By: chọn Comlumns
+ Đánh dấu vào Label in First Row
Trang 18+ Tọa độ đầu ra (Output Range): ta chọn ô D4 Nhấn OK.
Ta được kết quả như sau:
Ta tìm được:
+ Hệ số tương quan: r =0,342484725
Trang 19(c là phân vị mức α2=0,025 của phân bố Student với n-2=22 bậc tự do)
Vì |T|<c nên chưa có cơ sở bác bỏ giả thuyết H0.Vậy: Chưa kết luận được X và Y có tương quan tuyến tính
(ii) Phân tích tương quan phi tuyến:
Phân tích lại bảng số liệu:
Vào Data/Data analysic, chọn Anova: Single Factor, Nhấn OK.
Trên màn hình xuất hiện Anova: Single Factor.
Trang 20Trong hội thoại Anova: Single Factor, ta điền các giá trị như hình sau:
+ Phạm vi đầu vào (Input Range): ta kéo từ ô B1 đến ô H5
+ Trong Grouped By: chọn Columns
+ Chọn Labels in first row
+ Nhập 0.05 vào Alpha
+ Tọa độ đầu ra (Output Range): ta chọn ô A8
Ta được kết quả như sau:
Trang 21Rút ra được từ bảng Anova:
SSF = 237383,3SST = 248383,3Tính được: η Y / X2 =SSF
(c là phân vị mức α=0,05 của phân bố Fisher bậc tự do (k-2,n-k)=(5,21))
Vì: F>c nên không chấp nhận giả thuyết H0
Trang 22Vậy X và Y có tương quan phi tuyến.
(iii) Tìm đường hồi quy của X và Y
Giả thuyết H0: X và Y hồi quy tuyến tính
Ta nhập bản giá trị
Vào Data/Data Analysic, chọn Regression
Trong hội thoại Regression ta nhập vào các giá trị như hình sau:
Trang 23+ Phạm vi đầu vào Y (Input Y Range): ta chọn từ ô B1 đến ô B25.+ Phạm vi đầu vào X (Input X Range): ta chọn từ ô A1 đến ô A25.+ Nhấp vào Labels.
+ Nhấp vào Line Fit Plots
+ Tọa đồ đầu ra (Output Range): chọn ô D1 Nhấ OK
Ta được kết quả như sau
Trang 24Kết luận: Đường hồi quy của Y đối với X là:
X