Bài giảng môn Nguyên lý thống kê kinh tế - Phân tích phương sai (ANOVA)
Trang 1PHÂN TÍCH PHƯƠNG SAI ( Analysis of variance – ANOVA)
Trang 2MỞ ĐẦU:
Một công ty chuẩn bị xuất bản 4cuốn sách hướng dẫn học một ngôn ngữ lập trình mới, công ty muốn biết sách hướng dẫn nào thật sự tốt Để làm điều đó, công ty chọn 160 kỹ sư của công ty và chia làm 4 nhóm cỡ 40 Mỗi nhóm sẽ học 1 cuốn sách và sau đó làm bài kiểm tra Dựa vào kết đó đánh giá các cuốn sách và chọn 1 cuốn sách tốt nhất.
Trang 3x
chưa biết Cần kiểm định giả thuyết:
Trang 4ANOVA một nhân tố:
Phân tích phương sai một yếu tố là phân tích ảnh hưởng của một yếu tố nguyên nhân (định tính) ảnh hưởng đến một yếu tố kết quả (định lượng) đang nghiên cứu
Trang 5I Trường hợp k tổng thể có phân phối chuẩn và phương sai bằng nhau:
Giả sử ta muốn so sánh trung bình của k tổng thể có phương sai bằng nhau dựa trên
những mẫu ngẫu nhiên độc lập gồm n1, n2, …,
nk quan sát từ k tổng thể khác nhau có phân phối chuẩn Ký hiệu , i= 1,…,k là trung bình của các tổng thể
Cần kiểm định giả thuyết:
Trang 6Bước 1: Tính các trung bình mẫu
Trang 8Bước 2: Tính các tổng các độ lệch bình phương Tổng các độ lệch bình phương giữa các nhóm:
Trang 9Bước 3: Tính các phương sai:
MSw
MSG
F
w w
Phương sai trong nội bộ nhóm:
Phương sai giữa các nhóm:
Bước 4: tính tỷ số F
Bác bỏ giả thuyết H0 cho rằng cho rằng trung
bình của k tổng thể đều bằng nhau khi F F k 1, n k
Trang 10Dạng bảng kết quả ANOVA từ chương trình Exel,SPSS
Nguồn
biến thiên Tổng các độ lệch bình
phương(SS)
Bậc tự do(df) sai (MS) Phương Tỉ số F
w w
Trang 11Dạng bảng kết quả ANOVA từ chương trình Exel,SPSS
Source of
variance squares Sum of
(SS)
Degree of Fredom (df)
Mean of squares (MS)
w w
Trang 12Ví dụ 1:
Ban giám hiệu một trường đại học muốn nghiên cứu ảnh hưởng của việc đi làm thêm đến kết quả học tập của sinh viên Một trong những nội dung nghiên cứu đề tài này là xem xét thời gian đi làm thêm khác nhau có ảnh hưởng đến kết quả học tập của sinh viên như nhau không Thực hiện cuộc khảo sát với 120 sinh viên, có 22 sinh viên cho biết có công việc làm thêm đều đặn ít nhất là 16 tuần trong năm học qua Trong
đó, có 7 sinh viên có thời gian làm thêm dưới 6giờ/tuần; 7 sinh viên có thời gian làm thêm khoảng 6 đến 12giờ/tuần; 8 sinh viên có thời gian làm thêm trên 12giờ/tuần Dữ liệu về kết quả trung bình học tập của năm học vừa qua do phòng đào tạo nhà trường cung cấp được trình bày trong bảng sau:
Trang 13Điểm trung bình học tập của các sinh viên đi làm thêm
Nhóm 1
(TG làm thêm
dưới 6giờ/tuần)
Nhóm 2(TG làm thêm từ 6 đến
12giờ/tuần)
Nhóm 3(TG làm thêm trên 12giờ/tuần)6.3
7.06.56.67.26.96.4
7.26.66.15.86.87.15.9
6.35.86.05.55.26.55.36.2
Trang 14Giải , i= 1, 2, 3 lần lượt là điểm trung bình của 3
nhóm sinh viên có thời gian đi làm thêm khác
nhau Cần kiểm định giả thuyết: H0 : 1 2 3
1
46.9
6.77
2
45.5
6.5 7
Trang 16Bước 3: Tính các phương sai
Phương sai trong nội nhóm
1.502
6.7 MSw 0.224
Tra bảng phân phối F
Vì F = 6.7 > 3.52 cho nên dựa trên dữ liêu thu thập, ta
có thể bác bỏ giả thuyết H0 cho rằng điểm trung bình học tập của 3 nhóm sinh viên là bằng nhau,với mức ý
Trang 17Ví dụ 2:Một quản trị Marketing muốn xem xét chi phí bán hàng trung bình trên tháng của một sản phẩm điện tử ở
ba cửa hàng khác nhau Số liệu như trong bảng sau:
Chi phí bán hàng trung bình/sản phẩm của ba cửa hàng A, B và
C bằng nhau ?
Trang 18254272232238256250
Trang 19II Trường hợp các tổng thể được giả định có phân phối bất kỳ
• sử dụng biến W thay cho tỉ số F trong phần tính toán giá trị kiểm định
2 1
12
3( 1) ( 1)
w k
Trang 20II Trường hợp cá tổng thể được giả định có phân phối bất kỳ
= 11,10
2
Ta có
Trang 21Phân tích phương sai hai chiều
(1 ô có 1 quan sát)
Trang 22Phân tích phương sai hai chiều
(1 ô có 1 quan sát)
1 k 1,(k 1)(h 1),
F F
1 Giả thuyết H0 cho rằng trung bình của tổng thể
theo chỉ tiêu cột thì bằng nhau, có thể bị bác bỏ
khi:
2 Giả thuyết H0 cho rằng trung bình của tổng
thể theo chỉ tiêu hàng thì bằng nhau, có thể
bị bác bỏ khi:
1 h 1,(k 1)(h 1),
Trang 23VD
Trang 24Phân tích phương sai hai chiều
(1 ô có nhiều quan sát)
Trang 251 k 1,(k 1)(h 1),
F F
1 Giả thuyết H0 cho rằng trung bình của tổng thể
theo chỉ tiêu cột thì bằng nhau, có thể bị bác bỏ
khi:
2 Giả thuyết H0 cho rằng trung bình của tổng
thể theo chỉ tiêu hàng thì bằng nhau, có thể
bị bác bỏ khi:
1 h 1,(k 1)(h 1),