Mục tiêu của phân tích phương sai là so sánh trung bình của nhiều tổng thể dựa trên các trung bình mẫu và thông qua kiểm định giả thuyết để kết luận.. 9.1.1-Trường hợp k tổng thể được gi
Trang 1Chöông 9
PHÂN TÍCH PHƯƠNG SAI
Trang 2Mục tiêu của phân tích phương sai là
so sánh trung bình của nhiều tổng thể dựa trên các trung bình mẫu và thông qua kiểm định giả thuyết để kết luận
Ở đây chúng ta đề cập đến mô hình phân tích phương sai một yếu tố
( Một chiều )- tức là phân tích dựa trên ảnh hưởng của 1 nhân tố
Trang 39.1.1-Trường hợp k tổng thể được giả
định có phân phối chuẩn và có
phương sai bằng nhau
Giả sử chúng ta muốn so sánh trung bình của k tổng thể có phân phối chuẩn và có phương sai bằng nhau dựa trên k mẫu
gồm n1,n2,…,nk.quan sát được chọn ngẫu nhiên độc lập từ k tổng thể Nếu trung
bình của các tổng thể được ký hiệu là:
μ1 , μ2 , …, μk
Th ì mô hình phân tích phương sai một yếu tố:
Trang 4Được thực hiện:
Giả thuyết TK
H0 : μ1 = μ2 = …= μk
H1 : Không phải μ1 = μ2 = …= μk
Bước 1: Tính các trung bình mẫu từ
những quan sát của các mẫu ngẫu nhiên độc lập:
1 2
( X X , , , X k )
X
Trang 5X22
…X
Trang 6n X
X = ∑=
Trang 7Bước 2 : Tính tổng các độ lệch bình phương trong từng nhóm riêng biệt
Trang 8Tổng các bình phương trong nội bộ nhóm (SSW-Sum of Squares within group):
Trang 9SSW - thể hiện biến thiên của yếu tố kết quả do ảnh hưởng của các yếu tố khác , không do yếu tố nghiên cứu, tức yếu tố dùng để phân chia các nhóm
Trang 10Tiếp theo tính tổng bình phương các độ lệch giữa các nhóm ( SSG- Sum of
Squares between-group)
thể hiện sự biến thiên do sự khác
nhau giữa các nhóm, tức biến thiên yếu tố kết quả do yếu tố nghiên cứu (Yếu tố dùng để phân chia các nhóm)
2 1
Trang 11Tính tổng bình phương các chênh lệch giữa từng quan sát với trung bình của tất cả các quan sát (SST-Total Sum of Squares): SST = SSW + SSG
Hoặc:
Phản ánh biến thiên của yếu tố kết quả
do ảnh hưởng tất cả nguyên nhân
(gồm yếu tố nghiên cứu và yếu tố không
Trang 12Bước 3 : Ước lượng phương sai chung của
k tổng thể do các yếu tố khác tạo ra , MSW ( Trung bình bình phương trong nội bộ nhóm )
n-k -> Bậc tự do tương ứng;n- S ố
số quan sát ; k- số nhóm so sánh
{ n-k= (n 1 -1)+(n 2 -1)+…+(n k -1) }
SSW MSW
n k
=
−
Trang 13 Ước lượng phương tổng thể chung do yếu tố nguyên nhân , tức là tính MSG ( Trung bình bình phương giữa các
k
=
−
Trang 14 Như vậy ta có 2 giá trị ước lượng cho phương sai chung cuả k tổng thể, tỉ số giữa MSG và MSW
có thể dùng làm căn cứ để kết luận về giả thuyết
Trang 15Bước 4: Tính giá trị kiểm định F:
Trang 16Kết quả phân tích phương sai được trình bày dưới hình thức bảng:
Mean Squares ( MS )
Groups SSW n - k MSW= - SSW
Trang 17 Ví dụ : Một Cty bán loại xà phòng giống nhau trong 3 mẫu bao bì khác nhau với giá bán như nhau Doanh số bán trong 5 tháng được cho trong bảng dưới đây
87 83 79 81
78 81 79 82
90 91 84 82
Trang 18Giả định doanh số bán theo các mẫu bao bì có phân phối chuẩn và có phương sai bằng nhau.
1 Thiết lập bảng phân tích phương sai
2 Kiểm định ở mức ý nghĩa 0,05 giả thuyết H0 cho rằng doanh số bán trung bình của tổng thể thì bằng nhau cho cả 3 mẫu bao bì khác nhau
Trang 203 1
MSW MSG
Trang 21Bảng kết quả ANOVA một yếu tố
bình phương
Bậc tự do df
Trang 22Tra bảng F với mức ý nghĩa 0,05 ; ta có:
Fk-1,n-k,α = F2,12,0,05 = 3,88
Vì F=7,09 > 3,88 cho phép ta bác bỏ giả thuyết H0 cho rằng doanh số bán trung bình của 3 mẫu bao bì khác nhau thì bằng nhau với mức ý nghĩa
Trang 239.1.2 Phân tích sâu ANOVA
thuyết H 0 thì việc phân tích phương sai kết thúc
Nếu bác bỏ H 0 có nghĩa không phải trung bình của các tổng thể bằng nhau Vì vậy cần phân tích sâu: Trung bình của những tổng thể nào thì khác nhau, tổng thể nào có trung bình lớn hơn, hoặc nhỏ hơn.
Có nhiều phương pháp để tiếp tục phân tích sâu
Ở đây chỉ giới thiệu phương pháp khá thông
Trang 24Trước tiên, lập giả thuyết so sánh
thức :
( k ! ) = k k ( − 1)
Trang 25Tính tiêu chuẩn so sánh Tukey:
Với qα là giá trị của bảng phân phối q
(Studentized range distribution) ở mức
ý nghĩa α, với bậc tự do k và n-k (Trong trường hợp các ni khác nhau,
Trang 26 Tính giá trị kiểm định : Giá trị kiểm
định D là giá trị tuyệt đối của chênh
lệch giữa 2 trung bình mẫu, ví dụ:
Qui tắc quyết định : Bác bỏ H0 ở mức
ý nghĩa α, nếu D ≥ T
D = − ; = − X X D X X
Trang 27 Nếu phân tích ANOVA bác bỏ giả thuyết H0 cho rằng trung bình K tổng thể bằng nhau, thì với phương pháp Tukey ta sẽ tìm được ít nhất một cặp trung bình tổng thể khác nhau (ANOVA và Tukey được thực hiện ở cùng ý nghĩa α)
Trang 29 Như vậy điều kiện bác bỏ giả thuyết
H0 chỉ có trung bình tổng thể μ2 và μ3 vì:
D 2 = 7 > 5,1
Trang 309.1.3- Trường hợp k tổng thể
con cĩ phân phối bất kỳ
TRONG TRƯỜNG HỢP NÀY TA CÓ THỂ CHUYỂN ĐỔI DỮ LIỆU YẾU TỐ KẾT
QUẢ TỪ DẠNG ĐỊNH LƯỢNG VỀ DẠNG
ĐỊNH TÍNH (DỮ LIỆU THỨ BẬC) VÀ ÁP DỤNG MỘT KIỂM ĐỊNH PHI THAM SỐ PHÙ HỢP LÀ KRUSKAL - WALLIS GIẢ SỬ RẰNG CHÚNG TA CÓ CÁC MẪU NGẪU NHIÊN ĐỘC LẬP GỒM n 1 , n 2 , n k QUAN SÁT TỪ k
TỔNG THỂ CÓ PHÂN PHỐI BẤT KỲ TA
Trang 31LỚN, NẾU GIÁ TRỊ QUAN SÁT
TRÙNG NHAU THÌ HẠNG GIỐNG NHAU BẰNG CÁCH DÙNG SỐ TRUNG BÌNH CỘNG CÁC HẠNG CỦA CHÚNG ĐỂ
Trang 32ĐẶT n = n 1 + n 2 + + n k LÀ TỔNG
R 1 , R 2 , , R K LÀ TỔNG CỦA CÁC HẠNG Ở TỪNG MẪU ĐƯỢC XẾP THEO
Trang 33k 1
2
i 3 ( n 1 ) n
R )
1 n
( n 12
2
, 1
k− α
χ
Trang 34KHI GIẢ THUYẾT H o BỊ BAC BỎ TA DÙNG
PHƯƠNG PHÁP SO SÁNH TƯƠNG TỰ NHƯ
PHƯƠNG PHÁP TUKEY TRONG PHẦN TRƯỚC.
TÓM TẮT CÁC BƯỚC THỰC HIỆN:
BƯỚC 1: TRƯỚC HẾT CHÚNG TA TÍNH HẠNG TRUNG BÌNH CHO TỪNG NHÓM MUỐN SO SÁNH THEO CÔNG THỨC TỔNG QUÁT SAU:
i
i i
n R R
Trang 35BƯỚC 2: TIẾP THEO CHÚNG TA TÍNH
GIỮA 2 NHÓM CẦN SO SÁNH
D ĐƯỢC COI NHƯ GIÁ TRỊ ĐỂ KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ BẰNG NHAU
CỦA TRUNG BÌNH HAI TỔNG THỂ i VÀ j
ĐANG SO SÁNH.
BƯỚC 3: TÍNH GIÁ TRỊ GIỚI HẠN CK THEO
CÔNG THỨC:
j i
2
, 1 k
1 n
1 12
) 1 n
(
n ) (
C
2
, 1
k− α
χ
Trang 36Kết luận:
BƯỚC 4: NGUYÊN TẮC QUYẾT ĐỊNH: BÁC BỎ GIẢ THUYẾT H0 VỀ SỰ BẰNG NHAU CỦA HAI TRUNG BÌNH TỔNG THỂ KHI
D > CK