Bài giảng Chương 7 Phân tích phương sai

11 1.4K 24
Bài giảng Chương 7 Phân tích phương sai

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Chương 7 PHÂN TÍCH PHƯƠNG SAI ( ANOVA: Analysis of Variance ) Đặt vấn đề: 1. Phương pháp hồi qui tương quan nhằm chủ yếu nghiên cứu mối liên hệ tương quan giữa các biến đònh lượng hoặc đã lượng hóa. ANOVA có thể nghiên cứu mối liên hệ giữa tiêu chí nguyên nhân đònh tính với tiêu chí kết quả đònh lượng. 2. Mục đích cuối cùng : xem xét 01 hoặc 02 tiêu chí nguyên nhân có ảnh hưởng hay không ảnh hưởng đến 01 nhân tố kết quả: + 1 tiêu chí nguyên nhân (đònh tính)  → ah 1 tiêu chí kết quả (đònh lượng ) : Phân tích phương sai 01 yếu tố. + 2 tiêu chí nguyên nhân (đònh tính)  → ah 1 tiêu chí kết quả (đònh lượng) : Phân tích phương sai 02 yếu tố. Phương pháp nghiên cứu: + Chia tổng thể nghiên cứu thành k tổ theo tiêu chí nguyên nhân. + Đặt giả thuyết số trung bình của k tổ bằng nhau: H 0 : 1 µ = 2 µ = …… = …… = k µ + Kiểm đònh giảù thuyết H 0 : 2 trường hợp : * Bác bỏ H 0 : ⇔ 1 µ ≠ 2 µ ≠ …… : tiêu chí nguyên nhân có ảnh hưởng đến tiêu chí kết quả → Phân tích sâu ANOVA nhằm xác đònh các nhóm có trung bình khác nhau. * Chấp nhận H 0 : ⇔ 1 µ = 2 µ =…… : tiêu chí nguyên nhân không ảnh hưởng đến tiêu chí kết quả. ▼ Tư duy phương pháp : - Sự chênh lệch giữa các nhóm là do ảnh hưởng của tiêu chí nguyên nhân nghiên cứu. Sự chênh lệch trong nội bộ các nhóm là do các nguyên nhân khác. - Phương sai đo sự chênh lệch giữa các nhóm, nội bộ các nhóm theo tiêu chí nghiên cứu. - Giá trò kiểm đònh F là hệ số của phương sai giữa các nhóm và phương sai nội bộ các nhóm. Như vậy, F càng lớn thì ảnh * Kiểm đònh: Bác bỏ H 0 khi F > knk F −− ,1 ,α (Bảng phân phối Fisher) hưởng của tiêu chí nguyên nhân càng lớn, các trò số trung bình, tỉ lệ càng khác nhau. Tài liệu tham khảo:-Lý thuyết: giáo trình XSTK, Thống kê ứng dụng. -Vận dụng: tài liệu về Excel, SPSS, Eview,…. Các ký hiệu: - SS : Sum of Squares. (tổng bình phương “ chênh lệch”) - SSW : Sum of Squares Within groups. (tổng bình phương “ chênh lệch” nội bộ các nhóm) - SSG : Sum of Squares between Group. (tổng bình phương “ chênh lệch” giữa các nhóm) - SST: Total Sum of Squares. (tổng bình phương “chênh lệch”) SST = SSW + SSG - MSW : Mean Squares Within groups. (bình quân của bình phương “chênh lệch” nội bộ nhóm = phương sai nội bộ nhóm) - MSG : Mean Squares between groups. (bình quân của bình phương “chênh lệch” giữa các nhóm = phương sai giữa các nhóm. 1. PHÂN TÍCH PHƯƠNG SAI 1 NHÂN TỐ. 1.1. Trường hợp k nhóm có phân phối chuẩn &ø phương sai bằng nhau: 1.1.1. Công thức & Bảng tính tóan. a. Bảng tính tóan. Thí dụ: Trường phổ thông cơ sở BS mời 3 giáo viên bồi dưỡng cho 100 học sinh dự thi học sinh giỏi tin học. Sau một thời gian ôn tập, chọn mẫu 12 học sinh trong 100 học sinh trên thi thử với kết quả theo bảng sau (thang điểm 100). Với mức ý nghóa 5% hãy kiểm đònh xem điểm thi của học sinh theo học 3 giáo viên trên có khác nhau không? Giải: CBA H µµµ == : 0 H 1 : Không phải tất cả các cặp trung bình tổng thể (µ i ) ≡ ( Có ít nhất 1 cặp µ i khác nhau) Bảng dữ liệu & tính toán ANOVA : Bảng kết quả ANOVA : Nhóm theo t.chí ĐIỂM CỦA HS( x ij ) Nhóm giáo viên A (i=1) Nhóm giáo viên B (i=2) Nhóm giáo viên C (i=3) 1 2 3 4 79 86 94 89 71 77 81 83 83 69 71 77 / / / / Số mẫu quan sát n 1 = 4 n 2 = 4 n 3 = 4 12 == ∑ nn i Trung bình mẫu 87 1 1 11 : 1 nxx n j j ∑ = = 78 2 1 22 : 1 nxx n j j ∑ = = 75 3 1 33 : 1 nxx n j j ∑ = = 80 ∑∑ = iii nnxx : Chênh lệch bình phương nội nhóm 118 ( ) 2 111 ∑ −= xxSS j 84 ( ) 2 222 ∑ −= xxSS j 120 ( ) 2 333 ∑ −= xxSS j 322 ∑ = = k i i SSSSW 1 Chênh lệch bình phương giữa các nhóm 196 ( ) 1 2 11 nxxSSG ∑ −= 16 ( ) 2 2 22 nxxSSG ∑ −= 100 ( ) 2 2 22 nxxSSG ∑ −= 312 ∑ = i SSGSSG Nguồn biến thiên (Source of variation) Tổng bình phương chênh lệch ( Sum of Squares) Bậc tự do (Degree of Freedom) Phương sai (Mean Squares) Tỉ số F (F ratio) Giữa các nhóm (Between- groups) 312 SSD 2 (k-1) 156 1 − = k SSG MSG 4,36 MSW MSG F = Nội bộ nhóm (Within- groups) 322 SSW 9 (n - k) 35,78 kn SSW MSW − = Tòan bộ (Total) 634 STT 11 (n - 1) * Xác đònh Miền bác bỏ H 0 : F = 4,36 > F 2 , 9 , 0.05 = 4,26 → Bác bỏ H 0 Kết luận: Với độ tin cậy 95%, có thể kết luận có ít nhất 1 sự khác nhau giữa điểm trung bình của học sinh theo học với 2 giáo viên khác nhau. Như vậy, điểm của học sinh theo học với 3 giáo viên khác nhau sẽ khác nhau. Chất lượng giảng dạy của 3 giáo viên trên có ảnh hưởng khác nhau đến kết quả ôn luyện của học sinh. Để xác đònh các nhóm có điểm trung bình khác nhau cần tiến hành Phân tích sâu ANOVA . EXCEL: Tools – Data Analysis à Anova: single factor b. Công thức trong Bảng tính tóan. Bước 1: Tính trung bình mẫu: Bảng Dữ liệu: Dữ liệu phân nhóm theo tiêu chí nguyên nhân (i= k,1 ) Nhóm 1 Nhóm 2 …………. Chung k nhóm X 11 X 12 … X 1 n 1 X 21 X 22 … X 2 n 2 …… …… …… …… X k1 X k2 … x kn k * Trung bình mẫu thứ i (i= k,1 ): i n j ij i n x x i ∑ = = 1 Có 2 trường hợp về n i : + n 1 = n 2 = …… = n 3 + n 1 ≠ n 2 ≠ …… ≠ n 3 * Trung bình chung của k mẫu: ∑ ∑ = = = k i i k i ii n xn x 1 1 Bước 2: Tính tổng bình phương độ lệch: * Tổng độ lệch nội bộ nhó m : SSW + Từng nhóm thứ i: SS i = 2 1 )( i n j ij xx i ∑ = − + Tổng k nhóm: SSW = SS 1 + SS 2 + … + SS k SSW = 2 1 1 )( ∑∑ = = − k i n j iij i xx * Tổng độ lệch giữa các nhóm: SSG + Từng nhóm thứ i: SSG i = 2 1 )( xxn i k i i − ∑ = + Tổng k nhóm: SSG = SSG 1 + SSG 2 + … + SSG k SSG = 2 1 1 )( ∑∑ = = − i n j k i ii xxn * Tổng độ lệch tòan bộ: SST = SSG + SSW Bước 3: Tính trung bình các độ lệch bình phương (phương sai): MSG, MSW * Phương sai giữa các nhó m : MSG = 1 − k SSG * Phương sai nội bộ nhó m : MSW = kn SSW − Bước 4: Tính GT kiểm đònh F, xác đònh Miền bác bỏ H 0 * Gỉa thuyết: H 0 : 1 µ = 2 µ = …… = …… = k µ * GT kiểm đònh F: F = MSW MSG * Xác đònh Miền bác bỏ H 0: F > F α ,,1 knk −− → Bác bỏ H 0 → Chấp nhận H 1 → Phân tích sâu ANOVA. 1.1.2. Phân tích sâu ANOVA : Phương pháp Tukey * Số cặp cần so sánh: Với k nhóm: )!2(!2 ! 2 − = k k C k 2 )1( − = kk TD: Với k = 3: + 3 )!23(!2 !3 2 3 = − = C → + Các giả thuyết cần kiểm đònh là: 1. H 0 : 21 µµ = 2. H 0 : 32 µµ = 3. H 0 : 31 µµ = H 1 : 21 µµ ≠ H 1 : 32 µµ ≠ H 1 : 31 µµ ≠ * Giá trò tới hạnTurkey (T): i knk n MSW qT − = ,, α Với: + knk q − ,, α : GT tra bảng Phân phối kiểm đònh Turkey (Studentized Range Distribution) + n : tổng số quan sát mẫu ( ∑ = i nn ) + n i : số quan sát của 1 nhóm tổng thể mẫu. (chọn số quan sát nhỏ nhất) + MSW : phương sai nội bộ nhóm. * Miền bác bỏ H 0: Độ lệch tuyệt đối trung bình mẫu > T → Bác bỏ H 0 TD: │ 1 x - 2 x │ > T → Bác bỏ H 0 ( 21 µµ ≠ ) …………………………. │ 2 x - 3 x │ > T → Bác bỏ H 0 ( 32 µµ ≠ ) Sau đó, có thể ước lượng Khỏang chênh lệch giữa 2 trung bình nhóm: 21 µµ − = ( 21 xx − ) ± ( i kn n MSW t 2 2 , α − ) 1.2. Trường hợp các tổng thể có phân phối bất kỳ (KĐ phi tham số). 2. PHÂN TÍCH PHƯƠNG SAI 2 NHÂN TỐ . 2.1 Trường hợp có 1 quan sát mẫu trong 1 ô. Quan sát mẫu: Dòng (Khối – Blocks) Cột (Nhóm – Groups) 1 2 3 … k 1 2 . . . h x 11 x 12 … x 1h x 21 x 22 … x 2h … … X k1 X k2 … X kh Kiểm đònh giả thuyết: H 0 : 1 µ = 2 µ = …… = …… = k µ Và H 0 : 1 µ = 2 µ = …… = …… = h µ 2.2. Trường hợp có nhiều quan sát trong 1 ô: Hàng Nhóm (Groups) 1 2 … K 1 2 H X 111 X 112 …X 11L X 121 X 122 …X 12L … X 1H1 X 1H2 …X 1HL X 211 X 212 …X 21L X 221 X 222 …X 22L … X 2H1 X 2H2 …X 2HL … … … X K11 X K12 …X K1L X K21 X K22 …X K2L … X KH1 X KH2 … X KHL BÀI TẬP. 07.1:Cửa hàng giày HT vừa tung ra thò trường 3 mẫu giày mới với mã số: HT09.1- HT09.2- HT09.3. Số liệu về lượng khách mua 3 mẫu giày này trong 5 ngày đầu tiên theo bảng sau: Với mức ý nghóa α = 1%, hãy so sánh lượng giày tiêu thụ bình quân của 3 mẫu giày trên để rút ra kết luận 3 mẫu giày khác nhau như trên sẽ có lượng tiêu thụ khác nhau không? Ngày Lượng giày tiêu thụ (đôi) Mã HT09.1 Mã HT09.2 Mã HT09.3 1 28 35 33 2 21 42 38 3 20 32 32 4 18 28 42 5 23 28 30 [...]... 07. 2: Để chọn vò trí cho tòa nhà trung tâm thương mại trong 1 khu đô thò mới có 3 khu vực dân cư (A,B,C)sao cho cự ly từ cả 3 khu vực đến trung tâm thương mại là hợp lý, ngưới ta chọn mẫu 5 vò trí trong mỗi khu dân cư và đo khỏang cách đến trung tâm thương mại, số liệu như sau Vò trí 1 2 3 4 5 Khu A 254 263 241 2 37 251 Khỏang cách (m) Khu B 234 218 235 2 27 216 Khu C 200 222 1 97 206 204 Với . ) : Phân tích phương sai 01 yếu tố. + 2 tiêu chí nguyên nhân (đònh tính)  → ah 1 tiêu chí kết quả (đònh lượng) : Phân tích phương sai 02 yếu tố. Phương. lệch” giữa các nhóm = phương sai giữa các nhóm. 1. PHÂN TÍCH PHƯƠNG SAI 1 NHÂN TỐ. 1.1. Trường hợp k nhóm có phân phối chuẩn &ø phương sai bằng nhau: 1.1.1.

Ngày đăng: 29/11/2013, 11:11

Hình ảnh liên quan

a. Bảng tính tóan. - Bài giảng Chương 7 Phân tích phương sai

a..

Bảng tính tóan Xem tại trang 2 của tài liệu.
Bảng kết quả ANOVA: - Bài giảng Chương 7 Phân tích phương sai

Bảng k.

ết quả ANOVA: Xem tại trang 4 của tài liệu.
b. Công thức trong Bảng tính tóan. - Bài giảng Chương 7 Phân tích phương sai

b..

Công thức trong Bảng tính tóan Xem tại trang 6 của tài liệu.
Với: + qα, k ,n−k : GT tra bảng Phân phối kiểm định Turkey (Studentized Range Distribution) - Bài giảng Chương 7 Phân tích phương sai

i.

+ qα, k ,n−k : GT tra bảng Phân phối kiểm định Turkey (Studentized Range Distribution) Xem tại trang 8 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan