Phân tích phương sai một chiều (One way ANOVA)

Một phần của tài liệu Tài liệu Phân tích dữ liệu bằng SPSS - Phần 3 docx (Trang 29 - 39)

Các phép so sánh đề cập ở phần trên chỉ cho phép ta so sánh trung bình hai tổng thể dựa trên mẫu từng cặp phối hợp hoặc hai mẫu độc lập. Trong phần này phương pháp kiểm định sẽ mở rộng cho trường hợp so sánh trung bình của nhiều tổng thể được xây dựng trên việc xem xét các biến thiên (phương sai) của các giá trị quan sát trong nội bộ từng nhĩm (mẫu) và giữa các nhĩm (mẫu) với nhau. Ở đây ta đề cập đến phân tích phương sai một yếu tố là trường hợp chỉ cĩ một yếu tố (biến kiểm sốt) được xem xét nhằm xác định ảnh hưởng của nĩ đến một yếu tố khác. Yếu tố được xem xét ảnh hưởng được dùng để phân loại các quan sát thành các nhĩm nhỏ khác nhau.

Một cách tổng quát, giả sử ta cĩ k nhĩm (mẫu) n1, n2, …, nk quan sát được chọn ngẫu nhiên độc lậo từ k tổng thể (n1, n2, …, nk cĩ thể khác nhau về kích thước). Gọi µ1, µ2, …, µk là các trung bình của k tổng thể, xij là quan sát thứ j của nhĩm thứ i. Ta cĩ thể mơ tả các quan sát của k nhĩm như sau:

Nhĩm 1 2 … K X11 X12 … X1n1 X21 X22 … X2n2 … … … … XK1 XK2 … XKnK Với giả định các tổng thể cĩ phân phối chuẩn, cĩ phương sai bằng nhau, các sai số là độc lập với nhau, phân tích phương sai một yếu tố kiểm nghiệm giả thuyết ban đầu như sau: H0: µ1 = µ2 = … = µk. Ta thấy ở đây là việc so sánh giữa các giá trị trung bình, vậy phân tích phương sai nghe như là một sai sĩt. Tuy nhiên việc phân

n SD

tích phương sai ở đây dựa trên thơng số thống kê F, với F là tỷ số giữa biến thiên giữa trung bình các nhĩm trên biến thiên giữa các quan sát trong nội bộ nhĩm:

Biến thiên giữa trung bình các nhĩm F =

Biến thiên giữa các giá trị quan sát trong nội bộ nhĩm

Nếu các giá trị trung bình của các nhĩm khác biệt nhau nhiều, đặc biệt trong mối quan hệ với sự biến thiên của nội bộ từng nhĩm, giá trị F thu được sẽ lớn và khi đĩ giả thuyết H0:µ1 = µ2 = … = µk. sẽ bị từ chối. Và nếu ta quan sát việc phân tích phương sai một yếu tố cho hai nhĩm thì kết quả thống kê F tính được sẽ chính bằng bình phương kết quả thống kê t trong kiểm nghiệm t cho hai mẫu độc lập

Các bước phân tích phương sai một yếu tố để kiểm nghiệm sự ngang bằng giữa các giá trị trung bình của k tổng thể

Phân tích phương sai một yếu tố để kiểm nghiệm giả thuyết H0:µ1 = µ2 = … = µk được tiến hành thơng qua các bước sau:

Bước 1: Tính giá trị trung bình xi cho từng nhĩm và x chung cho tất cả các nhĩm

Hoặc

Bước 2: Tính các đại lượng thể hiện sự biến thiên trong nội bộ từng nhĩm (SSW) và giữa các nhĩm (SSG)

Gọi SS là đại lượng thể hiện sự biến thiên trong nội bộ từng nhĩm, ta cĩ: Ta co tổng cộng các biến thiên trong nội bộ từng nhĩm là:

Nĩi một cách đơn giản SSW là tổng bình phương các chênh lệch giữa từng quan sát với trung bình của nhĩm mà quan sát đĩ thuộc về (within-groups sum of

) ,..., 2 , 1 ( 1 i k n x x i n i ij i i = = ∑ = n x x i n j ij k i ∑ ∑ = = = 1 1 ) ( 1 1 ∑ ∑ = = = = k i i k i i i n n n x n x  ∑ = − = ni j i ij i x x SS 1 2 ) ( ∑∑ − = + + + =SS SS SS k ni x x SSW ... ( )2

squares). SSW là những biến thiên khơng do yếu tố kiểm sốt (yếu tố dùng để phân chia các nhĩm) gây ra.

Đại lượng thể hiện sự biến thiên giữa các nhĩm (between-groups sum of squares) được tính bằng cơng thức:

SSG thể hiện sự biến thiên do sự khác nhau giữa các nhĩm, tức là biến thiên do yếu tố kiểm sốt gây ra

Gọi STT là tổng bình phương các chênh lệch giữa từng quan sát với trung bình của tất cả các quan sát ta cĩ:

Đã chứng mính được rằng SST = SSW + SSG và cơng thức này chính là cơ sở của phương pháp phân tích phương sai một yếu tố với biến thiên của các quan sát so với giá trị trung bình là tổng cộng của biến thiên được giải thích bởi yếu tố kiểm sốt (SSG) và biến thiên do các yếu tố khác ngồi yếu tố kiểm sốt là SSW Bước 3: Tính các ước lượng cho phương sai chung của k tổng thể, MSW và MSG, bằng cách cia SSW và SSG cho số bật tự do tương ứng, ta cĩ:

SSW

MSW= (Within-groups mean square)

n-k SSG

MSG= (Between-groups mean square)

k-1

Tỷ số này được dùng để kiểm nghiệm giả thuyết H0. Nếu H0 đúng, nghĩa là trung bình của k tổng thể bằng nhau thì tỷ số MSG/MSW sẽ gần với giá trị 1. Ngược lại, khi các trung bình của k tổng thể khơng bằng nhau, thì MSG lớn hơn MSW, do vậy tỷ số MSG/MSW sẽ lớn hơn 1. Mức độ lớn hơn bao nhiêu thì được xem là “đủ lớn” (tuỳ thuộc vào độ tin cậy) để ta cĩ thể bác bỏ H0. Bước 4 với việc tính ra gia trị kiểm định F sẽ lý giải điều này

∑∑= = = = − = k i n j ij i x x SST 1 1 2 ) ( ∑ = − = ni i i i x x n SSG 1 2 ) (

Bước 4: Tính giá trị kiểm định F: MSG

F =

MSW

Ta sẽ bác bỏ H0 ở mức ý nghĩa ∝ (thường là 0.05), nếu giá trị p-value nhỏ hơn mức ý nghĩa, tương ứng với tỷ số F=MSG/MSW lớn hơn Fk-1, n-k, ∝, với Fk-1, n-k, ∝ cĩ phân phối F với k-1 và n-k bật tự do tương ứng ở tử và mẫu số.

Kết quả phân tích phương sai một yếu tố thường được thể hiện dưới dạng bảng sau: Biến thiên (Variance) Tổng các chệnh lệch bình phương (Sum of squares) Bật tự do (df) Trung bình các chênh lệch bình phương-Phương sai (Mean square) Giá trị kiểm định P-value Sig. Giữa các nhĩm (Between Groups) SSG k-1 MSG=SSG/k-1 F=MSG/ MSW Trong nội bộ nhĩm (Within Groups) SSW n-k MSW=SSW/n-k Tổng cơng (Total) SST n-1  So sánh từng cặp trung bình tổng thể

Một khi đã quyết định được sự khác biệt tồn tại giữa các giá trị trung bình-bác bỏ H0, hiễn nhiên nảy sinh câu hỏi tiếp theo là trung bình những tổng thể nào là khác nhau, tổng thể nào cĩ trung bình lơn hơn hoặc nhỏ hơn. Để trả lời các câu hỏi này SPSS cung cấp các kiểm nghiệm post hoc rangepairwise multiple comparisons cĩ thể quyết định được những giá trị trung bình nào là khác biệt.

Range tests xác định ra những nhĩm giá trị trung bình đồng nhất khơng tồn tại sự khác biệt giữa các giá trị trung bình này. Kiểm nghiệm Pairwise multiple comparisons kiểm nghiệm sự khác biệt giữa các cặp giá trị trung bình và đưa ra một ma trận đánh dấu hoa thị chỉ những nhĩm giá trị trung bình cĩ khác biệt đáng kể ở mức độ tin cậy là 5%

Đối với giả thuyết cân bằng về phương sai được chấp nhận (thơng qua kiểm nghiệm Levene) ta cĩ các phương pháp kiểm nghiệm thống kê sau để so sánh các trung bình mẫu:

- The least significant difference (LSD) là phép kiểm nghiệm tương đương với việc sử dụng phương pháp kiểm nghiệm t riêng biệt cho tồn bộ các cặp trong biến. Yếu điểm của phương pháp này là nĩ khơng chỉnh lý độ tin cậy cho tương thich với việc kiểm nghiệm cho nhiều so sánh cùng một lúc. Do đĩ dẫn đến độ tin cậy khơng cao. Các kiểm nghiệm khác sẽ được tham khảo sau đây loại bỏ được yếu điểm này bằng cách điều chỉnh độ tin cậy cho một so sánh nhiều thành phần.

- Phương pháp kiểm nghiệp BonferroniTukey’s honestly significant difference thì được sử dụng cho hầu hết các kiểm nghiệm so sánh đa bội. Kiểm nghiệm Sidak’s t test cũng được sử dụng tương tư như phương pháp

Bonferroni tuy nhiên nĩ cung cấp những giới hạn chặt chẻ hơn. Khi tiến hành kiểm nghiệm một số lượng lớn các cặp trung bình Tukey’s honestly significant difference test sẽ cĩ tác động mạnh hơn là Bonferroni test. Và ngược lại Bonferroni thì thích hợp hơn cho các kiểm nghiệm cĩ số lượng cặp so sánh ít.

- Hochberg’s GT2 thì giống như Tukey’s honestly significant difference test nhưng thơng thường Tukey’s test cĩ tác dụng tốt hơn. Gabriel’s pairwise comparisons test thì giống như Hochberg’s GT2 nhưng nĩ thường được sử dụng hơn khi kích cở giữa các mẫu kiểm nghiệm cĩ sự sai biệt lớn

- Phương pháp kiểm nghiệm Dunnett’s pairwise thì được dùng để so sánh các giá trị trung bình của các mẫu với một gía trị trung bình cụ thể được lấy từ trong tập các mẫu so sánh. Thơng thường mặc định nhĩm mẫu cuối cùng làm nhĩm kiển sốt, hoặc ta cĩ thể lựa chọn nhĩm đâu tiêu làm nhĩm kiểm sốt, lúc đĩ các giá trị trung bình của các nhĩm tong biến độc lập sẽ được so sánh với giá trị trung bình của nhĩm đầu tiên hoặc nhĩm sau cùng của biến độc lập - Ryan, Einot, Gabriel, and Welsch (R-E-G-W) đưa ra hai bước kiểm

nghiệm. Đầu tiên tiến hành kiểm nghiệm cĩ hay khơng tồn bộ các giá trị trung bình là ngang bằng nhau hay khơng. Nếu tồn bộ các giá trị trung bình là khơng ngang bằng nhau sau đĩ bước thứ hai sẽ kiểm nghiệm sự khác biệt giữa các nhĩm nhỏ với nhau, để tìm ra những nhĩm nào thật sự khác biệt và khơng khác biệt về giá trị trung bình. Tuy nhiên việc kiểm nghiệm này khơng nên thực hiện đối với trường hợp kích cở mẫu trong các nhĩm khơng ngang bằng nhau

- Thơng thường khi kích thước mẫu khơng ngang bằng giữa các nhĩm.

BonferroniScheffé là hai phương pháp kiểm nghiệm được lựa chọn hơn là phương pháp Tukey

- Duncan’s multiple range test, Student-Newman-Keuls (S-N-K), and Tukey’s b cũng tương tự tuy nhiên nĩ ít khi được sử dụng như các phương pháp trên.

- Kiểm nghiệm Waller-Duncan t được sử dụng khi kích thước mẫu là khơng bằng nhau

- Phương pháp kiểm nghiệm Scheffé cho phép sự kết hợp tuyến tính của những giá trị trung bình sẽ được kiểm nghiệm, khơng chỉ là so sánh giữa các cặp. Chính vì vậy kết quả của kiểm nghiệm Scheffé thì thường thận trọng hơn các phương pháp kiểm nghiệm khác , nĩ địi hỏi một sự khác biệt lớn giữa các giá trị trung bình quan sát được để bảo đảm tính thật sự khác biệt của phép kiểm nghiệm

Đối với trường hợp giả thuyết về sự cân bằng phương sai giữa các mẫu khơng được chấp nhận ta sẽ sử dụng các phương pháp kiểm nghiệm sau để tiến hành so sánh giá trị trung bình giữa các nhĩm:Tamhane’s T2, Dunnett’s T3, Games- Howell, Dunnett’s C

Ví dụ như trong nơng nghiệp người ta muốn biết ngũ cốc sẽ phát triển như thế nào khi sử dụng các loại phân bĩn khác nhau. Nhà nghiên cứu muốn biết liệu tất cả các loại phân bĩn trên thì cĩ ảnh hưởng ngang bằng đến sự phát triển của ngu cốc hay một vài loại phân bĩn sẽ cĩ tác dụng tốt hơn một vài loại khác. Để kiểm nghiệm điều này người ta dùng ANOVA đề kiểm nghiệm tốc độ phát triển trung bình (cĩ thể là trong lượng ngũ cốc thu hoạch, chiều cao của cây, số lượng trái trung bình thu hoạch được, …) đây chính là các giá trị trung bình được sử dụng trong thống kê.

ANOVA thơng thường kiểm nghiệm trên một số lượng mẫu lớn hơn hai, nếu số lượng mẫu bằng 2 ta cĩ thể dùng một phương pháp tương đối đơn giãn hơn là kiểm nghiệm t hai mẫu như đã đề cập ở phần trên. ANOVA được sử dụng rộng rãi trong thực tế bởi vì ta sẽ gặp rất nhiều trường hợp địi hỏi ta phải kiểm nghiệm nhiều mẫu trong cùng một lúc. Chú ý nếu ta kiểm nghiệp theo từng cặp lần lượt bằng phương pháp kiểm nghiệm t hai mẫu mỗi lần kiểm nghiệm độ sai lệch sẽ là 5% (tuỳ thuộc vào mức tin cậy mà ta mong muốn). Do đĩ khi kiểm nghiệm tất cả các cặp mẫu lần lượt tỷ lệ sai sĩt sẽ tăng lên theo mỗi lần. Do đĩ ANOVA sẽ cho phep1 ta kiểm nghiệm tất cả các mẫu trong cùng một mức độ sai sĩt là 5% và kiểm nghiệm trong một lần

Để thực hiện kiểm nghiệm ANOVA, dữ liệu địi hỏi phải thỏa mãn một số giả thuyết sau:

- Các mẫu kiểm nghiệm phải độc lập và mang tính ngẫu nhiên

- Các mẫu sử dụng trong kiểm nghiệm phải cĩ phân phối chuẩn hoặc kích thước mẫu đủ lớn để được xem là gần như phân phối chuẩn.

- Phương sai của các mẫu thì phải ngang băng nhau (cĩ thể kiểm nghiệp điều này bằng phép kiểm nghiệm phương sai Levene.

Nếu như các mẫu nghiên cứu của ta khơng thỏa mãn điều kiện trên ta cị thể dùng phép kiểm nghiện phi tham số (nonparametric) như như phép kiểm nghiệm

Kruskal-Wallis

Các nhà chế biến và phân phơí Coffee ở thị trường Hoa Kỳ đang đối mặt với một tình hình bất ổn về giá của hạt Coffee. Trong một năm giá của hạt coffee trội xụt từ $1.40 một pound (0.373 kg) lên $2.50/pound rồi sau đĩ lại tụt xuống $2.03/pound. Người ta xác định sự bất ổn về giá coffee này là do tình hình hoạt động của bản thân các nhà chế biến và phân phối coffee và một yếu tố khác rất quan trọng là vấn đề hạn hán ở Brazil, bởi vì Brazil sản xuất ra 30% sản lượng coffee trên thế giới, do đĩ thị trường coffee rất nhạy cảm với những biến chuyển về thời tiết (nguy cơ hạn hán) ở Brazil.

Để tạo ra một sự ổn định cho hoạt động của mình một nhà phân phối Coffee muốn loại bỏ mặt hàng Coffee Brazil ra khỏi cơ cấu hàng hĩa của mình. Tuy hiên trước khi thực hiện quyết định này cịn cĩ một cân nhắc là liệu loại bỏ mặt hàng Coffee Brazil thì cĩ làm giảm doanh số của cơng ty hay khơng. Vì vậy cơng ty thuê một cơng ty nghiên cứu Marketing tiến hành kiểm nghiệm thơng kê về sự ưa thích mùi vị coffee của khách hành tiêu dùng Coffee trên thị trường. Cơng ty tiến hành khảo sát dựa trên ba nhĩm khách hàng được lựa chọn ngẫu nhiên bao gồm nhĩm khách hàng chuyên tiêu dùng Coffee Brazil, Nhĩm khách hàng chuyên tiêu dùng Coffee Colombia và nhĩm khách hàng tiêu dùng Coffee Châu Phi (đây là 3 loại Coffee được tiêu dùng chủ yếu của cơng ty). Chú ý cơng ty loại trừ những nhĩm khách hành vừa tiêu dùng nhiều loại coffee khác nhau, để bảo đảm tính độc lập của các mẫu được chọn, và do nghiên cứu về mùi vị nên địi hỏi chọn những khách hàng cĩ gu tiêu dùng riêng biệt. Ở đây cơng ty muốn xác định xem liệu cĩ sự khác biệt về sự mức độ ưa thích đối với ba loại coffee (Sẽ cho khách hành thử ba loại coffee và khảo sát sự đánh giá về mức độ ưa thích của ba loại Coffee) hay cĩ sự khác nhau và khác nhau này như thế nào ở bao loại Coffe và ở ba nhĩm khách hàng. Dựa vào kết quả phân tích ANOVA sẽ cho ta biết liệu mức độ ưa thích trung bình của ba nhĩm khách hàng trên là giống nhau hay khác nhau đối với từng loại coffee. Sau đĩ dùng phương pháp kiểm nghiệp Post Hoc để xác định những khác biệt của từng nhĩm khách hàng về loại coffee đã thử.

Sau khi dùng ANOVA khảo sát sự khác biệt giữa các mẫu. Nếu ta cĩ đủ cơ sở để kết luận là khơng cĩ sự khác biệt giữa các mẫu. Ta cĩ thể kết thúc cơng việc (việc loại bỏ coffee brazil khơng gây ảnh hưởng đến doanh số, người tiêu dùng cĩ thể chuyển sang coffee comlobia hoặc châu Phi một cách dễ dàng). Tuy nhiên khi ta loại bỏ giã thuyết về sự ngang bằng giữa các nhĩm. Ta phải xác định tiếp sự khác biệt như thế nào giữa các mẫu kiểm nghiệm. Chúng ta cần phải xác định hướng và độ lớn của các khác biệt này bằng cách lần lượt so sánh sự khác biệt giữa các mẫu với nhau (người tiêu dùng coffee brazil cĩ thể thích coffee comlombia hơn coffe châu Phi, hoặc người tiêu dùng coffee brazil đánh giá coffee brazil ngang bằng với coffee colombia, trong khi mức độ ưa thích coffee châu Phi thì thấp hơn do đĩ để giảm thiểu sự mất doanh số bán coffee brazil khi loại bỏ mặt hàng cơng ty nên

Một phần của tài liệu Tài liệu Phân tích dữ liệu bằng SPSS - Phần 3 docx (Trang 29 - 39)

Tải bản đầy đủ (DOC)

(39 trang)
w