4.1.1 Khái niệm phân tích nhân tố khám phá EFA
Phân tích nhân tố khám phá, gọi tắt là EFA, dùng để rút gọn một tập hợp k biến quan sát thành một tập F (với F < k) các nhân tố có ý nghĩa hơn. Trong nghiên cứu, chúng ta thường thu thập được một số lượng biến khá lớn và rất nhiều các biến quan sát trong đó có liên hệ tương quan với nhau. Thay vì đi nghiên cứu 20 đặc điểm nhỏ của một đối tượng, chúng ta có thể chỉ nghiên cứu 4 đặc điểm lớn, trong mỗi đặc điểm lớn này gồm 5 đặc điểm nhỏ có sự tương quan với nhau. Điều này giúp tiết kiệm thời gian và kinh phí nhiều hơn cho người nghiên cứu.
Như vậy, có thể hiểu phân tích nhân tố là tên chung của một nhóm các thủ tục được sử dụng chủ yếu để thu nhỏ và tóm tắt các dữ liệu. Trong nghiên cứu, ta có thể thu thập được một số lượng biến khá lớn và hầu hết các biến này có liên hệ với nhau và số lượng của chúng phải được giảm bớt xuống đến một số lượng mà chúng ta có thể sử dụng được. Các biến quan sát đưa vào EFA sẽ được rút gọn thành một số nhân tố. Mỗi nhân tố gồm có một số biến quan sát thỏa mãn các điều kiện thống kê.
Người phân tích sẽ xem các biến quan sát trong mỗi nhân tố là những biến nào, có ý nghĩa là gì, và cũng cần dựa trên lý thuyết … từ đó đặt tên cho nhân tố. Tên này cần đại diện được cho các biến quan sát của nhân tố. EFA thường được sử dụng nhiều trong các lĩnh vực quản trị, kinh tế, tâm lý, xã hội học,…khi đã có được mô hình khái niệm (Conceptual Framework) từ các lý thuyết hay các nghiên cứu trước. Trong các nghiên cứu về kinh tế, người ta thường sử dụng thang đo scale) chỉ mục bao gồm rất nhiều câu hỏi (biến đo lường) nhằm đo lường các khái niệm trong mô hình khái niệm, và EFA sẽ góp phần rút gọn một tập gồm rất nhiều biến đo lường thành một số nhân tố. Khi có được một số ít các nhân tố, nếu chúng ta sử dụng các nhân tố này với tư cách là các biến độc lập trong hàm hồi quy bội thì khi đó, mô hình sẽ giảm khả năng vi phạm
hiện tượng đa cộng tuyến. Ngoài ra, các nhân tố được rút ra sau khi thực hiện EFA sẽ có thể được thực hiện trong phân tích hồi quy đa biến (Multivariate Regression Analysis) Trong EFA, mỗi biến đo lường được biểu diễn như là một tổ hợp tuyến tính của các nhân tố cơ bản, còn lượng biến thiên của mỗi biến đo lường được giải thích bởi những nhân tố chung (common factor). Biến thiên chung của các biến đo lường được mô tả bằng một số ít các nhân tố chung cộng với một số nhân tố đặc trưng (unique factor) cho mỗi biến. Nếu các biến đo lường được chuẩn hóa thì mô hình nhân tố được thể hiện bằng phương trình: Xi = Ai1 * F1 + Ai2 * F2 + Ai3 * F3 + . . .+ Aim * Fm + Vi*Ui Trong đó,
Xi : biến đo lường thứ i đã được chuẩn hóa
Aij: hệ số hồi quy bội đã được chuẩn hóa của nhân tố j đối với biến i F1, F2, . . ., Fm: các nhân tố chung
Vi: hệ số hồi quy chuẩn hóa của nhân tố đặc trưng i đối với biến i Ui: nhân tố đặc trưng của biến i
Các nhân tố đặc trưng có tương quan với nhau và tương quan với các nhân tố chung; mà bản thân các nhân tố chung cũng có thể được diễn tả như những tổ hợp tuyến tính của các biến đo lường, điều này được thể hiện thông qua mô hình sau đây:
Fi = Wi1*X1 + Wi2*X2 + Wi3*X3 + . . . + Wik*Xk Trong đó:
Fi: ước lượng trị số của nhân tố i
Wi: quyền số hay trọng số nhân tố(weight or factor scores coefficient) k: số biến
4.1.2 Ứng dụng của phân tích nhân tố
Phân tích nhân tố khám phá EFA thường được sử dụng nhiều trong các lĩnh vực về kinh tế, quản trị, xã hội học, tâm lý...
Trong nghiên cứu xã hội, phân tích EFA thường được dùng trong quá trình xây dựng thang đo (scale) nhằm kiểm tra tính đơn khía cạnh của thang đo và đo lường các khía cạnh khác nhau của khái niệm nghiên cứu.
Ví dụ: Để đo lường chính sách hỗ trợ nhà nước về khuyến nông, người ta có thể
sử dụng các câu hỏi khác nhau với thang đo từ 1-5 như:
Câu hỏi 1: Kinh phí hỗ trợ hoạt động khuyến nông của nhà nước được đảm bảo? Câu hỏi 2: Hỗ trợ vay vốn sau các chương trình khuyến nông của nhà nước là phù hợp?
Câu hỏi 3: Các hỗ trợ khác của nhà nước (ngoài vay vốn) phù hợp (ví dụ như giống cây trồng, phân bón, vật tư nông nghiệp ....)
Câu hỏi 4: Hỗ trợ của nhà nước trong tiêu thụ sản phẩm là phù hợp?
Thông qua phân tích nhân tố, có thể xem 4 yếu tố để đo lường chính sách hỗ trợ khuyến nông đã đầy đủ chưa (giải thích được bao nhiêu %), có tính đơn hướng và ổn định không?
Trong kinh tế, phân tích nhân tố khám phá có ứng dụng rất rộng rãi, trong nhiều trường hợp và phổ biến nhất là:
- Sử dụng trong phân khúc thị trường để phát hiện ra các nhân tố quan trọng dùng để phân nhóm người tiêu dùng. Ví dụ như: Những người mua xe có thể được chia thành 4 nhóm theo sự chú trọng tượng đối về tính năng, tiện nghi, kinh tế và sự sang trọng. Từ đó đưa ra 4 phân khúc về sản phẩm cho người mua xe: những người tiêu dùng tìm kiếm tính kinh tế, người tiêu dùng tìm kiếm tiện nghi, người tiêu dùng tìm kiếm tính năng và người tiêu dùng tìm kiếm sự sang trọng.
- Trong nghiên cứu định giá, ta có thể sử dụng phân tích EFA để nhận ra các đặc trưng của những người nhạy cảm với giá. Ví dụ những người tiêu dùng nhạy cảm với giá có thể là những người có suy nghĩ tiết kiệm, có tính ngăn nắp và không thích ra ngoài...
- Trong nghiên cứu sản phẩm, ta có thể sử dụng phân tích nhân tố để xác định các thuộc tính nhãn hiệu có ảnh hưởng đến sự lựa chọn của người tiêu dùng, Ví dụ như các nhãn hiệu kem chống nắng có thể được đánh giá theo khả năng như chỉ số chống tia UV, thời gian chống nắng tối đa và giá cả...
- Trong nghiên cứu quảng cáo, phân tích nhân tố có thể dùng để tìm hiểu thói quen sử dụng phương tiện truyền thông (tv, báo giấy, internet, quảng cáo ngoài trời...) của thị trường mục tiêu. Từ đó đưa ra cách tiếp cận hiệu quả
4.1.3 Cỡ mẫu khi áp dụng phân tích nhân tố EFA
Khi sử dụng phân tích nhân tố EFA và đồng thời sau đó sử dụng hồi quy đa biến có nhiều cách khác nhau để xác định cỡ mẫu. Tuy nhiên thông thường có 2 bước chính:
Bước 1: Xác định kích thước của mẫu áp dụng trong nghiên cứu được dựa theo
yêu cầu của phân tích nhân tố khám phá EFA (Exploratory Factor Analysis)
Dựa theo nghiên cứu của Hair, Anderson, Tatham và Black (1998) cho tham khảo về kích thước mẫu dự kiến. Theo đó kích thước mẫu tối thiểu là gấp 5 lần tổng số biến
quan sát. Đây là cỡ mẫu phù hợp cho nghiên cứu có sử dụng phân tích nhân tố (Comrey, 1973; Roger, 2006).
N=5*m , lưu ý m là số lượng câu hỏi trong bài.
Theo nghiên cứu của Gorsuch (1983) thì phân tích nhân tố cần ít nhất 200 quan sát.
Bước 2: Xác định kích thước mẫu với phân tích hồi quy đa biến: Cỡ mẫu tối thiểu
cần đạt được tính theo công thức là N=50 + 8*a (a: số biến độc lập) (Tabachnick và Fidell, 1996). Lưu ý a là số lượng nhân tố độc lập, chứ không phải là số câu hỏi độc lập.
Kết luận: khi lựa chọn số lượng mẫu phải thỏa cả hai công thức trên, và nguyên tắc là thà dư còn hơn thiếu mẫu
4.2 PHÂN TÍCH NHÂN TỐ EFA
Quy trình thực hiện EFA, có nhiều nhà nghiên cứu đưa ra các bước(step) khác nhau: Theo Hoàng Trọng và Chu Mộng Ngọc(2010), có 6 bước để thực hiện EFA:
Hình IV-1. Các bước thực hiện phân tích nhân tố
Bước 1: Xác định vấn đề nghiên cứu gồm có nhiều bước.Đầu tiên phải nhận
diện các mục tiêu của PTNT cụ thể là gì. Các biến tham gia vào PTNT phải được xác định dựa vào các nghiên cứu trong quá khứ, phân tích lý thuyết, và đánh giá của các nhà nghiên cứu. Một điều quan trọng là các biến này phải được đo lường một cách thích hợp bằng các thang đo định lượng (khoảng cách hay tỷ lệ), và cỡ mẫu phải đủ lớn. Thông thường thì số quan sát (cỡ mẫu) ít nhất phải bằng 4 hay 5 lần số biến trong PTNT. Trong nhiều tình huống nghiên cứu, kích thước mẫu khá nhỏ và tỷ số này đôi khi cũng khá
Tính toán các nhân số Đặt tên và giải thích các nhân tố
Xoay các nhân tố Tính số lượng nhân tố Xây dựng ma trận tương quan
nhỏ. Trong trường hợp này thì việc giải thích các kết quả cần phải thận trọng. Để minh họa, chúng ta hãy xem ví dụ sau. Một nhà nghiên cứu muốn xác định các lợi ích căn bản người tiêu dùng cần có khi mua một ống kem đánh răng. Mẫu gồm 35 người tiêu dùng được phỏng vấn. Những người được phỏng vấn cho biết mức độ quan trọng của 6 lợi ích sau trên thang đo 7 điểm (1 = không quan trọng, 7 = rất quan trọng). Danh sách 6 lợi ích đó như sau:
V1 (V = value): ngừa sâu răng V2: làm trắng răng
V3: làm chắc nướu V4: làm hơi thở thơm tho V5: làm sạch răng
V6: làm bóng răng
Bước 2: Xây dựng ma trận tương quan: Quá trình phân tích dựa trên ma trận
tương quan của các biến này. Để có thể áp dụng được PTNT thì các biến phải có liên hệ với nhau. Trong thực tế ta luôn có điều này. Nếu hệ số tương quan giữa các biến nhỏ thì PTNT có thể không thích hợp. […] Ta có thể sử dụng Bartlett’s test of sphericity để kiểm tra giả thuyết H0 là các biến không có tương quan với nhau trong tổng thể. […] Đại lượng này càng lớn thì ta càng có nhiều khả năng bác bỏ giả thuyết này. Nếu không thể bác bỏ giả thuyết thì PTNT có thể không thích hợp.
Bước 3: Tính số lượng nhân tố: Chúng ta có thể tính ra một số nhân tố nhiều
bằng số biến, nhưng như thế không có tác dụng gì cả! Để tóm tắt thông tin thì số nhân tố phải ít hơn số biến. Nhưng bao nhiêu nhân tố? Có 5 phương pháp xác định số nhân tố: xác định từ trước, dựa vào eigenvalue, biểu đồ dốc (scree plot), phần trăm biến thiên giải thích được (percentage of variance), chia đôi mẫu và kiểm nghiệm mức ý nghĩa.
Bước 4: Xoay các nhân tố: Sử dụng hai phương pháp gồm phương pháp
Orthogonal Rotation và Oblique rotation.
Bước 5: Đặt tên và giải thích các nhân tố: Việc đặt tên và giải thích các nhân
tố được thực hiện dựa trên các biến quan sát có hệ số tải (factor loading) lớn nằm trong cùng 1 nhân tố
Bước 6: Tính toán các nhân số: Có hai phương pháp để tính toán nhân số có
thể dùng trung bình cộng các biến quan sát để làm nhân số đại diện hoặc có thể dùng phương pháp chuẩn hoá để tính toán nhân số
Sau khi đi tìm hiểu sơ lược về các bước phân tích nhân số, chúng tả đi vào kỹ thuật chi tiết cho phân tích nhân số.
4.2.1 Kiểm định về độ tin cậy của dữ liệu
- Nhân tố (Factors): Ý tưởng chính của EFA là các biến có thể quan sát được có một số đặc điểm chung nào đó mà chúng ta lại không thể quan sát trực tiếp. Ví dụ: Nhiều người khi được hỏi các câu hỏi về thu nhập, giáo dục, nghề nghiệp đều có cách trả lời khá giống nhau vì họ có đặc điểm chung về địa vị kinh tế xã hội. Địa vị kinh tế xã hội chính là nhân tố chi phối thu nhập, giáo dục và nghề nghiệp của họ.
- Trong phân tích nhân tố khám phá, mỗi nhân tố có chức năng giống như một biến, nó đo lường phương sai tổng thể của các biến quan sát được và chúng ta thường hay liệt kê theo thứ tự khả năng giải thích của nhân tố đó
- Độ tin cậy của thang đo được đánh giá bằng phương pháp nhất quán nội tại qua hệ số Cronbach’s Alpha. Sử dụng phương pháp hệ số tin cậy Cronbach’s Alpha trước khi phân tích nhân tố EFA để loại các biến không phù hợp vì các biến rác này có thể tạo ra các yếu tố giả (Nguyễn Đình Thọ & Nguyễn Thị Mai Trang, 2009).
- Hệ số tin cậy Cronbach’s Alpha chỉ cho biết các đo lường có liên kết với nhau hay không; nhưng không cho biết biến quan sát nào cần bỏ đi và biến quan sát nào cần giữ lại. Khi đó, việc tính toán hệ số tương quan giữa biến-tổng sẽ giúp loại ra những biến quan sát nào không đóng góp nhiều cho sự mô tả của khái niệm cần đo (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005).
Vì vậy, các tiêu chí được sử dụng khi thực hiện đánh giá độ tin cậy thang đo:
- Tiêu chuẩn chọn thang đo khi có độ tin cậy Alpha lớn hơn 0,7 (Hair và các cộng sự 2009, 116); từ 0,6 trở lên là có thể sử dụng trong trường hợp khái niệm nghiên cứu là mới hoặc là mới trong bối cảnh nghiên cứu (Nunally, 1978; Peterson, 1994; Slater, 1995; Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2005).
Chú ý: Trong thực tế phân tích có 2 loại thang đó được sử dụng dụng trong phân tích là thang đo phản ánh (reflective measurement) và thang đo khẳng định (formative measurement). Hai thang đo này đều sử dụng đo lường biến tiềm ẩn (biến được đo lường thông qua nhiều khái niệm khác nhau => khái niệm trừu tượng). Tuy nhiên Cronbach Alpha chỉ sử dụng đánh giá độ tin cậy đối với thang đo phản ánh cũng như thực hiện các kiểm định của EFA, CFA (những kiểm định này đều xoay quanh việc đánh giá tương quan giữa các biến quan sát với nhau). Với thang đo phản ánh thì các biến quan sát có
xu hướng tương quan chặt chẽ với nhau do các biến quan sát này đều là kết quả được tạo ra từ biến tiềm ẩn. Chính vì vậy, tập hợp các biến của thang đo phản ánh tạo ra thang đo có tính đơn hướng và có sự ổn định cao. Ngược lại, thang đo khẳng định, các biến quan sát là các mảng tách biệt nhau do đó không đạt được tính đơn hướng và ổn định. Tóm lại, hệ số cronbach Alpha được sử dụng cho các loại thang đo thoả mãn các điều kiện sau:
Thứ nhất, các biến quan sát trong thang đo phải có sự tương quan với nhau khá tốt.
Thứ hai, các biến quan sát phải thoả mãn tính đơn hướng và cùng chiều.
4.2.2 Tiêu chuẩn chọn số nhân tố
Một quyết định quan trọng trọng EFA là bao nhiêu nhân tố được giữ lại. Có rất nhiều cách khác nhau để đưa ra quyết định số nhân tố được giữ lại. Một số tiêu chuẩn đồng thời để chọn nhân tố như sau:
- Kiểm định thống kê (Sử dụng kiểm định Bartlet): Đây là một đại lượng thống kê dùng để xem xét giả thuyết các biến không có tương quan trong tổng thể. Nếu kiểm định này có ý nghĩa thống kê (Sig. < 0.05) thì các biến quan sát có mối tương quan với nhau trong tổng thể. Điều này là do điều kiện để thực hiện EFA là các biến quan sát cần phản ánh những khía cạnh khác nhau của cùng 1 nhân tố và phải có mối tương quan với nhau. Về mặt ly thuyết, kiểm định Bartlett dùng để xem xét ma trận tương quan có phải là ma trận đơn vị (identity matrix) hay không ?. Ma trận đơn vị ở đây được hiểu là ma trận có hệ số tương quan giữa các biến bằng 0, và hệ số tương quan với chính nó bằng 1. Nếu phép kiểm định Bartlett có p<5%, chúng ta có thể từ chối giả thuyết H0 (ma trận tương quan là ma trận đơn vị), có nghĩa là các biến có quan hệ với nhau.
- Hệ số Eigenvalue: Đại diện cho phần biến thiên được giải thích bởi mỗi nhân tố. Còn Factor Loadings (hệ số tải nhân tố) là những hệ số tương quan đơn giữa các biến quan sát với nhân tố. Nếu hệ số tải càng lớn chứng tỏ biến quan sát có mối quan hệ càng