1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Phân tích nhân tố với dữ liệu có thứ bậc

57 200 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 57
Dung lượng 1,79 MB

Nội dung

Như vậy phân tích nhân tố cố gắng thu gọn độ tươngquan giữa các chỉ số bởi vì số lượng các yếu tố là ít hơn số biến quan sát trực tiếp.Các khái niệm này bắt nguồn từ Mô hình nhân tố chun

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

ĐẶNG THỊ PHƯƠNG ANH

PHÂN TÍCH NHÂN TỐ VỚI DỮ LIỆU CÓ THỨ BẬC

LUẬN VĂN THẠC SĨ TOÁN HỌC

HÀ NỘI - 2017

Trang 2

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

ĐẶNG THỊ PHƯƠNG ANH

PHÂN TÍCH NHÂN TỐ VỚI DỮ LIỆU CÓ THỨ BẬC

LUẬN VĂN THẠC SĨ TOÁN HỌC

Chuyên ngành: Lý thuyết Xác suất và Thống kê Toán học

Mã số: 60460106

NGƯỜI HƯỚNG DẪN KHOA HỌC

TS TRỊNH QUỐC ANH

HÀ NỘI - 2017

Trang 3

LỜI CẢM ƠN

Trước khi trình bày nội dung chính của luận văn, em xin bày tỏ lòng biết ơnsâu sắc tới TS Trịnh Quốc Anh người đã tận tình hướng dẫn để em có thể hoànthành luận văn này

Em cũng xin bày tỏ lòng biết ơn chân thành tới toàn thể các thầy cô giáotrong khoa Toán - Cơ - Tin học, Trường Đại học Khoa Học Tự Nhiên, Đại HọcQuốc Gia Hà Nội đã dạy bảo em tận tình trong suốt quá trình học tập tại khoa.Nhân dịp này em cũng xin được gửi lời cảm ơn chân thành tới gia đình, cơquan Nhà xuất bản Đại học Quốc gia Hà Nội, đồng nghiệp bạn bè đã luôn bên

em, cổ vũ, động viên, giúp đỡ em trong suốt quá trình học tập và thực hiện luânvăn tốt nghiệp

Hà Nội, ngày 6 tháng 06 năm 2017

Học viên

Đặng Thị Phương Anh

Trang 4

Mục lục

1.1 Xác định nhân tố (factor extration) 6

1.2 Lựa chọn nhân tố (factor section) 8

1.3 Phép xoay nhân tố (factor rotation) 13

2 Phân tích nhân tố khẳng định CFA 19 2.1 Giới thiệu về CFA 19

2.2 So sánh CFA và EFA 21

2.3 Mục đích và ưu điểm của CFA 24

2.4 Nhận dạng thống kê 25

2.5 Ước lượng tham số của mô hình CFA 27

2.5.1 Phương pháp ước lượng hợp lý cực đại 27

2.6 Các bước tiến hành CFA 28

2.6.1 Xác định cấu trúc thành phần 28

2.6.2 Xây dựng mô hình đo lường tổng quát 29

2.7 Thiết kế một nghiên cứu cụ thể 35

2.7.1 Các thang đo trong CFA 35

2.7.2 Đánh giá tính giá trị của mô hình đo lường 37

2.8 Đánh giá sự phù hợp (Assessing fit) 38

2.9 Ước lượng các tác động (path estimates) 38

2.10 Tính giá trị cấu trúc (Construct Validity) 38

2.10.1 Giá trị tương đồng (Convergent Validity) 39

2.10.2 Giá trị dị biệt (Discriminant validity) 39

2.10.3 Chẩn đoán mô hình (Model diagnostics) 39

2.10.4 Số dư chuẩn hoá (Standardized Residuals) 39

2.10.5 Các chỉ số điều chỉnh (Modification indices) 40

3 Thực hành chạy EFA và CFA trên SPSS và Amos với dữ liệu thực tế 41 3.1 Dữ liệu tiến hành phân tích 41

3.2 Sử dụng EFA trên SPSS 41

3.3 Sử dụng CFA trên AMOS 45

3.3.1 Cải thiện mô hình 46

3.3.2 Model Fit 47

3.4 Mô hình SEM 49

3.4.1 Dữ liệu Yên Bái 49

Trang 5

3.4.2 Phân tích đa nhóm 49

Trang 6

Lời mở đầu

Kể từ khi ra đời hơn một thế kỷ trước, phân tích nhân tố trở thành một trongnhững phương pháp thống kê nhiều chiều được sử dụng phổ biến nhất nhằm ápdụng để nghiên cứu số các lĩnh vực (ví dụ như tâm lý học, giáo dục, xã hội học,quản lý, khoa học chính trị, y tế công cộng) Mục đích cơ bản của phân tích nhân tố

là xác định được lượng và chất của các biến ẩn Biến ẩn được ám chỉ bởi hiệp tươngquan giữa hai hay nhiều biến quan sát hoặc các nhân tố giải thích cho phương sai,hiệp phương sai trong một nhóm các quan sát, thường được gọi là chỉ số Cụ thểmột nhân tố không thể quan sát được ảnh hưởng hơn biến quan sát được và nógiải thích cho mối tương quan giữa các biến quan sát được Nói cách khác, các biến

đo lường được tương quan vì nó chia sẻ tác nhân chung (tức là nó bị ảnh hưởngcấu trúc cơ bản giống nhau) Như vậy phân tích nhân tố cố gắng thu gọn độ tươngquan giữa các chỉ số bởi vì số lượng các yếu tố là ít hơn số biến quan sát trực tiếp.Các khái niệm này bắt nguồn từ Mô hình nhân tố chung (Thurstone, 1947).Trong đó, mặc định rằng các chỉ số của các biến đo lường được là một hàm tuyếntính của một hay nhiều nhân tố chung và một nhân tố riêng Như vậy phân tíchnhân tố phân vùng phương sai của mỗi chỉ số thành hai loại: (1) Phương sai chunghoặc các phương sai cho bởi các nhân tố, được ước lượng trên căn cứ của phươngsai đã chia sẻ với các chỉ số khác trong phân tích; (2) Phương sai riêng, tức là sựkết hợp giữa phương sai tin cậy (reliable variance) – các chỉ số cụ thể (các yếu tốảnh hướng tới chỉ số) với sai số ngẫu nhiên phương sai (random error variance) Cóhai loại chính của phân tích nhân tố chung: Phân tích nhân tố khám phá (EFA)

và phân tích nhân tố khẳng định (CFA) (J¨oreskog, 1969, 1971a) Cả EFA và CFEđều nhằm tái hiện lại sự liên quan của các quan sát với tập nhỏ nhất các biến ẩn,nhưng chúng khác nhau về cơ bản bởi lượng và chất của mô hình tiên nghiệm và

sự hạn chế bởi mô hình nhân tố

Theo đó, EFA thường được sử dụng trước đó để phát triển mô hình còn CFAđược sử dụng sau khi đã xây dựng cấu trúc, được thành lập thực nghiệm với EFA

và cơ sở lý thuyết

Luận văn gồm những khái niệm, thuật ngữ cơ bản và ví dụ về phân tích nhân

tố EFA và CFA Bố cục của luận văn bao gồm 3 chương:

• Chương 1 của luận văn trình bày về phân tích nhân tố khám phá EFA

• Chương 2 của luận văn tập trung trình bày phân tích nhân tố khẳng địnhCFA

• Chương 3 thực hành chạy EFA và CFA trên hai phần mềm là SPSS và Amosvới dữ liệu thực tế

Trang 7

Do thời gian thực hiện luận văn không nhiều, kiến thức còn hạn chế nên khi làmluận văn không tránh khỏi những hạn chế và sai sót Tác giả mong nhận được sựgóp ý và những ý kiến phản biện của quý thầy cô và bạn đọc Xin chân thành cảmơn!

Hà Nội, ngày 6 tháng 05 năm 2017

Học viên

Đặng Thị Phương Anh

Trang 8

Chương 1

Phân tích nhân tố khám phá EFA

Trong chương này, các mô hình nhân tố được đề cập chủ yếu trong khuôn khổcủa EFA Tuy nhiên, hầu hết các thuật ngữ được sử dụng của EFA cũng được sửdụng tương tự trong CFA Trong nghiên cứu ứng dụng, CFA và EFA thường đượctiến hành cùng với nhau Ví dụ, CFA thường được sử dụng trong giai đoạn sau củaviệc xây dựng mô hình nhằm kiểm tra, xác định độ hợp lý và phù hợp của số liệuvới mô hình Còn EFA giúp khảo sát, tìm đặc trưng của số liệu nhằm xây dựng

mô hình Như vậy muốn nghiên cứu và áp dụng CFA, ta phải hiểu rõ được EFA.Phương pháp tiến hành EFA được trình bày trong chương này Tổng quan so sánhchi tiết hơn về EFA và CFA sẽ được đề cập ở chương sau

EFA là một kỹ thuật để thăm dò hoặc mô tả lượng phù hợp các nhân tố chung

và để phát hiện ra các biến đo được mà là chỉ số hợp lý của các biến không trựctiếp quan sát, nhưng chúng ta giả định để tồn tại (có ít nhất ý nghĩa nào đó) đểgiải thích mô hình của sự biến đổi các biến quan sát Ví dụ, trong nghiên cứu tínhcách chúng ta có thể cho ai đó một bộ câu hỏi bao gồm 30 câu hỏi về mối quan hệcủa cá nhân họ, đời sống xã hội, Tại các mức cụ thể nhất, điều này cho chúng

ta kết quả mỗi người với trên 30 chiều riêng biệt Tuy nhiên, chúng ta có thể tómthành hai biến tiềm ẩn "hướng nội / hướng ngoại" có thể cho ra nhiều sự thay đổi

có hệ thống mà lấy trên 30 tham số quan sát Tóm lại, phương pháp phân tíchnhân tố EFA thuộc nhóm phân tích đa biến phụ thuộc lẫn nhau (interdependencetechniques), nghĩa là không có biến phụ thuộc và biến độc lập mà nó dựa vào mốitương quan giữa các biến với nhau (interrelationships) EFA dùng để rút gọn mộttập k biến quan sát thành một tập F (F < k) các nhân tố có ý nghĩa hơn Cơ sởcủa việc rút gọn này dựa vào mối quan hệ tuyến tính của các nhân tố với các biếnnguyên thủy (biến quan sát)

Như đã nêu trên, mục tiêu của EFA là để đánh giá chiều của một tập hợpnhiều chỉ số (ví dụ các mục từ một bảng hỏi) bằng cách khám phá nhân tố sáng

tỏ cần thiết để giải thích các mối tương quan giữa chúng Trong khi đó, các nhà

Trang 9

nghiên cứu cuối cùng phải ghi rõ số yếu tố phân tích bởi vì không có một hạn chếban đầu cho các mô hình của các mối quan hệ giữa biến quan sát và biến tiềm ẩn.Đây là sự khác biệt quan trọng giữa CFA và EFA Trong CFA, nhà nghiên cứuphải xác định một số yếu tố quan trọng của mô hình yếu tố (ví dụ, số nhân tố,

mô hình chỉ số nhân tố tải trọng) Sau khi xác định rằng EFA là kỹ thuật phântích thích hợp nhất cho câu hỏi thực nghiệm bằng tay Các nhà nghiên cứu phảiquyết định các chỉ số đưa vào phân tích, xác định kích thước và tính chất của mẫukhông phù hợp cho phân tích Các bước của EFA bao gồm:

Bước 1: Tính ma trận các mối liên quan cho tất cả các biến (correlationmatrix)

- Tạo correlation matrix cho tất cả các biến

- Xác định các biến mà không có liên quan với biến khác

- Trong trường hợp mối liên quan giữa các biến nhỏ, chúng có thể không chungmột nhân tố

- Kiểm định Kaiser-Meyer-Olkin (KMO)

- Kiểm định Bartlett test of Sphericity

Lưu ý: KMO là một chỉ tiêu để xem xét sự phù hợp cho việc phân tích EFA (0.5< KMO <1 là tốt) Kiểm định Bartlett xem xét giả thuyết Ho: Độ tương quangiữa các biến số quan sát bằng 0 Nếu kiểm định này có ý nghĩa thống kê ( sig

<0.05) thì các biến có tương quan với nhau trong tổng thể

Bước 2: Xác định nhân tố - Sử dụng một số công cụ ước lượng như Phântích thành phần chính hoặc Maximum likelihood Trong SPSS, phương pháp phântích thành phần chính được sử dụng, đây là phức hợp giải thích được nhiều biếnthiên nhất trong quần thể, sau đó giảm dần ở nhân tố thứ 2, 3 Để xác định giữlại bao nhiêu nhân tố, căn cứ vào 2 yếu tố: Eigen values > 1 và The Scree plot.Bước 3:Xoay nhân tố - Factor rotation (có nhiều phương pháp đề xoay nhân

tố, tuỳ theo điều kiện gạn lọc dữ liệu mà chúng ta có thể áp dụng)

- Phương pháp varimax rotations là phương pháp phổ biến hiện nay

- Chọn các nhân tố có trị số lớn nhất và nhóm chúng lại

Bước 4: Đặt tên nhân tố

1.1 Xác định nhân tố (factor extration)

Có rất nhiều phương pháp có thể sử dụng để ước lượng mô hình nhân tốchung, chẳng hạn như Khả năng tối đa (Maximum likehood; ML), Trọng số bìnhphương tối thiểu Ở đây ta quan tâm tới phương pháp phân tích thành phầnchính PCA (Principal Component Analysis) vì nó được sử dụng phổ biến trongnghiên cứu xác định tập đầu tiên của tải trọng, nó cũng được sử dụng như phân

Trang 10

tích bước nền cho các phân tích sâu hơn như các phân tích hồi qui hay sử dụngcho các mô hình SEM SPSS sử dụng phương pháp PCA (principal componentsanalysis), thường xuyên bị nhầm lẫn là phương pháp ước lượng của phân tích nhân

tố chung Không giống như các ước lượng ML và PF PCA dựa trên một tập hợpkhác nhau của phương pháp định lượng mà không dựa trên mô hình chung PCAkhông phân biệt sai số chung và sai số riêng Thay vào đó, PCA nhằm giải thíchphương sai cho các biến quan sát hơn là giải thích các mối tương quan giữa chúng.Như vậy PCA là một cách thích hợp được sử dụng như một kỹ thuật nén dữ liệu

để giảm bớt, thu nhỏ một tập quan sát để quản lý và sử dụng trong phân tích tiếptheo

tỉ lệ đóng góp tương đối tốt, có thể dừng lại để quan sát Cách tìm các trục tọa độđược phân tích xây dựng

Trong EFA, PCA được sử dụng để tìm giá trị của tải trọng mà tổng ước lượngchung càng gần so với tổng các phương sai quan sát càng tốt

Trang 11

Hình 1.1.1: PCA tìm trục cho không gian mới sao cho nó biểu diễn tốt nhất mức độ biến thiên của dữ liệu.

1.2 Lựa chọn nhân tố (factor section)

Tiếp theo, phân tích nhân tố được chạy với các phương pháp ước lượng đượclựa chọn (ví dụ ML, PF) Kết quả phân tích ban đầu được sử dụng để xác định sốlượng thích hợp các yếu tố để tách ra trong các phân tích tiếp theo Điều này đượccoi là quan trọng nhất của EFA Bởi vì underfactoring (chọn quá ít các nhân tố)

và overfactoring (chọn quá nhiều các nhân tố) Có thể gây ra ảnh hưởng đến môhình cuối cùng hay có thể tạo ra lỗi đáng kể trong việc xác định hệ số tải trọng.Mặc dù một số nghiên cứu cho thấy hậu quả của overfactoring ít nghiêm trọnghơn underfactoring (cf Fabrigar et al., 1999)

Trên thực tế, EFA là một kỹ thuật khám phá hoặc miêu tả một cách tự nhiên,các kết quả về việc đưa ra số lượng thích hợp các nhân tố được thực hiện bởi nhữngcân nhắc độc lập Số lượng các yếu tố (m) có thể được lấy ra bởi EFA là được giớihạn bởi các biện pháp quan sát (p) của nghiên cứu Các giới hạn trên của số cácnhân tố thay đổi thông qua kỹ thuật ước lượng

Ví dụ minh họa một số khái niệm quan trọng của mô hình nhân tố chung.Trong ví dụ cơ bản này, bốn loại quan sát hành vi (O1-O4) đã được thu thập trên

300 cá nhân được ghi nhận ở khoa thần kinh của một bệnh viện Bốn nhân tố là

Vô vọng (O1), Cảm giác vô dụng / tội lỗi (O2), Tâm thần chậm phát triển (O3)

và Rối loạn giấc ngủ (O4)

Bảng 2.1 là tương quan của bốn nhân tố Phỏng đoán rằng mỗi nhân tố làmột chỉ số biểu hiện tiềm ẩn của bệnh trầm cảm Đó là, mỗi triệu chứng quansát được (ví dụ: sự tuyệt vọng, vô dụng) có ảnh hưởng đến việc chia sẻ các khủnghoảng, chỉ có biến tiềm ẩn (yếu tố) mới giải thích cho sự tương quan của các phần

tử trong những quan sát Có duy nhất một lý do cho các chỉ số tương quan là họchia sẻ những nguyên nhân phổ biến của trầm cảm; nếu biến tiềm tàng này đượcloại bỏ, không có mối quan hệ giữa các chỉ số này được nhìn thấy

Trong EFA sử dụng PF (Principal factor), số lượng tối đa các yếu tố được

Trang 12

để lấy được p − 1 Trong ML (Maximum likelihood), EFA số lượng các yếu tố đầuvào trong mối tương quan ma trận hiệp phương sai (a) phải bằng hoặc lớn hơn sốlượng tham số được ước tính trong nhân tố giải pháp (b) Số lượng các nhân tố

(m) tăng thìtham số ước tính (b) trong nhân tố giải pháp cũng tăng lên Thực tế

số lượng tối đa các nhân tố là giới hạn toán học bởi dữ liệu đầu vào và có thể khóhiểu với ML để phân tích Đó là dữ liệu có thể không hỗ trợ khai thác các yếu tốđược thừa nhận để tồn tại trên cơ sở khái niệm Ví dụ, bởi vì có 4 biện pháp quansát (p = 4) có liên quan, nó có thể trích ra chỉ một nhân tố (m = 1) trong EFA.Mặc dù 2 nhân tố có thể khả thi Ví dụ, cơ thể trầm cảm: O1, O2; tâm thần trầmcảm: O 3, O 4 Các tham số được kết hợp với 2 nhân tố mô hình (b) sẽ phóng đại sốcủa các mẩu thông tin trong đầu vào ma trận tương quan(a) Đồng thời a và b cóthể dễ dàng tính toán qua phương trình sau đây:

a = [p ∗ (p + 1)]/2

b = (p ∗ m) + [m ∗ (m + 1)]/2) + p − m2

Trong đóp là số biến quan sát (chỉ số) và m là số lượng các yếu tố Giải quyếtmột chỉ số chỉ ra rằng ma trận đầu vào gồm 10 mẩu thông tin (xem Bảng 2.1)tương ứng với 6 mối tương quan trong số các phần tử còn lại ngoài đường chéochính và 4 phương sai chuẩn hóa trên đường chéo Đó là a = (4.5)/2 = 10 Giải cho

b (khi m = 1) chỉ ra rằng có 8 thông số ước tính cho một nhân tố giải pháp, đó là

b = (4 ∗ 1) + [(1 ∗ 2)/2] + 4 − 1 = 4 + 1 + 4 − 1 = 8 Bởi vì số lượng các yếu tố của matrận đầu vào (a = 10) lớn hơn số ước lượng tham số (b = 8), một yếu tố duy nhất

có thể trích ra từ dữ liệu Tuy nhiên, hai nhân tố không thể trích ra vì số lượngtham số để được ước tính trong mô hình này vượt quá số phần tử của ma trận đầuvào, đó là b = (4 ∗ 2) + [(2 ∗ 3)/2] + 4 − 4 = 8 + 3 + 4 − 4 = 11 Mỗi thành phần củaphương trình được sử dụng để giải quyết cho b tương ứng với các thông số cụ thể

và hạn chế toán học trong mô hình EFA

Trang 13

Thành phần đầu tiên, (p ∗ m), cho biết số hệ số tải trọng Λy Thành phần thứhai,([m ∗ (m + 1)]/2), cho biết số phương sai nhân tố và hiệp phương sai ψ Thànhphần thứ ba,p, tương ứng với số dư phương sai còn lạiθ,  Cuối cùng,m2 phản ánh

số lượng giới hạn được yêu cầu để xác định mô hình EFA Ví dụ, như mô tả trongmột mô hình có 4 nhân tố tải trọng (p ∗ m), 1 yếu tố phương sai ([m ∗ (m + 1)]/2),

và 4 chỉ số dư (p); Tuy nhiên, để xác định mục đích, phương sai nhân tố được cốđịnh 1.0 (m2 = 12 = 1) và do đó mô hình chứa các thông số ước tính Giải pháphai – nhân tố sẽ kéo theo 8 nhân tố tải trọng (4 ∗ 2), 2 yếu tố phương sai và 1 nhân

tố hiệp phương sai, [(2 ∗ 3)/2], và 4 chênh lệch còn lại (tổng số các tham số = 15).Sau khi trừ đi các hạn chế xác định (m2 = 22 = 4; 15 − 4 = 11), số lượng các tham

số được ước tính trong mô hình hai nhân tố (b = 11) vẫn vượt quá các mảnh trong

mô hình hai – nhân tố (b = 11) vẫn vượt quá các nhân tố trong ma trận đầu vào(a = 10) Như vậy hai nhân tố không thể được chiết xuất từ các dữ liệu ML khi

p = 4

Đoạn trước đã thảo luận về các giá trị riêng (ví dụ 2, 579) có nguồn gốc từ

ma trận giảm tương quan (Rr) được xây dựng bởi các giải pháp EFA Như vậy giátrị riêng hướng dẫn quy trình lựa chọn nhân tố bằng cách truyền tải nhân tố giảithích một phần đáng kể của tổng phương sai trong những biện pháp quan sát Bagiải pháp lựa chọn được sử dụng phổ biên được xây dựng trên cơ sở giá trị riêng

Ba nhân tố lựa chọn đó là: (1) Qui tắc Kaiser-Guttman, (2) kiểm tra Scree, và (3)phân tích song song Quy tắc Kaiser-Guttman (hay còn gọi là các tiêu chí Kaiserhoặc giá trị riêng > 1.0) quy tắc rất đơn giản: (1) có những giá trị riêng có nguồngốc từ các ma trận tương quan đầu vào R (như ghi chú của Fabrigar et al., 1999,các nhà nghiên cứu thường xuyên mắc sau lầm khi sử dụng giá trị riêng của matrận tương quan đầu vào thu gọn, Rr); (2) xác định có bao nhiêu giá trị riêng lớnhơn1.0; (3) sử dụng con số này để xác định số lượng kích thước tiềm ẩn không tầmthường mà tồn tại dữ liệu đầu vào Nhắc lại rằng giá trị riêng đại diện cho phươngsai và EFA chuẩn hóa cả biến ẩn và biến quan sát Như vậy, bởi vì mục tiêu củaEFA là giảm một tập hợp các chỉ tiêu đầu vào (số lượng các nhân tố nhận đượcnhỏ hơn số lượng các chỉ số đầu vào), nếu một giá trị riêng ít hơn 1.0, sau đó cácnhân tố giải thích tương ứng cho phương sai ít hơn các chỉ số (mà đúng bằng 1, 0).Qui tắc Kaiser – Guttman có sự hấp dẫn lớn (và trong thực tế là mặc định trongphần mềm thống kê như SPSS) vì nó đơn giản và khách quan Tuy nhiên, nhiềuphương pháp luận đã chỉ trích thủ tục này bởi vì nó có thể dẫn đến overf actoring

hoặc underf actoring, và bởi vì bản chất nó hơi độc đoán

Một phương pháp phổ biến khác được gọi là thử nghiệm Scree (Cattell, 1966),cũng sử dụng các giá trị riêng có thể được lấy từ đầu vào hoặc ma trận tương quanthu gọn Để cung cấp một minh họa thực tế hơn về phương pháp này, một tập hợp

Trang 14

dữ liệu lớn hơn được sử dụng (p = 20) Trong hình 12.1, các thử nghiệm Scree sửdụng một đồ thị trong có các giá trị riêng hình thành trục dọc và các nhân tố hìnhthành trục ngang Đồ thị được kiểm tra để xác định sự suy giảm đáng kể cuối cùngtrong biên độ của trị riêng hoặc điểm, nơi đường vẽ thông qua các giá trị riêng biểuthị sự thay đổi độ dốc Một hạn chế của việc này các tiếp cận là các kết quả củacác thử nghiệm Scree có thể khá mơ hồ (ví dụ không có rõ ràng về việc hay đổi về

độ dốc) và mở để giải thích chủ quan Điều này thể hiện rõ trong hình 1.3, nơi màcác kết quả có thể được hiểu như là một trong 4 hoặc 5 nhân tố giải pháp Tuynhiên, như ghi nhận của Gorsuch (1983), các thử nghiệm Scree thực hiện khá tốtdưới điều kiện khi khích thước mẫu lớn và được xác định rõ yếu tố có mặt trongcác dữ liệu (tức là, các yếu tố xác định bởi nhiều mục đích và tính chung cao).Một phương pháp dựa vào giá trị riêng khác cho việc hướng dẫn lựa chọn nhân

tố là Phân tích song song (Horn, 1965; Humphreys và Montanelli, 1975) Phươngpháp này dựa trên thử nghiệm Scree của các giá trị riêng thu được từ dữ liệu mẫuvới giá trị riêng được ước tính từ một tập dữ liệu các số ngẫu nhiên (tức là, ý nghĩacủa các giá trị riêng được sinh ra bởi nhiều tập dữ liệu hoàn toàn ngẫu nhiên) Vẽđường hiển thị giá trị riêng của dữ liệu ngẫu nhiên và dữ liệu quan sát, số nhân

tố lựa chọn phụ thuộc vào điểm giao nhau của hai đường Lựa chọn nhân tố đượchướng dẫn bởi số lượng các giá trị riêng thực lớn hơn các giá trị riêng được tạo ra

từ dữ liệu ngẫu nhiên; có nghĩa là, nếu các nhân tố "thật" giải thích ít phương saihơn nhân tố tương ứng thu được từ các số ngẫu nhiên, không nên đưa vào phântích nhân tố Các phân tích song song đề cập đến thực tế rằng tập hợp dữ liệungẫu nhiên(s) nên song song với các khía cạnh của các dữ liệu nghiên cứu thực tế(ví dụ kích thước, số lượng các chỉ số)

Hình 1.2.1: Thử nghiệm Scree các giá trị riêng của ma trận tương quan Mũi tên chỉ nơi

độ dốc thay đổi của đường cong

Trang 15

Mặc dù phân tích song song thường thực hiện tốt nhưng hạn chế của thủ tụcnày là nó không phải là có sẵn trong phần mềm thống kê phổ biến như SAS vàSPSS, tuy nhiên phân tích song song được lựa chọn trong Mplus và chương trìnhphần mềm Stata, và trong các chương trình phần mềm chia sẻ khác nhau được tìmthấy trên Internet (ví dụ, O’Connor, 2001) Ngoài ra, Hayton, Allen, và Scarpello(2004) đã cung cấp cú pháp để tiến hành phân tích song song trong SPSS, mặc dùngười sử dụng phải lưu lại và lấy tổng giá trị riêng được tạo ra từ dữ liệu ngẫu nhiênbên ngoài của SPSS Như đã nói ở trên, khi một thủ tục ước lượng nhân tố khác

là ML được sử dụng, các thủ tục giá trị riêng dựa vào quy tắc Kaiser-Guttman,các thử nghiệm Scree, và phân tích song song có thể được sử dụng để hỗ trợ trongviệc lựa chọn nhân tố

Hình 1.2.2: Phân tích song song sử dụng các giá trị riêng từ nghiên cứu và dữ liệu ngẫu nhiên, trung bình của 50 lần lặp Mũi tên chỉ ra rằng giá trị riêng từ dữ liệu ngẫu nhiên vượt quá giá trị riêng từ dữ liệu nghiên cứu sau nhân tố thứ tư

Lưu ý:

- Độ dốc cho thấy các factor lớn

- Khi hết độ dốc, thường các factor còn lại có giá trị Eigen < 1

- Ngoài các thử nghiệm thống kê, cần dựa vào thực tế và mục đích bài nghiêncứu

- Giai đoạn này chưa thể kết luận số lượng nhân tố

Trang 16

1.3 Phép xoay nhân tố (factor rotation)

Hệ số tải trọng không duy nhất, đầu tiên ta xem xét ví dụ sau:

Sinh viên trước tham gia chương trình MBA phải học ba khóa bắt buộc làTài chính, Tiếp thị và chính sách kinh doanh Y1, Y2 ,Y3 đại diện cho ba khóa này.Các dữ liệu lấy từ năm sinh viên ( trên thang điểm 10):

Trong đó βi là tải trọng, ei sai số (trong trường hợp giả thuyết các mối quan

hệ không chính xác) Ta xét một mô hình A sau đây:

Tiếp theo ta xem xét mô hình B, một tập βij khác:

Trang 17

Một lần nữa ta có thể dễ dàng xác nhận các phương sai, hiệp phương sai

lý thuyết giống hệt với mô hình A Ví dụ: V ar(Y1) = ( √

2/2)2 + 02 = 0, 5 + σ2;

Cov(Y1, Y2) = ( √

2/2)(0, 3 √

2) + (0)(0) = 0.3

Khảo sát tại bảng dưới đây, dọc theo trục ngang chúng ta vẽ đồ thị các hệ

số của F 1 và trục dọc là các hệ số của F 2 cho mỗi phương trình của mô hình A.Các hệ số của F 1 và F 2 trong phương trình đầu tiên được biểu diễn như là điểm

có tọa độ (0, 5; 0, 5), những điểm của phương trình thứ hai là (0, 3; 0, 3) và thứ ba

là (0, 5; −0, 5)

Hình 1.3.1: Minh họa tải trọng xoay vòng

Chúng ta thấy là tải trọng của mô hình B chính là việc áp dụng phép xoay tảitrọng của mô hình A, Hình 13.1, và có vô số các phép quay như vậy cho thấy hệ sốtải trọng là không duy nhất Điều này có thể áp dụng trong thực tế Cụ thể, khitiến hành phân tích sẽ có một số dự đoán trước liên quan tới tải trọng Đặc biệtmột số tải trọng có thể dự kiến bằng không hoặc là gần bằng không Vì lí do này,phân tích nhân tố thu được trong hai giai đoạn Trong giai đoạn đầu tiên, một bộtải trọngβij được tính theo phương sai, hiệp phương sai lý thuyết đưa ra phù hợp

Trang 18

với những quan sát càng nhiều càng tốt theo một chuẩn nhất định Tuy nhiên cáctải trọng lúc này có thể chưa hợp lý với kỳ vọng tiên nghiệm hoặc không có một

lý giải hợp lý Do đó, trong giai đoạn thứ hai, các tải trọng sẽ được quay để đượcgiá trị phù hợp tốt nhất với phương sai và hiệp phương sai quan sát và phù hợpvới cả kỳ vọng tiền nghiệm và dễ giải thích hơn Giả sử, ví dụ rằng các tải trọng

mô hình A là ước tính xây dựng phù hợp nhất Tất cả các tải trọng là cùng mộtthứ tự mức độ và tất cả các biến đều phụ thuộc vào hai nhân tố đó Trong khi tảitrọng ở mô hình B phù hợp với phương sai, hiệp phương sai và chỉ rõ rằng Y1, Y2

phụ thuộc vào một yếu tố duy nhất, trong khi Y3 phụ thuộc vào yếu tố khác.Khi số lượng nhân tố đã được xác định, ta tiến hành xoay các nhân tố xoay.Phép xoay phải có hai nhân tố trở lên (không áp dụng đối với phương pháp tríchmột nhân tố), phép xoay phù hợp bởi tính chất không xác định của mô hình nhân

tố chung Đó là, đối với bất kỳ mô hình nhiều nhân tố, tồn tại một số vô hạn củacác phương pháp tốt phù hợp Trong nghiên cứu ứng dụng, nhân tố tải trọng lớnhơn hoặc bằng 0, 30 hoặc 0, 40 thường được coi là cần thiết, mặc dù không có yêucầu cụ thể và các tiêu chuẩn nhưng việc lấy giới hạn tải trọng thường phụ thuộcvào bối cảnh thực nghiệm Như vậy, đối với mô hình có chứa hai hoặc nhiều nhân

tố (vô số phương pháp như nhau phù hợp là có thể), phép xoay dẫn đến tạo ramột phương pháp với các cấu trúc đơn giản nhất Điều này quan trọng để nhấnmạnh rằng phép xoay không làm sự thay đổi phù hợp của các phương pháp

Có hai loại phép xoay chính: vuông góc (trực giao) và xiên Trong phép quaytrực giao, các nhân tố này được hạn chế để không tương quan (tức là, nhân tốnày được định hướng ở góc90◦ trong không gian đa chiều); Trong phép xoay xiên,những nhân tố được phép tương quan (tức là, cho phép định hướng trục nhân tốdưới 90◦) Mối tương quan giữa hai nhân tố bằng với cosin của góc giữa các trụcquay Bởi vì cos(90◦) = 0, các nhân tố này là không tương quan trong phép quaytrực giao Trong phép quay xiên, góc của các trục được phép lớn hơn hoặc nhỏ hơn

90◦, và do đó cosin của góc có thể mang lại một nhân tố tương quan giữa 0 và 1.Trong nghiên cứu khoa học ứng dụng, phép xoay trực giao được sử dụngthường xuyên nhất, có lẽ vì nó được mặc định từ lâu trong các chương trình thống

kê chính như SPSS Các nhà nghiên cứu đã nhận thức rằng phương pháp xoaytrực giao được giải thích dễ dàng hơn vì hệ số tải trọng có thể đại diện cho mốitương quan giữa các chỉ số và các nhân tố (ví dụ, bình phương của hệ số tải trọnggiải thích tỷ lệ của phương sai trong các chỉ số mà các phương pháp nhân tố giảithích) Trong phương pháp xiên, hệ số tải trọng thường không phản ánh mối tươngquan đơn giản giữa các chỉ số Bởi vì phép quay xiên cho phép các nhân tố tươngquan, các mối tương quan giữa các chỉ số và các nhân tố có thể thổi phồng bằnghiệp biến của các nhân tố Đó là một chỉ số tương quan có thể tương quan với một

Trang 19

nhân tố thông qua mối tương quan của nó với các nhân tố khác Tuy nhiên, phépxoay trực giao có thể gây ra gây phương pháp hiểu lầm trong tình huống mà cácnhân tố này dự kiến là được tương quan Nói cách khác, mặc dù mối tương quanđáng kể có thể tồn tại giữa các nhân tố, phép xoay trực giao hạn chế các phươngpháp để mang lại các biến ẩn không tương quan.

Tuy nhiên trong nhiều trường hợp phép xoay xiên được ưa thích vì nó cungcấp một đại diện thực tế hơn về các nhân tố tương quan với nhau như thế nào.Nếu các nhân tố này là trong thực tế không tương quan, phép xoay xiên sẽ tạo

ra một phương pháp hầu như giống với phương pháp được tạo ra của phép xoaytrực giao Mặt khác, nếu các nhân tố được tương quan với nhau, phép xoay xiên

sẽ mang lại một đại diện chính xác hơn về tầm quan trọng của các mối quan hệ.Ngoài ra, ước lượng tương quan nhân tố cung cấp thông tin quan trọng, chẳng hạnnhư sự tồn tại của các nhân tố dự phòng (dư thừa) hoặc một cấu trúc tiềm năng.Hơn nữa, khi EFA được sử dụng như một tiền thân của CFA, các phương phápxiên có nhiều khả năng khái quát đến CFA hơn các phương pháp trực giao (tức

là, nhân tố hạn chế là không tương quan trong CFA sẽ có kết quả trong mô hìnhphù hợp kém)

Một số dạng của phép quay xiên đã được phát triển (ví dụ, PROMAX, geomin,quartamin, orthooblique) Khi phép xoay xiên được yêu cầu, hầu hết các chươngtrình phần mềm (như SPSS) đầu ra cả một ma trận mẫu (pattern matrix) và một

ma trận cấu trúc (structure matrix) Các tải trọng trong ma trận mô hình thể hiệnmối quan hệ duy nhất giữa một nhân tố và một chỉ số Nó được giải thích mộtcách tương tự như các hệ số hồi quy một phần trong nhiều hồi quy chuẩn Đó là,các hệ số đại diện cho mối quan hệ giữa các nhân tố dự báo và chỉ số

Phép xoay nhân tố được minh họa trong Hình 1.3.2, sử dụng một tập dữliệu thực tế trong tám chỉ số thu thập từ một mẫu của 500 người tham gia Thửnghiệm Scree và phân tích song song với hai nhân tố Kết quả cho thấy 4 chỉ sốđầu tiên (Y1-Y4) tải trên nhân tố 1 và bốn chỉ số còn lại (Y5-Y8) tải trên Nhân tố

2 Hình 1.3.2 hiển thị một đại diện hình học của phép không xoay, xoay trực giao(varimax), và xoay xiên (PROMAX) của ma trận nhân tố Ước lượng ML sinh racác tải trọng nhân tố không xoay được trình bày trong hình 1.3.2A Hình 1.3.2Bcho thấy kết quả của vòng xoay varimax Các trục nhân tố duy trì ở góc90◦, nhưngđược quay tối ưu nhất để tối đa hóa cao nhất tải trọng nhân tố và giảm thiểu tảitrọng thấp Phép xoay tạo ra một chuyển đổi ma trận Với ma trận đại số, ma trậntải trọng nhân tố không xoay được nhân với ma trận biến đổi để sinh ra ma trậntải trọng nhân tố xoay Trong tập dữ liệu này, ma trận chuyển đổi Varimax nhưsau:

Trang 20

Factor 1 Factor 2Factor 1 93347 35867Factor 2 –.35867 93347Các giá trị trên đường chéo (0.93347) là cosin, các giá trị ngoài đường chéo(0.35867, −0.35867) làsin và −sin Như được biết trong hình 1.3.2B các trục đượcxoay 20◦, để cắt ngang các cụm chỉ số tốt hơn Trong giới hạn sai số làm tròn,

cos(21)◦ bằng 0.933 và sin(19)◦ bằng 359, tương tự các hệ số biến đổi được biết ởtrên Do phép xoay trực giao được sử dụng, các trục của nhân tố 1 và nhân tố

2 còn lại ở góc phải, và do đó các nhân tố được bắt buộc là không xoay Đó là

Mặc dù phép biến đổi này làm sáng tỏ cấu trúc nhưng nó không làm thay đổitính chung của Y5 hoặc bất kì chỉ số khác Trong một phương pháp kéo theo nhiềuhơn một biến ẩn, tính chung trong EFA trực giao được tính bằng cách lấy tổng bìnhphương các tải trọng cho một số chỉ số được cho trong tất cả các nhân tố Trước

và sau khi quay, tỷ lệ phương sai được giải thích trong Y5 là 0, 257; phương phápkhông xoay: 0, 3862+ 0, 3292 = 0, 257, phương pháp xoay: 0, 2422 + 0, 4452 = 0, 257.Như vậy vòng quay không làm thay đổi sự phù hợp của phương pháp nhân tố

Trang 21

Hình 1.3.2: Biểu diễn hình học của không xoay, trực giao xoay, và ma trận nhân tố xoay gián tiếp

Trang 22

Chương 2

Phân tích nhân tố khẳng định CFA

2.1 Giới thiệu về CFA

CFA và EFA đều dựa trên mô hình nhân tố chung và thường được sử dụngmột phương pháp ước lượng (ví dụ ML ), các đặc điểm kỹ thuật của CFA là

có thể xây dựng dựa trên lý thuyết hoặc dấu hiệu cho trước khi nghiên cứu Nhưvậy trong khi EFA nhà nghiên cứu chỉ có thể chỉ trước số yếu tố còn CFA thườngkiểm tra một giải pháp tiết kiệm hơn bằng cho biết số nhân tố, các mô hình củanhân tố tải trọng (và tải trọng xoay mà thường được cố định bằng 0) Ngược lạivới EFA, CFA cho phép các đặc điểm kỹ thuật của mối quan hệ giữa các chỉ số đặcbiệt Như vậy, mọi khía cạnh của mô hình CFA được quy định trước Việc chấpnhận mô hình được đánh giá bởi giá trị phù hợp (của mô hình hồi qui) căn cứ vàokết quả của các ước lượng tham số giá trị phù hợp (của mô hình hồi qui) cũng ápdụng cho EFA khi sử dụng ước lượng ML Như đã nói trước đây, CFA mô hình lýthuyết thích hợp hơn EFA trong giai đoạn xây dựng và thử nghiệm trước khi đưatiên đoán liên quan tới cấu trúc tiềm ẩn

Với CFA, các nhà nghiên cứu xác định trước được số lượng các yếu tố hoặc

hệ số tải trọng, cũng như các tham số khác của việc đo lường giữa độc lập hay làhiệp phương sai của các yếu tố và của cả phương sai riêng (phương sai riêng chính

là phần phương sai riêng của mỗi biến không được giải thích bởi các biến còn lại).Việc định trước nhân tố là sự đánh giá trong việc làm thế nào để tái tạo lại các matrận tương quan mẫu của các biến đo được Vì vậy, không giống như EFA, CFAđòi hỏi thực nghiệm phải vững chắc, hoặc nền tảng khái niệm để định hướng cácđặc điểm (thông số) và đánh giá các mô hình nhân tố

Ngoài ra, CFA cung cấp một kỹ thuật phân tích mạnh mẽ để đánh giá sựtương đương của các mô hình đo lường giữa các nhóm khác nhau Điều này đượcthực hiện bằng một trong hai giải pháp đa nhóm (tức là, có thể phân tích tổngquát hoặt phân tích đa nhóm) Mặc dù một số phương pháp kiểm tra sự phù hợp

Trang 23

của các cấu trúc nhân tố trong EFA có sẵn (ví dụ khả năng để xác định mô hìnhbất biến từng phần, cf Byrne, Shavelson, và Muthén, 1989) Tuy nhiên những kỹthuật này mang đến nhiều cơ hội phân tích quan trọng trong việc nghiên cứu cácứng dụng, chẳng hạn như việc ước lượng một một đặc tính đo lường quy mô là bấtbiến trên tập các phân nhóm.

Một lợi thế của CFA và SEM là khả năng ước lượng mối quan hệ giữa cácbiến đánh giá cho sai số đo lường Một hạn chế quan trọng của phương pháp bìnhphương nhỏ nhất (OLS) cách tiếp cận tương quan và phân tích hồi qui đa chiều làgiả định rằng các biến đo được là không có lỗi (tức là nó hoàn toàn đáng tin cậy,

có nghĩa là tất cả các phương sai của một quan sát là đúng sai số) Tuy nhiên, giảthiết này hiếm khi được giữ trong các ngành khoa học xã hội và hành vi, mà chủyếu dựa trên những biến số đã được đánh giá bằng câu hỏi, thứ hạng các quan sátđộc lập, v.v Do đó, ước lượng có nguồn gốc từ phương pháp OLS (ví dụ, các mốitương quan, hệ số hồi quy) thường được suy yếu tới một mức độ chưa biết bằngcác lỗi đo lường trong các biến mà sử dụng để phân tích Mặt khác, CFA và SEMcho phép các mối quan hệ đó được ước tính sau khi điều chỉnh cho sai số đo lườngmột lý thuyết lỗ (mức độ sai số đo ngẫu nhiên và tương quan) Ví dụ, trong môhình CFA trình bày trong Hình 2.1.1a, mối quan hệ giữa hai cấu trúc được phảnánh ở yếu tố tương quan giữa các phần tử của một tập hợp) (giữa nhân tố 1 vànhân tố 2) như trái ngược với các mối quan hệ quan sát được giữa hàm chỉ tiêu tải

về của các nhân tố này Thật vậy, yếu tố tương quan này ước tính tốt hơn về giátrị phổ biến của mối quan hệ này hơn bất kỳ cặp chỉ số nào (EGR giữa Y1 và Y4)bởi vì nó đã được điều chỉnh cho sai số đo lường, nghĩa là phương sai được chia sẻgiữa các chỉ số của nhân tố được vận hành như đúng – sai số, được thông qua vàocác biến tiềm ẩn

CFA được sử dụng như là một tiền thân (điềm báo trước) của SEM, mà trong

đó xác định mối quan hệ cấu trúc (ví dụ, hồi quy) giữa các biến tiềm ẩn Một môhình phương trình cấu trúc có thể được chia thành hai phần chính: (1) các môhình đo lường xác định số lượng các nhân tố và (2) các mô hình cấu trúc, trong đóquy định cụ thể các yếu tố khác nhau có liên quan tới nhau như thế nào (ví dụ,tác động trực tiếp hoặc gián tiếp, không có mối quan hệ, mối quan hệ giả mạo).Hai mô hình cơ bản được trình bày trong Hình 2.1.1, sơ đồ đầu tiên (A) đại diệncho một mô hình đo lường (một mô hình CFA kéo theo ba nhân tố tương quangiữa các phần tử), và sơ đồ thứ hai (B) phản ánh một mô hình cấu trúc để chobiết rằng mối quan hệ giữa nhân tố X và nhân tố Y là hoàn toàn trung gian bởinhân tố Z (như với hệ số tải trọng, ảnh hưởng trực tiếp giữa các biến tiềm ẩn đượcmiêu tả bằng mũi tên một chiều trong hình 2.1.1B) Như vậy, trong khi mối quan

hệ giữa các biến tiềm ẩn được phép tương quan giữa các phần tử tự do trong mô

Trang 24

hình CFA, bản chất chính xác của các mối quan hệ được xác định trong mô hìnhcấu trúc đó là nhân tố X có ảnh hưởng trực tiếp tới nhân tố X, nhân tố X có ảnhhưởng trực tiếp nhân tố Y và nhân tố X có tác động gián tiếp tới nhân tố Y Lưu ýrằng trong mô hình đo lường (CFA), có ba thông số liên quan các yếu tố với nhau:tương quan yếu tố giữa X và Y, X và Z, Y và Z (mô tả bằng hai đầu, mũi tên congtrong Hình 2.1.1a) Trong mô hình cấu trúc, chỉ có hai thông số cấu trúc X → Y

và Y → Z Như đã thảo luận ở phần sau, phần cấu trúc của giải pháp này đượcxác định quá mức (overidentifed) Nghĩa là tồn tại ít chỉ số cấu trúc (ví dụ X →

Y và Y → Z) Trong mô hình so với số lượng các mối quan hệ có thể có giữa cácyếu tố (ví dụ, ba tương quan giữa X và Y, X và Z, Y và Z) Vì vậy các mô hìnhcấu trúc là chi li hơn các mô hình đo lường bởi vì nó cố gắng để tái tạo các mốiquan hệ giữa các biến tiềm ẩn với một ít tham số tự do ước tính Bởi vì bản chấtnhận dạng hoàn chỉnh phần cấu trúc của mô hình này, sự phù hợp (của hô hìnhhồi qui) có thế kém hơn so với các mô hình đo lường

Hình 2.1.1: Mối tương quan giữa các nhân tố

2.2 So sánh CFA và EFA

Các mô hình nhân tố chung và EFA đã trình bày trong Chương 2, phần này

sẽ so sánh giữa CFA và EFA Trên cơ sở những so sánh, những ưu điểm, mục đíchcủa CFA sẽ trở nên rõ ràng hơn Các ký hiệu và tính toán các thông số của mô

Trang 25

hình CFA sẽ được trình bày Chương này cũng đề với các khái niệm quan trọngcủa mô hình nhận dạng, khả năng tối đa (ML)dự toán, và đánh giá sự phù hợp(của mô hình hồi qui).

CFA là phương pháp nhằm xác định sự phù hợp của số liệu nghiên cứu với

mô hình lý thuyết Trong phân tích yếu tố khám phá (EFA), nhà nghiên cứu dựavào số liệu nghiên cứu để tìm ra các yếu tố cấu thành; trong khi CFA nhằm khẳngđịnh mô hình các yếu tố cấu thành đã có sẵn qua nghiên cứu trước đó hoặc môhình lý thuyết đã được xác định từ trước EFA có nhiệm vụ khảo sát số liệu, giúpnhà nghiên cứu tìm ra số yếu tố phù hợp đặc trưng cho số liệu Với EFA, tất cảcác biến quan sát đều có liên quan ít nhiều đến các yếu tố bằng cách ước lượngcác hệ số tải trọng Cấu trúc đạt được trong EFA bao gồm những biến quan sát

có hệ số tải lớn lên một yếu tố và các hệ số tải nhỏ lên các yếu tố khác (ví dụ, tảitrọng < 0.4)

Các yếu tố trong EFA được xác định thông qua kết quả phân tích thống kê,không phải từ lý thuyết và tên của từng yếu tố chỉ được đặt sau khi hoàn thànhphân tích EFA được thực hiện khi chưa biết có bao nhiêu yếu tố, và các biến nàothuộc yếu tố nào

Ngược lại, CFA, nhà nghiên cứu phải biết trước đã có bao nhiêu yếu tố, có baonhiêu biến trong từng yếu tố Trong trường hợp này, CFA làm nhiệm vụ xem xét

sự phù hợp của mô hình đã có sẵn với số liệu nghiên cứu Nói các khác, CFA tìmcách khẳng định sự phụ hợp của mô hình lý thuyết có sẵn đối với số liệu nghiêncứu Đó cũng là một cách tiếp cận SEM

Giống như EFA, mục đích của CFA là xác định nhân tố giải thích cho phươn sai

và hiệp phương sai giữa tập các chỉ số Cả EFA và CFA dựa trên mô hình nhân tốchung (ví dụ, hệ số tải trọng, phương sai riêng, communalities (các communalitiescho biến thứ i được tính bằng cách lấy tổng các tải trọng bình phương cho biếnđó)) Tuy nhiên, trong khi EFA thường dùng để mô phỏng hoặc thăm dò, với CFAnhà nghiên cứu trước tiên phải chỉ rõ tất cả các khía cạnh của mô hình nhân tố.CFA đòi hỏi một nền tảng thực nghiệm hoặc một khái niệm mạnh mẽ để hướngdẫn kỹ thuật và đánh giá các mô hình nhân tố Theo đó, CFA thường được sửdụng trong giai đoạn sau của sự pháp triển qui mô hoặc xây dựng tính khách quancủa mẫu – sau khi các cấu trúc cơ bản đã được xây đựng dự kiến bởi phân tíchthực nghiệm trước khi sử dụng EFA, cũng như trên cơ sở lý thuyết

EFA và CFA thường dựa vào các phương pháp ước lượng tương tự Khi mộtước lượng thông tin đầy đủ như ML được sử dụng, các mô hình yếu tố phát sinh

từ EFA và CFA có thể được đánh giá dựa trên các giải pháp tái xây dựng làm thếnào mô phỏng phương sai quan sát và hiệp phương sai giữa các chỉ số đầu vào.Ngoài ra, chất lượng của mô hình EFA và CFA được xác định một phần bởi tham

Trang 26

số của kết quả ước lượng tham số (ví dụ như mức độ của hệ số tải trọng và nhân

tố tương quan giữa các phần tử) và làm thế nào mỗi yếu tố được thể hiện bằngcác biện pháp quan sát (ví dụ chỉ số cho nhân tố, kích cỡ của chỉ số chung, nhân

tố xác định)

Mô hình nhân tố chung: CFA và EFA đều sử dụng mô hình nhân tố chung

và thường dựa vào các phương pháp ước lượng tương tự (ví dụ ML) Tuy nhiênvới CFA sẽ xác định sự phù hợp của số liệu nghiên cứu với mô hình lý thuyết sau

đó khẳng định mô hình các yếu tố cấu thành đã có sẵn qua nghiên cứu trước đóhoặc mô hình lý thuyết đã được xác định từ trước.Trước đó nhà nghiên cứu phảibiết trước đã có bao nhiêu yếu tố, có bao nhiêu biến trong từng nhân tố

Ngược lại, EFA dựa vào số liệu nghiên cứu để tìm ra các yếu tố cấu thành.EFA khảo sát số liệu, giúp nhà nghiên cứu tìm ra số yếu tố phù hợp đặc trưng cho

số liệu EFA được thực hiện khi chưa biết có bao nhiêu yếu tố, và các biến nàothuộc yếu tố nào

Giải pháp chuẩn hóa, không chuẩn hóa: CFA thường phân tích một matrận phương sai hiệp phương sai hoặc dữ liệu thô được sử dụng bởi các chươngtrình phần mềm để tạo ra một đầu vào ma trận phương sai, hiệp phương sai Nhưvậy ma trận đầu vào của CFA gồm các chỉ số phương sai trên đường chéo (1 phươngsai bằng độ lệch chuẩn của chỉ số bình phương, nghĩa là V AR = SD2.) và chỉ sốhiệp phương sai nằm ngoài đường chéo COV xy = rxySDxSDy) Kết quả của CFA

có thể cho ra một ma trận chuẩn hóa hoặc không chuẩn hóa

Đối với EFA thường chuẩn hóa hoàn toàn tất cả các biến trong phân tích Đặcbiệt, một ma trận tương quan được sử dụng như là đầu vào EFA và cả các nhân

tố và chỉ số đều được hoàn toàn chuẩn hóa: Yếu tố phương sai bằng 1.0; hệ số tảitrọng được giải thích như là mối tương quan hoặc hệ số chuẩn hóa

Hệ số tải trọng chéo: EFA thường sử dụng phép xoay nhân tố để giảmthiểu độ lớn của hệ số tải trọng nhưng CFA lại không áp dụng tải trọng xoay.Phương sai riêng: CFA nghiên cứu bản chất các mối quan hệ trong các lỗi

đo lường phương sai riêng của các chỉ số CFA cố gắng xấy dựng các mối quan hệquan sát với các ước lượng tham số ít hơn EFA.Trong khi đó, với EFA các mốiquan hệ phương sai riêng không xác định

Trang 27

Hình 2.2.1: Mô hình phân tích nhân tố khẳng định và phân tích nhân tố khám phá

2.3 Mục đích và ưu điểm của CFA

Mặc dù cùng sử dụng ước lượng ML nhưng CFA xây dựng một lý thuyết mạnh

mẽ hơn, ở EFA người ta chỉ có thể cho trước số các nhân tố, còn ở CFA người ta

có thể cho biết số các nhân tố và mô hình hệ số tải trọng Hơn nữa, CFA còn chobiết mối quan hệ giữa các lỗi phương sai riêng Ngoài ra, CFA có thể cung cấp mộtkhuôn khổ phân tích mạnh mẽ để đánh giá sự tương đương giữa các mô hình đolường giữa các nhóm khác nhau Một lợi thế khác, CFA có thể cung cấp khả năngước lượng giữa các biến điều chỉnh sai số cho sai số đo lường

Mũi tên hai chiều thể hiện hiệp phương sai, khi mối quan hệ được qui địnhnhư hiệp phương sai, các nhà nghiên cứu khẳng định các biến có liên quan, ví dụ

η1, η2

Các chỉ số được sắp xếp Y 1, Y 2, Y 3, Y 4, Y 5, Y 6trong đầu vào ma trận phươngsai – hiệp phương sai Nếu ma trận đầu vào là sắp xếp theo kiểu này, các ma trận

Trang 28

Hình 2.3.1: Mô hình phân tích nhân tố khám phá 2 nhân tố, 6 biến quan sát

λX ma trận λY được sắp xếp như sau:

− Mô hình xác định dưới khi tự do ước tính vượt quá số thông tin (tức là cácyếu tố trong ma trận đầu vào phương sai, hiệp phương sai) Một mô hình xác địnhdưới không được giải quyết bởi vì có một số lượng vô hạn các ước lượng tham số

mà kết quả phù hợp với mô hình Ví dụ:

Ngày đăng: 25/10/2018, 23:44

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w