Mô hình SEM là sự mở rộng của mô hình tuyến tính tổng quát cho phép nhà nghiên cứu kiểm định một tập hợp phương trình hồi quy cùng một lúc. SEM bao gồm một họ các mô hình được biết đến với nhiều tên gọi khác nhau, như: “Phân tích cấu trúc phương sai”, “Phân tích biến mờ”, “Phân tích nhân tố xác định”, và thường nhất là “Phân tích quan hệ cấu trúc tuyến tính - LISREL” (Nguyễn Khánh Duy, 2009)
Giá trị của SEM xuất phát từ các lợi ích đạt được trong việc sử dụng đồng thời các mô hình đo lường và mô hình cấu trúc, mỗi mô hình giữ các vai trò khác nhau trong phân tích chung. Để đảm bảo cả mô hình đo lường và mô hình cấu trúc được xác định đúng, và các kết quả là có giá trị (hiệu lực), việc phân tích với SEM thường tuân theo 7 bước, mà được mô tả vắn tắt như sau:
Bước 1: Phát triển mô hình dựa trên cơ sở lý thuyết.
SEM dựa vào các quan hệ nhân quả, trong đó sự thay đổi của một biến xuất phát từ sự thay đổi của một biến số khác. Nói chung, có 4 tiêu chuẩn được thiết lập để xác lập một quan hệ nhân quả: (1) Tồn tại quan hệ đủ mạnh giữa 2 biến; (2) Có trình tự thời gian trước sau của nguyên nhân và kết quả; (3) Không tồn tại nguyên nhân hiện hữu nào khác; (4) Có cơ sở lý thuyết vững chắc của mối quan hệ. Trong thực tế rất khó để đáp ứng đầy đủ cả 4 tiêu chuẩn này. Tuy nhiên, nếu những điều kiện đầu không được xác lập, nhưng có cơ sở lý thuyết vững chắc thì quan hệ nhân quả vẫn được xác định.
Bước 2: Xây dựng biểu đồ đường dẫn của các quan hệ nhân quả.
Biểu đồ đường dẫn là một công cụ để biểu diễn bằng hình ảnh các quan hệ nhân quả. Để xây dựng biểu đồ đường dẫn, trước tiên chúng ta phải xây dựng các khái niệm dựa vào cơ sở lý thuyết, và tìm các chỉ báo để đo lường chúng. Tiếp theo chúng ta sử dụng các hình mũi tên để thể hiện cho từng quan hệ cụ thể giữa hai khái niệm. Hình mũi tên một chiều chỉ quan hệ nhân quả trực tiếp từ một khái niệm đến một khái niệm khác. Hình mũi tên cong hai chiều chỉ mối quan hệ tương quan giữa các khái niệm. Và hình hai mũi tên ngược chiều nhau chỉ mối quan hệ tác động qua lại giữa hai khái niệm. Với ba dạng mũi tên này, tất cả các quan hệ trong các mô hình cấu trúc đều được minh hoạ.
Bước 3: Chuyển biểu đồ đường dẫn thành một tập hợp các mô hình đo lường và cấu trúc.
Sau khi phát triển mô hình lý thuyết và minh hoạ bằng biểu đồ đường dẫn, tập hợp các quan hệ cấu trúc có thể được chuyển thành một tập hợp các phương trình mà xác định: (1) Các phương trình cấu trúc liên kết các khái niệm; (2) Mô hình đo lường xác định các biến số nào đo lường cho khái niệm nào; (3) Một tập ma trận chỉ ra bất cứ quan hệ nào được giả thuyết giữa các khái niệm và các biến. Mục đích chính ở bước này là liên kết các định nghĩa ứng dụng của các khái niệm với lý thuyết nhằm kiểm định sự phù hợp về mặt thực nghiệm.
Mô hình cấu trúc:
η = Bη + Гξ + ς Trong đó:
η = (η1 η2 η3… ηm): Là véc-tơ các khái niệm nội sinh (biến phụ thuộc), không quan sát được.
ξ = (ξ1 ξ2 ξ3 … ξn): Là véc-tơ các khái niệm ngoại sinh (biến độc lập), không quan sát được.
ς = (ς1 ς2 ς3 … ςm): Là véc-tơ sai số ngẫu nhiên.
B (m x n) và Г(m x n): Là các ma trận hệ số. B thể hiện tác động nhân quả trực tiếp của một khái niệm nội sinh lên một khái niệm nội sinh khác. Г thể hiện tác động nhân quả trực tiếp của một khái niệm ngoại sinh lên một khái niệm nội sinh.
Mô hình đo lường:
Cho khái niệm ngoại sinh:
x = Λx ξ + δ, với x = (x1 x2 x3… xq) là quan sát được. Cho khái niệm nội sinh:
y = Λy η + ε, với y = (y1 y2 y3… yp) là quan sát được. Trong đó:
δ và ε là các véc-tơ của sai số đo lường của x và y. Λx (q x n),và Λy (p x m) là các ma trận hồi quy của x lên ξ và y lên η.
Bước 4: Chọn lựa ma trận đầu vào và ước lượng mô hình đề xuất.
SEM sử dụng ma trận tương quan hoặc ma trận hiệp phương sai của các biến quan sát làm dữ liệu đầu vào. Việc sử dụng ma trận nào làm dữ liệu đầu vào còn tùy thuộc vào mục đích nghiên cứu, sự khác biệt giữa chúng là việc giải thích kết quả đầu ra. Sử dụng ma trận hiệp phương sai cho phép chúng ta so sánh các tổng thể hoặc các mẫu khác nhau, tuy nhiên sẽ rất khó khăn trong việc giải thích các hệ số do các đơn vị đo lường các biến khác nhau. Ma trận hệ số tương quan được sử dụng rộng rãi hơn do có thể so sánh trực tiếp các hệ số trong một mô hình, nhờ các biến đã được chuẩn hóa. Khi chúng ta muốn hiểu đặc điểm quan hệ giữa các khái niệm thì sử dụng ma trận hệ số tương quan làm đầu vào của SEM là phù hợp hơn.
Bước 5: Đánh giá định dạng của mô hình cấu trúc.
Vấn đề lỗi định dạng xảy ra khi các kết quả ước lượng là không logic hoặc không duy nhất. Yêu cầu của việc định dạng là số phương trình phải lớn hơn số tham
số được ước lượng. Sự chênh lệch này thể hiện ra là số bậc tự do, mà là sai lệch giữa số hệ số tương quan hay số hiệp phương sai của ma trận đầu vào và số hệ số ước lượng trong mô hình (df = 1/2 [(p +q) (p + q +1) – t, với t là số tham số ước lượng trong mô hình). Mặc dù không có một quy tắc nhất quán để thiết lập việc định dạng đúng một mô hình, nhưng các nhà nghiên cứu có một số “quy tắc ngón tay cái”. Hai quy tắc cơ bản nhất là các điều kiện về hạng và điều kiện thứ bậc. Điều kiện thứ bậc đòi hỏi bậc tự do phải lớn hơn hoặc bằng 0. Nếu bậc tự do bằng 0, mô hình định dạng đúng, lời giải là duy nhất, hoàn hảo nhưng không có tính khái quát hóa. Mục đích của SEM phải là một mô hình vô định hay bậc tự do phải lớn hơn 0. Một mô hình được chấp nhận và có số bậc tự do lớn nhất có thể được luôn là mong muốn của những nhà nghiên cứu. Điều kiện thứ bậc chỉ là điều kiện cần, chưa phải điều kiện đủ đối với việc định dạng mô hình. Một mô hình cần phải đáp ứng được điều kiện hạng mà yêu cầu rằng các ước lượng phải là duy nhất. Điều kiện hạng là điều kiện đủ, và để xác định điều kiện hạng là một vấn đề rất phức tạp, do đó thông thường người ta sử dụng một “quy tắc ngón tay cái” như sau: Trước tiên là quy tắc ba đo lường mà khẳng định rằng bất cứ một khái niệm nào được đo lường bởi ít nhất ba chỉ báo đều định dạng được, và tiếp theo bất cứ một mô hình nào không chứa quan hệ tác động qua lại có các khái niệm được đo lường bởi ít nhất từ ba chỉ báo trở lên đều định dạng được.
Bước 6: Đánh giá các tiêu chuẩn độ phù hợp của mô hình.
Bước trước tiên trong việc đánh giá các kết quả là kiểm tra đối với “các ước lượng phi lý”. Khi mô hình được thiết lập với các ước lượng có thể chấp nhận, thì độ phù hợp của mới được đánh giá ở một số cấp độ: đầu tiên là cho mô hình chung, sau đó là cho các mô hình đo lường và mô hình cấu trúc tách rời.
Các ước lượng phi lý: Các ước lượng phi lý trong cả mô hình đo lường và mô hình cấu trúc là những hệ số được ước lượng vượt quá giới hạn cho phép, mà thông thường rơi vào các trường hợp sau: (1) Các phương sai của sai số âm; (2) Các hệ số chuẩn hóa vượt quá hoặc quá gần 1; (3) Các sai số chuẩn quá lớn liên quan đến bất kỳ ước lượng nào. Nếu mô hình có giá trị phi lý xuất hiện thì cần phải được giải quyết trước khi thực hiện các phân tích tiếp theo, vì một sự thay đổi trong một bộ phận của mô hình có thể có những ảnh hưởng đáng kể lên các kết quả khác.
Độ phù hợp của mô hình chung: Sau khi đã xác định không có giá trị ước lượng phi lý, thì việc đánh giá độ phù hợp của mô hình chung được thực hiện bằng
một hay nhiều hơn các đo lường về độ phù hợp của mô hình chung. Độ phù hợp đo lường sự tương thích của ma trận đầu vào và ma trận đầu ra được dự báo bởi mô hình đề xuất. Có ba loại đo lường về độ phù hợp: (1) Đo lường về độ phù hợp tuyệt đối: Đánh giá về độ phù hợp của mô hình chung không cần xét đến vấn đề “phù hợp quá mức”; (2) Đo lường về độ phù hợp tăng thêm: So sánh độ phù hợp của mô hình đề xuất với một mô hình khác được xác định bởi nhà nghiên cứu; (3) Đo lường về độ phù hợp tiết kiệm: Đánh giá mô hình với số tham số ước lượng khác nhau nhằm xác định độ phù hợp trên một tham số ước lượng (chỉ dùng đối với chiến lược so sánh mô hình cạnh tranh).
Thông thường, nếu không dùng chiến lược so sánh mô hình cạnh tranh để định dạng mô hình thì các nhà nghiên cứu thường đánh giá độ phù hợp của mô hình chung bằng các đo lường sau:
- Thống kê Chi – bình phương: Thống kê Chi – bình phương là một đo lường về độ phù hợp tuyệt đối, nó cung cấp cơ sở để tin rằng sự khác biệt giữa ma trận dự báo và ma trận đầu vào là không có ý nghĩa. Yêu cầu là mức ý nghĩa (p) phải lớn hơn 0.05 thì mô hình được xem là có thể chấp nhận. Tuy nhiên, thống kê này rất nhạy với kích cỡ mẫu, việc sử dụng nó để đánh giá độ phù hợp chỉ thích hợp khi cỡ mẫu từ 100 đến 200. Khi cỡ mẫu lớn hơn mức này thì thống kê này thường có ý nghĩa (p < 0.05) mà nếu căn cứ vào nó để đánh giá thì dẫn đến một kết luận sai lầm là mô hình chung không phù hợp.
- Chỉ số độ phù hợp tốt GFI (Goodness of Fit Index): GFI là một chỉ số đo lường độ phù hợp tuyệt đối. Nó là một đo lường phi thống kê có giá trị trãi dài từ 0 (độ phù hợp tồi) đến 1 (độ phù hợp hoàn hảo). Giá trị của GFI càng cao mô hình càng phù hợp, các nhà nghiên cứu đề nghị rằng GFI lớn hơn 0,9 thì mô hình được xem là có thể chấp nhận.
- Chỉ số RMSEA (Root Mean Square Error of Approximation): Chỉ số này dùng để khắc phục cho khuynh hướng bác bỏ mô hình của thống kê Chi – bình phương do kích cỡ mẫu lớn. RMSEA cũng là một chỉ số đo lường độ phù hợp tuyệt đối, giá trị của RMSEA càng nhỏ thể hiện độ phù hợp của mô hình càng cao, thông thường RMSEA rơi vào khoảng 0,05 đến 0,08 thì mô hình dường như có thể chấp nhận được.
- Chỉ số CFI (Comparative Fit Index): Là chỉ số đo lường độ phù hợp tăng thêm của mô hình, nó cho biết một so sánh giữa mô hình đề xuất với một mô hình “null” (có
bậc tự do bằng 0) hay một mô hình độc lập (có bậc tự do lớn nhất). Giá trị CFI nằm trong khoảng từ 0 đến 1. Giá trị của CFI càng cao thì mô hình càng phù hợp. Tương tự GFI, Browne và Cudek (1992) đề nghị CFI lớn hơn 0,9 thì mô hình được xem là có thể chấp nhận.
Mô hình chung không đạt được độ phù hợp có nghĩa là cả mô hình đo lường và mô hình cấu trúc đều tồi, nhưng nếu nó đạt được độ phù hợp không có nghĩa là tất cả các khái niệm và thang đo đều tốt, do đó cần phải các mô hình đo lường và cấu trúc tách rời để xem xét những vấn đề tiềm ẩn có ảnh hưởng đến độ phù hợp của mô hình chung.
Độ phù hợp của mô hình đo lường: Sau khi mô hình chung đã đạt được độ phù hợp, việc đo lường cho mỗi khái niệm có thể được đánh giá đối với tính đơn nghĩa và độ tin cậy.
Tính đơn nghĩa là một giả thuyết cơ bản nằm dưới việc tính toán độ tin cậy và được thể hiện khi các chỉ báo của một khái niệm có độ phù hợp được chấp nhận (có trọng số nhân tố rất cao) lên một nhân tố duy nhất. Tính đơn nghĩa có thể được xác định thông qua phân tích nhân tố khám phá (EFA), hoặc phân tích nhân tố xác định mà mô hình đo lường có độ phù hợp được chấp nhận.
Sau khi xem xét tính đơn nghĩa thì độ tin cậy của thang đo mới được đánh giá. Đô tin cậy của thang đo thường được đánh giá thông qua 3 hệ số: (1) alpha của Cronbach (1951), (2) độ tin cậy tổng hợp của Joreskog (1971); (3) phương sai chiết suất (Fornell và Lacker, 1981) (xem Nguyễn Xuân Vỹ, 2011).
Độ phù hợp của mô hình cấu trúc: Đánh giá hiển nhiên nhất đối với mô hình cấu trúc liên quan đến mức ý nghĩa của các hệ số ước lượng, cũng như sai số chuẩn và giá trị thống kê student cho mỗi hệ số. Thông thường mức ý nghĩa được xác định cho thống kê student là 0,05, tuy nhiên các mức ý nghĩa thấp hơn 0,025, hoặc 0,01 cũng được khuyến khích sử dụng, đặc biệt khi sử dụng phương pháp ước lượng hợp lý tối đa (ML) với kích thước mẫu nhỏ. Ngoài ra độ phù hợp của mô hình cấu trúc còn được xem xét bởi hệ số xác định R2, tương tự như phương pháp hồi quy.
Bước 7: Giải thích và hiệu chỉnh mô hình.
Sau khi mô hình có độ phù hợp được chấp nhận, các kết quả sẽ được xem xét sự phù hợp của chúng so với lý thuyết được đề xuất. Những câu hỏi cần phải trả lời là: (1) Liệu những quan hệ cơ bản trong lý thuyết có được ủng hộ và tìm thấy có ý nghĩa về thực nghiệm không ? (2) Liệu có mô hình cạnh tranh nào tốt hơn không? (3) Các mối
quan hệ có đúng với chiều hướng được giả thuyết không? và một số vấn đề khác. Để trả lời những câu hỏi này, có hai lời giải cần phải lựa chọn là sử dụng các lời giải chuẩn hóa hay không chuẩn hóa và cuối cùng là xem xét việc định dạng lại mô hình.
Các lời giải chuẩn hóa có phưong sai bằng nhau và giá trị tối đa bằng 1 là hữu dụng trong việc so sánh tầm quan trọng tương đối, cho một mẫu cụ thể và không thể so sánh cho các mẫu khác nhau. Trong khi các lời giải không chuẩn hóa cho phép ta đánh giá được phương sai của thang đo, nên có thể so sánh giữa các mẫu khác nhau.
Việc định dạng lại mô hình nhằm mục đích cải thiện độ phù hợp của mô hình đối với lý thuyết nền tảng của nó. Việc định dạng lại mô hình thường là thêm vào hay bớt đi một hay một số các tham số ước lượng, điều này sẽ tạo ra một loạt các mô hình cạnh tranh trong cùng một khung lý thuyết. Thông thường có hai cơ sở làm căn cứ cho việc định dạng lại mô hình là xem xét phần dư chuẩn hóa và các chỉ số hiệu chỉnh. Các phần dư chuẩn hóa có trị tuyệt đối lớn hơn 2,58 được xem là có ý nghĩa thống kê ở mức 5%, điều này thường xảy ra khi các biến đo lường vi phạm giả thuyết phân phối chuẩn. Các chỉ số hiệu chỉnh được tính toán cho các hệ số chưa được ước lượng, và những chỉ số này cho biết mức độ giảm tối thiểu trong thống kê Chi – bình phương nếu như hệ số tương ứng được ước lượng. Một giá trị của chỉ số hiệu chỉnh từ 3,84 trở lên thể hiện một mức giảm có ý nghĩa thống kê trong thống kê Chi – bình phương nếu hệ số tương ứng được ước lượng, tuy nhiên khi sử dụng hệ số này cần phải dựa vào cơ lý thuyết một cách chặt chẽ (Hồ Huy Tựu, 2006).