Các bước phân tích dữ liệu

Một phần của tài liệu Nghiên Cứu Khoa học (Trang 45 - 51)

CHƯƠNG 3 : PHƯƠNG PHÁP NGHIÊN CỨU

3.5. Các bước phân tích dữ liệu

Sau khi hoàn tất việc thu thập dữ liệu, các bảng câu hỏi được kiểm tra thủ công và loại bỏ những bảng không đạt yêu cầu. Bảng trả lời không đạt yêu cầu và bị loại bỏ do bỏ trống thông tin hoặc các phát biểu đều nhận được cùng một sự lựa chọn (do đó có cơ sở dữ liệu để tin rằng những bảng như vậy khơng có nhiều giá trị).

Dữ liệu sau khi được làm sạch bằng thủ công sẽ được xử lý bằng phần mềm SPSS phiên bản 25, bao gồm các bước sau:

− Nhập liệu, mã hoá và làm sạch dữ liệu: Các biến độc lập và biến phụ thuộc trong mơ hình nghiên cứu được ký hiệu như mơ tả trong phần Thang đo chính thức.

− Sau đó, tiến hành lập bảng tần số cho tất cả các biến để làm sạch dữ liệu lần 2, trong đó các giá trị lạ tại các biến do lỗi nhập sẽ được kiểm tra, hiệu chỉnh lại. Dữ liệu đã được làm sạch sẽ được đưa vào phân tích thơng qua phần mềm SPSS phiên bản 25 và phần mềm AMOS phiên bản 24 theo các bước sau:

Giai đoạn 1: Thống kê mô tả mẫu dữ liệu

Thống kê mô tả giúp thu thập, tổng kết và mơ tả những đặc tính cơ bản của dữ liệu thu thập được như các thông tin về độ tuổi, giới tính, thu nhập.

Giai đoạn 2: Đánh giá độ tin cậy của thang đo

Độ tin cậy của thang đo được đánh giá thông qua qua hệ số Cronbach và hệ số tương quan biến tổng (Corrected Item – Total Correlation).

Để tính Cronbach’s Alpha của thang đo thì nó phải có ít nhất ba biến đo lường. Hệ số Cronbach’s Alpha có giá trị biến thiên từ 0 đến 1. Theo các tác giả Nguyễn Đình Thọ và Nguyễn Thị Mai Trang (2007) về mặt lý thuyết thì hệ số Cronbach’s Alpha càng cao thì càng tốt (thang đo càng cao thì chứng tỏ độ tin cậy càng cao).Hồng Trọng và Chu Nguyễn Mộng Ngọc (2005) thì cho rằng một thang đo có độ tin cậy tốt khi độ biến thiên của nó nằm trong khoảng từ 0,7 đến xấp xỉ 0,8. Tuy nhiên chỉ cần hệ số Cronbach’s Alpha ≥ 0,6 là thang đo có thể được chấp nhận về độ tin cậy (Nunnally & Bernstein, 1994).

Hệ số Cronbach’s Alpha chỉ cho biết các đo lường có liên kết với nhau hay khơng nhưng khơng quyết định việc giữ hay bỏ đi một biến quan sát. Người nghiên cứu sẽ phải cân nhắc rất kỹ lưỡng và khi đó hệ số tương quan biến tổng (Corrected Item – Total Correlation) sẽ giúp cho thêm cơ sở để đưa ra quyết định này. Hệ số tương quan biến tổng là hệ số cho thấy được sự tương quan giữa một biến với một điểm trung bình của các biến khác trong cùng một thang đo, do đó hệ số này càng cao thì càng có sự tương quan của biến này với các biến khác trong nhóm càng cao. Theo Nunnally & Bernstein (1994), các biến có hệ số tương quan biến tổng nhỏ hơn 0,3 sẽ được coi là biến rác và sẽ bị loại khỏi thang đo.

Phân tích nhân tố khám phá là kỹ thuật cần thiết trong việc rút gọn và tóm tắt các dữ liệu cần nghiên cứu.

Khi tiến hành phân tích nhân tố, ta cần chú trọng đến một số tiêu chuẩn như: hệ số KMO (Kaiser-Meyer-Olkin) ≥ 0,50, mức ý nghĩa của kiểm định Bartlett ≤ 0,05; hệ số tải nhân tố (Factor Loading) ≥ 0,50, nếu biến quan sát nào có hệ số tải nhân tố < 0,50 sẽ bị loại; thang đo được chấp nhận khi tổng phương sai trích ≥ 50%; hệ số Eigenvalue phải có giá trị ≥ 1 (Gerbing & Anderson, 198872); khác biệt hệ số tải nhân tố của một biến quan sát giữa các nhân tố ≥ 0,30 để đảm bảo giá trị phân biệt giữa các nhân tố (Jabnoun & Al- Tamimi 200373).

Khi phân tích nhân tố khám phá EFA, nhóm tác giả sử dụng phương pháp trích Principal Axis Factoring với phép xoay Promax và điểm dừng khi trích các yếu tố có Eigenvalue ln lớn hơn 1.

Giai đoạn 4: Phân tích khẳng định nhân tố (CFA)

Phân tích nhân tố khẳng định (Confirmatory Factor Analysis) là một trong các kỹ thuật cho phép kiểm định các biến quan sát (measured variables) đại diện cho các nhân tố (constructs) tốt đến mức nào. CFA là bước tiếp theo của EFA vì CFA chỉ sử dụng thích hợp khi nhà nghiên cứu có sẵn một số kiến thức về cấu trúc tiềm ẩn cơ sở, trong đó mối quan hệ hay giả thuyết (có được từ lý thuyết hay thực nghiệm) giữa biến quan sát và nhân tố cơ sở thì được nhà nghiên cứu mặc nhiên thừa nhận trước khi tiến hành kiểm định thống kê.

Mơ hình phân tích yếu tố khẳng định (CFA) chuẩn có 3 đặc điểm sau đây:

 Mỗi biến đo lường (indicator) là biến liên tục có 2 nguyên nhân tạo ra nó: từ một cấu trúc đơn lẻ (construct hoặc factor) mà biến này đo lường và từ các người khác gọi chung là số dư.

 Các số dư do đo lường là độc lập với nhau và độc lập với các cấu trúc.

 Các cấu trúc là có liên quan với nhau (covary).

Ngồi hai điều kiện cơ bản cho phân tích SEM nói chung (df >0 và cấu trúc có thang đo), theo Kline (2011), CFA chuẩn địi hỏi những điều kiện sau để mơ hình được định hình:

Nếu CFA chỉ có một cấu trúc (yếu tố), cần phải có ít nhất 3 biến đo lường (indicators). Nếu mơ hình từ 2 cấu trúc trở lên, mỗi cấu trúc phải có ít nhất 2 biến đo lường. Tuy nhiên, tốt nhất là có 3 hoặc nhiều hơn biến đo lường cho một cấu trúc. Tiêu chuẩn 2 biến cho một cấu trúc là điều kiện tối thiểu mất để mơ hình được định hình.

Để đo lường mức độ phù hợp chung của mơ hình nghiên cứu thì các tiêu chuẩn sau cần được xem xét: Chi-square (CMIN); Chi-square điều chỉnh theo bậc tự do (Cmin/df); chỉ số thích hợp so sánh CFI (Comparative Fit Index); chỉ số GFI (Goodness of Fit Index), chỉ số TLI (Tucker và Lewis Index), chỉ số RMSEA (Root Mean Square Error Approximation). Mơ hình sẽ được xem là phù hợp với thị trường khi kiểm định Chisquare cho giá trị P- value < 0,05. Mặc khác, kiểm định Chi-square lại tồn tại một nhược điểm là nó rất nhạyvới kích thước mẫu. Kích thước mẫu càng lớn thì Chi-square càng lớn, từ đó làm giảm mức độ phù hợp của mơ hình. Thực tế các nghiên cứu cho rằng, ngoài giá trị P-value, các tiêu chuẩn kèm theo là GFI, TLI, CFI ≥ 0,9 (Bentler và Bonett, 1980); Cmin/df ≤ 2, một số trường hợp có thể nhỏ hơn 3 (Carmines và McIver, 1981). Ngồi ra, trong một số nghiên cứu thực tế người ta phân biệt ra 2 trường hợp: χ2/df < 5(với mẫu N > 200); hay < 3 (khi cỡ mẫu N < 200) thì mơ hình được xem là phù hợp tốt [Kettinger và Lee,1995]; RMSEA ≤ 0,08; RMSEA ≤ 0,05 được xem là tốt nhất (Steiger, 1990). Một nghiên cứu được công bố gần đây thì các giá trị GFI, TLI, CFI < 0,9 vẫn có thể sử dụng được (Hair và cộng sự, 2009). Mơ hình nghiên cứu này sẽ dựa trên chỉ tiêu GFI, TLI, CFI < 0,8; Cmin/df ≤ 5; RMSEA ≤ 0,08 thì mơ hình tương thích với dữ liệu thị trường.

Giai đoạn 5: Phân tích mơ hình cấu trúc tuyến tính (SEM)

Để kiểm định các giả thuyết trong mơ hình nghiên cứu, phương pháp phân tích mơ hình cấu trúc tuyến tính (SEM) được thực hiện nhằm xem xét mối liên hệ giữa các biến độc lập và biến phụ thuộc trong mơ hình nghiên cứu. Với phân tích SEM chúng ta sẽ xem xét đồng thời những ảnh hưởng các biến độc lập với nhau và biến phụ thuộc. Mơ hình cấu trúc tuyến tính cũng cho phép giải quyết các vấn đề đa cộng tuyến, sai số khi đo lường mà những phương pháp ước lượng bằng phân tích hồi quy khơng thực hiện được. Tiêu chuẩn để kiểm định được lựa chọn theo thông lệ ở mức ý nghĩa 5%.

Giai đoạn 6: Phân tích đa nhóm

Phương pháp phân tích cấu trúc đa nhóm được sử dụng để so sánh mơ hình nghiên cứu theo nhóm giới tính, ngành học và sinh viên đại học theo năm. Giới tính chia làm hai nhóm nam và nữ. Ngành học được chia làm các nhóm: Kinh tế, Kỹ thuật – Cơng nghệ, Khoa học, xã hội và Nhân văn, Y dược và các ngành khác. Sinh viên đại học theo năm được chia làm 4 nhóm: sinh viên năm 1, sinh viên năm 2, sinh viên năm 3, sinh viên năm 4. Phương pháp phân tích cấu trúc đa nhóm sử dụng trong nghiên cứu này bao gồm khả biến và bất biến từng phần (cục bộ). Phương pháp ước lượng ML được sử dụng trong phân tích đa nhóm. Kiểm định Chi-squaređược sử dụng để so sánh giữa 2 mơ hình bất biên và khả biến. Nếu kiểm định Chi-square cho thấy giữa mơ hình bất biến và mơ hình khả biến khơng cho thấy sự khác biệt (P-value > 0,05) thì mơ hình bất biến sẽ được chọn (có bậc tự do cao hơn). Ngược lại, nếu sự khác biệt Chi-square là có ý nghĩa giữa hai mơ hình (P-value < 0,05) thì chọn mơ hình khả biến (có độ tương thích cao hơn) (Nguyễn Đình Thọ và Nguyễn Thị Mai Trang, 2011).

TÓM TẮT CHƯƠNG 3

Trong chương 3, tác giả trình bày quy trình nghiên cứu được thực hiện để xây dựng, đánh giá các thang đo các vấn đề liên quan tới quyết định Gap Year của học sinh, sinh viên TP.HCM. Phương pháp thực hiện qua 2 bước: nghiên cứu sơ bộ và nghiên cứu chính thức.

Nghiên cứu sơ bộ được thực hiện thông qua các phương pháp nghiên cứu tại bàn, thảo luận nhóm và phỏng vấn gián tiếp nhằm khám phá các vấn đề liên quan tới kết quả học tập của sinh viên tại địa bàn TP.HCM, dùng để điều chỉnh và bổ sung vào thang đo của mơ hình nghiên cứu. Từ đó, các thang đo lường cho các khái niệm nghiên cứu cũng được xây dựng để phục vụ cho nghiên cứu chính thức.

Nghiên cứu chính thức sử dụng phương pháp nghiên cứu định lượng thông qua phỏng vấn gián tiếp với bảng câu hỏi chi tiết đã được chuẩn bị sẵn.

Ngoài ra, chương này cũng đã nêu lên cơ sở lý thuyết để tiến hành phân tích dữ liệu gồm: đánh giá độ tin cậy thang đo, phân tích nhân tố EFA, phân tích CFA, kiểm định mơ hình, kiểm định giả thuyết và kiểm định sự khác biệt.

Một phần của tài liệu Nghiên Cứu Khoa học (Trang 45 - 51)

Tải bản đầy đủ (DOCX)

(147 trang)
w