Phân tích yếu tố khám phá – EFA - KẾT QUẢ NGHIÊN C- 123docz.net

CHƯƠNG 4 KẾT QUẢ NGHIÊN CỨU

4.4. Phân tích yếu tố khám phá – EFA

Khi thực hiện EFA, chúng ta cần tiến hành một số quyết định về thống kê và phương pháp luận, đó là: các kỹ thuật kiểm tra dữ liệu, phương pháp phân tích nhân tố, phương pháp duy trì nhân tố, phương pháp xoay nhân tố và cắt giảm hệ số tải nhân tố.

Các kỹ thuật kiểm tra dữ liệu: Hai kỹ thuật phổ biến nhất cho EFA là kiểm định Bartlett và thước đo mức độ thích hợp của việc lấy mẫu với hệ số KMO (Kaiser- Meyer-Olkin Measure of Sampling Adequacy). Kiểm định Bartlett kiểm tra ma trận tương quan được quan sát có phải là ma trận đồng nhất hay khơng (hay khơng có phần tử ngồi đường chéo) (Tobias S., Carlson J. E., 1969). Vì kỹ thuật này giải thích mối quan hệ của các biến, nên việc thiếu hoàn toàn các mối quan hệ trong một bộ dữ liệu (ví dụ như một ma trận đồng nhất) sẽ ngăn chặn việc thực hiện EFA. Nếu kiểm định Bartlett có ý nghĩa, kết quả cho thấy dữ liệu khơng phải ma trận đồng nhất và thích hợp cho EFA, tuy nhiên, điều này lại xảy ra trong hầu hết các nghiên cứu (Dziuban C. D., Harris C. W., 1973); (Dziuban C. D., Shirkey E. C., 1974). Mặc dù vậy, kiểm định này có thể phát hiện ra các bộ dữ liệu có vấn đề, vì vậy nó vẫn nên được thực hiện trước EFA (Matt C. H., 2016). Một kỹ thuật khác được đề cập là KMO, đây là chỉ số về phương sai chung trong một bộ dữ liệu, cho thấy việc các yếu tố tiềm ẩn có thể tồn tại và EFA có thể được thực hiện hay khơng. So với kiểm định Bartlett, KMO cung cấp nhiều khoảng để kiểm tra phương sai có được chấp nhận hay khơng thay vì chỉ cho kết quả có hay khơng có ý nghĩa, các chỉ số trong các khoảng được biểu thị như sau: từ 0,00 đến 0,5 là không thể chấp nhận được; từ trên 0,5 đến 0,6 là nghèo nàn; từ trên 0,6 đến 0,7 là bình thường; từ trên 0,7 đến 0,8 là trung bình; từ trên 0,8 đến 0,9 là tốt; từ trên 0,9 đến 1 là tuyệt vời. Do đó, các nhà làm nghiên cứu cần có chỉ số KMO lớn hơn 0,6 trước khi tiến hành phân tích EFA, nếu đạt giá trị thấp hơn, chúng ta có thể loại bỏ các biến có

quan hệ tương hỗ nhỏ để cải thiện tính phù hợp của EFA (Dziuban C. D., Shirkey E. C., 1974); (Kaiser H. F., 1970).

Phương pháp phân tích nhân tố: Có rất nhiều phương pháp để lựa chọn hiện nay, tuy nhiên, nghiên cứu này sẽ sử dụng phương pháp Principal Axis Factoring (PAF). Phương pháp này có độ phổ biến chỉ sau phương pháp phân tích yếu tố chính (Principal Components Analysis: PCA) – được biết đến là phương pháp trích xuất yếu tố mặc định của phần mềm SPSS (Costello A. B., Osborne J., 2005). Vì PAF cho rằng sự xuất hiện của các phương sai riêng là bình thường, mục tiêu của phương pháp này là tạo ra một tập hợp các hệ số ước tính tải nhân tố để tái tạo phương sai chung trong một ma trận tương quan (De Winter J. C., Dodou D., 2012).

Phương pháp duy trì nhân tố: Tác giả chọn tiêu chuẩn Kaiser (1960): “Khuyến nghị rằng tất cả các nhân tố có hệ số eigenvalue lớn hơn 1 đều nên được giữ lại”. Phương pháp xoay nhân tố: Nghiên cứu sử dụng phép xoay Varimax, phương pháp này tìm cách tăng các phương sai của các hệ số tải nhân tố, cho ra cả hệ số lớn và nhỏ, và các biến quan sát sẽ được tải hoặc không được tải một cách rõ ràng lên mỗi nhân tố (Kaiser H. F., 1958).

Cắt giảm hệ số tải nhân tố: Ngoài việc xác định số lượng các nhân tố trong một nhóm các biến, phân tích nhân tố còn xác định mức độ mà mỗi biến đại diện cho từng yếu tố nổi bật thông qua các giá trị tải. Thông thường, những biến đại diện cho duy nhất một nhân tố sẽ được giữ lại, trong khi các biến đại diện cho nhiều nhân tố hoặc không đại diện cho nhân tố nào sẽ bị loại bỏ (Hair J. F., Black W. C., Babin B. J., Anderson R. E., Tatham R. L., 2006); (Tabachnick B. G., Fidell L. S., 2007). Nó được khuyến nghị rằng các biến quan sát thỏa điều kiện khi hệ số tải nhân tố chính trên 0,4 và chênh lệch giữa giá trị này với hệ số tải nhân tố thay thế trên 0,2 (Matt C. H., 2016). Nếu một biến quan sát có hệ số tải từ 0,32 trở lên ở hai hoặc nhiều hơn hai nhân tố, chúng ta cần phải xem xét lại việc biến đó có bị loại khỏi phân tích hay khơng (Tabachnick B. G., Fidell L. S., 2001).

3.4.5. Phân tích tương quan

Mối tương quan là thước đo cho sự liên kết đồng đều giữa hai biến. Một quan hệ đồng đều giữa hai biến là quan hệ mà trong đó khi giá trị của một biến tăng lên, giá trị của biến khác cũng tăng theo, hoặc khi giá trị của một biến tăng lên, giá trị của biến khác giảm. Trong dữ liệu có sự tương quan, sự thay đổi về giá trị của một biến được gắn liền với sự thay đổi về giá trị của một biến khác theo cùng một hướng hoặc ở hướng ngược lại. Nói cách khác, các giá trị cao hơn của một biến có xu hướng liên hệ với các giá trị cao hơn (tương quan dương) hoặc thấp hơn (tương quan âm) của biến khác, và ngược lại. (Patrick S., Christa B., Lothar A. S., 2018)

Mối quan hệ tuyến tính giữa hai biến là một trường hợp đặc biệt của quan hệ đồng đều. Thông thường, thuật ngữ “mối tương quan” được sử dụng trong bối cảnh xem xét mối quan hệ tuyến tính giữa hai biến số liên tục và ngẫu nhiên, chúng được gọi là hệ số tương quan Pearson, ký hiệu là “r” (Joseph L. R., Alan W. N., 1988). Mức độ thay đổi trong một biến liên tục liên quan đến sự thay đổi trong một biến liên tục khác có thể được mơ tả bằng tốn học dưới thuật ngữ hiệp phương sai của các biến, nó là thước đo về cách hai biến thay đổi cùng nhau. Hệ số tương quan Pearson dùng để đo lường hiệp phương sai theo tỷ lệ dao động từ -1 đến +1 (Dennis D. W., William M. III, Richard L. S., 2008). Trong đó, mối tương quan được coi là hồn hảo khi r có giá trị là -1 hoặc +1, điều đó có nghĩa rằng mọi điểm trong dữ liệu đều nằm chính xác trên 1 đường thẳng. Nếu r bằng 0, điều này có nghĩa khơng có sự tương quan giữa hai biến (Patrick S., Christa B., Lothar A. S., 2018). Mối tương quan giữa các cặp được xem là cao nếu giá trị tuyệt đối của r lớn hơn 0,7 (Booth

G. D., Niccolucci M. J., Schuster E. G., 1994).

3.4.6. Phân tích hồi quy tuyến tính bội

Phân tích hồi quy là một kỹ thuật thống kê để ước tính mối quan hệ giữa các biến có quan hệ nhân quả. Mơ hình hồi quy có một biến phụ thuộc và nhiều hơn một

biến độc lập được gọi là hồi quy tuyến tính bội (Gulden K. U., Nese G., 2013), được biểu diễn theo công thức:

“Trong đó, ký hiệu i thể hiện số đơn vị quan sát từ các quan sát lấy được trên Y và số lượng p biến độc lập” (John O. R., Sastry G. P., David A. D., 1998). “Y là biến phụ thuộc; X1, X2, Xp là biến độc lập; Yi, Xi1, Xi2, Xip là giá trị các quan sát thứ i của Y, X1, X2, Xp; β0 là hệ số chặn (hệ số tự do), giá trị Y sẽ bằng β0 khi X1 = X2

=…= Xp = 0; β1, β2, βp là các hệ số hồi quy riêng của các biến độc lập, chúng thể hiện sự thay đổi của Y khi biến độc lập tương ứng thay đổi 1 đơn vị trong khi các biến độc lập còn lại cố định, ε là sai số trong mơ hình hồi quy.” (Topica, 2022) Nghiên cứu này thực hiện phân tích mơ hình hồi quy tuyến tính bội dựa trên những thông số sau (TS. Nguyễn Văn Hạnh, 2022):

Mối quan hệ giữa các biến được trình bày thông qua kiểm định ANOVA (Analysis of Variance: phân tích phương sai). Nếu giá trị ở cột Sig. (Significance level: mức ý nghĩa) bé hơn giá trị α = 0,05, điều này kết luận các biến độc lập dự báo sự thay đổi trong biến phụ thuộc một cách đáng kể, mơ hình hồi quy có ý nghĩa thống kê và ngược lại.

R2 hiệu chỉnh hiển thị mức độ giải thích của các biến độc lập đối với biến phụ thuộc trong mơ hình hồi quy, chỉ số này nếu càng tiến về 1 thì mơ hình càng có ý nghĩa, càng tiến về 0 thì ý nghĩa mơ hình càng yếu. Thơng thường, giá trị R2 hiệu chỉnh thấp nhất có thể chấp nhận được là 0,5.

“Giá trị d của kiểm định Durbin-Watson nếu nhỏ hơn 1,5 cho biết có sự tương quan dương chuỗi bậc 1 giữa các phần dư, nếu d nằm trong khoảng từ 1,5 đến 2,5 cho thấy khơng có sự tương quan chuỗi bậc 1, và d lớn hơn 2,5 cho biết có sự tương quan âm chuỗi bậc 1.”

“Dữ liệu không được xuất hiện đa cộng tuyến, hiện tượng này xảy ra khi có hai hoặc nhiều biến độc lập có mối tương quan cao với nhau. Điều này dẫn đến các vấn đề trong việc xác nhận biến độc lập nào góp phần vào phương sai được giải

thích trong biến phụ thuộc, cũng như các trục trặc kỹ thuật trong việc tính tốn mơ

hình hồi quy bội. Hệ số phóng đại phương sai VIF (Variance inflation factor) nếu bé hơn 2 cho thấy hiện tượng đa cộng tuyến bị loại bỏ, nếu lớn hơn 2 sẽ có dấu hiệu đa cộng tuyến, lớn hơn 10 chắc chắn có đa cộng tuyến.”

“Sai số trong mơ hình hồi quy nên có phân phối xác suất chuẩn” (trường hợp gần đúng chuẩn vẫn có thể chấp nhận). Điều này được biểu thị thông qua đồ thị Histogram và đồ thị Normal P-P của phần dư chuẩn hóa hồi quy. Nếu sai số có phân phối xác suất chuẩn, các cột giá trị phần dư trong đồ thị Histogram sẽ phân bố theo dạng hình chng và các giá trị quan sát trong đồ thị Normal P-P sẽ nằm trên một đường thẳng ứng với phân phối chuẩn.

“Các phần dư trong phân tích hồi quy đại diện cho các ước lượng mẫu của các sai số. Chúng phải có độ tuyến tính và phương sai khơng đổi (đồng nhất)”, điều này được kiểm định bởi đồ thị Scatter Plot (đồ thị phân tán). Nếu các chấm trên biểu đồ này không tạo thành bất kỳ loại đường cong nào, liên hệ tuyến tính có thể được kết luận. Sự phân tán ngẫu nhiên của các chấm trên biểu đồ xung quanh tung độ 0 thể hiện phương sai đồng nhất.

CHƯƠNG 4. KẾT QUẢ NGHIÊN CỨU4.1. Kết quả mẫu thu thập 4.1. Kết quả mẫu thu thập

Bảng khảo sát trên Google Form thu về tổng cộng 485 mẫu trả lời, sau khi loại đi 3 trường hợp không học đại học tại TP.HCM, 16 trường hợp không đặt hàng qua mạng, 15 trường hợp có lần mua hàng trực tuyến gần nhất cách đây 6 tháng hoặc lâu hơn, 57 trường hợp chỉ chọn duy nhất một chỉ tiêu cho tất cả các biến quan sát và 8 trường hợp dị biệt, khảo sát còn lại 386 mẫu hợp lệ và đầy đủ câu trả lời.

Hình 4. Biểu đồ Scatterplot để loại quan sát dị biệtNguồn: Kết quả xử lý dữ liệu bằng SPSS của tác Nguồn: Kết quả xử lý dữ liệu bằng SPSS của tác giả

Dựa vào hình 4, chúng ta có thể thấy rõ 8 quan sát nằm ngoài vùng ba độ lệch chuẩn đầu tiên (±33333333333333 3 ) của đồ thị. Thứ tự các quan sát lần lượt là 29, 80, 118, 129, 170, 286, 331 và 385 được tính theo tổng số mẫu khi chưa loại điểm dị biệt là 394. Sau khi loại đi các trường hợp này, sẽ có một vài số thứ tự của các trường hợp

được giữ lại bị thay đổi, khi ấy, số mẫu còn lại là 386. Việc loại các quan sát này sẽ giúp kết quả nghiên cứu chính xác hơn, sau đó cho ra các khuyến nghị có ích đối với các cá nhân và doanh nghiệp. Sau khi dữ liệu đã được lọc, chúng sẽ tiếp tục đem đi tiến hành các phân tích dữ liệu sâu hơn.

4.2. Phân tích thống kê mơ tả

4.2.1. Trường đại học

Trong 386 đáp viên có trả lời hợp lệ, có 323 người là sinh viên Đại học Hoa Sen (chiếm 83,7%), 22 sinh viên từ Đại học Ngân hàng (chiếm 5,7%), 12 sinh viên từ Đại học Mở (chiếm 3,1%), 9 sinh viên từ Đại học Tôn Đức Thắng TP.HCM (chiếm 2,3%), 8 sinh viên từ Đại học Kinh tế TP.HCM (chiếm 2,1%), 4 sinh viên Đại học Huflit (chiếm 1%), 2 sinh viên Đại học Khoa học Xã hội và Nhân văn TP.HCM (chiếm 0,5%), ngồi ra cịn có sự tham gia của các trường Đại học Công nghiệp Thực phẩm, Đại học Tài chính – Marketing, Đại học Kinh tế - Luật TP.HCM, Đại học Bách khoa TP.HCM, Đại học Nông Lâm và Đại học Sư phạm Kỹ thuật TP.HCM với số lượng mỗi trường 1 sinh viên (mỗi trường chiếm 0,3%).

Hình 5. Biểu đồ tỷ lệ các trường đại học của các sinh viên tham gia khảo sát Nguồn: Kết quả xử lý dữ liệu của tác giả sát Nguồn: Kết quả xử lý dữ liệu của tác giả

Bảng 3. Bảng thống kê các trường đại học của các sinh viên tham gia khảo sát Nguồn: Kết quả xử lý dữ liệu bằng SPSS của tác giả

4.2.2. Số năm học đại học

Trong tổng số mẫu trả lời hợp lệ, có 88 sinh viên đang học năm nhất đại học tại TP.HCM (chiếm 22,8%), 137 sinh viên đang học năm hai (chiếm 35,5%), 98 sinh viên đang học năm ba (chiếm 25,4%), 58 sinh viên đang học năm tư (chiếm 15%), 3 sinh viên đang học năm thứ năm (chiếm 0,8%) và 2 sinh viên đang học năm sáu đại học (chiếm 0,5%).

Hình 6. Biểu đồ tỷ lệ số năm học đại học của các sinh viên tham gia khảo sátNguồn: Kết quả xử lý dữ liệu của tác giả Nguồn: Kết quả xử lý dữ liệu của tác giả

Bảng 4. Bảng thống kê số năm học đại học của các sinh viên tham gia khảo sát Nguồn: Kết quả xử lý dữ liệu bằng SPSS của tác giả

4.2.3. Giới tính

Mẫu khảo sát hợp lệ có sự tham gia của 83 sinh viên nam (chiếm 21,5%) và 303 sinh viên nữ (chiếm 78,5%).

Hình 7. Biểu đồ tỷ lệ giới tính của các sinh viên tham gia khảo sát Nguồn: Kết quả xử lý dữ liệu của tác giả sát Nguồn: Kết quả xử lý dữ liệu của tác giả

Bảng 5. Bảng thống kê giới tính của các sinh viên tham gia khảo sát Nguồn: Kết quả xử lý dữ liệu bằng SPSS của tác giả

4.2.4. Thu nhập

Trong số 386 mẫu được chọn ra, có 161 sinh viên thu nhập dưới 3 triệu đồng (chiếm 41,7%), 153 sinh viên có thu nhập từ 3 triệu đến dưới 6 triệu đồng (chiếm 39,6%), 43 sinh viên có thu nhập từ 6 triệu đến dưới 9 triệu đồng (chiếm 11,1%) và 29 sinh viên có thu nhập từ 9 triệu đồng trở lên (chiếm 7,5%).

Hình 8. Biểu đồ tỷ lệ thu nhập của các sinh viên tham gia khảo sát Nguồn: Kết quả xử lý dữ liệu của tác giả sát Nguồn: Kết quả xử lý dữ liệu của tác giả

Bảng 6. Bảng thống kê thu nhập của các sinh viên tham gia khảo sát Nguồn: Kết quả xử lý dữ liệu bằng SPSS của tác giả sát Nguồn: Kết quả xử lý dữ liệu bằng SPSS của tác giả

4.2.5. Trang web/app mua sắm trực tuyến

Mẫu khảo sát hợp lệ có 325 sinh viên thường xuyên mua sắm trực tuyến nhiều nhất trên Shopee (chiếm 84,2%), 20 sinh viên mua sắm trực tuyến nhiều nhất trên nền tảng Lazada (chiếm 5,2%), 11 sinh viên mua sắm trực tuyến nhiều nhất trên Tiki

(chiếm 2,8%), 8 sinh viên thực hiện việc mua sắm trực tuyến nhiều nhất thông qua Facebook (chiếm 2,1%) và 22 sinh viên sử dụng Instagram nhiều nhất để mua sắm trực tuyến (chiếm 5,7%).

Hình 9. Biểu đồ tỷ lệ trang web/app mua sắm trực tuyến được các sinh viên tham gia khảo sát sử dụng nhiều nhất để mua sắm trực tuyến

Nguồn: Kết quả xử lý dữ liệu của tác giả

Bảng 7. Bảng thống kê trang web/app mua sắm trực tuyến được các sinh viên tham gia khảo sát sử dụng nhiều nhất để mua sắm trực tuyến

4.3. Kiểm định độ tin cậy của thang đo – Cronbach’s Alpha

4.3.1. Hiệu năng

Hệ số Cronbach’s Alpha của nhân tố hiệu năng là 0,812, giá trị này lớn hơn hầu hết giá trị Cronbach’s Alpha nếu loại biến của các biến trong nhân tố. Biến HN4 dù có giá trị cao hơn là 0,846 nhưng vẫn khơng bị loại khỏi nghiên cứu vì có hệ số tương quan biến tổng thấp nhất trong các biến là 0,38 > 0,3. Kết quả ở bảng 8 cho thấy không biến nào trong 5 biến HN1, HN2, HN3, HN4, HN5 bị loại và đều

Phân tích yếu tố khám phá – EFA

Ma trận tương quan giữa các biến

Kết quả phân tích hồi quy