Phương pháp phân tích dữ liệu

Một phần của tài liệu Các nhân tố ảnh hưởng đến hành vi mua sắm sản phẩm chăm sóc vệ sinh cá nhân của người tiêu dùng trên địa bàn thành phố Hồ Chí Minh trong giai đoạn Covid-19 (Trang 58)

Dữ liệu được tiến hành phân tích với trình tự các bước như sau:

Bước 1: Sàng lọc và làm sạch số liệu bằng phần mềm Excel 2016, sau đó dữ liệu sẽ được tiến hành phân tích thông qua phần mềm SPSS 22 và AMOS 20.

Bước 2: Thống kê mô tả dữ liệu thu thập bằng phần mềm SPSS 22 để phân tích các thuộc tính nhân khẩu học của mẫu nghiên cứu gồm có: giới tính, độ tuổi, thu nhập hàng tháng, trình độ học vấn, môi trường làm việc. Ngoài ra, tác giả còn thống kê về các loại sản phẩm CSVSCN được xem là quan trọng trong mùa dịch.

Bước 3: Kiểm định độ tin cậy của thang đo bằng phân tích Cronbach’s Alpha, qua đó loại bỏ những biến không phù hợp trong mô hình nghiên cứu.

Bước 4: Phân tích nhân tố khám phá EFA (Exploratory Factor Analysis) để nhận diện các nhân tố được cho là phù hợp và rút gọn thành nhóm các nhân tố ảnh hưởng.

Bước 5: Phân tích nhân tố khẳng định CFA (Confirmatory Factor Analysis)

Bước 6: Phân tích mô hình cấu trúc tuyến tính SEM (Structural Equation Modeling) để kiểm định các giả thuyết của mô hình với mức ý nghĩa 5%.

3.3.2.1. Kiểm định độ tin cậy của thang đo

Trong nghiên cứu định lượng, không phải lúc nào tất cả các biến quan sát đưa ra dùng để đo lường một nhân tố đều phản ánh được khái niệm, tính chất của nhân tố đó. Do đó, cần có một công cụ kiểm tra mức độ phù hợp của các biến quan sát để đưa vào thang đo. Công cụ phổ biến nhất để thực hiện công việc này là kiểm định độ tin

cậy của thang đo Cronbach’s Alpha. Công cụ này giúp phản ánh mức độ tương quan chặt chẽ giữa các biến quan sát trong cùng một nhân tố, cho biết biến quan sát nào đóng góp vào việc đo lường khái niệm nhân tố, biến quan sát nào không. Thông qua đó, cho phép chúng ta loại bỏ được những biến không phù hợp trong mô hình nghiên cứu.

Hệ số Cronbach’s Alpha là hệ số tin cậy của thang đo, nó có giá trị biến thiên từ [0,1]. Về lý thuyết, hệ số này càng cao thì thang đo có độ tin cậy càng cao. Tuy nhiên khi hệ số Cronbach’s Alpha quá lớn (khoảng từ 0,95 trở lên) cho thấy có nhiều biến trong thang đo không có khác biệt nhau, hiện tượng này gọi là trùng lắp trong thang đo (Nguyễn Đình Thọ, 2013). Khi đó, ta nên xem xét biến đo lường nào đang là biến quan sát thừa, tức biến đo lường một khái niệm hầu như trùng lắp với biến đo lường khác, và loại bỏ nó khỏi thang đo.

Khi đánh giá độ tin cậy của thang đo, ta cần xem xét các tiêu chuẩn sau:

Thứ nhất, hệ số tương quan biến tổng (Corrected Item – Total Correlation) của từng biến phải đạt mức từ 0,3 trở lên mới đạt yêu cầu và giữ lại (Nunnally và Bernstein, 1994). Hệ số tương quan biến tổng thể hiện mối tương quan giữa biến quan sát đó với các biến còn lại trong thang đo, nếu biến quan sát này có sự tương quan càng mạnh với các biến trong nhóm, biến đó càng đáng tin cậy. Vì vậy, khi kiểm định độ tin cậy Cronbach’s Alpha, biến quan sát có hệ số tương quan biến tổng nhỏ hơn 0,3 thì cần loại biến đó và chạy lại lần hai.

Thứ hai, mỗi nhân tố trong nghiên cứu có mức giá trị hệ số Cronbach’s Alpha từ 0,6 trở lên thì thang đo mới được xem là đủ điều kiện, nếu chỉ số Cronbach’s Alpha của nhân tố đạt mức từ 0,7 đến 0,8 thì thang đo lường được đánh giá sử dụng tốt, còn nếu chỉ số này nằm trong khoảng từ 0,8 đến 1 thì thang đo lường rất tốt với độ tin cậy tốt (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008)

Ngoài ra, chúng ta cũng cần chú ý đến giá trị Cronbach’s Alpha if item deleted

(Cronbach’s Alpha nếu loại biến), đây là giá trị biểu diễn hệ số Cronbach’s Alpha nếu loại biến đang xem xét. Mặc dù đây không phải là tiêu chuẩn chính để đánh giá độ tin cậy của thang đo, nhưng nếu giá trị Cronbach’s Alpha nếu loại biến lớn hơn hệ

số Cronbach’s Alpha của nhóm quá nhiều (chênh lệch hơn 0,1) thì chúng ta nên cân nhắc xem xét loại bỏ hay giữ lại biến quan sát này tùy theo từng trường hợp để tăng độ tin cậy của thang đo.

Khi thực hiện phân tích Cronbach’s Alpha cho một nhân tố, nếu hệ số Cronbach’s Alpha của nhóm nhỏ hơn 0,6 và không có biến nào trong nhóm có Cronbach’s Alpha if item deleted lớn hơn 0,6 thì cần xem xét loại bỏ cả nhân tố.

3.3.2.2. Phân tích nhân tố khám phá EFA (Exploratory Factor Analysis)

Phân tích nhân tố khám phá EFA (Exploratory Factor Analysis) là một trong những phương pháp phân tích định lượng được dùng để rút gọn một tập hợp k biến quan sát phụ thuộc lẫn nhau thành một tập F (với F < k) các nhân tố có ý nghĩa hơn nhưng vẫn chứa đựng hầu hết các thông tin của tập biến quan sát ban đầu (Hair và cộng sự, 2010).

Các thang đo được đánh giá bằng phương pháp phân tích nhân tố khám phá EFA bằng cách sử dụng phương pháp trích Principle Axis Factoring với phép xoay Promax (Gerbing và Anderson, 1988) đối với cả biến độc lập và biến phụ thuộc. Hệ số KMO (Kaiser-Meyer-Olkin) là một chỉ số dùng để xem xét sự thích hợp của phân tích nhân tố. Trị số của KMO có giá trị từ 0,5 đến 1 phù hợp hay nói cách khác nếu trị số này nhỏ hơn 0,5 thì phân tích nhân tố có khả năng không thích hợp với tập dữ liệu nghiên cứu (Gerbing và Anderson, 1988). Đồng thời việc kiểm định Barlett xem xét giả thuyết về độ tương quan giữa các biến quan sát trong nhân tố có tương quan với nhau hay không. Nếu kiểm định này có ý nghĩa thống kê (Sig<0,05) thì các biến quan sát có tương quan với nhau (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008).

Để đảm bảo ý nghĩa thực tiễn của phân tích nhân tố khám phá EFA, hệ số tải nhân tố (factor loading) hay còn gọi là trọng số nhân tố nên bằng hoặc lớn hơn 0,5 (Hair và cộng sự, 2010). Giá trị này biểu thị mối quan hệ tương quan giữa biến quan sát với nhân tố. Hệ số tải nhân tố càng cao, nghĩa là tương quan giữa biến quan sát đó với nhân tố càng lớn và ngược lại.

Ngoài ra, theo Gerbing và Anderson (1988), tại điểm dừng được chọn là 1 (Eigenvalue = 1), có tổng phương sai trích lớn hơn 50% thì các điểm dừng này đủ điều kiện để trích nhân tố.

3.3.2.3. Phân tích nhân tố khẳng định CFA (Confirmatory Factory Analysis)

Phân tích nhân tố khẳng định (CFA) là bước phân tích tiếp theo của phân tích nhân tố khám phá EFA. Mục đích của CFA là để đánh giá mức độ phù hợp của mô hình với dữ liệu nghiên cứu, được thể hiện thông qua các chỉ tiêu sau: (i) Chi-square điều chỉnh theo bậc tự do (Chisquare/df) nhỏ hơn hoặc bằng 2, trong một số trường hợp chấp nhận giá trị nhỏ hơn 3 (Carmines và McIver, 1981); (ii) Chỉ số CFI

(Comparative Fit Index), GFI (Goodness of Fit Index), TLI không nhỏ hơn 0,9

(Bentler và Bonelt, 1980) và (iii) chỉ số RMSEA (Root Mean Square Error Approximation) nhỏ hơn 0,08 được xem là chấp nhận được, còn nếu RMSEA nhỏ hơn 0,05 được xem là rất tốt (Steiger, 1990). Một số trường hợp do sự giới hạn về cỡ mẫu nên trị số GFI khó đạt được mức 0,9. Chính vì vậy, mức giá trị GFI tối thiểu 0,8 vẫn được chấp nhận theo Baumgartner và Homburg (1996) và Doll và cộng sự (1994).

Ngoài ra, theo Peter (1981) và John và Reve (1982) để đánh giá cấu trúc giá trị của đo lường cần thiết phải xem xét các yếu tố như: (1) Độ tin cậy, (2) Giá trị hội tụ, (3) Giá trị phân biệt, và (4) giá trị liên hệ lý thuyết. Trong đó:

Thứ nhất, độ tin cậy của thang đo thể hiện cho tính nhất quán của đo lường, ngoài chỉ số Cronbach’s Alpha dùng đo lường độ tin cậy của tập hợp các biến quan sát để đo lường một khái niệm, trong CFA còn đánh giá độ tin cậy của thang đo thông qua độ tin cậy tổng hợp (Composite Reliability, viết tắt là “CR”) và trung bình phương sai trích (Average Variance Extracted, viết tắt là “AVE”). Theo Hair và cộng sự (2010) “Độ tin cậy tổng hợp và phương sai trích của mỗi khái niệm nên vượt quá 0,5 thì đảm bảo độ tin cậy”.

Thứ hai, tính hội tụ đề cập đến mực độ hội tụ của thang đo, để phân tích giá trị này phải dựa vào trọng số chuẩn hóa (λ) của các biến khi tiến hành phân tích CFA, nếu các trọng số này lớn hơn 0,5 đồng thời đạt mức ý nghĩa thống kê p nhỏ hơn 0,05 trong trường hợp độ tin cậy 95%, từ đó có thể kết luận thang đo hiện tại đạt giá trị hội tụ (Gerbing và Anderson, 1988).

Thứ ba, tính phân biệt nhằm đánh giá sự phân biệt giữa hai khái niệm đo lường khi các khái niệm nghiên cứu được tự do quan hệ với nhau. Để đảm bảo tính chất này theo điều kiện của phương sai riêng lớn nhất (Maximum Shared Variance, viết tắt “MSV”) phải nhỏ hơn AVE và căn bật hai của AVE đều lớn hơn các giá trị tương quan của nó với các khái niệm khác (Hair và cộng sự, 2010).

3.3.2.4. Phân tích mô hình cấu trúc tuyến tính SEM

Mô hình cấu trúc tuyến tính hay còn gọi là SEM (Structural Equation Modeling) là một kỹ thuật phân tích thống kê thế hệ thứ hai được phát triển để phân tích mối quan hệ đa chiều giữa nhiều biến trong một mô hình (Haenlein & Kaplan, 2004). Đa quan hệ giữa các biến có thể được biểu diễn trong một loạt các phương trình hồi quy đơn và bội. Kỹ thuật mô hình cấu trúc tuyến tính sử dụng kết hợp dữ liệu định lượng và các giả định tương quan (nguyên nhân - kết quả) vào mô hình. Với SEM, các nhà nghiên cứu có thể kiểm tra trực quan các mối quan hệ tồn tại giữa các biến quan tâm để ưu tiên các nguồn lực để phục vụ khách hàng tốt hơn.

Dùng phần mềm AMOS để tiến hành phân tích mô hình SEM và tiến hành:

Thứ nhất, kiểm tra phù hợp của mô hình cấu trúc SEM theo các chỉ tiêu giống khi phân tích khẳng định nhân tố (CFA): (i) Chi-square điều chỉnh theo bậc tự do (Chisquare/df) nhỏ hơn hoặc bằng 2, (ii) Chỉ số CFI, GFI, TLI không nhỏ hơn 0,9 và

(iii) chỉ số RMSEA nhỏ hơn 0,08 được xem là chấp nhận được.

Thứ hai, sau khi kiểm định sự phù hợp của mô hình nghiên cứu thì tiến hành kiểm định giả thuyết của mô hình, thực hiện thông qua các hệ số hồi quy chưa chuẩn hóa, hệ số hồi quy đã chuẩn hóa và giá trị thống kê p. Một giả thuyết được chấp nhận khi giá trị p nhỏ 5% với độ tin cậy 95% và chiều hướng của tác động giống với giả thuyết đề ra. Cụ thể, dựa vào giá trị của hệ số hồi quy chưa chuẩn hóa để đánh giá tính chất của các mối quan hệ nhân quả, mối quan hệ có ý nghĩa thống kê khi p nhỏ hơn 0,05 với độ tin cậy 95%; dựa vào giá trị của hệ số hồi quy đã chuẩn hóa để đánh giá mức độ tác động của các biến độc lập lên biến phụ thuộc. Ngoài ra, dựa vào hệ số tương quan bội bình phương (Square Multiple Correlations – R2) để đánh giá phần trăm biến thiên của biến phụ thuộc được giải thích bởi biến độc lập.

Thứ ba, kiểm định ước lượng của mô hình nghiên cứu bằng bootstrap. Để đánh giá độ tin cậy của các ước lượng và khẳng định mô hình nghiên cứu, tiến hành kiểm định bootstrap bằng cách chọn ra 200 mẫu, từ đó xác định trung bình các ước lượng, hiệu số giữa trung bình các ước lượng từ bootstrap và các ước lượng ban đầu là độ chệch bias, trị tuyệt đối các bias này càng nhỏ càng tốt Kline (2005).

Tóm tắt chương 3

Trong chương 3, tác giả mô tả toàn bộ quy trình và các phương pháp nghiên cứu. Luận văn thực hiện phương pháp nghiên cứu định tính và phương pháp nghiên cứu định lượng.

Nghiên cứu định tính được thực hiện trước với phương pháp phỏng vấn sâu với các chuyên gia. Kết quả nghiên cứu định tính là tác giả đã hoàn thiện việc xây dựng và mã hóa thang đo để từ đó xây dựng bảng câu hỏi khảo sát chính thức.

Nghiên cứu định lượng trình bày phương pháp chọn mẫu thuận tiện, phương pháp thu thập dữ liệu với công cụ là bảng hỏi được gửi đi bằng hình thức online thông qua các công cụ xã hội, phương pháp phân tích dữ liệu qua phần mềm SPSS và AMOS với các bước: đánh giá độ tin cậy của thang đo bằng hệ số Cronbach’s Alpha, phân tích nhân tố khám phá EFA, phân tích nhân tố khẳng định CFA và phân tích mô hình cấu trúc tuyến tính SEM để kiểm định các giả thuyết về mối quan hệ và mức độ tác động của biến độc lập tới biến phụ thuộc trong mô hình.

Ở chương 4, tác giả sẽ tiến hành xử lý và phân tích các dữ liệu thu thập được và thảo luận kết quả nghiên cứu cvới sự đối chiếu các công trình nghiên cứu trước đây để nhận biết các nhân tố ảnh hưởng đến hành vi mua sắm các sản phẩm chăm sóc vệ sinh cá nhân của người tiêu dùng trên địa bàn TP. Hồ Chí Minh trong giai đoạn dịch COVID-19.

CHƯƠNG 4 – KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN 4.1. Thống kê mô tả

4.1.1. Mô tả mẫu nghiên cứu

Bảng hỏi được gửi đi bằng hình thức online thông qua các công cụ trên mạng xã hội và nhận được 360 bảng phản hồi. Số bảng hợp lệ sau khi sàng lọc loại bỏ các bảng phản hồi không đáng tin cậy là 348 (tương ứng với tỷ lệ 97%). Số lượng phản hồi này phù hợp với số lượng mẫu nghiên cứu cần thiết là trên 300 mẫu.

Đặc điểm nhân khẩu học của đối tượng khảo sát bao gồm giới tính, độ tuổi, thu nhập, trình độ học vấn và môi trường làm việc được tóm tắt ở bảng 4.1.

Bảng 4.1: Bảng thống kê mô tả đặc điểm nhân khẩu học

Chỉ tiêu Tần số (người) Tần suất (%)

Nam 120 34,5 Giới tính Nữ 228 65,5 Tổng 348 100 Dưới 25 26 7,5 Từ 26 đến 40 273 78,4 Độ tuổi Từ 41 đến 55 49 14,1 Trên 55 0 0,0 Tổng 348 100 Dưới 5 triệu 21 6,0

Thu nhập Từ 5 triệu đến 9 triệu 85 24,4

Từ 10 triệu đến 20 triệu 123 35,3 hàng tháng Trên 20 triệu 119 34,2 Tổng 348 100 Trung học phổ thông 11 3,2 Trình độ học Trung cấp – cao đẳng 52 14,9 Đại học 213 61,2 vấn Sau đại học 72 20,7 Tổng 348 100

Chỉ tiêu Tần số (người) Tần suất (%)

Văn phòng 224 64,4

Nhà máy sản xuất 22 6,3

Vận tải (shipper, tài xế) 2 0,6

Môi trường Siêu thị 5 1,4

làm việc Bệnh viện, trạm y tế 21 6

Ở nhà 45 12,9

Khác 29 8,3

Tổng 348 100

(Nguồn: Kết quả thống kê của tác giả (2021))

Thống kê mẫu theo giới tính: qua khảo sát cho thấy, có 228 người là nữ

giới (chiếm 65,5%), còn lại 120 người là nam giới (chiếm 34,5%). Vậy trong mẫu nghiên cứu này giới tính nữ chiếm số đông hơn giới tính nam.

Thống kê mẫu theo độ tuổi: về cơ cấu tuổi của mẫu có thể thấy số người từ

26 đến 40 tuổi là nhiều nhất bao gồm 273 người chiếm tỷ lệ 78,4%, số người trong độ tuổi từ 41 đến 55 tuổi có số lượng lớn thứ hai (49 người) chiếm tỷ lệ 14,1%, số còn lại 26 người thuộc vào nhóm tuổi dưới 25 chiếm 7,5%, không có người khảo sát thuộc lứa tuổi trên 55 tuổi. Như vậy, trong tổng số người tham gia điều tra khảo sát, tập trung trọng yếu vào số người trong độ tuổi lao động có kinh nghiệm từ 26 tuổi đến dưới 55 tuổi, chiếm 92,5%.

Thống kê mẫu theo thu nhập hàng tháng: từ bảng khảo sát có thể thấy

nhóm người có thu nhập từ 10 triệu đến 20 triệu chiếm tỷ lệ cao nhất là 35,3% tương ứng với 123 người. Nhóm có tỷ lệ tương đương cao thứ hai bao gồm 119 người là nhóm có thu nhập trên 20 triệu tương ứng với 34,2%. Nhóm có thu nhập từ 5 đến 9 triệu đồng gồm 85 người, chiếm tỷ lệ 24,4%. Nhóm chiếm tỷ lệ thấp nhất 6% là nhóm có thu nhập dưới 5 triệu đồng, tương ứng với 21 người. Như vậy, có thể thấy tỷ lệ những người tham gia trong mẫu khảo sát có thu nhập cao là cao, tập trung ở mức từ 10 triệu trở lên (chiếm 69,5%). Lý do cho việc thu nhập cao có thể lý giải rằng đa phần những người tham gia khảo sát đều tập trung trong độ tuổi đi làm và có thâm niên (từ 26 đến dưới 55 tuổi).

Thống kê mẫu theo trình độ học vấn: qua khảo sát cho thấy, trình độ phân bổ khá đa dạng. Số lượng nhiều nhất tập trung ở trình độ đại học với 213 người (chiếm 61,2%), trình độ sau đại học là 72 người (chiếm 20,7%), trình độ trung cấp – cao đẳng 52 người (chiếm 14,9%) và thấp nhất ở trình độ trung học phổ thông với 11 người (chiếm 3,2%). Như vậy, mẫu khảo sát nghiên cứu tập trung trọng yếu ở những người

Một phần của tài liệu Các nhân tố ảnh hưởng đến hành vi mua sắm sản phẩm chăm sóc vệ sinh cá nhân của người tiêu dùng trên địa bàn thành phố Hồ Chí Minh trong giai đoạn Covid-19 (Trang 58)