CHƯƠNG 3 THIẾT KẾ NGHIÊN CỨU
3.5. NGHIÊN CỨU CHÍNH THỨC
3.5.2. Phương pháp phân tích số liệu
3.5.2.1. Thống kê mô tả
Trong bước đầu tiên, tác giả sử dụng thống kê mô tả để phân tích các thuộc tính của mẫu nghiên cứu như: giới tính, độ tuổi, thu nhập, nghề nghiệp.
3.5.2.2. Kiểm định và đánh giá thang đo
Bao gồm đánh giá độ tin cậy và giá trị các thang đo bằng hệ số tin cậy Cronbach’s Alpha và phân tích nhân tố khám phá EFA thông qua phần mềm xử lý SPSS 20.0 để sàng lọc, loại bỏ các biến quan sát không đáp ứng tiêu chuẩn (biến rác).
Phân tích Cronbach Alpha:
Cronbach’s Alpha là phép kiểm định thống kê về mức độ chặt chẽ (khả năng giải thích cho một khái niệm nghiên cứu) của tập hợp các biến quan sát (các câu hỏi) trong thang đo thông qua hệ số Cronbach’s Alpha. Theo Hoàng Trọng & Chu Nguyễn Mộng Ngọc (2008), cùng nhiều nhà nghiên cứu đồng ý rằng khi hệ số Cronbach’s Alpha có giá trị từ 0,8 trở lên đến gần 1,0 là thang đo tốt; từ 0,7 đến gần 0,8 là sử dụng được. Song cũng có nhiều nhà nghiên cứu đề nghị hệ số Cronbach Alpha từ 0,6 trở lên là có thể sử dụng được trong trường hợp khái niệm nghiên cứu là mới hoặc mới đối với người trả lời trong bối cảnh nghiên cứu.
Tuy nhiên, theo Nunnally et al. (1994), hệ số Cronbach’s Alpha không cho biết biến nào nên loại bỏ và biến nào nên giữ lại. Bởi vậy, bên cạnh hệ số Cronbach’s Alpha, người ta còn sử dụng hệ số tương quan biến tổng (iterm - total correlation) và những biến nào có tương quan biến tổng < 0,3 được coi là biến rác và sẽ bị loại bỏ. Song, theo Nguyễn Đình Thọ & Nguyễn Thị Mai Trang (2011), việc loại bỏ hay không một biến quan sát khơng chỉ đơn thuần nhìn vào con số thống kê mà còn phải xem xét giá trị nội dung của khái niệm. Theo đó, trong trường hợp thang đo đáp ứng tiêu chuẩn Cronbach’s Alpha và nếu loại bỏ biến có tương
quan biến tổng < 0,3 dẫn đến vi phạm giá trị nội dung (các biến quan sát còn lại khơng cịn bao phủ đầy đủ nội hàm của khái niệm) thì khơng nên loại biến đó.
Phân tích nhân tố khám phá (EFA)
Sau khi loại bỏ các biến không đảm bảo độ tin cậy, phương pháp phân tích nhân tố EFA được sử dụng để xác định giá trị hội tụ (convergent validity), giá trị phân biệt (discriminnant validity), và đồng thời thu gọn các tham số ước lượng theo từng nhóm biến. Trong nghiên cứu này, phân tích nhân tố được ứng dụng để tóm tắt tập các biến quan sát vào một số nhân tố nhất định đo lường các thuộc tính của các khái niệm nghiên cứu. Tiêu chuẩn áp dụng và chọn biến đối với phân tích nhân tố khám phá EFA bao gồm:
- Tiêu chuẩn Bartlett và hệ số KMO dùng để đánh giá sự thích hợp của EFA. Theo đó, giả thuyết H0 (các biến khơng có tương quan với nhau trong tổng thể) bị bác bỏ và do đó EFA được gọi là thích hợp khi: 0,5 ≤ KMO ≤ 1 và Sig < 0,05. Trường hợp KMO < 0,5 thì phân tích nhân tố có khả năng khơng thích hợp với dữ liệu (Hồng Trọng & Chu Nguyễn Mộng Ngọc, 2008). - Tiêu chuẩn rút trích nhân tố gồm chỉ số Eigenvalue (đại diện cho lượng biến
thiên được giải thích bởi các nhân tố) và chỉ số Cumulative (tổng phương sai trích cho biết phân tích nhân tố giải thích được bao nhiêu % và bao nhiêu % bị thất thoát). Theo Gerbing & Anderson (1988), các nhân tố có Eigenvalue < 1 sẽ khơng có tác dụng tóm tắt thơng tin tốt hơn biến gốc (biến tiềm ẩn trong các thang đo trước khi EFA). Vì thế, các nhân tố chỉ được rút trích tại Eigenvalue > 1 và được chấp nhận khi tổng phương sai trích ≥ 50%.
- Tiêu chuẩn hệ số tải nhân tố (Factor loading) biểu thị tương quan giữa các biến với các nhân tố, dùng để đánh giá mức ý nghĩa của EFA. Để thang đo đạt giá trị hội tụ thì hệ số tải nhân tố phải ≥ 0,4 trong một nhân tố. Để đạt giá trị phân biệt, khác biệt giữa các nhân tố phải ≥ 0,3.
Tuy nhiên, cũng như trong phân tích Cronbach’s Alpha, việc loại bỏ hay không một biến quan sát không chỉ dựa vào trọng số tải nhân tố mà còn phải xem xét giá trị nội dung của biến đó. Trường hợp biến có hệ số tải nhân tố thấp hoặc
được trích vào các nhân tố khác nhau mà chênh lệch trọng số rất nhỏ, nhưng có đóng góp quan trọng vào giá trị nội dung của khái niệm mà nó đo lường thì khơng nhất thiết loại bỏ biến đó (Nguyễn Đình Thọ & Nguyễn Thị Mai Trang, 2011).
3.5.2.3. Phân tích hồi quy
Sau khi hoàn tất việc đánh giá độ tin cậy và giá trị thang đo, các biến không đảm bảo giá trị hội tụ tiếp tục bị loại bỏ khỏi mơ hình cho đến khi tham số được nhóm theo các nhóm biến. Việc xác định mối quan hệ giữa các nhóm này cũng như xác định mối quan hệ giữa các nhóm biến độc lập và biến phụ thuộc trong mơ hình nghiên cứu được thực hiện bằng phương pháp hồi quy bội
Giá trị của biến mới trong mơ hình nghiên cứu là giá trị chuẩn hóa được phần mềm SPSS tính một cách tự động sau khi phân tích nhân tố EFA. Tuy nhiên, trước khi tiến hành phân tích hồi quy, một phân tích quan trọng cần được thực hiện đầu tiên là phân tính tương quan nhằm kiểm định mối tương quan tuyến tính giữa các biến trong mơ hình.
Phân tích tương quan:
Kiểm định mối tương quan tuyến tính giữa các biến trong mơ hình: giữa biến phụ thuộc với từng biến độc lập và giữa các biến độc lập với nhau. Sử dụng ma trận hệ số tương quan. Theo đó, điều kiện để phân tích hồi quy là phải có tương quan giữa các biến độc lập với nhau và với biến phụ thuộc. Tuy nhiên, theo Hoàng Trọng & Chu Nguyễn Mộng Ngọc (2008), khi hệ số tương quan < 0,85 thì có khả năng đảm bảo giá trị phân biệt giữa các biến. Nghĩa là, nếu hệ số tương quan > 0,85 thì cần xem xét vai trị của các biến độc lập, vì có thể xảy ra hiện tượng đa cộng tuyến (một biến độc lập này có được giải thích bằng một biến khác).
Phân tích hồi quy
Hồi quy tuyến tính bội được dùng để kiểm định và giải thích lý thuyết nhân quả (Cooper & Schindler, 2003). Ngoài chức năng là một công cụ mơ tả, hồi quy tuyến tính bội cũng được sử dụng như một công cụ kết luận để kiểm định các giả thuyết và dự báo các giá trị của tổng thể nghiên cứu. Do đó, trong nghiên cứu này
hồi quy tuyến tính bội được chọn là phương pháp thích hợp để kiểm định các giả thuyết nghiên cứu.
Kiểm định mơ hình hồi quy và các giả thuyết nghiên cứu
Y = β0 + β1X1+β2X2+ β3X3+ β4X4+...+ βkXk Được thực hiện thông qua các bước sau:
- Lựa chọn các biến đưa vào mơ hình hồi quy (tác giả sử dụng phương pháp Enter - SPSS xử lý tất cả các biến đưa vào cùng một lượt).
- Đánh giá độ phù hợp của mơ hình bằng hệ số xác định R2 (R Square). Hệ số xác định R2 đo lường tỉ lệ tổng biến thiên của biến phụ thuộc được giải thích bằng các biến độc lập trong mơ hình. Giá trị của R2 càng cao thì khả năng giải thích của mơ hình hồi quy càng lớn, và việc dự đoán biến phụ thuộc càng chính xác. Tuy nhiên, R2 có đặc điểm càng tăng khi đưa thêm các biến độc lập vào mơ hình, mặc dù khơng phải mơ hình càng có nhiều biến độc lập thì càng phù hợp với tập dữ liệu. R2 hiệu chỉnh (Adjusted R Square) có đặc điểm khơng phụ thuộc vào số lượng biến đưa thêm vào mơ hình từ đó phản ánh sát hơn mức độ phù hợp của mơ hình vì vậy, được sử dụng thay thế R2
để đánh giá mức độ phù hợp của mơ hình hồi quy bội. (Hồng Trọng & Chu Nguyễn Mộng Ngọc, 2013)
- Hệ số Kiểm định độ phù hợp của mơ hình để lựa chọn mơ hình tối ưu bằng cách sử dụng phương pháp phân tích ANOVA để kiểm định giả thuyết H0: (khơng có mối liên hệ tuyến tính giữa biến phụ thuộc với tập hợp các biến độc lập β1=β2=β3=βK= 0).
Nếu trị thống kê F có Sig rất nhỏ (< 0,05), thì giả thuyết H0 bị bác bỏ, khi đó chúng ta kết luận tập hợp của các biến độc lập trong mơ hình có thể giải thích cho sự biến thiên của biến phụ thuộc. Nghĩa là mơ hình được xây dựng phù hợp với tập dữ liệu, vì thế có thể sử dụng được.
- Xác định các hệ số của phương trình hồi quy, đó là các hệ số hồi quy riêng phần βk: đo lường sự thay đổi trung bình của biến phụ thuộc khi biến độc lập Xk thay đổi một đơn vị, trong khi các biến độc lập khác được giữ nguyên.
Tuy nhiên, độ lớn của βk phụ thuộc vào đơn vị đo lường của các biến độc lập, vì thế việc so sánh trực tiếp chúng với nhau là khơng có ý nghĩa. Do đó, để có thể so sánh các hệ số hồi quy với nhau, từ đó xác định tầm quan trong (mức độ giải thích) của các biến độc lập cho biến phụ thuộc, người ta biểu diễn số đo của tất cả các biến độc lập bằng đơn vị đo lường độ lệnh chuẩn beta.
Kiểm tra vi phạm các giả định hồi quy
Mơ hình hồi quy được xem là phù hợp với tổng thể nghiên cứu khi khơng vi phạm các giả định. Vì thế, sau khi xây dựng được phương trình hồi quy, cần phải kiểm tra các vi phạm giả định cần thiết sau đây:
- Có liên hệ tuyến tính gữa các biến độc lập với biến phụ thuộc - Phần dư của biến phụ thuộc có phân phối chuẩn
- Phương sai của sai số không đổi
- Khơng có tương quan giữa các phần dư (tính độc lập của các sai số)
- Khơng có tương quan giữa các biến độc lập (khơng có hiện tượng đa cộng tuyến).
Trong đó:
- Công cụ để kiểm tra giả định liên hệ tuyến tính là đồ thị phân tán phần dư chuẩn hóa (Scatter) biểu thị tương quan giữa giá trị phần dư chuẩn hóa (Standardized Residual) và giá trị dự đốn chuẩn hóa (Standardized Pridicted Value).
- Cơng cụ để kiểm tra giả định phần dư có phân phối chuẩn là đồ thị tần số Histogram, hoặc đồ thị tần số P-P plot.
- Công cụ để kiểm tra giả định sai số của biến phụ thuộc có phương sai khơng đổi là đồ thị phân tán của phần dư và giá trị dự đoán hoặc kiểm định Spearman.
- Công cụ được sử dụng để kiểm tra giả định khơng có tương quan giữa các phần dư là đại lượng thống kê D (Durbin - Watson), hoặc đồ thị phân tán phần dư chuẩn hóa (Scatter).
- Cơng cụ được sử dụng để phát hiện tồn tại hiện tượng đa cộng tuyến là độ chấp nhận của biến (Tolerance) hoặc hệ số phóng đại phương sai (Variance inflation factor - VIF). Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), quy tắc chung là VIF >10 là dấu hiệu đa cộng tuyến; trong khi đó, theo Nguyễn Đình Thọ và Nguyễn Thị Mai Trang (2011), khi VIF > 2 cần phải cẩn trọng hiện tượng đa cộng tuyến.
Tóm tắt chương 3
Chương này trình bày phương pháp nghiên cứu được thực hiện qua 2 giai đoạn là nghiên cứu sơ bộ và nghiên cứu chính thức. Kết quả nghiên cứu sơ bộ là một nghiên cứu định tính khẳng định mơ hình lý thuyết đề xuất trong chương 2 phản ánh các nhân tố tác động đến quyết định lựa chọn siêu thị làm nơi mua sắm của người tiêu dùng ở TP.HCM, đồng thời phát triển thang đo các thành phần này và quyết định lựa chọn siêu thị gồm 36 biến. Nghiên cứu chính thức là một nghiên cứu định lượng, mẫu nghiên cứu được chọn bằng phương pháp lấy mẫu thuận tiện. Kích thước mẫu dự kiến là 300 được thu thập bằng hình thức phỏng vấn bằng bảng câu hỏi, hoặc email. Q trình phân tích dữ liệu gồm các giai đoạn:
- Đánh sơ bộ các thang đo bằng Cronbach’s Alpha và phân tích nhân tố khám phá (EFA).
- Phân tích hồi quy tuyến tính đa biến được sử dụng để kiểm định mơ hình nghiên cứu và các giả thuyết nghiên cứu.
Toàn bộ quá trình phân tích dữ liệu sử dụng phần mềm SPSS 20.0. Kết quả phân tích dữ liệu nghiên cứu sẽ được trình bày trong chương 4 tiếp theo.