CHƯƠNG 2 : PHƯƠNG PHÁP NGHIÊN CỨU
2.3. Nghiên cứu định lượng
2.3.1. Mẫu và thông tin mẫu
Khảo sát định lượng thực hiện đối với khách hàng doanh nghiệp đang sử
dụng dịch vụ của Vietcombank. Phương pháp lấy mẫu phi xác suất, chọn mẫu theo
1-2 năm, 2-3 năm, trên 3 năm), theo loại hình doanh nghiệp (doanh nghiệp nhà
nước, doanh nghiệp 100% vốn nước ngồi, cơng ty TNHH và công ty cổ phần,
doanh nghiệp tư nhân, khác), theo số lượng lao động trong doanh nghiệp (dưới 10
người, từ 10-50 người, từ 50-100 người, trên 100 người)
Cách chọn mẫu: Theo Hair và ctg [18], để có thể phân tích nhân tố khám phá (EFA), cần thu thập bộ dữ liệu với ít nhất 5 mẫu trên 1 biến quan sát. Theo Tabachnick và Fidell [12], để tiến hành phân tích hồi quy một cách tốt nhất thì kích
thước mẫu cần phải đảm bảo theo công thức: n > = 8m + 50 (trong đó: n là cỡ mẫu,
m là số biến độc lập trong mơ hình). Trên cơ sơ đó, đề tài có 23 biến quan sát, ta cần chọn cỡ mẫu ít nhất là 234. Vì vậy đề tài sẽ chọn cỡ mẫu ít nhất là 234.
2.3.2. Thu thập và phân tích dữ liệu
Các bước xử lý số liệu cụ thể bằng SPSS 17.0 sẽ được giới thiệu trong hình bên dưới:
Hình 2.2. Các bước xử lý số liệu trong luận văn
Làm sạch dữ liệu
Kiểm định phân phối chuẩn
Kiểm định Cronbach’s Alpha
Phân tích nhân tố EFA
Phân tích hồi quy bội
2.3.2.1. Làm sạch dữ liệu
Sau khi loại các mẫu không phù hợp với yêu cầu ban đầu, chúng ta chạy phân bổ tần số để kiểm tra các biến nhập sai có giá trị gây nhiễu không nằm trong các giá trị lựa chọn.
Kiểm tra các mẫu đối tượng bị trùng nhau và loại mẫu bị trùng. Kiểm tra các tần suất các giá trị missing và đảm bảo các giá trị missing của một biến phải nhỏ
hơn 10% tổng số mẫu [6].
2.3.2.2. Kiểm định phân phối chuẩn
Để có thể sử dụng mẫu thu thập được vào việc chạy mơ hình hồi quy đa biến,
chúng ta cần đảm bảo các biến trong mơ hình hài lịng giả định về tính phân phối chuẩn. Giả định về tính phân phối chuẩn là giả định quan trọng nhất trong việc phân
tích đa biến, đề cập đến dạng phân phối của dữ liệu cho từng biến riêng và so sánh
với dạng phân phối chuẩn.
Kiểm tra tính phân phối chuẩn các biến bằng cách xem dạng phân phối tần số của các mẫu cũng như các thông số Skewness và Kurtosis [18]. Nếu Skewness và Kurtosis nằm trong khoảng ±1 được xem là tốt, trong khoảng ±2 thì biến đó vẫn
được chấp nhận để sử dụng thực hiện các kỹ thuật thống kê.
2.3.2.3. Kiểm tra độ tin cậy các nhóm nhân tố
Độ tin cậy Cronbach Alpha phải nằm trong khoảng từ 0.6 đến 1.0 để đảm
bảo các biến trong cùng một nhóm nhân tố có tương quan về ý nghĩa [6].
2.3.2.4. Phân tích nhân tố
Với số lượng các biến khá lớn và có mối tương quan với nhau, chúng ta cần giảm số lượng này xuống tới thành một số nhân tố ít hơn mà chúng ta có thể sử
dụng được nhưng vẫn có thể đại diện cho phần lớn ý nghĩa các biến thu thập. Các nhân tố này thể hiện được sự liên hệ qua lại giữa các biến và thể hiện sự giải thích của biến đối với các khía cạnh khác nhau của vấn đề.
Việc phân tích nhân tố sẽ được thực hiện theo các tiêu chí sau [6]:
- Kiểm định Barlett: Là một kiểm định thống kê nhằm kiểm tra giữa các biến
thì xem như các biến có tương quan với nhau[18]. Phép đo sự phù hợp của mẫu KMO (Kaiser-Meyer-Olkin): Là phép đo sự tương quan qua lại giữa các biến và sự phù hợp để phân tích nhân tố. Hệ số KMO có giá trị trong khoảng 0 đến 1. Giá trị KMO phụ thuộc vào cỡ mẫu, độ tương quan trung bình, số biến và số nhân tố. Nếu hệ số này lớn hơn 0.5 thì tập dữ liệu được xem là phù hợp để tiến hành phân tích nhân tố. Ngồi ra, chúng ta cịn có thể kiểm tra thơng số sự phù hợp của mẫu (MSA: measure of sampling adequacy) cho từng biến. Nếu lớn hơn 0.5 thì phù hợp cho việc phân tích nhân tố. Nếu nhỏ hơn 0.5 thì loại biến có MSA nhỏ nhất rồi chạy lại phân tích nhân tố.
- Eigenvalue: Là tổng bình phương các trọng số của các biến trên một cột nhân tố, còn được gọi là latent root. Nó đại diện cho mức độ biến động được giải thích bởi một nhân tố. Giá trị eigenvalue của các nhân tố được chọn phải từ 1 trở lên.
- Communality: Thể hiện tỉ lệ của các nhân tố phân tích đại diện cho cụ thể một biến nào đó. Giá trị này phải lớn hơn 0.2.
- Trong phần xử lý này, tác giả chấp nhận hệ số “factor loading” từ 0.40 trở lên theo qui tắc Thurstone. Nếu không đạt các yêu cầu này và không phải là biến quan trọng trong mơ hình thì biến sẽ bị loại và chạy lại phân tích nhân tố.
2.3.2.5. Phân tích hồi quy bội kiểm định mơ hình lý thuyết
Phân tích hồi quy bội là một kỹ thuật thống kê có thể được sử dụng để phân tích mối quan hệ giữa một biến phụ thuộc và nhiều biến độc lập. Mục tiêu của việc phân tích hồi quy bội là sử dụng các biến độc lập có giá trị biết trước để dự báo một giá trị biến độc lập nào đó được chọn bởi người nghiên cứu. Khi chạy hồi quy cần
quan tâm đến các thông số sau [6]:
- Hệ số Beta: Hệ số hồi quy chuẩn hoá cho phép so sánh trực tiếp giữa các hệ số dựa trên mối quan hệ giải thích của chúng với biến phụ thuộc.
- Hệ số khẳng định R2: Đánh giá phần biến động của biến phụ thuộc được
giải thích bởi các biến dự báo hay biến độc lập. Hệ số này có thể thay đổi từ 0 đến 1.
- Đa cộng tuyến: Mơ tả mối quan hệ tuyến tính giữa hai hay nhiều biến độc lập. Hai biến độc lập được xem là tuyến tính hồn tồn nếu hệ số tương quan giữa chúng là 1 và hồn tồn khơng quan hệ tuyến tính nếu hệ số tương quan giữa chúng
là 0. Đa cộng tuyến xảy ra khi một biến độc lập nào đó tương quan mạnh với một
nhóm biến độc lập khác.
- Hệ số tương quan r: Chỉ mối quan hệ giữa biến phụ thuộc và các biến độc lập. Dấu của hệ số tương quan chỉ hướng của mối quan hệ này. Giá trị của r có thể
thay đổi từ -1 đến +1.
- Hằng số hồi quy b0: Giá trị của cột Y khi đường thẳng Y = b0 + b1X1 cắt cột này. Hằng số hồi quy thể hiện các tác động của tất cả các biến dự báo khác không
được bao gồm trong mơ hình.
- Hệ số hồi quy bn: Giá trị hệ số góc của các biến trong mơ hình ước lượng. Các hệ số này mang tính riêng phần vì mỗi hệ số khơng chỉ thể hiện mối quan hệ giữa các biến độc lập và biến phụ thuộc mà còn giữa các biến độc lập với nhau.
- Hệ số Tolerance: Được sử dụng để đo lường tính tuyến tính và đa cộng
tuyến, giá trị tolerance của biến i (TOLi) là 1-R2*i với R2*i là hệ số khẳng định cho việc dự báo biến i bởi các biến độc lập khác. Khi giá trị Tolerance của một biến càng nhỏ thì biến này càng bị cộng tuyến với các biến độc lập khác.