CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU
3.4. Phương pháp xử lý số liệu
Thống kê mô tả đề cập đến một nhánh của thống kê liên quan đến việc chuyển hóa dữ liệu thô ban đầu và tóm tắt, sắp xếp, trình bày theo một cách dễ hiểu, ngắn gọn. Phương pháp này tập trung vào việc mô tả, phân tích các điểm chính và đặc trưng của dữ liệu mà không đưa ra bất kỳ sự suy diễn nào. Mục tiêu chính của thống kê mô tả là cung cấp thông tin rõ ràng và ngắn gọn về dữ liệu, giúp các nghiên cứu viên có được cái nhìn sâu sắc và hiểu các mẫu, xu hướng và phân phối trong tập dữ liệu. Bằng cách sử dụng thống kê mô tả, các nghiên cứu viên có thể truyền đạt hiệu quả các đặc điểm chính của một tập dữ liệu, tạo điều kiện cho việc nắm bắt tốt hơn về dữ liệu và cung cấp nền tảng cho các phân tích tiếp theo.
Trong phạm vi khóa luận này, tác giả thực hiện phương pháp thống kê mô tả bao gồm việc tạo bảng thống kê mô tả biến nhân khẩu học để minh họa dữ liệu thu thập được. Các thuộc tính như giới tính, năm học, dòng nhạc yêu thích và chi tiêu đóng vai trò là những viên gạch đầu tiên trong quá trình phân tích thông tin.
3.4.2. Phương pháp kiểm định độ tin cậy Cronbach’s Alpha
Hệ số Cronbach’s Alpha được phát triển bởi Lee Cronbach vào năm 1951, được sử dụng để đánh giá mức độ tin cậy và mối tương quan giữa các biến quan sát trong thang đo. Cronbach’s Alpha được mô tả là một trong những thống kê quan trọng và phổ biến nhất trong nghiên cứu liên quan đến việc xây dựng và sử dụng kiểm định đến mức việc sử dụng nó trong nghiên cứu được coi là quy trình thông thường.
Hệ số Cronbach’s Alpha có giá trị biến thiên trong đoạn từ 0-1. Để được coi là độ tin cậy đạt chuẩn, hệ số Cronbach’s Alpha phải nằm trong khoảng từ 0,7 trở lên, với mức tối đa là 1,0. Trong trường hợp cỡ mẫu nhỏ, các giá trị chấp nhận được là 0,7 hoặc 0,6. Hệ số tương quan Corrected Item – Total Correlation của từng biến quan sát trong thang đo nên từ 0,3 trở lên và trường hợp dưới 0,3 cần xem xét việc loại bỏ để cải thiện độ tin cậy của thang đo.
3.4.3. Phương pháp phân tích nhân tố khám phá
Phân tích nhân tố khám phá (Exploratory Factor Analysis - EFA) là một kỹ thuật thống kê được sử dụng để xác định cấu trúc của mối quan hệ giữa biến quan sát trong thang đo. Ứng dụng EFA để phân tích và thu gọn dữ liệu, các nghiên cứu viên chỉ cần tập trung vào ít biến hơn để giải thích sự phụ thuộc giữa các biến, thay vì xem xét quá nhiều biến có thể không quan trọng, rồi tiến hành phân loại những biến này vào các danh mục có ý nghĩa (còn gọi là các nhân tố). Quá trình thực hiện phân tích EFA bao gồm các tiêu chí đánh giá sau:
- Kiểm định KMO (Kaiser - Meyer - Olkin): trị số KMO dao động từ 0 đến 1, giá trị từ 0,5 được coi là phù hợp cho phân tích nhân tố.
- Hệ số tải nhân tố (Factor loading - FL): hệ số tải từ 0,5 là biến quan sát đạt chất lượng tốt và điều kiện tối thiểu nên là 0,3.
- Trị số Eigenvalue: quy tắc trị số Eigenvalue lớn hơn 1 được chấp nhận và tiếp tục là phương pháp được nhiều nghiên cứu viên ưa chuộng. Những nhân tố có Eigenvalue nhỏ hơn 1 cần được cân nhắc loại bỏ trong mô hình phân tích.
- Kiểm định Sphericity của Bartlett (Bartlett's Sphericity Test): kết quả của kiểm định nên nhỏ hơn 0,05. Nếu cho ra kết quả khác, nên tăng số lượng mẫu hoặc loại bỏ các biến nếu cần thiết.
- Tổng phương sai trích (Total Variance Explained - TVE): kết quả lớn hơn hoặc bằng 50% cho thấy mô hình EFA là phù hợp. TVE càng cao mô hình càng có hiệu suất tốt.
3.4.4. Phương pháp phân tích hồi quy tuyến tính
Phân tích hồi quy tuyến tính được sử dụng để dự đoán giá trị của một biến dựa trên giá trị của một biến khác. Biến cần được dự đoán được gọi là biến phụ thuộc, biến được sử dụng để dự đoán giá trị của biến khác được gọi là biến độc lập.
Hình thức phân tích này ước lượng các hệ số của phương trình tuyến tính, liên quan đến một hoặc nhiều biến độc lập, để dự đoán tốt nhất giá trị của biến phụ thuộc, mô
có từ hai biến độc lập trở lên, mô hình được gọi là hồi quy bội hay hồi quy đa biến (Multiple Linear Regression - MLR). Phương trình hồi quy bội có dạng:
Y = β0 + β1X1 + β2X2 + … + βnXn + ε Trong đó:
Y: biến phụ thuộc, là biến Quyết định mua vé buổi hòa nhạc do nghệ sĩ biểu diễn của sinh viên trường Đại học Ngân hàng Thành phố Hồ Chí Minh.
X, X1, X2, Xn: biến độc lập, bao gồm các biến Trải nghiệm, Sự kết nối, Giá trị dịch vụ, Sự thuận tiện, Ảnh hưởng xã hội và Nhận thức rủi ro.
β0: hằng số hồi quy, hay còn được gọi là hệ số chặn. Đây là chỉ số nói lên giá trị của Y sẽ là bao nhiêu nếu tất cả X cùng bằng 0.
β1, β2, βn: hệ số hồi quy, hay còn được gọi là hệ số góc. Chỉ số này cho biết có bao nhiêu đơn vị Y sẽ thay đổi nếu X tăng hoặc giảm một đơn vị. Khóa luận xác định β bằng hệ số hồi quy chuẩn hóa của từng biến độc lập tương ứng.
ε: sai số. Chỉ số này càng lớn càng khiến cho khả năng dự đoán của hồi quy trở nên kém chính xác hơn hoặc sai lệch nhiều hơn so với thực tế.
Hồi quy bội có các tiêu chí sau:
- Hệ số tương quan Pearson (ký hiệu r): là cách phổ biến nhất để đo lường sự tương quan tuyến tính. Hệ số này dao động trong khoảng từ –1 đến 1, đo lường mức độ chặt chẽ giữa hai biến. Để xác định hai biến có mối tương quan tuyến tính và phù hợp để thực hiện hồi quy, kết quả Sig. cần nhỏ hơn 0,05.
- Kiểm định F: đánh giá mối liên hệ tuyến tính giữa biến phụ thuộc và tất cả các biến độc lập. Giá trị Sig. < 0,05 được coi là có mối liên hệ tuyến tính đầy đủ.
- Giá trị R2 và R2 hiệu chỉnh: là chỉ số thống kê sử dụng để tổng hợp khả năng giải thích của mô hình. R2 và R2 hiệu chỉnh dao động trong đoạn từ 0 đến 1.
Nếu R2 càng tiến về 1, các biến độc lập giải thích càng nhiều cho biến phụ thuộc, và ngược lại. R2 hiệu chỉnh càng lớn thể hiện độ phù hợp của mô hình càng cao.
- Trị số Durbin – Watson (DW): kiểm tra hiện tượng tự tương quan hay còn gọi là tương quan nối tiếp, của các sai số liên tiếp nhau. Kết quả nằm trong khoảng lớn hơn 1 và nhỏ hơn 3 thì mô hình không có hiện tượng tự tương quan.
- Hệ số phóng đại phương sai (Variance Inflation Factor - VIF): sử dụng để đánh giá hiện tượng đa cộng tuyến. Kết quả VIF càng bé, tỉ lệ xảy ra đa cộng tuyến càng ít. VIF đạt ngưỡng từ 10 trở lên sẽ xảy ra đa cộng tuyến mạnh và mất giá trị giải thích.
Sau đó có thể thực hiện đánh giá các giả định hồi quy qua 3 biểu đồ:
- Phần dư chuẩn hóa trong hồi quy tuyến tính (Standardized Residual) là sự khác biệt giữa giá trị thực tế và giá trị dự đoán của biến phụ thuộc, có thể được đánh giá bằng 2 biểu đồ: Histogram và Normal P-P Plot.
- Liên hệ tuyến tính đề cập đến mối quan hệ giữa biến phụ thuộc và biến độc lập được mô tả bằng một phương trình tuyến tính. Để kiểm tra vi phạm giả định liên hệ tuyến tính có thể sử dụng biểu đồ phân tán (Scatter Plot).
Kết luận chương 3
Chương 3 trình bày phương pháp nghiên cứu hỗn hợp và quy trình nghiên cứu 9 bước. Trong quá trình xây dựng thang đo, bước đầu tác giả ứng dụng sử dụng thang đo Likert 5 mức độ cho bảng khảo sát online Google Forms. Sau đó, thang đo chính thức được hoàn thiện với 24 biến quan sát thuộc 6 biến độc lập (Trải nghiệm, Sự kết nối, Giá trị dịch vụ, Sự thuận tiện, Ảnh hưởng xã hội, Nhận thức rủi ro) và 4 biến quan sát cho biến phụ thuộc trong mô hình nghiên cứu. Nghiên cứu sử dụng các phương pháp xử lý số liệu bao gồm: thống kê mô tả, kiểm định độ tin cậy Cronbach’s Alpha, phân tích nhân tố khám phá (EFA), phân tích hồi quy tuyến tính.
Chương 4 sẽ thu thập dữ liệu từ bảng khảo sát để phân tích số liệu và đưa ra kết quả nghiên cứu.