CHƯƠNG 3 : PHƯƠNG PHÁP NGHIÊN CỨU
3.4 PHƯƠNG PHÁP PHÂN TÍCH SỐ LIỆU
Đối với mục tiêu (1): Đánh giá thực trạng mua vé số kiến thiết Đồng Tháp của người dân tỉnh Đồng Tháp.
Tác giả sử dụng các phương pháp phân tích sau:
Phương pháp phân tích tần số
Phương pháp phân tích tần số là một trong những công cụ thống kê mô tả được sử dụng để mơ tả và tìm hiểu về đặc tính phân phối của một số mẫu số liệu thơ nào đó. Trong phạm vi nghiên cứu này phương pháp phân tích tần số được dùng để đo
lường cả biến định lượng và định tính dưới dạng đếm số lần xuất hiện, để mô tả một số biến số liên quan đến đặc tính nhân khẩu học của đối tượng được phỏng vấn như giới tính, trình độ học vấn, tuổi tác,… Phương pháp này giúp cho chúng ta có cái nhìn tổng thể về một đặc tính nào đó của mẫu điều tra.
Phương pháp thống kê mô tả
- Thống kê mô tả được sử dụng để mơ tả những đặc tính cơ bản của dữ liệu thu thập được từ nghiên cứu thực nghiệm qua các cách thức khác nhau. Thống kê mô tả cung cấp những tóm tắt đơn giản về mẫu và các thước đo. Cùng với phân tích đồ họa đơn giản, chúng tạo ra nền tảng của mọi phân tích định lượng về số liệu. Bước đầu tiên để mơ tả và tìm hiểu về đặc tính phân phối của một bảng số liệu thô là lập bảng phân phối tần số. Sau đó, sử dụng một số hàm để làm rõ đặc tính của mẫu phân tích. Để hiểu được các hiện tượng và ra quyết định đúng đắn, cần nắm được các phương pháp cơ bản của mơ tả dữ liệu. Có rất nhiều kỹ thuật hay được sử dụng, có thể phân loại các kỹ thuật này như sau: Biểu diễn dữ liệu bằng đồ họa trong đó các đồ thị mô tả dữ liệu hoặc giúp so sánh dữ liệu; Biểu diễn dữ liệu thành các bảng số liệu tóm tắt về dữ liệu; Thống kê tóm tắt (dưới dạng các giá trị thống kê đơn nhất) mô tả dữ liệu.
- Các đại lượng thống kê mô tả gồm:
+ Mean: số trung bình cộng; Sum: tổng cộng; Std.deviation: độ lệch chuẩn; Minimum, maximum: giá trị nhỏ nhất, giá trị lớn nhất; df: tần số; Std error: sai số chuẩn; Median: là lượng biến của tiêu thức của đơn vị đứng ở vị trí giữa trong dãy số lượng biến, chia số lượng biến thành hai phần (phần trên và phần dưới) mỗi phần có cùng một số đơn vị bằng nhau; và Mode: là biểu hiện của tiêu thức được gặp nhiều nhất trong tổng thể hay trong dãy phân phối. Trong dãy lượng biến, mode là lượng biến có tần số lớn nhất
+ Giá trị trung bình: Mean, Average: bằng tổng tất cả các giá trị biến quan sát chia cho số quan sát.
+ Số trung vị (Median, kí hiệu: Me) là giá trị của biến đứng ở giữa của một dãy số đã được sắp xếp theo thứ tự tăng hoặc giảm dần. Số trung vị chia dãy số làm 2 phần, mỗi phần có số quan sát bằng nhau.
+ Mode (kí hiệu: Mo): là giá trị có tần số xuất hiện cao nhất trong tổng số hay trong một dãy số phân phối.
+ Phương sai: là trung bình giữ bình phương các độ lệch giữa các biến và trung bình của các biến đó. Độ lệch chuẩn là căn bậc hai của phương sai.
Đối với mục tiêu 2: phân tích các nhân tố ảnh hưởng đến việc chọn mua vé số của khách hàng đối với Công ty.
Tác giả sử dụng các phương pháp phân tích sau: Sử dụng hệ số Cronbach’s Alpha, phương pháp phân tích yếu tố khám phá EFA (exploratory factor analysis) và phương pháp phân tích hồi quy đa biến (Binary logistic) để đánh giá các thang đo có ảnh hưởng đến hành vi người tiêu dùng.
Phương pháp tính hệ số Cronbach’s Alpha
Hệ số Cronbach’s Alpha là một phép kiểm định thống kê cùng để kiểm tra sự chặt chẽ và tương quan giữa các biến quan sát. Điều này liên quan đến hai khía cạnh là tương quan giữa bản thân các biến và tương quan của điểm số của từng biến với điểm số toàn bộ các biến của từng đáp viên. Phương pháp này cho phép người phân tích loại bỏ các biến khơng phù hợp và hạn chế của những biến rác trong mơ hình nghiên cứu, vì nếu khơng, chúng ta khơng thể biết được độ chính xác độ biến thiên cũng như độ lỗi của các biến.
Nhiều nhà nghiên cứu đồng ý khi hệ số Cronbach’s Alpha từ 0,8 đến 1 là thang đo tốt, từ 0,7 đến 0,8 là sử dụng được. Cũng có nhà nghiên cứu đề nghị rằng hệ số Cronbach’s Alpha từ 0,6 trở lên là sử dụng được trong những trường hợp khái niệm đang nghiên cứu là mới hoặc mới đối với người trả lời trong bối cảnh nghiên cứu. (Nunnally, 1978; Peterson, 1994; Stater, 1995). Tiếp theo, những biến có hệ số tương quan giữa các biến và tổng (Item-total correlation) nhỏ hơn 0,3 sẽ bị loại (Nunnally & Burnstein, 1994).
Phương pháp phân tích nhân tố khám phá (EFA)
- Đánh giá độ tin cậy của thang đo bằng hệ số Cronbach’s Alpha:
Khi thực hiện các nghiên cứu định lượng, người nghiên cứu phải sử dụng các loại thang đo lường khác nhau. Việc lượng hố các khái niệm nghiên cứu địi hỏi phải có những thang đo lường được xây dựng cơng phu và phải được kiểm tra độ tin cậy trước khi sử dụng.
Ta thực hiện tính tốn với Cronbach’s Alpha trong chương trình SPSS để đánh giá độ tin cậy của các loại thang đo. Sau khi xử lý dữ liệu cho ra bảng Reliability Statistics, ta dựa vào Cronbach's Alpha có trong bảng để đánh giá.
Khi Cronbach's Alpha từ 0,8 trở lên đến gần 1 thì thang đo lường là tốt; từ 0,7 đến gần 0,8 là sử dụng được. Cronbach's Alpha từ 0,6 trở lên là có thể sử dụng được trong trường hợp khái niệm đang đo lường là mới hoặc mới đối với người trả lời trong quá trình nghiên cứu.
- Thực hiện phân tích nhân tố khám phá (EFA):
Mục đích của phương pháp phân tích này là nhằm nhóm lại các biến có xu hướng tương đương nhau về mặt ý nghĩa. Đầu tiên, ta đặt giả thiết sao cho phù hợp với mục đích ta cần nghiên cứu. Sau đó, ta chạy số liệu với SPSS ta có các bảng cần phải phân tích:
+ Bảng kiểm định Bartlett’s: với mức ý nghĩa đưa ra trước, nếu sig < thì ta bác bỏ giả thiết H0.
+ Bảng ma trận tương quan (Correlation Matrix): ta xem các giá trị gần 0,5 hay lớn hơn 0,5 để ta nhóm lại và phán đốn có khoảng bao nhiêu nhóm nhân tố.
+ Tiếp theo, dựa vào phương sai tổng hợp của từng nhân tố (Eigenvalue): những nhân tố có Eigenvalue >1 mới được đưa vào mơ hình. Đồng thời, số nhân tố được chọn vào mơ hình phải có tổng phương sai tích luỹ giữa hai nhân tố lớn hơn 60%.
+ Và từ bảng ma trận chuẩn hoá (Rotated Component Matrixa) và bảng Component Score Coefficient Matrix, ta có kết quả định tính và định lượng về số nhân tố chung được tạo ra và biến nào ảnh hưởng đến nhân tố chung nhiều hơn.
+ Cuối cùng, bản thân các nhân tố có thể được diễn tả như những kết hợp tuyến tính của các biến quan sát.
Phương trình nhân tố:
Fi = wi1X1 + wi2X2 + ...+ wikXk
Trong đó:
Fi: ước lượng trị số của nhân tố thứ i. wi: trọng số nhân tố thứ i.
k : số biến.
Tiến trình phân tích nhân tố
(Nguồn: tổng hợp của tác giả)
Hình 3.2: Sơ đồ tiến trình phân tích nhân tố
Mơ hình cụ thể như sau:
F = W1 X1 + W2 X2 +...+ W9 X9
Trong đó:
Fi: ước lượng trị số của nhân tố thứ i
F1: thái độ F6: cạnh tranh Xác định vấn đề Xác định số nhân tố Lập ma trận tương quan Xoay nhân tố Xác định mơ hình phù hợp Đặt tên và giải thích nhân tố
F2: chuẩn mực xã hội F7: sự tin tưởng F3: trách nhiệm đạo lý gia đình F8: cảm nhận rủi ro F4: tâm lý địa phương F9: chấp nhận rủi ro F5: kiểm soát hành vi
Wi: trọng số nhân tố K: số biến quan sát, k = 41
Số lượng các nhân tố cơ sở tùy thuộc vào mơ hình nghiên cứu, trong đó chúng ràng buộc nhau bằng cách xoay các vector trực giao nhau để không xảy ra hiện tượng tương quan. Phân tích nhân tố khám phá EFA rất hữu dụng trong bước thực nghiệm ban đầu hay mở rộng kiểm định.
Trong đề tài này, phân tích nhân tố được dùng để tìm ra nhân tố đại diện nhất. Trong q trình phân tích ta phân tích chọn lọc các nhân tố ảnh hưởng đến việc chọn mua vé số.
Phân tích hồi quy logistic
Khi biến phụ thuộc ở dạng nhị phân (biểu hiện 0 và 1) thì khơng thể phân tích với dạng hồi quy thông thường (hồi qui đa biến) mà phải sử dụng hồi quy Logistic. Nhà thống kê học David R.Cox đã phát triển mơ hình có tên Logistic Regression Model (1970s) để phân tích biến phụ thuộc là biến nhị phân. Theo đó, để ước lượng mối quan hệ giữa các biến độc lập (định lượng, định tính) và phụ thuộc (hai trạng thái biểu hiện) được thực hiện thơng qua phân tích hồi qua Logistic. Hồi quy Binary Logistic sử dụng biến phụ thuộc dạng nhị phân để ước lượng xác suất một sự kiện sẽ xảy ra với những thông tin của biến độc lập có được. Phương trình hồi quy Binary Logistic có dạng như sau:
P(Y=1)
Ln[ ]= B0 + B1X1+ B2X2+ … + BkXk P(Y=0)
Trong đó:
Y: Quyết đi ̣nh cho ̣n mua vé số được đo lường bởi 2 giá trị 1 và 0 P(Y=1): Xác suất xảy ra các sự kiện
P(Y=0): Xác suất không xảy ra các sự kiện
Xi ( i = 1, 2, … , k) là các biến độc lập chỉ ra các nhân tố ảnh hưởng đến quyết định chọn mua vé số
βk : Các hệ số hồi qui riêng phần
Các tham số β1, …, βk được tính tốn bằng phần mềm SPSS.
Hồi quy logistic đòi hỏi phải được đánh giá mức độ phù hợp của mơ hình. Để đo lường mức độ phù hợp tổng qt của mơ hình ta dựa vào chỉ tiêu -2LL (-2 log likelihood). -2LL càng nhỏ thì càng tốt, thể hiện mơ hình có ý nghĩa càng cao. Bên cạnh đó, ta dựa vào giá trị Sig., giá trị này phải nhỏ hơn 5%, và tỷ lệ dự báo trúng của mơ hình phải đạt trên 50% thì mơ hình mới có ý nghĩa (Hồng Trọng và Chu Nguyễn Mộng Ngọc, 2008).
Đối với mục tiêu 3: Đề xuất các giải pháp để phát triển việc kinh doanh vé số của Công ty.
Phương pháp phân tích được sử dụng để giải quyết mục tiêu này là phương pháp phân tích tổng hợp. Tổng hợp các yếu tố đã được phân tích để đề ra giải pháp thực hiện mục tiêu này.