Nghiên cứu định lượng được thực hiện thông qua phương pháp phỏng vấn các khách hàng đang sử dụng dịch vụ xe buýt tại Nghệ An.
2.3.1. Mẫu nghiên cứu
Bảng câu hỏi tự trả lời đã được sử dụng để thu thập thông tin cần nghiên cứu trong đề tài này. Việc phát bảng câu hỏi được thực hiện bởi chính tác giả.
Xác định kích thước mẫu là công việc khá phức tạp bởi hiện tại có quá nhiều quan điểm khác nhau. Nhiều nhà nghiên cứu đòi hỏi có kích thước mẫu lớn vì nó dựa vào lý thuyết phân phối mẫu lớn (Raykov & Widaman, 1995). Tuy nhiên, kích thước mẫu bao nhiêu là lớn thì hiện nay chưa xác định rõ ràng. Hơn nữa, kích thước mẫu còn tùy thuộc phương pháp ước lượng sử dụng. Nếu sử dụng phương pháp ước lượng ML3 thì kích thước mẫu tối thiểu phải từ 100 đến 150 mẫu (Hair & ctg, 1983), hay ít nhất là 200 mẫu (Hoelter). Bollen (1989) cho rằng kích thước mẫu tối thiểu là 5 mẫu cho một tham số ước lượng [Nguyễn Đình Thọ, Nguyễn Thị Mai Trang, 2007] hay 15 mẫu cho một biến [Phạm Đức Kỳ, Bùi Nguyên Hùng, 2007]. Tuy nhiên, số lượng mẫu cũng xác định trên số lượng tổng thể nghiên cứu (bằng 1/10 qui mô mẫu) [Nguyễn Viết Lâm, 2007].
Theo kinh nghiệm, nguyên tắc chọn mẫu là = số biến * 5 là số mẫu tối thiểu. Như vậy cỡ mẫu của nghiên cứu này là 230 (46 biến * 5). Tuy nhiên, xét thấy cỡ mẫu thực tế là rất lớn, hầu như người dân đã từng sử dụng dịch vụ xe buýt. Nên tác giả đã phát tổng cộng 300 phiếu. Kết quả thu về có 250 phiếu đạt yêu cầu chiếm tỷ lệ 83%.
2.3.2. Phương pháp thu thập số liệu
Bản câu hỏi được phát trực tiếp cho các khách hàng để họ trả lời và gửi lại cho tác giả sau khoảng một tuần. Người được hỏi không cần để lại danh tính trên bản câu hỏi, đảm bảo rằng các câu trả lời là thẳng thắn, khách quan và có độ tin cậy cao.
2.3.3. Phương pháp phân tích số liệu
2.3.3.1. Phương pháp phân tích độ tin cậy của thang đo
Những mục hỏi đo lường cùng một khái niệm tiềm ẩn thì phải có mối liên quan với những cái còn lại trong nhóm đó. Hệ số của Cronbach là một phép kiểm định thống kê về mức độ chặt chẽ mà các mục hỏi trong thang đo tương quan với nhau.
Công thức của hệ số Cronbach Alpha là: = N/[1 + (N – 1)]
Trong đó: là hệ số tương quan trung bình giữa các mục hỏi.
Phương pháp này cho phép người phân tích loại bỏ các biến không phù hợp và hạn chế các biến rác trong quá trình nghiên cứu và đánh giá độ tin cậy của thang đo bằng hệ số thông qua hệ số Cronbach alpha. Những biến có hệ số tương quan biến tổng (item-total correlation) nhỏ hơn 0.3 sẽ bị loại. Thang đo có hệ số Cronbach alpha từ 0.6 trở lên là có thể sử dụng được trong trường hợp khái niệm đang nghiên cứu mới (Nunnally, 1978; Peterson, 1994; Slater, 1995). Thông thường, thang đo có Cronbach
alpha từ 0.7 đến 0.8 là sử dụng được. Nhiều nhà nghiên cứu cho rằng khi thang đo có độ tin cậy từ 0.8 trở lên đến gần 1 là thang đo lường tốt.
2.3.3.2. Phương pháp thống kê mô tả
a. Khái niệm thống kê mô tả
Thống kê mô tả được sử dụng để mô tả những đặc tính cơ bản của dữ liệu thu thập được từ nghiên cứu thực nghiệm qua các cách thức khác nhau. Thống kê mô tả cung cấp những tóm tắt đơn giản về mẫu và các thước đo. Cùng với phân tích đồ họa đơn giản, chúng tạo ra nền tảng của mọi phân tích định lượng về số liệu. Bước đầu tiên để mô tả và tìm hiểu về đặc tính phân phối của một bảng số liệu thô là lập bảng phân phối tần số. Sau đó, sử dụng một số hàm để làm rõ đặc tính của mẫu phân tích. Để hiểu được các hiện tượng và ra quyết định đúng đắn, cần nắm được các phương pháp cơ bản của mô tả dữ liệu. Có rất nhiều kỹ thuật hay được sử dụng, có thể phân loại các kỹ thuật này như sau:
- Biểu diễn dữ liệu bằng đồ họa trong đó các đồ thị mô tả dữ liệu hoặc giúp so sánh dữ liệu;
- Biểu diễn dữ liệu thành các bảng số liệu tóm tắt về dữ liệu;
- Thống kê tóm tắt (dưới dạng các giá trị thống kê đơn nhất) mô tả dữ liệu. b. Các đại lượng thống kê mô tả
- Mean: Số trung bình cộng. - Sum: Tổng cộng.
- Std.deviation: Độ lệch chuẩn.
- Minimum, maximum: Giá trị nhỏ nhất, giá trị lớn nhất. - df: Tần số.
- Std error: Sai số chuẩn.
- Median: Là lượng biến của tiêu thức của đơn vị đứng ở vị trí giữa trong dãy số lượng biến, chia số lượng biến thành hai phần (phần trên và phần dưới) mỗi phần có cùng một số đơn vị bằng nhau.
- Mode: Là biểu hiện của tiêu thức được gặp nhiều nhất trong tổng thể hay trong dãy phân phối. Trong dãy lượng biến, mode là lượng biến có tần số lớn nhất.
2.3.3.3. Phương pháp phân tích nhân tố khám phá EFA
a.. Khái niệm
Phân tích nhân tố khám phá là kỹ thuật được sử dụng nhằm thu nhỏ và tóm tắt các dữ liệu sau khi đã đánh giá độ tin cậy của thang đo bằng hệ số Cronbach alpha và loại đi các biến không đảm bảo độ tin cậy. Trong nghiên cứu, chúng ta có thể thu thập được một số lượng biến khá lớn và hầu hết các biến này có liên hệ với nhau và số lượng của chúng phải được giảm bớt xuống đến một số lượng mà chúng ta có thể sử dụng được. Liên hệ giữa các nhóm biến có liên hệ qua lại lẫn nhau được xem xét và trình bày dưới dạng một số ít các nhân tố cơ bản. Vì vậy, phương pháp này rất có ích cho việc xác định các tập hợp biến cần thiết cho vấn đề nghiên cứu và được sử dụng để tìm mối quan hệ giữa các biến với nhau.
b. Mô hình phân tích nhân tố
Về mặt tính toán, phân tích nhân tố hơi giống phân tích hồi quy bội ở chỗ mỗi biến được biểu diễn như là một kết hợp tuyến tính của các nhân tố cơ bản. Lượng biến thiên của một biến được giải thích bởi những nhân tố chung trong phân tích gọi là communality. Biến thiên chung của các biến được mô tả bằng một số ít các nhân tố chung cộng với một nhân tố đặc trưng cho mỗi biến. Những nhân tố này không bộc lộ rõ ràng.
Nếu các biến được chuẩn hóa thì mô hình nhân tố được thể hiện bằng phương trình:
Xi = Ai1F1 + Ai2F2 + Ai3F3 + … + AimFm+ViUi
Trong đó:
Xi: biến thứ i được chuẩn hóa.
Aim: Hệ số hồi quy bội chuẩn hóa của nhân tố m đối với biến i. Fi: Nhân tố chung.
Vi: Các hệ số hồi quy chuẩn hóa của nhân tố đặc trưng i đối với biến i. Ui : Nhân tố đặc trưng của biến i.
m: Số nhân tố chung.
Các nhân tố đặc trưng có tương quan với nhau và với các nhân tố chung. Bản thân các nhân tố chung cũng có thể diễn tả như những kết hợp tuyến tính của các biến quan sát:
Trong đó:
Fi: Ước lượng trị số của nhân tố thứ i. Wi : Quyền số hay trọng số nhân tố. k: Số biến.
Chúng ta có thể chọn các quyền số hay trọng số nhân tố sao cho nhân tố thứ nhất giải thích được phần biến thiên nhiều nhất trong toàn bộ biến thiên. Sau đó ta chọn một tập hợp các quyền số thứ hai sao cho nhân tố thứ hai giải thích được phần lớn biến thiên còn lại và không có tương quan với nhân tố thứ nhất.
Nguyên tắc này được áp dụng như vậy để tiếp tục chọn quyền số cho các nhân tố tiếp theo. Do vậy, các nhân tố được ước lượng sao cho các quyền số của chúng, không giống như các giá trị của các biến gốc, là không tương quan với nhau. Hơn nữa, nhân tố thứ nhất giải thích được nhiều nhất biến thiên của dữ liệu, nhân tố thứ hai giải thích được nhiều thứ nhì…
c. Các tham số trong phân tích nhân tố:
- Barlett' test of sphericity: Đại lượng Bartlett là một đại lượng thống kê dùng để xem xét giả thiết các biến không có tương quan trong tổng thể. Nói cách khác, ma trận tương quan tổng thể là một ma trận đồng nhất, mỗi biến tương quan hoàn toàn với chính nó nhưng không tương quan với các biến khác.
- Correlation matrix: Cho biết hệ số tương quan giữa tất cả các cặp biến trong phân tích.
- Communality: Là lượng biến thiên của một biến được giải thích chung với các biến khác được xem xét trong phân tích.
- Eigenvalue: Đại diện cho phần biến thiên được giải thích bởi mỗi nhân tố. Chỉ những nhân tố có eigenvalue lớn hơn 1 thì mới được giữ lại trong mô hình. Đại lượng eigenvalue đại diện cho lượng biến thiên được giải thích bởi nhân tố .Những nhân tố có eigenvalue nhỏ hơn 1 sẽ không có tác dụng tóm tắt thông tin tốt hơn một biến gốc.
- Factorloading: Là những hệ số tương quan đơn giữa các biến và các nhân tố.
- Factor matrix: Chứa các hệ số tải nhân tố của tất cả các biến đối với các nhân tố được rút ra.
- Kaiser- Meyer-Olkin (KMO): Trong phân tích nhân tố, trị số KMO là chỉ số dùng để xem xét sự thích hợp của phân tích nhân tố. Trị số KMO phải có giá trị trong
khoảng từ 0.5 đến 1 thì phân tích này mới thích hợp, còn nếu như trị số này nhỏ hơn 0.5 thì phân tích nhân tố có khả năng không thích hợp với các dữ liệu.
- Percentage of variance: phần trăm phương sai toàn bộ được giải thích bởi từng nhân tố. Nghĩa là coi biến thiên là 100% thì giá trị trị này cho biết phân tích nhân tố cô đọng được bao nhiêu phần trăm.
2.3.3.4. Phân tích hồi quy
a. Định nghĩa
Phân tích hồi quy là nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc hay biến được giải thích) vào một hay nhiều biến khác (biến độc lập hay biến giải thích) với ý tưởng cơ bản là ước lượng hay dự đoán giá trị trung bình của biến phụ thuộc trên cơ sở đã biết của biến độc lập.
b. Các giả định khi xây dựng mô hình hồi quy Mô hình hồi quy có dạng:
Yi = B0+ B1 X1i+ B2 X2i+…+ Bn Xni + ei
Các giả định quan trọng khi phân tích hồi quy tuyến tính
- Giả thiết 1: Giả định liên hệ tuyến tính.
- Giả thiết 2: Phương sai có điều kiện không đổi của các phần dư. - Giả thiết 3: Không có sự tương quan giữa các phần dư.
- Giả thiết 4: Không xảy ra hiện tượng đa cộng tuyến. - Giả thiết 5: Giả thiết về phân phối chuẩn của phần dư. c. Xây dựng mô hình hồi quy
Các bước xây dựng mô hình:
Bước 1: Xem xét ma trận hệ số tương quan
Để xem xét mối quan hệ giữa biến phụ thuộc và các biến độc lập thông qua xây dựng ma trận tương quan. Đồng thời ma trận tương quan là công cụ xem xét mối quan hệ giữa các biến độc lập với nhau nếu các biến này có tương quan chặt thì nguy cơ xảy ra hiện tượng đa cộng tuyến cao dẫn đến việc vi phạm giả định của mô hình.
Bước 2: Đánh giá độ phù hợp của mô hình
Thông qua hệ số R2 ta đánh giá độ phù hợp của mô hình xem mô hình trên giải thích bao nhiêu % sự biến thiên của biến phụ thuộc.
TSS
R2 =
Trong đó:
ESS: tổng bình phương tất cả các sai lệch giữa giá trị dự đoán của Yi và giá trị trung bình của chúng.
TSS: tổng bình phương sai lệch giữa giá trị Yi và giá trị trung bình của chúng. Khi đưa càng nhiều biến vào mô hình thì hệ số này càng cao. Tuy nhiên, R2 ở hồi quy bội không phản ánh đúng sự phù hợp của mô hình như trong mô hình hồi quy đơn. Lúc này, ta phải sử dụng R2 điều chỉnh để đánh giá sự phù hợp của mô hình.
Bước 3: Kiểm định sự phù hợp của mô hình
Sử dụng kiểm định F để kiểm định với giả thiết Ho: B1 = B2 = Bn = 0
Nếu giả thiết này bị bác bỏ thì ta có thể kết luận mô hình ta xây dựng phù hợp với tập dữ liệu.
Bước 4: Xác định tầm quan trọng của các biến
Ý tưởng đánh giá tầm quan trọng tương đối của các biến độc lập trong mô hình thông qua xem xét mức độ tăng của R2 khi một biến giải thích được đưa thêm vào mô hình. Nếu mức độ thay đổi này mà lớn thì chứng tỏ biến này cung cấp thông tin độc nhất về sự phụ thuộc mà các biến khác trong phương trình không có được. Ta đánh giá tầm quan trọng của một biến thông qua hai hệ số:
Hệ số tương quan từng phần: căn bậc hai của R2 change. Thể hiện mối tương quan giữa biến Y và X mới đưa vào. Tuy nhiên, sự thay đổi của R2 không thể hiện tỉ lệ phần biến thiên mà một mình biến đó có thể giải thích. Lúc này, ta sử dụng hệ số tương quan riêng bằng căn bậc 2 của , với:
Bước 5: Lựa chọn biến cho mô hình
Đưa nhiều biến độc lập vào mô hình hồi quy không phải lúc nào cũng tốt vì những lý do sau (trừ khi chúng có tương quan chặt với biến phụ thuộc):
- Mức độ tăng R2 quan sát không hẳn phản ảnh mô hình hồi quy càng phù hợp hơn với tổng thể.
- Đưa vào các biến không thích đáng sẽ làm tăng sai số chuẩn của tất cả các ước lượng mà không cải thiện được khả năng dự đoán.
- Mô hình nhiều biến thì khó giải thích và khó hiểu hơn mô hình ít biến. Ta sử dụng SPSS để giải quyết vấn đề trên. Các thủ tục chọn biến trên SPSS: Phương pháp đưa vào dần, phương pháp loại trừ dần, phương pháp từng bước (là sự kết hợp của hai phương pháp loại trừ dần và đưa vào dần).
Bước 6: Dò tìm sự vi phạm các giả các giả thiết (đã nêu ở trên bằng các xử lý của SPSS). Ngoài ra, sử dụng phân tích chi bình phương một mẫu để tìm ra quy luật phân phối của mẫu và đánh giá độ tin cậy của thang đo thông qua hệ số Cronbach Alpha.
CHƯƠNG 3: KẾT QUẢ NGHIÊN CỨU