Tên quận Tỷ lệ dân số (%) Số mẫu khảo sát Số phường khảo sát Phường khảo sát (bốc thăm ngẫu nhiên)
Tổng 100 500
Quận 1 3,09 15 2 Bến Thành và Cầu Kho. Quận 2 2,32 12 2 An Lợi Đông và An Khánh. Quận 3 3,12 16 2 13 và 8.
Quận 4 3,02 15 2 14 và 2.
Quận 5 2,87 14 2 6 và 8.
Quận 6 4,18 20 2 1 và 3.
Quận 7 4,53 23 3 Tân Hưng, Phú Thuận và Phú Mỹ. Quận 8 6,91 35 4 1, 10, 7 và 11.
Quận 9 4,35 22 3 1, 3 và 8.
Quận 10 3,84 19 2 1 và 14.
Quận 11 3,84 19 2 1 và 8.
Quận 12 7,05 35 4 Đông Hưng Thuận, Tây Hưng Thuận, Thạnh Xuânvà Thạnh Lộc.
Gò Vấp 9,04 45 5 4, 15, 11, 7 và 8. Tân Bình 7,10 36 4 12, 4, 7 và 5.
Tân Phú 6,73 34 4 Sơn Kì, Hiệp Tân, Tây Thạnh và Hịa Thạnh.
Bình Thạnh 7,76 39 4 17, 26, 7 và 12.
Phú Nhuận 2,89 14 2 11 và 9.
Thủ Đức 7,54 38 4 Tam Phú, Linh Xuân, Linh Tây và Linh Chiếu.
Bình Tân 9,82 49 5 Tân Tạo, Bình Trị Đơng A, Bình Hưng Hịa B, An Lạc A và Bình Hưng Hịa A.
Nguồn: Nhóm tác giả tính tốn và tổng hợp
TPHCM bao gồm 19 quận và 5 huyện với dân số và mật độ được thể hiện trong Phụ lục 15. Nhằm tìm ra những nhân tố ảnh hưởng hành vi sử dụng xe buýt của người dân ở TPHCM, nhóm chỉ khảo sát ở 19 quận với số lượng mẫu (n) theo
tỷ lệ dân số của quận. Sốphường trong quận sẽđược tính theo cơng thức 1 1 10 n
với [x] là phần nguyên của x. Cuối cùng, bốc thăm ngẫu nhiên các phường thuộc từng quận theo sốlượng đã tính tốn đểxác định địa điểm khảo sát (xem bảng 3.2).
Để đảm bảo độ chính xác cho dữ liệu điều tra, nhóm phân cơng các thành viên khảo sát trực tiếp các đối tượng theo kế hoạch. Người khảo sát sẽ đọc các câu hỏi trong bảng hỏi cho đáp viên trả lời và sau đó trực tiếp hồn thành bảng hỏi theo phản hồi nhận được từđáp viên hoặc người khảo sát sẽđứng quan sát và hướng dẫn
người được khảo sát hoàn thành bảng hỏi. Nhờ vậy, các thành viên của nhóm có thể
dễ dàng phát hiện các bất hợp lý trong câu trả lời và định hướng lại cho đáp viên điều chỉnh, tránh trường hợp các phiếu bị lỗi. Mặc dù cách khảo sát này tốn nhiều thời gian nhưng theo kinh nghiệm, nhóm đánh giá cách làm này sẽ đảm bảo thông tin chân thực hơn và người trả lời sẽ có trách nhiệm hơn với những thơng tin mà họ
cung cấp.
3.6. Phương pháp phân tích dữ liệu
3.6.1. Đánh giá độ tin cậy thang đo bằng hệ sốCronbach’s Alpha
Cronbach’s Alpha được thực hiện trước để loại các biến rác trước khi thực
hiện phân tích EFA, tránh tạo nên các nhân tố giả khi phân tích EFA (Nguyễn Đình
Thọ, 2011).
Hệ số Cronbach’s Alpha là hệ số kiểm định thống kê về mức độ tin cậy và
tương quan trong giữa các biến quan sát trong thang đo. Hệ số này cho biết sự chặt chẽ và thống nhất trong các câu trả lời nhằm đảm bảo người được hỏi đã hiểu cùng một khái niệm.
Giả sử chúng ta cần đo lường một đại lượng là tổng của K thành phần. Với
1 2 ... K
X Y Y Y , hệ sốCronbach Alpha được định nghĩa như sau: 2 1 2 1 1 i K Y i X K K Với 2 X
là phương sai của tổng số điểm quan sát và 2
i
Y
là phương sai của thành phần thứ i của người hiện tại (Develles R.F., 1991).
Nếu các mục được ghi 0 và 1 thì ta có cơng thức rút gọn:
1 2 1 1 K i i i X PQ K K
Với Pi là tỷ lệ các mục được ghi giá trị là 1 và Qi 1 Pi (Cronbach L.J., 1970).
Phương pháp phân tích hệ số tin cậy Cronbach’s Alpha thỏa mãn một sốđiều kiện nhất định:
- Hệ sốCronbach’s Alpha từ 0,7 trở lên thì thang đo đáng tin cậy và giải thích hiệu quả (Nunnally và Bernstein, 1994). Tuy nhiên, hệ số Cronbach’s Alpha cịn
phụ thuộc vào kích thước mẫu. Cỡ mẫu càng nhỏ thì càng có nhiều khả năng hệ số
Cronbach’s Alpha sẽ không cao do thiếu dữ liệu đểxác định sựtương quan giữa các biến. Trong các trường hợp cỡ mẫu nhỏ thì hệ số Cronbach’s Alpha bằng 0,6 vẫn có thểđược chấp nhận;
- Nếu hệ sốCronbach’s Alpha cao (lớn hơn 0,95) thì có sự đa cộng tuyến cao giữa các biến giải thích. Dawn I. và Adam D. (2003) cho rằng giá trị Cronbach’s
Alpha phải đi kèm với khoảng tin cậy đểđánh giá hiệu quả tin cậy của thang đo;
- Đồng thời, đểthang đo có độ tin cậy cao thì các biến quan sát có tương quan
mạnh với nhau, thể hiện qua chỉ sốtương quan giữa biến – tổng phải lớn hơn 0,3.
3.6.2. Phân tích nhân tố khám phá EFA
EFA là một trong những phương pháp phân tích thống kê để rút gọn một tập
hợp gồm nhiều biến quan sát phụ thuộc lẫn nhau thành một biến (gọi là các nhân tố)
để chúng có ý nghĩa hơn nhưng vẫn chứa đựng hầu hết các thông tin của tập biến
ban đầu (Hair và cộng sự, 1998). Thực tế, một số biến có thểđo trực tiếp như tốc độ, chiều cao, cân nặng…, nhưng bên cạnh đó cũng có những biến khác khơng thể đo
trực tiếp bằng một câu hỏi như tính sáng tạo, hạnh phúc, sự hài lòng, sự thoải
mái,… EFA chính là phương pháp giúp đo lường các biến như vậy.
EFA thuộc nhóm phân tích đa biến phụ thuộc lẫn nhau, nghĩa là khơng có
biến phụ thuộc và biến độc lập mà dựa vào mối tương quan giữa các biến với nhau.
EFA dùng để rút gọn một tập k biến quan sát thành một tập F (F<k) các nhân tố có ý nghĩa hơn dựa vào mối quan hệ tuyến tính của các nhân tố với các biến nguyên thủy (biến quan sát).
Phương pháp EFA địi hỏi mơ hình phải thỏa mãn một sốđiều kiện nhất định. Các biến phải liên quan đến nhau ở một mức độ cao thông qua kiểm định Kaiser –
Meyer – Olkin (KMO) hay kiểm định Bartlett.
Phân tích nhân tốkhám phá EFA thường có 4 bước:
Bước 1: Kiểm định KMO hoặc kiểm định Bartlett
Theo Hair và cộng sự (1998) thì hệ số KMO phải nằm trong [0,5;1] và hệ số ý nghĩa của mơ hình theo kiểm định Barlett phải có ý nghĩa thống kê 5%.
0,5≤ KMO≤ 1: Hệ số KMO là chỉ sốđược dùng để xem xét sự thích hợp của phân tích nhân tố. Trị số KMO lớn có ý nghĩa phân tích nhân tố là thích hợp.
Kiểm định Bartlett có ý nghĩa thống kê (Sig.<0,05) thì các biến quan sát có mối tương quan với nhau trong tổng thể. Đây là một đại lượng thống kê dùng để
xem xét giả thuyết các biến khơng có tương quan trong tổng thể.
Bước 2: Factor extraction
Mục đích của bước này là xác định các nhân tố. Thường thì người ta dùng
phương pháp Principal components analysis để xác định các nhân tố. The 1st
principal component là phức hợp giải thích được nhiều biến thiên nhất trong quần
thể (1stextracted factor), sau đó giảm dần ở nhân tố thứ 2,3,..
Theo tiêu chuẩn Kaiser thì những nhân tố có Eigen value < 1 sẽ bị loại khỏi mơ hình nghiên cứu (Garson, 2002). Tổng phương sai trích phải lớn hơn 50%
(Gerbing và Anderson, 1998) thể hiện phần trăm biến thiên của các biến quan sát.
Bước 3: Factor rotation
Ở bước này các nhân tố được xoay để nó có ý nghĩa hơn. Có nhiều phương
pháp xoay nhân tố, phương pháp Varimax là cách thức được sử dụng phổ biến nhất. Hệ số tải nhân tố hay trọng số nhân tố là chỉ tiêu để đảm bảo mức ý nghĩa
thiết thực của EFA. Điều kiện để phân tích nhân tố khám phá là phải thỏa mãn các yêu cầu như tiêu chuẩn đối với hệ số tải nhân tố phải lớn hơn hoặc bằng 0,5. Các mức giá trị của hệ số tải nhân tố tối thiểu là 0,3; lớn hơn 0,4 là quan trọng; lớn hơn
0,5 là có ý nghĩa thực tiễn. Tiêu chuẩn chọn hệ số tải nhân tố: cỡ mẫu ít nhất là 350 thì hệ số tải nhân tố lớn hơn 0,3; nếu cỡ mẫu khoảng 100 thì lớn hơn 0,55; nếu cỡ
Bước 4: Ra quyết định cuối cùng về số nhân tố cần giữ lại
Tiến hành chọn các nhân tố có ý nghĩa thực tiễn nhất, chọn các nhóm biến có chỉ số lớn cho cùng một nhân tốvà đặt tên cho nhân tốtheo ý nghĩa của biến. Cuối
cùng là lưu nhân sốđại diện cho từng nhóm cho việc chạy hồi quy mơ hình logit.
3.6.3. Mơ hình logit
Mơ hình logit là mơ hình phản ứng nhịphân trong đó xác suất là hàm mật độ
xác suất tích lũy logit, cịn các biến là hàm tuyến tính (Phạm Văn Hùng, 2010). Ta có mơ hình hàm Logistic như sau: P(Y 1) ez z
1 e Vậy xác suất không xảy ra là: P(Y 0) 1 ez z 1 z 1 e 1 e Khi đó: z z z z P(Y 1) e 1 : e P(Y 0) 1 e 1 e
Lấy logarit tự nhiên hai vế: z
0 1 P(Y 1) ln ln e z β β .X P(Y 0)
Đây là dạng hồi quy logit nhị phân, có thể mở rộng cho nhiều biến độc lập.
Nhận xét:
- Zi biến thiên từ -∞ đến +∞ , Pi biến thiên từ0 đến 1 và hàm Ln biến thiên từ
-∞ đến +∞, như vậy Ln không bị giới hạn nhưng Pi thuộc khoảng (0;1). - Piphi tuyến với Xi nhưng Lni tuyến tính với Xi.
Chương trình Eviews sẽ tự động thực hiện việc tính tốn hệ sốthật lẫn hệ số đã được chuyển đổi.
- Diễn dịch các hệ số hồi quy của mơ hình logit nhị phân
Các hệ số hồi quy logit nhịphân có ý nghĩa tương đối khác với hệ số hồi quy
thông thường với các biến phụ thuộc dạng thập phân: P(Y 1) β β .X0 1 e P(Y 0)
Hệ số ước lượng β1 là sự đo lường những thay đổi trong tỷ lệ (được lấy logarit) của các xác suất xảy ra sự kiện với 1 đơn vị thay đổi trong biến độc lậpX. Hệ sốdương làm tăng tỷ lệ xác suất được dựđoán trong khi hệ số âm làm giảm tỷ lệ
xác suất dựđoán. Hệ số hồi qui ước lượng của X1 là β1, do đó nếu các yếu tố khác
khơng đổi thì xác suất xảy ra khi cóX1 gấp eβ1 lần so với trường hợp khác.
- Độ phù hợp của mơ hình được đánh giá bằng:
2 2
UR R
Psedo R = Mc Fadden R = 1 - (LLF / LLF ) - Kiểm định ý nghĩa thống kê của các hệ số:
Hồi quy logit nhị phân cũng đòi hỏi kiểm định giả thuyết hệ số hồi quy khác 0. Trong hồi quy logit, sử dụng kiểm định z để kiểm định giả thuyết H :0 βk 0.
Đặc biệt, trong kết quả của Eviews có cột p-value (Prob), so sánh giá trị này của từng hệ số với mức ý nghĩa α. Nếu p-value của βk< α: bác bỏ giả thuyết H0 tức hệ số βkcó ý nghĩa thống kê và ngược lại.
- Kiểm định ý nghĩa chung của tồn bộ mơ hình:
Có 3 kiểm định được sử dụng để kiểm định sự phù hợp chung của tồn bộ
mơ hình: kiểm định Likelihood, kiểm định Omnibus và kiểm định Hosmer và Lemeshow.
Thứ nhất, đối với kiểm định Likelihood, phần mềm Eviews đã cung cấp giá trị Prob(LR stat) vì vậy nếu Prob(LR stat) < α, tồn tại quan hệ giữa biến phụ thuộc và các biến độc lập trong mơ hình hồi quy logit hay thể hiện độ phù hợp của mơ
hình và ngược lại (Đinh Công Khải, 2011).
Thứ hai, kết quả của kiểm định Omnibus được cung cấp bởi phần mềm SPSS
nhằm kiểm định mức ý nghĩa chung của toàn bộ mơ hình. Trong kiểm định này, giả
thuyết H :0 β β1 2 β3 ... βk 0được sử dụng, tức là lúc này mơ hình khơng phù
hợp. Phần mềm SPSS đã cung cấp giá trị sig. vì vậy nếu sig. < α, tức là bác bỏ giả thuyết H0 hay mơ hình phù hợp với nghiên cứu.
Thứ ba, kiểm định Hosmer và Lemeshow kiểm định liệu có sự khác biệt giữa
giá trị thực tế và giá trị dự báo. Trong kiểm định này, giả thuyết H0: Khơng có sự
khác biệt giữa giá trị thực tế và giá trị dự báo, tức là lúc này mơ hình phù hợp. Phần mềm SPSS đã cung cấp giá trị sig. vì vậy nếu sig. > α, tức là chấp nhận giả thuyết H0 hay mơ hình phù hợp với nghiên cứu.
3.6.4. Phương pháp xử lý số liệu
Nghiên cứu định lượng được thực hiện thông qua phần mềm SPSS 20.0 và
Eviews 8.1. Sau khi đã hoàn thành việc khảo sát chính thức nhóm tiến hành xử lý số
liệu như sau:
Bước 1: Mẫu thu thập được tiến hành phân tích bằng các thống kê mơ tả.
Bước 2: Đánh giá độ tin cậy và giá trị của thang đo đối với các biến ULTI,
SER, SUB, ENVIR và PRIVATE. Hệ số Cronbach’s Alpha được dùng để đánh giá độ tin cậy của thang đo.
Bước 3: Bằng kỹ thuật phân tích nhân tố khám phá EFA, rút gọn một tập k
biến quan sát thành một tập F (F<k) các nhân tố có ý nghĩa hơn, đồng thời bỏ các biến khơng có ý nghĩa, tìm được nhân tố đại diện cho từng nhóm biến để sử dụng cho hồi quy logit.
Bước 4: Chạy mơ hình logit với các biến là các biến đại diện đã tìm được ở
bước 3 và các biến định lượng và nhân khẩu học thu được từ khảo sát. Đầu tiên, nhóm tiến hành lập ma trận hệ sốtương quan giữa các biến để xét sựđa cộng tuyến nhằm phát hiện kịp thời các biến có mối liên hệ với nhau ảnh hưởng đến kết quả hồi quy. Tiếp theo, tiến hành hồi quy logit nhị phân với tất cả các biến độc lập, kiểm
định hệ số hồi quy bằng giá trị p-value, loại bỏ lần lượt các biến có ý nghĩa thấp cho
mơ hình (p-value> 5%) và dùng kiểm định Wald, xem xét các thông sốkhác để đánh giá việc loại biến là có phù hợp hay khơng. Việc này được thực hiện đến khi thu được mơ hình hồi quy với các biến đều có ý nghĩa thống kê ở độ tin cậy 95%.
Sau đó, tiến hành kiểm định mức độ phù hợp, kiểm định ý nghĩa của các hệ số hồi
TÓM TẮT CHƯƠNG 3
Dựa trên cơ sở lý luận trình bày ở chương 2, chương 3 của bài nghiên cứu tập trung làm rõ phương pháp nghiên cứu bao gồm xây dựng mơ hình nghiên cứu
đề nghị, thiết lập dạng hàm nghiên cứu, thiết kế nghiên cứu định tính và định lượng.
Ngồi ra, chương 3 cịn nhấn mạnh đến cách thiết kể bảng hỏi, thang đo các biến số, cách thu thập dữ liệu điều tra và phương pháp xử lý số liệu.
Cụ thể, mơ hình nghiên cứu đề nghị gồm 11 nhân tố được biểu thị bởi 13 biến độc lập. Nhóm tác giả chọn mơ hình ước lượng là mơ hình hồi quy logit, trong
đó có 5 nhóm nhân tố sẽ được phân tích nhân tốkhám phá EFA trước khi chạy hồi
quy logit để tìm nhân số đại diện chung.
Nghiên cứu được tổ chức thơng qua nghiên cứu định tính và nghiên cứu định
lượng. Nghiên cứu định tính được thu thập từ phương pháp quan sát và phỏng vấn nhóm tập trung. Thơng q đó, kết quả của nghiên cứu định tính giúp nhóm tác giả kiểm chứng khung lý thuyết nghiên cứu, phát hiện và bổ sung các yếu tố mới (nếu có) và hỗ trợ xây dựng bảng hỏi sơ bộ. Nghiên cứu định lượng nhằm kiểm định các nhân tố trong mơ hình nghiên cứu đề nghị thơng qua khảo sát điều tra thực tế.
Đểthu được kết quả mang tính chính xác và độ tin cậy cao, nhóm tác giảđã
trình bày cụ thể cách thiết kế bảng hỏi, thang đo các biến số và thực hiện nghiên cứu sơ bộ với cỡ mẫu n=40 trước khi tiến hành nghiên cứu chính thức. Số lượng mẫu khảo sát chính thức là 500 và được chia đều tương ứng với dân số của từng khu