Tên quận Tỷ lệ dân số (%) Số mẫu khảo sát Số phường khảo sát Phường khảo sát (bốc thăm ngẫu nhiên)
Tổng 100 500
Quận 1 3,09 15 2 Bến Thành và Cầu Kho. Quận 2 2,32 12 2 An Lợi Đông và An Khánh. Quận 3 3,12 16 2 13 và 8.
Quận 4 3,02 15 2 14 và 2. Quận 5 2,87 14 2 6 và 8. Quận 6 4,18 20 2 1 và 3.
Quận 7 4,53 23 3 Tân Hưng, Phú Thuận và Phú Mỹ. Quận 8 6,91 35 4 1, 10, 7 và 11.
Quận 9 4,35 22 3 1, 3 và 8. Quận 10 3,84 19 2 1 và 14. Quận 11 3,84 19 2 1 và 8.
Quận 12 7,05 35 4 Đông Hưng Thuận, Tây Hưng Thuận, Thạnh Xuân và Thạnh Lộc.
Gò Vấp 9,04 45 5 4, 15, 11, 7 và 8. Tân Bình 7,10 36 4 12, 4, 7 và 5.
Tân Phú 6,73 34 4 Sơn Kì, Hiệp Tân, Tây Thạnh và Hịa Thạnh. Bình Thạnh 7,76 39 4 17, 26, 7 và 12.
Phú Nhuận 2,89 14 2 11 và 9.
Thủ Đức 7,54 38 4 Tam Phú, Linh Xuân, Linh Tây và Linh Chiếu. Bình Tân 9,82 49 5 Tân Tạo, Bình Trị Đơng A, Bình Hưng
Hịa B, An Lạc A và Bình Hưng Hịa A.
Nguồn: Nhóm tác gi tính tốn và t ng hả ổ ợp TPHCM bao g m 19 qu n và 5 huy n v i dân s và mồ ậ ệ ớ ố ật độ được th hiể ện trong Phụ ụ l c 15. Nh m tìm ra nh ng nhân tằ ữ ố ảnh hưởng hành vi s d ng xe buýt ử ụ của người dân ở TPHCM, nhóm chỉ khảo sát ở 19 quận với số lượng m u (n) theo ẫ
tỷ l dân s c a qu n. Sệ ố ủ ậ ố phường trong qu n sậ ẽ được tính theo cơng thức 1 1 10 n
với [x] là ph n nguyên c a x. Cu i cùng, bầ ủ ố ốc thăm ngẫu nhiên các phường thuộc từng qu n theo s ậ ố lượng đã tính tốn để xác định địa điểm khảo sát (xem bảng 3.2).
Để đả m bảo độ chính xác cho dữ liệu điều tra, nhóm phân cơng các thành viên kh o sát tr c tiả ự ếp các đối tượng theo k hoế ạch. Người kh o sát sả ẽ đọc các câu hỏi trong b ng hả ỏi cho đáp viên trả ời và sau đó trự l c ti p hồn thành b ng h i theo ế ả ỏ phản h i nhồ ận đượ ừ đáp viên hoặc người khảc t o sát sẽ đứng quan sát và hướng d n ẫ người được khảo sát hoàn thành bảng hỏi. Nhờ vậy, các thành viên của nhóm có thể dễ dàng phát hi n các b t h p lý trong câu tr lệ ấ ợ ả ời và định hướng lại cho đáp viên điều chỉnh, tránh trường hợp các phiếu bị lỗi. Mặc dù cách khảo sát này t n nhiố ều thời gian nhưng theo kinh nghiệm, nhóm đánh giá cách làm này sẽ đảm bảo thông tin chân thực hơn và người tr l i s có trách nhiả ờ ẽ ệm hơn với nh ng thông tin mà h ữ ọ cung cấp.
3.6. Phương pháp phân tích dữ liệu
3.6.1. Đánh giá độ tin cậy thang đo bằng hệ số Cronbach’s Alpha
Cronbach’s lpha đượA c thực hiện trước để loại các biến rác trước khi thực hiện phân tích EFA, tránh t o nên các nhân tạ ố gi khi phân tích EFA (Nguyả ễn Đình Thọ, 2011).
Hệ s Cronbachố ’s Alpha là h s kiệ ố ểm định th ng kê v mố ề ức độ tin c y và ậ tương quan trong giữa các biến quan sát trong thang đo. Hệ số này cho biết sự chặt chẽ và th ng nh t trong các câu tr l i nhố ấ ả ờ ằm đảm bảo người được hỏi đã hiểu cùng một khái niệm.
Giả s chúng ta cử ần đo lường một đại lượng là t ng c a K thành ph n. Vổ ủ ầ ới
1 2 ... K
X Y Y Y , h s ệ ố Cronbach Alpha được định nghĩa như sau:
2 1 2 1 1 i K Y i X K K Với 2 X
là phương sai của tổng số điểm quan sát và 2
i Y
là phương sai của thành phần thứ i của người hiện t i (Develles R.F., 1991). ạ
Nếu các mục được ghi 0 và 1 thì ta có cơng thức rút gọn:
1 2 1 1 K i i i X PQ K K
Với Pi là t l các mỷ ệ ục được ghi giá tr là 1 và ị Qi 1 Pi (Cronbach L.J.,
1970).
Phương pháp phân tích hệ số tin cậy Cronbach’s Alpha thỏa mãn một số điều kiện nhất định:
- Hệ số Cronbach’s Alpha từ 0,7 trở lên thì thang đo đáng tin cậy và gi i thích ả hiệu qu (Nunnally và Bernstein, 1994). Tuy nhiên, h sả ệ ố Cronbach’s Alpha cịn phụ thuộc vào kích thước mẫu. Cỡ mẫu càng nhỏ thì càng có nhiều khả năng hệ số Cronbach’s Alpha sẽ không cao do thiếu dữ liệu để xác định sự tương quan giữa các biến. Trong các trường hợp cỡ mẫu nhỏ thì hệ số Cronbach’s Alpha bằng 0,6 vẫn có thể được chấp nh n; ậ
- Nếu h sệ ố Cronbach’s Alpha cao (lớn hơn 0,95) thì có sự đa cộng tuy n cao ế giữa các bi n gi i thích. Dawn I. và Adam D. (2003) cho r ng giá trế ả ằ ị Cronbach’s Alpha phải đi kèm với khoảng tin cậy để đánh giá hiệu quả tin cậy của thang đo;
- Đồng thời, để thang đo có độ tin c y cao thì các biậ ến quan sát có tương quan mạnh với nhau, th hi n qua chể ệ ỉ s ố tương quan giữa biế – ổn t ng ph i lả ớn hơn 0,3.
3.6.2. Phân tích nhân t khám phá EFA ố
EFA là m t trong nhộ ững phương pháp phân tích thống kê để rút g n m t tọ ộ ập hợp g m nhi u bi n quan sát phồ ề ế ụ thuộ ẫc l n nhau thành m t bi n (g i là các nhân tộ ế ọ ố) để chúng có ý nghĩa hơn nhưng vẫn chứa đựng hầu hết các thông tin của tập biến ban đầu (Hair và cộng sự, 1998). Thực tế, một số biến có thể đo trực tiếp như tốc độ, chiều cao, cân nặng…, nhưng bên cạnh đó cũng có những bi n khác khơng thế ể đo trực ti p b ng m t câu hế ằ ộ ỏi như tính sáng tạo, h nh phúc, s hài lòng, sạ ự ự thoải mái,… EFA chính là phương pháp giúp đo lường các biến như vậy.
EFA thuộc nhóm phân tích đa biến phụ thuộ ẫn nhau, nghĩa là khơng có c l biến phụ thuộc và biến độ ậc l p mà d a vào mự ối tương quan giữa các bi n vế ới nhau. EFA dùng để rút gọn một tập k biến quan sát thành một tập F (F<k) các nhân tố có ý nghĩa hơn dựa vào mối quan hệ tuyến tính của các nhân tố với các biến nguyên thủy (bi n quan sát). ế
Phương pháp EFA địi hỏi mơ hình phải thỏa mãn mộ ốt s điều kiện nhất định. Các bi n phế ải liên quan đến nhau m t mở ộ ức độ cao thông qua kiểm định Kaiser – Meyer Olkin (KMO) hay ki– ểm định Bartlett.
Phân tích nhân tố khám phá EFA thường có 4 bước: Bước 1: Kiểm định KMO hoặc kiểm định Bartlett
Theo Hair và c ng s (1998) thì h s KMO ph i n m trong [0,5;1] và h s ộ ự ệ ố ả ằ ệ ố ý nghĩa của mơ hình theo kiểm định Barlett phải có ý nghĩa thống kê 5%.
0,5≤ KMO≤ 1: Hệ số KMO là chỉ số được dùng để xem xét sự thích hợp của phân tích nhân t . Tr số ị ố KMO lớn có ý nghĩa phân tích nhân tố là thích h p. ợ
Kiểm định Bartlett có ý nghĩa thống kê (Sig.<0,05) thì các biến quan sát có mối tương quan với nhau trong tổng thể. Đây là một đại lượng thống kê dùng để xem xét gi thuy t các biả ế ến khơng có tương quan trong tổng th ể.
Bước 2: Factor extraction
Mục đích của bước này là xác định các nhân tố. Thường thì người ta dùng phương pháp Principal components analysis để xác định các nhân tố. The 1st principal component là ph c h p giứ ợ ải thích được nhi u bi n thiên nh t trong quề ế ấ ần thể (1stextracted factor), sau đó giảm d n nhân t ầ ở ố ứ 2,3,.. th
Theo tiêu chu n Kaiser thì nh ng nhân t có ẩ ữ ố Eigen value < 1 s bẽ ị loại khỏi mơ hình nghiên c u (Garson, 2002). Tứ ổng phương sai trích phả ớn hơn 50% i l (Gerbing và Anderson, 1998) thể hiện phần trăm biến thiên c a các bi n quan sát. ủ ế
Bước 3: Factor rotation
Ở bước này các nhân tố được xoay để nó có ý nghĩa hơn. Có nhiều phương pháp xoay nhân tố, phương pháp Varimax là cách thức được sử ụ d ng ph bi n nh ổ ế ất.
Hệ s t i nhân t hay tr ng s nhân t là chố ả ố ọ ố ố ỉ tiêu để đảm b o mả ức ý nghĩa thiết th c cự ủa EFA. Điều kiện để phân tích nhân t khám phá là ph i th a mãn các ố ả ỏ yêu cầu như tiêu chuẩn đố ới v i h s t i nhân t ph i lệ ố ả ố ả ớn hơn hoặc b ng 0,5. Các ằ mức giá trị của h s t i nhân t t i thi u là 0,3; lệ ố ả ố ố ể ớn hơn 0,4 là quan trọng; lớn hơn 0,5 là có ý nghĩa thực tiễn. Tiêu chuẩn chọn hệ số tải nhân tố: cỡ mẫu ít nhất là 350 thì h s t i nhân t lệ ố ả ố ớn hơn 0,3; nếu c m u kho ng 100 thì lỡ ẫ ả ớn hơn 0,55; nếu c ỡ mẫu kho ng 50 thì lả ớn hơn 0,75 (Hair và cộng s , 1998). ự
Bước 4: Ra quyết định cu i cùng về số nhân tố c n giố ầ ữ lại
Tiến hành ch n các nhân tọ ố có ý nghĩa thực ti n nh t, ch n các nhóm bi n có ễ ấ ọ ế chỉ ố ớ s l n cho cùng m t nhân tố ộ và đặt tên cho nhân tố theo ý nghĩa của biến. Cuối cùng là lưu nhân số i diđạ ện cho từng nhóm cho vi c chạy hồi quy mơ hình logit. ệ
3.6.3. Mơ hình logit
Mơ hình logit là mơ hình ph n ng nhả ứ ị phân trong đó xác suất là hàm mật độ xác suất tích lũy logit, cịn các biến là hàm tuy n tính (Phế ạm Văn Hùng, 2010).
Ta có mơ hình hàm Logistic như sau:
z z e P(Y 1) 1 e Vậy xác su t không x y ra là: ấ ả z z z e 1 P(Y 0) 1 1 e 1 e Khi đó: z z z z P(Y 1) e 1 : e P(Y 0) 1 e 1 e
Lấy logarit t nhiên hai vự ế: z
0 1 P(Y 1) ln ln e z β β .X P(Y 0)
Đây là dạng hồi quy logit nhị phân, có thể mở rộng cho nhiều biến độc lập.
Nhận xét:
- Zi biến thiên t -ừ ∞ đến +∞ , Pi biến thiên từ 0 đến 1 và hàm Lnbiến thiên từ -∞ đến +∞, như vậy Ln không bịgiới hạn nhưng Pi thuộc khoảng (0;1).
- Piphi tuyến v i ớ Xi nhưng Lni tuyến tính với Xi.
Chương trình Eviews sẽ tự động th c hi n việc tính tốn h sự ệ ệ ốthậ ẫt l n h sệ ố đã được chuyển đổi.
- Diễn d ch các h s h i quy c a mơ hình logit nh phân ị ệ ố ồ ủ ị
Các h s h i quy logit nhệ ố ồ ị phân có ý nghĩa tương đối khác với hệ ố ồ s h i quy
thông thường v i các biến ph thuộc dạng thập phân: ớ ụ P(Y 1) β0 β .X1 e P(Y 0)
Hệ số ước lượng β1 là sự đo lường những thay đổi trong t lỷ ệ (được lấy logarit) c a các xác su t x y ra s ki n vủ ấ ả ự ệ ới 1 đơn vị thay đổi trong bi n c l pế độ ậ X. Hệ số dương làm tăng tỷ lệ xác suất được dự đoán trong khi hệ số âm làm giảm tỷ lệ
xác su t dấ ự đoán. Hệ ố ồi qui ước lượ s h ng của X là 1 β1, do đó nếu các yếu tố khác khơng đổi thì xác suất xảy ra khi cóX g p 1 ấ eβ1 l n so vầ ới trường h p khác. ợ
- Độ phù hợp của mơ hình được đánh giá bằng:
2 2
UR R
Psedo R = Mc Fadden R = 1 - (LLF / LLF ) - Kiểm định ý nghĩa thống kê của các hệ số:
Hồi quy logit nh phân cị ũng đòi hỏi kiểm định gi thuy t h s h i quy khácả ế ệ ố ồ 0 . Trong h i quy logit, s d ng kiồ ử ụ ểm định z để kiểm định gi thuyả ết H :β0 k0. Đặc biệt, trong kết quả của Eviews có cột p-value (Prob), so sánh giá tr này của ị từng h sệ ố với mức ý nghĩa α. Nếu p-value của βk< α: bác bỏ giả thuyết H t c h 0 ứ ệ số βkcó ý nghĩa thống kê và ngược lại.
- Kiểm định ý nghĩa chung của tồn bộ mơ hình:
Có 3 kiểm định được s dử ụng để kiểm định s phù h p chung c a toàn b ự ợ ủ ộ mơ hình: kiểm định Likelihood, kiểm định Omnibus và kiểm định Hosmer và Lemeshow.
Thứ nhất, đối với kiểm định Likelihood, ph n m m Eviews ầ ề đã cung cấp giá trị Prob(LR stat) vì vậy nếu Prob(LR stat) < α ồn tại quan hệ giữa biến phụ , t thuộc và các biến độc l p trong mơ hình h i quy logit hay th hiậ ồ ể ện độ phù h p c a mơ ợ ủ hình và ngượ ại (Đinh Cơng Khảc l i, 2011).
Thứ hai, k t qu cế ả ủa kiểm định Omnibus được cung c p b i ph n m m SPSS ấ ở ầ ề nhằm kiểm định mức ý nghĩa chung của toàn bộ mơ hình. Trong kiểm định này, gi ả thuyết H :β0 1β2β3 ... βk0được sử dụng, tức là lúc này mơ hình khơng phù hợp. Phần mềm SPSS đã cung cấp giá trị sig. vì v y nậ ếu sig. < α, tức là bác b gi ỏ ả thuyết H0 hay mơ hình phù hợp với nghiên c u. ứ
Thứ ba, kiểm định Hosmer và Lemeshow kiểm định liệu có sự khác biệt giữa giá trị thự ếc t và giá tr d báo. Trong kiị ự ểm định này, gi thuy t H : Khơng có s ả ế 0 ự khác bi t gi a giá trệ ữ ị thự ếc t và giá tr d báo, t c là lúc này mơ hình phù h p. ị ự ứ ợ Phần mềm SPSS đã cung cấp giá trị sig. vì v y n u ậ ế sig. > α, ức là t chấp nh n gi thuyậ ả ết H0 hay mơ hình phù h p vợ ới nghiên c u. ứ
3.6.4. Phương pháp xử lý số liệu
Nghiên cứu định lượng được th c hi n thông qua ph n m m SPSS 20.0 và ự ệ ầ ề Eviews 8.1. Sau khi đã hoàn thành việc khảo sát chính thức nhóm tiến hành xử lý số liệu như sau:
Bước 1: M u thu thẫ ập được tiến hành phân tích b ng các th ng kê mơ t . ằ ố ả Bước 2: Đánh giá độ tin cậy và giá tr cị ủa thang đo đố ới v i các bi n ULTI, ế
SER, SUB, ENVIR và PRIVATE. H sệ ố Cronbach’s Alpha được dùng để đánh giá
độ tin cậy của thang đo.
Bước 3: Bằng kỹ thuật phân tích nhân t khám phá EFA, rút g n m t t p k ố ọ ộ ậ biến quan sát thành một t p F (F<k) các nhân tậ ố có ý nghĩa hơn, đồng thời b các ỏ biến khơng có ý nghĩa, tìm được nhân tố đại diện cho từng nhóm biến để sử dụng cho hồi quy logit.
Bước 4: Chạy mơ hình logit v i các bi n là các biớ ế ến đại diện đã tìm được ở bước 3 và các biến định lượng và nhân khẩu học thu đượ ừ khảo sátc t . Đầu tiên, nhóm ti n hành l p ma tr n h sế ậ ậ ệ ố tương quan giữa các biến để xét sự đa cộng tuyến nhằm phát hi n kệ ịp th i các bi n có m i liên h vờ ế ố ệ ới nhau ảnh hưởng đến k t qu hế ả ồi quy. Ti p theo, ti n hành h i quy logit nh phân v i t t c các biế ế ồ ị ớ ấ ả ến độ ậc l p, kiểm định hệ số hồi quy bằng giá tr p-value, loại bỏ lị ần lượt các biến có ý nghĩa thấp cho mơ hình (p-value> 5%) và dùng kiểm định Wald, xem xét các thông số khác để đánh giá việc loại biến là có phù hợp hay khơng. Việc này được thực hiện đến khi thu được mơ hình hồi quy v i các biớ ến đều có ý nghĩa thống kê ở độ tin cậy 95%. Sau đó, tiến hành kiểm định mức độ phù hợp, kiểm định ý nghĩa của các hệ số hồi quy và đọc kết quả thu được.
TÓM T T Ắ CHƯƠNG 3
Dựa trên cơ sở lý luận trình bày ở chương 2, chương 3 của bài nghiên cứu tập trung làm rõ phương pháp nghiên cứu bao gồm xây dựng mơ hình nghiên cứu đề ngh , thiết lập dạng hàm nghiên cứu, thiết kế nghiên cị ứu định tính và định lượng. Ngồi ra, chương 3 còn nhấn mạnh đến cách thiết kể bảng hỏi, thang đo các biến số, cách thu thập d ữliệu điều tra và phương pháp xử lý sốliệu.
Cụ thể, mơ hình nghiên cứu đề ngh g m 11 nhân tị ồ ố được bi u th b i 13 ể ị ở