2.2.1 Phƣơng pháp thu thập số liệu
2.2.1.1 Số liệu thứ cấp
Sử dụng số liệu thu thập từ các bài báo, tạp chí, trang web,… đáng tin cậy có liên quan đến Thành phố Cần Thơ, các thông tin về tình hình thương mại điện tử của Việt Nam.
2.2.1.2 Số liệu sơ cấp
Sử dụng số liệu thu thập bằng cách phỏng vấn trực tiếp các khách hàng tại Cần Thơ đã từng mua hàng trực tuyến,theo phương pháp chọn mẫu thuận tiện thông qua bảng câu hỏi.
Kế hoạch thu thập số liệu sơ cấp: - Soạn thảo câu hỏi nghiên cứu. - Chọn mẫu điều tra:
+ Phạm vi lấy mẫu: trên địa bàn Tp. Cần Thơ .
+ Đơn vị tổng thể: khách hàng đã và đang mua hàng trực tuyến
+ Thang đo được sử dụng là thang đo Likert năm mức độ thông dụng trong khảo sát ý kiến, với một trung điểm để thu thập có tính trung lập cao.
Ý nghĩa giá trị trung bình đối với thang đo Likert
20
Bảng 2.1 Ý nghĩa của từng giá trị trung bình
Giá trị trung bình Ý nghĩa
1,00 - 1,80 Rất không đồng ý/ Rất không hài lòng/ Rất không quan trọng 1,81 - 2,26 Không đồng ý/ Không hài lòng/ Không quan trọng
2,61 - 3,40 Không ý kiến/ Trung bình 3,41 - 4,20 Đồng ý/ Hài lòng/ Quan trọng
4,21 - 5,00 Rất đồng ý/ Rất hài lòng/ Rất quan trọng (Nguồn: Lưu Thanh Đức Hải)
2.2.2 Xác định cỡ mẫu
Có nhiều cách để xác định cỡ mẫu, tùy thuộc vào từng nghiên cứu và các điều kiện về thời gian, chi phí, nhân lực,… mà các nhà nghiên cứu sẽ chọn một cỡ mẫu phù hợp và có khả năng đại diện cho tổng thể cao nhất, cho kết quả tốt nhất.
Công thức tính cỡ mẫu tương quan với tổng thể
Thông thường, các nghiên cứu trong thực tế nhà nghiên cứu mặc nhiên sử dụng cỡ mẫu bằng hoặc lớn hơn 100 mà không cần tính toán cỡ mẫu vì cỡ mẫu này đã thuộc mẫu lớn đảm bảo cho tính suy rộng. Tuy nhiên, một vấn đề nảy sinh trong thực tế là cỡ mẫu cũng sẽ phụ thuộc vào độ lớn của tổng thể. Nếu N càng lớn thì cỡ mẫu cũng phải nhiều hơn.
Ta có công thức tính cỡ mẫu tương quan với tổng thể:
1 / 1 1 0 0 n N n c n (2.1) Trong đó:
+ n(c): là cỡ mẫu tương quan với tổng thể.
+ n0: là cỡ mẫu chưa tính tương quan với tổng thể (thường lấy chuẩn là 100). + 1+(1/N)( n0 – 1): là hệ số điều chỉnh
Theo bảng cỡ mẫu tương quan với tổng thể thì với tổng thể từ 10.000 đến 1.000.000 sẽ có cỡ mẫu đã điều chỉnh là 100. ( Lưu Thanh Đức Hải)
Công thức tính cỡ mẫu theo độ tin cậy
Bên cạnh đó ta cũng có công thức tính cỡ mẫu theo độ tin cậy và tỉ lệ sai số như sau: 2 2 / 2 * 1 MOE p p n (2.2)
21
Trong đó: + n : là cỡ mẫu
+ p = 0,5 vì V = p(1-p) max p = 0,5
+ Độ tin cậy là 95% hay /2 = 0,025 = 1,96 + MOE: tỷ lệ sai số
Trong thực tế, dữ liệu biến động cao nhất khi p=0,5; sai số cho phép là 10%; độ tin cậy là 95% (hay =5%) hay Z=1,96
Từ các giá trị có được, ta có: 96 ) 96 , 1 ( ) 1 , 0 ( ) 5 , 0 1 ( 5 , 0 2 2 n
Vậy cỡ quan sát tối thiểu phù hợp với đề tài này là 96. Cụ thể trong bài nghiên cứu của tác giả chọn số mẫu gấp 6 lần số biến độc lập. Trong nghiên cứu có tất cả 20 biến ảnh hưởng đến quyết định mua hàng trực tuyến của người tiêu dùng nên sẽ có cỡ mẫu là 20*6 = 120. Dựa trên cơ sở này cỡ mẫu mà tác giả lựa chọn sẽ là 120 (tương ứng với 120 khách hàng được phỏng vấn) vì cỡ mẫu này thuộc mẫu lớn đảm bảo cho tính suy rộng
2.2.3 Phƣơng pháp phân tích số liệu
Số liệu sau khi thu thập sẽ được xử lý bằng phần mềm SPSS 15.0 và các mục tiêu sẽ sử dụng những phương pháp cụ thể sau:
Dùng phương pháp phân tích tần số, thống kê mô tả để nói lên thực trạng mua hàng trực tuyến của người dân TPCT.
Sử dụng phương pháp phân tích bảng chéo để phân tích quyết định của người tiêu dùng. Sau đó hệ số Cronbach Alpha và phương pháp phân tích nhân tố khám phá EFA (exploratory factor analysis) được sử dụng để đánh giá các yếu tố có ảnh hưởng đến quyết định mua. Cuối cùng sử dụng phân tích hồi quy Logistic để ước lượng mức độ ảnh hưởng của các yếu tố đến quyết định mua của người mua hàng trực tuyến trên địa bàn Cần Thơ.
Dựa vào kết quả nghiên cứu suy luận diễn giải và đưa ra các giải pháp nhằm hoàn thiện và nâng cao chất lượng dịch vụ của các nhà kinh doanh trực tuyến qua đó làm tích cực hơn trong quyết định và thỏa mãn của khách hàng khi tham gia mua hàng online của người dân Cần Thơ.
2.2.3.1 Phương pháp thống kê mô tả (Deseriptive Statistics)
Thống kế là tổng hợp các phương pháp lý thuyết và ứng dụng vào lĩnh vực kinh tế bằng cách rút ra những kết luận dựa trên những số liệu và thông tin thu thập được.
22
Thống kê mô tả là một trong hai chức năng chính của thống kê (thống kê mô tả và thống kê ứng dụng). Thống kê mô tả là tập hợp tất cả các phương pháp đo lường, mô tả và trình bày số liệu bằng các phép tính và các chỉ số thống kê thông thường như số trung bình (Mean), số trung vị (Median), phương sai (Variance), độ lệch chuẩn (standar deviation)… cho các biến số liên tục và các tỷ số (Proportion) cho các biến số không liên tục. Trong phương pháp thống kê mô tả, các đại lượng thống kê mô tả chỉ được tính đối với các biến định lượng.
Một số khái niệm:
- Giá trị trung bình (Mean, Average): bằng tổng các giá trị biến quan sát chia cho số quan sát.
- Số trung vị (Median, kí hiệu Me): là giá trị của biến đứng giữa của một dãy số đã được sắp xếp theo thứ tự tăng dần hay giảm dần. Số trung vị chia dãy số làm 2 phần, mỗi phần có số quan sát bằng nhau.
- Mode (kí hiệu là Mo): là giá trị có tần xuất hiện cao nhất trong tổng số hay trong dãy số phân phối.
- Phương sai: là trung bình giữa bình phương các độ lệch giữa các biến và trung bình của các biến
- Độ lệch chuẩn: là căn bậc hai của phương sai
2.2.3.2 Phương pháp phân tích tần số
Phương pháp phân tích tần số là một trong những công cụ thống kê mô tả được sử dụng để mô tả và tìm hiểu về đặc tính phân phối của một số mẫu số liệu thô nào đó.
Trong phạm vi nghiên cứu này phương pháp phan tích tần số được đưa ra nhằm đo lường cả biến định lượng và định tính dưới dạng đếm số lần xuất hiện, để mô tả một số biến liên quan đến đặc tính nhân khẩu học của đối tượng được phỏng vấn như giới tính, trình độ học vấn, tuổi tác,… Ngoài ra, phương pháp này cũng được sử dụng để mô tả và tìm hiểu một số biến số có ảnh hưởng đến hành vi tiêu dùng của người tiêu dùng như sản phẩm thường mua, nơi mua sắm hay tần suất mua sắm,… Phương pháp này giúp chúng ta có cái nhìn tổng thể về một đặc tính nào đó của mẫu điều tra.
2.2.3.3 Phân tích bảng chéo (Cross-Tabulation)
Phân tích bảng chéo dùng để kiểm định mối quan hệ giữa các biến định tính với nhau bằng cách dùng kiểm định Chi-bình phương (Chi-square). Bảng phân tích Cross-tabulation hai biến còn được gọi là bảng tiếp liên (Contigency table) mỗi ô trong bảng chứa đựng sự kết hợp phân loại của hai biến. Việc phân tích các biến theo cột hay theo hàng là tùy thuộc vào việc biến đó được xem xét như là biến độc lập hay biến phụ thuộc. Thông thường khi xử lý, biến xếp theo cột là biến độc lập
23
và biến xếp theo hàng là biến phụ thuộc. Trong phân tích Cross - Tabulation, ta cũng cần quan tâm đến giá trị kiểm định. Ở đây phân phối “chi bình phương” cho phép ta kiểm định mối quan hệ giữa các biến.
Các giả thuyết trong kiểm định có nội dung sau: - H0: Không có mối quan hệ giữa các biến. - H1: Có mối quan hệ giữa các biến.
Giá trị kiểm định x bình phương trong kết quả phân tích sẽ cung cấp mức ý nghĩa của kiểm định (P_value). Nếu mức ý nghĩa này nhỏ hơn hoặc bằng alpha (mức ý nghĩa phân tích ban đầu) thì kiểm định hoàn toàn có ý nghĩa, hay nói cách khác bác bỏ giả thuyết H0, nghĩa là các biến có liên hệ với nhau. Ngược lại thì các biến không có liên hệ với nhau.
Kiểm định Cronbach Alpha
Hệ số Cronbach Alpha được sử dụng trước để loại bỏ các biến quan sát không đạt yêu cầu hay các thang đo chưa đạt yêu cầu trong quá trình nghiên cứu. Tính hệ số Cronbach Alpha được thực hiện đối với mỗi nhóm biến kết cấu nên các nhân tố. Hệ số Cronbach alpha cho biết sự tương đối đồng nhất trong đo lường theo các biến có nội dung gần gũi với nhau và đã hình thành nên một nhân tố. Các biến quan sát có hệ số tương quan biến - tổng nhỏ hơn 0,3 sẽ bị loại bỏ vả tiêu chuẩn để chọn thang đo khi nó có độ tin cậy alpha từ 0,6 trở lên. Sau khi độ tin cậy đạt yêu cầu dùng phương pháp phân tích nhân tố để xác định đâu là những tiêu chí quan trọng nhất mà người tiêu dùng quan tâm.
2.2.3.4 Phương pháp phân tích nhân tố EFA
Phân tích nhân tố là tên chung của một nhóm các thủ tục được sử dụng chủ yếu nên để thu nhỏ và tóm tắt các dữ liệu. Trong nghiên cứu, chúng ta thu thập được một số lượng biến lớn và hầu hết các biến có mối liên hệ với nhau và số của chúng phải được giảm xuống đến một số lượng mà chúng ta có thể sử dụng được. Liên hệ giữa các nhóm biến có liên hệ lại lẫn nhau được xem xét và trình bày dưới dạng một số ít các nhân tố cơ bản.
Phân tích nhân tố được sử dụng trong các trường hợp sau:
- Nhận diện các khía cạnh hay nhân tố giải thích được các liên hệ tương quan trọng một tập hợp biến.
- Nhận diện các khía cạnh hay nhân tố giải thích được các liên hệ tương quan trong một tập hợp biến.
- Nhận diện một tập hợp gồm một số lượng biến mới tương đối ít không có tương quan với nhau để thay thế tập hợp biến gốc có tương qua với nhau để thực hiện một phân tích đa biến tiếp theo sau ( như hồi quy hay phân tích biệt số).
24
- Để nhận ra một tập hợp gồm một số ít các biến nổi trội từ một tập hợp nhiều biến để sử dụng trong các phân tích đa biến kế tiếp. Phân tích nhân tố còn có vô số ứng dung trong lĩnh vực nghiên cứu kinh tế và xã hội.
Khi phân tích nhân tố khám phá, các nhà nghiên cứu thường quan tâm đến một số tiêu chuẩn như:
- Thứ nhất, hệ số KMO (Kaiser – Meyer - Olkin) ≥ 0,5, mức ý nghĩa của kiểm định Bartlett ≤ 0,05. (KMO là một chỉ tiêu dùng để xem xét sự thích hợp của EFA, 0,5 ≤ KMO ≤ 1 thì phân tích nhân tố là thích hợp. Kiểm định Bartlett xem xét giả thuyết về độ tương quan giữa các biến quan sát bằng không trong tổng thể. Nếu kiểm định này có ý nghĩa tống kê (Sig ≤ 0,05) thì các biến quan sát có tương quan với nhau trong tổng thể ( Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005, tr.262).
- Thứ 2, hệ số tài nhân tố (Factor loading) ≥ 0,5. Nếu biết quan sát nào có hệ số tài nhân tố < 0,5 sẽ bị loại. (Theo Hair & ctg 1998, tr.111) Factor loading là chỉ tiêu để đảm bảo mức ý nghĩa thiết thực của EFA (ensuring practical significance). Factor loading > 0,3 được xem là đạt mức tối thiểu, Factor loading > 0,4 được xem là quan trọng, Factor loading ≥ 0,5 được xem là có ý nghĩa thực tiễn, Hair & ctg (1998, tr.111) cũng khuyên bạn đọc như sau: nếu chọn tiêu chuẩn factor loading > 0,3 thì cỡ mẫu của bạn ít nhất là 350, nếu cỡ mẫu của bạn khoảng 100 thì nên chọn tiêu chuẩn factor loading > 0,55 , nếu cỡ mẫu của bạn khoảng 50 thì factor loading phải > 0,75.
- Thứ ba, thang đo được chấp nhận khi tổng phương sai trích ≥ 50%.
- Thứ tư là hệ số eigenvalue có giá trị lớn hơn 1 (Trần Đức Long, 2006, tr.47) trích từ Gerbing & Anderson (1998), “An update paradigm for scale development incorporing unidimensionality and its assessments”, Journal of marketing research, Vol.25, tr.186 - 192)
- Tiêu chuẩn thứ năm, là khác biệt hệ số tài nhân tố của một biến quan sát giữa các nhân tố ≥ 0,3 để đảm bảo giá trị phân biệt giữa các nhân tố (Bùi Nguyên Hùng & Võ Khánh Toàn (2005) trích từ Jabnoun & Al-Tamimi (2003) “Measuring perceived service quality at UAE commercial banks”, International Journal of quality and reliability management, (20) ,4).
Kiểm định chi bình phƣơng (Chi - square): được sử dụng trong nghiên cứu này để kiểm định mối liên hệ giữa thu nhập và số tiền chi trung bình…
Kiểm định Chi square (CMIN): biểu thị mức độ phù hợp tổng quát của toàn bộ mii hình tại mức ý nghĩa 5% (Joserkog và Sorbom, 1989). Trong các nghiên cứu thuộc lĩnh vực khoa học xã hội, tất cả các mối quan hệ nhân quả đề nghị có độ tin cậy ở mức 95% (p = 0,005) (Cohen, 1988). Nghĩa là, với độ tin cậy là 95% ta không thể bác bỏ giá thuyết H0 (giả thuyết mô hình tốt). Tuy nhiên, kiểm định này có nhược điểm là phụ thuộc vào kích thước mẫu.
25
Chi tiêu Chi - square theo bậc tự do (CMIN/df): trong thực tế, nếu cỡ mẫu < 200 thì chỉ này phải < 3. Như vậy mô hình được xem là phù hợp (Kettinger và Lee, 1995).
Các chỉ số liên quan khác: để đánh giá độ phù hợp của mô hình lý thuyết so với dữ liệu thực tế thị trường, tác giả dựa trên 3 chỉ số quan trọng sau:
- Chỉ số TLI > 0,9. - Chỉ số CFI > 0,9. - Chỉ số RMSEA < 0,08.
2.2.3.5 Hồi quy Logistic
Mô hình hồi quy xác suất (Logistic) nhị nguyên (Binary Logistic)
Hồi quy Logistic nhị nguyên sử dụng biến phụ thuộc dạng nhị phân để ước lượng xác suất một sự kiện sẽ xảy ra với những thông tin của biến độc lập mà ta có được. Ví dụ sản phẩm mới được chấp nhận hay không? Người vay trả được nợ hay không? Mua hay không mua?... Những biến nghiên cứu có 2 biểu hiện như vậy gọi là biến thay phiên, 2 biểu hiện này sẽ được mã hóa thành 2 giá trị 0 và 1 và ở dưới dạng này gọi là biến nhị phân. Khi biến phụ thuộc ở dạng nhị phân thì nó không thể được nghiên cứu với dạng hồi quy thông thường vì nó sẽ xâm phạm các giả định, khi biến phụ thuộc chỉ có 2 biểu hiện thì thật không phù hợp khi giả định rằng phần dư có phân phối chuẩn mà thay vào đó nó sẽ có phân phối nhị thức.
Với hồi quy Binary Logistic, thông tin chúng ta cần thu thập về biến phụ thuộc là một sự kiện nào đó có xảy ra hay không, biến phụ thuộc Y lúc này có 2 giá trị 0 và 1, với 0 là không xảy ra sự kiện ta quan tâm và 1 là có xảy ra. Từ biến phụ thuộc nhị phân này, một thủ tục sẽ được dùng để dự đoán xác suất xảy ra sự kiện (Pi) theo quy tắc nếu xác suất được dự đoán lớn hơn 0,5 thì kết quả dự đoán sẽ cho là “có” xảy ra sự kiện, ngược lại thì kết quả dự đoán sẽ cho là “không”.
Hồi quy Binary Logistic cũng đòi hỏi phải đánh giá độ phù hợp của mô hình. Khác với mô hình hồi quy tuyến tính, thông thường hệ số R2 càng lớn thì mô hình càng phù hợp, hồi quy Binary Logistic sử dụng chỉ tiêu -2LL (-2 log likelihood) để đánh giá độ phù hợp của mô hình, -2LL càng nhỏ càng thể hiện độ phù hợp cao. Ngoài ra, khả năng giải thích biến phụ thuộc của tổ hợp biến độc lập cũng được xem xét thông qua kiểm định Chi bình phương.
Ta có mô hình hàm Binary Logistic như sau: