3.3.1. Tổng thể nghiên cứu
Khảo sát được tiến hành tại hai thành phố lớn là Hà Nội và Thành phố Hồ Chí Minh, số lượng mẫu khảo sát sẽ được chia đều cho hai khu vực. Đối tượng nghiên cứu là những người trong độ tuổi từ 22 đến 60 tuổi, có hiểu biết về mua hàng trực tuyến và có hoạt động mua thực phẩm tươi ít nhất một lần trong hai tuần gần nhất tại thời điểm khảo sát. Lý do tác giả đưa ra điều kiện chọn mẫu như vậy vì đây là những đối tượng có nhiều khả năng sẽ quan tâm đến vấn đề mua thực phẩm tươi trực tuyến từ đó sẽ đưa ra những ý kiến đánh giá thiết thực và có ý nghĩa hơn cho nghiên cứu.
3.3.2. Xác định cỡ mẫu
Kích thước mẫu càng lớn thì độ chính xác của kết quả nghiên cứu càng cao, tuy nhiên, do hạn chế về nguồn lực nên tác giả chỉ lựa chọn một kích thước mẫu phù hợp. Việc xác định cỡ mẫu cho phân tích thống kê có thế áp dụng rất nhiều công thức, trong đó có hai công thức rất quan trọng dùng để xác định cỡ mẫu tối thiểu giúp cho nghiên cứu có độ tin cậy cao. Hai công thức này dựa theo yêu cầu của phân tích nhân tố khám phá EFA và hồi quy đa biến. Công thức thứ nhất áp dụng cho mô hình nghiên cứu sử dụng phương pháp phân tích nhân tố khám phá EFA, Hair và cộng sự (2009)
cho rằng kích thước mẫu tối thiểu là gấp 5 lần tổng số biến quan sát. Công thức thứ hai áp dụng cho mô hình nghiên cứu sử dụng phân tích hồi quy đa biến, theo Tabachnick và Fidell (1996), cỡ mẫu tối thiều cần được tính theo công thức n = 50 + 8m, trong đó m là số biến độc lập trong mô hình.
Dựa vào hai công thức trên, tác giả chọn cỡ mẫu là n = 250, cỡ mẫu này vừa đảm bảo cho phân tích nhân tố EFA (5 x 32 = 160) và phân tích hồi quy tuyến tính đa biến (50 + 8 x 6) = 98. Nguyên tắc lựa chọn kích thước mẫu là sẽ lấy dư hơn mức tối thiểu để phòng trừ trường hợp hao hụt có thể xảy ra trong quá trình khảo sát.
3.3.3. Phương pháp chọn mẫu và thu thập dữ liệu
Do sự hạn chế về thời gian và nguồn lực, tác giả lựa chọn mẫu theo phương pháp phi xác suất và phương pháp chọn mẫu thuận tiện. Phương pháp này lấy mẫu phi ngẫu nhiên và dựa trên mức độ thuận tiện để tiếp cận đối tượng nhất có thể. Cụ thể đối với nghiên cứu này, tác giả tiến hành khảo sát tại các trung tâm mua sắm, siêu thị, cửa hàng tiện lợi và các cao ốc văn phòng làm việc tại các khu vực trung tâm ở Hà Nội và Tp. Hồ Chí Minh. Thời gian tiến hành khảo sát được dàn trải nhằm mục đích thu được một tập hợp mẫu có tính đa dạng nhất, giúp tăng khả năng đại diện cho tổng thể của mẫu nghiên cứu.
3.4. Phương pháp phân tích dữ liệu
Quy trình tiến hành phân tích dữ liệu như sau:
Bước 1: Xử lý dữ liệu. Sau khi thu nhận các bảng khảo sát, tác giả tiến hành gạn lọc loại bỏ các bảng khảo sát không đạt yêu cầu, làm sạch dữ liệu và mã hoá dữ liệu vào phần mềm SPSS 22.0.
Bước 2: Thống kê mô tả dữ liệu
Bước 3: Phân tích độ tin cậy thang đo bằng Cronbach’s Alpha Bước 4: Phân tích nhân tố khám phá EFA
Bước 5: Phân tích tương quan Pearson Bước 6: Phân tích hồi quy tuyến tính đa biến
3.4.1. Thống kê mô tả
Mẫu thu thập được từ khảo sát sẽ được tổng hợp, phân tích và tóm tắt lại theo các đặc trưng bao gồm: giới tính, độ tuổi, nghề nghiệp và chi phí mua thực phẩm tươi trung bình mỗi ngày.
3.4.2. Đánh giá độ tin cậy thang đo bằng hệ số Cronbach’s Alpha
Tác giả sử dụng phương pháp nhất quán nội tại qua hệ số Cronbach’s Alpha để đánh giá độ tin cậy của thang đo, phương pháp này được sử dụng trước để loại bỏ các biến không phù hợp bởi vì các biến này có thể tạo ra các yếu tố giả khi phân tích EFA (Nguyễn Đình Thọ, 2013).
Phương pháp đánh giá độ tin cậy này được chạy cho từng nhân tố kể cả nhân tố độc lập, mục tiêu là tìm ra các biến quan sát có cùng đo lường cho một khái niệm hay không tuy nhiên không xác định được biến nào cần giữ lại và biến nào cần loại bỏ. Do đó, muốn biết biến quan sát nào đóng góp nhiều hơn thì quan sát hệ số tương quan biến – tổng để loại bỏ những biến rác không giải thích nhiều cho khái niệm cần đo. Theo nghiên cứu của Nguyễn Đình Thọ năm 2013, tiêu chí đánh giá để chấp nhận một biến quan sát là hệ số Cronbach’s Alpha từ 0,6 đến 0,95 và đồng thời hệ số tương quan biến tổng lớn hơn 0,3. Các biến có hệ số tương quan biến tổng nhỏ hơn 0,3 sẽ bị xem là biến rác và hiển nhiên phải bị loại khỏi thang đo (Hoàng Trọng và Chu Mộng Ngọc, 2008).
3.4.3. Phân tích nhân tố khám phá EFA
Phương pháp phân tích nhân tố khám phá EFA (Exploratary Factor Analysis) giúp chúng ta đánh giá hai loại giá trị quan trọng của một thang đo là giá trị hội tụ và giá trị phân biệt. Phân tích nhân tố khám phá dùng để rút gọn một tập hợp các biến quan sát thành một tập hợp các biến quan sát chính có ý nghĩa hơn giúp tiết kiệm thời gian và kinh phí của người nghiên cứu. Tập hợp được rút gọn này sẽ ít nhân tố hơn nhưng sẽ có ý nghĩa hơn và vẫn chứa đựng hết nội dung thông tin của tập biến ban đầu. Các tiêu chí trong phân tích nhân tố khám phá EFA bao gồm:
Hệ số KMO (Kaiser Meyer Olkin) là chỉ số có tác dụng xem xét sự phù hợp của phân tích nhân tố. Điều kiện đủ để phân tích nhân tố phù hợp là giá trị của hệ số KMO phải không nhỏ hơn 0,5. Hệ số KMO càng lớn thì càng tốt và lớn hơn 0,9 là rất tốt.
Kiểm định Bartlett là kiểm định dùng để xem xét các biến quan sát trong cùng một nhân tố có tương quan với nhau hay không, hay nói cách khác là ma trận tương quan có phải là ma trận đơn vị hay không. Kiểm định này có ý nghĩa thống kê khi sig Bartlett Test nhỏ hơn 0,05.
Trị số Eigenvalue là trị số được sử dụng để xác định số lượng nhân tố trong phân tích nhân tố khám phá EFA, theo tiêu chí này, chỉ có những nhân tố nào có trị số Eigenvalue lớn hơn hoặc bằng 1 mới được giữ lại trong mô hình.
Tổng phương sai trích (Total Variance Explained) phải lớn hơn hoặc bằng 50% thì mô hình EFA mới là phù hợp và từ 60% trở lên thì sẽ tốt hơn.
Bảng 3.2: Giá trị của hệ số tải nhân tố để biến quan sát có ý nghĩa thống kê
Nguồn: Hướng dẫn sử dụng SPSS 20
Hệ số tải nhân tố (Factor Loading) là hệ số thể hiện mối quan hệ tương quan giữa biến quan sát với nhân tố. Hệ số tải nhân tố càng cao thì tương quan giữa biến quan sát đó với nhân tố càng nhiều và ngược lại. Điều kiện tối thiểu để giữ lại biến quan sát là hệ số tải nhân tố phải không nhỏ hơn 0,3, nếu hệ số lớn hơn 0,5 là biến quan sát có ý nghĩa thống kê tốt và lớn hơn 0,7 là biến quan sát có ý nghĩa thống kê rất tốt. Tuy nhiên với từng khoảng kích thước mẫu khác nhau thì mức trọng số nhân
Giá trị của hệ số tải nhân
tố (Factor Loading) Kích thước mẫu tối thiểu có ý nghĩa thống kê
0,30 350
0,35 250
0,40 200
0,45 150
tố để biến quan sát có ý nghĩa thống kê cũng khác nhau được thể hiện cụ thể qua bảng dưới đây.
Khi phân tích nhân tố EFA cho các biến độc lập cần lưu ý phải phân tích cùng một lúc vì nếu phân tích riêng cho từng thang đo sẽ không đạt được giá trị phân biệt hay không thấy được sự hội tụ của tập hợp các biến quan sát.
3.4.4. Phân tích tương quan Pearson
Phân tích tương quan Pearson thường được thực hiện trước khi phân tích hồi quy tuyến tính, nhằm mục đích kiểm tra mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc và các biến độc lập đồng thời kiểm tra sự tương quan giữa các biến độc lập với nhau để nhận diện vấn đề đa cộng tuyến. Hệ số tương quan Pearson càng tiến về 1 thì tương quan giữa các biến càng mạnh. Dấu hiệu nhận biết đa cộng tuyến có thể xảy ra là giá trị sig tương quan giữa các biến độc lập nhỏ hơn 0,05 và giá trị tương quan Pearson lớn hơn 0,4.
3.4.5. Phân tích hồi quy tuyến tính đa biến
Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), phân tích hồi quy tuyến tính đa biến cho ta biết mức độ ảnh hưởng của từng biến độc lập lên biết phụ thuộc. Cụ thể các trị số cần chú ý như sau:
Kiểm định giả thuyết mô hình
Để đánh giá sự phù hợp của mô hình hồi quy, hệ số xác định R2 (R-square) hiệu chỉnh sẽ được sử dụng. R2 hiệu chỉnh càng tiến về 1 thì mô hình hồi quy càng có ý nghĩa hay càng phù hợp với tập dữ liệu thu thập được, ngược lại R2 hiệu chỉnh càng tiến về 0 thì mô hình càng kém phù hợp. Sau đó, xem bảng phân tích phương sai ANOVA để xem xét mức độ phù hợp của mô hình hồi quy tổng thể. Điều kiện để kết luận mô hình hồi quy là phù hợp với tổng thể là xác suất F (sig. F) phải nhỏ hơn 0,05 (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008).
Bên cạnh đó, cần phải xem xét đến hiện tượng đa cộng tuyến của mô hình, tức là hiện tượng các biến độc lập có tính tương quan chặt chẽ lẫn nhau. Nếu giá trị VIF > 10 thì có thể kết luận có hiện tượng đa công tuyến (Hoàng Trọng & Chu Nguyễn
Mộng Ngọc, 2008). Tuy nhiên, các nghiên cứu thực tế thường so sánh VIF với 2, nếu hệ số phóng đại phương sai nhỏ hơn 2, chứng tỏ không có hiện tượng đa cộng tuyến.
Đánh giá mức độ tác động của các biến độc lập đến biến phụ thuộc
Sau cùng là xem xét hệ số hồi quy β (regression coefficient) để đánh giá mức độ tác động của các biến độc lập lên biến phụ thuộc cũng như chiều hướng tác động là tích cực (hệ số Beta dương) hay tiêu cực (hệ số Beta âm). Biến độc lập nào có hệ số hồi quy lớn hơn thì có thể nhận xét rằng biến đó có mức độ ảnh hưởng cao hơn các biến độc lập khác trong mô hình nghiên cứu. Ngoài ra, chúng ta có thể xem xét hệ số R bình phương (R square) và trị số p (p value). Biến độc lập nào có R bình phương càng lớn thì mốt quan hệ giữa biến đó và biến phụ thuộc càng chặt chẽ, đồng thời biến độc lập có trị số p (value) càng nhỏ thì mức ảnh hưởng của nó càng mạnh.
Sơ kết Chương 3
Trong Chương 3, tác giả đã trình bày quy trình các bước thực hiện nghiên cứu. Dựa trên các nhân tố đã lựa chọn ở Chương 2, các thang đo ở những nghiên cứu trước đó và bổ sung của mình, tác giả thiết kế bảng hỏi với thang đo Likert 5 điểm để phục vụ cho việc khảo sát thu thập dữ liệu. Sau khi khảo sát thử nghiệm và hiệu chỉnh bảng hỏi, tác giả tiến hành khảo sát và thu thập dữ liệu bằng bảng hỏi chính thức. Dữ liệu thu thập sẽ được phân tích bằng phần mềm SPSS với các kỹ thuật kiểm định độ tin cậy Cronbach’s Alpha, phân tích nhân tố khám phá EFA, phân tích tương quan Pearson, phân tích hồi quy và kiểm định giả thuyết nghiên cứu. Kết quả phân tích sẽ được tác giả trình bày trong chương tiếp theo.
CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU 4.1. Mô tả mẫu nghiên cứu
Tác giả tiến hành phát và thu thập 250 bảng hỏi để khảo sát ở các siêu thị và các cửa hàng thực phẩm tươi, sau đó gạn lọc ra 206 phiếu hợp lệ và đưa vào phân tích chính thức bằng phần mềm SPSS 22.0.
4.1.1. Phân loại mẫu theo giới tính
Theo dữ liệu thu thập từ 206 phiếu khảo sát hợp lệ, có 61 phiếu khảo sát là nam chiếm tỷ lệ 29,61% và 145 phiếu khảo sát là nữ chiếm 70,39%. Sự chênh lệch này là hợp lý đối với thị trường Việt Nam, trong hầu hết các gia đình thông thường phụ nữ sẽ là người phụ trách việc đi chợ mua thực phẩm tươi và nấu cơm, và đồng thời khi tác giả tiến hành khảo thực tế và trong quá trình gạn lọc người để làm khảo sát ngẫu nhiên đa số nam giới sẽ từ chối làm khảo sát vì họ cho rằng mình không có nhiều kinh nghiệm trong việc mua thực phẩm tươi.
Bảng 4.1: Phân loại mẫu theo giới tính
Đơn vị: người STT Giới tính Số lượng Tỷ lệ 1 Nam 61 29,61% 2 Nữ 145 70,39% Tổng cộng 206 100% Nguồn: Tác giả tổng hợp
4.1.2. Phân loại mẫu theo độ tuổi
Trong dữ liệu thu thập được, có 81 người tiêu dùng thuộc nhóm 30-39 tuổi (38,94%) chiếm tỷ lệ cao nhất, tiếp theo lần lượt là nhóm 64 người thuộc độ tuổi từ 22-29 tuổi (30,77%) và nhóm 46 người từ 40-49 tuổi (22,12%), cuối cùng là nhóm từ 50 tuổi trở lên (7,21%) với 15 người. Điều này cho thấy đa số những người tiêu dùng trẻ tuổi (22-39 tuổi) là những người quan tâm đến việc mua thực phẩm tươi trực tuyến nhiều hơn. Trong khi đó, nhóm người trên 50 chiếm tỷ lệ không nhiều, do họ là những
người đã rất quen thuộc với việc đi chợ truyền thống, có người bán hàng quen và đồng thời cũng ít tiếp xúc với những thiết bị công nghệ.
Biểu đồ 4.1: Phân loại mẫu theo độ tuổi
Nguồn: Tác giả tổng hợp
4.1.3. Phân loại mẫu theo nghề nghiệp
Biểu đồ 4.2: Phân loại mẫu theo nghề nghiệp
Nguồn: Tác giả tổng hợp
Nội trợ 10.19%
Nhân viên văn phòng 55.34% Kinh doanh tự do 20.39% khác 14.08% 22-29 tuổi, 30.77% 30-39 tuổi, 38.94% 40-49 tuổi, 22.12% Từ 50 tuổi trở lên7.21%
Theo dữ liệu thống kê, phần lớn người được khảo sát là nhân viên làm văn phòng với 114 người (55,34%) chiếm tỷ lệ khá cao, điều này cho thấy nhân viên văn phòng là đối tượng khách hàng tiềm năng cho ngành kinh doanh thực phẩm trực tuyến. Nguyên nhân là do nữ giới từ 22-39 tuổi ở các thành phố lớn đa số nghề nghiệp là nhân viên văn phòng, đồng thời đây cũng là đối tượng có sự hiểu biết về công nghệ. Tỷ lệ đứng thứ hai cũng là những người có xu hướng tiêu dùng trực tuyến hiện đại làm nghề kinh doanh tự do chiếm 20,39%, ngành nghề khác (bác sỹ, kỹ sư, giáo viên,…) chiếm 14,08%. Cuối cùng là nội trợ với tỷ lệ 10,19%, do họ là những người đi chợ hàng ngày và ít quan tâm đến vấn đề mua thực phẩm tươi trực tuyến.
4.1.4. Phân loại mẫu theo chi phí mua thực phẩm tươi trung bình mỗi ngày
Về chi phí trung bình mua thực phẩm tươi mỗi ngày, mức 100.000 – dưới 200.000 đồng/ ngày là mức chi phí phổ biến nhất với tỷ lệ 44,66% người tiêu dùng chi trả cho mỗi ngày đi chợ, tiếp đến là dưới 100.000 đồng/ ngày cũng chiếm tỷ lệ không nhỏ 38,83 %. Đây là hai mức chiếm tỷ lệ nhiều nhất và phù hợp cho các gia đình từ 2 đến 4 người. Còn lại là mức Từ 200.000 – dưới 300.000 đồng/ ngày (13,59%) và Trên 300.000 đồng/ ngày chỉ có 6 người lựa chọn chiếm tỷ lệ rất thấp 2,92%. Điều này cho thấy, đa số các đơn hàng trực tuyến sẽ giao động trong khoảng từ 50.000 đồng đến 200.000 đồng.
Bảng 4.2: Phân loại mẫu theo chi phí mua thực phẩm tươi trung bình
STT Chí phí trung bình Số lượng Tỷ lệ 1 Dưới 100.000 đồng/ ngày 80 38,83% 2 Từ 100.000 – dưới 200.000 đồng/ ngày 92 44,66% 3 Từ 200.000 – dưới 300.000 đồng/ ngày 28 13,59% 4 Trên 300.000 đồng/ ngày 6 2,92% Tổng 206 100% Nguồn: Tác giả tổng hợp
4.2. Kết quả nghiên cứu
4.2.1. Phân tích hệ số Cronbach’s Alpha
Để kiểm định độ tin cậy của thang đo, tất cả các biến quan sát thuộc 7 nhân tố được đưa vào phân tích độ tin cậy bằng hệ số Cronbach’s Alpha. Tiêu chuẩn đánh giá thang đo của tác giả là hệ số Cronbach’s Alpha không nhỏ hơn 0,6 và không lớn hơn