Xác định cỡ mẫu không phải là một nhiệm vụ dễ dàng trong nghiên cứu khoa học. Cỡ mẫu cần cho nghiên cứu phụ thuộc vào nhiều yếu tố như phương pháp xử lý (hồi quy, phân tích nhân tố khám phá EFA ...), độ tin cậy cần thiết ... Theo Tabachinick & Fidell (2007), cỡ mẫu phải tuân theo công thức: n ≥ 8m + 50 (n là cỡ mẫu, m là số lượng biến độc lập trong mơ hình); trong khi đó theo Hair cùng cộng sự (2006) cho rằng cỡ mẫu tối thiểu để sử dụng EFA là 50. tốt hơn là 100 và tỷ lệ số quan sát/biến đo lường là 5:1. nghĩa là cứ mỗi biến đo lường cần tối thiểu 5 quan sát.
Trong nghiên cứu này mơ hình nghiên cứu có 7 biến độc lập; một biến phụ thuộc và 34 biến quan sát. Vì thế, kích thước mẫu tính theo Tabachinick & Fidell (2007) là n ≥ 106, theo Hair (2006) n ≥ 170. Tuy nhiên, để tăng tính đại diện của mẫu nghiên cứu sau khi loại bỏ các bản câu hỏi thiếu nhiều thông tin hoặc chất lượng thấp, người nghiên cứu số lượng là 350 quan sát.
Xác định đám đông nghiên cứu Xác định khung mẫu Xác định kích thước mẫu Chọn phương pháp chọn mẫu Tiến hành chọn Những người từ 18 tuổi trở lên Sinh viên, Nhân viên văn phòng, Nội trợ ... đến siêu thị mua sắm Hair và cộng sự (2006); Tabachinick & Fidell (2007) n = 350 Lấy mẫu
43
3.4.2. Phương pháp phân tích số liệu.
3.4.2.1. Thống kê mô tả.
Trong bước đầu tiên, tác giả sử dụng thống kê mơ tả để phân tích các thuộc tính của mẫu nghiên cứu như: giới tính, tuổi tác, thu nhập, nghề nghiệp.
3.4.2.2. Kiểm định và đánh giá thang đo.
Bao gồm kiểm định và đánh giá thang đo bằng hệ số tin cậy Cronbach’s Alpha và phân tích EFA bằng phần mềm xử lý SPSS 20 để sàng lọc, loại bỏ các biến quan sát không đáp ứng tiêu chuẩn (biến rác).
Phân tích Cronbach’s Alpha.
Cronbach’s Alpha là phép kiểm định thống kê về mức độ chặt chẽ (khả năng giải thích cho một số khái niệm nghiên cứu) của một tập hợp các biến quan sát (các câu hỏi) trong thang đo thơng qua hệ số Cronbach’s Alpha.
Theo Hồng Trọng & Chu Nguyễn Mộng Ngọc (2008), cùng nhiều nhà nghiên cứu đồng ý rằng khi hệ số Cronbach’s Alpha từ 0.8 trở lên đến gần 1.0 thì đó là một thang đo tốt; từ 0.7 đến gần 0.8 là sử dụng được. Song cũng có nhiều nhà nghiên cứu cho rằng từ 0.6 trở lên là thang đo lường đủ điều kiện.
Phân tích nhân tố khám phá (EFA).
Sau khi loại bỏ các biến không đảm bảo độ tin cậy, phương pháp phân tích nhân tố EFA được sử dụng để giảm dữ liệu xuống một tập hợp các biến tóm tắt nhỏ hơn và để khám phá cấu trúc lý thuyết cơ bản của các hiện tượng. Nó được sử dụng để xác định cấu trúc của mối quan hệ giữa biến và người trả lời. Các tiêu chuẩn và biến dùng trong EFA bao gồm:
Các biến quan sát có trọng số factor loading phải lớn hơn 0.5 (Hair et al, 2006). Theo Gerbing & Anderson (1988), Số lượng nhân tố được xác định dựa trên chỉ
44
lượng nhân tố được xác định ở nhân tố có Eigenvalue tối thiểu bằng 1 và những nhân tố có Eigenvalue nhỏ hơn 1 sẽ bị loại ra khỏi mơ hình.
Tổng phương sai trích (Variance explained criteria) phải đạt từ 50% trở lên. Kiểm định Bartlett: kiểm định này có ý nghĩa thống kê khi Sig. < 0.05. Chứng tỏ
các biến quan sát có tương quan với nhau trong tổng thể.
Kiểm định KMO: Hệ số KMO càng lớn càng tốt vì phần chung giữa các biến càng lớn. Hệ số KMO phải đạt giá trị từ 0.5 trở lên thể hiện phân tích là phù hợp.
3.4.2.3. Phân tích hồi quy.
Sau khi hồn tất việc đánh giá độ tin cậy và giá trị thang đo, các biến không đảm bảo giá trị hội tụ tiếp tục bị đào thải khỏi mơ hình cho đến khi tham số được nhóm theo các nhóm biến. Việc xác định mối quan hệ giữa các nhóm này cũng như xác định mối quan hệ giữa các nhóm biến độc lập và biến phụ thuộc trong mơ hình nghiên cứu được thực hiện bằng phương pháp hồi quy bội.
Giá trị của biến mới trong mô hình nghiên cứu là giá trị chuẩn hóa được phần mềm SPSS tính một cách tự động sau khi phân tích nhân tố EFA. Tuy nhiên, trước khi tiến hành phân tích hồi quy, một phân tích quan trọng cần thực hiện đầu tiên là phân tích tương quan nhằm kiểm định mối tương quan tuyến tính giữa các biến trong mơ hình.
Phân tích tương quan.
Kiểm định mối tương quan tuyến tính giữa các biến trong mơ hình: giữa biến phụ thuộc với từng biến độc lập và giữa các biến độc lập với nhau. Sử dụng ma trận hệ số tương quan. Theo Hoàng Trọng & Chu Nguyễn Mộng Ngọc (2008), hệ số tương quan < 0.85, có sự khác biệt giữa các biến. Ngược lại có thể xảy ra hiện tượng đa cộng tuyến.
Phân tích hồi quy.
Hồi quy tuyến tính bội cịn được gọi đơn giản là hồi quy bội, là một kỹ thuật thống kê sử dụng một số biến giải thích để ước lượng kết quả của cho biến trả lời. Đích đến của nhiều hồi quy tuyến tính là mơ hình hóa mối quan hệ tuyến tính giữa các biến giải
45
thích (độc lập) và biến phản ứng (phụ thuộc). Do đó, trong nghiên cứu này hồi quy tuyến tính bội được chọn là phương pháp thích để kiểm định các giả thuyết nghiên cứu.
Kiểm định mơ hình hồi quy và các giả thuyết nghiên cứu.
𝑌 = 𝛽0 + 𝛽1𝑋1+ 𝛽2𝑋2+ 𝛽3𝑋3+ 𝛽4𝑋4+ ⋯ + 𝛽𝑘𝑋𝑘 Điều này thực hiện thông qua các bước sau:
Sử dụng phương pháp Enter – các biến đưa vào cùng một lượt.
Đánh giá độ phù hợp của mơ hình bằng hệ số xác định R2 (R Square). Hệ số Kiểm định đồ phù hợp của mơ hình.
Bác bỏ giả thuyết H0 nếu giá trị thống kê F có Sig rất nhỏ (< 0.05). Xác định các hệ số của phương trình hồi quy.
TĨM TẮT CHƯƠNG 3
Phần này nêu ra phương pháp nghiên cứu được thực hiện qua hai giai đoạn là nghiên cứu sơ bộ và nghiên cứu chính thức. Kết quả nghiên cứu sơ bộ là một nghiên cứu định tính khẳng định mơ hình đề ra trong chương 2 phản ánh các nhân tố tác động đến quyết định lựa chọn siêu thị AEON Citimart là địa điểm mua hàng của người tiêu dùng ở TP.HCM, đồng thời phát triển thang đo các thành phần này và quyết định chọn siêu thị AEON Citimart gồm 34 biến. Với 350 quan sát được thu thập bằng hình thức phỏng vấn bằng bảng câu hỏi hoặc email. Các giai đoạn trong phân tích:
Đánh giá Cronbach’s Alpha và phân tích EFA.
Phân tích hồi quy tuyến tính đa biến.
Phần tiếp theo sẽ trình bày kết quả nghiên cứu định lượng chính thức nhằm kiểm định mơ hình nghiên cứu cùng các giả thuyết nghiên cứu.
46
CHƯƠNG 4: PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU
4.1. THỐNG KÊ MẪU NGHIÊN CỨU.
Từ 330 bản câu hỏi được phát ra, tác giả thu về 318 bản câu hỏi (đạt tỷ lệ
96.36%). Sau khi loại các bản câu hỏi chưa rõ thông tin, chọn cũng một mức độ cho tất cả các câu hỏi, các bản câu hỏi trùng nhau thì số lượng bản câu hỏi đáp ứng được yêu cầu còn lại là 301 (đạt tỷ lệ 91.2% số bản câu hỏi phát ra), trong đó có số bản khảo sát trực tiếp là 187 (chiếm 62.1%), số bản câu hỏi qua Google Docs là 114 (chiếm 37.9%). Tổng 301 bản câu hỏi được phân phối theo đặc điểm cá nhân của khách hàng như sau:
Bảng 4.1: Thông tin về mẫu nghiên cứu phân bố theo đặc điểm nhận dạng từ người mua
Đặc điểm nhận dạng từ người mua Tần số Tần suất
Giới tính Nam 94 31.2% Nữ 207 68.8% Tổng 301 100% Độ tuổi Từ 18 – 25 tuổi 76 25.2% Từ 26 – 35 tuổi 153 50.8% Từ 36 – 45 tuổi 61 20.3% Trên 46 tuổi 11 3.7% Tổng 301 100% Trình độ học vấn Phổ thông 66 21.9% Trung cấp/ Cao đẳng 63 20.9% Đại học 154 51.2% Sau đại học 18 6.0% Tổng 301 100%
Nghề nghiệp Sinh viên 53 17.6%
47 Nội trợ 147 48.8% Khác 90 29.9% Tổng 301 100% Mức thu nhập hàng tháng (triệu đồng) Dưới 5 34 11.3% Từ 5 -10 141 46.8% Từ 11 – 15 68 22.6% Từ 16 – 20 53 17.6% Trên 20 5 1.7% Tổng 301 100%
(Nguồn: kết quả nghiên cứu chính thức)
Nhận xét:
Nhìn chung mẫu nghiên cứu đã đáp ứng kich thước và cỡ mẫu nghiên cứu được xác định ở chương 3.
Theo giới tính, mẫu nghiên cứu có số lượng khách hàng đi siêu thị mua hàng là nam là 94, chiếm tỉ lệ 31.2% so với mẫu nghiên cứu, và nữ chiếm 68.78% so với số lượng mẫu nghiên cứu là 301 mẫu.
Theo độ tuổi, người nghiên cứu đã đưa ra 4 nhóm tuổi: Từ 18 – 25 tuổi có 76 người (chiếm 25.2%); từ 26 – 35 tuổi có 153 người (chiếm 50.8%); Từ 36 – 45 tuổi có 61 người (chiếm 20.3%); và trên 46 tuổi có 11 người (chiếm 3.2%). Theo trình độ học vấn đã đưa ra 4 nhóm: gồm Phổ thơng có 66 người (chiếm
21.9%), Trung cấp/Cao đẳng có 63 người (chiếm 20.9%), Đại học có 154 người (chiếm 51.2%), Sau đại học có 18 người (chiếm 6.0%).
Về nghề nghiệp: Sinh viên có 53 người (chiếm 17.6%), Nhân viên văn phịng có 147 người (chiếm 48.8%), Nội trợ có 11 người (chiếm 3.7%), và các ngành nghề khác có 90 người (chiếm 29.9%).
48
Về mức thu nhập hàng tháng, được chia thành 5 nhóm dựa theo mức thu nhập của khách hàng đi siêu thị. Mức dưới 5 triệu đồng/ tháng có 34 người (chiếm 11.3%), mức từ 5 – 10 triệu đồng/ tháng có 141 người (chiếm 46.8%), mức từ 11 – 15 triệu đồng có 68 người (chiếm 22.6%), mức từ 16 -20 triệu đồng/ tháng có 53 người (chiếm 17.6%) và mức thu nhập trên 20 triệu đồng/ tháng có 5 người (chiếm 1.7%).
Dựa trên thông tin từ dữ liệu thu thập được từ khảo sát xã hội của khách hàng mua hàng siêu thị tại Thành phố Hồ Chí Minh, người nghiên cứu cho rằng cấu trúc trên phù hợp với thực tế. Kết quả thu được, kích thước và cấu trúc thu được đã đáp ứng các yêu cầu được đặt ra bởi nhà nghiên cứu trong chương 3.
4.2. THÓI QUEN MUA HÀNG CỦA NGƯỜI TIÊU DÙNG.
Thói quen của người tiêu dùng mua hàng tại siêu thị AEON Citimart sẽ được xác định thông qua một số nội dung chính như sau: tần suất đi siêu thị, mặt hàng mua sắm.
Kết quả thống kê cho thấy người tiêu dùng đến siêu thị AEON Citimart mua hàng với tần suất 2 đến 3 ngày trong tuần chiếm 48.8%, có 29.9% người đến siêu thị AEON Citimart mua hàng khoảng 4 – 5 ngày trong tuần, trong khi đó có 14.3% đi siêu thị mua hàng hằng ngày. Số còn lại mua hàng ở AEON Citimart 1 ngày/ tuần.
Bảng 4.2: Tần suất đi mua đồ tại AEON Citimart.
Tần số Tần suất Hằng ngày 43 14.3% 2 – 3 ngày/ tuần 147 48.8% 4 – 5 ngày/ tuần 90 29.9% 1 ngày/ tuần 21 7.0% Tổng 301 100%
49
Các loại hàng hóa mua hàng của siêu thị: trong số các loại hàng hóa được bày bán trong siêu thị, rau củ quả; thức ăn chế biến sẵn; thịt cá tươi sống; bánh kẹo, đồ ăn vặt và bia rượu, nước giải khát là những nhóm mặt hàng có số lượng người lựa chọn nhiều nhất với tỉ lệ tương ứng là 16.9%, 16.7%, 16.2%, 15.2%, 14.3% trong khi quần áo, thuốc lá, đồ trang trí … là những nhóm hàng hóa có ít người chọn mua tại siêu thị AEON Citimart nhất.
(Nguồn: kết quả nghiên cứu chính thức)