Nghiên cứu định lượng

Một phần của tài liệu Đề tài những yếu tố ảnh hưởng đến sự hài lòng của khách hàng khi mua sắm trực tuyến (Trang 37)

CHƯƠNG 3 THIẾT KẾ NGHIÊN CỨU

3.3. Nghiên cứu định lượng

Bảng câu hỏi được gửi đến các đối tượng khảo sát bằng link Google Form của tác giả thơng qua các nhóm cộng đồng sinh viên các trường đại học tại TP.HCM trên nền tảng mạng xã hội Facebook.

3.3.1. Xác định kích thước mẫu

Vì khơng thể biết được chính xác số lượng sinh viên đang theo học tại các trường đại học ở TP.HCM, tác giả dùng cơng thức tính mẫu của Cochran W. G. (1963), dùng cho các trường hợp quy mô tổng thể lớn và không thể đo lường được:

�0 = �

2� � 2

Theo như trên, n0 là độ lớn của mẫu cần xác định, Z là giá trị trên trục hoành của một đường cong bất kỳ trên đồ thị hai chiều tạo số góc α (1 – α bằng độ tin cậy mong muốn), e là độ chính xác mong muốn, p là tỷ lệ ước tính của một thuộc tính hiện diện trong tổng thể và q bằng 1 – p. Nghiên cứu này giả định p = 0,5 (mức biến thiên tối đa), độ tin cậy 95% tương ứng với hệ số Z = 1,96 và độ chính xác e = 5%, chúng ta có kết quả kích thước mẫu như sau:

�0 = � 2�� �2 = 1,962 × 0,5 × (1 − 0,5) 0,052 ≈ 385 sinh êêêêêêêêêêêêêêê

3.3.2. Phương pháp chọn mẫu và xây dựng thang đo

Báo cáo dùng phương pháp lấy mẫu thuận tiện. Đây là cách thức chọn mẫu phi xác suất trong đó nhà nghiên cứu có thể chọn bất kỳ phần tử mẫu nào mà họ tiếp cận dễ dàng. Trong trường hợp này, tất cả các sinh viên đang theo học tại các trường đại học ở TP.HCM có lần mua sắm trực tuyến gần nhất cách đây ít hơn sáu tháng đều có khả năng được chọn vào mẫu.

Thang đo Likert sẽ được sử dụng trong khảo sát, đây là “thang đo thứ tự và đo lường mức độ đồng ý của đối tượng nghiên cứu. Nghĩa là biến thiên của các trả lời từ hoàn toàn phản đối (khơng đồng ý) đến hồn tồn đồng ý”. Trong bảng câu hỏi, tác giả áp dụng Likert với năm lựa chọn theo các mức: “hoàn tồn khơng đồng ý”

– “khơng đồng ý” – “bình thường” – “đồng ý” – “hoàn toàn đồng ý”, đây là “một chuỗi các phát biểu liên quan đến thái độ trong câu hỏi được nêu ra và người trả lời sẽ chọn một trong các câu trả lời đó” (Nguyễn Đình Thọ, Nguyễn Thị Mai Trang, 2011, trang 93-94).

3.4. Xử lý số liệu

3.4.1. Lọc dữ liệu

Dữ liệu sau khi thu thập đủ số lượng sẽ tiến hành loại đi các câu trả lời không phải từ sinh viên của các đại học ở TP.HCM, những cá nhân không mua sắm trực tuyến và có thời gian mua hàng trực tuyến gần đây nhất cách đây hơn 6 tháng. Ngoài ra, những câu trả lời chỉ chọn một đáp án duy nhất cho tất cả các biến và các quan sát dị biệt cũng bị loại khỏi bước xử lý số liệu. Theo Viện Tiêu chuẩn và Công nghệ Quốc gia của Bộ Thương mại Hoa Kỳ: “Điểm dị biệt là quan sát nằm ở khoảng cách bất thường so với các giá trị khác trong một mẫu ngẫu nhiên từ một tổng thể”. “Thông thường, các quan sát dị biệt là các điểm dữ liệu xấu”. Để loại đi các quan sát dị biệt, tác giả áp dụng quy luật Empirical (hay còn gọi là quy luật ba sigma hoặc 68-95-99,7) được đặt ra bởi Abraham de Moivre, quy định rằng: “Đối với phân phối chuẩn, hầu hết tất cả dữ liệu nằm trong ba độ lệch

chuẩn (σ – standard deviation) của giá trị trung bình (µ – mean). Theo quy luật này, 68% quan sát nằm

trong độ lệch chuẩn đầu tiên (±1σ), 95% quan sát nằm trong hai độ lệch chuẩn đầu tiên (±2σ) và 99.7% nằm trong ba độ lệch chuẩn đầu tiên (±3σ). Trên cơ sở này, nếu tồn tại các điểm dữ liệu nằm ngồi vùng ba độ lệch chuẩn, các điểm dữ liệu đó sẽ được nhận diện là điểm dị biệt” (Stephanie G., khơng ngày tháng).

3.4.2. Phân tích thống kê mơ tả

Đây là dạng phân tích thống kê dễ nhất cho các nhà nghiên cứu để thực hiện. Thống kê mô tả là những kỹ thuật được diễn tả bằng số và đồ thị nhằm sắp xếp, trình bày và phân tích dữ liệu, giúp khái quát dữ liệu và cung cấp những mô tả về mẫu nhưng không thể cho biết những thơng tin về phân tích nhân quả. Việc trình bày kết quả phân tích của một biến trong mẫu sẽ tùy vào loại cấp bậc thang đo mà biến đó sử dụng (Murray J. F., Andrea P. M., 2009).

3.4.3. Kiểm định độ tin cậy của thang đo – Conbach’s Alpha

Alpha được Lee Cronbach phát triển vào năm 1951 để đo lường chỉ số đồng nhất của một thang đo và được biểu thị bằng một con số bất kỳ từ 0 đến 1. Chỉ số đồng nhất mô tả phạm vi mà ở đó tất cả các biến quan sát trong thang đo đều đo lường cùng một quan điểm hoặc cấu trúc, do đó nó được liên kết với mối tương quan của các biến. Vì thế, có thể nói số lượng các biến quan sát cũng như mối tương quan giữa chúng và giữa các thành tố ảnh hưởng đến giá trị của alpha (Cortina J., 1993). Những báo cáo khác nhau cho ra các giá trị alpha có thể chấp nhận khác nhau, thông thường trong khoảng từ 0,7 đến 0,95 (Nunnally J., Bernstein L., 1994); (Bland J., Altman D., 1997); (DeVellis R., 2003). Chỉ số alpha thấp có thể do số lượng câu hỏi ít, mối tương quan giữa các biến kém hay các cấu trúc không đồng nhất. Trong trường hợp chỉ số alpha thấp do mối tương quan kém, một vài biến quan sát sẽ phải được sửa đổi hoặc loại bỏ. Cách dễ nhất để tìm ra biến quan sát có vấn đề là tính tốn mối tương quan giữa mỗi biến với nhau, các biến cho ra các mối tương quan thấp nhất (gần bằng 0) sẽ bị xóa. Nếu chỉ số alpha quá cao, điều này có thể cho thấy rằng một số biến quan sát đang kiểm định cùng một ý nghĩa

nhưng cách diễn giải câu hỏi khác nhau. Để tránh cho trường hợp này xảy ra, giá trị alpha cao nhất được áp dụng cho thang đo là 0,9 (Streiner D., 2003).

3.4.4. Phân tích yếu tố khám phá – EFA (Eploratory Factor Analysis)

Khi thực hiện EFA, chúng ta cần tiến hành một số quyết định về thống kê và phương pháp luận, đó là: các kỹ thuật kiểm tra dữ liệu, phương pháp phân tích nhân tố, phương pháp duy trì nhân tố, phương pháp xoay nhân tố và cắt giảm hệ số tải nhân tố.

Các kỹ thuật kiểm tra dữ liệu: Hai kỹ thuật phổ biến nhất cho EFA là kiểm định Bartlett và thước đo mức độ thích hợp của việc lấy mẫu với hệ số KMO (Kaiser- Meyer-Olkin Measure of Sampling Adequacy). Kiểm định Bartlett kiểm tra ma trận tương quan được quan sát có phải là ma trận đồng nhất hay khơng (hay khơng có phần tử ngồi đường chéo) (Tobias S., Carlson J. E., 1969). Vì kỹ thuật này giải thích mối quan hệ của các biến, nên việc thiếu hoàn toàn các mối quan hệ trong một bộ dữ liệu (ví dụ như một ma trận đồng nhất) sẽ ngăn chặn việc thực hiện EFA. Nếu kiểm định Bartlett có ý nghĩa, kết quả cho thấy dữ liệu khơng phải ma trận đồng nhất và thích hợp cho EFA, tuy nhiên, điều này lại xảy ra trong hầu hết các nghiên cứu (Dziuban C. D., Harris C. W., 1973); (Dziuban C. D., Shirkey E. C., 1974). Mặc dù vậy, kiểm định này có thể phát hiện ra các bộ dữ liệu có vấn đề, vì vậy nó vẫn nên được thực hiện trước EFA (Matt C. H., 2016). Một kỹ thuật khác được đề cập là KMO, đây là chỉ số về phương sai chung trong một bộ dữ liệu, cho thấy việc các yếu tố tiềm ẩn có thể tồn tại và EFA có thể được thực hiện hay không. So với kiểm định Bartlett, KMO cung cấp nhiều khoảng để kiểm tra phương sai có được chấp nhận hay khơng thay vì chỉ cho kết quả có hay khơng có ý nghĩa, các chỉ số trong các khoảng được biểu thị như sau: từ 0,00 đến 0,5 là không thể chấp nhận được; từ trên 0,5 đến 0,6 là nghèo nàn; từ trên 0,6 đến 0,7 là bình thường; từ trên 0,7 đến 0,8 là trung bình; từ trên 0,8 đến 0,9 là tốt; từ trên 0,9 đến 1 là tuyệt vời. Do đó, các nhà làm nghiên cứu cần có chỉ số KMO lớn hơn 0,6 trước khi tiến hành phân tích EFA, nếu đạt giá trị thấp hơn, chúng ta có thể loại bỏ các biến có

quan hệ tương hỗ nhỏ để cải thiện tính phù hợp của EFA (Dziuban C. D., Shirkey E. C., 1974); (Kaiser H. F., 1970).

Phương pháp phân tích nhân tố: Có rất nhiều phương pháp để lựa chọn hiện nay, tuy nhiên, nghiên cứu này sẽ sử dụng phương pháp Principal Axis Factoring (PAF). Phương pháp này có độ phổ biến chỉ sau phương pháp phân tích yếu tố chính (Principal Components Analysis: PCA) – được biết đến là phương pháp trích xuất yếu tố mặc định của phần mềm SPSS (Costello A. B., Osborne J., 2005). Vì PAF cho rằng sự xuất hiện của các phương sai riêng là bình thường, mục tiêu của phương pháp này là tạo ra một tập hợp các hệ số ước tính tải nhân tố để tái tạo phương sai chung trong một ma trận tương quan (De Winter J. C., Dodou D., 2012).

Phương pháp duy trì nhân tố: Tác giả chọn tiêu chuẩn Kaiser (1960): “Khuyến nghị rằng tất cả các nhân tố có hệ số eigenvalue lớn hơn 1 đều nên được giữ lại”. Phương pháp xoay nhân tố: Nghiên cứu sử dụng phép xoay Varimax, phương pháp này tìm cách tăng các phương sai của các hệ số tải nhân tố, cho ra cả hệ số lớn và nhỏ, và các biến quan sát sẽ được tải hoặc không được tải một cách rõ ràng lên mỗi nhân tố (Kaiser H. F., 1958).

Cắt giảm hệ số tải nhân tố: Ngoài việc xác định số lượng các nhân tố trong một nhóm các biến, phân tích nhân tố còn xác định mức độ mà mỗi biến đại diện cho từng yếu tố nổi bật thông qua các giá trị tải. Thông thường, những biến đại diện cho duy nhất một nhân tố sẽ được giữ lại, trong khi các biến đại diện cho nhiều nhân tố hoặc không đại diện cho nhân tố nào sẽ bị loại bỏ (Hair J. F., Black W. C., Babin B. J., Anderson R. E., Tatham R. L., 2006); (Tabachnick B. G., Fidell L. S., 2007). Nó được khuyến nghị rằng các biến quan sát thỏa điều kiện khi hệ số tải nhân tố chính trên 0,4 và chênh lệch giữa giá trị này với hệ số tải nhân tố thay thế trên 0,2 (Matt C. H., 2016). Nếu một biến quan sát có hệ số tải từ 0,32 trở lên ở hai hoặc nhiều hơn hai nhân tố, chúng ta cần phải xem xét lại việc biến đó có bị loại khỏi phân tích hay khơng (Tabachnick B. G., Fidell L. S., 2001).

3.4.5. Phân tích tương quan

Mối tương quan là thước đo cho sự liên kết đồng đều giữa hai biến. Một quan hệ đồng đều giữa hai biến là quan hệ mà trong đó khi giá trị của một biến tăng lên, giá trị của biến khác cũng tăng theo, hoặc khi giá trị của một biến tăng lên, giá trị của biến khác giảm. Trong dữ liệu có sự tương quan, sự thay đổi về giá trị của một biến được gắn liền với sự thay đổi về giá trị của một biến khác theo cùng một hướng hoặc ở hướng ngược lại. Nói cách khác, các giá trị cao hơn của một biến có xu hướng liên hệ với các giá trị cao hơn (tương quan dương) hoặc thấp hơn (tương quan âm) của biến khác, và ngược lại. (Patrick S., Christa B., Lothar A. S., 2018)

Mối quan hệ tuyến tính giữa hai biến là một trường hợp đặc biệt của quan hệ đồng đều. Thông thường, thuật ngữ “mối tương quan” được sử dụng trong bối cảnh xem xét mối quan hệ tuyến tính giữa hai biến số liên tục và ngẫu nhiên, chúng được gọi là hệ số tương quan Pearson, ký hiệu là “r” (Joseph L. R., Alan W. N., 1988). Mức độ thay đổi trong một biến liên tục liên quan đến sự thay đổi trong một biến liên tục khác có thể được mơ tả bằng tốn học dưới thuật ngữ hiệp phương sai của các biến, nó là thước đo về cách hai biến thay đổi cùng nhau. Hệ số tương quan Pearson dùng để đo lường hiệp phương sai theo tỷ lệ dao động từ -1 đến +1 (Dennis D. W., William M. III, Richard L. S., 2008). Trong đó, mối tương quan được coi là hồn hảo khi r có giá trị là -1 hoặc +1, điều đó có nghĩa rằng mọi điểm trong dữ liệu đều nằm chính xác trên 1 đường thẳng. Nếu r bằng 0, điều này có nghĩa khơng có sự tương quan giữa hai biến (Patrick S., Christa B., Lothar A. S., 2018). Mối tương quan giữa các cặp được xem là cao nếu giá trị tuyệt đối của r lớn hơn 0,7 (Booth

G. D., Niccolucci M. J., Schuster E. G., 1994).

3.4.6. Phân tích hồi quy tuyến tính bội

Phân tích hồi quy là một kỹ thuật thống kê để ước tính mối quan hệ giữa các biến có quan hệ nhân quả. Mơ hình hồi quy có một biến phụ thuộc và nhiều hơn một

biến độc lập được gọi là hồi quy tuyến tính bội (Gulden K. U., Nese G., 2013), được biểu diễn theo cơng thức:

“Trong đó, ký hiệu i thể hiện số đơn vị quan sát từ các quan sát lấy được trên Y và số lượng p biến độc lập” (John O. R., Sastry G. P., David A. D., 1998). “Y là biến phụ thuộc; X1, X2, Xp là biến độc lập; Yi, Xi1, Xi2, Xip là giá trị các quan sát thứ i của Y, X1, X2, Xp; β0 là hệ số chặn (hệ số tự do), giá trị Y sẽ bằng β0 khi X1 = X2

=…= Xp = 0; β1, β2, βp là các hệ số hồi quy riêng của các biến độc lập, chúng thể hiện sự thay đổi của Y khi biến độc lập tương ứng thay đổi 1 đơn vị trong khi các biến độc lập còn lại cố định, ε là sai số trong mơ hình hồi quy.” (Topica, 2022) Nghiên cứu này thực hiện phân tích mơ hình hồi quy tuyến tính bội dựa trên những thông số sau (TS. Nguyễn Văn Hạnh, 2022):

Mối quan hệ giữa các biến được trình bày thơng qua kiểm định ANOVA (Analysis of Variance: phân tích phương sai). Nếu giá trị ở cột Sig. (Significance level: mức ý nghĩa) bé hơn giá trị α = 0,05, điều này kết luận các biến độc lập dự báo sự thay đổi trong biến phụ thuộc một cách đáng kể, mơ hình hồi quy có ý nghĩa thống kê và ngược lại.

R2 hiệu chỉnh hiển thị mức độ giải thích của các biến độc lập đối với biến phụ thuộc trong mơ hình hồi quy, chỉ số này nếu càng tiến về 1 thì mơ hình càng có ý nghĩa, càng tiến về 0 thì ý nghĩa mơ hình càng yếu. Thơng thường, giá trị R2 hiệu chỉnh thấp nhất có thể chấp nhận được là 0,5.

“Giá trị d của kiểm định Durbin-Watson nếu nhỏ hơn 1,5 cho biết có sự tương quan dương chuỗi bậc 1 giữa các phần dư, nếu d nằm trong khoảng từ 1,5 đến 2,5 cho thấy khơng có sự tương quan chuỗi bậc 1, và d lớn hơn 2,5 cho biết có sự tương quan âm chuỗi bậc 1.”

“Dữ liệu không được xuất hiện đa cộng tuyến, hiện tượng này xảy ra khi có hai hoặc nhiều biến độc lập có mối tương quan cao với nhau. Điều này dẫn đến các vấn đề trong việc xác nhận biến độc lập nào góp phần vào phương sai được giải

thích trong biến phụ thuộc, cũng như các trục trặc kỹ thuật trong việc tính tốn mơ

hình hồi quy bội. Hệ số phóng đại phương sai VIF (Variance inflation factor) nếu bé hơn 2 cho thấy hiện tượng đa cộng tuyến bị loại bỏ, nếu lớn hơn 2 sẽ có dấu hiệu đa cộng tuyến, lớn hơn 10 chắc chắn có đa cộng tuyến.”

“Sai số trong mơ hình hồi quy nên có phân phối xác suất chuẩn” (trường hợp gần đúng chuẩn vẫn có thể chấp nhận). Điều này được biểu thị thông qua đồ thị Histogram và đồ thị Normal P-P của phần dư chuẩn hóa hồi quy. Nếu sai số có phân phối xác suất chuẩn, các cột giá trị phần dư trong đồ thị Histogram sẽ phân bố theo dạng hình chng và các giá trị quan sát trong đồ thị Normal P-P sẽ nằm trên một đường thẳng ứng với phân phối chuẩn.

“Các phần dư trong phân tích hồi quy đại diện cho các ước lượng mẫu của các sai số. Chúng phải có độ tuyến tính và phương sai khơng đổi (đồng nhất)”, điều này được kiểm định bởi đồ thị Scatter Plot (đồ thị phân tán). Nếu các chấm trên biểu đồ này không tạo thành bất kỳ loại đường cong nào, liên hệ tuyến tính có thể được kết luận. Sự phân tán ngẫu nhiên của các chấm trên biểu đồ xung quanh tung độ 0 thể hiện phương sai đồng nhất.

Một phần của tài liệu Đề tài những yếu tố ảnh hưởng đến sự hài lòng của khách hàng khi mua sắm trực tuyến (Trang 37)

Tải bản đầy đủ (DOCX)

(107 trang)
w