Phương pháp chọn mẫu và xử lý số liệu

2.5.1. Chọn mẫu

Mẫu khảo sát được thực hiện là người dân trên địa bàn thành phố Nha Trang đã gửi tiền tiết kiệm tại ngân hàng hoặc có ý định gửi tiền tiết kiệm tại ngân hàng. Để đạt được mục tiêu nghiên cứu của đề tài, tác giả lựa chọn phương pháp chọn mẫu phi xác xuất với hình thức thuận tiện để sử dụng trong nghiên cứu này. Phương pháp chọn mẫu này có ưu điểm là ít tốn kém thời gian, chi phí thu thập thông tin nghiên cứu.

Kích thước mẫu sẽ phụ thuộc vào việc ta muốn nghiên cứu vấn đề gì từ những dữ liệu thu thập được và mối quan hệ ta muốn thiết lập với mục tiêu nghiên cứu. Vấn đề nghiên cứu càng đa dạng, phức tạp thì mẫu nghiên cứu càng lớn. Một nguyên tắc chung khác nữa là mẫu càng lớn thì độ chính xác của các kết quả nghiên cứu càng cao. Tuy nhiên, trên thực tế thì việc lựa chọn kích thước mẫu còn phụ thuộc vào một yếu tố hết sức quan trọng là năng lực tài chính và thời gian mà nhà nghiên cứu đó có thể có được.

Đối với đề tài này, do các giới hạn về tài chính và thời gian, kích thước mẫu sẽ được xác định ở mức hợp lý cần thiết nhưng vẫn đáp ứng được nhu cầu của cuộc nghiên cứu. Việc xác định kích thước mẫu bao nhiêu là phù hợp vẫn còn nhiều tranh cãi với nhiều quan điểm khác nhau. Một số nhà nghiên cứu khác không đưa ra con số cụ thể về số mẫu cần thiết mà đưa ra tỉ lệ giữa số mẫu cần thiết và số tham số cần ước lượng. Đối với phân tích nhân tố, kích thước mẫu sẽ phụ thuộc vào số lượng biến được đưa trong phân tích nhân tố. Gorsuch (1983, được trích bởi MacClallum và đồng tác giả 1999) cho rằng

số lượng mẫu cần gấp 5 lần so với số lượng biến. Trong khi Hoàng Trọng & Chu Nguyễn Mộng Ngọc (2005) cho rằng tỷ lệ đó là 4 hay 5. Trong đề tài này có tất cả tối đa 44 biến quan sát cần tiến hành phân tích nhân tố, vì vậy số mẫu tối thiểu cần thiết là 44 x 5 = 220 số lượng mẫu quan sát.

Với số lượng người dân trải rộng trên khắp thành phố Nha Trang nên việc lấy mẫu sẽ được thực hiện theo phương pháp thuận tiện, chủ yếu lấy mẫu là khách hàng đang gửi tiền tiết kiệm tại các ngân hàng trên địa bàn thành phố Nha Trang và những người quen biết đang có ý định gửi tiền tiết kiệm vào ngân hàng, mẫu này sẽ đại diện cho tổng thể. Tuy nhiên số lượng mẫu cần có phải lớn hơn hoặc bằng số lượng mẫu tối thiểu cho phép như đã nêu ở trên.

2.5.2. Xử lý số liệu

 Làm sạch số liệu:

Các bảng câu hỏi khảo sát sau khi thu thập cần thực hiện việc kiểm soát lỗi, chỉnh sửa trước khi nhập liệu vào phần mềm SPSS 18. Dữ liệu sau khi nhập cần kiểm tra các sai sót trong khi nhập liệu, kiểm tra chất lượng của việc phỏng vấn có sai sót hay hiểu nhầm không. Để làm sạch dữ liệu cần sử dụng bảng tần số, bảng phối hợp nhiều biến và kiểm tra ngay trên của sổ dữ liệu của phần mềm SPSS 18.

 Thống kê mô tả mẫu nghiên cứu:

Ðầu tiên, tác giả phân tích thống kê mô tả cho mẫu nghiên cứu. Mục đích nhằm phân tích sơ bộ dữ liệu, mô tả những đặc điểm của mẫu. Một số đại lượng sử dụng trong phương pháp thống kê mô tả: mean, mode, sum, st.deviation (s), range (R=xmax-x), max và min,… Trong nghiên cứu này, tác giả thống kê về độ tuổi, trình độ học vấn, tình trạng hôn nhân, mức thu nhập hàng tháng, nghề nghiệp.

 Đánh giá độ tin cậy của thang đo bằng hệ số Cronbach’s Alpha:

Kiểm định độ tin cậy của thang đo được đánh giá qua hệ số Cronbach’s Alpha (Cronbach, 1951): Hệ số Cronbach’s Alpha là hệ số tin cậy được sử dụng kiểm định thang đo lường tương quan giữa các cặp biến quan sát.

Mục tiêu đánh giá độ tin cậy của thang đo bằng hệ số tin cậy Cronbach’s Alpha là kiểm tra xem mục hỏi nào đã đóng góp vào việc đo lường xu hướng lựa chọn gửi tiền tiết kiệm của người dân và những mục hỏi nào không.

Với Cronbach’s Alpha sẽ giúp loại đi những biến quan sát không đạt yêu cầu hay các thang đo chưa đạt yêu cầu cho quá trình nghiên cứu. Các biến quan sát có hệ

số tương quan biến tổng (item-total correlation) nhỏ hơn 0.3 sẽ bị loại và tiêu chuẩn để thang đo đạt yêu cầu khi Cronbach’s Alpha lớn hơn 0.6 trở lên (Nguyễn Ðình Thọ & Nguyễn Thị Mai Trang, 2004). Các nhà nghiên cứu cho rằng Cronbach’s Alpha từ 0.8 đến 1 thì thang đo lường này tốt, từ 0.7 đến 0.8 là sử dụng được. Tuy nhiên nhiều tác giả cho rằng Cronbach’s Alpha từ 0.6 trở lên là có thể sử dụng được trong trường hợp các khái niệm nghiên cứu là mới hoặc mới đối với người trả lời (Theo Hoàng Trọng & Chu Mộng Ngọc, 2005).

 Phân tích nhân tố khám phá EFA:

Với kỹ thuật đánh giá độ tin cậy của thang đo bằng hệ số Cronbach’s alpha, tác giả sẽ loại đi các biến quan sát không phù hợp trong từng thang đo và các biến quan sát tốt sẽ được đưa vào để tiếp tục phân tích nhân tố EFA. Phân tích nhân tố được thực hiện với các biến quan sát của biến độc lập và các biến quan sát của biến phụ thuộc để rút ra được các nhân tố tiếp tục được đưa vào để phân tích tương quan và phân tích hồi qui ở phần sau.

Khi phân tích yếu tố khám phá EFA, các nhà nghiên cứu thường quan tâm đến một số tiêu chuẩn như sau:

 Một là, hệ số KMO (Kaiser-Meyer-Olkin) >=0.5, mức ý nghĩa của kiểm định Bartlett <= 0,5.

 Hai là, số tải nhân tố (Factors loading) >=0.5, nếu biến quan sát nào có hệ số tải nhân tố nhỏ hơn 0.5 sẽ bị loại (Hair &ctg, 1998).

 Ba là, thang đo được chấp nhận thì tổng phương sai trích >= 50%.

 Bốn là hệ số Eigenvalue có giá trị lớn hơn 1.

 Năm là, các điểm số nhân tố tổng hợp được ước lượng cho từng quan sát trên các nhân tố được rút ra (còn được gọi là nhân số) >= 0.3 để đảm bảo giá trị phân biệt giữa các nhân tố. (Nguyễn Ðình Thọ & Nguyễn Thị Mai Trang, 2004)

Khi phân tích EFA đối với thang đo về các yếu tố ảnh hưởng đến hành vi tiêu dùng, tác giả sử dụng phương pháp trích Principal Component Analysis với phép xoay Varimax và điểm dừng khi trích các yếu tố có Engenvalue lớn hơn 1.

 Phân tích tương quan và hồi qui:

Sau khi phân tích nhân tố khám phá EFA, mô hình hồi quy tuyến tính tổng quát về khuynh hướng lựa chọn gửi tiền tiết kiệm vào ngân hàng của người dân được điều chỉnh lại như sau:

SLC = β 0 + β 1F 1 + β 2F 2 + … + β jF j + e i

Trong đó:

SLC Sự lựa chọn của người dân từ tập hợp 10tiêu chí đánh giá. F = {F

1,…, F

j} Các biến thang đo nhân tố ảnh hưởng đến SLC β = {β

0,…, β

j} Hệ số hồi quy tác động đến SLC e

i Sai số

Nguyên tắc xây dựng mô hình hồi quy:

(i) Xem xét ma trận hệ số tương quan (Hệ số tương quan Pearson):

Hệ số tương quan Pearson (ký hiệu r) để lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa 2 biến định lượng. Nhìn chung r được sử dụng để kiểm tra liên hệ giữa những biến định lượng. Hệ số tương quan có giá trị từ -1 đến 1. Hệ số tương quan bằng 0 (hay gần 0) có nghĩa là hai biến số không có liên hệ gì với nhau, ngược lại nếu hệ số bằng -1 hay 1 có nghĩa là hai biến số có một mối liên hệ tuyệt đối.

-1 ≤ r ≤ +1

Diễn giải hệ số tương quan (r): (Fraenkel & Wallen, 2006): từ + .75 đến + 1.0 có mối quan hệ rất chặt chẽ từ + .50 đến + .75 có mối quan hệ chặt chẽ vừa phải từ + .25 đến + .50 có mối quan hệ yếu

từ + .00 đến + .25 có mối quan hệ kém chặt chẽ

Trị tuyệt đối của r cho biết mức độ chặt chẽ của mối liên hệ tuyến tính. Giá trị tuyệt đối của r tiến gần đến 1 khi hai biến có mối tương quan tuyến tính chặt chẽ. (giá trị của r cho biết không có mối liên hệ tuyến tính giữa 2 biến chưa hẳn có nghĩa là 2 biến đó không có mối liên hệ). Do đó hệ số tương quan tuyến tính chỉ nên được sử dụng để biểu thị mức độ chặt chẽ của liên hệ tương quan tuyến tính. (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2005).

Hệ số tương quan Pearson là loại đo lường tương quan được sử dụng nhiều nhất trong khoa học xã hội khi phân tích mối quan hệ giữa hai biến khoảng cách/tỷ lệ. Trong nghiên cứu này, hệ số tương quan Pearson được sử dụng để xác định các yếu tố ảnh hưởng quan trọng đến sự lựa chọn gửi tiền tiết kiệm vào ngân hàng của người dân.

Để kiểm định giả thuyết theo nghiên cứu về mối quan hệ giữa sự lựa chọn và các yếu tố ảnh hưởng, đề tài sử dụng phép kiểm định t của Student (T-Test) kết hợp với đồ thị phân tán (Scatterplots) tìm ra ý nghĩa thống kê khi phản ánh mối quan hệ thật sự trong tổng thể nghiên cứu.

(ii) Các thủ tục chọn biến độc lập (F

j):

Phương pháp Enter được sử dụng để phân tích hồi quy bằng cách tất cả các biến độc lập được đưa vào một lần, đưa ra các thông số thống kê liên quan đến các biến. Nếu biến nào thỏa điều kiện kiểm định ý nghĩa hệ số hồi quy (Sig. ≤ 0,05) thì nên giữ lại trong mô hình hồi quy, còn biến nào không thỏa điều kiện kiểm định thì nên loại ra.

(iii) Đánh giá mức độ phù hợp của mô hình hồi quy

Hệ số xác định R2 (R Square) là hệ số càng tăng khi số biến độc lập được đưa thêm vào mô hình. Tuy nhiên, cần xem xét mức độ phản ảnh sát hơn thì nên sử dụng hệ số R2 điều chỉnh (Adjusted R Square), vì nó không nhất thiết tăng lên khi số biến độc lập được đưa thêm vào mô hình.

Kiểm định ANOVA: là một phép kiểm định giả thuyết về độ phù hợp của mô hình hồi quy tuyến tính tổng thể. Ý nghĩa của kiểm định này là xem xét mối quan hệ giữa biến phụ thuộc SLC có liên hệ tuyến tính với toàn bộ tập hợp các biến nhân tố Fj hay không (giả thuyết H0 là β1 = β2 = … = βj = 0): Nếu bác bỏ giả thuyết H0 (Sig. ≤ 0,05): Tồn tại ít nhất một biến nhân tố Fj giải thích được thay đổi biến phụ thuộc SLC; Hoặc nếu không có cơ sở bác bỏ giả thuyết H0 (Sig. ≤ 0,05): Chưa thể kết luận các biến nhân tố Fj giải thích được thay đổi biến phụ thuộc SLC.

(iv) Kiểm định sự vi phạm các giả định cần thiết trong mô hình hồi quy tuyến tính

Kiểm tra bằng biểu đồ tần số Histogram, biểu đồ tần số Q-Q plot, biểu đồ phân tán Scatter nhằm đánh giá mức độ tuyến tính phù hợp với dữ liệu quan sát hay không.

Kiểm định Pearson trong ma trận hệ số tương quan (Pearson Correlation), bất cứ liên hệ tương quan qua lại chặt chẽ nào giữa các biến độc lập Fj thì có dấu hiệu đa cộng tuyến.

Độ chấp nhập của biến (Tolerance): Độ chấp nhận của biến độc lập Fj được định nghĩa là (1 – Rj2), trong đó Rj2 là hệ số tương quan bội khi biến độc lập Fj được dự đoán từ các biến độc lập khác. Nếu (1– Rj2) càng nhỏ thì có dấu hiệu đa cộng tuyến. Hệ số phóng đại phương sai (VIF–Variance Inflation Factor): Hệ số phóng đại phương sai của biến Fj được định nghĩa VIF = 1/(1–Rj2). Nếu VIF>5 thì có dấu hiệu đa cộng tuyến.

Kiểm định giả thuyết phương sai của sai số không đổi: Kiểm định tương quan hạng Spearman’s được sử dụng để xem xét giả thuyết H0: Hệ số tương quan hạng của tổng thể

bằng 0. Nếu kết quả kiểm định giả thuyết H0 không thể bị bác bỏ (Sig. > 0,05), do đó có thể kết luận phương sai của sai số không thay đổi trong mô hình hồi quy. (Phạm Thị Mộng Hằng, 2012).

 Phân tích phương sai ANOVA:

Kỹ thuật phân tích phương sai một yếu tố (One-Way ANOVA) được áp dụng trong nghiên cứu này để tìm ra ý nghĩa thống kê của những khác biệt trung bình giữa biến phụ thuộc là sự lựa chọn và các biến độc lập thuộc đặc tính từng cá nhân như: độ tuổi, trình độ học vấn, tình trạng hôn nhân, mức thu nhập hàng tháng, nghề nghiệp.

Trước khi tiến hành phân tích ANOVA, tiêu chuẩn Levene được tiến hành để kiểm tra giả thuyết bằng nhau của phương sai trong các nhóm với xác suất ý nghĩa Significance là 5%. Trong phép kiểm định này, nếu xác suất ý nghĩa lớn hơn 5% thì chấp nhận tính bằng nhau của các phương sai nhóm.

Tiêu chuẩn Fishier F trong phép phân tích phương sai ANOVA với mốc để so sánh các xác suất ý nghĩa Sig. là 5% được áp dụng. Trong phép kiểm định này, nếu xác suất ý nghĩa nhỏ hơn 5% thì ta có quyền bác bỏ giả thuyết. (Lê Anh Khôi, 2014)

Tóm tắt chương 2

Trong chương này toàn bộ phương pháp nghiên cứu đã được trình bày. Nghiên cứu sơ bộ với kỹ thuật thảo luận nhóm nhằm khám phá ra các yếu tố ảnh hưởng đến sự lựa chọn ngoài những yếu tố được đưa ra trong mô hình nghiên cứu đề xuất để hoàn chỉnh thang đo lường. Nghiên cứu chính thức được thực hiện bằng phương pháp định lượng thông qua bảng câu hỏi phỏng vấn. Thang đo lường sự lựa chọn gửi tiền tiết kiệm của người dân gồm 44 mục hỏi trong 10 yếu tố và một yếu tố "Sự lựa chọn”. Phần mềm xử lý dữ liệu SPSS phiên bản 18.0 được sử dụng để mô tả dữ liệu, đánh giá độ tin cậy, độ giá trị của thang đo lường cũng như thực hiện các thống kê suy luận khác. Chương tiếp theo sẽ tiến hành phân tích dữ liệu và trình bày các kết quả nghiên cứu.

CHƯƠNG 3.KẾT QUẢ NGHIÊN CỨU

Chương này sẽ trình bày kết quả nghiên cứu thông qua việc sử dụng phần mềm Pasw Statistics18 để phân tích dữ liệu đã thu thập được. Các bước thực hiện bao gồm: kiểm định độ tin cậy của thang đo thông qua hệ số Cronbach’s alpha; phân tích nhân tố khám phá EFA; xây dựng mô hình nghiên cứu điều chỉnh bằng phương pháp phân tích hồi quy tuyến tính, kiểm định các giả thiết của mô hình; đánh giá sự khác biệt của các nhân tố ảnh hưởng đến sự lựa chọn gửi tiền tiết kiệm vào ngân hàng của người dân trên địa bàn thành phố Nha Trang.

3.1.Mô tả cơ sở dữ liệu thu thập

Căn cứ bảng câu hỏi khảo sát đã được xây dựng ở Chương 2, tác giả đã tiến hành khảo sát và thu thập dữ liệu đối với người dân trên địa bàn thành phố Nha Trang. Quá trình phát phiếu khảo sát và thu thập dữ liệu được thực hiện từ ngày 01/05/2014 đến ngày 31/08/2014 với tổng số mẫu phát ra 400 mẫu, thu về 380 mẫu, số mẫu hợp lệ là 370 mẫu. Như vậy cơ sở dữ liệu đưa vào xử lý và phân tích là 370 mẫu.

Số mẫu hợp lệ được tiến hành xử lý và phân tích qua phần mềm Pasw Statistics18 (SPSS 18). Trước hết, cần thực hiện việc kiểm tra và làm sạch dữ liệu do quá trình nhập sai, trả lời không phù hợp với nội dung hỏi hoặc trả lời không đầy đủ, ... Sử dụng bảng phân tích tần số để rà soát tất cả các biến quan sát nhằm tìm ra các biến có những thông tin bị sai lệch hay thiếu sót bằng phần mềm SPSS 18. Kết quả cho thấy, không tìm thấy biến nào có thông tin sai lệch. Như vậy, dữ liệu đã được làm sạch và được đưa vào phân tích.

3.2.Mô tả mẫu 3.2.1. Giới tính 3.2.1. Giới tính

Kết quả ở bảng 3.1 cho thấy rằng ở mẫu nghiên cứu số lượng nữ giới và nam giới có tỷ lệ gần bằng nhau, trong đó: số lượng nam giới là 176 người (chiếm 47.6%), nữ giới là 194 người (chiếm 52.4%) trong tổng số 370 người dân trả lời bảng câu hỏi.

GIOI TINH

52.4%

47.6% Nam

Nữ

Bảng 3.1. Thông tin về giới tính của đối tượng nghiên cứu

Giới tính Tần số Phần trăm Phần trăm hợp lệ Phần trăm cộng dồn

Nam 176 47.6 47.6 47.6

Nữ 194 52.4 52.4 100.0

Tổng 370 100.0 100.0

Hình 3.1. Kết cấu mẫu theo giới tính 3.2.2. Theo nhóm tuổi

Trong mẫu thu thập được, độ tuổi được điều tra trả lời bảng câu hỏi nhiều nhất

Phương pháp chọn mẫu và xử lý số liệu

Mô hình nghiêncứu đề xuất

Tóm tắt nghiêncứu và kết quả nghiêncứu