Các phương pháp phân tích dữ liệu

6. Kết cấu của luận văn

2.3.4. Các phương pháp phân tích dữ liệu

2.3.4.1. Phương pháp phân tích độ tin cậy của thang - Hệ số Cronbach’s Alpha

Những mục hỏi đo lường cùng một khái niệm tiềm ẩn thì phải có mối liên quan với những cái còn lại trong nhóm đó. Hệ số  của Cronbach là một phép kiểm định thống kê về mức độ chặt chẽ mà các mục hỏi trong thang đo tương quan với nhau. Công thức của hệ số Cronbach  là:  = N/[1 + (N – 1)]

Trong đó  là hệ số tương quan trung bình giữa các mục hỏi. Ký tự Hy Lạp  (đọc là prô) trong công thức tượng trưng cho tương quan trung bình giữa tất cả các cặp mục hỏi được kiểm tra.

Vì hệ số Cronbach  chỉ là giới hạn dưới của độ tin cậy của thang đo (Nguyễn Đình Thọ và Nguyễn Thị Mai Trang, 2007), và còn nhiều đại lượng đo lường độ tin cậy, độ giá trị của thang đo, nên ở giai đoạn khám phá khi xây dựng bảng câu hỏi, hệ số này nằm trong phạm vi từ 0,6 đến 0,8 là chấp nhận được[21].

2.3.4.2. Phương pháp phân tích nhân tố khám phá (Exploratory Factor Analysis - EFA)

Phân tích nhân tố là tên chung của một nhóm các thủ tục được sử dụng chủ yếu để thu nhỏ và tóm tắt các dữ liệu. Trong nghiên cứu, chúng ta có thể thu thập được một số lượng biến khá lớn và hầu hết các biến này có liên hệ với nhau và số lượng của chúng phải được giảm bớt xuống đến một số lượng mà chúng ta có thể sử dụng được. Liên hệ giữa các nhóm biến có liên hệ qua lại lẫn nhau được xem xét và trình bày dưới dạng một số ít các nhân tố cơ bản. Về mặt tính toán, phân tích nhân tố hơi giống với phân tích hồi quy bội ở chỗ mỗi biến được biểu diễn như là một kết hợp tuyến tính của các nhân tố cơ bản. Lượng biến thiên của một biến được giải thích bởi những nhân tố chung trong phân tích được gọi là communality. Biến thiên chung của các biến được mô tả bằng một số ít các nhân tố chung (common factor) cộng với một nhân tố đặc trưng (unique factor) cho mỗi biến. Những nhân tố này không bộc lộ rõ ràng. Nếu các biến được chuẩn hóa thì mô hình nhân tố được thể hiện bằng phương trình:

Xi A Fí1 1 A Fí2 2  A Fí3 3 ... A Fím m V Ui i

Trong đó:

Xi : biến thứ i chuẩn hóa

Aij : hệ số hồi quy bội chuẩn hóa của nhân tố j đối với biến i

F : các nhân tố chung

Vi : hệ số hồi quy chuẩn hóa của nhân tố đặc trưng i đối với biến i Ui : nhân tố đặc trưng của biến i

m : số nhân tố chung

Các nhân tố đặc trưng có tương quan với nhau và với các nhân tố chung. Bản thân các nhân tố chung cũng có thể được diễn tả như những kết hợp tuyến tính của các biến quan sát:

Fi W Xí1 1W Xí2 2 W Xí3 3 ... W Xík k

Fi : ước lượng trị số của nhân tố thứ i

Wt: quyền số hay trọng số nhân tố (weight or factor score coefficient) k : số biến

Chúng ta có thể chọn các quyền số hay trọng số nhân tố sao cho nhân tố thứ nhất giải thích được phần biến thiên nhiều nhất trong toàn bộ biến thiên. Sau đó ta chọn một tập hợp các quyền số thứ hai sao cho nhân tố thứ hai giải thích được phần lớn biến thiên còn lại, và không có tương quan với nhân tố thứ nhất. Nguyên tắc này được áp dụng như vậy để tiếp tục chọn các quyền số cho các nhân tố tiếp theo. Do vậy các nhân tố được ước lượng sao cho các quyền số của chúng, không giống như các giá trị của các biến gốc, là không có tương quan với nhau. Hơn nữa, nhân tố thứ nhất giải thích được nhiều nhất biến thiên của dữ liệu, nhân tố thứ hai giải thích được nhiều thứ nhì …

Phân tích nhân tố được sử dụng trong nhiều trường hợp.

- Nhận diện các khía cạnh hay nhân tố giải thích được các liên hệ tương quan trong các tập hợp biến. Ví dụ, có thể sử dụng một tập hợp các phát biểu về lối sống để đo lường tiểu sử tâm lý của người tiêu dùng. Sau đó, những phát biểu này được sử dụng trong phân tích nhân tố để nhận diện các yếu tố tâm lý cơ bản.

- Nhận diện một tập hợp gồm một số lượng biến mới tương đối ít không có tương quan với nhau để thay thế tập hợp biến gốc có tương quan với nhau để thực hiện một phân tích đa biến tiếp theo sau. Chẳng hạn, như sau khi nhận diện các nhân tố thuộc về tâm lý thì ta có thể sử dụng chúng như những biến độc lập để giải thích những khác biệt giữa những người trung thành và những người không trung thành với nhãn hiệu sử dụng.

- Để nhận ra một tập hợp gồm một số ít các biến nổi trội từ một tập hợp nhiều biến để sử dụng trong các phân tích đa biến kế tiếp.

2.3.4.3. Phương pháp hồi quy

Các bước phân tích:

Bước 1: Xem xét ma trận hệ số tương quan

Để xem xét mối quan hệ giữa biến phụ thuộc và các biến độc lập thông qua xây dựng ma trận tương quan. Đồng thời ma trận tương quan là công cụ xem xét mối quan hệ giữa các biến độc lập với nhau nếu các biến này có tương quan chặt thì nguy cơ xảy ra hiện tượng đa cộng tuyến cao dẫn đến việc vi phạm giả định của mô hình.

Bước 2: Đánh giá độ phù hợp của mô hình

Thông qua hệ số R2 ta đánh giá độ phù hợp của mô hình xem mô hình trên giải thích bao nhiêu % sự biến thiên của biến phụ thuộc.

R2 =

TSS ESS

ESS: tổng bình phương tất cả các sai lệch giữa giá trị dự đoán của Yi và giá trị trung bình của chúng.

TSS: tổng bình phương sai lệch giữa giá trị Yi và giá trị trung bình của chúng. Khi đưa càng nhiều biến vào mô hình thì hệ số này càng cao. Tuy nhiên, R2 ở hồi quy bội không phản ánh đúng sự phù hợp của mô hình như trong mô hình hồi quy đơn. Lúc này, ta phải sử dụng R2 điều chỉnh để đánh giá sự phù hợp của mô hình.

2 R = 1- (1 - R2 ) k n n  1

Bước 3: Kiểm định sự phù hợp của mô hình

Sử dụng kiểm định F để kiểm định với giả thiết Ho: B1 = B2 = Bn = 0

Nếu giả thiết này bị bác bỏ thì ta có thể kết luận mô hình ta xây dựng phù hợp với tập dữ liệu.

Bước 4: Xác định tầm quan trọng của các biến

Ý tưởng đánh giá tầm quan trọng tương đối của các biến độc lập trong mô hình thông qua xem xét mức độ tăng của R2 khi một biến giải thích được đưa thêm vào mô hình. Nếu mức độ thay đổi này mà lớn thì chứng tỏ biến này cung cấp thông tin độc nhất về sự phụ thuộc mà các biến khác trong phương trình không có được. Ta đánh giá tầm quan trọng của một biến thông qua hai hệ số:

Hệ số tương quan từng phần: căn bậc hai của R2 change. Thể hiện mối tương quan giữa biến Y và X mới đưa vào. Tuy nhiên, sự thay đổi của R2 không thể hiện tỉ lệ phần biến thiên mà một mình biến đó có thể giải thích. Lúc này, ta sử dụng hệ số

tương quan riêng bằng căn bậc hai của Prk2, Prk2=

k 2 k 2 R 1 R R   2 .

Bước 5: Lựa chọn biến cho mô hình

Đưa nhiều biến độc lập vào mô hình hồi quy không phải lúc nào cũng tốt vì những lý do sau (trừ khi chúng có tương quan chặt với biến phụ thuộc):

- Mức độ tăng R2 quan sát không hẳn phản ảnh mô hình hồi quy càng phù hợp hơn với tổng thể.

- Đưa vào các biến không thích đáng sẽ làm tăng sai số chuẩn của tất cả các ước lượng mà không cải thiện được khả năng dự đoán.

Ta sử dụng SPSS để giải quyết vấn đề trên. Các thủ tục chọn biến trên SPSS: phương pháp đưa vào dần, phương pháp loại trừ dần, phương pháp từng bước (là sự kết hợp của hai phương pháp loại trừ dần và đưa vào dần).

Bước 6: Dò tìm sự vi phạm các giả các giả thiết (đã nêu ở trên bằng các xử lý của SPSS).

Ngoài ra, còn sử dụng phân tích chi bình phương một mẫu để tìm ra quy luật phân phối của mẫu và đánh giá độ tin cậy của thang đo thông qua hệ số Crobach’ alpha.

Kết luận chương 2

Chương này trình bày sơ lược về BHXH tỉnh Nghệ An, đánh giá thực trạng và những kết quả đạt được trong công tác tổ chức thực hiện chính sách BHXH TN trên địa bàn tỉnh. Đồng thời trình bày quy trình nghiên cứu của đề tài, phương pháp chọn mẫu, thu thập dữ liệu và các phương pháp phân tích dữ liệu : Phân tích hệ số Cronbachs Alpha, Phân tích EFA, phân tích tương quan và hồi quy về Sự quan tâm tham gia BHXH TN của người buôn bán nhỏ lẻ tại tỉnh Nghệ An.

CHƯƠNG 3: PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU

Với bảng câu hỏi chính thức có được từ kết quả của chương 2, tác giả đã tiến hành khảo sát và thu nhập dữ liệu. Kết quả có 284 mẫu hợp lệ được thu về từ 350 mẫu phát ra trong khoảng thời gian từ ngày 06/2013 đến ngày 07/2013. Số mẫu hợp lệ sẽ được tiến hành xử lý và phân tích với sự giúp đỡ của phần mềm SPSS 15.0. Thủ tục thực hiện trước hết là làm sạch dữ liệu và xử lý các giá trị “bỏ trống”. Lý do: sẽ có những mẫu có nội dung trả lời không phù hợp, hoặc không trả lời đầy đủ các mục hỏi. Sai sót còn có thể xảy ra trong quá trình nhập liệu: nhập sai nội dung, hoặc nhập thiếu mục trả lời. 3.1. Mô tả mẫu - Về giới tính 217 76.41% 67 23.59% Nu Nam Gioi tinh

Nguồn: Điều tra của tác giả

Hình 3.1. Bảng phân bố mẫu theo giới tính

Kết quả cho thấy có 67 nam và 217 nữ tham gia trả lời bảng câu hỏi điều tra. Số lượng nữ giới nhiều hơn nam giới (nữ: 76,4%, nam 23,9%). Tỷ lệ này là khá phù hợp với thực tế về đối tượng buôn bán nhỏ lẻ tại tỉnh Nghệ An đa số nữ.

- Về trình độ học vấn 25 8.80% 58 20.42% 39 13.73% 29.58%84 57 20.07% 21 7.39% dai hoc Cao dang Trung cap Cap 3 Cap 2 Cap 1 Trinh do

Nguồn: Điều tra của tác giả

Hình 3.2. Bảng phân bố mẫu theo trình độ học vấn

Kết quả cho thấy trong tổng số những người tham gia trả lời bảng câu hỏi, về trình độ học vấn đa số là cấp 3 với 84 người chiếm tỷ lệ 29,6%, trình độ cao đẳng là 58 người chiếm tỷ lệ 20,4%, cấp 2 là 57 người chiếm tỷ lệ 20,1%. Còn lại là các trình độ khác. Nhìn chung, phân bố về cơ cấu trình độ học vấn của đối tượng khảo sát là phân bố phủ khá phù hợp với tình hình thực tế tại địa phương.

- Về nghề kinh doanh 14 4.93% 21 7.39% 34 11.97% 26 9.15% 46 16.20% 62 21.83% 81 28.52%

Kinh doanh nho le khac Buon ban thuc pham Buon ban hoa qua, trai cay

Dich vu an uong binh dan Ca phe, nuoc giai khat My pham, quan ao, giay dep

Tap hoa

Nghe nghiep

Nguồn: Điều tra của tác giả

Kết quả bảng phân bố mẫu theo nghề kinh doanh cho thấy: Người lao động buôn bán tạp hóa chiếm tỷ lệ cao nhất là 81 người, tương ứng 28,5%; tiếp theo là buôn bán mỹ phẩm, quần áo, giày dép 62 người, chiếm tỷ lệ 21,8%; tiếp theo là kinh doanh cà phê, nước giải khát 46 người, chiếm tỷ lệ 16,2%; còn lại là các loại hình buôn bán khác. Tỷ lệ này thể hiện được tính đại diện của mẫu khảo sát là khá phù hợp với tình hình thực tế tại tỉnh Nghệ An.

- Về thu nhập

Kết quả trên cho thấy, số lượng người lao động buôn bán nhỏ lẻ có mức thu nhập từ 3 – 5 triệu chiếm tỷ lệ cao nhất với 119 người và tỷ lệ là 41,9%, kế đến là mức thu nhập từ 2 – 3 triệu với 54 người, chiếm tỷ lệ 19,0%. Số người có thu nhập từ 5 - 7 triệu là 47 người chiếm tỷ lệ 16,6%. Còn lại là các nhóm thu nhập khác. Kết quả này là tương đối phản ảnh thực tế rằng mức thu nhập phổ biến của khu vực buôn bán nhỏ lẻ tại tỉnh Nghệ An chỉ ở mức trung bình, với mức tiết kiệm tiềm năng không nhiều.

13 4.58% 47 16.55% 119 41.90% 54 19.01% 31 10.92% 20 7.04%

tu 7 trieu tro len tu 5 den duoi 7 trieu tu 3 den duoi 5 trieu tu 2 den duoi 3 trieu tu 1 den duoi 2 trieu Duoi 1 trieu

Thu nhap

Nguồn: Điều tra của tác giả

- Đã biết đến chính sách BHXH TN 195 68.66% 89 31.34% Biet Chua biet Biet BHXHTN

Nguồn: Điều tra của tác giả

Hình 3.5. Hình phân bố mẫu đã biết đến chính sách BHXH TN

Kết quả mẫu khảo sát cho thấy: Đối tượng đã biết về chính sách BHXH TN là 195 người, chiếm 68,7%, còn lại là đối tượng chưa biết về chính sách BHXH TN 89 người, chiếm 31,3%. Kết quả này phản ảnh công tác tuyên truyền về chính sách BHXH tự nguyện đến với người dân là khá phổ biến, tuy nhiên chưa phủ khắp các khu vực.

- Đã từng tham gia BHXH

Kết quả trên cho thấy cơ cấu đối tượng chưa từng tham gia BHXH chiếm đa số với 239 người tương ứng 84,2%; đối tượng đã từng tham gia BHXH là 45 người, hay 15,8% . Kết quả này là phù hợp với mục tiêu của nghiên cứu.

45 15.85%

239 84.15%

Da tung tham gia Chua tham gia

Tham gia BHXHTN

Nguồn: Điều tra của tác giả

- Về tuổi

Tuổi của các những người buôn bán nhỏ lẻ trên địa bàn Nghệ An trong mẫu biến thiên từ 15 đến khoảng 60. Trong đó nhóm tuổi từ 30 – 45 chiếm đa số, với 146 người, chiếm tỷ lệ 51,41%. Những người từ 45 tuổi trở lên có 78 người, tương ứng 27,46%, còn lại là nhóm tuổi từ 15 đến 30. 78 27.46% 146 51.41% 60 21.13%

Tu 45 tuoi tro len tu 30 den duoi 45 tuoi tu 15 den duoi 30 tuoi

Nhom tuoi

Nguồn: Điều tra của tác giả

Hình 3.7. Hình phân bố mẫu theo độ tuổi

3.2. Giá trị các biến quan sát

Tác giả tiến hành phân tích tiếp các bước thống kê mô tả để đánh giá tổng quát về giá trị của các chỉ báo quan sát. Một trong những giả thiết là yêu cầu các biến quan sát phải có phân phối chuẩn. Điều này yêu cầu hai thông số Skewness và Kurtosis nhỏ hơn 1 (Hồ Huy Tựu, 2007).

Kết quả phân tích điểm trung bình của 34 biến quan sát đều được người lao động buôn bán nhỏ lẻ đánh giá mức trung bình cao (trên 3,0); điểm trung bình thấp nhất là 3,11 (Ttruyen1 – Chính sách BHXHTN được tuyên truyề rộng rãi ở Nghệ An) và điểm trung bình cao nhất là 4,17 (Thaido7 - Tôi nghĩ BHXHTN là chính sách an sinh có ý nghĩa lớn), còn các biến quan sát còn lại đều khá tương đồng nhau, hầu hết đáp ứng tuân theo quy luật phân phối chuẩn, mặc dù một số quan sát có giá trị tuyệt đối Skewness và Kurtosis lớn hơn 1, nhưng mức độ vượt quá là rất nhỏ (nhỏ hơn chuẩn 3,0), vì vậy chúng ta có thể chấp nhận được, đặc biệt khi mẫu nghiên cứu là lớn (> 200).

Bảng 3.1. Các thông số thống kê mô tả của các biến quan sát Skewness Kurtosis N Cỡ mẫu Min Giá trị nhỏ nhất Max Giá trị lớn nhấ Mean Trung bình Statistic Std, Error Statistic Std. Error Thaido1 284 1 5 3,80 -0,843 0,145 1,032 0,288 Thaido2 284 1 5 3,38 -0,250 0,145 -0,777 0,288 Thaido3 284 1 5 3,38 -0,421 0,145 -0,734 0,288 Thaido4 284 1 5 3,82 -0,894 0,145 1,510 0,288 Thaido5 284 1 5 3,90 -1,065 0,145 1,819 0,288 Thaido6 284 1 5 3,56 -0,596 0,145 0,103 0,288 Thaido7 284 1 5 4,17 -1,238 0,145 1,035 0,288 Kyvong1 284 1 5 3,96 -0,647 0,145 0,554 0,288

Giới thiệu về BHXH tỉnh Nghệ An

Nghiên cứu sơ bộ và chính thức