Phương pháp phân tích, xử lý dữ liệu

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân tích các nhân tố ảnh hưởng đến việc chậm nộp thuế đối với hộ kinh doanh trên địa bàn quận bình thủy, thành phố cần thơ (Trang 44 - 51)

3.1 QUY TRÌNH NGHIÊN CỨU

3.2.3 Phương pháp phân tích, xử lý dữ liệu

Luận văn sử dụng phương pháp điều tra chọn mẫu thông qua bảng câu hỏi khảo sát. Dựa trên số liệu thu thập được từ bảng câu hỏi khảo sát, tác giả sẽ phân tích dữ liệu với phần mềm SPSS phiên bản 22 với các phương pháp sau”:

Phương pháp thống kê mô tả

Theo Mai Văn Nam (2008), định nghĩa rằng phương pháp phân tích thống kê mơ tả là các phương pháp có liên quan đến việc thu thập số liệu, tóm tắt, trình bày, tính tốn và mơ tả các đặc trưng khác nhau để phản ánh một cách tổng quát đối tượng nghiên cứu. Các đại lượng thường được dùng mô tả tập dữ liệu như: (1) Đại lượng mô tả mức độ tập trung: mean, mode,median; (2) Đại lượng mô tả mức độ phân tán: Phương sai, độ lệch chuẩn, khoảng biến thiên.

Phương pháp kiểm định độ tin cậy thang đo

Khi sử dụng các thang đo likert để thu thập các thông tin cần thiết cần sử dụng phép thống kê để kiểm tra sự chặt chẽ và tương quan giữa các biến quan sát trong các nhóm nhân tố. Kiểm tra sự tương quan giữa bản thân các biến và tương quan của các điểm số của từng biến với điểm số toàn bộ các biến của mỗi người trả lời.

Theo nghiên cứu của Cronbach (1951), để kiểm định độ tin cậy của thang đo được đánh giá thông qua hệ số Cronbach’s Alpha (α). Ronbach’s Alpha (α) là hệ số tin cậy được sử dụng kiểm định thang đo lường tương quan giữa các cặp biến quan sát. Nghiên cứu của Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2005), đề xuất các giá trị Cronbach’s Alpha để đánh giá độ tin cậy của thang đo như

35

sau: (1) Khi 0,8 ≤ α < 1,0 thì thang đo lường tốt; (2) Khi 0,7 ≤ α < 0,8 thì thang đo sử dụng được; (3) Khi α ≥ 0,6 thì sử dụng được đối với khái niệm nghiên cứu mới. Độ tin cậy của thang đo có hệ số Cronbach’s Alpha đạt tiêu chuẩn α ≥ 0,6 (Peterson, 1994). Việc kiểm định độ tin cậy thang đo có thể được xác định nhờ hệ số tương quan biến tổng (Corrected Item-Total Correclation) nhằm loại bỏ các biến rác khỏi thang đo lường. Hệ số tương quan biển tổng là hệ số tương quan của một biến với điểm trung bình của các biến khác trong cùng một thang đo, do đó hệ số này càng cao thì sự tương quan của biến này với các biến khác trong nhóm càng cao. Theo Nunnally và Burnstein (1994), các biến có hệ số tương quan biến tổng nhỏ hơn 00,3 được coi là biến rác, các biến rác cần loại bỏ, quá trình này được lập lại cho đến khi lựa chọn được hệ số Cronbach’s Alpha tốt nhất.

Phương pháp phân tích nhân tố khám phá

Chúng ta cần nhóm các biến quan sát có các đặc điểm chung vào các nhóm khác nhau, hình thành các nhóm thơng qua phương pháp phân tích nhân tố khám phá. Theo Hair và ctg (1998) (được trính dẫn bởi Nguyễn Quốc Nghi, (2011), định nghĩa rằng phân tích nhân tố khám phá EFA là kỹ thuật phân tích rút gọn một tập hợp gồm nhiều biến quan sát thành một số nhân tố ít hơn nhưng vẫn chứa đựng hầu hết nội dung thông tin và ý nghĩa thống kê của tập biến ban đầu. Mơ hình phân tích nhân tố EFA được thể hiện bằng phương trình:

Yi = ai1F1 + ai2F2 + ....+ aijFj + ViUi Trong đó:

Yi : Biến quan sát thứ i

aij : Hệ số hồi quy bội của nhân tố j đối với biến i Fj : Nhân tố chung

Vi : Hệ số hồi qui nhân tố của biến i Ui : Nhân tố đặc trưng của biến i

Mơ hình phân tích nhân tố EFA được cho là phù hợp khi các tiêu chuẩn sau đây được thỏa điều kiện: (1) Hệ số tải nhân tố (Factor Loadings): là những hệ số tương quan đơn giữa các biến và các nhân tố. Theo Hair & ctg (1998), hệ số tải nhân tố là chỉ tiêu để đảm bảo mức ý nghĩa thiết thực của EFA. Hệ số tải nhân tố

36

lớn hơn 0,3 được xem là đạt được mức tối thiểu, hệ số tải nhân tố lớn hơn 0,4 được xem là quan trọng và lớn hơn 0,5 được xem là có ý nghĩa thực tiễn. Cũng theo Theo Hair & ctg, hệ số tải nhân tố lớn hơn 0,3 được cho là phù hợp với quy mô mẫu lớn hơn 350 số quan sát, nếu cỡ mẫu khoảng 100 thì nên chọn tiêu chuẩn hệ số tải nhân tố > 0,55 nếu cỡ mẫu của bạn khoảng 50 thì hệ số tải nhân tố phải > 0,75, (2) Tính thích hợp của EFA bằng kiểm định KMO (Kaiser – Meyer – Olkin): là chỉ số dùng xem xét sự thích hợp của phân tích nhân tố nếu 0,5 ≤ KMO ≤ 1 (Hair và ctg, 1998) (Trích bởi Hồng Trọng và Chu Nguyễn Mộng Ngọc( 2008), (3) Kiểm định Bartlett: kiểm định các biến khơng có tương quan với nhau trong tổng thể. Ý nghĩa kiểm định Bartlett cho biết nếu bác bỏ giả thuyết H0: đại lượng Chi-Square lớn, ý nghĩa thống kê nhỏ hơn 0,05 thì phân tích nhân tố là thích hợp, (4) Phương sai cộng dồn (cumulative of variance): là phần trăm phương sai tồn bộ được giải thích bởi các nhân tố, nghĩa là coi biến thiên 100% thì giá trị này cho biến phân tích nhân tố cơ đọng được bao nhiêu % và bị thất thoát bao nhiêu %. Tiêu chuẩn để chấp nhận phân tích nhân tố có phương sai cộng dồn lớn hơn 50% với Eigenvalue phải lớn hơn 1 (Gerbing và Anderson, 1988).

Phương pháp phân tích bảng chéo

Theo Lưu Thanh Đức Hải và Võ Thị Thanh Lộc (2000), định nghĩa rằng phân tích bảng chéo là một kỹ thuật thống kê mô tả hai hay ba biến cùng lúc và bảng kết quả phản ánh sự kết hợp hai hay nhiều biến có số lượng hạn chế trong phân loại hoặc trong giá trị phân biệt. Mô tả dữ liệu bằng Cross- tabulation được sử dụng rất rộng rãi trong nghiên cứu. Phân tích bảng chéo có 2 dạng như sau: (1) Bảng phân tích Cross-tabulation 2 biến cịn được gọi là bảng tiếp liên, mỗi ơ trong bảng chứa đựng sự kết hợp phân loại của hai biến; (2) Bảng phân tích Cross - tabulation hai biến chưa được kết luận rõ ràng, ta cần tiến hành xử lý 3 biến. Như vậy, việc giới thiệu thêm biến thứ ba là để làm rõ hơn sự kết hợp hai biến ban đầu.

37

Kiểm định mẫu theo từng cặp

Phép kiểm định giả thuyết về trung bình của tổng thể, được dùng trong trường hợp ta muốn kiểm định giả thuyết về sự bằng nhau của 2 trung bình tổng thể dựa trên 2 mẫu độc lập rút từ 2 tổng thể này.

Trong kiểm định Independent-Samples T-Test ta có 1 biến định lượng để tính trung bình và 1 biến định tính dùng để chia nhóm ra so sánh.

Các bước khi thực hiện kiểm định Independent-SamplesT-Test bao gồm: - Bước 1: Đặt giả thuyết Ho: “Giá trị trung bình của 2 biến tổng thể là như nhau”.

- Bước 2: Thực hiện kiểm định Independent-Samples T-Test

- Bước 3: Tìm giá trị Sig tương ứng với kiểm định sự bằng nhau của 2 phương sai tổng thể Levene đã tính được:

+ Nếu Sig < α thì phương sai giữa 2 nhóm đối tượng là khác nhau, ta sẽ sử dụng kết quả kiểm định t ở phần Equal variances not assumed.

+ Nếu Sig ≥ α thì phương sai giữa 2 nhóm đối tượng là không khác nhau, ta sẽ sử dụng kết quả kiểm định t ở phần Equal variances assumed.

- Bước 4: So sánh giá trị Sig của kiểm định t được xác định ở bước 3 với xác suất α:

+ Nếu Sig ≥ α thì ta chấp nhận giả thuyết Ho + Nếu Sig < α thì ta bác bỏ giả thuyết Ho

Phân tích hồi quy nhị phân

Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), với mơ hình hồi quy BinaryLogicstic, thơng tin chúng ta cần thu thập về biến phụ thuộc là sự kiện nào đó có xảy ra hay khơng, biến phụ thuộc Y chỉ có 2 giá trị là 0 và 1, với 0 là không xảy ra sự kiện ta quan tâm và 1 là có xảy ra và tất nhiên là cả thông tin về các biến độc lập X. Từ biến phụ thuộc nhị phân này, một thủ tục sẽ được dự đoán xác suất sự kiện xảy ra theo quy tắc nếu xác suất được dự đốn lớn hơn 0,5 thì kết quả sẽ cho là “có” xảy ra sự kiện, ngược lại thì kết quả dự đốn sẽ là “khơng”.

38 Mơ hình hàm Binary Logicstic như sau:

Pi = E(Y = 1/X) = ( ) ) ( 1 0 1 0 1 B BX X B B e e   

Trong đó Pi = E(Y = 1/X) = P(Y = 1) gọi là xác suất để sự kiện xảy ra (Y = 1) khi biến độc lập X có giá trị cụ thể là Xi.

Đặt ký hiệu biểu thức (B0 + B1X) là z, ta viết lại mơ hình hàm Binary Logistic như sau:

P(Y = 1) = z z e e  1

Vậy xác suất không xảy ra sự kiện sẽ là P(Y = 0) = 1 - P(Y = 1) = 1 - z z e e  1

Thực hiện phép so sánh giữa xác suất của sự kiện xảy ra với xác suất sự kiện đó khơng xảy ra, tỷ lệ này có thể được thể hiện trong cơng thức

z z z z e e e e y P Y P       1 1 1 ) 0 ( ) 1 (

, lấy log cơ số e hai vế của phương trình rồi thực hiện biến đổi vế phải ta được kết quả

loge[ ( 0) ) 1 (   Y P Y P

] = logeez, vì logeez = z nên kết quả cuối cùng sẽ là

loge[ ( 0) ) 1 (   Y P Y P ] = B0 + B1X

Hay viết cách khác: loge[1 P1

Pi

 ] = B0 + B1X là dạng hàm hồi quy Binary Logistic. Hàm này có thể mở rộng mơ hình Binary Logistic cho hai hay nhiều biến độc lập Xk.

P0 : Xác suất ban đầu Pt: Xác suất thay đổi

Pt = P0e

B

1- P0 (1-eB)

39

Độ phù hợp của mơ hình:

Hồi quy Binary Logistic địi hỏi phải đánh giá độ phù hợp của mơ hình. Đo lường độ phù hợp tổng qt của mơ hình Binary Logistic dựa trên chỉ tiêu -2LL (-2 Log likelihood), thước đo này có ý nghĩa giống như SSE (Sum of squares of erro) nghĩa là càng nhỏ càng tốt, độ phù hợp của mơ hình càng cao khi chỉ số - 2LL bằng 0, tức là khơng có sai số, mơ hình hồn hảo.

Kiểm định ý nghĩa của các hệ số:

Hồi quy Binary Logistic cũng đòi hỏi kiểm định giả thuyết hệ số hồi quy khác không, nếu hế số hồi quy β0 và β1 đều bằng 0 thì tỷ lệ chênh lệch giữa các xác suất sẽ bằng 1, tức xác suất để sự kiện xảy ra và không xảy ra là như nhau, lúc đó mơ hình hồi quy là khơng có ý nghĩa trong việc dự đoán.

Khác với hồi quy tuyến tính kiểm định t để kiểm định giả thuyết H0: βk= 0, Binary Logistic dùng đại lượng Wald Chi Square để kiểm định ý nghĩa thông kê của hệ số hồi quy tổng thể. Cách sử dụng mức ý nghĩa Sig. Cho kiểm định Wald Chi Square cũng theo quy tắc thông thường. Wald Chi Square được tính bằng cách lấy ước lượng của hệ số hồi quy của biến độc lập trong mơ hình (hệ số hồi quy mẫu) binary logistic chia cho sai số chuẩn của ước lượng hệ số hồi quy nay, sau đó bình phương lên theo cơng thức sau

Wald Chi Square =

2 ) s.e.(       = 2 s.e.(B) B       Kiểm định độ phù hợp tổng quát:

Kiểm định tổng thể các giả thuyết dựa vào Sig. (trong bảng Omnibus Tests of Model Coefficients), nếu Sig. ≤ 0,05 (tương đương độ tin cậy 95%), có thể an tồn bác bỏ giả thuyết H0: β1= β2=... βk= 0, tỷ lệ xác suất giữa các sự kiện khác 1, tức là xác suất để các sự kiện xảy ra hay khơng xảy ra là có khác nhau.

Kiểm định mức ý nghĩa của các hệ số tương ứng với các biến độc lập, bằng kiểm định Wald Chi – square bằng giá trị Sig. (trong bảng Variables in the Equation), nếu Sig. ≤ 0,05 (độ tin cậy 95%), thì an tồn bác bỏ H0. Như vậy các hệ số hồi quy tìm được có ý nghĩa và mơ hình được sử dụng tốt.

40

Tóm tắt chương 3

Ở chương 3 tác giả đã mơ tả các phương pháp nghiên cứu trong q trình thực hiện đề tài. Đề tài được thực hiện qua hai giai đoạn là nghiên cứu định tính và nghiên cứu định lượng.

Nghiên cứu định tính sử dụng phương pháp thảo luận nhóm để định hướng cho nghiên cứu định lượng. Từ kết quả nghiên cứu định tính, các biến độc lập được xác định và sàng lọc. Nghiên cứu định tính để xác định mối quan hệ giữa biến độc lập và biến phụ thuộc trong mơ hình lý thuyết, đồng thời điều chỉnh và hồn thiện Bảng câu hỏi là cơng cụ cho nghiên cứu định lượng. Căn cứ vào các nghiên cứu và kinh nghiệm, tác giả đề xuất cỡ mẫu nghiên cứu và kỹ thuật để xử lý dữ liệu cho nghiên cứu. Quy mô mẫu được xác định là 216 hộ kinh doanh để đánh giá độ tin cậy của thang đo bằng hệ số Cronbach’s Alpha, phương pháp phân tích nhân tố khám phá EFA, kiểm định mối tương quan giữa các nhân tố và sự tuân thủ thuế của NTT trong mơ hình thơng qua mơ hình hồi quy tuyến tính.

Tất cả các bước thực hiện trong suốt quá trình nghiên cứu được diễn giải cụ thể trong chương này. Kết quả phân tích, bình luận, đánh giá cho các nội dung liên quan được đề cập trong chương 4

41

CHƯƠNG 4

KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân tích các nhân tố ảnh hưởng đến việc chậm nộp thuế đối với hộ kinh doanh trên địa bàn quận bình thủy, thành phố cần thơ (Trang 44 - 51)

Tải bản đầy đủ (PDF)

(116 trang)