Kiểm tra làm sạch dữ liệu

Một phần của tài liệu Luận văn thạc sĩ UEH các yếu tố tác động đến ý định sử dụng dịch vụ chính phủ điện tử nghiên cứu trường hợp ngành thuế tỉnh long an (Trang 37)

Sau khi hoàn chỉnh điều tra, tác giả tiến hành kiểm tra rà soát dữ liệu. Những bảng câu hỏi chưa được trả lời đầy đủ hoặc theo cảm tính sẽ bị loại bỏ để kết quả phân tích khơng bị sai lệch. Sau khi nhập dữ liệu thô vào phần mềm Excel và làm

sạch giữ liệu. Phần mềm SPSS 20.0 được sử dụng để phân tích dữ liệu, sử dụng bảng tần số để phát hiện những ô trống hoặc những giá trị trả lời không nằm trong thang đo, khi đó, cần kiểm tra lại bảng câu hỏi và hiệu chỉnh cho phù hợp.

3.5.1. Kiểm tra phân phối chuẩn và Outliers

Tiến hành kiểm tra phân phối chuẩn và Outliers nhằm chuẩn hóa dữ liệu để tiến hành các bước kiểm tra tiếp theo, có nhiều cách để nhận biết một phân phối chuẩn trong SPSS.

(1) Đơn giản nhất là xem biểu đồ với đường cong chuẩn (Histograms with normal curve) với dạng hình chng đối xứng với tần số cao nhất nằm ngay giữa và các tần số thấp dần nằm ở hai bên. Trị trung bình (mean) và trung vị (mediane) gần bằng nhau và độ xiên (skewness) gần bằng zero.

(2) Vẽ biểu đồ xác suất chuẩn (normal Q-Q plot). Phân phối chuẩn khi biểu đờ xác suất này có quan hệ tuyến tính (đường thẳng).

(3) Dùng phép kiểm định Kolmogorov-Smirnov khi cỡ mẫu lớn hơn 50 hoặc phép kiểm Shapiro-Wilk khi cỡ mẫu nhỏ hơn 50. Được coi là có phân phối chuẩn khi mức ý nghĩa (Sig.) lớn hơn 0,05.

3.5.2. Đánh giá độ tin cậy và độ giá trị của thang đo

Độ tin cậy là mức độ mà thang đo được xem xét là nhất quán và ổn định (Parasuraman, 1991). Hay nói cách khác, độ tin cậy của một phép đo là mức độ mà phép đo tránh được sai số ngẫu nhiên. Trong nghiên cứu này, để đánh giá độ tin cậy (reliability) của từng thang đo, đánh giá độ phù hợp của từng mục hỏi (items) hệ số tương quan Alpha của Cronbach (Cronbach’s Coefficient Alpha) được sử dụng. Khi đánh giá độ phù hợp của từng item, những item nào có hệ số tương quan biến tổng (item-total correlation) lớn hơn hoặc bằng 0,3 được coi là những item có độ tin cậy bảo đảm (Nguyễn Công Khanh, 2005), các item có hệ số tương quan biến tổng nhỏ hơn 0,3 sẽ bị loại bỏ ra khỏi thang đo.

Khi đó, với những biến quan sát có hệ số tương quan biến tổng phù hợp lớn hơn 0,3 (Hair, theo Võ Đức Chín). Hệ số Cronbach’s Alpha lớn hơn 0,6 được xem là có thể sử dụng để đưa vào phân tích ở bước tiếp theo vì khái niệm đang đo lường

tương đối mới trong bối cảnh nghiên cứu (Nunally, Perterson, Slater theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008). Hệ số Cronbach’s Alpha từ 0,7 đến gần 0,8 là sử dụng được và từ 0,8 đến gần 1 là tốt. Đối với các mục hỏi không phù hợp sẽ được loại khỏi mơ hình để đạt được hệ số Cronbach’s Alpha đủ tiêu chuẩn.

3.5.3. Phân tích phương sai (ANOVA- Analysis of Variance)

Phân tích phương sai ANOVA là phương pháp so sánh trị trung bình của ba nhóm trở lên. Có hai kỹ thuật phân tích phương sai : ANOVA một y ếu tố (một biến yếu tố để phân loại các quan sát thành các nhóm khác nhau) và ANOVA nhiều yếu tố (2 hay nhiều biến để phân loại). Kỹ thuật phân tích phương sai một yếu tố (One- Way ANOVA) được áp dụng trong nghiên cứu này để tìm ra ý nghĩa thống kê của những khác biệt trung bình giữa biến phụ thuộc là Ý định sử dụng. Trước khi tiến hành phân tích ANOVA, tiêu chuẩn Levence được tiến hành để kiểm tra giả thuyết bằng nhau của phương sai trong các nhóm với xác suất ý nghĩa Sig. (Significance) là 5%. Trong phép kiểm định này, nếu xác suất ý nghĩa lớn hơn 5% thì chấp nhận tính bằng nhau của các phương sai nhóm. Bên cạnh đó, để đảm bảo các kết luận rút ra trong nghiên cứu này, phép kiểm định phi tham số Kruskal - Wallis cũng được tiến hành nếu giả định tổng thể có phân phối chuẩn khơng được đáp ứng trong phân tích ANOVA.

3.6. Phân tích độ tin cậy (Cronbach Alpha)

Phân tích độ tin cậy Cronbach’s Alpha là một phép kiểm định thống kê nhằm kiểm tra sự chặt chẽ và tương quan giữa các biến quan sát , đánh giá độ tin cậy của thang đo. Giá trị đóng góp của các biến quan sát nhiều hay ít được phản ánh thông qua hệ số tương quan biến tổng (Corrected Item – Total Correlation). Qua đó, cho phép loại bỏ những biến khơng phù hợp trong mơ hình nghiên cứu.

Tiêu chuẩn để chấp nhận các biến:

Những biến có chỉ số tương quan biến tổng phù hợp (Corrected Item – Total Correlation) từ 0,3 trở lên.

Về mặt lý thuyết nhà nghiên cứu có thể được xây dựng từ một nhóm câu hỏi khác nhau. Tuy nhiên đó là lý thuyết, về mặt thực tế có thể trong những câu hỏi có những câu hỏi khơng cần thiết. Để kiểm tra việc này thông thường người ta sử dụng hai chỉ số thống kê là (1) Hệ số Cronbach Alpha và (2) hệ tố tương quan biến tổng. Hệ số Cronbach Alpha là hệ số cho phép đánh giá xem nếu đưa các biến quan sát nào đó thuộc về một biến nghiên cứu (biến tiềm ẩn, nhân tố) thì nó có phù hợp không. Hệ số Cronbach Alpha < 0,6, các thang đo của nhân tố là khơng phù hợp (có thể trong mơi trường nghiên cứu đối tượng khơng có cảm nhận về nhân tố đó); Hệ số Cronbach Alpha nằm trong khoảng (0,6;0,7), chấp nhận được với các nghiên cứu mới; Hệ số Cronbach Alpha nằm trong khoảng (0,7;0,8), chấp nhận được; Hệ số Cronbach Alpha nằm trong khoảng (0,8;0,95), tốt nhưng Hệ số Cronbach Alpha >= 0,95, chấp nhận được nhưng không tốt, nên xét xét các biến quan sát có thể có hiện tượng “trùng biến” (Hair, 2006).

Hệ số tương quan biến tổng là hệ số cho biến mức độ “liên kết” giữa một biến quan sát trong nhân tố với các biến cịn lại. Nó phản ánh mức độ đóng góp vào giá trị khái niệm của nhân tố một biến quan sát cụ thể. Tiêu chuẩn để đánh giá một biến có thực sự đóng góp giá trị vào nhân tố hay khơng là hệ số tương quan biến tổng phải lớn hơn 0,3. Nếu biến quan sát có hệ số tương quan biến tổng nhỏ hơn 0,3 thì phải loại nó ra khỏi nhân tố đánh giá.

Hệ số Cronbach’s Alpha trích trong (Nguyễn Đình Thọ & Nguyễn Thị Mai Trang, 2007) được tính theo cơng thức sau:

2 1 2 (1 ) 1 k i i T k k σ α σ = = − − ∑ Trong đó: α: Hệ số Cronbach’s Alpha k: Số mục hỏi trong thang đo

2

T

2

i

σ : Phương sai của mục hỏi thứ i

3.7. Phân tích nhân tố khám phá EFA

Sau khi đánh giá độ tin cậy của hệ số Cronbach's Alpha để loại đi các biến khơng đảm bảo độ tin cậy. Phân tích nhân tố khám phá được sử dụng nhằm thu nhỏ và tóm tắt các dữ liệu. Phương pháp này rất có ích trong việc xác định các tập hợp biến cần thiết cho vấn đề nghiên cứu và được sử dụng để tìm mối quan hệ giữa các biến với nhau.

Phân tích nhân nhân tố khám phá EFA (Exploratory Factor Analysis) được sử dụng để đánh giá độ giá trị của thang đo (Nguyễn Công Khanh, 2005). Các biến có hệ số tương quan đơn giữa biến và các nhân tố nhỏ hơn 0,5 sẽ bị loại (Hair và cộng sự, 1998, được trích bởi Nguyễn Đình Thọ và Nguyễn Thị Mai Trang, 2007). Phương pháp trích “Principal Component Analysis” được sử dụng kèm với phép quay “Varimax”, chỉ có những nhân tố nào có Eigenvalue lớn hơn 1 mới được giữ lại trong mơ hình nghiên cứu (Hồng Trọng và Chu Nguyễn Mộng Ngọc, 2008).

3.8. Phân tích tương quan

Ta có thể dùng kiểm định sự tự tương quan vì một số lý do dẫn đến sự tờn tại của phần dư đó là các biến có ảnh hưởng khơng được đưa vào mơ hình, chọn dạng tuyến tính cho mối quan hệ lẽ ra là phi tuyến tính, sai số trong đo lường các biến… Các vấn đề này có thể dẫn đến tương quan chuỗi trong sai số và tương quan này gây ra tác động sai lệch nghiêm trọng đến mơ hình hời quy tuyến tính (Hồng Trọng và Chu Nguyễn Mộng Ngọc, 2008). Vì thế phải kiểm định xem có sự tự tương quan giữa các phần dư này không.

Để biết được biến phụ thuộc có tương quan tuyến tính với các biến độc lập, cũng như giữa các biến độc lập với nhau. Người ta sử dụng một số thống kê có tên là hệ số tương quan Pearson, ký hiệu: r (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008). Giá trị r nằm trong đoạn [-1 ÷ 1], giá trị tuyệt đối của r càng gần 1 thì tương quan tuyến tính là chặt chẽ và khi r = 0 thì khơng có mối liên hệ tương quan tuyến tính giữa biến phụ thuộc và các biến độc lập. Mặc khác, nếu giữa các biến độc lập

cũng có tương quan lớn với nhau thì đó cũng là dấu hiệu cho biết giữa chúng có thể xảy ra hiện tượng đa cộng tuyến trong mơ hình hời quy tuyến tính.

3.9. Phân tích phương sai (ANOVA)

Kỹ thuật phân tích phương sai một yếu tố (One-Way ANOVA) được áp dụng trong nghiên cứu này để tìm ra ý nghĩa thống kê của những khác biệt trung bình giữa biến phụ thuộc là ý định sử dụng. Trước khi tiến hành phân tích ANOVA, tiêu chuẩn Levence được tiến hành để kiểm tra giả thuyết bằng nhau của phương sai trong các nhóm với xác suất ý nghĩa Sig. (Significance) là 5%. Trong phép kiểm định này, nếu xác suất ý nghĩa lớn hơn 5% thì chấp nhận tính bằng nhau của các phương sai nhóm. Bên cạnh đó, để đảm bảo các kết luận rút ra trong nghiên cứu này, phép kiểm định phi tham số Kruskal - Wallis cũng được tiến hành nếu giả định tổng thể có phân phối chuẩn khơng được đáp ứng trong phân tích ANOVA.

3.10. Phân tích hời quy

Sau khi đánh giá độ tin cậy của thang đo bằng hệ số Cronbach Alpha và loại đi các biến không đảm bảo độ tin cậy, dị tìm các phạm vi giả định cần thiết trong mơ hình hời quy tuyến tính như kiểm tra hệ số phóng đại phương sai VIF (Variance inflation factor – VIF). Nếu các giả định không bị vi phạm, mơ hình hời quy tuyến tính được xây dựng. Và hệ số R2 đã được điều chỉnh (adjusted R square) cho biết mơ hình hời quy được xây dựng phù hợp đến mức nào. Mơ hình hời quy có dạng như sau: Yi= β0+ β1X1i+ β2X2i+ β3X3i+ … + βkXki + ɛi Trong đó: Yi: biến phụ thuộc Xk: các biến độc lập β0: hằng số βk: các hệ số hời quy

TĨM TẮT CHƯƠNG 3

Tác giả đã trình bày cụ thể về quy trình nghiên cứu, thang đo các yếu tố trong mơ hình nghiên cứu và phương pháp kiểm định thang đo. Nghiên cứu định lượng với kỹ thuật thu thập dữ liệu bằng cách phỏng vấn thông qua bảng câu hỏi. Bảng câu hỏi sẽ là công cụ dùng để điều tra, thu thập dữ liệu cho các bước nghiên cứu chính thức. Chương tiếp theo tác giả sẽ trình bày kết quả nghiên cứu.

CHƯƠNG 4 KẾT QUẢ NGHIÊN CỨU 4.1. Làm sạch dữ liệu và mô tả mẫu

4.1.1. Làm sạch dữ liệu

Bảng câu hỏi được gửi đến trực tiếp cho các doanh nghiệp đang hoạt động trên địa bàn tỉnh Long An. Sau khi thu thập được đủ số phiếu theo yêu cầu, tác giả đã tiến hành làm sạch dữ liệu, mã hóa những thơng tin cần thiết trong bảng câu hỏi, nhập liệu và phân tích dữ liệu bằng phần mềm SPSS 20.0.

Bảng 4.1. Tất cả các biến định lượng quan sát

Câu hỏi Giá tr Giá tr thiếu sót Nh nhất Lớn nhất Giá tr trung bình Độ lệch

chuẩn Độ xiên Độ nhọn

SD1 130 0 1 7 5.30 1.211 -0.491 0.424 SD2 130 0 1 7 4.96 1.133 -0.198 0.429 SD3 130 0 1 7 5.41 1.173 -0.539 0.289 SD4 130 0 2 7 5.35 1.219 -0.292 -0.287 SD5 130 0 2 7 5.30 1.146 -0.409 0.087 HD1 130 0 1 7 5.34 1.104 -1.039 2.318 HD2 130 0 2 7 4.93 1.057 0.020 -0.363 HD3 130 0 2 7 5.53 0.925 -0.539 0.847 HD4 130 0 1 7 5.33 1.044 -0.825 1.450 TC1 130 0 2 7 4.34 1.132 -0.131 -0.119 TC2 130 0 2 7 4.57 1.268 -0.198 -0.288 TC3 130 0 1 7 4.70 1.150 -0.614 0.216 CN1 130 0 1 7 5.20 1.179 -1.392 2.754 CN2 130 0 2 7 4.98 1.056 -0.770 0.637 CN3 130 0 2 7 4.89 1.227 -0.430 -0.217 XH1 130 0 1 7 4.92 1.031 -0.404 1.291 XH2 130 0 2 7 4.96 1.088 -0.179 -0.483 XH3 130 0 2 7 4.88 1.031 -0.067 0.140 YD1 130 0 2 7 4.90 1.140 0.008 -0.575 YD2 130 0 1 7 5.03 1.081 -0.189 0.484 YD3 130 0 1 7 4.97 1.116 -0.191 0.317 Giá trị N 130

Kết quả kiểm tra làm sạch dữ liệu: Valid: giá trị hợp lệ là 130 đầy đủ Missing: giá trị thiếu sót, khơng có Minimum: giá trị nhỏ nhất, phù hợp Maximum: giá trị lớn nhất, phù hợp Mean: giá trị trung bình, phù hợp Std. deviation: độ lệch chuẩn,

Skewness: độ xiên dao động từ -1 đến +1, có thể các biến quan sát trên là phân phối chuẩn.

Kurtosis: độ nhọn của đồ thị tương đối phù hợp

4.1.2. Mô tả mẫu

Số mẫu phát đi 150 mẫu bằng giấy. Số mẫu thu hồi được 150 mẫu. Sau khi kiểm tra có 20 mẫu khơng đạt u cầu bị loại ra (chủ yếu là do thông tin trả lời khơng đầy đủ hoặc do các bảng có nội dung bị trùng lặp). Mẫu đưa vào khảo sát là 130 lớn hơn yêu cầu tối thiểu là 110, do đó đạt u cầu đặt ra về kích thước mẫu cần thiết.

Bảng 4.2. Đặc điểm của mẫu khảo sát của các biến định tính.

Chỉ tiêu

Giới tính Số lượng (người) Tỷ lệ (%)

Nam 71 54,61

Nữ 59 45,39

Thâm niên cơng tác trước đó

Dưới 1 năm 0

Từ 1-5 năm 57 43,84 Từ 5-10 năm 73 56,16 Trên 10 năm

Thâm niên công tác hiện tại

Dưới 1 năm 0

Từ 1-5 năm 64 49,23 Từ 5-10 năm 66 50,77 Trên 10 năm 0

Kết quả kiểm tra:

Thông tin thể hiện ở bảng 4.2 cho thấy giới tính, độ tuổi và kinh nghiệm làm việc của doanh nghiệp được khảo sát là phù hợp với thực tế và có thể đại diện cho tổng thể nghiên cứu. Họ có kinh nghiệm làm việc khá lâu tại doanh nghiệp (từ 5 năm trở lên chiếm 50,77%) và trình độ tương đối cao họ hồn tồn có thể hiểu và trả lời được những câu hỏi trong phiếu khảo sát và thơng tin mà họ cung cấp hồn tồn có thể dùng cho phân tích.

4.2. Đánh giá độ tin cậy của thang đo bằng hệ số Cronbach’s Alpha

Một phép đo có độ tin cậy tốt là điều kiện cần chứ chưa phải là điều kiện đủ đảm bảo cho phép đo đó có hiệu lực tốt (Nguyễn Cơng Khanh, 2005). Đề tài sử dụng hệ số Cronbach’s Alpha để đánh giá độ tin cậy của thang đo. Kết quả kiểm định Cronbach’s Alpha cho các thang đo như sau:

4.2.1. Thang đo về dễ dàng sử dụng

Bảng 4.3. Cronbach’s Alpha thang đo về dễ dàng sử dụng.Biến Biến

quan sát

Trung bình thang đo nếu

loại biến

Phương sai thang đo nếu

loại biến Tương quan biến tổng Cronbach's Alpha nếu loại biến Mức độ dễ dàng sử dụng: Alpha = .859 SD1 21.0462 14.277 0,700 0,823 SD2 21.3769 15.260 0,633 0,840 SD3 20.9308 14.220 0,741 0,812 SD4 20.9923 15.077 0,590 0,852 SD5 21.0385 14.549 0,718 0,819

Theo Bảng 4.3 ta có hệ số độ tin cậy Alpha của thang đo về dễ dàng sử dụng là 0,859 lớn hơn 0,6 cho nên thang đo này đạt tiêu chuẩn. Hơn nữa, các biến đều có hệ số tương quan biến tổng đều cao, phần lớn các hệ số này từ 0,812 đến 0,840 lớn hơn 0,3. Như vậy, thang đo về dễ dàng sử dụng đều phù hợp và đạt được độ tin cậy.

4.2.2. Thang đo về Mức độ hữu dụng

Bảng 4.4. Cronbach’s Alpha thang đo về Mức độ hữu dụng.Biến Biến

quan sát

Trung bình thang đo nếu

loại biến

Phương sai thang đo nếu

loại biến Tương quan biến tổng Cronbach's Alpha nếu loại biến Mức độ hữu dụng: Alpha = .874

HD1 15.7923 6.910 0,740 0,834 HD2 16.2077 7.267 0,709 0,846 HD3 15.6077 7.822 0,725 0,842 HD4 15.8077 7.149 0,750 0,830

Theo Bảng 4.4 ta có hệ số độ tin cậy Alpha của thang đo về Mức độ hữu dụng là 0,874 lớn hơn 0,6 cho nên thang đo này đạt tiêu chuẩn. Hơn nữa, các biến đều

Một phần của tài liệu Luận văn thạc sĩ UEH các yếu tố tác động đến ý định sử dụng dịch vụ chính phủ điện tử nghiên cứu trường hợp ngành thuế tỉnh long an (Trang 37)