3.5.1. Thiết kế thang đo
Mô hình ẫ
Mẫu phi xác suất
- Lấy mẫu thuận tiện - Lấy mẫu tích lũy nhanh - Lấy mẫu kiểm tra tỷ lệ - Lấy mẫu phán đoán
Mẫu xác suất
- Lấy mẫu ngẫu nhiên giản đơn - Lấy mẫu có hệ thống
- Lấy mẫu theo vùng lãnh thổ - Lấy mẫu ngẫu nhiên theo tầng
Trong nghiên cứu khoa học và xã hội, đo lường là cách thức sử dụng các con số để diễn tả các hiện tượng khoa học mà chúng ta cần nghiên cứu. Stevens (1951) đã chia các thanh đo thành 4 cấp độ là (1) Thang đo định danh ; (2) Thang đo thứ bậc ; (3) Thang đo khoảng cách; (4) Thang đo tỷ lệ ; trong đó thang định danh và thứ bậc là thuộc nhóm định tính và khoảng cách và tỷ lệ là thuộc nhóm định lượng.
Thang đo định danh, Đây là loại thang đo có mức độ đo lường yếu nhất. Thực chất của nó là gán cho các biểu hiện cùng loại của tiêu thức nghiên cứu một con số giống nhau. Như vậy, để xây dựng được thang đo này, ta chỉ cần thiết lập được mối quan hệ bằng nhau hoặc không bằng nhau giữa các đơn vị của hiện tượng nghiên cứu theo dấu hiệu được đo để phân chia chúng thành các lớp không cắt nhau mà không cần theo một trật tự xác định nào. Ví dụ: Với tiêu thức giới tính chỉ có hai loại nam và nữ.
Thang đo thứ bậc, đây là thang đo định danh nhưng giữa các biểu hiện của tiêu thức có quan hệ hơn kém, cao thấp. Giả sử có các điểm A, B, C, D theo thứ tự lần lượt trên thang đo thứ bậc, nếu đã có A lớn hơn B, thì A lớn hơn C và C cũng lớn hơn D. Loại thang đo này cũng được dùng rất nhiều trong các nghiên cứu xã hội, để đo các tiêu thức mà các biểu hiện có quan hệ thứ tự như đo thái độ, quan điểm của con người đối với một hiện tượng xã hội nào đó.
Thang đo khoảng, Là thang đo thứ bậc có các khoảng cách đều nhau nhưng không có điểm gốc là 0. Nếu có các điểm A, B, C, D xếp lần lượt trên thang đo khoảng, và thoả mãn A > B, B > C thì cũng sẽ có A - B = B - C. Hiệu số giữa hai điểm đứng liền nhau được gọi là tiêu chuẩn đo (hay đơn vị đo). Trong thang đo độ bách phân () khoảng cách giữa hai vạch đứng liền nhau là 1oC chính là tiêu chuẩn đo. Nhờ có tiêu chuẩn đo này, nên có thể thực hiện được các phép tính cộng, trừ, tính được các tham số đặc trưng như trung bình, phương sai, tỷ lệ và gọi nó là thang đo định lượng. Đặc điểm cơ bản của thang đo khoảng là chưa có giá trị “0 tuyệt đối”, mà đó chỉ là số 0 quy ước.
Thang đo tỷ lệ, Là thang đo khoảng với một điểm 0 tuyệt đối (điểm gốc) trên thang đo. Nhờ điểm gốc và một tiêu chuẩn đo cụ thể, ta có thể sử dụng được mọi công cụ toán - thống kê để phân tích dữ liệu, so sánh được tỷ lệ giữa các trị số đo. Theo tuần tự, thang đo sau có chất lượng đo lường cao hơn thang đo trước, đồng thời việc xây
dựng thang đo cũng phức tạp hơn. Song không phải cứ sử dụng thang đo tỷ lệ là tốt nhất, mà phải tuỳ thuộc vào đặc điểm của hiện tượng và tiêu thức nghiên cứu mà chọn thang đo thích hợp.
Trên cơ sở mục tiêu nghiên cứu của đề tài, tác giả sử dụng cả 4 loại thang đo đề cập ở trên phục vụ cho việc nghiên cứu và tương ứng với đó là việc ứng dụng các kỹ thuật phù hợp với các loại thang đo vào xử lý dữ liệu. Đặc biệt trong nghiên cứu của mình thang đo khoảng cách được sử dụng nhiều nhất trong việc đo lường các ý kiến khảo sát, trả lời của các đối tượng nghiên cứu. Để triển khai cụ thể thang đo khoảng cách tác giả đã ứng dụng quan điểm về thang đo của Likert, Rensis (1932) với 5 cấp độ sau: 1: Hoàn toàn không đồng ý/ 2: Không đồng ý/ 3: Không ý kiến/ 4: Đồng ý/ 5: Hoàn toàn đồng ý
3.5.2. Thiết kế bảng hỏi và thu thập dữ liệu
Theo Nguyễn Đình Thọ (2012) có 2 dạng bảng câu hỏi chính là (1) Bảng câu hỏi chi tiết dùng trong thu thập dữ liệu phục vụ cho nghiên cứu định lượng và (2) Dàn bài hướng dẫn thảo luận dùng trong nghiên cứu định tính. Đối với đề tài nghiên cứu của mình tác giả dùng bảng câu hỏi chi tiết để phỏng vấn các cán bộ thuế GTGT trên địa bàn Quảng Trị.
Trên thực tế việc thiết kế bảng hỏi mang tính khoa học và nghệ thuật cao bảng được tóm lược vắn tắt gồm 8 bước như sau:
Bước 1: Xác định dữ liệu cần tìm kiếm: điều kiện tiên quyết để lập bảng câu hỏi có hiệu quả là xác định chính xác cái gì cần phải được đo lường và cần làm rõ liệt kê các vấn đề cần đo lường đó; đồng thời cũng hình dung trước xem các biến số đó nên được sử dụng như thế nào.
Bước 2: Xác định quy trình khảo sát, phỏng vấn: Tại bước này nhà nghiên cứu cần phải xác định xem sẽ dự kiến dùng phương pháp nào để thu thập thông tin (phỏng vấn trực tiếp, điện thoại, email, bưu điện ..) để từ đó thiết lập quy trình thu thập thông tin một cách phù hợp và từ đó thể hiện ra thành bảng hỏi phù hợp.
Bước 3: Đánh giá nội dung câu hỏi: Để đảm bảo cho nội dung câu hỏi được trả lời đầy đủ, đúng và có chất lượng thì khi thiết kế bảng hỏi; nhà nghiên cứu cần xác
bất tiện, vô lý … trong bảng hỏi hay không? Những vấn đề này cần được đánh giá cẩn thận trước khi tiến hành nghiên cứu chính thức.
Bước 4: Quyết định về dạng câu hỏi và trả lời: Nhà nghiên cứu cùng cần cân nhắc các dạng câu hỏi nào trong bảng hỏi (câu hỏi mở, câu hỏi đóng, câu hỏi nhiều sự lựa chọn, các quan điểm …)
Bước 5: Xác định từ ngữ trong bảng hỏi: Do bảng câu hỏi là phương tiện giao tiếp giữa nhà nghiên cứu và người được hỏi..nên việc xác định các ngôn từ là vô cùng quan trọng. Nó giúp cho việc diễn đạt dễ hiểu, đúng và chính xác với các ý đồ của nhà nghiên cứu và làm cho người trả lời hiểu đúng, đầy đủ cảm thấy thoải mái khi trả lời ..
Bước 6: Xác định cấu trúc bảng hỏi: Một cấu trúc bảng hỏi chuần thường gồm phần mở đầu, các câu hỏi hâm nóng, các câu hỏi đặc thù, các câu hỏi mang tính cung cấp thông tin cá nhân và các câu hỏi phụ.
Bước 7: Xác định đặc tính vật lý (dạng thể hiện) của bảng hỏi: đây là vấn đề quan trọng và phụ thuộc vào hình thức phỏng vấn là gì. Như với đề tài này do tác giả lựa chọn hình thức phỏng vấn trực tiếp nên đặc tính vật lý của bảng hỏi là in và thể hiên trên giấy A4.
Bước 8: Kiểm tra và hoàn thiện bảng hỏi.
Và được tác giả chi tiết hóa như tại phụ lục 1 bảng hỏi của đề tài này. Để triển khai thu thập dữ liệu nghiên cứu, tác giả đã lựa chọn cách thức phỏng vấn bằng cách để người được hỏi tự nghiên cứu trả lời với các bước như sau:
1.Gửi bảng câu hỏi tới chi cục thuế, các phòng thuế của tỉnh Quảng Trị có các cán bộ được xác định phỏng vấn.
2. Thông qua các đầu mối tại mỗi điểm để giải thích thêm các vấn đề chưa rõ và tổng hợp nhận lại các bản trả lời
3. Nhận lại các phiếu hỏi từ các đầu mối và tổng hợp dữ liệu.
3.6. PHƯƠNG PHÁP XỬ LÝ DỮ LIỆU 3.6.1. Mô tả dữ liệu 3.6.1. Mô tả dữ liệu
Trung bình cộng là một đại lượng mô tả mức độ tập chung của dữ liệu được sử dụng phổ biến nhất và được xác định bằng cách tính tổng số giá trị quan sát đươợc và
chia cho tổng số quan sát. Ngoài ra để bổ trợ cho giá trị trung bình của dữ liệu, trong mô tả dữ liệu chúng ta còn quan tâm tới: (1) Trung vị là điểm đứng giữa dãy dữ liệu đã được xắp xếp theo thứ tự tăng dần; (2) Mode là giá trị lặp lại nhiều lần nhất trong dữ liệu; (3) Các giá trị lớn nhất (max) và nhỏ nhất (min); (4) Các khoảng chia nhỏ dữ liệu hơn chẳng hạn chia đôi, chia 3, chia 4 …; (5) Khoảng biến thiên dữ liệu.
Phương sai mẫu được xác định bằng cách lấy trung bình của các biến thiên (đã được lấy) bình phương giữa từng quan sát trong tập dữ liệu so với giá trị trung bình của nó.
Độ lệch chuẩn là căn bậc 2 của phương sai mẫu. Hai chỉ tiêu này dùng để đánh giá mức độ biến thiên, mức độ chính xác của dữ liệu quanh giá trị trung bình của nó; mức độ ổn định của dữ liệu nghiên cứu.
Bảng tần số là một bảng tổng hợp các biểu hiện có thể có của đặc điểm quan sát, hoặc các khoảng giá trị mà trong phạm vi đó dữ liệu có thể rơi vào và số quan sát tương ứng với mỗi biểu hiện hoặc khoảng giá trị dữ liệu, đồng thời có thể tính toán xem so với tổng số quan sát thì số đơn vị thuộc biểu hiện này chiếm tỷ lệ bao nhiêu phần trăm. Cách trình bày bảng tần số bao gồm các cột nội dung như sau: (1) Cột 1 là liệt kê các biểu hiện có thể có của dữ liệu; (2) Cột 2 là tần số xuất hiện (số quan sát được) của các biểu hiện tương ứng; (3) Tần suất được lấy bằng số quan sát chia cho tổng số quan sát của dữ liệu.
Đồ thị phân phối thường được sử dụng để chuyển hóa thông tin trên bảng tần số thành hình ảnh hấp dẫn trực quan hơn, dễ thu hút sự chú ý, ghi nhớ hơn nhất là khi có sự kết hợp với màu sắc. Ngoài ra còn có có cac dạng đồ thị dạng đường, hình tròn, dạng thanh dọc, thanh ngang … bổ trợ cho các cách trình bày dữ liệu.
3.6.2. Kiểm định độ tin cậy của thang đo
Cronback (1951) đã đưa ra hệ số tin cậy Alpha cho các thang đo nghiên cứu; và nó được thực hiện cho từ 3 biến quan sát trở lên. Theo Nguyễn Đình Thọ (2012) Cronbach’s Alpha được tính theo công thức rút gọn như sau: Alpha = Nρ/ (1+ ρ(N-1)), trong đó ρ là hệ số tương quan trung bình của các mục hỏi; N là số câu hỏi trong 1 nhân tố.
Hệ số Cronback Alpha có giá trị từ 0 đến 1, về lý thuyết Cronback Alpha càng lớn càng tốt. Nhiều nhà nghiên cứu đồng ý rằng hệ số Cronbach Alpha từ 0.8 trở lên đến gần 1 thì thang đo lường là tốt, tuy nhiên nếu lớn hơn 0.95 cho thấy các quan sát là không có gì khác biệt (tức là không có ý nghĩa nghiên cứu ), còn từ 0.7 đến gần 0.8 là sử dụng được. Cũng có nhà nghiên cứu đề nghị rằng Cronbach Alpha từ 0.6 trở lên là có thể sử dụng được trong trường hợp khái niệm đang nghiên cứu là mới hoặc mới đối với người trả lời trong bối cảnh nghiên cứu (Hoàng Trọng - Chu Nguyễn Mộng Ngọc, 2011). Vì vậy đối với nghiên cứu này thì Cronbach Alpha từ 0.6 trở lên là sử dụng được.
Do các biến quan sát dùng để đo lường cùng một khái niệm (nhân tố) nên cần có sự tương quan với nhau. Vì vậy ngoài việc kiểm tra hệ số Cronbach Alpha >= 0.6, chúng ta cần phải xem xét thêm hệ số tương quan biến tổng (DeVellis, 2003). Đây là hệ số tương quan của một biến với điểm trung bình của các biến khác trong cùng một thang đo, do đó hệ số này càng cao thì sự tương quan của biến này với các biến khác trong nhóm càng cao. Theo Nunnally & Burnstein (1994) nếu hệ số tương quan biến tổng này mà nhỏ hơn 0.3 thì thang đo đó sẽ bị loại khỏi nghiên cứu.
3.6.3. Phân tích nhân tố khám phá
Phân tích nhân tố khám phá là một phương pháp phân tích thống kê dùng để rút gọn một tập gồm nhiều biến quan sát phụ thuộc lẫn nhau thành một tập biến (gọi là các nhân tố) ít hơn để chúng có ý nghĩa hơn nhưng vẫn chứa đựng hầu hết nội dung thông tin của tập biến ban đầu (Hair & ctg, 1998). Theo Hoàng Trọng - Chu Nguyễn Mộng Ngọc (2011), phân tích nhân tố là tên chung của một nhóm thủ tục được sử dụng để thu nhỏ dữ liệu.
Nguồn: Dự theo Kim & Mueller (1978a)
Hình 3.4: Mô hình mô phỏng 1 nhân tố EFA
Về mặt tính toán phân tích nhân tố được mô tả như sau: Xi = Ai1*F1 + Ai2*F2 + Ai3*F3 + ….+ Aim*Fm + ViUi. Trong đó:
Xi là biến chuẩn hóa thứ i
Aij là hệ số hồi quy bội chuẩn hóa của nhân tố j đối với biến i F các nhân tố chung
Vi hệ số hồi quy chuẩn hóa của nhân tố đặc trưng đối với biến i Ui nhân tố đặc trưng của biến i
m số nhân tố.
Các nhân tố đặc trưng có tương quan với nhau và với các nhân tố chung; bản thân các nhân tố chung cũng có thể được diễn tả như những kết hợp tuyến tính của các biến quan sát như sau: Fi = Wi1*X1 + Wi2*X2 + Wi3*X3 + ….+ Wik*Xk; trong đó
Fi là ước lượng trị số của nhân tố i Wi là quyền số hay trọng số của nhân tố k là số biến
Khi phân tích nhân tố, chúng ta cần xem xét các tham số thống kê của quá trình phân tích nhân tố bao gồm:
Factor loading là những hệ số tương quan đơn giữa các biến và nhân tố của nó; Factor loading > 0.5 được sử dụng trong phép phân tích nhân tố để loại bỏ các biến
V1 Biến X1 Nhân tố Fi Biến X2 Biến X3 Biến Xk . . . U1 U2 U3 Uk W1 W2 Wk W3 V2 Vk V3
không hợp lệ. Theo Hair & ctg (1998,111)1 Factor loading là chỉ tiêu để đảm bảo mức ý nghĩa thiết thực của EFA. Factor loading > 0.3 được xem là đạt được mức tối thiểu, Factor loading > 0.4 được xem là quan trọng, > 0.5 được xem là có ý nghĩa thực tiễn. Hair & ctg (1998,111) cũng khuyên bạn đọc như sau: nếu chọn tiêu chuẩn factor loading > 0.3 thì cỡ mẫu của bạn ít nhất phải là 350, nếu cỡ mẫu của bạn khoảng 100 thì nên chọn tiêu chuẩn factor loading > 0.55, nếu cỡ mẫu của bạn khoảng 50 thì Factor loading phải > 0.75. Factor matrix là ma trận chứa các hệ số factor loading
Kiểm định Bartlett‟s Test of Sphericity là một đại lượng thống kê dùng để xem xét giả thuyết các biến không có tương quan trong tổng thể. Nếu Sig của Bartlett‟s Test of Sphericity < 5% chúng ta bác bỏ giả thuyết Ho: Các biến không có tương quan trong tổng thể (không có ý nghĩa trong phân tích nhân tố).
Eigenvalue đại diện cho phần biến thiên được giải thích của các nhân tố; Eigeưnvalue > 1 là tiêu chuẩn để xác định số nhân tố được hình thành từ các dữ liệu thu thập được.
KMO là trị số cho biết mức độ thích hợp của các nhân tố trong phân tích; KMO >= 0.5 là thích hợp với các nghiên cứu tiếp theo và ngược lại.
3.6.4. Phân tích hồi quy và kiểm định giả thuyết.
Phân tích hồi quy là nghiên cứu mối liên hệ phụ thuộc của một biến phụ thuộc (nhân tố) vào các biến khác (gọi là biến độc lập) với ý tưởng ước lượng và/hoặc dự đoán giá trị trung bình của biến phụ thuộc trên cơ sở các giá trị biết trước của các biến độc lập.
Trong đề tài nghiên cứu này, tác giả sẽ xem xét mối quan hệ giữa biến phụ thuộc là Tăng cường chống thất thu thuế (TCCTTT) vào các biến biến độc lập là: Hệ thống chính sách thuế; Tổ chức bộ máy thu thuế; Ứng dụng công nghệ; Công tác thanh kiểm tra giám sát; Chính sách tuyên truyền và động viên khuyến khích; Sự phối hợp giữa các ban ngành chức năng
Phương pháp bình phương bé nhất (Phương pháp OLS) sẽ được ứng dụng vào triển khai xử lý mối quan hệ của mô hình TCCTTT = f(6 nhân tố) bằng phần mềm thống kê kinh tế lượng SPSS 20.
Để xem xét tính đúng đắn của mô hình hồi quy hàng loạt các kiểm định sẽ được xem xét thực hiện bao gồm: (1) Kiểm định F về mức độ phù hợp của mô hình; (2)