Phương pháp lấy mẫu được áp dụng bằng cách lựa chọn mẫu phi xác xuất theo cách thuận tiện được gửi đến các đối tượng khảo sát do chính tác giả thực hiện và được sự trợ giúp của các bạn bè, đồng nghiệp giúp đỡ với sự hướng dẫn của chính tác giả được thực hiện sau khi hồn thành bước khảo sát sơ bộ.
3.3.2 Xác định kích thước mẫu khảo sát
Theo Hair et al [13] đối với mơ hình phân tích nhân tố khám phá kích thước mẫu xác định dựa vào mức tối thiểu và số lượng biến đưa vào phân tích của mơ hình.
- Mức tối thiểu là 50 mẫu.
- Nếu mơ hình có m thang đo, Pi số biến quan sát của thang đo thứ i thì kích Bảng câu hỏi chính thức Gửi đến Người Quyết định đầu tư Bộ dữ liệu dùng để phân tích Thu thập dữ liệu Tổng hợp dữ liệu Gửi đến Chủ đầu tư Gửi đến Tư vấn thiết kế, tư vấn giám sát Gửi đến Nhà thầu thi công Dữ liệu chưa đầy đủ sẽ được thu thập lại Kiểm tra dữ liệu
thước mẫu xác định theo công thức.
𝑛 = ∑ 𝑘𝑃𝑖 𝑚
𝑖=1
Với k là tỷ lệ của số mẫu so với một biến phân tích là 5/1 hoặc 10/1 Chọn k=5/1 suy ra: n=5*(3+6+4+4+3+3) =115
Nghiên cứu thực hiện có 23 biến cần khảo sát được lập trong bảng câu hỏi nên số lượng mẫu cần phải thực hiện khảo sát tối thiểu 115 mẫu.
3.3.3 Cách thức phân phối bảng câu hỏi
Căn cứ vào mục tiêu nghiên cứu, đối tượng cần hướng đến để thu thập dữ liệu trong luận văn này là những người làm việc trong lĩnh vực xây dựng. Bảng câu hỏi được phát trực tiếp đến các cá nhân có kinh nghiệm làm việc trực tiếp tại tỉnh Kiên Giang. Họ là các kỹ sư, trưởng phó các bộ phận của nhà thầu thi công, tư vấn giám sát, tư vấn thiết kế, Người quyết định đầu tư hoặc Ban Quản lý dự án. Quan điểm của họ về nội dung của vấn đề nghiên cứu nhờ những kinh nghiệm, kiến thức có được trong q trình tham gia vào các dự án có nhiều năm kinh nghiệm.
Sau khi thu thập bảng câu hỏi, tiến hành kiểm tra và loại bỏ những bảng câu hỏi trả lời không hợp lệ (câu trả lời bị thiếu, câu trả lời có nhiều kết quả trả lời).
3.3.4 Cấu trúc bảng câu hỏi
Bảng câu hỏi khảo sát bao gồm 2 phần chính (xem Phụ lục A): - Phần I: Giới thiệu thang đo và cách trả lời bảng câu hỏi.
Giới thiệu thang đo: là thang đo Likert 5 khoảng đo nhằm đánh giá mức độ
xảy ra và mức độ ảnh hưởng của từng nguyên nhân dẫn tới chậm thanh toán vốn
trong các dự án đầu tư xây dựng sử dụng vốn ngân sách Nhà nước.
Bảng 3.2: Bảng thang đo đánh giá 5 khoảng đo
Mức độ xảy ra Mức độ ảnh hưởng 1. Không xảy ra 2. Xảy ra ít 3. Xảy ra vừa 4. Xảy ra nhiều 5. Xảy ra rất nhiều 1. Không ảnh hưởng 2. Ảnh hưởng ít 3. Ảnh hưởng vừa 4. Ảnh hưởng nhiều 5. Ảnh hưởng rất nhiều
Do nghiên cứu tổng hợp rất nhiều bảng câu hỏi để phân tích, vì vậy nhằm để dễ dàng xác định chính xác mức độ ảnh hưởng của từng nhân tố nên thang đo Likert 5 khoảng đo sẽ được chuyển thành thang đo đánh giá 5 mức độ với khoảng cách giữa các mức độ được xác định bởi công thức sau:
Công thức: 1 5 1 0,8 5 n k n
. Trong đó: k là khoảng cách, n là số điểm
Bảng 3.3: Bảng thang đo đánh giá 5 mức độ Mức độ Mức độ xảy ra Mức độ ảnh hưởng Mức độ Mức độ xảy ra Mức độ ảnh hưởng
1,0-1,8 Không xảy ra Không ảnh hưởng 1,8-2,6 Xảy ra ít Ít ảnh hưởng 2,6-3,4 Xảy ra vừa Ảnh hưởng vừa 3,4-4,2 Xảy ra nhiều Ảnh hưởng nhiều
4,2-5 Xảy ra rất nhiều Ảnh hưởng rất nhiều
Mức độ xảy ra và mức độ ảnh hưởng đến nguy cơ chậm thanh toán vốn đầu tư xây dựng cơ bản được mã hóa như sau: (1) = "khơng ảnh hưởng ", (2) = "ít ảnh hưởng", (3) = "Ảnh hưởng vừa", (4) = "Ảnh hưởng nhiều", và (5) = "Ảnh hưởng rất nhiều".
Cách trả lời Bảng câu hỏi: Người khảo sát được hỏi về mức độ đồng ý của họ đối với từng yếu tố trong bảng câu hỏi theo thang đo Likert 5 mức độ từ 1 đến 5.
Theo đó người trả lời được lựa chọn đáp án mà đáp án này phản ánh suy nghĩ đúng nhất của người trả lời và đánh dấu vào một ô ở mỗi phần (các ô từ 1 đến 5) trong bảng câu hỏi. Mỗi câu hỏi gồm có 2 nội dung trả lời.
Liệt kê 23 yếu tố ảnh hưởng đến nguy cơ chậm thanh toán vốn đầu tư xây dựng cơ bản trong các dự án đầu tư xây dựng.
- Phần II: Thông tin cá nhân về cá nhân trả lời. Nhằm mục đích bảo mật thông tin cá nhân của người trả lời vì vậy bảng câu hỏi ghi rõ cam kết dữ liệu chỉ phục vụ mục đích nghiên cứu khoa học. Các thơng tin cá nhân trả lời trong bảng câu hỏi cũng chỉ mang tính chất tùy chọn, không bắt buột người trả lời nhất thiết phải cung cấp.
3.4 Mã hóa dữ liệu
Nhằm để thuận tiện trong việc xử lý và nhập dữ liệu trong bảng số liệu đối với từng nhân tố trong bảng khảo sát. Tiến hành mã hóa các nhân tố thành các ký hiệu mục đích đơn giản và dễ hiểu. Các nhân tố được mã hóa như sau:
Bảng 3.4: Các nhân tố ảnh hưởng chậm thanh toán vốn đầu tư xây dựng cơ
bản trong các dự án xây dựng
STT
Tên các nhân tố gây chậm thanh toán vốn đầu tư xây dựng cơ bản Mã hóa mức độ xảy ra Mã hóa mức độ ảnh hưởng
I. Liên quan đến người quyết định đầu tư
1 Phê duyệt kế hoạch, danh mục đầu tư chậm XR1 AH1 2
Phê duyệt Chủ trương đầu tư chưa sát với nhu cầu thực tế của địa
phương XR2 AH2
3 Quyết định giao làm chủ đầu tư một số dự án không phù hợp XR3 AH3
II. Liên quan đến chủ đầu tư
1 Cơng tác giải phóng mặt bằng chậm XR4 AH4 2 Chậm xử lý khi có vướng mắc phát sinh XR5 AH5 3 Thay đổi thiết kế trong q trình thi cơng XR6 AH6 4 Chậm trễ trong việc giải quyết hồ sơ, thủ tục, thanh toán XR7 AH7 5 Năng lực cán bộ quản lý dự án yếu kém XR8 AH8 6 Quyền hạn của chủ đầu tư còn hạn chế XR9 AH9
III. Liên quan đến nhà thầu thi công
1 Nhà thầu năng lực yếu kém (tài chính, máy móc, kỹ thuật…) XR10
AH10
2 Nhà thầu thi công không đảm bảo chất lượng XR11 AH11 3 Chậm trễ trong nghiệm thu và làm hồ sơ thanh, quyết toán XR12 AH12 4 Sự phối hợp kém giữa nhà thầu với các bên liên quan XR13 AH13
VI. Liên quan đến nhà thầu tư vấn
1 Hồ sơ thiết kế, dự tốn cịn sai sót XR14 AH14 2 Phối hợp xử lý công việc với chủ đầu tư chưa kịp thời XR15 AH15
3 Năng lực tư vấn còn hạn chế XR16 AH16 4 Chậm xét duyệt khối lượng đã hoàn thành của nhà thầu XR17 AH17
V. Liên quan đến Cơ chế-Chính sách-Pháp luật
1 Chính sách pháp luật liên quan thường xuyên thay đổi XR18 AH18
2
Văn bản hướng dẫn cấp Tỉnh về hoạt động đầu tư, thanh toán vốn
xây dựng cơ bản chưa kịp thời XR19 AH19 3 Chế tài xử phạt vi phạm hợp đồng chưa nghiêm XR20 AH20
VI. Nhóm yếu tố khác
1 Điều kiện thời tiết không thuận lợi (mưa, bão, lũ lụt…) XR21 AH21 2 Cơ quan quản lý Nhà nước thẩm định dự án chậm XR22 AH22 3 Giá vật liệu xây dựng biến động bất lợi (dự toán-thực tế) XR23 AH23
3.5 Cơng cụ phân tích
Tất cả các dữ liệu sau khi được thu thập thông qua bảng câu hỏi khảo sát sẽ được mã hóa Bảng 3.3. Sau đó tiến hành phân tích kết quả và xử lý số liệu bằng chương trình phân tích thống kê SPSS.20 để hỗ trợ trong việc phân tích. Trình tự phân tích thực hiện theo các bước sau:
3.5.1 Mô tả mẫu
Dùng để mô tả các dữ liệu thu thập được từ tổ hợp mẫu vừa khảo sát được, nhằm tổng hợp tóm tắt nội dung như: thời gian tham gia cơng tác, vai trị của người trả lời trong công ty/ dự án, lĩnh vực hoạt động chính của người trả lời trong cơng ty/dự án. Thường dùng các thông số được sử dụng mô tả như: tần suất, phần trăm, tỷ lệ phần trăm, các dữ liệu này để dễ hiểu thường được thể hiện bằng biểu đồ và bảng mơ tả dữ liệu nhằm để phân tích, so sánh các thơng tin của cá nhân trả lời.
3.5.2. Kiểm định độ tin cậy của thang đo hệ số Cronbach’s Alpha
Độ tin cậy của thang đo được đánh giá bằng phương pháp nhất quán nội tại qua hệ số Cronbach’s Alpha. Sử dụng phương pháp hệ số tin cậy Cronbach’s Alpha trước khi thực hiện các phân tích thống kê để loại các biến khơng phù hợp [14].
trong bảng câu hỏi. Là một phép kiểm định thống kê về mức độ chặt chẽ của các mục hỏi trong thang đo tương quan với nhau. Theo Trọng và Ngọc [15], thì hệ số Cronbach’s Alpha từ 0,7 đến 0,8 thì sử dụng được và từ 0,8 trở lên là tốt. Đồng thời các biến có hệ số tương quan biến tổng nhỏ hơn 0,3 được xem là biến rác và sẽ bị loại khỏi thang đo. Cũng có nhà nghiên cứu đề nghị rằng Cronbach’s Alpha từ 0.6 trở lên là có thể sử dụng được trong trường hợp khái niệm đo lường là mới trong bối cảnh nghiên cứu hoặc mới đối với người trả lời (Robert A. Peterson & Salter [16]).
Nghiên cứu này áp dụng theo Theo Trọng và Ngọc [15] thang đo được đánh giá chấp nhận và tốt đòi hỏi thỏa mãn đồng thời 02 điều kiện sau:
- Hệ số Cronbach’s Alpha của tổng thể > 0.7
- Hệ số tương quan biến tổng (Corrected Item-Total Correlation) > 0.3
3.5.3 Thống kê mơ tả
Mục đích của thống kê mơ tả là xác định trung bình và xếp hạng các nhân tố ảnh hưởng đến chậm thanh toán vốn đầu tư xây dựng cơ bản và từ đó xác định nhân tố nào ảnh hưởng đến đến chậm thanh toán vốn đầu tư xây dựng cơ bản nhiều nhất. Bên cạnh đó, qua xếp hạng cũng biết được các nhân tố ít ảnh hưởng đối với đến nguy cơ chậm thanh toán vốn đầu tư xây dựng cơ bản. Thường dùng các thông số thống kê như giá trị trung bình, độ lệch chuẩn.
3.5.4 Phân tích One – Way Analysis of Variance (ANOVA)
Phân tích ANOVA được sử dụng để xác định có hay khơng có sự khác biệt đáng kể giữa trị trung bình của hai hoặc nhiều hơn nhóm độc lập và chiều hướng liên hợp giữa chúng. Vì vậy để phân tích sự khác biệt về trị trung bình của nhiều nhóm tổng thể, thì phương pháp phân tích phương sai một yếu tố ANOVA là một kiểm định phù hợp. Các giả thuyết kiểm định như sau:
-H0: Khơng có sự khác biệt về trị trung bình của các giá trị khảo sát giữa các nhóm đối tượng.
- HA: Có sự khác biệt về trị trung bình của các giá trị khảo sát giữa các nhóm đối tượng.
Đồng thời nếu có sự khác biệt về trị trung bình của các giá trị khảo sát giữa các nhóm đối tượng (bác bỏ Ho) thì tiến hành kiểm định hậu nghiệm Tukey’HSD để xem xét có hay khơng việc loại bỏ nhóm đối tượng nào trong tồn bộ mẫu sau khi phân tích Anova.
3.5.5 Chỉ số mức độ quan trọng tương đối
Dữ liệu được xử lý thông qua ba loại chỉ số:
- Chỉ số tần xuất (Frequency Index - F.I): chỉ số này thể hiện tần suất xuất hiện của các yếu tố xảy ra chậm thanh toán vốn. Nó được tính theo cơng thức sau:
5 1 . . 5 i i a n F I N
Trong đó: a = hằng số thể hiện trọng số được gán cho mỗi câu trả lời (khoảng từ 1 cho "không xảy ra" đến 5 cho " xảy ra rất nhiều"), n = tần số của mỗi đáp án, N = tổng số phản hồi.
- Chỉ số ảnh hưởng (Severity Index - S.I): Chỉ số này thể hiện mức độ ảnh hưởng của yếu tố gây ra chậm thanh tốn vốn. Nó được tính theo cơng thức sau:
5 1 . . 5 i i a n S I N
Trong đó: a = hằng số thể hiện trọng số được gán cho mỗi câu trả lời (khoảng từ 1 cho "không ảnh hưởng" đến 5 cho "ảnh hưởng rất nhiều"), n = tần số của mỗi đáp án, N = tổng số phản hồi.
- Chỉ số quan trọng (Importance Index - IMP.I): Chỉ số này thể hiện tổng quan về yếu tố dựa trên cả mức độ xảy ra và mức độ ảnh hưởng của chúng. Nó được tính theo công thức sau:
IMP.I = F.I . x S.I.
3.5.6 Hệ số tương quan hạng Spearman
Để kiểm tra mối quan hệ giữa hai biến được xếp hạng hoặc một biến được xếp hạng khơng u cầu có phân phối chuẩn
tính dựa vào các hạng của dữ liệu chứ không dựa vào giá trị thực của quan sát [18] Hệ số Spearman được tính 2 2 1 6 ( 1) i s d r n n
- Hệ số tương quan hạng Spearman chạy từ -1 đến +1, trong đó -1 và +1 cho thấy mối liên hệ hồn tồn tuyến tính giữa hạng của hai biến, với di = sự khác nhau giữa các hạng quy cho hai đặc điểm khác nhau của thành phần hay hiên tượng thứ i và n = số các thành phần hay hiện tượng được xếp hạng [19]
3.5.7 Phân tích cụm Cluster
Để chuyển dữ liệu thành thông tin, chúng ta phải biết cách đơn giản hóa dữ liệu. Có hai cách phổ biến để đơn giản hóa dữ liệu phổ biến, đó là phân tích nhân tố (factor analysis) và phân tích cụm (cluster analysis). Khác với phân tích nhân tố là gộp các biến (items) có liên quan thành các nhân tố (factor), phân tích cluster là phân nhóm các đối tượng có liên quan vào một nhóm đại diện bởi một biến gọi là cluster. Phân tích cluster có hiệu quả cao khi các đối tượng trong cùng một cluster có quan hệ mật thiết (đồng nhất - homogeneous) với nhau và có sự phân biệt với các cluster khác. Phân tích cluster được ứng dụng trong rất nhiều lĩnh vực khác nhau như: nghiên cứu hành vi xã hội, tâm lý, địa lý, kinh doanh… Ứng dụng trong nghiên cứu Marketing, phân tích cluster giúp nhận diện các phân khúc thị trường, tìm hiểu hành vi khách hàng, nhận dạng các cơ hội cho sản phẩm mới hay lựa chọn thị trường để thử nghiệm các chiến lược khác nhau.
Phân tích cluster bao gồm 2 phương pháp phân tích chủ yếu là phân tích cluster thứ bậc (Hierachical clustering) và phân tích cluster khơng thứ bậc (Non- hierachical clustering). Phân tích cluster thứ bậc sử dụng phương pháp Ward, và phân tích cluster khơng thứ bậc sử dụng phương pháp K-Means. Thuật toán phân cấp gồm hai dạng: dạng từ dưới lên (bottom-up, hay agglomerative algorithm) và từ trên xuống (top-down, hay divisive algorithm).
Thuật toán Agglomerative Algorithm Step 0 Step 1 Step 2 Step 3 Step 4 m m Raw Data
Raw Data Processed Data
Step 1
Step 2
Step 3
k-means at step 3
Thuật toán Divisive Algorithm
Các loại thước đo khoảng cách thường được sử dụng phổ biến cho phân cụm thứ tự bao gồm (Wikipedia):
Khoảng cách Euclid giữa hai điểm p và q là chiều dài đoạn thẳng 𝑝𝑞̅̅̅. Trong hệ tọa độ Descartes, nếu p = (p1, p2,..., pn) và q = (q1, q2,..., qn) là hai điểm trong khơng gian Euclid n chiều, thì khoảng cách từ p đến q bằng:
𝑑(𝑝, 𝑞) = √( 𝑝1− 𝑞1)2+( 𝑝2− 𝑞2)2+ ⋯ + ( 𝑝𝑛− 𝑞𝑛)2 = √∑𝑛𝑖=1( 𝑝𝑖− 𝑞𝑖)2
Dạng chuẩn Euclid là khoảng cách của một điểm đến điểm gốc trong không gian Euclid:
‖𝑝‖ = √( 𝑝1)2+( 𝑝2)2+ ⋯ + ( 𝑝𝑛)2= √𝑝. 𝑝
Trong đó phương trình sau cùng là tích vơ hướng. Đây là chiều dài của p, khi ta xem nó là một Véc-tơ Euclid có gốc nằm ở gốc tọa độ. Khoảng cách khi đó bằng ‖𝑝 − 𝑞‖ = √(𝑝 − 𝑞). (𝑝 − 𝑞) = √‖𝑝‖2+ ‖𝑞‖2− 2𝑝. 𝑞
Bình phương khoảng cách Euclide
Khoảng cách Euclid tiêu chuẩn có thể được bình phương để đặt dần lớn hơn trọng lượng trên các đối tượng xa nhau. Trong trường hợp này, phương trình trở
thành
𝒅𝟐(𝒑, 𝒒) = ( 𝒑𝟏− 𝒒𝟏)𝟐+ ( 𝒑𝟐− 𝒒𝟐)𝟐+ ⋯ + ( 𝒑𝒊− 𝒒𝒊)𝟐+ ⋯ + ( 𝒑𝒏− 𝒒𝒏)𝟐 Bình phương khoảng cách Euclid khơng phải là một thước đo, nó khơng đáp ứng bất đẳng thức tam giác, Tuy nhiên, nó thường được sử dụng trong tối ưu hóa