L ời mở đầ u
2.2.2. Mô hình hồi quy tuyến tính tổng quát
Phương pháp hồi quy cổđiển thường dùng cho biến phụ thuộc và biến độc lập là các biến định lượng. Còn phương pháp phân tích mô hình hồi quy tuyến tính tổng quát dùng được cho cả các biến độc lập là biến định lượng và định tính, trong đó các biến định tính đã được mã hoá thành các biến 0 – 1. Trước hết, ta dùng hồi quy tuyến tính cho đầy đủ các biến độc lập trong đó biến phụ thuộc là biến “tylesai”. Đối với nhân tố địa điểm, ta xét bốn khu vực là: Hà Nội, đồng bằng Bắc Bộ, miền núi (bao gồm khu vực Đông Bắc, Tây Bắc và Tây Nguyên), miền Nam (bao gồm các tỉnh từ Quảng Bình trở vào). Như vậy nhân tố này có 4 mức, ta lấy nhóm các công trình thuộc khu vực đồng bằng Bắc Bộ làm nhóm chứng và lập 3 biến giả tương ứng với 3 khu vực còn lại là biến “HaNoi” (ứng với khu vực Hà Nội), biến “MienNui” (ứng với khu vực miền núi), biến “MienNam” (ứng với khu vực miền Nam).
Đối với nhân tố đặc điểm công trình, vì chỉ có 2 nhóm công trình là loại công trình xây dựng và loại công trình cung cấp trang thiết bị nên chúng ta dùng 1 biến giả là biến “CTTThietbi” để mã hoá cho nhân tố này, với nhóm chứng bao gồm các công trình xây dựng (không cung cấp trang thiết bị). Đối với việc phân loại công trình theo chức năng sử dụng, ta dùng 3 biến giả tương ứng với các công trình xây
dựng trường học (biến “Truonghoc”), chung cư và văn phòng cho thuê (biến “Chungcu”), cơ sở hạ tầng (biến “CosoHT”) và lấy nhóm các công trình xây dựng trụ sở làm việc, nhà công vụ làm nhóm chứng.
Ngoài ra ta còn dùng 2 biến giả là biến “CTcolon” và biến “CTconho” để chỉ nhóm các công trình cỡ lớn (có vốn đầu tư trên 2,5 tỷđồng) và nhóm các công trình cỡ nhỏ (có vốn đầu tư dưới 500 triệu đồng) để so sánh với nhóm chứng bao gồm các công trình cỡ vừa (có vốn đầu tư từ 500 triệu đồng đến 2,5 tỷđồng).
Các biến giả trên đây được dùng làm biến độc lập để đưa vào phương trình hồi quy của mô hình tuyến tính tổng quát. Kết quả tính toán ước lượng các hệ số hồi quy và xác suất ý nghĩa tương ứng được trình bày trong bảng 2.7.
Bảng 2.7. Kết quả phân tích theo mô hình hồi quy tuyến tính tổng quát cho đầy đủ các biến độc lập Model Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta 1 (Constant) 4.573 1.520 3.009 .003 CTTThietbi -3.024 1.078 -.247 -2.805 .006 HaNoi -1.241 1.417 -.116 -.875 .383 MienNui -2.495 1.613 -.202 -1.547 .125 MienNam -5.154 1.405 -.342 -3.669 .000 Truonghoc -1.260 1.406 -.101 -.896 .372 CosoHT 4.750 1.347 .400 3.526 .001 Chungcu .703 1.404 .050 .501 .617 CTcolon -1.928 1.052 -.182 -1.832 .069 CTconho -.068 1.303 -.006 -.052 .958
Ta đã biết biến “CTTThietbi” nhận giá trị 1 nếu công trình đó là công trình mua sắm trang thiết bị và nhận giá trị 0 nếu đó là công trình xây dựng. Do đó biến “CTTThietbi” có tác dụng so sánh nhóm thử là nhóm công trình mua sắm trang thiết bị với nhóm chứng là nhóm công trình xây dựng. Từ kết quả ở bảng 2.7, ta thấy biến “CTTThietbi” có hệ số hồi quy là -3,024 và xác suất ý nghĩa là 0,006 (tức là 0,6%). Vì xác suất ý nghĩa của biến này là 0,6% (nhỏ hơn 5%) nên hệ số hồi quy của biến này thực sự khác 0, do đó có thể kết luận là các công trình mua sắm trang thiết bị có tỷ lệ sai phạm trung bình thấp hơn các công trình xây dựng khoảng 3%. Như vậy, biến “CTTThietbi” là một yếu tố ảnh hưởng đến tỷ lệ sai phạm trong quyết toán.
Tương tự như vậy, ta có các biến “HaNoi”, “MienNui”, “MienNam” nhận giá trị là 1 khi công trình thi công tại địa bàn đó và nhận giá trị là 0 nếu công trình nằm trên địa bàn khác. Do đó 3 biến này đều đóng vai trò là nhóm thử, có tác dụng so sánh với nhóm chứng còn lại là nhóm “MienBac”. Từ kết quảở bảng 2.7, ta thấy hệ số hồi quy của cả 3 biến “HaNoi”, MienNui”, “MienNam” đều âm. Vậy có phải tỷ lệ sai phạm trung bình của cả 3 khu vực này đều nhỏ hơn tỷ lệ sai trung bình ở khu vực miền Bắc? Để có được kết luận chính xác, ta cần xem xét xác suất ý nghĩa tương ứng của các biến. Biến “HaNoi” và biến “MienNui” có xác suất ý nghĩa lần lượt là 38,3% và 12,5%, đều lớn hơn 5%, nên ta không chấp nhận giả thuyết hệ số hồi quy khác 0. Hay nói cách khác, 2 biến này có hệ số hồi quy coi như bằng 0. Do đó tỷ lệ sai phạm trung bình của 2 nhóm này so với nhóm chứng là nhóm miền Bắc là coi như không có sự sai khác gì (coi như bằng nhau). Biến “MienNam” có xác suất ý nghĩa là xấp xỉ 0% (nhỏ hơn 5%) nên ta chấp nhận giả thuyết hệ số hồi quy khác 0, tức là hệ số hồi quy của biến “MienNam” là -5,154. Do đó, các công trình ở miền Nam có tỷ lệ sai trung bình thấp hơn tỷ lệ sai trung bình của các công trình ở miền Bắc khoảng 5,154%.
Các biến “Truonghoc”, “CosoHT”, “Chungcu” sẽ là các nhóm thử để so sánh với nhóm chứng là nhóm trụ sở làm việc. Ta thấy, biến “Truonghoc” và “Chungcu” có xác suất ý nghĩa lần lượt là 37,2% và 61,7% (lớn hơn 5%) nên hệ số hồi quy của
2 biến này coi như bằng 0. Tức là tỷ lệ sai trung bình của các công trình trường học và chung cư coi như bằng tỷ lệ sai trung bình của các công trình trụ sở làm việc. Biến “CosoHT” có xác suất ý nghĩa là 0,1% (nhỏ hơn 5%) nên ta chấp nhận giả thuyết hệ số hồi quy của biến đó là 4,750. Do đó, các công trình cơ sở hạ tầng có tỷ lệ sai trung bình cao hơn tỷ lệ sai trung bình của các công trình trụ sở làm việc khoảng 4,75%.
Các biến “CTcolon” và “CTconho” sẽ là các nhóm thử để so sánh với nhóm chứng là nhóm các công trình cỡ vừa. Ta thấy, biến “CTcolon” và “CTconho” có xác suất ý nghĩa lần lượt là 6,9% và 95,8% (lớn hơn 5%) nên hệ số hồi quy của 2 biến này coi như bằng 0. Tức là tỷ lệ sai trung bình của các công trình cỡ lớn, cỡ nhỏ và cỡ vừa coi như bằng nhau.
Như vậy, qua việc sử dụng phương pháp hồi quy tuyến tính tổng quát ta thấy các yếu tố công trình trang thiết bị, cơ sở hạ tầng và miền Nam có ảnh hưởng đến tỷ lệ sai phạm của các công trình. Còn các yếu tố khác thì không có ảnh hưởng sai khác đến tỷ lệ sai.
Ta có thể dùng hồi quy từng bước để loại bỏ các biến không có ý nghĩa trong mô hình trên (các biến có hệ số hồi quy bằng 0) bằng cách sử dụng mô hình hồi quy từng bước. Sử dụng thủ tục hồi quy từng bước của phần mềm SPSS với biến phụ thuộc là biến “tylesai” và các biến độc lập là biến “CTTThietbi”, biến “HaNoi”, biến “MienNui”, biến “MienNam”, biến “Truonghoc”, biến “CosoHT”, biến “Chungcu”, biến “CTcolon”, biến “CTconho”, biến “CTcovua”. Ta thu được kết quả trong bảng 2.8.
Qua bảng 2.8, ta thấy mô hình hồi quy từng bước được tiến hành như sau. Bước 1, biến đầu tiên được đưa vào là biến “CosoHT” với hệ số hồi quy là 4,146 và xác suất ý nghĩa là 0,000 (tức là nhỏ hơn 0,1%). Ở bước thứ 2, ngoài biến “CosoHT” ta có thêm biến “MienNam”. Ở bước này biến “MienNam” có hệ số hồi quy là -4,217 và xác suất ý nghĩa là 0,1%; còn biến “CosoHT” thay đổi với hệ số hồi quy là 5,199 và xác suất ý nghĩa là 0%. Sang bước thứ 3, ngoài 2 biến ở trên ta có thêm biến
“CTTThietbi”. Ở bước này biến “CTTThietbi” có hệ số hồi quy là -2,582 và xác suất ý nghĩa là 0,8%; còn 2 biến đã có từ bước 2có sự điều chỉnh đôi chút. Biến “CosoHT” có hệ số hồi quy là 5,127 và xác suất ý nghĩa là 0%.Biến “MienNam” có hệ số hồi quy là -4,409 và xác suất ý nghĩa là 0,1%. Đến đây, thủ tục được dừng ở bước 3, không thêm biến độc lập nào khác vào. Mô hình 3 so với kết quả phần phân tích phương sai ở trên thì kết quả của mô hình 3 hoàn toàn phù hợp, vẫn là 3 yếu tố có ảnh hưởng sai khác đến tỷ lệ sai phạm của các công trình là công trình cơ sở hạ tầng, miền Nam và công trình trang thiết bị.
Bảng 2.8. Kết quả phân tích theo mô hình hồi quy từng bước
Model Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta 1 (Constant) CosoHT 1.196 4.146 .506 .986 .350 2.363 4.204 .020 .000 2 (Constant) CosoHT MienNam 1.507 5.199 -4.217 .496 1.001 1.273 .438 -.280 3.036 5.192 -3.312 .003 .000 .001 3 (Constant) CosoHT MienNam CTTThietbi 2.173 5.127 -4.409 -2.582 .544 .978 1.245 .958 .432 -.292 -.211 3.995 5.243 -3.542 -2.694 .000 .000 .001 .008
Với mô hình này, ta có thể đưa ra kết luận là trong các công trình phân theo chức năng sử dụng thì công trình cơ sở hạ tầng có tỷ lệ sai phạm trung bình (có ý
nghĩa thống kê) cao hơn công trình trụ sở làm việc 5,127%. Trong khi đó công trình trường học, chung cư có tỷ lệ sai phạm không sai khác (một cách có ý nghĩa thống kê) so với công trình trụ sở làm việc. Trong các công trình phân theo địa điểm thi công thì công trình ở miền Nam có tỷ lệ sai phạm trung bình ít hơn các công trình ở miền Bắc 4,409%. Nhưng nếu so sánh các công trình ở miền Bắc, miền núi và ở Hà Nội thì mức độ sai phạm của các công trình này như nhau. Trong các công trình phân theo đặc tính kỹ thuật, các công trình mua sắm trang thiết bị có mức độ sai phạm ít hơn 2,582% so với các công trình xây dựng. Còn các công trình phân theo mức kinh phí đầu tư thì giữa 3 nhóm công trình cỡ lớn, cỡ vừa và cỡ nhỏ không có sự sai khác về tỷ lệ sai phạm trung bình của các công trình.
Như vậy, qua mô hình hồi quy từng bước ta cũng có thể thấy các yếu tố công trình trang thiết bị, cơ sở hạ tầng và miền Nam là có sựảnh hưởng sai khác với các yếu tố còn lại tương ứng. Kết luận này cũng tương tự như kết luận có được nhờ mô hình hồi quy tuyến tính tổng quát cho đầy đủ các biến độc lập. Những kết luận này làm sáng tỏ những kết quả có được từ việc áp dụng phương pháp phân tích phương sai cho 4 nhân tốở phần 2.2.1.
KẾT LUẬN VÀ KIẾN NGHỊ
Như vậy, luận văn đã trình bày cơ sở lý thuyết của mô hình tuyến tính tổng quát và ứng dụng của mô hình này vào việc phân tích kết quả kiểm toán, quyết toán của một số công trình xây dựng. Qua việc phân tích, chúng ta đã phát hiện tỷ lệ sai phạm giữa số tiền quyết toán và kiểm toán có thể bị ảnh hưởng bởi một số yếu tố là địa điểm thi công, tính chất kỹ thuật và chức năng sử dụng của công trình. Trong đó những công trình xây dựng cơ sở hạ tầng rất dễ xảy ra sai phạm với tỷ lệ cao hơn 5% so với những công trình loại khác như công trình trường học, nhà công vụ, chung cư,… Nhưng những công trình ở miền Nam lại ít xảy ra sai phạm hơn (ít hơn 4,4%) so với những công trình ở miền Bắc, miền núi và Hà Nội. Những công trình (dự án) chỉ mua sắm trang thiết bị cũng ít sai phạm hơn hẳn (ít hơn 2,6%) những công trình xây dựng.
Từ những kết quả trên, để giảm sai sót trong việc quản lí tài chính đối với các công trình xây dựng nên đầu tư, tăng cường kiểm soát, giám sát một cách chặt chẽ đối với những công trình xây dựng, đặc biệt là những công trình xây dựng cơ sở hạ tầng như cầu, đường, thuỷđiện, trung tâm thương mại, khu di tích… Các nhà quản lý và nhân viên trong quá trình giám sát, kiểm tra, kiểm toán có thể nên chú trọng, tăng cường vào các công trình xây dựng hơn là vào các công trình (dự án) chỉ mua sắm trang thiết bị. Công việc giám sát, kiểm toán cũng nên chú trọng nhiều hơn vào các công trình ở các khu vực khác như Hà Nội, đồng bằng miền Bắc, miền núi hơn là chú trọng vào khu vực miền Nam để tiết kiệm thời gian và nhân lực. Những kết luận này sẽ giúp cho công việc quản lý làm tốt hơn, đầu tư thời gian, nhân lực một cách hiệu quả, tiết kiệm và định hướng cho ngành xây dựng, kiểm toán ở Việt Nam.
Các phương pháp phân tích thống kê có thể áp dụng cho các lĩnh vực khác như y tế, nông nghiệp, môi trường… Các kết quả thu được sẽ hỗ trợ đắc lực cho công tác hoạch định chính sách và điều hành ở các cơ quan quản lí.
TÀI LIỆU THAM KHẢO
[1] Đào Hữu Hồ, Nguyễn Văn Hữu, Hoàng Hữu Như (2004), Thống kê toán học, NXB Đại học Quốc gia Hà Nội.
[2] Nguyễn Duy Tiến, Vũ Việt Yên (2000), Lý thuyết xác suất, NXB Hà Nội.
[3] J. M. Dickey (1967), “Matricvariate generalizations of the multivariate t- distribution and the inverted multivariate t- distribution”, Annals of mathematical Statistics, 38, 511-518.
[4] J. H. Ellenberg (1973), “The joint distribution of the standardized least squares residual from general linear regression”, Journal of American Statistical Association, 68, 941 – 943.
[5] F. Graybill (1985), Theory and Application of the Linear Model, Wadsworth Publishing Company, Inc., Belmont, California.
[6] R. J. Muirhead (1982), Aspects of multivate statistical theory, Wiley Series in Probability and Mathematical Statistics, John Wiley anh Sons, Inc., New York.