Cho đến nay, đã có rất nhiều nghiên cứu sử dụng các phân tích thống kê để ước lượng chi phí cho các công trình xây dựng như: Ước tính chi phí sơ bộ cho các công trình công cộng ở bán đảo
Trang 1TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH
TẠI LONG AN
Trang 2Lê Thanh Tòng Trang 1
CHƯƠNG 1: ĐẶT VẤN ĐỀ 1.1 Giới thiệu chung:
Hình 1.1 Vị trí khu vực nghiên cứu (Nguồn : Google Maps 2016)
Long An là phần đất khá đặc biệt chuyển tiếp giữa Đông Nam Bộ và Tây Nam Bộ nên được xác định là vùng có vai trò chiến lược phát triển nền kinh
tế và nguồn nhân lực Cho nên việc xây dựng và sữa chữa các cơ sở, trung tâm giáo dục hiện nay được quan tâm rất nhiều để tập trung phát triền nguồn nhân lực trên địa bàn Tỉnh
Trong giai đoạn chuẩn bị cho một dự án xây dựng, một trong những điều quan trọng nhất là ước lượng chi phí xây dựng một cách hợp lý Điều này giúp các chủ đầu tư chủ động được nguồn vốn, đầu tư hiệu quả, tránh lãng phí Trong khi dự toán chi phí xây dựng công trình phải dựa trên khối lượng, đơn giá xây dựng, các chỉ tiêu kinh tế- kỹ thuật, nhân công, máy móc thi công… nên phải mất rất nhiều thời gian
Nghiên cứu này nhằm mục đích phát triển các mô hình dựa trên phân tích thống kê, mà đại diện cho nghiên cứu này là phân tích hồi quy đa biến,
Trang 3Lê Thanh Tòng Trang 2
nhằm xác định các nhân tố ảnh hưởng và ước lượng được chi phí xây dựng ban đầu cho các công trình trường học
Cho đến nay, đã có rất nhiều nghiên cứu sử dụng các phân tích thống kê
để ước lượng chi phí cho các công trình xây dựng như: Ước tính chi phí sơ bộ cho các công trình công cộng ở bán đảo Malaysia [11]; Mô hình dự báo thời gian và chi phí xây dựng thực tế [20]; Sử dụng mô hình hồi quy bôi dự báo chi phí xây dựng [6]…Tuy nhiên, chưa có nghiên cứu nào về hồi quy đa biến
để ước lượng chi phí cho các công trình trường học ở Long An
1.2 Xác định các vấn đề nghiên cứu:
1.2.1 Lý do nghiên cứu:
Để xác định chi phí xây dựng cho các công trình trường học (đa số từ vốn ngân sách nhà nước) được lập theo các phương pháp sau [21]:
- Phương pháp khối lượng và đơn giá xây dựng
- Phương pháp tổng khối lượng hao phí vật liệu, nhân công, máy thi công
và bảng giá tương ứng
- Phương pháp suất chi phí xây dựng công trình với các chỉ tiêu kinh tế -
kỹ thuật tương tự đã thực hiện
- Phương pháp phù hợp với tính chất và đặc điểm xây dựng công trình Tuy nhiên, các phương pháp trên vẫn còn nhiều bất cập trong các suất vốn đầu tư, các dạng công trình trong suất đầu tư vốn chưa đầy đủ, tốn nhiều thời thực hiện
Các dự toán công trình hiện nay được lập căn cứ trên khối lượng các công việc xác định theo thiết kế kỹ thuật, đơn giá xây dựng công trình… nên phải tốn rất nhiều thời gian.Việc nghiên cứu sử dụng các dữ liệu từ quá khứ thông qua các phân tích thống kê, để đưa ra các mô hình dự báo chi phí xây dựng cho các công trình xây dựng có ý nghĩa rất quan trọng, giúp các chủ đầu
Trang 4Lê Thanh Tòng Trang 3
tư quản lý tốt chi phí đầu tư, tránh những điều chỉnh, phát sinh gây nhiều lãng phí
1.2.2 Các câu hỏi nghiên cứu:
- Các nhân tố nào sẽ ảnh hưởng đến chi phí xây dựng cho các công trình trường học?
- Có thể dùng công cụ nào để tìm ra và phân tích các nhân tố ảnh hưởng đến chi phí, cách thực hiện thế nào?
- Dùng các công cụ và kiểm định thống kê nào để xây dựng mô hình ước lượng được chi phí xây dựng cho các công trình trường học? Mô hình ước lượng sai lệch với giá trị thực tế như thế nào ?
1.3 Các mục tiêu nghiên cứu
- Xác định các nhân tố ảnh hưởng đến chi phí xây dựng cho các công trình trường học để thu thập dữ liệu cho các biến đầu vào
- Từ các nhân tố ảnh hưởng đến chi phí xây dựng công trình trường học, xác định các nhân tố chính để đưa vào mô hình
- Thiết lập mô hình hồi qui đa biến để ước lượng chi phí xây dựng cho các công trình trường học
1.4 Phạm vi nghiên cứu
Nội dung nghiên cứu của luận văn được thực hiện trong phạm vi sau:
- Phạm vi của luận văn chỉ được giới hạn ở các dự án công trình trường học sử dụng vốn ngân sách (Tiểu học, Trung học cơ sở, Trung học phổ thông) trên địa bàn Tỉnh Long An
- Số liệu thu thập trong luận văn vào khoảng tháng 2/2015; các số liệu được lấy từ các công trình trường học ở Long An
- Dữ liệu nghiên cứu là các dữ liệu công trình trường học của giai đoạn kết thúc dự án
Trang 5Lê Thanh Tòng Trang 4
1.5 Đóng góp của nghiên cứu nghiên cứu
Hiện nay trên thế giới và Việt Nam đã có nhiều nghiên cứu liên quan đến ứng dụng hồi quy đa biến, để ước lượng chi phí thông qua việc khai thác các
dữ liệu quá khứ Nghiên cứu này đóng góp thêm một tình huống ứng dụng để ước lượng chi phí nữa trong xây dựng công trình trường học
Về mặt lý luận : Nghiên cứu này góp phần vào sự hiểu biết tốt hơn các nhân tố ảnh hưởng đến chi phí xây dựng công trình trường học Đồng thời mở
ra một triển vọng ước lượng chi phí xây dựng không chỉ dựa vào các phương pháp do nhà nước ban hành mà còn dựa vào các giá trị hiện thực của các dự
án đã xây dựng
Về mặt thực tiễn : Nghiên cứu sử dụng các dữ liệu từ quá khứ thông qua các phân tích thống kê, để đưa ra các mô hình dự báo chi phí xây dựng giúp các chủ đầu tư ước lượng chi phí khách quan, quản lý tốt chi phí đầu tư ban đầu, tránh những điều chỉnh, phát sinh gây nhiều lãng phí
Trang 6Lê Thanh Tòng Trang 5
CHƯƠNG 2: TỔNG QUAN 2.1 Phân tích hồi quy đa biến:
2.1.1 Khái niệm:
Phân tích hồi quy đa biến là một công cụ thống kê dùng để mô tả mối liên
hệ giữa một biến phụ thuộc (Y) và các biến độc lập (Xi) Phương trình mô tả
có dạng như sau:
Yi = 0 + 1X1i + 2X2i + … +kXpi + ei (2.1) Trong đó:
- Y: là biến phụ thuộc
- 0: là tung độ gốc
- Xpi : là các biến độc lập thứ p tại quan sát thứ i
- k là các hệ số hồi quy riêng phần (Partial regression coefficients)
- ei là một biến độc lập ngẫu nhiên (yếu tố nhiễu) có phân phối chuẩn với trung bình là 0 và phương sai không đổi 2
Mô hình hồi quy tuyến tính bội giả định rằng biến phụ thuộc có phân phối chuẩn đối với bất kỳ sự kết hợp nào của các biến độc lập trong mô hình
Để tránh hiên tượng đa cộng tuyến, trong phân tích hồi quy cần phải xem xét mối tương quan tuyến tính giữa các biến [6]
2.1.2 Các giả định trong phân tích hồi quy:
Phân tích hồi quy không phải chỉ là mô tả lại các dữ liệu đã quan sát, mà
từ các kết quả quan sát trong tập mẫu phải được suy rộng cho mối liên hệ giữa các biến trong tổng thể Các kết quả trong phân tích hồi quy được chấp nhận
và diễn giải thông qua các giả định cần thiết Nếu các giả định bị vi phạm thì các kết quả trong phân tích hồi quy không đáng tin cậy nữa [6]
Trang 7Lê Thanh Tòng Trang 6
2.1.2.1 Giả định độc lập
Các giá trị (Y) độc lập thống kê với nhau, tức là các quan sát này không
bị ảnh hưởng bởi các quan sát khác [6]
2.1.2.2 Giả định phân phối chuẩn và phương sai bằng nhau
Nếu các biến độc lập(X) được đưa vào với bất kì giá trị nào thì phân phối của biến phụ thuộc (Y) cũng đều là phân phối chuẩn, trung bình của (Y) tại một giá trị (X) cụ thể là μ (Y/X) và phương sai không đổi [6]
Cơ sở để xem xét vấn đề này cần phải quan sát biều đồ phân tán phần dư với mỗi biến, hoặc đối với giá trị ước lượng Ŷ Nếu đồ thị phân tán của phần
dư không theo một quy luật nào, dữ liệu là độc lập, đồ thị không phân bố dày đặc thì khả năng diễn đạt của mô hình đáng tin cậy [10]
2.1.2.3 Giả định tuyến tính
Nếu mối liên hệ không phải là quan hệ tuyến tính, mà trong phân tích dữ liệu ta dùng quan hệ tuyến tính để mô tả dữ liệu thì sẽ không có ý nghĩa Cho nên cần thiết phải kiểm tra điều kiện đủ thẳng thông qua các biểu đồ phân tán (Scatterplot) của biến phụ thuộc (Y) với mỗi biến độc lập (X) phải đủ thẳng ở điều kiện chấp nhận được [10]
2.1.3 Các thông số trong phân tích hồi quy:
Hệ số tương quan bội R (Coefficient of correlation): là hệ số thể hiện mức
độ chặt chẽ của mối liên hệ giữa 2 biến định lượng
X X Y Y R
Trang 8Lê Thanh Tòng Trang 7
thể hiện mối liên hệ đồng biến hoặc nghịch biến [6]
Hệ số xác định R 2 (Coefficient of determination): Dùng để đo mức độ phù
hợp của phương trình hồi quy với các số liệu quan sát được:
^ 2
_ _ 2 1
n i i
Y Y
R S S R
- R2 có khuynh hướng tăng lên khi số lượng biến độc lập giải thích trong
mô hình tăng lên R2 nhận giá trị trong [0,1] và R2 càng tiến về một thì phương trình hồi quy càng phù hợp với tập dữ liệu
Hệ số hồi quy riêng phần β k : Hệ số này cho biết ảnh hưởng của các thay đổi
một đơn vị trong Xk đối với giá trị trung bình của biến phụ thuộc (Y) khi loại trừ ảnh hưởng của các biến độc lập khác [6]
Hệ số beta: Độ lớn của các hệ số phụ thuộc vào đơn vị đo lường của các biến,
để so sánh các hệ số của các biến độc lập với cần phải quy đổi các biến độc lập về cùng đơn vị Một cách khác có thể làm cho các hệ số so sánh được với nhau là tính trọng số beta, đó là hệ số của biến độc lập (X) khi tất cả dữ liệu trên các biến được biểu diễn bằng đơn vị đo lường độ lệch chuẩn
k
Y
S B S
Sk là độ lệch chuẩn của biến độc lập thứ k [6]
Trang 9Lê Thanh Tòng Trang 8
Độ chấp nhận của biến (Tolerance): Được sử dụng đo lường hiện tượng đa
cộng tuyến và được định nghĩa bằng 2
1 R k , trong đó 2
k
R là hệ số tương quan bội khi biến độc lập Xk được dự đoán từ các biến độc lập còn lại Nếu độ chấp nhận của một biến nhỏ, thì nó gần như là một kết hợp tuyến tính của các biến
độc lập, đó là dấu hiệu đa cộng tuyến [6]
Hệ số phóng đại phương sai VIF (variance inflation factor): là nghịch đảo
của độ chấp nhận
2
1 IF
V
R
và hiện tượng đa cộng tuyến xảy ra khi VIF >10
2.2 Các nghiên cứu tương tự đã được công bố:
Để ước lượng chi phí xây dựng cho các công trình, có rất nhiều nghiên cứu sử dụng mô hình hồi quy đa biến để ước lượng chi phí đầu ra dựa trên các biến đầu vào như:
Al-Momani, [1] đã thu thập dữ liệu 125 dự án quá khứ từ năm 1984-
1994 Sử dụng mô hình hồi quy đa biến để phân tích các dữ liệu thu thập được
Y: Chi phí xây dựng
X1: Chi phí xây dựng theo hợp đồng
X2: Thay đổi thiết kế
X3: Diện tích sàn /m2
X4: Ngày hoàn thành thực tế
X5: Ngày hoàn thành dự kiến
X6: Thời gian chậm tiến độ
X7: Giá thầu cao nhất
Trang 10Lê Thanh Tòng Trang 9
Attalla, [2] dự báo độ lệch chi phí xây dựng trong các dự án tái xây dựng sử dụng mạng nơ-ron nhân tạo và hồi quy đa biến
- Thông tin thu thập được thông qua một cuộc khảo sát các chuyên gia xây dựng từ 50 dự án tái thiết
- Đối với từng dự án có độ lệch chi phí thực tế so với chi phí dự toán
- Dựa trên các thông tin thu thập đã xác định được 36 yếu tố có tác động trực tiếp đến chi phí xây dựng của các dự án tái thiết
- Sử dụng phân tích thống kê hồi quy và ANN để phát triển các mô hình
dự đoán
- Kết quả : Nghiên cứu đã góp phần tìm ra các lý do dẫn đến sự sai lệch chi phí của các dự án tái thiết và có thể định lượng các độ lệch chi phí này
Kim, [8] So sánh mô hình ước lượng chi phí xây dựng dựa trên phân
tích hồi quy, ANN và trường hợp cơ sở
- Thông qua chi phí xây dựng thực tế của 530 dự án dân dụng từ năm
1997 đến năm 2000 ở Seoul, Hàn Quốc Trong 530 dự án được chia ngẫu nhiên thành 480 bộ dùng để huấn luyện và 50 bộ dùng để kiểm
Trang 11Lê Thanh Tòng Trang 10
David, [5] Nghiên cứu phát triền mô hình hồi quy tuyến tính để dự báo chi phí xây dựng dựa trên 286 bộ dữ liệu đã được thu thập tại Anh Hai phương pháp phân tích đã được thực hiện là forward và backward stepwise, đưa ra được 6 mô hình và xác định được 41 biến độc lập trong đó có 5 biến xuất hiện trong cả 6 mô hình là :
X1: Tổng diện tích sàn X2: Chức năng công trình X3: Thời gian hoàn thành công trình X4: Hệ thống cơ điện
2000 đến năm 2009 (3 dự án dùng để kiểm tra và 30 dự án dùng làm bộ
dữ liệu xây dựng mô hình) và tìm ra được 7 nhân tố ảnh hưởng đến tổng mức đầu tư xây dựng công trình giao thông đường bộ bằng phân tích hồi quy đa biến
X1: Thời gian thực hiện dự án
X2: Chiều dài tuyến đường
X3: Số lượng cống bê tông cốt thép thoát nước trên tuyến
X4: Số lượng cầu bản bê tông cốt thép thoát nước trên tuyến X5: Số lượng cầu dầm bê tông cốt thép thoát nước trên tuyến X6: Bề rộng nền đường
Trang 12Lê Thanh Tòng Trang 11
X7: Bề rộng mặt đường
Mô hình tốt nhất theo phương pháp Stepwise là:
Tongmuc = 0,149Snen +78,081Lcaudam+22,493Lcong (2.8) Kết quả R2=0.86 và MAPE= 2.59%
Nguyễn Thanh Trúc [14] Nghiên cứu sử dụng phân tích hồi quy đa biến
để xây dựng mô hình ước lượng chi phí cho các dự án công trình trường học.Nghiên cứu khảo sát được thực hiện với 44 ứng viên tham gia trả lời bảng câu hỏi và tìm được 6 nhân tố Dữ liệu thu thập từ 27 công trình xây dựng trường học tại tỉnh Vĩnh Long từ năm 2007 đến
2014
X1: Tổng diện tích xây dựng X2: Số tầng cao
X3: Số phòng học X4: Phương án gia cố nền móng X5: Vị trí xây dựng
X6: Loại mái
Mô hình thu được
Y= -216,010+ 7,036X1-545,190X2-119,436X3+2118,815X4
Kết quả R Adjusted Square =0,971 và MAPE = 12,01%
Nguyễn Hữu Phúc [13] Nghiên cứu sử dụng phân tích hồi quy đa biến
và mô hình ANN để dự báo thời gian thi công của công trình cầu đường bộ Thông qua cuộc khảo sát 20 ứng viên đã tìm được 12 nhân
tố chính Dữ liệu thu thập từ 44 dự án xây dựng cầu đường bộ từ năm
2000 đến năm 2014
Trang 13Lê Thanh Tòng Trang 12
Kết quả mô hình ANN dự báo tốt hơn MLR với R Square = 0,9045 và MAPE=5,28%
Trang 14
Lê Thanh Tòng Trang 13
CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU 3.1 Quy trình nghiên cứu
Hình 3.1 Quy trình nghiên cứu (Nguồn: Bài giảng phương pháp nghiên cứu khoa học, Lưu 2014)
3.2 Xác định các nhân tố ảnh hưởng đến chi phí xây dựng công trình
trường học
Các nhân tố ảnh hưởng đến chi phí xây dựng công trình được dựa trên các nghiên cứu tương tự đã được công bố:
Nguyễn Thanh Trúc (2014) dùng mô hình hồi quy để ước lượng chi phí xây
dựng cho công trình trường học ở Vĩnh Long với 6 biến đầu vào:
1 Tổng diện tích xây dựng
XÁC ĐỊNH ĐỀ TÀI
Thông qua các nghiên cứu trước đây, tạp chí, tài liệu để
xác định các nhân tố
Tham khảo ý kiến chuyên gia, bảng câu hỏi để tìm ra các
nhân tố chính bằng các phân tích thống kê
Thu thập và xử lý số liệu
Xây dựng mô hình hồi qui
Đánh giá sự phù hợp của mô hình dựa trên các kiểm định
thống kê Đánh giá kết quả hồi qui
Kết luận và kiến nghị
Ý kiến GVHD
Linear Regression
Trang 15Lê Thanh Tòng Trang 14
Al-Momani (1996) đã thu thập dữ liệu 125 dự án quá khứ từ năm 1984- 1994
Sử dụng mô hình hồi quy đa biến để phân tích các dữ liệu thu thập được
1 Chi phí xây dựng theo hợp đồng
2 Thay đổi thiết kế
3 Diện tích sàn /m2
4 Ngày hoàn thành thực tế
5 Ngày hoàn thành dự kiến
6 Thời gian chậm tiến độ
7 Giá thầu cao nhất
8 Giá thầu thấp nhất
Nguyễn Hữu Thức (2010) đã xác định chi phí xây dựng công trình cao ốc
thông qua 16 nhân tố:
Trang 16Lê Thanh Tòng Trang 15
12 Số lượng thang máy
13 Số tầng hầm
14 Loại cao ốc văn phòng
15 Vị trí xây dựng
16 Cảnh quang xung quanh
Thông qua việc tham khảo các nghiên cứu trên và tham khảo ý kiến của 7 chuyên gia trong các lĩnh vực thiết kế, thi công, giám sát…hoạt động trong các dự án xây dựng công trình dân dụng trên 10 năm, từ đó xác định được 14 nhân tố sau ảnh hưởng chi phí xây dựng công trình trường học:
14 Khối lượng san nền
3.3 Các công cụ nghiên cứu
Trang 17Lê Thanh Tòng Trang 16
Bảng 3.1 Các công cụ nghiên cứu
Xác định các nhân tố chính - Bảng câu hỏi
- Phân tích thống kê của phần mềm SPSS
Phân tích mô hình hồi qui và kiểm
định mô hình
- Sử dụng công cụ Linear Regression của phần mềm SPSS
3.4 Thiết kế bảng câu hỏi
3.4.1 Quy trình thiết kế bảng câu hỏi:
Hình 3.2 Quy trình thiết kế bảng câu hỏi (Nguồn: Bài giảng phương pháp nghiên cứu khoa học, Lưu 2014)
3.4.2 Cấu trúc của bảng câu hỏi
Cấu trúc bảng câu hỏi được chia làm 3 thành phần chính:
Đọc những bài báo và nghiên cứu
trước
Nhận dạng các nhân tố ảnh hưởng
đến chi phí
Xác định được các nhân tố chính
đưa vào bảng câu hỏi
Tham khảo ý kiến chuyên gia
Xây dựng bảng câu hỏi và chuyển
đến đối tượng khảo sát Thu thập lại bảng câu hỏi
Trang 18Lê Thanh Tòng Trang 17
Phần 1: Giới thiệu thông tin về cá nhân và định hướng cho các ứng viên hiểu được các vấn đề, mục đích của việc khảo sát giúp cho các ứng viên trả lời phù hợp với kinh nghiệm và hiểu biết của bản thân Phần 2: Sử dụng thang đo tỷ lệ Likert với các mức độ ảnh hưởng từ 1 đến 5 Thông qua điểm từ bảng câu hỏi sẽ đánh giá các yếu tố ảnh hưởng đến chi phí xây dựng cho các công trình trường học
Phần 3:Các thông tin cá nhân của người tham gia khảo sát
Chi tiết của bảng câu hỏi được trình bày ở phụ luc 1
3.5 Thiết kế mẫu
3.5.1 Khung lấy mẫu
Dữ liệu sơ cấp được thu thập thông qua các bảng câu hỏi được gửi trực tiếp đến các cá nhân hoạt động trong các lĩnh vực thiết kế, thi công, tư vấn thiết kế, giám sát, thẩm định dự án… nhằm mục đích xác định các nhân tố chính trong 14 nhân tố và mức độ ảnh hưởng của các yếu tố này đến chi phí xây dựng cho các công trình trường học
3.5.2 Xác định kích thước mẫu
Để đảm bảo ý nghĩa về mặt thống kê thì kích thước mẫu phải đủ lớn Số lượng mẫu cho phân tích hồi quy n= 50+ 8*m với m: số biến độc lập (Comrey, 1973; Roger, 2006) Mẫu khảo sát dùng bảng câu hỏi dự kiến với kích thước khoảng 100 mẫu
3.5.3 Phương pháp lấy mẫu
Thu thập dữ liệu quá khứ: Phương pháp lấy mẫu được chọn là phương
pháp lấy mẫu thuận tiện trên các dữ liệu của chủ đầu tư
Khảo sát bằng bảng câu hỏi: theo phương pháp thuận tiện từ các kĩ sư Phương pháp này được sử dụng rất nhiều, tuy nhiên về mặt thống kê không thể xác định mức độ chính xác vì không biết được sai số lấy mẫu[11]
Trang 19Lê Thanh Tòng Trang 18
3.6 Thang đo và độ tin cậy của thang đo
Thang đo tỷ lệ Likert với mức độ từ 1 đến 5 dùng để hỏi người khảo sát
về mức độ đồng ý Thông qua hệ số Cronbach Alpha để đánh giá mức độ chặt chẽ của các mục câu hỏi trong thang đo Các điểm số trong bảng câu hỏi cũng
sẽ được tính toán và xếp hạng dựa trên giá trị trung bình.Từ đó xác định các nhân tố ảnh hưởng chính đến vấn đề khảo sát
3.7 Thu thập dữ liệu
Thu thập dữ liệu dùng trong nghiên cứu này dựa trên 2 nguồn dữ liệu:
- Dữ liệu sơ cấp: là các dữ liệu từ bảng câu hỏi được gửi trực tiếp đến các đối tượng phù hợp với vấn đề khảo sát Sau khi nhận lại các bảng câu hỏi sẽ thu được các nhân tố chính ảnh hưởng đến chi phí xây dựng cho công trình trường học
- Dữ liệu thứ cấp: là các dữ liệu trong quá khứ từ các công trình trường học (TH, THCS, THPT)
3.8 Phân tích dữ liệu
Từ các dữ liệu sơ cấp được thu thập thông qua bảng câu hỏi, sau khi tiến hành làm sạch và mã hóa thông tin sẽ nhập vào phần mềm SPSS Version 22
- Đánh giá độ tin cậy của thang đo thông qua hệ số Cronbach Alpha
- Tính toán điểm trung bình và xếp hạng các nhân tố dựa trên điểm trung bình để chọn ra các nhân tố chính ảnh hưởng đến chi phí xây dựng cho các công trình trường học
3.9 Thiết lập mô hình hồi quy đa biến
3.9.1 Phương pháp lựa chọn biến [6]
Để xây dựng được mô hình hồi quy đa biến hợp lý thì việc xác định các biến độc lập để dự báo tốt cho biến phụ thuộc là cần thiết.Các phương pháp
lựa chọn biến phổ biến trong SPSS
Trang 20Lê Thanh Tòng Trang 19
Phương pháp đưa dần vào (forward selection):
- là phương pháp đưa dần vào và biến đầu tiên được xem xét khi đưa vào phương trình có tương quan thuận hay nghịch lớn nhất với biến phụ thuộc Kiểm định F đối với giả thuyết hệ số của biến đưa vào bằng 0 sẽ được tính toán và so sánh với 2 tiêu chuẩn: F ≥ FIN (F-to-enter) hoặc F ≤ PIN (Probability of F- to –enter)
- Biến đầu tiên được chọn là biến thỏa mãn tiêu chuẩn và xem xét các biến đưa vào tiếp theo Nếu các biến tiếp theo có hệ số tương quan riêng lớn trong mô hình hồi quy giữa biến phụ thuộc và các biến độc lập còn lại thì sẽ loại bỏ biến đầu tiên.Quá trình này sẽ được lặp lại khi không còn biến nào thỏa thỏa tiêu chuẩn vào
Phương pháp loại trừ dần (backward elimination)
- Là phương pháp đưa tất cả các biến vào mô hình và sẽ loại bỏ dần bằng 2 tiêu chuẩn FOUT (F-to-remove) hoặc POUT (Probability of
F-to-remove)
- Nếu biến thỏa F ≥ FOUT hoặc F ≤ POUT thì biến đó sẽ được giữ lại Biến có hệ số tương quan từng phần nhỏ nhất sẽ được kiểm tra đầu tiên, nếu biến này không thỏa tiêu chuẩn thì phương trình sẽ tính toán lại, quá trình này được lặp lại cho đến khi không còn biến nào vi
phạm tiêu chuẩn
Phương pháp lựa chọn từng bước (Stepwise selection)
- Là phương pháp phổ biến nhất và nó phối hợp cả 2 phương pháp forward và backward
- Biến độc lập mà giải thích tốt nhất cho biến phụ thuộc sẽ được thêm vào đầu tiên
- Các biến tiếp theo được chọn dựa trên sự đóng góp gia tăng của chúng cho biến thứ nhất
Trang 21Lê Thanh Tòng Trang 20
- Để tránh việc trùng lặp của 1 biến đưa vào thì giá trị PIN <POUT hay FIN > FOUT
3.9.2 Kiểm định các giả thuyết của mô hình hồi quy [6]
3.9.2.1 Kiểm định về sự phù hợp của mô hình:
- Khi xây dựng mô hình hồi quy mà các hệ số đứng trước biến độc lập đều bằng không (β 1= β2 =β3…=β n=0)thì phương trình hồi quy mẫu
là không phù hợp vì các biến độc lập không ảnh hưởng đến biến phụ thuộc
- Kiểm định F được dùng trong bảng phân tích phương sai để kiểm định giả thuyết về sự phù hợp của mô hình được xây dựng so với mô hình tổng thể
3.9.2.2 Kiểm định về ý nghĩa các hệ số hồi quy riêng phần β k
- Là hệ số cho biết ảnh hưởng của các thay đổi một đơn vị trong Xk
đối với giá trị trung bình của biến phụ thuộc Y khi loại trừ ảnh hưởng
của các biến độc lập khác
- Trị thống kê t được dùng cho kiểm định giả thuyết này.Nếu kết quả kiểm định không đủ bác bỏ H0 thì mô hình hồi quy đã xây dựng không có căn cứ nào cho thấy βk ≠ 0.Tuy nhiên vẫn không thể khẳng định biến độc lập Xk không có ảnh hưởng đến biến phụ thuộc Y
3.9.2.3 Kiểm định giả thuyết về tầm quan trọng của các biến
- Hệ số tầm quan trọng của một biến được đặc trưng bởi R square change và được xác định khi đưa thêm biến vào phương trình hồi quy mẫu
Trang 22Lê Thanh Tòng Trang 21
Với N là số dữ liệu quan sát, q là số biến đưa vào, p là số biến độc lập trong mô hình
3.9.3 Kiểm định các giả định của mô hình hồi quy
3.9.3.1 Giả định độc lập của sai số
Các giá trị (Y) độc lập thống kê với nhau, tức là các quan sát này không
bị ảnh hưởng bởi các quan sát khác [6]
Giả định về sai số thực ei cho nó là biến ngẫu nhiên, độc lập (các phần
dư không có mối tương quan) có phân phối chuẩn với giá trị trung bình bằng
0 và phương sai không đổi σ2
Đại lượng thống kê Durbin-Watson (d) dùng để kiểm định tương quan các sai số kề nhau
2 1 2
2 2
N
i i i
N i i
3.9.3.2 Giả định phân phối chuẩn của phần dư
Mô hình hồi quy lý tưởng là với bất kì giá trị nào của biến phụ thuộc thì phần dư đều tuân theo phân phối chuẩn
Việc sử dụng sai mô hình, phương sai không phải là hằng số thì phần dư
có thể không tuân theo phân phối chuẩn
Để khảo sát sự phân phối của phần dư có thể sử dụng 2 biểu đồ là: Biểu
đồ tần suất Histogram hoặc biểu đồ tần suất Q-Q plot
3.9.3.3 Giả định phương sai của sai số không đổi
Nếu sai số của phần dư tăng hoặc giảm cùng với giá trị của các biến độc lập thì mô hình hồi quy tuyến tính bội có thể có phương sai thay đổi Hiện tượng phương sai thay đổi làm cho mô hình ước lượng bằng phương pháp bình phương bé nhất không hiệu quả
Trang 23Lê Thanh Tòng Trang 22
Để kiểm tra phương sai không đổi thì phần dư phải phân bố xung quanh giá trị trung bình trong phạm vi không đổi
3.9.3.4 Giả định liên hệ tuyến tính
Nếu các mối liên hệ không phải là quan hệ tuyến tính, mà trong phân tích dữ liệu ta dùng quan hệ tuyến tính để mô tả dữ liệu thì sẽ không có ý nghĩa.Cho nên cần phải kiểm tra giả định liên hệ tuyến tính
Sử dụng biểu đồ phân tán Scatter plot để kiểm tra điều kiện khá thẳng của biến phụ thuộc với mỗi biến độc lập
3.9.3.5 Giả định không có mối tương quan giữa các biến độc lập
Hiện tượng đa cộng tuyến xảy ra khi các biến độc lập có mối tương quan chặt chẽ với nhau sẽ làm tăng độ lệch chuẩn của các hệ số trong mô hình hồi quy, đồng thời làm giảm trị thống kê t.Vì thế cần phải kiểm tra giả định không
có mối tương quan giữa các biến độc lập
3.9.4 Các bước xây dựng mô hình hồi quy đa biến
Bước 1: Thu thập và xử lý các dữ liệu sơ cấp, thứ cấp
Bước 2: Tiến hành phân tích tương quan giữa các biến
Bước 3: Phân tích lựa chọn biến ( forward selection, backward
elimination, Stepwise selection, Enter)
Bước 4: Kiểm định các giả thuyết của mô hình hồi quy
Bước 5: Kiểm định các giả định của mô hình hồi quy
Bước 6: Đánh giá mô hình hồi quy
Trang 24Lê Thanh Tòng Trang 23
CHƯƠNG 4: XÂY DỰNG MÔ HÌNH HỒI QUY ĐA BIẾN
4.1 Xác định các nhân tố chính ảnh hưởng đến chi phí xây dựng công trình trường học
4.1.1 Dữ liệu sơ cấp
Là các bảng câu hỏi khảo sát được gửi trực tiếp đến các kĩ sư xây dựng Tổng số bảng câu hỏi được phát đi là 100, kết quả thu lại được sau khi kiểm tra là 96 bảng câu hỏi, tỉ lệ là 96 %
Hình 4.1 thể hiện kinh nghiệm của các ứng viên tham gia trong cuộc phỏng vấn.Kết quả phỏng vấn là đáng tin cậy thông qua thời gian làm việc của ứng viên trên 5 năm chiếm 60%, ứng viên từ 3 đến 5 năm chiếm 22% và ứng viên dưới 3 năm là 18%
Hình 4.1 Kinh nghiệm của ứng viên trong cuộc khảo sát
4.1.2 Đánh giá độ tin cậy thang đo
Kết quả tổng hợp bảng câu hỏi khảo sát được trình bày trong phụ lục 2
Từ kết quả tổng hợp của bảng câu hỏi khảo sát Tiến hành phân tích đánh giá độ tin cậy của thang đo
Trang 25Lê Thanh Tòng Trang 24
Bảng 4.1 Kết quả phân tích Cronbach Alpha
giữa mục hỏi
và tổng các biến còn lại
Cronbach Alpha nếu loại bỏ mục hỏi Tongdientich
Trang 26Lê Thanh Tòng Trang 25
Từ kết quả phân tích bảng 4.1 cho thấy hệ số Cronbach Alpha là 0,806
>0,8 chứng tỏ rằng thang đo là tốt Các hệ số Cronbach Alpha nếu loại bỏ mục hỏi điều bé hơn giá trị Cronbach Alpha nên không cần loại bỏ mục hỏi nào[6]
4.1.3 Xếp hạng các nhân tố ảnh hưởng đến chi phí xây dựng công trình trường học
Các nhân tố được xếp hạng trên cơ sở tính toán giá trị trung bình của kết quả bảng câu hỏi khảo sát Các nhân tố có giá trị trung bình trên 3,4 sẽ được xem xét để đưa vào mô hình hồi quy
Bảng 4.2 Xếp hạng các nhân tố
xây dựng
Giá trị trung bình
Xếp hạng
Trang 27Lê Thanh Tòng Trang 26
Bảng câu hỏi khảo sát được đánh giá trên thang điểm 5 để đánh giá mức độ ảnh hưởng Giá trị khoảng cách = (Maximum- Minimum)/n = (5-1)/2 = 0.8 1.00 -> 1.80: Hoàn toàn không ảnh hưởng
1.81 -> 2.60: Không ảnh hưởng
2.61 -> 3.40: có thể ảnh hưởng
3.41 -> 4.20: Ảnh hưởng
4.21 -> 5.00: Hoàn toàn ảnh hưởng
Các giá trị trung bình trong bảng 4.2 đều >3,4 thể hiện mức độ có thể ảnh hưởng.Cho nên 14 biến này đều có thể đưa vào xây dựng mô hình hồi quy [7]
4.1.4 Dữ liệu thứ cấp
30 bộ dữ liệu thứ cấp (11 trường tiểu học, 9 THCS, 9 THPT) được thu thập từ kho lưu trữ của của chủ đầu tư từ năm 2007 đến 2014 theo 14 biến có khả năng là biến đầu vào và biến chi phí xây dựng là biến đầu ra
Dữ liệu của các biến định tính được phân theo:
Biến giải pháp kết cấu móng bao gồm 3 loại là móng cọc BTCT, cừ tràm và móng đơn trên nền tự nhiên
Biến loại kết cấu mái bao gồm 2 loại là mái ngói và mái tole
Biến vị trí xây dựng bao gồm 2 loại: trong thành phố và ở các huyện
Cấp công trình: công trình kiên cố, công trình cấp 3 và công trình cấp 4 Chi tiết tổng hợp kết quả dữ liệu thứ cấp được trình bày trong phụ lục 3
Trang 28Lê Thanh Tòng Trang 27
4.2 Xây dựng mô hình hồi quy đa biến
X8 Tổng diện tích phòng hành chánh
quản lý
Trang 29Lê Thanh Tòng Trang 28
Trong số 14 biến có khả năng làm biến đầu vào thì có 10 biến định lượng
và 4 biến phân loại Các biến phân loại được định nghĩa như sau:
Giải pháp kết cấu móng được phân chia làm 3 loại: móng cọc bê tông cốt thép (kí hiệu “3”), cừ tràm (kí hiệu “2”), móng đơn trên nền tự nhiên (“1”)
Móng cọc bê tông cốt thép: 1= móng cọc bê tông cốt thép, 0= không phải là móng cọc bê tông cốt thép
Cừ tràm: 1= cừ tràm, 0= không phải là cừ tràm
Móng đơn trên nền tự nhiên: 1= móng đơn trên nền tự nhiên, 0= không phải là móng đơn trên nền tự nhiên
Cấp công trình được phân chia làm 3 loại: công trình kiên cố (kí hiệu
“1”), công trình cấp 3 (kí hiệu “2”), công trình cấp 4 (kí hiệu “3”)
Loại kết cấu mái được phân chia làm 2 loại : mái ngói (kí hiệu “1”), mái tole (kí hiệu “2”)
Vị trí xây dựng được phân chia làm 2 loại: trong thành phố (kí hiệu
“1”), ở các huyện (kí hiệu “2”)
Các số liệu sau khi được mã hóa xong sẽ được nhập vào SPSS version 22
để tiến hành phân tích các bước tiếp theo
4.2.1.2 Phân nhóm dữ liệu
Các dữ liệu thu thập được từ 30 công trình trường học được phân chia làm 2 nhóm dữ liệu chính: nhóm 1 dùng để phân tích hồi quy và nhóm 2 dùng
để kiểm tra
Nhóm 1: dùng 27 dự án chiếm tỉ lệ 90 % để chạy phân tích hồi quy
Nhóm 2: dùng 3 dự án (4, 20, 29) chiếm tỉ lệ 10 % dùng để kiểm tra mô hình
Trang 30Lê Thanh Tòng Trang 29
30 bộ dữ liệu các dự án công trình trường học được thu thập ở các năm khác nhau nên cần qui đổi về 1 thời điểm chung theo chỉ số giá xây dựng so với kì gốc 2011 theo các văn bản đã công bố:
- Công văn số 2800/BXD-VP ngày 31/12/2007 của Bộ Xây dựng về việc công bố chỉ số giá xây dựng năm 2007 [3]
- Công văn số 208/BXD-VP ngày 19/02/2009 của Bộ Xây dựng về việc công bố chỉ số giá xây dựng quí 4, quí 4/2008 và năm 2008 [4]
- Quyết định 410/QĐ-BXD ngày 31/3/2010 của Bộ Xây dựng về việc công bố chỉ số giá xây dựng quí 4,và năm 2009 [15]
- Quyết định 196/QĐ-BXD ngày 23/02/2011 của Bộ Xây dựng về việc công bố chỉ số giá xây dựng quí 4,và năm 2010 [16]
- Quyết định số 91/QĐ-SXD-QLKTXD ngày 25/02/2013 của Sở Xây dựng thành phố Hồ Chí Minh về việc Công bố Chỉ số giá xây dựng tháng 10, 11, 12, quý 4/2011, và năm 2011 [17]
- Quyết định số 1278/QĐ-SXD-QLKTXD ngày 06/08/2013 của Sở xây dựng thành phố Hồ Chí Minh về việc Công bố Chỉ số giá xây dựng tháng 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, quý I, II, III, IV và năm 2012 [18]
- Quyết định số 1047/QĐ-SXD-QLKTXD ngày 23/9/2014 của Sở xây dựng thành phố Hồ Chí Minh về việc Công bố Chỉ số giá xây dựng từ tháng 4 đến tháng 12; Quý II, III, IV/2013 và năm 2013 [19]
- Quyết định số 198/QĐ-SXD ngày 06/08/2014 của Sở xây dựng tỉnh Long An về việc Công bố Chỉ số giá xây dựng từ tháng 4, tháng 5, tháng 6 và quí II năm 2014 [20]
Tính toán và qui đổi chỉ số giá xây dựng về năm gốc áp dụng cho công trình giáo dục từ năm 2007 về năm 2011 Các công trình từ năm 2012 đến năm 2014 đã được Sở Xây dựng qui đổi về năm 2011
Trang 31Lê Thanh Tòng Trang 30
4.2.2 Kiểm tra điều kiện khá thẳng
Sử dụng biểu đồ phân tán (Scatterplot) kiểm tra điều kiện khá thẳng của
01 biến phụ thuộc Chiphixaydung và 14 biến độc lập
Hình 4.2 Biểu đồ phân tán chiphixaydung và tongdientichphonghoc
Hình 4.3 Biểu đồ phân tán chiphixaydung và tongdientichhoitruong
Trang 32Lê Thanh Tòng Trang 31
Hình 4.4 Biểu đồ phân tán chiphixaydung và tongdientichphongthuchanh
Hình 4.5 Biểu đồ phân tán chiphixaydung và sotang
Trang 33Lê Thanh Tòng Trang 32
Hình 4.6 Biểu đồ phân tán chiphixaydung và giaiphapmong
Hình 4.7 Biểu đồ phân tán chiphixaydung và dientichphonghanhchanhquanly
Trang 34Lê Thanh Tòng Trang 33
Hình 4.8 Biểu đồ phân tán chiphixaydung và tongdientichcongtrinhphu
Hình 4.9 Biểu đồ phân tán chiphixaydung và chieudaiconghangrao
Trang 35Lê Thanh Tòng Trang 34
Hình 4.10 Biểu đồ phân tán chiphixaydung và thoigian
Sau khi kiểm tra biểu đồ phân tán giữa biến phụ thuộc và 14 biến độc lập
thì có 9 biến X1, X2, X3, X4 , X5, X8, X9, X11, X14 thỏa điều kiện khá thẳng
(R2 Linear > 0,3) sẽ đưa vào phân tích hồi quy 5 biến còn lại X6, X7, X10,
X12, X13 không thỏa (trình bày chi tiết trong phụ lục 04) sẽ được loại bỏ
4.2.3 Phân tích tương quan giữa các biến
Để xem xét mối quan hệ giữa các biến với nhau (biến phụ thuộc với các biến độc lập và các biến độc lập với nhau)
Analyze>> Correlate>> Bivariate:
Trang 36Lê Thanh Tòng Trang 35
Hình 4.11 hộp thoại phân tích tương quan các biến
Trang 37Lê Thanh Tòng Trang 36
Bảng 4.4: Bảng phân tích tương quan giữa các biến
Trang 38Lê Thanh Tòng Trang 37
Trang 39Lê Thanh Tòng Trang 38
Theo bảng 4.4 Kết quả phân tích tương quan giữa các biến cho thấy biến phụ thuộc và các biến độc lập đều có mối tương quan tương đối cao với nhau (> 0.617) Kiểm định giả thuyết ở mức ý nghĩa < 5% nên hệ số tương quan tổng thể bằng 0 bị bác bỏ Tuy nhiên hệ số tương quan giữa các biến độc lập với nhau cũng tương đối cao Vì vậy cần quan tâm đến hiện tượng đa cộng tuyến trong phân tích hồi quy
Sau khi kiểm tra điều kiện khá thẳng và phân tích tương quan giữa các biến.Cuối cùng đã xác định được các biến phù hợp để đưa vào mô hình:
Biến phụ thuộc Y: Chiphixaydung ( Triệu đồng)
Tiến hành phân tích lựa chọn biến theo 3 phương pháp: Forward
selection, Stepwise selection, backward elimination
4.2.4 Phân tích MLR bằng phương pháp Forward Selection
4.2.4.1 Phân tích MLR bằng SPSS
Analyze>> Regression>> Linear>>Forward
Trang 40Lê Thanh Tòng Trang 39
Hình 4.12 Hộp thoại phân tích hồi phương pháp Forward
Bảng 4.5 Model summary phương pháp Forward