1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng mô hình hồi quy đa biến (MLR) để ước lượng chi phí xây dựng cho công trình trường học tại long an

97 953 5

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 97
Dung lượng 1,58 MB

Nội dung

Cho đến nay, đã có rất nhiều nghiên cứu sử dụng các phân tích thống kê để ước lượng chi phí cho các công trình xây dựng như: Ước tính chi phí sơ bộ cho các công trình công cộng ở bán đảo

Trang 1

TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH

TẠI LONG AN

Trang 2

Lê Thanh Tòng Trang 1

CHƯƠNG 1: ĐẶT VẤN ĐỀ 1.1 Giới thiệu chung:

Hình 1.1 Vị trí khu vực nghiên cứu (Nguồn : Google Maps 2016)

Long An là phần đất khá đặc biệt chuyển tiếp giữa Đông Nam Bộ và Tây Nam Bộ nên được xác định là vùng có vai trò chiến lược phát triển nền kinh

tế và nguồn nhân lực Cho nên việc xây dựng và sữa chữa các cơ sở, trung tâm giáo dục hiện nay được quan tâm rất nhiều để tập trung phát triền nguồn nhân lực trên địa bàn Tỉnh

Trong giai đoạn chuẩn bị cho một dự án xây dựng, một trong những điều quan trọng nhất là ước lượng chi phí xây dựng một cách hợp lý Điều này giúp các chủ đầu tư chủ động được nguồn vốn, đầu tư hiệu quả, tránh lãng phí Trong khi dự toán chi phí xây dựng công trình phải dựa trên khối lượng, đơn giá xây dựng, các chỉ tiêu kinh tế- kỹ thuật, nhân công, máy móc thi công… nên phải mất rất nhiều thời gian

Nghiên cứu này nhằm mục đích phát triển các mô hình dựa trên phân tích thống kê, mà đại diện cho nghiên cứu này là phân tích hồi quy đa biến,

Trang 3

Lê Thanh Tòng Trang 2

nhằm xác định các nhân tố ảnh hưởng và ước lượng được chi phí xây dựng ban đầu cho các công trình trường học

Cho đến nay, đã có rất nhiều nghiên cứu sử dụng các phân tích thống kê

để ước lượng chi phí cho các công trình xây dựng như: Ước tính chi phí sơ bộ cho các công trình công cộng ở bán đảo Malaysia [11]; Mô hình dự báo thời gian và chi phí xây dựng thực tế [20]; Sử dụng mô hình hồi quy bôi dự báo chi phí xây dựng [6]…Tuy nhiên, chưa có nghiên cứu nào về hồi quy đa biến

để ước lượng chi phí cho các công trình trường học ở Long An

1.2 Xác định các vấn đề nghiên cứu:

1.2.1 Lý do nghiên cứu:

Để xác định chi phí xây dựng cho các công trình trường học (đa số từ vốn ngân sách nhà nước) được lập theo các phương pháp sau [21]:

- Phương pháp khối lượng và đơn giá xây dựng

- Phương pháp tổng khối lượng hao phí vật liệu, nhân công, máy thi công

và bảng giá tương ứng

- Phương pháp suất chi phí xây dựng công trình với các chỉ tiêu kinh tế -

kỹ thuật tương tự đã thực hiện

- Phương pháp phù hợp với tính chất và đặc điểm xây dựng công trình Tuy nhiên, các phương pháp trên vẫn còn nhiều bất cập trong các suất vốn đầu tư, các dạng công trình trong suất đầu tư vốn chưa đầy đủ, tốn nhiều thời thực hiện

Các dự toán công trình hiện nay được lập căn cứ trên khối lượng các công việc xác định theo thiết kế kỹ thuật, đơn giá xây dựng công trình… nên phải tốn rất nhiều thời gian.Việc nghiên cứu sử dụng các dữ liệu từ quá khứ thông qua các phân tích thống kê, để đưa ra các mô hình dự báo chi phí xây dựng cho các công trình xây dựng có ý nghĩa rất quan trọng, giúp các chủ đầu

Trang 4

Lê Thanh Tòng Trang 3

tư quản lý tốt chi phí đầu tư, tránh những điều chỉnh, phát sinh gây nhiều lãng phí

1.2.2 Các câu hỏi nghiên cứu:

- Các nhân tố nào sẽ ảnh hưởng đến chi phí xây dựng cho các công trình trường học?

- Có thể dùng công cụ nào để tìm ra và phân tích các nhân tố ảnh hưởng đến chi phí, cách thực hiện thế nào?

- Dùng các công cụ và kiểm định thống kê nào để xây dựng mô hình ước lượng được chi phí xây dựng cho các công trình trường học? Mô hình ước lượng sai lệch với giá trị thực tế như thế nào ?

1.3 Các mục tiêu nghiên cứu

- Xác định các nhân tố ảnh hưởng đến chi phí xây dựng cho các công trình trường học để thu thập dữ liệu cho các biến đầu vào

- Từ các nhân tố ảnh hưởng đến chi phí xây dựng công trình trường học, xác định các nhân tố chính để đưa vào mô hình

- Thiết lập mô hình hồi qui đa biến để ước lượng chi phí xây dựng cho các công trình trường học

1.4 Phạm vi nghiên cứu

Nội dung nghiên cứu của luận văn được thực hiện trong phạm vi sau:

- Phạm vi của luận văn chỉ được giới hạn ở các dự án công trình trường học sử dụng vốn ngân sách (Tiểu học, Trung học cơ sở, Trung học phổ thông) trên địa bàn Tỉnh Long An

- Số liệu thu thập trong luận văn vào khoảng tháng 2/2015; các số liệu được lấy từ các công trình trường học ở Long An

- Dữ liệu nghiên cứu là các dữ liệu công trình trường học của giai đoạn kết thúc dự án

Trang 5

Lê Thanh Tòng Trang 4

1.5 Đóng góp của nghiên cứu nghiên cứu

Hiện nay trên thế giới và Việt Nam đã có nhiều nghiên cứu liên quan đến ứng dụng hồi quy đa biến, để ước lượng chi phí thông qua việc khai thác các

dữ liệu quá khứ Nghiên cứu này đóng góp thêm một tình huống ứng dụng để ước lượng chi phí nữa trong xây dựng công trình trường học

Về mặt lý luận : Nghiên cứu này góp phần vào sự hiểu biết tốt hơn các nhân tố ảnh hưởng đến chi phí xây dựng công trình trường học Đồng thời mở

ra một triển vọng ước lượng chi phí xây dựng không chỉ dựa vào các phương pháp do nhà nước ban hành mà còn dựa vào các giá trị hiện thực của các dự

án đã xây dựng

Về mặt thực tiễn : Nghiên cứu sử dụng các dữ liệu từ quá khứ thông qua các phân tích thống kê, để đưa ra các mô hình dự báo chi phí xây dựng giúp các chủ đầu tư ước lượng chi phí khách quan, quản lý tốt chi phí đầu tư ban đầu, tránh những điều chỉnh, phát sinh gây nhiều lãng phí

Trang 6

Lê Thanh Tòng Trang 5

CHƯƠNG 2: TỔNG QUAN 2.1 Phân tích hồi quy đa biến:

2.1.1 Khái niệm:

Phân tích hồi quy đa biến là một công cụ thống kê dùng để mô tả mối liên

hệ giữa một biến phụ thuộc (Y) và các biến độc lập (Xi) Phương trình mô tả

có dạng như sau:

Yi = 0 + 1X1i + 2X2i + … +kXpi + ei (2.1) Trong đó:

- Y: là biến phụ thuộc

- 0: là tung độ gốc

- Xpi : là các biến độc lập thứ p tại quan sát thứ i

- k là các hệ số hồi quy riêng phần (Partial regression coefficients)

- ei là một biến độc lập ngẫu nhiên (yếu tố nhiễu) có phân phối chuẩn với trung bình là 0 và phương sai không đổi 2

Mô hình hồi quy tuyến tính bội giả định rằng biến phụ thuộc có phân phối chuẩn đối với bất kỳ sự kết hợp nào của các biến độc lập trong mô hình

Để tránh hiên tượng đa cộng tuyến, trong phân tích hồi quy cần phải xem xét mối tương quan tuyến tính giữa các biến [6]

2.1.2 Các giả định trong phân tích hồi quy:

Phân tích hồi quy không phải chỉ là mô tả lại các dữ liệu đã quan sát, mà

từ các kết quả quan sát trong tập mẫu phải được suy rộng cho mối liên hệ giữa các biến trong tổng thể Các kết quả trong phân tích hồi quy được chấp nhận

và diễn giải thông qua các giả định cần thiết Nếu các giả định bị vi phạm thì các kết quả trong phân tích hồi quy không đáng tin cậy nữa [6]

Trang 7

Lê Thanh Tòng Trang 6

2.1.2.1 Giả định độc lập

Các giá trị (Y) độc lập thống kê với nhau, tức là các quan sát này không

bị ảnh hưởng bởi các quan sát khác [6]

2.1.2.2 Giả định phân phối chuẩn và phương sai bằng nhau

Nếu các biến độc lập(X) được đưa vào với bất kì giá trị nào thì phân phối của biến phụ thuộc (Y) cũng đều là phân phối chuẩn, trung bình của (Y) tại một giá trị (X) cụ thể là μ (Y/X) và phương sai không đổi [6]

Cơ sở để xem xét vấn đề này cần phải quan sát biều đồ phân tán phần dư với mỗi biến, hoặc đối với giá trị ước lượng Ŷ Nếu đồ thị phân tán của phần

dư không theo một quy luật nào, dữ liệu là độc lập, đồ thị không phân bố dày đặc thì khả năng diễn đạt của mô hình đáng tin cậy [10]

2.1.2.3 Giả định tuyến tính

Nếu mối liên hệ không phải là quan hệ tuyến tính, mà trong phân tích dữ liệu ta dùng quan hệ tuyến tính để mô tả dữ liệu thì sẽ không có ý nghĩa Cho nên cần thiết phải kiểm tra điều kiện đủ thẳng thông qua các biểu đồ phân tán (Scatterplot) của biến phụ thuộc (Y) với mỗi biến độc lập (X) phải đủ thẳng ở điều kiện chấp nhận được [10]

2.1.3 Các thông số trong phân tích hồi quy:

Hệ số tương quan bội R (Coefficient of correlation): là hệ số thể hiện mức

độ chặt chẽ của mối liên hệ giữa 2 biến định lượng

X X Y Y R

Trang 8

Lê Thanh Tòng Trang 7

thể hiện mối liên hệ đồng biến hoặc nghịch biến [6]

Hệ số xác định R 2 (Coefficient of determination): Dùng để đo mức độ phù

hợp của phương trình hồi quy với các số liệu quan sát được:

^ 2

_ _ 2 1

n i i

Y Y

R S S R

- R2 có khuynh hướng tăng lên khi số lượng biến độc lập giải thích trong

mô hình tăng lên R2 nhận giá trị trong [0,1] và R2 càng tiến về một thì phương trình hồi quy càng phù hợp với tập dữ liệu

Hệ số hồi quy riêng phần β k : Hệ số này cho biết ảnh hưởng của các thay đổi

một đơn vị trong Xk đối với giá trị trung bình của biến phụ thuộc (Y) khi loại trừ ảnh hưởng của các biến độc lập khác [6]

Hệ số beta: Độ lớn của các hệ số phụ thuộc vào đơn vị đo lường của các biến,

để so sánh các hệ số của các biến độc lập với cần phải quy đổi các biến độc lập về cùng đơn vị Một cách khác có thể làm cho các hệ số so sánh được với nhau là tính trọng số beta, đó là hệ số của biến độc lập (X) khi tất cả dữ liệu trên các biến được biểu diễn bằng đơn vị đo lường độ lệch chuẩn

k

Y

S B S

Sk là độ lệch chuẩn của biến độc lập thứ k [6]

Trang 9

Lê Thanh Tòng Trang 8

Độ chấp nhận của biến (Tolerance): Được sử dụng đo lường hiện tượng đa

cộng tuyến và được định nghĩa bằng 2

1  R k , trong đó 2

k

R là hệ số tương quan bội khi biến độc lập Xk được dự đoán từ các biến độc lập còn lại Nếu độ chấp nhận của một biến nhỏ, thì nó gần như là một kết hợp tuyến tính của các biến

độc lập, đó là dấu hiệu đa cộng tuyến [6]

Hệ số phóng đại phương sai VIF (variance inflation factor): là nghịch đảo

của độ chấp nhận

2

1 IF

V

R

và hiện tượng đa cộng tuyến xảy ra khi VIF >10

2.2 Các nghiên cứu tương tự đã được công bố:

Để ước lượng chi phí xây dựng cho các công trình, có rất nhiều nghiên cứu sử dụng mô hình hồi quy đa biến để ước lượng chi phí đầu ra dựa trên các biến đầu vào như:

 Al-Momani, [1] đã thu thập dữ liệu 125 dự án quá khứ từ năm 1984-

1994 Sử dụng mô hình hồi quy đa biến để phân tích các dữ liệu thu thập được

Y: Chi phí xây dựng

X1: Chi phí xây dựng theo hợp đồng

X2: Thay đổi thiết kế

X3: Diện tích sàn /m2

X4: Ngày hoàn thành thực tế

X5: Ngày hoàn thành dự kiến

X6: Thời gian chậm tiến độ

X7: Giá thầu cao nhất

Trang 10

Lê Thanh Tòng Trang 9

 Attalla, [2] dự báo độ lệch chi phí xây dựng trong các dự án tái xây dựng sử dụng mạng nơ-ron nhân tạo và hồi quy đa biến

- Thông tin thu thập được thông qua một cuộc khảo sát các chuyên gia xây dựng từ 50 dự án tái thiết

- Đối với từng dự án có độ lệch chi phí thực tế so với chi phí dự toán

- Dựa trên các thông tin thu thập đã xác định được 36 yếu tố có tác động trực tiếp đến chi phí xây dựng của các dự án tái thiết

- Sử dụng phân tích thống kê hồi quy và ANN để phát triển các mô hình

dự đoán

- Kết quả : Nghiên cứu đã góp phần tìm ra các lý do dẫn đến sự sai lệch chi phí của các dự án tái thiết và có thể định lượng các độ lệch chi phí này

 Kim, [8] So sánh mô hình ước lượng chi phí xây dựng dựa trên phân

tích hồi quy, ANN và trường hợp cơ sở

- Thông qua chi phí xây dựng thực tế của 530 dự án dân dụng từ năm

1997 đến năm 2000 ở Seoul, Hàn Quốc Trong 530 dự án được chia ngẫu nhiên thành 480 bộ dùng để huấn luyện và 50 bộ dùng để kiểm

Trang 11

Lê Thanh Tòng Trang 10

 David, [5] Nghiên cứu phát triền mô hình hồi quy tuyến tính để dự báo chi phí xây dựng dựa trên 286 bộ dữ liệu đã được thu thập tại Anh Hai phương pháp phân tích đã được thực hiện là forward và backward stepwise, đưa ra được 6 mô hình và xác định được 41 biến độc lập trong đó có 5 biến xuất hiện trong cả 6 mô hình là :

X1: Tổng diện tích sàn X2: Chức năng công trình X3: Thời gian hoàn thành công trình X4: Hệ thống cơ điện

2000 đến năm 2009 (3 dự án dùng để kiểm tra và 30 dự án dùng làm bộ

dữ liệu xây dựng mô hình) và tìm ra được 7 nhân tố ảnh hưởng đến tổng mức đầu tư xây dựng công trình giao thông đường bộ bằng phân tích hồi quy đa biến

X1: Thời gian thực hiện dự án

X2: Chiều dài tuyến đường

X3: Số lượng cống bê tông cốt thép thoát nước trên tuyến

X4: Số lượng cầu bản bê tông cốt thép thoát nước trên tuyến X5: Số lượng cầu dầm bê tông cốt thép thoát nước trên tuyến X6: Bề rộng nền đường

Trang 12

Lê Thanh Tòng Trang 11

X7: Bề rộng mặt đường

Mô hình tốt nhất theo phương pháp Stepwise là:

Tongmuc = 0,149Snen +78,081Lcaudam+22,493Lcong (2.8) Kết quả R2=0.86 và MAPE= 2.59%

 Nguyễn Thanh Trúc [14] Nghiên cứu sử dụng phân tích hồi quy đa biến

để xây dựng mô hình ước lượng chi phí cho các dự án công trình trường học.Nghiên cứu khảo sát được thực hiện với 44 ứng viên tham gia trả lời bảng câu hỏi và tìm được 6 nhân tố Dữ liệu thu thập từ 27 công trình xây dựng trường học tại tỉnh Vĩnh Long từ năm 2007 đến

2014

X1: Tổng diện tích xây dựng X2: Số tầng cao

X3: Số phòng học X4: Phương án gia cố nền móng X5: Vị trí xây dựng

X6: Loại mái

Mô hình thu được

Y= -216,010+ 7,036X1-545,190X2-119,436X3+2118,815X4

Kết quả R Adjusted Square =0,971 và MAPE = 12,01%

 Nguyễn Hữu Phúc [13] Nghiên cứu sử dụng phân tích hồi quy đa biến

và mô hình ANN để dự báo thời gian thi công của công trình cầu đường bộ Thông qua cuộc khảo sát 20 ứng viên đã tìm được 12 nhân

tố chính Dữ liệu thu thập từ 44 dự án xây dựng cầu đường bộ từ năm

2000 đến năm 2014

Trang 13

Lê Thanh Tòng Trang 12

Kết quả mô hình ANN dự báo tốt hơn MLR với R Square = 0,9045 và MAPE=5,28%

Trang 14

Lê Thanh Tòng Trang 13

CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU 3.1 Quy trình nghiên cứu

Hình 3.1 Quy trình nghiên cứu (Nguồn: Bài giảng phương pháp nghiên cứu khoa học, Lưu 2014)

3.2 Xác định các nhân tố ảnh hưởng đến chi phí xây dựng công trình

trường học

Các nhân tố ảnh hưởng đến chi phí xây dựng công trình được dựa trên các nghiên cứu tương tự đã được công bố:

Nguyễn Thanh Trúc (2014) dùng mô hình hồi quy để ước lượng chi phí xây

dựng cho công trình trường học ở Vĩnh Long với 6 biến đầu vào:

1 Tổng diện tích xây dựng

XÁC ĐỊNH ĐỀ TÀI

Thông qua các nghiên cứu trước đây, tạp chí, tài liệu để

xác định các nhân tố

Tham khảo ý kiến chuyên gia, bảng câu hỏi để tìm ra các

nhân tố chính bằng các phân tích thống kê

Thu thập và xử lý số liệu

Xây dựng mô hình hồi qui

Đánh giá sự phù hợp của mô hình dựa trên các kiểm định

thống kê Đánh giá kết quả hồi qui

Kết luận và kiến nghị

Ý kiến GVHD

Linear Regression

Trang 15

Lê Thanh Tòng Trang 14

Al-Momani (1996) đã thu thập dữ liệu 125 dự án quá khứ từ năm 1984- 1994

Sử dụng mô hình hồi quy đa biến để phân tích các dữ liệu thu thập được

1 Chi phí xây dựng theo hợp đồng

2 Thay đổi thiết kế

3 Diện tích sàn /m2

4 Ngày hoàn thành thực tế

5 Ngày hoàn thành dự kiến

6 Thời gian chậm tiến độ

7 Giá thầu cao nhất

8 Giá thầu thấp nhất

Nguyễn Hữu Thức (2010) đã xác định chi phí xây dựng công trình cao ốc

thông qua 16 nhân tố:

Trang 16

Lê Thanh Tòng Trang 15

12 Số lượng thang máy

13 Số tầng hầm

14 Loại cao ốc văn phòng

15 Vị trí xây dựng

16 Cảnh quang xung quanh

Thông qua việc tham khảo các nghiên cứu trên và tham khảo ý kiến của 7 chuyên gia trong các lĩnh vực thiết kế, thi công, giám sát…hoạt động trong các dự án xây dựng công trình dân dụng trên 10 năm, từ đó xác định được 14 nhân tố sau ảnh hưởng chi phí xây dựng công trình trường học:

14 Khối lượng san nền

3.3 Các công cụ nghiên cứu

Trang 17

Lê Thanh Tòng Trang 16

Bảng 3.1 Các công cụ nghiên cứu

Xác định các nhân tố chính - Bảng câu hỏi

- Phân tích thống kê của phần mềm SPSS

Phân tích mô hình hồi qui và kiểm

định mô hình

- Sử dụng công cụ Linear Regression của phần mềm SPSS

3.4 Thiết kế bảng câu hỏi

3.4.1 Quy trình thiết kế bảng câu hỏi:

Hình 3.2 Quy trình thiết kế bảng câu hỏi (Nguồn: Bài giảng phương pháp nghiên cứu khoa học, Lưu 2014)

3.4.2 Cấu trúc của bảng câu hỏi

Cấu trúc bảng câu hỏi được chia làm 3 thành phần chính:

Đọc những bài báo và nghiên cứu

trước

Nhận dạng các nhân tố ảnh hưởng

đến chi phí

Xác định được các nhân tố chính

đưa vào bảng câu hỏi

Tham khảo ý kiến chuyên gia

Xây dựng bảng câu hỏi và chuyển

đến đối tượng khảo sát Thu thập lại bảng câu hỏi

Trang 18

Lê Thanh Tòng Trang 17

Phần 1: Giới thiệu thông tin về cá nhân và định hướng cho các ứng viên hiểu được các vấn đề, mục đích của việc khảo sát giúp cho các ứng viên trả lời phù hợp với kinh nghiệm và hiểu biết của bản thân Phần 2: Sử dụng thang đo tỷ lệ Likert với các mức độ ảnh hưởng từ 1 đến 5 Thông qua điểm từ bảng câu hỏi sẽ đánh giá các yếu tố ảnh hưởng đến chi phí xây dựng cho các công trình trường học

Phần 3:Các thông tin cá nhân của người tham gia khảo sát

Chi tiết của bảng câu hỏi được trình bày ở phụ luc 1

3.5 Thiết kế mẫu

3.5.1 Khung lấy mẫu

Dữ liệu sơ cấp được thu thập thông qua các bảng câu hỏi được gửi trực tiếp đến các cá nhân hoạt động trong các lĩnh vực thiết kế, thi công, tư vấn thiết kế, giám sát, thẩm định dự án… nhằm mục đích xác định các nhân tố chính trong 14 nhân tố và mức độ ảnh hưởng của các yếu tố này đến chi phí xây dựng cho các công trình trường học

3.5.2 Xác định kích thước mẫu

Để đảm bảo ý nghĩa về mặt thống kê thì kích thước mẫu phải đủ lớn Số lượng mẫu cho phân tích hồi quy n= 50+ 8*m với m: số biến độc lập (Comrey, 1973; Roger, 2006) Mẫu khảo sát dùng bảng câu hỏi dự kiến với kích thước khoảng 100 mẫu

3.5.3 Phương pháp lấy mẫu

Thu thập dữ liệu quá khứ: Phương pháp lấy mẫu được chọn là phương

pháp lấy mẫu thuận tiện trên các dữ liệu của chủ đầu tư

Khảo sát bằng bảng câu hỏi: theo phương pháp thuận tiện từ các kĩ sư Phương pháp này được sử dụng rất nhiều, tuy nhiên về mặt thống kê không thể xác định mức độ chính xác vì không biết được sai số lấy mẫu[11]

Trang 19

Lê Thanh Tòng Trang 18

3.6 Thang đo và độ tin cậy của thang đo

Thang đo tỷ lệ Likert với mức độ từ 1 đến 5 dùng để hỏi người khảo sát

về mức độ đồng ý Thông qua hệ số Cronbach Alpha để đánh giá mức độ chặt chẽ của các mục câu hỏi trong thang đo Các điểm số trong bảng câu hỏi cũng

sẽ được tính toán và xếp hạng dựa trên giá trị trung bình.Từ đó xác định các nhân tố ảnh hưởng chính đến vấn đề khảo sát

3.7 Thu thập dữ liệu

Thu thập dữ liệu dùng trong nghiên cứu này dựa trên 2 nguồn dữ liệu:

- Dữ liệu sơ cấp: là các dữ liệu từ bảng câu hỏi được gửi trực tiếp đến các đối tượng phù hợp với vấn đề khảo sát Sau khi nhận lại các bảng câu hỏi sẽ thu được các nhân tố chính ảnh hưởng đến chi phí xây dựng cho công trình trường học

- Dữ liệu thứ cấp: là các dữ liệu trong quá khứ từ các công trình trường học (TH, THCS, THPT)

3.8 Phân tích dữ liệu

Từ các dữ liệu sơ cấp được thu thập thông qua bảng câu hỏi, sau khi tiến hành làm sạch và mã hóa thông tin sẽ nhập vào phần mềm SPSS Version 22

- Đánh giá độ tin cậy của thang đo thông qua hệ số Cronbach Alpha

- Tính toán điểm trung bình và xếp hạng các nhân tố dựa trên điểm trung bình để chọn ra các nhân tố chính ảnh hưởng đến chi phí xây dựng cho các công trình trường học

3.9 Thiết lập mô hình hồi quy đa biến

3.9.1 Phương pháp lựa chọn biến [6]

Để xây dựng được mô hình hồi quy đa biến hợp lý thì việc xác định các biến độc lập để dự báo tốt cho biến phụ thuộc là cần thiết.Các phương pháp

lựa chọn biến phổ biến trong SPSS

Trang 20

Lê Thanh Tòng Trang 19

Phương pháp đưa dần vào (forward selection):

- là phương pháp đưa dần vào và biến đầu tiên được xem xét khi đưa vào phương trình có tương quan thuận hay nghịch lớn nhất với biến phụ thuộc Kiểm định F đối với giả thuyết hệ số của biến đưa vào bằng 0 sẽ được tính toán và so sánh với 2 tiêu chuẩn: F ≥ FIN (F-to-enter) hoặc F ≤ PIN (Probability of F- to –enter)

- Biến đầu tiên được chọn là biến thỏa mãn tiêu chuẩn và xem xét các biến đưa vào tiếp theo Nếu các biến tiếp theo có hệ số tương quan riêng lớn trong mô hình hồi quy giữa biến phụ thuộc và các biến độc lập còn lại thì sẽ loại bỏ biến đầu tiên.Quá trình này sẽ được lặp lại khi không còn biến nào thỏa thỏa tiêu chuẩn vào

Phương pháp loại trừ dần (backward elimination)

- Là phương pháp đưa tất cả các biến vào mô hình và sẽ loại bỏ dần bằng 2 tiêu chuẩn FOUT (F-to-remove) hoặc POUT (Probability of

F-to-remove)

- Nếu biến thỏa F ≥ FOUT hoặc F ≤ POUT thì biến đó sẽ được giữ lại Biến có hệ số tương quan từng phần nhỏ nhất sẽ được kiểm tra đầu tiên, nếu biến này không thỏa tiêu chuẩn thì phương trình sẽ tính toán lại, quá trình này được lặp lại cho đến khi không còn biến nào vi

phạm tiêu chuẩn

Phương pháp lựa chọn từng bước (Stepwise selection)

- Là phương pháp phổ biến nhất và nó phối hợp cả 2 phương pháp forward và backward

- Biến độc lập mà giải thích tốt nhất cho biến phụ thuộc sẽ được thêm vào đầu tiên

- Các biến tiếp theo được chọn dựa trên sự đóng góp gia tăng của chúng cho biến thứ nhất

Trang 21

Lê Thanh Tòng Trang 20

- Để tránh việc trùng lặp của 1 biến đưa vào thì giá trị PIN <POUT hay FIN > FOUT

3.9.2 Kiểm định các giả thuyết của mô hình hồi quy [6]

3.9.2.1 Kiểm định về sự phù hợp của mô hình:

- Khi xây dựng mô hình hồi quy mà các hệ số đứng trước biến độc lập đều bằng không (β 1= β2 =β3…=β n=0)thì phương trình hồi quy mẫu

là không phù hợp vì các biến độc lập không ảnh hưởng đến biến phụ thuộc

- Kiểm định F được dùng trong bảng phân tích phương sai để kiểm định giả thuyết về sự phù hợp của mô hình được xây dựng so với mô hình tổng thể

3.9.2.2 Kiểm định về ý nghĩa các hệ số hồi quy riêng phần β k

- Là hệ số cho biết ảnh hưởng của các thay đổi một đơn vị trong Xk

đối với giá trị trung bình của biến phụ thuộc Y khi loại trừ ảnh hưởng

của các biến độc lập khác

- Trị thống kê t được dùng cho kiểm định giả thuyết này.Nếu kết quả kiểm định không đủ bác bỏ H0 thì mô hình hồi quy đã xây dựng không có căn cứ nào cho thấy βk ≠ 0.Tuy nhiên vẫn không thể khẳng định biến độc lập Xk không có ảnh hưởng đến biến phụ thuộc Y

3.9.2.3 Kiểm định giả thuyết về tầm quan trọng của các biến

- Hệ số tầm quan trọng của một biến được đặc trưng bởi R square change và được xác định khi đưa thêm biến vào phương trình hồi quy mẫu

Trang 22

Lê Thanh Tòng Trang 21

Với N là số dữ liệu quan sát, q là số biến đưa vào, p là số biến độc lập trong mô hình

3.9.3 Kiểm định các giả định của mô hình hồi quy

3.9.3.1 Giả định độc lập của sai số

Các giá trị (Y) độc lập thống kê với nhau, tức là các quan sát này không

bị ảnh hưởng bởi các quan sát khác [6]

Giả định về sai số thực ei cho nó là biến ngẫu nhiên, độc lập (các phần

dư không có mối tương quan) có phân phối chuẩn với giá trị trung bình bằng

0 và phương sai không đổi σ2

Đại lượng thống kê Durbin-Watson (d) dùng để kiểm định tương quan các sai số kề nhau

 

2 1 2

2 2

N

i i i

N i i

3.9.3.2 Giả định phân phối chuẩn của phần dư

Mô hình hồi quy lý tưởng là với bất kì giá trị nào của biến phụ thuộc thì phần dư đều tuân theo phân phối chuẩn

Việc sử dụng sai mô hình, phương sai không phải là hằng số thì phần dư

có thể không tuân theo phân phối chuẩn

Để khảo sát sự phân phối của phần dư có thể sử dụng 2 biểu đồ là: Biểu

đồ tần suất Histogram hoặc biểu đồ tần suất Q-Q plot

3.9.3.3 Giả định phương sai của sai số không đổi

Nếu sai số của phần dư tăng hoặc giảm cùng với giá trị của các biến độc lập thì mô hình hồi quy tuyến tính bội có thể có phương sai thay đổi Hiện tượng phương sai thay đổi làm cho mô hình ước lượng bằng phương pháp bình phương bé nhất không hiệu quả

Trang 23

Lê Thanh Tòng Trang 22

Để kiểm tra phương sai không đổi thì phần dư phải phân bố xung quanh giá trị trung bình trong phạm vi không đổi

3.9.3.4 Giả định liên hệ tuyến tính

Nếu các mối liên hệ không phải là quan hệ tuyến tính, mà trong phân tích dữ liệu ta dùng quan hệ tuyến tính để mô tả dữ liệu thì sẽ không có ý nghĩa.Cho nên cần phải kiểm tra giả định liên hệ tuyến tính

Sử dụng biểu đồ phân tán Scatter plot để kiểm tra điều kiện khá thẳng của biến phụ thuộc với mỗi biến độc lập

3.9.3.5 Giả định không có mối tương quan giữa các biến độc lập

Hiện tượng đa cộng tuyến xảy ra khi các biến độc lập có mối tương quan chặt chẽ với nhau sẽ làm tăng độ lệch chuẩn của các hệ số trong mô hình hồi quy, đồng thời làm giảm trị thống kê t.Vì thế cần phải kiểm tra giả định không

có mối tương quan giữa các biến độc lập

3.9.4 Các bước xây dựng mô hình hồi quy đa biến

Bước 1: Thu thập và xử lý các dữ liệu sơ cấp, thứ cấp

Bước 2: Tiến hành phân tích tương quan giữa các biến

Bước 3: Phân tích lựa chọn biến ( forward selection, backward

elimination, Stepwise selection, Enter)

Bước 4: Kiểm định các giả thuyết của mô hình hồi quy

Bước 5: Kiểm định các giả định của mô hình hồi quy

Bước 6: Đánh giá mô hình hồi quy

Trang 24

Lê Thanh Tòng Trang 23

CHƯƠNG 4: XÂY DỰNG MÔ HÌNH HỒI QUY ĐA BIẾN

4.1 Xác định các nhân tố chính ảnh hưởng đến chi phí xây dựng công trình trường học

4.1.1 Dữ liệu sơ cấp

Là các bảng câu hỏi khảo sát được gửi trực tiếp đến các kĩ sư xây dựng Tổng số bảng câu hỏi được phát đi là 100, kết quả thu lại được sau khi kiểm tra là 96 bảng câu hỏi, tỉ lệ là 96 %

Hình 4.1 thể hiện kinh nghiệm của các ứng viên tham gia trong cuộc phỏng vấn.Kết quả phỏng vấn là đáng tin cậy thông qua thời gian làm việc của ứng viên trên 5 năm chiếm 60%, ứng viên từ 3 đến 5 năm chiếm 22% và ứng viên dưới 3 năm là 18%

Hình 4.1 Kinh nghiệm của ứng viên trong cuộc khảo sát

4.1.2 Đánh giá độ tin cậy thang đo

Kết quả tổng hợp bảng câu hỏi khảo sát được trình bày trong phụ lục 2

Từ kết quả tổng hợp của bảng câu hỏi khảo sát Tiến hành phân tích đánh giá độ tin cậy của thang đo

Trang 25

Lê Thanh Tòng Trang 24

Bảng 4.1 Kết quả phân tích Cronbach Alpha

giữa mục hỏi

và tổng các biến còn lại

Cronbach Alpha nếu loại bỏ mục hỏi Tongdientich

Trang 26

Lê Thanh Tòng Trang 25

Từ kết quả phân tích bảng 4.1 cho thấy hệ số Cronbach Alpha là 0,806

>0,8 chứng tỏ rằng thang đo là tốt Các hệ số Cronbach Alpha nếu loại bỏ mục hỏi điều bé hơn giá trị Cronbach Alpha nên không cần loại bỏ mục hỏi nào[6]

4.1.3 Xếp hạng các nhân tố ảnh hưởng đến chi phí xây dựng công trình trường học

Các nhân tố được xếp hạng trên cơ sở tính toán giá trị trung bình của kết quả bảng câu hỏi khảo sát Các nhân tố có giá trị trung bình trên 3,4 sẽ được xem xét để đưa vào mô hình hồi quy

Bảng 4.2 Xếp hạng các nhân tố

xây dựng

Giá trị trung bình

Xếp hạng

Trang 27

Lê Thanh Tòng Trang 26

Bảng câu hỏi khảo sát được đánh giá trên thang điểm 5 để đánh giá mức độ ảnh hưởng Giá trị khoảng cách = (Maximum- Minimum)/n = (5-1)/2 = 0.8 1.00 -> 1.80: Hoàn toàn không ảnh hưởng

1.81 -> 2.60: Không ảnh hưởng

2.61 -> 3.40: có thể ảnh hưởng

3.41 -> 4.20: Ảnh hưởng

4.21 -> 5.00: Hoàn toàn ảnh hưởng

Các giá trị trung bình trong bảng 4.2 đều >3,4 thể hiện mức độ có thể ảnh hưởng.Cho nên 14 biến này đều có thể đưa vào xây dựng mô hình hồi quy [7]

4.1.4 Dữ liệu thứ cấp

30 bộ dữ liệu thứ cấp (11 trường tiểu học, 9 THCS, 9 THPT) được thu thập từ kho lưu trữ của của chủ đầu tư từ năm 2007 đến 2014 theo 14 biến có khả năng là biến đầu vào và biến chi phí xây dựng là biến đầu ra

Dữ liệu của các biến định tính được phân theo:

 Biến giải pháp kết cấu móng bao gồm 3 loại là móng cọc BTCT, cừ tràm và móng đơn trên nền tự nhiên

 Biến loại kết cấu mái bao gồm 2 loại là mái ngói và mái tole

 Biến vị trí xây dựng bao gồm 2 loại: trong thành phố và ở các huyện

 Cấp công trình: công trình kiên cố, công trình cấp 3 và công trình cấp 4 Chi tiết tổng hợp kết quả dữ liệu thứ cấp được trình bày trong phụ lục 3

Trang 28

Lê Thanh Tòng Trang 27

4.2 Xây dựng mô hình hồi quy đa biến

X8 Tổng diện tích phòng hành chánh

quản lý

Trang 29

Lê Thanh Tòng Trang 28

Trong số 14 biến có khả năng làm biến đầu vào thì có 10 biến định lượng

và 4 biến phân loại Các biến phân loại được định nghĩa như sau:

 Giải pháp kết cấu móng được phân chia làm 3 loại: móng cọc bê tông cốt thép (kí hiệu “3”), cừ tràm (kí hiệu “2”), móng đơn trên nền tự nhiên (“1”)

 Móng cọc bê tông cốt thép: 1= móng cọc bê tông cốt thép, 0= không phải là móng cọc bê tông cốt thép

 Cừ tràm: 1= cừ tràm, 0= không phải là cừ tràm

 Móng đơn trên nền tự nhiên: 1= móng đơn trên nền tự nhiên, 0= không phải là móng đơn trên nền tự nhiên

 Cấp công trình được phân chia làm 3 loại: công trình kiên cố (kí hiệu

“1”), công trình cấp 3 (kí hiệu “2”), công trình cấp 4 (kí hiệu “3”)

 Loại kết cấu mái được phân chia làm 2 loại : mái ngói (kí hiệu “1”), mái tole (kí hiệu “2”)

 Vị trí xây dựng được phân chia làm 2 loại: trong thành phố (kí hiệu

“1”), ở các huyện (kí hiệu “2”)

Các số liệu sau khi được mã hóa xong sẽ được nhập vào SPSS version 22

để tiến hành phân tích các bước tiếp theo

4.2.1.2 Phân nhóm dữ liệu

Các dữ liệu thu thập được từ 30 công trình trường học được phân chia làm 2 nhóm dữ liệu chính: nhóm 1 dùng để phân tích hồi quy và nhóm 2 dùng

để kiểm tra

 Nhóm 1: dùng 27 dự án chiếm tỉ lệ 90 % để chạy phân tích hồi quy

 Nhóm 2: dùng 3 dự án (4, 20, 29) chiếm tỉ lệ 10 % dùng để kiểm tra mô hình

Trang 30

Lê Thanh Tòng Trang 29

30 bộ dữ liệu các dự án công trình trường học được thu thập ở các năm khác nhau nên cần qui đổi về 1 thời điểm chung theo chỉ số giá xây dựng so với kì gốc 2011 theo các văn bản đã công bố:

- Công văn số 2800/BXD-VP ngày 31/12/2007 của Bộ Xây dựng về việc công bố chỉ số giá xây dựng năm 2007 [3]

- Công văn số 208/BXD-VP ngày 19/02/2009 của Bộ Xây dựng về việc công bố chỉ số giá xây dựng quí 4, quí 4/2008 và năm 2008 [4]

- Quyết định 410/QĐ-BXD ngày 31/3/2010 của Bộ Xây dựng về việc công bố chỉ số giá xây dựng quí 4,và năm 2009 [15]

- Quyết định 196/QĐ-BXD ngày 23/02/2011 của Bộ Xây dựng về việc công bố chỉ số giá xây dựng quí 4,và năm 2010 [16]

- Quyết định số 91/QĐ-SXD-QLKTXD ngày 25/02/2013 của Sở Xây dựng thành phố Hồ Chí Minh về việc Công bố Chỉ số giá xây dựng tháng 10, 11, 12, quý 4/2011, và năm 2011 [17]

- Quyết định số 1278/QĐ-SXD-QLKTXD ngày 06/08/2013 của Sở xây dựng thành phố Hồ Chí Minh về việc Công bố Chỉ số giá xây dựng tháng 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, quý I, II, III, IV và năm 2012 [18]

- Quyết định số 1047/QĐ-SXD-QLKTXD ngày 23/9/2014 của Sở xây dựng thành phố Hồ Chí Minh về việc Công bố Chỉ số giá xây dựng từ tháng 4 đến tháng 12; Quý II, III, IV/2013 và năm 2013 [19]

- Quyết định số 198/QĐ-SXD ngày 06/08/2014 của Sở xây dựng tỉnh Long An về việc Công bố Chỉ số giá xây dựng từ tháng 4, tháng 5, tháng 6 và quí II năm 2014 [20]

Tính toán và qui đổi chỉ số giá xây dựng về năm gốc áp dụng cho công trình giáo dục từ năm 2007 về năm 2011 Các công trình từ năm 2012 đến năm 2014 đã được Sở Xây dựng qui đổi về năm 2011

Trang 31

Lê Thanh Tòng Trang 30

4.2.2 Kiểm tra điều kiện khá thẳng

Sử dụng biểu đồ phân tán (Scatterplot) kiểm tra điều kiện khá thẳng của

01 biến phụ thuộc Chiphixaydung và 14 biến độc lập

Hình 4.2 Biểu đồ phân tán chiphixaydung và tongdientichphonghoc

Hình 4.3 Biểu đồ phân tán chiphixaydung và tongdientichhoitruong

Trang 32

Lê Thanh Tòng Trang 31

Hình 4.4 Biểu đồ phân tán chiphixaydung và tongdientichphongthuchanh

Hình 4.5 Biểu đồ phân tán chiphixaydung và sotang

Trang 33

Lê Thanh Tòng Trang 32

Hình 4.6 Biểu đồ phân tán chiphixaydung và giaiphapmong

Hình 4.7 Biểu đồ phân tán chiphixaydung và dientichphonghanhchanhquanly

Trang 34

Lê Thanh Tòng Trang 33

Hình 4.8 Biểu đồ phân tán chiphixaydung và tongdientichcongtrinhphu

Hình 4.9 Biểu đồ phân tán chiphixaydung và chieudaiconghangrao

Trang 35

Lê Thanh Tòng Trang 34

Hình 4.10 Biểu đồ phân tán chiphixaydung và thoigian

Sau khi kiểm tra biểu đồ phân tán giữa biến phụ thuộc và 14 biến độc lập

thì có 9 biến X1, X2, X3, X4 , X5, X8, X9, X11, X14 thỏa điều kiện khá thẳng

(R2 Linear > 0,3) sẽ đưa vào phân tích hồi quy 5 biến còn lại X6, X7, X10,

X12, X13 không thỏa (trình bày chi tiết trong phụ lục 04) sẽ được loại bỏ

4.2.3 Phân tích tương quan giữa các biến

Để xem xét mối quan hệ giữa các biến với nhau (biến phụ thuộc với các biến độc lập và các biến độc lập với nhau)

Analyze>> Correlate>> Bivariate:

Trang 36

Lê Thanh Tòng Trang 35

Hình 4.11 hộp thoại phân tích tương quan các biến

Trang 37

Lê Thanh Tòng Trang 36

Bảng 4.4: Bảng phân tích tương quan giữa các biến

Trang 38

Lê Thanh Tòng Trang 37

Trang 39

Lê Thanh Tòng Trang 38

Theo bảng 4.4 Kết quả phân tích tương quan giữa các biến cho thấy biến phụ thuộc và các biến độc lập đều có mối tương quan tương đối cao với nhau (> 0.617) Kiểm định giả thuyết ở mức ý nghĩa < 5% nên hệ số tương quan tổng thể bằng 0 bị bác bỏ Tuy nhiên hệ số tương quan giữa các biến độc lập với nhau cũng tương đối cao Vì vậy cần quan tâm đến hiện tượng đa cộng tuyến trong phân tích hồi quy

 Sau khi kiểm tra điều kiện khá thẳng và phân tích tương quan giữa các biến.Cuối cùng đã xác định được các biến phù hợp để đưa vào mô hình:

 Biến phụ thuộc Y: Chiphixaydung ( Triệu đồng)

Tiến hành phân tích lựa chọn biến theo 3 phương pháp: Forward

selection, Stepwise selection, backward elimination

4.2.4 Phân tích MLR bằng phương pháp Forward Selection

4.2.4.1 Phân tích MLR bằng SPSS

Analyze>> Regression>> Linear>>Forward

Trang 40

Lê Thanh Tòng Trang 39

Hình 4.12 Hộp thoại phân tích hồi phương pháp Forward

Bảng 4.5 Model summary phương pháp Forward

Ngày đăng: 25/11/2016, 09:40

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w