TỔNG QUAN
Các khái niệm
Nhà xưởng (hay còn gọi là nhà máy hoặc nhà công nghiệp) là khoảng không gian rộng lớn hơn so với các cửa hàng, văn phòng hay công ty Đây cũng là nơi tập trung những vật dụng, nhân lực cho sản xuất, bảo quản và vận chuyển thành phẩm của các doanh nghiệp Ngoài ra, nhà xưởng còn được xây dựng để làm nơi bảo quản tránh sự tác động của thời tiết bên ngoài hoặc nhằm mục đích vận chuyển các loại mặt hàng phục vụ chính cho những ngành công nghiệp
Nhà xưởng có cấu tạo bao gồm những phần chính: Hệ kết cấu móng, nền nhà, hệ khung kết cấu chịu lực chính gồm cột và vì kèo thép, cửa và mái che (canopy), xà gồ và hệ giằng, vách bao che, …Mô hình minh họa cấu tạo những kết cấu chính và phụ kiện của nhà xưởng ở hình 2.1:
Hình 2.1: Minh họa cấu tạo nhà xưởng
Tùy vào đặc điểm, mục đích sử dụng hay nhu cầu khách hàng mà nhà xưởng được thường phân loại thành các loại sau:
- Theo vật liệu xây dựng: Khung bê tông cốt thép và khung kèo thép
- Theo mục đích sử dụng: Nhà xưởng sản xuất và nhà xưởng kết hợp văn phòng Đối với nhà xưởng sản xuất, tùy theo chức năng và ngành nghề sản xuất mà nền nhà xưởng có nền móng máy hoặc không
- Theo độ cao: Nhà xưởng một tầng và nhà xưởng nhiều tầng
Chi phí xây dựng là chi phí bỏ ra để xây dựng một công trình, bao gồm chi phi trực tiếp, chi phí gián tiếp, thu nhập chịu thuế tính trước, thuế giá trị gia tăng Chi phí xây dựng được xác định dựa vào khối lượng tính toán từ bản vẽ thiết kế và thi công, các chỉ dẫn kỹ thuật, công việc thực hiện, định mức xây dựng và đơn giá xây dựng Theo thông tư 19/2019/TT-BXD hướng dẫn nghị định số 68/2019/NĐ-CP ngày 14/8/2019 về Quản lý chi phí đầu tư xây dựng, chi phí xây dựng bao gồm (hình 2.2):
Hình 2.2: Chi phí xây dựng theo thông tư 19/2019/TT-BXD
Theo Borja García de Soto [13]: “Ước lượng CPXD là công việc quan trọng của lập dự toán, là một phần trong đấu thầu xây dựng, nhà thầu xây dựng thường phải lập dự toán chi phí lập bảng báo giá để có thể cạnh tranh được Tuy nhiên, trong đấu thầu quá trình này không yêu cầu nhiều người tham dự vào quá trình tính toán, nhưng các phương pháp tính toán khác nhau cần được chuẩn bị và kết hợp với các phương pháp khác để tạo điều kiện đánh giá và so sánh với các báo giá trước đây Để thực hiện điều này, bạn cần ước tính các nguồn lực (chẳng hạn như vật liệu xây dựng) cần thiết cho dự án, sau đó nhân số lượng tài nguyên đó với chi phí của đơn giá tương ứng Phương pháp này Ưu điểm của là nó có thể phân biệt giữa số lượng và chi phí và có thể được cập nhật khi có thông tin mới.”
Theo Dogan [2]:”Chi phí xây dựng được xem là một trong những tiêu chí quan trọng trong việc ra quyết định đầu tư dự án, nhất là giai đoạn hình thành ý tưởng.Với sự canh tranh khốc liệt trong ngành xây dựng, việc nâng cao lợi nhuận, giảm giá thành và việc mở rộng thị trường ngày càng trở nên phức tạp và khó khăn
Do đó việc kiểm soát tốt chi phí xây dựng dự án sẽ mang lại giá trị cho các doanh nghiệp xây dựng Ước lượng chi phí trong giai đoạn đầu hình thành ý tưởng đầu tư dự án mang nhiều ý nghĩa nhất, đặc biệt là giai đoạn thiết kế sơ bộ khi chưa có các chi tiết cụ thể Để thực hiện điều này, các nhà thầu thường áp dụng các kiến thức về các dữ liệu của dự án tương tự trước đây để ƯLCP cho dự án sẽ thực hiện trong tương lai, chủ yếu là dựa trên kinh nghiệm và sự phán đoán”
2.1.4 Các phương pháp ước lượng chi phí
Hiện nay, có nhiều phương pháp để ƯLCP Các phương pháp được tính toán dựa vào các yếu tố: mục đích, số lượng thông tin, thời gian, dữ liệu về chi phí [18]
Phương pháp này có thể áp dụng ở giai đoạn ước tính và dự toán, tùy thuộc vào độ chi tiết của khối lượng Đối với khái toán chi phí, phương pháp giá được sử dụng như: trường học (chi phí/số học sinh hay chi phí/1m2 sàn xây dựng), bệnh viện (chi phí/sốgiường bệnh), nhà hát (chi phí/ghế ngồi), bãi đậu xe (chi phí/chỗ đậu xe) Đối với lập dự án theo đơn giá tổng hợp, phương pháp được áp dụng để lập giá dự thầu
Psd: Năng lực sử dụng/thiết kế
Cđv: Chi phí/đơn giá đơn vị
❖ Ví dụ: Một sân vận động 1000 chỗ đã xây dựng xong được 12 tháng với chi phí xây dựng 100 tỷ đồng Hệ số lạm phát là 10%/năm Chủ đầu tư đang dự định xây dựng một sân vận động với thiết kế tương tự và một vị trí xây dựng tương tự nhưng quy mô là 5000 chỗ Hỏi CPXD sân động mới là bao nhiêu?
- Chi phí của sân vận động 1000 chỗ được đưa về thời điểm hiện tại là: 100*1,10 tỷ
- Chi phí xây dựng sân vận động/chỗ: 110/1000 = 0.11 tỷ đồng/chỗ
- Chi phí cho sân vận động 5000 chỗ được ước tính: 5000*0.11 = 550 tỷ
❖ Ưu điểm: Tính toán nhanh, dễ áp dụng, được sử dụng cho giai đoạn lập dự án đầu tư, thiết kế cơ sở và là căn cứ để nhà đầu tư cân nhắc và đưa ra quyết định đầu tư hay không
❖ Nhược điểm: Thiếu chính xác, không xem xét các yếu tố khác nhau: hình vàdạng mặt bằng, kích thước, vật liệu và biện pháp thi công Phương pháp này chỉ nên được ưu tiên áp dụng cho: dự án công cộng, giai đoạn thiết kế sơ bộ
2.1.4.2 Phương pháp diện tích sàn
Tổng diện tích sàn bằng tổng diện tích của tất cả các sàn của các tầng (tính diện tích lọt lòng, không trừ diện tích tường ngăn bên trong, thang máy và cầu thang)
Ssàn: Tổng diện tích sàn (m2)
Cđv: Chi phí đơn vị theo m2 sàn
❖ Ví dụ: Một căn nhà có diện tích sàn 300m2 đã hoàn thành với chi phí xây dựng 4 tỷ đồng Chủ nhà dự tính xây dựng một căn nhà tương tự có diện tích 500 m2 thì CPXD căn nhà mới là bao nhiêu?
- Chi phí xây dựng/m2: 4tỷ/ 300 = 0,0133 tỷ/m2 (13.333.333 đồng/m2)
- Ước lượng chi phí xây dựng cho căn nhà 500m2: 500 * 0,0133= 6,66 tỷ
❖ Ưu điểm: Thực hiện tính toán nhanh và đơn giản dễ hiểu và dễ thực hiện
❖ Nhược điểm: Khó xác định được giá thành 1m2 sàn, không xem xét các yếu tố khác như: hình dáng, chiều cao, số tầng, thay đổi thông số kỹ thuật, Ngoài ra, phương pháp này cần dựa vào dữ liệu của công trình đã thực hiện trước đó, số liệu thống kê, và kinh nghiệm của người ước tính
Mục tiêu của phương pháp là ước lượng chi phí công trình thông tin qua đơn vị khối tích:
Cđvtt: Chi phí đơn vị thể tích (1m3)
Ứng dụng mạng ANN trong các lĩnh vực
Từ những nghiên cứu còn sơ khai lúc ban đầu của McCulloch, hiện nay với sự phát triển của khoa học công nghệ, mạng neuron nhân tạo được quan tâm và nhanh chóng trở thành một xu hướng nghiên cứu đầy triển vọng trong tương lai Mạng neuron nhân tạo giúp xây dựng những công cụ thông minh tiến gần đến trí tuệ của con người Hiện nay, mạng neuron được áp dụng rộng rãi trên nhiều lĩnh vực: khoa học, y học, kỹ thuật, giao thông, giáo dục, …
❖ Trong khoa học: Ứng dụng mạng neuron để nhận dạng dấu vân tay “Neural Networks for Fingerprint Recognition (Pierre Baldi and Yves Chauvin)” [21]
❖ Trong kỹ thuật chế tạo: Ứng dụng trong giám sát quá trình gia công, đúc khuôn mẫu, tối ưu chế độ cắt thép… “Sử dụng mạng neron nhân tạo mô hình lực cắt thép” (TamasSzecsi) [22]
❖ Trong xử lý tín hiệu:
Phân tích và dự báo thời tiết, động đất, sóng thần…”Mô hình mạng neuron nhân tạo dự đoán động đất với giám sát radon” (Fatih Ku¨laci và các tác giả) [23]
❖ Trong an ninh - quốc phòng: Điều khiển hệ thống tên lửa, đạn đọa tự hành, nhận dạng địa hình, phát hiện thủy lôi…” Áp dụng kỹ thuật mạng neuron nhân tạo tối ưu hóa đầu phun động cơ tên lửa” (Wei Shyy và các tác giả) [24]
Phân tích các dấu hiệu điện tâm đồ, chẩn đoán bệnh…”Mạng neuron nhân tạo ra quyết định trong y học lâm sàng” (Jari J Forsstrorn) [25]
Phân tích thị trường chứng khoán, tỷ giá, giá bất động sản, biến động giá cả thị trường…”Mạng neuron nhân tạo dự đoán giá cổ phiếu” (Devadoss và cộng sự) [26]
Phân tích hệ thống phân luồng, điều hành phương tiện, dự báo lưu lượng…”Dự đoán giao thông đường bộ và kiểm soát sự tắc nghẽn bằng cách sử dụng mạng neuron nhân tạo” (Rohan More và các tác giả) [27]
Phân tích, dự đoán, ước lượng chi phí, tiến độ, quản lý xây dựng, ra quyết định đầu tư…”Áp dụng mạng neuron nhân tạo để đo lường và dự đoán năng suất lao động trong xây dựng” (Gholamreza Heravi) [28].
Tình hình nghiên cứu
Trong ngành QLXD, hiện nay có rất nhiều nghiên cứu trong vào ngoài nước áp dụng ANN để ước lượng CPXD Tóm tắt những đề tài nghiên cứu liên quan đến ƯLCP trình bày tại bảng 2.4:
Bảng 2.4: Thống kê các nghiên cứu về ước lượng chi phí
STT Tác giả Đề tài Phương pháp
Tiêu chí ước lượng Kết quả
Hệ thống ước tính chi phí tự động sử dụng mạng nơ-ron
-ANN -Sử dụng 36 dữ liệu
STT Tác giả Đề tài Phương pháp
Tiêu chí ước lượng Kết quả
Mohamed (2002) [30] Áp dụng mạng nơ ron trong điều chỉnh lý luận dựa trên tình huống để đánh giá chi phí nhà thép
-ANN và CBR -Sử dụng 35 dữ liệu
- Tấm ốp tường bên trong
Sai số 4%, ANN tốt hơn CBR
STT Tác giả Đề tài Phương pháp
Tiêu chí ước lượng Kết quả
Kết hợp mô hình mạng thần kinh và thuật toán di truyền để ước tính chi phí sơ bộ
Kết quả của việc huấn luyện các tham số Thuật toán lan truyền ngược với GAs tốt hơn huấn luyện các tham số
Phan Văn Khoa (2006) [3] Ước lượng CPXD chung cư bằng ANN
PAN Hua và các tác giả (2010) [7]
Nghiên cứu ứng dụng thực tế của mạng nơ ron trong ƯLCP của nhà xưởng công nghiệp
- Chiều cao -Chiều dài dầm -Bước cột -Diện tích xây dựng
STT Tác giả Đề tài Phương pháp
Tiêu chí ước lượng Kết quả trục cẩu
Lưu Nhất Phong (2010) [6] Ứng dụng mạng neuron nhân tạo và hồi quy đa biến để dự báo tổng mức đầu tư các dự án công trình giao thông
- Thời gian thực thi công
- Số lượng cầu bản BTCT thoát nước trên tuyến
- Số lượng cống thoát nước
STT Tác giả Đề tài Phương pháp
Tiêu chí ước lượng Kết quả
Lê Khắc Huấn (2011) [32] Áp dụng mô hình mạng nơron trong vệc dự báo giá thành của dự án xây dựng nhà cao tầng
-ANN -Sử dụng 32 dữ liệu
- Lãi suất ngân hàng trong -Thời gian thi công
Sai số dự án 1: 1,1%, dự án 2: 2,58%
Hồ (2012) [8] Ứng dụng System Dynamics trong phân tích và dự báo
- Độ dốc nhà Đưa ra được: khối lượng công
STT Tác giả Đề tài Phương pháp
Tiêu chí ước lượng Kết quả
CPXD nhà thép tiền chế
- Hoạt tải trên xà gồ
- Chiều cao lớp bao che trình, chi phí: vật liệu, vận chuyển, lắp dựng…
Gwang - Hee Kim và các tác giả (2013) [16]
So sánh các phương pháp ƯLCP xây dựng trường học sử dụng phân tích hồi quy, mạng neuron và máy vectơ hỗ trợ
- Cách tiếp nhận khu đất
ANN cho kết quả tốt hơn
Guangli Feng, Li Li (2013) [33] Ứng dụng của thuật toán di truyền và mạng thần kinh trong ước tính chi
- Diện tích tầng điển hình
ANN có thể giải quyết một số nhược điểm
STT Tác giả Đề tài Phương pháp
Tiêu chí ước lượng Kết quả phí xây dựng - Kết cấu nhà xe
- Loại móng chính của kỹ thuật ước lượng thông thường
Mô hình mạng neuron để xây dựng ước tính CPXD
- Loại hoàn thiện bên ngoài
- Điều hòa không khí và trần
STT Tác giả Đề tài Phương pháp
Tiêu chí ước lượng Kết quả
- Mức độ hoàn thiện điện
- Mức độ hoàn thiện nước
Nghiên cứu so sánh trong việc sử dụng mạng nơron để ước tính độ lớn chi phí trong xây dựng
- Hồi quy có sai số 23,72% ANN tốt hơn hồi quy
Nguyễn Minh Quang (2017) [4] Ước lượng chi phí xây dựng trường THPT tại TP.HCM bằng
Kết luận: Hiện nay, rất ít các nghiên cứu về ước lượng chi phí nhà xưởng Để có thêm thông tin, nghiên cứu đã tìm hiểu thêm các nghiên cứu về công trình nhà dân dụng, giao thông cũng có thể cung cấp thêm các tiêu chí liên quan đến CPXD Hơn nữa, đa số những nghiên cứu này đa số ở nước ngoài với sự khác biệt về vị trí địa lý, điều kiện kinh tế và đặc điểm ngành xây dựng nên không thể áp dụng hết những yếu tố này vào nghiên cứu Do đó cần thống kê và sàng lọc những nhân tố chính và đưa ra những nhân tố ảnh hưởng đến CPXD nhà xưởng trong giai đoạn đấu thầu tại Việt Nam để phù hợp với mục đích nghiên cứu Trình bày tại bảng 2.5:
Bảng 2.5: Thống kê các tiêu chí từ các nghiên cứu
STT Các tiêu chí ước lượng Tài liệu tham khảo
STT Các tiêu chí ước lượng Tài liệu tham khảo
Sau khi tóm tắt các tiêu chí, tham khảo ý kiến chuyên gia để sàng lọc những tiêu chí quan trọng Quan điểm nghiên cứu dựa trên quan điểm nhà thầu thi công nên những yếu tố liên quan về thiết kế như “tĩnh tải”, “hoạt tải”, “tĩnh tải gió”, “tĩnh tải phụ”, “mật độ xây dựng” sẽ bị loại bỏ Đối với xây dựng nhà xưởng, mức độ hoàn thiện không nhiều và chi tiết như dân dụng, yếu tố “mức độ hoàn thiện” đã bao hàm trong các yếu tố loại tường, loại mái, nên yếu tố này cũng lược bỏ Yếu tố
“tầng lửng” và “số tầng” có ý nghĩa gần giống nhau nên sẽ để lại yếu tố “số tầng” Trong thi công xây dựng, giá cả vật liệu xây dựng đóng vai trò rất quan trọng, quyết định đến giá đặc biệt trong xây dựng nhà xưởng, nhà thép tiền chế thì vật liệu chủ yếu và đặc trưng là thép nên nghiên cứu chỉ giữ lại yếu tố “giá thép” để nghiên cứu, các yếu tố giá vật liệu khác có sự ảnh hưởng không nhiều nên sẽ được lược bỏ trong nghiên cứu này Đối với yếu tố “nguồn vốn xây dựng”, có thể là vốn tự có hoặc vốn vay ngân hàng, nếu là vốn tự có thì chứng tỏ năng lực tài chính của nhà thầu rất tốt, nếu là vay ngân hàng thì lãi suất hàng tháng sẽ ảnh hưởng đến CPXD nên nghiên cứu sẽ giữ loại bỏ yếu tố “nguồn vốn xây dựng” và giữ lại yếu tố “lãi suất ngân hàng trong thời gian thi công” Ngoài ra, chuyên gia bổ sung thêm hai yếu tố ảnh hưởng là “biện pháp thi công”, biện pháp này chủ yếu là lắp dựng khung thép để đảm bảo chất lượng, an toàn, tiết kiệm thời gian và chi phí; “chiến lược đấu thầu” là kế hoạch huy động vật tư, nhân công, chính sách giảm giá, … Tổng hợp được 20 tiêu chí ở bảng 2.6:
Bảng 2.6: Bảng tổng hợp tiêu chí ảnh hưởng từ nghiên cứu và ý kiến chuyên gia
STT Các tiêu chí ước lượng Nguốn trích dẫn
19 Biện pháp thi công Chuyên gia
20 Chiến lược đấu thầu Chuyên gia
Hiện nay, thực tế các nhà thầu dựa vào kinh nghiệm thi công và các đặc điểm của dự án để ước lượng CPXD nhà xưởng Vì vậy, những kinh nghiệm của họ cũng giúp tác giả có thêm một nguồn tài liệu Trên website của các nhà thầu có kinh nghiệm thi công nhà xưởng thường giới thiệu, cập nhật các tài liệu, thông tin liên quan về xây dựng nhà xưởng để cung cấp cho khách hàng cũng như người như những người quan tâm đến lĩnh vực này Các tiêu chí này được nêu ra ở bảng 2.7:
Bảng 2.7: Các tiêu chí tham khảo trên website các nhà thầu
STT Công ty Yếu tố ảnh hưởng
1 Công ty CP TVĐT nhà thép Việt Nam
3 Công ty Cổ phần Kizuna JV
4 Công ty tư vấn đầu tư xây dựng Nhân Đạt
Hầu hết yếu tố trong bảng 2.7 trùng với các tiêu chí từ các nghiên cứu “Công năng nhà xưởng” tương tự “mục đích sử dụng”, “tiến độ thi công” tương tự “thời gian thi công”, “quy mô thiết kế”, “thiết kế” được xem tương tự với “diện tích xây dựng” và các thông số kỹ thuật khác Về yếu tố “nguyên vật liệu” bao quát nhiều vấn đề như loại vật liệu, nguồn cung cấp, giá cả vật liệu nhưng ở trên nghiên cứu đã nhấn mạnh tập trung vào “giá thép” nên yếu tố “nguyên vật liệu” được xem như tương tự như “giá thép” Theo ý kiến chuyên gia, yếu tố “nhà thầu thi công”, “trình độ công nhân”, hai yếu tố này có ảnh hưởng trong giai đoạn đấu thầu nhưng nó cũng đã bao hàm trong các yếu tố đã chọn Việc chọn nhà thầu chính lựa chọn nhà thầu phụ thi công thường tập trung chủ yếu đến việc năng lực nhà thầu thi công đó có đủ kinh nghiệm thi công, đảm bảo về tiến độ thi công và đơn giá xây dựng: vật liệu và nhân công Yếu tố “trình độ nhân công” cũng ảnh hưởng đến tiến độ xây dựng và giá nhân công Ba vấn đề tiến độ, vật liệu, giá nhân công đã đề cập ở bảng 2.6 là “tiến độ thi công”, “giá thép” và “mức lương cơ bản”, do đó có thể lược bỏ yếu tố “nhà thầu thi công” và “trình độ nhân công” để tập trung vào các yếu tố chính
Tóm lại, sau khi tham khảo các nguồn tài liệu từ các nghiên cứu, quan điểm của các nhà thầu thi công và tham khảo ý kiến chuyên gia, nghiên cứu đã sàng lọc và hiệu chỉnh các yếu tố phù hợp với mục tiêu của nghiên cứu và quyết định sử dụng
20 yếu tố từ bảng 2.6 để tiến hành lập bảng khảo sát.
PHƯƠNG PHÁP NGHIÊN CỨU
Quy trình nghiên cứu
Quy trình này gồm 4 bước được thể hiện trong bảng 3.1, và 2 giai đoạn chính ở hình 3.1 thể hiện chi tiết sơ đồ khối của nghiên cứu này
Bảng 3.1: Quy trình nghiên cứu
- Tìm hiểu và đọc các bài báo nghiên cứu khoa học, tạp chí khoa học, luận văn liên quan về đề tài ước lượng CPXD, CPXD nhà xưởng, ứng dụng của ANN trong quản lý xây dựng…
- Tham khảo ý kiến chuyên gia để sàng lọc và lựa chọn các tiêu chí phù hợp trong lĩnh vực xây dựng nhà xưởng
- Thiết kế bảng câu hỏi sơ bộ những tiêu chí ảnh hưởng đến chi phí xây dựng nhà xưởng trong giai đoạn đấu thầu Sau đó, gửi bảng khảo sát sơ bộ đến các chuyên gia và những người có kinh nghiệm đã từng thi công và lập chi phí xây dựng nhà xưởng thông qua phỏng vấn trực tiếp hoặc gửi email, zalo, facebook Thang đo khảo sát là Likert 5 theo mức độ tăng dần Ở bảng khảo sát sơ bộ này, các chuyên gia có thể vừa trả lời, vừa chỉnh sửa và đề xuất các tiêu chí để hoàn thiện cho bảng câu hỏi (BCH) chính thức
- Thiết kế BCH chính thức và tiến hành khảo sát bằng cách lấy mẫu thuận tiện
- Phân tích dữ liệu đã thu thập được bằng SPSS, tính giá trị trung bình và kiểm tra độ tin cậy thang đo Cronbach's Alpha, loại bỏ các biến không phù hợp và xếp hạng thứ tự các nhân tố Kết luận các nhân tố ảnh hưởng chính đến chi phí xây dựng nhà xưởng trong giai đoạn đấu thầu
- Thu thập dữ liệu công trình và xử lý dữ liệu để đưa vào mô hình
- Xây dựng mô hình ANN với phần mềm Rapidminer Studio 9,5
- Đánh giá mô hình và kết luận
Hình 3.1: Quy trình thực hiện nghiên cứu
Thu thập dữ liệu
3.2.1 Thiết kế bảng câu hỏi
Bảng câu hỏi là một trong những phương pháp điều tra và thu thập số liệu được sử dụng rộng rãi trong nghiên cứu khoa học Khảo sát giúp nghiên cứu có được thông tin trực tiếp, đa dạng và đáng tin cậy về những người tham gia Dữ liệu thu thập được có đáng tin cậy hay không phụ thuộc vào việc thiết kế BCH, vì vậy việc thiết kế BCH có liên quan đến sự thành công của một dự án nghiên cứu Nội dung BCH bao gồm ba phần chính:
- Phần 1: Giới thiệu tổng quan của đề tài nghiên cứu để người được khảo sát nắm được những thông tin của đề tài nghiên cứu và các thông tin của người thực hiện nghiên cứu
- Phần 2: Thu thập mức độ đánh giá các nhân tố ảnh hưởng đến CPXD nhà xưởng theo thang đo Likert 5 mức độ tăng dần mức ảnh hưởng từ không đến rất ảnh hưởng
- Phần 3: Phần thông tin cơ bản của người được khảo sát, đưa ra các câu hỏi về chức vụ đảm nhiệm, nơi công tác, lĩnh vực thi công, kinh nghiệm làm việc, quy mô dự án đã tham gia để sàng lọc các đối tượng không phù hợp với nội dung đề tài nghiên cứu
3.2.2 Xác định kích thước mẫu
Việc nghiên cứu đạt được kết quả tốt hay mang lại độ tin cậy mong muốn phụ thuộc phần lớn vào kích thước của mẫu được thu thập, kích thước của mẫu được phân tích phải đại diện cho tổng thể Có 2 phương pháp chọn mẫu chính ở bảng 3.2:
Bảng 3.2: Phân biệt phương pháp chọn mẫu
Phương pháp Chọn mẫu theo xác xuất Chọn mẫu phi xác xuất Đặc điểm Lựa chọn ngẫu nhiên, xác suất lựa chọn của các cá thể trong tổng thể mẫu là như nhau, không phụ thuộc vào quyết định của người thực hiện nghiên cứu
Nhà nghiên cứu chủ ý chọn đối tượng tham gia nghiên cứu dựa trên những người có sẵn tại thời điểm thu thập dữ liệu sao cho thuận tiện nhất mà không cần biết người nào trong quần thể sẽ được chọn làm mẫu Ưu điểm Đơn giản, mang tính ngẫu nhiên, một mẫu có thể đại
Thuận tiện dễ tiếp cận, ít tốn thời gian và chi phí
Phương pháp Chọn mẫu theo xác xuất Chọn mẫu phi xác xuất diện cho tổng thể mẫu
Nhược điểm Cần có một khung mẫu cụ thể, chính xác
Khi các mẫu phân bố rải rác ở cách xa nhau sẽ tốn kém thời gian, nhân lực và chi phí cho việc điều tra
Không thể tính được sai số Kết quả mẫu không thể đại diện cho tổng thể
Với sự khó khăn hạn chế về thời gian và khả năng tiếp cận các đối tượng nên nghiên cứu này chọn phương pháp chọn mẫu phi xác suất, kiểu lấy mẫu thuận tiện Phương pháp lấy mẫu này có thể làm i ảnh hưởng i độ tin cậy của kết quả phân i tích nghiên cứu nhưng việc khoanh vùng, giới hạn đối tượng là những người tham gia lĩnh vực DD&CN, trước khi khảo sát có thể làm nghiên cứu đạt được sự tin cậy cần thiết
Yêu cầu về kích thước cỡ mẫu mục đích đảm bảo về độ tin cậy, đồng thời phù hợp với điều kiện về thời gian thực hiện và trong khả năng thực hiện được
Theo Trọng và Ngọc (2008) [35], công thức xác định cỡ mẫu:
/ 2 : giá trị tra bảng phân phối z (dựa vào độ tin cậy 1 − )
- e: là độ rộng của ước lượng
- p: tỉ lệ thành công, là tham số phải tìm cách ước lượng
Mặt khác, Trọng và Ngọc (2008) [35] cũng cho rằng số lượng mẫu cần khảo sát có thể được ước tính sơ bộ ban đầu ít nhất phải từ 4 đến 5 lần số lượng biến quan sát Ở nghiên cứu này, số biến ở khảo sát chính thức là 16 nên số lượng BCH khoảng 64 đến 80 bảng Số lượng BCH được gửi đi là 120 bảng, thu về được 89 BCH hợp lệ, tỉ lệ phản hồi là 89%, phù hợp với kích thước mẫu yêu cầu
3.2.3 Phương pháp thu thập Ở nghiên cứu này, mẫu được lấy theo phương pháp thuận tiện, công tác thu thập dữ liệu đã được thực hiện bằng cách gửi BCH gặp trực tiếp phỏng vấn và gián tiếp (online) bằng đường dẫn Google Form thông qua các ứng dụng Gmail, Zalo, Messenger, đến những đối tượng khảo sát Mặc dù, việc lấy khảo sát trực tiếp sẽ thu được kết quả tốt và hoàn chỉnh hơn tránh những bảng câu hỏi bị đánh sót hay thiếu thông tin của người khảo sát nhưng tại thời điểm nghiên cứu lại xảy dịch bệnh phức tạp nên việc lấy khảo sát trực tiếp bị hạn chế, nên nghiên cứu ưu tiên tiến hành khảo sát online Link khảo sát được tạo từ Google Form được gửi qua Email, Zalo, Facebook, đến đối tượng khảo sát
Bảng câu hỏi có mục đích là thu thập ý kiến của những người có kinh nghiệm lâu năm trong nghề nhằm chọn lọc, chỉnh sửa, góp ý bổ sung các nhân tố thu thập được Bảng khảo sát ở giai đoạn sơ bộ được gửi đến ban QLDA các chuyên gia trong lĩnh vực xây dựng công nghiệp Bảng khảo chính thức cung cấp dữ liệu cho việc phân tích thống kê nên cần số liệu nhiều hơn, tuy nhiên khó khăn tiếp cận được với các công ty hay dự án liên quan đến lĩnh vực xây dựng công nghiệp hơn nữa do tình hình dịch bệnh nên tác giả mở rộng đối tượng khảo sát bao gồm các kỹ sư, chuyên gia trong lĩnh vực xây dựng DD&CN Tất cả các bảng câu hỏi đã được gửi đến Giám đốc dự án, chỉ huy trưởng công trình, trưởng phòng - chuyên viên phòng đấu thầu và kỹ sư giám sát tại các công trình
Những bảng khảo sát không phù hợp, có thể gây sai lệch cho kết quả phân tích sẽ bị loại bỏ như:
+ Bảng trả lời của các đối tượng không liên quan đến xây dựng DD&CN + Bảng trả lời câu hỏi nếu có sự nghi ngờ đánh giá mức ảnh hưởng đều cùng một mức độ giống nhau hoặc theo đánh theo một quy luật nào đó.
Công cụ phân tích
Các công cụ nghiên cứu được trình bày cụ thể bảng 3.3 sau:
Bảng 3.3: Các công cụ nghiên cứu
TT Nội dung nghiên cứu Công cụ nghiên cứu
1 Mô tả các tính chất của dữ liệu Thống kê mô tả trên SPSS
2 Kiểm tra độ tin cậy của thang đo Hệ số Cronbach’s Alpha (CR’s-
3 Xây dựng mô hình ước lượng Phần mềm Rapidminer Studio
4 Đánh giá mô hình Hệ số tương quan R, các sai số
3.3.1 Phân tích độ tin cậy bằng hệ số Cronbach’s Alpha
Nghiên cứu này ứng dụng IBM SPSS 20 để nhập các dữ liệu khảo sát đầu vào và sử dụng trị trung bình để đánh giá mức độ ảnh hưởng cảu các yếu tố đến chi phí xây dựng nhà xưởng
Theo Thọ, (2013) [36]: “Hệ số Cronbach’s Alpha chỉ đo lường độ tin cậy của thang đo (thang đo từ 3 biến quan sát trở lên) mà không tính độ tin cậy cho từng biến quan sát” Hệ số này có độ biến thiên từ 0 đến 1, nếu hệ số này càng lớn thì thang đo có độ tin cậy cao và ngược lại Tuy nhiên, nếu hệ số này quá lớn (>0,95) thì nhiều biến trong thang đo không có gì khác biệt, hiện tượng này gọi là trùng lặp trong thang đo
Hệ số tương quan biến tổng (TQBT) là hệ số cho biết mối quan hệ giữa các biến quan sát trong nhân tố với các biến còn lại Khi hệ số TQBT lớn hơn giá trị 0,3 thì biến đó có đóng góp giá trị khái niệm của nhân tố
Công thức tính hệ số CR’s-Alpha:
: hệ số tương quan trung bình giữa các mục hỏi
Tổng hợp đánh giá độ tin cậy thang đo theo Trọng và Ngọc (2008) [35] và Thọ (2013) được thể hiện ở Bảng 3.4
Bảng 3.4: Đánh giá độ tin cậy thang đo
STT Nội dung Đánh giá
1 CR’s-Alpha (>0,95) Xuất hiện trùng lặp trong đo lường i
2 CR’s-Alpha từ 0,70 - 0,95 Có độ tin cậy tốt
3 CR’s-Alpha ≥ 0,60 Có thể chấp nhận
4 Hệ số TQBT ≥ 0,3 Đạt yêu cầu
Tại kết quả xuất ra từ phần mềm, ở Giá trị của cột Cronbach’s Alpha if Item Deleted, nếu xét thấy giá trị này không nhỏ hơn hệ số CR’s-Alpha tổng và Corrected Item-Total correlation (hệ số TQBT) nhỏ hơn giá trị 0,3 thì tiến hành loại bỏ biến đó để tăng độ tin cậy của thang đo
3.3.2 Đánh giá hiệu suất mô hình
Các chỉ số đánh giá hiệu suất mô hình ở bảng 3.5:
Bảng 3.5: Đánh giá hiệu suất mô hình
Hệ số tương quan tuyến tính R R = n y.y '− y y ' n( y) 2 − ( y) 2 n( y ') 2 − ( y ') 2
Phần trăm sai số trung bình tuyệt đối (MAPE - Mean Absolute
Sai số trung bình tuyệt đối
Sai số toàn phương trung bình
(RMSE - Root mean squared error)
Trong đó: y là giá trị thực tế và y’ là giá trị dự đoán trong mô hình
RapidMiner là một nền tảng phần mềm khoa học dữ liệu cung cấp một môi trường tích hợp để chuẩn bị dữ liệu, học máy, học sâu, khai thác văn bản và phân tích dự đoán Đây là một trong những hệ thống mã nguồn mở hàng đầu cho khai thác dữ liệu Chương trình được viết bằng ngôn ngữ lập trình Java.RapidMiner Studio Developer 9 cung cấp các lược đồ Learning Schemas, có nhiều công cụ, mô hình và các thuật toán phục vụ nhu cầu phân tích dữ liệu với dữ liệu lớn, có thể được mở rộng bằng ngôn ngữ R và Python RapidMiner có thể: xử lý và trưc quan dữ liệu, chuyển đổi dữ liệu, phân tích thống kê và xây dựng mô hình dự báo, đưa ra đánh giá về dữ liệu, …
RapidMiner có ưu điểm dễ dùng, đọc tất cả các loại cơ sở dữ liệu rất nhanh, nhiều tính năng, tiết kiệm thời gian Nghiên cứu chọn Rapidminer studio để xây dựng mô hình vì so với Clementine thì nhiều ưu điểm nổi bật:
- Giao diện sử dụng đơn giản và dễ nhìn
- Nhận dạng được và gán thuộc tính cho biến
- Chọn và thay đổi được các vai trò của biến (label, target, )
- Chức năng chuyển đổi các thuộc tính về dạng số trực tiếp trên phần mềm
- Tự động xáo trộn dữ liệu theo nhiều kiểu khác nhau
- Tự động tính toán các chỉ số đánh giá mô hình
- Xuất ra được kết quả của mô hình
- Xuất trực tiếp kết quả ra Excel nhanh chóng
Vì vậy, ở nghiên cứu này sử dụng Rapidminer Studio để xây dựng mô hình.
PHÂN TÍCH DỮ LIỆU
Khảo sát thử nghiệm
Sau khi tổng hợp được bảng các nhân tố ảnh hưởng đến CPXD nhà xưởng, tác giả tiến hành khảo sát ý kiến chuyên gia và những người có kinh nghiệm trong thi công nhà xưởng Những chuyên gia này sẽ giúp đánh giá, hiệu chỉnh, bổ sung, hoàn thiện các tiêu chí để hoàn chỉnh bảng khảo sát chính thức Tổng hợp kết quả, tác giả lựa chọn những tiêu có sự tương đồng giữa các chuyên gia, loại bỏ những yếu tố được đánh giá thấp Ngoài ra, các chuyên gia bổ sung một số tiêu chí: chiến lược đấu thầu, biện pháp thi công Sau khi tổng hợp ý kiến chuyên gia, nghiên cứu nhận dạng được 20 yếu tố ảnh hưởng đến CPXD nhà xưởng chia thành 3 nhóm sau: Nhóm thuộc Chiến lược của nhà thầu, Nhóm thuộc về Đặc điểm kỹ thuật của dự án, Nhóm thuộc về các yếu tố ảnh hưởng bên ngoài (thể hiện ở bảng 4.1)
Các biến quan sát được đo lường theo thang đo Likert 5 theo mức độ tăng dần từ 1 đến 5 Thang đo định danh (nominal) được sử dụng để phân biệt các đối tượng tham gia khảo sát
Bảng 4.1: Bảng mã hóa các yếu tố ảnh hưởng khảo sát sơ bộ
STT Yếu tố ảnh i hưởng i Mã hóa
I CHIẾN LƯỢC CỦA NHÀ THẦU CL
1 Thời gian thi công CL1
2 Biện pháp thi công CL2
3 Chiến lược đấu thầu CL3
II ĐẶC ĐIỂM KỸ THUẬT CỦA DỰ ÁN KT
1 Địa điểm xây dựng KT1
2 Mục đích sử dụng KT2
4 Hình thức xây dựng KT4
6 Diện tích xây dựng KT6
STT Yếu tố ảnh i hưởng i Mã hóa
BN YẾU TỐ BÊN NGOÀI BN
2 Mức lương cơ bản BN2
3 Lãi suất trong thời gian thi công BN3
Bảng khảo sát sơ bộ được thực hiện với 15 người có nhiều năm kinh nghiệm trong công tác đấu thầu và thi công nhà xưởng tại Việt Nam bằng cách phỏng vấn trực tiếp và online Vì khó khăn trong vấn đề tiếp cận các chuyên gia về lĩnh vực nhà xưởng cũng như thời gian hạn hẹp nên chỉ nhận lại 08 bảng câu trả lời ở bảng 4.2 Trong đó, công tác tại phòng đấu thầu (chiếm 50%), công tác thi công (chiếm 50%), có kinh nghiệm làm việc từ 5-10 năm (chiếm 50%) Số liệu này cho thấy đối tượng khảo sát phù hợp với yêu cầu, phạm vi của nghiên cứu và đáng tin cậy
Bảng 4.2: Danh sách chuyên gia khảo sát sơ bộ
STT Nơi công tác Kinh nghiệm làm việc Số lượng Tỷ lệ
Tiến hành sử dụng IBM SPSS 20 phân tích dữ liệu và kết quả trình bày ở bảng
Bảng 4.3: Kết quả phân tích trị trung bình của khảo sát sơ bộ
STT Nhân tố Mã hóa Trị trung bình Độ lệch chuẩn
2 Thời gian thi công CL1 4,38 0,518
3 Mục đích sử dụng KT2 4,25 0,707
5 Biện pháp thi công CL2 4,13 0,641
STT Nhân tố Mã hóa Trị trung bình Độ lệch chuẩn
12 Diện tích xây dựng KT6 3,63 0,916
14 Mức lương cơ bản BN2 3,63 0,518
15 Địa điểm xây dựng KT1 3,50 0,535
17 Hình thức xây dựng KT4 2,88 0,641
19 Chiến lược đấu thầu CL3 2,75 0,707
Lãi suất ngân hàng trong thời gian thi công
Phân tích số liệu bằng IBM SPSS 20, tác giả nhận thấy 20 nhân tố ảnh hưởng có độ lệch chuẩn nhỏ hơn 1 cho thấy mức độ đánh của chuyên gia đối với với các nhân tố không dao động lớn Các nhân tố Kết cấu khung (KT1), Thời gian thi công (CL1), Mục đích sử dụng (KT2), Bước cột (KT12), Biện pháp thi công (CL2), Loại móng (KT9) có mức trung bình cao trên 4,0 Kết quả đánh giá có 16 nhân tố có giá trị trung bình (mean) >=3,0 (mức độ trung bình); do đó chỉ lấy 16 nhân tố này tiếp tục khảo sát bước tiếp theo, các nhân tố Chiến lược đấu thầu (CL3), Hình thức xây dựng (KT4), Chu vi (KT5), Lãi suất trong thời gian thi công (BN3) có trung bình nhỏ hơn 3 bị loại bỏ
Yếu tố Chu vi (KT5) liên quan đến kích thước công trình, các thông số này đã có trong nhân tố diện tích (KT6) và chiều cao (KT7) Yếu tố Hình thức xây dựng (KT4) bao gồm xây mới và sửa chữa cải tạo, hai hình thứ này chỉ khác nhau chi phí phá dỡ hiện trạng, chi phí này không ảnh hưởng nhiều có thể cộng thêm vào khi tính dự toán, do đó yếu tố này có thể loại bỏ Yếu tố Chiến lược đấu thầu ( là chiến lược huy động vật tư, nhân công, ) yếu tố này hầu như có tác động đến chi phí nhân công và vật liệu, yếu tố vật liệu và nhân công đã xét đếm ở yếu tố giá thép (BN1) và mức lương cơ bản (BN2) Trong xây dựng, các ngân hàng thường giải ngân theo tiến độ thi công, nếu dự án thi công trễ tiến độ thì lãi vay ngân hàng cũng là một áp lực đối với nhà thầu Hiện nay, hầu hết các ngân hàng có chính sách lãi vay ưu đãi đối với các doanh nghiệp xây dựng và giải ngân theo tiến độ thi công
Do đó, nếu thực hiện công việc đúng theo kế hoạch thì chi phí này có thể không ảnh hưởng nhiều đến CPXD Tuy nhiên, về khách quan và tùy theo đặc điểm của dự án thì yếu tố chiến lược đấu thầu (CL3) và yếu tố lãi suất ngân hàng trong thời gian thi công (BN3) cần được xem xét, đánh giá lại.
Khảo sát chính thức
Đối tượng khảo sát là giám đốc dự án, trưởng phòng/chuyên viên phòng đấu thầu, kỹ sư giám sát công trình thuộc lĩnh vực xây dựng DD&CN Câu hỏi ở phần thông tin chung “Đã tham gia công trình gì” nhằm loại bỏ những đối tượng không phù hợp với phạm vi của đề tài Khảo sát bằng cách phỏng vấn trực tiếp hoặc gửi bảng online (email, zalo, viber ), tổng số bảng câu hỏi gửi đi 100 bảng, thu về 95 bảng (chiếm 95%) nhưng trong đó có 06 bảng không hợp lệ do trả lời không đầy đủ, đánh tất cả đáp án cũng mức độ và không thuộc lĩnh vực xây dựng DD&CN Tổng số bảng câu hỏi hợp lệ và đưa vào phân tích dữ liệu là 89 bảng (chiếm 89% so với tổng câu hỏi được phát đi), phù hợp với kích thước mẫu đã phân tích ở trên Các yếu tố ảnh hưởng khảo sát được thể hiện ở bảng 4.4:
Bảng 4.4: Mã hóa các yếu tố ảnh hưởng
STT Yếu tố ảnh hưởng Mã hóa
I CHIẾN LƯỢC CỦA NHÀ THẦU CL
1 Thời gian thi công CL1
2 Biện pháp thi công CL2
II ĐẶC ĐIỂM KỸ THUẬT CỦA DỰ ÁN KT
1 Địa điểm xây dựng KT1
2 Mục đích sử dụng KT2
4 Diện tích xây dựng KT6
STT Yếu tố ảnh hưởng Mã hóa
BN YẾU TỐ BÊN NGOÀI BN
2 Mức lương cơ bản BN2
4.2.1 Phân tích của đối tượng khảo sát
Kết quả trả lời nơi công tác của người khảo sát được trình bày như bảng 4.5
Mã hóa Nơi công tác Số lượng
Tổng 89 100,0 Đối tượng phần lớn là Nhà thầu thi công chiếm tỷ lệ cao nhất (53,9%), Ban quản lý dự án (21,3%), Tư vấn thiết kế (15,7%), cơ quan nhà nước (4,5%), các tổ chức khác (4,5%) Các chuyên gia ở đây chủ yếu là chủ đầu tư và nhà thầu xây dựng thì dữ liệu sẽ đa dạng góc nhìn, quan điểm khác nhau nên dữ liệu khách quan và tin cậy hơn
4.2.1.2 Chức vụ Đối tượng phần lớn là chuyên viên phòng đấu thầu (46,1%), Trưởng phòng (19,1%), đây là những người có đầy đủ kiến thức đồng thời trực tiếp tham gia công việc lập và quản lý chi phí xây dựng nên ý kiến của họ rất phù hợp với phạm vi và mục tiêu của nghiên cứu Riêng Quản lý cấp cao và Giám đốc dự án cùng chiếm 2,2%, mặc dù chiếm tỉ lệ rất nhỏ nhưng với vị trí và kinh nghiệm làm việc thì ý kiến của các chuyên gia này cũng rất quan trọng Giám sát thi công và Kỹ sư thiết kế đều chiếm 13,5%, đây là mặt hạn chế của nghiên cứu vì đối tượng này không có chuyên môn về lập chi phí nhưng những kiến thức về xây dựng của họ cũng góp phần đáng kể cho nghiên cứu
Kết quả trả lời theo chức vụ của người khảo sát được trình bày như bảng 4.6
Mã hóa Vị trí Số lượng Phần trăm (%) Biểu đồ
Kết quả trả lời theo kinh nghiệm của người khảo sát trình bày như bảng 4.7
Bảng 4.7: Kinh nghiệm làm việc
Mã hóa Kinh nghiệm Số lượng Phần trăm
Tổng 89 100,0 Đối tượng khảo sát từ 5-10 năm kinh nghiệm chiếm đa số là 40,4%, tiếp đến là kinh nghiệm từ 3 đến 5 năm chiếm 29,2%, kinh nghiệm dưới 3 năm chiếm 15,7%, thấp nhất là trên 10 năm kinh nghiệm chiếm 14,6% Đa số kinh nghiệm làm việc trên 5 năm, với kinh nghiệm và kiến thức trong lĩnh vực xây dựng thì ý kiến của các chuyên gia có độ tin cậy cao
Kết quả trả lời theo lĩnh vực của người khảo sát được thể hiện như bảng 4.8
Bảng 4.8: Lĩnh vực hoạt động
Mã hóa Lĩnh vực Số lượng Phần trăm (%) Biểu đồ
Trong 89 người khảo sát, có 38 người thuộc lĩnh vực xây dựng chiếm (42,70%) và 51 người thuộc lĩnh vực xây dựng công nghiệp (57,30%) không chênh lệch nhiều Với đề tài ước lượng chi phí xây dựng nhà xưởng thì nhóm đối tượng nghiên cứu chính thuộc lĩnh vực xây dựng công nghiệp nhưng việc thu thập dữ liệu bị hạn chế Tuy nhiên, nếu xét về chuyên môn trong xây dựng thì hai lĩnh vực này có nhiều nét tương đồng, do đó số liệu khảo sát cũng đạt mức tin cậy có thể chấp nhận được Kết quả trả lời theo lĩnh vực của người khảo sát được thể hiện như bảng 4.8
Quy mô dự án khảo sát được là quy mô dự án lớn nhất đã từng tham gia của các người được khảo sát Quy mô 200 tỷ chiếm tỉ lệ cao nhất là 50,6%, tiếp đến là từ 100-200 tỷ chiếm 19,1%, kế tiếp là từ 50-100 tỷ và dưới 50 tỷ lần lượt là 15,7 % và 14,6% Với sự đa dạng quy mô thì phù hợp với các quy mô của nhà xưởng do đó số liệu thu thập phù hợp với đề tài nghiên cứu
Kết quả trả lời theo Quy mô dự án đã thực hiện của người khảo sát được thể hiện như bảng 4.9
Bảng 4.9: Quy mô dự án đã tham gia
Quy mô dự án Số lượng
Phân tích dữ liệu
Sử dụng phần mềm hỗ trợ IBM SPSS để tiến hành phân tích đối với Nhóm đặc điểm kỹ thuật, kết quả trình bày ở bảng 4.10, bảng 4.11
Bảng 4.10: Kết quả hệ số CR’s-Alpha nhóm nhân tố
Nhóm đặc điểm kỹ thuật
Hệ số CR’s-Alpha Số lượng biến
Bảng 4.11: Hệ số CR’s-Alpha và hệ số TQBT
STT Nhân tố Mã hóa Hệ số TQBT Hệ số CR’s-Alpha
1 Địa điểm xây dựng KT1 0,364 0,841
2 Mục đích sử dụng KT2 0,393 0,838
STT Nhân tố Mã hóa Hệ số TQBT Hệ số CR’s-Alpha
Kết quả Cronbach's Alpha là 0,842>0,7, như vậy thang đo được xem là đáng tin cậy, nhân tố KT3 (cấp công trình) có hệ số TQBT hơn giá trị 0,3, ta tiến hành loại bỏ biến KT3, tiến hành chạy CR’s-Alpha lần 2 và kết quả thể hiện ở bảng 4.12
Bảng 4.12: Kết quả CR’s-Alpha chạy lần 2 của nhóm
Nhóm đặc điểm kỹ thuật
Hệ số CR’s-Alpha lần 2 Số lượng biến
Sau khi loại bỏ biến Cấp công trình (KT3), kết quả CR’s Alpha là 0,847>0,7, như vậy thang đo được xem là đáng tin cậy, hệ số TQBT của các biến lớn hơn giá trị 0,3 đạt yêu cầu về độ tin cậy Với nhóm Chiến lược của nhà thầu chỉ có 2 nhân tố Thời gian thi công (CL1) và biện pháp thi công (CL2), Nhóm yếu tố thị trường bên ngoài có 2 nhân tố Giá thép (BN1) và Mức lương cơ bản (BN2) nên không tiến hành chạy CR’s-Alpha mà giữ lại tất cả các biến Sau khi đã đánh giá, lựa chọn các biến phù hợp với mô hình, tiến hành xếp hạng sự ảnh hưởng các nhân tố theo trị trung bình mức độ ảnh hưởng của từng nhân tố, thể hiện ở Bảng 4.13
Bảng 4.13: Bảng xếp hạng nhân tố theo trị trung bình
Nhân tố ảnh hưởng Mã hóa Trung bình Xếp hạng
Kết cấu khung KT13 3,98 1 Địa điểm xây dựng KT1 3,88 2
Biện pháp thi công CL2 3,83 3
Thời gian thi công CL1 3,74 5
Nhân tố ảnh hưởng Mã hóa Trung bình Xếp hạng
Tải trọng Cầu trục KT14 3,64 8
Mục đích sử dụng KT2 3,63 9
Mức lương cơ bản BN2 3,26 13
Nhân tố Kết cấu khung (KT11) có mức độ ảnh hưởng nhiều nhất với trung bình 3,98, tiếp theo là (Địa điểm xây dựng) KT1 với trung bình 3,88, Biện pháp thi công (CL2) là 3,83 Các nhân tố tiếp theo liên quan đến chiến lược nhà thầu bao gồm Biện pháp thi công (CL2) là 3,83 và thời gian thi công (CL1) là 3,8 Nhóm nhân tố thuộc yếu tố thị trường bên ngoài có mức độ ảnh hưởng thấp nhất, giá thép (BN1) là 3,53 và mức lương cơ bản (BN2) là 3,26
Kết quả 89 bảng khảo sát, với hầu hết các chuyên gia có trên 5 năm kinh nghiệm (chiếm hơn 50%) phần lớn công tác trong trong lĩnh vực xây công nghiệp (58,4%), có chuyên môn về công tác lập và quản lý chi phí (chiếm 41,6%) Ý kiến đánh giá của các chuyên gia đồng ý với 15 yếu tố ảnh hưởng theo thứ tự ở Bảng 4.13, với mức trung bình cao nhất là 3,98 thấp nhất là 3,26 Trong một số nghiên cứu trước đây, thì với thang đo Likert 5 mức độ thì mức độ trên 3 được đánh giá là mức độ chấp nhận được Vì vậy, kết quả khảo sát này đạt yêu cầu Quá trình thu thập dữ liệu bị hạn chế về thông tin cũng như thời gian, dữ liệu đưa vào phân tích thu thập được 11 nhân tố đầu vào bao gồm: Địa điểm xây dựng, Mục đích sử dụng, Kết cấu khung, Diện tích, Chiều cao, Bước cột, Số tầng, Tải trọng cầu trục, Loại móng, Loại tường, Loại mái.
Quy trình xây dựng mô hình
Mô hình được xây dựng gồm 3 bước sau đây:
❖ Bước 1: Thu thập và xử lý số liệu
Từ các nhân tố ảnh hưởng đã xác định ở chương 4, thu thập dữ liệu từ 35 dự án Chia 35 bộ dữ liệu thành 5-fold, mỗi fold gồm 7 bộ dữ liệu Mỗi lần test 4-fold mang đi huấn luyện, 1-fold dùng để kiểm tra lại Tiến hành chạy và tính kết quả trung bình của 5 lần
Hình 4.1: Phân chia tập dữ liệu 5-fold
❖ Bước 2: Xây dựng mạng neuron
- Thiết kế các tham số đầu vào: Chọn số lớp ẩn, số nút trong lớp ẩn, hàm truyền và một số thông số khác
- Tiến hành đưa dữ liệu vào và xây dựng mô hình bằng phần mềm
Hình 4.2: Sơ đồ quy trình thực hiện trong Rapisminer Studio 9.5
❖ Bước 3: Đánh giá mô hình
- Đánh giá mô hình với hệ số tương quan R, sai số MAE, MAPE, RMSE Mô hình có chỉ số hệ số tương quan càng lớn và các sai số MAE, MAPE, RMSE càng i nhỏ thì kết quả càng đáng tin cậy.
Thực hiện mô hình
Dữ liệu thu thập từ các hồ sơ các dự án khu công nghiệp Do hạn chế về thời gian và thông tin, nghiên cứu thu thập được 35 dự án khu công nghiệp và thu thập được 10 thông tin liên quan như bảng 4.14, các yếu tố giá thép, mức lương cơ bản, tiến độ thi công, biện pháp thi công không có đủ dữ liệu Quá trình thu thập và kiểm tra kết quả, nhân tố “kết cấu khung” của 35 dự án công nghiệp đều cho kết quả là
“kết cấu thép”, do đó không có sự biến thiên về nhân tố này, ta không đưa và mô hình ANN để làm các biến
Bảng 4.14: Các nhân tố và kiểu dữ liệu được chọn để thu thập
Kí hiệu Nhân tố Phân loại Thứ nguyên
Long An, Bình Dương, Đồng Nai, TP Hồ Chí Minh, Quảng Nam, Quảng Ngãi, Vũng Tàu, Bình Phước, Đà Nẵng
Nhà xưởng, Nhà xưởng và văn phòng, Nhà xưởng có nền móng
X6 Số tầng [min-max] = [1÷3] Tầng
X7 Tải trọng cầu trục [min-max] = [0÷9] Tấn
X8 Loại móng Móng đơn, Móng cọc Không thứ nguyên
X9 Loại tường Gạch, Tôn màu, Panel, Panel chống cháy
X10 Loại mái Tôn màu, Panel, Panel chống cháy
Kí hiệu Nhân tố Phân loại Thứ nguyên
Y CPXD nhà xưởng trong giai đoạn đấu thầu [min-max] = [4937 ÷ 51474] Triệu đồng Các dữ liệu như Địa điểm xây dựng, Mục đích sử dụng, Loại móng, Loại tường, Loại mái được thu thập phân loại như sau:
- Địa điểm xây dựng bao gồm 9 địa điểm: TP Hồ Chí Minh, Long An, Bình
Dương, Vũng Tàu, Đồng Nai, Bình Phước, Quảng Nam, Đà Nẵng, Quảng Ngãi
- Mục đích sử dụng được phân loại theo công năng sử dụng bao gồm 3 loại: Nhà xưởng và văn phòng, Nhà xưởng (sản xuất hoặc làm kho chứa), Nhà xưởng có nền móng máy (có nền hoặc hố đặt máy móc thiết bị sản xuất)
- Loại móng: gồm 2 loại móng đơn và móng cọc
- Loại tường: gồm 4 loại là tường gạch, tôn màu, panel và panel chống cháy
- Loại mái: gồm 3 loại là mái tôn màu, panel và panel chống cháy
Vậy dữ liệu đầu vào của lớp neuron đầu vào (input) gồm 26 dữ liệu Trước khi xử lý số liệu, các kiểu dữ liệu cần mã hóa và đặt tên (ký hiệu) được trình bày như bảng 4.15
Bảng 4.15: Miã hóa và gọi tên biến các nhân tố
Ký hiệu Nhân tố Dạng dữ liệu Ký hiệu
X1 Địa điểm xây dựng Dạng chữ: Vị trí (tỉnh) Polynominal X2 Mục đích sử dụng Dạng chữ (loại chức năng) Polynominal
X3 Diện tích Dạng số thực (m 2 ) Real
X4 Chiều cao Dạng số thực (m) Real
X5 Bước cột Dạng số thực (m) Real
X6 Số tầng Dạng số nguyên (tầng) Interger
X7 Tải trọng cầu trục Dạng số nguyên (tấn) Interger
X8 Loại móng Dạng chữ (loại móng) Polynominal
X9 Loại tường Dạng chữ (loại tường) Polynominal
X10 Loại mái Dạng chữ (loại mái) Polynominal
CPXD nhà xưởng trong giai đoạn đấu thầu
Dạng số thực (Triệu đồng) Real
Mạng neuron nhân tạo (ANN) đã được sử dụng trong nhiều lĩnh vực cho nhiều ứng dụng khác nhau và được chứng minh là đáng tin cậy Mặc dù có những ưu điểm độc đáo như bản chất phi tham số, khả năng giới hạn quyết định tùy ý và dễ dàng xử lý các loại dữ liệu khác nhau thì chúng có một số hạn chế Những hạn chế này là kết quả của một số yếu tố, có thể ảnh hưởng đến độ chính xác của việc phân loại Có 2 nhóm yếu tố chính: yếu tố bên ngoài và yếu tố bên trong Các yếu tố bên ngoài bao gồm các đặc điểm của tập dữ liệu đầu vào và quy mô của nghiên cứu, trong khi các yếu tố bên trong là sự lựa chọn cấu trúc mạng thích hợp, trọng số ban đầu, số lần lặp, chức năng truyền và tốc độ học [37] Vì vậy, một trong những thách thức lớn trong thiết kế mạng neuron là việc xác định các thông số nhằm để quá trình huấn luyện đạt sai số tối thiểu và độ chính xác cao nhất
4.5.2.1 Số lớp ẩn và số neuron trong lớp ẩn
Nhiều nghiên cứu cho rằng khi sử dụng một lớp ẩn cho ta hiệu năng i tốt hơn là sử dụng nhiều hơn một lớp Khi sử dụng mạng có nhiều lớp ẩn thì việc huấn luyện mạng thường rất chậm và tốn nhiều thời gian Vì vậy, ở nghiên cứu này tác giả thiết kế mô hình với 1 lớp ẩn để tính toán
Số lượng neuron thần kinh trong lớp đầu vào thì dựa vào số lượng tham số đầu số ở lớp đầu vào, số lượng tế bào thần kinh lớp đầu ra được xác định bởi các tham số đầu ra nhưng số lượng tế bào thần kinh trong lớp ẩn chưa có căn cứ để xác định Nếu số lượng neuron trong lớp ẩn ít thì có thể dẫn đến tình trạng thiếu ăn khớp (underfitting) nghĩa là không thể nhận biết được các tín hiệu đầy đủ trong một tập dữ liệu phức tạp Ngược lại, nếu số lượng neuron trong lớp ẩn nhiều sẽ tăng thời gian luyện mạng, có thể xảy ra tình trạng thừa ăn khớp (overfitting) nghĩa là dữ liệu mẫu (training) quá nhỏ trong khi đó mô hình quá phức tạp dẫn đến đến việc dự đoán bị nhiễu và chất lượng mô hình không còn tốt Vì vậy, việc lựa chọn số lượng neuron trong các lớp của mạng thần kinh nhân tạo là vô cùng quan trọng vì nó liên quan đến thành công của quá trình đào tạo mạng
Có nhiều nghiên cứu xác định số neuron trong lớp ẩn sử dụng phương pháp thử và sửa cho đến khi nào đạt kết tối ưu hoặc mong muốn Để khắc phục điều này
K Gnana Sheela (2013) [38] thức tính số neuron trong lớp ẩn và Tijana Vujičić và cộng sự (2016) [39] đã chứng minh công thức này giúp quá trình huấn luyện đạt sai số thấp nhất với n là số neuron lớp đầu vào:
Nghiên cứu có 26 tham số của lớp đầu vào thì số lượng neuron trong lớp ẩn là 4
4.5.2.2 Tốc độ học (learning rate)
Tốc độ học lớn giúp mạng lưới thần kinh đào tạo có tốc độ nhanh hơn, nhưng nó cũng có thể làm giảm độ chính xác Nếu tốc độ học quá thấp sẽ ảnh hưởng lớn đến tốc độ của thuật toán, có thể xảy ra trường hợp không bao giờ đạt được mục tiêu (đích) Mặt khác, nếu tốc độ học lớn cao, thuật toán tiếp cận mục tiêu rất nhanh sau một vài lần lặp, nhưng không thể hội tụ vì bước nhảy quá lớn, và cứ quanh quẩn ở mục tiêu
Khi lựa chọn giá trị này thì cần căn cứ vào dữ liệu và yêu cầu mỗi bài toán và phải làm một vài thí nghiệm để chọn ra giá trị tốt nhất Ở nghiên cứu này tác giả đã thử và chọn tốc độ học là 0,02 cho ra kết quả sai số thấp nhất
Khi tốc độ học quá lớn hoặc quá bé sẽ khiến quá trình huấn luyện gặp khó khăn, khi đó có một thành phần gọi là momentum- động lực hoặc gọi là đà, hệ số này giúp cho quá trình đào tạo diễn ra thuận lợi và nhanh hơn
Wnew = W old - (*v + * gradient) Trong đó:
Wnew, Wold: lần lượt là trọng số mới và cũ
: momentum, thường chọn 0,9 v: vận tốc gradient: tỷ lệ độ nghiêng của đường dốc
Trước khi đưa các tập dữ liệu vào mô hình, ta cần thiết lập các thông số mô hình Các thông số này được ở bảng 4.16 và hình 4.3 dưới đây Các bước thực hiện được tham khảo ở tài liệu hướng dẫn [40] và cụ thể các thiết lập trong phần mềm Rapidminer Studio sẽ được trình bày ở phần tiếp theo
Bảng 4.16: Các thông số cho mô hình mạng ANN
Thông số Giá trị trong Rapidminer
Số nút của lớp vào 26
Số nút của lớp ẩn 4
Learning rate (tỉ lệ học) 0.02
Error epsilon (sai số cho phép) 1.0E-4
- Mô hình thực hiện được thể hiện qua hình 4.3:
Hình 4.3: Mô hình huấn luyện ANN
- Các bước thực hiện mô hình:
🞡 Bước 1: Đưa dữ liệu excel vào phần mềm
🞡 Bước 2: Gán thuộc tính cho biến
🞡 Bước 3: Thay đổi vai trò của thuộc tính, chọn Y là biến mục tiêu (Output)
🞡 Bước 4: Chuyển đổi các thuộc tính về dạng số
Các thuộc tính không phải dạng số sẽ được ánh xạ về dạng số nhưng không làm thay đổi bản chất của thuộc tính ban đầu của biến
🞡 Bước 5: Xáo trộn dữ liệu mô hình
Mô hình 5 fold, có vài 4 kiểu xáo trộn nhưng kiểu dữ liệu xáo theo thứ tự tuyến tính (line sampling) cho kết quả sai số thấp nhất, là xáo trộn theo thứ tự từ fold 1 đến fold 5 theo sắp xếp ngẫu nhiên từ bảng số liệu đưa vào mô hình
+ Bước 6: Thiết lập các thông số của mô hình Đưa các thông số đã tính toán ở bảng 4.16 vào mô hình
🞡 Bước 7: Chạy mô hình và xuất kết quả
Sau khi chạy mô hình trên phần mềm, mô hình tự động tính toán kết quả hiệu suất được thể hiện trong bảng 4.17 dưới đây Chi tiết các kết quả được trình bày ở phụ lục 5
Bảng 4.17: Kết quả hiệu suất mô hình ANN
Hình 4.4: Biểu đồ so sánh Y và Y’
Hình 4.5: Biểu đồ tương quan giữa Y và Y’
So sánh với các mô hình khác
Sử dụng bộ dữ liệu 35 công trình chạy mô hình hồi quy và mô hình SVM Kết quả của 3 mô hình thể hiện ở bảng 4.18, hệ số tương quan (R), phần trăm sai số trung bình tuyệt đối (MAPE), sai số trung bình tuyệt đối (MAE), sai số toàn phương trung bình (RMSE) của mô hình ANN có độ tin cậy cao, tốt hơn, tiếp theo là mô hình hồi quy và cuối cùng là mô hình SVM Vì vậy, mô hình ANN sử dụng trong nghiên cứu này là mô hình cho kết quả tin cậy cao
Bảng 4.18: So sánh kết quả các mô hình
Trên hình 4.6, mô hình ANN có hệ số tương quan lớn nhất 0,910, lớn hơn mô hình hồi quy 0,849 và máy véc tơ hỗ trợ 0,763 Mô hình ANN có độ tin cậy lớn hơn
Hình 4.6: Biểu đồ hệ số tương quan của các mô hình
Hình 4.7 biểu diễn MAPE phản ánh giá trị dự báo sai khác bao nhiêu phần trăm so với giá trị trung bình Mô hình ANN có mức sai số thấp nhất 22,49% tốt hơn mô hình hổi quy 35,54% và mô hình máy véc tơ hỗ trợ 88,78%
RMSE (triệu VNĐ) Hình 4.7: Biểu đồ sai số MAPE
Hình 4.8 cho thấy sai số MAE, sai số toàn phương trung bình RMSE so với giá trị dự đoán của mô hình ANN là thất nhất 4.153,246 triệu đồng và 5.661,965 đồng, mô hình hồi quy có sai số 4.890,241 triệu đồng và 6.559,556 triệu đồng nhưng mô hình véc tơ hỗ trợ có sai số rất lớn 10.538,749 trệu đồng và 12.162,688 triệu đồng
Hình 4.8: Biểu đồ sai số MAE và RMSE Kết quả xuất ra từ mô hình Véc tơ hỗ trợ (SVM)
Kết quả xuất ra từ mô hình Hồi quy tuyến tính