CART : Các cây phân loại và hồi quy MT : Mô hình cây ANN : Mạng thần kinh nhân tạo LS-SVM : Mô hình áp dụng trí tuệ nhân tạo trong phân tích DE : Tối ưu hóa đột biến MLIE : Ước lượng kho
Trang 1LÊ TUẤN KHANH
ỨNG DỤNG TRÍ TUỆ NHÂN TẠO TRONG KIỂM SOÁT DỰ ÁN XÂY DỰNG THEO PHƯƠNG PHÁP
QUẢN LÝ GIÁ TRỊ ĐẠT ĐƯỢC (EVM)
LUẬN VĂN THẠC SĨ
KỸ THUẬT XÂY DỰNG DÂN DỤNG VÀ CÔNG NGHIỆP
ĐÀ NẴNG, 2017
Trang 2LÊ TUẤN KHANH
ỨNG DỤNG TRÍ TUỆ NHÂN TẠO
TRONG KIỂM SOÁT DỰ ÁN XÂY DỰNG THEO PHƯƠNG PHÁP QUẢN LÝ GIÁ TRỊ ĐẠT ĐƯỢC
(EVM)
Chuyên ngành: Kỹ thuật Xây dựng
Dân dụng và Công nghiệp
LUẬN VĂN THẠC SĨ
KỸ THUẬT XÂY DỰNG DÂN DỤNG VÀ CÔNG NGHIỆP
Người hướng dẫn khoa học: TS VŨ DUY THẮNG
ĐÀ NẴNG, 2017
Trang 3Tôi xin bày tỏ lòng biết ơn tới Lãnh đạo trường Đại học Duy Tân, khoaSau đại học, các Thầy, Cô giáo đã tạo mọi điều kiện thuận lợi giúp tôi hoànthành quá trình học tập và nghiên cứu.
Tôi xin cảm ơn TS Vũ Duy Thắng đã tận tình hướng dẫn, chỉ bảo đểtôi hoàn thành luận văn này
Tôi cũng xin cảm ơn các cơ quan, bạn bè đồng nghiệp và những ngườithân đã cùng chia sẻ, giúp đỡ, động viên, tạo mọi điều kiện thuận lợi để tôihoàn thành nhiệm vụ học tập và cuốn luận văn này
Tác giả luận văn
LÊ TUẤN KHANH
Trang 4Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi, dưới sựhướng dẫn của TS Vũ Duy Thắng Những nội dung nghiên cứu, kết quả trong
đề tài này là trung thực và chưa công bố dưới bất kỳ hình thức nào trước đây.Nếu phát hiện có bất kỳ sự gian lận nào, tôi xin hoàn toàn chịu trách nhiệm vềnội dung luận văn của mình
Tác giả luận văn
LÊ TUẤN KHANH
Trang 5MỞ ĐẦU 1
1 Tính cấp thiết của đề tài luận văn 1
2 Mục tiêu nghiên cứu của đề tài 2
3 Phạm vi và đối tượng nghiên cứu 2
4 Phương pháp nghiên cứu 2
5 Nội dung nghiên cứu, bố cục luận văn 2
CHƯƠNG 1 TỔNG QUAN VỀ THỰC TRẠNG QUẢN LÝ CHI PHÍ XÂY DỰNG CÔNG TRÌNH VÀ VIỆC ÁP DỤNG CÁC MÔ HÌNH 4
1.1 ĐẶT VẤN ĐỀ 4
1.2 TÌNH HÌNH NGHIÊN CỨU ÁP DỤNG CÁC MÔ HÌNH DỰ BÁO 5
1.2.1 Mô hình CART (Classification And Regression Trees) 6
1.2.2 Mô hình MT (Model Tree) 7
1.2.3 Mô hình ANN (Artificial Neural Networks) 8
1.3 ƯỚC TÍNH CHI PHÍ XÂY DỰNG VỚI LS-SVM 10
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT DỰ ĐOÁN CHI PHÍ HOÀN THÀNH THEO EVM VÀ PHÂN TÍCH MÔ HÌNH EAC-LSPIM 14
2.1 DỰ ĐOÁN CHI PHÍ HOÀN THÀNH 14
2.2 PHÂN TÍCH MÔ HÌNH EAC-LSPIM 16
2.3 DÙNG MÁY HỌC LS-SVM ĐỂ PHÂN TÍCH HỒI QUY 17
2.4 PHÂN TÍCH HỒI QUY VỚI KHOẢNG THỜI GIAN DỰ ĐOÁN 19
2.4.1 Bối cảnh 19
2.4.2 Đánh giá hiệu suất của khoảng dự báo 21
2.4.3 Các công trình trước khi dự đoán khoảng cách dự đoán 22
2.5 THUẬT TOÁN TỐI ƯU HOÁ SỰ ĐỘT BIẾN 24
2.5.1 Khởi tạo 25
2.5.2 Đột biến 25
Trang 62.5.5 Ngừng kiểm tra tiêu chí 26
2.6 ĐÁNH GIÁ VÀ HIỆU CHỈNH MÔ HÌNH 26
CHƯƠNG 3 ÁP DỤNG MÔ HÌNH EAC-LSPIM ĐỂ DỰ ĐOÁN CHI PHÍ HOÀN THÀNH ĐỐI VỚI NHÓM NHÀ Ở XÃ HỘI THÀNH PHỐ ĐÀ NẴNG 30
3.1 NHẬP DỮ LIỆU 31
3.2 LS-SVM ĐỂ ƯỚC LƯỢNG ĐIỂM ƯỚC TÍNH ĐẾN KHI HOÀN THÀNH 36 3.3 CÔNG SUẤT DỰ ĐOÁN ETC 36
3.4 LS-SVM ĐỂ SUY LUẬN VỀ CÁC GIỚI HẠN DỰ ĐOÁN ETC 39
3.5 TỔNG HỢP DỰ TOÁN CHI PHÍ DỰ ÁN ĐẾN HOÀN THÀNH 39
3.6 KẾT QUẢ TÍNH TOÁN VÀ KẾT LUẬN 39
KẾT LUẬN VÀ KIẾN NGHỊ 46 TÀI LIỆU THAM KHẢO
QUYẾT ĐỊNH GIAO ĐỀ TÀI (BẢN SAO)
Trang 7CART : Các cây phân loại và hồi quy
MT : Mô hình cây
ANN : Mạng thần kinh nhân tạo
LS-SVM : Mô hình áp dụng trí tuệ nhân tạo trong phân tích
DE : Tối ưu hóa đột biến
MLIE : Ước lượng khoảng cách dựa trên máy
EVM : Quản lý giá trị đạt được
PV : Giá trị kế hoạch
BCWS : Chi phí dự toán ngân sách
EV : Giá trị kiếm được
BCWP : Chi phí đã thực hiện
AC : Chi phí thực tế
ACWP : Chi phí đã thực hiện
EAC : Ước tính khi hoàn thành
AI : Trí tuệ nhân tạo
PI : Khoảng dự đoán
PICP : Xác xuất khoảng dự đoán
MPI : Độ rộng trung bình của khoảng dự đoán
ML : Máy học
MLIE : Ước lượng khoảng cách theo máy học
PL : Giới hạn dự đoán
NFE : Số lượng các đánh giá chức năng
ETC : Ước tính đến hoàn thành
RMSE : Sai số trung bình
R2 : hệ số tương quan giữa 2 biến
Trang 9Số hiệu hình Tên hình Trang
2.2 Giới hạn dự đoán và khoảng thời gian dự đoán 202.3 Ước tính khoảng cách máy học (ML) 232.4 Thuật toán tối ưu hóa sự biến đổi 24
3.5 Kết quả dự báo cho mô hình kiểm tra (dự án 12) 45
Trang 10MỞ ĐẦU
1 TÍNH CẤP THIẾT CỦA ĐỀ TÀI LUẬN VĂN
Thực hiện “Chiến lược phát triển nhà ở quốc gia đến năm 2020 và tầm
nhìn đến năm 2030” của Chính phủ, thời gian gần đây Đà Nẵng đã đẩy mạnh
triển khai chương trình phát triển nhà ở cho người có thu nhập thấp sử dụng
nguồn vốn đầu tư từ ngân sách nhà nước hay còn được gọi là nhà ở xã hội
Theo đó, đến năm 2020 Đà Nẵng sẽ xây dựng 187 khối nhà với khoảng
10.400 căn hộ từ nguồn vốn ngân sách, đến hết năm 2016 thành phố đã đưa
trên 8.300 căn hộ vào sử dụng theo hình thức cho thuê và bán trả góp cho
những đối tượng là cán bộ công chức, viên chức, lực lượng vũ trang và những
người có thu nhập thấp sinh sống, làm việc lâu dài trên địa bàn thành phố
Trong quá trình phát triển đô thị, gắn với công tác giải tỏa và chỉnh trang
đô thị, thành phố Đà Nẵng đã đầu tư nhiều dự án công trình nhà ở Theo đó,
việc phát triển nhà ở chung cư gắn liền với chương trình “Thành phố 3 có” và
sau này là chương trình “Nhà ở xã hội” Hiện nay, Công ty Quản lý nhà chung
cư đang quản lý 10.636 căn hộ chung cư, nhà liền kề đã được đưa vào sử
dụng, bố trí cho thuê
Để thực hiện chủ trương nêu trên, thành phố Đà Nẵng đang ra sức huy
động nguồn lực xã hội để đầu tư Nhà ở xã hội Vấn đề hiệu quả của việc đầu
tư nhằm tránh việc lãng phí ngân sách, hoặc xây dựng đình trệ do thiếu vốn,
hoặc giảm chất lượng các công trình đang là vấn đề được đưa ra Việc dự
đoán chi phí xây dựng hiện nay chưa rõ ràng và thiếu tính thực tế Hầu hết,
việc dự đoán chi phí chỉ dựa trên quy mô và quy định về “Suất đầu tư” của Bộ
Xây dựng ban hành mà không đặt một cách cụ thể vào điều kiện kỹ thuật, thị
trường, địa phương Cũng thấy rằng, chưa có công cụ hữu hiệu nào được đưa
ra để dự báo chi phí xây dựng có độ tin cậy cao
Trang 11Do triển khai trong thời gian dài và sự thiếu ổn định của các yếu tố đầu
vào như pháp lý, thời tiết, thị trường đầu vào, thị trường đầu ra, các sự cố kỹ
thuật luôn đặt các dự án xây dựng chịu các mức độ rủi ro cao Do đó, chi phí
vượt ngân sách ban đầu thường xuyên xảy ra đối với các dự án xây dựng Để
đảm bảo an toàn về mặt tài chính khi thực hiện dự án, chủ đầu tư phải thường
xuyên đánh giá chi phí của dự án trong quá trình thực hiện và đến khi hoàn
thành để phát hiện các sai lệch, đồng thời có phản ứng thích hợp Tuy nhiên,
các chủ đầu tư thường tập trung trong việc lập kế hoạch ngân sách trong giai
đoạn bắt đầu, đã bỏ qua tác động của của thay đổi chi phí và thông tin cập
nhật trong quá trình thực hiện xây dựng
Luận văn của tác giả hướng đến việc nghiên cứu áp dụng một mô hình
dự đoán tin cậy, nhằm thực hiện dự đoán chi phí xây dựng có độ chính xác
tương đối cao, phục vụ cho các nhà quản lý dự án ấn định ngân sách phù hợp
để đầu tư xây dựng công trình hiệu quả
2 MỤC TIÊU NGHIÊN CỨU CỦA ĐỀ TÀI
Mục tiêu chính của đề tài là nghiên cứu áp dụng mô hình EAC-LSPIM
(dự trên mô hình LS-SVM, là mô hình áp dụng trí tuệ nhân tạo trong phân
tích), để dự báo chi phí đến hoàn thành (ETC) đối với các công trình nhà ở xã
hội của thành phố Đà Nẵng
3 PHẠM VI VÀ ĐỐI TƯỢNG NGHIÊN CỨU
Nghiên cứu áp dụng trí tuệ nhân tạo, mà cụ thể là mô hình EAC-LSPIM
để dự báo chi phí đến hoàn thành (ETC) đối với nhóm nhà ở xã hội của thành
phố Đà Nẵng
Nghiên cứu áp dụng thực nghiệm trên cơ sở dữ liệu đã hoàn thành của
các công trình nhà ở xã hội thành phố Đà Nẵng, trong giai đoạn từ năm 2003
đến 2010
Trang 124 PHƯƠNG PHÁP NGHIÊN CỨU
Nghiên cứu thực nghiệm
5 NỘI DUNG NGHIÊN CỨU, BỐ CỤC LUẬN VĂN
Đề tài được viết triên cơ sở mục tiêu nghiên cứu đã trình bày ở trên, cấu
trúc gồm các chương tương ứng với nội dung như sau:
- Phần Mở đầu, trình bày một cách khái quát tổng quan vấn đề cần
nghiên cứu, mục tiêu, đối tượng, phạm vi nghiên cứu
- Chương 1, trình bày tổng quan về vấn đề thực trạng quản lý chi phí xây
dựng công trình và việc áp dụng các mô hình
- Chương 2, trình bày về cơ sở lý thuyết dự đoán chi phí hoàn thành theo
EVM và phân tích mô hình EAC-LSPIM
- Chương 3, áp dụng mô hình EAC-LSPIM để dự đoán chi phí hoàn
thành đối với nhóm nhà ở xã hội thành phố Đà Nẵng
- Phần kết luận và kiến nghị, tác giả trình bày các kết luận của đề tài và
kết quả đạt được của đề tài
Trang 13CHƯƠNG 1 TỔNG QUAN VỀ THỰC TRẠNG QUẢN LÝ CHI PHÍ XÂY
DỰNG CÔNG TRÌNH VÀ VIỆC ÁP DỤNG CÁC MÔ HÌNH
1 ĐẶT VẤN ĐỀ
Trong ngành xây dựng, các yếu tố không chắc chắn luôn tác động đến sự
thành bại của một dự án Do triển khai trong thời gian dài và sự thiếu ổn định
của các yếu tố đầu vào như pháp lý, thời tiết, thị trường đầu vào, thị trường
đầu ra, các sự cố kỹ thuật luôn đặt các dự án xây dựng chịu các mức độ rủi ro
cao Do các yếu tố bất định đó nên chi phí vượt ngân sách ban đầu thường
xuyên xảy ra đối với các dự án xây dựng (Nassar và cộng sự, 2005) Để đảm
bảo an toàn về mặt tài chính và đảm bảo có lợi nhuận khi thực hiện dự án, chủ
đầu tư phải thường xuyên đánh giá chi phí của dự án trong quá trình thực hiện
và đến khi hoàn thành để phát hiện các sai lệch, đồng thời có phản ứng thích
hợp Tuy nhiên, các chủ đầu tư thường tập trung trong việc lập kế hoạch ngân
sách trong giai đoạn bắt đầu, đã bỏ qua tác động của của thay đổi chi phí và
thông tin cập nhật trong quá trình thực hiện xây dựng (Cheng và cộng sự,
2010)
Đối với thành phố Đà Nẵng, trong quá trình phát triển đô thị, gắn với
công tác giải tỏa và chỉnh trang đô thị, thành phố Đà Nẵng đã đầu tư nhiều dự
án công trình nhà ở Theo đó, việc phát triển nhà ở chung cư gắn liền với
chương trình “Thành phố 3 có” và sau này là chương trình “Nhà ở xã hội”
Hiện nay, thành phố đang quản lý 190 khối nhà với 10.636 căn hộ chung cư
đã được đưa vào sử dụng, bố trí cho thuê
Để thực hiện chủ trương nêu trên, thành phố Đà Nẵng đang ra sức huy
động nguồn lực xã hội để đầu tư Nhà ở xã hội Vấn đề hiệu quả của việc đầu
Trang 14tư nhằm tránh việc lãng phí ngân sách, hoặc xây dựng đình trệ do thiếu vốn,
hoặc giảm chất lượng các công trình đang là vấn đề được đưa ra Việc dự
đoán chi phí xây dựng hiện nay chưa rõ ràng và thiếu tính thực tế Hầu hết,
việc dự đoán chi phí chỉ dựa trên quy mô và quy định về “Suất đầu tư” của Bộ
Xây dựng ban hành mà không đặt một cách cụ thể vào điều kiện kỹ thuật, thị
trường, địa phương Cũng thấy rằng, chưa có công cụ hữu hiệu nào được đưa
ra để dự báo chi phí xây dựng có độ tin cậy cao
Do đó, dự toán chi phí là một nhiệm vụ quan trọng và cần được thực
hiện ở các giai đoạn khác nhau của dự án (Liu và Zhu, 2007) Hơn nữa, độ
chính xác của việc ước lượng chi phí xây dựng là một yếu tố quan trọng trong
sự thành công của dự án (Kim và cộng sự, 2004)
TÌNH HÌNH NGHIÊN CỨU ÁP DỤNG CÁC MÔ HÌNH DỰ BÁO
Hiện nay, việc thực hiện một dự án đầu tư xây dựng công trình thường
không được kế thừa từ các dữ liệu cũ Một số các nhà đầu tư thường dựa vào
kinh nghiệm thực hiện hiện có của họ để triển khai các dự án tiếp theo Điều
này càng hạn chế đối với các dự án thực hiện ngân sách Nhà nước Hầu như,
các dự án đầu tư thường được thực hiện trên cơ sở quy định “suất đầu tư” do
Bộ Xây dựng ban hành (cho năm trước đó) và một phần kinh phí dự phòng
theo quy định quản lý dự án đầu tư Tuy nhiên, quy định “suất đầu tư” không
dựa trên các điều kiện địa phương và các yếu tố bất định, nên tính khả thi của
việc thực hiện dự án đầu tư xây dựng khó đáp ứng Điều này dẫn đến việc
lãng phí ngân sách hoặc dự án ngưng trệ, vượt chi ngân sách luôn xảy ra
Do tầm quan trọng của nó, trên thế giới hiện nay đã xây dựng các mô hình
dự báo để dự đoán chi phí Các phương pháp tiếp cận được áp dụng cho việc
ước lượng chi phí từ các phân tích hồi quy đa biến dựa trên thống kê, đến các
kỹ thuật máy học như: mô hình cây phân loại và hồi quy (CART), mô hình cây
Trang 15(MT), mô hình mạng thần kinh nhân tạo (ANN), mô hình áp dụng trí tuệ nhân
tạo trong phân tích (SVM và LS-SVM)
1.1.1 Mô hình CART (Classification And Regression Trees)
CART (Breiman và cộng sự, 1984) là một phương pháp phân loại sử
dụng dữ liệu lịch sử để xây dựng các “cây” quyết định Một mô hình CART
dự báo giá trị của các biến liên tục từ một tập hợp các biến đầu vào được gọi
là mô hình hồi quy (Razer and Athappilly, 2005)
Phân tích phân loại tối ưu trên toàn cầu (GO-CTA) (còn được gọi là
phân tích phân biệt tối ưu theo phân cấp) là sự khái quát hóa phân tích phân
biệt tối ưu có thể được sử dụng để xác định mô hình thống kê có độ chính xác
cao nhất để dự đoán giá trị của một biến phụ thuộc phân loại cho bộ dữ liệu
bao gồm các biến phân loại và liên tục Kết quả của HODA là cây không trực
giao kết hợp các biến phân loại và các điểm cắt cho các biến liên tục mang lại
độ chính xác tiên đoán tối đa, đánh giá tỷ lệ lỗi chính xác của Loại I và đánh
giá khả năng mô hình hoá thống kê có khả năng tổng quát của mô hình thống
kê Phân tích phân biệt tối ưu phân cấp có thể được xem như là một sự khái
quát hóa phân tích tuyến tính của Fisher Phân tích phân biệt tối ưu là một
thay thế cho ANOVA (phân tích biến thiên) và phân tích hồi quy, mà cố gắng
để thể hiện một biến phụ thuộc như là một sự kết hợp tuyến tính của các tính
năng hoặc phép đo khác Tuy nhiên, phân tích ANOVA và hồi quy đưa ra một
biến phụ thuộc đó là một biến số, trong khi phân tích phân biệt tối ưu phân
cấp cung cấp cho một biến phụ thuộc đó là một biến lớp
Các cây phân loại và hồi quy (CART) là một kỹ thuật học cây quyết định
phi tham số tạo ra các cây phân loại hoặc cây hồi quy, tuỳ thuộc vào việc biến
phụ thuộc là phân loại hay số
Cây quyết định được hình thành bằng một tập hợp các quy tắc dựa trên
các biến trong bộ dữ liệu mô hình hóa
Trang 16Các quy tắc dựa trên các giá trị của biến được lựa chọn để phân chia tốt
nhất để phân biệt các quan sát dựa trên biến phụ thuộc
Khi một quy tắc được chọn và chia tách một nút thành hai, quá trình
tương tự sẽ được áp dụng cho mỗi nút "con" (nghĩa là đó là thủ tục đệ quy)
Việc chia tách dừng lại khi CART phát hiện không thể đạt được thêm
nữa, hoặc một số quy tắc dừng trước đã được thiết lập (Hoặc, dữ liệu được
phân chia càng nhiều càng tốt và sau đó cây được cắt tỉa sau đó)
Mỗi chi nhánh của cây kết thúc trong một nút đầu cuối Mỗi quan sát rơi
vào một và chính xác một nút đầu cuối, và mỗi nút đầu cuối được xác định
duy nhất bởi một bộ quy tắc
Một phương pháp rất phổ biến cho các phân tích tiên đoán là rừng ngẫu
nhiên của Leo Breiman
Một ưu điểm chính của mô hình dựa trên cây quyết định là khả năng xử
lý các bộ dữ liệu cỡ nhỏ Hơn nữa, CART có thể làm giảm tác động tiêu cực
của các yếu tố ngoại lệ bởi vì mô hình có khả năng cô lập các ngoại lệ trong
một nút riêng biệt Tuy nhiên, một bất lợi của CART là nó có thể tạo ra các
cây quyết định không ổn định (Timofeev, 2004) Lý do là việc sửa đổi không
đáng kể của mẫu thử có thể tạo ra sự thay đổi cơ bản trong cây quyết định
Ngoài ra, các công trình trước đây (Razi và Athappilly, 2005, Brown và cộng
sự., 1993) đã chỉ ra rằng hiệu suất dự đoán của CART có thể thấp hơn ANN
1.1.2 Mô hình MT (Model Tree)
Một mô hình cây (MT) tương tự như cây quyết định, nhưng bao gồm các
hàm hồi quy tuyến tính đa biến ở các lá và có thể dự đoán thuộc tính giá trị
liên tục (Shrestha và Solomatine, 2006, Witten và Frank, 2000, Kaluzny và
cộng sự, 2011) Thuật toán tách không gian tham số thành các không gian con
và xây dựng một mô hình hồi quy tuyến tính cục bộ ở mỗi trong số chúng
Trang 17Vì vậy, ở một mức độ nào đó, MT tương tự như một hàm tuyến tính
Trong MT, các nút của cây được chọn dựa trên thuộc tính tối đa hóa việc
giảm lỗi mong đợi như là một hàm của độ lệch tiêu chuẩn của tham số đầu ra
(Bonakdar và Etemad-Shahidi, 2011) MT được chứng minh là có hiệu quả và
nó có thể giải quyết các bài toán hồi quy với các chiều kích cao So với các kỹ
thuật học máy khác, quá trình huốn luyện tương đối nhanh và kết quả có thể
hiểu được (Shrestha và Solomatine, 2006)
1.1.3 Mô hình ANN (Artificial Neural Networks)
Mạng thần kinh nhân tạo (ANN) hoặc các hệ thống kết nối là các hệ
thống máy tính lấy cảm hứng từ các mạng nơ-ron sinh học hình thành bộ não
động vật Các hệ thống này học (nâng cao hiệu suất) để thực hiện các nhiệm
vụ bằng cách xem xét các ví dụ, nói chung không có chương trình cụ thể Ví
dụ như trong nhận diện hình ảnh, nó có thể học cách xác định những hình ảnh
có chứa "cat" bằng cách phân tích các hình ảnh ví dụ đã được dán nhãn theo
cách thủ công là "cat" hoặc "no cat" và sử dụng các kết quả để xác định "cat"
trong các hình ảnh khác Họ đã tìm thấy hầu hết sử dụng trong các ứng dụng
khó biểu hiện trong một thuật toán máy tính truyền thống bằng cách sử dụng
chương trình dựa trên quy tắc
ANN được dựa trên một tập hợp các đơn vị kết nối hoặc các nút gọi là
nơ-ron nhân tạo (tương tự như các nơ-ron sinh học trong một bộ não động
vật) Mỗi kết nối (xung thần kinh) giữa các nơ-ron có thể truyền tín hiệu từ
người này sang người khác Thần kinh tiếp nhận (postsynaptic) có thể xử lý
tín hiệu và sau đó tín hiệu thần kinh dưới dòng kết nối với nó Trong các ứng
dụng phổ biến của ANN, tín hiệu khớp thần kinh là một số thực, và đầu ra của
mỗi nơ-ron được tính bằng một hàm không tuyến tính của tổng đầu vào của
nó Các tế bào thần kinh và khớp thần kinh cũng có thể có trọng lượng thay
đổi theo tiến trình học tập, có thể làm tăng hoặc giảm sức mạnh của tín hiệu
Trang 18mà nó gửi xuống hạ lưu Hơn nữa, chúng có thể có ngưỡng như vậy chỉ khi
tín hiệu tổng hợp ở dưới (hoặc ở trên) mức đó là tín hiệu hạ lưu được gửi đi
Thông thường, nơ-ron được tổ chức theo lớp Các lớp khác nhau có thể
thực hiện các kiểu biến đổi khác nhau trên đầu vào của chúng Các tín hiệu di
chuyển từ đầu vào, đến lớp cuối cùng (đầu ra), có thể sau khi đi qua các lớp
nhiều lần
Hình 1.1 Mô hình mạng nơron thần kinh
Mục tiêu ban đầu của phương pháp tiếp cận mạng thần kinh là giải quyết
các vấn đề giống như cách mà bộ não của con người có thể Theo thời gian,
sự chú ý tập trung vào việc kết hợp các khả năng tinh thần cụ thể, dẫn đến sự
sai lệch từ sinh học như tăng tốc ngược lại hoặc truyền thông tin theo hướng
ngược lại và điều chỉnh mạng để phản ánh thông tin đó
Trang 19Mạng thần kinh đã được sử dụng trên nhiều công việc, bao gồm tầm
nhìn máy tính, nhận dạng giọng nói, dịch máy, lọc mạng xã hội, chơi trò chơi
và trò chơi điện tử và chẩn đoán y khoa
ANN là một giải pháp khả thi để dự báo chi phí xây dựng và trong thực
tế, nó đã được sử dụng để xây dựng các mô hình dự báo chi phí khác nhau
(Hegazy và Ayed, 1998, Zhu và cộng sự, 2010, Sonmez, 2011) Phương pháp
này loại bỏ sự cần thiết phải tìm ra một mối quan hệ lập bản đồ mà toán học
mô tả chi phí xây dựng như là một hàm của các biến đầu vào Khi các yếu tố
ảnh hưởng và cấu trúc của ANN đều được xác định, nhiệm vụ giảm xuống để
thu thập một số lượng hợp lý dữ liệu để đào tạo ANN Tuy nhiên, quá trình
đào tạo các mô hình dựa trên ANN thường mất thời gian, và ANN cũng gặp
nhiều khó khăn trong việc lựa chọn một số lượng lớn các thông số kiểm soát
như kích thước lớp ẩn, tỷ lệ học và thời điểm xung lượng (Bao và cộng sự,
2005)
Hơn nữa, một bất lợi lớn của ANN là quá trình đào tạo của nó đạt được
thông qua một thuật toán trên không gian lỗi, có thể rất phức tạp và có thể
chứa nhiều yếu tố cục bộ (Kiranyaz và cộng sự, 2009) Do đó, việc đào tạo
AN có thể bị mắc kẹt và điều này chắc chắn cản trở khả năng dự báo Để khắc
phục vấn đề như vậy, các thuật toán tiến hóa, chẳng hạn như Thuật toán di
truyền (GA) và tối ưu hóa Phần tử Hạt (PSO), có thể được sử dụng để đào tạo
ANN (Nasseri và cộng sự, 2008, Zhang và cộng sự, 2007) Đó là vì những kỹ
thuật tối ưu hóa tiên tiến này làm giảm cơ hội bị mắc kẹt để quá trình đào tạo
có thể giải quyết được giải pháp tối ưu Tuy nhiên, điều này không thể được
đảm bảo (Kiranyaz và cộng sự, 2009)
ƯỚC TÍNH CHI PHÍ XÂY DỰNG VỚI LS-SVM
Trong lĩnh vực xây dựng, SVM đã được sử dụng trong dự toán chi phí
(Kong và cộng sự, 2008, HongWei, 2009, An và cộng sự, 2007, Cheng và
Trang 20cộng sự, 2010) Nguyên tắc của SVM dựa trên cơ sở giảm thiểu rủi ro và lý
thuyết thống kê Các mô hình dựa trên mô hình SVM cũng bao gồm xác định
các yếu tố tác động, thu thập mẫu dữ liệu, và quy trình đào tạo/kiểm tra Sau
khi chức năng lập bản đồ đã được thiết lập, mô hình có khả năng dự đoán giá
trị tương lai của chi phí dự án Lợi ích của SVM được biết đến rộng rãi bao
gồm khả năng suy luận mạnh mẽ, tổng quát tuyệt vời, và khả năng tiên đoán
chính xác (Lam và cộng sự, 2009, Huang và cộng sự, 2004) Tuy nhiên, quá
trình đào tạo SVM đòi hỏi phải giải quyết một vấn đề về lập trình bậc hai phải
chịu sự ràng buộc bất bình đẳng Điều này có nghĩa là quá trình đào tạo của
SVM đối với bộ dữ liệu lớn đòi hỏi chi phí tính toán cao (Guo và Bai, 2009)
Ngoài ra, đòi hỏi phải tập hợp dữ liệu lớn và cập nhật thường xuyên
Để khắc phục nhược điểm của SVM, LS-SVM được đề xuất gần đây bởi
Suykens và cộng sự (Suykens và cộng sự, 2010, Suykens, 1999, Suykens và
cộng sự, 2002) và Gestel và cộng sự (Gestel và cộng sự, 2004) LS-SVM là
một phiên bản được sửa đổi của SVM để giảm bớt gánh nặng tính toán Trong
quá trình đào tạo của LS-SVM, một chức năng chi phí bình phương nhỏ nhất
được đề nghị để có được một tập tuyến tính các phương trình trong không
gian kép Do đó, để có được giải pháp trên, cần thiết để giải quyết một tập
hợp các phương trình tuyến tính thay vì lập trình bậc hai như trong tiêu chuẩn
SVM Và hệ thống tuyến tính này có thể được giải quyết hiệu quả bằng các
phương pháp lặp đi lặp lại như độ dốc liên hợp (Wang và Hu, 2005) Các
nghiên cứu đã được thực hiện để chứng minh sự tổng quát, độ chính xác dự
đoán, và tính toán nhanh LS-SVM (Lean và cộng sự, 2009, Samui và Kothari,
2011, Chen và cộng sự, 2005) Mặc dù tính ưu việt của nó, việc áp dụng
LS-SVM trong dự toán xây dựng vẫn còn rất hạn chế
Ngoài ra, khi áp dụng LS-SVM, có thể nhận ra rằng các thông số điều
chỉnh, cụ thể là sự ổn định hóa và các tham số chức năng của hạt nhân, đóng
Trang 21một vai trò quan trọng trong việc thiết lập mô hình tiên đoán (Lean và cộng
sự, 2009, Suykens và cộng sự, 2002) Kiểm soát sự phức tạp của mô hình cần
được xác định một cách chính xác thông qua việc xác nhận chéo Khi làm như
vậy, mục tiêu chính là để có được mô hình tối ưu có thể khám phá chức năng
lập bản đồ đầu vào và đầu ra tiềm ẩn và có khả năng tạo ra hiệu suất tiên đoán
tốt nhất đối với dữ liệu mới (Bishop, 2006) Trong nghiên cứu này, DE một
công cụ tìm kiếm ngẫu nhiên dựa trên dân số được đề xuất bởi Storn và Price
(Price và cộng sự, 2005), được sử dụng trong quá trình kiểm tra chéo để đạt
được mục tiêu đó
Trong thực tế, dự toán chi phí trong ngành xây dựng thường được thể
hiện ở dạng dự báo điểm (Trost và Oberlender, 2003, Iranmanesh và cộng sự,
2007, Cheng và cộng sự, 2010, Zhu và cộng sự, 2010) Tuy nhiên, các nhà
hoạch định chính sách không chỉ yêu cầu dự báo chính xác các biến số nhất
định, mà còn là sự không chắc chắn liên quan đến dự báo Ước lượng điểm
không tính đến các nguồn không chắc chắn khác nhau từ mô hình, các biến
đầu vào, và các tham số điều chỉnh Do đó, kết hợp dự đoán sự không chắc
chắn vào các dự báo xác định có thể giúp nâng cao độ tin cậy và độ tin cậy
của các đầu ra mô hình (Shrestha và Solomatine, 2006)
Các phương pháp khác nhau (Wonnacott và Wonnacott, 1996, Heskes,
1997, Mencar và cộng sự, 2005, De Brabanter và cộng sự, 2011) đã được
giới thiệu để đạt được ước lượng khoảng cách Tuy nhiên, các phương pháp
hiện tại cũng có nhiều hạn chế như yêu cầu phân bố trước của các tham số
đầu vào không chắc chắn hoặc dữ liệu và liên quan đến các giả định nhất
định về dữ liệu và phân phối lỗi Độ chính xác và tính hữu hiệu của các
phương pháp này phụ thuộc đáng kể vào độ chính xác của thông tin trước và
các giả định Chúng dựa vào lấy mẫu lại hoặc khởi động Mặc dù các
Trang 22phương pháp dựa trên bẫy (Sonmez, 2011, Stine, 1985, Lam và Veall, 2002)
có thể mang lại kết quả dự đoán chính xác, phương pháp này được đặc trưng
bởi chi phí tính toán cao
Gần đây, một khuôn khổ mới cho việc ước tính PI mà dựa trên kỹ thuật
“máy học” đã được Shrestha và Solomatine tạo ra (Shrestha và Solomatine,
2006) Phương pháp đề xuất không yêu cầu bất kỳ giả định và kiến thức về dữ
liệu đầu vào hoặc mô hình phân phối lỗi Hơn nữa, nó cũng không yêu cầu chi
phí tính toán sâu như trong các phương pháp dựa trên khởi đầu Trong nghiên
cứu của họ (Shrestha và Solomatine, 2006), tính ưu việt của việc ước lượng
khoảng cách dựa trên máy (MLIE) so với các phương pháp truyền thống được
trưng bày Quá trình đào tạo SVM đòi hỏi phải giải quyết một vấn đề về lập
trình bậc hai phải chịu sự ràng buộc bất bình đẳng Điều này có nghĩa là quá
trình đào tạo của SVM đối với bộ dữ liệu lớn đòi hỏi chi phí tính toán cao
(Guo và Bai, 2009)
Trang 23CHƯƠNG 2
CƠ SỞ LÝ THUYẾT DỰ ĐOÁN CHI PHÍ HOÀN THÀNH
THEO EVM VÀ PHÂN TÍCH MÔ HÌNH EAC-LSPIM
DỰ ĐOÁN CHI PHÍ HOÀN THÀNH
Trong quản lý xây dựng, ước tính chi phí của công việc hoàn thành là
yếu tố quan trọng cho sự thành công của dự án Để đạt được điều này, các nhà
quản lý dự án thường dựa vào phương pháp quản lý giá trị đạt được (EVM)
EVM được biết đến rộng rãi như là một kỹ thuật quản lý liên quan đến việc
lập kế hoạch nguồn lực, sử dụng lịch biểu và yêu cầu thực hiện kỹ thuật
(Abba, 1997)
Phương pháp quản lý giá trị đạt được (EVM) được sử dụng để đánh giá
tổng thể hiệu quả thực hiện của dự án tại thời điểm xem xét Được thực thi
bằng việc phân tích chi phí và tiến độ với kế hoạch ban đầu EVM bao gồm
ba thành phần thiết yếu hỗ trợ kiểm soát dự án:
Giá trị kế hoạch (PV) hoặc Chi phí Dự toán Ngân sách (BCWS);
Giá trị kiếm được (EV) hoặc Chi phí Ngân sách cho Công việc đã Thực
hiện (BCWP);
Chi phí Thực tế (AC) hoặc Công việc đã thực hiện (ACWP)
Trong ngành xây dựng, các nhà quản lý dự án nhấn mạnh việc áp dụng
EVM vì nó cung cấp một công cụ để theo dõi tình trạng dự án và để đo hiệu
suất của dự án
EVM là cách tiếp cận có hệ thống để dự báo Ước tính khi hoàn thành
(EAC) Vai trò của EAC được nhấn mạnh bởi vì các nhà quản lý hoặc các nhà
quy hoạch có thể đánh giá tổng chi phí dự án dựa trên giá trị ước tính của
EAC Iranmanesh (Iranmanesh và cộng sự, 2007) chỉ ra rằng chính xác và
Trang 24đúng thời điểm EAC là cần thiết để dự phòng trong thời gian thực hiện dự án
Nếu EAC cho thấy chi phí đã vượt quá ngân sách, các nhà quản lý dự án có
thể sử dụng các chiến lược phù hợp để điều chỉnh chi phí xây dựng Trong
trường hợp chi phí vượt trội, các nhà quản lý dự án cần phải triển khai một
chương trình giá trị để giảm chi phí, trong đó phạm vi hoặc chất lượng của
một số dự án giảm Một lựa chọn khác là cần bổ sung ngân sách để bù đắp chi
phí vượt quá
Ở mỗi giai đoạn hoàn thành, các nhà quản lý có thể trích xuất dữ liệu từ
báo cáo tiến độ, tính toán dự toán thu được giá trị (EV) và dự đoán EAC
EAC có thể được tính bằng công thức sử dụng dữ liệu quản lý chi phí do nhà
thầu cung cấp trong “Báo cáo Hiệu suất Chi phí” hoặc “Báo cáo Tình trạng
Chi phí/Chi phí” Độ tin cậy của các báo cáo này phụ thuộc vào mức độ mà
nhà thầu tuân thủ kiểm soát nội bộ liên quan đến việc xem xét hiệu suất của
một hợp đồng (Christensen, 1993)
Theo các công trình trước đây của Christensen (Christensen, 1993,
Christensen và cộng sự, 1995) và Chen (Chen, 2008), việc xác định một ước
lượng thích hợp của EAC là một nhiệm vụ không truyền thống Để có được
EAC, các nhà quản lý cần phải thu thập dữ liệu quản lý chi phí lớn do nhà
thầu cung cấp trong báo cáo tiến độ, thường là báo cáo hàng tháng hoặc như ở
Việt Nam là các chu kỳ thanh toán Đối với các nhà thầu, để lập báo cáo định
kỳ cho chủ sở hữu, kỹ sư của họ phải thu thập đủ dữ liệu được tóm tắt trong
bản tóm tắt hàng ngày và bản tóm tắt thiết bị hàng ngày Cuối cùng, các công
thức tính EAC dựa trên sự kết hợp của một số yếu tố dữ liệu được trình bày
trong báo cáo: BCWS, BCWP và ACWP
Để dự báo EAC, nhiều công thức dựa trên chỉ số đã được sử dụng Các
công thức được chia thành ba loại: phương pháp không hiệu quả, phương
pháp thực hiện, phương pháp tổng hợp (Christensen và cộng sự, 1995, Chen,
Trang 252008, Cheng và cộng sự, 2010) Theo điều tra do Christensen và cộng sự
(Christensen và cộng sự, 1995) thực hiện, tính chính xác của các công thức
dựa trên chỉ số phụ thuộc đáng kể vào loại hệ thống, giai đoạn và giai đoạn
của dự án Điều này giải thích tại sao việc thực hiện một công thức đặc biệt có
thể chấp nhận được trong một trường hợp nhất định, trong khi các trường hợp
khác có thể tồi tệ hơn nhiều (Cheng và cộng sự, 2010) Các nhà quy hoạch dự
án phải sử dụng các bản án riêng để xác định một EAC phù hợp nhất hoặc
một loạt các EAC hợp lý Hiện tại, không có hướng dẫn chính thức về cách
chọn một phép tính EAC có thể làm theo một thiết lập cụ thể
Ngoài các công thức dựa trên chỉ số, các phương pháp dự báo EAC khác
dựa trên phân tích hồi quy (Iranmanesh và cộng sự, 2007, Christensen và
cộng sự, 1995) Các công thức dựa trên hồi quy thường được tạo ra bằng cách
sử dụng phân tích hồi quy đơn hoặc không tuyến tính đơn lẻ (Christensen,
1993) Tuy nhiên, các phương pháp dựa trên phân tích hồi quy truyền thống
cũng có những bất lợi như những hạn chế của chúng trong mô tả các mối
quan hệ phi tuyến (An và cộng sự, 2007) Thêm vào đó, số yếu tố ảnh hưởng
đối với dự toán chi phí xây dựng có thể được đánh giá cao (Trost và
Oberlender, 2003, Cheng và cộng sự, 2010) và chức năng hồi quy cơ bản có
thể rất phức tạp Thực tế này giải thích tại sao dự toán EAC dựa trên phân tích
hồi quy truyền thống không được sử dụng rộng rãi (Christensen, 1993)
Không cần phải nói, vấn đề dự báo EAC phức tạp vì nó liên quan đến
nhiều dữ liệu xây dựng, cân nhắc nhiều yếu tố ảnh hưởng và chức năng hồi
quy phức tạp Vì vậy, các nhà quy hoạch hoặc nhà quản lý có thể sử dụng các
phương pháp tiên tiến hơn, cụ thể là các phương pháp Trí tuệ nhân tạo (AI),
phương pháp ANN và phương pháp LS-SVM
Trang 26PHÂN TÍCH MÔ HÌNH EAC-LSPIM
Theo nghiên của Min Yuan Cheng và Hoàng Nhật Đức được đăng ngày
10/3/2014 trên Tạp chí Kỹ thuật Xây dựng và Quản lý, đã đề xuất mô hình sử
dụng LS-SVM để dự đoán khoảng chi phí xây dựng khi hoàn thành
(EAC-LSPIM)
Nghiên cứu này nhằm mục đích đề xuất mô hình tình huống giả định, cụ
thể là EAC-LSPIM, kết hợp các kỹ thuật tiên tiến khác nhau bao gồm
LS-SVM, MLIE, và DE để giúp dự án quản lý trong dự toán chi phí xây dựng
Mô hình được xây dựng kết hợp những điểm mạnh và giảm thiểu những điểm
yếu của từng kỹ thuật Mục tiêu nghiên cứu là xây dựng một mô hình có thể
hoạt động tự động mà không cần sự can thiệp của con người và có thể cung
cấp kết quả dự báo chính xác và đáng tin cậy Được trang bị với công cụ này,
dự kiến rằng các nhiệm vụ kiểm soát chi phí và lập kế hoạch chi phí trong
ngành xây dựng có thể được thực hiện hiệu quả
Hình 2.1 Mô hình EAC-LSPIM
Dữ liệu đầu vào
Dùng LS-SVM phân tích hồi quy
Phân tích khoảng dự đoán
Đánh giá và thiết lập giá trị
LS-SVM suy luận khoảng dự
đoán
Đánh giá chéo DE
Phương pháp MLIE
Đánh giá chéo DE
Trang 27DÙNG MÁY HỌC LS-SVM ĐỂ PHÂN TÍCH HỒI QUY
Phần này dành riêng cho việc mô tả công thức toán học của LV-SVM
Xem công thức toán học sau đây, mô tả mối quan hệ chức năng giữa biến đáp
ứng và một hoặc nhiều biến độc lập (Suykens và cộng sự, 2002, Wang và Hu,
2005):
Trong đó: x R n,y R, và (x) :R n R nh là phản xạ tới không gian đặc
trưng chiều cao Trong LS-SVM để phân tích hồi quy, đưa ra một tập dữ liệu
huấn luyện, vấn đề tối ưu được xây dựng như sau:
1 ) ,
Đây là các biến lỗi, biểu thị hằng số định chuẩn
Trong bài toán tối ưu trên, cần lưu ý rằng hàm mục tiêu bao gồm một
tổng của sai khớp bình phương và một thuật ngữ định chuẩn hóa Chức năng
chi phí này tương tự như thủ tục tiêu chuẩn trong việc đào tạo mạng lưới
nơ-ron và có liên quan đến hồi quy (Wang và Hu, 2005) Tuy nhiên, khi w trở
thành vô hạn, người ta không thể giải quyết vấn đề này Do đó, cần xây dựng
Lagrangian và rút ra được vấn đề kép (Suykens và cộng sự, 2002)
Lagrangian được cho bởi:
Trang 28e L
=
T v v
b y
Ở đây k và b là giải pháp cho hệ thống tuyến tính (5) Hạt nhân chức
năng thường được sử dụng là hàm cơ sở (Radial Basis Function-RBF) Mô tả
của RBF hạt nhân được đưa ra như sau:
2 2
Trong trường hợp hạt nhân hàm cơ sở, có hai tham số điều chỉnh cần
được xác định trong LS-SVM Tham số định chuẩn kiểm soát đối với các
điểm dữ liệu lệch với hàm hồi quy Trong khi đó, tham số hạt nhân ảnh hưởng
đến sự trơn tru của hàm hồi quy Cần lưu ý rằng phải thiết lập đúng các thông
Trang 29Phân tích hồi quy là nghiên cứu về chức năng nằm trong mối quan hệ
giữa biến phụ thuộc Y và một vector độc lập x (Olive, 2007) Một mô hình
hồi quy điển hình có thể được biểu diễn như sau:
Y i m(x i)e i, i 1 , ,n (9)Trong đó m biểu thị là một chức năng của x và ei là lỗi dự đoán
Các phương pháp khác nhau được sử dụng để tìm các ước tính m của m
Các phương pháp này bao gồm các kỹ thuật truyền thống, như mô hình hồi
quy đa tuyến và nhiều mô hình thời gian, các mô hình phi tuyến tính (Olive,
2007), cho các kỹ thuật máy học khác nhau như MT (Bhattacharya và
Solomatine, 2005, Jekabsons, 2010), ANN (Zhu và cộng sự, 2010, Wong và
cộng sự, 1997), SVM (Cheng và cộng sự, 2010, Lu và cộng sự, 2009) và
LS-SVM (Suykens và cộng sự, 2002, Suykens và cộng sự, 2010)
Một khi chức năng lập bản đồ thu được, nhiệm vụ chính là dự đoán giá
trị tương lai của Y khi một đầu vào X cụ thể được trình bày cho hệ thống
Trong đánh giá điểm, Y được biểu diễn dưới dạng một giá trị duy nhất
Ngược lại, trong dự toán khoảng, kết quả dự đoán được đưa ra dưới dạng một
khoảng giá trị có thể Trong nhiều trường hợp, ước lượng khoảng thời gian
thu hút nhiều sự chú ý hơn so với ước lượng điểm Lý do là yêu cầu của các
nhà ra quyết định không chỉ nằm trong một dự báo chính xác mà còn trong sự
không chắc chắn vốn có của các dự báo (Shrestha và Solomatine, 2006)
Trang 30Hình 2.2 Giới hạn dự đoán và khoảng thời gian dự đoán
Ước lượng khoảng bao gồm các giới hạn trên và dưới, giữa đó một giá
trị điểm của biến đáp ứng dự kiến sẽ nằm ở mức độ tin cậy nhất định (thường
là 95%) Dãy hạn chế bởi những giới hạn này được biết đến khoảng thời gian
(PI) Khoảng dự đoán là đầu ra là mong muốn vì chúng cung cấp một loạt các
giá trị mà có thể bao gồm ước lượng điểm của biến dự đoán Thêm vào đó,
người ta có thể sử dụng khoảng thời gian dự đoán để phân biệt độ chính xác
của ước lượng được cung cấp bởi mô hình, sau đó quyết định giữ hoặc từ chối
kết quả (Mencar và cộng sự, 2005)
2.1.2 Đánh giá hiệu suất của khoảng dự báo
Khi đã đạt được kết quả với khoảng thời gian, có thể sử dụng dự đoán
khả năng bảo hiểm khoảng thời gian dự đoán (PICP) để đánh giá hiệu suất
(Shrestha và Solomatine, 2006, Khosravi và cộng sự, 2011, Khosravi và cộng
sự, 2010) PICP đo tỷ lệ điểm dữ liệu nằm trong PI Trong một số trường hợp,
PICP thực nghiệm có thể thấp hơn nhiều so với mức độ tin cậy được xác định
trước Điều này cho thấy các PI có nguồn gốc không đáng tin cậy (Khosravi
Trang 31và cộng sự, 2011) Vì vậy, PICP đôi khi dự kiến sẽ bằng hoặc lớn hơn mức độ
tự tin, vì điều này phản ánh độ tin cậy của các kết quả dự đoán
Tuy nhiên, PICP không phải là thước đo duy nhất để đánh giá PI Lý do
là người ta có thể đơn giản xây dựng một PI lớn để đạt được độ tin cậy tối đa
của các kết quả dự đoán (ví dụ: 100%) Tuy nhiên, các PI rất lớn, trên thực tế,
giảm khả năng sử dụng các kết quả dự báo vì ước tính khoảng thời gian
không truyền tải thông tin có giá trị cho người ra quyết định (Khosravi và
cộng sự, 2011) Do đó, để đảm bảo khả năng sử dụng ước tính khoảng cách,
cần phải xem xét chiều rộng trung bình của khoảng dự đoán (MPI) (Khosravi
và cộng sự, 2010, Shrestha và Solomatine, 2006), đo chiều rộng trung bình
của PI Theo đó, một PI được xây dựng tốt phải đạt được sự cân bằng giữa độ
tin cậy và khả năng sử dụng Nói cách khác, cần có một PICP cao tương ứng
với một MPI hẹp (Khosravi và cộng sự, 2010, Khosravi và cộng sự, 2011)
Tuy nhiên, hai tiêu chí này đôi khi xung đột với nhau và điều này làm cho
việc ước lượng khoảng thời gian là một vấn đề đầy thách thức Do tầm quan
trọng và thách thức của nó, các nghiên cứu đã dành riêng việc thành lập các
PI cho nhiều mô hình dự đoán
2.1.3 Các công trình trước khi dự đoán khoảng cách dự đoán
Sonmez (Sonmez, 2011) mạng nơ-ron tích hợp với khoảng dự đoán thời
gian khởi động để ước lượng phạm vi chi phí xây dựng Trong cách tiếp cận
này, các mạng thần kinh được sử dụng để mô hình hoá chức năng lập bản đồ
giữa các yếu tố ảnh hưởng và chi phí Phương pháp khởi động được sử dụng
để định lượng mức độ biến thiên bao gồm trong chi phí ước tính Tuy nhiên,
để xây dựng các ước tính khoảng thời gian, có thể tạo ra khoảng thời gian
chính xác, đòi hỏi tính toán nhiều (De Brabanter và cộng sự, 2011)
Mencar và cộng sự (Mencar và cộng sự, 2005) đề xuất một phương pháp
ước lượng khoảng dự đoán cho mạng nơ-ron thần kinh sao cho hệ thống cung
Trang 32cấp ước tính độ không chắc chắn liên quan đến các giá trị đầu ra dự đoán
Phương pháp này không đòi hỏi bất kỳ giả định nghiêm ngặt nào đối với việc
phân phối dữ liệu không rõ Tuy nhiên, các khoảng bắt nguồn là không đổi
trong toàn bộ miền đầu vào
Tính năng này có thể không phản ánh hiện tượng thực sự xảy ra trong dữ
liệu chuỗi thời gian thực Trong những trường hợp này, sự không chắc chắn vốn
có thể phân phối không đều trong các thời kỳ khác nhau (Cheng và Roy, 2011)
Một phương pháp khác để xây dựng PI, được dựa trên phương pháp tiếp
cận máy học, được thành lập bởi Shrestha và Solomatine (Shrestha và
Solomatine, 2006) Trong nghiên cứu của họ, các tác giả trình bày một
phương pháp để ước lượng PI qua sự không chắc chắn của đầu ra mô hình Ý
tưởng quan trọng ở đây là các số dư lịch sử giữa các đầu ra mô hình và các dữ
liệu quan sát tương ứng có thể là các chỉ số định lượng của sự khác biệt giữa
mô hình và mô hình hệ thống thế giới thực và cung cấp các thông tin có giá trị
để đánh giá sự không chắc chắn của mô hình