Tối ưu hóa ước tính mức tiêu thụ năng lượng trong các tòa nhà dựa trên các thuật toán trí tuệ nhân tạo

11 81 1
Tối ưu hóa ước tính mức tiêu thụ năng lượng trong các tòa nhà dựa trên các thuật toán trí tuệ nhân tạo

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Mô phỏng và dự báo năng lượng tiêu thụ đóng vai trò quan trọng trong việc thiết lập chính sách năng lượng và đưa ra quyết định theo hướng phát triển bền vững. Nghiên cứu này sử dụng phương pháp kỹ thuật thống kê và công cụ trí tuệ nhân tạo bao gồm mạng nơ-ron thần kinh (ANNs – Artificial neutral networks), máy hỗ trợ véc tơ (SVM – Support vector machine), cây phân loại và hồi quy (CART - Classification and regression trees), hồi quy tuyến tính (LR - Linear regression), hồi quy tuyến tính tổng quát (GENLIN - Generalized linear regression), tự động phát hiện tương tác Chi-squared (CHAID - Chi-square automatic interaction detector) và mô hình tổng hợp (Ensemble model) để dự đoán mức tiêu thụ năng lượng trong các căn hộ tòa nhà chung cư. Bộ dữ liệu để xây dựng mô hình gồm 200 mẫu được khảo sát ở nhiều chung cư tại TP. Hồ Chí Minh. Mô hình đơn có hiệu quả tốt nhất trong quá trình dự đoán là CART, trong khi đó mô hình được tổng hợp tốt nhất là CART + GENLIN.

Tạp chí Khoa học Cơng nghệ Xây dựng NUCE 2020 14 (1V): 35–45 TỐI ƯU HĨA ƯỚC TÍNH MỨC TIÊU THỤ NĂNG LƯỢNG TRONG CÁC TÒA NHÀ DỰA TRÊN CÁC THUẬT TỐN TRÍ TUỆ NHÂN TẠO Trần Đức Họca,∗, Lê Tấn Tàia a Khoa Kỹ thuật Xây dựng, Trường Đại học Bách khoa Thành phố Hồ Chí Minh, số 268 Lý Thường Kiệt, quận 10, thành phố Hồ Chí Minh, Việt Nam Nhận ngày 11/10/2019, Sửa xong 03/02/2020, Chấp nhận đăng 03/02/2020 Tóm tắt Mơ dự báo lượng tiêu thụ đóng vai trị quan trọng việc thiết lập sách lượng đưa định theo hướng phát triển bền vững Nghiên cứu sử dụng phương pháp kỹ thuật thống kê công cụ trí tuệ nhân tạo bao gồm mạng nơ-ron thần kinh (ANNs – Artificial neutral networks), máy hỗ trợ véc tơ (SVM – Support vector machine), phân loại hồi quy (CART - Classification and regression trees), hồi quy tuyến tính (LR - Linear regression), hồi quy tuyến tính tổng quát (GENLIN - Generalized linear regression), tự động phát tương tác Chi-squared (CHAID - Chi-square automatic interaction detector) mơ hình tổng hợp (Ensemble model) để dự đốn mức tiêu thụ lượng hộ tòa nhà chung cư Bộ liệu để xây dựng mô hình gồm 200 mẫu khảo sát nhiều chung cư TP Hồ Chí Minh Mơ hình đơn có hiệu tốt q trình dự đốn CART, mơ hình tổng hợp tốt CART + GENLIN Từ khố: ước tính; tịa nhà; tiêu thụ lượng; khai phá liệu, trí tuệ nhân tạo OPTIMIZING ESTIMATION ACCURACY OF ENERGY CONSUMPTION IN RESIDENTIAL BUILDINGS BASED ON A COMPARISON OF ARTIFICIAL INTELLIGENCE ALOGIRITHMS Abstract Energy simulation and forecasting play an important role in setting energy policy and making decisions in pursuit of sustainable development This research uses statistical tools and artificial intelligence techniques including artificial neural networks, support vector machines, classification and regression trees, linear regression, generalized linear regression, chi-square automatic interaction detector, and ensemble model to predict the energy consumption in apartment buildings A dataset of two hundred samples, which were obtained from residential buildings in Ho Chi Minh City, Vietnam, were used to evaluate the performance of the developed models As a result, CART is the best single model, meanwhile the best ensemble model is CART + GENLIN Keywords: estimation; residential buildings; energy consumption; data mining https://doi.org/10.31814/stce.nuce2020-14(1V)-04 c 2020 Trường Đại học Xây dựng (NUCE) Giới thiệu Hiện nay, tiết kiệm lượng vấn đề cấp thiết không phạm vi quốc gia mà trở thành mối quan tâm toàn giới [1] Biến đổi khí hậu tăng giá loại lượng với chất lượng sống người ngày cao [2] dẫn đến phụ thuộc nhiều vào nguồn lượng tạo thách thức cho đội ngũ kiến trúc sư, kỹ sư phải khơng ∗ Tác giả Địa e-mail: tdhoc@hcmut.edu.vn (Học, T Đ.) 35 Học, T Đ., Tài, L T / Tạp chí Khoa học Cơng nghệ Xây dựng ngừng sáng tạo cải tiến thiết kế ngành xây dựng Thiết kế tòa nhà phải không tạo tiện nghi, thoải mái cho người sử dụng mà cịn cần tối ưu hóa sử dụng lượng giảm thiểu tối đa tác động xấu môi trường Trên giới, lượng sử dụng tòa nhà chiếm đến 20% tổng lượng cần sử dụng cho người [3] Ở Việt Nam tỷ lệ 27% [2, 4] Riêng Mỹ nước Châu Âu tỷ lệ chiếm đến 40% [5] Do đó, việc ước tính mức tiêu thụ lượng tịa nhà có ý nghĩa quan trọng việc tối ưu hóa hiệu suất sử dụng lượng nhằm mục đích tiết kiệm lượng giảm thiểu tác động mơi trường Tuy nhiên, hệ thống lượng tịa nhà tương đối phức tạp cơng trình định [6] Các thiết bị tiêu thụ lượng chủ yếu tòa nhà như: hệ thống thiết bị điều hịa khơng khí, tủ lạnh, bếp điện [7] Kích thước phòng đặc điểm cửa sổ thay đổi theo loại cơng trình Ngồi ra, yếu tố điều kiện thời tiết gây ảnh hưởng không nhỏ nhu cầu sử dụng lượng tòa nhà [1] Do phức tạp thiết kế thiết bị ảnh hưởng lượng tòa nhà nên việc ước tính xác mức tiêu thụ lượng gặp nhiều khó khăn Trong năm gần đây, nhiều nghiên cứu phương pháp dự đoán đề xuất áp dụng rộng rãi cho nhiều ngành nghề Những phương pháp bao gồm phương pháp kỹ thuật, thống kê trí tuệ nhân tạo Những phương pháp sử dụng rộng rãi gồm: mạng nơ-ron thần kinh (ANN), máy hỗ trợ véc tơ (SVM), phân loại hồi quy (CART), hồi quy tuyến tính (LR), hồi quy tuyến tính tổng quát (GENLIN), tự động phát tương tác Chi-squared (CHAID) sử dụng chương trình SPSS IBM [8] Năm 1965, Nilsson [9] giới thiệu ý tưởng mô hình kết hợp cho vấn đề phân loại liệu Kỹ thuật mơ hình tổng hợp tổ hợp điểm mạnh mơ hình riêng lẻ nhằm mục đích tạo ước tính tốt Bởi kết hợp nhiều mơ hình riêng lẻ giảm lỗi giống trình ước lượng Do vậy, sử dụng phương pháp nhiều mơ hình riêng lẻ kết hợp tạo mơ hình dự đốn mạnh với tính tổng qt hóa cao Nghiên cứu sử dụng kết thu từ mơ hình riêng lẻ tốt sau tổng hợp xây dựng mơ hình kết hợp để ước lượng mức tiêu thụ lượng tịa nhà Mơ hình tổng hợp sử dụng thuật toán logic chéo k-fold liệu thu thập từ trước Các mơ hình ước tính phương pháp đánh giá Mục tiêu liệu cóliệu bằngbằng cách cácphương phương Mục tiêukhai chínhphá khai phá có cáchkết kếthợp hợp pháppháp cơng cơng nghệ nghệ nhiều lĩnh vực khác nhau, gồmnhau, khoabaohọc thống phân tích tích liệu trực nhiều lĩnh bao vực khác gồmmáy khoatính, học máy tính,kê, thống kê, phân liệu trựctuyến, máy tuyến, máy học, gia hệ thống [10] Cơng liệu áp q trình học, hệ thống chuyên [10] Côngchuyên nghệgia khai phá dữnghệ liệukhai hiệnpháđược áp dụng dụng q trình dự đốn nhiều lĩnh vực Hình thể quy trình hoạt động dự đốn nhiều lĩnh vực Hình thể quy trình hoạt động mơ hình dự đốn đơn bao mơ khai hình dự đốn baoANNs, gồm sáuCART, kỹ thuật CHAID, khai phá dữLR, liệu,GENLIN, ANNs, CART, gồm sáu kỹ thuật phá dữđơn liệu, CHAID, SVMs LR, Các mô hình GENLIN, SVMs Các mơ hình đơn sử dụng để tự động tạo so sánh kết liên đơn sử dụng để tự động tạo so sánh kết liên tục tục ANNs CHAID Dữ liệu đầu vào LR Đánh giá hiệu mô hình Kết hợp mơ hình tốt Dữ liệu đầu GENLIN SVM Hình Sơ đồ khối mơ hình ước tính mức tiêu thụ lượng tịa nhà chung cư Hình Sơ đồ khối mơ hình ước tính mức tiêu thụ lượng tịa nhà chung cư 2.1 Mạng thần kinh nhân tạo (ANNs) 36 Mơ hình mạng thần kinh nhân tạo cơng cụ mạnh mẽ để giải vấn đề phức tạp Mạng thần kinh xử lý nhân tố nơ-ron não người, nhân tố đơn xếp theo tường lớp Mạng thần kinh nhân tạo sử dụng để dự đoán mức tiêu thụ lượng nhiều nghiên cứu trước [11-13] Trong mạng nơ-ron đa lớp, lớp Học, T Đ., Tài, L T / Tạp chí Khoa học Cơng nghệ Xây dựng 2.1 Mạng thần kinh nhân tạo (ANNs) Mơ hình mạng thần kinh nhân tạo cơng cụ mạnh mẽ để giải vấn đề phức tạp Mạng thần kinh xử lý nhân tố nơ-ron não người, nhân tố đơn xếp theo tường lớp Mạng thần kinh nhân tạo sử dụng để dự đoán mức tiêu thụ lượng nhiều nghiên cứu trước [11–13] Trong mạng nơ-ron đa lớp, lớp tập hợp nút liệu đầu vào đặc điểm phịng, có hay nhiều lớp ẩn chứa nút tính tốn lớp đầu chứa nút biểu thị mức tiêu thụ lượng Thuật toán máy học sử dụng rộng rãi hiệu để huấn luyện mạng thần kinh đa lớp thuật tốn lan truyền ngược Ngưỡng kích hoạt nơ-ron lớp ẩn tính sau: netk = yk = f (netk ) wk j o j netk ngưỡng kích hoạt nơ-ron thứ k; j tập nơ-ron lớp trước; wk j trọng số kết nối nơ-ron k nơ-ron j; o j đầu nơ-ron j, yk hàm truyền f (netk ) = 1 + e−net Công thức huấn luyện trọng số cập nhật wk j chu kỳ t wk j (t) = wk j (t − 1) + ∆wk j (t) Giá trị thay đổi ∆wk j (t) tính sau ∆wk j (t) = ηδ p j o p j + αwk j (t − 1) η tham số tốc độ huấn luyện; δ p j sai số lan truyền; o p j kết đầu nơ-ron j cho lần thứ p; α tham số khuếch đại, wk j (t − 1) giá trị thay đổi cho wk j chu kỳ trước 2.2 Cây phân loại hồi quy (CART) Cây phân loại hồi quy phương pháp định để xây dựng phân loại hồi quy theo loại biến phụ thuộc nó, vừa theo kiểu phân loại kiểu số [14] Với trường dự đốn sử dụng nhiều lần cấp khác Phương pháp định vượt trội mơ hình kỹ thuật khác áp dụng vấn đề có tính logic cao [8] Tùy thuộc vào trường mục tiêu, ba biện pháp đo lường sử dụng để xác định vị trí phân chia cho mơ hình phân loại hồi quy Chẳng hạn như, biến Gini thường dùng cho trường mục tiêu tượng trưng phương pháp độ lệch bình phương nhỏ tự động chọn mục tiêu liên tục mà không giải thích chúng Chỉ số Gini g(t) nút t mơ hình định, xác định theo phương trình sau: g(t) = p( j|t)p(i|t) j i i j loại trường mục tiêu p( j|t) = p( j, t) ; p(t) p( jt) = π( j)N j (t) ; Nj p(t) = p( j, t) j p( j) giá trị xác suất trước cho loại j; N j (t) số lượng mẫu loại j nút t, N j số lượng mẫu loại j nút gốc Khi số Gini sử dụng để cải thiện sau trình phân tách trình phát triển, mẫu nút nút gốc với giá trị hợp lệ cho dự đốn phân tách sử dụng để tính N j (t) N j 37 Học, T Đ., Tài, L T / Tạp chí Khoa học Cơng nghệ Xây dựng 2.3 Tự động phát tương tác Chi-squared (CHAID) Kỹ thuật tự động phát tương tác Chi-squared để phân loại liệu phát triển Kass [15] Nó kiểm tra tính độc lập cách sử dụng kiểm định Chi-square để đánh giá việc tách nút có cải thiện độ liệu đáng kể hay khơng Cụ thể, dự đốn có liên kết mạng (theo giá trị p-value) với biến trả lời nút sử dụng làm nút chia Nếu dự đốn kiểm định cho thấy khơng có cải thiện đáng kể mặt thống kê khơng có phân tách thực thuật toán dừng lại Tự động phát tương tác Chi-squared toàn diện phát triển để giải hạn chế CHAID [16] Tuy nhiên, kỹ thuật CHAID tồn diện khơng tối ưu hóa phân tách cho biến dự báo dừng việc hợp biến phân loại xác định tất biến phân loại lại khác đáng kể Kỹ thuật CHAID tồn diện tránh việc mơ hình phù hợp với định phát triển đầy đủ vào liệu để huấn luyện cách liên tục hợp dự đoán phân loại hai biến phân loại tốt Sau đó, xác định dự đốn chuỗi phép hợp tính giá trị p-value điều chỉnh cho biến phân loại giúp mang lại liên kết tốt với biến mục tiêu Do đó, CHAID tồn diện tìm phân tách tốt cho dự đoán chọn dự đoán để phân tách dựa giá trị p-value điều chỉnh 2.4 Hồi quy tuyến tính (LR) Mơ hình hồi quy tuyến tính đa biến (LR) phần mở rộng hồi quy đơn giản, xác định mối quan hệ hai nhiều biến [17] Cơng thức chung mơ hình là: n Y = β0 + βi X i + ε i=1 mơ hình đề xuất, Y mức tiêu thụ lượng hộ chung cư; β0 số; βi hệ số hồi quy (i = 1, 2, , n); ε sai số, Xi đại diện cho nhân tố cụ thể Mơ hình hồi quy tuyến tính áp dụng bốn phương pháp hồi quy tuyến tính đa biến cách sử dụng bình phương cực tiểu: stepwise, forward backward 2.5 Mơ hình tuyến tính tổng qt (GENLIN) Mơ hình tuyến tính tổng quát phát triển Nelder Wedderburn [18] Mơ hình phân tích phân phối xác suất khác (ví dụ phân phối chuẩn, nhị thức, Poison gamma) cho biến phụ thuộc sử dụng hàm liên kết làm mơ hình tính tốn để xác định mối quan hệ yếu tố dự báo tuyến tính hàm phân phối trung bình Mơ hình tuyến tính tổng qt linh hoạt có mối quan hệ thực tế so với hồi quy đơn Mẫu phân phối giả định điểm liệu mối quan hệ X Y xác định theo phương trình sau: η = g(E(Y)) = Xi βi + O, Y ∼ F η dự đốn tuyến tính, O biến bù, Xi biến độc lập, βi hệ số độ dốc F phân phối Y Ba thành phần mơ hình tuyến tính tổng qt bao gồm biến kết Y với phân phối ngẫu nhiên cụ thể giá trị kỳ vọng µ phương sai σ2 (E(Y) = µ) Một hàm liên kết g(.) kết nối giá trị kỳ vọng (µ) Y để biến đổi giá trị dự đoán η[η = g(µ)]; mơ hình cấu trúc tuyến tính 38 Học, T Đ., Tài, L T / Tạp chí Khoa học Công nghệ Xây dựng 2.6 Máy hỗ trợ véc tơ (SVM) Vapnik [19] người giới thiệu máy hỗ trợ véc tơ Các máy hỗ trợ véc tơ tạo hàm ánh xạ đầu vào – đầu từ tập liệu Hàm giải vấn đề phân loại lẫn hồi quy Thơng thường, mơ hình hồi quy sử dụng hồi quy hỗ trợ véc tơ epsilon [20] để tìm hàm f (x) có độ lệch ε tối đa thu thập từ liệu đầu yi Trong máy hỗ trợ véc tơ hồi quy, đầu vào ánh xạ vào vùng đặc tính không gian n chiều cách sử dụng hàm phi tuyến sau: f (x, ω) = ω, x + b ω χ, b χ với Chất lượng hàm f (x) ước tính dựa tổn thất hàm L(x) sau: Lε = [y, f (x, ω)] = |y − f (x, ω)| |y − f (x, ω)| ≤ ε khác Đặc tính hỗ trợ véc tơ hồi quy sử dụng tổn thất khơng nhạy cảm ε để tính tốn hàm hồi quy tuyến tính cho khơng gian đặc tính cao đồng thời giảm độ phức tạp mơ hình cách giảm thiểu ||ω||2 Hàm đưa cách lấy tổng không âm hàm ξi ξi ∗, i = 1, , n sử dụng để xác định mẫu huấn luyện từ vùng không nhạy cảm ε Do đó, hỗ trợ véc tơ hồi quy coi phiên thu nhỏ hàm sau: ω n +C ξi + ξi∗ với i=1   yi − f (xi , ω) ≤ ε + ξi∗    f (xi , ω) − yi ≤ ε + ξi∗     ξ , ξ∗ ≥ 0, i = 1, , n i i số C ≥ xác định cân độ phẳng f (x, ω) dung sai cho độ lệch lớn so với ε 2.7 Các mơ hình kết hợp Các mơ hình xếp hạng dựa vào q trình dự đốn sau mơ hình có tỷ lệ dự đốn tốt kết hợp lại tạo thành mơ hình kết hợp Phương pháp kết hợp thể phép toán g : Rd → R với biến dự đoán X biến phản hồi Y Mỗi phương pháp sử dụng thuật toán xác định để đưa hàm ước tính g(.) Ước tính hàm kết hợp gen (.) tạo cách kết hợp tuyến tính hàm riêng lẻ sau: n gen (.) = c j ∗ g(.) j=1 c j chứa hệ số kết hợp tuyến tính, giá trị trung bình trọng số khác Nhìn chung, phương pháp mơ hình kết hợp ước tính xác so với mơ hình riêng lẻ thông thường [21, 22] Các nghiên cứu thường áp dụng thuật toán xác thực chéo k lần để giảm thiểu sai số liên quan đến lấy mẫu ngẫu nhiên việc huấn luyện Kohavi [23] xác nhận thử nghiệm 10 lần đem lại thời gian tính tốn phương sai tối ưu Phương pháp phân chia tập mẫu liệu thành 10 tập con, tiến hành xây dựng xác thực mơ hình 10 lần, chọn tập liệu khác để kiểm tra, huấn luyện mơ hình tập liệu sử dụng tập cịn lại để kiểm tra tính xác mơ hình minh họa Hình Độ xác mơ hình tính độ xác trung bình 10 mơ hình 10 lần xác thực 39 để giảm thiểu sai số liên quan đến lấy mẫu ngẫu nhiên việc huấn luyện Kohavi xác nhận thử nghiệm 10 lần đem lại thời gian tính tốn phương sai tối ưu [23] Phương pháp phân chia tập mẫu liệu thành 10 tập con, tiến hành xây dựng xác thực mô hình 10 lần, chọn tập liệu khác để kiểm tra, huấn luyện mơ hình tập liệu sử dụng tập lại để kiểm tra tính xác mơ hình minh họa hình Độ xác Đ., độ Tài,chính L T.xác / Tạp chí bình Khoacủa học10 Cơng nghệtrong Xây dựng mơ hình đượcHọc, tính T trung mơ hình 10 lần xác thực Thử nghiệm tập 1 Thử nghiệm tập 2 Thử nghiệm tập 3 Thử nghiệm tập 4 Thử nghiệm tập Thử nghiệm tập 5 1 2 10 8 10 10 Thử nghiệm tập 10 Thử nghiệm tập Thử nghiệm tập Thử nghiệm tập 10 10 10 10 10 10 10 Hình Phương pháp xác thực chéo 10 lần Hình Phương pháp xác thực chéo 10 lần 1.1 Phương pháp đánh giá hiệu suất Để đánh giá độ xác q trình dự đốn mơ hình đơn lẻ mơ hình kết 2.8 Phương pháp đánh giá pháp hiệusau suất hợp, phương sử dụng: • Phần trăm sai số trung bình tuyệt đối mơ hình đơn lẻ mơ hình kết hợp, Để đánh giá độ xác q trình dự đốn 𝑦 − 𝑦′ phương pháp sau sử dụng: 𝑀𝐴𝑃𝐸 = & w w 𝑛 𝑦 - Phần trăm sai số trung bình tuyệt đối CMN • Sai số trung bình tuyệt đối n y4 − y MAPE 𝑀𝐴𝐸 = = &|𝑦 − 𝑦′| n i=1𝑛 y CMN • Sai số tồn phương trung bình - Sai số trung bình tuyệt đối n 1 MAE𝑅𝑀𝑆𝐸 = = { y&(𝑦 − y | − 𝑦)k n i=1 𝑛 CMN - Sai số tồn phương trung bình RMSE = n n (y − y)2 i=1 Ta sử dụng số tổng hợp (SI) thông qua ba phương pháp thống kê MAPE, MAE, RMSE với công thức sau: m Pi − Pmin,i SI = m i=1 Pmax,i − Pmin,i m số phương pháp đánh giá; Pi hiệu suất thứ i Giá trị SI từ đến 1; SI gần độ xác mơ hình cao Thiết lập thực nghệm 3.1 Mô tả chuẩn bị liệu Dữ liệu khảo sát bảng câu hỏi đưa đến hộ gia đình Bảng câu hỏi bao gồm nhân tố ảnh hưởng đến nhu cầu sử dụng điện hộ chung cư biến 40 Học, T Đ., Tài, L T / Tạp chí Khoa học Cơng nghệ Xây dựng đầu vào liệu thể Bảng Bộ liệu gồm có 200 mẫu khảo sát nhiều chung cư Thành phố Hồ Chí Minh Trung bình mức tiêu thụ lượng theo tháng thu thập từ tháng 10 năm 2018 đến tháng năm 2019 Các chung cư khảo sát nằm quận khác địa bàn Thành phố Hồ Chí Minh để đảm bảo tính bao phủ vị trí Đồng thời, chung cư có mức độ tiện nghi từ trung bình cao cấp Các tịa nhà hồn thành từ năm 2015 với 90% cư dân sinh sống Đối với hộ chung cư, liệu thu thập từ hộ gia đình có người sinh sống Trong tầng tiến hành khảo sát hộ chung cư vị trí đặc điểm khác biệt (vị trí giữa/góc, hướng hộ, số phịng ngủ, ) để đảm bảo tính đa dạng đối tượng khảo sát [24] Bảng Mô tả liệu Tên nhân tố Tên biến Đơn vị Loại Tổng diện tích X1 m2 Range Tổng số lượng cửa sổ X2 Cái Range Hướng cửa sổ X3 Set Loại kính cửa số cách nhiệt X Có/khơng Flag thỏa mãn mức độ hoạt động độ xác Số lượng máy điều hịa X5 Cái Range Hình minh họa bước dùng mơ hình để dự đốn mức độ tiêu thụ lượng thơng Số lượng lò nướng X6 Cái Range qua phần mềm SPSS IBM [8] Kích cỡ tủ•lạnh X Lít Range dựa thuật toán xác thực chéo Bước 1: Nhập liệu đầu vào nút nguồn Tổng số người sinh sống X8 tạo liệu Người Range • Bước 2: Sử dụng nút dự đoán số để đào Mật độ tịa• nhà X [1,5] Range Bước 3: Sử dụng mơ hình đơn để kiểm tra liệu Mức tiêu thụ lượng Y kWh Range • Bước 4: Kết hợp mơ hình thơng qua nút kết hợp • Bước 5: Đánh giá kết phân tích thơng qua bảng kết Các yếu tố đầu vào Xác thực chéo Dữ liệu Mạng nơ ron Cây phân loại & hồi quy Tự động phát & tương tác Phương pháp dự đốn Hồi quy tuyến Hồi quy tuyến tính tính tổng quát Mạng nơ ron Cây phân loại & hồi quy Tự động phát & tương tác Hồi quy tuyến tính Hồi quy tuyến tính tổng quát Máy hỗ trợ vectơ Máy hỗ trợ vectơ Mơ hình kết hợp Kết phân tích Kết dạng bảng Hình Cấu trúc mơ hình ước tính mức tiêu thụ lượng tịa nhà chung cư Hình Cấu trúc mơ hình ước tính mức tiêu thụ lượng tòa nhà chung cư Kết thực nghiệm Phần đưa kết phân tích so sánh 41hiệu suất mơ hình kết hợp với sáu mơ hình dự đốn đơn đề xuất hệ số tổng hợp SI Từ kết xếp hạng hiệu suất ta kết hợp mơ hình đơn với nhằm tăng hiệu dự đoán Học, T Đ., Tài, L T / Tạp chí Khoa học Cơng nghệ Xây dựng 3.2 Cấu trúc mơ hình Các tham số mơ hình đặt mặc định trình so sánh thử nghiệm kỹ thuật khai phá liệu nhằm đảm bảo cho mơ hình hoạt động cách khách quan, dễ dàng thỏa mãn mức độ hoạt động độ xác Hình minh họa bước dùng mơ hình để dự đốn mức độ tiêu thụ lượng thông qua phần mềm SPSS IBM [8] - Bước 1: Nhập liệu đầu vào nút nguồn dựa thuật toán xác thực chéo - Bước 2: Sử dụng nút dự đoán số để đào tạo liệu - Bước 3: Sử dụng mô hình đơn để kiểm tra liệu - Bước 4: Kết hợp mơ hình thơng qua nút kết hợp - Bước 5: Đánh giá kết phân tích thơng qua bảng kết Kết thực nghiệm Phần đưa kết phân tích so sánh hiệu suất mơ hình kết hợp với sáu mơ hình dự đoán đơn đề xuất hệ số tổng hợp SI Từ kết xếp hạng hiệu suất ta kết hợp mơ hình đơn với nhằm tăng hiệu dự đoán Bảng thể hiện kết hiệu suất mơ hình bao gồm ANNs, CART, CHAID, LR, GENLIN SVM Trong đó, mơ hình có hiệu suất tốt q trình dự đốn CART với số tổng hợp SI 0,0 Tiếp sau mơ hình GENLIN có hiệu suất tương đối tốt với số tổng hợp SI 0,131 Xếp vị trí thứ ba thứ tư hai mơ hình CHAID (SI = 0,243) LR (SI = 0,353) Hai mơ hình dự đốn ANNs (SI = 0,51) SVM (SI = 1,00) có hiệu suất thấp Bảng Tổng hợp kết thử nghiệm mơ hình đơn Model MAPE (%) MAE (kWh) RMSE (kWh) SI ANNs CART CHAID LR GENLIN SVM 28,822 6,289 14,106 19,078 11,112 44,193 55,917 11,833 30,306 40,813 23,589 83,235 68,414 22,959 45,592 50,706 31,647 108,369 0,510 (5) 0,000 (1) 0,243 (3) 0,353 (4) 0,131 (2) 1,000 (6) Tiếp theo ta tiến hành kết hợp mơ hình có hiệu suất tốt với nhằm tăng hiệu q trình dự đốn Ta sử dụng mơ hình kết hợp sau: - Mơ hình kết hợp mơ hình đơn tốt nhất: CART + GENLIN + CHAID + LR + ANNs - Mơ hình kết hợp mơ hình đơn tốt nhất: CART + GENLIN + CHAID + LR - Mơ hình kết hợp mơ hình đơn tốt nhất: CART + GENLIN + CHAID - Mơ hình kết hợp mơ hình đơn tốt nhất: CART + GENLIN Sau kết hợp mô hình với ta có hiệu suất mơ hình Bảng Mơ hình kết hợp có hiệu suất tốt bao gồm ba mơ hình (CART + GENLIN) với hệ số tổng hợp SI có Tiếp mơ hình kết hợp gồm (CART + GENLIN + CHAID) có hệ số tổng hợp SI = 0,562 mơ hình kết hợp có hiệu suất tốt thứ Hai mơ hình kết hợp cịn lại (CART + GENLIN + CHAID + LR) (CART + GENLIN + CHAID + LR + ANNs) có hiệu suất thấp 42 Học, T Đ., Tài, L T / Tạp chí Khoa học Cơng nghệ Xây dựng Bảng Tổng hợp kết thử nghiệm mơ hình tổng hợp Model MAPE (%) MAE (kWh) RMSE (kWh) SI Kết hợp mơ hình tốt 12,314 25,002 30,825 1,000 (4) Kết hợp mơ hình tốt 9,135 19,437 25,553 0,754 (3) Kết hợp mơ hình tốt 7,078 14,934 20,591 0,562 (2) Kếtchỉ hợp mơ hình tốt 1,146 2,497 5,187 0,000 số thống kê tốt hẳn so với mơ hình đơn phần trăm sai số trung bình tuyệt đối (1) MAPE MAPE (%)(%) số thống kê 1,146%, tốt hẳn so trung với mơtuyệt hìnhđối đơn(MAE) phần trămkWh sai sốvàtrung đối (MAPE) có sai số bình 2,497 sai sốbình tồntuyệt phương (MAPE) có 1,146%, sai số trung bình tuyệt đối (MAE) 2,497 kWh sai số tồn phương trung bìnhchỉ (RMSE) 5,187 kWh Hình 4-6 thể số thống kê nêu mục 2.8 nhằm đánh giá hiệu mô hình trung bình (RMSE) 5,187 kWh thu CHAID, thông quaLR, phương pháp k-fold kết cáchhợp lấycủa trung bìnhhình tốt dự đốn Các bao kết gồmquả ANNs, CART, GENLIN, SVM (k=10), mơ hình mơ Các kết thu thông qua phương pháp k-fold (k=10), cách lấy trung bình (CART + GENLIN) Mơ hìnhNhìn kết hợp (Ensemble) thống kêmơ tốt hình tốt hẳnnhất so với 10 lần chạy kiểm nghiệm vào hình đếncó6,các mơchỉ hìnhsốkết hợp củađơn 10này lần chạy Nhìn hình đến mơ hình kết hợp mơ hình tốt mơ phầnkiểm trămnghiệm sai số bình tuyệt (MAPE) 1,146%, saidự số đốn trung bình tuyệt Điều chứng minh mơtrung hìnhvào kết hợp đối mơ hình6,phù hợpcó cholàviệc mức đối (MAE) 2,497 kWh sai số toàn phương trung bình (RMSE) 5,187 kWh Điều chứng minh mơ hình kết hợp mơ hình phù hợp cho việc dự đoán mức tiêu thụ lượng tiêu thụ lượng 50 45 50 40 45 35 40 30 35 25 30 20 25 15 20 10 15 10 05 44.193 44.193 28.822 28.822 6.289 6.289 14.106 14.106 19.078 19.078 11.112 11.112 1.146 1.146 ANNs CART CHAID LR GENLIN SVM Tổng hợp ANNs CART CHAID LR GENLIN SVM Ensemble Hình sai số số trung trungbình bìnhtuyệt tuyệtđối đối(MAPE) (MAPE)của củacác cácmơmơ hình Hình4.4:Biểu Biểuđồ đồ phần phần trăm trăm sai hình Hình 4: Biểu đồ phần trăm sai số trung bình tuyệt đối (MAPE) mơ hình MAE (kWh) MAE (kWh) 100 100 83.235 83.235 80 80 60 60 55.917 55.917 40 40 30.306 30.306 20 20 0 40.183 40.183 11.833 11.833 23.589 23.589 2.497 2.497 ANNs CART CHAID LR GENLIN SVM Ensemble ANNs CART CHAID LR GENLIN SVM Tổng hợp Hình 5: Biểu đồ sai số trung bình tuyệt đối (MAE) mơ hình Hình bình tuyệt tuyệtđối đối(MAE) (MAE)của củacác cácmơ mơhình hình Hình5.5:Biểu Biểuđồ đồ sai sai số số trung bình Các kết thu thơng qua phương pháp k-fold (k = 10), cách lấy trung bình 10 lần chạy kiểm nghiệm Từ Hình 4-6 ta thấy mơ hình kết hợp mơ hình tốt Điều chứng minh mơ hình kết hợp mơ hình phù hợp cho việc dự đoán mức tiêu thụ lượng 43 11 11 Học, T Đ., Tài, L T / Tạp chí Khoa học Công nghệ Xây dựng 120 108.369 SMSE (kWh) 100 80 68.414 60 45.592 50.706 40 31.647 22.959 20 5.187 ANNs CART CHAID LR GENLIN SVM Tổng hợp Hình trung bình bình(RMSE) (RMSE)của củacác cácmơ mơhình hình Hình6.6:Biểu Biểuđồ đồsai saisố số toàn toàn phương trung Kết luận Kết luận Bài viết trình bày đề xuất mơ hình dựa vào thuật tốn trí tuệ nhân tạo bao gồm thần kinh – Artificial mạng Bàimạng báo nơ-ron trình bày đề (ANNs xuất mơ hình newron dựa vàonetwork), thuật tốnmáy hỗ trí trợ tuệ vectơ nhân (SVMs), tạo bao gồm phân loại hồi quy (CART), hồi quy tuyến tính (LR), hồi quy tuyến tính tổng quát nơ-ron thần kinh (ANNs – Artificial neural network), máy hỗ trợ véc tơ (SVMs), phân loại tự động phát (CHAID) được(GENLIN), sử dụng chương hồi quy(GENLIN), (CART), hồi quy tuyến tínhtương (LR), tác hồiChi-squared quy tuyến tính tổng quát tự động phát trìnhChi-squared SPSS IBM nhằm áp dụngsửtrong dựchương đốn mức tiêuSPSS thụ áp tòadụng nhà tương tác (CHAID) dụngviệc trình lượng IBM nhằm việc dựchung đốncư mức tịatục nhàxây chung cáctổng mơ hình đơn tiếp Từtiêu cácthụ mơnăng hình lượng đơn lẻ đó, tiếp dựngcư mơTừ hình hợp để tốilẻưuđó, hóa dựtục xây dựng mơ hình tổng hợp tối ưuđiểm hóa dự đốn, phụclẻ.các điểm đốn, khắc phục cácđểnhược nhữngkhắc mơ hình Dữnhược liệu sửcủa dụngnhững mơ việchình dự riêng lẻ Dữ đoán liệu sử dụng trongsátviệc dự đoán bao 200Hồ khảo nhiều chung cư toán TP bao gồm 200 khảo nhiều chung cưgồm TP Chí sát Minh Áp dụng thuật xácHồ Chí Minh thực Đồngchéo thời, cứu áp sai dụng thuật tốntrình xáchuấn thực luyện chéo mơ 10 lần 10nghiên lần để giảm thiểu số hình.để giảm thiểu sai số q trình huấn luyện mơ hình Nghiên cứu mơ hình đơn có hiệu tốt q trình dự đốn mức Nghiên cứu mơ hình đơn có hiệu tốt q trình dự đốn mức độ tiêu độ tiêu thụ lượng mơ hình phân loại hồi quy (CART) với số thống kê tốt thụ lượng mơ hình phân loại hồi quy (CART) với số thống kê tốt hẳn so với hẳn so với mô hình đơn khác, đồng thời có hệ số tổng hợp SI tốt mơ mơ hình đơn khác, đồng thời có hệ số tổng hợp SI tốt mơ hình đề xuất (SI = 0) Mơ hìnhhợp đề 0) Mơ hình tổng hợp có hiệu mơ hình hình tổng có xuất hiệu(SI suất= tốt mơ hình tổngsuất hợptốt mơ hình đơn baotổng gồm:hợp CART + mơ hình đơn bao gồm: CART + GENLIN (SI = 0) GENLIN (SI = 0) Lời cảm ơn Lời cảm ơn tác giả chân thành cảm ơn hỗ trợ tài Quỹ Phát triển khoa học cơng nghệ Nhóm Quốc gia (NAFOSTED) cho đề tài mã số 102.05-2018.07 Nghiên cứu tài trợ Quỹ Phát triển khoa học công nghệ Quốc gia (NAFOSTED) đề mãtham số 102.05-2018.07 Tàitàiliệu khảo Mitterer, C., et al., Optimizing energy efficiency and occupant comfort with climate specific design of the building 2012 Tài liệu khảo E.o., VietNam energy outlook report 2017: VietNam tham Denmark, Davis, E and G Heidorn, An algorithm for optimal project scheduling under multiple resources [1] Mitterer,constraints C., Kăunzel, H M., Herkel, Holm, (2012) Optimizing energy efficiency and occupant Management Science,S., 1971 21: p.A.B803-B816 comfort with climate specific design of the building Frontiers of Architectural Research, 1(3):229–235 [2] Denmark, E., Trade, M (2017) Vietnam energy outlook report Bộ Công Thương, Việt Nam 12 for optimal project scheduling under multiple resource [3] Davis, E W., Heidorn, G E (1971) An algorithm constraints Management Science, 17(12):B803–B816 [4] Trung, N T., Toi, P V (2018) Nghiên cứu, đề xuất suất tiêu thụ điện cho văn phịng làm việc: Ap dụng tính tốn cho văn phịng làm việc Hà Nội Tạp chí Khoa học Công nghệ Xây dựng (KHCNXD)ĐHXD, 12(2):59–64 [5] Pérez-Lombard, L., Ortiz, J., Pout, C (2008) A review on buildings energy consumption information Energy and Buildings, 40(3):394–398 44 Học, T Đ., Tài, L T / Tạp chí Khoa học Cơng nghệ Xây dựng [6] Zhao, H.-x., Magoulès, F (2012) A review on the prediction of building energy consumption Renewable and Sustainable Energy Reviews, 16(6):3586–3592 [7] Lượng, N Đ., Nga, T T V., Hiệp, N H., Giang, H M., Minh, N B (2018) Ứng dụng BIM để mô lượng nhiệt xạ mặt trời tác động lên tòa nhà văn phịng thành phố Hà Nội Tạp chí Khoa học Công nghệ Xây dựng (KHCNXD)-ĐHXD, 12(1):83–88 [8] IBM (2010) PASW Modeler IBM Cororation, USA [9] Nilsson, N J (1965) Learning machines: Foundations of trainable pattern classifying systems McGrawHill, New York [10] Liao, S.-H., Chu, P.-H., Hsiao, P.-Y (2012) Data mining techniques and applications–A decade review from 2000 to 2011 Expert Systems with Applications, 39(12):11303–11311 [11] Li, K., Su, H., Chu, J (2011) Forecasting building energy consumption using neural networks and hybrid neuro-fuzzy system: A comparative study Energy and Buildings, 43(10):2893–2899 [12] Tso, G K F., Yau, K K W (2007) Predicting electricity energy consumption: A comparison of regression analysis, decision tree and neural networks Energy, 32(9):1761–1768 [13] Ekici, B B., Aksoy, U T (2009) Prediction of building energy consumption by using artificial neural networks Advances in Engineering Software, 40(5):356–362 [14] Breiman, L (2017) Classification and regression trees Routledge [15] Kass, G V (1980) An exploratory technique for investigating large quantities of categorical data Journal of the Royal Statistical Society: Series C (Applied Statistics), 29(2):119–127 [16] Biggs, D., De Ville, B., Suen, E (1991) A method of choosing multiway partitions for classification and decision trees Journal of Applied Statistics, 18(1):49–62 [17] Neter, J., Wasserman, W., Kutner, M H (1986) Applied linear statistical models Journal of the American Statistical Association, 81 [18] Nelder, J A., Wedderburn, R W M (1972) Generalized linear models Journal of the Royal Statistical Society: Series A (General), 135(3):370–384 [19] Vapnik, V (1995) The nature of statistical learning theory Springer-Verlag, New York [20] Clementine, S P S S (2007) 12.0 Algorithm Guide Integral Solutions Limited, Chicago, USA [21] Adeodato, P J L., Arnaud, A L., Vasconcelos, G C., Cunha, R C L V., Monteiro, D S M P (2011) MLP ensembles improve long term prediction accuracy over single networks International Journal of Forecasting, 27(3):661–671 [22] Van Wezel, M., Potharst, R (2007) Improved customer choice predictions using ensemble methods European Journal of Operational Research, 181(1):436–452 [23] Kohavi, R (1995) A study of cross-validation and bootstrap for accuracy estimation and model selection International Joint Conference on Articial Intelligence (IJCAI), Montreal, Canada, 14(2):1137–1145 [24] Học, T Đ., Hậu, Đ T., Tài, L T (2019) Các nhân tố ảnh hưởng đến khả tiêu thụ điện hộ chung cư Tạp chí Xây dựng, 9:31–35 45 ... để ước lượng mức tiêu thụ lượng tịa nhà Mơ hình tổng hợp sử dụng thuật toán logic chéo k-fold liệu thu thập từ trước Các mô hình ước tính phương pháp đánh giá Mục tiêu liệu cóliệu bằngbằng cách... phân tích Kết dạng bảng Hình Cấu trúc mơ hình ước tính mức tiêu thụ lượng tịa nhà chung cư Hình Cấu trúc mơ hình ước tính mức tiêu thụ lượng tịa nhà chung cư Kết thực nghiệm Phần đưa kết phân... mơ hình ước tính mức tiêu thụ lượng tòa nhà chung cư 2.1 Mạng thần kinh nhân tạo (ANNs) 36 Mơ hình mạng thần kinh nhân tạo công cụ mạnh mẽ để giải vấn đề phức tạp Mạng thần kinh xử lý nhân tố

Ngày đăng: 02/03/2020, 17:45

Từ khóa liên quan

Mục lục

  • 1 Giới thiệu

  • 2 Các mô hình ước tính và phương pháp đánh giá

    • 2.1 Mạng thần kinh nhân tạo (ANNs)

    • 2.2 Cây phân loại và hồi quy (CART)

    • 2.3 Tự động phát hiện tương tác Chi-squared (CHAID)

    • 2.4 Hồi quy tuyến tính (LR)

    • 2.5 Mô hình tuyến tính tổng quát (GENLIN)

    • 2.6 Máy hỗ trợ véc tơ (SVM)

    • 2.7 Các mô hình kết hợp

    • 2.8 Phương pháp đánh giá hiệu suất

    • 3 Thiết lập thực nghệm

      • 3.1 Mô tả và chuẩn bị dữ liệu

      • 3.2 Cấu trúc mô hình

      • 4 Kết quả thực nghiệm

      • 5 Kết luận

Tài liệu cùng người dùng

Tài liệu liên quan