Ứng dụng thuật toán “rừng ngẫu nhiên” cho phân tích hồi qui khả năng chịu tải của khung thép phi tuyến

11 27 0
Ứng dụng thuật toán “rừng ngẫu nhiên” cho phân tích hồi qui khả năng chịu tải của khung thép phi tuyến

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Trong bài viết này, tác giả giới thiệu một phương pháp dựa trên thuật toán “rừng ngẫu nhiên” để phân tích hồi quy khả năng chịu tải của khung thép. Phân tích trực tiếp được sử dụng để xác định khả năng chịu tải của khung thép. Các thông số đầu vào của mô hình là các đặc trưng về tiết diện của phần tử khung và đặc tính vật liệu.

Tạp chí Khoa học Cơng nghệ Xây dựng, NUCE 2021 15 (2V): 110–120 ỨNG DỤNG THUẬT TOÁN “RỪNG NGẪU NHIÊN” CHO PHÂN TÍCH HỒI QUI KHẢ NĂNG CHỊU TẢI CỦA KHUNG THÉP PHI TUYẾN Hà Mạnh Hùnga,∗ a Khoa Xây dựng dân dụng Công nghiệp, Trường Đại học Xây dựng, 55 đường Giải Phóng, quận Hai Bà Trưng, Hà Nội, Việt Nam Nhận ngày 11/04/2021, Sửa xong 06/05/2021, Chấp nhận đăng 07/05/2021 Tóm tắt Các tốn thiết kế cơng trình phức tạp thiết kế tối ưu hay tính tốn độ tin cậy tiêu tốn thời gian lớn đặc biệt trường hợp sử dụng phân tích phi tuyến Vấn đề giải cách sử dụng mơ hình dự báo sử dụng thuật toán máy học nhằm dự đốn ứng xử cơng trình Thuật tốn “rừng ngẫu nhiên” xem thuật toán máy học tốt nhờ ứng dụng hiệu nhiều lĩnh vực nghiên cứu tốn phân tích hồi qui phân loại Trong báo này, tác giả giới thiệu phương pháp dựa thuật toán “rừng ngẫu nhiên” để phân tích hồi quy khả chịu tải khung thép Phân tích trực tiếp sử dụng để xác định khả chịu tải khung thép Các thơng số đầu vào mơ hình đặc trưng tiết diện phần tử khung đặc tính vật liệu Một khung thép khơng gian tầng sử dụng làm ví dụ để đánh giá hiệu mơ hình Kết thu cho thấy, số lượng định nên sử dụng ≥ 100; Đối với toán hồi quy, định nên phân chia đến độ sâu tối đa; Và, độ xác mơ hình tăng lên số lượng mẫu huấn luyện tăng lên cần xem xét dựa tương quan mang lại mặt kết thời gian tính tốn Từ khố: rừng ngẫu nhiên; máy học; phân tích trực tiếp; khung thép; phi tuyến RANDOM FOREST-BASED METHOD FOR REGRESSION OF LOAD-CARRYING CAPACITY OF NONLINEAR STEEL FRAMES Abstract Complex structural design problems such as optimal design or reliability calculation take excessive computational efforts, especially in the case of using nonlinear analyzes This problem can be solved by using metamodels such as using machine learning algorithms to predict building responses The random forest has been considered as one of the most robust Machine Learning techniques since it has been successfully applied for both regression and classification problems in many fields In this paper, we develop a random forest-based method for regression and classification of the load-carrying capacity of steel frames Direct analysis is used to estimate the load-carrying capacity of this frame The input variables are the information of cross-sections of structural members and material A six-story space frame is studied to demonstrate the efficiency of the proposed method The obtained results show that the number of decision-making trees should be greater than 100; For regression problems, decision trees should be divided up to maximum depth; And, the accuracy of the model increases when the number of trained samples increases but it should be considered based on the correlation between the results in terms of efficiency and calculation time Keywords: random forest; machine learning; direct analysis; steel frame; nonlinear https://doi.org/10.31814/stce.nuce2021-15(2V)-09 © 2021 Trường Đại học Xây dựng (NUCE) ∗ Tác giả đại diện Địa e-mail: hunghm@nuce.edu.vn (Hùng, H M.) 110 Hùng, H M / Tạp chí Khoa học Cơng nghệ Xây dựng Giới thiệu Phân tích kết cấu cơng trình đòi hỏi phản ánh sát ứng xử thực tế cơng trình tốt Chính vậy, phương pháp phân tích đại dựa phân tích trực tiếp ngày sử dụng rộng rãi, đặc biệt kết cấu thép [1, 2] Phân tích trực tiếp chấp nhận phiên tiêu chuẩn AISC LRFD [3] Ưu điểm phương pháp phân tích trực tiếp chúng có khả mơ tả ứng xử hệ thống kết cấu cơng trình chịu tải trọng, đặc biệt thay đổi cơng trình tải trọng thay đổi Qua đó, khả chịu tải tồn hệ thống cơng trình xác định Tính an tồn cơng trình đánh giá cách đơn giản thông qua việc so sánh khả chịu tải cơng trình khơng nhỏ áp lực tải trọng gây [1, 2] Tuy nhiên, phân tích trực tiếp thường tốn thời gian Do vậy, ứng dụng chúng hạn chế, đặc biệt tốn địi hỏi phải có nhiều lần phân tích kết cấu tốn tối ưu hay tính tốn độ tin cậy cơng trình [4–6] Để giảm bớt số lượng phân tích kết cấu tốn này, cách tiếp cận gần sử dụng mơ hình thuật toán máy học (Machine learning) (ML) thu hút quan tâm nghiên cứu thời gian gần [7, 8] Nói cách tổng qt, thuật tốn ML trang bị cho máy tính khả tự động hiểu, phân tích, xử lý học hỏi từ thơng tin/dữ liệu đầu vào từ để thực nhiệm vụ giao Dựa đặc điểm này, thuật tốn máy học sử dụng để huấn luyện máy tính có khả ước lượng ứng xử kết cấu cơng trình dựa thơng tin đầu vào kết cấu ví dụ như: kích thước, đặc điểm vật liệu, đặc điểm tải trọng, v.v Một số nghiên cứu bật việc ứng dụng thuật toán ML vào đánh giá ứng xử kết cấu kể đến sau Vũ cs [9] ứng dụng thuật toán Gradient Tree Boosting (GTB) để ước lượng khả chịu tải cọc ống thép nhồi bê tông (CFST) Hùng cs [10] trình bày xử lý tượng khớp mơ hình học sâu (Deep Learning) (DL) cho giàn thép phi tuyến Ứng dụng thuật toán ML để tính độ tin cậy cơng trình nhiều nhà khoa học quan tâm nghiên cứu như: Yang Hsieh [11] sử dụng Support Vector Machine (SVM), Chen cs [12] sử dụng Kriging, Gholizadeh [13] sử dụng mạng nơ-ron lan truyền ngược (back-propagation neural network), v.v Bên cạnh đó, việc đánh giá/nhận diện hư hỏng cơng trình thuật tốn ML thu áp dụng ngày nhiều Ví dụ Oh cs [14] sử dụng Bayesian để phân loại trạng thái hư hỏng cơng trình chịu động đất Hasni cs [15] sử dụng SVM để theo dõi sức khỏe cơng trình thép Trong việc ứng dụng thuật tốn ML vào tốn thiết kế cơng trình, hiệu phụ thuộc nhiều yếu tố, có yếu tố cần lưu ý sau Thứ nhất, khơng có thuật tốn xem vượt trội mà tùy thuộc vào lớp toán hay cụ thể đặc điểm toán thiết kế Do vậy, nghiên cứu ứng dụng thuật tốn ML ln cần thiết nhằm tối ưu hóa cơng việc Thứ hai, tính hiệu thuật tốn ML ảnh hưởng nhiều việc lựa chọn giá trị tham số hệ thống mà số lượng tham số hệ thống thuật toán lại nhiều Cho nên, lớp toán cụ thể, cần thực phân tích, đánh giá nhằm tìm cách sử dụng tham số hiệu cho mơ hình huấn luyện Dựa quan điểm đó, báo này, tác giả trình bày chi tiết cách xây dựng mơ hình huấn luyện cho toán ước lượng khả chịu tải khung thép phi tuyến sử dụng thuật toán rừng ngẫu nhiên (Random Forest) (RF) Thuật toán rừng ngẫu nhiên lựa chọn dựa hiệu quả, mạnh mẽ việc giải tốn phân tích hồi qui phân loại [16, 17] Thêm vào đó, chưa có nghiên cứu cụ thể trình bày áp dụng thuật toán vào toán ước lượng khả chịu tải khung thép phi tuyến Một khung thép không gian tầng sử dụng để minh họa cho cách thiết lập mơ hình huấn luyện sử dụng RF Ảnh hưởng tham số hệ thống RF đến hiệu mơ hình tiến hành phân tích nhằm đưa đề xuất lựa chọn giá trị tham số 111 Hùng, H M / Tạp chí Khoa học Cơng nghệ Xây dựng hợp lý Thuật toán rừng ngẫu nhiên RF giới thiệu lần Breiman vào năm 2001 [18] Nó phương pháp phân loại hồi quy theo phương thức học có kiểm sốt, bao gồm kết hợp nhiều dự báo/cây định Mỗi định tạo dựa tập mẫu huấn luyện ngẫu nhiên tạo từ tập mẫu huấn luyện ban đầu với độ lớn theo ngun tắc lấy mẫu có hồn lại (phương pháp Bootstrap) nghĩa mẫu lấy nhiều lần Các định dựa tập mẫu vừa tạo với nguyên tắc sử dụng số lượng biến đầu vào nút phân chia Kết cuối giá trị trung bình kết thu từ tất định Bằng cách sử dụng thật nhiều Tạp chí họclượng Cơng nghệ Xâyhình dựng,sẽNUCE2020 2615-9058; e-ISSN 2734-9489 định, saiKhoa số ước mô giảmp-ISSN đáng kể Ngun lý thuật tốn tóm tắt Hình 106 107 Hình1.1.Thuật Thuật tốn tốn rừng Hình rừngngẫu ngẫunhiên nhiên 108 Trong Trong cácbáo báo nhận sốvìcụkỹthể thay loại kỹ (ra tốnbài hồitốn quy,hồi quy, dự dự nhận cácsẽgiá trị số cụgiá thể trị thay thuật phân 109quyếtthuật (ra thiết quyếtkếđịnh) [19] thiếtcủa kế phâncho tíchphép định)phân [19].loại Trong Trong định phâncây tíchrahồi quy,định 110phát hồi câytối chodữphép sâu tiến tối đa củagiản liệu luyện mà Đây triểnquy, đến độ sâu đa liệu phát huấntriển luyệnđến mà độ không hành lược huấn lại (ngắt cành) ưu điểm thuật tốn việc thực giản lược yếu tố 111 không tiến hành giản lược lại (ngắt cành) Đây ưu điểm thuậtchính đếnbởi hiệuvìsuất mơ hình [20] Breiman cũngyếu chotốrằng khiảnh số lượng câyđến tăng lên, sai 112ảnh hưởng toán việccủa thực giản lược cây[19] hưởng hiệu số tổng quát hội tụ không giản lược cây, việc xử lý tượng mơ hình q khớp 113 suất mơ hình [20] Breiman [19] cho số lượng tăng lên, sai số thực dựa nguyên tắc luật số lớn (Strong Law of Large Numbers) [21] Số lượng biến 114đượctổng quát(N) lược định cây, xử lýcây mơ hình sử dụng tạihội mỗitụnút để tạokhi không câygiản việc số lượng tượng định (k) 115sử dụng quálàkhớp hiệndùng dựalựa nguyên tắc luật số lớn (Strong Law of Large hai tham số thực người chọn trước [19] 116 Dựa Numbers) [21] lượng sửradụng số nútquan để tạo câyảnh hưởng đến trình bàySốtrên đây, biến rút được(N) cáctại thơng trọng hiệu suất mơ hình rừng ngẫu nhiên là: (1) số lượng định sử dụng; (2) 117 định số lượng định (k) sử dụng hai tham số người dùng kỹ lựathuật dụng[19] hay không sử dụng kỹ thuật bootstrap); (3) số lượng biến sử dụng nút; 118lấy mẫu chọn(sửtrước (4) đặc điểm tập liệu bao gồm thông số đầu vào thơng số đầu mơ hình 119 Dựa trình bày đây, rút thơng số quan trọng 120 ảnh hưởng đến hiệu suất mơ hình rừng ngẫu nhiên là: (1) số lượng định 121 sử dụng; (2) kỹ thuật lấy mẫu (sử dụng hay không sử dụng kỹ thuật bootstrap); 112 122 (3) số lượng biến sử dụng nút; (4) đặc điểm tập liệu bao gồm thông 123 số đầu vào thơng số đầu mơ hình 124 Xây dựng thuật toán sử dụng rừng ngẫu nhiên để ước lượng khả chịu tải Hùng, H M / Tạp chí Khoa học Cơng nghệ Xây dựng Xây dựng thuật toán sử dụng rừng ngẫu nhiên để ước lượng khả chịu tải khung thép 3.1 Khả chịu tải khung thép Trong phương pháp phân tích trực tiếp, an tồn kết cấu đánh giá thông qua việc so sánh khả chịu tải toàn hệ thống với tải trọng tác dụng lên cơng trình Nếu khả chịu tải lớn tải trọng tác dụng ta có cơng trình an tồn, ngược lại cơng trình an tồn Để chuẩn hóa tính chất này, thay sử dụng khái niệm khả chịu tải kết cấu, sử dụng thơng số “hệ số khả chịu tải kết cấu” (LF) định nghĩa tỉ lệ khả chịu tải cơng trình (R) hiệu ứng tải trọng gây (S): R (1) S Lúc kết cấu xem an toàn LF ≥ ngược lại Trong nghiên cứu này, LF khung thép tính tốn dựa phân tích phi tuyến tính phi đàn hồi trình bày tài liệu [1] LF = 3.2 Xây dựng tập liệu huấn luyện Xây dựng tập liệu bước quan trọng cho việc xây dựng mơ hình huấn chí Khoa học Cơng Xây dựng, p-ISSN 2615-9058; luyện Để việc nắm bắtTạpcách thức xâynghệdựng dữNUCE2020 liệu cho toáne-ISSN ước 2734-9489 lượng khả chịu tải 148 149 150 151 152 153 Hình Khung thép khơng gian tầng Hình Khung thép khơng gian tầng Một tập liệu gồm 20000 liệu tạo cách tổ hợp ngẫu nhiên tiết diện dầm cột khác Phần mềm phân tích phi tuyến PAAP [1] sử dụng 113 để tạo mẫu Với thông số tiết diện dầm cột, phần mềm phân tích kết cấu phi tuyến tính phi đàn hồi thực để thu LF tương ứng Hình thể Tạp chí Khoa học Công nghệ Xây dựng, NUCE2020 p-ISSN 2615-9058; e-ISSN 2734-9489 phân bố giá trị LF 20000 liệu tạo Dựa vào hình thấy, LF khung nằm chủ yếu khoảng giá trị từ (0.5 – 4.0) Tỉ lệ LF < chiếm khoảng 29% Hùng, H.số M.đầu / Tạp học Công Xây dựng số đầu vào mô LF lựa chọn 156 thơng rachí củaKhoa mơ hình huấnnghệ luyện Thơng 157 hình đặc trưng tiết diện dầm cột Đối với toán khung, nhiều đặc khung thép, ví dụ khung thép khơng gian tầng Hình sử dụng để minh họa 158 trưng tiết diện ảnh hưởng đến ứng xử kết cấu Do vậy, để độ xác trực tiếp Trong khung, dầm cột chia thành 13 nhóm tiết diện khác Hình 159 mơ hình cao, nhiều đặc tính tiết diện xét đến mơ hình Các cột thiết kế sử dụng tiết diện W12 W14, dầm thiết kế sử dụng tiết diện W10, 160 huấn luyện tốt Trong nghiên cứu này, 16 loại đặc tính tiết diện trình bày W12, W14 W16 Vật liệu thép A992 với mô-đun đàn hồi 200 (Gpa) cường độ chảy 161 Bảng sử dụng biến đầu vào mơ hình chúng có ảnh hưởng lớn 345 (Mpa) Tải trọng gió tác dụng theo phương Y nút khung có giá trị 20 kN Tải trọng thẳng 162 chương trình phân tích phi tuyến tính phi đàn hồi sử dụng Với 13 nhóm tiết đứng phân bố dầm 5,5 kN/m 163 diện khung, có tổng cộng 208 biến đầu vào 154 155 164 165 166 10 11 12 13 14 15 16 Hình Phân bố giá trị LF tập liệu Hình Phân bố giá trị LF tập liệu Bảng Đặc trưng hình học tiết diện xem xét biến đầu vào Đặc trưng tiết diện Bảng 1.1Đặc trưng học Hệhình số cong vênhtiết diện xem xét biến đầu vào Bán kính hồi chuyển trục yếu Mô men tĩnh trục y trưng tiết diện Đặc Mô men tĩnh trục z Hệ số xoắnHệ số cong vênh Mô men quán đốihồi vớichuyển trục y trục yếu Bántính kính Mơ men qn tính trụcvới z trục y Mô men tĩnh đối Diện tích tiết diện Mơ men tĩnh trục z Diện tích miền cắt để tính cắt dọc theo trục y Hệ số 10 Diện tích miền cắtxoắn để tính cắt dọc theo trục z Mơtính men qn tínhtrục đốiyvới trục y 11 Mơ men qn dẻo 12 Mơ men qn dẻo Mơtính men quán tínhtrục đốizvới trục z 13 Chiều cao tiết diện Diện tích tiết diện 14 Chiều rộngDiện cánh tích miền cắt để tính cắt dọc theo trục y 15 Chiều dày cánh Diện 16 Chiều dày vách tích miền cắt để tính cắt dọc theo trục z Mơ men qn tính dẻo trục y Mơ men quán tính dẻo trục z Chiều cao tiết diện Chiều rộng cánh Chiều dày cánh Chiều dày vách Một tập liệu gồm 20000 liệu tạo cách tổ hợp ngẫu nhiên tiết diện dầm cột khác Phần mềm phân tích phi tuyến PAAP [1] sử dụng để tạo mẫu Với thông số tiết diện dầm cột, phần mềm phân tích kết cấu phi tuyến tính phi đàn hồi thực để thu LF tương ứng Hình thể phân bố giá trị LF 20000 liệu tạo Dựa vào 114 Hùng, H M / Tạp chí Khoa học Cơng nghệ Xây dựng hình thấy, LF khung nằm chủ yếu khoảng giá trị từ (0,5 – 4,0) Tỉ lệ LF < chiếm khoảng 29% LF lựa chọn thông số đầu mơ hình huấn luyện Thơng số đầu vào mơ hình đặc trưng tiết diện dầm cột Đối với toán khung, nhiều đặc trưng tiết diện ảnh hưởng đến ứng xử kết cấu Do vậy, để độ xác mơ hình cao, nhiều đặc tính tiết diện xét đến mơ hình huấn luyện tốt Trong nghiên cứu này, 16 loại đặc tính tiết diện trình bày Bảng sử dụng biến đầu vào mơ hình chúng có ảnh hưởng lớn chương trình phân tích phi tuyến tính phi đàn hồi sử dụng Với 13 nhóm tiết diện khung, có tổng cộng 208 biến đầu vào 3.3 Xây dựng mơ hình huấn luyện Trình tự bước xây dựng mơ hình huấn luyện sử dụng thuật tốn rừng ngẫu nhiên sau: Bước 1: Xây dựng toán Trong bước cần xây dựng tập liệu, xác định biến đầu vào biến đầu mơ hình huấn luyện Đây nội dung trình bày chi tiết phần 3.2 Bước 2: Phân chia tập liệu chuẩn hóa liệu Tập liệu ban đầu phân chia thành tập riêng biệt: (1) tập huấn luyện sử dụng cho q trình huấn luyện mơ hình (2) tập kiểm tra sử dụng để đánh giá hiệu mơ hình Đối với tập liệu có giá trị thơng số đầu vào khác nhiều, liệu thường chuẩn hóa cách đưa khoảng [0, 1] nhằm việc huấn luyện đạt hiệu cao Cơng thức để chuẩn hóa sử dụng sau: xi = xi [xi ] (2) [xi ] giá trị lớn biến đầu vào xi Bước 3: Xây dựng mơ hình huấn luyện Một số tham số mơ sau: - Hàm mát (loss function): Hàm mát hiểu hàm mục tiêu tối thiểu hóa q trình huấn luyện mơ hình Đối với tốn phân tích hồi quy, dạng hàm mát thường dùng: “sai số tồn phương trung bình” (mean-squared-error) (MSE), “sai số tuyệt đối trung bình” (mean-absolute-error) (MAE) Trong nghiên cứu này, hàm MSE sử dụng - Số lượng định (n_estimators): tham số có ảnh hưởng lớn đến độ xác cùa mơ hình Vai trị định trình bày phân tích phần - Kỹ thuật lấy mẫu: có kỹ thuật là: (1) lấy mẫu có hồn lại (phương pháp Bootstrap) (2) toàn mẫu sử dụng để xây dựng định Bước 4: Huấn luyện mơ hình Đây dạng huấn luyện có kiểm sốt tập huấn luyện Hiệu suất mơ hình đánh giá dựa vào tập kiểm tra Mơ hình thu được sử dụng để ước lượng hệ số khả chịu tải khung thép Kết Trong phần này, đánh giá ảnh hưởng thơng số mơ hình đến hiệu suất làm việc mơ hình rừng ngẫu nhiên Từ đó, khuyến nghị đưa nhà nhằm giúp người đọc lựa chọn hiệu áp dụng thuật tốn vào cơng việc Ngơn ngữ lập trình Python thư viện Sklearn sử dụng để mơ hình hóa mơ hình huấn luyện rừng ngẫu nhiên 115 Tạp chí Khoa học Cơng nghệ Xây dựng, NUCE2020 p-ISSN nghệ 2615-9058; Hùng, H M / Tạp chí Khoa học Công Xâye-ISSN dựng2734-9489 4.1 Ảnh hưởng số lượng định 200 dụng để mơ hình hóa mơ hình huấn luyện rừng ngẫu nhiên Trong phân đầu vềcủa ảnh hưởng số định lượng định đến mơ hình huấn luyện 201tích4.1 Ảnhtiên hưởng số lượng câycủa rừng ngẫu nhiên, đầu liệutiêncho tậphưởng huấncủaluyện tậprakiểm tra đến 202 số lượng Trongmẫu phân tích ảnh số lượng định mơ lấy 5000, kỹ huấnlấy luyệnmẫu rừng có ngẫuhồn nhiên, lại số lượng liệu cho tập huấnsố luyện tậpcây kiểmra định thuật lấy mẫu 203 kỹhình thuật (sử mẫu dụng bootstrap), lượng 204 1000 tra lấy thuậtđược lấy mẫu kỹ thuật mẫu có lại (sử thay đổi từ đến Dạng hàm5000, mấtkỹmát sửlàdụng lấy MSE Đểhoàn giảm ảnhdụng hưởng tính ngẫu 205 bootstrap), số lượng định thay đổi từ đến 1000 Dạng hàm mát nhiên đến kết tính tốn, tương ứng với trường hợp chương trình chạy độc lập 10 lần Kết 206 sử dụng MSE Để giảm ảnh hưởng tính ngẫu nhiên đến kết tính tốn, tính tốn thể Hìnhhợp chương Ta cótrình thể thấychạy sốlần lượng định tăng lên, 207 tương ứng với trường độckhi lập 10 Kết tínhra tốn giá trị hàm mát tập huấn luyện tập kiểm tra giảm đi, tức mơ hình 208 thể Hình Ta thấy số lượng định tăng lên, huấn luyện 209 giácây trị hàm mát tập huấnsử luyện tập giảm đi, tứcmất mơ hình tốt lên Khi số lượng định dụng ≥kiểm 100,tragiá trị hàm máthuấn tập liệu hầu 210 luyện tốt lên Khi số lượng định sử dụng ≥ 100, giá trị hàm không thay đổi (đã hội tụ) Do vậy, số lượng định nên sử dụng với giá trị 211 mát tập liệu không thay đổi (đã hội tụ) Do vậy, số lượng đủ lớn khuyến ≥ nên 100 212 nghị quyếtlà định sử dụng với giá trị đủ lớn khuyến nghị ≥ 100 213 214 Hình Ảnh hưởng số định đến hiệu suất mơ hình huấn luyện Hình Ảnh hưởng số định đến hiệu suất mơ hình huấn luyện 215 Để làm rõ hiệu thuật toán RF, Hình trình bày so sánh giá trị hàm 216 mát thuật toán RF với thuật toán khác thuật toán định (DT) Để làm rõ 217 hiệu thuật tốn RF, Hình trình bày so sánh giá trị hàm mát thuật thuật toán SVM Lưu ý kết trình bày hình cho tập kiểm tra với số toán RF với 2218 thuậtlượng toánmẫu khác ralàquyết định tập thuật tronglà tậpthuật kiểm tratoán cố định 5000 Số lượng(DT) mẫu huấntoán luyện SVM Lưu ý 219 thay 500 đến thấy thuật toán RF giá trịtra cố định kết trình bày hìnhđổilàtừcho tập20000 kiểmmẫu traKết vớiquảsốcho lượng mẫu tậpchokiểm mát luyện nhiều so vớithay DT vàđổi SVM nghĩa RF hiệuKết quả cho thấy 5000 Số lượng220mẫuhàm tậpthấp huấn từ Điều 500này đếncó20000 mẫu 221 mạnh trường hợp nghiên cứu thuật toán RF choTạp giáchítrị hàm mát thấp nhiều so với DT SVM Điều có nghĩa Khoa học Công nghệ Xây dựng, NUCE2020 p-ISSN 2615-9058; e-ISSN 2734-9489 RF hiệu mạnh trường hợp nghiên cứu 222 223 Hình So sánh hiệu thuật tốn máy học Hình So sánh hiệu thuật toán máy học 224 4.2 Ảnh hưởng kỹ thuật lấy mẫu 225 226 227 228 229 Hình phần 4.1 thể kết kỹ thuật lấy mẫu có hồn lại đến 116 hiệu suất mơ hình Để đánh giá kỹ hơn, tiếp tục xem xét ảnh hưởng kỹ thuật lấy mẫu thông thường (không sử dụng bootstrap) đến hiệu suất mơ hình huấn luyện Điều có nghĩa tất liệu sử dụng định Kết tính tốn thể Hình Ta thấy giá trị hàm mát 222 223 Hùng, H M / Tạp chí Khoa học Cơng nghệ Xây dựng Hình So sánh hiệu thuật toán máy học 4.2 Ảnh hưởng củaẢnh kỹ hưởng thuật lấy kỹ mẫu 224 4.2 thuật lấy mẫu Hình4.1 cũngkết thể kết kỹ thuật mẫucó cóhồn hồn lại Hình 4225 phần cũngphần thể4.1 củaquả kỹcủa thuật lấy lấy mẫu lạiđến đến hiệu suất 226 hiệu suất mơ hình Để đánh giá kỹ hơn, tiếp tục xem xét ảnh hưởng kỹ mơ hình Để đánh giá kỹ hơn, tiếp tục xem xét ảnh hưởng kỹ thuật lấy mẫu thông thường lấy mẫu thông thường (không sử dụng bootstrap) đến hiệu suất mơ hình huấn (khơng sử 227 dụng thuật bootstrap) đến hiệu suất mơ hình huấn luyện Điều có nghĩa tất liệu 228 luyện Điều có nghĩa tất liệu sử dụng định sử dụng định Kết tính tốn thể Hình Ta thấy 229 Kết tính tốn thể Hình Ta thấy giá trị hàm mát giá trị hàm230 mátcảcủa tập huấn luyện kiểm thay đổirakhi sốđịnh lượng tập huấn luyện tập kiểmvà tra tập không thaytra đổi không số lượng định tăng lên, tương ứng 4,15E-05 2,5E-03 Đồng thời, giá trị hàm mát 231 tăng lên, tương ứng 4.15E-05 2.5E-03 Đồng thời, giá trị hàm mát đối vớiđối với tập kiểm tra trường hợp sử tra dụng thuật thông thường kémthường với sử dụng kỹ 232 tập kiểm trongkỹ trường hợplấy sử mẫu dụng kỹ thuật lấy mẫu thông kémnhiều rấtso nhiều 233 cósohồn với khilại sử dụng kỹ thuậtbày lấy mẫu có hồn lại4được trình1,1E-03) bày Hình (bằng thuật lấy mẫu trình Hình (bằng Điều 1.1Ecó nghĩa kỹ thuật có sử nghĩa kỹtrong thuật lấy mẫutốn có hồn lại nhiên nên sử dụng thuật lấy mẫu có234 hồn03) lại Điều nên dụng thuật ngẫu 235 toán ngẫu nhiên Tạp chí Khoa học Cơng nghệ Xây dựng, NUCE2020 p-ISSN 2615-9058; e-ISSN 2734-9489 238 4.3 Ảnh hưởng số thông số khác 239 Bên cạnh tham số quan trọng ảnh hưởng đến hiệu suất mơ hình rừng ngẫu 236 240 nhiên trình bày trên, số tham số khác cần quan tâm là:mơ (1) hình số lượng tối 237 Hình Ảnh hưởng số định đến hiệu suất huấnmẫu luyện 241 1hưởng nút, (2)của số lượng mẫu thiểuđịnh (3)suất số lượng biếnhình đầu vào lớnluyện Hìnhthiểu Ảnh số tối đếnláhiệu mô huấn 242 cho phép sử dụng định Ảnh hưởng tham số 10 243 trình bày Hình 7, Hình cho thấy quy định số lượng 244 mẫu tối thiểu nút tăng lên, độ xác mơ hình bị giảm tập 4.3 Ảnh hưởng số thông số khác 245 huấn luyện tập kiểm tra Do vậy, tốn phân tích hồi quy, quyếtsố định nên xâyảnh dựnghưởng với độ sâu đa liệu rừng cách khác nhiên trình Bên cạnh2462 tham quan trọng đếntốihiệu suất củaHay mơnói hình ngẫu 247 số lượng mẫu tối thiểu nút Hình cho thấy việc giới bày trên, số tham số khác cần quan tâm là: (1) số lượng mẫu tối thiểu nút, (2) số lượng 248 lượng biến đầu vào cho phép sử dụng định không ảnh hưởng mẫu tối thiểu hạn mộtsốlá (3) số lượng biến đầu vào lớn cho phép sử dụng 249 lớn đến hiệu suất toán hồi quy Điều có nghĩa người dùng sử dụng định Ảnh hưởng tham sốđanày bàyýtrong 7, bé) 9.nhiên, Hình cho thấy 250 số lượng biến đầu vào tối cho câytrình tùy ý (lưu khơng Hình q Tuy quy251 địnhdựa sốtrên lượng tốisuất thiểu hình nút sẽvàtăng tăng lên, xác Hìnhmẫu 9, hiệu mô lên chútđộ (không đáng kể)của mô số hình bị giảm 252 lượng biến đầu vào tối đa cho bé tổng số lượng biến đầu vào liệu 253 254 Ảnh hưởng số lượng mẫu tối thiểu nút đến hiệu suất mơ hình Hình Ảnh Hình hưởng số lượng mẫu tối thiểu nút đến hiệu suất mơ hình huấn luyện 255 huấn luyện 117 Tạp chí Khoa học Cơng nghệ Xây dựng, NUCE2020 p-ISSN 2615-9058; e-ISSN 2734-9489 Tạp chí Khoa học Cơng nghệ Xây dựng, NUCE2020 p-ISSN 2615-9058; e-ISSN 2734-9489 Hùng, H M / Tạp chí Khoa học Cơng nghệ Xây dựng 256256 Hình Ảnh hưởngcủa củasốsốlượng lượngmẫu mẫu tối tối thiểu thiểu 257257 Hình 8 Ảnh hưởng láláđến đếnhiệu hiệusuất suấtcủa củamơ mơhình hình 258 huấn luyện Hình 258 Ảnh hưởng số lượng mẫu tối thiểu đến hiệu suất mơ hình huấn luyện huấn luyện 259 259260 Hình Hình Ảnh hưởng số lượng mẫu tối thiểu đến hiệu suất mơ hình 260 Hình Ảnh số lượng tối thiểu đến hiệu suấtcủa mơ mơ hình 261 huấn luyện Ảnh hưởng củahưởng số lượng mẫu tốimẫu thiểu đến hiệu suất hình 261 huấn luyện 262 4.4 Ảnh hưởng độ lớn liệu huấn luyện huấn luyện 262263 4.4 ẢnhDựa hưởng củaphân độ lớn liệu tíchdữ trên, đểhuấn đánh luyện giá ảnh hưởng độ lớn liệu huấn luyện tập huấn luyện vàcác tậpphân kiểm tra vậy, với toán phân tích hồi quy, mơ hình, phần Do tham số mô lựa sau:huấn số lượng 263264 đếnDựa tích trên, để đánh giáđối ảnhhình hưởng độchọn lớn liệu luyện rahình, địnhvới =phần 100, kỹsâu thuật lấy đa mẫu có hồn lại (sử dụng bootstrap), lượng định nên xây dựng độnày dữhình liệu Hay nói cách khác số lượng mẫu 264265 đếncây mô cáctối tham sốcủa mô lựa chọn nhưsốsau: số mẫu lượng 266lá tốira1 thiểu nút = 2, số mẫu tối thiểu thấy một(sử = vàbootstrap), số lượng biến đầu số vào câylà định = 100, kỹ lượng thuật mẫu có hồn lại dụng sốhạn lượng mẫu tối thiểu 265 vàtạitại nút 2.lấy Hình cho việc giới lượng biến đầu vào 267 tốilớn cho phép sử số dụng định = 1sốvàlượng biến đầu vào Số 266 thiểu nút = 2, lượng mẫu tối thiểu = số lượng biến đầu vào cho phép sử dụng định không ảnh hưởng lớn đến hiệu suất toán hồi quy 267 lớn cho phép sử dụng định = số lượng biến đầu vào Số Điều có nghĩa người dùng sử dụng số lượng biến đầu vào tối đa cho tùy ý (lưu ý 12 khơng q bé) Tuy nhiên, dựa Hình 9, hiệu suất mơ hình tăng lên chút (không đáng kể) số lượng biến đầu vào tối đa cho mỗi12cây bé tổng số lượng biến đầu vào liệu 4.4 Ảnh hưởng độ lớn liệu huấn luyện Dựa phân tích trên, để đánh giá ảnh hưởng độ lớn liệu huấn luyện đến mơ hình, phần tham số mơ hình lựa chọn sau: số lượng định = 100, kỹ thuật lấy mẫu có hồn lại (sử dụng bootstrap), số lượng mẫu tối thiểu nút = 2, số lượng mẫu tối thiểu = số lượng biến đầu vào lớn cho phép sử dụng định = số lượng biến đầu vào Số lượng mẫu liệu tập kiểm tra 5000, tập huấn luyện thay đổi từ 1000 đến 20000 Mỗi trường hợp chương trình chạy độc lập 10 lần Kết trình bày Hình 10 Có thể nhận số lượng mẫu tập huấn luyện tăng lên độ xác mơ hình tập kiểm tra tăng lên MSE tương ứng với số lượng mẫu 5000 = 1,13E-03 44,8% so với MSE 500 mẫu ( = 2,52E-03) 168% so với MSE 20000 mẫu (= 6,72E-04) Rõ ràng yếu tố số lượng mẫu mang tính định đến độ xác mơ hình 118 lượng mẫu liệu tập kiểm tra 5000, tập huấn luyện thay đổi từ 1000 đến 20000 Mỗi trường hợp chương trình chạy độc lập 10 lần Kết trình bày Hình 10 Có thể nhận số lượng mẫu tập huấn luyện tăng lên độ xác mơ hình tập kiểm tra tăng lên MSE tương ứng với số lượng H M / Tạp chí so Khoa nghệ Xây 272 mẫu 5000 =Hùng, 1.13E-03 44.8% với học MSECông 500 mẫu ( =dựng 2.52E-03) 273 168% so với MSE 20000 mẫu ( = 6.72E-04) Rõ ràng yếu tố số lượng mẫu mang huấn luyện Tuy việc sốcủa lượng mẫu sẽluyện làmTuy tăng thờiviệc gian tính tốn, đặc biệt 274 nhiên, tính địnhlựa nhấtchọn đến độnhiều xác mơ hình huấn nhiên, lựa chọn thời gian tạo275 dữnhiều liệusốđối vớimẫu cácsẽbài sử dụng phân philàtuyến tính lượng làmtốn tăng thời gian tính tốn,tích đặc biệt thời gian tạo phi dữđàn liệu hồi 276 đối toán sử dụngthời phângian tích phi đàn hồi (giờ), báo này.còn 20000 mẫu báo Cụ thể, vớicác 5000 mẫu tạotuyến dự tính liệuphihuấn luyện 8,3 277vậy, Cụsự thể, đốichọn với 5000 mẫu mẫu thời gian tạo luyện dự liệu huấn luyện 8.3 (giờ), 33,3 (giờ) Do lựa số lượng huấn cần phải xemcòn xét20000 dựa mối quan hệ 278 mẫu 33.3 (giờ) Do vậy, lựa chọn số lượng mẫu huấn luyện cần phải xem xét hiệu mơ hình thời gian tính tốn 279 dựa mối quan hệ hiệu mô hình thời gian tính tốn 268 269 270 271 280 281 Hình 10 Ảnh hưởng số lượng mẫu tập huấn luyện đến hiệu suất mơ hình huấn luyện Hình 10 Ảnh hưởng số lượng mẫu tập huấn luyện đến hiệu suất mơ hình huấn luyện 282 283 Kết luận Bài báo giới thiệu chi tiết chương trình ước lượng khả chịu tải khung thép phi tuyến sử dụng thuật tốn rừng ngẫu nhiên Thơng số đầu vào mơ 286 hình huấn luyện tiết diện dầm cột với 16 đặc trưng hình học cho loại Bài báo giới thiệu chi số tiết trìnhchịu ước khảđược khung thép phi 287 tiết diện Thông đầumột chương hệ số khả tải lượng kết cấu xác chịu định sửtải dụng tuyến sử dụng toán ngẫu nhiên số đầu vào hình 288thuật phân tích rừng trực tiếp phi tuyến tínhThơng phi đàn hồi Một khung thépmô không gianhuấn tầngluyện với tiết diện 289 với 20816 biến đầutrưng vào sử học dụng cho để đánh hiệu tiết mơThơng hình huấn dầm cột đặc hình mỗigiáloại diện sốluyện đầu Ảnh hệ số khả 290 hưởng thông số quan trọng mơ số lượng định, kỹ hồi Một khung chịu tải kết cấu xác định sử dụng phân tích trực tiếp phi tuyến tính phi đàn 291 thuật lấy mẫu, số lượng mẫu tối thiểu nút lá, số lượng biến đầu vào lớn thép không gian tầng với 208 biến đầu vào sử dụng để đánh giá hiệu mơ hình huấn 292 cho phép sử dụng định số lượng mẫu tập huấn luyện 284 Kết luận 285 luyện Ảnh hưởng thông số quan trọng mơ số lượng định, kỹ thuật lấy mẫu, số lượng mẫu tối thiểu nút lá,13số lượng biến đầu vào lớn cho phép sử dụng định số lượng mẫu tập huấn luyện đến mơ hình huấn luyện phân tích, đánh giá Kết thu cho thấy, số lượng định nên sử dụng ≥ 100; Đối với toán hồi quy, định nên phân chia đến độ sâu tối đa; độ xác mơ hình tăng lên số lượng mẫu huấn luyện tăng lên cần xem xét dựa tương quan hiệu mang lại mặt kết thời gian tính tốn Tài liệu tham khảo [1] Thai, H.-T., Kim, S.-E (2011) Nonlinear inelastic analysis of space frames Journal of Constructional Steel Research, 67(4):585–592 [2] Kim, S.-E., Choi, S.-H (2001) Practical advanced analysis for semi-rigid space frames International Journal of Solids and Structures, 38(50-51):9111–9131 [3] ANSI/AISC 360-10 (2010) Specification for structural steel buildings Chicago (IL): American Institute of Steel Construction [4] Ha, M.-H., Vu, Q.-V., Truong, V.-H (2020) Optimization of nonlinear inelastic steel frames considering panel zones Advances in Engineering Software, 142:102771 [5] Ha, M.-H., Vu, Q.-A., Truong, V.-H (2018) Optimum Design of Stay Cables of Steel Cable-stayed Bridges Using Nonlinear Inelastic Analysis and Genetic Algorithm Structures, 16:288–302 119 Hùng, H M / Tạp chí Khoa học Công nghệ Xây dựng [6] Kim, S.-E., Truong, V.-H (2020) Reliability Evaluation of Semirigid Steel Frames Using Advanced Analysis Journal of Structural Engineering, 146(5):04020064 [7] Hung, T V., Viet, V Q., Thuat, D V (2019) A deep learning-based procedure for estimation of ultimate load carrying of steel trusses using advanced analysis Journal of Science and Technology in Civil Engineering (STCE) - NUCE, 13(3):113–123 [8] Truong, V.-H., Vu, Q.-V., Thai, H.-T., Ha, M.-H (2020) A robust method for safety evaluation of steel trusses using Gradient Tree Boosting algorithm Advances in Engineering Software, 147:102825 [9] Vu, Q.-V., Truong, V.-H., Thai, H.-T (2021) Machine learning-based prediction of CFST columns using gradient tree boosting algorithm Composite Structures, 259:113505 [10] Hùng, H M., Hùng, T V., Thuật, Đ V., Việt, V Q (2020) Phương pháp xử lý tượng mơ hình q khớp xây dựng mơ hình học sâu để ước lượng khả chịu tải giàn phi tuyến Tạp chí Khoa học Công nghệ Xây dựng (KHCNXD)-ĐHXD, 14(1V):12–20 [11] Yang, I.-T., Hsieh, Y.-H (2012) Reliability-based design optimization with cooperation between support vector machine and particle swarm optimization Engineering with Computers, 29(2):151–163 [12] Chen, W., Xu, C., Shi, Y., Ma, J., Lu, S (2019) A hybrid Kriging-based reliability method for small failure probabilities Reliability Engineering & System Safety, 189:31–41 [13] Gholizadeh, S (2015) Performance-based optimum seismic design of steel structures by a modified firefly algorithm and a new neural network Advances in Engineering Software, 81:50–65 [14] Oh, C K., Beck, J L., Yamada, M (2008) Bayesian Learning Using Automatic Relevance Determination Prior with an Application to Earthquake Early Warning Journal of Engineering Mechanics, 134(12): 1013–1020 [15] Hasni, H., Alavi, A H., Lajnef, N., Abdelbarr, M., Masri, S F., Chakrabartty, S (2017) Self-powered piezo-floating-gate sensors for health monitoring of steel plates Engineering Structures, 148:584–601 [16] Liaw, A., Wiener, M (2002) Classification and regression by randomForest R news, 2(3):18–22 [17] Hapfelmeier, A., Ulm, K (2013) A new variable selection approach using Random Forests Computational Statistics & Data Analysis, 60:50–69 [18] Breiman, L (2001) Random forests Machine Learning, 45(1):5–32 [19] Breiman, L (1999) Random forests-random features Technical Report 567, Statistics Department University of California, Berkeley [20] Pal, M., Mather, P M (2003) An assessment of the effectiveness of decision tree methods for land cover classification Remote Sensing of Environment, 86(4):554–565 [21] Feller, W (1968) An introduction to probability theory and its applications, volume 3rd edition, John Wiley & Sons 120 ... luyện cho toán ước lượng khả chịu tải khung thép phi tuyến sử dụng thuật toán rừng ngẫu nhiên (Random Forest) (RF) Thuật toán rừng ngẫu nhiên lựa chọn dựa hiệu quả, mạnh mẽ việc giải tốn phân tích. .. tích hồi qui phân loại [16, 17] Thêm vào đó, chưa có nghiên cứu cụ thể trình bày áp dụng thuật toán vào toán ước lượng khả chịu tải khung thép phi tuyến Một khung thép không gian tầng sử dụng. .. tiết trìnhchịu ước khả? ?ược khung thép phi 287 tiết diện Thông đầumột chương hệ số khả tải lượng kết cấu xác chịu định s? ?tải dụng tuyến sử dụng toán ngẫu nhiên số đầu vào hình 28 8thuật phân tích rừng

Ngày đăng: 10/06/2021, 10:18

Mục lục

  • 1 Giới thiệu

  • 2 Thuật toán rừng ngẫu nhiên

  • 3 Xây dựng thuật toán sử dụng rừng ngẫu nhiên để ước lượng khả năng chịu tải của khung thép

    • 3.1 Khả năng chịu tải của khung thép

    • 3.2 Xây dựng tập dữ liệu huấn luyện

    • 3.3 Xây dựng mô hình huấn luyện

    • 4 Kết quả

      • 4.1 Ảnh hưởng của số lượng cây ra quyết định

      • 4.2 Ảnh hưởng của kỹ thuật lấy mẫu

      • 4.3 Ảnh hưởng của một số thông số khác

      • 4.4 Ảnh hưởng của độ lớn dữ liệu huấn luyện

      • 5 Kết luận

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan