BCKH Ứng dụng thuật toán “rừng ngẫu nhiên” cho phân tích hồi qui khả năng chịu tải của khung thép phi tuyến

11 16 0
BCKH Ứng dụng thuật toán “rừng ngẫu nhiên” cho phân tích hồi qui khả năng chịu tải của khung thép phi tuyến

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tạp chí Khoa học Cơng nghệ Xây dựng, NUCE 2021 15 (2V): 110–120 ỨNG DỤNG THUẬT TOÁN “RỪNG NGẪU NHIÊN” CHO PHÂN TÍCH HỒI QUI KHẢ NĂNG CHỊU TẢI CỦA KHUNG THÉP PHI TUYẾN Hà Mạnh Hùnga,∗ a Khoa Xây dựng dân dụng Công nghiệp, Trường Đại học Xây dựng, 55 đường Giải Phóng, quận Hai Bà Trưng, Hà Nội, Việt Nam Nhận ngày 11/04/2021, Sửa xong 06/05/2021, Chấp nhận đăng 07/05/2021 Tóm tắt Các tốn thiết kế cơng trình phức tạp thiết kế tối ưu hay tính tốn độ tin cậy tiêu tốn thời gian lớn đặc biệt trường hợp sử dụng phân tích phi tuyến Vấn đề giải cách sử dụng mơ hình dự báo sử dụng thuật toán máy học nhằm dự đốn ứng xử cơng trình Thuật tốn “rừng ngẫu nhiên” xem thuật toán máy học tốt nhờ ứng dụng hiệu nhiều lĩnh vực nghiên cứu tốn phân tích hồi qui phân loại Trong báo này, tác giả giới thiệu phương pháp dựa thuật toán “rừng ngẫu nhiên” để phân tích hồi quy khả chịu tải khung thép Phân tích trực tiếp sử dụng để xác định khả chịu tải khung thép Các thơng số đầu vào mơ hình đặc trưng tiết diện phần tử khung đặc tính vật liệu Một khung thép khơng gian tầng sử dụng làm ví dụ để đánh giá hiệu mơ hình Kết thu cho thấy, số lượng định nên sử dụng ≥ 100; Đối với toán hồi quy, định nên phân chia đến độ sâu tối đa; Và, độ xác mơ hình tăng lên số lượng mẫu huấn luyện tăng lên cần xem xét dựa tương quan mang lại mặt kết thời gian tính tốn Từ khố: rừng ngẫu nhiên; máy học; phân tích trực tiếp; khung thép; phi tuyến RANDOM FOREST-BASED METHOD FOR REGRESSION OF LOAD-CARRYING CAPACITY OF NONLINEAR STEEL FRAMES Abstract Complex structural design problems such as optimal design or reliability calculation take excessive computational efforts, especially in the case of using nonlinear analyzes This problem can be solved by using metamodels such as using machine learning algorithms to predict building responses The random forest has been considered as one of the most robust Machine Learning techniques since it has been successfully applied for both regression and classification problems in many fields In this paper, we develop a random forest-based method for regression and classification of the load-carrying capacity of steel frames Direct analysis is used to estimate the load-carrying capacity of this frame The input variables are the information of cross-sections of structural members and material A six-story space frame is studied to demonstrate the efficiency of the proposed method The obtained results show that the number of decision-making trees should be greater than 100; For regression problems, decision trees should be divided up to maximum depth; And, the accuracy of the model increases when the number of trained samples increases but it should be considered based on the correlation between the results in terms of efficiency and calculation time Keywords: random forest; machine learning; direct analysis; steel frame; nonlinear https://doi.org/10.31814/stce.nuce2021-15(2V)-09 © 2021 Trường Đại học Xây dựng (NUCE) ∗ Tác giả đại diện Địa e-mail: hunghm@nuce.edu.vn (Hùng, H M.) 110 Hùng, H M / Tạp chí Khoa học Cơng nghệ Xây dựng Giới thiệu Phân tích kết cấu cơng trình đòi hỏi phản ánh sát ứng xử thực tế cơng trình tốt Chính vậy, phương pháp phân tích đại dựa phân tích trực tiếp ngày sử dụng rộng rãi, đặc biệt kết cấu thép [1, 2] Phân tích trực tiếp chấp nhận phiên tiêu chuẩn AISC LRFD [3] Ưu điểm phương pháp phân tích trực tiếp chúng có khả mơ tả ứng xử hệ thống kết cấu cơng trình chịu tải trọng, đặc biệt thay đổi cơng trình tải trọng thay đổi Qua đó, khả chịu tải tồn hệ thống cơng trình xác định Tính an tồn cơng trình đánh giá cách đơn giản thông qua việc so sánh khả chịu tải cơng trình khơng nhỏ áp lực tải trọng gây [1, 2] Tuy nhiên, phân tích trực tiếp thường tốn thời gian Do vậy, ứng dụng chúng hạn chế, đặc biệt tốn địi hỏi phải có nhiều lần phân tích kết cấu tốn tối ưu hay tính tốn độ tin cậy cơng trình [4–6] Để giảm bớt số lượng phân tích kết cấu tốn này, cách tiếp cận gần sử dụng mơ hình thuật toán máy học (Machine learning) (ML) thu hút quan tâm nghiên cứu thời gian gần [7, 8] Nói cách tổng qt, thuật tốn ML trang bị cho máy tính khả tự động hiểu, phân tích, xử lý học hỏi từ thơng tin/dữ liệu đầu vào từ để thực nhiệm vụ giao Dựa đặc điểm này, thuật tốn máy học sử dụng để huấn luyện máy tính có khả ước lượng ứng xử kết cấu cơng trình dựa thơng tin đầu vào kết cấu ví dụ như: kích thước, đặc điểm vật liệu, đặc điểm tải trọng, v.v Một số nghiên cứu bật việc ứng dụng thuật toán ML vào đánh giá ứng xử kết cấu kể đến sau Vũ cs [9] ứng dụng thuật toán Gradient Tree Boosting (GTB) để ước lượng khả chịu tải cọc ống thép nhồi bê tông (CFST) Hùng cs [10] trình bày xử lý tượng khớp mơ hình học sâu (Deep Learning) (DL) cho giàn thép phi tuyến Ứng dụng thuật toán ML để tính độ tin cậy cơng trình nhiều nhà khoa học quan tâm nghiên cứu như: Yang Hsieh [11] sử dụng Support Vector Machine (SVM), Chen cs [12] sử dụng Kriging, Gholizadeh [13] sử dụng mạng nơ-ron lan truyền ngược (back-propagation neural network), v.v Bên cạnh đó, việc đánh giá/nhận diện hư hỏng cơng trình thuật tốn ML thu áp dụng ngày nhiều Ví dụ Oh cs [14] sử dụng Bayesian để phân loại trạng thái hư hỏng cơng trình chịu động đất Hasni cs [15] sử dụng SVM để theo dõi sức khỏe cơng trình thép Trong việc ứng dụng thuật tốn ML vào tốn thiết kế cơng trình, hiệu phụ thuộc nhiều yếu tố, có yếu tố cần lưu ý sau Thứ nhất, khơng có thuật tốn xem vượt trội mà tùy thuộc vào lớp toán hay cụ thể đặc điểm toán thiết kế Do vậy, nghiên cứu ứng dụng thuật tốn ML ln cần thiết nhằm tối ưu hóa cơng việc Thứ hai, tính hiệu thuật tốn ML ảnh hưởng nhiều việc lựa chọn giá trị tham số hệ thống mà số lượng tham số hệ thống thuật toán lại nhiều Cho nên, lớp toán cụ thể, cần thực phân tích, đánh giá nhằm tìm cách sử dụng tham số hiệu cho mơ hình huấn luyện Dựa quan điểm đó, báo này, tác giả trình bày chi tiết cách xây dựng mơ hình huấn luyện cho toán ước lượng khả chịu tải khung thép phi tuyến sử dụng thuật toán rừng ngẫu nhiên (Random Forest) (RF) Thuật toán rừng ngẫu nhiên lựa chọn dựa hiệu quả, mạnh mẽ việc giải tốn phân tích hồi qui phân loại [16, 17] Thêm vào đó, chưa có nghiên cứu cụ thể trình bày áp dụng thuật toán vào toán ước lượng khả chịu tải khung thép phi tuyến Một khung thép không gian tầng sử dụng để minh họa cho cách thiết lập mơ hình huấn luyện sử dụng RF Ảnh hưởng tham số hệ thống RF đến hiệu mơ hình tiến hành phân tích nhằm đưa đề xuất lựa chọn giá trị tham số 111 Hùng, H M / Tạp chí Khoa học Cơng nghệ Xây dựng hợp lý Thuật toán rừng ngẫu nhiên RF giới thiệu lần Breiman vào năm 2001 [18] Nó phương pháp phân loại hồi quy theo phương thức học có kiểm sốt, bao gồm kết hợp nhiều dự báo/cây định Mỗi định tạo dựa tập mẫu huấn luyện ngẫu nhiên tạo từ tập mẫu huấn luyện ban đầu với độ lớn theo ngun tắc lấy mẫu có hồn lại (phương pháp Bootstrap) nghĩa mẫu lấy nhiều lần Các định dựa tập mẫu vừa tạo với nguyên tắc sử dụng số lượng biến đầu vào nút phân chia Kết cuối giá trị trung bình kết thu từ tất định Bằng cách sử dụng thật nhiều Tạp chí họclượng Cơng nghệ Xâyhình dựng,sẽNUCE2020 định, saiKhoa số ước mô giảm đáng kể Nguyên lý thuật tốn tóm tắt Hình Hình Thuật ậ toán rừng ngẫuẫ nhiên dự báo nhận ự ẽgiá trị ậ số cụ thể thay ị ốvì ụkỹ thuật ể phân loại ỹ (ra Trong toán hồi quy, ậ [19] Trong ết địcác ủ cho phép định) thiếtếtkếđịcác địnhế củaế phân tích hồi quy, ồi quy, câytối đượ ển đến ối đa củ giản ữ lược ệ lạiấ(ngắt ệcành) Đây phát triển đến độ sâu đa liệu huấn luyện mà độ khơng tiến hành ưu điểm thuật tốn việc thực giản lược mộtủyếu tốậchính ế ản lượ cành) Đây ưu điể Breiman [19] số lượng câyđếtăng lên, ảnh hưởng đến hiệu suấtệcủa mơ ự hình ệ [20] ản lượ ộ ếchoốrằng khiảnh hưởng ệ sai số tổng quát hội tụ không giản lược cây, việc xử lý tượng mơ hình q khớp ấ ủ ] cho rằ ố lượng tăng lên, sai số thực dựa nguyên tắc luật số lớn (Strong Law of Large Numbers) [21] Số lượng biến ộ ụnút để tạo ả ra ảnquyết lượ định sốệlượng ện ổsử dụng (N) tượ định (k) ớptham đượsố doựngườiệ dùng ự lựa chọn trước [19] ắ ậ ố sử dụng hai lượđây, chúng ến đượ ỗ số tquan để ạtrọng cóộthể ảnh hưởng ế đến Dựa trình bày ốtrên ta rútửra ụđược ạthơng hiệu đị suất mơ hình rừng ngẫu nhiên là: (1) số lượng định sử dụng; (2) kỹ ố lượ ết đị đượ ụ ố ngườ ự thuật lấy mẫuọn (sửtrướ dụng hay không sử dụng kỹ thuật bootstrap); (3) số lượng biến sử dụng nút; (4) đặc điểm tập liệu bao gồm thông số đầu vào thông số đầu mơ hình ựa trình bày đây, rút đượ ảnh hưởng đế ệ ấ ủ ẫ đượ ụ ỹ ậ ấ ẫ ụ 112 ố lượ ến đượ ụ ỗi nút; (4) đặc điể ố đầ ố đầ ủ ự ậ ụ ố ố lượ ụ ỹ ủ ậ ữ ệ ẫu nhiên để ước lượ ọ ể ết đị ậ ả chị ả Hùng, H M / Tạp chí Khoa học Cơng nghệ Xây dựng Xây dựng thuật toán sử dụng rừng ngẫu nhiên để ước lượng khả chịu tải khung thép 3.1 Khả chịu tải khung thép Trong phương pháp phân tích trực tiếp, an tồn kết cấu đánh giá thơng qua việc so sánh khả chịu tải toàn hệ thống với tải trọng tác dụng lên cơng trình Nếu khả chịu tải lớn tải trọng tác dụng ta có cơng trình an tồn, ngược lại cơng trình an tồn Để chuẩn hóa tính chất này, thay sử dụng khái niệm khả chịu tải kết cấu, sử dụng thông số “hệ số khả chịu tải kết cấu” (LF) định nghĩa tỉ lệ khả chịu tải cơng trình (R) hiệu ứng tải trọng gây (S): R (1) S Lúc kết cấu xem an toàn LF ≥ ngược lại Trong nghiên cứu này, LF khung thép tính tốn dựa phân tích phi tuyến tính phi đàn hồi trình bày tài liệu [1] LF = 3.2 Xây dựng tập liệu huấn luyện Xây dựng tập liệu bước quan trọng cho việc xây dựng mơ hình huấn chí Khoa học Cơng Xây dựng, luyện Để việc nắm bắtTạpcách thức xâynghệdựng dữNUCE2020 liệu cho toán ước lượng khả chịu tải 148 ầ Hình Khung thép khơng gian tầng ộ ậ ữ ệ ế ệ ầ ộ để ẫ ộ ộ ến tính phi đà ồi đượ ữ ệu đượ ằ ổ ợ ẫ ầ ề ến PAAP [1] đượ ụ 113 ố ế ệ ủ ầ ộ ầ ề ế ấ ể ệ ự ự ện để thu đượ LF tương ứ Tạp chí Khoa học Công nghệ Xây dựng, NUCE2020 ố ị ủ ữ ệu đượ ự ấ ủ ủ ế ả ị – ỉ ệ ế ả / Tạp chíủ Khoa học Công đượ ự ọ Hùng, H M ố đầ ấ nghệệXây dựng ố đầ ủ hình đặc trưng củ ế ệ ầ ột Đố ấ ều đặ khung thép, ví dụ khung thép khơng gian tầng Hình sử dụng để minh họa trưng củ ế ệ ể ảnh hưởng đế ứ ủ ế ấ ậy, để độ trực tiếp Trong khung, dầm cột chia thành 13 nhóm tiết diện khác Hình ủ ều đặ ủ ế ện xét đế Các cột thiết kế sử dụng tiết diện W12 W14, dầm thiết kế sử dụng tiết diện W10, ấ ệ ố ứ ại đặ ủ ế ện đượ W12, W14 W16 Vật liệu thép A992 với mô-đun đàn hồi 200 (Gpa) cường độ chảy ảng đượ ụng biến đầ ủ ảnh hưở 345 (Mpa) Tải trọng gió tác dụng theo phương Y nút khung có giá trị 20 kN Tải trọng thẳng chương trình phân tích phi tuyến tính phi đàn hồi đượ ụ ế đứng phân bố dầm 5,5 kN/m ệ ủ ẽ ổ ộ ến đầ ằ 10 11 12 13 14 15 16 ố ị ủ ủ ậ ữ ệ Hình Phân bố giá trị LF tập liệu ả Đặc trưng hình họ ủ ế ện xem xét biến đầ Đặc trưng tiết diện Bảng Đặc trưng học Hệhình số cong vênhtiết diện xem xét biến đầu vào Bán kính hồi chuyển trục yếu Mô men tĩnh trục y trưng tiết diện Đặc Mô men tĩnh trục z Hệ số xoắnHệ số cong vênh Mô men quán đốihồi vớichuyển trục y trục yếu Bántính kính Mơ men qn tính trụcvới z trục y Mơ men tĩnh đối Diện tích tiết diện Mơ men tĩnh trục z Diện tích miền cắt để tính cắt dọc theo trục y Hệ số Diện tích miền cắtxoắn để tính cắt dọc theo trục z Mơtính men quán tínhtrục đốiyvới trục y men quán dẻo Mơ men qn dẻo Mơtính men qn tínhtrục đốizvới trục z Chiều cao tiết diện Diện tích tiết diện Chiều rộngDiện cánh tích miền cắt để tính cắt dọc theo trục y Chiều dày Diện tích miền cắt để tính cắt dọc theo trục z Chiều dày vách Mơ men qn tính dẻo trục y Mơ men qn tính dẻo trục z Chiều cao tiết diện Chiều rộng cánh Chiều dày cánh Chiều dày vách Một tập liệu gồm 20000 liệu tạo cách tổ hợp ngẫu nhiên tiết diện dầm cột khác Phần mềm phân tích phi tuyến PAAP [1] sử dụng để tạo mẫu Với thông số tiết diện dầm cột, phần mềm phân tích kết cấu phi tuyến tính phi đàn hồi thực để thu LF tương ứng Hình thể phân bố giá trị LF 20000 liệu tạo Dựa vào 114 Hùng, H M / Tạp chí Khoa học Cơng nghệ Xây dựng hình thấy, LF khung nằm chủ yếu khoảng giá trị từ (0,5 – 4,0) Tỉ lệ LF < chiếm khoảng 29% LF lựa chọn thông số đầu mơ hình huấn luyện Thơng số đầu vào mơ hình đặc trưng tiết diện dầm cột Đối với toán khung, nhiều đặc trưng tiết diện ảnh hưởng đến ứng xử kết cấu Do vậy, để độ xác mơ hình cao, nhiều đặc tính tiết diện xét đến mơ hình huấn luyện tốt Trong nghiên cứu này, 16 loại đặc tính tiết diện trình bày Bảng sử dụng biến đầu vào mô hình chúng có ảnh hưởng lớn chương trình phân tích phi tuyến tính phi đàn hồi sử dụng Với 13 nhóm tiết diện khung, có tổng cộng 208 biến đầu vào 3.3 Xây dựng mơ hình huấn luyện Trình tự bước xây dựng mơ hình huấn luyện sử dụng thuật tốn rừng ngẫu nhiên sau: Bước 1: Xây dựng toán Trong bước cần xây dựng tập liệu, xác định biến đầu vào biến đầu mơ hình huấn luyện Đây nội dung trình bày chi tiết phần 3.2 Bước 2: Phân chia tập liệu chuẩn hóa liệu Tập liệu ban đầu phân chia thành tập riêng biệt: (1) tập huấn luyện sử dụng cho trình huấn luyện mơ hình (2) tập kiểm tra sử dụng để đánh giá hiệu mơ hình Đối với tập liệu có giá trị thông số đầu vào khác nhiều, liệu thường chuẩn hóa cách đưa khoảng [0, 1] nhằm việc huấn luyện đạt hiệu cao Cơng thức để chuẩn hóa sử dụng sau: xi′ = xi [xi ] (2) [xi ] giá trị lớn biến đầu vào xi Bước 3: Xây dựng mơ hình huấn luyện Một số tham số mơ sau: - Hàm mát (loss function): Hàm mát hiểu hàm mục tiêu tối thiểu hóa q trình huấn luyện mơ hình Đối với tốn phân tích hồi quy, dạng hàm mát thường dùng: “sai số tồn phương trung bình” (mean-squared-error) (MSE), “sai số tuyệt đối trung bình” (mean-absolute-error) (MAE) Trong nghiên cứu này, hàm MSE sử dụng - Số lượng định (n_estimators): tham số có ảnh hưởng lớn đến độ xác cùa mơ hình Vai trị định trình bày phân tích phần - Kỹ thuật lấy mẫu: có kỹ thuật là: (1) lấy mẫu có hồn lại (phương pháp Bootstrap) (2) toàn mẫu sử dụng để xây dựng định Bước 4: Huấn luyện mơ hình Đây dạng huấn luyện có kiểm sốt tập huấn luyện Hiệu suất mơ hình đánh giá dựa vào tập kiểm tra Mơ hình thu được sử dụng để ước lượng hệ số khả chịu tải khung thép Kết Trong phần này, đánh giá ảnh hưởng thơng số mơ hình đến hiệu suất làm việc mơ hình rừng ngẫu nhiên Từ đó, khuyến nghị đưa nhà nhằm giúp người đọc lựa chọn hiệu áp dụng thuật tốn vào cơng việc Ngơn ngữ lập trình Python thư viện Sklearn sử dụng để mơ hình hóa mơ hình huấn luyện rừng ngẫu nhiên 115 Tạp chí Khoa học Cơng nghệ Xây dựng, NUCE2020 Hùng, H M / Tạp chí Khoa học Công 4.1 Ảnh hưởng số lượng định ụng để ấ ệ nghệ Xây dựng ẫ Trong phân tích đầu hưởng sốết đị lượng định đến mơ hình huấn luyện Ảnhtiên hưở ủảnh ố lượ rừng ngẫu nhiên, số lượng đầ liệu choề ảnh tậphưở huấn ủluyện tra đế lấy 5000, kỹ Trongmẫu phân tích ố lượvà tập kiểm ết định cóẫ hồn lại ố lượ ẫ ữ bootstrap), ệ ậ ấ số lượng ệ ậ ể định thuật lấy mẫu kỹ thuậtấ lấyệmẫu (sử dụng tra đượDạng ấ ằhàm ỹmátậ ấ ẫsử dụng ỹ ậ MSE ấ ẫ Để giảm ảnh ụhưởng tính ngẫu thay đổi từ đến 1000 ố lượ định thay đổ đế ấ nhiên đến kết tính tốn, tương ứng vớiếtmỗi trường hợp chương trìnhạ chạy độc lập 10 lần Kết đượ ụng MSE Để ả ảnh hưở ủ ẫu nhiên đế ế ả tính tốn tương thể Hình Ta thấy số lượng định tăng lên, ứ ỗi trườ ợp chương trình đượ ạy độ ậ ầ ế ả giá trị hàm mátđượ tập huấn luyện tập kiểm tra giảm đi, tức mơ hình huấn luyện ể ệ ể ấ ằ ố lượ ết định tăng lên, ị ấ ủ ả ậ ấ ệ ậ ểm tra đề ảm đi, tứ ấ tốt lên Khi số lượng định sử dụng ≥ 100, giá trị hàm mát tập liệu hầu ệ ố lượ ết định đượ ụng ≥ 100, giá trị không thay đổi (đã ốhội tụ) Do vậy, số lượng định nên đượcấ sử dụng với giá trị ủ ậ ữ ệ ầu không thay đổ ữa (đã hộ ụ ậ ố lượ đủ lớn khuyến nghịếtlàđịnh ≥ nên 100 đượ ụ ị đủ ế ị ≥ 100 Ảnh hưở ủ ố ết định đế ệ ấ ủ ấ ệ Hình Ảnh hưởng số định đến hiệu suất mơ hình huấn luyện Để làm rõ hiệ ả ủ ậ ị ủ ậ ậ ậ ết đị Để làm rõ hiệu thuật tốn ếRF,ảHình trình bày so sánh giá trị hàm mát thuật ật toán SVM Lưu ý rằ ậ ể ố toán RF với thuậtlượtoán ẫkhác làậ thuật toán định (DT) thuật toán SVM Lưu ý ểm tra đượ ố đị ố lượ ẫ ậ ấ ệ thay 500 đế ế số ả lượng ấ ằmẫu ậ kết trình bày hìnhđổlàừcho tập kiểm ẫtra với tập kiểm ịtra cố định ấ tập huấn ấp luyện nhiềđượcớithay DT vàđổi SVM nghĩa RF hiệ Kết ả cho thấy 5000 Số lượng mẫu từ Điều 500này đếncó20000 mẫu ạnh trườ ợ ứ thuật tốn RF choTạp giáchítrị hàm mát thấp nhiều so với DT SVM Điều có nghĩa Khoa học Công nghệ Xây dựng, NUCE2020 ấ RF hiệu mạnh trường hợp nghiên cứu ệ Ảnh hưở ả ủ ậ ọ Hình So sánh hiệu thuật toán máy học ủ ỹ ậ ấ ẫ ần 4.1 thể ệ ế ả ủ ỹ ậ ấ ẫ ại đế 116 ấ mơ hình Để đánh giá kỹ hơn, tiế ụ ảnh hưở ủ ỹ ậ ấ ẫu thông thườ ụng bootstrap) đế ệ ấ ấ ện Điề có nghĩa tấ ả ữ ệu đượ ụ ỗ ết đị ế ả tính tốn đượ ể ệ ể ấ ằ ị ấ ệ Hùng, H M / Tạp chí Khoa học Cơng nghệ Xây dựng ệ ả ủ ậ ọ 4.2 Ảnh hưởng củaẢnh kỹ hưở thuật lấy ủ mẫu ỹ ậ ấ ẫ ần 4.1 cũngkết thể ệ ế kỹ ả ủthuật ỹ lấy ậ mẫu ấ ẫ có hồn ại Hình phần 4.1 thể lạiđếđến hiệu suất ệ ấ mơ hình Để đánh giá kỹ hơn, tiế ụ ảnh hưở ủ mẫu ỹ thơng thường mơ hình Để đánh giá kỹ hơn, tiếp tục xem xét ảnh hưởng kỹ thuật lấy ậ ấ ẫu thông thườ ụng bootstrap) đế ệ ấ ấ (không sử dụng bootstrap) đến hiệu suất mơ hình huấn luyện Điều có nghĩa tất liệu ện Điề có nghĩa tấ ả ữ ệu đượ ụ ỗ ết đị Ta thấy sử dụng mỗiế câyả định ểKếtệ tính tốn ểthểấhiện trongị Hình tính tốn đượ ằ ấ giá trị hàm mát kiểm thay đổi số ủ ảcủa ậ cảấ tập huấn ệ ậluyện ểmvà tra tập không thaytra đổ không ố lượ ết địlượng định tăng lên, tương ứng 4,15E-05 2,5E-03 Đồng thời, giá trị hàm mátớ tập kiểm tăng lên, tương ứ ằ 03 Đồ ị ấ đố tra trường hợp thuậtợlấyử mẫu kémthường ậ ểsử dụng trongkỹ trườ ụ thông ỹ ậ thường ấ ẫu thông kémnhiều rấso với ề sử dụng kỹ lạiử ụ ỹ ậ bày ấ ẫ ằ có nghĩa kỹ thuật (bằng 1,1E-03) Điều thuật lấy mẫu có hồn trình Hìnhại4đượ có sử nghĩa kỹtrong ậ thuật ấ ẫ toán ngẫuại nhiên nên đượ ụ ậ lấy mẫu có hồn lại Điề nên dụng ẫ Tạp chí Khoa học Cơng nghệ Xây dựng, NUCE2020 Ảnh hưở ủ ộ ố ố ố ọ ảnh hưởng đế ệ ấ ủ ẫ nhiên đượ ố đế ầ ệ ố lượ ấ ẫ ệố Ảnh hưở ởủ ố ộ ố ết định ấ ủ hưởng ố lượ ố ể định đến ộ hiệu suất ố lượ đầ huấn luyện Hình 6.ểẢnh số ẫra mơếnhình ấ ụng đố ộ ết đị Ảnh hưở ủ ố đượ ấ ằng quy đị ố lượ ẫ ố ể ại nút tăng lên, độ ủ ị ảm đố ả ậ 4.3 Ảnh hưởng số thông số khác ấ ệ ậ ể ậy, đố định nên đượ ự hưởng ới độ đếnốihiệu đa củsuất ữ ệ mơ hình ộ rừng ngẫu nhiên trình Bên cạnh thamếtsố quan trọng ảnh ố lượ ẫ ố ể ỗ ỗ ấ ằ ệtại nút, (2) số lượng bày trên, số tham số khác cần quan tâm là: (1) số lượng mẫu tối thiểu ố lượ ến đầ ụ ỗ ết đị ảnh hưở mẫu tối thiểu (3) số lượng biến đầu vào lớn cho phép sử dụng ớn đế ệ ấ ủ ồi quy Điều có nghĩa ngườ ể ụ định Ảnh hưởng sốđanày bàyýtrong ố lượ ến đầtham ối cho câytrình tùy ý (lưu khơng Hình đượ 7, Hình cho thấy quy định ựsố lượng mẫuệtối thiểu tăng lên, xác ấ ủ nút ẽ tăng lên chútđộ (không đáng kể ế mơ ố hình bị giảm lượ ến đầ ối đa cho bé tổ ố lượ ến đầ ủ ữ ệ ủ ố lượ ẫ ố ột nút đế ủ Hình Ảnh hưởng Ảnh hưở số lượng mẫu tối thiểu ểmột nút đến hiệuệsuấtấ mơ hình huấn luyện ấ 117 ệ Tạp chí Khoa học Cơng nghệ Xây dựng, NUCE2020 Tạp chí Khoa học Cơng nghệ Xây dựng, NUCE2020 Hùng, H M / Tạp chí Khoa học Cơng nghệ Xây dựng Ảnh hưở Ảnh hưở lượ ủ ủ ốốlượ ẫẫ ốố ấ ể ệ ột ột láláđế đế ệệ ấấ ủ ủ ể ột đế ệ ấ ủ Hình Ảnh hưởng số lượng mẫu tối thiểu ệmột đến hiệu suất mơ hình huấn luyện ấ Ảnh hưở Hình Ảnh ủ ố lượ ẫ ố ủ mẫu ố lượ tối thiểu ẫ ốấ hưởngẢnh củahưở số lượng ấ Ảnh hưở độ ữ ệ ấ Ảnh ự hưở độ ạ tạiểệmột ệ ệ đếhiệuệsuấtấ ủ láộtđến ữ ệ để đánh ấ giá ệảnh hưở độ ữ ệ mơ hình huấn luyện ấ ệ tập huấnđếluyện tra Do vậy, cácủaựbài tốn tích ệhồi quy, ầ ố giá ủ đối ọn sau: ự tập kiểm để đánh ảnh với hưởđượ độ ữ phân ệ sốấlượ ết đị vớiầđộ ỹsâuậtối ấ đaẫốcủa lượ ẫ định nên cách khác số lượng mẫu đế xây dựng ủ ạliệu đượụHay ự nói ọn nhưốsau: số lượ ể ếtạtại ẫ ẫố ểcho thấy ố lượgiớiến đầ số ẫlượng biến đầu vào đị nútốỹ lượ ậ ấHình ạộ ụ ốhạn lượ tối thiểu làố việc ể ấạ ốụng đố ớẫ ộố ếtộđị ố lượố lượến đầ ến đầ ố lượđịnh cho phép sử dụng ốtại không ểảnhạ hưởng lớn đến hiệu suất toán hồi quy ấ ụng đố ộ đị ố lượ đầ ố Điều có nghĩa người dùng sử dụng số lượngếtbiến đầu vào tốiếnđa cho tùy ý (lưu ý khơng q bé) Tuy nhiên, dựa Hình 9, hiệu suất mơ hình tăng lên chút (không đáng kể) số lượng biến đầu vào tối đa cho bé tổng số lượng biến đầu vào liệu 4.4 Ảnh hưởng độ lớn liệu huấn luyện Dựa phân tích trên, để đánh giá ảnh hưởng độ lớn liệu huấn luyện đến mơ hình, phần tham số mơ hình lựa chọn sau: số lượng định = 100, kỹ thuật lấy mẫu có hồn lại (sử dụng bootstrap), số lượng mẫu tối thiểu nút = 2, số lượng mẫu tối thiểu = số lượng biến đầu vào lớn cho phép sử dụng định = số lượng biến đầu vào Số lượng mẫu liệu tập kiểm tra 5000, tập huấn luyện thay đổi từ 1000 đến 20000 Mỗi trường hợp chương trình chạy độc lập 10 lần Kết trình bày Hình 10 Có thể nhận số lượng mẫu tập huấn luyện tăng lên độ xác mơ hình tập kiểm tra tăng lên MSE tương ứng với số lượng mẫu 5000 = 1,13E-03 44,8% so với MSE 500 mẫu ( = 2,52E-03) 168% so với MSE 20000 mẫu (= 6,72E-04) Rõ ràng yếu tố số lượng mẫu mang tính định đến độ xác mơ hình 118 lượ đế ẫ ữ ệ ậ ỗi trườ ể ủ ậ ấ ện thay đổ ợp chương trình đượ ạy độ ậ ầ ế ả đượ ể ậ ằ ố lượ ẫ ủ ậ ấ ện tăng lên độ mơ hình đố ậ ểm tra tăng lên MSE tương ứ ố lượ Hùng, H M.ằ / Tạp chí Khoa ẫ học Cơng ủ nghệẫXây dựng ằ ủ ẫ ế ố ố lượ ẫ huấn luyện Tuy nhiên, việc ết đị lựaấtchọn đến độnhiều số ủlượng mẫuấsẽ làm ệ tăng thời ệgian ự tính ọ tốn, đặc biệt thời gian tạo liệu sử dụng phân ề đối ố lượvới ẫ ẽbàimtoán tăng thời gian tính tốn,tích đặ phi ệ tuyến tính phi ữđàn ệ hồi đố với 5000 mẫuử ụ thời gian tạo dự ến tính đàn hồi (giờ), báo này.cịn 20000 mẫu báo Cụ thể, đối liệuphihuấn luyện 8,3 đố chọn số lượng ẫ huấn luyện ự ệ cần ấ phải ệ xem xét dựa mối quan hệ 33,3 (giờ) Do vậy, ụsự ể,lựa mẫu ẫ ậ ự ự ọ ố lượ ẫ ấ ệ ầ ải đượ hiệu mơ hình thời gian tính tốn ự ố ệ ữ ệ ả ủ Ảnh hưở ủ ố lượ ẫ ủ ậ ấ ệ đế ệ ấ ủ Hình 10 Ảnh hưởng số lượng mẫu tập huấn luyện đến hiệu suất mơ hình huấn luyện ấ ế ệ ậ ệ ế ột chương trình ước lượ ả chị ả ủ ế ụ ậ ẫ ố đầ ủ ấ ệ ế ệ ủ ầ ộ ới 16 đặc trưng hình họ ỗ Bài báo giới chi tiết trìnhchịướcả lượng ế thiệu ệ ố đầ chương ệ ố ả ủ ế khả ấu xác chịu đị ửtảiụcủa khung thép phi tuyến sử dụng thuật toán rừng số đầu tiết diện ự ếngẫu nhiên ến tínhThơng phi đàn hồ ộ vào mơ hình huấn ầ luyện đầutrưng vào đượ ụng cho để đánh hiệ tiếtả diện ủ ệ Ả dầm cột với 16 ến đặc hìnhử học mỗigiáloại Thơngấsố đầu hệ số khả hưởđược ủ xác định sử ố dụngọ phân mô nhưtiếp số lượ ết đị ỹ hồi Một khung chịu tải kết cấu tíchhình trực phi tuyến tính phi đàn ậ ấ ẫ ố lượ ẫ ố ể ố lượ ến đầ ấ thép không gian tầng với 208 biến đầu vào sử dụng để đánh giá hiệu mô hình huấn ụng đố ộ ết đị ố lượ ẫ ủ ậ ấ ệ Kết luận luyện Ảnh hưởng thông số quan trọng mô số lượng định, kỹ thuật lấy mẫu, số lượng mẫu tối thiểu nút lá, số lượng biến đầu vào lớn cho phép sử dụng định số lượng mẫu tập huấn luyện đến mơ hình huấn luyện phân tích, đánh giá Kết thu cho thấy, số lượng định nên sử dụng ≥ 100; Đối với toán hồi quy, định nên phân chia đến độ sâu tối đa; độ xác mơ hình tăng lên số lượng mẫu huấn luyện tăng lên cần xem xét dựa tương quan hiệu mang lại mặt kết thời gian tính tốn Tài liệu tham khảo [1] Thai, H.-T., Kim, S.-E (2011) Nonlinear inelastic analysis of space frames Journal of Constructional Steel Research, 67(4):585–592 [2] Kim, S.-E., Choi, S.-H (2001) Practical advanced analysis for semi-rigid space frames International Journal of Solids and Structures, 38(50-51):9111–9131 [3] ANSI/AISC 360-10 (2010) Specification for structural steel buildings Chicago (IL): American Institute of Steel Construction [4] Ha, M.-H., Vu, Q.-V., Truong, V.-H (2020) Optimization of nonlinear inelastic steel frames considering panel zones Advances in Engineering Software, 142:102771 [5] Ha, M.-H., Vu, Q.-A., Truong, V.-H (2018) Optimum Design of Stay Cables of Steel Cable-stayed Bridges Using Nonlinear Inelastic Analysis and Genetic Algorithm Structures, 16:288–302 119 Hùng, H M / Tạp chí Khoa học Cơng nghệ Xây dựng [6] Kim, S.-E., Truong, V.-H (2020) Reliability Evaluation of Semirigid Steel Frames Using Advanced Analysis Journal of Structural Engineering, 146(5):04020064 [7] Hung, T V., Viet, V Q., Thuat, D V (2019) A deep learning-based procedure for estimation of ultimate load carrying of steel trusses using advanced analysis Journal of Science and Technology in Civil Engineering (STCE) - NUCE, 13(3):113–123 [8] Truong, V.-H., Vu, Q.-V., Thai, H.-T., Ha, M.-H (2020) A robust method for safety evaluation of steel trusses using Gradient Tree Boosting algorithm Advances in Engineering Software, 147:102825 [9] Vu, Q.-V., Truong, V.-H., Thai, H.-T (2021) Machine learning-based prediction of CFST columns using gradient tree boosting algorithm Composite Structures, 259:113505 [10] Hùng, H M., Hùng, T V., Thuật, Đ V., Việt, V Q (2020) Phương pháp xử lý tượng mơ hình q khớp xây dựng mơ hình học sâu để ước lượng khả chịu tải giàn phi tuyến Tạp chí Khoa học Cơng nghệ Xây dựng (KHCNXD)-ĐHXD, 14(1V):12–20 [11] Yang, I.-T., Hsieh, Y.-H (2012) Reliability-based design optimization with cooperation between support vector machine and particle swarm optimization Engineering with Computers, 29(2):151–163 [12] Chen, W., Xu, C., Shi, Y., Ma, J., Lu, S (2019) A hybrid Kriging-based reliability method for small failure probabilities Reliability Engineering & System Safety, 189:31–41 [13] Gholizadeh, S (2015) Performance-based optimum seismic design of steel structures by a modified firefly algorithm and a new neural network Advances in Engineering Software, 81:50–65 [14] Oh, C K., Beck, J L., Yamada, M (2008) Bayesian Learning Using Automatic Relevance Determination Prior with an Application to Earthquake Early Warning Journal of Engineering Mechanics, 134(12): 1013–1020 [15] Hasni, H., Alavi, A H., Lajnef, N., Abdelbarr, M., Masri, S F., Chakrabartty, S (2017) Self-powered piezo-floating-gate sensors for health monitoring of steel plates Engineering Structures, 148:584–601 [16] Liaw, A., Wiener, M (2002) Classification and regression by randomForest R news, 2(3):18–22 [17] Hapfelmeier, A., Ulm, K (2013) A new variable selection approach using Random Forests Computational Statistics & Data Analysis, 60:50–69 [18] Breiman, L (2001) Random forests Machine Learning, 45(1):5–32 [19] Breiman, L (1999) Random forests-random features Technical Report 567, Statistics Department University of California, Berkeley [20] Pal, M., Mather, P M (2003) An assessment of the effectiveness of decision tree methods for land cover classification Remote Sensing of Environment, 86(4):554–565 [21] Feller, W (1968) An introduction to probability theory and its applications, volume 3rd edition, John Wiley & Sons 120 ... luyện cho toán ước lượng khả chịu tải khung thép phi tuyến sử dụng thuật toán rừng ngẫu nhiên (Random Forest) (RF) Thuật toán rừng ngẫu nhiên lựa chọn dựa hiệu quả, mạnh mẽ việc giải tốn phân tích. .. thuật toán sử dụng rừng ngẫu nhiên để ước lượng khả chịu tải khung thép 3.1 Khả chịu tải khung thép Trong phương pháp phân tích trực tiếp, an tồn kết cấu đánh giá thơng qua việc so sánh khả chịu. .. tích hồi qui phân loại [16, 17] Thêm vào đó, chưa có nghiên cứu cụ thể trình bày áp dụng thuật toán vào toán ước lượng khả chịu tải khung thép phi tuyến Một khung thép không gian tầng sử dụng

Ngày đăng: 25/10/2021, 10:15

Mục lục

  • 2 Thuật toán rừng ngẫu nhiên

  • 3 Xây dựng thuật toán sử dụng rừng ngẫu nhiên để ước lượng khả năng chịu tải của khung thép

    • 3.1 Khả năng chịu tải của khung thép

    • 3.2 Xây dựng tập dữ liệu huấn luyện

    • 3.3 Xây dựng mô hình huấn luyện

    • 4 Kết quả

      • 4.1 Ảnh hưởng của số lượng cây ra quyết định

      • 4.2 Ảnh hưởng của kỹ thuật lấy mẫu

      • 4.3 Ảnh hưởng của một số thông số khác

      • 4.4 Ảnh hưởng của độ lớn dữ liệu huấn luyện

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan