PHƯƠNG PHÁP TIẾP CẬN DỮ LIỆU LỚN ĐỂ RA QUYẾT ĐỊNH TRONG BẢO TRÌ CÔNG TRÌNH CẦU Tóm tắt. Hệ thống quản lý cầu Đài Loan (TBMS) bắt đầu trực tuyến từ năm 2000 và tổng số lượng hàng tồn kho là 33.275 bao gồm tất cả các loại cầu và cống . Hiện tại , số lượng trường trong tất cả các bảng trong cơ sở dữ liệu của TBMS là khoảng 6.500 với hơn 3,4 triệu bảng ghi dữ liệu trong cơ sở dữ liệu của nó . Có hơn 11.200 cây cầu đã hơn 20 năm tuổi và 9.300 cây cầu khác chưa rõ năm xây dựng trong TBMS. Các cây cầu ở Đài Loan đã bước vào giai đoạn cần bảo dưỡng thường xuyên . Do đó nghiên cứu này nhằm mục đích phân tích cơ sở dữ liệu trong TBMS bằng cách sử dụng phân tích nhân tố khám phá để xác định chiến lươc bảo trì cho những cây cầu này . Bài báo này mô tả kết quả của những nổ lực nghiên cứu của năm đầu tiên . Các tài liệu liên quan về bảo trì cầu . Các khái niệm , lý thuyết và phần mềm có sẵn để phân tích “ Dữ liệu lớn “ cũng được giới thiệu .
BỘ GIÁO DỤC VÀ ĐÀO TẠO PHÂN HIỆU TRƯỜNG ĐẠI HỌC GIAO THƠNG VẬN TẢI TẠI THÀNH PHỐ HỒ CHÍ MINH KHOA CƠNG TRÌNH - BỘ MƠN CẦU HẦM TIỂU LUẬN CẦU HIỆN ĐẠI GVHD : TS NGUYỄN THẠC QUANG THỰC HIỆN: NHÓM LỚP: KTXDCTGT K27.2 TP HỒ CHÍ MINH – 08/2020 CẦU HIỆN ĐẠI DANH SÁCH NHĨM Lê Đăng Khoa Phan Ngọc Anh Khoa Trần Văn Giáp Lê Sỹ Cường Võ Phú Tồn Phan Đình Phùng CẦU HIỆN ĐẠI PHƯƠNG PHÁP TIẾP CẬN DỮ LIỆU LỚN ĐỂ RA QUYẾT ĐỊNH TRONG BẢO TRÌ CƠNG TRÌNH CẦU Tóm tắt Hệ thống quản lý cầu Đài Loan (TBMS) bắt đầu trực tuyến từ năm 2000 tổng số lượng hàng tồn kho 33.275 bao gồm tất loại cầu cống Hiện , số lượng trường tất bảng sở liệu TBMS khoảng 6.500 với 3,4 triệu bảng ghi liệu sở liệu Có 11.200 cầu 20 năm tuổi 9.300 cầu khác chưa rõ năm xây dựng TBMS Các cầu Đài Loan bước vào giai đoạn cần bảo dưỡng thường xuyên Do nghiên cứu nhằm mục đích phân tích sở liệu TBMS cách sử dụng phân tích nhân tố khám phá để xác định chiến lươc bảo trì cho cầu Bài báo mô tả kết nổ lực nghiên cứu năm Các tài liệu liên quan bảo trì cầu Các khái niệm , lý thuyết phần mềm có sẵn để phân tích “ Dữ liệu lớn “ giới thiệu 1.1 GIỚI THIỆU Hệ thống Quản lý Cầu Đài Loan (TBMS) trực tuyến từ năm 2000 [1] Khoảng không quảng cáo bao gồm 28.365 cầu với 6.524 thuộc tính tất bảng tổng lượng ghi liệu 3.457.274, tăng 15.000 ghi hàng năm Trong số thuộc tính này, có 475 thuộc tính chứa thơng tin quản lý hạt nhân cầu nối liệu kiểm kê, kết kiểm tra hồ sơ sửa chữa Do đó, sở liệu TBMS đáp ứng định nghĩa “Dữ liệu lớn” Bảng 1.1 Cơ quan quản lý tuổi mổi quan quản lý Bản thảo nhận ngày 11 tháng năm 2015; sửa đổi ngày 12 tháng năm 2016 Phân bố tuổi cầu TBMS thể Bảng Có 11.263 cầu 20 năm tuổi Hình cho thấy số lượng phận cầu cho cần thiết cho hoạt động bảo trì Số lượng thành phần bị hư hỏng nghiêm trọng tăng dần, NGƯỜI DỊCH: LÊ ĐĂNG KHOA - KTXDCTGT K27.2 CẦU HIỆN ĐẠI hoạt động bảo trì quan có trách nhiệm xúc tiến nhiều thành phần Hình 1.1 Số lượng thành phần cầu cần hành động bảo trì Do ngân sách hạn hẹp, đặc biệt quyền địa phương, việc ưu tiên bảo trì cầu ln nhiệm vụ khó khăn quan quản lý cầu, bên cạnh việc xác định phương án tốt bảo trì xây dựng lại cầu Phân tích chi phí vịng đời giải pháp khả thi cho vấn đề này; nhiên, kỹ thuật địi hỏi mơ hình dự báo hư hỏng phù hợp chưa triển khai TBMS Để đánh giá hiệu chi phí hiệu công việc sửa chữa xây dựng lại cầu, nghiên cứu nhằm mục đích phân tích sở liệu TBMS để có đặc điểm tình trạng xuống cấp cầu Đài Loan hữu ích cho việc xác định chiến lược bảo trì Dự án nghiên cứu kéo dài hai năm có hai giai đoạn Trong năm đầu tiên, ngồi việc xem xét tài liệu bảo trì cầu, thuật tốn phần mềm có sẵn liên quan đến liệu lớn điều tra kỹ lưỡng; việc áp dụng kỹ thuật phần mềm vào sở liệu TBMS dự kiến thực năm thứ hai Đối với nghiên cứu này, kết dự đốn thu thơng tin bảo trì chi phí sửa chữa thời gian phận, tiến độ điều kiện hư hỏng yếu tố kích hoạt hành động sửa chữa Cuối cùng, mơ hình hỗ trợ đánh giá định cho việc tái xây dựng hư hỏng cầu thực thông qua nghiên cứu NGƯỜI DỊCH: LÊ ĐĂNG KHOA - KTXDCTGT K27.2 CẦU HIỆN ĐẠI 1.2 ĐÁNH GIÁ TÌNH HÌNH 1.2.1 CÁC YẾU TỐ PHÁ HỦY CẦU Ở ĐÀI LOAN Lin [2] thiết lập thành cơng mơ hình dự đốn tuổi thọ sử dụng cho khe nối mở rộng, thu mức chênh lệch 9% năm dịch vụ dự đốn thực tế Ơng phát gia tốc ngang, số nhịp lưu lượng giao thông yếu tố quan trọng việc xác định tuổi thọ khe co giãn Ngoài ra, Su [3] thu thập 935 liệu kiểm tra cầu Đài Trung để phân tích mối liên quan xuống cấp cầu mơi trường phương pháp hồi quy logistic Nghiên cứu phát tuổi cầu, khoảng cách biển việc sử dụng dầm kiểu chữ I yếu tố gây hư hỏng 1.2.2 ƯU TIÊN BẢO TRÌ CẦU Đối với quyền trung ương địa phương, việc phân phối ngân sách bảo trì cầu ln nhiệm vụ khó khăn Chen [4] thiết lập mơ hình để tính Hệ số nguy hiểm (DF) cho cầu cách ấn định trọng số cho thành phần dựa xếp hạng hư hỏng chúng nhân với hệ số khách du lịch xác định theo cấp đường mà cầu qua; thành phần có giá trị cao chuẩn hóa để đại diện cho DF cầu DF sử dụng cho việc ưu tiên bảo trì cầu phân phối ngân sách bảo trì Mơ hình ưu tiên kết hợp TBMS 1.2.3 HIỆU QUẢ CỦA NGÂN SÁCH BẢO TRÌ Ngân sách chi cho bảo trì cầu cần phải hiệu Cách khả thi để kiểm tra tính hiệu điều tra kết bảo trì khoảng thời gian điều kiện ngân sách hạn chế Weng [5] so sánh khoản chi phí bỏ khoảng thời gian để sửa chữa thay thành phần định để tìm cách hiệu Huang [6] đề xuất khái niệm bảo dưỡng đồng thời nhiều phận cầu để giảm thời gian tổng thể cho việc sửa chữa phận khác cầu Lay [7] phát triển mơ hình phân tích chi phí bảo trì cho phép người dùng nhập số lượng ngân sách số năm định mô hình phân bổ ngân sách cho cầu để đạt kết hiệu 1.2.4 QUẢN LÝ VÒNG ĐỜI CẦU Nhiều nhà nghiên cứu thúc đẩy khái niệm chi phí vịng đời cho quản lý cầu nhiều năm Tuy nhiên, thực tế hầu hết hồ sơ thầu xây dựng cầu Đài Loan chưa tính đến chi phí bảo trì Zhu [8] thiết lập mơ hình tối ưu để tính tổng chi phí vịng đời cầu cho cầu dầm BTCT, xem xét chi phí người lại chi phí xã hội Safi [9] phân tích NGƯỜI DỊCH: PHAN NGỌC ANH KHOA - KTXDCTGT K27.2 CẦU HIỆN ĐẠI Hệ thống quản lý cầu Thụy Điển để tìm tổng chi phí bảo trì cho phận cầu Kết nghiên cứu cho thấy tổng chi phí bảo trì 15% đến 25% chi phí vịng đời cầu, loại cầu khác chênh lệch 50% chi phí xây dựng 1.2.5 TĨM TẮT Một số nghiên cứu yếu tố xuống cấp cầu ưu tiên bảo trì thiết lập số mơ hình phân tích cho cầu Đài Loan Tuy nhiên, tần suất, chi phí phương pháp bảo trì thực tế thành phần cầu khác sử dụng để tạo mơ hình chi phí vịng đời vốn quan trọng để có chiến lược bảo trì hiệu Ngồi ra, việc đưa định việc tiếp tục bảo trì xây dựng lại cầu chưa làm rõ Vì vậy, câu trả lời cho nghi ngờ cách đào sâu vào kết kiểm tra thực tế hồ sơ bảo trì TBMS trở thành mục tiêu nghiên cứu 1.3 HỆ THỐNG QUẢN LÝ CẦU ĐÀI LOAN (TBMS) Được hỗ trợ Viện giao thông vận tải, Bộ Giao thông vận tải Truyền thông, TBMS phát triển Đại học Trung ương Quốc gia vào năm 1999 Đài Loan TBMS sử dụng tất quan phủ chịu trách nhiệm quản lý cầu Trong TBMS, sở liệu quan hệ kết hợp quan hệ hai nhiều ghi liệu xây dựng thuộc tính Ví dụ: cần hai sở liệu, gọi “khoảng không quảng cáo” “đại lý”, thuộc tính có tên “id đại lý” thêm vào hai sở liệu để tạo mối quan hệ chúng, thể Hình 1.2 Hình 1.2 Thiết lập quan hệ liệu Hình 1.3 minh họa cấu trúc liệu TBMS Có 30 bảng liệu mô-đun TBMS, chẳng hạn Kiểm kê, Dữ liệu Kiểm tra, Hồ sơ Bảo trì, Thống kê, Hỗ trợ Quyết định, v.v., thể Hình Các Bộ luật Bảo trì Đài Loan quy định cầu cần phải kiểm tra lần hai năm Do đó, nghiên cứu NGƯỜI DỊCH: PHAN NGỌC ANH KHOA - KTXDCTGT K27.2 CẦU HIỆN ĐẠI tập trung vào liệu ba số mô-đun này; chúng mô-đun Kiểm kê, Dữ liệu Kiểm tra Hồ sơ Bảo trì, mơ tả bên 1.3.1 MƠ-ĐUN KHOẢNG KHƠNG QUẢNG CÁO Có 33.275 ghi liệu phân hệ kiểm kê; có 28.000 cầu cịn sử dụng bảo trì, số cịn lại bị thiên tai tàn phá, phải đóng cửa phá dỡ xuống cấp nghiêm trọng Trong mơ-đun này, có bốn bảng mơ tả liệu cầu Bảng kiểm kê Bridge lớp cấu trúc liệu mô-đun này; bên mố, trụ bảng nhịp Bảng kiểm kê bao gồm sáu loại liệu quản lý, hình học, cấu trúc, cấu trúc cụ thể, sông thiết kế; tổng số trường 147 trường với khoảng 33.000 ghi tích lũy kể từ năm 2000 NGƯỜI DỊCH: PHAN NGỌC ANH KHOA - KTXDCTGT K27.2 CẦU HIỆN ĐẠI Hình 1.3 Sơ đồ cấu trúc sở liệu Hình 1.4 Các mơ-đun chức TBMS 1.3.2 MÔ-ĐUN DỮ LIỆU KIỂM TRA Phương pháp kiểm tra cầu thường xuyên sử dụng TBMS gọi DER & U [10] Trong phương pháp luận này, bốn số sử dụng để đánh giá tình trạng cầu thành phần: “D” thể mức độ hư hỏng; “E” thể mức độ hư hỏng; “R” thể mức độ liên quan xuống cấp an toàn cầu; “U” thể mức độ khẩn cấp sửa chữa giảm giá trị Tất số đánh giá số thang số nguyên từ đến để mô tả trạng thái hư hỏng, trình bày Bảng NGƯỜI DỊCH: TRẦN VĂN GIÁP - KTXDCTGT K27.2 CẦU HIỆN ĐẠI Đối với bê tông cầu, 21 thành phần cần kiểm tra, các loại cầu số lượng thành phần lên đến 25 Mơ-đun liệu kiểm tra lưu trữ kiểm tra trực quan kết tất cầu Nó có ba lớp cấu trúc liệu; chúng phiếu kiểm tra chính, tổng thể, nhịp trụ Các phiếu kiểm tra có 21, 69 51 trường để ghi lại kết kiểm tra họ có khoảng 276.000, 277.000 2.000.000 ghi, tương ứng Vì quy định hành yêu cầu kiểm tra cầu hai năm lần, hồ sơ tăng khoảng 15.000 năm NGƯỜI DỊCH: TRẦN VĂN GIÁP - KTXDCTGT K27.2 CẦU HIỆN ĐẠI Đáng ý, hư hỏng tìm thấy q trình kiểm tra, yêu cầu nhập phương pháp sửa chữa đề xuất người kiểm tra Vì vậy,ở cuối cấu trúc liệu, phương pháp sửa chữa ghi theo 34 lĩnh vực; có 521.000 ghi TBMS Bảng 1.2 Tiêu chí đánh giá DER & U D E R Thành phần có Khơng có khả quan sát Liên quan không chắn U Khẩn cấp không chắn Tốt Ít hơn10% Nhỏ Kiểm tra định kỳ Khá 10~30 % Giới hạn -d Trong năm Xấu 30~60 % Chính Trong năm Nghiệm trọng Trên 60% Lớn Ngay 1.3.3 MÔ-ĐUN HỒ SƠ BẢO TRÌ Trong mơ-đun này, có bảy bảng sử dụng để ghi lại cơng việc bảo trì hợp đồng bảo trì,nhà thầu, hồ sơ chi tiết hoạt động bảo trì Hiện tại, 54.000 hồ sơ bảo trì lưu trữ mơ-đun Thời gian bảo trì, phương pháp sử dụng, chi phí số lượng thành phần sửa chữa cầu coi thông tin quan trọng nghiên cứu 1.4 PHƯƠNG PHÁP NGHIÊN CỨU Quy trình nghiên cứu với thuật tốn phần mềm mơ tả bên Thuộc tính giá trị phân tích mơ tả 1.4.1 QUY TRÌNH NGHIÊN CỨU Hình 1.2 cho thấy quy trình nghiên cứu Đáng ý, liệu bảng xuất trước tiên từ mô-đun hàng tồn kho, liệu kiểm tra hồ sơ bảo trì TBMS Các thuộc tính sử dụng để thiết lập mối quan hệ liệu bị xóa thuộc tính lặp lại bị loại trừ Sau nhập liệu vào phần mềm phân tích chọn, kết sau dự kiến đạt được: (1) bảo trì lớn thành phần, (2) thời gian bảo trì thực tế thành phần, (3) chi phí bảo trì thực tế (4) mối quan hệ khoảng không quảng cáo Chỉ số điều kiện (CI) Hệ số yếu tố số thuộc tính kiểm tra để làm cho phù hợp sửa đổi trình NGƯỜI DỊCH: LÊ SỸ CƯỜNG - KTXDCTGT K27.2 CẦU HIỆN ĐẠI Hình 1.5 Sơ đồ quy trình nghiên cứu 1.4.1.1 Xóa thuộc tính quan hệ TBMS bao gồm sở liệu quan hệ; có nhiều thuộc tính khơng hợp lệ liệu phân tích Hình phần bảng hồ sơ sửa chữa hàng hiển thị tên thuộc tính Cột C đặt tên Repair_id cột D có tên kho_id Những hai trường cho thấy bảng có liên quan đến khoảng khơng quảng cáo sửa chữa bảng hợp đồng Những loại thuộc tính khơng cần thiết q trình phân tích liệu cần xóa giảm số lượng liệu 1.4.1.2 Loại trừ giá trị thiếu tính tồn vẹn Có khoảng triệu giá trị kho, kiểm tra liệu công việc sửa chữa Một số giá trị có giá trị rỗng thuộc tính Hình thể phần liệu bến tàu Các thuộc tính có tên pylon_type, vật liệu pylon anchor_type giá trị rỗng hàng 5, Giá trị rỗng làm cho kết khơng xác chúng ảnh hưởng đến kết phân tích nhân tố Vì vậy, giá trị với null giá trị bị loại trừ nghiên cứu NGƯỜI DỊCH: LÊ SỸ CƯỜNG - KTXDCTGT K27.2 CẦU HIỆN ĐẠI Hình 1.6 Bảng ghi nhận giá trị sửa chữa Hình 1.7 Dữ liệu trụ cầu NGƯỜI DỊCH: VÕ PHÚ TOÀN - KTXDCTGT K27.2 10 CẦU HIỆN ĐẠI 1.4.2 PHƯƠNG PHÁP NGHIÊN CỨU Phân tích nhân tố thuật tốn trích xuất biến số biến quan sát phổ biến để phân tích mối tương quan yếu tố Nghiên cứu nhằm mục đích thăm dị mối quan hệ thuộc tính yếu tố khám phá phân tích kết hợp Phương pháp bao gồm bước: trích xuất yếu tố chung, định số lượng yếu tố, xoay trục, đặt tên yếu tố; trích xuất xoay công việc quan trọng được mơ tả 1.4.2.1 Trích xuất Phương pháp bao gồm hình ảnh tính tốn điểm ảnh biến thông qua hồi quy nhiều lần thực phân tích thành phần ma trận điểm ảnh Sau tính tốn, đưa hệ số ma trận tải trọng chuyển đổi thành ma trận giá trị riêng L Cơng thức tính tốn (1) (2) Trong đó: - L: ma trận giá trị riêng - V: vector riêng - Λ: hệ số ma trận tải trọng 1.4.2.2 Xoay trục Mục đích xoay trục để làm rõ mối quan hệ yếu tố để phản ánh cấu trúc yếu tố đơn giản Vì định nghĩa mơ hình liệu quan hệ độc lập với thuộc tính, phương pháp xoay trực giao coi cách thích hợp để xử lý Phương pháp làm cho phương sai bình phương hệ số tải trọng trở thành cực đơn giản hóa việc giải thích nhân tố NGƯỜI DỊCH: VÕ PHÚ TOÀN - KTXDCTGT K27.2 11 CẦU HIỆN ĐẠI 1.4.3 PHẦN MỀM PHÂN TÍCH DỮ LIỆU LỚN Phân tích liệu lớn trở thành vấn đề phổ biến gần Sau xem xét kỹ lưỡng phần mềm có, 11 loại gói phần mềm phổ biến tìm thấy Đó Matlab, SAS, R, Python, Julia, Java, Hadoop Hive, Scala, Kafka Storm, Octave GO Trong đó, Matlab SAS giới học thuật sử dụng rộng rãi, R kết hợp nhiều cổng thơng tin tiếng Do đó, nghiên cứu có kế hoạch sử dụng ba loại gói phần mềm để thực phân tích liệu lớn Đặc điểm chúng mô tả 1.4.3.1 R R phát triển Giáo sư Ihaka Gentleman Đại học Auckland New Zealand R viết để thống kê, vẽ khai thác liệu R có khả thực 25 loại chức phân tích thống kê số thu giá trị trung bình, độ lệch chuẩn, vẽ biểu đồ thực trình hồi quy Quan trọng nhất, mã nguồn R có sẵn miễn phí Những người dùng tiếng bao gồm Google, Facebook, Bank of America New York Times Ngoài chức trên, R sử dụng để tính tốn ma trận; hiệu suất hiệu so sánh với GNU Octave Matlab Hàng nghìn công cụ phần mềm bổ sung dựa kỹ thuật phân tích khác kinh tế tài thiết lập R cách nhiều ngôn ngữ khác LaTeX, JAVA, C FORTRAN 1.4.3.2 Matlab Đây phần mềm thương mại phát triển MathWorks Nó sử dụng để tạo thuật tốn, trực quan hóa liệu, khai thác liệu, phân tích tính tốn liệu Phiên R204b cho phép người dùng thiết lập bề mặt người dùng ngôn ngữ lập trình cách gọi chương trình khác viết C, C ++, JAVA, Python FORTRAN Matlab cung cấp hộp công cụ dễ sử dụng thiết lập dựa kỹ thuật khác phân tích nhân tố, thuật tốn chung, mạng nơron ANN, cho phép sử dụng để thực chức phân tích tối ưu, thống kê, xử lý tín hiệu, xử lý hình ảnh, vector phân tích tính tốn ma trận Đáng ý, việc chuẩn bị liệu thô quan trọng Matlab điều ảnh hưởng đến hiệu tính tốn 1.4.3.3 Hệ thống phân tích thống kê (SAS) Được phát triển SAS Institute Inc., SAS sử dụng phổ biến lĩnh vực thương mại nhiều thập kỷ (Wikipedia, 2014) Phiên SAS NGƯỜI DỊCH: PHAN ĐÌNH PHÙNG - KTXDCTGT K27.2 12 CẦU HIỆN ĐẠI viết ngôn ngữ C, JAVA C ++ bao gồm Phiên 9.4, bao gồm 10 mơ-đun để khai thác liệu, đồ họa trình bày, kinh tế lượng phân tích chuỗi thời gian, phân tích thử nghiệm lâm sàng, phân tích thống kê, ngơn ngữ ma trận tương tác, kiểm soát chất lượng truyền sở liệu, v.v 1.4.4 KẾT QUẢ DỰ ĐOÁN Bước nghiên cứu xây dựng hồ sơ liệu đơn lẻ bao gồm liệu trường từ bảng kiểm kê cầu, nhịp, trụ, mố, kiểm tra chính, kiểm tra chi tiết, đề xuất bảo dưỡng phương pháp hồ sơ bảo trì Bản ghi liệu có liệu bị thiếu trường có mâu thuẫn logic bị loại bỏ Các ghi nhập vào ba gói phần mềm; Matlab, SAS R đề cập Các kết dự đoán (1) tần suất bảo trì cho tất phận cầu, (2) phận cầu bảo dưỡng nhiều nhất, (3) chi phí bảo trì thực tế cho phận cầu, (4) mối quan hệ CI liệu kiểm kê cầu Cuối cùng, mơ hình đánh giá thiết lập để xác định việc tiếp tục bảo trì xây dựng lại cầu dựa phát NGƯỜI DỊCH: PHAN ĐÌNH PHÙNG - KTXDCTGT K27.2 13 BÀI BÁO GỐC International Journal of Structural and Civil Engineering Research Vol 5, No 3, August 2016 A Big Data Approach for Decision Making in Bridge Maintenance Yu-Han Chuang and Nie-Jia Yau Graduate Institute of Construction Engineering and Management, National Central University, Taoyuan, Taiwan Email: yuhan@cc.ncu.edu.tw, yau@ncu.edu.tw Abstract—The Taiwan Bridge Management System (TBMS) has been online since 2000 and the total amount of inventory is 33,275, including all kinds of bridges and culverts Currently, the number of fields in all tables in the databases of TBMS is around 6,500 with more than 3.4 million data records in its databases There are more than 11,200 bridges that are over 20 years old with another 9,300 bridge having unknown built years in the TBMS The bridges in Taiwan have stepped into the stage where maintenance is crucial and frequently required Therefore, this research aims at analyzing the database in the TBMS using Exploratory Factor Analysis for determining maintenance strategies for these bridges This paper describes results of the first year’s research efforts Relevant literature in bridge maintenance, prioritization, and life-cycle bridge management were firstly reviewed Concepts, theories, and available software for analyzing “Big Data” were also introduced. Age distribution of bridges in the TBMS is shown in Table I There are 11,263 bridges over 20 years old, and Fig shows the amount of bridge components which are deemed necessary for maintenance actions The number of seriously deteriorated components still increases gradually, even though maintenance activities have been expedited by responsible agencies for many of such components 1,300 1,200 1,100 1,000 Index Terms—bridge maintenance, bridge management, big data, decision making 900 800 Railways 700 600 500 City/ County Freeway/ Highway 400 I INTRODUCTION 2010 The Taiwan Bridge Management System (TBMS) has been online since 2000 [1] Its inventory includes 28,365 bridges with 6,524 attributes in all tables, and the total amount of data records is 3,457,274 which increase 15,000 records annually Among these attributes, there are 475 attributes containing kernel management information of a bridge such as inventory data, inspection results, and repair records Thus, the databases in the TBMS have met the definition of “Big Data.” TABLE I 726 54 1,235 2,015 2,262 262 3,198 5,722 20~30 1,004 332 4,037 5,373 30~40 971 359 2,752 4,082 40~50 252 408 606 1,266 50~60 61 104 199 364 60~70 18 65 41 124 70~80 9 27 80~90 - 15 21 90~100 - - 5 100~110 - - 1 unknown 16 135 9,214 9,365 Manuscript received July 11, 2015; revised January 12, 2016 © 2016 Int J Struct Civ Eng Res doi: 10.18178/ijscer.5.3.216-222 2013 2014 Due to limited budgets, especially for local governments, prioritization of bridge maintenance is always a tough task for the bridge management agencies, in addition to determining which option is better between maintaining and rebuilding of the bridge Life-cycle cost analysis is a feasible solution for such problem; however, such technique requires an appropriate deterioration prediction model which does not yet implemented in the TBMS In order to effectively evaluate cost efficiency of repairing work and rebuilding of bridge, this research aims to analyze the TBMS databases to obtain characteristics of bridge deterioration in Taiwan that are useful for determining maintenance strategies This twoyear research project has two stages For the first year, in addition to literature review in bridge maintenance, algorithm and available software related to big data are thoroughly investigated; and application of these techniques and software to the TBMS databases is planned to be performed in the second year For this research, the anticipated result is to obtain maintenance information such as repairing cost and period of components, progressive of deterioration conditions, and factors that trigger the repairing actions Finally, a decision support and evaluation model for Bridge’s age Freeway/Highway Railway City/ County Total ~10 2012 Figure Amount of bridge components need maintenance actions BRIDGE’S AGE OF E ACH MANAGEMENT AGENCY 10~20 2011 216 International Journal of Structural and Civil Engineering Research Vol 5, No 3, August 2016 bridges may have more than 50% difference in construction cost rebuilding of deteriorated bridges will be established from this research II E Summary Several studies in bridge deterioration factors and maintenance prioritization have established some analysis model for the bridges in Taiwan However, actual maintenance frequency, costs, and methods of various bridge components could be used to generate a life cycle cost model which is crucial to obtain a more effective maintenance strategy In addition, decision making between continuing maintenance actions and rebuilding of a new bridge still not clarified yet Thus, answers to these doubts by digging into the actual inspection results and maintenance records in the TBMS have become the major objectives of this research LITERATURE REVIEW A Bridge Deterirarion Factors in Taiwan Lin [2] successfully established a service life prediction model for expansion joint that obtained a 9% difference between the predicted and the actual service year He also discovered that horizontal acceleration, number of spans and traffic flow are the most significant factors in determining the service life of an expansion joint In addition, Su [3] collected 935 bridge inspection data in Taichung to analyze the relevancy between bridge deterioration and its environment by a logistic regression approach This study discovered that the age of bridge, the distance to sea, and using of I-type girders are the major factors that caused deterioration III Supported by the Institute of transportation, Ministry of Transportations and Communications, the TBMS was developed by National Central University in 1999 in Taiwan The TBMS is used by all the governmental agencies which are responsible for bridge management In the TBMS, relational databases are incorporated in which relations of two or more data records are built by the same attribute For example, if two databases, termed as “inventory” and “agency” are needed, an attribute named “agency’s id” can be added into both databases to create a relation between them, as show in Fig B Prioritization of Bridge Maintenance For both the central and local governments, distribution of bridge maintenance budgets is always a difficult task Chen [4] established a model to calculate a Danger Factor (DF) for a bridge by assigning weights to its major components based on their deterioration ratings multiplied by a traveler’s factor determined by level of road that bridge was on; then the component having the highest value was normalized to represent the DF of the bridge The DF can be used for both prioritization of bridge maintenance and distribution of maintenance budgets This prioritization model is currently incorporated by the TBMS Inventory Bridge id C Effectiveness of Maintenance Budget Budget spent for bridge maintenance needs to be effective Feasible ways to check the effectiveness is to investigate results of maintenance within a time period or under limited budgets Weng [5] compared the same amount of cost spent within a time period for fixing or replacing certain components to find which way is more effective Huang [6] proposed a concept of concurrently maintaining multiple components on a bridge to reduce the overall time spent for repairing various components of the bridge Lay [7] developed a maintenance cost analysis model that allowed the user to input the amount of budget for a given number of years, and the model would allocate the budget to the bridges to achieve the most effective result Bridge Name Total Length Structure Angency Type id Agency Agency id Department Address Phone Number Figure Data relation establishment D Bridge Life-Cycle Management Many researchers have promoted life cycle cost concept for bridge management for many years However, current practice in most bridge construction bids in Taiwan still not yet consider the maintenance costs Zhu [8] established an optimal model for calculating bridge total life cycle cost for RC beam bridges, considering travelers’ cost and social cost Safi [9] analyzed the Sweden bridge management system to find a total maintenance cost for bridge components The research results showed that the total maintenance cost is 15% to 25% of life cycle cost of a bridge, while different types of © 2016 Int J Struct Civ Eng Res TAIWAN BRIDGE MANAGEMENT SYSTEM (TBMS) 217 Fig illustrates the data structure of the TBMS There are 30 data tables and modules in the TBMS, such as Inventory, Inspection Data, Maintenance Records, Statistic, Decision Support, etc., as shown in Fig The Maintenance Codes in Taiwan regulates that every bridge needs to be inspected at least once per two years Hence, this research focuses on data in three of these modules; they are Inventory, Inspection Data, and Maintenance Records modules, as described below A Inventory Module There are 33,275 data records in the inventory module; among which only 28,000 bridges are still in use or under maintenance, the rest were destroyed by natural disasters, closed or demolished due to serious deterioration In this module, there are four tables that describe the basic data of a bridge Bridge main inventory table is the top layer of data structure in this module; below which are abutment, pier, and span tables The main inventory table consists of six kinds of data such as management, International Journal of Structural and Civil Engineering Research Vol 5, No 3, August 2016 geometry, structure, particular structure, river, and design; the total number of fields is 147 with roughly 33,000 records accumulated since year 2000 The abutment, pier, and span tables have data fields describing detailed geometry and design information with 42, 58, and 39 fields and around 9,700, 24,000, and 90,000 records, respectively Figure The diagram of database structure Figure Major functional modules of the TBMS the deterioration, as exhibited in Table II For a concrete bridge, 21 components need to be inspected, for other types of bridges the number of components may up to 25 This inspection data module stores visual inspection results of all bridges It has three layers of data structure; they are main, overall, spans and piers inspection sheets These inspection sheets have 21, 69, and 51 fields to record the inspection results and currently they have around 276,000, 277,000, and 2,000,000 records, respectively Since current regulation requires at least inspecting bridge once per two years, these records B Inspection Data Module The methodology of regular bridge inspections used by the TBMS is called DER&U [10] In this methodology, four indices are used to evaluate the condition of a bridge component: “D” represents the degree of deterioration; “E” represents the extent of the deterioration; “R” represents the deterioration’s relevancy to bridge safety; and “U” represents the urgency for repairing the deterioration All of these indices are numerically rated on an integer scale from to to describe the status of © 2016 Int J Struct Civ Eng Res 218 International Journal of Structural and Civil Engineering Research Vol 5, No 3, August 2016 this module The maintenance time, method used, costs and quantity of repaired components of a bridge are deemed as crucial information in this research increase roughly 15,000 annually Notably, if deterioration is found during inspection, it is required to input a suggested repairing method by the inspector Thus, at the bottom of the data structure, the suggested repairing method is also recorded by 34 fields; it has 521,000 records in the TBMS now TABLE II IV Processes of this research along with related algorithms and software are described below Attributes and tuples which will be analyzed are also depicted THE DER&U EVALUATION CRITERIA D Component not existing Good Fair Bad Serious E Unable to inspect Less than 10% 10~30 % 30~60 % Over 60% R Relevancy uncertain Minor Limite d Major Large U Urgency uncertain Routine In years In year RESEARCH METHOD A Research Processes Fig shows the processes of this research Notably, data of tables will be firstly exported from the modules of inventory, inspection data, and maintenance records in the TBMS The attributes used to establish relation of data will be deleted, and the repeated attributes will be excluded as well After importing these data into a selected analysis software, the following results are expected to be obtained: (1) the major maintenance components, (2) the actual maintenance period of components, (3) the actual maintenance cost of components, and (4) the relation between inventory and Condition Index (CI) Coefficient of factors among attributes will be examined to make appropriate modifications during these processes Immediately C Maintenance Records Module In this module, there are seven tables used to record a maintenance work such as maintenance contract, contractor, and detail records of maintenance activities, etc Currently, 54,000 maintenance records are stored in Exporting data sheet Data processing Analyzing the major component of maintenance of every structure type Analyzing the actual repair period of components of every structure type Calculating the actual cost of components of every structure type Analyzing the correlation between inventory and Condition Index Programming the analyzing code of software Analyzing the coefficient of factors Establishing the model of repair and reconstruction effectiveness analysis Modifying the model Figure Diagram of research processes 1) Deleting the relational attributes The TBMS is composed of relational databases; therefore there are many invalid attributes during data analysis Fig is a part of repair record table where the top row shows the name of attributes Column C is named repair_id, and column D is named inventory_id These two fields show that this table is related to inventory and repair contract tables These kinds of attribute are not necessary during data analysis and need to be deleted to decrease the amount of data © 2016 Int J Struct Civ Eng Res 2) Excluding lack of integrity tuples There are about million tuples in inventory, inspect data, and repair work Some tuples might have null values in attributes Fig demonstrates part of the pier data The attributes named pylon_type, pylon material, and anchor_type are null in row 5, 6, and Null values would make the result inaccurate, and they affects the result of factor analysis as well So, the tuples with null values would be excluded in this research 219 International Journal of Structural and Civil Engineering Research Vol 5, No 3, August 2016 Figure Repair record table Figure Pier data table matrix which can be transformed into an eigenvalue matrix L the mathematic model is shown in Eq (1) and Eq (2) B Research Methodology Factor analysis is an algorithm that extracts latent variables among common observed variables to analyze the correlation between factors This research aims to probe relation of attributes thus the exploratory factor analysis is incorporated This methodology consists of steps: extracting common factors, deciding the amounts of factors, rotating the axis, and naming factors; in which extraction and rotation are the most important ones as described below 1) Extraction Image factoring method calculates the image scores of variables through multiple regression, and it principal component analysis by the covariance matrix of image scores After calculation, it brings out a factor loading © 2016 Int J Struct Civ Eng Res L = VR𝑉 ′ (1) R = VL𝑉 ′ = 𝑉√𝐿√𝐿𝑉 ′ = (𝑉√𝐿)(√𝐿𝑉 ′ ) = ΛΛ′ (2) Where, L is eigenvalue matrix V is eigenvector Λ is factor loading matrix 2) Rotation The purpose of rotating factor axis is to clarify the relation of factors to reflect a simple factor structure Since the definition of relational data model is independent of attributes, the orthogonal rotation method is deemed to be the appropriate way to process This method makes the variance of factor loading square 220 International Journal of Structural and Civil Engineering Research Vol 5, No 3, August 2016 become maximum in order to simplify explanation of factors C Big Data Analysis Software Big data analysis has become a popular issue recently After a thorough review of current available software, 11 kinds of popular software packages are found They are Matlab, SAS, R, Python, Julia, Java, Hadoop and Hive, Scala, Kafka and Storm, Octave, and GO Among which, Matlab and SAS are widely used by the academia, while R is incorporated by many famous portals Thus, this research plans to utilize these three kinds of software packages to perform the big data analysis Their characteristics are depicted below 1) R R was developed by Professors Ihaka and Gentleman at the University of Auckland in New Zealand R is written for statistic, drawing, and data mining R is capable of performing 25 kinds of statistic and numerical analysis functions such as obtaining mean value, standard deviation, plotting of histogram, and executing regression process Most importantly, the source code of R is available freely Its famous users include Google, Facebook, Bank of America, and New York Times In addition to the above functions, R can be used for matrix calculation; its efficient performance can be comparable to GNU Octave and Matlab Thousands of added software tools based on various analysis techniques for economics and finance have been established on R by various languages such as LaTeX, JAVA, C, and FORTRAN 3) Tatistics Analysis System (SAS) Developed by SAS Institute Inc., SAS has been commonly used in commercial areas for decades (Wikipedia, 2014) The initial version of SAS was written in language C, and now JAVA and C++ are also included Its latest version is 9.4, including 10 main modules for data mining, graphics and presentation, econometrics and time series analysis, clinical trial analysis, statistics analysis, interactive matrix language, quality control, and database transfer, etc 2) Matlab It is commercially available software developed by MathWorks It can be used for algorithm generation, data visualization, data mining, data analysis and calculation Its latest version is R204b which allows the user to establish user surfaces by its programing language or by calling other programs written by C, C++, JAVA, Python or FORTRAN Matlab also provides an easy-to-use tool box established based on various techniques such as factor analysis, generic algorithm, neural networks and ANN, allowing the use to perform functions such as optimal analysis, statistics, signal processing, image-processing, vector analysis, and matrix calculation Notably, raw data preparation is crucial for Matlab since that may affect calculation efficiency D Anticipated Result The next step of this research taken is to formulate single data records which consists of data of fields from © 2016 Int J Struct Civ Eng Res tables of bridge inventory, span, pier, abutment, main inspection, detail inspection, suggested maintenance method, and maintenance record Data records have missing data in any field or have logic inconsistence will be eliminated These records will be input to the three software packages; Matlab, SAS, and R as mentioned above The anticipated results will be (1) a maintenance frequency for all the bridge components, (2) most maintained bridge components, (3) actual maintenance costs for bridge components, and (4) the relationship between CI and bridge inventory data Finally, an evaluation model will be established for determining continuation of maintenance or rebuilding of a bridge based on these findings V This research collected relevant literature in bridge maintenance and life-cycle costs analysis in Taiwan It was found that models for calculating bridge life cycle costs still not yet established, nor the effectiveness comparison between maintenance and rebuilding of a deteriorated bridge These have become goals of this research and are intended to be solved by digging into the big databases of the TBMS which has already been used for 15 years This research depicts the preliminary steps in data processing to decrease the amount of data and increase the accuracy, and selects an appropriate algorithm and three available software packages for big data analysis The data in the TBMS would be soon applied to find relevant maintenance information for decision making in bridge maintenance in Taiwan ACKNOWLEDGMENT The authors appreciate the financial support provided by Ministry of Science and Technology, under project number MOST 104-2221-E-008-102-MY2 REFERENCES [1] [2] [3] [4] [5] [6] [7] [8] [9] 221 CONCLUSION Institute of Transportation, MOTC, 2014 Taiwan Bridge Management System [Online] Available: http://tbms.iot.gov.tw/bms2/ J J Lin, “Modeling prediction of service lives of bridge expansion joints,” Master's thesis, National Yunlin University of Science and Technology, 2007 H J Su, “A correlation study of the existing bridges for failure analysis-case study of Taichung County,” Master's thesis, Feng Chia University, 2003 J J Chen, “Developing a maintenance decision support module for Taiwan bridge management system– An example for directorate general of highways,” Master's thesis, National Central University, 2007 K H Weng, “Comparison of economic efficiency of rehabilitation and replacement in bridge maintenance,” Master's thesis, National Central University, 2009 H Y Huang, “Establishment of bridge elements concurrent maintenance model,” Master's thesis, National Yunlin University of Science and Technology, 2007 Y C Lay, “A maintenance strategy evaluation model for network level bridges,” Master's thesis, National Central University, 2001 J Zhu and B Liu, “Performance life cost-based maintenance strategy optimization for reinforced concrete girder bridges,” Journal of Bridge Engineering, vol 18, no 2, pp 172-178, 2013 M Safi, H Sundquist, and R Karoumi, “Cost-efficient procurement of bridge infrastructures by incorporating life-cycle International Journal of Structural and Civil Engineering Research Vol 5, No 3, August 2016 Nie-Jia Yau was born in Taiwan, 1958 He obtained his Ph.D degree from Department of Civil and Environmental Engineering, University of Illinois at Urbana-Champaign in 1992 He is now Professor of Graduate Institute of Construction Engineering and Management and also Director of Research Center for Hazard Mitigation and Prevention, National Central University, Taiwan cost analysis with bridge management systems,” Journal of Bridge Engineering., vol 20, no 6, p 04014083, 2014 [10] Institute of Transportation, MOTC, Establishment of Bridge Visual Inspection and Evaluation Manual (Draft), 2011 Yu-Han Chuang was born in Taiwan, 1986 She is a Ph.D student of Graduate Institute of Construction Engineering and Management, National Central University, Taiwan © 2016 Int J Struct Civ Eng Res 222