CHƯƠNG 2 CƠ SỞ LÝ THUYẾT CỦA NGHIÊN CỨU
2.5. Lý thuyết về các mơ hình dự đốn dầm BTCT ăn mòn
2.5.1. Khai phá dữ liệu (KPD L Data Mining)
Khai phá dữ liệu (KPDL) được ra đời vào cuối thập kỷ 80. Nhằm phát hiện ra các thơng tin có giá trị tiềm ẩn trong các tập dữ liệu lớn. Khai phá dữ liệu liên quan đến việc phân tích và sử dụng các kỹ thuật, cơng cụ để tìm ra các đặc điểm mẫu trong tập dữ liệu [45, 46].
Hình 2.19 Quá trình khai phá dữ liệu [45]
Các giải thuật KPDL được mơ tả bằng những chương trình hoạt động trực tiếp trên tệp dữ liệu. Quá trình xử lý KPDL (Hình 2.19) gồm các bước sau.
Bước 1: Bắt đầu bằng cách xác định vấn đề cần giải quyết.
Bước 2: Sau đó sẽ xác định các dữ liệu liên quan dùng để xây dựng giải pháp. Bước 3: Là thu thập các dữ liệu có liên quan và xử lý chúng thành dạng sao
cho giải thuật KPDL có thể hiểu được.
Bước 4: Chọn thuật tốn KPDL thích hợp và thực hiện việc KPDL để tìm
được các mẫu có ý nghĩa dưới dạng biểu diễn tương ứng với các ý nghĩa đó.
Đặc điểm của mẫu phải là. Độ mới có thể được đo tương ứng với độ thay đổi trong dữ liệu (bằng cách so sánh các giá trị hiện tại với các giá trị trước đó hoặc các giá trị mong muốn), hoặc bằng tri thức (mối liên hệ giữa phương pháp tìm mới và phương pháp cũ như thế nào).
38 Kỹ thuật KPDL thực chất là sự kế thừa, kết hợp và mở rộng của các kỹ thuật cơ bản đã được nghiên cứu từ trước như máy học, nhận dạng, thống kê (hồi quy, xếp loại, phân cụm), các mơ hình đồ thị, trí tuệ nhân tạo, v.v…
Có thể hiểu, KPDL là một q trình tìm kiếm, phát hiện các tri thức mới được tiềm ẩn ở trong các cơ sở dữ liệu lớn. Khai phá tri thức là mục tiêu quan trọng của KPDL. Cụ thể KPDL là một bước chính trong q trình khai phá tri thức [46].