1. Trang chủ
  2. » Giáo Dục - Đào Tạo

(LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng

66 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ MINH LÝ KHAI PHÁ DỮ LIỆU TRÊN NỀN ORACLE VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN HÀ NỘI - 2014 TIEU LUAN MOI download : skknchat@gmail.com ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ MINH LÝ KHAI PHÁ DỮ LIỆU TRÊN NỀN ORACLE VÀ ỨNG DỤNG Ngành: Công nghệ Thông tin Chuyên ngành: Hệ thống Thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: GS.TS VŨ ĐỨC THI HÀ NỘI - 2014 TIEU LUAN MOI download : skknchat@gmail.com LỜI CẢM ƠN Lời đầu tiên, xin gửi lời cảm ơn lòng biết ơn sâu sắc tới GS.TS Vũ Đức Thi, Viện Công nghệ thông tin, Viện Khoa học Công nghệ Việt Nam Thầy dành nhiều thời gian tận tình hướng dẫn, giúp đỡ tơi đ nh hướng th c n i dung luận v n Tôi xin chân thành cảm ơn thầy, cô tạo cho điều kiện thuận lợi suốt q trình tơi học tập trường Đại học Công nghệ Tôi xin chân thành cảm ơn lãnh đạo quan, bạn bè đồng nghiệp cung cấp tài liệu cho lời khuyên quý báu để th c luận v n Tôi gửi lời cảm ơn tới bạn lớp K16HTTT2 ủng h , khích lệ, giúp đỡ ln sát cánh bên tơi suốt q trình học tập, rèn luyện trường Và cuối cùng, xin gửi lời cảm ơn vơ hạn tới gia đình, người thân bạn bè bên tơi lúc khó kh n nhất, ln đ ng viên tơi, khuyến khích tơi cu c sống học tập, công việc Tôi xin chân thành cảm ơn! Hà Nội, tháng năm 2014 Học viên Nguyễn Th Minh Lý TIEU LUAN MOI download : skknchat@gmail.com LỜI CAM ĐOAN Tôi xin cam đoan đề tài nghiên cứu riêng tôi, th c s hướng dẫn GS.TS Vũ Đức Thi Các kết khai phá đề tài tiến hành khai phá chưa cơng bố cơng trình khác Hà Nội, tháng năm 2014 Học viên Nguyễn Th Minh Lý TIEU LUAN MOI download : skknchat@gmail.com MỤC LỤC DANH SÁCH CÁC HÌNH VẼ DANH SÁCH CÁC BẢNG BẢNG CÁC KÝ HIỆU VIẾT TẮT LỜI MỞ ĐẦU CHƢƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1 Khái niệm 1.2 Ứng dụng khai phá liệu .4 1.3 Ưu khai phá liệu .5 1.4 Các kỹ thuật khai phá liệu .6 1.5 Tổng kết chương CHƢƠNG 2: NGÂN HÀNG THƢƠNG MẠI VÀ GIẢI PHÁP PHÂN LỚP CÁC NGÂN HÀNG THƢƠNG MẠI 2.1 Ngân hàng thương mại xếp loại ngân hàng thương mại 2.1.1 Khái niệm ngân hàng thương mại 2.1.2 Hệ thống ch tiêu xếp loại ngân hàng thương mại 2.2 Nghiên cứu giải pháp phân lớp ngân hàng thương mại .14 2.2.1 Bài toán phân lớp m t số thuật tốn phân lớp điển hình 14 2.2.1.1 Thuật toán phân lớp Bayes .15 2.2.1.2 Thuật toán phân lớp SVM 20 2.2.1.3 Thuật toán phân lớp đ nh .24 2.2.2 Đánh giá hiệu phân lớp 26 2.3 Đề xuất mơ hình phân lớp ngân hàng thương mại .28 2.3.1 Phát biểu toán phân lớp ngân hàng thương mại 28 2.3.2 Đề xuất mơ hình phân lớp ngân hàng thương mại .28 2.4 Tổng kết chương 35 CHƢƠNG 3: CÔNG NGHỆ KHAI PHÁ DỮ LIỆU ORACLE .36 3.1 Lý sử dụng công nghệ khai phá liệu Oracle 36 3.2 Quy trình khai phá liệu sử dụng Oracle Data Miner .37 3.3 Tổng kết chương 47 TIEU LUAN MOI download : skknchat@gmail.com CHƢƠNG 4: THỰC NGHIỆM PHÂN LỚP CÁC NGÂN HÀNG THƢƠNG MẠI 48 4.1 Môi trường th c nghiệm .48 4.1.1 Cấu hình phần cứng, hệ điều hành 48 4.1.2 Công cụ phần mềm 48 4.1.3 Cài đặt kết nối phần mềm 48 4.2 Dữ liệu th c nghiệm 49 4.3 Kết th c nghiệm 52 4.3.1 Kết th c nghiệm thuật toán phân lớp Naive Bayes 52 4.3.2 Kết th c nghiệm thuật toán phân lớp SVM .53 4.3.3 Kết th c nghiệm thuật toán phân lớp đ nh 54 4.4 Đánh giá kết đạt 55 4.5 Tổng kết chương 55 KẾT LUẬN 56 TÀI LIỆU THAM KHẢO TIEU LUAN MOI download : skknchat@gmail.com DANH SÁCH CÁC HÌNH VẼ Hình 1.1 Q trình khám phá tri thức sở liệu Hình 2.1 Biểu diễn mặt phẳng siêu phẳng SVM 21 Hình 2.2 Mơ hình phân lớp đề xuất 28 Hình 2.3 Bảng tiêu ngân hàng thương mại .29 Hình 2.4 Bảng tiêu ngân hàng thương mại trích chọn 29 Hình 2.5 Bảng tiêu sử dụng để phân lớp ngân hàng thương mại 30 Hình 3.1 Màn hình ODM - chọn chức xây dựng mơ hình khai phá liệu 38 Hình 3.2 Màn hình ODM - chọn chức năng, giải thuật khai phá liệu 38 Hình 3.3 Màn hình ODM - chọn bảng liệu học cho khai phá liệu 39 Hình 3.4 Màn hình ODM - chọn thuộc tính đích bảng liệu học 39 Hình 3.5 Màn hình ODM - nhập tên cho mơ hình khai phá liệu 40 Hình 3.6 Màn hình ODM – kết xây dựng mơ hình khai phá liệu .40 Hình 3.7 Màn hình ODM – chọn chức kiểm thử mơ hình khai phá liệu .41 Hình 3.8 Màn hình ODM – chọn mơ hình khai phá liệu cần kiểm thử 41 Hình 3.9 Màn hình ODM – chọn bảng liệu kiểm thử 42 Hình 3.10 Màn hình ODM – kết kiểm thử .42 Hình 3.11 Màn hình ODM – độ tin cậy mơ hình khai phá liệu 43 Hình 3.12 Màn hình ODM – độ xác mơ hình khai phá liệu 43 Hình 3.13 Màn hình ODM – chọn chức áp dụng mơ hình khai phá liệu .44 Hình 3.14 Màn hình ODM – chọn mơ hình khai phá liệu cần áp dụng 44 Hình 3.15 Màn hình ODM – chọn bảng liệu cần khai phá .45 Hình 3.16 Màn hình ODM – chọn thuộc tính đầu vào cho khai phá 45 Hình 3.17 Màn hình ODM – nhập tên cho hoạt động khai phá 46 Hình 3.18 Màn hình ODM – kết áp dụng mơ hình khai phá liệu .46 Hình 3.19 Màn hình ODM – kết khai phá liệu 47 Hình 4.1 Định nghĩa kết nối Oracle Data Miner với sở liệu 49 TIEU LUAN MOI download : skknchat@gmail.com DANH SÁCH CÁC BẢNG Bảng Chỉ tiêu giám sát khả vốn Bảng 2.2 Chỉ tiêu giám sát chất lượng tài sản có 10 Bảng 2.3 Chỉ tiêu giám sát khả sinh lời 11 Bảng 2.4 Chỉ tiêu giám sát khả khoản 12 Bảng 2.5 Chỉ tiêu giám sát rủi ro khác 13 Bảng 2.6 Xếp loại ngân hàng thương mại .13 Bảng 2.7 Ví dụ liệu tiêu giám sát 17 Bảng 2.8 Ví dụ liệu tiêu giám sát quy đổi 18 Bảng 2.9 Ví dụ tính xác suất thuộc tính 19 Bảng 2.10 Bảng ký hiệu 26 Bảng 2.11 Ví dụ tập vectơ đặc trưng thứ .31 Bảng 2.12 Ví dụ tập vectơ đặc trưng thứ hai .32 Bảng 2.13 Ví dụ liệu gốc cần phân lớp 33 Bảng 2.14 Ví dụ kết phân lớp với liệu gốc .33 Bảng 2.15 Ví dụ liệu quy đổi cần phân lớp .34 Bảng 2.16 Ví dụ kết phân lớp với liệu quy đổi 34 Bảng 3.1 Các chức khai phá liệu dự đoán Oracle .36 Bảng 3.2 Các chức khai phá liệu mô tả Oracle 37 Bảng 4.1 Cấu hình phần cứng, hệ điều hành .48 Bảng 4.2 Danh sách phần mềm sử dụng 48 Bảng 4.3 Các tiêu xếp loại ngân hàng thương mại 49 Bảng 4.4 Tiêu chí quy đổi điểm 50 Bảng 4.5 Phân bố liệu huấn luyện 51 Bảng 4.6 Phân bố liệu kiểm thử 51 Bảng 4.7 Kết thực nghiệm phân lớp Naive Bayes với liệu gốc 52 Bảng 4.8 Kết thực nghiệm phân lớp Naive Bayes với liệu quy đổi 52 Bảng 4.9 Kết thực nghiệm phân lớp SVM với liệu gốc 53 Bảng 4.10 Kết thực nghiệm phân lớp SVM với liệu quy đổi 53 Bảng 4.11 Kết thực nghiệm phân lớp định với liệu gốc 54 Bảng 4.12 Kết thực nghiệm phân lớp định với liệu quy đổi 54 TIEU LUAN MOI download : skknchat@gmail.com BẢNG CÁC KÝ HIỆU VIẾT TẮT Từ cụm từ Kí hiệu viết tắt Oracle data miner ODM One-against-Rest OAR One-against-One OAO Support vector machine SVM TIEU LUAN MOI download : skknchat@gmail.com LỜI MỞ ĐẦU Ngày nay, đơn v , tổ chức có áp dụng cơng nghệ thơng tin vào quản lý, ứng dụng dừng lại mức đ ứng dụng tác nghiệp thông thường với chức n ng hỗ trợ đưa thông tin vào kết xuất báo cáo đầu Những ứng dụng hỗ trợ cao cho phân tích, hỗ trợ đ nh chưa nhiều Tuy nhiên với xu hướng phát triển tại, chắn cần đến ứng dụng khai phá tri thức tiềm ẩn sở liệu Bảo hiểm tiền gửi Việt Nam tổ chức tài Nhà nước với nhiệm vụ bảo vệ quyền lợi ích hợp pháp người gửi tiền, góp phần trì s ổn đ nh tổ chức tham gia Bảo hiểm tiền gửi s phát triển an toàn lành mạnh hoạt đ ng ngân hàng Với nhiệm vụ giao, m t cơng tác Bảo hiểm tiền gửi Việt Nam giám sát tổ chức tham gia Bảo hiểm tiền gửi (đánh giá rủi ro, xếp loại tổ chức tham gia Bảo hiểm tiền gửi,…) Áp dụng công nghệ tin học vào công tác giám sát tổ chức tham gia Bảo hiểm tiền gửi từ n m đầu thành lập Bảo hiểm Tiền gửi Việt Nam, đến Bảo hiểm tiền gửi Việt Nam xây d ng hệ thống công nghệ thông tin đáp ứng nhiệm vụ giám sát tổ chức tham gia Bảo hiểm tiền gửi Tuy nhiên, sở liệu Bảo hiểm tiền gửi Việt Nam ch sử dụng để phục vụ tác nghiệp ngày, báo cáo, thống kê Tại Bảo hiểm tiền gửi Việt Nam, ứng dụng dừng mức đưa báo cáo liệt kê ch tiêu tổ chức tham gia Bảo hiểm tiền gửi cán b giám sát Bảo hiểm tiền gửi c n vào báo cáo để phân tích, đánh giá tổ chức tham gia Bảo hiểm tiền gửi (phân tích ch tiêu m t cách riêng lẻ) Với số lượng tổ chức tham gia Bảo hiểm tiền gửi ngày t ng, việc xem xét trường hợp, số liệu cụ thể tổ chức tham gia Bảo hiểm tiền gửi trở nên khó kh n cần cơng cụ hỗ trợ Mong muốn cán b giám sát có ứng dụng t đ ng phân tích d a nhiều ch tiêu đưa số liệu ch tiêu m t tổ chức tham gia Bảo hiểm tiền gửi vào có câu trả lời xếp loại tổ chức Hiện tại, Bảo hiểm tiền gửi Việt Nam th c đấu thầu để triển khai d án hệ thống thông tin quản lý đại hóa ngân hàng - Hợp phần Bảo hiểm tiền gửi Việt Nam M t yêu cầu phân hệ Giám sát rủi ro hệ thống hệ thống phải cho phép tiến hành khai thác liệu, hệ thống phải cung cấp công cụ hỗ trợ hoạt đ ng: đánh giá rủi ro, xếp loại tổ chức tham gia Bảo hiểm tiền gửi Với tìm hiểu trên, cho thấy áp dụng khai phá liệu với sở liệu Bảo hiểm tiền gửi Việt Nam để đáp ứng mong muốn cán b giám sát, từ nâng cao hiệu công tác giám sát, đánh giá, xếp loại tổ chức tham gia Bảo hiểm tiền gửi TIEU LUAN MOI download : skknchat@gmail.com 43 - Đ tin cậy mô hình thể thẻ Preditive Confidence hình sau: Hình 3.11 Màn hình ODM – độ tin cậy mơ hình khai phá liệu - Đ xác mơ hình thể thẻ Accuracy hình sau: Hình 3.12 Màn hình ODM – độ xác mơ hình khai phá liệu TIEU LUAN MOI download : skknchat@gmail.com 44 Bước 5: Áp dụng mơ hình khai phá vào khai phá liệu: - Trên giao diện chương trình, chọn Activity -> chọn Apply Hình 3.13 Màn hình ODM – chọn chức áp dụng mơ hình khai phá liệu - Chọn mơ hình khai phá Hình 3.14 Màn hình ODM – chọn mơ hình khai phá liệu cần áp dụng TIEU LUAN MOI download : skknchat@gmail.com 45 - Chọn bảng liệu cần khai phá Hình 3.15 Màn hình ODM – chọn bảng liệu cần khai phá - Chọn thu c tính đầu vào Hình 3.16 Màn hình ODM – chọn thuộc tính đầu vào cho khai phá TIEU LUAN MOI download : skknchat@gmail.com 46 - Nhập tên hoạt đ ng khai phá liệu Hình 3.17 Màn hình ODM – nhập tên cho hoạt động khai phá - Chọn Run Activity để hồn thành việc khai phá Hình 3.18 Màn hình ODM – kết áp dụng mơ hình khai phá liệu TIEU LUAN MOI download : skknchat@gmail.com 47 - Chọn Result để xem kết d đoán Hình 3.19 Màn hình ODM – kết khai phá liệu 3.3 Tổng kết chƣơng Chương trình bày lý sử dụng công nghệ khai phá liệu Oracle, quy trình khai phá liệu sử dụng công cụ Oracle Data Miner TIEU LUAN MOI download : skknchat@gmail.com 48 CHƢƠNG 4: THỰC NGHIỆM PHÂN LỚP CÁC NGÂN HÀNG THƢƠNG MẠI 4.1 Môi trƣờng thực nghiệm 4.1.1 Cấu hình phần cứng, hệ điều hành Bảng 4.1 Cấu hình phần cứng, hệ điều hành Thành phần Chỉ số CPU Intel Core Duo 3.00 GHz RAM GB HDD 150 GB OS Microsoft Window XP Service Park 4.1.2 Công cụ phần mềm Trong luận v n sử dụng phần mềm bảng sau: Bảng 4.2 Danh sách phần mềm sử dụng STT Tên phần mềm Oracle database 10g Java JDK 1.4.2 Oracle Data Miner 10.2.0.1 Nguồn Đĩa CD chứa b cài Oracle Database 10g http://www.oracle.com/technetwork/database/e nterprise-edition/odminer-install-10202098193.html 4.1.3 Cài đặt kết nối phần mềm Để sử dụng Oracle Data Miner Microsoft Windows, cần cài đặt kết nối sau: Cài đặt Oracle Database 10g tạo Database chứa liệu th c nghiệm Cài đặt Java JDK 1.4.2 Tải odminer.zip Giải nén tệp odminer.zip Chạy (nhấp đúp chu t) tệp odminerw.exe thư mục bin vừa giải nén Đ nh nghĩa m t kết nối mô tả đây: (Host đ a ch máy chứa liệu th c nghiệm) TIEU LUAN MOI download : skknchat@gmail.com 49 Hình 4.1 Định nghĩa kết nối Oracle Data Miner với sở liệu 4.2 Dữ liệu thực nghiệm Dữ liệu th c nghiệm gồm liệu ch tiêu giám sát 98 ngân hàng thương mại n m 2010, 2011, 2012, 2013 Dữ liệu th c nghiệm có tất 4253 ghi Toàn b liệu th c nghiệm tiền xử lý gán nhãn sau: Trong phạm vi luận v n, ch xét ch tiêu bảng sau làm c n để đánh giá, xếp loại ngân hàng thương mại: Bảng 4.3 Các tiêu xếp loại ngân hàng thương mại Mã tiêu Tên tiêu M51 Chênh lệch thu nhập, chi phí M246 Lỗ lũy kế M111 Tỷ lệ nợ xấu M112 Tỷ lệ nợ hạn M107 Tỷ lệ đầu tư, mua sắm tài sản cố đ nh so với Vốn cấp M108 Giới hạn góp vốn mua cổ phần TIEU LUAN MOI download : skknchat@gmail.com 50 Tiêu chí cho điểm ch tiêu sau: Bảng 4.4 Tiêu chí quy đổi điểm Chỉ tiêu Điểm Chênh lệch thu nhập, chi phí >0 A =0 B 0 A =0 B 1 4 ch tiêu b điểm C NHTM xếp loại D Tập liệu th c nghiệm chia làm hai tập con, tập liệu huấn luyện tập liệu kiểm thử Trong đó: - Tập liệu huấn luyện phân bố sau: Bảng 4.5 Phân bố liệu huấn luyện STT Lớp Số trƣờng hợp A 1663 B 861 C 217 D 93 Tổng - 2834 Tập liệu kiểm thử phân bố sau: Bảng 4.6 Phân bố liệu kiểm thử STT Lớp Số trƣờng hợp A 990 B 500 C 138 D 53 Tổng 1681 TIEU LUAN MOI download : skknchat@gmail.com 52 4.3 Kết thực nghiệm 4.3.1 Kết thực nghiệm thuật toán phân lớp Naive Bayes a) Kết thực nghiệm với liệu gốc Bảng 4.7 Kết thực nghiệm phân lớp Naive Bayes với liệu gốc STT Lớp Số trƣờng hợp phân lớp A 875 29 0,9679 0,8838 0,9239 B 403 117 0,775 0,806 0,7902 C 109 97 0,5291 0,7899 0,6337 D 51 0,9623 0,9808 Số trƣờng hợp phân lớp sai Độ Độ hồi F-Measure xác tƣởng (Precision) (Recall) (Đ đo F)  = 0,8554 M = 0,8605 b) Kết thực nghiệm với liệu quy đổi Bảng 4.8 Kết thực nghiệm phân lớp Naive Bayes với liệu quy đổi STT Lớp Số trƣờng hợp phân lớp A 802 119 0,9808 0,9903 B 372 199 0,8923 0,928 0,9098 C 80 28 0,7372 0,7319 0,7345 D 50 31 1 Số trƣờng hợp phân lớp sai Độ Độ hồi F-Measure xác tƣởng (Precision) (Recall) (Đ đo F)  = 0,9453 M = 0,9102 TIEU LUAN MOI download : skknchat@gmail.com 53 4.3.2 Kết thực nghiệm thuật toán phân lớp SVM a) Kết thực nghiệm với liệu gốc Bảng 4.9 Kết thực nghiệm phân lớp SVM với liệu gốc STT Lớp Số trƣờng hợp phân lớp A 802 119 0,8708 0,8101 0,8394 B 372 199 0,6515 0,744 0,6947 C 80 28 0,7407 0,5797 0,6504 D 50 31 0,6173 0,9434 0,7463 Số trƣờng hợp phân lớp sai Độ Độ hồi F-Measure xác tƣởng (Precision) (Recall) (Đ đo F)  = 0,7757 M = 0,7693 b) Kết thực nghiệm với liệu quy đổi Bảng 4.10 Kết thực nghiệm phân lớp SVM với liệu quy đổi STT Lớp Số trƣờng hợp phân lớp A 990 42 0,9593 0,9792 B 405 17 0,9597 0,81 0,8785 C 106 52 0,6709 0,7681 0,7162 4 D 53 15 0,7681 0,8688 Số trƣờng hợp phân lớp sai Độ Độ hồi xác tƣởng (Precision) (Recall) F-Measure (Đ đo F)  = 0,9244 M = 0,8945 TIEU LUAN MOI download : skknchat@gmail.com 54 4.3.3 Kết thực nghiệm thuật toán phân lớp định a) Kết thực nghiệm với liệu gốc Bảng 4.111 Kết thực nghiệm phân lớp định với liệu gốc STT Lớp Số trƣờng hợp phân lớp A 979 0,9919 0,9889 0,9904 B 475 30 0,9406 0,95 0,9453 C 118 17 0,8741 0,8551 0,8645 D 53 0,9815 0,9907 Số trƣờng hợp phân lớp sai Độ Độ hồi F-Measure xác tƣởng (Precision) (Recall) (Đ đo F)  = 0,9667 M = 0,9485 b) Kết thực nghiệm với liệu quy đổi Bảng 4.122 Kết thực nghiệm phân lớp định với liệu quy đổi STT Lớp Số trƣờng hợp phân lớp A 999 0,999 0,9995 B 495 10 0,9802 0,99 0,9851 C 127 0,9695 0,9203 0,9443 D 53 0,9815 0,9907 Số trƣờng hợp phân lớp sai Độ Độ hồi F-Measure xác tƣởng (Precision) (Recall) (Đ đo F)  = 0,9905 M = 0,9776 TIEU LUAN MOI download : skknchat@gmail.com 55 4.4 Đánh giá kết đạt đƣợc Quá trình th c nghiệm mơ hình giải tốn phân lớp ngân hàng thương mại d a phương pháp đinh, phương pháp máy hỗ trợ vector SVM phương pháp Naive Bayes bước đầu cho thấy kết tương đối khả quan với đ xác cao Trong đó, th c nghiệm sử dụng liệu gốc, phương pháp đ nh cho kết có đ tin cậy (93,13%) đ xác (96,67%) cao nhất, phương pháp Naive Bayes cho kết có đ tin cậy (81,4%) đ xác (85,54) cao so với phương pháp máy hỗ trợ vector SVM Thời gian xây d ng mơ hình thuật toán nhanh, với liệu thử nghiệm thời gian xây d ng mơ hình, kiểm thử mơ hình áp dụng mơ hình ba thuật toán ch vài giây Th c nghiệm cho thấy việc sử dụng liệu quy đổi ba thuật toán cho kết tốt việc sử dụng liệu gốc Kết th c nghiệm cho thấy mơ hình d đốn có tính khả thi áp dụng th c tế 4.5 Tổng kết chƣơng Chương trình bày quy trình phân lớp ngân hàng thương mại sở mơ hình đề xuất chương 2, th c nghiệm đánh giá kết phân lớp ngân hàng thương mại d a phương pháp đinh, phương pháp máy hỗ trợ vector SVM phương pháp Naive Bayes TIEU LUAN MOI download : skknchat@gmail.com 56 KẾT LUẬN Từ việc nghiên cứu toán phân lớp ngân hàng thương mại, luận v n đề xuất mơ hình giải phân lớp ngân hàng thương mại d a phương pháp đ nh, phương pháp máy hỗ trợ vector (SVM) phương pháp Naive Bayes Qua kết th c nghiệm đạt cho thấy mơ hình đề xuất d a phương pháp đ nh có đ xác cao D a vào kết th c nghiệm thấy mơ hình xây d ng có tính khả thi áp dụng th c tế Về mặt n i dung, luận v n đạt kết sau: - Trình bày khái niệm chung khai phá liệu - Trình bày toán phân lớp phân lớp d a phương pháp đinh, phương pháp máy hỗ trợ vector (SVM) phương pháp Naive Bayes - Trình bày toán phân lớp ngân hàng thương mại mơ hình giải tốn phân lớp ngân hàng thương mại - Trình bày cơng nghệ khai phá liệu Oracle, công cụ khai phá liệu Oracle Data Miner - Th c nghiệm phân lớp ngân hàng thương mại thuật toán phân lớp đ nh, thuật toán Naive Bayes thuật toán SVM Oracle Data Miner - Đánh giá kết đạt Nhìn chung, hướng tiếp cận đề tài đắn có tính th c tiễn cao Để đưa mơ hình phân lớp ngân hàng thương mại vào ứng dụng m t cách hiệu Bảo hiểm tiền gửi Việt Nam Bảo hiểm tiền gửi Việt Nam cần có chế thu thập liệu ngân hàng thương mại đầy đủ xác nữa, cần xây d ng b học liệu lớn xác (b liệu đánh giá rủi ro ngân hàng thương mại c n vào toàn b hệ thống ch tiêu giám sát), áp dụng mơ hình d đốn vào th c tế, kiểm chứng th c tế đánh giá kết m t cách thường xuyên Ngoài ra, luận v n tham khảo để giải toán đánh giá rủi ro, phân lớp quỹ tín dụng c n vào hệ thống ch tiêu giám sát quỹ tín dụng d a phương pháp phân lớp sử dụng công cụ Oracle Data Miner Đối với hệ thống thông tin quản lý đại hóa ngân hàng - Hợp phần Bảo hiểm tiền gửi Việt Nam đấu thầu để triển khai, m t yêu cầu phân hệ Giám sát rủi ro hệ thống hệ thống phải cho phép tiến hành khai thác liệu, hệ thống phải cung cấp công cụ hỗ trợ hoạt đ ng: đánh giá rủi ro, xếp hạng tổ chức tham gia Bảo hiểm tiền gửi Vì vậy, kết nghiên cứu luận v n tiền đề cho việc triển khai phân hệ Giám sát rủi ro hệ thống TIEU LUAN MOI download : skknchat@gmail.com TÀI LIỆU THAM KHẢO Tiếng Việt [1] Đinh Th Kim Dung (2004), “M t số thử nghiệm khai phá liệu sở liệu ORACLE”, Đại học Công nghệ, Đại học Quốc gia Hà N i [2] Lường Hồng Giang (2012), “Ứng dụng m t số kỹ thuật khai phá liệu để phân tích liệu viễn thơng nhằm t ng cường chất lượng d ch vụ khách hàng”, Đại học Công nghệ, Đại học Quốc gia Hà N i [3] Đoàn Nhật Minh (2003), “Nghiên cứu m t số phương pháp khai phá liệu thiết kế, xây d ng ứng dụng khai phá liệu kho liệu khách hàng bưu điện Tp Hà N i”, Đại học Công nghệ, Đại học Quốc gia Hà N i [4] Vũ Thanh Nguyên, Trang Nhật Quang (2009) ,“Ứng dụng thuật tốn phân lớp rút trích thơng tin v n FSVM Internet”, Tạp chí Phát triển Khoa học Công nghệ, tập 12, số 05-2009 [5] Hà Quang Thụy (2013), Bài giảng “Kho liệu khai phá liệu” [6] Hà Quang Thụy, Phan Xuân Hiếu, Đoàn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú (2009), “Giáo trình khai phá liệu Web”, Nhà xuất Giáo dục Việt Nam [7] Nguyễn Thu Trà (2006), “Nghiên cứu áp dụng m t số kỹ thuật khai phá liệu với sở liệu ngành Thuế Việt Nam”, Luận v n thạc sỹ khoa học, Trường Đại học Bách Khoa Hà N i [8] Website: http://bis.net.vn Tiếng Anh [9] Jiawei Han and Michelline Kamber (2000), “Data mining: Concepts and Techniques”, Morgan Kaufmann Publishers [10] Oracle (2003), “Oracle Data Mining Concepts 10g Release 1”, Oracle Corporation [11] Oracle (2008), “Oracle Data Mining Tutorial for Oracle Data Mining 10g Release 2”, Oracle Corporation [12] Oracle (2003), “Oracle Data Mining Administrator's Guide 10g Release 1”, Oracle Corporation TIEU LUAN MOI download : skknchat@gmail.com ... Ƣu khai phá liệu Khai phá liệu có nhiều ứng dụng m t số ưu rõ rệt xem xét đây: + So với phương pháp học máy, khai phá liệu có lợi chỗ, khai phá liệu sử dụng với sở liệu chứa nhiều nhiễu, liệu. .. thống trích lọc tri thức từ liệu sở liệu khổng lồ Song so với phương pháp khác, khai phá liệu có m t số ưu rõ rệt [5] 1.2 Ứng dụng khai phá liệu Phát tri thức khai phá liệu liên quan đến nhiều ngành,... CHƢƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1 Khái niệm 1.2 Ứng dụng khai phá liệu .4 1.3 Ưu khai phá liệu .5 1.4 Các kỹ thuật khai phá liệu .6 1.5 Tổng

Ngày đăng: 27/06/2022, 09:13

Xem thêm:

HÌNH ẢNH LIÊN QUAN

BẢNG CÁC KÝ HIỆU VIẾT TẮT - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
BẢNG CÁC KÝ HIỆU VIẾT TẮT (Trang 9)
Hình 1.1. Quá trình khám phá tri thức trong cơ sở dữ liệu - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Hình 1.1. Quá trình khám phá tri thức trong cơ sở dữ liệu (Trang 13)
Bảng 2.2. Chỉ tiêu giám sát chất lượng tài sản có - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Bảng 2.2. Chỉ tiêu giám sát chất lượng tài sản có (Trang 19)
Bảng 2.3. Chỉ tiêu giám sát khả năng sinh lời - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Bảng 2.3. Chỉ tiêu giám sát khả năng sinh lời (Trang 20)
Bảng 2.4. Chỉ tiêu giám sát khả năng thanh khoản - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Bảng 2.4. Chỉ tiêu giám sát khả năng thanh khoản (Trang 21)
Bảng 2.6. Xếp loại các ngân hàng thương mại - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Bảng 2.6. Xếp loại các ngân hàng thương mại (Trang 22)
Hình 2.1. Biểu diễn của mặt phẳng siêu phẳng của SVM - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Hình 2.1. Biểu diễn của mặt phẳng siêu phẳng của SVM (Trang 30)
2.3. Đề xuất mô hình phân lớp các ngân hàng thƣơng mại 2.3.1. Phát biểu bài toán phân lớp các ngân hàng thƣơng mại  - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
2.3. Đề xuất mô hình phân lớp các ngân hàng thƣơng mại 2.3.1. Phát biểu bài toán phân lớp các ngân hàng thƣơng mại (Trang 37)
Hình 4.3. Bảng chỉ tiêu của ngân hàng thương mại - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Hình 4.3. Bảng chỉ tiêu của ngân hàng thương mại (Trang 38)
Hình 2.6. Bảng chỉ tiêu sử dụng để phân lớp các ngân hàng thương mại - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Hình 2.6. Bảng chỉ tiêu sử dụng để phân lớp các ngân hàng thương mại (Trang 39)
Bảng 2.11. Ví dụ tập vectơ đặc trưng thứ nhất - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Bảng 2.11. Ví dụ tập vectơ đặc trưng thứ nhất (Trang 40)
Bảng 2.14. Ví dụ kết quả phân lớp với dữ liệu gốc - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Bảng 2.14. Ví dụ kết quả phân lớp với dữ liệu gốc (Trang 42)
Bảng 2.13. Ví dụ dữ liệu gốc cần phân lớp - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Bảng 2.13. Ví dụ dữ liệu gốc cần phân lớp (Trang 42)
Hình 3.3. Màn hình OD M- chọn bảng dữ liệu học cho khai phá dữ liệu - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Hình 3.3. Màn hình OD M- chọn bảng dữ liệu học cho khai phá dữ liệu (Trang 48)
Hình 3.5. Màn hình OD M- nhập tên cho mô hình khai phá dữ liệu - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Hình 3.5. Màn hình OD M- nhập tên cho mô hình khai phá dữ liệu (Trang 49)
Bước 4: Kiểm thử mô hình trên tập dữ liệu kiểm thử: - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
c 4: Kiểm thử mô hình trên tập dữ liệu kiểm thử: (Trang 50)
- Chọn bảng dữ liệu kiểm thử - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
h ọn bảng dữ liệu kiểm thử (Trang 51)
Hình 3.11. Màn hình ODM – độ tin cậy của mô hình khai phá dữ liệu - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Hình 3.11. Màn hình ODM – độ tin cậy của mô hình khai phá dữ liệu (Trang 52)
Hình 3.13. Màn hình ODM – chọn chức năng áp dụng mô hình khai phá dữ liệu - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Hình 3.13. Màn hình ODM – chọn chức năng áp dụng mô hình khai phá dữ liệu (Trang 53)
Bước 5: Áp dụng mô hình khai phá vào khai phá dữ liệu: - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
c 5: Áp dụng mô hình khai phá vào khai phá dữ liệu: (Trang 53)
Hình 3.15. Màn hình ODM – chọn bảng dữ liệu cần khai phá - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Hình 3.15. Màn hình ODM – chọn bảng dữ liệu cần khai phá (Trang 54)
- Chọn bảng dữ liệu cần khai phá - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
h ọn bảng dữ liệu cần khai phá (Trang 54)
Hình 3.18. Màn hình ODM – kết quả áp dụng mô hình khai phá dữ liệu - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Hình 3.18. Màn hình ODM – kết quả áp dụng mô hình khai phá dữ liệu (Trang 55)
Hình 3.17. Màn hình ODM – nhập tên cho hoạt động khai phá - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Hình 3.17. Màn hình ODM – nhập tên cho hoạt động khai phá (Trang 55)
Hình 3.19. Màn hình ODM – kết quả khai phá dữ liệu - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Hình 3.19. Màn hình ODM – kết quả khai phá dữ liệu (Trang 56)
Hình 4.1. Định nghĩa một kết nối Oracle Data Miner với cơ sở dữ liệu - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Hình 4.1. Định nghĩa một kết nối Oracle Data Miner với cơ sở dữ liệu (Trang 58)
Bảng 4.4. Tiêu chí quy đổi điểm - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Bảng 4.4. Tiêu chí quy đổi điểm (Trang 59)
Bảng 4.9. Kết quả thực nghiệm phân lớp SVM với dữ liệu gốc - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Bảng 4.9. Kết quả thực nghiệm phân lớp SVM với dữ liệu gốc (Trang 62)
Bảng 4.111. Kết quả thực nghiệm phân lớp cây quyết định với dữ liệu gốc - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Bảng 4.111. Kết quả thực nghiệm phân lớp cây quyết định với dữ liệu gốc (Trang 63)
Bảng 4.122. Kết quả thực nghiệm phân lớp cây quyết định với dữ liệu quy đổi - (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng
Bảng 4.122. Kết quả thực nghiệm phân lớp cây quyết định với dữ liệu quy đổi (Trang 63)

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w