Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

66 1 0
Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ MINH LÝ KHAI PHÁ DỮ LIỆU TRÊN NỀN ORACLE VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN HÀ NỘI - 2014 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ MINH LÝ KHAI PHÁ DỮ LIỆU TRÊN NỀN ORACLE VÀ ỨNG DỤNG Ngành: Công nghệ Thông tin Chuyên ngành: Hệ thống Thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: GS.TS VŨ ĐỨC THI HÀ NỘI - 2014 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com LỜI CẢM ƠN Lời đầu tiên, xin gửi lời cảm ơn lòng biết ơn sâu sắc tới GS.TS Vũ Đức Thi, Viện Công nghệ thông tin, Viện Khoa học Công nghệ Việt Nam Thầy dành nhiều thời gian tận tình hướng dẫn, giúp đỡ đ nh hướng th c n i dung luận v n Tôi xin chân thành cảm ơn thầy, cô tạo cho điều kiện thuận lợi suốt q trình tơi học tập trường Đại học Công nghệ Tôi xin chân thành cảm ơn lãnh đạo quan, bạn bè đồng nghiệp cung cấp tài liệu cho lời khuyên quý báu để th c luận v n Tôi gửi lời cảm ơn tới bạn lớp K16HTTT2 ủng h , khích lệ, giúp đỡ ln sát cánh bên tơi suốt q trình học tập, rèn luyện trường Và cuối cùng, xin gửi lời cảm ơn vơ hạn tới gia đình, người thân bạn bè bên lúc khó kh n nhất, ln đ ng viên tơi, khuyến khích tơi cu c sống học tập, công việc Tôi xin chân thành cảm ơn! Hà Nội, tháng năm 2014 Học viên Nguyễn Th Minh Lý LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com LỜI CAM ĐOAN Tôi xin cam đoan đề tài nghiên cứu riêng tôi, th c s hướng dẫn GS.TS Vũ Đức Thi Các kết khai phá đề tài tiến hành khai phá chưa công bố cơng trình khác Hà Nội, tháng năm 2014 Học viên Nguyễn Th Minh Lý LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com MỤC LỤC DANH SÁCH CÁC HÌNH VẼ DANH SÁCH CÁC BẢNG BẢNG CÁC KÝ HIỆU VIẾT TẮT LỜI MỞ ĐẦU CHƢƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1 Khái niệm 1.2 Ứng dụng khai phá liệu .4 1.3 Ưu khai phá liệu .5 1.4 Các kỹ thuật khai phá liệu .6 1.5 Tổng kết chương CHƢƠNG 2: NGÂN HÀNG THƢƠNG MẠI VÀ GIẢI PHÁP PHÂN LỚP CÁC NGÂN HÀNG THƢƠNG MẠI 2.1 Ngân hàng thương mại xếp loại ngân hàng thương mại 2.1.1 Khái niệm ngân hàng thương mại 2.1.2 Hệ thống ch tiêu xếp loại ngân hàng thương mại 2.2 Nghiên cứu giải pháp phân lớp ngân hàng thương mại .14 2.2.1 Bài toán phân lớp m t số thuật toán phân lớp điển hình 14 2.2.1.1 Thuật tốn phân lớp Bayes .15 2.2.1.2 Thuật toán phân lớp SVM 20 2.2.1.3 Thuật toán phân lớp đ nh .24 2.2.2 Đánh giá hiệu phân lớp 26 2.3 Đề xuất mơ hình phân lớp ngân hàng thương mại .28 2.3.1 Phát biểu toán phân lớp ngân hàng thương mại 28 2.3.2 Đề xuất mơ hình phân lớp ngân hàng thương mại .28 2.4 Tổng kết chương 35 CHƢƠNG 3: CÔNG NGHỆ KHAI PHÁ DỮ LIỆU ORACLE .36 3.1 Lý sử dụng công nghệ khai phá liệu Oracle 36 3.2 Quy trình khai phá liệu sử dụng Oracle Data Miner .37 3.3 Tổng kết chương 47 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com CHƢƠNG 4: THỰC NGHIỆM PHÂN LỚP CÁC NGÂN HÀNG THƢƠNG MẠI 48 4.1 Môi trường th c nghiệm .48 4.1.1 Cấu hình phần cứng, hệ điều hành 48 4.1.2 Công cụ phần mềm 48 4.1.3 Cài đặt kết nối phần mềm 48 4.2 Dữ liệu th c nghiệm 49 4.3 Kết th c nghiệm 52 4.3.1 Kết th c nghiệm thuật toán phân lớp Naive Bayes 52 4.3.2 Kết th c nghiệm thuật toán phân lớp SVM .53 4.3.3 Kết th c nghiệm thuật toán phân lớp đ nh 54 4.4 Đánh giá kết đạt 55 4.5 Tổng kết chương 55 KẾT LUẬN 56 TÀI LIỆU THAM KHẢO LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com DANH SÁCH CÁC HÌNH VẼ Hình 1.1 Q trình khám phá tri thức sở liệu Hình 2.1 Biểu diễn mặt phẳng siêu phẳng SVM 21 Hình 2.2 Mơ hình phân lớp đề xuất 28 Hình 2.3 Bảng tiêu ngân hàng thương mại .29 Hình 2.4 Bảng tiêu ngân hàng thương mại trích chọn 29 Hình 2.5 Bảng tiêu sử dụng để phân lớp ngân hàng thương mại 30 Hình 3.1 Màn hình ODM - chọn chức xây dựng mơ hình khai phá liệu 38 Hình 3.2 Màn hình ODM - chọn chức năng, giải thuật khai phá liệu 38 Hình 3.3 Màn hình ODM - chọn bảng liệu học cho khai phá liệu 39 Hình 3.4 Màn hình ODM - chọn thuộc tính đích bảng liệu học 39 Hình 3.5 Màn hình ODM - nhập tên cho mơ hình khai phá liệu 40 Hình 3.6 Màn hình ODM – kết xây dựng mơ hình khai phá liệu .40 Hình 3.7 Màn hình ODM – chọn chức kiểm thử mơ hình khai phá liệu .41 Hình 3.8 Màn hình ODM – chọn mơ hình khai phá liệu cần kiểm thử 41 Hình 3.9 Màn hình ODM – chọn bảng liệu kiểm thử 42 Hình 3.10 Màn hình ODM – kết kiểm thử .42 Hình 3.11 Màn hình ODM – độ tin cậy mơ hình khai phá liệu 43 Hình 3.12 Màn hình ODM – độ xác mơ hình khai phá liệu 43 Hình 3.13 Màn hình ODM – chọn chức áp dụng mơ hình khai phá liệu .44 Hình 3.14 Màn hình ODM – chọn mơ hình khai phá liệu cần áp dụng 44 Hình 3.15 Màn hình ODM – chọn bảng liệu cần khai phá .45 Hình 3.16 Màn hình ODM – chọn thuộc tính đầu vào cho khai phá 45 Hình 3.17 Màn hình ODM – nhập tên cho hoạt động khai phá 46 Hình 3.18 Màn hình ODM – kết áp dụng mơ hình khai phá liệu .46 Hình 3.19 Màn hình ODM – kết khai phá liệu 47 Hình 4.1 Định nghĩa kết nối Oracle Data Miner với sở liệu 49 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com DANH SÁCH CÁC BẢNG Bảng Chỉ tiêu giám sát khả vốn Bảng 2.2 Chỉ tiêu giám sát chất lượng tài sản có 10 Bảng 2.3 Chỉ tiêu giám sát khả sinh lời 11 Bảng 2.4 Chỉ tiêu giám sát khả khoản 12 Bảng 2.5 Chỉ tiêu giám sát rủi ro khác 13 Bảng 2.6 Xếp loại ngân hàng thương mại .13 Bảng 2.7 Ví dụ liệu tiêu giám sát 17 Bảng 2.8 Ví dụ liệu tiêu giám sát quy đổi 18 Bảng 2.9 Ví dụ tính xác suất thuộc tính 19 Bảng 2.10 Bảng ký hiệu 26 Bảng 2.11 Ví dụ tập vectơ đặc trưng thứ .31 Bảng 2.12 Ví dụ tập vectơ đặc trưng thứ hai .32 Bảng 2.13 Ví dụ liệu gốc cần phân lớp 33 Bảng 2.14 Ví dụ kết phân lớp với liệu gốc .33 Bảng 2.15 Ví dụ liệu quy đổi cần phân lớp .34 Bảng 2.16 Ví dụ kết phân lớp với liệu quy đổi 34 Bảng 3.1 Các chức khai phá liệu dự đoán Oracle .36 Bảng 3.2 Các chức khai phá liệu mô tả Oracle 37 Bảng 4.1 Cấu hình phần cứng, hệ điều hành .48 Bảng 4.2 Danh sách phần mềm sử dụng 48 Bảng 4.3 Các tiêu xếp loại ngân hàng thương mại 49 Bảng 4.4 Tiêu chí quy đổi điểm 50 Bảng 4.5 Phân bố liệu huấn luyện 51 Bảng 4.6 Phân bố liệu kiểm thử 51 Bảng 4.7 Kết thực nghiệm phân lớp Naive Bayes với liệu gốc 52 Bảng 4.8 Kết thực nghiệm phân lớp Naive Bayes với liệu quy đổi 52 Bảng 4.9 Kết thực nghiệm phân lớp SVM với liệu gốc 53 Bảng 4.10 Kết thực nghiệm phân lớp SVM với liệu quy đổi 53 Bảng 4.11 Kết thực nghiệm phân lớp định với liệu gốc 54 Bảng 4.12 Kết thực nghiệm phân lớp định với liệu quy đổi 54 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com BẢNG CÁC KÝ HIỆU VIẾT TẮT Từ cụm từ Kí hiệu viết tắt Oracle data miner ODM One-against-Rest OAR One-against-One OAO Support vector machine SVM LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com LỜI MỞ ĐẦU Ngày nay, đơn v , tổ chức có áp dụng cơng nghệ thơng tin vào quản lý, ứng dụng dừng lại mức đ ứng dụng tác nghiệp thông thường với chức n ng hỗ trợ đưa thông tin vào kết xuất báo cáo đầu Những ứng dụng hỗ trợ cao cho phân tích, hỗ trợ đ nh chưa nhiều Tuy nhiên với xu hướng phát triển tại, chắn cần đến ứng dụng khai phá tri thức tiềm ẩn sở liệu Bảo hiểm tiền gửi Việt Nam tổ chức tài Nhà nước với nhiệm vụ bảo vệ quyền lợi ích hợp pháp người gửi tiền, góp phần trì s ổn đ nh tổ chức tham gia Bảo hiểm tiền gửi s phát triển an toàn lành mạnh hoạt đ ng ngân hàng Với nhiệm vụ giao, m t công tác Bảo hiểm tiền gửi Việt Nam giám sát tổ chức tham gia Bảo hiểm tiền gửi (đánh giá rủi ro, xếp loại tổ chức tham gia Bảo hiểm tiền gửi,…) Áp dụng công nghệ tin học vào công tác giám sát tổ chức tham gia Bảo hiểm tiền gửi từ n m đầu thành lập Bảo hiểm Tiền gửi Việt Nam, đến Bảo hiểm tiền gửi Việt Nam xây d ng hệ thống công nghệ thông tin đáp ứng nhiệm vụ giám sát tổ chức tham gia Bảo hiểm tiền gửi Tuy nhiên, sở liệu Bảo hiểm tiền gửi Việt Nam ch sử dụng để phục vụ tác nghiệp ngày, báo cáo, thống kê Tại Bảo hiểm tiền gửi Việt Nam, ứng dụng dừng mức đưa báo cáo liệt kê ch tiêu tổ chức tham gia Bảo hiểm tiền gửi cán b giám sát Bảo hiểm tiền gửi c n vào báo cáo để phân tích, đánh giá tổ chức tham gia Bảo hiểm tiền gửi (phân tích ch tiêu m t cách riêng lẻ) Với số lượng tổ chức tham gia Bảo hiểm tiền gửi ngày t ng, việc xem xét trường hợp, số liệu cụ thể tổ chức tham gia Bảo hiểm tiền gửi trở nên khó kh n cần công cụ hỗ trợ Mong muốn cán b giám sát có ứng dụng t đ ng phân tích d a nhiều ch tiêu đưa số liệu ch tiêu m t tổ chức tham gia Bảo hiểm tiền gửi vào có câu trả lời xếp loại tổ chức Hiện tại, Bảo hiểm tiền gửi Việt Nam th c đấu thầu để triển khai d án hệ thống thông tin quản lý đại hóa ngân hàng - Hợp phần Bảo hiểm tiền gửi Việt Nam M t yêu cầu phân hệ Giám sát rủi ro hệ thống hệ thống phải cho phép tiến hành khai thác liệu, hệ thống phải cung cấp công cụ hỗ trợ hoạt đ ng: đánh giá rủi ro, xếp loại tổ chức tham gia Bảo hiểm tiền gửi Với tìm hiểu trên, cho thấy áp dụng khai phá liệu với sở liệu Bảo hiểm tiền gửi Việt Nam để đáp ứng mong muốn cán b giám sát, từ nâng cao hiệu cơng tác giám sát, đánh giá, xếp loại tổ chức tham gia Bảo hiểm tiền gửi LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 43 - Đ tin cậy mô hình thể thẻ Preditive Confidence hình sau: Hình 3.11 Màn hình ODM – độ tin cậy mơ hình khai phá liệu - Đ xác mơ hình thể thẻ Accuracy hình sau: Hình 3.12 Màn hình ODM – độ xác mơ hình khai phá liệu LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 44 Bước 5: Áp dụng mơ hình khai phá vào khai phá liệu: - Trên giao diện chương trình, chọn Activity -> chọn Apply Hình 3.13 Màn hình ODM – chọn chức áp dụng mơ hình khai phá liệu - Chọn mơ hình khai phá Hình 3.14 Màn hình ODM – chọn mơ hình khai phá liệu cần áp dụng LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 45 - Chọn bảng liệu cần khai phá Hình 3.15 Màn hình ODM – chọn bảng liệu cần khai phá - Chọn thu c tính đầu vào Hình 3.16 Màn hình ODM – chọn thuộc tính đầu vào cho khai phá LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 46 - Nhập tên hoạt đ ng khai phá liệu Hình 3.17 Màn hình ODM – nhập tên cho hoạt động khai phá - Chọn Run Activity để hoàn thành việc khai phá Hình 3.18 Màn hình ODM – kết áp dụng mơ hình khai phá liệu LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 47 - Chọn Result để xem kết d đốn Hình 3.19 Màn hình ODM – kết khai phá liệu 3.3 Tổng kết chƣơng Chương trình bày lý sử dụng công nghệ khai phá liệu Oracle, quy trình khai phá liệu sử dụng cơng cụ Oracle Data Miner LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 48 CHƢƠNG 4: THỰC NGHIỆM PHÂN LỚP CÁC NGÂN HÀNG THƢƠNG MẠI 4.1 Môi trƣờng thực nghiệm 4.1.1 Cấu hình phần cứng, hệ điều hành Bảng 4.1 Cấu hình phần cứng, hệ điều hành Thành phần Chỉ số CPU Intel Core Duo 3.00 GHz RAM GB HDD 150 GB OS Microsoft Window XP Service Park 4.1.2 Công cụ phần mềm Trong luận v n sử dụng phần mềm bảng sau: Bảng 4.2 Danh sách phần mềm sử dụng STT Tên phần mềm Oracle database 10g Java JDK 1.4.2 Oracle Data Miner 10.2.0.1 Nguồn Đĩa CD chứa b cài Oracle Database 10g http://www.oracle.com/technetwork/database/e nterprise-edition/odminer-install-10202098193.html 4.1.3 Cài đặt kết nối phần mềm Để sử dụng Oracle Data Miner Microsoft Windows, cần cài đặt kết nối sau: Cài đặt Oracle Database 10g tạo Database chứa liệu th c nghiệm Cài đặt Java JDK 1.4.2 Tải odminer.zip Giải nén tệp odminer.zip Chạy (nhấp đúp chu t) tệp odminerw.exe thư mục bin vừa giải nén Đ nh nghĩa m t kết nối mô tả đây: (Host đ a ch máy chứa liệu th c nghiệm) LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 49 Hình 4.1 Định nghĩa kết nối Oracle Data Miner với sở liệu 4.2 Dữ liệu thực nghiệm Dữ liệu th c nghiệm gồm liệu ch tiêu giám sát 98 ngân hàng thương mại n m 2010, 2011, 2012, 2013 Dữ liệu th c nghiệm có tất 4253 ghi Tồn b liệu th c nghiệm tiền xử lý gán nhãn sau: Trong phạm vi luận v n, ch xét ch tiêu bảng sau làm c n để đánh giá, xếp loại ngân hàng thương mại: Bảng 4.3 Các tiêu xếp loại ngân hàng thương mại Mã tiêu Tên tiêu M51 Chênh lệch thu nhập, chi phí M246 Lỗ lũy kế M111 Tỷ lệ nợ xấu M112 Tỷ lệ nợ hạn M107 Tỷ lệ đầu tư, mua sắm tài sản cố đ nh so với Vốn cấp M108 Giới hạn góp vốn mua cổ phần LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 50 Tiêu chí cho điểm ch tiêu sau: Bảng 4.4 Tiêu chí quy đổi điểm Chỉ tiêu Điểm Chênh lệch thu nhập, chi phí >0 A =0 B 0 A =0 B 1 4 ch tiêu b điểm C NHTM xếp loại D Tập liệu th c nghiệm chia làm hai tập con, tập liệu huấn luyện tập liệu kiểm thử Trong đó: - Tập liệu huấn luyện phân bố sau: Bảng 4.5 Phân bố liệu huấn luyện STT Lớp Số trƣờng hợp A 1663 B 861 C 217 D 93 Tổng - 2834 Tập liệu kiểm thử phân bố sau: Bảng 4.6 Phân bố liệu kiểm thử STT Lớp Số trƣờng hợp A 990 B 500 C 138 D 53 Tổng 1681 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 52 4.3 Kết thực nghiệm 4.3.1 Kết thực nghiệm thuật toán phân lớp Naive Bayes a) Kết thực nghiệm với liệu gốc Bảng 4.7 Kết thực nghiệm phân lớp Naive Bayes với liệu gốc STT Lớp Số trƣờng hợp phân lớp A 875 29 0,9679 0,8838 0,9239 B 403 117 0,775 0,806 0,7902 C 109 97 0,5291 0,7899 0,6337 D 51 0,9623 0,9808 Số trƣờng hợp phân lớp sai Độ Độ hồi F-Measure xác tƣởng (Precision) (Recall) (Đ đo F)  = 0,8554 M = 0,8605 b) Kết thực nghiệm với liệu quy đổi Bảng 4.8 Kết thực nghiệm phân lớp Naive Bayes với liệu quy đổi STT Lớp Số trƣờng hợp phân lớp A 802 119 0,9808 0,9903 B 372 199 0,8923 0,928 0,9098 C 80 28 0,7372 0,7319 0,7345 D 50 31 1 Số trƣờng hợp phân lớp sai Độ Độ hồi F-Measure xác tƣởng (Precision) (Recall) (Đ đo F)  = 0,9453 M = 0,9102 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 53 4.3.2 Kết thực nghiệm thuật toán phân lớp SVM a) Kết thực nghiệm với liệu gốc Bảng 4.9 Kết thực nghiệm phân lớp SVM với liệu gốc STT Lớp Số trƣờng hợp phân lớp A 802 119 0,8708 0,8101 0,8394 B 372 199 0,6515 0,744 0,6947 C 80 28 0,7407 0,5797 0,6504 D 50 31 0,6173 0,9434 0,7463 Số trƣờng hợp phân lớp sai Độ Độ hồi F-Measure xác tƣởng (Precision) (Recall) (Đ đo F)  = 0,7757 M = 0,7693 b) Kết thực nghiệm với liệu quy đổi Bảng 4.10 Kết thực nghiệm phân lớp SVM với liệu quy đổi STT Lớp Số trƣờng hợp phân lớp A 990 42 0,9593 0,9792 B 405 17 0,9597 0,81 0,8785 C 106 52 0,6709 0,7681 0,7162 4 D 53 15 0,7681 0,8688 Số trƣờng hợp phân lớp sai Độ Độ hồi xác tƣởng (Precision) (Recall) F-Measure (Đ đo F)  = 0,9244 M = 0,8945 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 54 4.3.3 Kết thực nghiệm thuật toán phân lớp định a) Kết thực nghiệm với liệu gốc Bảng 4.111 Kết thực nghiệm phân lớp định với liệu gốc STT Lớp Số trƣờng hợp phân lớp A 979 0,9919 0,9889 0,9904 B 475 30 0,9406 0,95 0,9453 C 118 17 0,8741 0,8551 0,8645 D 53 0,9815 0,9907 Số trƣờng hợp phân lớp sai Độ Độ hồi F-Measure xác tƣởng (Precision) (Recall) (Đ đo F)  = 0,9667 M = 0,9485 b) Kết thực nghiệm với liệu quy đổi Bảng 4.122 Kết thực nghiệm phân lớp định với liệu quy đổi STT Lớp Số trƣờng hợp phân lớp A 999 0,999 0,9995 B 495 10 0,9802 0,99 0,9851 C 127 0,9695 0,9203 0,9443 D 53 0,9815 0,9907 Số trƣờng hợp phân lớp sai Độ Độ hồi F-Measure xác tƣởng (Precision) (Recall) (Đ đo F)  = 0,9905 M = 0,9776 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 55 4.4 Đánh giá kết đạt đƣợc Q trình th c nghiệm mơ hình giải toán phân lớp ngân hàng thương mại d a phương pháp đinh, phương pháp máy hỗ trợ vector SVM phương pháp Naive Bayes bước đầu cho thấy kết tương đối khả quan với đ xác cao Trong đó, th c nghiệm sử dụng liệu gốc, phương pháp đ nh cho kết có đ tin cậy (93,13%) đ xác (96,67%) cao nhất, phương pháp Naive Bayes cho kết có đ tin cậy (81,4%) đ xác (85,54) cao so với phương pháp máy hỗ trợ vector SVM Thời gian xây d ng mơ hình thuật tốn nhanh, với liệu thử nghiệm thời gian xây d ng mơ hình, kiểm thử mơ hình áp dụng mơ hình ba thuật tốn ch vài giây Th c nghiệm cho thấy việc sử dụng liệu quy đổi ba thuật toán cho kết tốt việc sử dụng liệu gốc Kết th c nghiệm cho thấy mơ hình d đốn có tính khả thi áp dụng th c tế 4.5 Tổng kết chƣơng Chương trình bày quy trình phân lớp ngân hàng thương mại sở mô hình đề xuất chương 2, th c nghiệm đánh giá kết phân lớp ngân hàng thương mại d a phương pháp đinh, phương pháp máy hỗ trợ vector SVM phương pháp Naive Bayes LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 56 KẾT LUẬN Từ việc nghiên cứu toán phân lớp ngân hàng thương mại, luận v n đề xuất mơ hình giải phân lớp ngân hàng thương mại d a phương pháp đ nh, phương pháp máy hỗ trợ vector (SVM) phương pháp Naive Bayes Qua kết th c nghiệm đạt cho thấy mơ hình đề xuất d a phương pháp đ nh có đ xác cao D a vào kết th c nghiệm thấy mơ hình xây d ng có tính khả thi áp dụng th c tế Về mặt n i dung, luận v n đạt kết sau: - Trình bày khái niệm chung khai phá liệu - Trình bày tốn phân lớp phân lớp d a phương pháp đinh, phương pháp máy hỗ trợ vector (SVM) phương pháp Naive Bayes - Trình bày tốn phân lớp ngân hàng thương mại mơ hình giải toán phân lớp ngân hàng thương mại - Trình bày cơng nghệ khai phá liệu Oracle, công cụ khai phá liệu Oracle Data Miner - Th c nghiệm phân lớp ngân hàng thương mại thuật toán phân lớp đ nh, thuật toán Naive Bayes thuật toán SVM Oracle Data Miner - Đánh giá kết đạt Nhìn chung, hướng tiếp cận đề tài đắn có tính th c tiễn cao Để đưa mơ hình phân lớp ngân hàng thương mại vào ứng dụng m t cách hiệu Bảo hiểm tiền gửi Việt Nam Bảo hiểm tiền gửi Việt Nam cần có chế thu thập liệu ngân hàng thương mại đầy đủ xác nữa, cần xây d ng b học liệu lớn xác (b liệu đánh giá rủi ro ngân hàng thương mại c n vào toàn b hệ thống ch tiêu giám sát), áp dụng mơ hình d đốn vào th c tế, kiểm chứng th c tế đánh giá kết m t cách thường xun Ngồi ra, luận v n tham khảo để giải toán đánh giá rủi ro, phân lớp quỹ tín dụng c n vào hệ thống ch tiêu giám sát quỹ tín dụng d a phương pháp phân lớp sử dụng công cụ Oracle Data Miner Đối với hệ thống thông tin quản lý đại hóa ngân hàng - Hợp phần Bảo hiểm tiền gửi Việt Nam đấu thầu để triển khai, m t yêu cầu phân hệ Giám sát rủi ro hệ thống hệ thống phải cho phép tiến hành khai thác liệu, hệ thống phải cung cấp công cụ hỗ trợ hoạt đ ng: đánh giá rủi ro, xếp hạng tổ chức tham gia Bảo hiểm tiền gửi Vì vậy, kết nghiên cứu luận v n tiền đề cho việc triển khai phân hệ Giám sát rủi ro hệ thống LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com TÀI LIỆU THAM KHẢO Tiếng Việt [1] Đinh Th Kim Dung (2004), “M t số thử nghiệm khai phá liệu sở liệu ORACLE”, Đại học Công nghệ, Đại học Quốc gia Hà N i [2] Lường Hồng Giang (2012), “Ứng dụng m t số kỹ thuật khai phá liệu để phân tích liệu viễn thông nhằm t ng cường chất lượng d ch vụ khách hàng”, Đại học Công nghệ, Đại học Quốc gia Hà N i [3] Đoàn Nhật Minh (2003), “Nghiên cứu m t số phương pháp khai phá liệu thiết kế, xây d ng ứng dụng khai phá liệu kho liệu khách hàng bưu điện Tp Hà N i”, Đại học Công nghệ, Đại học Quốc gia Hà N i [4] Vũ Thanh Nguyên, Trang Nhật Quang (2009) ,“Ứng dụng thuật toán phân lớp rút trích thơng tin v n FSVM Internet”, Tạp chí Phát triển Khoa học Cơng nghệ, tập 12, số 05-2009 [5] Hà Quang Thụy (2013), Bài giảng “Kho liệu khai phá liệu” [6] Hà Quang Thụy, Phan Xuân Hiếu, Đoàn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú (2009), “Giáo trình khai phá liệu Web”, Nhà xuất Giáo dục Việt Nam [7] Nguyễn Thu Trà (2006), “Nghiên cứu áp dụng m t số kỹ thuật khai phá liệu với sở liệu ngành Thuế Việt Nam”, Luận v n thạc sỹ khoa học, Trường Đại học Bách Khoa Hà N i [8] Website: http://bis.net.vn Tiếng Anh [9] Jiawei Han and Michelline Kamber (2000), “Data mining: Concepts and Techniques”, Morgan Kaufmann Publishers [10] Oracle (2003), “Oracle Data Mining Concepts 10g Release 1”, Oracle Corporation [11] Oracle (2008), “Oracle Data Mining Tutorial for Oracle Data Mining 10g Release 2”, Oracle Corporation [12] Oracle (2003), “Oracle Data Mining Administrator's Guide 10g Release 1”, Oracle Corporation LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ... Ƣu khai phá liệu Khai phá liệu có nhiều ứng dụng m t số ưu rõ rệt xem xét đây: + So với phương pháp học máy, khai phá liệu có lợi chỗ, khai phá liệu sử dụng với sở liệu chứa nhiều nhiễu, liệu. .. thống trích lọc tri thức từ liệu sở liệu khổng lồ Song so với phương pháp khác, khai phá liệu có m t số ưu rõ rệt [5] 1.2 Ứng dụng khai phá liệu Phát tri thức khai phá liệu liên quan đến nhiều ngành,... CHƢƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1 Khái niệm 1.2 Ứng dụng khai phá liệu .4 1.3 Ưu khai phá liệu .5 1.4 Các kỹ thuật khai phá liệu .6 1.5 Tổng

Ngày đăng: 05/12/2022, 15:40

Hình ảnh liên quan

BẢNG CÁC KÝ HIỆU VIẾT TẮT - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng
BẢNG CÁC KÝ HIỆU VIẾT TẮT Xem tại trang 9 của tài liệu.
Hình 1.1. Quá trình khám phá tri thức trong cơ sở dữ liệu - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Hình 1.1..

Quá trình khám phá tri thức trong cơ sở dữ liệu Xem tại trang 13 của tài liệu.
Bảng 2.2. Chỉ tiêu giám sát chất lượng tài sản có - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Bảng 2.2..

Chỉ tiêu giám sát chất lượng tài sản có Xem tại trang 19 của tài liệu.
Bảng 2.3. Chỉ tiêu giám sát khả năng sinh lời - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Bảng 2.3..

Chỉ tiêu giám sát khả năng sinh lời Xem tại trang 20 của tài liệu.
Bảng 2.4. Chỉ tiêu giám sát khả năng thanh khoản - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Bảng 2.4..

Chỉ tiêu giám sát khả năng thanh khoản Xem tại trang 21 của tài liệu.
Bảng 2.6. Xếp loại các ngân hàng thương mại - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Bảng 2.6..

Xếp loại các ngân hàng thương mại Xem tại trang 22 của tài liệu.
Hình 2.1. Biểu diễn của mặt phẳng siêu phẳng của SVM - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Hình 2.1..

Biểu diễn của mặt phẳng siêu phẳng của SVM Xem tại trang 30 của tài liệu.
2.3. Đề xuất mơ hình phân lớp các ngân hàng thƣơng mại 2.3.1. Phát biểu bài toán phân lớp các ngân hàng thƣơng mại  - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

2.3..

Đề xuất mơ hình phân lớp các ngân hàng thƣơng mại 2.3.1. Phát biểu bài toán phân lớp các ngân hàng thƣơng mại Xem tại trang 37 của tài liệu.
Hình 4.3. Bảng chỉ tiêu của ngân hàng thương mại - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Hình 4.3..

Bảng chỉ tiêu của ngân hàng thương mại Xem tại trang 38 của tài liệu.
đánh giá ngân hàng thương mại vừa thu được từ hàng sang ct và lưu vào bảng có cấu trúc như hình sau:  - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

nh.

giá ngân hàng thương mại vừa thu được từ hàng sang ct và lưu vào bảng có cấu trúc như hình sau: Xem tại trang 39 của tài liệu.
Bảng 2.11. Ví dụ tập vectơ đặc trưng thứ nhất - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Bảng 2.11..

Ví dụ tập vectơ đặc trưng thứ nhất Xem tại trang 40 của tài liệu.
Bảng 2.14. Ví dụ kết quả phân lớp với dữ liệu gốc - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Bảng 2.14..

Ví dụ kết quả phân lớp với dữ liệu gốc Xem tại trang 42 của tài liệu.
Bảng 2.13. Ví dụ dữ liệu gốc cần phân lớp - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Bảng 2.13..

Ví dụ dữ liệu gốc cần phân lớp Xem tại trang 42 của tài liệu.
Hình 3.3. Màn hình OD M- chọn bảng dữ liệu học cho khai phá dữ liệu - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Hình 3.3..

Màn hình OD M- chọn bảng dữ liệu học cho khai phá dữ liệu Xem tại trang 48 của tài liệu.
Hình 3.5. Màn hình OD M- nhập tên cho mơ hình khai phá dữ liệu - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Hình 3.5..

Màn hình OD M- nhập tên cho mơ hình khai phá dữ liệu Xem tại trang 49 của tài liệu.
Bước 4: Kiểm thử mơ hình trên tập dữ liệu kiểm thử: - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

c.

4: Kiểm thử mơ hình trên tập dữ liệu kiểm thử: Xem tại trang 50 của tài liệu.
- Chọn bảng dữ liệu kiểm thử - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

h.

ọn bảng dữ liệu kiểm thử Xem tại trang 51 của tài liệu.
Hình 3.11. Màn hình ODM – độ tin cậy của mơ hình khai phá dữ liệu - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Hình 3.11..

Màn hình ODM – độ tin cậy của mơ hình khai phá dữ liệu Xem tại trang 52 của tài liệu.
Hình 3.13. Màn hình ODM – chọn chức năng áp dụng mơ hình khai phá dữ liệu - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Hình 3.13..

Màn hình ODM – chọn chức năng áp dụng mơ hình khai phá dữ liệu Xem tại trang 53 của tài liệu.
Bước 5: Áp dụng mơ hình khai phá vào khai phá dữ liệu: - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

c.

5: Áp dụng mơ hình khai phá vào khai phá dữ liệu: Xem tại trang 53 của tài liệu.
Hình 3.15. Màn hình ODM – chọn bảng dữ liệu cần khai phá - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Hình 3.15..

Màn hình ODM – chọn bảng dữ liệu cần khai phá Xem tại trang 54 của tài liệu.
- Chọn bảng dữ liệu cần khai phá - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

h.

ọn bảng dữ liệu cần khai phá Xem tại trang 54 của tài liệu.
Hình 3.18. Màn hình ODM – kết quả áp dụng mơ hình khai phá dữ liệu - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Hình 3.18..

Màn hình ODM – kết quả áp dụng mơ hình khai phá dữ liệu Xem tại trang 55 của tài liệu.
Hình 3.17. Màn hình ODM – nhập tên cho hoạt động khai phá - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Hình 3.17..

Màn hình ODM – nhập tên cho hoạt động khai phá Xem tại trang 55 của tài liệu.
Hình 3.19. Màn hình ODM – kết quả khai phá dữ liệu - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Hình 3.19..

Màn hình ODM – kết quả khai phá dữ liệu Xem tại trang 56 của tài liệu.
Hình 4.1. Định nghĩa một kết nối Oracle Data Miner với cơ sở dữ liệu - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Hình 4.1..

Định nghĩa một kết nối Oracle Data Miner với cơ sở dữ liệu Xem tại trang 58 của tài liệu.
Bảng 4.4. Tiêu chí quy đổi điểm - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Bảng 4.4..

Tiêu chí quy đổi điểm Xem tại trang 59 của tài liệu.
Bảng 4.9. Kết quả thực nghiệm phân lớp SVM với dữ liệu gốc - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Bảng 4.9..

Kết quả thực nghiệm phân lớp SVM với dữ liệu gốc Xem tại trang 62 của tài liệu.
Bảng 4.111. Kết quả thực nghiệm phân lớp cây quyết định với dữ liệu gốc - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Bảng 4.111..

Kết quả thực nghiệm phân lớp cây quyết định với dữ liệu gốc Xem tại trang 63 của tài liệu.
Bảng 4.122. Kết quả thực nghiệm phân lớp cây quyết định với dữ liệu quy đổi - Luận văn thạc sĩ VNU UET khai phá dữ liệu trên nền ORACLE và ứng dụng

Bảng 4.122..

Kết quả thực nghiệm phân lớp cây quyết định với dữ liệu quy đổi Xem tại trang 63 của tài liệu.

Tài liệu cùng người dùng

Tài liệu liên quan