Luận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụng

66 9 0
Luận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Luận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụngLuận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụngLuận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụngLuận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụngLuận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụngLuận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụngLuận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụngLuận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụngLuận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụngLuận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụngLuận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụngLuận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụngLuận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụngLuận văn Thạc sĩ Công nghệ thông tin: Khai phá dữ liệu trên nền Oracle và ứng dụng

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ MINH LÝ KHAI PHÁ DỮ LIỆU TRÊN NỀN ORACLE VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN HÀ NỘI - 2014 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ MINH LÝ KHAI PHÁ DỮ LIỆU TRÊN NỀN ORACLE VÀ ỨNG DỤNG Ngành: Công nghệ Thông tin Chuyên ngành: Hệ thống Thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: GS.TS VŨ ĐỨC THI HÀ NỘI - 2014 LỜI CẢM ƠN Lời đầu tiên, xin gửi lời cảm ơn lòng biết ơn sâu sắc tới GS.TS Vũ Đức Thi, Viện Công nghệ thông tin, Viện Khoa học Công nghệ Việt Nam Thầy dành nhiều thời gian tận tình hướng dẫn, giúp đỡ tơi đ nh hướng th c n i dung luận v n Tôi xin chân thành cảm ơn thầy, cô tạo cho điều kiện thuận lợi suốt q trình tơi học tập trường Đại học Cơng nghệ Tôi xin chân thành cảm ơn lãnh đạo quan, bạn bè đồng nghiệp cung cấp tài liệu cho lời khuyên quý báu để th c luận v n Tôi gửi lời cảm ơn tới bạn lớp K16HTTT2 ủng h , khích lệ, giúp đỡ ln sát cánh bên tơi suốt trình học tập, rèn luyện trường Và cuối cùng, xin gửi lời cảm ơn vô hạn tới gia đình, người thân bạn bè bên tơi lúc khó kh n nhất, ln đ ng viên tơi, khuyến khích tơi cu c sống học tập, công việc Tôi xin chân thành cảm ơn! Hà Nội, tháng năm 2014 Học viên Nguyễn Th Minh Lý LỜI CAM ĐOAN Tôi xin cam đoan đề tài nghiên cứu riêng tôi, th c s hướng dẫn GS.TS Vũ Đức Thi Các kết khai phá đề tài tiến hành khai phá chưa cơng bố cơng trình khác Hà Nội, tháng năm 2014 Học viên Nguyễn Th Minh Lý MỤC LỤC DANH SÁCH CÁC HÌNH VẼ DANH SÁCH CÁC BẢNG BẢNG CÁC KÝ HIỆU VIẾT TẮT LỜI MỞ ĐẦU CHƢƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1 Khái niệm 1.2 Ứng dụng khai phá liệu .4 1.3 Ưu khai phá liệu .5 1.4 Các kỹ thuật khai phá liệu .6 1.5 Tổng kết chương CHƢƠNG 2: NGÂN HÀNG THƢƠNG MẠI VÀ GIẢI PHÁP PHÂN LỚP CÁC NGÂN HÀNG THƢƠNG MẠI 2.1 Ngân hàng thương mại xếp loại ngân hàng thương mại 2.1.1 Khái niệm ngân hàng thương mại 2.1.2 Hệ thống ch tiêu xếp loại ngân hàng thương mại 2.2 Nghiên cứu giải pháp phân lớp ngân hàng thương mại .14 2.2.1 Bài toán phân lớp m t số thuật toán phân lớp điển hình 14 2.2.1.1 Thuật tốn phân lớp Bayes .15 2.2.1.2 Thuật toán phân lớp SVM 20 2.2.1.3 Thuật toán phân lớp đ nh .24 2.2.2 Đánh giá hiệu phân lớp 26 2.3 Đề xuất mơ hình phân lớp ngân hàng thương mại .28 2.3.1 Phát biểu toán phân lớp ngân hàng thương mại 28 2.3.2 Đề xuất mơ hình phân lớp ngân hàng thương mại .28 2.4 Tổng kết chương 35 CHƢƠNG 3: CÔNG NGHỆ KHAI PHÁ DỮ LIỆU ORACLE .36 3.1 Lý sử dụng công nghệ khai phá liệu Oracle 36 3.2 Quy trình khai phá liệu sử dụng Oracle Data Miner .37 3.3 Tổng kết chương 47 CHƢƠNG 4: THỰC NGHIỆM PHÂN LỚP CÁC NGÂN HÀNG THƢƠNG MẠI 48 4.1 Môi trường th c nghiệm .48 4.1.1 Cấu hình phần cứng, hệ điều hành 48 4.1.2 Công cụ phần mềm 48 4.1.3 Cài đặt kết nối phần mềm 48 4.2 Dữ liệu th c nghiệm 49 4.3 Kết th c nghiệm 52 4.3.1 Kết th c nghiệm thuật toán phân lớp Naive Bayes 52 4.3.2 Kết th c nghiệm thuật toán phân lớp SVM .53 4.3.3 Kết th c nghiệm thuật toán phân lớp đ nh 54 4.4 Đánh giá kết đạt 55 4.5 Tổng kết chương 55 KẾT LUẬN 56 TÀI LIỆU THAM KHẢO DANH SÁCH CÁC HÌNH VẼ Hình 1.1 Quá trình khám phá tri thức sở liệu Hình 2.1 Biểu diễn mặt phẳng siêu phẳng SVM 21 Hình 2.2 Mơ hình phân lớp đề xuất 28 Hình 2.3 Bảng tiêu ngân hàng thương mại .29 Hình 2.4 Bảng tiêu ngân hàng thương mại trích chọn 29 Hình 2.5 Bảng tiêu sử dụng để phân lớp ngân hàng thương mại 30 Hình 3.1 Màn hình ODM - chọn chức xây dựng mơ hình khai phá liệu 38 Hình 3.2 Màn hình ODM - chọn chức năng, giải thuật khai phá liệu 38 Hình 3.3 Màn hình ODM - chọn bảng liệu học cho khai phá liệu 39 Hình 3.4 Màn hình ODM - chọn thuộc tính đích bảng liệu học 39 Hình 3.5 Màn hình ODM - nhập tên cho mơ hình khai phá liệu 40 Hình 3.6 Màn hình ODM – kết xây dựng mơ hình khai phá liệu .40 Hình 3.7 Màn hình ODM – chọn chức kiểm thử mơ hình khai phá liệu .41 Hình 3.8 Màn hình ODM – chọn mơ hình khai phá liệu cần kiểm thử 41 Hình 3.9 Màn hình ODM – chọn bảng liệu kiểm thử 42 Hình 3.10 Màn hình ODM – kết kiểm thử .42 Hình 3.11 Màn hình ODM – độ tin cậy mơ hình khai phá liệu 43 Hình 3.12 Màn hình ODM – độ xác mơ hình khai phá liệu 43 Hình 3.13 Màn hình ODM – chọn chức áp dụng mơ hình khai phá liệu .44 Hình 3.14 Màn hình ODM – chọn mơ hình khai phá liệu cần áp dụng 44 Hình 3.15 Màn hình ODM – chọn bảng liệu cần khai phá .45 Hình 3.16 Màn hình ODM – chọn thuộc tính đầu vào cho khai phá 45 Hình 3.17 Màn hình ODM – nhập tên cho hoạt động khai phá 46 Hình 3.18 Màn hình ODM – kết áp dụng mơ hình khai phá liệu .46 Hình 3.19 Màn hình ODM – kết khai phá liệu 47 Hình 4.1 Định nghĩa kết nối Oracle Data Miner với sở liệu 49 DANH SÁCH CÁC BẢNG Bảng Chỉ tiêu giám sát khả vốn Bảng 2.2 Chỉ tiêu giám sát chất lượng tài sản có 10 Bảng 2.3 Chỉ tiêu giám sát khả sinh lời 11 Bảng 2.4 Chỉ tiêu giám sát khả khoản 12 Bảng 2.5 Chỉ tiêu giám sát rủi ro khác 13 Bảng 2.6 Xếp loại ngân hàng thương mại .13 Bảng 2.7 Ví dụ liệu tiêu giám sát 17 Bảng 2.8 Ví dụ liệu tiêu giám sát quy đổi 18 Bảng 2.9 Ví dụ tính xác suất thuộc tính 19 Bảng 2.10 Bảng ký hiệu 26 Bảng 2.11 Ví dụ tập vectơ đặc trưng thứ .31 Bảng 2.12 Ví dụ tập vectơ đặc trưng thứ hai .32 Bảng 2.13 Ví dụ liệu gốc cần phân lớp 33 Bảng 2.14 Ví dụ kết phân lớp với liệu gốc .33 Bảng 2.15 Ví dụ liệu quy đổi cần phân lớp .34 Bảng 2.16 Ví dụ kết phân lớp với liệu quy đổi 34 Bảng 3.1 Các chức khai phá liệu dự đoán Oracle .36 Bảng 3.2 Các chức khai phá liệu mô tả Oracle 37 Bảng 4.1 Cấu hình phần cứng, hệ điều hành .48 Bảng 4.2 Danh sách phần mềm sử dụng 48 Bảng 4.3 Các tiêu xếp loại ngân hàng thương mại 49 Bảng 4.4 Tiêu chí quy đổi điểm 50 Bảng 4.5 Phân bố liệu huấn luyện 51 Bảng 4.6 Phân bố liệu kiểm thử 51 Bảng 4.7 Kết thực nghiệm phân lớp Naive Bayes với liệu gốc 52 Bảng 4.8 Kết thực nghiệm phân lớp Naive Bayes với liệu quy đổi 52 Bảng 4.9 Kết thực nghiệm phân lớp SVM với liệu gốc 53 Bảng 4.10 Kết thực nghiệm phân lớp SVM với liệu quy đổi 53 Bảng 4.11 Kết thực nghiệm phân lớp định với liệu gốc 54 Bảng 4.12 Kết thực nghiệm phân lớp định với liệu quy đổi 54 BẢNG CÁC KÝ HIỆU VIẾT TẮT Từ cụm từ Kí hiệu viết tắt Oracle data miner ODM One-against-Rest OAR One-against-One OAO Support vector machine SVM LỜI MỞ ĐẦU Ngày nay, đơn v , tổ chức có áp dụng công nghệ thông tin vào quản lý, ứng dụng dừng lại mức đ ứng dụng tác nghiệp thông thường với chức n ng hỗ trợ đưa thông tin vào kết xuất báo cáo đầu Những ứng dụng hỗ trợ cao cho phân tích, hỗ trợ đ nh chưa nhiều Tuy nhiên với xu hướng phát triển tại, chắn cần đến ứng dụng khai phá tri thức tiềm ẩn sở liệu Bảo hiểm tiền gửi Việt Nam tổ chức tài Nhà nước với nhiệm vụ bảo vệ quyền lợi ích hợp pháp người gửi tiền, góp phần trì s ổn đ nh tổ chức tham gia Bảo hiểm tiền gửi s phát triển an toàn lành mạnh hoạt đ ng ngân hàng Với nhiệm vụ giao, m t cơng tác Bảo hiểm tiền gửi Việt Nam giám sát tổ chức tham gia Bảo hiểm tiền gửi (đánh giá rủi ro, xếp loại tổ chức tham gia Bảo hiểm tiền gửi,…) Áp dụng công nghệ tin học vào công tác giám sát tổ chức tham gia Bảo hiểm tiền gửi từ n m đầu thành lập Bảo hiểm Tiền gửi Việt Nam, đến Bảo hiểm tiền gửi Việt Nam xây d ng hệ thống công nghệ thông tin đáp ứng nhiệm vụ giám sát tổ chức tham gia Bảo hiểm tiền gửi Tuy nhiên, sở liệu Bảo hiểm tiền gửi Việt Nam ch sử dụng để phục vụ tác nghiệp ngày, báo cáo, thống kê Tại Bảo hiểm tiền gửi Việt Nam, ứng dụng dừng mức đưa báo cáo liệt kê ch tiêu tổ chức tham gia Bảo hiểm tiền gửi cán b giám sát Bảo hiểm tiền gửi c n vào báo cáo để phân tích, đánh giá tổ chức tham gia Bảo hiểm tiền gửi (phân tích ch tiêu m t cách riêng lẻ) Với số lượng tổ chức tham gia Bảo hiểm tiền gửi ngày t ng, việc xem xét trường hợp, số liệu cụ thể tổ chức tham gia Bảo hiểm tiền gửi trở nên khó kh n cần công cụ hỗ trợ Mong muốn cán b giám sát có ứng dụng t đ ng phân tích d a nhiều ch tiêu đưa số liệu ch tiêu m t tổ chức tham gia Bảo hiểm tiền gửi vào có câu trả lời xếp loại tổ chức Hiện tại, Bảo hiểm tiền gửi Việt Nam th c đấu thầu để triển khai d án hệ thống thông tin quản lý đại hóa ngân hàng - Hợp phần Bảo hiểm tiền gửi Việt Nam M t yêu cầu phân hệ Giám sát rủi ro hệ thống hệ thống phải cho phép tiến hành khai thác liệu, hệ thống phải cung cấp công cụ hỗ trợ hoạt đ ng: đánh giá rủi ro, xếp loại tổ chức tham gia Bảo hiểm tiền gửi Với tìm hiểu trên, cho thấy áp dụng khai phá liệu với sở liệu Bảo hiểm tiền gửi Việt Nam để đáp ứng mong muốn cán b giám sát, từ nâng cao hiệu cơng tác giám sát, đánh giá, xếp loại tổ chức tham gia Bảo hiểm tiền gửi 43 - Đ tin cậy mơ hình thể thẻ Preditive Confidence hình sau: Hình 3.11 Màn hình ODM – độ tin cậy mơ hình khai phá liệu - Đ xác mơ hình thể thẻ Accuracy hình sau: Hình 3.12 Màn hình ODM – độ xác mơ hình khai phá liệu 44 Bước 5: Áp dụng mơ hình khai phá vào khai phá liệu: - Trên giao diện chương trình, chọn Activity -> chọn Apply Hình 3.13 Màn hình ODM – chọn chức áp dụng mơ hình khai phá liệu - Chọn mơ hình khai phá Hình 3.14 Màn hình ODM – chọn mơ hình khai phá liệu cần áp dụng 45 - Chọn bảng liệu cần khai phá Hình 3.15 Màn hình ODM – chọn bảng liệu cần khai phá - Chọn thu c tính đầu vào Hình 3.16 Màn hình ODM – chọn thuộc tính đầu vào cho khai phá 46 - Nhập tên hoạt đ ng khai phá liệu Hình 3.17 Màn hình ODM – nhập tên cho hoạt động khai phá - Chọn Run Activity để hoàn thành việc khai phá Hình 3.18 Màn hình ODM – kết áp dụng mơ hình khai phá liệu 47 - Chọn Result để xem kết d đốn Hình 3.19 Màn hình ODM – kết khai phá liệu 3.3 Tổng kết chƣơng Chương trình bày lý sử dụng công nghệ khai phá liệu Oracle, quy trình khai phá liệu sử dụng cơng cụ Oracle Data Miner 48 CHƢƠNG 4: THỰC NGHIỆM PHÂN LỚP CÁC NGÂN HÀNG THƢƠNG MẠI 4.1 Môi trƣờng thực nghiệm 4.1.1 Cấu hình phần cứng, hệ điều hành Bảng 4.1 Cấu hình phần cứng, hệ điều hành Thành phần Chỉ số CPU Intel Core Duo 3.00 GHz RAM GB HDD 150 GB OS Microsoft Window XP Service Park 4.1.2 Công cụ phần mềm Trong luận v n sử dụng phần mềm bảng sau: Bảng 4.2 Danh sách phần mềm sử dụng STT Tên phần mềm Oracle database 10g Java JDK 1.4.2 Oracle Data Miner 10.2.0.1 Nguồn Đĩa CD chứa b cài Oracle Database 10g http://www.oracle.com/technetwork/database/e nterprise-edition/odminer-install-10202098193.html 4.1.3 Cài đặt kết nối phần mềm Để sử dụng Oracle Data Miner Microsoft Windows, cần cài đặt kết nối sau: Cài đặt Oracle Database 10g tạo Database chứa liệu th c nghiệm Cài đặt Java JDK 1.4.2 Tải odminer.zip Giải nén tệp odminer.zip Chạy (nhấp đúp chu t) tệp odminerw.exe thư mục bin vừa giải nén Đ nh nghĩa m t kết nối mô tả đây: (Host đ a ch máy chứa liệu th c nghiệm) 49 Hình 4.1 Định nghĩa kết nối Oracle Data Miner với sở liệu 4.2 Dữ liệu thực nghiệm Dữ liệu th c nghiệm gồm liệu ch tiêu giám sát 98 ngân hàng thương mại n m 2010, 2011, 2012, 2013 Dữ liệu th c nghiệm có tất 4253 ghi Toàn b liệu th c nghiệm tiền xử lý gán nhãn sau: Trong phạm vi luận v n, ch xét ch tiêu bảng sau làm c n để đánh giá, xếp loại ngân hàng thương mại: Bảng 4.3 Các tiêu xếp loại ngân hàng thương mại Mã tiêu Tên tiêu M51 Chênh lệch thu nhập, chi phí M246 Lỗ lũy kế M111 Tỷ lệ nợ xấu M112 Tỷ lệ nợ hạn M107 Tỷ lệ đầu tư, mua sắm tài sản cố đ nh so với Vốn cấp M108 Giới hạn góp vốn mua cổ phần 50 Tiêu chí cho điểm ch tiêu sau: Bảng 4.4 Tiêu chí quy đổi điểm Chỉ tiêu Điểm Chênh lệch thu nhập, chi phí >0 A =0 B 0 A =0 B 1 4 ch tiêu b điểm C NHTM xếp loại D Tập liệu th c nghiệm chia làm hai tập con, tập liệu huấn luyện tập liệu kiểm thử Trong đó: - Tập liệu huấn luyện phân bố sau: Bảng 4.5 Phân bố liệu huấn luyện STT Lớp Số trƣờng hợp A 1663 B 861 C 217 D 93 Tổng - 2834 Tập liệu kiểm thử phân bố sau: Bảng 4.6 Phân bố liệu kiểm thử STT Lớp Số trƣờng hợp A 990 B 500 C 138 D 53 Tổng 1681 52 4.3 Kết thực nghiệm 4.3.1 Kết thực nghiệm thuật toán phân lớp Naive Bayes a) Kết thực nghiệm với liệu gốc Bảng 4.7 Kết thực nghiệm phân lớp Naive Bayes với liệu gốc STT Lớp Số trƣờng hợp phân lớp A 875 29 0,9679 0,8838 0,9239 B 403 117 0,775 0,806 0,7902 C 109 97 0,5291 0,7899 0,6337 D 51 0,9623 0,9808 Số trƣờng hợp phân lớp sai Độ Độ hồi F-Measure xác tƣởng (Precision) (Recall) (Đ đo F)  = 0,8554 M = 0,8605 b) Kết thực nghiệm với liệu quy đổi Bảng 4.8 Kết thực nghiệm phân lớp Naive Bayes với liệu quy đổi STT Lớp Số trƣờng hợp phân lớp A 802 119 0,9808 0,9903 B 372 199 0,8923 0,928 0,9098 C 80 28 0,7372 0,7319 0,7345 D 50 31 1  = 0,9453 M = 0,9102 Số trƣờng hợp phân lớp sai Độ Độ hồi F-Measure xác tƣởng (Precision) (Recall) (Đ đo F) 53 4.3.2 Kết thực nghiệm thuật toán phân lớp SVM a) Kết thực nghiệm với liệu gốc Bảng 4.9 Kết thực nghiệm phân lớp SVM với liệu gốc STT Lớp Số trƣờng hợp phân lớp A 802 119 0,8708 0,8101 0,8394 B 372 199 0,6515 0,744 0,6947 C 80 28 0,7407 0,5797 0,6504 D 50 31 0,6173 0,9434 0,7463 Số trƣờng hợp phân lớp sai Độ Độ hồi F-Measure xác tƣởng (Precision) (Recall) (Đ đo F)  = 0,7757 M = 0,7693 b) Kết thực nghiệm với liệu quy đổi Bảng 4.10 Kết thực nghiệm phân lớp SVM với liệu quy đổi STT Lớp Số trƣờng hợp phân lớp A 990 42 0,9593 0,9792 B 405 17 0,9597 0,81 0,8785 C 106 52 0,6709 0,7681 0,7162 4 D 53 15 0,7681 0,8688  = 0,9244 M = 0,8945 Số trƣờng hợp phân lớp sai Độ Độ hồi xác tƣởng (Precision) (Recall) F-Measure (Đ đo F) 54 4.3.3 Kết thực nghiệm thuật toán phân lớp định a) Kết thực nghiệm với liệu gốc Bảng 4.111 Kết thực nghiệm phân lớp định với liệu gốc STT Lớp Số trƣờng hợp phân lớp A 979 0,9919 0,9889 0,9904 B 475 30 0,9406 0,95 0,9453 C 118 17 0,8741 0,8551 0,8645 D 53 0,9815 0,9907 Số trƣờng hợp phân lớp sai Độ Độ hồi F-Measure xác tƣởng (Precision) (Recall) (Đ đo F)  = 0,9667 M = 0,9485 b) Kết thực nghiệm với liệu quy đổi Bảng 4.122 Kết thực nghiệm phân lớp định với liệu quy đổi STT Lớp Số trƣờng hợp phân lớp A 999 0,999 0,9995 B 495 10 0,9802 0,99 0,9851 C 127 0,9695 0,9203 0,9443 D 53 0,9815 0,9907  = 0,9905 M = 0,9776 Số trƣờng hợp phân lớp sai Độ Độ hồi F-Measure xác tƣởng (Precision) (Recall) (Đ đo F) 55 4.4 Đánh giá kết đạt đƣợc Quá trình th c nghiệm mơ hình giải tốn phân lớp ngân hàng thương mại d a phương pháp đinh, phương pháp máy hỗ trợ vector SVM phương pháp Naive Bayes bước đầu cho thấy kết tương đối khả quan với đ xác cao Trong đó, th c nghiệm sử dụng liệu gốc, phương pháp đ nh cho kết có đ tin cậy (93,13%) đ xác (96,67%) cao nhất, phương pháp Naive Bayes cho kết có đ tin cậy (81,4%) đ xác (85,54) cao so với phương pháp máy hỗ trợ vector SVM Thời gian xây d ng mơ hình thuật toán nhanh, với liệu thử nghiệm thời gian xây d ng mơ hình, kiểm thử mơ hình áp dụng mơ hình ba thuật toán ch vài giây Th c nghiệm cho thấy việc sử dụng liệu quy đổi ba thuật toán cho kết tốt việc sử dụng liệu gốc Kết th c nghiệm cho thấy mơ hình d đốn có tính khả thi áp dụng th c tế 4.5 Tổng kết chƣơng Chương trình bày quy trình phân lớp ngân hàng thương mại sở mơ hình đề xuất chương 2, th c nghiệm đánh giá kết phân lớp ngân hàng thương mại d a phương pháp đinh, phương pháp máy hỗ trợ vector SVM phương pháp Naive Bayes 56 KẾT LUẬN Từ việc nghiên cứu toán phân lớp ngân hàng thương mại, luận v n đề xuất mơ hình giải phân lớp ngân hàng thương mại d a phương pháp đ nh, phương pháp máy hỗ trợ vector (SVM) phương pháp Naive Bayes Qua kết th c nghiệm đạt cho thấy mơ hình đề xuất d a phương pháp đ nh có đ xác cao D a vào kết th c nghiệm thấy mơ hình xây d ng có tính khả thi áp dụng th c tế Về mặt n i dung, luận v n đạt kết sau: - Trình bày khái niệm chung khai phá liệu - Trình bày tốn phân lớp phân lớp d a phương pháp đinh, phương pháp máy hỗ trợ vector (SVM) phương pháp Naive Bayes - Trình bày tốn phân lớp ngân hàng thương mại mơ hình giải tốn phân lớp ngân hàng thương mại - Trình bày công nghệ khai phá liệu Oracle, công cụ khai phá liệu Oracle Data Miner - Th c nghiệm phân lớp ngân hàng thương mại thuật toán phân lớp đ nh, thuật toán Naive Bayes thuật toán SVM Oracle Data Miner - Đánh giá kết đạt Nhìn chung, hướng tiếp cận đề tài đắn có tính th c tiễn cao Để đưa mơ hình phân lớp ngân hàng thương mại vào ứng dụng m t cách hiệu Bảo hiểm tiền gửi Việt Nam Bảo hiểm tiền gửi Việt Nam cần có chế thu thập liệu ngân hàng thương mại đầy đủ xác nữa, cần xây d ng b học liệu lớn xác (b liệu đánh giá rủi ro ngân hàng thương mại c n vào toàn b hệ thống ch tiêu giám sát), áp dụng mơ hình d đốn vào th c tế, kiểm chứng th c tế đánh giá kết m t cách thường xun Ngồi ra, luận v n tham khảo để giải toán đánh giá rủi ro, phân lớp quỹ tín dụng c n vào hệ thống ch tiêu giám sát quỹ tín dụng d a phương pháp phân lớp sử dụng công cụ Oracle Data Miner Đối với hệ thống thông tin quản lý đại hóa ngân hàng - Hợp phần Bảo hiểm tiền gửi Việt Nam đấu thầu để triển khai, m t yêu cầu phân hệ Giám sát rủi ro hệ thống hệ thống phải cho phép tiến hành khai thác liệu, hệ thống phải cung cấp công cụ hỗ trợ hoạt đ ng: đánh giá rủi ro, xếp hạng tổ chức tham gia Bảo hiểm tiền gửi Vì vậy, kết nghiên cứu luận v n tiền đề cho việc triển khai phân hệ Giám sát rủi ro hệ thống TÀI LIỆU THAM KHẢO Tiếng Việt [1] Đinh Th Kim Dung (2004), “M t số thử nghiệm khai phá liệu sở liệu ORACLE”, Đại học Công nghệ, Đại học Quốc gia Hà N i [2] Lường Hồng Giang (2012), “Ứng dụng m t số kỹ thuật khai phá liệu để phân tích liệu viễn thơng nhằm t ng cường chất lượng d ch vụ khách hàng”, Đại học Công nghệ, Đại học Quốc gia Hà N i [3] Đoàn Nhật Minh (2003), “Nghiên cứu m t số phương pháp khai phá liệu thiết kế, xây d ng ứng dụng khai phá liệu kho liệu khách hàng bưu điện Tp Hà N i”, Đại học Công nghệ, Đại học Quốc gia Hà N i [4] Vũ Thanh Nguyên, Trang Nhật Quang (2009) ,“Ứng dụng thuật tốn phân lớp rút trích thơng tin v n FSVM Internet”, Tạp chí Phát triển Khoa học Công nghệ, tập 12, số 05-2009 [5] Hà Quang Thụy (2013), Bài giảng “Kho liệu khai phá liệu” [6] Hà Quang Thụy, Phan Xuân Hiếu, Đoàn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú (2009), “Giáo trình khai phá liệu Web”, Nhà xuất Giáo dục Việt Nam [7] Nguyễn Thu Trà (2006), “Nghiên cứu áp dụng m t số kỹ thuật khai phá liệu với sở liệu ngành Thuế Việt Nam”, Luận v n thạc sỹ khoa học, Trường Đại học Bách Khoa Hà N i [8] Website: http://bis.net.vn Tiếng Anh [9] Jiawei Han and Michelline Kamber (2000), “Data mining: Concepts and Techniques”, Morgan Kaufmann Publishers [10] Oracle (2003), “Oracle Data Mining Concepts 10g Release 1”, Oracle Corporation [11] Oracle (2008), “Oracle Data Mining Tutorial for Oracle Data Mining 10g Release 2”, Oracle Corporation [12] Oracle (2003), “Oracle Data Mining Administrator's Guide 10g Release 1”, Oracle Corporation ... ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ MINH LÝ KHAI PHÁ DỮ LIỆU TRÊN NỀN ORACLE VÀ ỨNG DỤNG Ngành: Công nghệ Thông tin Chuyên ngành: Hệ thống Thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN... giải pháp phân lớp ngân hàng thương mại - Thứ ba, tìm hiểu công nghệ khai phá liệu Oracle - Thứ tư, th c nghiệm khai phá liệu sử dụng công cụ khai phá liệu Oracle 3 CHƢƠNG 1: TỔNG QUAN VỀ KHAI PHÁ... Ƣu khai phá liệu Khai phá liệu có nhiều ứng dụng m t số ưu rõ rệt xem xét đây: + So với phương pháp học máy, khai phá liệu có lợi chỗ, khai phá liệu sử dụng với sở liệu chứa nhiều nhiễu, liệu

Ngày đăng: 01/01/2023, 20:28

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan