Tiểu luận môn CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG CÂY QUYẾT ĐỊNH VÀ HỖ TRỢ RA QUYẾT ĐỊNH TÍN DỤNG NGÂN HÀNG

51 400 0
Tiểu luận môn CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG CÂY QUYẾT ĐỊNH VÀ HỖ TRỢ RA QUYẾT ĐỊNH TÍN DỤNG NGÂN HÀNG

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THƠNG TIN  PHỊNG ĐÀO TẠO SAU ĐẠI HỌC TIỂU LUẬN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG CÂY QUYẾT ĐỊNH VÀ HỖ TRỢ RA QUYẾT ĐỊNH TÍN DỤNG NGÂN HÀNG Giảng viên hướng dẫn: GS TSKH HOÀNG VĂN KIẾM Học viên thực hiện: NGUYỄN VĂN KIỆT Mã số học viên: CH1301095 TP Hồ Chí Minh, tháng 10 năm 2014 HVTH: NGUYỄN VĂN KIỆT Trang Công nghệ tri thức ứng dụng GVHD: GS TSKH HOÀNG VĂN KIẾM Mục Lục HVTH: NGUYỄN VĂN KIỆT Trang CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HỒNG VĂN KIẾM DANH MỤC HÌNH HVTH: NGUYỄN VĂN KIỆT Trang CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM DANH MỤC BẢNG HVTH: NGUYỄN VĂN KIỆT Trang CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM LỜI MỞ ĐẦU Tôi xin chân thành gửi lời cám ơn chân thành đến GS TSKH Hoàng Văn Kiếm, người thầy hướng dẫn khoa học nghiêm túc nhiệt tâm Thầy người truyền đạt cho kiến thức quý báu môn học “Công nghệ tri thức ứng dụng” Nhờ có kiến thức thầy mà tơi có đủ kiến thức cơng cụ cần thiết để thực tiểu luận môn học Sau thời gian học tập môn Công nghệ tri thức ứng dụng, với tìm hiểu từ tài liệu từ báo khoa học luận văn Internet Tôi chọn nghiên cứu Cây định hỗ trợ định tín dụng ngân hàng để làm tiểu luận cho mơn học Nội dung tiểu luận gồm: Chương 1: Tổng quan khám phá tri thức khai phá liệu Chương 2: Cây định khai phá liệu Chương 3: Ứng dụng định vào tốn hỗ trợ định tín dụng ngân hàng Chương 4: Cài đặt, thử nghiệm đánh giá Chương 5: Kết luận Do thời gian nghiên cứu có hạn thân tơi có số hạn chế nên khơng tránh khỏi thiếu sót báo cáo Kính mong nhận thơng cảm góp ý GS TSKH Hồng Kiếm để hướng nghiên cứu tơi tới hồn thiện đạt hiểu Tôi xin chân thành cảm ơn! HVTH: NGUYỄN VĂN KIỆT Trang CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM Chương TỔNG QUAN VỀ KHÁM PHÁ TRI THỨC VÀ KHAI PHÁ DỮ LIỆU Trong năm gần đây, phát triển mạnh mẽ CNTT ngành công nghiệp phần cứng làm cho khả thu thập lưu trữ thông tin hệ thống thông tin tăng nhanh cách nhanh chóng Bên cạnh đó, việc tin học hoá cách ạt hoạt động sản xuất, kinh doanh nhiều lĩnh vực hoạt động khác tạo cho lượng liệu (DL) lưu trữ khổng lồ Hàng triệu CSDL sử dụng hoạt động sản xuất, kinh doanh, quản lí , có nhiều CSDL cực lớn cỡ Gigabyte, chí Terabyte Sự bùng nổ dẫn tới yêu cầu cấp thiết cần có kĩ thuật cơng cụ để tự động chuyển đổi lượng liệu khổng lồ thành tri thức có ích Từ đó, kĩ thuật khai phá liệu trở thành lĩnh vực thời CNTT giới 1.1 Khai phá liệu gì? Khai phá liệu (Data Mining) khái niệm đời vào năm cuối thập kỷ 1980 Nó q trình trích xuất thơng tin có giá trị tiềm ẩn bên lượng lớn DL lưu trữ CSDL, kho liệu Hiện nay, thuật ngữ khai phá liệu, người ta dùng số thuật ngữ khác có ý nghĩa tương tự như: khai phá tri thức từ CSDL, trích lọc DL, phân tích DL/ mẫu, khảo cổ DL, nạo vét DL Nhiều người coi khai phá liệu thuật ngữ thông dụng khác phát tri thức CSDL (Knowlegde Discovery in Databases - KDD) Tuy nhiên thực tế, khai phá liệu bước thiết yếu trình phát tri thức CSDL Có thể nói Data Mining giai đoạn quan trọng HVTH: NGUYỄN VĂN KIỆT Trang CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HỒNG VĂN KIẾM tiến trình phát tri thức từ CSDL, tri thức hỗ trợ việc định khoa học kinh doanh 1.2 Quá trình khám phá tri thức Hình 1.1: Quá trình khám phá tri thức 1.2.1 Hình thành định nghĩa tốn Đây bước tìm hiểu lĩnh vực ứng dụng hình thành tốn Bước định cho việc rút tri thức hữu ích, đồng thời lựa chọn phương pháp khai phá liệu thích hợp với mục đích ứng dụng chất liệu 1.2.2 Thu thập tiền xử lý liệu Trong bước liệu thu thập dạng thô (nguồn liệu thu thập từ liệu hay nguồn thông tin Internet) Trong giai đoạn liệu tiền xử lí để biến đổi cải thiện chất lượng liệu cho phù hợp với phương pháp khai phá liệu chọn lựa bước Bước thường chiếm nhiều thời gian trình khám phá tri thức Các thuật giải tiền xử lí liệu bao gồm: HVTH: NGUYỄN VĂN KIỆT Trang CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HỒNG VĂN KIẾM Xử lí liệu bị mất/ thiếu: Các dạng liệu bị thiếu thay giá trị thích hợp; Khử trùng lắp: Các đối tượng liệu trùng lắp bị loại bỏ Kỹ thuật không sử dụng cho tác vụ có quan tâm đến phân bố liệu Giảm nhiễu: Nhiễu đối tượng tách rời khỏi phân bố chung bị loại khỏi liệu Chuẩn hóa: Miền giá trị liệu chuẩn hóa Rời rạc hóa: dạng liệu số biến đổi giá trị rời rạc Rút trích xây dựng đặc trưng từ thuộc tính có Giảm chiều: Các thuộc tính chứa thông tin loại bỏ bớt 1.2.3 Khai phá liệu rút tri thức Đây bước quan trọng tiến trình khám phá tri thức Kết bước trích mẫu và/ mơ hình ẩn duwowisc liệu Một mơ hình biểu diễn cấu trúc tổng thể thành phần hệ thống hay hệ thống CSDL, hay miêu tả cách liệu nảy sinh Còn mẫu cấu trúc cục có liên quan đến vài biến vài trường hợp CSDL 1.2.4 Phân tích kiểm định kết Bước hiểu tri thức tìm được, đặc biệt làm sáng tỏ mơ tả dự đốn Trong bước này, kết tìm biến đổi sang dạng phù hợp với lĩnh vực ứng dụng dễ hiểu cho người dung 1.2.5 Sử dụng tri thức phát HVTH: NGUYỄN VĂN KIỆT Trang CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM Trong bước này, tri thức khám phá củng cố, kết hợp lại thành hệ thống, đồng thời giải xung đột tiềm tri thức Các mơ hình rút đưa vào hệ thống thông tin thực tế dạng moodun hỗ trợ việc đưa định Các giai đoạn trình khám phá tri thức có mối quan hệ chặt chẽ với bối cảnh chung hệ thống Các kỹ thuật sử dụng giai đoạn trước ảnh hưởng đến hiệu giải thuật sử dụng giai đoạn Các bước q trình khám phá tri thức lặp lặp lại số lần, kết thu được lấy trung bình tất lần thực 1.3 Quá trình khai phá liệu Khai phá liệu hoạt động trọng tâm trình khám phá tri thức Thuật ngữ khai phá liệu số nhà khoa học gọi phát tri thức CSDL (Knowledge Discovery in Database – KDD) (Theo Fayyad Smyth and Piatestky – Shapiro 1989) Quá trình gồm bước: HVTH: NGUYỄN VĂN KIỆT Trang CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HỒNG VĂN KIẾM Hình 1.2: Q trình khai phá liệu Quá trình khai phá liệu bắt đầu với kho liệu thô kết thúc với tri thức chiết xuất Nội dung trình sau: 1.3.1 Gom liệu (Gatherin) Tập hợp liệu bước khai phá liệu Bước lấy liệu từ sở liệu, kho liệu, chí liệu từ nguồn cung ứng web 1.3.2 Trích lọc liệu (Selection) Ở giai đoạn liệu lựa chọn phân chia theo số tiêu chuẩn 1.3.3 Làm tiền xử lý liệu (Cleansing Preprocessing) Giai đoạn thứ ba giai đoạn hay bị lãng, thực tế bước quan trọng trình khai phá liệu Một số lỗi thường mắc phải gom liệu liệu không đầy đủ khơng thống nhất, thiếu chặt chẽ Vì liệu thường chứa giá trị vô nghĩa khả kết nối liệu Ví dụ Sinh viên có tuổi=200 Giai đoạn thứ ba nhằm xử lý liệu trên(dữ liệu vô nghĩa, liệu khơng có khả kết nối) Những liệu dạng thường xem thông tin dư thừa, khơng có giá trị Bởi q trình quan trọng Nếu liệu khơng làm sạch- tiền xử lý - chuẩn bị trước gây nên kết sai lệch nghiêm trọng sau 1.3.4 Chuyển đổi liệu (Transformation) Trong giai đoạn này, liệu tổ chức sử dụng lại Mục đích việc chuyển đổi liệu làm cho liệu phù hợp với mục đích khai phá liệu 1.3.5 Phát trích mẫu liệu (Pattern Extraction and Discovery) Đây bước tư khai phá liệu Ở giai đoạn nhiều thuật toán khác sử dụng để trích mẫu từ liệu Thuật tốn thường HVTH: NGUYỄN VĂN KIỆT Trang 10 CƠNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM bị nhiễu Trong C4.5 thực việc phân ngưỡng với thuộc tính số phép tách nhị p hân đưa vào đại lượng GainRatio thay cho đại lượng Gain ID3 Để giải vấn đề thuộc tính có nhiều giá trị Ngồi C4.5 cịn có bước cắt tỉa nhánh khơng phù hợp Tuy nhiên yếu điểm thuật tốn làm việc khơng hiệu với CSDL lơn chưa giải vấn đề nhớ − Thuật toán SLIQ phân lớp có hiệu tập liệu lớn, làm việc khơng phù thuộc vào số lượng lớp, thuộc tính số lượng ghi tập liệu SLIQ cải thiện vấn đề nhớ có pha tiền xử lý phân loại, thời điểm có danh sách lớp thường trú nhớ SLIQ có kỹ thuật cắt tỉa mơ tả độ dài tối thiểu MDL, hữu hiệu Nó thuật tốn phân lớp nhanh, xác, chi phí thấp Tuy nhiên việc cài đặt phức tạp, áp dụng cho sở liệu lớn Mặc dù có nhiều cải tiến, nhiều thuật toán xây dựng định đời, nói chung vấn cịn nhiều vấn đề khó khăn phức tạp nhiều thách thức KPDL định Như vấn đề liệu bị thiếu giá trị thuộc tính CSDL Vấn đề CSDL lớn số lượng thuộc tính số lượng ghi, vấn đề nhớ…Những vấn đề làm đau đầu nhà khoa học Trên thực tế thuật toán xây dựng định vấn cải tiến, nghiên cứu phát triển HVTH: NGUYỄN VĂN KIỆT Trang 37 CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM Chương ỨNG DỤNG CÂY QUYẾT ĐỊNH VÀO BÀI TOÁN HỖ TRỢ RA QUYẾT ĐỊNH TÍN DỤNG NGÂN HÀNG 3.1 Một số ứng dụng khai phá liệu lĩnh vực ngân hàng  Marketing Một lĩnh vực ứng dụng rộng rãi cho ngành ngân hàng kỹ thuật khai phá liệu lĩnh vực quảng bá sản phẩm Bộ phận tiếp thị bán hàng Ngân hàng sử dụng kỹ thuật khai phá liệu để phân tích sở liệu khách hàng Kỹ thuật khai thác liệu giúp xác định khách hàng mang lại lợi nhuận khách hàng không mang lại lợi nhuận  Quản lý rủi ro Khai phá liệu sử dụng rộng rãi để quản lý rủi ro ngành công nghiệp ngân hàng Giám đốc điều hành ngân hàng cần phải biết khách hàng mà họ có liệu đáng tin cậy hay không  Phát gian lận Một lĩnh vực khác khai phá liệu sử dụng ngành cơng nghiệp ngân hàng việc phát gian lận Phát hành động gian lận mối quan tâm ngày tăng cho nhiều doanh nghiệp, với giúp đỡ kỹ thuật khai phá liệu hành động gian lận ngày phát hiên nhiều  Quản trị quan hệ khách hàng Trong thời đại cạnh tranh khốc liệt ngày nói chung, đặc biệt ngành ngân hàng, khách hàng luôn nhân tố quan trọng định tồn HVTH: NGUYỄN VĂN KIỆT Trang 38 CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM phát triển họ Khai phá liệu hữu ích tất ba giai đoạn chu kỳ mối quan hệ khách hàng: Tìm kiếm khách hàng, tăng giá trị khách hàng trì khách hàng 3.2 Ứng dụng định qui trình tín dụng 3.2.1 Qui trình tín dụng  Khái niệm qui trình tín dụng Để chuẩn hố q trình tiếp xúc, phân tích, cho vay thu nợ khách hàng, Ngân hàng thường đặt quy trình phân tích tín dụng Đó bước (hoặc nội dung cơng việc) mà cán tín dụng, phịng ban có liên quan Ngân hàng phải thực làm việc cho khách hàng  Ý nghĩa qui trình ứng dụng Việc thiết lập quy trình tín dụng khơng ngừng hồn thiện đặc biệt quan trọng ngân hàng thương mại Về mặt hiệu quả, quy trình tín dụng hợp lý giúp cho ngân hàng nâng cao chất lượng tín dụng giảm thiểu rủi ro tín dụng 3.2.2 Qui trình tín dụng  Bước 1: Lập hồ sơ vay vốn Bước cán tín dụng thực sau tiếp xúc khách hàng Nhìn chung hồ sơ vay vốn cần phải thu thập thông tin như: - Năng lực pháp lý, lực hành vi dân khách hàng Khả sử dụng vốn vay HVTH: NGUYỄN VĂN KIỆT Trang 39 CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG  GVHD: GS TSKH HỒNG VĂN KIẾM Khả hồn trả nợ vay (vốn vay lãi) Bước 2: Phân tích tín dụng Phân tích tín dụng xác định khả tương lai khách hàng việc sử dụng vốn vay hoàn trả nợ vay với mục tiêu: - Tìm kiếm tình xảy dẫn đến rủi ro cho ngân hàng, dự đốn khả khắc phục rủi ro đó, dự kiến biện pháp giảm - thiểu rủi ro hạn chế tổn thất cho ngân hàng Phân tích tính chân thật thơng tin thu thập từ phía khách hàng bước 1, từ nhận xét thái độ, thiện chí khách hàng làm sở  cho việc định cho vay Bước 3: Ra định tín dụng Trong khâu này, ngân hàng định đồng ý từ chối cho vay hồ sơ vay vốn khách hàng Khi định, thường mắc sai lầm bản:  • Đồng ý cho vay với khách hàng khơng tốt • Từ chối cho vay với khách hàng tốt Bước 4: Giải ngân Nguyên tắc giải ngân: phải gắn liền vận động tiền tệ với vận động hàng hóa dịch vụ có liên quan, nhằm kiểm tra mục đích sử dụng vốn vay khách hàng đảm bảo khả thu nợ  Bước 5: Giám sát tín dụng HVTH: NGUYỄN VĂN KIỆT Trang 40 CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM Nhân viên tín dụng thường xuyên kiểm tra việc sử dụng vốn vay thực tế khách hàng, trạng tài sản đảm bảo, tình hình tài khách hàng để đảm bảo khả thu nợ  Bước 6: Thanh lý hợp đồng tín dụng 3.3 Sử dụng định để phân loại khách hàng Qui trình tín dụng mà ngân hàng thương mại phải tuân theo Bài toán đặt để định tín dụng Bước để không mắc phải sai lầm mắc phải là: • Đồng ý cho vay với khách hàng khơng tốt • Từ chối cho vay với khách hàng tốt Đề giải toán này, dựa liệu có sẵn để hỗ trợ định Trong nghiên cứu này, chúng tơi tập trung vào cơng tác tín dụng tiêu dùng, đặc biệt việc mua nhà giá thấp khách hàng với tập liệu thu thập Dựa vào tập liệu xây dựng mơ hình định, từ định ta rút luật định Dựa vào luật định ta phân lớp tập liệu (dữ liệu khách hàng xin vay tiêu dùng, chưa phân lớp) tập liệu sau phân lớp hỗ trợ cán tín dụng định cho khách hàng vay hay không? Các bước thực giải toán: - Thu thập tiền xử lý liệu: Tiến hành thu thập liệu khách hàng theo thuộc tính sau: Tuổi, Giới tính, Hộ khẩu, Thu nhập, Kết hơn, Số con, Xe HVTH: NGUYỄN VĂN KIỆT Trang 41 CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM Ôtô, Tài khoản tiết kiệm, Tài khoản tại, Tài sản chấp, Cho vay Dữ liệu khách hàng mô tả chi tiết qua Bảng 3.1: Bảng 3.1: Bảng thuộc tính tập liệu huấn luyện Thứ tự Thuộc tính Giá trị Ý nghĩa Tuoi Tre, TrungNien, Gia Trẻ, Trung niên, Già GioiTinh Nam, Nu Nam, Nữ HoKhau NongThon, ThiTran, NgoaiO, ThanhPho Nông thôn, Thị trấn, Ngoại ô, Thành phố ThuNhap Thap, TrungBinh, Cao Thấp, Trung bình, Cao KetHon Co, Khong Có, Khơng SoCon KhongCon, MotCon, HaiCon, BaCon, BonCon Không con, Một con, Hai con, Ba con, Bốn XeOto Co, Khong Có, Khơng TaiKhoanTietKiem Co, Khong Có, Khơng TaiKhoanHienTai Co, Khong Có, Khơng 10 TaiSanTheChap Co, Khong Có, Khơng 11 ChoVay Yes, No Có (Yes), Khơng (No) Sau trình thu thập, tiến hành hậu xử lý giữ liệu như: kiểm tra chỉnh sửa lại giá trị thuộc tính để đồng liệu Tiếp theo, chia liệu thu thập thành tập: liệu huấn luyện liệu thử nghiệm HVTH: NGUYỄN VĂN KIỆT Trang 42 CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG - GVHD: GS TSKH HOÀNG VĂN KIẾM Khai thác liệu rút tri thức: Chọn mơ hình định để tìm luật hỗ trợ định cho vay Tiến hành huấn luyện tập liệu huấn luyện Ví dụ: + Luật 1: IF(SoCon = MotCon) AND (ThuNhap = Cao) AND (TaiKhoanTheChap = Co) THEN (ChoVay = Yes) + Luật 2: IF(SoCon = BonCon) AND (ThuNhap = Thap) AND (TaiKhoanTheChap = Khong) THEN (ChoVay = No) +… - Phân tích kiểm định kết quả: Tiến hành kiểm tra đánh giá độ xác - tập liệu huấn luyện Sử dụng tri thức phát được:Từ luật xây dựng được, tiến hành xây dựng ứng dụng hỗ trợ định việc cho khách hàng vay hay không? Trong chương 4, tiến hành cài đặt thử nghiệm chương trình HVTH: NGUYỄN VĂN KIỆT Trang 43 CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM Chương CÀI ĐẶT, THỬ NGHIỆM VÀ ĐÁNH GIÁ 4.1 Cài đặt Chương trình xây dựng dựa trên: - Ngôn ngữ: Java Công cụ: NetBeans 8.1 Các bước thực hiện: - Bước 1: Thu thập liệu Bước 2: Xử lý liệu lưu trữ liệu file Gồm liệu: huấn - luyện (250 đối tượng) kiểm tra (50 đối tượng) Bước 3: Cài đặt thuật toán ID3 tạo định Bước 4: Tạo luật sinh từ định Bước 5: Đánh giá độ xác thuật tốn Sau q trình huấn luyện, số luật sinh 42 Cây định tạo từ liệu huấn luyện (gồm 250 đối tượng): HVTH: NGUYỄN VĂN KIỆT Trang 44 CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HỒNG VĂN KIẾM Hình 4.1: Cây định cho tốn HVTH: NGUYỄN VĂN KIỆT Trang 45 CƠNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM Và luật tương đương: Hình 4.2: Các luật rút từ định 4.2 Thử nghiệm đánh giá  Chúng kiểm tra tập gồm 50 đối tượng Số đối tượng đúng: 41 Số đối tượng sai: Tỉ lệ đúng: 41/50 = 0.82 Ứng dụng định hỗ trợ cán tính dụng ngân hàng Dựa luật thu được, ta tham khảo để định cho  khách hàng vay khơng cho vay tiền HVTH: NGUYỄN VĂN KIỆT Trang 46 CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM Xét khách hàng sau: Bảng 4.1: Thông tin khách hàng Khách hàng Tuổi Giới tính Hộ Thu nhập Kết hôn Số Xe ô tô Tài khoản tiết kiệm Tài khoản Tài sản chấp    A Gia Nam ThanhPho Cao Co KhongCon Co Khong Co Co B Tre Nam ThiTran Thap Co BonCon Khong Co Khong Khong C TrungNien Nam ThiTran TrungBinh Khong BonCon Co Co Khong Khong Trường hợp khách hàng A, dựa luật: If ( ThuNhap = Cao && HoKhau = ThanhPho && GioiTinh = Nam && Tuoi = Gia) then ChoVay = Yes Vì vậy, khách hàng A ngân hàng cho vay Trường hợp khách hàng B, dựa luật: If ( ThuNhap = Thap) then ChoVay = No Vì vậy, khách hàng B khơng ngân hàng cho vay Trường hợp khách hàng C, dựa luật: If ( ThuNhap = TrungBinh && TaiKhoanTheChap = Khong && SoCon = BonCon) then ChoVay = No Vì vậy, khách hàng C không ngân hàng cho vay HVTH: NGUYỄN VĂN KIỆT Trang 47 CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM Chương KẾT LUẬN Tìm hiểu phương pháp tổng quát xây dựng định, trình bày số thuật tốnxây dựng định Ứng dụng định vào việc khai phá liệu để tìm tri thức Sử dụng định để phân loại khách hàng vay vốn ngân hàng thương mại Dựa vào mơ hình định (các luật định) xây dựng, chương trình đánh giá, phân tích luật q trình phân loại khách hàng để từ tiếp tục hỗ trợ việc định cho khách hàng vay vốn ngân hàng thương mại Bên cạnh đó, liệu huấn luyện cịn hạn chế Vì vậy, để hiệu tơi cần phải có liệu thống kê lớn hơn, kết hợp với kỹ thuật tiên tiến khai thác liệu để cải tiến độ xác cao HVTH: NGUYỄN VĂN KIỆT Trang 48 CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM TÀI LIỆU THAM KHẢO Tiếng Anh [1] Nishant Mathur, Sumit Kumar, Santosh Kumar, and Rajni Jindal ,“The Base Strategy for ID3 Algorithm of Data Mining Using Havrda and Charvat Entropy Based on Decision Tree”, International Journal of Information and Electronics Engineering, Vol 2, No 2, March 2012 [2]“Decision Tree”, địa truy cập: http://www.saedsayad.com/decision_tree.htm [3] “Decision Tree”, địa truy cập: http://en.wikipedia.org/wiki/Decision_tree Tiếng Việt [4] “Các kỹ thuật khai phá liệu”, địa truy cập: http://www.ibm.com/developerworks/vn/library/data/2013Q1/ba-data-miningtechniques/ [5] Nguyễn Thị Thùy Linh, “Nghiên cứu thuật toán phân lớp liệu dựa định”, Khóa luận tốt nghiệp đại học quy, Đại học cơng nghệ [6] Phạm Duy An, “Phương pháp khai thác liệu định”, Luận văn thạc sĩ, Học viện Công nghệ Bưu Viễn thơng [7] Slide giảng mơn học Công nghệ tri thức ứng dụng, GS TSKH Hồng Kiếm HVTH: NGUYỄN VĂN KIỆT Trang 49 CƠNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM PHỤ LỤC HƯỚNG DẪN SỬ DỤNG PROJECT Màn hình gồm thành phần sau:  Mơ hình định thể dạng TreeView Hình 5.1: Hiển thị định  Bảng hiển thị liệu training HVTH: NGUYỄN VĂN KIỆT Trang 50 CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM Hình 5.2: Màn hình hiển thị liệu luyện  Khu vực hiển thị luật Hình 5.3: Màn hình hiển thị luật  Các nút chức - Nút Play: Run thuật tốn ID3 , hình thành luật Nút About: Hiển thị thông tin tác giả Nút Exit: Thốt khỏi chương trình Nút Test: Thử nghiệm liệu test (50 đối tượng) HVTH: NGUYỄN VĂN KIỆT Trang 51 ... NGUYỄN VĂN KIỆT Trang 37 CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM Chương ỨNG DỤNG CÂY QUYẾT ĐỊNH VÀO BÀI TOÁN HỖ TRỢ RA QUYẾT ĐỊNH TÍN DỤNG NGÂN HÀNG 3.1 Một số ứng dụng khai phá... kiến thức quý báu môn học ? ?Công nghệ tri thức ứng dụng? ?? Nhờ có kiến thức thầy mà tơi có đủ kiến thức cơng cụ cần thiết để thực tiểu luận môn học Sau thời gian học tập môn Công nghệ tri thức ứng dụng, ... KIỆT Trang 44 CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HỒNG VĂN KIẾM Hình 4.1: Cây định cho tốn HVTH: NGUYỄN VĂN KIỆT Trang 45 CƠNG NGHỆ TRI THỨC VÀ ỨNG DỤNG GVHD: GS TSKH HOÀNG VĂN KIẾM Và

Ngày đăng: 20/05/2015, 10:28

Từ khóa liên quan

Mục lục

  • DANH MỤC HÌNH

  • DANH MỤC BẢNG

    • LỜI MỞ ĐẦU

    • Chương 1

    • TỔNG QUAN VỀ KHÁM PHÁ TRI THỨC VÀ KHAI PHÁ DỮ LIỆU

      • 1.1. Khai phá dữ liệu là gì?

      • 1.2. Quá trình khám phá tri thức

      • 1.3. Quá trình khai phá dữ liệu

      • 1.4. Chức năng của khai phá dữ liệu

      • 1.5. Các kỹ thuật khai phá dữ liệu

      • 1.6. Các dạng dữ liệu có thể khai phá được

      • 1.7. Các lĩnh vực liên quan đến khai phá dữ liệu và ứng dụng của khai phá dữ liệu

      • 1.8. Các thách thức và hướng phát triển của phát hiện tri thức và khai phá dữ liệu

      • Chương 2

      • CÂY QUYẾT ĐỊNH VÀ KHAI PHÁ DỮ LIỆU

        • 2. 1. Cây quyết định

        • 2. 2. Các thuật toán khai phá dữ liệu bằng cây quyết định

        • Chương 3

        • ỨNG DỤNG CÂY QUYẾT ĐỊNH VÀO BÀI TOÁN HỖ TRỢ RA QUYẾT ĐỊNH TÍN DỤNG NGÂN HÀNG

          • 3.1. Một số ứng dụng khai phá dữ liệu trong lĩnh vực ngân hàng

          • 3.2. Ứng dụng cây quyết định trong qui trình tín dụng

          • 3.3. Sử dụng cây quyết định để phân loại khách hàng

          • Chương 4

          • CÀI ĐẶT, THỬ NGHIỆM VÀ ĐÁNH GIÁ

            • 4.1. Cài đặt

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan