Quá trình khám phá tri thức

Một phần của tài liệu Xây dựng module dự đoán rủi ro trong quy trình cho vay đồng tài trợ tại NH á châu khoá luận tốt nghiệp 757 (Trang 32 - 34)

Từ quá trình khám phá tri thức trên chúng ta thấy được sự khác biệt giữa khám phá tri thức và khai phá dữ liệu. Trong khi khám phá tri thức là nói đến q trình tổng thể phát hiện tri thức hữu ích từ dữ liệu. Cịn khai phá dữ liệu chỉ là một bước trong quá trình khám phá tri thức, các công việc chủ yếu là xác định được bài toán khai phá, tiến hành lựa chọn phương pháp khai phá dữ liệu phù hợp với dữ liệu có được và tách ra từ các tri thức cần thiết.

2.1.2 Ưu thế khai phá dữ liệu

Khai phá dữ liệu có một số ưu thế dưới đây:

-I- So với phương pháp học máy, khai phá dữ liệu có lợi thể hơn ở chỗ, khai phá dữ liệu có thể sử dụng với các bộ dữ liệu chứa nhiều nhiễu, bộ dữ liệu không đầy đủ hoặc biến đổi liên tục. Trong khi đó phương pháp học máy chủ yếu được sử dụng với cơ sở dữ liệu đầy đủ, ít biến động và tập dữ liệu khơng quá lớn

-I- Phương pháp thống kê là một trong những nền tảng lý thuyết của Khai phá dữ liệu, nhưng khi so sánh hai phương pháp này với nhau ta có thể thấy các phương pháp còn tồn tại một số điểm yếu mà khai phá dữ liệu đã khắc phục được. Điển hình: các phương pháp

thống kê chuẩn khơng phù hợp với các kiểu dữ liệu có cấu trúc trong cơ sở dữ liệu; kết quả phân tích của thống kê có thể sẽ rất nhiều và khó có thể làm rõ đuợc; phuơng pháp thống kê cần có sự huớng dẫn của nguời dùng để xác định phân tích dữ liệu nhu thế nào và ở đâu.

Với những uu điểm này, khai phá dữ liệu đang trở nên vơ cũng hữu ích và có tầm quan trọng trong cuộc sống ở những lĩnh vực khác nhau.

2.1.3 Ứng dụng của khai phá dữ liệu

Khai phá dữ liệu là một huớng tiếp cận khá mới nhung thu hút đuợc các chuyên gia nghiên cứu bởi tính ứng dụng thực tiễn của nó đuợc ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau và ngày càng có tầm quan trọng.

-I- Lĩnh vực thuơng mại điện tử:

- Cơng cụ tìm hiểu, định huớng thúc đẩy, giao tiếp với khách hàng

- Phân tích hành vi mua sắm trên mạng và cho biết thông tin tiếp thị phù hợp với loại khách hàng trong một phân khu thị truờng nhất định

-I- Nhân sự: Giúp nhà tuyển dụng chọn ứng viên thích hợp nhất cho nhu cầu của công ty -I- Y học: Hỗ trợ bác sĩ phát hiện ra bệnh của bệnh nhân dựa trên các xét nghiệm đầu vào -I- An ninh, an toàn mạng: Ứng dụng trong hệ thống phát hiện xâm nhập trái phép IDS/IPS để phát hiện ra các cuộc tấn công xâm nhập mạng trái phép

-I- Lĩnh vực tài chính ngân hàng: Đặc biệt, ứng dụng khai phá dữ liệu đã có đóng góp to lớn trong hoạt động kinh doanh hiệu quả của các ngân hàng. Khi ngành công nghiệp ngân hàng ngày càng phát triển thì việc thực hiện giao dịch trở nên dễ dàng đồng thời khối luợng dữ liệu từ các giao dịch này cũng tăng lên chóng mặt, thể loại dữ liệu đa dạng và hàm chứa nhiều nội dung hữu ích... Các ngân hàng cần sử dụng các nguồn dữ liệu này một cách hiệu quả nhằm phục vụ cho hoạt động kinh doanh. Nhận thức đuợc tầm quan trọng của việc sử dụng dữ liệu đúng đắn, một số ngân hàng đã thay thế phuơng pháp phân tích dữ liệu truyền thống bằng những cơng cụ khai phá dữ liệu. Một số ví dụ minh họa điển hình: vào ngày 08/05/2017 tại Viện Đào tạo Công nghệ và Quản trị Robusta chi nhánh Hà Nội đã triển khai khóa đào tạo “Khai phá dữ liệu” dành cho Ngân hàng TMCP Công Thuơng Việt Nam. Hay vào năm 2017 tại Ngân hàng thuơng mại cổ phần ngoại thuơng Việt Nam công cụ Data Mining đuợc nghiên cứu và đã đang đua vào sử dụng phục vụ việc phân khúc khách hàng và lợi nhuận , chấm điểm tín dụng và phê duyệt, quảng bá và bán sản phẩm, phát hiện các giao dịch gian lận v.v.

Khai phá dữ liệu giải quyết các vấn đề kinh doanh bằng cách tìm kiếm các mẫu và các mối tuơng quan đuợc ẩn chứa trong các thông tin liên quan tới việc kinh doanh đuợc luu

Khóa luận tốt nghiệp Xây dựng module Dự đốn rủi ro trong quy trình cho vay đồng tài trợ tại Ngân hàng Á Châu trữ trong cơ sở dữ liệu. Ứng dụng khai phá dữ liệu để xây dựng các mơ hình và phân tích, các chun viên ngân hàng có thể đua ra những dự đốn có tính chính xác cao, phục vụ cho việc hoạt động kinh doanh một cách hiệu quả nhất, tối đa hóa lợi nhuận và giảm thiểu tổn thất. Đặc biệt, ứng dụng khai phá dữ liệu để dự đốn rủi ro trong mảng tín dụng có tầm quan trọng vơ cùng lớn. Chuyên viên ngân hàng cần biết chắc chắn khách hàng họ cho vay có tin vậy hay khơng, khách hàng nào sẽ có nguy cơ rủi ro cao hơn mặc định trên một khoản vay, nên cho vay ở mức tiền nhu thế nào cho hợp lý và khai phá dữ liệu sẽ giúp ngân hàng giải quyết những vấn đề này.

2.2Bài toán dự đoán rủi ro cho vay đồng tài trợ

2.2.1 Giới thiệu bài toán dự đoán rủi ro

Nhu đã đề cập ở trên, dự đoán rủi ro khách hàng truớc khi quyết định có cấp tín dụng hay khơng đặc biệt trong cho vay đồng tài trợ vốn hàm chứa nhiều rủi ro là vô cùng quan trọng. Từ việc tìm hiểu quy trình cho vay đồng tài trợ tại Ngân hàng Á Châu, em nhận thấy hệ thống cần có chức năng dự đốn rủi ro cho vay đồng tài trợ. Chính vì thế, em đề xuất với đội dự án phát triển module dự đoán rủi ro vào hệ thống bằng việc áp dụng kiến thức khai phá dữ liệu và tính ứng dụng thực tiễn của nó để xây dựng mơ hình và PHÁT TRIỂN module này.

-I- Đầu vào: tập các hồ sơ khách hàng đã có và hồ sơ khách hàng hiện tại. -I- Đầu ra: đua ra kết luận hồ sơ khách hàng hiện tại có chứa rủi ro hay khơng

Một phần của tài liệu Xây dựng module dự đoán rủi ro trong quy trình cho vay đồng tài trợ tại NH á châu khoá luận tốt nghiệp 757 (Trang 32 - 34)

Tải bản đầy đủ (DOCX)

(61 trang)
w