Một số mô hình khai phá dữ liệu ngân hàng

Một phần của tài liệu Phương pháp phân cụm tích lũy và áp dụng tại Ngân hàng Thương mại cổ phần Quân đội (Trang 39)

Công nghiệp Ngân hàng trên thế giới đã trải qua những sự thay đổi to lớn. Với sự phát triển hiện tại, sự đáp ứng ngày càng lớn và sự sử dụng của ngân hàng “điện tử”, việc kiểm soát dữ liệu giao dịch đã trở nên dễ dàng hơn và, một cách đồng bộ, khối lượng của dữ liệu như vậy đã tăng lên đáng kể. Nó vượt ra ngoài khả năng của con người để phân tích khối lượng lớn của dữ liệu ban đầu và chuyển đổi hiệu quả dữ liệu thành dạng tri thức có ích cho tổ chức. Khối lượng lớn của dữ liệu mà các Ngân hàng đã thu thập được trong nhiều năm có thể tác động lớn tới sự thành công của những nỗ lực khai phá dữ liệu. bằng cách sử dụng khai phá dữ liệu để phân tích các mẫu và các hướng, các nhà quản lý ngân hàng có thể dự đoán, với độ chính xác ngày càng cao, bao nhiêu khách hàng sẽ phản ứng lại đối với sự thay đổi trong tỉ giá mới, những khách hàng nào sẽ chấp nhận dùng sản phẩm mới, khách hàng nào sẽ tiềm ẩn rủi ro với khoản cho vay, và làm thế nào để tạo các quan hệ khách hàng tốt hơn.

Công nghiệp ngân hàng đang nhận thấy tầm quan trọng của thông tin đã có về khách hàng của họ, Không nghi ngờ gì, nó có một lượng lớn thông tin khách hàng, bao gồm nhân khẩu học của khách hàng, dữ liệu giao dịch, mẫu sử dụng thẻ tín dụng, v.v…. Và bởi vì lĩnh vực ngân hàng nằm trong công nghiệp dịch vụ, việc duy trì quan hệ khách hàng là điều rất quan trọng. Để làm điều đó, các ngân hàng cần đầu tư tài nguyên của họ để hiểu biết tốt hơn các khách hàng tiềm năng và đang có của họ. Bằng cách sử dụng các công cụ khai phá dữ liệu phù hợp, các ngân hàng có thể cung cấp những sản phẩm và dịch vụ phù hợp với khách hàng.

Khi sự cạnh tranh trở nên mạnh mẽ khốc liệt trên toàn cầu, các Ngân hàng đã phải chiến đấu sáng tạo hơn và phản ứng nhanh nhạy hơn để có được và duy trì sự chia sẻ thị trường. Những ngân hàng vẫn dựa trên các kĩ thuật dịch vụ khách hàng phản ứng và quảng cáo rộng rãi truyền thống bị kết tội là nguyên nhân thất bại hoặc bị thu hẹp lại. Các ngân hàng của tương lai sẽ sử dụng sự lượng giá, tri thức và không phải các nguồn tài nguyên tài chính, bởi sự thúc đẩy của chúng cho sự tồn tại và sự quan tâm thích thú. Một điều đáng ngạc nhiên là, hầu hết những tri thức này đang ở trong hệ thông ngân

hàng và được tạo ra bởi các giao dịch và các hoạt động hàng ngày. Thông tin có giá trị này không cần phải được tập hợp bởi các nghiên cứu khách hàng hoặc chương trình nghiên cứu thị trường tốn kém. Vấn đề là kho dữ liệu này phải được khai phá để tìm những thông tin hữu ích. Thông thường những thông tin khổng lồ không được khai phá này được tập hợp, tạo ra, in, lưu trữ thành các file và bị loại bỏ sau khi chúng đã phục vụ cho những mục đích ngắn hạn và các mục đích kiểm toán. Hầu hết dữ liệu tạo ra bởi các hệ thống thông tin của ngân hàng bằng tay hay theo cách tự động, như xử lý thẻ tín dụng và xử lý của ATM, được thiết kế để cung cấp hoặc theo dõi các giao dịch, đáp ứng các yêu cầu kiểm toán bên trong và bên ngoài, và tuân theo các yêu cầu của chính phủ và ngân hàng. Một số ít được tạo ra có mục đích để tạo các báo cáo quản trị. Các hệ thống thông tin hiện tại không được thiết kế như các hệ thống hỗ trợ ra quyết định để trợ giúp cho việc quyết định hiệu quả để quản lý các tài nguyên, và tăng cường dịch vụ cũng như sự thỏa mãn cho khách hàng. Kết quả là, các báo cáo quản lý không có thể thức hoặc thậm chí bản nhất được lấy ra từ các trung tâm dữ liệu rải rác và độc lập mà sử dụng các định dạng không tương thích. Kết quả là các báo cáo quản trị luôn luôn muộn, không chính xác, và không phù hợp. các quyết định điều hành dựa trên các báo cáo không chính xác này có thể dẫn đến việc mất nhiều tiền trong thời gian dài hay ngắn và mất các cơ hội cũng như thị trường.

Sự phát triển mạnh mẽ của công nghệ thông tin sẽ giúp cho các ngân hàng có thể tác động vào các hệ thống thông tin sẵn có, được biết như các hệ thống hợp lệ, và khi phá những thông tin hữu ích từ dữ liệu được lưu trữ trong các hệ thống này. Tiến trình này có thể được thực hiện mà không cần phải thay đổi những hệ thống hiện tại và dữ liệu chúng tạo ra. Nhưng trước khi khai phá dữ liệu được thực hiện, một kho dữ liệu sẽ được tạo ra đầu tiên. Kho dữ liệu là tiến trình của việc trích rút, sàng lọc, chuyển đổi và chuẩn hóa dữ liệu không thích hợp từ những hệ thống hiện tại của ngân hàng để những dữ liệu này có thể được khai phá và phân tích cho những mẫu, các quan hệ và các luật kết hợp hữu ích. Kho dữ liệu này không cần được cập nhật thường xuyên hoặc hàng ngày như các hệ thống dựa trên giao dịch. Các kho dữ liệu có thể được cập nhật và khai phá khi cần thiết cho các báo cáo quản lý và việc ra quyết định, nghĩa là, hàng tháng, hàng quý, hoặc dựa trên cơ sở không tính trước (đặc biệt- ad hoc). Kho dữ liệu và sự khai phá có thể chạy song song với các hệ thống thông tin giao dịch ngân hàng, mà không có sự xâm phạm và sự ngắt quãng.

Khi tri thức trở nên ngày càng giống với sự sáng tạo có giá trị và khi một kế hoạch chiến lược cho sự cạnh tranh trong thị trường có thể không tốt hơn thông tin mà kế hoạch dựa vào làm cơ sở, sự quan trọng của tri thức và thông tin trong kinh doanh ngày nay có thể không bao giờ được nhìn nhận như là nhân tố bên ngoài đối với kinh doanh.

Các tổ chức và cá nhận đang tiếp cận tới thông tin đúng đắn ở đúng thời điểm, có có hội thành công tốt hơn trong kỉ nguyên toàn cầu hóa và sự cạnh tranh gay gắt.

Hiện tại, những kho dữ liệu điện tử lớn đang được duy trì bởi các ngân hàng và các tổ chức khác trên toàn cầu. Những bit có giá trị của thông tin được tích hợp trong những kho dữ liệu này. Kích thước lớn của các tài nguyên dữ liệu này làm cho con người khó có khả năng phân tích để đưa ra thông tin quan trọng trợ giúp trong quá trình ra quyết định. Một số công ty thương mại đã nhận ra giá trị của những khái niệm này, thể hiện ở việc thị trường phần mềm cho khai phá dữ liệu trông đợi vượt qua 10 tỉ USD.

Sự hiểu biết trong kinh doanh (business intelligence) tập trung vào việc khám phá tri thức từ những kho dữ liệu điện tử khác nhau, cả bên trong và bên ngoài, để hỗ trợ việc ra quyết định tốt hơn. Các kĩ thuật khai phá dữ liệu trở nên quan trọng cho sự khám phá tri thức từ cơ sở dữ liệu. Trong những năm gần đây, các hệ thống tri thức trong kinh doanh đã đóng vai trò nòng cốt (pivotal) trong việc trợ giúp các tổ chức để đạt được các mục đích kinh doanh như là cải tiến sự duy trì khách hàng, sự thâm nhập thị trường, lợi ích và tính hiệu quả. Trong hầu hết các trường hợp, việc hiểu sâu sắc có được bằng cách phân tích dữ liệu lịch sử.

Sự cạnh tranh toàn cầu, thị trường biến động, và vòng xoay giảm dần nhanh của sự cải tiến kĩ thuật đưa ra những thách thức quan trọng cho ngành ngân hàng và tài chính. Sự sẵn sàng của thông tin trên toàn thế giới cho phép các công ty cải tiến khả năng linh hoạt của họ. Trong các tổ chức tài chính sự phát triển của công nghệ thông tin dẫn đến việc đòi hỏi sự phân tích liên tục của dữ liệu kết quả.

Khai phá dữ liệu có thể đóng góp để giải quyết những bài toán kinh doanh trong ngân hàng và tài chính bằng cách tìm các mẫu, quan hệ nhân quả, và những sự tương quan trong thông tin kinh doanh và giá cả thị trường mà không xuất hiện ngay lập tức với những nhà quản lý bởi vì khối lượng dữ liệu quá lớn hoặc được tạo ra quá nhanh đối với các chuyên gia. Những nhà quản lý của ngân hàng có thể tiến một bước xa hơn để tìm ra trình tự, các đoạn và chu kì của hành vi giao dịch của các khách hàng của họ để giúp họ trong việc cụm, xác định đích, đề ra yêu cầu, duy trì những khách hàng mang lại lợi nhuận. Sự hiểu biết trong kinh doanh và các kĩ thuật khai phá dữ liệu có thể trợ giúp chúng trong việc xác định những lớp khác nhau của khách hàng và đưa ra định hướng giá hoặc những sản phẩm dựa trên lớp này mà có thể tạo được sự quản lý có lợi.

Hình 3.1: Việc sử dụng kĩ thuật khai phá dữ liệu là một thách thức to lớn đối với ngành tài chính. Nguồn dữ liệu to lớn của công ty có thể được sử dụng thông qua khai phá dữ liệu cho

những lĩnh vực ngành nghề khác[5]

Lợi ích và ứng dụng của khai phá dữ liệu trong công nghiệp ngân hàng là gì? Một trong những ứng dụng sớm nhất của khai phá dữ liệu là trong lĩnh vực siêu thị bán lẻ. Khai phá lượng lớn của dữ liệu POS hàng ngày, ban quản lý cửa hàng phân tích hành vi mua sắm của người nội chợ, và phát hiện ra những sản phẩm nào thường được mua cùng nhau. Thông tin hữu ích này dẫn đến việc thay đổi trong sắp xếp cửa hàng theo cách những sản phẩm thường được mua cùng nhau sẽ được sắp xếp cùng nhau, dẫn tới việc quản lý hàng hóa cửa hàng được tốt hơn. Những nhà bán lẻ như WalMart đã có sự tăng trưởng cao (khoảng 20%) sau khi thực hiện việc khai phá dữ liệu.

Trong lĩnh vực ngân hàng, các câu hỏi khai phá dữ liệu có thể được trả lời là:

 Những giao dịch nào một khách hàng thực hiện trước khi chuyển sang ngân hàng đối thủ (để ngăn chặn)

 Thông tin profile của khách hàng sử dụng ATM là gì và kiểm sản phẩm nào anh ta sẽ mua (để giới thiệu bán kèm)

 Những sản phẩm ngân hàng nào thường đi kèm nhau với một nhóm khách hàng (để giới thiệu bán kèm)

 Những mẫu nào trong giao dịch tín dụng dẫn đến giả mạo (để phát hiện và ngăn cản lỗi)

 Tiểu sử của những người vay có mức độ rủi ro cao là gì (để ngăn chặn sự vỡ nợ, nợ xấu, và cải tiến)

 Dịch vụ và lợi ích gì những khách hàng hiện tại mong muốn (để làm tăng mức độ trung thành và sự duy trì khách hàng)

Chú ý rằng khai phá dữ liệu không bắt đầu với giả thiết rằng phải được chứng minh hay không. Nó là một tiến trình khám phá mục đích là “khám phá tri thức” hơn là công việc truyền thống “xác thực tri thức”. Sự xác thực tri thức các của hệ thống hỗ trợ ra quyết định ngược lại được biết như là OLAP (online analytical processing) sẽ đặt ra câu hỏi rõ ràng như “ bao nhiêu chủ thẻ nợ tháng này so với cùng tháng này năm ngoái?” hoặc “bao nhiêu khách hàng ATM của chúng ta cũng là người vay” Trong khi các truy vấn OLAP hữu dụng, tuy nhiên cũng không diễn tả đầy đủ. Bộ khai phá dữ liệu không có một tri thức biết trước hoặc giả định nào. Phần mềm khai phá dữ liệu sẽ làm lộ ra những mẫu và những cơ hội chưa biết và lấy đó chính làm giả thuyết.

Có nhiều lĩnh vực trong đó khai phá dữ liệu có thể được sử dụng trong công nghiệp ngân hàng, bao gồm sự phân khúc khách hàng và lợi nhuận khách hàng, chấp thuận và đánh giá mức độ tín dụng, dự đoán thanh toán mặc định, quảng cáo, phát hiện giao dịch gian lận, các hoạt động dự đoán và quản lý tiền, tối ưu hóa danh mục đầu tư chứng khoán, và xếp hạng các đầu tư. Thêm vào đó, các ngân hàng có thể sử dụng khai phá dữ liệu để xác định các khách hàng có độ tin cậy mang lại lợi nhuận cao hoặc các đối tượng cho vay nhiều rủi ro. Do đó, sự cần thiết để xây dựng khả năng phân tích để tập trung vào những vấn đề đã nói ở trên và khai phá dữ liệu cố gắng cung cấp câu trả lời. Dưới đây là một số lĩnh vực mà công nghiệp ngân hàng có thể ứng dụng hiệu quả khai phá dữ liệu:

 Quảng cáo (marketing)

Một trong những lĩnh vực sử dụng rộng rãi nhất của khai phá dữ liệu cho công nghiệp ngân hàng là quảng cáo. Phòng quảng cáo của ngân hàng có thể sử dụng khai phá dữ liệu để phân tích các cơ sở dữ liệu khách hàng và khám phá ra sở thích của khách hàng đối với các sản phẩm và dịch vụ. Bằng việc cung cấp chỉ những sản phẩm và dịch vụ mà khách hàng mong muốn, ngân hàng có thể tiết kiệm được những khoản tiền khá lớn đối với việc quảng cáo và cung cấp và không mạng lại hiệu quả. Những người làm quảng cáo của ngân hàng, vì thế, cần tập trung vào các khách hàng của họ bằng cách tìm hiểu nhiều hơn về họ. Bank of America, là ví dụ, sử dụng cơ sở dữ liệu quảng cáo để cải tiến dịch vụ khách hàng và tăng lợi nhuận. Bằng việc hợp nhất năm năm bản ghi dữ liệu khách hàng, ngân hàng có thể quảng cáo và bán những dịch vụ tới khách hàng.

Đây là một lĩnh vực quảng cáo khác mà khai phá dữ liệu có thể sử dụng mở rộng. Ở đây, một nhà cung cấp dịch vụ tạo sự hấp dẫn đối với khách hàng bằng việc bán những sản phẩm hoặc dịch vụ thêm với cùng giao dịch kinh doanh. Càng nhiều sản phẩm và dịch vụ bán được cho khách hàng, các ngân hàng càng có khả năng giữ khách hàng. Ví dụ, một số ngân hàng nước ngoài ở Ấn độ, ICICI, HSBC… sử dụng khai phá dữ liệu để tìm kiếm những khách hàng có yêu cầu gửi tiết kiệm và quan tâm đến khoản vay mua nhà. Một mô hình được xây dựng cho những khách hàng có các khoản vay cổ phần mua nhà và mô hình này được sử dụng để xác định những người dùng khác cũng quan tâm đến vấn đề này. Một ví dụ khác là Bank of America đã hoàn thành một project với những công cụ khai phá dữ liệu của IBM để tìm kiếm cơ sở dữ liệu khách hàng của nó và cố gắng tìm xem sản phẩm nào người dùng sẽ mong muốn.

 Quản trị rủi ro

Khai phá dữ liệu được sử dụng rộng dãi cho quản trị rủi ro trong công nghiệp ngân hàng. Những người điều hành ngân hàng cần biết rằng các khách hàng của họ có đáng tin cậy hay không. Cung cấp các thẻ tín dụng cho khách hàng mới, mở rộng cho các khách hàng đang có các loại tín dụng, và chấp nhận cho vay có thể là những quyết định mạo hiểm cho ngân hàng nếu họ không biết chút nào về các khách hàng của họ. Khai phá dữ liệu, tuy nhiên, có thể được sử dụng để giảm rủi ro của các ngân hàng bằng cách xác định những khách hàng mà thường không trả nợ đúng hạn trên tài khoản của họ. Một ví dụ là báo cáo trên bài báo của một ngân hàng phát hiện ra rằng những chủ thẻ mà rute tiền ở casino có tỉ lệ nợ không trả và sự vỡ nợ cao hơn. Dễ dàng để phân tích hành vi giao dịch của khách hàng đối với các tài khoản tiền gửi để xác định khả năng không trả nợ đúng hạn đối với tài khoản cho vay của họ.

Đánh giá điểm đối với mức độ tin cậy, thực chất, là một trong những công cụ quản lý rủi ro tài chính phát triển sớm nhất. Đánh giá mức độ tin cậy có thể đáng giá đối

Một phần của tài liệu Phương pháp phân cụm tích lũy và áp dụng tại Ngân hàng Thương mại cổ phần Quân đội (Trang 39)