TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN * * * LÊ THỊ HỒNG NHUNG NGHIÊN CỨU ỨNG DỤNG KHAI PHÁ DỮ LIỆU PHÂN CỤM TRONG PHÂN ĐOẠN KHÁCH HÀNG BÁN LẺ TẠI CÁC NHTM VIỆT NAM Chuyên ngành: Hệ thống t
Trang 1TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN
* * *
LÊ THỊ HỒNG NHUNG
NGHIÊN CỨU ỨNG DỤNG KHAI PHÁ DỮ LIỆU PHÂN CỤM TRONG PHÂN ĐOẠN KHÁCH HÀNG BÁN LẺ TẠI
CÁC NHTM VIỆT NAM
Chuyên ngành: Hệ thống thông tin quản lý
TÓM TẮT LUẬN VĂN THẠC SĨ
Hà Nội, Năm 2014
Trang 2TÓM TẮT LUẬN VĂN
1 Tính cấp thiết của đề tài
Trong bối cảnh cạnh tranh ngày càng gay gắt, giữa các ngân hàng đang diễn
ra một cuộc chạy đua giành giật thị trường và khách hàng, thì việc hiểu rõ nhu cầu của khách hàng, phát triển các sản phẩm phù hợp với các đối tượng khách hàng khác nhau trở nên vô cùng quan trọng, cấp thiết Tuy nhiên, một loại sản phẩm đồng nhất không thể thỏa mãn được nhu cầu và sở thích của tất cả khách hàng Ví
dụ, sản phẩm tiết kiệm phải có nhiều loại kỳ hạn, hình thức mở sổ khác nhau để đáp ứng được thị hiếu của nhiều đối tượng người tiêu dùng khác nhau Tuy nhiên, ngân hàng cũng không thể đáp ứng nhu cầu riêng của từng khách hàng Vậy nên, việc phân chia khách hàng thành các nhóm có nhu cầu và thị hiếu gần giống nhau
để thiết kế sản phẩm phù hợp đang là giải pháp được các ngân hàng lựa chọn vận dụng và triển khai
Trong lĩnh vực ngân hàng, với việc phân tách khách hàng thành các nhóm đối tượng và xây dựng đội ngũ nhân viên chuyên biệt, các ngân hàng sẽ chủ động hơn trong việc nghiên cứu, thiết kế sản phẩm dịch vụ, tăng tính cạnh tranh thông qua khác biệt hóa.Đồng thời các ngân hàng cũng sẽ linh hoạt hơn trong việc triển khai phương án kinh doanh trong bối cảnh thị trường còn nhiều biến động khó dự đoán Với định hướng này, mỗi ngân hàng đang và sẽ đưa ra những sản phẩm trọn gói cho từng phân đoạn khách hàng, với những chính sách riêng phù hợp Ví dụ, Maritime Bank đang cung cấp các sản phẩm phong phú, phù hợp với nhiều đối tượng khách hàng như: tài khoản M1 cho khách hàng thường xuyên chuyển tiền với mức phí ưu đãi, các sản phẩm tiết kiệm với nhiều kỳ hạn và lãi suất linh hoạt… Theo ThS Huỳnh Kim Trí, cán bộ quan hệ khách hàng của Vietin Bank thì: “Nếu biết xác định tốt phân khúc khách hàng thì 20% khách hàng tốt, tiềm
Trang 3năng có thể giúp Chi nhánh chiếm lĩnh 80% thị phần, qui mô sản phẩm dịch vụ, tạo
ra 80% qui mô lợi nhuận Ngược lại, nếu không lường được tác hại của rủi ro tín dụng sẽ không tránh khỏi tình huống 20% khách hàng vay chất lượng nợ xấu gây tai họa cho 80% dư nợ ngân hàng”
Câu hỏi đặt ra cho mỗi ngân hàng là “Làm thế nào để phân đoạn khách một cách tốt nhất” Hiện nay, hầu hết các ngân hàng thương mại ở Việt Nam đều được trang bị các loại phần mềm nghiệp vụ lõi, phần mềm quản trị nhân sự, phần mềm quản lý quan hệ khách hàng Tuy nhiên, hoạt động phân đoạn khách hàng lại chưa
có phần mềm chuyên dụng hỗ trợ Phần lớn hoạt động phân đoạn dựa trên kiến thức, kinh nghiệm của người làm marketing Trong khi đó, từ các giao dịch hàng ngày, khối lượng dữ liệu về khách hàng thu thập được tại các ngân hàng càng ngày càng lớn và phong phú, nếu có thể khai thác được lượng dữ liệu này sẽ mang lại những tri thức kinh doanh có ý nghĩa rất lớn Ví dụ, một phân tích dữ liệu về nhân khẩu học của khách hàng (tuổi tác, nghề nghiệp, nơi cư trú, ) kết hợp với dữ liệu
về giao dịch của họ (các mặt hàng đã mua, các hợp đồng, ) có thể tiết lộ một vài nhóm khách hàng mà ngân hàng chưa từng nghĩ đến và có chính sách chăm sóc phù hợp Thông tin về các hành vi tiêu biểu của các nhóm khách hàng như vậy có thể được bộ phận tiếp thị sử dụng để phát triển sản phẩm và dịch vụ chuyên sâu
Trong các giải pháp công nghệ hỗ trợ kinh doanh hiện nay, khai phá dữ liệu đang là xu hướng được ưu tiên hàng đầu Đặc biệt với công tác phân đoạn khách hàng, phân tích dữ liệu có ý nghĩa rất quan trọng, thì giải pháp khai phá dữ liệu có thể xem là lựa chọn tốt nhất Các hãng cung cấp giải pháp công nghệ thông tin hàng đầu trên thế giới như Microsoft, Oracle, IBM,…đã tham gia xây dựng các công cụ khai phá dữ liệu, mở ra cơ hội to lớn cho các ngân hàng trong ứng dụng khai phá dữ liệu hỗ trợ các vấn đề kinh doanh
Có nhiều kỹ thuật khác nhau được sử trọng trong khai phá dữ liệu, cụ thể như kỹ thuật khai phá dữ liệu phân lớp và dự đoán, phân tích chuỗi theo thời gian,
Trang 4phân cụm,…Trong đó kỹ thuật khai phá dữ liệu phân cụm cho phép tự động nhóm các bản ghi dữ liệu theo các đặc điểm thành các cụm tương tựnhau.Chính vì vậy phân cụm dữ liệu rất phù hợp để ứng dụng trong bài toán phân đoạn khách hàng
Xuất phát từ những cơ sở lý luận và thực tiễn trên, tác giả đã lựa chọn hướng nghiên cứu “Nghiên cứu ứng dụng khai phá dữ liệu phân cụm trong phân đoạn khách hàng bán lẻ tại các ngân hàng thương mại Việt Nam” cho luận văn thạc sỹ chuyên ngành Hệ thống thông tin quản lý của mình Do hạn chế về thời gian và khả năng, trong luận văn tác giả chỉ chạy thử nghiệm trên số liệu của ngân hàng SHB
2 Kết cấu của luận văn
Ngoài phần mở đầu, kết luận và danh mục tài liệu tham khảo, luận văn được kết cấu thành 3 chương:
Chương 1:Tổng quan về hoạt động phân đoạn khách hàng tại các NHTM Việt Nam
Trong chương 1, tác giả trình bày tổng quan về phân đoạn khách hàng nói chung và phân đoạn khách hàng ngân hàng nói riêng Trong chương này, tác giả cũng trình bày về thực trạng và các vấn đề gặp phải trong hoạt động phân đoạn khách hàng tại các NHTM Việt Nam hiện nay Cuối cùng, tác giả trình bày về khả năng áp dụng giải pháp phân đoạn khách hàng bằng kỹ thuật khai phá dữ liệu phân cụm tại các NHTM Việt Nam thông qua phân tích SWOT
Chương 2: Kỹ thuật khai phá dữ liệu phân cụm và thuật toán phân cụm K-means
Trong chương 2, tác giả trình bày về quy trình khai phá tri thức nói chung, trong đó khai phá dữ liệu được coi là một tiến trình con của Nội dung chương 2 cũng giới thiệu tổng quan về một số phương pháp khai phá dữ liệu như cây quyết định, luật kết hợp, phân lớp, phân cụm,…và khả năng ứng dụng của các phương pháp này trong các lĩnh vực Cũng trong chương này,tác giả trình bày tổng quan về
Trang 5phương pháp phân cụm và thuật toán phân cụm K-means Cuối cùng, tác giả trình bày lý do lựa chọn phương pháp phân cụm K-Means để phân đoạn khách hàng
Chương 3: Ứng dụng khai phá dữ liệu phân cụm trong phân đoạn khách hàng bán lẻ tại các NHTM Việt Nam
Trong chương 3, tác giả trình bày về bài toán phân đoạn khách hàng bán lẻ tại các NHTM Việt Nam và quy trình khai phá dữ liệu nói chung và khai phá dữ liệu phân cụm trong bài toán phân đoạn khách hàng nói riêng Cũng trong chương này, tác giả giới thiệu công cụ khai phá dữ liệu BIDS của Microsoft và ứng dụng công cụ này trên một bộ dữ liệu thử nghiệm Cơ sở dữ liệu thử nghiệm gồm 600 bản ghi, 13 thuộc tính mô tả đặc điểm nhân khẩu học, địa lý và sản phẩm, dịch vụ
sử dụng của khách hàng ngân hàng SHB Cuối chương, tác giả đưa ra một số khuyến nghị về việc áp dụng kết quả phân đoạn khách hàng bán lẻ bằng thuật toán phân cụm K-means
3 Phần kết luận
Qua hai năm học tập, tìm tòi, nghiên cứu, đặc biệt là trong khoảng thời gian làm luận văn, tác giả đã hoàn thiện luận văn với các mục tiêu đặt ra ban đầu Cụ thể luận văn đã đạt được những kết quả sau:
- Trình bày các kiến thức cơ bản về khai phá tri thức và khai phá dữ liệu
- Giới thiệu phương pháp khai phá dữ liệu phân cụm, trình bày thuật toán phân cụm K-means
- Cài đặt và chạy thử nghiệm thuật toán K-means bằng công cụ BIDS của Microsoft trên bộ dữ liệu ngân hàng gồm 600 bản ghi và 13 thuộc tính
- Đánh giá độ chính xác của mô hình và đưa ra kết luận, khuyến nghị về việc áp dụng kết quả khai phá dữ liệu
Hướng phát triển trong tương lai của đề tài:
- Tiếp tục nghiên cứu các thuật toán khai phá dữ liệu phân cụm khác như thuật toán EM, … để so sánh được hiệu quả của các thuật toán này khi áp dụng vào mô hình phân đoạn khách hàng
Trang 6- Tiếp tục nghiên cứu các công cụ khai phá dữ liệu khác như Oracle Data Mining, IBM InfoSphere, … và so sánh ưu điểm và nhược điểm của các công cụ này
- Bổ sung thêm dữ liệu tập huấn để mô hình phân cụm có độ tin cậy cao hơn và hoạt động hiệu quả hơn
- Tìm hiểu nhu cầu thực tế, từ đó cải tiến chương trình, cài đặt lại bài toán theo các thuật toán đã nghiên cứu để làm việc tốt hơn với các cơ sở dữ liệu lớn
Tác giả rất mong nhận được sự quan tâm giúp đỡ và chỉ bảo của thầy cô cùng với sự đóng góp ý kiến của bạn bè để luận văn được hoàn thiện Cuối cùng, tác giả xin cảm ơn sự góp ý tận tình của cô giáo PGS.TS Trần Thị Song Minh đã giúp đỡ để hoàn thành luận văn này