CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU

Một phần của tài liệu báo cáo môn học ứng dụng phân tích dữ liệu lớn trong quản lý đề tài dự báo khả năng khách hàng ngừng sử dụng dịch vụ thẻ tín dụng trong lĩnh vực ngân hàng bằng phương pháp machine learning (Trang 40 - 45)

3.1. Xứ lý dữ liệu Nhóm nghiên cứu đã xử lý dữ liệu trước khi đưa vào mô hình để xuất. Trong bước đâu tiên, nhóm nghiên cứu đã thay đổi các giá trị của biến lớp (Attrition_Flag).

Cột này chứa hai loại giá trị. Giá trị "Attrited Customer" đã được thay đối thành "1"

trong khi gia tri "Existing Customer" thay đổi thành “0”. Tiếp theo, tiến điều chỉnh cột giới tính. Giá trị Nữ được thay bằng “1”, và giá trị Nam được thay bằng “0”. Cuối cùng, trong các cột Education_Level, Income_Category và Marital_ Status, có một só giá trị không được xác định. Chúng tôi đã loại bỏ những giá trị này khỏi tập dữ liệu.

Và trong số 23 biến, tác giả cũng đã loại bỏ các biến không liên quan là hai cột cuối cùng của tác giả cung cấp gì không đóng góp vào quá trình phân loại. Cuối cùng còn 21 biến cuối cùng trong bộ dữ liệu được sử dụng. Trong đó có 20 biến dự đoán và I biến lớp phân loại.

3.2. Phương pháp nghiên cứu Lĩnh vực học máy đã xuất hiện khoảng bốn thập kỷ trước với mục tiêu mạnh mẽ là phát triển các phương pháp tính toán có khả năng học các loại hình khác nhau thông qua các cơ chế cụ thê, từ đó tạo ra kiến thức từ các ví dụ hoặc dữ liệu (Kubat, M., Bratko, |., & Michalski, R. S, 1998).

ML cho phép giải quyết các vấn để phức tạp bằng cách xây dựng các mô hình dự đoán hoặc phân loại dựa trên dữ liệu. ML đã từng bước phát triển từ việc máy tính học hỏi theo cách mà con người học, và hiện đã trở thành một ngành học đa dạng vả tiên tiễn. Điều này đã tạo ra sự kết hợp giữa các thuật toán và kỹ thuật ML trong nhiều lĩnh vực ứng dụng khác nhau. Sự phát triển của học máy cũng đã thúc đây sự tiến bộ trong lĩnh vực thống kê, làm nỗi bật các lý thuyết và phương pháp tính toán mới để giải quyết các vấn đề trong quá trình học tập và dự đoán (Vladimir Nastesky, 2017).

27

examples _—_——————_ learning ơ

: concept description

backor 1 algorithm ] |

vackerTounc

knowledge

Hinh 3.1. Nhiém va hec máy Hiện nay, với sự tiễn bộ của các công nghệ máy tính mới trong lĩnh vực Big Data, học máy đã trải qua những thay đôi đáng kế so với trước đây. Các thuật toán học máy hiện đại đã trải qua quá trình phát triển, cập nhật và cải thiện, đồng thời khả năng tự động hóa trong việc áp dụng các phép tính toán phức tạp vào dữ liệu lớn đã trở thành hiện thực. Điều này giúp việc tính toán và xử lý đữ liệu diễn ra nhanh chóng và hiệu quả hơn, đồng thời mở ra nhiều cơ hội mới trong lĩnh vực học máy (Rich Caruana, Alexandru Niculescu-MIzil, 2006).

Machine learning đã được triên khai rộng rãi trong nhiều lĩnh vực đời sống và kinh doanh, mang lại sự đa dang và phạm vi ứng dụng rộng lớn. Điều này thể hiện tiềm năng mạnh mẽ của machine learning trong việc giải quyết vấn đề và cung cấp

giải pháp cho nhiều lĩnh vực khác nhau. Trong lĩnh vực y tế, ML được áp dụng để

phân tích dữ liệu từ hồ sơ bệnh án và thiết bị y tế thông minh, từ đó dự đoán căn bệnh, hỗ trợ chân đoán hình ảnh y khoa và tìm kiếm điều trị hiệu quả. Đối với lĩnh vực tài chính, ML được sử dụng đề dự đoán thị trường tài chính, quản lý rủi ro đầu tư và phát hiện gian lận tài chính. Trong lĩnh vực bán lẻ và thương mại điện tử, machine learning

được áp dụng đề tối ưu hóa chiến lược giá cả, dự đoán hành ví mua sam và cá nhân

hóa trải nghiệm mua sam. Trong quảng cáo và tiếp thị, ML được sử dụng để tôi ưu hóa chiến lược quảng cáo và tạo nội dung quảng cáo cá nhân hóa... và ML còn được áp dụng trong nhiều lĩnh vực khác nhau của đời sống và kinh doanh nhằm dự đoán

các két quả dựa trên dữ liệu lịch sử và mô hình học may; phân loại và nhận dạng các

đối tượng dựa trên dữ liệu đầu vào; tối ưu hóa các quy trình và hệ thống bằng cách tinh chỉnh các tham số dựa trên phản hỏi từ dữ liệu; tự đoọng hóa các nhiệm vụ phức tạp mà trước đây cần sự can thiệp của con người (Ví dụ, trong ô tô tự hành, machine

28

learning có thẻ giúp xe tự động nhận biết và phản ứng với môi trường xung quanh một cách tự động); hỗ trợ quyết định bằng cách cung cấp thông tin và phân tích dữ liệu để hỗ trợ việc ra quyết định... Tóm lại, machine learning không chỉ mở ra nhiều cơ hội mới cho các ứng dụng công nghệ mà còn có tác dụng tối ưu hóa, tinh chỉnh,

và tự động hóa các quy trình và quyết định trong nhiều lĩnh vực khác nhau.

Trong bài nghiên cứu, nhóm sẽ tiến hành sử dụng phương pháp ML đề xây dựng mô hình dự báo khả năng khách hàng ngừng sử dụng dịch vụ thẻ tín dụng.

Trong thực tế, đã có nhiều doanh nghiệp sử dụng phương pháp ML để sự báo về churn rate. Một số sản phẩm tương tự có thẻ kế đến như:

Các ngân hàng thương mại và tô chức tài chính như các ngân hàng lớn như Citibank, JP Morgan Chase, các công ty bảo hiểm như Allstate, Progressive, các nghiên cứu machine learning tập trung vào việc dự đoán khả năng khách hàng rời bỏ và phát triển các chiến lược giữ chân khách hàng. Các mô hình ML sử dụng dữ liệu về lịch sử giao dịch, hoạt động tài chính và hành vi khách hàng để dự đoán nguy co

rời bỏ và đề xuất các biện pháp tôi ưu hóa quản lý mối quan hệ với khách hàng.

Trong lĩnh vực dịch vụ Internet và Truyền thông, ML được sử dụng để dự đoán khả năng rời bỏ của người đùng dịch vụ lnternet, truyền hình cáp, hoặc điện thoại di động ở các doanh nghiệp cung cấp dịch vụ Internet như Comcast, AT&T, Verizon, các nhà cung cấp dịch vụ truyền hình cáp và truyền hình vệ tỉnh như DirecTV, Dish Network, Netflix.. Các mô hình machine learning phan tích dữ liệu về việc sử dụng dịch vụ, các gói cước, và hành vi truy cập trang web để đưa ra dự đoán về khách hàng có khả năng chuyên sang đối thủ hoặc hủy dịch vụ.

Trong lĩnh vực dịch vụ Công nghệ và SaaS (phần mềm dưới dạng dịch vụ), nghiên cứu ML tại một số doanh nghiệp công nghệ cung cấp các địch vụ SaaS như Salesforce, Microsoft (voi Microsoft 365), Google (voi Google Workspace), cac céng ty phat trién phan mềm như Adobe tập trung vào việc dự đoán và giữ chân khách hàng sử dụng các dịch vụ công nghệ và SaaS. Các mô hình ML sử dụng dữ liệu về việc sử dụng sản phẩm, tương tác với ứng dụng, và hành vi trực tuyến dé dy đoán nguy cơ rời bỏ và để xuất các chiến lược giữ chân khách hàng.

29

Trong ngành du lịch trực tuyến, ML được sử dụng để dự đoán và giữ chân khách hàng sử dụng các dịch vụ đặt phòng và đặt vé. Các mô hình ML phân tích dữ liệu về lịch sử đặt phòng, phản hồi từ khách hàng và hành vi trực tuyến để đưa ra dự đoán về khả năng rời bỏ và tối ưu hóa chiến lược giữ chân khách hàng ở các công ty đặt phòng và đặt vé trực tuyến như Booking.com, Expedia, Airbnb, các hãng hàng khéng nhu Delta Airlines, United Airlines, các dịch vụ du lịch trực tuyến như TripAdvisor.

Nhằm tiến hành xây dựng mô hình dự đoán khả năng khách hàng ngừng sử dụng dịch vụ thẻ tín dụng bằng phương pháp học máy, nhóm nghiên cứu đã tiến hành su dung céng cu Azure Machine Learning Studio. Azure Machine Learning (ML) Studio la mét nén tang hoc may trén dam may, duoc thiết kế với một môi trường kéo và thả đễ sử dụng. Nền tảng này cung cấp hơn 20 thuật toán học máy được xác định trước. Với Azure ML Studio, người dùng có thê nhập dữ liệu từ nhiều nguồn khác nhau, thực hiện các thử nghiệm học máy và triển khai dịch vụ web từ các mô hình đã tạo. Đặc biệt, Azure ML Studio cũng hỗ trợ chạy mã R hoặc Python, giúp người dùng linh hoạt trong việc phát triển và triển khai các dự án học may (Etaati, L., & EtaatI, L, 2019).

4 Description

Quick Help

Hình 3.2. Môi trưởng Azure ML Studio Azure Machine Learning cung cấp nhiều mô-đun khác nhau giúp người dùng xây dựng và triên khai các mô hình học máy trong môi trường sản xuât. Các bước

30

chính đề xây dựng và triên khai mô hình bao gồm: 1) nhập dữ liệu thô; 2) tiền xử lý dữ liệu; 3) kỹ thuật trích xuất đặc trưng và gán nhãn đữ liệu (đối với các bài toán học có giám sát như phân loại); 4) huấn luyện, đánh giá và đánh giá mô hình; 5) so sánh và lựa chọn mô hình; 6) lưu trữ mô hình đã huấn luyện; 7) tạo thử nghiệm dự đoàn;

và 8) triển khai dich vu web trong Azure Machine Learning (Barga, R., Fontama và các cộng sự, 2015).

Azure ML Studio là một công cụ mạnh mẽ cho việc xây dựng vả triển khai các mô hình dự báo trong lĩnh vực dịch vụ thẻ tín dung. Voi giao diện dé hoa dé str dụng, Azure ML Studio cho phép các nhà phân tích đữ liệu và nhà phát triển mô hình

dễ dàng nhập dữ liệu từ các nguồn khác nhau và thực hiện các bước quan trọng như

tiền xử lý đữ liệu, huấn luyện mô hình, và đánh giá hiệu suất. Công cụ này cung cấp

một loạt các thuật toán học máy được xác định sẵn cho phép xử lý dữ liệu lớn va huấn luyện các mô hình phức tạp một cách hiệu quả, giúp tối ưu hóa quá trình xây dựng mô hình dự báo khách hàng ngừng dịch vụ thẻ tín dụng.

Azure ML Studio cũng có khả năng tích hợp với các dịch vụ và công nghệ khác trong hệ thống thông tin của doanh nghiệp, tạo điều kiện thuận lợi cho việc triển khai các mô hình dự báo vào môi trường sản xuất. Tuy nhiên, việc sử dụng Azure ML Studio cũng đòi hỏi kiến thức kỹ thuật vững vàng để có thể tận dụng hết tiềm năng của công cụ này, đặc biệt là trong việc tiền xử lý đữ liệu và lựa chọn mô hình phù hợp.. Tuy nhiên, với những lợi ích và tiềm năng mà nó mang lại, Azure ML Studio là một công cụ hữu ích và tiềm năng cho các doanh nghiệp muốn dự báo khả năng khách hàng ngừng sử dụng dịch vụ thẻ tín dụng.

31

Một phần của tài liệu báo cáo môn học ứng dụng phân tích dữ liệu lớn trong quản lý đề tài dự báo khả năng khách hàng ngừng sử dụng dịch vụ thẻ tín dụng trong lĩnh vực ngân hàng bằng phương pháp machine learning (Trang 40 - 45)

Tải bản đầy đủ (PDF)

(91 trang)