Phân nhóm khách hàng dựa trên học máy

Một phần của tài liệu (Luận văn Đại học Thương mại) NGHIÊN CỨU MỘT SỐ THUẬT TOÁN HỌC MÁY (MACHINE LEARNING) ỨNG DỤNG CHO BÀI TOÁN XÁC ĐỊNH CÁC CHỦ ĐỀ QUAN TÂM CỦA KHÁCH HÀNG TRỰC TUYẾN (Trang 55 - 95)

4.5 CÁC HÀM Ý ĐỀ XUẤT ỨNG DỤNG CHO TỔ CHỨC, DOANH NGHIỆP Học máy là sự giao thoa giữa thống kê cổ điển với khoa học máy tính. Một mục Học máy là sự giao thoa giữa thống kê cổ điển với khoa học máy tính. Một mục tiêu quan trọng của ngành học máy là làm sao để máy tính thơng minh hơn, có khả năng học hỏi và hình thành tri thức một cách tự động từ kinh nghiệm và trở nên hữu ích hơn trong giao tiếp với con người. Đây cũng là một trong những mục tiêu ban đầu của ngành học máy, vào những năm 1950 trong thế kỷ trước. Giờ đây, sau nhiều năm phát triển và đặc biệt trong quãng 5 - 10 năm trở lại đây, học máy đã được ứng dụng trong rất nhiều lĩnh vực của xã hội.

Học máy có một vai trị quan trọng với mọi chính phủ trên tồn cầu, trong việc phân tích và dự báo dữ liệu thơng tin quốc gia, từ quốc phịng - an ninh tới y tế, tài chính, kinh doanh, ... Dữ liệu luôn được thu thập liên tục bằng rất nhiều phương tiện trong từng giây. Những bộ dữ liệu quý giá này sẽ được xử lý bởi hệ thống học máy. Thông tin sau khi xử lý, phân tích chính xác và đưa ra những chỉ báo hiệu quả sẽ mang lại rất nhiều giá trị và lợi thế cho quốc gia đó.

Có thể nói, trong tương lai, học máy sẽ phủ khắp mọi lĩnh vực trong cuộc sống, miễn là nơi đó có dữ liệu. Nhờ có học máy, thời tiết sẽ được dự báo chính xác hơn. Trong y tế, thơng tin bệnh nhân được quản lý sâu tới nguồn gene và hỗ trợ bác sĩ lên phác đồ điều trị phù hợp. Các kênh đầu tư sẽ có thêm nhiều gợi ý chính xác hơn. Tuy

nhiên, để máy tính học tốt, nó phải có khả năng xử lý dữ liệu tốt hơn: dữ liệu đến từ việc giao tiếp với người và giao tiếp giữa những loại thiết bị máy móc với nhau. Khi máy giao tiếp với người, nó phải tiếp nhận được dữ liệu mà người cung cấp cho máy, hiểu những thông tin mà con người truyền đạt cho nó.

Cốt lõi của học máy cũng chính là vấn đề suy diễn từ dữ liệu. So với thống kê cổ điển, điều mới là máy phải thực hiện một cách hiệu quả các phép suy diễn và học tập từ dữ liệu bằng các thuật toán hiệu quả và cơ sở quản lý dữ liệu đồ sộ của máy tính. Do đó học máy cũng được xem là một trong những lĩnh vực tiên phong của thống kê hiện đại nói riêng và khoa học dữ liệu nói chung.

Đối với các doanh nghiệp việc thu thập thông tin và xây dựng hệ thống dữ liệu khách hàng sẽ tạo điều kiện để doanh nghiệp cá nhân hóa tương tác, tăng độ hài lòng trong cách đáp ứng nhu cầu người dùng. Điều này đặt ra thách thức cho doanh nghiệp trong việc quản trị dữ liệu, đồng thời cũng là cơ hội giúp doanh nghiệp có được sự đa dạng về thơng tin để thực hiện phân tích và đưa ra đánh giá về khách hàng của mình.

Khi có được kết quả đánh giá, tức là doanh nghiệp đã nắm được insight - những nhu cầu sâu xa nhất của khách hàng. Như vậy, việc tiếp theo doanh nghiệp cần làm sẽ là vạch ra một chiến lược tiếp thị “đánh trúng” vào insight đó để có thể chinh phục những đối tượng mình muốn tiếp cận.

Xây dựng và phân tích dữ liệu khách hàng là nhiệm vụ quan trọng tất yếu trong kinh doanh. Không thấu hiểu khách hàng, doanh nghiệp không thể thành công. Một hệ thống dữ liệu khách hàng được doanh nghiệp quan tâm đầu tư sẽ giúp nâng cao doanh số, giúp doanh nghiệp phát triển bền vững và có thể phát triển sản phẩm dựa theo mong muốn của khách hàng.

Sự kết hợp các thuật tốn học máy vào phân tích dữ liệu khách hàng có thể ứng dụng vào các bài toán như:

Một là, dự đoán hành vi mua sắm của khách hàng: Các thuật tốn về phân tích

dữ liệu có thể dùng để xử lý các hành vi mua sắm, mối quan tâm đến các loại sản phẩm nào, từ đó dự đốn xu hướng mua sắm để đưa ra các khuyến nghị, quảng cáo phù hợp với nhu cầu của khách hàng. Các kết quả hiển thị gợi ý sản phẩm khách hàng quan tâm, tối ưu hóa kết quả hiển thị tìm kiếm thay cho việc khách hàng phải đi dạo các sản phẩm một cách ngẫu nhiên. Chẳng hạn như khi khách hàng chọn xem hoặc lựa chọn vào giỏ hàng sản phẩm điện thoại, website sẽ gợi ý các sản phẩm như ốp lưng, pin dự phòng, sạc điện thoại, tai nghe,… Kết quả phân tích hành vi khách hàng sẽ giúp doanh nghiệp xác định được những yếu tố tác động đến việc khách hàng chọn mua sản phẩm hay đăng ký dịch vụ. Do đó, khi tập hợp được dữ liệu về sở thích, thói quen của khách hàng đồng nghĩa với việc gián tiếp giúp doanh nghiệp bán được nhiều hàng hóa hơn.

Hai là, phân tích dữ liệu khách hàng trực tuyến là nguồn dữ liệu cho phần mềm tự động chăm sóc và lưu trữ thơng tin khách hàng 24/7 (chatbot): Phân tích dữ liệu

khách hàng hỗ trợ việc hình thành một hệ thống chăm sóc khách hàng linh hoạt, tạo giá trị hữu hình trong xây dựng mối liên với khách hàng và chăm sóc khách hàng. Bên cạnh đó, hệ thống chatbot cịn có vai trị cung cấp tính năng thu thập dữ liệu khách hàng từ

các đoạn đối thoại, sau đó, dữ liệu được phân tích để nắm bắt nhu cầu mong muốn của khách hàng để có thể đưa ra các phản hồi phù hợp, làm thỏa mãn nhu cầu của khách hàng, hình thành và xây dựng mối liên hệ với khách hàng, giữ chân khách hàng.

Ba là, hỗ trợ quản lý chuỗi cung ứng: Quản lý chuỗi cung ứng là một trong những

vấn đề phức tạp của mọi doanh nghiệp. Đối với ngành bán lẻ, quản lý chuỗi cung ứng cịn có vai trị sống cịn. Khi khách hàng đặt một sản phẩm trực tuyến, khách hàng sẽ cần biết giá cả sản phẩm, hiện trạng, mơ tả của sản phẩm, sản phẩm cịn hàng hay không, sản phẩm đang ở kho hàng nào, chi phí giao hàng,… Tất cả những điều đó là nhiệm vụ của chuỗi cung ứng. Hệ thống quản lý chuỗi cung ứng sẽ xác định chính xác lượng hàng tồn kho ở tất cả các kho hàng tại thời điểm đó một cách nhanh chóng, chính xác. Bản chất của bán lẻ là khách hàng đặt hàng số lượng ít và nhu cầu mua được hàng trong khoảng thời gian nhanh nhất. Nếu không đáp ứng được điều này, cơ hội bán hàng sẽ bị vuột mất. Một hệ thống quản lý chuỗi cung ứng tốt hỗ trợ doanh nghiệp khơng bị lưu kho q nhiều hàng hóa, giảm gánh nặng về chi phí tồn kho vì đã có hệ thống phân phối hàng hợp lý.

Phân tích dữ liệu khách hàng có thể hỗ trợ dự báo xu hướng giúp doanh nghiệp dự đoán sản phẩm sẽ cháy hàng hay thời điểm nào khách hàng sẽ mua nhiều hàng nhất để tăng khả năng điều phối hàng hóa, giao hàng kịp thời đến khách hàng. Dữ liệu khách hàng được phân tích cũng hỗ trợ xác định các tuyến đường giao vận ngắn nhất, xác định nhà cung cấp gần nhất với người mua để giảm chi phí vận chuyển. Ứng dụng dự báo và phân nhóm khách hàng giúp doanh nghiệp đưa ra mạng lưới cung cấp với độ chính xác, rõ ràng và chi tiết nhất có thể. Mọi sản phẩm để đến được với khách hàng đều phải trải qua một chu trình cần có sự phối hợp đồng bộ từ nhà cung cấp đến đơn vị vận chuyển, rồi mới đến các cửa hàng bán lẻ. Mỗi bước đều có thể xảy ra những rủi ro như thiếu sót về hàng hóa, kho bãi, q trình vận chuyển.

Bốn là, phân tích hành trình của khách hàng thơng qua bản đồ hành trình khách hàng: Sử dụng dữ liệu phân tích để diễn tả quy trình khách hàng tương tác với doanh

nghiệp, khách hàng sẽ mua hàng hoặc gia tăng nhận biết về thương hiệu cửa hàng. Việc phân tích q trình tương tác giữa khách hàng và sản phẩm, khách hàng và cửa hàng giúp doanh nghiệp nhận biết được các vấn đề của khách hàng. Từ đó tối ưu hóa từng hoạt động cụ thể để giải quyết tận gốc vấn đề khách hàng đang gặp phải, xây dựng mối quan hệ lâu bền với doanh nghiệp.

Năm là, xây dựng mơ hình chi tiêu cho từng khách hàng: Đặc thù của dịch vụ bán

lẻ là có số lượng lớn đối tượng khách hàng có cùng đặc điểm. Nếu khơng ứng dụng phân tích dữ liệu khách hàng trực tuyến thì việc xây dựng mơ hình chi tiêu cho từng khách hàng là việc bất khả thi. Chăm sóc từng khách hàng thơng qua việc xây dựng kế hoạch chi tiêu cho từng khách hàng cụ thể đem đến hiệu quả cao cho các doanh nghiệp phát triển mảng bán lẻ. Thông thường khách hàng mua lẻ sẽ có tần suất chi tiêu cao theo từng tuần, từng tháng hoặc từng quý. Nắm bắt được nhu cầu và tần suất chi tiêu của khách hàng, doanh nghiệp sẽ có hiệu quả kinh doanh cao với lượng hàng hóa mua đều đặn từ khách hàng lẻ.

Sáu là, phân tích tập các phân tích dữ liệu khách hàng trực tuyến để xác định sản phẩm cung ứng: Kết hợp phân tích cùng một lúc các dữ liệu về thời điểm, giao dịch,

truyền thông xã hội, dự báo thời tiết để xác định chính xác sản phẩm phù hợp nhằm kịp thời cung ứng cho khách hàng đúng thời điểm, tránh xảy ra tình trạng khan hiếm hàng hóa.

Bảy là, cải thiện an toàn giao dịch trên Internet: Phân tích dữ liệu khách hàng

trực tuyến được áp dụng rất phổ biến trong việc cải thiện bảo mật các giao dịch trên Internet, phát hiện các giao dịch khác lạ của khách hàng từ dữ liệu tổng hợp hành vi của khách hàng, phát hiện ra các vấn đề về an toàn bảo mật trên mạng từ những dữ liệu được tổ chức có cấu trúc như lịch sử giao dịch, hồ sơ khách hàng, hoặc những dữ liệu phi cấu trúc như hoạt động của khách hàng trên trang web, ứng dụng mobile banking hay sử dụng mạng xã hội. Phân tích dữ liệu khách hàng trực tuyến đem lại hiệu quả lớn và lợi thế cạnh tranh về sự an toàn cho người sử dụng và doanh nghiệp bán lẻ.

KẾT LUẬN

Khách hàng là yếu tố quan trọng quyết định sự tồn tại và phát triển của doanh nghiệp. Bởi vậy doanh nghiệp cần xây dựng hệ thống dữ liệu khách hàng để có được sự thấu hiểu người dùng, tạo điều kiện thuận lợi trong việc chăm sóc khách hàng cũ và tăng khả năng tiếp cận khách hàng mới.

Nghiên cứu này đã giới thiệu sơ lược các thuật toán học máy được ứng dụng trong phân tích dữ liệu khách hàng trực tuyến được, và sử dụng 02 bộ ngữ liệu chuẩn phổ biến để so sánh và phân tích hiệu suất của các thuật toán học máy đang được đề cập đến trong thời gian gần đây. Các thuật toán học máy được sử dụng so sánh được lựa chọn dựa trên các kết quả phân tích và cơng bố của các nghiên cứu liên quan đến phân tích dữ liệu trên các phương tiện truyền thơng xã hội.

Qua thực nghiệm dựa trên phương pháp học có giám sát theo One vs All, có thể thấy rằng, mặc dù có nhiều thuật tốn được đề cập đến nhưng khơng phải thuật tốn nào cũng phù hợp ứng dụng trong bài tốn phân tích dữ liệu khách hàng. Việc lựa chọn thuật toán phù hợp mang lại kết quả tốt không những nâng cao hiệu quả mà cịn phân loại chính xác các nhóm khách hàng để đưa ra các chiến lược phát triển trong các hoạt động sản xuất, kinh doanh của tổ chức.

DANH MỤC TÀI LIỆU THAM KHẢO

1. Đỗ Thanh Nghị, (2010), Khai mỏ dữ liệu – minh họa bằng ngôn ngữ R (chương 4), NXB Đại học Cần Thơ, 2010.

2. Phan Thanh Đức và các tác giả, (2019), Ứng dụng phân tích dữ liệu khách hàng

trực tuyến trong hoạt động quản trị quan hệ khách hàng tại các Ngân hàng thương mại Việt Nam, Tạp chí Khoa học & Đào tạo Ngân hàng, Số 203- Tháng 4. 2019

3. Nguyễn Anh Duy & Nguyễn Phúc Quỳnh Như, (2019), Dữ liệu lớn: Cách thức khai thác cơ hội từ dữ liệu? Trường hợp Amazon, Số 46 (56) - Tháng 05 - 06/2019

Phát triển & Hội nhập

4. Jill Dyché, Huỳnh Minh Em (dịch), (2010), Cẩm nang quản lý mối quan hệ khách

hàng, NXB Tổng hợp TP.HCM, 2010

5. Lưu Đan Thọ, Lương Văn Quốc, (2016), Quản trị quan hệ khách hàng (Lý thuyết

và tính huống thực hành ứng dụng của các cơng ty Việt Nam) , NXB Tài chính,

2016

6. Huỳnh Quyết Thắng, Đinh Thị Thu Phương, (2005), “Tiếp cận phương pháp học

khơng giám sát trong học có giám sát với bài tốn phân lớp văn bản tiếng Việt và đề xuất cải tiến cơng thức tính độ liên quan giữa hai văn bản trong mơ hình vectơ”,

Kỷ yếu Hội thảo ICT.rda’04, trang 251-261, Hà Nội 2005.

7. Đỗ Trung Thành, Đỗ Phúc, (2015), "Mơ hình tích hợp khám phá và gán nhãn chủ

đề tiếp cận theo mơ hình chủ đề," Tạp chí Khoa học Cơng nghệ ĐHQGHCM , vol.

4, no. 17, 2015.

8. Phan Hồ Viết Trường, Hồ Trung Thành, Đỗ Phúc, (2014), "Phân tích tầm ảnh hưởng đối tượng theo chủ đề trong mạng xã hội," Tạp chí Khoa học Cơng nghệ,

Viện Hàn lâm Khoa học Công nghệ Việt Nam, vol. 1B, no. 52, pp. 101-111, 2014. 9. A. Abdul-Rahim, et al., (2014), "Determinants of Online Buying Behavior of

Social Media Users in Saudi Arabia: An Exploratory Study," SSRN Electronic

Journal, DOI:10.2139/ssrn.2519254, India, 2014.

10. A. Ezgi and S. Mardikyan, (2014), "Analyzing factors affecting users' behavior intention to use social media: Twitter case," International Journal of Business and

Social Science, pp. 5-11, 2014.

11. A.M. Kibriya, et al., (2004), "Multinomial Naive Bayes for Text Categorization Revisited," in Proceedings of the 17th Australian Joint Conference on Advances in

Artificial Intelligence, AI’04, Springer-Verlag, Berlin, Heidelberg, 2004

12. Allahyari, Mehdi, et al. (2017), "A brief survey of text mining: Classification,

clustering and extraction techniques." arXiv preprint arXiv:1707.02919, 2017.

13. Amedie, Jacob, (2015), "The Impact of Social Media on Society". Advanced

Writing: Pop Culture Intersections. http://scholarcommons.scu.edu/engl_176/2, 2015

14. B. Parantapa, et al., (2014), "Inferring User Interests in the Twitter Social Network”, Proceedings of the 8th ACM Conference on Recommender Systems,

RecSys'14, 2014, Silicon Valley, California, USA, pp 357-360, ACM, New York, 2014 .

15. Basit Shahzad, Ikramullah Lali, M. Saqib Nawaz, Waqar Aslam, Raza Mustafa, Atif Mashkoor, (2017), "Discovery and classification of user interests on social media", Information Discovery and Delivery, https://doi.org/10.1108/IDD-03-

2017-0023

16. Collin, P., Rahilly, K., Richardson, I. & Third, (2011), “A.The Benefits of Social Networking Services: A literature review”, Cooperative Research Centre for Young People, Technology and Wellbeing. Melbourne, 2011

17. D. Manning, et al., (2008), “Introduction to Information Retrieval”, New York, USA: Cambridge University Press, ISBN: 0521865719, 9780521865715, 2008. 18. Editor, Ijcsis. (2016). “A Method for Mining Social Media to Discovering

Influential Users”. 10.6084/M9.FIGSHARE.3362416.V1.

19. Faris Kateb and Jugal Kalita, (2015), “Article: Classifying Short Text in Social

Media: Twitter as Case Study”. International Journal of Computer Applications

111(9):1-12, February 2015.

20. Hsinchun Chen, et al., (2010), "Data Mining for Social Network Data, Annalys of

Information Systems," volume 12, Springer, 2010.

21. Li Lei, (2015), "Recommending Users and Communities in Social Media," Journal ACM Trans. Knowl. Discov., vol. 10, no. 2, 2015.

22. Ristoski, P., P., Mika, P. and Paulheim, H., (2018), “A machine learning approach

for product matching and categorization”, Semantic web, (Preprint), pp.1-22.

23. Smeureanu Ion, et al, (2012), "Applying Supervised Opinion Mining Techniques

on Online User Reviews," Informatica Economica, vol. 16, no. 2, pp. 81-91, 2012.

24. Y. Kim., (2014), "Convolutional Neural Networks for Sentence Classification," in Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP-2014), Doha, Qatar, pp.1746-1751, 2014

25. Yang Christopher C, et al., (2012), "Identifying Implicit Relationships Between Social Media Users to Support Social Commerce," in Proceedings of the 14th

Annual International Conference on Electronic Commerce, ICEC '12, Singapore, 2012.

26. Z. Abbassi, et al., (2015), "Optimizing Display Advertising in Online Social Networks" in Proceedings of the 24th International Conference on World Wide

Web, WWW '15, Florence, Italy, 2015.

27. Z. Yongzheng and P. Marco, (2013), "Predicting Purchase Behaviors from Social

Một phần của tài liệu (Luận văn Đại học Thương mại) NGHIÊN CỨU MỘT SỐ THUẬT TOÁN HỌC MÁY (MACHINE LEARNING) ỨNG DỤNG CHO BÀI TOÁN XÁC ĐỊNH CÁC CHỦ ĐỀ QUAN TÂM CỦA KHÁCH HÀNG TRỰC TUYẾN (Trang 55 - 95)