Phân khúc khách hàng tronglĩnh vực bán lẻ xe đạp ứng dụng môhình rfm kết hợp phương pháp học máyphân cụm k means

Mục tiêu tổng quát: Nghiên cứu này đề xuất phương pháp và xây dựng mô hình phân khúc khách hàng dựa trên phương pháp RFM kết hợp với thuật toán học máy phân cụm K-means để phân tích phân

Mục tiêu nghiên cứu

Mục tiêu tổng quát: Nghiên cứu này đề xuất phương pháp và xây dựng mô hình phân khúc khách hàng dựa trên phương pháp RFM kết hợp với thuật toán học máy phân cụm K-means để phân tích phân khúc khách hàng trong lĩnh vực bán lẻ Từ đó hoàn thiện mô hình phân khúc khách hàng hiệu quả, đồng thời đánh giá hiệu quả phương pháp RFM truyền thống so với RFM kết hợp thuật toán học máy Điều này giúp các nhà quản lý doanh nghiệp đưa ra các chiến dịch marketing phù hợp với từng phân khúc khách hàng.

- Nghiên cứu này sẽ làm rõ các cơ sở lý thuyết liên quan như hành vi khách hàng, phân khúc khách hàng, mô hình RFM, và các nghiên cứu liên quan có sử dụng phương pháp K-means trong phân khúc khách hàng

- Trình bày về việc thu thập, xử lý dữ liệu để đưa ra phân khúc khách hàng dựa trên mô hình RFM, phương pháp K-means

- Đưa ra những phân tích định tính và định lượng tương ứng với từng phân khúc khách hàng Từ đó hoàn thiện mô hình phân khúc khách hàng hiệu quả sử dụng RFM kết hợp phương pháp học máy.

- Đề xuất/khuyến nghị chiến lược marketing hiệu quả cho từng phân khúc khách hàng. Đối tượng và phạm vị nghiên cứu Đối tượng: Phân khúc khách hàng bằng cách ứng dụng mô hình RFM và thuật toán học máy phân cụm K-mean

- Không gian: Nghiên cứu dựa trên dữ liệu về thị trường hoạt động bán lẻ xe đạp của công ty AdventureWorks ( Từ năm 2017 - 2020)

- Thời gian: nghiên cứu này thực hiện trong 2 tháng (từ tháng 9/2022 đến tháng 11/2022)

Phương pháp nghiên cứu

- Phương pháp phân tích và tổng hợp lý thuyết: Tổng hợp và đưa ra luận điểm chính thu được từ quá trình phân tích, tổng hợp từ các lý thuyết nền tảng và các nghiên cứu trước.

- Phương pháp phân loại và hệ thống hóa lý thuyết: dựa vào các thông tin thu thập được tiến hành hệ thống hóa và phân thành các mục vấn đề với hướng đi cụ thể, thống nhất, từ đó đưa ra kết luận cuối cùng.

- Phương pháp chuyên gia: tham khảo, phỏng vấn những chuyên gia có hiểu biết sâu rộng về lĩnh vực tiếp thị cũng như học máy, từ đó tổng hợp được những thông tin quan trọng về đối tượng nghiên cứu.

- Phương pháp nghiên cứu tài liệu: Nghiên cứu bài nghiên cứu khoa học được công bố trước đó về lĩnh vực tiếp thị, kỹ phân khúc khách hàng, cụ thể là các mô hình RFM và phương thức kết hợp với các phương pháp máy học để tối ưu hiệu quả mô hình.

- Phương pháp thu thập thông tin: Xây dựng bộ dữ liệu dựa trên các ghi nhận của hệ thống bán lẻ, bao gồm các dữ liệu định lượng chủ chốt như số lần mua, tổng tiền, thời điểm giao dịch,…

- Phương pháp định tính: Diễn giải cách phân chia và đặc trưng của từng nhóm khách hàng dựa trên kết quả phân cụm có được từ thực nghiệm.

- Phương pháp định lượng: tìm ra các chỉ số Recency, Frequency, Monetary và xây dựng thang đo giá trị áp dụng với từng khách hàng Kết hợp kết quả từ mô hình RFM với thuật toán K-means để tăng độ chính xác và tối ưu kết quả phân cụm, phân đoạn khách hàng.

Quy trình nghiên cứu

Nghiên cứu được thực hiện theo sơ đồ như hình:

Hình 1 1: Quy trình nghiên cứu

Cấu trúc bài nghiên cứu

Bài báo cáo nghiên cứu này có cấu trúc gồm 5 chương, chi tiết như sau:

Chương 1: Tổng quan tình hình nghiên cứu Ở chương này nghiên cứu sẽ trình bày về tổng quan đề tài bao gồm lý do chọn đề tài, mục tiêu nghiên cứu, đối tượng, phạm vi, phương pháp nghiên cứu.

Chương 2: Cơ sở lý thuyết

Trong chương 2 sẽ có các nội dung về những lý thuyết nền tảng liên quan tới đề tài bao gồm Hành vi khách hàng, Phân tích phân khúc khách hàng, RFM,… và các công trình nghiên cứu, đóng góp học thuật có liên quan.

Chương 3: Thực nghiệm trên mô hình RFM

Chương 3 trình bày nội dung chi tiết về triển khai mô hình thực nghiệm, bao gồm các bước chuẩn bị, tối ưu dữ liệu và áp dụng mô hình RFM nhằm đưa ra kết quả thực nghiệm cho nghiên cứu này.

Chương 4: Kết quả thực nghiệm và thảo luận Ở chương 4 sẽ trình bày kết quả của việc triển khai các mô hình, thuật toán và nhận xét đánh giá về kết quả có được.

Chương 5: Kết luận và hướng phát triển

Tổng kết lại thu hoạch của quá trình mà cuộc nghiên cứu này đã nhận được cũng như đưa ra hướng phát triển, đề ra hướng đi, giải pháp để có thể cải thiện nghiên cứu trong tương lai.

Phụ lục: Phân cụm khách hàng với thuật toán K-means Phần này sẽ trình bày phương pháp phân khúc khách hàng kết hợp mô hình RFM và thuật toán phân cụm K-means, bao gồm đưa ra mô hình thực nghiệm và kết quả thực nghiệm, đánh giá và nhận xét về hiệu quả của mô hình đồng thời đưa ra các khuyến nghị khi áp dụng phương pháp này vào phân khúc khách hàng.

18 18 18 18 2.1 Cơ sở lý thuyết

Hành vi khách hàng

Hành vi khách hàng là một lĩnh vực nghiên cứu có nguồn gốc từ các khoa học như tâm lý học, xã hội học, tâm lý xã hội học, nhân văn học và kinh tế học Hành vi khách hàng chú trọng đến việc nghiên cứu tâm lý cá nhân, nghiên cứu những niềm tin cốt yếu, những giá trị, những phong tục, tập quán ảnh hưởng đến hành vi con người và những ảnh hưởng lẫn nhau giữa các cá nhân trong quá trình mua sắm tiêu dùng Đặc biệt, việc nghiên cứu hành vi khách hàng là một phần quan trọng trong nghiên cứu kinh tế học với mục đích tìm hiểu xem bằng cách nào (how) và tại sao (why) những người tiêu dùng mua (hoặc không mua) các sản phẩm và dịch vụ, và quá trình mua sắm của khách hàng diễn ra như thế nào 1

Sự hiểu biết về hành vi khách hàng sẽ cung cấp nền tảng cho những chiến lược marketing, như việc định vị sản phẩm, phân khúc thị trường, phát triển sản phẩm mới, những áp dụng thị trường mới, marketing toàn cầu, những quyết định marketing mix, Những hoạt động marketing chủ yếu này sẽ hiệu quả hơn khi được đặt trên cơ sở một sự hiểu biết về hành vi khách hàng

Có nhiều định nghĩa về hành vi khách hàng, sau đây là một số định nghĩa tiêu biểu:

- Theo Hiệp hội Marketing Hoa Kỳ, hành vi khách hàng chính là sự tác động qua lại giữa các yếu tố kích thích của môi trường với nhận thức và hành vi của con người mà qua sự tương tác đó, con người thay đổi cuộc sống của họ Hay nói cách khác, hành vi khách hàng bao gồm những suy nghĩ và cảm nhận mà con người có được và những hành động mà họ thực hiện trong quá trình tiêu dùng Những yếu tố như ý kiến từ những người tiêu dùng khác, quảng cáo, thông tin về giá cả, bao bì, bề ngoài sản phẩm,… đều có thể tác động đến cảm nhận, suy nghĩ và hành vi của khách hàng 2

- Theo Kotler & Levy, hành vi khách hàng là những hành vi cụ thể của một cá nhân khi thực hiện các quyết định mua sắm, sử dụng và vứt bỏ sản phẩm hay dịch vụ 3

Như vậy, qua hai định nghĩa trên, chúng ta có thể xác định hành vi khách hàng là:

- Những suy nghĩ và cảm nhận của con người trong quá trình mua sắm và tiêu dùng.

- Hành vi khách hàng là năng động và tương tác vì nó chịu tác động bởi những yếu tố từ môi trường bên ngoài và có sự tác động trở lại đối với môi trường ấy.

- Hành vi khách hàng bao gồm các hoạt động: mua sắm, sử dụng và xử lý sản phẩm dịch vụ.

Phân tích phân khúc khách hàng

Việc doanh nghiệp áp dụng một phương thức marketing chung cho các khách hàng của họ có thể không mang lại cho họ những lợi ích mong muốn, bởi mỗi khách hàng là một cá thể khác nhau có những lối sống, trải nghiệm khác nhau do đó ta cần phải phân khúc khách hàng thành từng nhóm theo một hoặc một vài thuộc tính nào đó Phân khúc khách hàng là quá trình phân chia các khách hàng không đồng nhất thành các nhóm đồng nhất trên cơ sở tương đồng về một hoặc một vài thuộc tính chung nào đó và là điều cần thiết để xử lý nhiều loại khách hàng với nhiều nhóm sở thích đa dạng khác nhau một cách hiệu quả hơn Việc phân khúc khách hàng thường dựa trên một số tiêu chí, như dựa trên dữ liệu nhân khẩu học, ví dụ: giới tính, độ tuổi, tình trạng hôn nhân, quy mô hộ gia đình, ; Dữ liệu địa lý, ví dụ: khu vực cư trú hoặc làm việc, ; Dữ liệu tâm lý học, ví dụ: các đặc điểm về tầng lớp xã hội, lối sống và nhân cách, ; Dữ liệu bán hàng, cho biết các hành vi mua sắm, ví dụ: khối lượng bán hàng, số lượt truy cập, tần suất truy cập, khối lượng tiền tệ, lượt truy cập gần đây, ; Dữ liệu hành vi, tức là dữ liệu chỉ ra các hành vi khác ngoài mua sắm, ví dụ: dữ liệu thu được từ các giỏ hàng hỗ trợ RFID thể hiện những gì người mua sắm bỏ vào giỏ hàng của họ Việc phân khúc khách hàng có thể áp dụng nhiều mô hình khai thác dữ liệu như: mô hình dựa trên liên kết (ví dụ: quy tắc liên kết, chuỗi Markov), phân loại (ví dụ: cây quyết định), phân cụm, khám phá trình tự, dự báo (ví dụ: mạng thần kinh) Dữ liệu bán hàng ở cấp độ khách hàng thường được sử dụng để phân khúc người mua hàng và kiểm tra hành vi mua hàng của họ Nói cách khác, họ kiểm tra hành vi mua sắm (ví dụ: khối lượng bán hàng, tần suất ghé thăm, ) hoặc sự kết hợp của các sản phẩm hoặc danh mục sản phẩm mà người mua hàng đã mua trong toàn bộ lịch sử mua hàng của họ, tức là trong tất cả các lần truy cập của họ trong một cửa hàng vật lý hoặc cửa hàng trực tuyến của một nhà bán lẻ Sau khi áp dụng các phương pháp để gom nhóm khách hàng, các nhóm khách hàng sẽ được gán nhãn tương ứng với các chỉ số đặc trưng của nhóm đó (ví dụ như: nhóm khách hàng tiềm năng, nhóm khách hàng trung thành, nhóm khách hàng V.I.P, nhóm khách hàng có khả năng rời bỏ, ) Sau khi có các phân khúc khách hàng riêng biệt, doanh nghiệp có thể tùy chỉnh kế hoạch tiếp thị, xác định xu hướng, lập kế hoạch phát triển sản phẩm, chiến dịch quảng cáo và cung cấp các sản phẩm phù hợp với từng phân khúc khách hàng tương ứng từ đó nâng cao doanh số cho doanh nghiệp Việc phân khúc khách hàng rất quan trọng bởi đây doanh nghiệp nào có được cái nhìn chính xác về đặc trưng của từng phân khúc khách hàng sẽ có thể phân chia ngân sách quảng cáo hợp lý hơn và tiết kiệm được nhiều hơn, không những thế còn đem lại hiệu quả to lớn Đối với người làm marketing, đặc biệt là trong lĩnh vực bán lẻ, việc xác định đúng phân khúc khách hàng giúp cho họ hiểu khách hàng mình hơn Khi thấu hiểu khách hàng, nhà bán lẻ có thể điều chỉnh và cải thiện chất lượng dịch vụ mà họ cung cấp để khách hàng có trải nghiệm tốt hơn và đồng hành cùng doanh nghiệp lâu dài, giúp tăng doanh số ổn định, tạo sự bền vững cho doanh nghiệp.

Các phương pháp phân khúc khách hàng trước đó

Trước khi có đủ khả năng để ứng dụng các tiến bộ khoa học công nghệ trong việc phân khúc khách hàng, những nhà bán lẻ thường phân nhóm khách hàng của họ dựa trên việc quan sát và ghi nhận một cách thủ công Phương pháp này tuy gần gũi, dễ dàng thực hiện song lại vô cùng kém hiệu quả vì người thường không thể nào nắm hết một lượng lớn thông tin khách hàng chỉ dựa trên việc nhìn, nghe, đánh giá cá nhân và ghi chép, chưa kể thông tin ở đây không chỉ bao gồm thông tin định danh cá nhân mà còn là nhân khẩu học, hành vi và đôi khi là cả tâm lý học Điều này gây ra những rủi ro cực kỳ lớn cho các nhà bán lẻ khi họ có nguy cơ đánh mất lượng khách hàng đáng kể nếu vô tình

“nhớ nhầm” thông tin của một khách hàng thân quen nào đó, giới thiệu sai sản phẩm cho sai người hay đánh giá sai tính cách và hành vi khách hàng do chỉ dựa vào quan điểm cá nhân Vì vậy, xu hướng tất yếu lúc bấy giờ là cần một sự đổi mới trong việc phân tích phân khúc khách hàng.

Ngày nay, khi công nghệ đã phát triển vượt bậc kéo theo sự ra đời của những kỹ thuật mới như nhãn nhóm khách hàng (Customer Quintiles) và các phương pháp học máy (Machine Learning) đã giúp cho việc phân khúc khách hàng trở nên hiệu quả và chính xác hơn bao giờ hết Bằng cách tính toán và chấm điểm (scoring) những chỉ số khách hàng (RFM, CLV, LTV, NPS…) theo dữ liệu đã thu thập được, nhà phân tích và bán lẻ có thể “dán nhãn” (labelling) các nhóm khách hàng theo từng thuộc tính cụ thể tùy thuộc vào mục đích phân tích VD: phân khúc thành các nhóm Champions, Loyal cho đến Hibernating, Lost customers Trong đó, mô hình RFM là một trong những phương pháp được sử dụng rộng rãi nhất Ưu điểm lớn nhất của phương pháp này chính là cung cấp được thông tin chi tiết về khách hàng chỉ với 3 tiêu chí (Lần truy cập gần đây, Tần suất, Tiền tệ) giúp làm giảm độ phức tạp của mô hình phân tích mà không ảnh hưởng đến độ chính xác của nó Ngoài ra, để mô hình có thể hoàn thiện và phân nhóm một cách phù hợp hơn đối với từng bộ dữ liệu, các nghiên cứu gần đây còn kết hợp RFM với phương pháp học máy, điển hình là Onur DOĞAN và cộng sự (2018) đã sử dụng thuật toán K-means giúp phân chia khách 4 hàng thành các cụm (cluster) dựa trên những tính chất chung của khách hàng.

Một số nghiên cứu trước đây

Nghiên cứu phân khúc khách hàng (Customer Segmentation) rất quan trọng Đây là một bài toán được rất nhiều sự quan tâm của các doanh nghiệp Để đạt được hiểu quả tối ưu khi kinh doanh, doanh nghiệp luôn cần xác định phân khúc khách hàng phù hợp với sản phẩm của mình, từ đó chuẩn bị nội dung, thông điệp, chiến lược tiếp thị phù hợp với đối tượng khách hàng mà doanh nghiệp hướng tới RFM là phương pháp thường được sử dụng để phân chia nhóm khách hàng Cho đến hiện tại đã có rất nhiều bài nghiên cứu khoa học, công trình nghiên cứu liên quan đến vấn đề này Trong đó có những nhóm tác giả đến phân khúc khách hàng thông qua mô hình RFM, thuật toán K- means và yếu tố nhân khẩu học,

Dữ liệu khách hàng có thể được phân tích dựa trên nhiều góc nhìn như nhân khẩu học, tâm lý học, đặc điểm tích cách xoay quanh hành vi mua hàng, rủi ro cũng như khả năng sinh lời Một trong những phương pháp phân chia nhóm khách hàng được nhiều nhà nghiên cứu thực hiện nhất đó là dựa trên mô hình RFM, tiêu biểu là You-Shyang Chen và cộng sự (2009) Các giá trị này có thể được kết hợp với nhiều phương 5 pháp hay đặc điểm khác nhằm cho ra kết quả dựa trên góc nhìn đa chiều và chính xác hơn Nhiều nghiên cứu đã thực nghiệm việc ứng dụng khai thác dữ liệu vào phân khúc khách hàng, tuy nhiên nhiều trong số đó phân tích dữ liệu khách hàng từ một góc nhìn chủ quan, thiếu hệ thống thay vì cân nhắc tất cả giai đoạn của mô hình CRM Vì vậy Morteza Namvar và cộng sự (2011) đã xây dựng một phương pháp 6 phân khúc khách hàng hệ thống hơn, dựa trên các mô hình RFM, LTV và các tham số nhân khẩu học Tương tự, Daqing Chen và cộng sự

(2012) 7 đã dựa trên mô hình RFM, phân chia khách hàng thành nhiều cụm bằng thuật toán K-means, sau đó sử dụng thuật toán Decision Tree để ra lọc các cụm và cho ra phân khúc khách hàng, với mục tiêu cung cấp phương pháp tổng quan cho việc sắp xếp và phân khúc khách hàng dựa trên phân tích dữ liệu Abdulkadir Hiziroglu (2013) nhận ra 8 với sự thay đổi nhanh chóng của thị trường, việc đưa ra các chiến lược dựa trên thay đổi hành vi của khách hàng đối với các vấn đề theo thời gian là một thách thức Monireh Hosseini (2015) đã chỉ ra phân tích 9 quan trọng cho thấy việc sử dụng soft-computing trong bài toán phân cụm vẫn đang ở giai đoạn đầu và chưa đủ để khai thác dữ liệu khách hàng Với những phát hiện đó, có thể thấy soft-computing là một phương pháp tiềm năng nhưng vẫn còn nhiều điều cần thực nghiệm để chứng minh tính hiệu quả của nó Để khắc phục, Aryuni và cộng sự

(2018) 10 đã xây dựng mô hình phân nhóm trên dữ liệu hồ sơ khách hàng dựa trên việc họ sử dụng ngân hàng trực tuyến, hai phương pháp phân nhóm được sử dụng là K-means và K-Medoids Hai phương pháp này được sử dụng dựa trên điểm RFM của các giao dịch trực tuyến của khách hàng Với việc so sánh giữa hai phương pháp về hiệu năng đã cho kết quả phương pháp K-means vượt qua phương pháp K-Medoids ở hai tiêu chí (AWC và chỉ số Davies-Bouldin) Cùng vấn đề đó, Onur DOĞAN và cộng sự (2018) sau khi tiến hành thử nghiệm trong lĩnh 11 vực bán lẻ tại Thổ Nhĩ Kỳ đã phát hiện ra rằng phân loại khách hàng chỉ dựa trên chi phí là không đủ Vì vậy, họ đã đề xuất 2 mô hình phân cụm sử dụng RFM (phân cụm hai bước và phân cụm K-means) được kỳ vọng sẽ cung cấp sự hiểu biết khách hàng tốt hơn nhằm đưa ra quyết định hiệu quả hơn Ngoài các nghiên cứu về RFM, Anastasia Griva và cộng sự (2018) đã đề xuất một mô hình mô tả lượt ghé thăm của 12 khách hàng theo danh mục sản phẩm đã mua trong giỏ hàng và xác định ý định mua sắm đằng sau chuyến thăm đó Theo Rodrigo Heldt và cộng sự (2019) , các mô hình RFM được sử dụng rộng rãi trước đó để 13 ước tính giá trị của khách hàng chỉ dựa trên quan điểm của khách hàng mà bỏ qua quan điểm sản phẩm từ đó nhóm tác giả đã đề xuất mô hình RFM trên mỗi sản phẩm (RFM / P) Hiện nay có những công ty tin rằng giảm giá hay khuyến mãi sẽ giữ chân được khách hàng nhưng điều này lại hoàn toàn ngược lại Siti Monalisa và cộng sự (2019) đã 14 tiến hành nghiên cứu để chứng minh dựa trên danh mục đầu tư (CPA) và dựa trên giá trị cuộc sống của khách hàng (CLV); RFM, nhân khẩu học và thuật toán gom cụm Fuzzy C-Means (FCM) là mô hình dùng để phân tích Vì vậy, cũng trong năm đó nhiều nhà nghiên cứu đã thực hiện việc kết hợp RFM cùng các thuật toán khác và thực nghiệm để đánh giá tính hiệu quả của chúng, điển hình là Anitha và Patil (2019) 15 với việc triển khai các nguyên tắc phân khúc tập dữ liệu bằng cách sử dụng Thuật toán K-Means trong việc xác định khách hàng tiềm năng ngành bán lẻ Một phương pháp khác đã được Hansi Chen và cộng sự

(2019) 16 sử dụng chính là dựa trên hình thức sử dụng điện thoại thông minh của khách hàng để đạt được sự thỏa mãn chính xác hơn đối với nhu cầu của khách hàng trong các phân khúc thị trường khác nhau Ngoài ra Jun Wu, Li Shi và cộng sự (2020) cũng đã phân hành vi của 17 khách hàng luôn thay đổi do đó doanh nghiệp cần có một chiến lược tiếp cận khách hàng để dự đoán các hành vi dựa trên phân tích dữ liệu, do đó phương pháp RFM, thuật toán K-means và phương pháp PCA được kết hợp để tiến hành phân cụm khách hàng và phân tích giá trị Một nghiên cứu khác trong nước của Đinh Tiên Minh và Lê Vũ Lan Oanh

(2020) 18 cũng đã sử dụng mô hình RFM, K-means và các yếu tố nhân khẩu học, tâm lý học để phân khúc khách hàng mua sắm ở các trung tâm thương mại Gần đây Hoàng Anh Dũng (2020) đã ứng dụng mô 19 hình phân cụm và phân nhóm PRF (Parallel Random Forest) cùng với kỹ thuật tối ưu hóa song song dữ liệu và xử lý đồng thời để đưa ra khuyến nghị theo phân khúc khách hàng Quá trình này được thực hiện thông qua khai thác Big Data, kết hợp thuật toán học máy K-means và Random Forest, ứng dụng hệ khuyến nghị và kỹ thuật phân tích hành vi khách hàng để cho ra kết quả phù hợp nhất Hồ Trung Thành và Nguyễn Đăng Sơn (2021) cũng đã kết hợp mô hình RFM cùng phương 20 pháp K-means để phân khúc khách hàng và gom cụm được 5 phân khúc khách hàng đặc trưng thông qua thực nghiệm, sau kiểm định cho thấy tính hiệu quả khá cao Tương tự, Christy và cộng sự (2021) cũng 21 đã đề cập đến sử dụng các thuật toán không giám sát như K-Means và Fuzzy C-Means trong nghiên cứu của mình Cùng với đó,

Dr.B.Arivazhagan và Dr.G.Vijaiprabhu (2022) đã kết hợp các giá trị 22 RFM này với dữ liệu nhân khẩu học và phân chia các cụm khách hàng bằng phương pháp Hierarchical Agglomerative trong hai lĩnh vực Ngân Hàng và Viễn Thông - hai lĩnh vực bị ảnh hưởng nhiều bởi giá trị khách hàng Trong bài nghiên cứu của Phan Châu Minh Trường (2022) , phân 23 tích hành vi chủ yếu tập trung vào việc phân khúc khách hàng và sẽ được thực hiện bằng cách sử dụng các kỹ thuật học máy không giám sát ứng dụng vào mô hình RFM để khám phá hành vi khách hàng, để hiểu từng phân khúc khách hàng cụ thể Một nghiên cứu mới nhất trong nước, Đỗ Vĩnh Trúc (2022) đã nhận thấy sự không tường minh 24 của các biến R,F,M nên đã làm rõ quy trình phân khúc khách hàng để các tổ chức có thể cải thiện các hoạt động tiếp thị của mình bằng hương pháp tính CLV để bán các dịch vụ hay sản phẩm tốt nhất tiếp theo của họ cho nhóm khách hàng có giá trị hơn, bằng cách tính toán toàn bộ giá trị lâu dài của khách hàng.

PHƯƠNG PHÁP THỰC NGHIỆM 25 25 25 25 25 3.1 Thu thập dữ liệu

Về công ty AdventureWorks Cycles

Về công ty AdventureWorks Cycles, đây là một công ty hoạt động trong lĩnh vực bán lẻ xe đạp, thị trường của công ty bao gồm nhiều khu vực trên thế giới, như khu vực Bắc Mỹ, Châu Âu và cả Châu Á Công ty có trụ sở chính ở Bothell, Washington với 290 nhân viên.

Kết thúc 1 năm tài chánh thành công, công ty AdventureWorks Cycles đang tìm cách mở rộng thị phần bằng cách tập trung vào các hoạt động bán hàng cho các khách hàng quan trọng nhất của họ, mở rộng thông tin sản phẩm thông qua hệ thống Website đồng thời tiết giảm chi phí bán hàng bằng cách giảm chi phí sản xuất.

Mô tả bộ dữ liệu

Về bộ dữ liệu AdventureWorks:

Bộ dữ liệu chứa các giao dịch bán hàng của công ty từ ngày 1/7/2017 đến ngày 15/6/2020 Bộ dữ liệu chứa các dữ liệu lớn về:

- Sales Order: Chứa dữ liệu về các kênh bán hàng (Channel) của Công ty gồm: trực tiếp (Reseller), hay kênh bán hàng qua mạng (Internet); Mã đơn hàng (Sales Order) và dữ liệu chi tiết về mã các món hàng trong một đơn hàng (Sales Order Line, SalesOrderLineKey).

- Sales Territory: Chứa dữ liệu về các vùng lãnh thổ mà Công ty hoạt động gồm các cột dữ liệu về Vùng (Region), Quốc gia (Country), Nhóm (Group).

- Sales: Chứa các dữ liệu bán hàng của công ty như: Dữ liệu chi tiết các món hàng trong đơn hàng (Sales Order Line); dữ liệu bán hàng của kênh bán hàng cho đơn hàng (Reseller); Mã khách hàng (Customer); Ngày mua hàng (Order Day); Ngày đáo hạn (Due Date); Ngày giao hàng (Ship Day); Bán hàng theo vùng lãnh thổ ( Sales Territory); Số lượng bán hàng (Order Quantity); Giá trên đơn vị sản phẩm (Unit Price); Khoảng giảm giá (Unit Price Discount Pct); Tổng doanh thu đối với hóa đơn (Sales Amount).

- Reseller: Dữ liệu về kênh bán hàng Reseller, gồm có: ResellerID; loại danh nghiệp (Business Type); Thành phố (City); Tỉnh (State-Province); Khu vực quốc gia ( Country-Region); Mã vùng (Postal Code).

- Date: Dữ liệu về ngày; tháng năm giao dịch (Date, Month, Full Date); năm tài chính, quý tài chính (Fiscal Year, Fiscal Quarter).

- Product: Dữ liệu về mã sản phẩm (ProductKey, SKU); Thuộc tính sản phẩm (Product); Giá tiêu chuẩn (Standard Cost); Màu sắc (Color); Danh sách giá (List Price); Model; Danh mục phụ (Subcategory); Danh mục (Category).

- Customer: Dữ liệu về khách hàng như: Mã khách hàng (Customer ID); Tên khách hàng (Customer); Thành phố khách hàng sống (City); Tỉnh khách hàng sống (State-Province), Khu vực quốc gia khách hàng sống (Country-Region); Mã vùng của khách hàng (Postal Code).

Trong bài nghiên cứu này chúng tôi tập trung sử dụng các loại dữ liệu sau: Sales Order (Dữ liệu về đơn mua hàng của khách hàng với hơn 121,254 dòng dữ liệu) để tính điểm cho nhân tố Frequency, Order Date (Dữ liệu về ngày mua hàng của khách hàng, với hơn 121,254 dòng dữ liệu bắt đầu từ ngày 1/7/2017 đến ngày 15/6/2020) để tính điểm cho nhân tố Recency, Sales Amount (Tổng tiền đơn hàng của khách hàng, với hơn 121,254 dòng dữ liệu về tổng số tiền của các giao dịch, đơn vị Đô-la ($) cho nhân tố Monetary.

Bảng 3 1: Bảng mô tả dữ liệu của Sales

SalesOrderLineKey Mã chi tiết các dòng sản phẩm liên quan trong mỗi đơn hàng ResellerKey Mã nhà bán lẻ của công ty Adventure Works

OrderDateKey Ngày đặt đơn hàng

DueDateKey Ngày đáo hạn đơn hàng của khách hàng

ShipDateKey Ngày giao hàng đơn hàng của khách hàng

SalesTerritoryKey Mã lãnh thổ bán hàng

Order Quantity Số lượng đơn đặt hàng

Unit Price Giá trên đơn vị sản phẩm

Extended Amount Giá của số sản phẩm khách hàng mua (Giá trên đơn vị sản phẩm x số sản phẩm) Unit Price Discount

Pct Giảm giá trên mỗi đơn vị sản phẩm

Cost Chi phí tiêu chuẩn của sản phẩm

Total Product Cost Tổng chi phí sản phẩm

Sales Amount Doanh thu đơn hàng

Bảng 3 2: Bảng mô tả dữ liệu của Sales Order

Channel Kênh bán hàng (Reseller hay Internet)

Mã chi tiết các dòng sản phẩm liên quan trong mỗi hóa đơn

Sales Order Mã đơn hàng

Mã chi tiết các dòng sản phẩm liên quan trong mỗi đơn hàng

Bảng 3 3: Bảng mô tả dữ liệu của Customer

Customer ID Mã khách hàng

Customer Tên khách hàng đặt đơn hàng

City Thành phố nơi khách hàng sống

State-Province Bang - Tỉnh nơi khách hàng sống

Country-Region Quốc gia - Khu vực nơi khách hàng sinh sốngPostal Code Mã bưu chính (mã bưu điện)

Tiền xử lý dữ liệu

3.2.1 Lựa chọn các thuộc tính

Nhằm kiểm chứng tính hiệu quả của phương pháp, nhóm tác giả đã tiến hành thực nghiệm trên bộ dữ liệu (dataset) của công ty bán lẻ xe đạp AdventureWorks với hơn 121,254 dòng dữ liệu giao dịch phát sinh từ ngày 01/07/2017 đến ngày 15/06/2022 cùng đầy đủ các thuộc tính cần thiết cho việc thiết lập mô hình RFM Ngoài ra, tập dữ liệu này đã cho thấy một số lượng không nhỏ nhà bán lẻ cũng là khách hàng của công ty.

Hình 3 2: Tập dữ liệu công ty AdventureWorks (Nguồn: Nhóm tác giả)

Như những gì thể hiện trên Hình 3.2, có thể thấy tập dữ liệu của công ty AdventureWorks chứa rất nhiều những thuộc tính khác nhau Mỗi thuộc tính đều biểu hiện một giá trị dạng số hay phi số nào đó của giao dịch như đơn giá, tổng tiền, mã khách hàng, mã đơn hàng… và không phải dữ liệu nào cũng có thể giúp để thiết lập nên mô hình RFM

Vì vậy, trước khi đi vào tính toán các giá trị R, F, M, nghiên cứu đã tiến hành quan sát và sàng lọc để tìm ra các thuộc tính cần thiết trong bộ dữ liệu đồ sộ trên và tập trung khai thác vào các thuộc tính sau: CustomerKey (khóa khách hàng), OrderDateKey (khóa ngày đặt hàng), Sales Order (đơn đặt hàng) và Sales Amount (tổng tiền bán ra).

Hình 3 3: Chọn lọc các thuộc tính cần thiết để tính toán giá trị R, F, M (Nguồn:

Nhóm tác giả) Giải thích cho việc lựa chọn các thuộc tính này: thứ nhất, mục đích hàng đầu của nghiên cứu chính là phân khúc khách hàng (Customer Segmentation) vì vậy việc đầu tiên cần phải làm chính là định danh được từng khách hàng, do đó nghiên cứu này sẽ sử dụng CustomerKey làm khóa chính và phân tích những yếu tố xung quanh nó, mỗi một khách hàng chỉ có duy nhất một CustomerKey riêng và phân biệt với các khách hàng còn lại; thứ hai, để tính được giá trị Recency thì nhân tố không thể thiếu đó là OrderDateKey giúp biết được thời gian đơn hàng phát sinh nhằm xác định được số ngày kể từ thời điểm xảy ra lần giao dịch gần nhất cho đến hiện tại; thứ 3, thuộc tính Sales Order được đưa ra để tính giá trị Frequency, Frequency sẽ bằng tổng số lượt Sales Order phát sinh tương ứng với từng khách hàng riêng biệt; cuối cùng nhưng không thể thiếu, để xác định được nhân tố Monetary, thuộc tính Sales Amount cần phải được đề cập để tính toán tổng số tiền mà một khách hàng cụ thể đã bỏ ra để mua sản phẩm của công ty.

Làm sạch dữ liệu là quá trình sửa hoặc xóa dữ liệu không chính xác, dữ liệu sai định, trùng lặp hoặc không đầy đủ trong tập dữ liệu Khi kết hợp nhiều nguồn dữ liệu, có nhiều khả năng dữ liệu bị trùng lặp hoặc bị gán nhãn sai Nếu dữ liệu không chính xác, kết quả của mô hình sẽ bị ảnh hưởng nên việc làm sạch dữ liệu là điều vô cùng cần thiết.

Bộ dữ liệu được làm sạch bằng cách xóa những dữ liệu trùng lặp và những dữ liệu không liên quan Trong quá trình thu thập dữ liệu của doanh nghiệp, việc trùng lặp dữ liệu và phát sinh những dữ liệu không liên quan là điều không thể tránh khỏi Với bộ dữ liệu ta có , cần phải đảm bảo những điều kiện sau:

- Cột dữ liệu Sales Order: kiểu dữ liệu String

- Cột dữ liệu OrderDateKey: kiểu dữ liệu Số

- Cột dữ liệu Amount: kiểu dữ liệu Số thập phân

Lỗi cấu trúc xảy ra khi đo lường hoặc truyền dữ liệu và nhận thấy các quy ước đặt tên lạ, lỗi chính tả hoặc viết hoa không chính xác Ở bước này cần đảm bảo một số điều kiện sau:

- Thuộc tính Sales Order - gồm chữ viết hoa và số

- Thuộc tính OrderDateKey - độ dài chuỗi bằng 8

Xem xét các giá trị ngoại lệ: Với dữ liệu đã được tùy chọn thuộc tính, thuộc tính SalesAmount là trường dữ liệu định lượng có thể tìm ẩn những giá trị ngoại lai không phù hợp Vì vậy có thể xem xét trường dữ liệu này qua các trị số thống kê mô tả và sơ đồ boxplot.

Hình 3 4: Thống kê mô tả thuộc tính Sales Amount (Nguồn: Nhóm tác giả) Một số điểm dữ liệu có giá trị lớn hơn 3000 có mức độ chênh lệch khá lớn Tuy nhiên các giá trị này có ý nghĩa phù hợp với giá trị sản phẩm và số lượng mua của khách hàng Vì vậy các giá trị này nên được giữ lại nhưng cần thảo luận riêng đối với kết quả phân cụm liên quan đến các giá trị ngoại lai này.

Xử lý dữ liệu bị thiếu

Hình 3 5: Số giá trị bị thiếu của từng thuộc tính (Nguồn: Nhóm tác giả) Tùy theo hiểu biết về bộ dữ liệu và tỉ trọng của lượng dữ liệu bị thiếu so với tổng thể, có thể loại bỏ hoặc thay thế dữ liệu bị thiếu để đảm bảo độ chính xác của dữ liệu Với bộ dữ liệu hiện có, thuộc tính đã được hoàn chỉnh và các điểm dữ liệu không bị thiếu.

Sau khi đã thu thập, sàng lọc và làm sạch đầy đủ các dữ liệu cần thiết, ở bước tiếp theo, nhóm tác giả sẽ tiến hành chuyển hóa dữ liệu (Data Transformation).

Chuyển hóa dữ liệu là quá trình biến đổi hình thức, cấu trúc hoặc giá trị của dữ liệu nhằm tổ chức dữ liệu một cách trực quan, hiệu quả hơn Bước này giúp tạo nên một tập dữ liệu dễ dàng sử dụng hơn đối với cả con người lẫn máy tính vì nó chứa đủ các thuộc tính, dữ liệu cần thiết cho việc phân tích, không thừa, không thiếu Từ đó, trong quá trình phân tích sẽ giúp hạn chế tối đa vấn đề bị nhiễu thông tin do thừa dữ liệu hoặc thiếu hụt thông tin dẫn tới việc không thể tính toán hoặc tính toán ra các giá trị một cách kém chính xác và thiếu hiệu quả Khi nói đến việc chuyển hóa dữ liệu trong quy trình thiết lập mô hình RFM ở bài báo này, nghĩa là nói về việc tính toán các giá trị Recency, Frequency và Monetary dựa trên những dữ liệu đã có.

Recency là khoảng thời gian (ngày) tính từ lần giao dịch gần nhất mà khách hàng phát sinh đối với công ty vì vậy thuộc tính phù hợp cho việc tính toán giá trị này sẽ là OrderDateKey Trước khi đi vào xác định

R, nhóm tác giả thực hiện định dạng lại cột dữ liệu OrderDateKey sang hình thức “Year-Month-Day” và gộp các CustomerKey trùng lặp lại với nhau để tính toán theo từng khách hàng Tiếp đến, mốc thời gian được xác định trong bài báo là ngày mua gần nhất của tập dữ liệu, sau đó dùng mốc trừ đi ngày mua hàng gần nhất của từng khách hàng (là giá trị Max của cột OrderDateKey) để cho ra được giá trị Recency tương ứng như trong Hình 3 6.

Hình 3 6: Giá trị Recency (Nguồn: Nhóm tác giả)Frequency - Tần suất mua hàng của khách hàng là chỉ số cần xác định tiếp theo Chỉ số này thường được các doanh nghiệp có dịch vụ, sản phẩm có giá trị lợi nhuận thấp quan tâm, vì họ chỉ có thể tồn tại nếu khách hàng sử dụng dịch vụ của họ một cách thường xuyên, VD: đặt xe Grab, mua một chai nước uống… Giá trị Frequency chính là số lần mua hàng của khách hàng, giá trị này được đưa ra dựa trên việc đếm số lượng Sales Order mà một khách hàng (tương ứng với một CustomerKey) tạo ra.

Hình 3 7: Giá trị Frequency (Nguồn: Nhóm tác giả)

Thiết lập mô hình RFM

3.3.1 Tính điểm RFM tổng thể

Sau khi hoàn thành việc tính 3 giá trị R, F, M, bài báo đã tiến hành tính điểm từng chỉ số Ở bước tiếp theo, nhóm tác giả thực hiện phân cấp khách hàng bằng phương pháp phân tổ dữ liệu, số cụm được chọn là 5 để thuận tiện cũng như khách quan cho việc đánh giá và phân nhóm khách hàng được phù hợp Để có thể phân tổ dữ liệu thành 5 tổ, nhóm tác giả tiến hành tính độ dài từng khoảng (h) như sau:

Trong đó Max và Min lần lượt là giá trị lớn nhất và nhỏ nhất của từng cột dữ liệu R, F, M Sau khi thực hiện đã cho ra giá trị của các mốc 20%, 40%, 60%, 80% của từng giá trị như sau:

Hình 3 10: Giá trị các mốc của R, F, M (Nguồn: Nhóm tác giả) Khi đã có kết quả tính điểm từng nhân tố R (Recency), F (Frequency) và M (Monetary) ở bước trước, nhóm tác giả sẽ tiến hành gộp điểm R, F, và M (Concatenate RFM) của từng khách hàng lại với nhau để phục vụ cho việc phân khúc khách hàng.

Hình 3 11: Nối điểm RFM (Nguồn: Nhóm tác giả)

Kết quả thu được sau bước này là mỗi khách hàng sẽ có một tổ hợp điểm kết hợp R, F, và M tương ứng với hành vi mua hàng của mình.

Tổ hợp điểm này sẽ được sử dụng ở bước dán nhãn (Labelling), mỗi tổ hợp điểm với một điều kiện nhất định sẽ được gán cho một nhãn tương ứng để phân biệt giữa các nhóm khách hàng đặc trưng.

3.3.2 Phân cụm và dán nhãn nhóm khách hàng

Bước cuối cùng của quy trình phân khúc khách hàng đó chính là việc dán nhãn (Labelling) để phân biệt những nhóm khách hàng khác nhau tương ứng với từng tính chất, đặc trưng riêng biệt của mỗi nhóm Việc gán nhãn cho mỗi nhóm khách hàng sau khi chấm điểm (Scoring) là vô cùng quan trọng bởi điều này sẽ giúp cho việc nhận biết và đưa ra các chính sách phù hợp đối với từng nhóm trở nên thuận tiện và chính xác hơn Tuy chỉ là một bước định danh cơ bản nhưng dán nhãn không chỉ giúp nhà bán lẻ tiết kiệm được thời gian, chi phí mà lại còn hiệu quả hơn trong việc đánh giá khách hàng thay vì phải nhìn vào từng cột điểm RFM như 514, 351, 222,… một cách rắc rối và khó khăn khi phải mất thêm một bước để đánh giá xem khách hàng là ai, cần gì và chiến dịch marketing với họ như thế nào, liệu họ có phải là khách hàng V.I.P hay thậm chí họ thuộc nhóm đang có nguy cơ rời bỏ sản phẩm/dịch vụ của công ty.

Việc đặt tên nhãn còn cần phải biết sử dụng từ ngữ thật dễ hiểu dựa trên đặc trưng của các nhóm khách hàng, thể hiện rõ tính chất riêng biệt của từng nhóm Bài báo này sử dụng 10 nhãn tương ứng cho các nhóm khách hàng của công ty từ chỉ số RFM đã tính được bao gồm:

- Nhà vô địch (Champions): Nhóm khách hàng mua gần đây, thường xuyên và chi nhiều nhất.

- Khách hàng trung thành (Loyal): Chi tiêu nhiều và thường xuyên, sẵn sàng thúc đẩy cho công ty.

- Khách hàng trung thành tiềm năng (Potential Loyalist): Những khách hàng gần đây với tần suất mua hàng nằm ở mức trung bình.

- Khách hàng mới (New Customers): Khách hàng đã mua gần đây nhất, nhưng không thường xuyên.

- Khách hàng kỳ vọng (Promising): Những khách hàng mua sắm gần đây, nhưng chưa chi tiêu nhiều.

- Cần sự chú ý (Need Attention): Điểm RFM trên trung bình; có thể đã không mua gần đây.

- Sắp ngủ (About To Sleep): Nhóm khách hàng có số điểm R, F dưới trung bình; sẽ để mất nếu không được kích hoạt lại.

- Có rủi ro (At Risk): Những người đã chi số tiền lớn và mua thường xuyên nhưng điều này đã lâu, cần phải mang những khách hàng này trở lại.

- Không thể để mất (Can't Lose Them): Những khách hàng thực hiện các giao dịch mua lớn nhất và thường xuyên nhưng đã lâu không quay trở lại Thường rơi vào các outliers.

- Ngủ đông (Hibernating): Lần mua hàng cuối cùng đã lâu, chi tiền ít và tần suất mua hàng cũng ít tương tự.

- Đã đánh mất (Lost Customers): Những khách hàng đã thực sự rời bỏ công ty.

Các bước để gán nhãn cho nhóm khách hàng: Đầu tiên, nghiên cứu này sẽ lấy dữ liệu đã chấm điểm RFM tổng thể để bắt đầu dán nhãn nhưng nhóm tác giả sẽ loại trừ điểm M và chỉ sử dụng điểm R và F để thực hiện Lý do cho việc này là bởi sự phức tạp nếu sử dụng mô hình 3D trên điểm RFM, do đó chỉ sử dụng điểm R và F để vẽ bản đồ 2D.

Nhóm khách hàng có điểm R và F lần lượt như sau sẽ được gán một nhãn tương ứng:

Mỗi nhãn (Label) sau đó được dùng để phân biệt giữa các nhóm khách hàng với nhau Sau khi dán nhãn, nhà bán lẻ có thể dễ dàng nhận biết một khách hàng cụ thể thuộc nhóm nào, từ đó công ty sẽ có các chiến lược chăm sóc cũng như marketing phù hợp đối với từng nhóm khách hàng riêng biệt, giúp giữ chân, tăng độ hài lòng của khách hàng và góp phần đem về một lượng lớn doanh thu.

Kết quả thu được sau khi dán nhãn thể hiện qua hình dưới đây:

Hình 3 12 : Dữ liệu sau khi được dán nhãn (Nguồn: Nhóm tác giả)Mỗi nhãn (Label) sau đó được dùng để phân biệt giữa các nhóm khách hàng với nhau Sau khi dán nhãn, nhà bán lẻ có thể dễ dàng nhận biết một khách hàng cụ thể thuộc nhóm nào, từ đó công ty sẽ có các chiến lược chăm sóc cũng như marketing phù hợp đối với từng nhóm khách hàng riêng biệt, giúp giữ chân, tăng độ hài lòng của khách hàng và góp phần đem về một lượng lớn doanh thu.

KẾT QUẢ THỰC NGHIỆM VÀ THẢO LUẬN 40 40 40 40

Kết quả nghiên cứu

Nhằm hỗ trợ cho việc quan sát và đưa ra các nhận định một cách chính xác hơn, nhóm nghiên cứu đã tiến hành trực quan hóa dữ liệu bằng biểu đồ và cho ra được kết quả độ phân tán của các giá trị R, F và

M lần lượt như trên các hình 4.1, 4.2 và 4.3 Qua các kết quả được thể hiện trên biểu đồ, có thể thấy rằng độ phân tán của cả 3 giá trị R, F và

M đều có xu hướng lệch phải.

Hình 4 1 Biểu đồ thể hiện độ phân tán của Recency (Nguồn: Nhóm tác giả) Đối với chỉ số Recency, biểu đồ lệch phải đã chứng tỏ rằng các khách hàng chủ yếu mua trong thời gian gần đây Sở dĩ điều này xảy ra có thể là do công ty còn trẻ hoặc vừa mới trở lại thị trường hoặc vừa tham gia vào thị trường cho nên đa số vẫn là khách hàng mới với thời gian mua gần nhất có số yếu vị ở khoảng dưới 50 ngày.

Hình 4 2: Biểu đồ thể hiện độ phân tán của Frequency (Nguồn: Nhóm tác giả) Tương tự với Recency, chỉ số Frequency cũng lệch phải cực kỳ nhiều khi giá trị chiếm đa số là 1 lần mua và cũng là giá trị thấp nhất của thuộc tính này Điều đó càng làm khẳng định thêm cho nhận định

“doanh nghiệp chỉ mới bước vào thị trường không lâu” và “đa số khách hàng vẫn còn mới” với rất nhiều tiềm năng chưa khai thác và số lần mua hàng là tương đối ít.

Hình 4 3: Biểu đồ thể hiện độ phân tán của Monetary (Nguồn: Nhóm tác giả) Đi kèm với hai giá trị R và F, giá trị còn lại là M (Monetary) cũng có nét tương đồng và thể hiện những kết quả tương đối giống khi số tiền mà đa số khách hàng bỏ ra còn ít và đa số khách hàng lựa chọn mua sản phẩm giá thấp (2.29 đô-la) với rất ít lần mua (mua 1 lần là chủ yếu).Về kết quả của bước dán nhãn, nhóm nghiên cứu đã phân tích ra được 4 nhóm khách hàng riêng biệt tương ứng với từng tính chất đặc trưng cho mỗi nhóm và được dán các nhãn phù hợp như: Promising, New Customers, Hibernating và About to sleep với tỷ lệ khách hàng tương ứng cho mỗi nhóm lần lượt là 30.9%, 66.4%, 1.8% và 0.7% Ngoài ra còn xuất hiện thêm 2 nhóm là Champions (0.1%) và Potential Loyalist (0.1%) song do kích thước của 2 nhóm này quá nhỏ so với tổng thể nên sẽ được gộp chung vào nhóm New Customers để có một kết quả đúng đắn hơn trong trường hợp tổng quan bởi vì cả 3 nhóm này đều là tập hợp của những khách hàng có xu hướng mua từ khá nhiều cho đến nhiều lần với tổng số tiền khá lớn và lần cuối cùng mua rất gần thời điểm mốc của nghiên cứu.

Hình 4 4: Biểu đồ thể hiện kích thước mỗi nhóm (Nguồn: Nhóm tác giả)Qua quá trình nghiên cứu, nhóm tác giả đã phân tích và đề xuất một mô hình phân tích khách hàng ứng dụng phương pháp RFM và dãn nhãn các nhóm khách hàng thực nghiệm trên bộ dữ liệu của công ty

AdventureWorks trong lĩnh vực bán lẻ xe đạp Về cơ bản, nghiên cứu đã hoàn thành được các mục tiêu đề ra ở chương 1, thành công trong việc tìm hiểu các lý thuyết về hành vi khách hàng và phân tích phân khúc khách hàng cũng như các kiến thức được đề cập trong các bài nghiên cứu liên quan mà nhóm đã tham khảo Ngoài ra, không chỉ đóng góp về mặt lý thuyết, nghiên cứu này còn cung cấp thêm các công cụ giúp cho quá trình phân khúc khách hàng được hiệu quả hơn, từ đó giúp các nhà phân tích và nhà bán lẻ có khả năng thấu hiểu khách hàng nhằm đưa ra các chiến dịch marketing cũng như chăm sóc khách hàng phù hợp với từng phân khúc.

Thảo luận

Bài nghiên cứu đã cho ra được kết quả phân khúc khách hàng gồm 4 nhóm khác nhau là: Promising, New Customers, Hibernating và About to sleep Thông qua phân tích, nhóm tác giả đã tìm ra được các đặc trưng của từng nhóm.

4.2.1 Phân tích nhóm khách hàng hứa hẹn (Promising)

Hình 4 5: Mô tả tứ phân vị của nhóm Promising (Nguồn: Nhóm tác giả)Dựa vào mô tả tứ phân vị của nhóm khách hàng hứa hẹn (Promising) ở Hình 4.6 đã cho thấy được kích thước của nhóm này là

5645 khách hàng, chiếm 30.9% trong tổng số khách hàng xuất hiện trong tập dữ liệu gốc Qua đánh giá các tham số đặc trưng và tứ phân vị có thể suy ra một vài đặc trưng chủ yếu của nhóm khách hàng này Đây là nhóm có tỷ lệ lần mua hàng gần nhất đứng thứ hai với giá trị trung bình khoảng 285 ngày, chỉ sau nhóm khách hàng mới Thêm vào đó, chỉ số Frequency – tần suất mua hàng của nhóm này thuộc vào mức trung bình khá so với tổng thể (trung bình ở mức 1.3), kết hợp giữa hai thuộc tính cho thấy khả năng quay trở lại của nhóm này là rất cao Ngoài ra, tổng số tiền mà nhóm này đem lại cho doanh nghiệp cũng chiếm phần đa, lên tới 27.4% (Hình 4.7), chiếm vị trí thứ hai trên tổng thể tất cả các phân khúc cho thấy lợi ích mà nhóm này đem lại đối với doanh nghiệp là rất lớn Tuy nhiên, nếu xét theo góc độ cá nhân thì những khách hàng trong nhóm này chưa thực sự sẵn sàng chi tiền cho doanh nghiệp khi mức chi trung bình chỉ đạt khoảng 1424 đô-la, thấp nhất trong các phân khúc.

Từ các đặc điểm về Recency, Frequency và Monetary ta có thể thấy, đây không chỉ là nhóm khách hàng có khả năng quay trở lại cực kỳ cao mà còn là một trong 2 nhóm đem lại nguồn doanh thu khủng nhất cho doanh nghiệp Vì vậy, doanh nghiệp cần phải có chiến lược thu hút đúng nhu cầu đối với nhóm này, đặc biệt là các chiến lược về giá và sản phẩm như tạo ra đa dạng các phân khúc sản phẩm với mức giá phù hợp túi tiền người mua để khách hàng có thể dễ dàng lựa chọn hay đưa ra nhiều khuyến mãi nhằm khuyến khích khách hàng chi tiền.

Hình 4 6: Tỷ lệ chi tiêu của từng nhóm khách hàng (Nguồn: Nhóm tác giả)

4.2.2 Phân tích nhóm khách hàng mới (New

Customers) Đối với nhóm khách hàng mới, họ là những người có lần mua hàng gần đây nhất đứng đầu tiên trong tất cả các phân khúc với trung bình Recency đạt mức chỉ khoảng 101 ngày như kết quả ở Hình 4.8 cho thấy tiềm năng thu hút đối với nhóm khách hàng này là cực kỳ cao Các giá trị tần suất mua hàng (Frequency) ở nhóm này là khá lớn, đây là một điều đáng ngạc nhiên bởi vì tuy thuộc vào nhóm khách hàng mới đối với doanh nghiệp, nhưng số lần mua hàng của họ lại chiếm cao nhất trong cả 4 nhóm khách hàng với chỉ số trung bình là 1.5 (chưa tính gộp 2 nhóm Champions và Potential Loyalists) Điều này sẽ tạo nên một sự tập trung cực kỳ lớn của doanh nghiệp hướng đến nhóm khách hàng này.

Hình 4 7: Mô tả tứ phân vị của nhóm khách hàng mới (Nguồn: Nhóm tác giả) Không chỉ thế, khi xét đến giá trị Monetary thì nhóm này vẫn chiếm ưu thế khi góp đến 67.9% tổng số tiền công ty thu được (Hình 4.7) – hơn một nửa số doanh thu của doanh nghiệp, một kết quả hết sức bất ngờ Nếu chỉ đánh giá dựa trên nhận định chủ quan mà không phân khúc khách hàng dựa trên dữ liệu, khả năng cao doanh nghiệp sẽ bỏ qua vấn đề này, làm doanh thu không đạt được mức tối ưu Giải thích cho điều này có thể là do doanh nghiệp vẫn còn mới, dẫn đến đa số khách hàng sẽ thuộc vào nhóm “New Customers” và vì lẽ đó phần lớn nguồn doanh thu của doanh nghiệp cũng đến từ nhóm này Tuy nhiên, nếu xét theo giá trị trung bình thì tổng số tiền mà mỗi khách hàng thuộc nhóm này đem lại cho doanh nghiệp vẫn còn tương đối thấp Ngoài ra, đây còn là nhóm chiếm số lượng lớn nhất trong tập dữ liệu với 12,341 khách hàng chiếm 66.4% toàn bộ Với kết quả phân tích như trên có thể đưa ra khuyến nghị rằng các nhà bán lẻ nên tập trung xây dựng chính sách tiếp thị và chăm sóc nhóm khách hàng mới này thật tốt để xây dựng thương hiệu ngay từ đầu, tạo ảnh hưởng tốt để doanh nghiệp phát triển và là tiền đề thu hút một lượng lớn khách hàng mới, biến những khách hàng hiện có trong nhóm này dần trở thành nhóm khách hàng trung thành Những chính sách mà nhà bán lẻ nên tham khảo để áp dụng cho nhóm khách hàng mới bao gồm: Sử dụng KOLs, KOCs; Truyền thông truyền miệng; Truyền thông trên các nền tảng mạng xã hội, internet; Tạo dựng thương hiệu ngay từ ban đầu; Có các dịch vụ, khuyến mãi độc đáo, gây ấn tượng…

4.2.3 Phân tích nhóm khách hàng sắp ngủ (About to sleep)

Hình 4 8: Mô tả tứ phân vị của nhóm khách hàng sắp ngủ (Nguồn: Nhóm tác giả)

Theo như những số liệu thể hiện trên Hình 4.9, nhóm khách hàng sắp ngủ (About to sleep) chiếm tỷ lệ không quá lớn trong tổng thể, chỉ khoảng 1.8% tương ứng với 132 khách hàng Trung bình của giá trị Recency của nhóm này cũng tương đối cao (khoảng 518 ngày – hơn 17 tháng) cho thấy độ trung thành của khách hàng đã giảm đi đáng kể và lần mua hàng gần nhất của các khách hàng thuộc nhóm này đã xảy ra khá lâu Một chỉ số còn lại là tần suất mua hàng đến từ nhóm này cũng không có gì nổi bật, hay thậm chí là không đem lại giá trị đáng kể cho doanh nghiệp khi chỉ số trung bình của Frequency là 1 bằng với min (giá trị thấp nhất) của chỉ số này Tuy vậy, tổng số tiền trung bình mà nhóm sắp ngủ đem đến cho doanh nghiệp lại là điểm sáng khi nằm ở mức hơn 1850 đô-la, cao hơn so với trung bình tổng thể Từ những đặc điểm đó, doanh nghiệp có thể đưa ra các chính sách phù hợp hơn nhằm tiếp thị các sản phẩm đến nhóm khách hàng này một cách hiệu quả nhưng vẫn cần cân nhắc những yếu tố khác Nói như vậy là vì mặc dù khách hàng đã từng chi trả một lượng tiền lớn nhưng đã rất lâu không quay lại, khả năng rời bỏ của nhóm này là cực kỳ cao và có khả năng mang đến nhiều rủi ro cho doanh nghiệp khi tiếp cận sai đối tượng.

4.2.4 Phân tích nhóm khách hàng ngủ đông

Nhóm khách hàng cuối cùng trong phân tích phân khúc khách hàng của bài nghiên cứu này chính là nhóm khách hàng ngủ đông (Hibernating) Cũng tương tự như nhóm sắp ngủ, nhóm ngủ đông có 2 chỉ số Recency và Frequency không mấy nổi bật hay thậm chí là khá kém so với tất cả các phân khúc còn lại Như Hình 4.9 cho thấy, trung bình giá trị Recency ở nhóm này là cực kỳ lớn – hơn 907 ngày hay nói cách khác là những khách hàng trong nhóm này đã không quay trở lại trong vòng hơn 30 tháng gần nhất – một thời gian vô cùng lâu, lớn nhất trong các phân khúc Và trung bình tần suất mua hàng cũng bằng với trung bình tần suất ở nhóm sắp ngủ - mang giá trị 1 (giá trị thấp nhất) Cũng giống như nhóm sắp ngủ, nhóm ngủ đông có chỉ số Monetary trái ngược hoàn toàn so với 2 chỉ số còn lại khi có giá trị trung bình là hơn 3199 đô-la, đây là nhóm có tổng số tiền trung bình mà một khách hàng chi tiêu cho công ty mang giá trị lớn nhất.

Hình 4 9: Mô tả tứ phân vị của nhóm khách hàng ngủ đông (Nguồn: Nhóm tác giả)

Khi đánh giá các chỉ số R, F, M mà nhóm khách hàng ngủ đông (Hibernating) mang lại, doanh nghiệp và các nhà phân tích cần suy xét rất kĩ để có thể đưa ra được một chính sách phù hợp nhất cho từng thời điểm và từng bối cảnh khác nhau, tránh đánh mất các khách hàng V.I.P.

Vì đây vừa có thể là nhóm khách hàng với tỷ lệ rời bỏ doanh nghiệp cao nhất, vừa có thể bao gồm những khách hàng V.I.P tuy mua hàng với tần suất thấp nhưng số tiền mà họ bỏ ra thì lại cực kỳ khổng lồ. Qua kết quả phân tích về các nhóm khách hàng mà bài nghiên cứu đã phân khúc được, nhóm nghiên cứu đã thảo luận và đưa ra một số ý kiến như sau:

Thứ nhất, doanh nghiệp nên tập trung vào nhóm khách hàng có độ trung thành cao và nguồn lợi mà nhóm đó đem lại lớn hay nói cách khác là hai nhóm Promising và New Customers Lý giải cho điều đó là vì những khách hàng này có chỉ số R, F, M được thể hiện rất tốt, khả năng quay trở lại là cực kỳ cao và doanh nghiệp cần chú trọng để biến họ thành nhóm khách hàng trung thành Mặc dù vậy, nếu muốn giới hạn lại phạm vi và xác định rõ được nên ưu tiên phát triển chính sách cho nhóm nào, nhóm nghiên cứu sẽ cần tiến hành phân tích kết hợp thêm các giá trị CLV, CR hoặc RR và các dữ liệu về nhân khẩu học và tâm lý học khách hàng để kết quả thể hiện được chính xác hơn.

Thứ hai, để vận dụng được tối đa nguồn lực một cách tối ưu nhất, doanh nghiệp không thể nào đẩy mạnh phát triển chiến lược cho tất cả các nhóm mà phải có sự “ưu tiên” vào các nhóm quan trọng, đồng thời

“hạn chế quan tâm” các nhóm ít tiềm năng và tỷ lệ rời bỏ cao Cụ thể đối với trường hợp trong nghiên cứu này, doanh nghiệp cần ít chú trọng đối với các nhóm khách hàng có xu hướng rời bỏ cao như nhóm About to sleep và Hibernating Tuy nhiên, không nên bỏ qua hoàn toàn mà vẫn cần phân tích thêm các yếu tố khác để đưa ra được kết luận cuối cùng bởi vì dù hai nhóm này không quay lại và mua hàng thường xuyên, thế nhưng số tiền mà họ bỏ ra là cực kỳ lớn cho mỗi lần mua và vẫn có khả năng những khách hàng V.I.P đang thuộc vào các nhóm này.

Tiêu đề	Phân khúc khách hàng trong lĩnh vực bán lẻ xe đạp ứng dụng mô hình RFM kết hợp phương pháp học máy phân cụm K-means
Tác giả	Trần Sĩ Đan, Trịnh Quốc Thịnh, Nguyễn Thiên Huy, Phan Anh Thư, Dương Văn Nhựt Duy
Người hướng dẫn	Ho Trung Thanh, Ph.D., Nguyen Van Ho, MA
Trường học	Trường Đại học Kinh tế - Luật (ĐHQG-HCM)
Chuyên ngành	Phương pháp nghiên cứu liên ngành
Thể loại	Báo cáo đồ án cuối kỳ
Năm xuất bản	2022
Thành phố	TP. Hồ Chí Minh

Định dạng
Số trang	81
Dung lượng	1,91 MB