1. Trang chủ
  2. » Luận Văn - Báo Cáo

báo cáo đồ án cuối kỳ môn phương pháp nghiên cứu liên ngành đề tài rfm giải pháp hiệu quả để phân cụm khách hàng trong lĩnh vực bán lẻ

68 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Trang 1

UNIVERSITY OF ECONOMICS AND LAW FACULTY OF INFORMATION SYSTEMS

MON PHUONG PHAP NGHIEN CUU LIEN NGANH DE TAI RFM - GIAI PHAP HIEU QUA DE PHAN CUM KHACH

HANG TRONG LINH VUC BAN LE

GVHD: Ph.D TS Hé Trung Thanh Nhom 4:

1

Phạm Trà My Hoàng Thanh Trúc Nguyễn Mai Như Luận - Trương Ngọc Khiêm

Trang 2

2 | Pham Tra My K214060401 10 Thanh vién 3 | Hoang Thanh Truc K214061264 10 Thanh vién

4_ | Nguyễn Mai Như Luận | K214110805 10 Thành viên 5 | Trương Ngọc Khiêm K214060397 10 Thành viên

Trang 3

Loi cam ơn

Lời đầu tiên, nhóm chúng em xin gửi lời cảm ơn chân thành đến thầy Hồ Trung Thành - giảng viên khoa Hệ thông thông tin trường Đại học Kinh tế - Luật đã tận tâm dạy bảo chúng em trong suốt kì học vừa qua Thời gian qua là một khoảng thời gian không đài nhưng cũng chắng phải ngắn, chúng em đã được tiếp cận với nhiều kiến thức bô ích cũng như các kỹ năng liên quan đến RFM, K-means và cả những kỹ năng thực hành excel vô cùng bồ ích Tích lũy những kiến thức được thầy truyền đạt lại, nhóm chúng em xin được trình bày đến thầy báo cáo đồ án cuối kỳ “##M- giải pháp hiệu quả để phân cụm khách hàng trong lĩnh vực bán lẻ”

Mặc dù, cả nhóm chúng em đã nô lực tìm hiểu thêm ` về các kiến thức liên quan và cả các kỹ năng cần thiết đề thực hiện đồ án nhưng chúng em cũng không the hoan toàn tránh khỏi những thiếu sót trong quá trình làm việc Vì vậy, nhóm em rất mong nhận được những lời nhận xét và ý kiến từ thay dé co thé sửa đổi, bồ sung, nâng cao kỹ năng làm việc và kiến thức của chúng em, đề phục vụ tốt hơn cho các công tác sau này Nhóm em xin gửi lời cảm ơn đến thầy, chúc thầy và gia đình luôn có thật nhiều sức khoẻ

Trang 5

Mục lục Danh mục bảng biểu

Danh mục hình ảnh và đồ thị Bảng thuật ngữ viết tắt Sơ đồ Gantt

Tổng quan đồ án

Chương I1: Tổng quan về tình hình nghiên cứu 1.1 Tổng quan tình hình nghiên cứu 1.2 Sơ đồ mô hình

1.3 Đánh giá chung

1.4 Khoảng trông nghiên cứu và những điểm mới của nhóm Chương 2: Cơ sở lý luận

2.1 Hanh vi khách hang

2.1.1 Khai niém hanh vi khach hang

2.1.2 Vai trò của việc nghiên cứu hành vị khách hàng 2.1.3 Tại sao cần nghiên cứu hành vi khách hàng? 2.1.4 Phân loại về hành vi khách hàng

2.1.5 Các yếu tố ảnh hưởng đến hành vi khách hàng 2.2 Phân khúc khách hàng

2.2.1 Khái niệm phân khúc khách hàng

2.2.2 Tam quan trọng của việc phân khúc khách hàng 2.2.3 Các phân khúc khách hàng phỏ biến

2.3 Tổng quan về mô hình RFM 2.3.1 Khải niệm mô hình RFM 2.3.2 Vai trò

2.5.1 Khải nệm

2.5.2 Lý do chọn phương pháp phân tích Cohort

10 11 13 13 13 15 15 15 15 15 15 16 16 16 16 16 18 18 19 19 20 20 20 20 21 21 22 22 22

Trang 6

2.5.3 Các loại phân tích Cohort 2.5.4 Các loại nhóm Cohort để phân tích 2.5.5 Các ứng dụng của phân tích Cohort Chương 3: Chuẩn bị dữ liệu

3.1 Mô tả về đữ liệu 3.1.1 Dữ liệu nghiên cứu

3.1.2 Mô tả các dữ liệu trong tập dữ liệu 3.2 Phân tích khám phá đữ liệu

3.2.1 Làm sạch dữ liệu 3.2.2 Thu thập dữ liệu Chương 4: Mô tả bài toán

4.1 Mô hình REM trên excel 4.2 Mô hình RFM trên python 4.3 Mô hình REM trên K-means

4.3.4 Phân khúc theo K-means Chương 5: Phân tích thảo luận và đề xuất

5.1 Mô hình REM truyền thống 5.2 Mô hình RFM với K-means 5.3 Cohort

Kết luận và Hướng phát triển Tham khảo

Phụ lục

23 23 25 26 26 26 26 32 32 34 36 36 39 47 53 37 57 60 63 66 68 69

Trang 7

Danh mục bảng biểu | Danh muc hinh anh va do thi Bảng thuật ngữ viết tắt

— Frequency — Monetary

Recency Thời gian của lần cuối gần nhất mà khách hàng đã mua hàng

Frequency Tần suất mua hàng của khách hàng

Monetary Tổng lượng tiền mà khách hàng đã chi tiêu cho toàn bộ hoạt động mua sắm

K-means Một trong những thuật toán được sử dụng trong lĩnh vực Machine Learning thuộc mô hình Học không giám sat

một khoảng thời gian nhat dinh sau lan dau sử dụng

Trang 8

NC RFM trén K-means

Thực hiện trên excel Thực hiện EDA trên excel Viết lý thuyết liền quan Thue hién code EDA

Thực hiện trên python

Thực hiện trên K-means

Danh giả mô hình Hoàn chỉnh đồ án

Sơ đồ Gantt

Ngay batdau [ÑÑ Khoảng thời gian ee]

— lớn

Trang 9

Tông quan đồ án Ly do chon dé tai:

Ngày nay, yêu cầu cao về cạnh tranh chiến lược và chính sách bán hàng của từng công ty ngày càng phát triển một cách mạnh mẽ với một mục đích cuối cùng đó là tối đa hóa doanh thu đi kèm với giảm thiếu chi phí cho sản xuất, kinh doanh các công ty/công ty không còn áp dụng các chiến lược marketing một cách tổng thê như trước đây với việc gộp chung tat cả các khách hàng dé phục vụ cùng một loại sản pham/dich vụ Điều này có thê làm giảm khả năng cạnh tranh của công ty/công ty so với các đối thủ cạnh tranh khác trên thị trường Đã có rất nhiều giải pháp được đề ra trong đó có thế đề cập đến phương pháp REM thông qua các đữ liệu từ công tác mua bán hàng của công ty đối với khách hàng trong mà ở đây chính là lĩnh vực bán lẻ từ chính những đữ liệu này có thê giúp chúng ta tông hợp được đặc điểm mua hàng của từng khách hàng sau đó phân cụm khách hàng rõ ràng để có những chính sách và hậu mãi riêng biệt dé có thế tăng doanh thu và níu chân khách hàng biến họ trở thành tệp khách hàng trung thành cho công ty

Tuy nhiên, việc phân cụm khách hàng đòi hỏi một khối lượng lớn nguồn lực thì mới có thế thực hiện một cách đầy đủ và chính xác nhất để có thể trình bày một cách chi tiết về cụm khách để công ty có những phán đoán kịp thời và ra quyết định cho chiến lược kinh đoanh của mình

Việc áp dụng học máy vào trong phân khúc khách hàng giúp ta tiết kiệm đáng kế nguồn lực của công ty Ngoài ra có thê kế đến độ chính xác và trực quan từ mô hình REM mang lại Nếu như so với việc thực hiện REM một cách thủ công từ bàn tay con người thì chắc chắn sẽ xảy ra những sai sót phần nào ảnh hưởng đến quyết định của công ty Triển khai học máy REM sẽ đỏi hỏi một nguồn đầu tư lớn cho cơ sở vật chất, cơ sở hạ tầng về thiết bị, thu thập dữ liệu khách hàng Nếu như được đầu tư đúng mức thì công ty chỉ cần thiết lập những bước ban dau cho céng cu nay sau đó thì lợi ich ma nd mang dén hoan toàn lớn hon so với phần mà họ đã đầu tư

Ác tiêu nghiên cứu - Mục tiêu ngắn hạn:

+ Phân cụm từng tệp khách hàng nhăm có các chính sách bán hàng phù hợp, lọc ra các khách hàng chuyên biệt mang tính biệt lập như có số lần mua hàng ít tuy nhiên số lượng hàng và giá trị hàng hóa tương đối lớn hay các khách hàng có nguy cơ rời bỏ khỏi công ty sẽ được loại bỏ ngay từ bước đầu trong xử lí dữ liệu

+ Thể hiện rõ ràng từng tệp khách hàng qua sơ đỗ giúp cho công ty dễ dàng đưa ra quyết định và chính sách bán hàng phù hợp với từng tệp khách hàng cụ thê từ đó tối đa hóa doanh thu

- Mục tiêu dài hạn:

+ Áp dụng học máy vảo trong phân tích dữ liệu đối với khách hàng trong ngành bán lẻ Từ đó, có thê tiết kiệm nguồn lực phục vụ cho việc phân tích trong lâu dài

Trang 10

+ Tạo ra lợi thế cạnh tranh một cách rõ ràng nhằm vượt qua đối thủ và có nhiêu chính sách thu hút lượng lớn khách hàng trên thị trường ngành hang bán lẻ

Đối tượng và phạm vị nghiên cứu

Đối tượng: tệp dữ liệu khách hàng của công ty Adventureworks Cycles với nhiều đữ liệu mua hàng

Phạm vi nghiên cứu: Phạm vị nghiên cứu là dia bàn các nước lớn như Mỹ, Canada, Đức, Pháp, được thu thập dữ liệu và nghiên cứu trong vòng 2 tháng

Phương pháp nghiên cứa

Bước đầu tiên, nhóm tiến hành xử lý dữ liệu thông qua giải pháp EDA bằng ngôn ngữ Python, được biết đến chính là ngôn ngữ ở hữu lượng lớn các khối cơ sở đữ liệu, phục vụ hiệu quả cho các chương trình mang tính thương mại Thông qua phương pháp này giúp nhóm loại bỏ được các dữ liệu rỗng giúp cho quá trình phân cụm khách hàng trở nên nhanh chóng, xóa bỏ được nhiều đữ liệu ngoại lệ có giá trị quá thấp hoặc quá cao gây ảnh hưởng đến quá trình phân cụm Mặt khác, các dữ liệu này sẽ được phân thành một cụm riêng biệt đề dé dàng quyết định hơn

Sau khi các đữ liệu được lọc sạch sẽ được đưa vào và thế hiện lên trên biêu đồ thông qua thư viện matplotlib trong ngôn ngữ Đython sau đó phương pháp Elbow được áp dụng nhằm xác định sô lượng K-Cluster cụ thé dé c6 thé cho chính xác số lượng cụm mà nhóm quyết định

_ Việc thê hiện và áp đụng số cụm sẽ được so sánh giữa từng đại lượng bao gồm giữa Frequency, Monetary, và Recency sau đó được trực quan hóa liên trên biểu đề 3D và cuối cung su dung Silhouette nhằm xác định độ chính xác về việc phân cụm tệp khách hàng thành nhiều tệp riêng biệt

Phương pháp nghiên cứu định lượng: thu thập thông tin từ các nguồn tư liệu khác nhau nhằm xây dựng các mô hình lý thuyết hay thực nghiệm ban đầu của nhóm Bên cạnh đó điều tra thực nghiệm có hệ thống các hiện tượng quan sát được qua số liệu thống kê nhóm thu thập được

Phương pháp nghiên cứu định tính: Sau khi phân tích kết quả nghiên cứu, nhóm sẽ tiền hành diễn giải phân tích sau khi có được kết quả cuối cùng, nhóm sẽ nghiên cứu và xem xét lại những thành quả thực tiễn trong quá khứ để rút ra tóm lại bố ích cho thực tiễn và khoa học

Ý nghĩa thực tiễn của nghiên cứu:

Nghiên cứu tập trung phân tích hành vi mua hàng của người tiêu dùng từ đó tìm ra những tệp khách hàng có cùng đặc điểm hành vi, tính cách, thói quen mua hàng, qua đó đề xuất các chiến lược marketing phù hợp với từng phân khúc khách hàng khác nhau Tạo được nhiều cơ hội phát triên nông nghiệp Việt Nam và nền tảng thương mại bán lẻ trực tuyến phát triển bên vững

Nghiên cứu đưa ra các đề xuất thông qua việc thử nghiệm các mô hình trên ba công cụ phố biến dành cho các công ty trong lĩnh vực kinh doanh nói chung và các lĩnh vực liên quan Từ đó, các công ty sẽ có thể chọn cho cho mình mô hình hiệu quả,

Trang 11

tối ưu nhưng vẫn có thể tiết kiệm chí phí sao cho phù hợp với tình hình công ty Hơn nữa, các công ty sẽ có thêm nhiều cái nhìn bao quát hơn về khách hàng và thị trường của họ đề thúc đây các quá trình cải thiện hoạt động và hiệu suất sản phẩm dịch vụ của các công ty đề cạnh tranh hiệu quả hơn trên thị trường

Keyword: Phan khuc khach hang, RFM, hoc may, Phan cum K-means, Cohort Kết cấu đô án:

Đồ án được kết cấu gồm 5 chương như sau: Chương I: Tổng quan về tỉnh hình nghiên cứu Chương 2: Cơ sở lý luận

2.1 Hành vi khách hang 2.2 Phân khúc khách hàng 2.3 Mô hình RFM

2.4 Téng quan vé K-mean clustering 2.5 Cohort analysis - Phan tich theo nhom Chuong 3: Chuan bị dữ liệu

Chương 4: Mô tả bài toán 4.1 Mô hình RFM trên excel 4.2 Mô hình RFM trên python 4.3 Mô hình RFM trên K-means Chương 5Š: Phân tích thảo luận va đề xuất

Trang 12

Chương 1: Tổng quan về tình hình nghiên cứu 1.1 Tổng quan tình hình nghiên cứu

Trong lĩnh vực tiếp thị, quảng bá thương hiệu, sản phẩm đến người tiêu dùng hay để xuất giải pháp cho các công ty, việc phân loại khách hàng mục tiêu luôn là một vấn để quan trọng và cần được đầu tư phát triển Phân tích dữ liệu lớn đóng một vai trò quan trọng trong việc ra quyết định bán lẻ, đặc biệt khi đữ liệu liên quan đến hành vi của khách hàng Phân tích hành vi khách hàng giúp chủ công ty thực hiện các quyết định quan trọng ảnh hưởng đến các khía cạnh khác nhau của cửa hàng bán lẻ, nơi hành vị không chỉ giới hạn ở hành vĩ mua hàng của khách hàng (Mussadiq Abdul Rahim và cộng sự, 2021)

Phân cum khach hang (customer segmentation) là quá trình phân chia khách hàng dựa trên các đặc điểm chung như hành vị, thói quen mua sắm và sử dụng dịch vụ của họ để các công ty, công ty có thể tiếp thị cho từng nhóm khách hàng một cách hiệu quả và phủ hợp hơn Với các đặc điểm của nhóm khách hàng, thì việc phân cụm theo điểm chỉ tiêu và thu nhập cho công ty thấy rõ ràng hơn cụm khách hàng mục tiêu, và theo thuật toán K-Means thi việc phân thành 2 cụm khách hàng là tối ưu (Phạm Kiên Trung và cộng sự, 2020)

Đề đạt mục tiêu trên, có nhiều phương pháp đã được tiến hành trên nhiều lĩnh vực khác nhau để tiến hành phân cụm các khách hàng mục tiêu Trong lĩnh vực dịch vụ viễn thông và dịch vụ tài chính, nghiên cứu của Arne Floh và cộng sự (2013) đã dựa trên mô hình về khái niệm đa chiều dé đánh giá các điểm không đồng nhất ở chính khách hàng đã ủng hộ mạnh mẽ lập luận rằng ảnh hưởng giá trị cảm nhận là ý định về mặt môi trường, nhưng các tác động đó cũng khác nhau về mức độ tùy thuộc vào phân khúc người tiêu dùng (Arne Floh và cộng sự, 2013) Trong lĩnh vực bảo hiểm, (Wafa Qadadeh và Sherief Abdallah, 2018) đã sử dụng 2 kỹ thuật khai thác đữ liệu là phân cụm K- Means va ky thuat SOM (dựa trên ANN) Thông qua phân tích cụm và trực quan hóa dữ liệu đa chiều có thể biết được đặc điểm tính cách khách hàng trong CRM, từ đó có thể thiết kế một kế hoạch marketing riêng cho từng loại khách hàng của công ty Còn trong lĩnh vực kinh doanh mỹ phâm, Sari Hartini và cộng sự (2020) đã thu được mô hình phân tích hỗ sơ và phân khúc khách hàng

hiệu quả sử dụng thuật toán phân nhóm và phân loại cho kết quả rằng mô hình

thuật toán có thê cung cấp giải pháp cho những nhu cầu này là mô hình thuật toán K-Means + Na ve Bayes, với giá trị chính xác cao là 65, 87% Ở Việt Nam, trong lĩnh vực bản lẻ, Nguyễn Phúc Sơn và cộng sự (202L) đã tập hợp dữ liệu giao dịch bán lẻ từ một chuỗi siêu thị ở Thành phố Hồ Chí Minh, Việt Nam đề thiết kế mô hình phân đoạn mới dựa trên sự kết hợp của mạng nơ-ron sâu và kỹ thuật phân cụm xác suất tự giám sát Mô hình mới linh hoạt hơn vả thích ứng hơn với sự đa dạng của bộ dữ liệu khách hàng so với các thuật toán heuristic hién tai trong CRM Trong linh vực du lịch và khách sạn, Arkadriusz T.Tomezyk và cộng sự (2022) đã thông qua WTP (so sánh về mức chỉ tiêu của khách hàng săn lòng chỉ tiêu) đi sâu về lĩnh vực cá nhân hóa cho chính khách hàng đồng thời kết hợp với CeoP đề tìm ra mức phân khúc phù hợp cho những gì khách hàng chỉ tiêu và thứ họ nhận lại được từ đó đề xuất kiêu khách hàng đề hỗ trợ chiến lược phân khúc và định giá

Trang 13

Các nghiên cứu trước đây đã triển khai mô hình hành vi mua hàng dựa trên hành vi thế chất của một đôi tượng Hiện nay, có nhiều phương pháp giúp công ty thực hiện việc phân cụm khách hàng mục tiêu dựa trên những hiểu biết vé hanh vi (behavior), thoi quen (habits), so thich (preferences) của khách hàng tiém nang nhu KMeans, Mean-Shift, Density-Based Spatial, Expectation- Maximization, Agglomerative Hierarchical Clustering (Chen et al., 2012)

RFM là một trong những phương pháp phân tích được sử dụng rộng rãi nhất để phân tích khách hàng thông qua phân khúc và lập hồ sơ khách hàng (Sari Hartim và cộng sự (2020) Mô hình RFM cho hành vi mua hàng của khách hàng sử dụng thuật toán K-Means đã áp dụng trí tuệ kinh doanh trong việc xác định khách hàng tiềm năng băng cách cung cấp đữ liệu phù hợp và kịp thời cho các đơn vị kinh doanh trong ngành Bán lẻ Một loạt các cụm tập dữ liệu được xác nhận dựa trên việc tính toán Hệ số Silhouette Do đó, kết quả thu được liên quan đến giao dịch bán hàng được so sánh với các thông số khác nhau như lần truy cập bán hàng, tần suất bán hàng và khối lượng bán hàng (P Anitha, Malini và M.Patil, 2019) Mô hình REM và các kỹ thuật lập mô hình dữ liệu được dùng dé phát hiện các mẫu hành vi của khách hang Mỗi giao dịch được phân bổ cho khách hàng là một phần trong hành vi của một người và là một ví dụ của vectơ đặc điểm, nó được mô hình hóa dựa trên một tập hợp các giao dịch để tạo thành hành vi mua lại Phân tích thực nghiệm cho thấy tám giao dịch la du dé phan loại khách hàng với độ chính xác cao (Mussadiq Abdul Rahim và cộng sự, 202L) Bên cạnh đó, mô hình dữ liệu REM sử dụng phương pháp Elbow với chỉ sô kiêm dinh Silhouette đề tôi ưu số cụm khách hàng, hệ số chuan (Z- score) va Quy tac kiém chứng (Empirical Rule) được áp dụng để xử liệu các dữ liệu bất thường (Outlier) và phương pháp Cohort đề phân tích tỷ lệ duy trì khách hàng kết hợp biểu đồ nhiệt trên phân phối ma trận Mô hình này dựa trên đữ liệu giao địch với những tham số đặc trưng và cầu trúc tương đồng có thể tìm thấy trên các hóa đơn bán hàng trong bất kỳ cửa hàng tại các nước trên thế giới cũng như tại Việt Nam và áp dụng phương pháp học máy không giám sát để phân tích phân khúc khách hàng và tìm ra những giá trị thật sự (insight) co kha năng tác động, ảnh hưởng tới hành vi và quyết định mua hàng của khách hàng (Hồ Trung Thành và Nguyễn Dang Son, 2021)

Ngoai m6 hinh RFM truyén thông, nhiều nhóm tác giả đã phát triển nhiều mô hình RFM sáng tạo kết hợp với nhiều kỹ thuật khác nhau để giải quyết các điểm yếu của mô hình truyền thống Một mô hình mới liên kết mô hình REM với giá trị lâu dài của khach hang (CLV) sử dụng đường cong gia tri đăng cấp đề tính toán phân khúc khách hàng, nhóm các cá nhân lại với nhau, những người có hành vi mua sắm khác nhau nhưng có giá trị tương đương trong tương lai (Peter 5 Fader và cộng sự, 2005) Tính chu kỷ của nhu câu sản pham ¢ ở mô hinh truyền thống chưa có thế được ước tính dựa trên hành ví mua của mỗi khách hàng, khiến cho khó đề xuất sản phâm vào đúng thời điểm phù hợp với yêu cầu mua Để đối phó với tính chu kỳ của sản phẩm, mô hình TREM có tính đến tính chất sản phẩm và tính chu kỳ mua hàng Phương pháp này kết hợp đặc tính sản phẩm và chu kỳ mua hàng dé đo lường lòng trung thành của khách hàng và phân tích hành vĩ mua hàng của khách hàng (Li-Hua Li va céng sự, 2006) Ngoài ra, còn có mô hình kết hợp giá trị định lượng của

Trang 14

các thuộc tính REM và thuật toán K-mean vào lý thuyết tập hợp thô (lý thuyết RS), dé trích xuất các quy tắc ý nghĩa và nó có thế cải thiện một cách hiệu quả mạng nơ-ron có thời gian đảo tạo lâu và thuật toán di truyền trong CRM (Ching-Hsue Cheng va You-Shyang Chen, 2009) Phân tích dữ liệu mua hàng của khách hàng trong lĩnh vực thương mại điện tử bằng 3 thuật toán phân cụm: K-means Clustering, Fuzzy C-means Clustering va Hierarchical Clustering được xây dựng trên ngôn ngữ lập trình R đề hiểu rõ về hành vĩ và phân khúc khách hàng dựa trên mô hình REMI Chỉ số Dumn chỉ ra rằng mô hình phân cấp hoạt động tốt hơn so với mô hình K-means và mô hình Fuzzy C-means về mặt tạo ra một cụm tot (Oluwasurefunmi Idowu và cộng sự, 2019) Mô hình REM trên mỗi sản pham (RFM/P) duoc dé xuat để ước tính giá trị của khách hàng trên mỗi sản phẩm trước tiên và sau đó tông hợp chúng lại dé thu được giá trị tông thế của khách hàng Ngoài ra, khi có những thay đổi trong hành vi mua hàng của khách hàng liên quan đến lần truy cập gần đây trên mỗi sản phẩm và tần suất trên mỗi sản phẩm, thông thường, độ chính xác của dự đoán REM/P được nhận thấy là tốt hơn so với REM truyền thống (Rodrigo Heldta và cộng su, 2021)

1.4 Khoảng trồng nghiên cứu và những điễm mới của nhóm Tổng quan các công trình trong nước và trên thế giới chỉ ra răng phân khúc khách hàng băng mô hình RFM không phải là điêu mới Tuy nhiên, nhóm tác giả nhận thây có một sô khoảng trông sau:

Trang 15

Thứ nhất, các hệ thông quản lý khách hàng ngày càng được tự động hóa Tuy nhiên, hệ thống chủ yếu là ghi nhận dữ liệu giao dịch và thực hiện những thống kê định kỳ theo phương pháp truyền thống dẫn đến kết quả chưa đảm bảo được tính khách quan, chính xác và khó phân tích được hành vi mua sam của khách hàng để có cơ sở xây dựng chiến lược tiếp cận khách hàng và bán hàng hiệu quả hơn

Tint hai, mô hình đề xuất không xem xét đến sự cạnh tranh trên thị tường Hơn nữa, mô hình phân tách được đề xuất giả định sự độc lập piữa các loại sản phâm Đây có thế là một vẫn đề không nhỏ tùy thuộc vào một số trường hợp

Đây là một nghiên cứu mới để đi sâu vào phân tích dữ liệu cho một công ty cụ thê Adventureworks Cycles với mục đích phân khúc khách hàng thông qua mô hình REM và phương pháp học máy, từ đó đề xuất giải pháp hiệu quả cho chiến lược kinh doanh hiệu quả Bên cạnh đó, nghiên cứu còn áp dụng thêm phương pháp học máy phân cụm K-means đề tự động gom cụm nhóm khách hàng có cùng đặc điểm Phương pháp học máy này sẽ tiết kiệm thời gian và chính xác hơn so với việc tính toán mô hình REM truyền thống sử dụng excel hoặc python không dùng học máy

Tổng kết lại, nhóm tác giả cho rằng có một khoảng trồng trong nghiên cứu về mô hình phân tích dữ liệu phân khúc khách hàng Đây chính là căn cứ quan trọng dé nhóm tác giả lựa chọn đề tài của nghiên cứu: “8E Ä⁄ — GIẢI PHÁP HIEU QUA DE PHAN CUM KHACH HANG TRONG LINH VUC BAN LE”

Trang 16

Chương 2: Cơ sở lý luận 2.1 Hành vì khách hàng

2.1.1 Khái niệm hành vì khách hàng

Hành vi khách hàng bao gồm những tâm lý của khách hàng như suy nghĩ, cảm nhận, các phản ứng đối với sản phẩm, dịch vụ và toàn bộ những hoạt động của khách hàng trong quá trình tiêu dùng như quyết định mua sắm, sử dụng hay ngừng sử dụng sản phẩm Quá trình này chủ yếu liên quan đến sự biến đổi của các yếu tô tâm lý, động lực và hanh vi

Nghiên cứu hành vi khách hàng là việc phân tích hành vị khách hang sẽ dựa trên suy nghĩ, hành động, cảm nhận và thói quen mua hàng đã có Những thói quen này có thê được thay đôi nhờ sự tương tác qua lại của các yếu tô gây nên sự tò mò, kích thích và nhận thức của con người

2.1.2 Vai trò của việc nghiên cứu hành vị khách hàng

- _ Định vị thương hiệu theo hướng “cá nhân hóa”: giúp công ty đánh thắng vào nhu cầu của khách hàng, kích thích họ mua hàng

- _ Lên mục tiêu và kế hoạch kinh doanh khả thi: từ việc thu thập dữ liệu về doanh thu, thời gian, tần suất mua hàng, đưa ra dự đoán về khách hàng tiềm năng có thê tiếp cần đề đề ra các chiến lược kinh đoanh hiệu quả

- Tối ưu chiến lược Marketing: dựa trên phân tích diễn biến nhân thức, tâm lý của khách hàng về các sản phẩm, đề ra những giải pháp cải tiễn, thay đổi chiến lược truyền thông, marketing sao cho phù hợp và tối ưu

- Tăng mức độ trung thành của khách hàng đối với thương hiệu: từ việc thỏa mãn các nhu cầu của khách hàng biến họ thành đối tượng trung thành với các sản phẩm của thương hiệu

- Tăng vị thế cạnh tranh với đối thủ: với hiểu biết về hành vi khách hàng giúp công ty tạo ra sản phẩm khác biệt thỏa mãn hoặc vượt trên mong muôn của khách hàng, đồng thời đề ra chiến lược kinh doanh, Marketing hiệu quả

2.1.3 Tai sao can nghiên cứu hành vì khách hàng?

- _ Xác định đúng khách hàng tiềm năng: đây là một hoạt động quan trọng, quyết định tính hiệu quả các chiến lược và hoạt động kinh doanh của công ty Đề đạt được điều đó, cần phải xác định được nhu cầu, hành vi, tính cách của khách hàng sao cho phù hợp với các sản phẩm và mục tiêu của công ty

- _ Cá nhân hóa trải nghiệm của khách hàng: bằng việc sử dụng những dữ liệu thu thập được, công ty đề ra các chiến lược nhắm đến các đối tượng khách hàng cụ thể Từ nghiên cứu hành vi khách hàng, công ty dé dang phan nhóm khách hàng dựa trên hành vi, nhu cầu và sở thích phù hợp để nâng cao trải nghiệm của từng nhóm đối tượng

-_ Dự báo doanh thu và xu hướng mua sam - Canh bao rủi ro kinh doanh

- _ Tối ưu hóa các chiến địch - _ Giữ chân khách hàng hiệu quả

2.1.4 Phân loại về hành vi khách hàng Các hành vi của khách hàng có thể chia thành 2 nhóm:

- - Nhóm hành vi có thê quan sát được: các hành vi liên quan đến số lượng, thời gian, địa điểm, xu hướng tiền kiếm, số tiền

Trang 17

- - Nhóm hành vi không thê quan sát được: cách khách hàng sử dụng sản phẩm, chia sẻ, đánh giá về sản phẩm

2.1.5 Các yếu tô ảnh hưởng đến hành vi khách hàng Hành vi tiêu dùng chịu ảnh của cả yếu tố bên trong và bên ngoài: - _ Yếu tổ văn hóa:

+ Nền văn hóa: là yếu tô quan trọng cần được phân tích trong mọi chiến dịch thâm nhập thị trường chưa được xác định Việc biết được những đặc trưng của từng nền văn hóa và lựa chọn phù hợp với mục tiêu của công ty giúp truyền tải đúng thông điệp của chiến dịch hiệu quả hơn + Văn hóa cộng đồng: việc xác định những nhóm văn hóa giúp công ty

_ phân nhóm khách hàng và cá nhân hóa tốt hơn

- Yếu tố xã hội: cộng đồng, mạng xã hội, tầng lớp xã hội, gia đình, địa vị - Yếu tố cá nhân: tuôi tác, giới tính, nghề nghiệp, tính cách, phong cách song - Yéuté tam ly: Động cơ, nhận thức, lĩnh hội, niêm tin, thái độ

2.2 Phân khúc khách hàng

2.2.1 Khái niệm phân khúc khách hàng

Phân khúc khách hàng là nhóm các đối tượng khách hàng được phân chia theo từng đặc điểm cụ thể Từng phân khúc khách hàng khác nhau sẽ có những đặc điểm, hành vi mua hàng khác nhau, ảnh hưởng đến chiến lược kinh doanh của công ty Tùy vào phân khúc khách hàng khác nhau, công ty nên chuẩn bị nội dung, thông điệp, một chiến lược tiếp thị, bán hàng phù hợp với phân khúc, đối tượng khách hàng mục tiêu sẽ mang đến hiệu quả vượt trội trong hoạt động kinh doanh của công ty

2.2.2 Tâm quan trọng của việc phân khúc khách hàng

Phân khúc khách hàng giúp bạn dễ dàng hơn trong quá trình cá nhân hóa các hoạt động tiếp thi sau nay

+ Xác định khách hàng mục tiêu: giúp bạn khoanh vùng được đối tượng phủ hợp, tập trung vào nhóm các đối tượng này và tiết kiệm tối đa chí phí cho các hoạt động tiếp thị

+ Điều chỉnh thông điệp đề tiếp cận nhanh chóng hơn với nhóm khách hàng mục tiêu: các nội dung khi đã xác định được mục tiêu, bảm sát vào nhóm đối tượng này sẽ rút ngắn thời gian thực hiện chiến dịch, đồng thời mang lại hiệu quả cao nhất cho toàn

bộ chiến dịch

+ Đáp ứng một nhu cầu cụ thê từ đó giúp gia tăng tỷ lệ chuyến đôi: việc xác định chính xác mong muốn của một khách hàng tiềm năng sẽ gia tăng cơ hội biến họ thành khách hàng thực sự của công ty

+ Xây dựng mối quan hệ bên chat và có được sự trung thành từ khách hàng + Mở rộng tệp khách hàng tiềm năng của bạn đề đây nhanh chu kỳ bán hàng

2.2.3 Các phân khúc khách hàng phổ biến

Các công ty thường nhóm đối tượng khách hàng theo các yếu tố như nhân khâu học, hành vị, thu nhập va vi tri cua ho trong hành trình mua hàng Chiến lược được sử dụng dé phân khúc khách hàng sẽ phụ thuộc vào sản phâm hoặc dịch vụ mà công ty cung câp

Trang 18

Phân khúc khách

hàng Khai niệm

điềm

Nhược

Theo nhân khâu học

Đây là cách phân khúc phô biến nhất và dễ nhất Tuôi tác, mức thu nhập, công việc và vị trí địa lý là tất cả yếu tố mà bạn có thể sử dụng để sắp xếp các nhóm đối tượng của

mình

- Thu thập dữ liệu dễ dàng - Nhắm mục tiêu và phân tích đơn giản - Tiết kiệm chỉ phí

-Dễ dàng đo lường - Dễ dàng theo dõi các xu

hướng xã hội

-Dựa trên các

Theo hành vì

Chiến nảy mang tính chuyên sâu hơn một chút so với

lược

việc phân khúc theo nhân khẩu học Phân tích hành vi nghĩa là xem xét những gì khách hàng

mua, tần suất

họ mua hàng và lý do tại sao họ chọn

phẩm hoặc dịch vụ đó

-Dễ dàng lập

kế hoạch -Dễ dang quảng cáo -Phân khúc khách hàng theo hanh vi: Các công ty có thế phân nhóm khách hàng theo hành vi của họ và từ đó có thế đưa ra chién lược tiếp thị phủ hợp -Hành vi của

Theo hành trình mua

hàng

Chiến lược kinh doanh này gIúp điều chỉnh các nội dung và thông điệp của mình dựa trên vị

khách hàng trong hành tinh mua hàng của họ

Giúp hướng đến từng nguo1 mua VỚI từng

khác nhau và dua ra câu trả lời phủ hợp cho các câu hỏi của họ

Tốn khá

Theo mức dộ tham gia

Tương tác với những khách hàng với mức độ tương tác thấp bằng chiến địch được xây dựng và thiết kế riêng cho họ, chăng hạn sử dụng các ưu đãi, khuyến mãi và quả tặng

Không bỏ qua các phân

khúc khách

hàng tiềm năng

Triển khai

Theo loại thiết bị sử

dụng Tối ưu hóa

một nội

dung cụ thé cho từng loại thiết bị

Giúp người dùng dê dàng nhấn

vao mot

cuộc khảo sát hoặc tương tác với một hình ảnh, tử đó gia tang cơ hội giữ chân họ

Cần một

Trang 19

điềm

giả định: Phân khúc theo nhân khâu học có

năm ở cách tiếp cận một chiều của nó -Dữ liệu nhân khâu học quá mơ hồ: Không cung cấp cho bạn thông tin chi tiết về tính cách của cá nhân đó hoặc những mong muôn và giá trị của họ -Diễn giải sai dữ liệu: Về cơ bản, dữ liệu nhân khẩu học có thể được coi là khá lỗi thời Trong những năm qua, lỗi sống của con người đã thay đổi đáng kê -Dữ liệu thay

khách hàng liên tục thay đôi -Không thể đo lường

nhiều nguồn lực và thời gian của công ty để có thê phân tích chính xác hành trình mua hàng của người tiêu dùng Đồng thời đội ngũ nhân sự cần đầu tư vào kế hoạch

truyền

thông sao cho phù hợp nhất

chương trinh

khuyến mại quá thường xuyên thì sẽ tạo cảm giác nhàm chan cho khách hàng

nguồn lực lớn để liên tục cập nhật những thay đổi mới của từng thiết bị

=> Co thé str dụng hai hoặc nhiều phương thức cùng một lúc đê mở rộng phạm vi của mình Một ví dụ cụ thê là gửi một thông báo email cho khách hàng tại Hà Nội (nhân khâu học), người mua các sản phâm tử bạn một cách thường xuyên (hành vi)

23 Tổng quan về mô hình RFM 2.3.1 Khái miệm mô hình REMF

REM (Recency-Frequeney-Monetary): là một kỹ thuật phân tích được sử dụng dé xác định lượng khách nào là khách hàng tốt nhất bang cach kiém tra mức độ gần đây thông qua các số liệu như khách hàng đã mua, tần suất họ mua và số tiền khách hàng chỉ tiêu

Trong đó:

Trang 20

e R(Recency): lần tương tác, giao dich, mua hang gan nhat Thời gian da trôi qua bao lâu kế từ lần tương tác hoặc giao dịch cuối cùng của khách hàng với công ty? Các tương tác không chỉ ngoài việc mua hàng, lượt truy cập cuôi củng vào trang web hoặc sử dụng ứng dụng dành cho thiết bị đi động Trong hầu hết các trường hợp, khách hàng tương tác hoặc giao dịch với công ty cảng gần với hiện tại thì khả năng khách hàng đó sẽ phản hồi với các thông tin từ công ty trong tương lai càng cao Công thức tính: thời gian kế từ lúc khách hàng tương tác cuối cùng với công ty (ngày, tuần, tháng)

® F(Frequency): tần suất khách hàng giao dịch hay tương tác với công ty Tần suất một khách hàng đã giao địch hoặc tương tác với công ty trong một khoảng thời gian cụ thể như thế nào? Những khách hàng có sự tương tác thường xuyên thông thường sẽ găn bó hơn và trung thành hơn những khách hàng có tần suất thấp hơn Công thức tính: tổng số lần giao dịch, tương tác của khách hàng

® M(Monetary): số tiền mà khách hàng đã chỉ tiêu cho các giao dịch với công ty trong khoảng thời gian cụ thể Những khách hàng chỉ tiêu nhiều thường mang lại nhiều giá trị kinh doanh cho công ty hơn những khách hàng chỉ tiêu ít Công thức tính: tổng số tiền đã chỉ tiêu hay trung bình số tiền khách hàng đã chí tiêu cho mỗi lần giao dich

2.3.2 Vai tro

Thông qua các tiêu chí, mô hình REM giúp công ty xác định: Khách hàng tốt nhất và tiềm năng nhất của công ty Khách hàng có khả năng rời dịch vụ

Khách hàng mang lại giá trị kinh doanh nhất

Khách hàng trung thành với công ty ; Khách hàng sẽ tương tác, phản hoi tro lai voi những chiên dịch marketing, quảng cáo của công ty

® Nhóm khách hàng có khả năng sẽ mua sản phâm mới 2.3.3 Các biến thể của REM

Ngoài ra RFM còn có các biến thể khác dựa trên sự thay đổi thêm bớt cac bién trong 3 bién Recency, Frequency va Monetary:

e RFD - Recency, Frequency, Duration (thoi gian) la phiên ban đã duoc modified cua phan tich RFM Nhung thay vi phan tích giá trị khách hàng, REFD được sử dụng dé phan tich hanh vi khach hang theo các nhóm người xem/người đọc/người lướt web e RFE - Recency, Frequency, Engagement(mtre d6 cam két) la

phién ban mé réng cua phan tich RFD nham xac dinh mirc dé găn bó của khách hàng đối với một nền tảng web, app Trường Engagement (mức độ cam kết) được xác định thông qua thời lượng truy cập, số trang trên mỗi lượt truy cập và các chiều dữ liệu khác tương tự Mô hình RFE có thé duoc str dung dé phan tích hành vị khách hàng theo các nhóm người xem/người đọc/người lướt web.

Trang 21

@ RFM-I- Recency, Frequency, Monetary Value — Interactions (Giá trị tiền tệ - Tương tác) là một phiên bản khác của REM đề đánh gia chi phí tương tác marketing trong tiếp cận khách hàng @ RFMIC - Recency, Frequency, Monetary Value, Time (Thoi

gian), Churn rate (Tỷ lệ rời bỏ) là một mô hình REM mở rộng được đề xuất bởi I-Cheng và cộng sự (2009) Mô hình sử dụng chuỗi Bernoulli trong lý thuyết xác suất nhằm đự báo xác suất mua hàng tại những chiến dịch marketing tiếp theo

2.3.4 Uu điểm và nhược điểm của RFM

© Tinh diém REM có thê khó khăn

©_ Phân tích RFM phụ thuộc vào dữ liệu lịch sử và không phải là triển vọng trong tương lai

©_ Phân tích này có thể không phù hợp nếu bạn chỉ bán một sản phẩm

2.4 Tổng quan về K-mean clustering 2.4.1 Khai niém

Phân cụm là một phương pháp học tập không giam sat có nhiệm vụ phân tách tập hợp hoặc các điểm dữ liệu thành nhiều nhóm, sao cho các điểm đữ liệu trong một nhóm giống nhau hơn và không giống với các điểm đữ liệu của các nhóm khác Nó không là gì ngoài một tập hợp các đối tượng dựa trên sự giống nhau và không giống nhau giữa chúng

Phân cụm K-means là một thuật toán Học máy không giảm sát thực hiện nhiệm vụ phân cụm Trong phương pháp này, các quan sát 'n' được nhóm thành các cụm 'K' dựa trên khoảng cách Thuật toán có gắng giảm thiêu phương sai trong cụm (để các quan sát tương tự rơi vào cùng một cụm)

Phân cụm K-Means yêu cầu tất cả các biến phải liên tục vì nó sử dụng thước đo khoảng cách và thông số kỹ thuật trước đó về số lượng cụm (K)

2.4.2 Các bước cơ bản của thuật toán

Khởi tạo k phần tử trung tâm một cách ngẫu nhiên (mỗi phần tử trung tâm đại diện cho một nhóm)

Thực hiện các bước cơ bản sau cho đến khi tất cả các đối tượng được phân loại và không còn còn sự thay đôi của các đối tượng đến các nhóm:

Trang 22

1 Chọn ngẫu nhiên K tâm (centroid) cho K cum (cluster) Mỗi cụm được đại diện bằng các tâm của cụm

2 Tính khoảng cách giữa các đối tượng (objects) đến K tâm (thường dùng khoảng cách Euclidean)

3 Nhóm các đối tượng vào nhóm gần nhất 4 Xác định lại tâm mới cho các nhóm

5 Thực hiện lại bước 2 cho đến khi không có sự thay đối nhóm nào của các đối

tượng Bắt đầu

Dữ liệu đâu vào: m đối

tượng, & nhóm

Khởi tạo & phản tử trung tâm

Uu diém Nhược điểm

- K-means là có độ phức - K-means không khắc phục tạp tính toán O(tkn) được nhiễu và giá trị k phải được

- K-means phân tích phân cho bởi người dùng

cụm đơn giản nên có thê áp dụng - Chỉ thích hợp áp dụng với đối với tập dữ liệu lớn dữ liệu có thuộc tính số và khám ra

các cụm có dạng hình cầu

2.4.4 Ứng dụng trong kinh doanh

Thuật toán phân cụm K -means được sử dụng để tìm các nhóm chưa được gan nhãn rõ ràng trong dữ liệu Điều này có thê được sử dụng để xác nhận các giả định kinh doanh về loại nhóm tôn tại hoặc đề xác định các nhóm chưa biết trong tập dữ liệu

Trang 23

phức tạp Khi thuật toán đã được chạy và các nhóm được xác định, bat kỳ đữ liệu mới nào cũng có thê đễ dàng được gán cho đúng nhóm

Đây là một thuật toán linh hoạt có thể được sử dụng cho bat ky loai nhom nao Một số ví dụ về các trường hợp sử dụng là:

Phân khúc theo hành vi Phân loại phép đo cảm biến

Phân khúc theo lịch sử mua hàng (@) Phát hiện các loại hoạt động trong cảm biến chuyển

Phân đoạn theo hoạt động trên các nên tảng động hình ảnh nhóm âm thanh riêng biệt

Tao hô sơ dựa trên giám sát hoạt động

Phân loại hàng tồn kho @ Phát hiện bot hoặc sự bất thường Nhóm hàng tôn kho theo hoạt động bán hàng Tach cac nhóm hoạt động hợp lệ khỏi bot

Nhóm hàng tôn kho theo số liệu sản xuât aw Nhóm hoạt động hợp lệ để làm sạch phát hiện ngoại lệ

Ngoài ra, việc theo dõi xem diém đữ liệu được theo đõi có chuyền đôi giữa các nhóm theo thời gian hay không có thê được sử dụng đê phát hiện những thay đôi có ý nghĩa trong dữ liệu

2.5 Cohort analysis - Phân tích theo nhóm 2.5.1 Khải niệm

Cohort analysis (phan tích theo nhóm) là dạng phân tích hành vị khách hàng, lây dữ liệu từ tập hợp con như kinh doanh dịch vụ theo mô hình SaaS, game, các nền tảng thương mại điện tử hay từng nhóm khách hàng thành các tệp liên quan với nhau, thay vì theo dõi dữ liệu theo từng đơn vị đơn lẻ Các nhóm này thường mang đặc điểm chung về thời gian hoặc quy mô

Các công ty sử dụng phân tích đoàn hệ đề phân tích hành vi của khách hàng trong suốt vòng đời của từng khách hàng Trong trường hợp không có phân tích theo nhóm, các công ty có thể gặp khó khăn trong việc hiểu vòng đời mà mỗi khách hàng trải qua trong một khung thời gian nhất định Các công ty sử dụng phân tích theo nhóm đề hiểu xu hướng và mô hình của khách hàng theo thời gian và đề điều chỉnh việc cung cấp sản phẩm và dịch vụ của họ cho các nhóm đã xác định

Phân tích Cohort có thể giúp công ty theo đði được hiệu suất sản phẩm (product performance), so sanh các tệp khách hàng theo thời gian, đánh giá hiệu suất đề tìm xem chiến dịch nào hiệu quả chiến dịch nào không Đây là một công cụ giá trị cho các chiến dịch marketing nhắm đến một số đối tượng khách hàng nhất định, giúp việc điều chỉnh thông điệp và hoạt động phù hợp cho khách hang trở nên khả thi

2.5.2 Lý do chọn phương pháp phân tích Cohort Kết quả phân tích Cohort:

Nam bat duoc bounce rate, retention rate theo thời gian của từng nhóm user 2 Đối với lượt truy cập trang web, có thê nắm bắt được tần suất truy cập của user

cũng như thời gian user lưu lại trang web, sau bao nhiêu lâu thì user quay lại trang web của bạn, đánh giá được customer lifetime đề tôi ưu hóa conversion funnel

Trang 24

3 Thông qua những kết quả này bạn có thê chỉ số hóa mức độ tham gia của người dùng, từ đó làm nền tảng xây dựng các chiến dich target marketing phù hợp

Tóm lại, so với những chỉ SỐ chung chung khác, kết quả phân tích Cohort sẽ có được 1nsipht tông quan về pattern của từng tập hợp người dùng, từ đó đễ dàng thiết kế các chiến dịch target marketing cũng như các kênh quảng bá phù hợp với đặc tính, thói quen, hành vi của khách hàng, ngoài ra kết quả phân tích Cohort còn có thê giúp sản phẩm thuyết phục hơn trước các nhà đầu

2.5.3 Các loại phân tích Cohortf

Đặc phân chia người dùng dựa vi người dùng dựa trên ạ trên thời điềm họ có được các hoạt động mà họ thực điêm hoặc đăng ký một sản hiện trong ứng dụng trong

Một cách đề trực định quan hóa thông tin này là

vẽ biêu đồ đường cong tỷ lệ giữ chân, cho thây tỷ lệ giữ chân của các nhóm này theo thoi gian

Uu diém xác định rất tốt xu hướng và thời | có thể xác định mức độ giữ chân

yêu tố chính thúc đây sự tăng trưởng, mức độ tương tác và doanh thu cho ứng dụng N kho dé đưa ra những

Như thông tin chí tiệt hữu ích gc như đề hiệu lý do tại sao ho

Trang 25

Gồm các khách hàng đã đăng ký sử dụng sản phẩm hoặc dịch vụ của công ty trong khoảng thời gian nhất định (có- thê tính theo tuần, tháng hay quý phụ thuộc vào vòng đời sản phẩm của mỗi công ty)

Phân tích, phân loại nhóm khách hàng dựa trên thời gian g1úp giảm tỷ lệ Chum

Phân loại dựa trên phân khúc khách hàng

Là dạng phân loại dựa trên các khách hàng đã mua [ sản pham cy thê hoặc đã trả khoản tiền nhất định cho dịch vụ nào đó Thông thường, phân nhóm khách hàng theo phân khúc như này để hiểu rõ nhu cầu khác nhau của nhóm đối tượng, từ đó đưa ra chiến dịch giới thiệu các sản phẩm — dịch vụ phù hợp cho từng phân khúc

Phân nhóm dựa trên kích thước nhóm

Những khách hàng đã mua sản phâm hay sử đụng dịch vụ của bạn có thể gom lại thành một nhóm Nhóm này đối tượng chủ yếu là công ty nhỏ mới thành lập, công ty tầm trung hay công ty lớn đạng tập đoản

Với cách phân loại này, dễ đàng khảo sát và so sánh sức mua hàng dựa trên số lượng sản phẩm đã bán ra Trong từng danh mục hàng hoá, có thế xem xét coi đâu là sản phâm khách hàng quan tâm và mua nhiều nhất đề có các chương trình đây mạnh việc bán hàng

Ở mô hình kinh doanh SaaS, những công ty nhỏ hay mới khởi nghiệp thường có tỷ lệ churn cao hơn các công ty lớn Bởi vỉ công ty nhỏ, mới mở thường có kinh phí thấp nên ban đầu cần phải thử nghiệm sản phẩm dịch vụ giá rẻ dé chon ra san pham mũi nhọn cho mình Các công ty lớn có nguôn vốn ôn hơn nên sẽ có xu hướng gắn bó với một sản phẩm trong thời gian đài

Trang 26

2.5.5 Các ứng dụng cua phan tich Cohort

- _ Khi triển khai một dự án phát triển mới cần đo đạc hiệu quả của dự án so với thông thường

- _ Khi triển khai các campaign/chién dich can phan tich hiéu qua - Khihé théng có rất nhiều khách hàng vào hàng tháng mà lưu lượng hàng tháng không giống đều nhau (đang tăng trưởng/đang giảm tốc)

- _ Cần phân tích được các mốc về sự gắn kết của khách hàng: sử dụng, sử dụng thường xuyên, gia hạn,

- Tổng quát hóa: các hệ thống có đầu vào biến thiên và quá trình diễn ra theo | chu ky thoi gian dai (tuan/thang/quy, .) như các dự án phát

triên/campaign/tăng trưởng/giảm tốc

Trang 27

Chương 3: Chuẩn bị dữ liệu

3.1 Mô tảvề dữ liệu

3.1.1 Dữ liệu nghiên cứu

Nghiên cứu thực hiện trên dữ liệu AdventureWorks Sales Đây là dữ liệu ban hàng của công ty Adventure Works Cycles trong lĩnh vực sản xuất và kinh doanh xe đạp Tập dữ liệu chứa 121.253 giao dịch trong khoảng thời gian từ 7/2017 đến 6/2020

3.1.2 M6 ta các đữ liệu trong tập dữ liệu

Tập đữ liệu bao gồm đữ liệu về các đơn hàng (Sales Order data), vị trí khách hang (Sales Territory data), théng tin các giao dịch bán hàng (Sales data), bán lại (Reseller data), thời gian giao dich (Date data) thông tin khách hàng (Customer data) và đữ liệu sản pham (Product data)

Sales Order_data:

Dit liéu worksheet Sales Order data

Các đôi tác kênh bán hàng trong dữ liệu gôm 2 loại: ban thông qua các kênh bán lại và bán hàng trực tuyên

Dữ liệu không có giá trị rỗng

Các thông tin trong dữ liệu:

Trang 28

đơn hàng

tương từng sản phâm Sales Territory_data:

SalesTerritoryKey Region Country Group 8 1 Northwest United States North America 1 2 Northeast United States North America 2 3 Central United States North America 3 4 Southwest United States North America 4 5 Southeast United States North America 5 6 Canada Canada North America 6 7 France France Europe 7 8 Germany Germany Europe 8 9 Australia Australia Pacific 9 10 United Kingdom United Kingdom Europe 10 11 Corporate HQ Corporate HQ Corporate HQ

Dit ligu worksheet Sales Territory_data

Thông tín về vị trí khách hàng được chia thành 4 nhóm: Bắc Mĩ, châu Âu, Thái Binh Duong va tai trụ sở chính của công ty Trong đó có 6 nước: MI, Canada, Pháp, Đức, Úc và Vương quốc Anh Về phân vùng g6m co 10 vung: Tay Bac, Dong Bac, trung tâm, Tây Nam, Đông Nam nước Mỹ, Canada, Pháp, Đức, Úc, Vương quốc Anh và tại trụ sở chính công ty

Data columns (total 4 columns):

Cac thông tin trong dữ liệu:

Tén cot

SalesTerritory Key

Kiéu dt liéu int64

Ntuna

M6 ta

Mã tương ứng từng vùng lãnh thô

Trang 29

Region obJect Tên các vùng mà công ty hoạt động gôm có LÍ vùng

6 nước

Sales_data

Dit ligu worksheet Sales data

Dữ liệu về thông tin các giao dịch Nghiên cứu sẽ tập trung các thuộc tính: Customer Key, Order Date Key, SalesOrderLineKey, Sales Amount

Mô tả về thông tin các cột quan trọng:

Tên cột Kiểu đữ liệu Mô tả

Trang 30

hàng

Reseller_data:

Dit liéu worksheet Reseller data Dữ liệu về các bên bán lại

Date_data:

Trang 31

; Dữ liệu trong worksheet Date data Dữ liệu về thời gian giao dich

Product_data

Dir liéu trong worksheet Product data

Thông tin về các san pham: ma san pham, tên sản phâm, mầu mã, màu sắc,

Trang 32

“ aon a aan + "+

Mô tả thông tin các cột quan trọng:

Tên cột Kiểu dữ liệu Mô tả

List Price float64 Giá sản phẩm

Customer_data:

Dit liéu trong worksheet Customer data

Dữ liệu về thông tin khách hàng bao gôm: mã khách hàng, tên khách hàng và vị trí cụ thê của khách hàng.

Trang 33

Mô tả thông tin các cột quan trọng

3.2 Phan tich kham pha dit liéu 3.2.1 Lam sạch đữ liệu

Tìm giá trị rỗng trong dữ liệu Sale Order data

Sales Territory data

Sales data

Trang 34

Reseller data

Product data

Ngày đăng: 27/08/2024, 12:12

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN