Đã có rất nhiều giải pháp được đề ra trong đó có thế đề cập đến phương pháp REM thông qua các đữ liệu từ công tác mua bán hàng của công ty đối với khách hàng trong mà ở đây chính là lĩn
Trang 1UNIVERSITY OF ECONOMICS AND LAW FACULTY OF INFORMATION SYSTEMS
- BAO CAO DO ÁN CUỐI KỲ | ; MON PHUONG PHAP NGHIEN CUU LIEN NGANH
DE TAI RFM - GIAI PHAP HIEU QUA DE PHAN CUM KHACH
HANG TRONG LINH VUC BAN LE
GVHD: Ph.D TS Hé Trung Thành
Nhom 4:
1
Phạm Trà My Hoàng Thanh Trúc Nguyễn Mai Như Luận Truong Ngọc Khiêm
Huynh Ngoc Dung
TP Hé Chi Minh, ngay 21 thang 11 nam 2022
Trang 22 | Pham Tra My K214060401 10 Thành viên
3 | Hoang Thanh Truc K214061264 10 Thành viên
4_ | Nguyễn Mai Như Luận | K214110805 10 Thành viên
5 | Truong Ngoc Khiém K214060397 10 Thanh viên
Trang 3
Lời cảm ơn Lời đầu tiên, nhóm chúng em xin gửi lời cảm ơn chân thành đến thầy Hồ Trung
Thành - piảng viên khoa Hệ thông thông tin trường Đại học Kinh tế - Luật đã tận tâm
dạy bảo chúng em trong suốt kì học vừa qua Thời gian qua lả một khoảng thời gian
không dài nhưng cũng chăng phải ngắn, chúng em đã được tiếp cận với nhiều kiến
thức bổ ích cũng như các kỳ năng liên quan đến REM, K-means va ca những ky nang
thực hành excel vô cùng bồ ích Tích lũy những kiến thức được thầy truyền đạt lại,
nhóm chúng em xin được trình bày đến thầy báo cáo đồ án cuối kỳ “##M- giải pháp
hiệu quả để phân cụm khách hàng trong lĩnh vực bán lẻ”
Mặc dù, cả nhóm chúng em đã nô lực tìm hiểu thêm về các kiến thức liên quan
và cả các kỹ năng cần thiết để thực hiện đồ án nhưng chúng em cũng không thể hoan
toàn tránh khỏi những thiếu sót trong quá trình làm việc Vì vậy, nhóm em rat mong
nhận được những lời nhận xét và ý kiến từ thầy để có thể sửa đổi, bố sung, nâng cao
kỹ năng làm việc và kiến thức của chúng em, để phục vụ tốt hơn cho các công tác sau
này Nhóm em xin gửi lời cảm ơn đến thầy, chúc thầy và gia đình luôn có thật nhiều
sức khoẻ
Trang 4Lời cam kết Nhóm chúng em xin cam đoan đồ án “REM- giải pháp hiệu quả đề phân cụm khách hàng trong lĩnh vực bản lẻ” do chính nhóm chúng em thực hiện
dưới sự hướng dẫn của thầy Hồ Trung Thành và có tham khảo các nguồn tài
liệu có liên quan để phục vụ cho mục đích nghiên cứu Nhóm chúng em xin
chắc chắn rằng toàn bộ nội dung bài báo cáo là trung thực, duy nhất và không
hề tồn tại sự gian lận Đồng thời, toàn bộ các số liệu, thong tin có trong bai bao
cáo đều là kết quả của quá trình thực hành Nếu có xuất hiện bất ky van dé gian
dối, sai lệch, nhóm chúng em xin chịu mọi trách nhiệm
Trang 5Mục lục Danh mục bảng biểu
Danh mục hình ảnh và đồ thị
Bảng thuật ngữ viết tắt
Sơ đồ Gantt
Tổng quan đồ án
Chương l: Tổng quan về tình hình nghiên cứu
1.1 Tông quan tình hình nghiên cứu
1.2 Sơ đồ mô hình
1.3 Đánh gia chung
1.4 Khoảng trông nghiên cứu vả những điêm mới của nhóm
Chương 2: Cơ sở lý luận
2.1 Hành vi khách hàng
2.1.1 Khái niệm hành vi khách hàng
2.1.2 Vai trò của việc nghiên cứu hành vị khách hàng
2.1.3 Tại sao cần nghiên cứu hành vi khach hang?
2.1.4 Phân loại về hành vi khách hàng
2.1.5 Các yếu tô ảnh hưởng đến hành vi khách hàng
2.2 Phân khúc khách hàng
2.2.1 Khái nệm phân khúc khách hang
2.2.2 Tầm quan trọng của việc phân khúc khách hàng
2.2.3 Các phân khúc khách hàng phô biến
2.3 Tông quan về mô hình REM
2.3.1 Khải niệm mô hình RFM
2.3.2 Vai trò
2.3.3 Các biến thể của RFM
2.3.4 Ưu điểm và nhược điểm của REM
2.4 Tổng quan về _K-mean clustering
2.4.1 Khải nệm
2.4.2 Các bước cơ bản của thuật toán
2.4.3 Đánh giá thuật toán K-Means
2.4.4 Ứng dụng trong kinh đoanh
2.5 Cohort analysis - Phan tich theo nhom
2.5.1 Khai niém
2.5.2 Ly do chon phuong phap phan tich Cohort
Trang 62.5.3 Các loại phân tích Cohort
2.5.4 Các loại nhóm Cohort để phân tích
2.5.5 Các ứng dụng của phân tích Cohort
Chương 3: Chuẩn bị dữ liệu
3.1 Mô tả về đữ liệu
3.1.1 Dữ liệu nghiên cứu
3.1.2 Mô tả các đữ liệu trong tập đữ liệu
3.2 Phân tích khám phá dữ liệu
3.2.1 Làm sạch dữ liệu
3.2.2 Thu thập dữ liệu
Chương 4: Mô tả bài toán
4.1 Mô hình REM trên excel
4.2 Mô hình REM trên python
4.3 Mô hình RFM trên K-means
4.3.4 Phân khúc theo K-means
Chương 5: Phân tích thảo luận và đề xuất
5.1 Mô hình REM truyền thống
5.2 Mô hình REM với K-means
Trang 7Danh mục bảng biểu ` Danh mục hình ảnh và đồ thị Bảng thuật ngữ việt tắt
Frequency Tần suất mua hàng của khách hàng
Monetary Tông lượng tiền mà khách hàng đã chi tiêu cho toàn bộ
hoạt động mua sắm
K-means Một trone những thuật toán được sử dụng trong lĩnh vực
Machine Learning thuộc mô hình Học không p1âm sát
Cluster Cụm hay nhóm, gồm các điểm dữ liệu trong phân tích cụm
Outlier Dữ liệu ngoại lai
Bounce rate Tỉ lệ người dùng roi website khi vừa truy cap thay vi
tiếp tục xem các tranp khác thuộc một website
Retention rate Tỉ lệ người dùng quay lại sử dụng sản phẩm trong
một khoảng thời sian nhât định sau lan dau su dung
Trang 8
Sơ đồ Gantt
SƠ ĐỎ GANTT
Ngay batdau ÑÑ Khoảng thời gian
Tìm hiểu NC liên quan |
Thực hiện trên excel bs
Thực hiện trên K-means
Trang 9Tong quan do an
Lý do chọn đề tài:
Ngày nay, yêu cầu cao về cạnh tranh chiến lược và chính sách bán hàng của
từng công ty ngày càng phat triển một cách mạnh mẽ với một mục đích cuối cùng đó
là tôi đa hóa doanh thu đi kèm với giảm thiếu chỉ phí cho sản xuất, kinh doanh các
công ty/công ty không còn áp dụng các chiến lược marketing một cách tông thể như
trước đây với việc gộp chung tât cá các khách hàng để phục vụ củng một loại sản
phâm/dịch vụ Điều này có thể làm giảm khả năng cạnh tranh của công ty/công ty so
với các đôi thủ cạnh tranh khác trên thị trường Đã có rất nhiều giải pháp được đề ra
trong đó có thế đề cập đến phương pháp REM thông qua các đữ liệu từ công tác mua
bán hàng của công ty đối với khách hàng trong mà ở đây chính là lĩnh vực bán lẻ từ
chính những đữ liệu này có thể giúp chúng ta tông hợp được đặc điểm mua hàng của
từng khách hàng sau đó phân cụm khách hàng rõ ràng để có những chính sách và hậu
mãi riêng biệt dé co thé tăng doanh thu và níu chân khách hàng biến họ trở thành tệp
khách hàng trung thành cho công ty
Tuy nhiên, việc phân cụm khách hàng đòi hỏi một khôi lượng lớn nguồn
lực thì mới có thể thực hiện một cách đầy đủ và chính xác nhất để có thê trình
bày một cách chỉ tiết về cụm khách để công ty có những phán đoán kịp thời và
ra quyết định cho chiến lược kinh doanh của mình
Việc áp dụng học máy vảo trone phân khúc khách hàng giúp ta tiết kiệm đáng kê nguồn lực của công ty Ngoài ra có thể kê đến độ chính xác và trực
quan từ mô hình REM mang lại Nếu như so với việc thực hiện REM một cách
thủ công từ bàn tay con người thì chắc chắn sẽ xảy ra những sai sót phần nảo
ảnh hưởng đến quyết định của công ty Triển khai học máy REM sẽ đòi hỏi một
nguồn đầu tư lớn cho cơ sở vật chất, cơ sở hạ tầng về thiết bị, thu thập dữ liệu
khách hàng Nếu như được đầu tư đúng mức thì công ty chỉ cần thiết lập
những bước ban đầu cho công cụ này sau đó thì lợi ích mà nó mang đến hoàn
toàn lớn hơn so với phần mà họ đã đầu tư
Mục tiêu nghiên cứu
- _ Mục tiêu ngắn han:
+ Phan cum từng tệp khách hàng nhằm có các chính sách bán hàng phù hợp, lọc ra các khách hàng chuyên biệt mang tính biệt lập như có số lần mua hàng ít tuy nhiên số lượng hàng và giá trị hàng hóa tương đối lớn hay các khách hàng có nguy cơ rời bỏ khỏi công ty sẽ được loai bo ngay
từ bước đầu trong xử lí dữ liệu
+ Thể hiện rõ ràng từng tệp khách hàng qua sơ đỗ giúp cho công ty dễ dàng đưa ra quyết định và chính sách bán hàng phù hợp với từng tệp khách hàng cụ thể từ đó tối đa hóa doanh thu
- Mục tiêu dài hạn:
+ Áp dụng học máy vào trong phân tích đữ liệu đối với khách hàng trong nganh ban lẻ Từ đó, có thê tiết kiệm nguồn lực phục vụ cho việc phân tích trong lâu dải
Trang 10+ Tạo ra lợi thế cạnh tranh một cách rõ rang nhằm vượt qua đối thú và có nhiêu chính sách thu hút lượng lớn khách hàng trên thị trường ngành hàng bán lẻ
Đối tượng và phạm vị nghiên cứu Đối tượng: tệp dữ liệu khách hàng của công ty Adventureworks Cycles với nhiều đữ liệu mua hang
Phạm vi nghiên cứu: Phạm vị nghiên cứu là địa bàn các nước lớn như
Mỹ, Canada, Đức, Pháp, được thu thập dữ liệu và nghiên cứu trong vòng 2
tháng
Phương pháp nghiên cứu
Bước đầu tiên, nhóm tiến hành xử lý dữ liệu thông qua giải pháp EDA
bằng ngôn ngữ Python, được biết đến chính là ngôn ngữ ở hữu lượng lớn các
khối cơ sở đữ liệu, phục vụ hiệu quả cho các chương trình mang tính thương
mại Thông qua phương pháp này giúp nhóm loại bỏ được các dữ liệu rỗng
giúp cho quá trình phân cụm khách hàng trở nên nhanh chóng, xóa bỏ được
nhiều đữ liệu ngoại lệ có giá trị quá thấp hoặc quá cao gây ảnh hưởng đến quá
trinh phân cụm Mặt khác, các dữ liệu này sẽ được phân thành một cụm riêng
biệt đề để dàng quyết định hơn
Sau khi các đữ liệu được lọc sạch sẽ được đưa vào và thể hiện lên trên biểu đồ thông qua thư viện matplotlib trong ngôn ngữ Python sau đó phương
pháp Elbow được áp dụng nhằm xác định số lượng K-Cluster cụ thê để có thé
cho chính xác số lượng cụm mà nhóm quyết định
Việc thê hiện và áp dụng số cụm sẽ được so sánh giữa từng đại lượng bao gồm giữa Frequency, Monetary, và Recency sau đó được trực quan hóa
liên trên biểu đồ 3D và cuối cùng sử dụng Silhouette nhằm xác định độ chính
xác về việc phân cụm tệp khách hàng thành nhiều tệp riêng biệt
Phương pháp nghiên cứu định lượng: thu thập thông tin từ các nguồn tư
liệu khác nhau nhằm xây dựng các mô hình lý thuyết hay thực nghiệm ban đầu
của nhóm Bên cạnh đó điều tra thực nghiệm có hệ thông các hiện tượng quan
sát được qua số liệu thống kê nhóm thu thập được
Phương pháp nghiên cứu định tính: Sau khi phân tích kết quả nghiên cứu, nhóm sẽ tiến hành diễn giải phân tích sau khi có được kết quả cuỗi cùng,
nhóm sẽ nghiên cứu và xem xét lại những thành quả thực tiễn trong qua khir dé
rút ra tóm lại bố ích cho thực tiễn và khoa hoc
Ý nghĩa thực tiễn của nghiên cứu:
Nghiên cứu tập trung phân tích hành vi mua hàng của người tiêu dùng từ đó
tìm ra những tệp khách hàng có cùng đặc điểm hành vi, tính cách, thói quen mua
hàng, qua đó đề xuất các chiến lược marketing phù hợp với từng phân khúc khách
hàng khác nhau Tạo được nhiều cơ hội phát triên nông nghiệp Việt Nam và nên tảng
thương mại bán lẻ trực tuyến phát trién bền vững
Nghiên cứu đưa ra các đề xuất thông qua việc thử nghiệm các mô hình trên ba
công cụ phổ biến dành cho các công ty trong lĩnh vực kinh doanh nói chung và các
lĩnh vực liên quan Từ đó, các công ty sẽ có thé chon cho cho mình mô hình hiệu quả,
Trang 11tối ưu nhưng vẫn có thê tiết kiệm chí phí sao cho phù hợp với tình hình công ty Hơn
nữa, các công ty sẽ có thêm nhiều cái nhìn bao quát hơn về khách hảng và thị trường
của họ đề thúc đây các quá trình cải thiện hoạt động và hiệu suất sản phẩm dịch vụ
của các công ty để cạnh tranh hiệu quả hơn trên thị trường
Keyword: Phan khuc khach hang, RFM, hoc may, Phan cum K-means, Cohort
Kết cấu đồ án:
D6 an được kết cấu sồm 5 chương như sau:
Chương 1: Tổng quan về tình hình nghiên cứu
Chương 2: Cơ sở lý luận
2.1 Hành vi khách hàng 2.2 Phân khúc khách hàng 2.3 Mô hình RFM 2.4 Tong quan vé K-mean clustering
2.5 Cohort analysis - Phân tích theo nhóm Chuong 3: Chuẩn bị dữ liệu
Chương 4: Mô tả bài toán
4.1 Mô hình RFEM trên excel
4.2 Mô hình REM trên python
4.3 Mô hình RFM trên K-means Chương 5: Phân tích thảo luận và đề xuất
Trang 12Chương 1: Tông quan về tình hình nghiên cứu 1.1 Tổng quan tình hình nghiên cứu
Trong lĩnh vực tiếp thị, quảng bá thương hiệu, sản phâm đến người tiêu dùng hay đề xuất giải pháp cho các công ty, việc phân loại khách hàng mục
tiêu luôn là một vấn đề quan trọng và cần được đầu tư phát triển Phân tích dữ
liệu lớn đóng một vai trò quan trọng trong việc ra quyết định bán lé, đặc biệt
khi đữ liệu liên quan đến hành vi của khách hàng Phân tích hành vi khách hàng
giúp chủ công ty thực hiện các quyết định quan trọng ảnh hưởng đến các khía
cạnh khác nhau của cửa hàng bán lẻ, nơi hành vị không chỉ giới hạn ở hành vĩ
mua hàng của khách hàng (Mussadiq Abdul Rahim và cộng sự, 2021)
Phân cụm khách hảng (customer segmentation) là quá trình phân chia khách hàng dựa trên các đặc điểm chung như hành vi, thói quen mua săm và sử
dụng dịch vụ của họ, dé các công ty, công ty có thể tiếp thị cho từng nhóm
khách hàng một cách hiệu quả và phù hợp hơn Với các đặc điểm của nhóm
khách hàng, thi việc phân cụm theo điểm chỉ tiêu và thu nhập cho công ty thay
rõ ràng hơn cụm khách hàng mục tiêu, và theo thuật toán K-Means thì việc
phân thành 2 cụm khách hàng là tôi ưu (Phạm Kiên Trung và cộng sự, 2020)
Để đạt mục tiêu trên, có nhiều phương pháp đã được tiến hành trên nhiều lĩnh vực khác nhau dé tiến hành phân cụm các khách hàng mục tiêu
Trong lĩnh vực dịch vụ viễn thông và dịch vụ tài chính, nghiên cứu của Arne
Floh và cộng sự (2013) đã dựa trên mô hình về khái niệm đa chiều để đánh giá
các điểm không dong nhất ở chính khách hàng đã ủng hộ mạnh mẽ lập luận
rằng ảnh hướng giá trị cảm nhận là ý định về mặt môi trường, nhưng các tác
động đó cũng khác nhau về mức độ tùy thuộc vào phân khúc người tiêu dùng
(Arne Floh và cộng sự, 2013) Trong lĩnh vực bảo hiểm, (Wafa Qadadeh và
Sherief Abdallah, 2018) đã sử dụng 2 kỹ thuật khai thác dữ liệu là phân cụm K-
Means và kỹ thuật SOM (dựa trên ANN) Thông qua phân tích cụm và trực
quan hóa dữ liệu đa chiều có thể biết được đặc điểm tính cách khách hang trong
CRM, từ đó có thể thiết kế một kế hoạch marketing riêng cho từng loại khách
hang của công ty Còn trong lĩnh vực kinh doanh mỹ phẩm, Sari Hartini và
cộng sự (2020) đã thu được mô hình phân tích hồ sơ và phân khúc khách hàng
hiệu quả sử dụng thuật toán phân nhóm và phân loại cho kết quả rằng mô hình
thuật toán có thê cung cấp giải pháp cho những nhu cầu này là mô hình thuật
toán K-Means + Na rve Bayes, với giá trị chính xác cao là 65, 87% Ở Việt
Nam, trong lĩnh vực bán lẻ, Nguyễn Phúc Sơn và cộng sự (2021) đã tập hợp dữ
liệu giao dịch bán lẻ từ một chuỗi siêu thị ở Thành phố Hồ Chí Minh, Việt
Nam để thiết kế mô hình phân đoạn mới dựa trên sự kết hợp của mạng nơ-ron
sâu và kỹ thuật phân cụm xác suất tự siám sát Mô hình mới linh hoạt hơn và
thích ứng hơn với sự đa dạng của bộ dữ liệu khách hàng so với các thuật toán
heuristic hién tai trong CRM Trong linh vực du lịch và khách sạn, Arkadiusz
T.Tomezyk va cong su (2022) đã thông qua WTP (so sánh về mức chỉ tiêu của
khách hàng sẵn lòng chỉ tiêu) đi sâu về lĩnh vực cá nhân hóa cho chính khách
hàng đồng thời kết hợp với CeoP đê tìm ra mức phân khúc phù hợp cho những
gi khach hang chi tiêu và thứ họ nhận lại được từ đó đề xuất kiểu khách hảng
đề hỗ trợ chiến lược phân khúc và định giá
Trang 13Các nghiên cứu trước đây đã triển khai mô hình hành ví mua hàng dựa trên hành vi thế chất của một đối tượng Hiện nay, có nhiều phương pháp giúp
công ty thực hiện việc phân cụm khách hàng mục tiêu dựa trên những hiểu biết
về hành vi (behavior), thói quen (habits), sở thích (preferences) của khách hàng
tiềm năng như KMeans, Mean-Shift, Density-Based Spatial, Expectation-
Maximization, Agglomerative Hierarchical Clustering (Chen et al., 2012)
REM là một trong những phương pháp phân tích được sử dụng rộng rãi nhất để phân tích khách hàng thông qua phân khúc và lập hồ sơ khách hàng
(San Hartim và cộng sự (2020) Mô hình RFM cho hanh vi mua hang cua
khách hàng sử dụng thuật toán K-Means đã áp dụng trí tuệ kinh doanh trong
việc xác định khách hàng tiềm năng bằng cách cung cấp dữ liệu phù hợp và kịp
thời cho các đơn vị kinh doanh trong ngành Bán lẻ Một loạt các cum tap dit
liệu được xác nhận dựa trên việc tính toán Hệ số Silhouette Do đó, kết quả thu
được liên quan đến giao dịch bán hàng được so sánh với các thông số khác
nhau như lần truy cập bán hàng, tần suất bán hàng và khối lượng bán hàng (P
Anitha, Malini và M.Patil, 2019) Mô hình REMI và các kỹ thuật lập mô hình
đữ liệu được dùng để phát hiện các mẫu hành vi của khách hàng Mỗi giao dich
được phân bổ cho khách hàng là một phần trong hành vi của một người và là
một ví dụ của vectơ đặc điểm, nó được mô hình hóa dựa trên một tập hợp các
giao dich để tạo thành hành vi mua lại Phân tích thực nghiệm cho thấy tám
giao dịch 1a du dé phan loại khách hàng với độ chính xác cao (Mussadiq Abdul
Rahim và cộng sự, 2021) Bên cạnh đó, mô hình đữ liệu REM sử dụng phương
pháp Elbow với chỉ số kiểm định Silhouette đề tối ưu số cụm khách hàng, hệ sỐ
chuẩn (Z- score) va Quy tac kiém chứng (Empirical Rule) được áp dụng để xử
liệu các đữ liệu bất thường (Outlier) và phương pháp Cohort để phân tích tý lệ
duy tri khách hàng kết hợp biểu đồ nhiệt trên phân phối ma trận Mô hình này
dựa trên dữ liệu giao dịch với những tham số đặc trưng và cau trúc tương đồng
co thé tìm thấy trên các hóa đơn bán hàng trong bất kỳ cửa hàng tại các nước
trên thế giới cũng như tại Việt Nam và áp dụng phương pháp học máy không
giám sát để phân tích phân khúc khách hàng và tìm ra những giá trị thật sự
(insight) co kha năng tác động, ảnh hướng tới hành vi và quyết định mua hàng
của khách hàng (Hồ Trung Thành và Nguyễn Đăng Sơn, 2021)
Ngoài mô hình RFM truyền thông, nhiều nhóm tác giả đã phát triển nhiều mô hình RFM sáng tạo kết hợp với nhiều kỹ thuật khác nhau để giải
quyết các điểm yếu của mô hình truyền thống Một mô hình mới liên kết mô
hình REM với gi4 tri lau dai cua khách hàng (CLV) sử dụng đường cong gia tri
đẳng cấp để tính toán phân khúc khách hàng, nhóm các cá nhân lại với nhau,
những người có hành vi mua sắm khác nhau nhưng có giá trị tương đương
trong tuong lai (Peter S Fader va céng sự, 2005) Tính chu kỳ của nhu cầu sản
phâm ở mô hình truyền thống chưa có thể được ước tính dựa trên hành vi mua
của mỗi khách hàng, khiến cho khó đề xuất sản phâm vào đúng thời điểm phù
hợp với yêu cầu mua Để đối phó với tính chu kỳ của sản phâm, mô hình
TREM có tính đến tính chất sản phẩm và tính chu kỳ mua hàng Phương pháp
này kết hợp đặc tính sản phẩm và chu kỳ mua hàng để đo lường lòng trung
thành của khách hàng và phân tích hành vi mua hàng của khách hàng (Li-Hua
Li và cộng sự, 2006) Ngoài ra, còn có mô hình kết hợp giá trị định lượng của
Trang 14các thuộc tính REM và thuật toán K-mean vảo lý thuyết tập hợp thô (lý thuyết
RS), để trích xuất các quy tắc ý nghĩa và nó có thể cải thiện một cách hiệu quả
mạng nơ-ron có thời øian đảo tạo lâu và thuật toán di truyền trong CRM
(Ching-Hsue Cheng va You-Shyang Chen, 2009) Phan tich dir ligu mua hang
của khách hang trong lĩnh vực thương mại điện tử bằng 3 thuật toán phân cụm:
K-means Clustering, Fuzzy C-means Clustering va Hierarchical Clustering
được xây dựng trên ngôn ngữ lập trình R dé hiểu rõ về hành vi va phan khúc
khách hàng dựa trên mô hình REMI Chỉ số Dumn chỉ ra rằng mô hình phân cấp
hoạt động tốt hơn so với mô hình K-means và mô hình Fuzzy C-means vé mat
tao ra mét cum tot (Oluwasurefunmi ldowu và cộng sự, 2019) Mô hình RFM
trên mỗi sản phâm (REM/P) được đề xuất để ước tính giá trị của khách hàng
trên mỗi sản phẩm trước tiên và sau đó tông hợp chúng lại để thu được giá tri
tông thế của khách hàng Ngoài ra, khi có những thay doi trong hanh vi mua
hang cua khach hang liên quan đến lần truy cập gần đây trên mỗi sản phẩm vả
tần suất trên mỗi sản pham, thong thường, độ chính xác của dự đoán REM/P
được nhận thấy là tốt hơn so với REM truyền thống (Rodrigo Heldta và cộng
Trong một thập kỷ vừa qua chứng kiến những tiến bộ vượt bậc của khoa
học kĩ thuật cùng với đó, công nghệ khoa học dữ liệu hiện nay cũng đã phát
triển không ngừng giúp việc thu thập và xử lý dữ liệu khách hàng trở nên dễ
đàng hơn, mạng đến nguồn tài nguyên quý giá, giàu tiềm năng cho việc phân
tích hành vị khách hàng trong kinh doanh Việc phân tích phân khúc khách
hàng đóng một vai trò quan trọng giúp công ty, công ty tập trung hóa, đề ra các
chiến lược marketing hop ly và chăm sóc tốt hơn các nhóm khách hàng, đồng
thời duy trì và phát triển công ty, công ty trong bối cảnh thị trường cạnh tranh
vô cùng khốc liệt
1.4 Khoảng trồng nghiên cứu và những điêm mới của nhóm Tổng quan các công trình trong nước và trên thế giới chỉ ra rang phân khúc khách hàng băng mô hình REMI không phải là điêu mới Tuy nhiên,
nhóm tac gia nhận thây có một số khoảng trông sau:
Trang 15Thứ nhất, các hệ thông quản lý khách hàng ngày cảng được tự động hóa Tuy nhiên, hệ thống chủ yếu là phi nhận dữ liệu giao dịch và thực
hiện những thống kê định kỳ theo phương pháp truyền thống dẫn đến kết quả
chưa đảm bảo được tính khách quan, chính xác và khó phân tích được hành vị
mua sắm của khách hàng để có cơ sở xây dựng chiến lược tiếp cận khách hàng
và bán hàng hiệu quả hơn
Thứ hai, mô hình đề xuất không xem xét đến sự cạnh tranh trên
thị trường Hơn nữa, mô hình phân tách được đề xuất giả định sự độc lập piữa
các loại sản phẩm Đây có thể là một vấn đề không nhỏ tùy thuộc vào một số
trường hợp
Đây là một nghiên cứu mới để đi sâu vào phân tích đữ liệu cho một công ty cụ thể Adventureworks Cvycles với mục đích phân khúc khách
hàng thông qua mô hình REM và phương pháp học máy, từ đó đề xuất giải
pháp hiệu quả cho chiến lược kinh doanh hiệu quả Bên cạnh đó, nghiên cứu
còn áp dụng thêm phương pháp học máy phân cụm K-means để tự động som
cụm nhóm khách hàng có cùng đặc điểm Phương pháp học máy nảy sẽ tiết
kiệm thời gian và chính xác hơn so với việc tính toán mô hình REMI truyền
thông sử dụng excel hoặc python không dùng học máy
Tông kết lại, nhóm tác giả cho răng có một khoảng trống trong nghiên cứu vê mô hình phân tích dữ liệu phân khúc khách hàng Đây chính là
căn cứ quan trọng, để nhóm tác giả lựa chọn đề tài của nghiên cứu: “®ƑÄ⁄ —
GIAI PHAP HIEU QUA DE PHAN CUM KHACH HANG TRONG LINH VUC
BAN LE”
Trang 16Chương 2: Cơ sở lý luận 2.1 Hành vì khách hang
2.1.1 Khải miệm hành vì khách hàng
Hành vi khách hàng bao gồm những tâm lý của khách hàng như suy nghĩ, cảm
nhận, các phản ứng đối với sản phẩm, dịch vụ và toàn bộ những hoạt động của khách
hàng trong quá trình tiêu dùng như quyết định mua sắm, sử dụng hay ngừng sử dụng
sản phẩm Quá trình này chủ yếu liên quan đến sự biến đổi của các yếu tổ tâm lý,
dong lực và hành vi
Nghiên cứu hành vị khách hàng là việc phân tích hành vị khách hang sẽ dựa trên
suy nghĩ, hành động, cảm nhận và thói quen mua hàng đã có Những thói quen này có
thê được thay đổi nhờ sự tương tác qua lại của các yêu tô gây nên sự tò mò, kích thích
và nhận thức của con n8ười
2.1.2 Vai trò của việc nghiên cứu hành vi khách hang
- _ Định vị thương hiệu theo hướng “cá nhân hóa”: giúp công ty đánh thắng vào
nhu cầu của khách hàng, kích thích họ mua hàng
-_ Lên mục tiêu và kế hoạch kinh doanh khả thi: từ việc thu thập dữ liệu về doanh
thu, thời gian, tần suất mua hàng, đưa ra dự đoán về khách hàng tiềm năng có
thé tiếp cần để đề ra các chiến lược kinh doanh hiệu quả
- Tối ưu chiến lược Marketing: dựa trên phân tích diễn biến nhân thức, tâm lý
cua khach hang về các sản phẩm, đề ra những giải pháp cải tiền, thay đôi chiến
lược truyền thông, marketine sao cho phù hợp va toi ưu
- Tăng mức độ trung thành của khách hàng đối với thương hiệu: từ việc thỏa
mãn các nhu cầu của khách hàng biến họ thành đối tượng trung thành với các
sản phẩm của thương hiệu
- _ Tăng vị thế cạnh tranh với đối thủ: với hiểu biết về hành vi khách hàng giúp
công ty tạo ra sản phẩm khác biệt thỏa mãn hoặc vượt trên mong muôn của
khách hàng, đồng thời đề ra chiến lược kinh doanh, Marketing hiệu quả
2.1.3 Tại sao cẩn nghiên cứu hành vi khách hàng?
- _ Xác định đúng khách hàng tiềm năng: đây là một hoạt động quan trọng, quyết
định tính hiệu quả các chiến lược và hoạt động kinh doanh của công ty Đề đạt
được điều đó, cần phải xác định được nhụ cầu, hành vi, tính cách của khách
hàng sao cho phù hợp với các sản phẩm và mục tiêu của công ty
- _ Cá nhân hóa trải nghiệm của khách hàng: bằng việc sử dụng những dữ liệu thu
thập được, công ty đề ra các chiến lược nhắm đến các đôi tượng khách hàng cụ
thể Từ nghiên cứu hành vi khách hàng, công ty dễ dàng phân nhóm khách
hàng dựa trên hành vi, nhu cầu và sở thích phù hợp để nâng cao trải nghiệm
của từng nhóm đối tượng
- _ Dự báo doanh thu và xu hướng mua sắm
- _ Cảnh báo rủi ro kinh doanh
- _ Tối ưu hóa các chiến dịch
- _ Giữ chân khách hàng hiệu qua
2.1.4 Phân loại về hành vì khách hàng
Các hành vi của khách hàng có thể chia thành 2 nhóm:
- - Nhóm hành vi có thể quan sát được: các hành vi liên quan đến số lượng, thời
gian, địa điểm, xu hướng tiền kiếm, số tiền
Trang 17- Nhóm hành vi không thé quan sát được: cách khách hàng sử dụng sản pham,
chia sẻ, đánh giá về sản phẩm
2.1.5 Các yếu tô ảnh hưởng đến hành vì khách hàng Hành vi tiêu dùng chịu ảnh của cả yêu tổ bên trong và bên ngoài:
- _ Yếu tố văn hóa:
+ Nền văn hóa: là yếu tố quan trọng cần được phân tích trong mọi chiến dịch thâm nhập thị trường chưa được xác định Việc biết được những đặc trưng của từng nền văn hóa và lựa chọn phù hợp với mục tiêu của công,
ty giúp truyền tải đúng thông điệp của chiến dịch hiệu quả hơn
+ Văn hóa cộng đồng: việc xác định những nhóm văn hóa giúp công ty
_ phân nhóm khách hàng và cá nhân hóa tốt hơn
- Yếu tô xã hội: cộng đồng, mang xa hội, tầng lớp xã hội, gia đình, dia vị
- Yếu tô cá nhân: tuôi tác, giới tính, nghề nghiệp, tính cách, bàn cách sống
- _ Yếu tổ tâm lý: Động cơ, nhận thức, lĩnh hội, niềm tin, thái độ
2.2 Phân khúc khách hàng
2.2.1 Khải mệm phân khúc khách hàng Phân khúc khách hàng là nhóm các đối tượng khách hàng được phân chia theo
từng đặc điểm cụ thể Từng phân khúc khách hàng khác nhau sẽ có những đặc điểm,
hành ví mua hàng khác nhau, ảnh hưởng đến chiến lược kinh doanh của công ty Tùy
vào phân khúc khách hàng khác nhau, công ty nên chuẩn bị nội dung, thông điệp, một
chiến lược tiếp thị, bán hàng phù hợp với phân khúc, đối tượng khách hàng mục tiêu
sé mang dén hiéu quả vượt trội trone hoạt động kinh doanh của công ty
2.2.2 Tầm quan trọng của việc phân khúc khách hàng
Phân khúc khách hàng giúp bạn dễ dàng hơn trong quá trình cá nhân hóa các
hoạt động tiếp thị sau này
+ Xác định khách hàng mục tiêu: giúp bạn khoanh vùng được đối tượng phủ
hợp, tập trung vào nhóm các đối tượng này và tiết kiệm tối đa chỉ phí cho các hoạt
động tiếp thị
+ Điều chỉnh thông điệp đề tiếp cận nhanh chóng hơn với nhóm khách hảng mục
tiêu: các nội dung khi đã xác định được mục tiêu, bám sát vào nhóm đối tượng nảy sẽ
rut ngan thoi gian thye hién chién dich, đồng thời mang lại hiệu quả cao nhất cho toàn
bộ chiến dịch
+ Đáp ứng một nhụ cầu cụ thé tir do giup gia tăng tý lệ chuyến đối: việc xác định
chính xác mong muốn của một khách hàng tiềm năng sẽ gia tăng cơ hội biến họ thành
khách hàng thực sự của công ty
+ Xây dựng mối quan hệ bên chặt và có được sự trung thành từ khách hàng
+ Mở rộng tệp khách hàng tiềm năng của bạn để đây nhanh chu kỳ bán hàng
2.2.3 Các phân khúc khách hàng phô biển Các công ty thường nhóm đối tượng khách hàng theo các yếu tô như nhân khâu
học, hành vị, thu nhập và vị trí của họ trong hành trình mua hàng Chiến lược được sử
dụng dé phân khúc khách hàng sẽ phụ thuộc vào sản phẩm hoặc dịch vụ mà công ty
cung cập
Trang 18Phân Theo nhân Theo hành | Theo hành | Theo mức | Theo loại
khúc khấu học vì trinh mua | độ tham gia Kops >
£
Khai | Day là cách Chiến lược |Chiến lược Tương tác Tối ưu hóa
niệm | phân khúc phố|này mang |kinh doanh |với những | một nội
biến nhất và dễ |tính chuyên |này giúp |kháchhàng | dung cụ thể nhất Tuổi tác, |sâu hơn một |điều chỉnh |vớimức độ | cho từng mức thu nhập, |chút so với | các nội | tương tác loại thiết bị
công việc và vị | vIỆc phân | dung và | thấp bằng trí địa ly là tất | khúc theo |thông điệp chiến dịch
cả yếu tố mà |nhân khấu |của mình | được xây bạn có thể sử | học Phân | dựa trên vị | dựng và thiết dung dé sắp |tích hành vi | trí của | kế riêng cho xếp các nhóm | nghĩa là xem | khách hàng | họ, chang đôi tượng của | xét những gì |trone hành | hạn sử dụng mình khách hàng [trình mua | các ưu đãi,
mua, tần suất | hàng của họ | khuyến mãi
và lý do tại sao họ chọn
phâm hoặc dịch vụ đó
Ưu |- Thu thập dữ |-Dễ dàng lập | Giúp hướng |Không bỏ | Giúp người
điểm | liệu dé dang kế hoạch đến từng | qua các phân | dùng dễ
- Nhăm mục |-Dễ dàng [người mua |khúc khách |dàng nhấn
tiêu và phân | quảng cáo với từng |hàng — tiềm | vào một
tích đơngiản |-Phân khúc |nhu cầu | năng cuộc khảo
- Tiết kiệm chi |khách hàng |khác nhau sát — hoặc
phí theo hanh vi: |va đưa ra tương tác
-Dé dang đo |Các công ty |câu trả lời vol một
lường có thể phân | phù hợp cho hình ảnh, từ
- Dễ dàng theo |nhóm khách | các câu hỏi đó gia tăng
họ và từ đó
có thể đưa ra chến lược tiếp thị phù hợp
Nhược |-Dựa trên các |-Hành vi của | Tốn khá |Triếển khai|Cần một
Trang 19
điểm
giả định: Phân
khúc theo nhân khẩu học có nhược điểm nằm ở cách tiếp cận một chiều của nó
-Dữ liệu nhân khẩu học quá
mơ hồ: Không
cung cấp cho bạn thông tin chỉ tiết về tính cách của cá nhân đó hoặc những mong
muốn và giá trị
của họ
-Diễn giải sai
dữ liệu: Về cơ bản, dữ liệu
gian của
công ty để
có thể phân tích chính
xác hành trình mua hàng của
người tiêu
dùng Đồng thoi doi net nhan su can đầu tư vào
kế hoạch truyền thông sao
nguôn lực
lớn để liên
tục cập nhật những thay đôi mới của tùng
bị
thiết
=> Có thê sử dụng hai hoặc nhiều phương thức cùng một lúc để mở rộng phạm vi của
mình Một ví dụ cụ thê là gửi một thông báo email cho khách hàng tại Hà Nội (nhân
khâu học), người mua các sản phâm từ bạn một cách thường xuyên (hành vì)
23
Trong đó:
Tổng quan về mô hình RF'M 2.3.1 Khải niệm mô hình RF Mĩ REM (Recency-Frequency-Monetary): là một kỳ thuật phân tích được
sử dụng đề xác định lượng khách nào là khách hàng tốt nhất bằng cách kiểm tra
mức độ gan đây thông qua các số liệu như khách hàng đã mua, tân suất họ mua
và số tiền khách hàng chỉ tiêu
Trang 20
® R(Recency): lần tương tác, giao dịch, mua hàng gần nhất Thời gian đã
trôi qua bao lâu kê từ lần tương tác hoặc giao dịch cuối cùng của khách hàng với công ty? Các tương tác không chỉ ngoài việc mua hàng, lượt truy cập cuôi cùng vào trang web hoặc sử dụng ứng dụng dành cho thiết
bị di động Trong hầu hết các trường hợp, khách hàng tương tác hoặc giao dich voi cong ty càng gần với hiện tại thi khả năng khách hàng đó
sẽ phản hồi với các thông tin từ công ty trong tương lai cảng cao Cong thức tính: thời gian kế từ lúc khách hàng tương tác cuỗi cùng với công ty (ngày, tuần, tháng)
® F(ŒFrequency): tần suất khách hàng giao dịch hay tương tác với công ty
Tần suất một khách hàng đã giao dịch hoặc tương tác với công ty trong
một khoảng thời gian cụ thê như thế nào? Những khách hàng có sự
tương tác thường xuyên thông thường sẽ gan bo hon va trung thanh hon những khách hàng có tần suất thấp hơn Công thức tính: tông số lần giao
dịch, tương tác của khách hàng
® M(Monetary): số tiền mà khách hàng đã chỉ tiêu cho các giao dịch với công ty trong khoảng thời gian cụ thể Những khách hàng chi tiêu nhiều thường mang lại nhiều giá trị kinh doanh cho công ty hơn những khách hang chi tiêu ít Công thức tính: tổng số tiền đã chi tiêu hay trung bình
số tiền khách hàng đã chí tiêu cho mỗi lần giao dịch
2.3.2 Vai tro Thông qua các tiêu chí, mô hình REM giúp công ty xác định:
Khách hàng tốt nhất và tiềm năng nhất của công ty Khách hàng có khả năng rời dịch vụ
Khách hàng mang lại giá trị kinh doanh nhất
Khách hàng trung thành với công ty Khách hàng sẽ tương tác, phản hôi trở lại với những chiến dịch
marketing, quảng cáo của công ty
® Nhóm khách hàng có khả năng sẽ mua sản phẩm mới
2.3.3 Các biến thể của RFM
Ngoài ra REFM còn có các biến thê khác dựa trên sự thay đổi thêm bớt
các biến trong 3 bién Recency, Frequency va Monetary:
@ RFD - Recency, Frequency, Duration (thoi gian) 1a phién bản đã duoc modified cua phan tich RFM Nhung thay vi phan tich gia tri khach hang, RFD duoc sử dụng dé phan tich hanh vi khach hàng theo các nhóm nguoi xem/nguwoi doc/nguoi lướt web
@ RFE - Recency, Frequency, Engagement(muc d6 cam kết) là
phiên bản mở rộng của phân tích RFD nhằm xác định mức độ gắn bó của khách hàng đối với một nền tảng web, app Trường
Eneapement (mức độ cam kết) được xác định thông qua thời lượng truy cập, số trang trên mỗi lượt truy cập và các chiều đữ liệu khác tương tự Mô hình RFE có thể được sử dụng để phân tích hành vị khách hàng theo các nhóm người xem/neười đọc/người lướt web
Trang 21® RFM-I- Recency, Frequency, Monetary Value — Interactions (Giá trị tiền tệ - Tương tác) là một phiên bản khác của REM dé đánh giá chỉ phí tương tác marketing trong tiếp cận khách hàng
@ RFMIC - Recency, Frequency, Monetary Value, Time (Tho1 sian), Churn rate (Tỷ lệ rời bó) là một mô hình REM mở rộng được đề xuất bởi I-Cheng và cộng sự (2009) Mô hình sử dụng chuỗi Bernoulli trong lý thuyết xác suất nhằm dự báo xác suất
mua hảng tại những chiến dịch marketing tiếp theo
2.3.4 Ưu điểm và nhược điểm của RFM
® Uu điểm:
o_ Có thê áp dụng cho nhiều loại hình kinh đoanh khác nhau
© Cé thé giam chi phi tiếp thị bằng cách giúp nhắm mục tiêu
© Tinh diém REM co thể khó khăn
©_ Phân tích REM phụ thuộc vào dữ liệu lich sử và không phải là triển vọng trong tương lai
© Phan tích này có thế không phù hợp nếu bạn chỉ bán một sản phẩm
2.4 Tổng quan về K-mean clustering 2.4.1 Khải niệm
Phân cụm là một phương pháp học tập không giám sát có nhiệm vụ phân tách tập hợp hoặc các điểm đữ liệu thành nhiều nhóm, sao cho các điểm dữ liệu
trong một nhóm giống nhau hơn và không giống với các điểm dữ liệu của các
nhóm khác Nó không là gì ngoài một tập hợp các đối tượng dựa trên sự giống
nhau và không giống nhau giữa chúng
Phân cụm K-means là một thuật toán Học máy không ø1ám sát thực hiện nhiệm vụ phân cụm Trong phương pháp này, các quan sát 'n' được nhóm thành
các cụm 'K' dựa trên khoảng cách Thuật toán cố gắng giảm thiểu phương sai
trong cụm (dé các quan sát tương tự rơi vào củng một cụm)
Phân cụm K-Means yêu cầu tất cả các biến phải liên tục vì nó sử dụng thước đo khoảng cách và thông số kỹ thuật trước đó về số lượng cụm (K)
2.4.2 Các bước cơ bản của thuật toản
Khởi tạo k phần tử trung tâm một cách ngẫu nhiên (mỗi phần tử trung tâm đại diện cho một nhóm)
Thực hiện các bước cơ bản sau cho đến khi tất cả các đối tượng được phân loại và không còn còn sự thay đổi của các đối tượng đến các nhóm:
Trang 221 Chọn ngẫu nhiên K tâm (centroid) cho K cụm (cluster) Mỗi cụm được đại
diện bằng các tâm của cụm
2 Tính khoảng cách giữa các đối tượng (objects) đến K tâm (thường dùng
khoảng cách Euclidean)
3 Nhóm các đối tượng vào nhóm gần nhất
4 Xác định lại tâm mới cho các nhóm
5 Thực hiện lại bước 2 cho đến khi không có sự thay đổi nhóm nào của các đối
phần tử đến các phân tử trung tâm
Phân nhóm dựa trên ổ nhỏ nhất
Uu diém Nhược điểm
- K-means là có độ phức - K-means không khắc phục tạp tính toán O(tkn) được nhiễu và giá trị k phải được
- K-means phân tích phân cho bởi người dùng
cụm đơn giản nên có thế áp dụng - Chỉ thích hợp áp dụng với
đối với tập dữ liệu lớn dữ liệu có thuộc tính số và khám ra
nhãn rõ ràng trong dữ liệu Điều nảy có thể được sử dụng để xác nhận các giả định
kinh doanh về loại nhóm tôn tại hoặc đề xác định các nhóm chưa biết trong tập dữ liệu
Trang 23phức tạp Khi thuật toán đã được chạy và các nhóm được xác định, bất kỳ dữ liệu mới
nào cũng có thê dễ dàng được gán cho đúng nhóm
Đây là một thuật toán linh hoạt có thể được sử dụng cho bat kỳ loại nhóm nào
Một số ví dụ về các trường hợp sử dụng là:
hd ˆ my à i A , 2 sh
Phân khúc theo hành vi Phân loại phép đo cảm biến Phân khúc theo lịch sử mua hàng ° » 2 Phát hiện các loại hoạt động trong cảm biên chuyên K3 85 É : 7 : :& Ậ Phân đoạn theo hoạt động trên các nên tảng động hình ảnh nhóm âm thanh riêng biệt
Xác đị 0ersonas đựa trên sở thíc oe 3 - se as
x wc định personas dựa trên sở thích Xác định các nhóm trong theo dõi sức khỏe Tạo hỗ sơ dựa trên giám sát hoạt động
Phân loại hàng tồn kho @ Phát hiện bot hoặc sự bât thường Nhóm hàng tồn kho theo hoạt động bán hàng Tách các nhóm hoạt động hợp lệ khỏi bot Nhóm hàng tôn kho theo sô liệu sản xuât Nhóm hoạt động hợp lệ để làm sạch phát hiện ngoại lệ
Ngoài ra, việc theo dõi xem điểm dữ liệu được theo dõi có chuyên đổi gitra cac nhóm
theo thời ø1an hay không có the duoc str dung dé phat hiện những thay đôi có ý nghĩa
trong đữ liệu
2.5 Cohort analysis - Phân tích theo nhóm 2.5.1 Khải niệm
Cohort analysis (phan tich theo nhóm) là dạng phân tích hành vi khách hàng,
lấy dữ liệu từ tập hợp con như kinh doanh dịch vụ theo mô hình SaaS, game,
các nền tảng thương mại điện tử hay từng nhóm khách hàng thành các tệp liên
quan với nhau, thay vì theo dõi dữ liệu theo từng đơn vị đơn lẻ Các nhóm này
thường mang đặc điểm chung về thời gian hoặc quy mô
Các công ty sử dụng phân tích đoàn hệ để phân tích hành vi của khách hàng
trong suốt vòng đời của từng khách hàng Trong trường hợp không có phân tích
theo nhóm, các công ty có thể gặp khó khăn trong việc hiểu vòng đời mà mỗi
khách hàng trải qua trong một khung thời gian nhất định Các công ty sử dụng
phân tích theo nhóm đề hiểu xu hướng và mô hình của khách hàng theo thời
gian và để điều chỉnh việc cung cấp sản phẩm và dịch vụ của họ cho các nhóm
đã xác định
Phân tích Cohort có thê giúp công ty theo dõi được hiệu suất sản phẩm
(product performance), so sánh các tệp khách hàng theo thoi gian, danh giá
hiệu suất đề tìm xem chiến dịch nào hiệu quả chiến dịch nào không Đây là một
công cụ gia tri cho cac chién dich marketing nhắm đến một số đối tượng khách
hàng nhất định, øiúp việc điều chỉnh thông điệp và hoạt động phù hợp cho
khách hang trở nên khả thị
2.5.2 Ly do chọn phương pháp phân tích Cohort
Kết quả phân tích Cohort:
Nắm bắt được bounce rate, retention rate theo thời gian của từng nhóm user
Đối với lượt truy cập trang web, có thế nắm bắt được tần suất truy cập của user
cũng như thời gian user lưu lại trang web, sau bao nhiêu lâu thì user quay lại
trang web của bạn, đánh giá được customer lifetime đề tối ưu hóa conversion
funnel
Trang 243 Thông qua những kết quả nay ban có thế chỉ số hóa mức độ tham gia của người dùng, từ đó làm nền tảng xây dựng các chiến dich target marketing phu hop
Tóm lại, so với những chỉ số chung chung khác, kết quả phân tích Cohort sẽ có được insight tong quan về pattern của từng tập hợp người dùng, từ
đó dễ dàng thiết kế các chiến dịch target marketing cũng như các kênh quảng
bá phủ hợp với đặc tính, thói quen, hành vi của khách hàng, ngoàải ra kết qua phân tích Cohort còn có thể giúp sản phâm thuyết phục hơn trước các nhà đầu
2.5.3 Các loại phân tích Cohort
I Acquisition cohorts Behavioral cohorts
Đặc phân chia người dùng dựa vi neười dùng dựa trên _ trên thời điểm họ có được các hoạt động mà họ thực diém hoặc đăng ký một sản hiện trong ứng dụng trong
Một cách đề trực định
quan hóa thông tin này là
vẽ biêu đô đường cong tỷ lệ gitr chan, cho thay ty 1é gitr chân của các nhóm này theo thoi gian
Uu diém xac định rất tốt xu hướng và thời có thê xác định mức độ gitr chan
yêu tô chính thúc đây sự tăng trưởng, mức độ tương tác và doanh thu cho ứng dụng
N kho dé đưa ra những
Như thông tin chị tiết hữu ích
ge như đề hiệu lý do tại sao họ
diém roi di
2.5.4 Các loại nhóm Cohort dé phan tich
- Nhom duoc phan loại dựa vào thời gian
Trang 25Gồm các khách hàng đã đăng ký sử dụng sản phẩm hoặc dịch vụ của công ty trong khoảng thời gian nhất định (có- thê tính theo tuần, tháng hay quý phụ thuộc vào vòng đời sản phẩm của mỗi công ty)
Phân tích, phân loại nhóm khách hàng dựa trén thoi gian giup giảm tỷ lệ Churn
Phân loại dựa trên phân khúc khách hàng
Là dạng phân loại dựa trên các khách hàng đã mua 1 sản phẩm cụ thể hoặc đã trả khoản tiền nhất định cho dịch vụ nào đó Thông thường, phân nhóm khách hàng theo phân khúc như này để hiểu rõ nhu cầu khác nhau của nhóm đối tượng, từ đó đưa ra chiến dịch giới thiệu các sản phẩm — dich vu phu hop cho từng phân khúc
Phân nhóm dựa trên kích thước nhóm
Những khách hàng đã mua sản phâm hay sử dụng dịch vụ của bạn có thé gom
lại thành một nhóm Nhóm này đối tượng chủ yếu là công ty nhỏ mới thành
lập, công ty tầm trung hay công ty lớn dạng tập đoản
Với cách phân loại này, đễ đàng khảo sát và so sánh sức mua hàng dựa trên số lượng sản phẩm đã bán ra Trong từng danh mục hàng hoá, có thể xem xét coi đâu là sản phẩm khách hàng quan tâm và mua nhiều nhất để có các chương trình đây mạnh việc bán hàng
Ở mô hình kinh doanh SaaS, những công ty nhỏ hay mới khởi nghiệp thường
có tý lệ churn cao hơn các công ty lớn Bởi vì công ty nhỏ, mới mở thường có
kinh phí thấp nên ban đầu cần phải thử nghiệm sản phẩm dịch vụ giá rẻ dé chon
ra san pham mũi nhọn cho mình Các công ty lớn có nguôn vốn ôn hơn nên sẽ
có xu hướng gắn bó với một sản phẩm trong thời gian dải
Trang 26
2.5.5 Các ứng dụng của phân tich Cohort
- _ Khi triển khai một dự án phát triển mới cần đo đạc hiệu quả của dự án
so với thông thường
- _ Khi triển khai các campaign/chién dịch cần phân tích hiệu quả
- Khihé thong có rất nhiều khách hàng vào hàng tháng mà lưu lượng hàng tháng không giống đều nhau (đang tăng trưởng/đang giảm tốc)
- _ Cân phân tích được các mốc về sự gắn kết của khách hàng: sử dụng, sử dụng thường xuyên, gia han
- _ Tổng quát hóa: các hệ thống có đầu vào biến thiên và quá trình diễn ra theo | chu ky thoi gian dai (tuân/tháng/quý ) như các dự án phát
triển/campaign/tăng trưởng/giảm tốc
Trang 27_ Chương 3: Chuẩn bị dữ liệu
3.1 Mô tả về dữ liệu
3.1.1 Dữ liệu nghiên cứu Nghiên cứu thực hiện trên dữ liệu AdventureWorks Sales Đây là dữ liệu bán hàng của công ty Adventure Works Cycles trong lĩnh vực sản xuất và kinh doanh xe đạp Tập dữ liệu chứa 121.253 giao dịch trong khoảng thời g1an từ 7/2017 đến 6/2020
3.1.2 Mô tả các dữ liệu trong tập dữ liệu Tập dữ liệu bao gồm dữ liệu về các đơn hàng (Sales Order_ data), vị trí khách hang (Sales Territory_ data), thông tin các giao dịch bán hàng (Sales data), bán lại (Reseller data), thời gian giao dich (Date data), théng tin khách hàng (Customer_data) va dit ligu san pham (Product_data)
RangeIndex: 121253 entries, 0 to 121252
Data columns (total 4 columns):
dtypes: int64(1), object(3)
Dữ liệu không có giá trị rỗng
Các thông tin trone dữ liệu:
Trang 28
Channel object Cac kénh ban hang
SalesOrderLineKey mt64 Mã từng sản phẩm trong
đơn hàng Sales Order object Ma don hang
Sales Order Line object Cac dong trong don hang
tương từng sản phâm Sales Territory_data:
SalesTerritoryKey Region Country Group
8 1 Northwest United States North America
1 2 Northeast United States North America
2 3 Central United States North America
3 4 Southwest United States North America
4 5 Southeast United States North America
9 160 United Kingdom United Kingdom Europe
10 11 Corporate HQ Corporate HQ Corporate HQ
Die liéu worksheet Sales Territory data Thông tin về vị trí khách hàng được chia thành 4 nhóm: Bắc Mĩ, châu Âu, Thái Bình Dương và tại trụ sở chính của công ty Trong đó có 6 nước: Mĩ, Canada, Pháp, Đức, Úc và Vương quốc Anh Về phân vùng pôm có 10 vùng: Tây Bắc, Đông Bắc, trung tâm, Tây Nam, Đông Nam nước Mỹ, Canada, Pháp, Đức, Úc, Vương quôc Anh
và tại trụ sở chính công ty
Data columns (total 4 columns):
dtypes: int64(1), object(3) Cac théng tin trong dit liéu:
SalesTerritoryKey int64 Mã tương ứng từng vùng lãnh thô
Trang 29
non-null
non-null
non-null
non-null non-null non-null non-null
11 Unit Price Discount Pct 121253
12 Product Standard Cost 121253
15 Total Product Cost 121253
14 Sales Amount 121253
dtypes: float64(6), int64(9)
Mô tả về thông tin các cột quan trọng:
non-null
Die liéu worksheet Sales data
Dữ liệu về thông tin các giao dịch Nehiên cứu sẽ tập trung các thuộc tinh: Customer Key, Order Date Key, SalesOrderLineKey, Sales Amount
Ảintéá ftoató4
ainté4 int64
ftoaté4 float64
int64
ftoató4 Float64 Float64
Trang 30
hàng
ProductKey int64 Mã sản phẩm
OrderDateKey int64 Ngày đặt hàng
DueDateKey int64 Ngày thanh toán
ShipDateKey float64 Ngày giao hang
Sales Amount float64 Doanh thu cua don hang
AW00060001 AW09086862 AW00060003 AWO0000004
AW00000697 AWO00060698 AW00000699 AW00060700 AW00060701
[782 rows x 8 columns]
# Column
ResetLerKey Reseller ID Business Type Reseller City State-Province
United States United States United States United States
States States States States Canada
United United United United
Die liéu worksheet Reseller data
Dữ liệu về các bên bán lại
Postal Code [Not Applicable]
Trang 31
9 20170701 2017-07-01 FY2018 2017 Jul 2017 Jul, 61 291707
1 20170702 2017-07-02 FY2018 2017 Jul 2017 Jul, 02 201707
2 20178703 2017-07-03 FY2018 2017 Jul 2017 Jul, 03 201707
3 20170704 2017-07-04 FY2018 2017 Jul 2017 Jul, 04 281707
4 20170705 2017-07-05 FY2018 2017 Jul 2017 Jul, 05 201707
1456 20210626 2021-06-26 FY2021 2021 Jun 2021 Jun, 26 202106
1457 20210627 2021-06-27 FY2021 2021 Jun 2021 Jun, 27 202106
1459 20210629 2021-06-29 FY2021 2021 Jun 2021 Jun, 29 202106
1460 20210630 2021-06-30 FY2021 2021 Jun 2021 Jun, 30 202106
[1461 rows x 7 columns]
; Dit liu trong worksheet Date data
Dữ liệu về thời ø1an giao dịch
RangeIndex: 14ó1 entries, 6 to 14é0
Data columns (total 7 columns):
# = Column Non-Null Count Dtype
0 DateKey 1461 non-null = inté64
1 Date 1461 non-null datetimeé4[ns]
2 Fiscal Year 1461 non-null object
3 Fiscal Quarter 1461 non-null object
4 Month 1461 non-null object
5 Full Date 1461 non-null object
6 MonthKey 1461 non-null int64
dtypes: datetimeé4[ns](1), int64(2), object(4)
Product_data
ProductKey SKU Subcategory Category
1 211 FR-R92R-58 Road Frames Components
392 602 BB-8107 Bottom Brackets Components
393 603 BB-9108 Bottom Brackets Components
[397 rows x 9 columns]
Thông tin về các sản phẩm: mã sản phâm, tên sản phâm, mẫu mã, màu sắc,
Die liéu trong worksheet Product data
Trang 32# Column
ProductKey
SKU
Product Standard Cost Color List Price Model Subcategory
Dtype
int64 object object float64 object Ffloat64 object object object
dtypes: float64(2), int64(1), object(6)
Mô tả thông tin các cột quan trọng:
Product object Tén san pham
AW60011000 AW60011001 AW00011002 AW00011003
AII080029479 AW00029480 AW00029481 AWO00029482 AW00029483
[18485 rows x 7 columns]
Pos [Not App sae Country-Region [Not Applicable]
see Australia see Australia sae Australia eae Australia
eee France eee United Kingdom wae Germany eee France eee France
Dit liéu trong worksheet Customer data
Dữ liệu về thông tin khach hang bao gom: ma khach hang, tén khach hang va vi
tri cu thé cua khach hang
tal Code 1icabte]
95010
17490
92081
Trang 33
dtypes: int64(1), object(6)
Mô tả thông tin các cột quan trọng,
object object object object
3.2 _ Phân tích khám phả dữ liệu 3.2.1 Lam sach đữ liệu
Tim giá trị rông trong đữ liệu Sale Order data
Trang 34number
SalesOrderLineKey ReseLLerKey CustomerKey ProductKey 0rderDateKey DueDateKey SalesTerritoryKey Order Quantity Unit Price Extended Amount Unit Price Discount Pct Product Standard Cost Total Product Cost Sales Amount
Reseller data
number
ReseLtLerKey Reseller ID Business Type Reseller City State-Province Country-Region