1. Trang chủ
  2. » Luận Văn - Báo Cáo

tiểu luận phân nhóm khách hàng theo phương pháp phân tích cụm cluster analysis với thuật toán k means

17 2 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân nhóm khách hàng theo phương pháp phân tích cụm (Cluster Analysis) với thuật toán K-means
Tác giả Trần Thị Mỹ Linh
Người hướng dẫn Hoàng Văn Hải
Trường học Trường Đại học Kinh tế, Đại học Đà Nẵng
Chuyên ngành Phân tích kinh doanh trong môi trường số
Thể loại Báo cáo bài tập cuối kì
Năm xuất bản 2023
Thành phố Đà Nẵng
Định dạng
Số trang 17
Dung lượng 1,61 MB

Nội dung

Báo cáo này tập trung vào phân tích dữ liệu khách hàng của một doanh nghiệp bằng cách sử dụng công cụ phân tích dữ liệu như Excel và Tabeau để trích xuất thông tin có ý nghĩa.. Bằng cách

Trang 1

BÁO CÁO BÀI TẬP CUỐI KÌ HỌC PHẦN: PHÂN TÍCH KINH DOANH TRONG MÔI TRƯỜNG SỐ

Giảng viên hướng dẫn : Hoàng Văn Hải

Sinh viên thực hiện : Trần Thị Mỹ Linh

Đà Nẵng, 2023

Trang 2

Lời mở đầu

Trong bối cảnh ngày nay, môi trường kinh doanh đang chứng kiến sự biến đổi đáng kể do sự lan tỏa mạnh mẽ của công nghệ và môi trường số Dữ liệu, được xem là dầu mỏ của thời đại số, đóng vai trò quan trọng trong việc định hình chiến lược kinh doanh và tạo ra lợi thế cạnh tranh Báo cáo này tập trung vào phân tích dữ liệu khách hàng của một doanh nghiệp bằng cách sử dụng công cụ phân tích dữ liệu như Excel và Tabeau để trích xuất thông tin có ý nghĩa Bằng cách này, chúng ta có thể nhìn nhận rõ hơn về cách dữ liệu có thể được biến đổi thành thông tin chiến lược, giúp doanh nghiệp hiểu rõ hơn về thị trường, khách hàng và cơ hội kinh doanh Từ đó, giúp nhà quản trị đưa ra quyết định phù hợp hơn cho doanh nghiệp

Trân trọng cảm ơn thầy Hoàng Văn Hải đã đọc bài cáo và nhận xét!

Trang 3

5 Phân cụm khách khàng 7

II Phân tích các đặc tính của khách hàng theo nhóm khách hàng 9

1 Cụm 1 9

2 Cụm 2 9

3 Cụm 3 10

4 Cụm 4 10

5 Cụm 5 10

III Dashboard thể hiện đặc tính của nhóm khách hàng 11

1 Cụm 1 (cluster 1) 11

2 Cụm 2 (cluster 2) 12

3 Cụm 3 (cluster 3) 13

4 Cụm 4 (cluster 4) 13

5 Cụm 5 (cluster 5) 14

IV Chính sách thưởng cuối năm 14

V Vai trò thành viên nhóm 15

MỤC LỤC HÌNH ẢNH Hình 1 Cluster Chart 9

Hình 2 Dashboard thể hiện đặc tính của khách hàng 11

Trang 4

GVHD: Hoàng Văn Hải

I Phân nhóm khách hàng theo phương pháp phân tích cụm (Cluster Analysis) với thuật toán K-means

Ta sử dụng thuật toán K-means để phân tập dữ liệu thành các cụm (cluster) khác nhau trong cùng một 1 cụm có tính chất giống nhau Từ đó, doanh nghiệp có thể dựa vào phân tích để đưa ra những chiến lược phù hợp cho doanh nghiệp của

họ Ta thực hiện các bước sau:

1 Lựa chọn thuộc tính

Tập dữ liệu của công ty chứa nhiều những thuộc tính khác nhau Mỗi thuộc tính đều biểu hiện một giá trị dạng số hay phi số nào đó của giao dịch như mã khách hàng, tuổi khách hàng, mức mua sắm… Ở tập trung khai thác vào các thuộc tính sau: thu nhập và mức mua sắm của khách hàng

Việc chọn hai đặc tính trên để phân tích nhóm khách hàng sẽ giúp em hiểu, biết được hơn về nhóm khách hàng nào đang dành lượng lớn thu nhập để gia tăng mức mua sắm Điều này cho thấy được độ hấp dẫn của sản phẩm, lòng trung thành của khách hàng đối với doanh nghiệp

2 Chuẩn hóa thang đo

Đầu tiên em chuẩn hóa thang đo cột thu nhập khách hàng theo năm theo địa chỉ cột mới là K2 với công thức excel:

=STANDARDIZE(D2,AVERAGE($D$2:$D$201),STDEV($D$2:$D$201))

Tiếp theo em chuẩn hóa thang đo cột mức mua sắm theo địa chỉ cột mới là L2 với công thức tương tự:

=STANDARDIZE(E2,AVERAGE($E$2:$E$201),STDEV($E$2:$E$201))

Too long to read on your phone? Save

to read later on your computer

Save to a Studylist

Trang 5

3 Lựa chọn cụm cluster

Với k=3, chỉ số wss = 9,1116

Với k=4, chỉ số wss = 6.1116

Với k=5, chỉ số wss đạt nhỏ nhất, wss= 3.6851

 Chọn k=5

4 Khởi tạo centroid và tính khoảng cách

Tính khoảng cách từ tâm đến cluster với công thức :

=SQRT((L2-$AB$3)^2+(K2-$AB$2)^2)

5

Trang 6

GVHD: Hoàng Văn Hải

Sau đó, tương tự với các cụm cluster sau

Tâm là giá trị em cho ngẫu nhiên từ -1 đến 1 và tiến hành lựa chọn Cluster nào

có giá trị min trong 5 cluster vừa tính được ở câu trên

Tiếp theo, em tính khoảng cách của các cluster và cột tổng khoảng cách em sẽ

để ở dạng function tổng của cả 5

6

Trang 7

5 Phân cụm khách khàng

Sau khi có tổng khoảng cách của các cluster, em chạy solver như ảnh ở dưới vì

ta tìm khoảng cách nhỏ nhất giữa các cluster đến tâm cụm Chọn giá trị nằm trong khoảng (-3; 3) vì đây là giá trị nhỏ nhất là lớn nhất của dữ liệu vừa normalized ở trên

7

Trang 8

GVHD: Hoàng Văn Hải

Kết quả sau khi chạy xong đã cho ra khoảng cách 98,775

Vẽ biểu đồ từ địa chỉ từ cluster 1-cluster 5

và sau đó kích chuột phải vào biểu đồ để select data xác định tâm cụm, ví dụ cho cụm 1 và thực hiện tương tự các cụm khác

Cluster 1:

Centroid 1:

8

Trang 9

Sau khi làm tương tự ta nhấn OK và chỉnh sửa sao cho trực quan.

II Phân tích các đặc tính của khách hàng theo nhóm khách hàng

Hình 1 Cluster Chart

1 Cụm 1

Kích thước cụm 1 là 80 đối tượng, phân bố tập trung và sát tâm

Tâm điểm cụm 1 (centroid cluster 1): độ tuổi 43,2; thu nhập $55,088/năm; mức mua sắm $4,971

Cụm khách hàng 1 màu xanh lá thuộc nhóm khách hàng có mức mua sắm và thu nhập trung bình

2 Cụm 2

Kích thước cụm 2 là 23 đối tượng, phân bố rải rác và xa tâm

9

Trang 10

GVHD: Hoàng Văn Hải

Tâm điểm cụm 2 (centroid cluster 2): độ tuổi 45,7; thu nhập $26,304/năm; mức mua sắm $2,09

Cụm khách hàng 2 màu cam thuộc nhóm khách hàng có mức mua sắm và thu nhập đều thấp

3 Cụm 3

Kích thước cụm 3 là 39 đối tượng, phân bố không đồng đều và xa tâm

Tâm điểm cụm 3 (centroid cluster 3): độ tuổi 32,7; thu nhập $86,538/năm; mức mua sắm $8,213

Cụm khách hàng 3 màu đỏ thuộc nhóm khách hàng có mức mua sắm thu nhập đều cao

4 Cụm 4

Kích thước cụm 4 là 22 đối tượng, đa số tập trung ở rìa tâm và không đồng đều Tâm điểm cụm 4 (centroid cluster 4): độ tuổi 25,3; thu nhập $25,727/năm; mức mua sắm $7,936

Cụm khách hàng 4 màu vàng thuộc nhóm khách hàng có mức mua sắm cao và

có thu nhập thấp

5 Cụm 5

Kích thước cụm 5 là 36 đối tượng, phân bố không đồng đều và phần lớn đối tượng ở cách xa tâm

Tâm điểm cụm 5 (centroid cluster 5): độ tuổi 40,7; thu nhập $87,750/năm; mức mua sắm $1,758

Cụm khách hàng 5 màu xanh dương thuộc nhóm khách hàng có thu nhập cao nhưng mức mua sắm rất thấp

1 0

Trang 11

Hình 2 Dashboard thể hiện đặc tính của khách hàng

Về tổng quan:

 Doanh nghiệp có 200 khách hàng là được chia ra thành 5 nhóm có những đặc tính về thu nhập và mua sắm giống nhau

 Mức mua sắm và thu thập trung bình của 5 nhóm khách hàng lần lượt là

$5,202 và $60,560

 Xu hướng mua sắm: Cluster 2 và Cluster 4 đứng yên vì chỉ có khách vào

2020, Cluster 1 có xu hướng giảm và cluster 3 và 5 tăng

 Nơi mua hàng: tập trung mua nhiều nhất ở Midwest với tỉ trọng 57.01%, tuy nhiên ở northeast lại chỉ đạt con số chỉ 0.3%

 Tổng đơn đặt hàng là 670 đơn

 Khách hàng của doanh nghiệp nằm ở độ tuổi từ 25,3 đến 40,7 tuổi

1 Cụm 1 (cluster 1)

1 1

Trang 12

GVHD: Hoàng Văn Hải

 Nhận xét:

Theo hình trên, ta thấy rằng nhóm khách hàng này đông nhất tập trung ở phía Tây và Trung Tây, có thu nhập và chi tiêu ở mức tầm trung Tỉ trọng đơn đặt hàng của nhóm này chiếm 41,79% so với tổng số đơn, tuy nhiên vào năm 2021

nó có xu hướng mua sắm giảm so với năm ngoái mà mức chiết khấu của doanh nghiệp cung cấp chỉ ở mức 9,35% thấp hơn so với trung bình các nhóm khác Điều này đã khiến doanh nghiệp mất đi lượng khách hàng đáng kể và doanh thu cũng giảm

Vì vậy, trong năm tiếp theo doanh nghiệp nên cân nhắc về chính sách thưởng hay những sản phẩm/dịch vụ mới để thu hút nhóm khách hàng này

2 Cụm 2 (cluster 2)

 Nhận xét:

1 2

Trang 13

3 Cụm 3 (cluster 3)

 Nhận xét:

Theo hình trên, ta thấy rằng nhóm khách hàng vẫn có số lượng ít tuy nhiên đứng thứ 2 trong tổng số lượng, tập trung ở phía Tây Trung Tây và phía Nam, có thu nhập và chi tiêu nằm trong top đầu Tỉ trọng đơn đặt hàng của nhóm này chiếm 18,49% so với tổng số đơn, ngoài ra vào năm 2021 nhóm này còn có xu hướng mua sắm tăng mạnh so với năm ngoái và mức chiết khấu đang ở mức cao nhất 18,49% Điều này đã giúp doanh nghiệp có thêm khách hàng mới và doanh thu cũng tăng

Vì vậy, trong năm tiếp theo doanh nghiệp nên cân nhắc về chính sách thưởng hay những sản phẩm/dịch vụ mới để thu hút nhóm khách hàng này

4 Cụm 4 (cluster 4)

1 3

Trang 14

GVHD: Hoàng Văn Hải

Theo hình trên, ta thấy rằng đây là nhóm khách hàng có số lượng ít nhất, tập trung ở phía Tây Trung Tây và phía Nam Tuy họ có thu nhập nhấp nhưng mức mua sắm lại cao đứng thứ 2 Tỉ trọng đơn đặt hàng của nhóm này chiếm tỉ lệ khá cao là 21,64% so với tổng số đơn mặc dù mức chiết khấu đang ở mức thấp nhất 6,96% Mức mua sắm vào năm 2021 của nhóm này đột ngột chững lại Điều này đang là mối đe dọa doanh nghiệp bởi lẽ doanh thu từ nhóm khách hàng này không còn nữa

Vì vậy, trong năm tiếp theo doanh nghiệp nên cân nhắc về chính sách thưởng hay những sản phẩm/dịch vụ mới để thu hút nhóm khách hàng này

5 Cụm 5 (cluster 5)

 Nhận xét:

Ta có thể thấy rằng nhóm khách hàng này không nhiều và chủ yếu tập trung ở phía Tây và Trung Tây và thưa dần ở Đông Bắc và phía Nam Nhóm khách

1 4

Trang 15

hay những sản phẩm/dịch vụ mới để thu hút nhóm khách hàng này.

IV Chính sách thưởng cuối năm

Để đưa ra chính sách tặng thưởng cuối năm cho nhóm khách hàng mua sắm thường xuyên thì doanh nghiệp nên kết hợp chiến lược ưu tiên giữa việc giữ chân khách hàng hiện tại và thu hút khách hàng mới có tiềm năng tăng trưởng Cụm 3 và Cụm 5 có vẻ là ứng viên tiềm năng cho chính sách thưởng cuối năm

do có sự cân bằng giữa thu nhập, chiết khấu, và tiềm năng tăng trưởng:

Ưu tiên nhóm khách hàng 3

 Lượng khách hàng ở nhóm này đang đông nhất và có chiều hướng tăng mạnh vào năm 2021

 Tập trung ở các khu vực có thu nhập và chi tiêu cao, đặc biệt là ở phía Tây, Trung Tây, và phía Nam

 Mức chiết khấu cao nhất (18,49%) so với các nhóm khác, điều này có thể tăng khả năng giữ chân và thu hút khách hàng mới

Xem xét nhóm khách hàng 5

 Nhóm này có thu nhập cao nhất, tuy nhiên, mức mua sắm thấp hơn so với các nhóm khác

 Mức chiết khấu cao (15,62%) cũng có thể là một yếu tố thuận lợi để giữ chân khách hàng và tăng cường doanh số bán hàng

 Mặc dù có số lượng ít, nhưng có khả năng tăng trưởng và đó có thể là cơ hội để phát triển mối quan hệ dài hạn với nhóm này

Cuối cùng xem xét nhóm khách hàng 1

 Nhóm khách hàng này có số lượng tương đối và có chiều hướng tăng mạnh vào năm 2021

 Tập trung ở các khu vực có thu nhập và chi tiêu cao, đặc biệt là ở phía Tây, Trung Tây, và phía Nam

 Mức chiết khấu cao nhất (18,49%) so với các nhóm khác, điều này có thể tăng khả năng giữ chân và thu hút khách hàng mới

1 5

Trang 16

GVHD: Hoàng Văn Hải

V Vai trò thành viên nhóm

Ở mỗi chương sẽ có từng bài tập cụ thể và mỗi thành viên sẽ đảm nhiệm các vai trò khác nhau Ở bài tập giữa kỳ, em tự vẽ dashboard và khi họp lại thì tất cả sẽ cùng nhau đóng góp ý kiến để hoàn thành bài báo cáo một cách tốt nhất Về phần bài tập trên lớp, nhóm em đã cùng nhau thảo luận và làm được các bài tập được giao Và với mỗi thế mạnh khác nhau, ở mỗi nhiệm vụ khác nhau, các bạn đều hoàn thành được công việc của mình Bản thân em được giao ở nhiệm vụ soạn nội dung và đôi khi cũng có thuyết trình Nếu có thắc mắc, các thành viên trong nhóm sẽ cùng nhau giải đáp và hỗ trợ thành viên còn lại trong những việc như cài tableau hoặc sử dụng excel để tạo dashboard Sau khi học học phần này thì tất cả thành viên đều có thêm những kiến thức bổ ích và cần thiết cho công việc cũng như cuộc sống sau này, phát triển khả năng tự học, khả năng làm việc nhóm, kỹ năng thuyết trình cũng như trả lời câu hỏi

1 6

Ngày đăng: 02/06/2024, 15:55

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w