Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 39 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
39
Dung lượng
4,12 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC KINH TẾ TP HỒ CHÍ MINH TRƯỜNG KINH TẾ LUẬT VÀ QUẢN LÝ NHÀ NƯỚC DỰ ÁN KẾT THÚC HỌC PHẦN ĐỀ TÀI: PHÂN TÍCH DỮ LIỆU, DỰ ĐỐN PHÂN LOẠI KHÁCH HÀNG DỰA TRÊN BỘ DỮ LIỆU UBG Học phần: Khoa Học Dữ Liệu Mã lớp học phần: 22C1INF50905944 Giảng viên hướng dẫn: Nguyễn Văn Hồ Chuyên ngành: Kinh tế học ứng dụng Khóa: K47 TP Hồ Chí Minh, Ngày 24 tháng 12 năm 2022 BẢNG ĐÁNH GIÁ THÀNH VIÊN Họ tên La Ngọc Liên MSSV Nhiệm vụ Hoàn Chữ ký thành sinh viên Nghiên cứu, tổng quan 31211027210 liệu, nhận xét biểu đồ, thảo luận, dự báo Nghiên cứu liệu, sở Lê Nguyễn 31211020203 lý thuyết, nhận xét biểu đồ, Trà My tổng hợp, chỉnh sửa Nguyễn Kim Trâm Anh Thanh Trúc 100% Nghiên cứu phân tích 31211022713 liệu, tổng quan đề tài, nhận 100% xét Nghiên cứu liệu phân Huỳnh Bảo 31211022011 tích tiền xử lý liệu, nhận Trâm xét, kết luận Nguyễn Thị 100% 100% Nghiên cứu phân tích 31211020216 liệu, chạy Rstudio, nhận xét biểu đồ, slides 100% MỤC LỤC LỜI CẢM ƠN DANH MỤC BẢNG BIỂU, SƠ ĐỒ, HÌNH ẢNH .1 CHƯƠNG TỔNG QUAN ĐỀ TÀI 1.1 Lý chọn đề tài 1.2 Mục tiêu đề tài 1.3 Đối tượng phạm vi nghiên cứu đề tài (thương mại sản xuất) 1.3.1 Chọn liệu 1.3.2 Cấu trúc liệu 1.4 Công cụ sử dụng 1.5 Ý nghĩa nghiên cứu 1.6 Cấu trúc đề tài CHƯƠNG CƠ SỞ LÝ THUYẾT 2.1 Tổng quan Khoa học liệu 2.2 Lợi ích Khoa học liệu kinh doanh quản lý .7 2.3 Quy trình thực dự án Khoa học liệu .7 2.4 Mơ hình RFM .8 2.4.1 Giới thiệu mơ hình 2.4.2 Quy hình thực 2.4.3 Lợi ích 10 2.5 RStudio .10 2.5.1 Giới thiệu Rstudio 10 2.5.2 Quy trình thực với Rstudio: 10 CHƯƠNG PHÂN TÍCH YÊU CẦU NGƯỜI DÙNG VÀ MÔ TẢ DỮ LIỆU 11 3.1 Xác định phân tích yêu cầu người dùng .11 3.2 Tổng quan sở liệu nguồn 12 3.2.1 Mô tả liệu nguồn 12 3.2.2 Lựa chọn trình bày liệu cần phân tích yêu cầu người dùng 12 CHƯƠNG PHÂN TÍCH DỮ LIỆU VÀ KẾT QUẢ 14 4.1 Giới thiệu giải pháp quy trình thực .14 4.2 Phân tích trực quan hóa kết quả (Đánh giá tổng quan mơ hình RFM thơng qua Excel ứng dụng Rstudio) .17 4.2.1 Trực quan liệu xử lý: 17 4.2.2 Kết trực quan RFM qua Excel Rstudio: .18 4.2.3 Biểu đồ trực quan đánh giá kết RFM 19 4.2.4 Histogram RFM 24 4.2.5 Trực quan hóa phân khúc khách hàng 25 4.3 Thảo luận đánh giá kết phân tích đề xuất hỗ trợ định30 CHƯƠNG KẾT LUẬN 31 5.1 Kết đạt 31 5.2 Hạn chế .31 5.3 Hướng phát triển .32 FILE THUYẾT TRÌNH .32 TÀI LIỆU THAM KHẢO 32 PHỤ LỤC 33 LỜI CẢM ƠN Lời đầu tiên, nhóm em xin gửi lời cảm ơn đến thầy Nguyễn Văn Hồ Trong trình học tập tìm hiểu mơn Khoa học liệu, nhóm em nhận quan tâm giúp đỡ, hướng dẫn nhiệt tình, tâm huyết thầy Nhờ có thầy mà nhóm em tích lũy nhiều hiểu rõ kiến thức mơn học, có nhiều kinh nghiệm tin học văn phịng để ứng dụng vào cơng việc sau Thơng qua tiểu luận này, nhóm em xin phép trình bày mở rộng kiến thức thầy truyền đạt mơn Khoa học liệu Có lẽ kiến thức vô hạn mà mức độ tiếp thu thân người tồn hạn chế định Do q trình làm bài, nhóm em chắn khơng thể tránh khỏi thiếu sót Vì chúng em mong nhận lời nhận xét ý kiến đóng góp thầy để báo cáo nhóm em hồn thiện DANH MỤC BẢNG BIỂU, SƠ ĐỒ, HÌNH ẢNH Mục Loại Tên Trang 1.3.2 Bảng Cấu trúc liệu 2.1 Hình Lược đồ Data Science 2.4.1 Hình Mơ hình RFM 2.4.2 Hình Ví dụ RFM score 3.2.1 Bảng Mô tả liệu nguồn 12 3.2.2 Hình Bộ liệu qua tiền xử lý 13 4.1.1 Hình Chuẩn hố liệu thành bảng điểm 14 4.1.2 Hình Dữ liệu điểm R,F,M RFM score 15 4.1.3 Hình Phân loại số lượng khách hàng tỷ lệ tương ứng 15 4.1.4 Biểu đồ Label segment Treemap 16 4.1.5 4.2.1.1 4.2.1.2 Biểu đồ Đồ thị lệch chuẩn Hình 16 Mã code kết thể liệu xử lý 17 Biểu đồ Xác nhận liệu hai biến “Current price” 18 “Quality” xử lý 4.2.2.3 Hình Kết RFM thơng qua Rstudio 18 4.2.2.4 Hình Kết so sánh RFM score Excel 19 Rstudio 4.2.3.5 Biểu đồ RFM heat map 19 4.2.3.6 Biểu đồ RFM bar chart 21 4.2.3.7 Biểu đồ Mối tương quan Recency Monetary 22 4.2.3.8 Biểu đồ Mối tương quan Frequency Monetary 23 4.2.4.9 Biểu đồ RFM Histogram 24 4.2.5.10 Hình Phân khúc khách hàng 25 4.2.5.11 Biểu đồ RFM plot median Recency 25 4.2.5.12 Biểu đồ RFM plot median Frequency 26 4.2.5.13 Biểu đồ RFM plot median Monetary 27 4.2.5.14 Biểu đồ Số lượng giá sản phẩm mua 4.2.5.15 Biểu đồ Tổng số tiền mua hàng, thu nhập trung bình hộ gia đình bang 28 29 CHƯƠNG TỔNG QUAN ĐỀ TÀI 1.1 Lý chọn đề tài Một doanh nghiệp muốn tìm chiến lược kinh doanh phù hợp phải nắm bắt tình trạng khách hàng thơng qua việc lưu trữ liệu Trong mơ hình kinh doanh nay, nhóm lựa chọn mơ hình kinh doanh lị sưởi để phân tích đưa giải pháp phù hợp cho mơ hình Nhu cầu sử dụng lị sưởi quốc gia vùng ơn đới cao mùa đơng nơi có khí hậu giá rét Lị sưởi phổ biến phương Tây, Bắc Âu, ngành cơng nghiệp lị sưởi quốc gia phát triển Nhận biết tầm phủ sóng thị trường này, nhóm định thực hành đánh giá hành vi người tiêu dùng, đưa chiến lược kinh doanh cho doanh nghiệp dựa vào việc “Phân tích liệu, dự đốn phân loại khách hàng dựa liệu UBG (tập đoàn lớn đại diện cho doanh nghiệp độc lập chuyên thị trường lò sưởi)” ứng dụng phương pháp khoa học liệu để tạo case phân tích liệu kinh tế 1.2 Mục tiêu đề tài Mục tiêu đề tài đề xuất chiến lược kinh doanh phù hợp với doanh nghiệp cho giai đoạn tiếp tới Để làm điều này, nhóm phải tiến hành thu thập liệu đánh giá hành vi người tiêu dùng Tiếp theo, nhóm phân loại khách hàng tập đồn UBG, dự đốn khả mua hàng khách hàng, từ đề xuất, hỗ trợ định, giúp doanh nghiệp bán sản phẩm có chiến lược kinh doanh hiệu làm tăng doanh thu 1.3 Đối tượng phạm vi nghiên cứu đề tài (thương mại sản xuất) 1.3.1 Chọn liệu Dựa vào bảng liệu doanh nghiệp UBG công khai tại: Link trang web Đối tượng nghiên cứu đề tài gồm thông tin doanh nghiệp thông tin khách hàng, thông tin sản phẩm, doanh thu thời gian bán Dữ liệu ghi lại sau lần giao dịch thành công với người tiêu dùng Đề tài nghiên cứu phạm vi thương mại sản xuất Nghiên cứu thực tập đoàn UBG bao gồm hoạt động kinh doanh tập đoàn giai đoạn từ đầu năm 2018 đến nửa đầu năm 2020 1.3.2 Cấu trúc liệu Đặc điểm Mô tả Đơn biến hay đa biến Đa biến Lĩnh vực Thương mại sản xuất Số lượng mẫu 15,000 Bảng 1.3.2: Cấu trúc liệu 1.4 Công cụ sử dụng Model RFM áp dụng tính số với khách hàng dựa lịch sử mua hàng họ, ta sử dụng Excel để xử lí số liệu kết hợp với việc sử dụng RStudio để số liệu thể cụ thể Excel phần mềm quen thuộc giúp khai phá, phân tích, thống kê, tính tốn số liệu Nó phù hợp để tính RFM với bước đơn giản dễ dàng cho kết cách nhanh số cơng cụ cơng thức có sẵn RStudio mơi trường phát triển tích hợp cho R, ngơn ngữ lập trình cho tính tốn thống kê đồ họa Chương trình có sẵn hai định dạng: RStudio Desktop - ứng dụng máy tính để bàn thông thường RStudio Server chạy máy chủ từ xa cho phép truy cập RStudio trình duyệt web 1.5 Ý nghĩa nghiên cứu Với phát triển mạnh mẽ không ngừng khoa học công nghệ liệu nay, việc thu thập, lưu trữ liệu khách hàng nguồn tài nguyên mang đến nhiều tiềm sở việc khai thác, phân tích giải vấn đề kinh doanh Các nhà quản trị hiểu tầm quan trọng khách hàng họ muốn thông qua liệu lịch sử mua hàng để hiểu khách hàng họ, để việc kết nối với khách hàng dễ dàng hơn, mơ hình phân loại khách hàng đưa tầm nhìn nhà quản trị xa xây dựng mở rộng mối quan hệ với khách hàng Phân tích ln yếu tố then chốt để dẫn đến thắng lợi hoạt động Sales & Marketing, mơ hình RFM mơ hình quan trọng RFM cho phép người làm nhắm mục tiêu nhóm khách hàng cụ thể với thông tin phù hợp nhiều với hành vi họ – tạo tỷ lệ phản hồi cao nhiều, cộng với trung thành giá trị lâu dài khách hàng tăng lên Kết nghiên cứu liệu tham khảo cho doanh nghiệp, cơng ty, tập đồn, muốn phân tích xác định hành vi khách hàng có Từ có chiến dịch marketing hoc chăm sóc đc biệt đến khách hàng quản trị khách hàng hiệu 1.6 Cấu trúc đề tài Bài nghiên cứu gồm 34 trang, bảng, 11 hình 12 biểu đồ Ngồi phần mở đầu, mục lục, danh mục từ viết tắt, danh mục bảng, danh mục hình ảnh, danh mục tài liệu tham khảo phục lục, đề tài kết cấu thành chương sau: Chương 1: Tổng quan đề tài Chương 2: Cơ sở lý thuyết Chương 3: Phân tích yêu cầu người dùng mơ tả liệu Chương 4: Phân tích liệu kết Chương 5: Kết luận CHƯƠNG CƠ SỞ LÝ THUYẾT 2.1 Tổng quan Khoa học liệu Khoa học liệu hiểu nghiên cứu liệu, mà nguồn liệu nhiều dạng khác thu thập từ lĩnh vực, ngành nghề, sau khai thác, khám Bản đồ nhiệt hiển thị giá trị tiền tệ trung bình cho danh mục khác điểm số Recency Frequency Điểm cao Frequency Recency đc trưng giá trị tiền tệ trung bình cao vùng tối bản đồ nhiệt Thông qua biểu đồ ta thấy: ● Mức độ chi tiêu/ Doanh thu cao: xuất phát từ vùng khách hàng Frequent Shopper - mức - đậm màu (tăng đậm màu dần tương ứng từ 1-5) Mức độ tăng màu biểu diễn tác động chất lượng sản phẩm tốt hay khơng, điểm giá tiền sản phẩm có phù hợp hay khơng hoc khách hàng muốn mua loại sản phẩm/ mt hàng ● Tương ứng ta có mức độ tập trung Recency tăng theo thứ tự từ 1-5 Mức độ tăng màu đậm thể việc khách hàng có xu hướng quay lại chi tiêu mua sắm Qua ta rút khách hàng nịng cốt khách hàng lâu năm, họ có xu hướng quay lại chi tiêu mua sắm mt hàng nhiều Thực tế mức - tăng theo hai chiều cho thấy dấu hiệu đáng mừng khách hàng có xu hướng quay lại chi tiêu mua sắm mt hàng công ty sau lần đầu mua sắm Ngược lại giao khu vực - “Frequency” với “Recency” màu trung tính mức nhạt mức cho thấy khách hàng “New Shopper” mức chi tiêu thấp Từ đây, cơng ty cần có sách hợp lý phát triển thu hút nhiều khách hàng mới, tiềm đồng thời giữ chân khách hàng “sẽ - đang” lâu năm RFM bar chart biểu đồ cho tương quan biến “Frequency score”, “Recency Score”, “Monetary”: 20 Biểu đồ 4.2.3.6: RFM bar chart RFM bar chart sử dụng nhằm tạo phân phối cho điểm số tiền tệ kết hợp khác tần suất điểm số lần truy cập gần (lần cuối mua hàng khách hàng) Biểu đồ 4.2.3.6 thể cách nhìn khái quát rõ biểu đồ 4.2.3.6 khu vực RFM cần ý như: ● 5-5-5: có mức monetary cao => Khách hàng lâu năm có mức chi tiêu cao ● 1:5-3 -1:5: có mức monetary ổn định => Khách hàng thường xuyên cần giữ chân ● 1:5-1-1:5: có mức monetary thấp (hầu khơng có điểm recency ngoại trừ điểm 3) => cần tìm cách thu hút nhu cầu tiêu dùng Scatter Plot: Biểu đồ thể tương quan hai biến “Recency score” “Monetary” 21 Biểu đồ 4.2.3.7: Mối tương quan Recency Monetary Với thời điểm xét 30/6/2020 nhìn vào biểu đồ, phần lớn khách hàng mua sắm mức Recency = 100 tức tính từ ngày 22/3/2020 đổ Một số lượng khách hàng khác có mức chi tiêu cao với lượng ngày truy cập lần cuối mức Recency khoảng 100 - 150 (tức 1/2/2020 - 22/3/2020) Những khách hàng mua hàng gần có xu hướng mang lại nhiều doanh thu so với khách hàng ghé thăm khứ (thời gian mua hàng lần cuối lâu hơn) Một số khách hàng có mức chi tiêu cao lần ghé thăm Vì mt hàng lị sưởi - mt hàng khơng thể thiếu nước ơn đới đồng thời từ ngày tính cuối tháng 6, đầu tháng tới lúc khách hàng bắt đầu mua sắm chuẩn bị cho ngày lễ lớn “Halloween” hay “Christmas” hội để thực chiến lược kinh doanh thích hợp thu hút khách hàng đồng thời đẩy mạnh quay trở lại chi mua khách hàng Biểu đồ thể tương quan hai biến “Frequency” “Monetary” (Scatter Plot) 22 Biểu đồ 4.2.3.8: Mối tương quan Frequency Monetary Tần suất người mua hàng giá trị tiền tệ có mối tương quan cht chẽ Tần suất mua hàng cao 30 lần số tiền nhiều người tiêu dùng chi tiêu cho lần mua sắm $75,000 Tần suất mua hàng khách hàng tăng lên, kéo theo doanh thu tăng lên Nhóm khách hàng Champions ghé thăm thường xuyên để mua sắm Nhóm khách hàng thân thiết hay khách hàng trung thành, tiềm năng, họ yếu tố góp phần thúc đẩy doanh thu tăng lên Cũng suy rằng, tần suất doanh thu tỷ lệ thuận với Khi tần suất mua hàng người tiêu dùng tăng lên nói lên doanh nghiệp làm có hiệu đáp ứng nhu cầu tiêu dùng khách hàng mức tối ưu Do cần đẩy mạnh tiếp cận nhiều người tiêu dùng tốt 23 4.2.4 Histogram RFM Biểu đồ 4.2.4.9: Biểu đồ phân bố tần số kết RFM Biểu đồ cho thấy phân bố tương đối giá trị cho biến dùng để tính tốn điểm Recency - Frequency - Monetary Đc điểm biểu đồ chúng có hình dáng lệch, biểu đồ Recency lệch hẳn sang bên trái thay đối xứng Đây dấu hiệu tốt doanh nghiệp có lượt khách mua hàng gần nhiều Biểu đồ Monetary Frequency có hình dạng phân bố đỉnh độc lập với đỉnh nằm phía trái Điều cho thấy tần suất mua khách hàng giá trị họ mua nằm phân khúc trung bình thấp so với tổng thể Giá trị xuất biểu đồ Recency 19, biểu đồ Frequency 17 biểu đồ Monetary 35,704, tương ứng với số điểm RFM 433 Với kết này, doanh nghiệp nên tập trung vào việc nâng cao số F M Tri ân khách hàng tng voucher giảm giá cho lần mua cách hiệu để thu hút khách quay lại, tăng tần số mua hàng khách Ngoài ra, khách hàng vui lịng mua lại doanh nghiệp có ấn tượng tốt mắt họ Vì phát triển dịch vụ điều cần thiết mà doanh nghiệp nên làm Bên cạnh đó, doanh nghiệp muốn tăng số F M chương trình tích điểm tng quà phù 24 hợp Khách hàng quay lại nhiều lần, mua đơn hàng đạt giá trị để tham gia vào chương trình Bài tốn 2: Dự đoán phân loại khách hàng (Đánh giá qua kết mơ hình RFM qua ứng dụng Rstudio) 4.2.5 Trực quan hóa phân khúc khách hàng Hình 4.2.5.10: Phân khúc khách hàng Hiện tại, nhóm tách khách hàng thành phân khúc RFM khác nhau, biểu đồ RFM plot median trực quan hóa liệu nhóm dựa phân khúc định RFM plot median recency Biểu đồ 4.2.5.11: Biểu đồ phân loại theo RFM thời gian mua hàng trung bình gần (RFM plot median recency) 25 Biểu đồ cho thấy thời gian mua hàng trung bình gần cho phân khúc khách hàng khác ● Với thời điểm xét 30/6/2020, nhóm khách hàng Hibernating có thời gian mua hàng trung bình gần dài với 120 ngày ● Với thời điểm xét 30/6/2020, nhóm khách hàng Champions có thời gian mua hàng trung bình gần ngắn gần 20 ngày => Điều khẳng định cho việc tập trung chăm sóc nhóm khách hàng VIP (Champions Loyal Customers) mục tiêu ưu tiên với nhiều ưu điểm mức độ rủi ro thấp, thời gian giao dịch gần nhất, có khả mang lại doanh thu cao phân khúc khách hàng khác RFM plot median Frequency Biểu đồ 4.2.5.12: Biểu đồ phân loại theo RFM tuần suất giao dịch trung bình gần (RFM plot median recency) 26 Biểu đồ 4.2.5.12 cho thấy, tần suất giao dịch nhóm phân khúc khách hàng có chênh lệch ● Nhóm Champions điểm bật với trung vị đạt gần 25 lần Trong phân khúc khách hàng khác có từ 12 - 22 lần giải ngân ● Tỷ lệ nắm giữ sản phẩm khách hàng chưa cao (khoảng từ 10 - 18 lần) => Cần xây dựng hệ thống sản phẩm khách hàng thực linh hoạt, hấp dẫn để giữ chân khách hàng quay lại nhiều Từ đó, gia tăng tỷ lệ nắm giữ sản phẩm doanh số giải ngân cao Đc biệt, biểu đồ cần lưu ý tới hai phân khúc khách hàng cần có sách chăm sóc là Potential Loyalist và About to Sleep RFM plot median Monetary: Biểu đồ 4.2.5.13: Biểu đồ phân loại theo RFM giá trị tiền tệ trung bình khách hàng chi tiêu (RFM plot median Monetary) Biểu đồ cho thấy tầm quan trọng phân khúc Champions chúng có giá trị tiền tệ trung bình lớn 27 ● Chúng ta nhận thấy chênh lệch khơng q lớn nhóm khách hàng Champions nhóm Loyal Customers (khách hàng gần thứ hai với Champions) xấp xỉ 1,2 lần ● Ngoài ra, thấy khách hàng At Risk có giá trị tiền tệ trung bình tốt (hơn 45,000) thấy trong Biểu đồ 4.2.5.12, nhóm At Risk nhóm khách hàng có thời gian mua hàng trung bình gần dài => Điều ảnh hưởng từ sách sản phẩm dành cho nhóm khách hàng có nguy rủi ro cao còn, kết hợp với việc chưa có giải pháp hiệu khai thác nhóm khách hàng tiềm để biến họ thành khách hàng thân thiết Hoc nói giải pháp sách giữ chân khách hàng, chương trình khách hàng thân thiết giai đoạn xây dựng, triển khai chưa đạt hiệu Bài toán mở rộng: Mô tả số liệu sản phẩm - khả mua hàng khách hàng: a) Quantity & Price: Biểu đồ 4.2.5.14: Số lượng giá sản phẩm mua Dựa vào biểu đồ trên, ta thấy tổng sản phẩm doanh nghiệp bán từ đầu năm 2018 đến 30/06/2020 29,138 sản phẩm Trong sản phẩm ưa chuộng với số lượng bán thị trường cao (632 sản phẩm) có mức giá $530 (bằng 20,4% so với sản phẩm có mức giá cao $2,597) Sản phẩm ưa chuộng 28 sản phẩm với mức giá $1,052 $1,635 với số lượng bán 228 sản phẩm loại Hai khung giá tiền khách hàng chi tiêu nhiều nhất: sản phẩm khung giá ($315 - $590) - hàng hố cấp thấp/ thơng thường, sản phẩm khung giá ($1671 $1809 ) - hàng hoá cấp cao b) State: Biểu đồ 4.2.5.15: Tổng số tiền mua hàng, thu nhập trung bình hộ gia đình bang Mức chi tiêu mua sắm sản phẩm hai bảng đồ thị có hướng di chuyển tương ứng giống nhau, đồng thời thể tương quan ba biến “Sum of Households”, “Sum of Median Income”, “Sum of Amount” Phân tích số liệu bang state: “Florida”: với mức thu nhập bình quân (Sum of Median Income) đứng thứ Tuy nhiên, tổng dân cư lại cao không nhiều so với mt chung tiểu bang khác đáng ngạc nhiên sức mua hàng họ vô lớn (xếp thứ chi tiêu) Như vậy, nhu cầu hàng hóa dân cư lớn để đạt mức doanh thu cao (Sum of Amount) “New York”: ứng với lượng dân cư cao nhất, tổng chi tiêu chiếm vị trí thứ mức thu nhập bình quân cao so với bang khác 29 Có thể dự đốn rằng, mức thu nhập bình quân tăng lên khả chi tiêu cho hàng hóa người dân bang tỷ lệ thuận Các bang cịn lại có số lượng mua hàng thấp nhiều hướng ba đường với bang mức tương đồng Cho thấy họ chi tiêu phù hợp với mức thu nhập trung bình dẫn đến doanh thu không chênh lệch nhiều 4.3 Thảo luận đánh giá kết phân tích đề xuất hỗ trợ định Từ phân tích, đánh giá kết biểu đồ phía nhóm dự đốn hành vi mua hàng khách hàng sản phẩm doanh nghiệp dự đoán phân loại khách hàng đề số biện pháp cho đối tượng khách hàng sau: ● Nhóm khách hàng thân thiết hay khách hàng trung thành, tiềm năng, họ yếu tố góp phần thúc đẩy doanh thu tăng lên có khả chi trả cao Đối với nhóm khách hàng này, nhóm có đề xuất doanh nghiệp dành cho họ lợi ích như: miễn phí vận chuyển, cung cấp thẻ thành viên, sáng tạo thêm sản phẩm với công vượt trội, thường xuyên liên hệ để xin đánh giá trải nghiệm họ hoc tổ chức kiện để mời khách hàng đến tham quan, tương tác trực tiếp ● Nhóm khách hàng ngưng quay lại thời gian trước họ mua hàng thường xuyên chi tiêu nhiều Doanh nghiệp ưu đãi giá, gửi email cá nhân để kết nối lại với họ, Sau đó, kiểm tra phản hồi điều chỉnh cách tiếp cận phù hợp ● Các khách hàng có điểm RFM cao điểm F là khách hàng Nhóm để xuất doanh nghiệp nên tiết kiệm cách liên hệ với họ hoc sử dụng phương pháp rẻ khơng bỏ qua nhóm khách hàng Tóm lại, doanh nghiệp cần đẩy mạnh tiếp cận nhiều người tiêu dùng tốt, họ nên tập trung vào việc nâng cao số F M Và biện pháp nêu, doanh nghiệp áp dụng nhiều biện pháp để gia tăng số 30 lượng khách hàng trung thành tăng doanh thu cho Dựa vào kết phân tích phía trên, việc dự báo phân loại khách hàng doanh nghiệp khơng cịn tốn “đốn mị” mà có cơng thức rõ ràng doanh nghiệp dựa vào để đề sách hợp lý cho nhóm khách hàng CHƯƠNG KẾT LUẬN 5.1 Kết đạt Dự án hoàn thiện đạt kết sau: Về mt lý thuyết, dự án đề điểm sở lý thuyết tổng quan khai phá liệu Về mt thực tế, áp dụng sở lý thuyết để giải liệu cho kết thõa với mục đích nghiên cứu Với việc phân tích khai thác liệu cho kết ta thấy hiệu mơ hình Từ đó, giúp ta dễ dàng tìm phân khúc khách hàng có hành vi mua sắm tương đồng có chiến lược hợp lý 5.2 Hạn chế Mc dù nỗ lực để hồn thành nghiên cứu, nhiên, q trình làm bài, khơng thể tránh khỏi số hạn chế yếu tố chủ quan, khách quan: Bài dự án nhóm cố gắng đạt mục tiêu kinh nghiệm nghiên cứu chưa có nhiều vốn kiến thức cịn tương đối hạn chế nên khơng thể tránh thiếu sót định Thời gian học phần ngắn nên chưa thực vững thực hành bước huấn luyện liệu làm việc với liệu Độ xác cịn chưa đạt tới mức tuyệt đối, khơng thể tránh khỏi sai sót q trình làm việc nên việc đưa kết luận khơng thể hồn toàn 100% 31 Tại Việt Nam, liệu khách hàng dạng bảo mật thông tin, vậy, chưa thực có hội làm việc với liệu nước liệu thực tế 5.3 Hướng phát triển Từ kết đạt thấy khơng dự án mà xem nguồn tham khảo nhiều khía cạnh góc nhìn để giúp người quản trị có tranh tổng quan khách hàng tình hình cơng ty, doanh nghiệp Và giúp họ nhận diện, phân tích chiến lược marketing nói riêng, lĩnh vực phân tích liệu khách hàng nói chung Dự án cịn cách giới thiệu giải pháp phân tích với liệu lớn giúp việc định nhà quản trị có hiệu tối ưu Để dự án hoàn thiện hơn, tiếp tục mở rộng dự án đưa vào thực tế sử dụng cách triệt để Có thể kết hợp nhiều phương pháp, mơ hình phân tích khác để có hiểu biết hành vi khách hàng Từ dự án nhóm phát triển cho việc trau dồi thêm kiến thức kinh nghiệm cho lần phân tích liệu khác Sẽ tìm nguồn liệu có giá trị thực tiễn ý nghĩa Nghiên cứu sâu toán khai phá liệu áp dụng vào thực tế Khơng áp dụng mà cịn phù hợp với tình hình giai đoạn như: định hướng kinh doanh, FILE THUYẾT TRÌNH Link Slide thuyết trình TÀI LIỆU THAM KHẢO Nguyen Van Ho. Bài giảng môn Khoa học liệu Truy xuất từ hệ thống học trực tuyến: https://lms.ueh.edu.vn/course/view.php?id=6081 Birant, D (2011) Data mining using RFM analysis In Knowledge-oriented applications in data mining IntechOpen Blattberg, R.C.; Kim, B-D & Neslin, S.A (2008) Database Marketing: Analyzing and Managing Customers, Chapter 12, pp 323-337, Springer, ISBN: 978-0387725789, New York, USA 32 Han, J.; Pei, H.& Yin Y (2000) Mining Frequent Patterns without Candidate Generation Proceedings of Conference on the Management of Data (SIGMOD’00), pp 1-12, ISBN:1581132174, Dallas, Texas, United States, May 2000, ACM New York, NY, USA Khoa học Dữ liệu – Data science gì? (25 THÁNG MƯỜI MỘT, 2019) Truy xuất từ: https://abiz.edu.vn/khoa-hoc-du-lieu-data-science-la-gi/ Khoa học liệu Truy xuất từ: https://aws.amazon.com/vi/what-is/datascience/ Phân tích phân khúc khách hàng với mơ hình RFM Truy xuất từ: https://tigosoftware.com/vi/phan-tich-phan-khuc-khach-hang-voi-mo-hinh-rfm Q, T Q (2021). Introduction about R and RStudio Đại học Công nghệ Thông tin & Truyền thông Thái Nguyên Tuân, B (2022) RFM - Customer Level Data Truy xuất từ: https://rpubs.com/votieuvu1986/938658?fbclid=IwAR37XQ532oCTPTvkB5m6aZM HcE4z3Xu-0O_9-n3K2kN9nNtiuiDQiLZAjkU PHỤ LỤC Bảng RFM segmentation RFM score Label 555, 554, 544, 545, 454, 455, 445 Champions 543, 444, 435, 355, 354, 345, 344, 335 Loyal Description Bought recently, order often and spend the most Orders regularly Responsive to promotions 553, 551, 552, 541, 542, 533, 532, 531, 452, 451, 442, 441, Potential Recent customers who spent good 431, 453, 433, 432, 423, 353, Loyalist amounts 352, 351, 342, 341, 333, 323 512, 511, 422, 421, 412, 411, 311 New Customers 33 Bought most recently Potential loyalist a few months ago 525, 524, 523, 522, 521, 515, 514, 513, 425, 424, 413, 414, Promising 415, 315, 314, 313 Spends frequently and a good amount But the last purchase was several weeks ago 535, 534, 443, 434, 343, 334, Need Core customers whose last purchase 325, 324 Attention happened more than one month ago 331, 321, 312, 221, 213, 231, About To 241, 251 Sleep 255, 254, 245, 244, 253, 252, Made their last purchase a long time ago but in the last weeks either visited the site or opened an email Similar to 'Cannot Lose Them' but 243, 242, 235, 234, 225, 224, At Risk 153, 152, 145, 143, 142, 135, with smaller monetary and frequency value 134, 133, 125, 124 155, 154, 144, 214, 215, 115, Cannot Lose Made the largest orders, and often 114, 113 Them But haven’t returned for a long time Customers who made smaller and 332, 322, 233, 232, 223, 222, Hibernating infrequent purchases before but 132, 123, 122, 212, 211 customers haven't purchased anything in a long time 111, 112, 121, 131, 141, 151 Lost customers 34 Made last purchase long time ago and didn’t engage at all in the last weeks