(Tiểu luận) đề tài phân tích dữ liệu, dự đoán phân loại khách hàng dựa trênbộ dữ liệu ubg

39 10 0
(Tiểu luận) đề tài phân tích dữ liệu, dự đoán phân loại khách hàng dựa trênbộ dữ liệu ubg

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC KINH TẾ TP HỒ CHÍ MINH TRƯỜNG KINH TẾ LUẬT VÀ QUẢN LÝ NHÀ NƯỚC DỰ ÁN KẾT THÚC HỌC PHẦN ĐỀ TÀI: PHÂN TÍCH DỮ LIỆU, DỰ ĐỐN PHÂN LOẠI KHÁCH HÀNG DỰA TRÊN BỘ DỮ LIỆU UBG Học phần: Khoa Học Dữ Liệu Mã lớp học phần: 22C1INF50905944 Giảng viên hướng dẫn: Nguyễn Văn Hồ Chuyên ngành: Kinh tế học ứng dụng Khóa: K47 TP Hồ Chí Minh, Ngày 24 tháng 12 năm 2022 BẢNG ĐÁNH GIÁ THÀNH VIÊN Họ tên La Ngọc Liên Lê Nguyễn Trà My MSSV Anh Huỳnh Bảo Trâm Nguyễn Thị Thanh Trúc Hoàn Chữ ký thành sinh viên Nghiên cứu, tổng quan 31211027210 100% liệu, nhận xét biểu đồ, thảo luận, dự báo 31211020203 Nghiên cứu liệu, sở 100% lý thuyết, nhận xét biểu đồ, tổng hợp, chỉnh sửa Nghiên cứu phân tích100% Nguyễn Kim Trâm Nhiệm vụ 31211022713 liệu, tổng quan đề tài, nhận xét Nghiên cứu liệu phân 31211022011 tích tiền xử lý liệu, nhận 100% xét, kết luận Nghiên cứu phân tích 31211020216 liệu, chạy Rstudio, nhận xét biểu đồ, slides 100% MỤC LỤC LỜI CẢM ƠN .1 DANH MỤC BẢNG BIỂU, SƠ ĐỒ, HÌNH ẢNH CHƯƠNG TỔNG QUAN ĐỀ TÀI 1.1 Lý chọn đề tài 1.2 Mục tiêu đề tài 1.3 Đối tượng phạm vi nghiên cứu đề tài (thương mại sản xuất) 1.3.1 Chọn liệu 1.3.2 Cấu trúc liệu 1.4 Công cụ sử dụng 1.5 Ý nghĩa nghiên cứu 1.6 Cấu trúc đề tài CHƯƠNG CƠ SỞ LÝ THUYẾT .5 2.1 Tổng quan Khoa học liệu 2.2 Lợi ích Khoa học liệu kinh doanh quản lý 2.3 Quy trình thực dự án Khoa học liệu 2.4 Mơ hình RFM 2.4.1 Giới thiệu mơ hình 2.4.2 Quy hình thực 2.4.3 Lợi ích 10 2.5 RStudio 10 2.5.1 Giới thiệu Rstudio 10 2.5.2 Quy trình thực với Rstudio: .10 CHƯƠNG PHÂN TÍCH U CẦU NGƯỜI DÙNG VÀ MƠ TẢ DỮ LIỆU 3.1 Xác định phân tích yêu cầu người dùng .11 3.2 Tổng quan sở liệu nguồn 12 11 3.2.1 Mô tả liệu nguồn 12 3.2.2 Lựa chọn trình bày liệu cần phân tích yêu cầu người dùng 12 CHƯƠNG PHÂN TÍCH DỮ LIỆU VÀ KẾT QUẢ 14 4.1 Giới thiệu giải pháp quy trình thực 14 4.2 Phân tích trực quan hóa kết (Đánh giá tổng quan mơ hình RFM thơng qua Excel ứng dụng Rstudio) .17 4.2.1 Trực quan liệu xử lý: 17 4.2.2 Kết trực quan RFM qua Excel Rstudio: .18 4.2.3 Biểu đồ trực quan đánh giá kết RFM 19 4.2.4 Histogram RFM 24 4.2.5 Trực quan hóa phân khúc khách hàng .25 4.3 Thảo luận đánh giá kết phân tích đề xuất hỗ trợ định30 CHƯƠNG KẾT LUẬN 31 5.1 Kết đạt .31 5.2 Hạn chế 31 5.3 Hướng phát triển 32 FILE THUYẾT TRÌNH 32 TÀI LIỆU THAM KHẢO 32 PHỤ LỤC 33 LỜI CẢM ƠN Lời đầu tiên, nhóm em xin gửi lời cảm ơn đến thầy Nguyễn Văn Hồ Trong q trình học tập tìm hiểu mơn Khoa học liệu, nhóm em nhận quan tâm giúp đỡ, hướng dẫn nhiệt tình, tâm huyết thầy Nhờ có thầy mà nhóm em tích lũy nhiều hiểu rõ kiến thức mơn học, có nhiều kinh nghiệm tin học văn phịng để ứng dụng vào cơng việc sau Thơng qua tiểu luận này, nhóm em xin phép trình bày mở rộng kiến thức thầy truyền đạt môn Khoa học liệu Có lẽ kiến thức vơ hạn mà mức độ tiếp thu thân người tồn hạn chế định Do trình làm bài, nhóm em chắn khơng thể tránh khỏi thiếu sót Vì chúng em mong nhận lời nhận xét ý kiến đóng góp thầy để báo cáo nhóm em hồn thiện DANH MỤC BẢNG BIỂU, SƠ ĐỒ, HÌNH ẢNH Mục Loại Tên 1.3.2 Bảng Cấu trúc liệu 2.1 Hình Lược đồ Data Science 2.4.1 Hình Mơ hình RFM 2.4.2 Hình Ví dụ RFM score 3.2.1 Bảng Mô tả liệu nguồn 12 3.2.2 Hình Bộ liệu qua tiền xử lý 13 4.1.1 Hình Chuẩn hố liệu thành bảng điểm 14 4.1.2 Hình Dữ liệu điểm R,F,M RFM score 15 4.1.3 Hình Phân loại số lượng khách hàng tỷ lệ tương ứng 15 4.1.4 Biểu đồ Label segment Treemap 16 Trang 4.1.5 Biểu đồ Đồ thị lệch chuẩn 16 4.2.1.1 Hình Mã code kết thể liệu xử lý 17 4.2.1.2 Biểu đồ Xác nhận liệu hai biến “Current price” 18 “Quality” xử lý 4.2.2.3 Hình Kết RFM thơng qua Rstudio 18 4.2.2.4 Hình Kết so sánh RFM score Excel 19 Rstudio 4.2.3.5 Biểu đồ RFM heat map 19 4.2.3.6 Biểu đồ RFM bar chart 21 4.2.3.7 Biểu đồ Mối tương quan Recency Monetary 22 4.2.3.8 Biểu đồ Mối tương quan Frequency Monetary 23 4.2.4.9 Biểu đồ RFM Histogram 24 4.2.5.10 Hình Phân khúc khách hàng 25 4.2.5.11 Biểu đồ RFM plot median Recency 25 4.2.5.12 Biểu đồ RFM plot median Frequency 26 4.2.5.13 Biểu đồ RFM plot median Monetary 27 4.2.5.14 Biểu đồ Số lượng giá sản phẩm mua 28 4.2.5.15 Biểu đồ Tổng số tiền mua hàng, thu nhập trung bình 29 hộ gia đình bang CHƯƠNG TỔNG QUAN ĐỀ TÀI 1.1 Lý chọn đề tài Một doanh nghiệp muốn tìm chiến lược kinh doanh phù hợp phải nắm bắt tình trạng khách hàng thơng qua việc lưu trữ liệu Trong mơ hình kinh doanh nay, nhóm lựa chọn mơ hình kinh doanh lị sưởi để phân tích đưa giải pháp phù hợp cho mơ hình Nhu cầu sử dụng lị sưởi quốc gia vùng ơn đới cao mùa đơng nơi có khí hậu giá rét Lị sưởi phổ biến phương Tây, Bắc Âu, ngành cơng nghiệp lị sưởi quốc gia phát triển Nhận biết tầm phủ sóng thị trường này, nhóm định thực hành đánh giá hành vi người tiêu dùng, đưa chiến lược kinh doanh cho doanh nghiệp dựa vào việc “Phân tích liệu, dự đốn phân loại khách hàng dựa liệu UBG (tập đoàn lớn đại diện cho doanh nghiệp độc lập chuyên thị trường lò sưởi)” ứng dụng phương pháp khoa học liệu để tạo case phân tích liệu kinh tế 1.2 Mục tiêu đề tài Mục tiêu đề tài đề xuất chiến lược kinh doanh phù hợp với doanh nghiệp cho giai đoạn tiếp tới Để làm điều này, nhóm phải tiến hành thu thập liệu đánh giá hành vi người tiêu dùng Tiếp theo, nhóm phân loại khách hàng tập đồn UBG, dự đốn khả mua hàng khách hàng, từ đề xuất, hỗ trợ định, giúp doanh nghiệp bán sản phẩm có chiến lược kinh doanh hiệu làm tăng doanh thu 1.3 Đối tượng phạm vi nghiên cứu đề tài (thương mại sản xuất) 1.3.1 Chọn liệu Dựa vào bảng liệu doanh nghiệp UBG công khai tại: Link trang web Đối tượng nghiên cứu đề tài gồm thông tin doanh nghiệp thông tin khách hàng, thông tin sản phẩm, doanh thu thời gian bán Dữ liệu ghi lại sau lần giao dịch thành công với người tiêu dùng Đề tài nghiên cứu phạm vi thương mại sản xuất Nghiên cứu thực tập đoàn UBG bao gồm hoạt động kinh doanh tập đoàn giai đoạn từ đầu năm 2018 đến nửa đầu năm 2020 1.3.2 Cấu trúc liệu Đặc điểm Mô tả Đơn biến hay đa biến Đa biến Lĩnh vực Thương mại sản xuất Số lượng mẫu 15,000 Bảng 1.3.2: Cấu trúc liệu 1.4 Công cụ sử dụng Model RFM áp dụng tính số với khách hàng dựa lịch sử mua hàng họ, ta sử dụng Excel để xử lí số liệu kết hợp với việc sử dụng RStudio để số liệu thể cụ thể Excel phần mềm quen thuộc giúp khai phá, phân tích, thống kê, tính tốn số liệu Nó phù hợp để tính RFM với bước đơn giản dễ dàng cho kết cách nhanh số cơng cụ cơng thức có sẵn RStudio mơi trường phát triển tích hợp cho R, ngơn ngữ lập trình cho tính tốn thống kê đồ họa Chương trình có sẵn hai định dạng: RStudio Desktop - ứng dụng máy tính để bàn thông thường RStudio Server chạy máy chủ từ xa cho phép truy cập RStudio trình duyệt web 1.5 Ý nghĩa nghiên cứu Với phát triển mạnh mẽ không ngừng khoa học công nghệ liệu nay, việc thu thập, lưu trữ liệu khách hàng nguồn tài nguyên mang đến nhiều tiềm sở việc khai thác, phân tích giải vấn đề kinh doanh Các nhà quản trị hiểu tầm quan trọng khách hàng họ muốn thông qua liệu lịch sử mua hàng để hiểu khách hàng họ, để việc kết nối với khách hàng dễ dàng hơn, mơ hình phân loại khách hàng đưa tầm nhìn nhà quản trị xa xây dựng mở rộng mối quan hệ với khách hàng Phân tích ln yếu tố then chốt để dẫn đến thắng lợi hoạt động Sales & Marketing, mơ hình RFM mơ hình quan trọng RFM cho phép người làm nhắm mục tiêu nhóm khách hàng cụ thể với thông tin phù hợp nhiều với hành vi họ – tạo tỷ lệ phản hồi cao nhiều, cộng với trung thành giá trị lâu dài khách hàng tăng lên Kết nghiên cứu liệu tham khảo cho doanh nghiệp, cơng ty, tập đồn, muốn phân tích xác định hành vi khách hàng có Từ có chiến dịch marketing ho c chăm sóc đ c biệt đến khách hàng quản trị khách hàng hiệu 1.6 Cấu trúc đề tài Bài nghiên cứu gồm 34 trang, bảng, 11 hình 12 biểu đồ Ngồi phần mở đầu, mục lục, danh mục từ viết tắt, danh mục bảng, danh mục hình ảnh, danh mục tài liệu tham khảo phục lục, đề tài kết cấu thành chương sau: Chương 1: Tổng quan đề tài Chương 2: Cơ sở lý thuyết Chương 3: Phân tích yêu cầu người dùng mô tả liệu Chương 4: Phân tích liệu kết Chương 5: Kết luận CHƯƠNG CƠ SỞ LÝ THUYẾT 2.1 Tổng quan Khoa học liệu Khoa học liệu hiểu nghiên cứu liệu, mà nguồn liệu nhiều dạng khác thu thập từ lĩnh vực, ngành nghề, sau khai thác, khám phá thuật tốn, cơng cụ, phương pháp nghiên cứu, mơ hình kết hợp với kiến thức chun ngành (tốn học, thống kê, trí tuệ nhân tạo, kỹ thuật máy tính, ) để giải vấn đề Kết đạt trả lời, lý giải câu hỏi: điều xảy ra; lại thế; điều xảy tiếp theo; cần giải nào, bao lâu; ảnh hương xảy ra; thu thơng tin, kiến thức có ý nghĩa hoạt động kinh tế- xã hội Hình 2.1: Lược đồ Data Science Lược đồ Data Science gồm nội dung chính: quản trị liệu, phân tích liệu sử dụng kết Nguồn liệu thu thập từ trình quan sát, đo lường thuộc tính, giá trị, đ c điểm, vật, tượng cần xem xét làm giữ an tồn, sau phương pháp, thuật toán khai thác để đưa kết theo yêu cầu để phục vụ cho mục đích lĩnh vực Trải qua cách mạng công nghiệp, bùng lên mạnh mẽ liệu lớn (Big Data), đời bước tiến vượt bậc: điện toán đám mây (Clouding Computing) - giúp lưu trữ truy nhập liệu lên “clouds” qua Internet thay máy tính người dùng, Internet vạn vật (IoT) trao đổi qua Internet không cần kết nối trực

Ngày đăng: 30/10/2023, 16:20

Tài liệu cùng người dùng

Tài liệu liên quan