Bài tập lớn tìm hiểu về Big Data.docx

28 20 0
Bài tập lớn tìm hiểu về Big Data.docx

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

DEMO PHÂN TÍCH VÀ TRỰC QUAN HOÁ DỮ LIỆU DOANH NGHIỆP ADVENTUREWORKS2014 VỚI NHÓM SẢN PHẨM BIKE BẰNG PHƯƠNG PHÁP RFM.

ĐẠI HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI KHOA CÔNG NGHỆ THÔNG TIN BÁO CÁO NHĨM MƠN HỌC THƯƠNG MẠI ĐIỆN TỬ TÌM HIỂU BIG DATA Cán hướng dẫn: Nhóm: Lớp: Hà Nội, tháng năm 2023 MỤC LỤC BẢNG PHÂN CÔNG CÔNG VIỆC Chương 1: GIỚI THIỆU ĐỀ TÀI Chương 2: NỘI DUNG ĐỀ TÀI I Tổng quan Big Data II Cơ sở lý thuyết Big Data III Kỹ thuật Big Data IV Vai trò Big Data doanh nghiệp .9 V Khó khăn làm việc với Big Data VI Quy trình hoạt động Big Data 10 VII Các ứng dụng phổ biến Big Data 12 VIII Các công nghệ dành cho Big Data 14 Chương 3: PHÂN TÍCH VÀ TRỰC QUAN HỐ DỮ LIỆU DOANH NGHIỆP ADVENTUREWORKS2014 VỚI NHÓM SẢN PHẨM BIKE BẰNG PHƯƠNG PHÁP RFM .16 Cơ sở lý thuyết 16 Giới thiệu liệu thực hành 17 KẾT LUẬN 26 TÀI LIỆU THAM KHẢO 27 Chương 1: GIỚI THIỆU ĐỀ TÀI Big Data, khái niệm trở nên quen thuộc thời đại số hóa, mang sức mạnh biến đổi đáng kể cách nắm bắt, xử lý tận dụng thông tin Đã từ lâu, liệu không đơn số thông tin thô mà trở thành tài sản vô giá, nguồn cung cấp thông tin quan trọng, thúc đẩy phát triển thay đổi tồn diện nhiều khía cạnh sống kinh tế Chính gia tăng vượt bậc khả lưu trữ, truyền tải xử lý liệu đánh dấu đời Big Data Khái niệm không dừng lại lượng liệu khổng lồ mà đề cập đến tốc độ nhanh chóng việc tạo liệu, đa dạng nguồn liệu từ cấu trúc đến phi cấu trúc Sự kết hợp Big Data cơng nghệ trí tuệ nhân tạo học máy mở cánh cửa cho việc khám phá thơng tin tiềm ẩn, tạo dự đốn, hiểu sâu giới xung quanh Các lĩnh vực từ y tế, tài chính, quản lý đô thị, sản xuất đến bán lẻ nông nghiệp tận dụng Big Data để tạo giá trị, tối ưu hóa hoạt động định hình tương lai Tuy nhiên, với quy mô phức tạp Big Data đặt thách thức bảo mật, quyền riêng tư khả xử lý Hiểu biết cách làm việc với Big Data, từ việc thu thập, lưu trữ, xử lý đến phân tích, trở thành phần quan trọng phát triển giới số hóa Trong bối cảnh thứ dần trở nên kết nối thông tin ngày thâm nhập vào sống hàng ngày, Big Data không khái niệm mà cách mạng cách hiểu tận dụng thông tin để hướng tới tiến phát triển bền vững Chương 2: NỘI DUNG ĐỀ TÀI I Tổng quan Big Data Định nghĩa Big Data thuật ngữ sử dụng để miêu tả việc xử lý phân tích lượng lớn liệu có quy mơ khổng lồ, đa dạng phức tạp, mà công cụ phương pháp truyền thống xử lý hiệu Khái niệm thường liên kết với ba yếu tố chính: 3V - Volume (lượng), Velocity (tốc độ), Variety (đa dạng) Đặc điểm -Volume (Lượng): Big Data ám khả thu thập lưu trữ lượng liệu lớn, vượt khả hệ thống thông thường Dữ liệu bao gồm thơng tin từ nguồn máy chủ, thiết bị cảm biến, mạng xã hội, hoạt động trực tuyến, v.v -Velocity (Tốc độ): Dữ liệu Big Data thường tạo thu thập với tốc độ nhanh chóng, địi hỏi khả xử lý phân tích liệu thời gian thực Ví dụ, ứng dụng Internet of Things (IoT) tạo liệu liên tục từ thiết bị cảm biến -Variety (Đa dạng): Dữ liệu môi trường Big Data không đến từ nguồn nhất, mà đa dạng định dạng, cấu trúc nguồn gốc Điều bao gồm liệu cấu trúc (như sở liệu SQL), liệu bán cấu trúc (như tệp CSV), liệu phi cấu trúc (như văn bản, hình ảnh, video) =>Để xử lý tận dụng liệu Big Data, công cụ kỹ thuật đặc biệt phát triển Các hệ thống xử lý liệu lớn Hadoop, Spark, công nghệ sở liệu NoSQL phát triển để giúp lưu trữ, xử lý phân tích liệu quy mô lớn Các kỹ thuật Machine Learning Data Mining thường sử dụng để khai thác thông tin ẩn chứa liệu Big Data, để đưa dự đoán, phân loại, hiểu rõ xu hướng mơ hình Tổng cộng, khái niệm Big Data phản ánh thực tế mà sống giới mà liệu ngày trở nên phong phú, đa dạng tăng quy mô, việc quản lý sử dụng hiệu liệu thách thức quan trọng nhiều lĩnh vực Các giai đoạn hình thành Dữ liệu lớn thuật ngữ sử dụng để xử lý quản lý liệu lớn, phức tạp mà xử lý công cụ truyền thông Sự phát triển Big Data chia thành giai đoạn từ 1.0 đến 4.0 để mơ tả tiến hóa qua thời gian Dưới tóm tắt giai đoạn này: -Big Data 1.0: Điểm khởi động Giai đoạn đầu Big Data bắt đầu công ty tổ chức bắt đầu nhận giá trị việc lưu trữ xử lý liệu lớn Các công nghệ sở liệu phân tán (cơ sở liệu phân tán) khung Hadoop xuất hiện, cho phép lý liệu có quy định lớn cách tận dụng sức mạnh xử lý nhiều máy tính kết nối với -Big Data 2.0: Phân tích Insight Giai đoạn thứ hai tập trung vào việc phân tích liệu để trích xuất thơng tin hiểu rõ khách hàng, xu hướng thị trường mơ hình hành vi Các cơng nghệ phương pháp phân tích liệu phức tạp Machine Learning Data Mining bắt đầu áp dụng để tạo thông tin hữu ích từ liệu lớn -Big Data 3.0: Thời đại kết nối tương tác Giai đoạn tập trung vào việc kết hợp liệu từ nhiều nguồn khác tạo mơ hình phức tạp để dự đoán đưa định Internet of Things (IoT) đóng vai trị quan trọng việc cung cấp lượng liệu lớn từ thiết bị cảm biến khác nhau, ứng dụng Thành phố thơng minh hệ thống tự động hóa phát triển dựa kết nối nối tương tác nguồn liệu -Big Data 4.0: Trí tuệ nhân tạo Tự động hóa cao cấp Giai đoạn tại, Big Data 4.0, tập trung vào việc sử dụng trí tuệ nhân tạo (AI) để tự động hóa tối ưu hóa định dựa liệu thay Các hệ thống tự động hóa thông minh, hệ thống sản xuất tự động, giao thông thông minh quản lý tài nguyên, dựa liệu lớn trí tuệ nhân tạo để hoạt động hiệu đáp ứng nhu cầu ngày cao phát triển xã hội =>Sự phát triển Dữ liệu lớn từ 1.0 đến 4.0 tiến hóa cơng việc lý sử dụng liệu lớn lĩnh vực khác nhau, xử lý từ phân tích đến tương tác phức tạp cuối kết hợp trí tuệ nhân tạo tự động hóa cao cấp II Cơ sở lý thuyết Big Data Cơ sở lý thuyết Big Data dựa số khái niệm nguyên tắc từ lĩnh vực khoa học máy tính, xử lý liệu, thống kê hệ thống thông tin Dưới số khía cạnh sở lý thuyết quan trọng liên quan đến Big Data: Thống kê Xác xuất Cơ sở lý thuyết thống kê xác suất quan trọng việc hiểu xử lý Big Data Các phương pháp thống kê giúp phân tích liệu, xác định mẫu, đo lường không chắn liệu tạo dự đốn dựa mơ hình Các ngun tắc xác suất giúp định lượng khả xảy kiện liệu, đặc biệt liệu lớn phức tạp Xử lý liệu lớn (Big Data Processing) Đây lĩnh vực tập trung vào việc xử lý liệu có quy mơ lớn Các công nghệ Hadoop Apache Spark ví dụ điển hình hệ thống xử lý liệu lớn Các nguyên tắc xử lý song song, phân tán cân tải sở lý thuyết quan trọng Cơ sở liệu Trong Big Data, việc lưu trữ truy cập liệu có quy mơ lớn địi hỏi sở liệu có hiệu suất cao khả mở rộng Các sở liệu NoSQL MongoDB, Cassandra, hệ thống sở liệu cụ thể cho liệu lớn (Big Data databases) phát triển để đáp ứng yêu cầu Mạng xã hội Phân tích ngữ nghĩa Trong thời đại số hóa, liệu xã hội liệu từ nguồn mạng xã hội, diễn đàn trực tuyến trở nên ngày quan trọng Phân tích ngữ nghĩa, khai phá liệu xã hội xử lý liệu văn địi hỏi kiến thức xử lý ngơn ngữ tự nhiên (NLP) kỹ thuật khai thác thơng tin Trí tuệ nhân tạo học máy Big Data thường kèm với việc sử dụng trí tuệ nhân tạo học máy để tìm kiếm mẫu, tạo dự đoán hiểu sâu liệu Cơ sở lý thuyết học máy, bao gồm thuật toán phân loại, gom cụm, học sâu (deep learning), cung cấp khả hiểu liệu tạo giá trị từ Nhìn chung Cơ sở lý thuyết Big Data liên quan đến kết hợp nhiều lĩnh vực khác nhau, đặc biệt khoa học máy tính, tốn học, thống kê, xử lý liệu III Kỹ thuật Big Data Hadoop: Hadoop framework mã nguồn mở dựa nguyên tắc xử lý phân tán Nó bao gồm hai thành phần Hadoop Distributed File System (HDFS) để lưu trữ liệu phân tán MapReduce để xử lý liệu phân tán Hadoop cho phép xử lý liệu lớn cụm máy tính thông qua phân tán song song Apache Spark: Spark framework xử lý liệu lớn khác, nhanh linh hoạt so với MapReduce Nó hỗ trợ nhiều loại công việc xử lý liệu xử lý batch, xử lý dựa luồng (streaming), xử lý đồ đạc học máy Cơ sở liệu NoSQL: Các sở liệu NoSQL (Not Only SQL) MongoDB, Cassandra, Redis thiết kế để xử lý liệu phi cấu trúc có khả mở rộng tốt Chúng thích hợp cho việc lưu trữ truy vấn liệu có quy mơ lớn đa dạng Phân tích liệu thời gian thực (Real-time Data Analytics): Các hệ thống xử lý liệu thời gian thực Apache Kafka Apache Flink cho phép xử lý phân tích liệu tạo Điều hữu ích việc theo dõi kiện trực tiếp, phát cố đưa định nhanh chóng Học máy Khai thác liệu (Data Mining): Các thuật toán học máy khai thác liệu giúp tìm kiếm mẫu thơng tin tiềm ẩn liệu lớn Điều bao gồm việc dự đoán xu hướng, phân loại liệu, gom cụm liệu Trích xuất thông tin từ liệu văn (Text Mining): Trích xuất thơng tin từ liệu văn bản, cịn gọi phân tích ngữ nghĩa, kỹ thuật quan trọng để hiểu khai thác liệu văn Các kỹ thuật NLP (Natural Language Processing) xử lý ngôn ngữ tự nhiên sử dụng để phân tích, phân loại trích xuất thơng tin từ văn Trực quan hoá liệu (Data Visualization): Trực quan hóa liệu kỹ thuật biến liệu thành biểu đồ, đồ thị hình ảnh dễ hiểu Công cụ Tableau, Power BI D3.js giúp biểu diễn liệu cách trực quan để tạo hiểu biết từ liệu lớn =>Nhìn chung, kỹ thuật Big Data bao gồm loạt công cụ phương pháp giúp xử lý, lưu trữ phân tích liệu lớn cách hiệu quả, đáp ứng nhu cầu ngày tăng việc làm cho liệu trở nên hữu ích thơng tin IV Vai trò Big Data doanh nghiệp - Hiểu nhắm khách hàng mục tiêu: liệu Big Data thu thập từ nhiều nguồn khác nhau, gồm lịch sử trình duyệt, mạng xã hội, Đây kênh người dùng sử dụng thường xuyên Vì vậy, doanh nghiệp phân tích Big Data hiểu hành vi, sở thích, nhu cầu khách hàng đồng thời phân loại lựa chọn đối tượng khách hàng phù hợp với sản phẩm, dịch vụ doanh nghiệp - Định lượng tối ưu hóa hiệu suất cá nhân: nhờ thiết bị di động thông minh smartphone, smartwatch mà thông tin, liệu cá nhân thu thập dễ dàng Những liệu cá nhân từ người dùng giúp doanh nghiệp có nhìn rõ nét xu hướng hành vi khách hàng Từ đó, nhà quản lý định hướng cho chiến lược, kế hoạch tương lai gần - Phòng chống an ninh, giảm thiểu rủi ro: Big Data doanh nghiệp sử dụng để thăm dò, phát ngăn chặn nguy cơ, rủi ro gian lận, xâm nhập hệ thống, đánh cắp thơng tin mật Ví dụ ngân hàng cơng ty thẻ tín dụng dùng Big Data để ngăn chặn giao dịch gian lận - Tối ưu hóa giá cả: việc định giá sản phẩm, dịch vụ điều quan trọng khó khăn doanh nghiệp Bởi doanh nghiệp cần nghiên cứu kỹ mong muốn khách hàng mức giá đối thủ cạnh tranh Nhờ có Big Data mà công nghiên cứu, thu thập liệu trở nên dễ dàng, nhanh chóng, giúp doanh nghiệp định giá cách xác, hiệu - Nắm bắt giao dịch tài chính: thương mại điện tử phát triển mạnh mẽ toàn giới, có Việt Nam Do đó, giao dịch tài website hay app thương mại điện tử ngày tăng lên thể rõ hành vi mua khách hàng Các thuật toán Big Data doanh nghiệp sử dụng để gợi ý, đưa định giao dịch cho khách hàng, tăng tỷ lệ chốt đơn cho doanh nghiệp V Khó khăn làm việc với Big Data Thác thức đến từ Bg Data Thách thức lớn sử dụng Big Data khối lượng lớn tăng nhanh Khối lượng liệu cho tăng gấp lần sau năm khiến việc lưu trữ gặp khó khăn Các doanh nghiệp, tổ chức ln cố gắng để bắt kịp với tăng nhanh liệu tìm cách lưu trữ đủ Big Data cần thiết Một thách thức thời gian xử lý Big Data Các nhà khoa học liệu cho biết họ thường dành 50% - 80% thời gian để quản lý chuẩn bị liệu trước thực sử dụng Ngồi ra, lượng liệu lớn nên chất lượng liệu không đảm bảo, nhiều liệu lỗi gây khó khăn việc xử lý lọc liệu Chỉ trích cách sử dụng Big Data 10 xác định sản phẩm xem nhiều để tối ưu thời gian hiển thị, tự gửi mã ưu đãi cho sản phẩm khách hàng bỏ vào giỏ hàng khơng mua Đặc biệt, Big Data phân tích hành vi, sở thích, quan tâm khách hàng, giúp nhà quản lý hiểu khách hàng để cung cấp sản phẩm theo xu hướng, nhu cầu thị trường Ngành bán lẻ Ngành bán lẻ ứng dụng Big Data việc xây dựng mô hình chi tiêu khách hàng, trợ giúp dự đốn cung - cầu cho sản phẩm Kết hợp với liệu thời điểm giao dịch, liệu truyền thông xã hội, dự báo thời tiết để xác định xác sản phẩm phù hợp để ln sẵn sàng cung ứng cho khách hàng Nhà quản lý dựa vào liệu thói quen mua hàng, sở thích khách hàng để xác định vị trí, cách bố trí sản phẩm kệ hàng đưa chiến lược kinh doanh để cải thiện Digital Marketing Digital Marketing ngày trở thành công cụ quan trọng cho doanh nghiệp Khi ứng dụng Big Data, doanh nghiệp sử dụng Digital Marketing xác định đối tượng mục tiêu trang mạng xã hội dựa thông tin nhân học, giới tính, tuổi tác, sở thích Bên cạnh đó, cá nhân hóa hoạt động tìm kiếm Google, Email Marketing, hiển thị quảng cáo phù hợp tạo báo cáo chi tiết sau chiến dịch quảng cáo Ngành công nghiệp - Phát triển phần mềm sản phẩm: Các công ty sử dụng Big Data để xây dựng mơ hình dự đốn cho sản phẩm dịch vụ Họ phân loại thuộc tính sản phẩm/dịch vụ q khứ tại, sau mơ hình hóa mối quan hệ thuộc tính phát triển thành phần mềm hoàn chỉnh 14 - Tăng trải nghiệm khách hàng: Big Data cho phép bạn thu thập liệu từ phương tiện truyền thông xã hội, lịch sử web, nhật ký gọi nguồn khác Nhờ đó, doanh nghiệp hiểu rõ khách hàng qua hành vi thực tế khách hàng - Máy học (Machine Learning): Máy học bước tiến cơng nghệ đại Big Data góp phần lớn phát triển máy học Hiện máy móc tự học từ liệu lịch sử thay người phải lập trình, liệu lịch sử thu thập đầy đủ vào Big Data - Thúc đẩy cải tiến mới: Big data cung cấp liệu thông tin sản phẩm, lịch sử phát triển lĩnh vực, ngành nghề Qua đó, nhà quản lý xác định điểm cần cải tiến, phát triển để công nghệ đem lại sáng tạo, mẻ, hữu ích cho ngành công nghiệp Lĩnh vực giáo dục & đào tạo Ngành giáo dục sử dụng Big Data để ước tính số lượng học sinh, sinh viên tuyển sinh năm, quản lý hồ sơ học sinh, sinh viên, truy xuất nhanh thông tin cần thiết gặp vấn đề phát sinh Ngoài ra, Big Data giúp ước tính nhu cầu tuyển dụng cho ngành nghề hàng năm để đề phương án đào tạo nhằm đáp ứng nguồn nhân lực cho xã hội Cơ sở hạ tầng IT hỗ trợ Big Data Đặc điểm Big Data lượng liệu khổng lồ tăng cao qua nhiều năm, cần có hệ thống lưu trữ máy chủ thiết kế đặc biệt cho Big Data Ngoài cịn có phần mềm thu thập, quản lý tích hợp liệu Doanh nghiệp sử dụng Big Data lâu dài nên đầu tư sở hạ tầng IT vững vàng, chất lượng để đảm bảo nguồn liệu không bị không cập nhật kịp Phần lớn 15 sở hạ tầng tập trung chỗ, cơng ty muốn tiếp tục tận dụng khoản đầu tư vào trung tâm liệu Nhưng ngày có nhiều tổ chức dựa vào dịch vụ điện toán đám mây để xử lý nhiều yêu cầu big data họ VIII Các công nghệ dành cho Big Data Hệ sinh thái Hadoop: Hadoop Apache framework mã nguồn mở viết Java, cho phép xử lý phân tán tập liệu lớn cụm máy tính (clusters of computers) thơng qua mơ hình lập trình đơn giản Hadoop thiết kế để mở rộng quy mô từ máy chủ đơn sang hàng ngàn máy tính khác có tính tốn lưu trữ cục (local computation and storage) Apache Spark: Đây cơng cụ tính tốn nhanh có mục đích chung để xử lý quy mơ lớn liệu Nó xử lý liệu nhanh 100 lần so với MapReduce Apache Kafka: Apache Kafka hệ thống nhắn tin phân tán lượng thông tin cao thường sử dụng với Hadoop Nó bổ sung cho hệ sinh thái Big Data Data lakes: Data lakes kho lưu trữ chứa khối lượng liệu thô lớn định dạng gốc, thiết kế để giúp người dùng dễ dàng truy cập vào lượng lớn liệu có nhu cầu Các yếu tố giúp tăng trưởng data lakes phong trào kỹ thuật số phát triển IoT 16 NoSQL Databases: Các sở liệu SQL thông thường thiết kế cho transaction đáng tin cậy truy vấn ngẫu nhiên Cơ sở liệu NoSQL nêu hạn chế, lưu trữ quản lý liệu theo cách cho phép tốc độ hoạt động cao linh hoạt tuyệt vời Không giống sở liệu SQL, nhiều sở liệu NoSQL mở rộng theo chiều ngang hàng trăm hàng ngàn máy chủ In-memory databases: Cơ sở liệu nhớ (IMDB) hệ thống quản lý sở liệu chủ yếu dựa vào nhớ (Ram), thay HDD Cơ sở liệu nhớ nhanh sở liệu tối ưu hóa đĩa, điểm quan trọng để sử dụng phân tích big data tạo kho liệu siêu liệu Máy tính lượng tử: Máy tính lượng tử có mối liên hệ với big data số khía cạnh Dưới số điểm bạn quan tâm: Xử lý liệu lớn nhanh hơn: Big data bao gồm việc xử lý phân tích lượng lớn liệu Máy tính lượng tử có sức mạnh tính tốn lớn, vượt trội so với máy tính truyền thống, cho phép xử lý tác vụ liên quan đến big data cách nhanh chóng hiệu Giải vấn đề phân tích liệu phức tạp: Máy tính lượng tử có khả giải vấn đề tính tốn phức tạp khó khăn, bao gồm thuật tốn tối ưu hóa phân tích liệu phức tạp big data Điều giúp tìm thơng tin quan trọng giá trị từ kho liệu lớn Khai thác liệu cách linh hoạt: Máy tính lượng tử có khả xử lý liệu khơng cấu trúc phân tích mẫu không rõ ràng, giúp khai thác thông tin 17 từ liệu khơng có cấu trúc big data Điều giúp đưa hiểu biết phát triển mơ hình liệu tốt Bảo mật liệu: Big data thường chứa thơng tin nhạy cảm quan trọng Máy tính lượng tử cung cấp cách tiếp cận phân tích mã hóa liệu Cơng nghệ lượng tử giúp tăng cường bảo mật liệu big data cách sử dụng thuật tốn mã hóa xử lý thông tin lượng tử Tuy nhiên, cần lưu ý máy tính lượng tử giai đoạn phát triển chưa sử dụng rộng rãi thực tế Việc ứng dụng máy tính lượng tử cho big data đòi hỏi nhiều nghiên cứu phát triển thêm trước áp dụng phổ biến Chương 3: PHÂN TÍCH VÀ TRỰC QUAN HỐ DỮ LIỆU DOANH NGHIỆP ADVENTUREWORKS2014 VỚI NHÓM SẢN PHẨM BIKE BẰNG PHƯƠNG PHÁP RFM Cơ sở lý thuyết a RFM ? RFM (Recency – Frequency – Monetary): phần Marketing Analysis sử dụng để phân tích giá trị khách hàng (Customer Value), từ giúp doanh nghiệp phân tích nhóm khách hàng mà có, từ có chiến dịch marketing chăm sóc đặc biệt b Cấu trúc mơ hình RFM RFM tạo nên ba yếu tố (điểm cho số từ đến 5) thông thường doanh nghiệp sử dụng yếu tố Ví dụ RF, RM, FM  R (Recency) Khoảng thời gian mà khách hàng mua hàng gần Chúng ta đặt điểm cho nhóm khách có thời gian mua gần điểm 18 nhóm lâu r chưa mua hàng điểm.*Lưu ý: Tùy loại business mà xếp thang điểm cho phù hợp Ví dụ: - Lần mua hàng gần khoảng ngày trước: 5đ - Lần mua hàng gần khoảng tuần trước: 4đ - Lần mua hàng gần khoảng tuần trước: 3đ - Lần mua hàng gần khoảng tháng trước: 2đ - Lần mua hàng gần khoảng tháng trước: 1đ  F (Frequency) Tần suất mua hàng khách hàng Chỉ số thường doanh nghiệp có dịch vụ, sản phẩm có giá trị lợi nhuận thấp (M) quan tâm, họ tồn khách hàng sử dụng dịch vụ họ cách thường xuyên, VD: đặt xe Grab, mua chai nước uống Tương tự trên, ta chia tần suất mua hàng, sử dụng dịch vụ khách hàng nhóm, đặt điểm số cho nhóm Ví dụ: (Như trên, business có cách chia tính điểm khác nhau) * lần/ tuần: 5đ * lần/ tuần: 4đ * lần/ tuần: 3đ * lần/ tháng: 2đ * lần/ tháng: 1đ  M (monetary) 19 Giá trị lần mua hàng Chỉ số dùng để tính tốn giá trị vật chất mà doanh nghiệp có khách hàng sử dụng dịch vụ Các loại hình kinh doanh quan tâm nhiều đến số công ty dịch vụ mà khách hàng không sử dụng thường xuyên, lần sử dụng tiền mức VD: Dịch vụ du lịch, khách sạn, bất động sản, Giới thiệu liệu thực hành a Giới thiệu liệu Đây liệu doanh nghiệp ảo AventureWorks2014 chuyên bán sản phẩm thể thao, liệu thuộc loại Data Warehouse bao gồm bảng Fact Dim với mơ hình đa chiều Star Schema 20

Ngày đăng: 02/01/2024, 22:06

Tài liệu cùng người dùng

Tài liệu liên quan