Một số khó khăn thường gặp khi khai thác dữ liệu trong hệ thống thông tin như: Khó tìm thấy dữ liệu cần thiết Khó lấy ra được dữ liệu cần thiết Khó hiểu dữ liệu tìm thấy Khó sử dụng được dữ liệu tìm thấy Và vấn đề đặt ra là làm thế nào để tổ chức, khai thác được những khối lượng dữ liệu khổng lồ, lưu trữ nhiều nơi, ở nhiều dạng dữ liệu khác nhau đó một cách hiệu quả trong các hệ thống thông tin lớn. Bài báo cáo này sẽ trình bày những đặc điểm ứng dụng của kho dữ liệu trong Thương mại điện tử.
Trang 1DATA WAREHOUSE VÀ ỨNG DỤNG TRONG
THƯƠNG MẠI ĐIỆN TỬ
Trang 2THÀNH VIÊN
LÂM NGỌC LAN PHẠM THỊ MAI PHƯƠNG
THÁI HÀ PHƯƠNG PHAN THỊ HUYỀN TRANG
4
1 2 3
Giáo viên hướng dẫn: NGUYỄN VĂN CHỨC
Trang 4Đặt vấn đề
Là tuyển tập các cơ sở dữ liệu tích hợp, hướng chủ đề, được thiết kế để hỗ trợ cho chức năng trợ giúp quyết định.
Thường rất lớn tới hàng trăm GB hay thậm chí hàng Terabyte
Trang 5Đặc điểm
Ổn định
Tổng hợp
Không biến động
Tích hợp
Trang 6Giúp tổ chức, xác định, quản lý
và điều hành các dự án, các nghiệp
vụ hiệu quả
và chính xác.
Tích hợp
dữ liệu và các siêu dữ liệu từ nhiều nguồn khác nhau
Trang 7Cấu trúc dữ liệu của DW
Một thống kê doanh số bán hàng dựa trên ba yếu
tố là: địa điểm, thời gian và chủng loại hàng Data cube là vấn đề "Thống kê bán hàng" với ba chiều
là ba yếu tố: địa điểm, thời gian và chủng loại
hàng Bảng fact là bảng tổng hợp dữ liệu của mối liên quan của doanh số với 3 yếu tố trên
Trang 81Qtr 2Qtr 3Qtr 4Qtr
U.S.A Canada Mexico
sum
Trang 9Ngôn ngữ
Thu
nhỏ
Mở rộng Cắt
lát
Tách khối
Ngôn ngữ xử lý phân tích trực tuyến (OLAP
- On-Line Analytical Prosessing), rất phù
hợp với kho dữ liệu, ngôn ngữ này tương tự với ngôn ngữ truy vấn SQL và tập trung vào các câu lệnh sau
Trang 10Tầng giữa
Tầng
trên cùng
Tầng
trên cùng
Cấu trúc của một hệ thống kho dữ liệu
Trang 11Mối quan hệ giữa kho dữ
liệu và khai phá dữ liệu
liệu
OLAP về cung cấp các tập lệnh rất hữu hiệu trong phân tích
Trang 12Kho dữ liệu cục bộ
Kho dữ liệu cục bộ (Data Mart) có những đặc điểm giống với kho dữ liệu nhưng với quy mô nhỏ hơn và lưu trữ dữ liệu về một lĩnh vực, một chuyên ngành
Trang 13Data mart độc lập được xây dựng trước DW và dữ liệu được trực tiếp lấy từ các nguồn khác nhau
Trang 14Cơ sở dữ liệu phân tán
Distributed Database
Kho dữ liệu phân tán không thuần nhất
ở nhiều nơi (site) của một mạng máy tính
Cơ sở dữ liệu phân tán
Trang 15Xây dựng công cụ hỗ trợ quản lý kho dữ liệu
Tích hợp
Phân tán
và hợp nhất
Tạo mới
Chuyển đổi
Đồng bộ
DỮ LIỆU
Lọc
Trang 16•Nguồn DL bên ngoài
•Tải ban đầu đồ sộ
•Cân nhắc nhân bản DL
•Tích hợp DL khó khăn
•Biến đổi DL phức hợp
•Làm sạch DL
•Lưu giữ DL dung lượng lớn
•Độ tăng trưởng nhanh
•Nhu cầu xử lý song song
•Một vài kiểu người dùng
•Truy vấn được kéo dài tới hạn
•Kiểu truy vấn phức
•Kích hoạt dựa trên Web
•Phân tích đa chiều
•Giao diện với ứng dụng DSS
•Chất liệu cho DM
•Công cụ đa nhà cung cấp
Trang 17THƯƠNG MẠI ĐIỆN TỬ
Trao đổi dữ liệu tạo điều kiện thuận lợi cho các nguồn tài chính
Thương mại điện tử, hay còn gọi là commerce,
e-comm hay EC, là sự mua bán sản phẩm hay dịch vụ trên các hệ thống điện tử như Internet và các mạng máy tính
Trang 18Đối tượng
Chính phủ (G - Goverment)
Chính phủ (G - Goverment)
Khách hàng (C – Customer/ Consumer)
Trang 19Hình thức
Doanh nghiệp với Chính phủ (B2G)
Doanh nghiệp với Doanh nghiệp (B2B) Doanh nghiệp với Khách hàng (B2C)
Khách hàng với Khách hàng (C2C) Thương mại đi động (mobile
commerce hay viết tắt là m-commerce)
Trang 20Khuynh hướng toàn cầu
Trang 21Thương mại điện tử đã trở thành một công cụ quan trọng cho thương mại quốc tế không chỉ bán sản phẩm mà còn quan hệ với khách hàng
Trang 22Các tác động đến thị
trường và người bán lẻ
• Thu thập nhanh chóng và dễ dàng thông tin đa dạng về sản phẩm, giá cả và người bán
• Trực tiếp đưa ra các đánh giá của mình về nhiều
khía cạnh liên quan tới giao dịch mua sắm
Các doanh nghiệp lớn hơn có cơ hội để giảm chi phí so với những doanh nghiệp nhỏ hơn do các doanh nghiệp lớn có lợi thế về quy mô kinh tế và đưa ra mức giá thấp hơn
Trang 23Phần mềm
Phân tích kinh doanh
Trang 25Tập hợp DL về khách hàng
Cập nhật DL về khách hàng
Trang 26Xác định các dữ liệu cần lưu trữ trong các Data Mart, xác định các nguồn
dữ liệu hiện có và kế thừa, xây dựng cấu trúc Data Mart độc lập.
Tích hợp các Data Mart độc lập từ các bộ phận, phòng ban: Nắm được các Data Mart chứa dữ liệu gì?Kiểu dữ liệu, yêu cầu trao đổi dữ liệu giữa các Data Mart.
Trang 27Xây dựng kho dữ liệu chung
Xây dựng các công cụ
Tổ chức khai thác
Xây dựng kho dữ liệu chung để lưu trữ dữ liệu được tích hợp từ các Data Mart độc lập: Chuyển đổi tất cả các dữ liệu từ các Data Mart độc lập từ các bộ phận, phòng ban và xây dựng cấu trúc dữ liệu để lưu trữ
Xây dựng các công cụ cho phép quản lý kho dữ liệu chung như: Tổng hợp dữ liệu, làm sạch dữ liệu, đồng bộ dữ liệu, phân tán dữ liệu.
Tổ chức khai thác kho dữ liệu phục vụ quản lý : Triển khai các
chương trình ứng dụng khai thác dữ liệu trong kho dữ liệu phục vụ công tác quản lý bán hàng trực tuyến.
Trang 29• Tiki là công ty xây dựng quản lý trực tiếp tiki.vn.
• Ta có tình hình sử dụng dữ liệu của các bộ phận trong tiki có thể tổng hợp như sau:
Trang 31KẾT LUẬN
DATA WAREHOUSE
THƯƠNG MẠI ĐIỆN
TỬ
CẦN THIẾT HIỆU QUẢ
Trang 32Thank You!