XÁC ĐỊNH CÁC BẢNG SỰ KIỆN (FACT TABLE FT) VÀ

Một phần của tài liệu Xử lý phân tích trực tuyến OLAP và ứng dụng trong khai thác kho dữ liệu (Trang 66)

(Dimension table) của kho dữ liệu

Để xây dựng thành công một kho dữ liệu chủ đề thì việc xác định các chiều và các FT cho chính xác và hợp lý là một khâu rất quan trọng. Việc này phụ thuộc vào thông tin được lưu trữ và nhu cầu khai thác thông tin của người sử dụng.

Các chiều của kho dữ liệu được dùng để xác định, phân biệt các bản ghi nên các chiều của kho sẽ là các chiều về sản phẩm, khách hàng, thời gian, ...

Việc xác định các FT đòi hỏi thoả mãn yêu cầu: các FT không được có kích thước quá to hay quá nhỏ để đảm bảo tốc độ truy vấn. Có một số cách để phân chia các FT, tuy nhiên theo sự phân tích kho dữ liệu thương mại điện tử thì phương án chia theo các dịch vụ (dịch vụ mua bán hàng hoá hữu hình và phi vật thể, dịch vụ đặt phòng khách sạn, dịch vụ đặt vé máy bay và dịch vụ đặt tour du lịch) là phương án tối ưu nhất và sẽ được chọn là phương án thực hiện của quá trình xây dựng kho dữ liệu. Mặc dù có thể tách dịch vụ mua bán hàng hoá hữu hình và phi vật thể thành hai FT riêng biệt; tuy nhiên hai dịch vụ này có các dữ liệu phần lớn tương tự nhau, cách quản lý cũng gần giống nhau nên ta sẽ gộp chung hai loại hình dịch vụ này vào trong cùng một bảng FT.

Như vậy, kho dữ liệu TMĐT sẽ là tập hợp của các kho dữ liệu chủ đề (DM) sau:

- DM về dịch vụ mua bán hàng hoá hữu hình và phi vật thể - DM về dịch vụ đặt phòng khách sạn

- DM về dịch vụ đặt vé máy bay - DM về dịch vụ đặt tour du lịch

Một phần của tài liệu Xử lý phân tích trực tuyến OLAP và ứng dụng trong khai thác kho dữ liệu (Trang 66)