STT Tên gói Diễn giải
1 PKG_DM_Dim_CashDesk - Bảng nguồn: tbl_M_CashDesk
- Bảng đích: STG_M_CashDesk - Bảng Lookup: không
- Diễn giải: chỉ cập nhật các bản ghi mới và các bản ghi đã bị sửa đổi
2 PKG_DM_Dim_Currency - Bảng nguồn: tbl_M_Curency
- Bảng đích: STG_M_Currency - Bảng Lookup: không
- Diễn giải: chỉ cập nhật các bản ghi mới và các bản ghi đã bị sửa đổi
3 PKG_DM_Dim_Store - Bảng nguồn: tbl_M_Store
- Bảng đích: STG_M_Store - Bảng Lookup: không
- Diễn giải: chỉ cập nhật các bản ghi mới và các bản ghi đã bị sửa đổi
- Bảng đích: STG_M_Customer - Bảng Lookup: không
- Diễn giải: chỉ cập nhật các bản ghi mới và các bản ghi đã bị sửa đổi
5 PKG_DM_Dim_Product - Bảng nguồn: tbl_M_Product
- Bảng đích: STG_M_Product - Bảng Lookup: không
- Diễn giải: chỉ cập nhật các bản ghi mới và các bản ghi đã bị sửa đổi 6 PKG_DM_Fact_POSRetail - Bảng nguồn: tbl_M_POSRetail_Detail - Bảng đích: STG_M_POSRetail_Detail - Bảng Lookup: không
- Diễn giải: chỉ nạp các bản ghi mới dựa trên việc so sánh số hiệu giao dịch (TransID) và số hiệu mục hàng (ItemID)
3.5.5. Thiết kế khối dữ liệu
3.5.5.1. Tạo kết nối đến nguồn dữ liệu
Bước đầu tiên của việc tạo khối dữ liệu là tạo kết nối đến dữ liệu nguồn, tức là
tạo kết nối đến kho dữ liệu chuyên biệt bán hàng SieuThi_DM. Chi tiết thiết lập kết nối
đến nguồn dữ liệu được thể hiện trong Hình 3.11 bên dưới.
3.5.5.2. Tạo liên kết các bảng dữ liệu nguồn
Sau khi tạo kết nối đến dữ liệu nguồn xong thì phải thực hiện tạo các khung nhìn cho nguồn dữ liệu. Thực chất ở bước này là chọn các bảng dữ liệu nào cần lấy dữ liệu
cho khối, cũng như thiết lập quan hệ giữa các bảng đã chọn. Hình 3.12 bên dưới là các
bảng dữ liệu được tạo cho khối dữ liệu.
Hình 3.12. Màn hình dữ liệu nguồn cho khối
3.5.5.3. Tạo khối đa chiều
Tiếp đến là bước tạo khối, tức tạo các chiều và các độ đo cho các khối dữ liệu. Hình bên dưới là cấu trúc của khối dữ liệu đã được tạo:
Các thông tin cho khối dữ liệu như sau:
1. Tên khối: Cube_POSRetail
2. Các độ đo của khối: các độ đo nằm ở phần trên của hình vẽ, trong khối này
gồm sáu độ đo cơ bản cho việc phân tích:
Quantity: số lượng hàng bán
Amount: thành tiền
POS Count: số lượng mục hàng bán
Count Distinct By Product: số lượng hàng được bán
Count Distinct By Transaction: số lượng mã giao dịch bán hàng hay có thể hiểu là số lượt bán hàng
3. Các chiều: các chiều nằm ở phần dưới của hình vẽ, ở đây có sáu chiều được
tạo cho khối:
Dim Date: chiều ngày, có phân cấp năm → quí → tháng → ngày Dim Product: chiều hàng hóa, có phân cấp loại hàng → nhóm hàng → hàng
Dim Customer: chiều khách hàng, có phân cấp loại khách hàng →
khách hàng
Dim Payment Method: chiều phương thức thanh toán
Dim Curency: chiều loại tiền tệ thanh toán
Dim Cash Desk: chiều quầy thu ngân.
3.5.5.4. Triển khai khối dữ liệu
Sau khi tạo khối xong thì phải thực hiện triển khai khối vào CSDL của dịch vụ
phân tích SSAS. Hình 3.14 sau đây là giao diện sử dụng để cấu hình khối trước khi
triển khai.
Các tham số cấu hình cho khối như sau:
Tên CSDL phân tích: AS_SieuThi
Kiểu OLAP: MOLAP
Máy chủ dịch vụ báo cáo: ThanhACW\SQL2008
3.5.5.5. Cập nhật dữ liệu cho khối dữ liệu
Bước cuối cùng, trước khi có thể khai thác dữ liệu trong khối, là cập nhật dữ liệu mới nhất cho khối trong CSDL phân tích. Việc cập nhật dữ liệu được thể hiện như
Hình 3.15 bên dưới.
Hình 3.15. Màn hình cập nhật cho khối dữ liệu
3.5.6. Khai thác khối dữ liệu
Việc khai thác số liệu từ khối có thể thực hiện qua công cụ PivotTable của Excel
hoặc qua các công cụ Report Designer và Report Builder. Nhưng trong phạm vi của
người dùng đó là chức năng PivotTable của Excel cho việc phân tích số liệu. Các bước thực hiện phân tích trong Excel như sau:
Thiết lập kết nối đến khối dữ liệu từ Excel
Tạo lập mẫu phân tích số liệu bởi công cụ PivotTable
Thực hiện phân tích số liệu
3.5.6.1. Kết nối đến khối dữ liệu đa
Excel 2007 cho phép tạo kết nối trực tiếp đến khối dữ liệu và thực hiện việc phân
tích số liệu trực tiếp từ khối, Hình 3.16 bên dưới là ví dụ về màn hình kết nối đến khối
dữ liệu từ Excel.
Hình 3.16. Màn hình kết nối đến khối dữ liệu từ Excel
Để tạo một kết nối đến khối thì thực hiện các bước sau:
Chọn thực đơn Data
Chọn biểu tượng Connetions
Chọn nút Add
Chọn nút Browse for More
Chọn hàng Connect to New Data Source.odc
Chọn nút Next, khi đó màn để nhập các thông tin kết nối.
Nhập các thông tin kết nối: gồm các tham số như tên máy chủ kết phân tích SQL Server, tên và mật khẩu đăng nhập.
Sau khi nhập xong các thông tin đăng máy chủ SQL Server thì màn hình
chọn khối sẽ hiện ra danh sách để có thể chọn như Hình 3.16 ở trên.
Chọn nút Next thì quá trình kết nối hoàn thành. Từ đây có thể bắt đầu sử
dụng PivotTable để phân tích số liệu.
3.5.6.2. Tạo lập mẫu báo cáo bởi công cụ PivotTable
Khi kết nối đến khối thành công thì sẽ hiện ra màn hình như Hình 3.17 bên dưới.
Hình 3.17. Màn hình hiện danh sách các trường của PivotTable
Nhìn vào Hình 3.17 bên trên thì có hai phần chính:
1. Phần bên trên: đây là phần chứa danh sách các chiều và độ đo mà đã được
tạo trong khối.
2. Phần bên dưới bao gồm bốn hộp dùng để tạo mẫu báo cáo như sau:
Column Labels: chứa các trường của các chiều sẽ hiện ở phần cột.
Value: chứa các trường độ đo, là các giá trị tính toán.
Report Filter: chứa các trường của các chiều dùng cho việc lọc dữ liệu. Để tạo báo cáo thì chỉ việc “kéo và thả” các trường vào bốn ô này, mẫu báo cáo sẽ tự động được sinh ra theo định dạng mặc định. Chú ý, không nhất thiết lúc nào cũng cần có các trường cho cả bốn ô, yêu cầu ít nhất phải có một ô chứa một hoặc nhiều trường.
Sau mỗi lần kéo và thả các trường vào các ô thì mẫu phân tích sẽ hiện ra ngay lập
tức. Nếu kéo và thả các trường như Hình 3.17 ở trên thì sẽ thu được mẫu phân tích như
Hình 3.18 bên dưới.
Hình 3.18. Mẫu phân tích trong Excel sử dụng PivotTable
3.5.6.3. Phân tích số liệu trong mẫu phân tích
Sau khi tạo mẫu phân tích xong người dùng có thể thực hiện phân tích số liệu trên mẫu. Các thao tác phân tích thông thường hay dùng như sau:
Xem mức chi tiết hơn, trong PivotTable thì kích nút (+).
Xem mức tổng hợp hơn, trong PivotTable thì kích nút (-).
Xem/ẩn một hoặc nhiều mục dữ liệu. Sắp xếp tự động/tùy chọn.
Chọn N phần tử cao nhất hay thấp nhất theo một tiêu chí nào đấy
3.5.7. Tạo các mẫu báo cáo phân tích
Sẽ sử dụng công cụ PivotTable của Excel để tạo ra các một số mẫu phân tích cơ
bản như sau:
Số lượng hàng bán theo loại hàng và thời gian Doanh số bán hàng theo thời gian
So sánh doanh số bán hàng theo tháng Lượng giao dịch theo ngày
Lượng mục hàng bán theo quầy
Thống kê các loại tiền tệ được thanh toán
3.5.8. Tạo lịch thực hiện công việc tự động
Sau khi triển khai và đưa kho dữ liệu vào hoạt động thực tế thì cần phải có lịch thực hiện tự động các các công việc. Các công việc cho việc tích hợp và cập nhật mới khối thường sẽ chạy vào các thời điểm mà ít giao dịch như trưa và tối.
Để đơn giản thì ban đầu chỉ cần tạo một công việc duy nhất bao gồm các bước thực hiện sau:
Bước 1: chạy gói điều khiển PKG_STG_Controller để nạp dữ liệu vào
SieuThi_ST.
Bước 2: chạy gói điều khiển PKG_DW_Controller để nạp dữ liệu vào
SieuThi_DW.
Bước 3: chạy gói điều khiển PKG_DM_Controller để nạp dữ liệu vào
SieuThi_DM.
Bước 4: thực hiện việc cập nhật khối Cube_POSRetail để có dữ liệu mới nhất cho phân tích.
Lịch thực hiện của SieuThi_Job này đang được thiết lập là 1:00 sáng sớm và 1:00
chiều hằng ngày. Hằng ngày, vào các buổi sáng sớm hay chiều có thể xem lại lịch sử
các lần thực hiện SieuThi_Job, và kiểm tra xem có bất kỳ lỗi xảy ra hay không. Đồng
thời, để có thể phát hiện lỗi sớm hơn nên cấu hình để thực hiện gửi thư điện tử tự động đến người có trách nhiệm mỗi khi có lỗi xảy ra trong quá trình thực thi công việc
SieuThi_Job theo lịch biểu.
Hình 3.19 bên dưới hiển thị các bước của công việc SieuThi_Job được tạo bởi dịch vụ tác nhân SQL Server.
Hình 3.19. Màn hình SieuThi_Job của tác nhân SQL Server
3.6. Tổng kết chương
Chương này chủ yếu trình bày các nội dung công việc đã được thực hiện khi xây
dựng kho dữ liệu thử nghiệm cho siêu thị T-Mart. Nội dung chương đã đề cập đến cấu
trúc CSDL của kho dữ liệu SieuThi_DW và kho dữ liệu chuyên biệt SieuThi_DM, các
gói tích hợp dữ liệu, các khối dữ liệu,các mẫu báo cáo phân tích dựa trên khối dữ liệu, và cuối cùng là lịch thực hiện tự động các gói tích hợp và làm mới khối.
Chương 4. KẾT QUẢ CÀI ĐẶT THỬ NGHIỆM 4.1. Môi trường cài đặt
Tất cả các CSDL, các gói tích hợp và báo cáo đều được cài đặt trong trong máy xách tay với cấu hình như sau:
CPU: Core Duo 2.1 GHz RAM: 3GB, HDD: 320 GB
Sử dụng hệ quản trị CSDL SQL Server 2008, phiên bản cụ thể như sau:
Microsoft SQL Server 2008 (RTM) - 10.0.1600.22 (Intel X86) Jul 9 2008 14:43:34 Copyright (c) 1988-2008 Microsoft Corporation Enterprise Edition on Windows NT 5.1 <X86> (Build 2600: Service Pack 3).
Công cụ phân tích: sử dụng chức năng PivotTable của Excel 2007.
4.2. Dữ liệu thử nghiệm
Thực hiện thử nghiệm dữ liệu thật của siêu thị trong vòng hơn 2 năm từ 08/2008
đến 10/2010. Số bản ghi của các bảng trong CSDL nguồn như Bảng 4.1 dưới đây.