Danh sách các gói tích hợp cho SieuThi_DM

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Nghiên cứu giải pháp kho dữ liệu trong SQL server 2008 và áp dụng trong thương mại (Trang 60 - 70)

STT Tên gói Diễn giải

1 PKG_DM_Dim_CashDesk - Bảng nguồn: tbl_M_CashDesk

- Bảng đích: STG_M_CashDesk - Bảng Lookup: không

- Diễn giải: chỉ cập nhật các bản ghi mới và các bản ghi đã bị sửa đổi

2 PKG_DM_Dim_Currency - Bảng nguồn: tbl_M_Curency

- Bảng đích: STG_M_Currency - Bảng Lookup: không

- Diễn giải: chỉ cập nhật các bản ghi mới và các bản ghi đã bị sửa đổi

3 PKG_DM_Dim_Store - Bảng nguồn: tbl_M_Store

- Bảng đích: STG_M_Store - Bảng Lookup: không

- Diễn giải: chỉ cập nhật các bản ghi mới và các bản ghi đã bị sửa đổi

- Bảng đích: STG_M_Customer - Bảng Lookup: không

- Diễn giải: chỉ cập nhật các bản ghi mới và các bản ghi đã bị sửa đổi

5 PKG_DM_Dim_Product - Bảng nguồn: tbl_M_Product

- Bảng đích: STG_M_Product - Bảng Lookup: không

- Diễn giải: chỉ cập nhật các bản ghi mới và các bản ghi đã bị sửa đổi 6 PKG_DM_Fact_POSRetail - Bảng nguồn: tbl_M_POSRetail_Detail - Bảng đích: STG_M_POSRetail_Detail - Bảng Lookup: không

- Diễn giải: chỉ nạp các bản ghi mới dựa trên việc so sánh số hiệu giao dịch (TransID) và số hiệu mục hàng (ItemID)

3.5.5. Thiết kế khối dữ liệu

3.5.5.1. Tạo kết nối đến nguồn dữ liệu

Bước đầu tiên của việc tạo khối dữ liệu là tạo kết nối đến dữ liệu nguồn, tức là

tạo kết nối đến kho dữ liệu chuyên biệt bán hàng SieuThi_DM. Chi tiết thiết lập kết nối

đến nguồn dữ liệu được thể hiện trong Hình 3.11 bên dưới.

3.5.5.2. Tạo liên kết các bảng dữ liệu nguồn

Sau khi tạo kết nối đến dữ liệu nguồn xong thì phải thực hiện tạo các khung nhìn cho nguồn dữ liệu. Thực chất ở bước này là chọn các bảng dữ liệu nào cần lấy dữ liệu

cho khối, cũng như thiết lập quan hệ giữa các bảng đã chọn. Hình 3.12 bên dưới là các

bảng dữ liệu được tạo cho khối dữ liệu.

Hình 3.12. Màn hình dữ liệu nguồn cho khối

3.5.5.3. Tạo khối đa chiều

Tiếp đến là bước tạo khối, tức tạo các chiều và các độ đo cho các khối dữ liệu. Hình bên dưới là cấu trúc của khối dữ liệu đã được tạo:

Các thông tin cho khối dữ liệu như sau:

1. Tên khối: Cube_POSRetail

2. Các độ đo của khối: các độ đo nằm ở phần trên của hình vẽ, trong khối này

gồm sáu độ đo cơ bản cho việc phân tích:

Quantity: số lượng hàng bán

Amount: thành tiền

POS Count: số lượng mục hàng bán

Count Distinct By Product: số lượng hàng được bán

Count Distinct By Transaction: số lượng mã giao dịch bán hàng hay có thể hiểu là số lượt bán hàng

3. Các chiều: các chiều nằm ở phần dưới của hình vẽ, ở đây có sáu chiều được

tạo cho khối:

Dim Date: chiều ngày, có phân cấp năm → quí → tháng → ngày Dim Product: chiều hàng hóa, có phân cấp loại hàng → nhóm hàng → hàng

Dim Customer: chiều khách hàng, có phân cấp loại khách hàng →

khách hàng

Dim Payment Method: chiều phương thức thanh toán

Dim Curency: chiều loại tiền tệ thanh toán

Dim Cash Desk: chiều quầy thu ngân.

3.5.5.4. Triển khai khối dữ liệu

Sau khi tạo khối xong thì phải thực hiện triển khai khối vào CSDL của dịch vụ

phân tích SSAS. Hình 3.14 sau đây là giao diện sử dụng để cấu hình khối trước khi

triển khai.

Các tham số cấu hình cho khối như sau:

Tên CSDL phân tích: AS_SieuThi

Kiểu OLAP: MOLAP

Máy chủ dịch vụ báo cáo: ThanhACW\SQL2008

3.5.5.5. Cập nhật dữ liệu cho khối dữ liệu

Bước cuối cùng, trước khi có thể khai thác dữ liệu trong khối, là cập nhật dữ liệu mới nhất cho khối trong CSDL phân tích. Việc cập nhật dữ liệu được thể hiện như

Hình 3.15 bên dưới.

Hình 3.15. Màn hình cập nhật cho khối dữ liệu

3.5.6. Khai thác khối dữ liệu

Việc khai thác số liệu từ khối có thể thực hiện qua công cụ PivotTable của Excel

hoặc qua các công cụ Report DesignerReport Builder. Nhưng trong phạm vi của

người dùng đó là chức năng PivotTable của Excel cho việc phân tích số liệu. Các bước thực hiện phân tích trong Excel như sau:

Thiết lập kết nối đến khối dữ liệu từ Excel

Tạo lập mẫu phân tích số liệu bởi công cụ PivotTable

Thực hiện phân tích số liệu

3.5.6.1. Kết nối đến khối dữ liệu đa

Excel 2007 cho phép tạo kết nối trực tiếp đến khối dữ liệu và thực hiện việc phân

tích số liệu trực tiếp từ khối, Hình 3.16 bên dưới là ví dụ về màn hình kết nối đến khối

dữ liệu từ Excel.

Hình 3.16. Màn hình kết nối đến khối dữ liệu từ Excel

Để tạo một kết nối đến khối thì thực hiện các bước sau:

Chọn thực đơn Data

Chọn biểu tượng Connetions

Chọn nút Add

Chọn nút Browse for More

Chọn hàng Connect to New Data Source.odc

Chọn nút Next, khi đó màn để nhập các thông tin kết nối.

Nhập các thông tin kết nối: gồm các tham số như tên máy chủ kết phân tích SQL Server, tên và mật khẩu đăng nhập.

Sau khi nhập xong các thông tin đăng máy chủ SQL Server thì màn hình

chọn khối sẽ hiện ra danh sách để có thể chọn như Hình 3.16 ở trên.

Chọn nút Next thì quá trình kết nối hoàn thành. Từ đây có thể bắt đầu sử

dụng PivotTable để phân tích số liệu.

3.5.6.2. Tạo lập mẫu báo cáo bởi công cụ PivotTable

Khi kết nối đến khối thành công thì sẽ hiện ra màn hình như Hình 3.17 bên dưới.

Hình 3.17. Màn hình hiện danh sách các trường của PivotTable

Nhìn vào Hình 3.17 bên trên thì có hai phần chính:

1. Phần bên trên: đây là phần chứa danh sách các chiều và độ đo mà đã được

tạo trong khối.

2. Phần bên dưới bao gồm bốn hộp dùng để tạo mẫu báo cáo như sau:

Column Labels: chứa các trường của các chiều sẽ hiện ở phần cột.

Value: chứa các trường độ đo, là các giá trị tính toán.

Report Filter: chứa các trường của các chiều dùng cho việc lọc dữ liệu. Để tạo báo cáo thì chỉ việc “kéo và thả” các trường vào bốn ô này, mẫu báo cáo sẽ tự động được sinh ra theo định dạng mặc định. Chú ý, không nhất thiết lúc nào cũng cần có các trường cho cả bốn ô, yêu cầu ít nhất phải có một ô chứa một hoặc nhiều trường.

Sau mỗi lần kéo và thả các trường vào các ô thì mẫu phân tích sẽ hiện ra ngay lập

tức. Nếu kéo và thả các trường như Hình 3.17 ở trên thì sẽ thu được mẫu phân tích như

Hình 3.18 bên dưới.

Hình 3.18. Mẫu phân tích trong Excel sử dụng PivotTable

3.5.6.3. Phân tích số liệu trong mẫu phân tích

Sau khi tạo mẫu phân tích xong người dùng có thể thực hiện phân tích số liệu trên mẫu. Các thao tác phân tích thông thường hay dùng như sau:

Xem mức chi tiết hơn, trong PivotTable thì kích nút (+).

Xem mức tổng hợp hơn, trong PivotTable thì kích nút (-).

Xem/ẩn một hoặc nhiều mục dữ liệu. Sắp xếp tự động/tùy chọn.

Chọn N phần tử cao nhất hay thấp nhất theo một tiêu chí nào đấy

3.5.7. Tạo các mẫu báo cáo phân tích

Sẽ sử dụng công cụ PivotTable của Excel để tạo ra các một số mẫu phân tích cơ

bản như sau:

Số lượng hàng bán theo loại hàng và thời gian Doanh số bán hàng theo thời gian

So sánh doanh số bán hàng theo tháng Lượng giao dịch theo ngày

Lượng mục hàng bán theo quầy

Thống kê các loại tiền tệ được thanh toán

3.5.8. Tạo lịch thực hiện công việc tự động

Sau khi triển khai và đưa kho dữ liệu vào hoạt động thực tế thì cần phải có lịch thực hiện tự động các các công việc. Các công việc cho việc tích hợp và cập nhật mới khối thường sẽ chạy vào các thời điểm mà ít giao dịch như trưa và tối.

Để đơn giản thì ban đầu chỉ cần tạo một công việc duy nhất bao gồm các bước thực hiện sau:

Bước 1: chạy gói điều khiển PKG_STG_Controller để nạp dữ liệu vào

SieuThi_ST.

Bước 2: chạy gói điều khiển PKG_DW_Controller để nạp dữ liệu vào

SieuThi_DW.

Bước 3: chạy gói điều khiển PKG_DM_Controller để nạp dữ liệu vào

SieuThi_DM.

Bước 4: thực hiện việc cập nhật khối Cube_POSRetail để có dữ liệu mới nhất cho phân tích.

Lịch thực hiện của SieuThi_Job này đang được thiết lập là 1:00 sáng sớm và 1:00

chiều hằng ngày. Hằng ngày, vào các buổi sáng sớm hay chiều có thể xem lại lịch sử

các lần thực hiện SieuThi_Job, và kiểm tra xem có bất kỳ lỗi xảy ra hay không. Đồng

thời, để có thể phát hiện lỗi sớm hơn nên cấu hình để thực hiện gửi thư điện tử tự động đến người có trách nhiệm mỗi khi có lỗi xảy ra trong quá trình thực thi công việc

SieuThi_Job theo lịch biểu.

Hình 3.19 bên dưới hiển thị các bước của công việc SieuThi_Job được tạo bởi dịch vụ tác nhân SQL Server.

Hình 3.19. Màn hình SieuThi_Job của tác nhân SQL Server

3.6. Tổng kết chương

Chương này chủ yếu trình bày các nội dung công việc đã được thực hiện khi xây

dựng kho dữ liệu thử nghiệm cho siêu thị T-Mart. Nội dung chương đã đề cập đến cấu

trúc CSDL của kho dữ liệu SieuThi_DW và kho dữ liệu chuyên biệt SieuThi_DM, các

gói tích hợp dữ liệu, các khối dữ liệu,các mẫu báo cáo phân tích dựa trên khối dữ liệu, và cuối cùng là lịch thực hiện tự động các gói tích hợp và làm mới khối.

Chương 4. KẾT QUẢ CÀI ĐẶT THỬ NGHIỆM 4.1. Môi trường cài đặt

Tất cả các CSDL, các gói tích hợp và báo cáo đều được cài đặt trong trong máy xách tay với cấu hình như sau:

CPU: Core Duo 2.1 GHz RAM: 3GB, HDD: 320 GB

Sử dụng hệ quản trị CSDL SQL Server 2008, phiên bản cụ thể như sau:

Microsoft SQL Server 2008 (RTM) - 10.0.1600.22 (Intel X86) Jul 9 2008 14:43:34 Copyright (c) 1988-2008 Microsoft Corporation Enterprise Edition on Windows NT 5.1 <X86> (Build 2600: Service Pack 3).

Công cụ phân tích: sử dụng chức năng PivotTable của Excel 2007.

4.2. Dữ liệu thử nghiệm

Thực hiện thử nghiệm dữ liệu thật của siêu thị trong vòng hơn 2 năm từ 08/2008

đến 10/2010. Số bản ghi của các bảng trong CSDL nguồn như Bảng 4.1 dưới đây.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Nghiên cứu giải pháp kho dữ liệu trong SQL server 2008 và áp dụng trong thương mại (Trang 60 - 70)

Tải bản đầy đủ (PDF)

(78 trang)