Báo cáo số lượng tiêu thụ theo thể loại sản phẩm trên từng quốc gia

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng business intelligence SQL server 2008 trong thương mại điện tử (Trang 48 - 50)

Nhìn vào hình 3.17 ta cĩ thể thấy Mỹ là nước cĩ số lượng sản phẩm tiêu thụ cao nhất, Úc thấp nhất. Thể loại Action, Sport là hai sản phẩm bán chạy nhất. Thể loại được ưa chuộng ở các quốc gia khá là giống nhau, những loại như Action, Family, Sport, Music đều thuộc vào nhĩm được ưu chuộng ở tất cả quốc gia. Thể loại Drama, New, Horror thuộc nhĩm tiêu thụ thấp. Cĩ thể thấy sở thích của người dân về thể loại DVD ở các quốc gia cĩ sự tương đồng. Người Mỹ thích xem DVD nhất, họ dành nhiều thời gian cho hoạt động giải trí, một trong những hoạt động đĩ là xem DVD. Ngược lại người Úc dường như khơng thích xem DVD bằng các quốc gia cịn lại

Như vậy việc biểu diễn dữ liệu dưới các chiều quan sát khác nhau, các báo cáo đã cung cấp cho giám đốc cửa hàng, phân tích kinh doanh ngồi nắm bắt được tình hình kinh doanh như các báo cáo thống kê cịn cĩ thêm thơng tin, mối liên quan tới sở thích mua DVD của khách hàng hỗ trợ cho việc ra quyết định của họ. Phần tiếp theo chúng ta sẽ xây dựng mơ hình khai phá dữ liệu để hỗ trợ ra quyết định tốt hơn cho nhà quản lý cũng như đưa ra một số dự báo doanh số trong tương lại.

3.5. Xây dựng các mơ hình khai phá dữ liệu

3.5.1. Mơ hình khai phá dữ liệu dự đốn xu hướng

Được sử dụng để dự đốn (giá trị, xu hướng) tương lai dựa vào dữ liệu lịch sử, Microsoft Time Series là phương pháp điển hình dùng để dự đốn giá trị của biến liên tục theo thời gian. Để tạo một mơ hình sử dụng thuật tốn Microsoft Time Series, các bước thực hiện như sau:

 Tạo một Mining model structure.  Hiệu chỉnh Mining model.

 Sử dụng Mining model.

Trong Time Series Charts, cả dữ liệu lịch sử và dữ liệu dự đốn tương lai đều được thể hiện. Phần bên trái đường phân cách (đường thẳng đứng) là dữ liệu lịch sử và hiện tại, phần bên phải là time series dự đốn.

Dữ liệu training là dữ liệu của 4 năm ở cửa hàng: 2009, 2010, 2011, 2012.

Thuật tốn Microsoft Time Series cung cấp các biến (parameters) làm ảnh hưởng tới mơ hình, dữ liệu thời gian đã phân tích. Thay đổi các thuộc tính này cĩ thể tác động đáng kể cách mơ hình khai phá tạo các dự đốn

Tham số Giá trị

mặc định Giá trị dùng Mơ tả

Periodicity_hint 1 12 Tham số cung cấp cho thuật tốn các giai đoạn thời gian chúng ta mong đợi sẽ thể hiện trong dữ liệu. Do chúng ta cần dự đốn theo tháng, 12 tháng trong năm nên thiết lập PERIODICITY_HINT =12 để chỉ cĩ 12 tháng để tạo nên một chu trình bán hàng

Forecasting Method None MIXED Dùng để quyết định sử dụng thuật tốn hồi quy nào, ARIMA hay ARTXP hoặc MIXED nếu muốn cả hai, hệ thống sẽ tự động đưa ra kết quả tốt dự trên cả 2 thuật tốn Missing_value_substitution None 0 Giá trị 0 sẽ lấp đầy các vị trí bị

a. Dự đốn xu hƣớng doanh số bán hàng trong thời gian tiếp theo

Một view được truy vấn từ kho dữ liệu cho dữ diệu huấn luyện như bên dưới:

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng business intelligence SQL server 2008 trong thương mại điện tử (Trang 48 - 50)

Tải bản đầy đủ (PDF)

(66 trang)