CHƯƠNG 3: THỬ NGHIỆM RA QUYẾT ĐỊNH QUẢN LÝ VẬT TƯ TẠI TRƯỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM
3.2. Yêu cầu về hệ thống
3.2.1. Cơ sở dữ liệu về đào tạo và nghiên cứu khoa học
Hiện tại, Học viện chƣa quản lý tác nghiệp rộng trên cơ sở dữ liệu trực tuyến. Dữ liệu thường được tổ chức trong các cơ sở dữ liệu đơn lẻ. Nhiệm vụ của đề tài luận văn là thiết kế cơ sở dữ liệu tích hợp, cho phép lưu mọi thông tin về đào tạo và nghiên cứu khoa học của cán bộ, học viên và sinh viên của Học viện.
Hệ quản trị cơ sở dữ liệu là SQL SERVER. Giao diện là tương tác người dùng theo đồ họa, gắn với môi trường Windows.
Nhiều bảng dữ liệu, liên quan đến đào tạo và nghiên cứu khoa học đƣợc mô tả trong cơ sở dữ liệu quản lý vật tƣ”.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/
3.2.2. Hạ tầng kĩ thật
Đề tài thực hiện trên máy đơn. Mô hình tương lai yêu cầu cơ sở dữ liệu đặt trên máy chủ cơ sở dữ liệu của vật tƣ. Các quyết định liên quan đến quản lý nguồn vật tư sẽ thực hiện trên mạng Intranet, cho phép các người quản lý điều khiển tác nghiệp. Các chức năng tìm kiếm, trích rút dữ liệu và xử lý dữ liệu, theo hệ thống cơ sở dữ liệu truyền thống đƣợc hệ quản trị cơ sở dữ liệu SQL SERVER đảm nhiệm.
Một số chức năng trợ giúp quyết định do khối OLAP đảm nhiệm. Phần mềm với các chức năng OLAP gắn với hệ quản trị SQL SERVER, và chức năng OLAP trong các bảng tính sẽ giúp người quản lý tin học hóa quá trình của họ.
3.2.4. Giới thiệu công cụ xây dựng mô hình khai phá dữ liệu Business Intelligence Development Studio (BIDS) của Microsoft
BIDS là công cụ cho phép tổ chức quản lý và khai thác kho dữ liệu (Xử lý phân tích trực tuyến) cũng nhƣ xây dựng các mô hình khai phá dữ liệu rất dễ sử dụng và hiệu quả của Microsoft.
BIDS cho phép triển khai các mô hình khai phá dữ liệu sau:
Micorosft Decision Tree (Cây quyết định) Microsoft Clustering (Phân cụm)
Micorosoft Naive Bayes (Phân lớp với Bayes Rules) Micorosoft Time Series (Chuỗi thời gian)
Micorosoft Association (Luật kết hợp)
Micorsoft Sequence Clustering (Phân tích chuỗi) Microsoft Neural Network (Mạng Neural)
Micorsoft Linear Regression (Hồi qui tuyến tính) Micorsoft Logistics Regression (Hồi qui logistics)
Qui trình Xây dựng mô hình khai phá dữ liệu với BIDS nhƣ sau:
Tạo mới 1 project (Analysis Services Project) Tạo một Data Source
Tạo một Data Source View
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/
Tạo một Mining model structure.
Tạo các Mining models.
Khai thác Mining models.
Kiểm tra độ chính xác của Mining Models.
Sử dụng Mining Models để dự đoán.
3.2.5. Giới thiệu kỹ thuật xử lý phân tích trực tuyến với SQL SERVER OLAP Trong công nghệ kho dữ liệu (Data Warehouse Technology), OLAP là kỹ thuật để truy xuất dữ liệu chủ yếu trong kho dữ liệu. Dữ liệu trong DW đƣợc tổ chức dưới dạng các khối dữ liệu đa chiều và OLAP được dùng để phân tích trên dữ liệu khối (cube).
Data Warehouse (DW): Được xem là tập các cơ sở dữ liệu hướng chủ đề, có tính lịch sử đƣợc tích hợp từ nhiều nguồn dữ liệu qua các quá trình trích lọc, hợp nhất, chuyển đổi, làm sạch.
Dữ liệu khối (Data Cube): Dữ liệu trong kho dữ liệu được thể hiện dưới dạng đa chiều (Multi Dimension) gọi là khối (cube). Mỗi chiều mô tả một đặc trƣng nào đó của dữ liệu. Ví dụ với Data Cube bán hàng thì chiều hàng hóa (Item) mô tả chi tiết về hàng hóa, chiều thời gian (time) mô tả về thời gian bán hàng, chiều chi nhánh (Branch) mô tả thông tin về các đại lý bán hàng,…
Lƣợc đồ hình sao (Star Schema): Đây là mô hình biểu diễn dữ liệu của DW, lƣợc đồ hình sao về cơ bản gồm có bảng sự kiện (Fact Table) và các bảng chiều (Dimension table). Fact table đùng để theo dõi các biến động của dữ liệu, cấu trúc của Fact table gồm các khóa ngoại đó là các khóa chính của cả bảng chiều (Dimension table). Dimension Table là các bảng mô tả các đặt trƣng của các chiều nhƣ chiều thời gian, chiều khách hàng, chiều hàng hóa,…
Measure (độ đo): Là đại lƣợng có thể tính toán đƣợc trên các thuộc tính của fact table. Đây là mục tiêu của OLAP và phải xác định trước khi tiến hành phân tích. Ví dụ nhƣ tổng tiền bán hàng của một chi nhánh, doanh thu của từng mặt hàng theo quí,…
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/
Phân cấp (Hierarchies): Khái niệm này mô tả sự phân cấp thứ bậc (mức độ chi tiết của dữ liệu). Ví dụ đối với chiều thời gian, ta có thực bậc nhƣ sau:
day<week<month<quarter<year. Tương tự đối với chiều location ta có thứ bậc street<city<province_or_state<country. Trong khi phân tích dữ liệu chúng ta rất cần khái niệm này để tổng hợp hay chi tiết từng hạng mục dữ liệu trong DW.
3.2.6. Kho dữ liệu trong quản lý vật tư
Quản lý muốn tìm kiếm các thông tin bổ ích về vật tƣ để có những kế hoạch hiệu hỏa. Nhu cầu thong tin tham khảo thật sự cần thiếm và để đảm bảo thong tin này đầy đủ và chính xác cần có một lƣợng dữ liệu lớn về thong tin vật tƣ hang năm đƣợc thu thập và phân loại chính xác. Từ đó đƣa ra các quyết định nhằm hỗ trợ cho người quản lý có những quyết định cho các khía cạnh cụ thể.
Từ đó tối quyết định đƣa ra giải pháp hình thành một kho dữ liệu nguồn đƣợc cập nhật và khai phá tốt để cung cấp thông tin vật tƣ.