1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phương pháp xử lư phân tích trực tuyến áp dụng trong xây dựng hệ trợ giúp quyết định dựa vào dữ liệu

63 507 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 63
Dung lượng 1,34 MB

Nội dung

- - BỘ GIÁO DỤC VÀ ĐÀO TẠO MỤC LỤC TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Danh mục hình vẽ Danh sách thuật ngữ từ viết tắt .6 Lời mở đầu .7 Chương I Khai thác liệu xử lý phân tích trực tuyến 10 - LUẬN VĂN THẠC SĨ KHOA HỌC PHƯƠNG PHÁP XỬ LÝ PHÂN TÍCH TRỰC TUYẾN ÁP DỤNG TRONG XÂY DỰNG HỆ TRỢ GIÚP QUYẾT ĐỊNH DỰA VÀO DỮ LIỆU 1.1 Giới thiệu phương pháp khai thác liệu 10 1.2 Xử lý phân tích trực tuyến (OLAP) 11 1.3 Nguyên tắc OLAP 12 1.3.1 Khung nhìn đa chiều 12 1.3.2 Tính suốt (Transparency) 12 1.3.3 Khả truy nhập 13 1.3.4 Thực việc tạo báo cáo đồng 13 1.3.5 Kiến trúc khách/chủ (Client/Server) 13 1.3.6 Cấu trúc chung cho chiều (Generic Dimensionality) .13 1.3.7 Làm việc với ma trận .14 1.3.8 Hỗ trợ nhiều người sử dụng .14 1.3.9 Phép toán chiều không hạn chế 14 1.3.10 Thao tác tập trung vào liệu 14 1.3.11 Tạo báo cáo linh hoạt .15 1.3.12 Không hạn chế số chiều mức kết hợp liệu 15 Chương II Kho liệu (Data Warehouse) 16 CHUYÊN NGÀNH: XỬ LÝ THÔNG TIN VÀ TRUYỀN THÔNG TRẦN ĐÌNH CHIẾN NGƯỜI HƯỚNG DẪN KHOA HỌC: GS.TS NGUYỄN THÚC HẢI HÀ NỘI 2006 2.1 Các thành phần kho liệu 16 2.1.1 Siêu liệu (Metadata) 17 2.1.2 Các nguồn liệu .17 2.1.3 Hệ thống xử lý giao dịch trực tuyến (OLTP) 18 2.1.3.1 Những đặc điểm hệ thống OLTP 19 2.1.3.2 Các công cụ thu thập, làm chuyển đổi liệu nguồn 20 2.1.4 Cơ sở liệu kho liệu 22 2.1.5 Kho liệu 23 2.1.5.1 Định nghĩa 23 2.1.5.2 Đặc điểm liệu kho liệu 24 2.1.6 Kho liệu chủ đề (Datamart) 25 2.2 Sử dụng kho liệu .26 2.3 Phương pháp xây dựng kho liệu 28 2.4 Thiết kế CSDL cho kho liệu .29 2.4.1 Giản đồ hình (Star) 29 2.4.2 Giản đồ hình tuyết rơi (Snowflake) 32 2.4.3 Giản đồ kết hợp 33 2.4.4 Những vấn đề liên quan tới thiết kế giản đồ hình .34 2.4.4.1 Đánh số 34 2.4.4.2 Chỉ thị mức 35 2.4.5 Những nhân tố thiết kế cần phải cân nhắc .35 2.5 Quản trị kho liệu .37 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - - Chương III Tiếp cận phân tích đa chiều xử lý phân tích trực tuyến 39 3.1 Tiếp cận đa chiều 39 3.2 Phân tích đa chiều 40 3.3 Kiến trúc khối OLAP (OLAP Cube Architecture) 42 3.3.1 Giới thiệu kiến trúc khối 42 3.3.2 Khối (Cube) .43 3.3.2.1 Xác định khối 44 3.3.2.2 Xử lý khối 45 3.3.2.3 Khối ảo (Virtual Cube) 46 3.3.3 Chiều (Dimension) .46 3.3.3.1 Xác định chiều 48 3.3.3.2 Chiều có phân cấp 48 3.3.3.3 Phân cấp chiều 49 3.3.3.4 Roll_up Drill_down dựa phân cấp chiều .50 3.3.3.5 Các chiều ảo (Virtual Dimensions) 50 3.3.4 Các đơn vị đo lường (Measures) .51 3.3.5 Các phân hoạch (Partitions) 51 3.3.6 Các phương pháp lưu trữ liệu (MOLAP, ROLAP, HOLAP) .53 3.3.6.1 MOLAP (Multidimensional OLAP) 53 3.3.6.2 ROLAP (Relational OLAP) .54 3.3.6.3 HOLAP (Hybrid OLAP) 55 3.4 Thuật toán số hoá khung nhìn xử lý phân tích trực tuyến kho liệu 55 3.4.1 Một số khái niệm 56 3.4.1.1 Các khối liệu (Subcubes) .56 3.4.1.2 Câu truy vấn (Queries) .56 3.4.1.3 Chỉ số (Indexes) 57 3.4.1.4 Quan hệ tính toán phụ thuộc 58 3.4.2 Thuật toán chọn View Index .61 3.4.2.1 Ước tính kích thước View 61 3.4.2.2 Ước tính kích thước số Index 61 3.4.2.3 Xác định toán .62 3.4.2.4 Giải toán 63 3.3.5 Kết luận 66 Chương IV Hệ trợ giúp định dựa vào liệu 67 4.1 Hệ trợ giúp định 67 4.1.1 Giới thiệu 67 4.1.2 Hệ trợ giúp định 68 4.1.3 Phân loại hệ trợ giúp định 69 4.2 Hệ trợ giúp định dựa vào liệu 71 4.2.1 Tiếp cận kho liệu OLAP 71 4.2.2 Trợ giúp định dựa vào liệu sở kho liệu OLAP .73 4.2.3 Tiến trình trợ giúp định dựa vào liệu cho toán cụ thể 75 4.3 Xây dựng cấu trúc thông tin hỗ trợ việc định 77 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - - 4.3.1 Vai trò cấu trúc thông tin 77 4.3.2 Các yếu tố ảnh hưởng .78 4.3.2.1 Các yêu cầu thông tin .78 4.3.2.2 Mức độ tích hợp .80 4.3.3 Mô hình tổ chức thông tin 81 4.3.3.1 Các yêu cầu thông tin lực hệ thống thông tin 81 4.3.3.2 Mức độ tích hợp hệ thống 83 4.3.4 Kết luận .84 4.4 Dịch vụ trợ giúp định Microsoft 85 4.4.1 Kho liệu Microsoft .85 4.4.1.1 Microsoft Data Warehousing Framework 86 4.4.1.2 Sự phức tạp liệu .87 4.4.1.3 Lợi ích việc kinh doanh 88 4.4.1.4 Mô hình liệu 88 4.4.1.5 Các hình thức lưu trữ 89 4.4.2 Kiến trúc dịch vụ trợ giúp định Microsoft 90 4.4.3 Các vấn đề việc triển khai Microsoft DSS .91 4.4.3.1 Xây dựng mô hình liệu OLAP cho Microsoft DSS 91 4.4.3.2 Lưu trữ mềm dẻo .93 4.4.3.3 Chuyển thông tin tới người sử dụng 97 4.4.3.4 Khả công cụ OLAP 100 4.5 Hướng nghiên cứu phát triển: Hệ trợ giúp định phân tán 102 Chương V Xây dựng hệ thống trợ giúp định dựa vào liệu công cụ Analysis Services 106 5.1 Mục tiêu hệ thống 106 5.2 Yêu cầu hệ thống 106 5.3 Chức hệ thống 107 5.3.1 Chức tạo lập CSDL đa chiều 109 5.3.2 Chức phân tích hiển thị liệu 109 5.4 Giới thiệu hệ thống .110 5.4.1 Khởi động Analysis Manager 110 5.4.2 Cài đặt sở liệu nguồn liệu (Database & Data Source) .110 5.4.3 Tạo khối 111 5.4.4 Lưu trữ xử lý khối .114 5.4.5 Khối ảo tăng cường khả xử lý bảo mật .117 5.4.6 Tạo khối ảo 118 5.4.7 Hiển thị liệu khối 120 5.4.8 Ví dụ minh họa 121 Phần kết luận .122 Tài liệu tham khảo 124 Tóm tắt luận văn 125 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - - - - Danh mục hình vẽ Hình 1.1 Kho liệu OLAP Hình 2.1 Mô hình kho liệu Hình 2.2 Giản đồ hình hình tuyết rơi Hình 3.1 Mô hình liệu đa chiều Hình 3.2 Mô hình liệu khối Hình 3.3 Giản đồ khối hình Hình 3.4 Giản đồ khối hình tuyết rơi Hình 3.5 Sơ đồ mô hình đa khối Hình 3.6 Phân cấp chiều Sản_phẩm Hình 3.7 Cây phân cấp đối xứng Hình 3.8 Roll_up Drill_down theo phân cấp chiều Hình 4.1 Phân loại Hệ thông tin quản lý Hình 4.2 Kho liệu hệ thống OLAP Hình 4.3 Tiến trình trợ giúp định dựa vào liệu cho toán cụ thể Danh sách thuật ngữ từ viết tắt CSDL DBA DM DSS HOLAP DataBase Administrator DataMart Decision Support System Hybrid OLAP ETL Extract Transformation Load LS MIS MOLAP MSS OLAP OLTP Legacy System Management Information System Multidimensional OLAP Management Support System On-Line Analysis Processing On-Line Transaction Processing Relational DataBase Management Hệ quản trị CSDL quan hệ System Relational OLAP OLAP quan hệ Subject Area Vùng chủ đề RDBMS ROLAP SA Cơ sở liệu Quản trị sở liệu Kho liệu chủ đề Hệ trợ giúp định OLAP ghép Trích xuất, chuyển nạp liệu Hệ thống có sẵn Hệ thông tin quản lý OLAP đa chiều Hệ hỗ trợ quản lý Xử lý phân tích trực tuyến Xử lý giao dịch trực tuyến Hình 4.4 Ma trận Yêu cầu/Năng lực Hình 5.1 Kiến trúc hệ trợ giúp định dựa vào liệu Hình 5.2 Chức hệ trợ giúp định dựa vào liệu Hình 5.3 Tạo DataSource cho khối Database Hình 5.4 Chọn bảng Fact Hình 5.5 Chọn đơn vị đo Hình 5.6 Tạo chiều Hình 5.7 Chọn mức chiều Hình 5.8 Chọn kiểu lưu trữ Hình 5.9 Tăng tốc độ thực Hình 5.10 Xử lý khối Hình 5.11 Chọn khối cho khối ảo Hình 5.12 Chọn đơn vị đo cho khối ảo Hình 5.13 Chọn chiều cho khối ảo Hình 5.14 Hiển thị liệu khối Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - - Lời mở đầu - - định dựa vào liệu, sử dụng phương pháp luận xử lý phân tích trực tuyến Các hoạt động sản xuất, kinh doanh cần có đáp ứng (OLAP) Đề tài tập trung vào hai công việc nghiên cứu vấn đề tổ nhanh nhạy, tức thời thay đổi liên tục, nhà quản lý buộc chức sở liệu đa chiều, phân tích hiển thị liệu để trợ giúp phải thường xuyên lúc nhiều định đắn (mà chúng ảnh định hưởng đáng kể đến xu hướng hoạt động cạnh tranh doanh nghiệp) Hệ trợ giúp định theo cách tiếp cận giúp nhà quản cách nhanh chóng Do vấn đề trợ giúp định trở nên cần thiết lý thiết lập mô hình OLAP cho ứng dụng cụ thể việc tổ Người ta cần phải thu thập, tổng hợp phân tích liệu từ nhiều nguồn khác chức sở liệu đa chiều dễ dàng điều chỉnh hoạt động phân tích, tìm cách nhanh hiệu định kiếm thông tin theo khía cạnh khác liệu nhằm thu thập nhanh chóng phù hợp Điều dẫn đến việc cần phát triển hệ tối đa liệu cần thiết để từ đưa định tốt thống tinh thông biết cách làm để trích chọn phân tích liệu cho cách nhanh chóng người sử dụng Không giống với hệ trợ giúp định truyền thống thường Hiện có nhiều phần mềm cung cấp cho người sử dụng xây dựng với mục đích đưa giải pháp tối ưu cho toán cụ thể, khả truy vấn lập báo cáo thông tin, đặc biệt hệ quản trị phạm vi ứng dụng hẹp, hệ trợ giúp định dựa vào liệu hướng đến CSDL quan hệ Tuy nhiên CSDL quan hệ với cấu trúc hai chiều (dòng cột) việc giúp người sử dụng khai thác tối đa khả tiềm ẩn không thiết kế để cung cấp quan điểm đa chiều liệu đầu vào khối lượng liệu lớn, nhằm thu thông tin tổng hợp đủ phân tích phức tạp Sử dụng hệ thống này, gặp khía cạnh khác liệu, để từ định nhiều khó khăn bất tiện việc tổ chức liệu đa chiều vào bảng cách nhanh chóng Do đặc điểm này, phạm vi ứng dụng hệ trợ giúp hai chiều, triển khai liệu phân tích với số lượng lớn, công cụ định dựa vào liệu rộng Nó sử dụng để trợ giúp định phân tích để tạo liệu định không mạnh, thuận tiện, linh hoạt, cho toán khác nhau, lĩnh vực khác nhanh chóng không dễ dàng để sử dụng nhà quản lý, Bố cục luận văn: người định Như vậy, việc xây dựng hệ thống có khả tổ chức liệu đa chiều có khả phân tích liệu linh hoạt để trả lời truy vấn đa chiều cách dễ dàng, nhanh chóng nhằm hỗ trợ cho việc định nhà quản lý cần thiết Mục đích đề tài: Luận văn đề cập đến việc nghiên cứu xây dựng hệ trợ giúp Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Toàn luận văn trình bày chương: • Chương 1: Giới thiệu phương pháp khai thác liệu, nội dung xử lý phân tích trực tuyến • Chương 2: Trình bày lý thuyết chung kho liệu mô hình kho liệu, phương pháp xây dựng thiết kế CSDL cho kho liệu • Chương 3: Trình bày phương pháp tiếp cận phân tích đa chiều xử lý phân tích trực tuyến Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - - • Chương 4: Giới thiệu Hệ trợ giúp định dựa vào liệu với hai thành phần kho liệu xử lý phân tích trực tuyến Tiến trình trợ giúp định dựa vào liệu Xây dựng cấu trúc thông tin để hỗ trợ việc định giới thiệu dịch vụ trợ giúp định Microsoft Hướng nghiên cứu phát triển • Chương 5: Xây dựng hệ thống với chức tạo lập sở liệu đa chiều phân tích hiển thị liệu - 10 - Chương I Khai thác liệu xử lý phân tích trực tuyến 1.1 Giới thiệu phương pháp khai thác liệu Khai thác liệu trình phát mối quan hệ liên thuộc, mô hình khuynh hướng (Patterns & Trends) việc khảo sát số lượng lớn liệu lưu trữ kho (Repository) sử dụng công nghệ nhận dạng mẫu kỹ thuật thống kê toán học Khai thác liệu hiểu kỹ thuật khoan liệu theo chiều sâu tổng hợp liệu theo chiều ngược lại, trình đào xới xem xét liệu nhiều góc độ nhằm tìm mối liên hệ thành phần liệu phát xu hướng, hình mẫu, kinh nghiệm khứ tiềm ẩn kho liệu Vì phù hợp với mục đích phân tích liệu hỗ trợ điều hành định Phần lớn phương pháp khai thác liệu dựa lĩnh vực học máy, thống kê công cụ khác Một số kỹ thuật thường dùng mạng Nơ-ron (Neuron Network), giải thuật di truyền (Genetic Algorithms) xử lý phân tích trực tuyến (OLAP) Xử lý phân tích trực tuyến việc sử dụng kho liệu cho mục đích trợ giúp định Ý tưởng mô chiều liệu mở rộng: bảng với n thuộc tính xem không gian n chiều Người quản lý thường đặt câu hỏi mà phân tích phân tích đa chiều Các thông tin dễ phân tích bảng biểu diễn hai chiều CSDL quan hệ chuẩn đáp ứng tốt công việc Trong trường hợp vậy, sử dụng OLAP tỏ thích hợp Cũng có khác công cụ OLAP khai thác liệu công cụ OLAP học, chúng không tạo nên tri thức không tìm kiếm giải pháp Như có khác tri thức đa chiều kiểu tri thức mà người lấy từ CSDL Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 11 - thông qua khai thác liệu - 12 - biến đổi liên quan tới đại lượng số liệu số qua nhiều chiều • Tạo tổng hợp kết hợp, phân cấp dùng mức tổng hợp, kết hợp cho phép giao bảng theo chiều • Hỗ trợ mô hình chức cho việc dự báo, phân tích xu hướng phân tích thống kê • Lấy hiển thị liệu theo bảng chiều hay chiều, theo biểu đồ hay đồ thị, dễ dàng xoay đổi trục cho Khả xoay Hình 1.1 Kho liệu OLAP quan trọng người sử dụng cần phân tích liệu từ cách nhìn khác phân tích theo cách nhìn dẫn đến câu hỏi 1.2 Xử lý phân tích trực tuyến (OLAP) OLAP chức thông minh xử lý nghiệp vụ, làm cho thông tin hiểu dễ dàng OLAP khiến cho người sử dụng đầu cuối (End-User) hiểu chất bên thông qua việc truy nhập nhanh, tương tác tới khung nhìn nhiều dạng thông tin chuyển đổi từ liệu thô để phản ánh đa dạng nhiều chiều OLAP công nghệ phân tích liệu thực công việc sau: khác, câu hỏi kiểm tra tính đắn dựa cách nhìn khác liệu • Đáp ứng câu trả lời nhanh trình phân tích không bị cắt ngang thông tin không bị cũ • Sử dụng kho liệu đa chiều, lưu trữ liệu theo mảng (lưu ý mảng lưu trữ phần tử kiểu khác với ghi phần tử khác kiểu nhau) Những mảng biểu diễn Logic chiều công việc • Đưa khung nhìn Logic, nhiều chiều liệu kho liệu Khung nhìn hoàn toàn không phụ thuộc vào việc liệu lưu trữ (có thể lưu trữ kho liệu nhiều chiều hay kho liệu quan hệ) • Thường liên quan tới truy vấn phân tích tương tác liệu Sự tương tác thường phức tạp, liên quan tới việc khoan sâu xuống mức liệu chi tiết lên mức liệu cao mức tổng hợp kết hợp • Cung cấp khả thiết lập mô hình phân tích bao gồm tính toán tỉ lệ, Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 1.3 Nguyên tắc OLAP 1.3.1 Khung nhìn đa chiều Đối với người thực cách nhìn họ với công việc nhiều chiều chất Vì mô hình OLAP phải đa chiều chất Những người sử dụng thao tác dễ dàng mô hình liệu đa chiều 1.3.2 Tính suốt (Transparency) Công cụ phân tích cần phải suốt với người sử dụng OLAP nên Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 13 - tồn kiến trúc hệ thống mở, cho phép công cụ phân tích có - 14 - 1.3.7 Làm việc với ma trận thể nhúng vào nơi mà người sử dụng mong muốn mà không Cấu trúc vật lý OLAP Server cần phải biến đổi cho phù hợp với mô có tác động ngược lại với chức công cụ máy hình phân tích cụ thể tạo tải vào để việc quản lý ma trận tối chủ ưu Khi làm việc với ma trận, OLAP Server phải có khả suy 1.3.3 Khả truy nhập luận tìm cách lưu trữ liệu hiệu Các phương pháp truy nhập Công cụ OLAP phải ánh xạ giản đồ Logic tới kho vật lý thay đổi thường xuyên cung cấp chế khác liệu vật lý hỗn tạp, truy nhập tới liệu thực chuyển đổi cần tính toán trực tiếp, nhị phân, kỹ thuật băm kết hợp tốt thiết để đưa khung nhìn đơn giản, mạch lạc đồng cho người sử kỹ thuật dụng Dữ liệu vật lý hệ thống thuộc kiểu trở nên suốt với người 1.3.8 Hỗ trợ nhiều người sử dụng sử dụng mối quan tâm công cụ Những công cụ OLAP phải cung cấp truy nhập đồng thời (lấy 1.3.4 Thực việc tạo báo cáo đồng liệu cập nhật), tính toàn vẹn an toàn để hỗ trợ cho người sử Khi số lượng chiều tăng suất báo tạo báo cáo giảm 1.3.5 Kiến trúc khách/chủ (Client/Server) Thành phần Server công cụ OLAP cần phải đủ thông minh đến dụng làm việc đồng thời với mô hình phân tích tạo mô hình khác từ liệu 1.3.9 Phép toán chiều không hạn chế mức mà nhiều Client truy nhập tới cách dễ dàng lập Trong phân tích liệu đa chiều, tất chiều tạo có vai trình tích hợp Server thông minh phải có đủ khả để ánh xạ xây dựng trò Các công cụ OLAP quản lý tính toán liên quan tới liệu từ sở liệu vật lý Logic khác hẳn Điều cần chiều không yêu cầu người sử dụng phải định nghĩa phép toán thiết để đảm bảo tính suốt xây dựng lược đồ mức khái niệm, Việc tính toán đòi hỏi phải định nghĩa công thức tùy thuộc vào ngôn Logic, vật lý chung ngữ, ngôn ngữ phải cho phép tính thao tác với số lượng chiều bất 1.3.6 Cấu trúc chung cho chiều (Generic Dimensionality) Mỗi chiều liệu phải cân cấu trúc khả thực Thường tồn cấu trúc chung cho tất chiều Mọi chức áp dụng cho chiều áp dụng cho chiều khác kỳ mà không bị hạn chế mối quan hệ phần tử, không liên quan tới số thuộc tính chung liệu phần tử 1.3.10 Thao tác tập trung vào liệu Những thao tác định hướng lại đường dẫn xây dựng liệu khoan sâu xuống theo chiều hàng thực hành động trực tiếp phần tử mô hình phân tích mà không đòi hỏi phải sử dụng Menu hay ngắt cho giao diện với người sử dụng Những Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 15 - chiều định nghĩa mô hình phân tích chứa tất thông tin mà người sử dụng cần để thực hành động cố hữu 1.3.11 Tạo báo cáo linh hoạt Với việc sử dụng OLAP Server công cụ nó, người sử - 16 - Chương II Kho liệu (Data Warehouse) Hiện hầu hết tổ chức phải đương đầu với thay đổi thị trường Người ta thấy để đưa định đắn, trước hết phải có khả truy nhập tới tất loại thông tin nhanh chóng dụng đầu cuối thao tác, phân tích, đồng hoá xem xét liệu theo Đối với tổ chức đó, để có định đắn, cần nghiên cứu cách mà người mong muốn, bao gồm việc tạo những liệu khứ, phân tích nhằm định toàn xu hướng có nhóm Logic bố trí hàng, cột, phần tử cạnh phần tử khác thể Trong bối cảnh công nghệ thông tin phát triển, liệu tập trung Những phương tiện tạo báo cáo phải cung cấp tính linh hoạt đưa sở liệu khổng lồ, nhu cầu truy cập vào tất thông tin thông tin đồng theo cách mà người sử dụng cần thiết Cách có hiệu để trợ giúp nhu cầu truy nhập thông tin muốn hiển thị chúng tổ chức kho liệu (Data Warehouse) 1.3.12 Không hạn chế số chiều mức kết hợp liệu 2.1 Các thành phần kho liệu Một OLAP Server chứa 15 chiều mô hình phân tích thông thường Mỗi chiều cho phép số lượng không Các thành phần cấu thành kho liệu cung cấp khung để trao đổi kiến trúc, cấu trúc chiến lược kho liệu giới hạn mức tổng hợp kết hợp liệu người sử dụng định nghĩa đưa cách xây dựng mức Hình 2.1 Mô hình kho liệu Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 17 - 2.1.1 Siêu liệu (Metadata) Trong việc tổ chức kho liệu, người dùng đầu cuối mà nhân viên quản trị cần truy nhập toàn thông tin - 18 - chủng loại Các hệ thống nằm coi hệ thống nguồn hệ thống có sẵn • Hệ thống có sẵn (Legacy System - LS): hệ thống tác nghiệp bảng gồm đối tượng thuộc tính Do họ muốn biết Hệ thống phát triển, sử dụng công nghệ có sẵn số vấn đề: phù hợp với nhu cầu Các hệ thống thực • Có thể tìm thấy liệu đâu? nhiều năm có lẽ có minh chứng tài • Tồn loại thông tin, liệu nào? liệu • Dữ liệu thuộc loại nào, có dạng sao? • Trong sở liệu khác liệu có liên quan với nào? • Dữ liệu lấy từ đâu thuộc quản lý? • Dữ liệu ngoài: liệu không nằm hệ thống tác nghiệp tổ chức, liệu người sử dụng đầu cuối yêu cầu Các LS phát triển để phục vụ cho dự án Các ứng dụng phát triển với liệu mà liệu lại đáp ứng nhiều nhu cầu khác Vì hình thành dạng sở liệu khác gọi Metadata Cùng liệu lại có tên khác thuộc hệ thống nhằm mô tả cấu trúc nội dung sở liệu Trong môi trường đo lường khác Kết cuối nguồn liệu cần đánh sở liệu phức hợp, Metadata phù hợp thiếu định giá định nghĩa cần đưa vào Metadata để nhắm tới vấn đề sau: cấu trúc sở liệu tác nghiệp cấu trúc kho liệu Một vấn đề xuất • Xác định nguồn khác nhau, cấu trúc file khác nhau, thường xuyên khả giao tiếp với người sử dụng thông tin bên kho liệu cách thức chúng truy nhập Chính Metadata cách để người sử dụng ứng dụng tiếp cận với (Platform) khác • Hiểu liệu có hệ thống nguồn tồn tại, định nghĩa liệu luật cho liệu thông tin lưu trữ kho liệu Nó định nghĩa tất phần • Phát giao thông tin hệ thống khác tử liệu thuộc tính chúng • Quyết định liệu tốt hệ thống Mỗi hệ thống cần Metadata cần thu thập kho liệu thiết kế xây dựng Metadata phải có sẵn cho tất người sử dụng kho liệu để hướng dẫn họ dùng kho liệu Ngoài công cụ trợ giúp thiết lập cần đánh giá 2.1.2 Các nguồn liệu Bao gồm hệ thống tổ chức, phong phú Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 đánh giá để định hệ thống có liệu rõ ràng xác 2.1.3 Hệ thống xử lý giao dịch trực tuyến (OLTP) Dữ liệu phát sinh từ hoạt động hàng ngày thu thập, xử lý để phục vụ công việc cụ thể tổ chức thường gọi liệu tác nghiệp hoạt động thu thập xử lý loại liệu gọi xử lý giao Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 19 - dịch trực tuyến (OLTP) - 20 - xử lý giao dịch trực tuyến Dữ liệu CSDL tác nghiệp lấy từ nhiều nguồn khác Kho liệu với nhiệm vụ tổ chức liệu cho mục đích phân tích nên dễ bị nhiễu, hỗn tạp dẫn đến liệu không sạch, không toàn vẹn Do giải khó khăn việc cung cấp khóa chính, việc kiểm tra liệu, làm liệu phải tiến hành nhằm kho liệu có thể: bảo đảm tính toàn vẹn, tính đắn liệu để phục vụ cho việc xây dựng kho liệu trợ giúp định sau 2.1.3.1 Những đặc điểm hệ thống OLTP • Trợ giúp số lượng lớn người sử dụng đồng thời việc thêm mới, sửa đổi liệu • Diễn tả trạng thái thay đổi bắt buộc tổ chức không lưu lại lịch sử • Chứa đựng số lượng lớn liệu, bao gồm liệu tổng quát để kiểm soát thực • Được điều chỉnh để đáp ứng nhanh việc thực • Cung cấp sở hạ tầng công nghệ để hỗ trợ thao tác thường ngày tổ chức Chính từ đặc điểm này, sử dụng OLTP cho phân tích trực tuyến thường gặp khó khăn sau: • Các yêu cầu phân tích, tổng hợp khối lượng lớn liệu ảnh hưởng tới khả hệ thống • Kết hợp liệu từ nguồn liệu hỗn tạp vào cấu trúc đơn • Tổ chức liệu cấu trúc đơn giản đáp ứng hiệu yêu cầu có tính phân tích cho việc xử lý giao dịch • Chứa liệu thay đổi, hợp lệ, chắn hợp lý hoá phân tích • Cung cấp liệu ổn định • Được cập nhật định kỳ liệu bổ sung giao dịch thường xuyên • Cung cấp sở liệu tổ chức phù hợp cho OLAP cho OLTP 2.1.3.2 Các công cụ thu thập, làm chuyển đổi liệu nguồn Một yêu cầu quan trọng sử dụng liệu tinh chế từ hệ thống tác nghiệp đưa chúng vào khuôn dạng thích hợp cho ứng dụng thông tin Những công cụ thực tất công việc chuyển đổi, tóm tắt thay đổi quan trọng, thay đổi cấu trúc cô đọng cần thiết cho chuyển đổi liệu riêng rẽ thành thông tin có • Sự thực hệ thống đáp ứng yêu cầu phân tích phức thể dùng công cụ hỗ trợ định Nó sinh tạp chậm không ổn định, cung cấp hỗ trợ không đầy đủ chương trình kiểm soát câu lệnh Cobol, ngôn ngữ JLC, Unix Script cho người sử dụng phân tích trực tuyến • Sự thay đổi liệu thường xuyên gây trở ngại cho tính tin cậy thông tin phân tích • An ninh trở nên phức tạp phân tích trực tuyến kết hợp với Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 ngôn ngữ định nghĩa liệu SQL cần thiết để chuyển liệu vào kho liệu từ nhiều hệ thống tác nghiệp khác Ngoài trì Metadata Các chức bao gồm: • Loại bỏ liệu không mong muốn từ sở liệu tác Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 97 - - 98 - lượng đĩa cấp cho liệu tập hợp trước Các ứng dụng Microsoft DSS nhà cung cấp gọi Hội đồng OLAP công bố chuẩn MDAPI để mở đáp ứng hầu hết yêu cầu truy vấn thời gian giây gần thị trường cho tham gia nhà cung cấp lớn Cộng đồng nhà cung tất truy vấn 10 giây cấp gồm thành viên Hội đồng OLAP Các bổ xung Microsoft DSS khối phân chia, làm cho Nhận cần thiết phải có chuẩn thống nhất, Microsoft đưa công nghệ nâng lên bậc Khối phân chia khối định nghĩa mở rộng API dùng để truy nhập liệu OLE DB tồn Lôgic liệu dàn trải qua khối vật lý chí rải rác bao gồm tính đa chiều Microsoft đưa hai phác thảo Server riêng biệt Để trả lời truy vấn từ người sử dụng, Microsoft DSS API, tìm kiếm ý kiến nhà cung cấp đưa phiên cuối phân tán truy vấn đễn Server, kích hoạt liệu nhận lại song chứng thực 18 nhà cung cấp beta Ngày OLE DB song cho OLAP API hỗ trợ từ 30 nhà cung cấp số có tất Ví dụ, trường hợp ứng dụng dò tìm điện thoại 10 khu vực địa lý nơi có hàng triệu điện thoại ngày Do mục đích thành viên Hội đồng OLAP Rất nhiều số sẵn sàng đưa sản phẩm dạng beta chi tiết cho người sử dụng phân tích này, liệu nằm 10 Server mà chứa liệu Nhiều nhà phân tích kinh doanh cần liệu phân tích đa chiều khu vực riêng thường có khối liệu Lôgic đơn giản Để trả ngắt kết nối mạng lúc họ công tác chẳng hạn Người sử lời yêu cầu từ người sử dụng thông tin này, Microsoft DSS chuyển yêu dụng lưu động thường muốn xem phân tích lát nhỏ khối, cầu truy vấn thích hợp cho Server nhận lại kết riêng lẻ Mỗi chẳng hạn trường hợp người quản lý bán hàng muốn biết tổng doanh thu sở liệu riêng biệt sẵn sàng cho truy xuất riêng biệt để phân tích cho khu vực đến thăm văn phòng công ty khu vực thông tin tìm kiếm cho khu vực Khả Microsoft DSS quản DOLAP (Desktop OLAP) công nghệ không đòi hỏi máy chủ chia sẻ để lý hiệu liệu phân chia Server làm cho công nghệ tiến xa truy cập liệu đa chiều Hầu hết công nghệ máy chủ OLAP ngày không cung cấp việc 4.4.3.3 Chuyển thông tin tới người sử dụng Công nghệ OLAP Server kết hợp chặt chẽ với công nghệ Client, có nghĩa khách hàng có lựa chọn cho sản phẩm Điều dẫn đến giá giải pháp cao thường có lựa chọn không tương xứng cho ứng dụng Client/Server chuyển tải thông tin OLAP dựa Web Vài năm trước thị trường sở liệu quan hệ, giao diện chung cần thiết để phát triển lựa chọn ứng dụng sở liệu ODBC Các công cụ OLAP lần áp dụng vào năm 1996 nhóm Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 tạo khối DOLAP suốt Công việc dành cho nỗ lực phát triển đòi hỏi tập trung để công cụ Client thêm vào tính OLAP hỗ trợ sử dụng máy để bàn Hầu hết công cụ hiển thị dùng dạng thông tin Web OLAP ngoại lệ Để giảm chi phí cho người sử dụng ứng dụng OLAP, trình duyệt Web hứa hẹn mở cách truy cập đa chiều Hiện có vài sản phẩm công cụ chuyển giao liệu OLAP qua mạng nội chưa có chế dễ dàng cho công cụ phát Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 99 - triển ứng dụng để tạo công cụ hiển thị OLAP theo ý muốn - 100 - người sử dụng yêu cầu liệu bán hàng tháng 1, 3, liệu DSS Server lưu truy vấn người sử dụng, siêu liệu lưu Cache phía Server Client Nếu sau người sử dụng yêu liệu Việc xác định truy vấn lưu siêu liệu làm Microsoft cầu liệu quý I, PivotTable Service lấy kết máy Client mà DSS có khả trả lời truy vấn cách tính toán liệu không cần gửi yêu cầu tới Server Nếu người sử dụng sau lại yêu cầu lưu thay truy xuất từ đĩa Ví dụ, người sử dụng yêu cầu liệu bán liệu quý I năm để so sánh với năm ngoái, PivotTable Service đủ hàng tháng 1, 3, người khác yêu cầu liệu bán hàng thông minh truy cập vào liệu năm ngoái Server quý I, Microsoft DSS lấy tổng số từ tháng đến từ RAM PivotTable Service cung cấp chế cho việc sử dụng lưu động nhanh tìm liệu quý I từ đĩa Không có khác biệt từ hầu hết máy Các phần khối định nghĩa truy nhập từ Server chủ OLAP khác lưu Client để dùng cho truy nhập sau ngắt kết nối mạng Theo Microsoft DSS giải pháp có khả cung cấp nhiều tính cách này, người sử dụng nhà kinh doanh dùng cho phía Client Mọi Client kết nối tới DSS Server dùng thành phần sở liệu họ lưu động có phân tích hoàn phần gọi Microsoft PivotTable Service PivotTable Service có tính chỉnh không cần phải ngồi văn phòng Hơn nữa, PivotTable Service điều khiển quản lý kết nối Client Server PivotTable Service chia cho phép người sử dụng tạo mô hình OLAP đơn giản máy sẻ nhiều đoạn mã với DSS Server, chuyển thành phần tính toán đa chiều Client, truy nhập thông tin nguồn liệu OLE DB từ file cho Server, Cache quản lý truy vấn đến Client Kết cho ta mô hình đến sở liệu máy để bàn quản lý liệu Client/Server có khả thực yêu cầu cao giảm PivotTable Service cung cấp kết nối cho ứng dụng dựa thiểu lưu thông mạng Điều đem lại lợi ích dung lượng đĩa yêu cầu Web Khi OLE DB cho OLAP giao diện chương trình mức thấp, PivotTable Service xấp xỉ MB nhớ yêu cầu 500 KB ActiveX Data Object (ADO) phát triển để cung cấp truy nhập liệu đa Kiến trúc DSS Client/Server thông minh có khả xác định cách chiều Nó gọi ADO/MD, dễ dàng sử dụng để tạo ActiveX điều khiển thức để trả lời yêu cầu từ người sử dụng nhanh loại trừ dư thừa Microsoft Visual Basic để xem, lập báo cáo liệu DSS từ trang lưu thông mạng Điểm cốt lõi kiến trúc chia sẻ siêu liệu Web ADO/MD công cụ lập trình ứng dụng hợp tác cho phép truy xuất tới Client Server Khi người sử dụng yêu cầu thông tin từ Server, tất tính DSS liệu siêu liệu (định nghĩa cấu trúc khối) tải xuống Client Siêu 4.4.3.4 Khả công cụ OLAP liệu khối Client cho phép PivotTable Service định yêu cầu cần trả lại cho Server Xét ví dụ cần xem xét liệu bán hàng tháng Cho DSS Server ứng dụng phía Client kích hoạt Khi Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Microsoft nhận thấy OLAP mở rộng tự nhiên công nghệ sở liệu đưa DSS vào SQL Server SQL Server bao gồm nhiều đặc tính bổ xung khác hỗ trợ tiến trình kho liệu bao gồm: • Visual Database Tools: dùng để tạo giản đồ sở liệu Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 101 - • Data Transformation Services: dùng để trích xuất chuyển liệu tác nghiệp vào kho liệu • Microsoft Repository: cung cấp tính lưu trữ siêu liệu thống SQL Server - 102 - 4.5 Hướng nghiên cứu phát triển: Hệ trợ giúp định phân tán Khi xây dựng hệ trợ giúp định, nói chung người ta quan tâm đến công nghệ phân tán việc tính toán phân tán thường bị hạn chế tác vụ phụ trợ Các tính toán phân tán có khả tích hợp hệ Trong phiên tới Microsoft Office, Microsoft đưa trợ giúp định với hệ thống E-mail, nhiều nghiên cứu hệ trợ giúp nhiều lực OLAP tương thích với DSS Xây dựng OLE DB cho giao diện định tận dụng lợi công nghệ mạng phân tán để mở OLAP, lực hỗ trợ truy nhập trực tiếp vào DSS Server, khả rộng với nhiều công cụ Video tương tác hai chiều, Chat, Bulletin Board sử dụng ngắt mạng tính truy nhập qua giao diện Web Nói chung, công nghệ phân tán ứng dụng hệ trợ giúp Đầu tiên, MS Excel, tính PivotTable kết nối bảng tính định thường xem cách thuận tiện để truy cập vào sở MS Excel với OLE DB cho việc cung cấp liệu OLAP Trong trường hợp liệu bên hay truy cập vào hệ thống Client/Server Các hệ trợ giúp này, có thêm lực khả tạo khối cục từ phần định dựa Web cung cấp thành phần Client để kết nối với khối Server Server có Hosting ứng dụng trợ giúp định Công cụ PivotTable MS Excel thay với công cụ Tuy nhiên, tiềm to lớn công nghệ phân tán không PivotTable Service từ Microsoft DSS cho phép người dùng máy để bàn nhiều sử dụng nhà thiết kế việc mở rộng hệ trợ giúp khả mềm dẻo tạo cấu trúc đa chiều mà giới hạn định truyền thống với công cụ bổ trợ, thay chiến nhớ lược hỗ trợ định kiểu hợp tác hay cộng tác phân tán có ảnh hưởng Một số tính gọi Web Components phiên tới cấu trúc lõi hệ trợ giúp định “Về bản, nhiều hệ thống tới Office cung cấp việc truy xuất OLAP tính lập liệt vào loại hệ trợ giúp định phân tán đa phần ứng bảng qua ActiveX để dễ dàng thêm vào trang Web Xây dựng OLE DB dụng tập trung cho kết mô hình Client/Server Tuy nhiên, hệ cho OLAP sử dụng với cung cấp OLAP tương thích trợ giúp định phân tán gần gũi với trình có nhiều người Microsoft DSS Với việc cải tiến đưa tính phân tích hiển thị tham gia tránh cấu trúc tập trung thực chức OLAP bản, Microsoft cố gắng tạo bước chuyển xu kho hỗ trợ định cho người sử dụng”[4] liệu để nhằm giảm giá công cụ định Hệ thống cần phải hỗ trợ nhiều tốt cho trình Sự kết hợp OLE DB OLAP tạo đa dạng sản phẩm định mà không áp đặt ép buộc người từ nhà cung cấp phần mềm cho việc sử dụng DSS Do nhiều công vụ định Về bản, hai yêu cầu cần thiết để coi hệ trợ giúp định mở Client xây dựng để truy nhập thông tin DSS, người sử dụng rộng tự nhiên lực định là: có nhiều lựa chọn cho ứng dụng Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 • Hệ trợ giúp định cần bắt chước hành động định Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 103 - người định, • Hệ trợ giúp định phải gần gũi với người định, sẵn sàng sử dụng đâu, lúc Bắt chước hành vi định nhiệm vụ bất - 104 - phụ thuộc vào vị trí Thêm vào số môi trường làm việc, người định người hỗ trợ làm việc độc nên hệ trợ giúp định phân tán cần có tính chạy chế độ Offline Nói cách khác, hệ trợ giúp định phân tán không phụ thuộc vào máy chủ kỳ hệ trợ giúp định Tuy nhiên, để hoàn thành nhiệm vụ tốt trung tâm điều quan trọng cần hiểu người định Mô hình liên kết định Vì hệ trợ giúp định cần bắt chước Các kiến trúc phân tán truyền thống sử dụng trình thiết hành động định với nhiều người tham gia Việc chuyển từ hệ trợ kế hệ trợ giúp định phân tán thường kiểu mô hình mạng tập trung giúp định với người sử dụng sang hệ trợ giúp định nhiều Mặc dù lợi hệ thống tập trung đơn giản hạn chế người sử dụng cần chia thành hai hướng riêng: chúng tập trung chỗ Do hệ thống khả chịu lỗi, • Thiết kế kiến trúc phân tán cho hệ trợ giúp định, độc lập vị trí, khó mở rộng cân Sự phụ thuộc vào • Hỗ trợ kết hợp tính khác hệ trợ giúp định phân nguồn tập trung chấp nhận cách tiếp cận chúng tán ta Nói cách khác, kiến trúc không tập trung mô hình thích hợp để đáp ứng Để bắt chước hành động định, điều vô quan trọng phải yêu cầu Ta đưa mô hình liên kết tận dụng lợi mô giải phóng người định khỏi thúc ép kỹ thuật, nói cách khác hình mạng không tập trung Trong mô hình này, người sử dụng hệ trợ người định cần tránh nhiệm vụ kỹ thuật kiểu cấu hình sửa giúp định nhận môi trường làm việc phù hợp với vai trò lỗi Các tình y tế ví dụ tốt cho yêu cầu này: hệ thống có liên tục thay đổi Môi trường làm việc chứa thông tin người sử thể kết nối với loại thiết bị y tế mà không đòi hỏi thầy thuốc dụng hệ trợ giúp định dịch vụ cung cấp cho người sử dụng phải bận tâm cấu hình liệu hay phần mềm Để đạt mục tiêu việc liên kết với thành viên khác trình hỗ trợ định Môi việc sử dụng hệ trợ giúp định phân tán giải pháp linh hoạt trường làm việc Node hay Peer giao tiếp với Node khác linh Để đảm bảo hệ trợ giúp định gần gũi với người hoạt Mỗi môi trường làm việc chứa tối thiểu dịch vụ hạ tầng cần để chạy định người hỗ trợ, sẵn sàng sử dụng lúc nào, bất hệ trợ giúp định Các dịch vụ cung cấp tính kỳ đâu, thiết bị nào, người định người hỗ trợ có tra cứu (Lookup), quản lý giao dịch, liên kết trình… thể làm việc với hệ thống từ đâu việc truy cập thẳng vào hệ trợ giúp Khi người sử dụng quyền tham gia vào hệ trợ giúp định, định cần thiết để tạo linh hoạt Mô hình mạng tập trung môi trường làm việc họ thông báo diện họ mạng Môi không phù hợp cho việc hỗ trợ trình định với đông người tham trường làm việc người sử dụng tồn thông báo hỏi môi gia Hơn nữa, hệ trợ giúp định phân tán chạy nơi không trường làm việc để chia sẻ sách Thông tin trao đổi hiển Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 105 - - 106 - thị thời gian thật hình thiết bị Mỗi người sử dụng hệ trợ Chương V Xây dựng hệ thống trợ giúp định dựa vào giúp định biết diện người sử dụng khác truy liệu công cụ Analysis Services cập vào thông tin chung Theo nghĩa này, cộng đồng sử dụng vừa linh hoạt 5.1 Mục tiêu hệ thống vừa tự hình thành Môi trường làm việc không chứa liệu mà chứa dịch vụ mà tất thành viên sử dụng Trong môi trường làm việc chứa tối thiểu dịch vụ hạ tầng cần để chạy hệ trợ giúp định dịch vụ mở rộng cung cấp cho Roles đặc trưng Hệ thống cung cấp công cụ để xử lý mô hình OLAP ứng dụng cụ thể: cho phép tổ chức CSDL đa chiều CSDL thiết lập cung cấp khả phân tích liệu cách dễ dàng, linh hoạt nhanh chóng nhằm trợ giúp cho việc định Để thực chức này, luận văn sử dụng công cụ Hệ thống tự quản trị Tính mềm dẻo cho phép môi trường làm việc phát cách tự động biến môi trường làm việc khác cập nhật thông tin tới người sử dụng Các môi trường làm việc lại loại bỏ thông tin liên quan đến môi trường vừa biến người sử dụng biết vắng mặt người sử dụng khác Thông tin hiển thị trở lại người sử dụng quay lại mạng Môi trường làm việc bị biến cho thấy ví dụ dịch vụ hạ tầng cần để chạy hệ trợ giúp định, điều cho thấy cộng đồng sử dụng có tính tự sửa lỗi Trong mô hình liên kết, người sử dụng hệ trợ giúp định làm việc cục bộ, đơn lẻ với môi trường làm việc người Tuy nhiên, sở thông tin toàn hệ thống tăng tỉ lệ trực tiếp với số người sử dụng chia sẻ môi trường làm việc Mỗi người sử dụng trang bị lực cần để sử dụng chế độ cục phân tán (các lực mạng dịch vụ hạ tầng) Thông tin người sử dụng quản lý theo cách mà người tham gia kết nối chia sẻ, họ cho phép Sự khác Analysis Services Microsoft SQL Server 2000 với mô hình đối tượng DSO (Decision Support Objects) cho phép tạo ứng dụng quản lý: Databases, DataSources, Dimensions, Cubes Roles Ngoài ta quản trị an ninh, xử lý Cubes khai thác mẫu 5.2 Yêu cầu hệ thống Hệ thống phải dễ dàng cho người sử dụng, không cần thiết họ phải người hiểu biết nhiều máy tính Có thể ứng dụng để trợ giúp định phạm vi rộng toán, lĩnh vực khác mà liệu có khuynh hướng đa chiều Các định thực người sử dụng hoàn toàn khách quan đủ cứ, dựa tiềm tàng khối lượng lớn liệu sở sẵn có (là kết hoạt động tác nghiệp) Hệ thống cung cấp khả phân tích mạnh, cho phép người sử dụng có thể: • Cắt lát khối đa chiều theo mức, chiều tùy chọn biệt quan trọng kiến trúc kiến trúc tập trung vắng mặt • Khoan sâu xuống mức liệu chi tiết máy chủ trung tâm và/hoặc hệ thống quản trị sở liệu • Cuộn lên mức liệu tổng hợp (theo phân cấp chiều) Hệ thống giúp người sử dụng dễ dàng mô tả, thay đổi yêu cầu Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 107 - phân tích liệu giao diện hình thể kết đa chiều Với hệ trợ giúp định này, người sử dụng dễ dàng, thuận tiện nhanh chóng việc định cho toán ứng dụng thực tế - 108 - Dưới sơ đồ thể kiến trúc hệ thống trợ giúp định dựa vào liệu: cách thực công việc sau: (1) Xác định yêu cầu toán ứng dụng cụ thể (2) Xây dựng mô hình OLAP cho toán, hướng đến việc giải yêu cầu Đây công việc phụ thuộc chủ yếu vào nội dung, yêu cầu toán dễ thực sử dụng hệ thống Hình 5.1 Kiến trúc hệ trợ giúp định dựa vào liệu (3) Thực vài thao tác đơn giản để tạo lập sở liệu đa chiều (4) Thực việc phân tích liệu thuận tiện, linh hoạt trực quan Người sử dụng dễ dàng, linh động việc mô tả, thay đổi yêu cầu truy vấn thông tin (trên mức nào, khía cạnh liệu chứa khối) thao tác chọn lựa đơn giản hình thân Hệ thống giới thiệu tập chung vào khối chức quan trọng sau: • Chức tạo lập CSDL đa chiều (Cubes) • Chức phân tích, hiển thị liệu thiện Người dùng thấy kết phân tích mong muốn dạng bảng báo cáo tổng hợp tiện lợi linh hoạt việc uốn nắn hoạt động phân tích liệu để làm sáng tỏ dần tất thông tin cần thiết, đủ để dễ dàng định tốt 5.3 Chức hệ thống Một hệ trợ giúp định dựa vào liệu sử dụng hai thành tố Kho liệu OLAP có đầu vào liệu thu từ hoạt động tác nghiệp (của hệ thống tác nghiệp) đầu báo cáo, thông tin phân tích dồi phong phú hiển thị cách trực quan linh hoạt Hoạt động phân tích tiến hành cách dễ dàng, thuận tiện Hình 5.2 Chức hệ trợ giúp định dựa vào liệu nhanh chóng Dựa kết phân tích này, nhà quản lý có đủ thông tin cần thiết để định hợp lý Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 109 - 5.3.1 Chức tạo lập CSDL đa chiều Là công cụ giúp tạo lập nên khối cấu trúc chiều từ mô hình OLAP ứng dụng cụ thể Dữ liệu nguồn chứa bảng Fact Để tạo khối cần thực bước sau: • Chọn bảng Fact cho khối cần tạo • Tạo đơn vị đo (Measures): chọn cột (có kiểu liệu kiểu số) bảng Fact để làm đơn vị đo • Tạo lập chiều liệu: chiều tương ứng với bảng (bảng Dimension) sơ đồ hình mà bảng Fact bảng trung tâm Trong bảng chiều (Dimension) chọn cột làm mức (Level) chiều Chúng ta cần chọn mức cho đáp ứng việc tham chiếu “Roll_up”, “Drill_down” theo mức • Xử lý khối Ngoài chức tạo khối ảo giúp ta tạo khối từ khối có cách sử dụng lại đơn vị đo chiều khối cũ mà không cần tốn thêm không gian nhớ: • Chọn khối mà ta cần tạo khối ảo từ • Chọn đơn vị đo cho khối ảo • Chọn chiều cho khối ảo • Xử lý khối 5.3.2 Chức phân tích hiển thị liệu Sau khối tạo, liệu khối phân tích qua thao tác xử lý khối Sau người sử dụng tham khảo kết phân tích cách dễ dàng cách thực thao tác “Roll_up”, “Drill_down” theo mức chiều khối chọn Với chức ta có thể: • Cắt lát khối đa chiều theo mức, chiều tùy chọn Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 110 - • Khoan sâu xuống mức liệu chi tiết cần • Cuộn lên mức liệu tổng hợp (theo phân cấp chiều) muốn • Tạo linh hoạt tiện ích cho người sử dụng: dễ dàng mô tả, thay đổi yêu cầu phân tích liệu 5.4 Giới thiệu hệ thống 5.4.1 Khởi động Analysis Manager Khi cài đặt MS SQL 2000 Analysis Services, Analysis Manager cài đặt công cụ quản trị cho Analysis Server Giống Microsoft SQL Server Enterprise Manager, giao diện ta sử dụng Analysis Manager tích hợp tiện ích cho việc quản trị Một cấu trúc xuất bên trái giao diện quản trị cấu trúc phân cấp thường thấy Windows Explorer Khởi động Analysis Manager, ta thấy giao diện Analysis Manager với tất Analysis Server thiết lập môi trường phía bên trái giao diện Tên Analysis Server tự động gán cài đặt MS SQL Server 2000 giống tên máy 5.4.2 Cài đặt sở liệu nguồn liệu (Database & Data Source) Trước thiết kế khối mới, ta cần cài đặt sở liệu riêng biệt Analysis Manager gọi sở liệu OLAP Với sở liệu OLAP tạo ta tổ chức khối, Roles, nguồn liệu, chiều chia sẻ đối tượng khác Trong đối tượng khác, sở liệu chứa đa khối mà khối có nguồn liệu riêng Để cài đặt sở liệu, ta liên kết nguồn liệu với sở liệu trước tiến hành cấu trúc khối Nguồn liệu cần phải tồn qua OLE DB sử dụng, với Microsoft OLE DB Provider for ODBC Drivers chọn hệ thống Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 111 - cũ Chọn Microsoft Jet 4.0 OLE DB Provider OLE DB Drivers for ODBC thường cung cấp cách thứ cấp để kết nối, OLE DB Driver tối ưu - 112 - chọn bảng ‘sales_fact_1998’) • Cửa sổ bên phải hiển thị trường liệu bảng Fact chọn Để cho việc lựa chọn kiểm tra liệu bảng Fact, kích vào nút ‘Browse Data’ Để tạo 5.4.3 Tạo khối tạo thêm nguồn liệu cho khối chọn nút ‘New Data Source’ • Chọn lệnh ‘New Database’ để tạo Database để lưu, chứa khối đặt tên cho Database (ví dụ ‘chientd’) Chọn ‘DataSource’ để tạo nguồn liệu cho khối Database (ví dụ chọn liệu có sẵn Microsofft FoodMart 2000) Hình 5.4 Chọn bảng Fact • Tạo đơn vị đo: Chọn cột số bảng Fact (sales_fact_1998) cửa sổ trái để làm đơn vị đo, cửa sổ bên phải thị cột số chọn • Tạo chiều: Để định nghĩa chiều ta chọn bảng chiều Hình 5.3 Tạo DataSource cho khối Database danh sách bảng nguồn liệu cửa sổ trái (ví dụ chọn bảng customer) • Chọn ‘New Cube’ để tạo khối • Chọn bảng Fact cho khối: Chọn bảng Fact Datasource cửa sổ bên trái, việc chọn bảng tuỳ thuộc vào yêu cầu truy vấn (ví dụ Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 113 - - 114 - • Tạo mức cho chiều: Chọn cột bảng chiều cửa sổ bên trái làm mức chiều Lưu ý ta cần chọn mức cho đáp ứng việc tham chiếu “Roll_up”, “Drill_down” theo mức (ví dụ với bảng chiều ‘customer’ ta chọn ba cột ‘country’, ‘state_province’, ‘city’ làm ba mức chiều) Hình 5.5 Chọn đơn vị đo Hình 5.7 Chọn mức chiều • Chọn ‘Edit’ để thêm, sửa hay xoá khối, đơn vị đo chiều khối 5.4.4 Lưu trữ xử lý khối Analysis Services thường đưa nhiều lựa chọn lưu trữ liệu tập liệu khối Các kiểu lưu trữ gồm: MOLAP, ROLAP HOLAP Hình 5.6 Tạo chiều Khi kết thúc việc thiết kế cấu trúc khối, ta cần thiết kế mô hình lưu trữ theo kiểu cho Analysis Services biết cách sinh Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 115 - - 116 - tập hợp tính toán trước tổng hợp để cải thiện việc thực truy vấn cải tiến lực khối Tiếp theo ta xử lý khối, nạp liệu từ nguồn liệu thiết kế để sinh tính toán tổng hợp mà ta định nghĩa dẫn tập hợp Hình 5.9 Tăng tốc độ thực Hình 5.8 Chọn kiểu lưu trữ • Để thiết kế cách lưu trữ, sử dụng ‘Storage Design Wizard’, chọn ‘Type of Data Storage’, kiểu mặc định để lưu trữ liệu MOLAP Khi xuất ‘Set Aggregation Options’, yêu cầu Analysis Services tăng tốc độ xử lý mà không cần quan tâm dung lượng lưu trữ yêu cầu cách chọn ‘Performance Gain Reaches’ gõ tỉ lệ chọn (ví dụ 65%) Sự cân dung lượng lưu trữ sử dụng khả Hình 5.10 Xử lý khối đáp ứng khối quản lý tính • Cửa sổ tiến trình xuất cho phép ta giám sát tiến trình khối qua giai đoạn toàn tiến trình Khi tiến trình kết thúc xuất Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 117 - thông báo “Processing completed successfully” 5.4.5 Khối ảo tăng cường khả xử lý bảo mật - 118 - 5.4.6 Tạo khối ảo • Chọn ‘New Virtual Cube’ để tạo khối ảo từ khối có Có thể tạo khung nhìn từ việc kết hợp bảng cách Lôgic • Chọn khối cho khối ảo: cửa sổ trái liệt kê tất khối có trong sở liệu quan hệ, khối ảo khối Lôgic tạo FoodMart 2000 Cửa sổ phải hiển thị khối chọn (ví dụ ta chọn qua việc kết hợp khối Ta chọn chiều đơn vị đo khối hai khối ‘Sales’ ‘HR’) ảo từ chiều đơn vị đo tồn Không cần thiết phải sử dụng tất chiều đơn vị đo chọn những chiều cung cấp cho ta khung nhìn tốt liệu mà ta cố đưa từ nguồn liệu khác Khối ảo xuất khối đơn lẻ từ yêu cầu thông tin người dùng Các khối ảo thường gồm chiều đơn vị đo lựa chọn từ khối Ta thường gặp tình yêu cầu kết hợp liệu từ nhiều nguồn liệu OLAP muốn hạn chế liệu đưa tới người dùng tập hợp chiều đơn vị đo khối đơn lẻ Trong tình khối ảo cung cấp lựa chọn tốt Sức mạnh khối ảo bao gồm tính mềm dẻo, tính khả chuyển dễ dàng việc tạo hay sửa khối Yêu cầu lưu trữ tối thiểu mềm dẻo, cho phép kết hợp đa dạng hoá việc tạo khối Sức mạnh khối ảo Hình 5.11 Chọn khối cho khối ảo nằm khả bảo mật Thuộc tính tạo hữu dụng khối ảo phần phần thông tin khối nhạy cảm không • Chọn đơn vị đo cho khối ảo: hình liệt kê tất thích hợp để cung cấp cho tất người sử dụng Một khối ảo cần bỏ qua đơn vị đo khối chọn (khối ‘Sales’ ‘HR’) cửa sổ trái số thông tin nhạy cảm cung cấp Có thể tạo hai Role bảo mật: thứ Thực việc chọn đơn vị đo có sẵn để làm đơn vị đo cho khối ảo chứa người dùng phép xem thông tin nhạy cảm thứ hai Cửa sổ phải hiển thị đơn vị đo chọn chứa người dùng lại Ta dễ dàng cấp quyền cho Role thứ truy cập toàn khối Role thứ hai truy cập khối ảo Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 • Chọn chiều cho khối ảo: thực việc chọn chiều cho khối ảo tương tự việc chọn đơn vị đo Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 119 - - 120 - 5.4.7 Hiển thị liệu khối • Chọn ‘Browse Data’ để hiển thị liệu khối cần phân tích (ví dụ khối ‘Sales’), hình phân tích liệu khối xuất • Cửa sổ bên hiển thị liệu chiều đó, chiều Store (lúc ta nhìn thấy liệu khối Sales theo chiều Store) Tại đây, ta khoan sâu xuống (Drill_down) mức liệu chi tiết cuộn lên (Roll_up) mức liệu tổng hợp theo phân cấp chiều có liệu phân tích theo yêu cầu Cửa sổ bên hiển thị chiều lại khối • Để xoay khối ‘Sales’ sang chiều khác (nhìn liệu khối theo chiều khác) ta việc chọn tên chiều cửa sổ bên Hình 5.12 Chọn đơn vị đo cho khối ảo Hình 5.13 Chọn chiều cho khối ảo Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Hình 5.14 Hiển thị liệu khối Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 121 - - 122 - • Muốn cắt lát khối, ta cố định số chiều giá trị cụ thể Phần kết luận cách kích chuột vào nút lệnh cạnh tên chiều 5.4.8 Ví dụ minh họa Dựa vào liệu mẫu FoodMart 2000 Microsoft ta đưa ví dụ sau: Giám đốc doanh nghiệp muốn biết “Mặt hàng bán chạy vào quý năm 1998 từ kho thuộc thành phố Los Angeles Mỹ, tầng lớp khách hàng (nhóm tuổi) tiêu thụ mạnh nhất?” Đây câu hỏi có chiều: mặt hàng, thời gian, vùng, nhóm tuổi Không dễ có Sau thời gian nghiên cứu hoàn thành luận văn, tác giả nắm bắt khái niệm tổng quát lý thuyết OLAP, tiếp cận phân tích đa chiều Đề tài nêu rõ chi tiết để áp dụng sở lý luận vào phát triển mô hình cụ thể hệ trợ giúp định dựa vào liệu, tiến trình trợ giúp định, triển khai tổ chức hệ thống xây dựng thành phần yếu hệ trợ giúp định dựa vào liệu Luận văn thực tất nội dung đạt mục câu trả lời cho câu hỏi nhiều chiều cách sử dụng kỹ thuật truy vấn truyền thống mô hình liệu quan hệ SQL mà phải dựa kết phân tích nhiều chiều Hơn nữa, yêu cầu người sử dụng liên tục thay đổi, đòi hỏi câu trả lời phải xử lý theo thứ tự khác lúc theo vùng, theo thời gian, khác lại theo nhóm tuổi Để trả lời câu hỏi này, ta xây dựng khối ‘Test’ sau: tiêu đề đề cương duyệt Các kết đạt bao gồm: • Nắm bắt lý thuyết khai thác liệu xử lý phân tích trực tuyến • Nắm bắt lý thuyết tổ chức kho liệu • Bảng Fact: chọn bảng ‘sales_fact_1998’ • Nắm bắt cách tiếp cận phân tích liệu đa chiều • Đơn vị đo: ‘unit_sales’ • Tìm hiểu Hệ thống trợ giúp định dựa vào liệu sở • Chiều: o Sản_phẩm: chọn bảng ‘product’ Các mức: ‘product_name’ o Thời_gian: chọn bảng ‘time_by_day’ Các mức: ‘the_year’, ‘quarter’, ‘the_month’ o Vùng: chọn bảng ‘store’ Các mức: ‘store_country’, ‘store_state’, ‘store_city’ o Nhóm_tuổi: chọn bảng ‘customer’ Các mức: ‘country’, ‘state_province’, ‘city’, ‘birthdate’ Xoay khối ‘Test’ theo chiều Sản_phẩm, cố định giá trị Q4 chiều Thời_gian, giá trị Los Angeles chiều Vùng có câu trả lời Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 phương pháp luận xử lý phân tích trực tuyến • Xây dựng hệ trợ giúp định dựa vào liệu công cụ Analysis Services Tuy nhiên số vấn đề mà luận văn chưa đề cập đến Một số hướng phát triển khác mở rộng như: việc tổ chức quản lý kho liệu mạng thực liên kết khối đa chiều với kho liệu hay trực tiếp đến hệ xử lý tác vụ để tự động hoá việc cập nhật liệu cấu trúc chiều cho khối đa chiều; việc phối hợp khối đa chiều để khai thác tối đa khả khối đa chiều; nghiên cứu tăng cường khả hiển thị kết quả, giúp cho việc mô tả, thay đổi yêu cầu truy vấn thông tin thuận lợi hơn, linh hoạt Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 123 - - 124 - Tài liệu tham khảo Mặc dù cố gắng nghiên cứu thực đề tài, thời gian trình độ có hạn, chắn luận văn không tránh khỏi nhiều thiếu sót [1] Viện Công nghệ Thông tin (1997), Kho liệu - Data Warehouse, Hà Em xin bày tỏ lòng biết ơn sâu sắc tới GS.TS.Nguyễn Thúc Hải, người tận Nội tình giảng dạy hướng dẫn em hoàn thành luận văn Em xin [2] Surajit Chaudhuri (1997), An Overview of Data Warehouse and OLAP bầy tỏ lòng biết ơn tới thầy, cô anh, chị khoa Công nghệ Thông Technology, http://research.microsoft.com tin Trung tâm Đào tạo sau Đại học nhiệt tình giảng dạy giúp đỡ em [3] Ching T.H., suốt thời gian học tập vừa qua Xin chân thành cảm ơn bạn học Queries in OLAP Data Cubes, Proceeding ACM SIGMOD đồng nghiệp giúp đỡ trình học tập, nghiên cứu thử nghiệm [4] Alexandre Gachet (2003), Distributed Decision Support System: A đề tài Federalist Model of Cooperation, University of Fribourg Agrawal R., Megiddo N., Srikant R (1997), Range [5] William H.Inmon (2005), Building the Data Warehouse - Fourth Edition, Wiley Publishing Inc [6] Intelligent Science, Intelligent Decision Support System - IDSS, http://www.intsci.ac.cn/en/research/idss.html [7] Ralph Kimball (1996), Dealing with Dirty Data, DBMS Online Magazine Sep 1996 [8] Patrick O’Neil, Dallan Quass (1997), Improved Query Performance with Variant Indexes, Proceeding ACM SIGMOD [9] Chrisantha Silva (2004), Building Info-Structures for Decision Making, IT Business Systems [10] Erik Thomsen (2002), OLAP Solutions: Building Multidimensional Information Systems - Second Edition, Wiley Computer Publishing [11] E.Turban, J.E.Aronson (2001), Decision Support Systems and Intelligent Systems - 6th Edition, Prentice Hall Một số Website tham khảo: http://www.databasejournal.com/features/mssql/article.php/1429671 http://www.certtutor.net/Articles/Index.cfm?ArticleID=7150 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 - 125 - Tóm tắt luận văn Luận văn đề cập đến việc nghiên cứu xây dựng hệ trợ giúp định dựa vào liệu, sử dụng phương pháp luận xử lý phân tích trực tuyến (OLAP) Hệ trợ giúp định theo tiếp cận giúp nhà quản lý thiết lập mô hình OLAP cho ứng dụng cụ thể việc tổ chức sở liệu đa chiều dễ dàng điều chỉnh hoạt động phân tích, tìm kiếm thông tin theo khía cạnh khác liệu nhằm thu thập tối đa liệu cần thiết để từ đưa định tốt cách nhanh chóng Không giống với hệ trợ giúp định truyền thống thường xây dựng với mục đích đưa giải pháp tối ưu cho toán cụ thể, phạm vi ứng dụng hẹp, hệ trợ giúp định dựa vào liệu hướng đến việc giúp người sử dụng khai thác tối đa khả tiềm ẩn khối lượng liệu lớn, nhằm thu thông tin tổng hợp đủ khía cạnh khác liệu, để từ định cách nhanh chóng Do đặc điểm này, phạm vi ứng dụng hệ trợ giúp định dựa vào liệu rộng Nó sử dụng để trợ giúp định cho toán khác nhau, lĩnh vực khác Luận văn trình bày nội dung phương pháp tiếp cận phân tích đa chiều xử lý phân tích trực tuyến, xây dựng hệ trợ giúp định dựa vào liệu với hai thành phần kho liệu xử lý phân tích trực tuyến, tiến trình trợ giúp định dựa vào liệu, xây dựng cấu trúc thông tin để hỗ trợ việc định xây dựng hệ thống với chức tạo lập sở liệu đa chiều phân tích hiển thị liệu Các từ khoá (Key Word): xử lý phân tích trực tuyến (OLAP), kho liệu (Data Warehouse), hệ trợ giúp định (DSS), khối (Cube) đa chiều (Multidimensional) Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 [...]... tích, khai thác các dữ liệu này Nói một cách khác, để có thể trợ giúp quyết định dựa vào dữ liệu cần xây dựng hai thành phần quan trọng là kho dữ liệu và OLAP Để có khả năng cung cấp những dữ liệu quyết định cho những người ra quyết định, cần sử dụng một cách lưu trữ dữ liệu cho phép họ quản lý, khai thác dữ liệu một cách dễ dàng Cách lưu trữ dữ liệu kiểu này là kho dữ liệu Một kho dữ liệu là một CSDL... một Hệ trợ giúp quyết định - 70 - • Hệ trợ giúp quyết định: bao gồm những hệ thống được thiết kế để trợ Các loại Hệ trợ giúp quyết định truyền thống như sử dụng bảng tính, tối giúp các nhà quản lý ra quyết định Khác với Hệ xử lý tác vụ phục vụ ưu toán học, phân tích số hay mô hình mô phỏng sẽ vẫn tiếp tục phát huy cho các hoạt động hàng ngày, một Hệ trợ giúp quyết định phục vụ cho được tác dụng trong. .. liệu có quan hệ với nhau đều cần được phân tích lư ng dữ liệu lớn được tổ chức một cách phức tạp Tiếp cận tốt nhất để cung Trong xử lý phân tích thì trọng tâm là phân tích dữ liệu, đặc biệt là phân tích cấp xử lý hướng đến quyết định dựa trên phân tích và phù hợp với những yêu đa chiều Trong phân tích đa chiều, dữ liệu được miêu tả thành các chiều Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông... trợ giúp quyết định có thể được chia thành hai hướng cơ bản Hướng đầu tiên dựa vào mô hình theo xu hướng của các Hệ trợ giúp quyết định cũ Giá trị của hệ thống này là ở chất lư ng của mô hình của nó Khả năng phân tích của nó được dựa trên một lý thuyết hay trên một mô hình mạnh cùng với một giao diện tốt để làm cho mô hình dễ sử dụng Loại Hệ trợ giúp quyết định thứ hai là loại Hệ trợ giúp quyết định dựa. .. Datamart phụ thuộc, nó được xây Dữ liệu chi tiết là thông tin mức thấp nhất được lưu trữ trong kho dữ dựng trước kho dữ liệu và dữ liệu được lấy từ các nguồn dữ liệu tác nghiệp liệu Dữ liệu tác nghiệp là thông tin mức thấp nhất cho một tổ chức Dữ liệu Phương pháp này đơn giản hơn và chi phí thấp hơn nhưng đổi lại có những tác nghiệp thuần tuý không được lưu trữ trong kho dữ liệu Dữ liệu tổng hợp điểm yếu... lý dữ liệu và thông tin theo các thủ tục có cấu trúc nhằm hỗ trợ điều khiển, dự báo và giám - 68 - Hệ trợ giúp quyết định là những hệ ứng dụng xây dựng trên máy tính nhằm giải quyết các bài toán, các vấn đề có cấu trúc kém Vai trò chính của Hệ trợ giúp quyết định là nhằm mục đích giúp các nhà ra quyết định giải quyết những vấn đề trong những hoàn cảnh chưa được định nghĩa rõ ràng, các nhà ra quyết định. .. phương pháp kho dữ liệu Những dự án dùng phương pháp kho dữ liệu buộc phải lựa chọn giữa một mô hình dữ liệu và một giản đồ dữ liệu liên quan trực quan cho việc phân tích nhưng nghèo nàn về thể hiện Một giản đồ - mô hình là cách thực hiện tốt hơn nhưng không phù hợp lắm cho việc phân tích Khi phương pháp kho dữ liệu được tiếp tục phát triển thì những cách tiếp cận mới cho việc thiết kế giản đồ dữ liệu. .. nhiều tổ chức quan tâm nghiên cứu đầu tư xây dựng và phát triển 4.1.2 Hệ trợ giúp quyết định Hệ trợ giúp quyết định ban đầu rất thô sơ, được phát triển từ các phần sát công việc Đầu thập kỷ 70 của thế kỷ trước một loại hình ứng dụng mới ra mềm bảng tính Các Hệ trợ giúp quyết định sau đó sử dụng các mô hình tối đời, đó là Hệ trợ giúp quyết định (DSS) nhằm mục đích hỗ trợ các nhà quản ưu của việc nghiên cứu... chuyển đổi, lưu (OLAP) Trong khi ngôn ngữ truy vấn chuẩn SQL và các công cụ làm chuyển, bảo toàn tính toàn vẹn, tích hợp, làm sạch dữ liệu, đưa dữ liệu từ báo cáo truyền thống chỉ có thể miêu tả những gì có trong CSDL thì nhiều nguồn dữ liệu tác nghiệp vào hệ thống quản lý cơ sở dữ liệu để phục vụ phân tích trực tuyến có khả năng phân tích dữ liệu, xác định xem giả các quá trình ra quyết định Kiến trúc... dữ liệu phục vụ cho việc phân tích với kết quả mang tính thông tin cao Các hệ thống thông tin thu thập, xử lý dữ liệu loại này còn gọi là Hệ xử lý phân tích trực tuyến (OLAP) Một kho lưu trữ dữ liệu thường được sử dụng như cơ sở cho một hệ thống hỗ trợ quyết định Nó được thiết kế để khắc phục những vấn đề vấp phải khi một tổ chức cố gắng thực hiện chiến lư c phân tích có sử dụng cùng Luận văn tốt nghiệp

Ngày đăng: 24/09/2016, 08:54

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w