Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 125 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
125
Dung lượng
1,46 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - LUẬN VĂN THẠC SĨ KHOA HỌC PHƯƠNG PHÁP XỬ LÝ PHÂN TÍCH TRỰC TUYẾN ÁP DỤNG TRONG XÂY DỰNG HỆ TRỢ GIÚP QUYẾT ĐỊNH DỰA VÀO DỮ LIỆU CHUYÊN NGÀNH: XỬ LÝ THÔNG TIN VÀ TRUYỀN THÔNG TRẦN ĐÌNH CHIẾN NGƯỜI HƯỚNG DẪN KHOA HỌC: GS.TS NGUYỄN THÚC HẢI HÀ NỘI 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - - MỤC LỤC Danh mục hình vẽ Danh sách thuật ngữ từ viết tắt .6 Lời mở đầu .7 Chương I Khai thác liệu xử lý phân tích trực tuyến 10 1.1 Giới thiệu phương pháp khai thác liệu 10 1.2 Xử lý phân tích trực tuyến (OLAP) 11 1.3 Nguyên tắc OLAP 12 1.3.1 Khung nhìn đa chiều 12 1.3.2 Tính suốt (Transparency) 12 1.3.3 Khả truy nhập 13 1.3.4 Thực việc tạo báo cáo đồng 13 1.3.5 Kiến trúc khách/chủ (Client/Server) 13 1.3.6 Cấu trúc chung cho chiều (Generic Dimensionality) .13 1.3.7 Làm việc với ma trận .14 1.3.8 Hỗ trợ nhiều người sử dụng .14 1.3.9 Phép toán chiều không hạn chế 14 1.3.10 Thao tác tập trung vào liệu 14 1.3.11 Tạo báo cáo linh hoạt .15 1.3.12 Không hạn chế số chiều mức kết hợp liệu 15 Chương II Kho liệu (Data Warehouse) 16 2.1 Các thành phần kho liệu 16 2.1.1 Siêu liệu (Metadata) 17 2.1.2 Các nguồn liệu .17 2.1.3 Hệ thống xử lý giao dịch trực tuyến (OLTP) 18 2.1.3.1 Những đặc điểm hệ thống OLTP 19 2.1.3.2 Các công cụ thu thập, làm chuyển đổi liệu nguồn 20 2.1.4 Cơ sở liệu kho liệu 22 2.1.5 Kho liệu 23 2.1.5.1 Định nghĩa 23 2.1.5.2 Đặc điểm liệu kho liệu 24 2.1.6 Kho liệu chủ đề (Datamart) 25 2.2 Sử dụng kho liệu .26 2.3 Phương pháp xây dựng kho liệu 28 2.4 Thiết kế CSDL cho kho liệu .29 2.4.1 Giản đồ hình (Star) 29 2.4.2 Giản đồ hình tuyết rơi (Snowflake) 32 2.4.3 Giản đồ kết hợp 33 2.4.4 Những vấn đề liên quan tới thiết kế giản đồ hình .34 2.4.4.1 Đánh số 34 2.4.4.2 Chỉ thị mức 35 2.4.5 Những nhân tố thiết kế cần phải cân nhắc .35 2.5 Quản trị kho liệu .37 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - - Chương III Tiếp cận phân tích đa chiều xử lý phân tích trực tuyến 39 3.1 Tiếp cận đa chiều 39 3.2 Phân tích đa chiều 40 3.3 Kiến trúc khối OLAP (OLAP Cube Architecture) 42 3.3.1 Giới thiệu kiến trúc khối 42 3.3.2 Khối (Cube) .43 3.3.2.1 Xác định khối 44 3.3.2.2 Xử lý khối 45 3.3.2.3 Khối ảo (Virtual Cube) 46 3.3.3 Chiều (Dimension) .46 3.3.3.1 Xác định chiều 48 3.3.3.2 Chiều có phân cấp 48 3.3.3.3 Phân cấp chiều 49 3.3.3.4 Roll_up Drill_down dựa phân cấp chiều .50 3.3.3.5 Các chiều ảo (Virtual Dimensions) 50 3.3.4 Các đơn vị đo lường (Measures) .51 3.3.5 Các phân hoạch (Partitions) 51 3.3.6 Các phương pháp lưu trữ liệu (MOLAP, ROLAP, HOLAP) .53 3.3.6.1 MOLAP (Multidimensional OLAP) 53 3.3.6.2 ROLAP (Relational OLAP) .54 3.3.6.3 HOLAP (Hybrid OLAP) 55 3.4 Thuật toán số hoá khung nhìn xử lý phân tích trực tuyến kho liệu 55 3.4.1 Một số khái niệm 56 3.4.1.1 Các khối liệu (Subcubes) .56 3.4.1.2 Câu truy vấn (Queries) .56 3.4.1.3 Chỉ số (Indexes) 57 3.4.1.4 Quan hệ tính toán phụ thuộc 58 3.4.2 Thuật toán chọn View Index .61 3.4.2.1 Ước tính kích thước View 61 3.4.2.2 Ước tính kích thước số Index 61 3.4.2.3 Xác định toán .62 3.4.2.4 Giải toán 63 3.3.5 Kết luận 66 Chương IV Hệ trợ giúp định dựa vào liệu 67 4.1 Hệ trợ giúp định 67 4.1.1 Giới thiệu 67 4.1.2 Hệ trợ giúp định 68 4.1.3 Phân loại hệ trợ giúp định 69 4.2 Hệ trợ giúp định dựa vào liệu 71 4.2.1 Tiếp cận kho liệu OLAP 71 4.2.2 Trợ giúp định dựa vào liệu sở kho liệu OLAP .73 4.2.3 Tiến trình trợ giúp định dựa vào liệu cho toán cụ thể 75 4.3 Xây dựng cấu trúc thông tin hỗ trợ việc định 77 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - - 4.3.1 Vai trò cấu trúc thông tin 77 4.3.2 Các yếu tố ảnh hưởng .78 4.3.2.1 Các yêu cầu thông tin .78 4.3.2.2 Mức độ tích hợp .80 4.3.3 Mô hình tổ chức thông tin 81 4.3.3.1 Các yêu cầu thông tin lực hệ thống thông tin 81 4.3.3.2 Mức độ tích hợp hệ thống 83 4.3.4 Kết luận .84 4.4 Dịch vụ trợ giúp định Microsoft 85 4.4.1 Kho liệu Microsoft .85 4.4.1.1 Microsoft Data Warehousing Framework 86 4.4.1.2 Sự phức tạp liệu .87 4.4.1.3 Lợi ích việc kinh doanh 88 4.4.1.4 Mô hình liệu 88 4.4.1.5 Các hình thức lưu trữ 89 4.4.2 Kiến trúc dịch vụ trợ giúp định Microsoft 90 4.4.3 Các vấn đề việc triển khai Microsoft DSS .91 4.4.3.1 Xây dựng mô hình liệu OLAP cho Microsoft DSS 91 4.4.3.2 Lưu trữ mềm dẻo .93 4.4.3.3 Chuyển thông tin tới người sử dụng 97 4.4.3.4 Khả công cụ OLAP 100 4.5 Hướng nghiên cứu phát triển: Hệ trợ giúp định phân tán 102 Chương V Xây dựng hệ thống trợ giúp định dựa vào liệu công cụ Analysis Services 106 5.1 Mục tiêu hệ thống 106 5.2 Yêu cầu hệ thống 106 5.3 Chức hệ thống 107 5.3.1 Chức tạo lập CSDL đa chiều 109 5.3.2 Chức phân tích hiển thị liệu 109 5.4 Giới thiệu hệ thống .110 5.4.1 Khởi động Analysis Manager 110 5.4.2 Cài đặt sở liệu nguồn liệu (Database & Data Source) .110 5.4.3 Tạo khối 111 5.4.4 Lưu trữ xử lý khối .114 5.4.5 Khối ảo tăng cường khả xử lý bảo mật .117 5.4.6 Tạo khối ảo 118 5.4.7 Hiển thị liệu khối 120 5.4.8 Ví dụ minh họa 121 Phần kết luận .122 Tài liệu tham khảo 124 Tóm tắt luận văn 125 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - - Danh mục hình vẽ Hình 1.1 Kho liệu OLAP Hình 2.1 Mô hình kho liệu Hình 2.2 Giản đồ hình hình tuyết rơi Hình 3.1 Mô hình liệu đa chiều Hình 3.2 Mô hình liệu khối Hình 3.3 Giản đồ khối hình Hình 3.4 Giản đồ khối hình tuyết rơi Hình 3.5 Sơ đồ mô hình đa khối Hình 3.6 Phân cấp chiều Sản_phẩm Hình 3.7 Cây phân cấp đối xứng Hình 3.8 Roll_up Drill_down theo phân cấp chiều Hình 4.1 Phân loại Hệ thông tin quản lý Hình 4.2 Kho liệu hệ thống OLAP Hình 4.3 Tiến trình trợ giúp định dựa vào liệu cho toán cụ thể Hình 4.4 Ma trận Yêu cầu/Năng lực Hình 5.1 Kiến trúc hệ trợ giúp định dựa vào liệu Hình 5.2 Chức hệ trợ giúp định dựa vào liệu Hình 5.3 Tạo DataSource cho khối Database Hình 5.4 Chọn bảng Fact Hình 5.5 Chọn đơn vị đo Hình 5.6 Tạo chiều Hình 5.7 Chọn mức chiều Hình 5.8 Chọn kiểu lưu trữ Hình 5.9 Tăng tốc độ thực Hình 5.10 Xử lý khối Hình 5.11 Chọn khối cho khối ảo Hình 5.12 Chọn đơn vị đo cho khối ảo Hình 5.13 Chọn chiều cho khối ảo Hình 5.14 Hiển thị liệu khối Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - - Danh sách thuật ngữ từ viết tắt CSDL DBA DM DSS HOLAP DataBase Administrator DataMart Decision Support System Hybrid OLAP ETL Extract Transformation Load LS MIS MOLAP MSS OLAP OLTP Legacy System Management Information System Multidimensional OLAP Management Support System On-Line Analysis Processing On-Line Transaction Processing Relational DataBase Management Hệ quản trị CSDL quan hệ System Relational OLAP OLAP quan hệ Subject Area Vùng chủ đề RDBMS ROLAP SA Cơ sở liệu Quản trị sở liệu Kho liệu chủ đề Hệ trợ giúp định OLAP ghép Trích xuất, chuyển nạp liệu Hệ thống có sẵn Hệ thông tin quản lý OLAP đa chiều Hệ hỗ trợ quản lý Xử lý phân tích trực tuyến Xử lý giao dịch trực tuyến Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - - Lời mở đầu Các hoạt động sản xuất, kinh doanh cần có đáp ứng nhanh nhạy, tức thời thay đổi liên tục, nhà quản lý buộc phải thường xuyên lúc nhiều định đắn (mà chúng ảnh hưởng đáng kể đến xu hướng hoạt động cạnh tranh doanh nghiệp) cách nhanh chóng Do vấn đề trợ giúp định trở nên cần thiết Người ta cần phải thu thập, tổng hợp phân tích liệu từ nhiều nguồn khác cách nhanh hiệu định nhanh chóng phù hợp Điều dẫn đến việc cần phát triển hệ thống tinh thông biết cách làm để trích chọn phân tích liệu cho người sử dụng Hiện có nhiều phần mềm cung cấp cho người sử dụng khả truy vấn lập báo cáo thông tin, đặc biệt hệ quản trị CSDL quan hệ Tuy nhiên CSDL quan hệ với cấu trúc hai chiều (dòng cột) không thiết kế để cung cấp quan điểm đa chiều liệu đầu vào phân tích phức tạp Sử dụng hệ thống này, gặp nhiều khó khăn bất tiện việc tổ chức liệu đa chiều vào bảng hai chiều, triển khai liệu phân tích với số lượng lớn, công cụ phân tích để tạo liệu định không mạnh, thuận tiện, linh hoạt, nhanh chóng không dễ dàng để sử dụng nhà quản lý, người định Như vậy, việc xây dựng hệ thống có khả tổ chức liệu đa chiều có khả phân tích liệu linh hoạt để trả lời truy vấn đa chiều cách dễ dàng, nhanh chóng nhằm hỗ trợ cho việc định nhà quản lý cần thiết Mục đích đề tài: Luận văn đề cập đến việc nghiên cứu xây dựng hệ trợ giúp Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - - định dựa vào liệu, sử dụng phương pháp luận xử lý phân tích trực tuyến (OLAP) Đề tài tập trung vào hai công việc nghiên cứu vấn đề tổ chức sở liệu đa chiều, phân tích hiển thị liệu để trợ giúp định Hệ trợ giúp định theo cách tiếp cận giúp nhà quản lý thiết lập mô hình OLAP cho ứng dụng cụ thể việc tổ chức sở liệu đa chiều dễ dàng điều chỉnh hoạt động phân tích, tìm kiếm thông tin theo khía cạnh khác liệu nhằm thu thập tối đa liệu cần thiết để từ đưa định tốt cách nhanh chóng Không giống với hệ trợ giúp định truyền thống thường xây dựng với mục đích đưa giải pháp tối ưu cho toán cụ thể, phạm vi ứng dụng hẹp, hệ trợ giúp định dựa vào liệu hướng đến việc giúp người sử dụng khai thác tối đa khả tiềm ẩn khối lượng liệu lớn, nhằm thu thông tin tổng hợp đủ khía cạnh khác liệu, để từ định cách nhanh chóng Do đặc điểm này, phạm vi ứng dụng hệ trợ giúp định dựa vào liệu rộng Nó sử dụng để trợ giúp định cho toán khác nhau, lĩnh vực khác Bố cục luận văn: Toàn luận văn trình bày chương: • Chương 1: Giới thiệu phương pháp khai thác liệu, nội dung xử lý phân tích trực tuyến • Chương 2: Trình bày lý thuyết chung kho liệu mô hình kho liệu, phương pháp xây dựng thiết kế CSDL cho kho liệu • Chương 3: Trình bày phương pháp tiếp cận phân tích đa chiều xử lý phân tích trực tuyến Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - - • Chương 4: Giới thiệu Hệ trợ giúp định dựa vào liệu với hai thành phần kho liệu xử lý phân tích trực tuyến Tiến trình trợ giúp định dựa vào liệu Xây dựng cấu trúc thông tin để hỗ trợ việc định giới thiệu dịch vụ trợ giúp định Microsoft Hướng nghiên cứu phát triển • Chương 5: Xây dựng hệ thống với chức tạo lập sở liệu đa chiều phân tích hiển thị liệu Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 10 - Chương I Khai thác liệu xử lý phân tích trực tuyến 1.1 Giới thiệu phương pháp khai thác liệu Khai thác liệu trình phát mối quan hệ liên thuộc, mô hình khuynh hướng (Patterns & Trends) việc khảo sát số lượng lớn liệu lưu trữ kho (Repository) sử dụng công nghệ nhận dạng mẫu kỹ thuật thống kê toán học Khai thác liệu hiểu kỹ thuật khoan liệu theo chiều sâu tổng hợp liệu theo chiều ngược lại, trình đào xới xem xét liệu nhiều góc độ nhằm tìm mối liên hệ thành phần liệu phát xu hướng, hình mẫu, kinh nghiệm khứ tiềm ẩn kho liệu Vì phù hợp với mục đích phân tích liệu hỗ trợ điều hành định Phần lớn phương pháp khai thác liệu dựa lĩnh vực học máy, thống kê công cụ khác Một số kỹ thuật thường dùng mạng Nơ-ron (Neuron Network), giải thuật di truyền (Genetic Algorithms) xử lý phân tích trực tuyến (OLAP) Xử lý phân tích trực tuyến việc sử dụng kho liệu cho mục đích trợ giúp định Ý tưởng mô chiều liệu mở rộng: bảng với n thuộc tính xem không gian n chiều Người quản lý thường đặt câu hỏi mà phân tích phân tích đa chiều Các thông tin dễ phân tích bảng biểu diễn hai chiều CSDL quan hệ chuẩn đáp ứng tốt công việc Trong trường hợp vậy, sử dụng OLAP tỏ thích hợp Cũng có khác công cụ OLAP khai thác liệu công cụ OLAP học, chúng không tạo nên tri thức không tìm kiếm giải pháp Như có khác tri thức đa chiều kiểu tri thức mà người lấy từ CSDL Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 111 - cũ Chọn Microsoft Jet 4.0 OLE DB Provider OLE DB Drivers for ODBC thường cung cấp cách thứ cấp để kết nối, OLE DB Driver tối ưu cho việc lựa chọn 5.4.3 Tạo khối • Chọn lệnh ‘New Database’ để tạo Database để lưu, chứa khối đặt tên cho Database (ví dụ ‘chientd’) Chọn ‘DataSource’ để tạo nguồn liệu cho khối Database (ví dụ chọn liệu có sẵn Microsofft FoodMart 2000) Hình 5.3 Tạo DataSource cho khối Database • Chọn ‘New Cube’ để tạo khối • Chọn bảng Fact cho khối: Chọn bảng Fact Datasource cửa sổ bên trái, việc chọn bảng tuỳ thuộc vào yêu cầu truy vấn (ví dụ Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 112 - chọn bảng ‘sales_fact_1998’) • Cửa sổ bên phải hiển thị trường liệu bảng Fact chọn Để kiểm tra liệu bảng Fact, kích vào nút ‘Browse Data’ Để tạo tạo thêm nguồn liệu cho khối chọn nút ‘New Data Source’ Hình 5.4 Chọn bảng Fact • Tạo đơn vị đo: Chọn cột số bảng Fact (sales_fact_1998) cửa sổ trái để làm đơn vị đo, cửa sổ bên phải thị cột số chọn • Tạo chiều: Để định nghĩa chiều ta chọn bảng chiều danh sách bảng nguồn liệu cửa sổ trái (ví dụ chọn bảng customer) Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 113 - Hình 5.5 Chọn đơn vị đo Hình 5.6 Tạo chiều Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 114 - • Tạo mức cho chiều: Chọn cột bảng chiều cửa sổ bên trái làm mức chiều Lưu ý ta cần chọn mức cho đáp ứng việc tham chiếu “Roll_up”, “Drill_down” theo mức (ví dụ với bảng chiều ‘customer’ ta chọn ba cột ‘country’, ‘state_province’, ‘city’ làm ba mức chiều) Hình 5.7 Chọn mức chiều • Chọn ‘Edit’ để thêm, sửa hay xoá khối, đơn vị đo chiều khối 5.4.4 Lưu trữ xử lý khối Analysis Services thường đưa nhiều lựa chọn lưu trữ liệu tập liệu khối Các kiểu lưu trữ gồm: MOLAP, ROLAP HOLAP Khi kết thúc việc thiết kế cấu trúc khối, ta cần thiết kế mô hình lưu trữ theo kiểu cho Analysis Services biết cách sinh Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 115 - tập hợp tính toán trước tổng hợp để cải thiện việc thực truy vấn cải tiến lực khối Tiếp theo ta xử lý khối, nạp liệu từ nguồn liệu thiết kế để sinh tính toán tổng hợp mà ta định nghĩa dẫn tập hợp Hình 5.8 Chọn kiểu lưu trữ • Để thiết kế cách lưu trữ, sử dụng ‘Storage Design Wizard’, chọn ‘Type of Data Storage’, kiểu mặc định để lưu trữ liệu MOLAP Khi xuất ‘Set Aggregation Options’, yêu cầu Analysis Services tăng tốc độ xử lý mà không cần quan tâm dung lượng lưu trữ yêu cầu cách chọn ‘Performance Gain Reaches’ gõ tỉ lệ chọn (ví dụ 65%) Sự cân dung lượng lưu trữ sử dụng khả đáp ứng khối quản lý tính Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 116 - Hình 5.9 Tăng tốc độ thực Hình 5.10 Xử lý khối • Cửa sổ tiến trình xuất cho phép ta giám sát tiến trình khối qua giai đoạn toàn tiến trình Khi tiến trình kết thúc xuất Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 117 - thông báo “Processing completed successfully” 5.4.5 Khối ảo tăng cường khả xử lý bảo mật Có thể tạo khung nhìn từ việc kết hợp bảng cách Lôgic sở liệu quan hệ, khối ảo khối Lôgic tạo qua việc kết hợp khối Ta chọn chiều đơn vị đo khối ảo từ chiều đơn vị đo tồn Không cần thiết phải sử dụng tất chiều đơn vị đo chọn những chiều cung cấp cho ta khung nhìn tốt liệu mà ta cố đưa từ nguồn liệu khác Khối ảo xuất khối đơn lẻ từ yêu cầu thông tin người dùng Các khối ảo thường gồm chiều đơn vị đo lựa chọn từ khối Ta thường gặp tình yêu cầu kết hợp liệu từ nhiều nguồn liệu OLAP muốn hạn chế liệu đưa tới người dùng tập hợp chiều đơn vị đo khối đơn lẻ Trong tình khối ảo cung cấp lựa chọn tốt Sức mạnh khối ảo bao gồm tính mềm dẻo, tính khả chuyển dễ dàng việc tạo hay sửa khối Yêu cầu lưu trữ tối thiểu mềm dẻo, cho phép kết hợp đa dạng hoá việc tạo khối Sức mạnh khối ảo nằm khả bảo mật Thuộc tính tạo hữu dụng khối ảo phần phần thông tin khối nhạy cảm không thích hợp để cung cấp cho tất người sử dụng Một khối ảo cần bỏ qua số thông tin nhạy cảm cung cấp Có thể tạo hai Role bảo mật: thứ chứa người dùng phép xem thông tin nhạy cảm thứ hai chứa người dùng lại Ta dễ dàng cấp quyền cho Role thứ truy cập toàn khối Role thứ hai truy cập khối ảo Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 118 - 5.4.6 Tạo khối ảo • Chọn ‘New Virtual Cube’ để tạo khối ảo từ khối có • Chọn khối cho khối ảo: cửa sổ trái liệt kê tất khối có FoodMart 2000 Cửa sổ phải hiển thị khối chọn (ví dụ ta chọn hai khối ‘Sales’ ‘HR’) Hình 5.11 Chọn khối cho khối ảo • Chọn đơn vị đo cho khối ảo: hình liệt kê tất đơn vị đo khối chọn (khối ‘Sales’ ‘HR’) cửa sổ trái Thực việc chọn đơn vị đo có sẵn để làm đơn vị đo cho khối ảo Cửa sổ phải hiển thị đơn vị đo chọn • Chọn chiều cho khối ảo: thực việc chọn chiều cho khối ảo tương tự việc chọn đơn vị đo Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 119 - Hình 5.12 Chọn đơn vị đo cho khối ảo Hình 5.13 Chọn chiều cho khối ảo Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 120 - 5.4.7 Hiển thị liệu khối • Chọn ‘Browse Data’ để hiển thị liệu khối cần phân tích (ví dụ khối ‘Sales’), hình phân tích liệu khối xuất • Cửa sổ bên hiển thị liệu chiều đó, chiều Store (lúc ta nhìn thấy liệu khối Sales theo chiều Store) Tại đây, ta khoan sâu xuống (Drill_down) mức liệu chi tiết cuộn lên (Roll_up) mức liệu tổng hợp theo phân cấp chiều có liệu phân tích theo yêu cầu Cửa sổ bên hiển thị chiều lại khối • Để xoay khối ‘Sales’ sang chiều khác (nhìn liệu khối theo chiều khác) ta việc chọn tên chiều cửa sổ bên Hình 5.14 Hiển thị liệu khối Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 121 - • Muốn cắt lát khối, ta cố định số chiều giá trị cụ thể cách kích chuột vào nút lệnh cạnh tên chiều 5.4.8 Ví dụ minh họa Dựa vào liệu mẫu FoodMart 2000 Microsoft ta đưa ví dụ sau: Giám đốc doanh nghiệp muốn biết “Mặt hàng bán chạy vào quý năm 1998 từ kho thuộc thành phố Los Angeles Mỹ, tầng lớp khách hàng (nhóm tuổi) tiêu thụ mạnh nhất?” Đây câu hỏi có chiều: mặt hàng, thời gian, vùng, nhóm tuổi Không dễ có câu trả lời cho câu hỏi nhiều chiều cách sử dụng kỹ thuật truy vấn truyền thống mô hình liệu quan hệ SQL mà phải dựa kết phân tích nhiều chiều Hơn nữa, yêu cầu người sử dụng liên tục thay đổi, đòi hỏi câu trả lời phải xử lý theo thứ tự khác lúc theo vùng, theo thời gian, khác lại theo nhóm tuổi Để trả lời câu hỏi này, ta xây dựng khối ‘Test’ sau: • Bảng Fact: chọn bảng ‘sales_fact_1998’ • Đơn vị đo: ‘unit_sales’ • Chiều: o Sản_phẩm: chọn bảng ‘product’ Các mức: ‘product_name’ o Thời_gian: chọn bảng ‘time_by_day’ Các mức: ‘the_year’, ‘quarter’, ‘the_month’ o Vùng: chọn bảng ‘store’ Các mức: ‘store_country’, ‘store_state’, ‘store_city’ o Nhóm_tuổi: chọn bảng ‘customer’ Các mức: ‘country’, ‘state_province’, ‘city’, ‘birthdate’ Xoay khối ‘Test’ theo chiều Sản_phẩm, cố định giá trị Q4 chiều Thời_gian, giá trị Los Angeles chiều Vùng có câu trả lời Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 122 - Phần kết luận Sau thời gian nghiên cứu hoàn thành luận văn, tác giả nắm bắt khái niệm tổng quát lý thuyết OLAP, tiếp cận phân tích đa chiều Đề tài nêu rõ chi tiết để áp dụng sở lý luận vào phát triển mô hình cụ thể hệ trợ giúp định dựa vào liệu, tiến trình trợ giúp định, triển khai tổ chức hệ thống xây dựng thành phần yếu hệ trợ giúp định dựa vào liệu Luận văn thực tất nội dung đạt mục tiêu đề đề cương duyệt Các kết đạt bao gồm: • Nắm bắt lý thuyết khai thác liệu xử lý phân tích trực tuyến • Nắm bắt lý thuyết tổ chức kho liệu • Nắm bắt cách tiếp cận phân tích liệu đa chiều • Tìm hiểu Hệ thống trợ giúp định dựa vào liệu sở phương pháp luận xử lý phân tích trực tuyến • Xây dựng hệ trợ giúp định dựa vào liệu công cụ Analysis Services Tuy nhiên số vấn đề mà luận văn chưa đề cập đến Một số hướng phát triển khác mở rộng như: việc tổ chức quản lý kho liệu mạng thực liên kết khối đa chiều với kho liệu hay trực tiếp đến hệ xử lý tác vụ để tự động hoá việc cập nhật liệu cấu trúc chiều cho khối đa chiều; việc phối hợp khối đa chiều để khai thác tối đa khả khối đa chiều; nghiên cứu tăng cường khả hiển thị kết quả, giúp cho việc mô tả, thay đổi yêu cầu truy vấn thông tin thuận lợi hơn, linh hoạt Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 123 - Mặc dù cố gắng nghiên cứu thực đề tài, thời gian trình độ có hạn, chắn luận văn không tránh khỏi nhiều thiếu sót Em xin bày tỏ lòng biết ơn sâu sắc tới GS.TS.Nguyễn Thúc Hải, người tận tình giảng dạy hướng dẫn em hoàn thành luận văn Em xin bầy tỏ lòng biết ơn tới thầy, cô anh, chị khoa Công nghệ Thông tin Trung tâm Đào tạo sau Đại học nhiệt tình giảng dạy giúp đỡ em suốt thời gian học tập vừa qua Xin chân thành cảm ơn bạn học đồng nghiệp giúp đỡ trình học tập, nghiên cứu thử nghiệm đề tài Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 124 - Tài liệu tham khảo [1] Viện Công nghệ Thông tin (1997), Kho liệu - Data Warehouse, Hà Nội [2] Surajit Chaudhuri (1997), An Overview of Data Warehouse and OLAP Technology, http://research.microsoft.com [3] Ching T.H., Agrawal R., Megiddo N., Srikant R (1997), Range Queries in OLAP Data Cubes, Proceeding ACM SIGMOD [4] Alexandre Gachet (2003), Distributed Decision Support System: A Federalist Model of Cooperation, University of Fribourg [5] William H.Inmon (2005), Building the Data Warehouse - Fourth Edition, Wiley Publishing Inc [6] Intelligent Science, Intelligent Decision Support System - IDSS, http://www.intsci.ac.cn/en/research/idss.html [7] Ralph Kimball (1996), Dealing with Dirty Data, DBMS Online Magazine Sep 1996 [8] Patrick O’Neil, Dallan Quass (1997), Improved Query Performance with Variant Indexes, Proceeding ACM SIGMOD [9] Chrisantha Silva (2004), Building Info-Structures for Decision Making, IT Business Systems [10] Erik Thomsen (2002), OLAP Solutions: Building Multidimensional Information Systems - Second Edition, Wiley Computer Publishing [11] E.Turban, J.E.Aronson (2001), Decision Support Systems and Intelligent Systems - 6th Edition, Prentice Hall Một số Website tham khảo: http://www.databasejournal.com/features/mssql/article.php/1429671 http://www.certtutor.net/Articles/Index.cfm?ArticleID=7150 Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 - 125 - Tóm tắt luận văn Luận văn đề cập đến việc nghiên cứu xây dựng hệ trợ giúp định dựa vào liệu, sử dụng phương pháp luận xử lý phân tích trực tuyến (OLAP) Hệ trợ giúp định theo tiếp cận giúp nhà quản lý thiết lập mô hình OLAP cho ứng dụng cụ thể việc tổ chức sở liệu đa chiều dễ dàng điều chỉnh hoạt động phân tích, tìm kiếm thông tin theo khía cạnh khác liệu nhằm thu thập tối đa liệu cần thiết để từ đưa định tốt cách nhanh chóng Không giống với hệ trợ giúp định truyền thống thường xây dựng với mục đích đưa giải pháp tối ưu cho toán cụ thể, phạm vi ứng dụng hẹp, hệ trợ giúp định dựa vào liệu hướng đến việc giúp người sử dụng khai thác tối đa khả tiềm ẩn khối lượng liệu lớn, nhằm thu thông tin tổng hợp đủ khía cạnh khác liệu, để từ định cách nhanh chóng Do đặc điểm này, phạm vi ứng dụng hệ trợ giúp định dựa vào liệu rộng Nó sử dụng để trợ giúp định cho toán khác nhau, lĩnh vực khác Luận văn trình bày nội dung phương pháp tiếp cận phân tích đa chiều xử lý phân tích trực tuyến, xây dựng hệ trợ giúp định dựa vào liệu với hai thành phần kho liệu xử lý phân tích trực tuyến, tiến trình trợ giúp định dựa vào liệu, xây dựng cấu trúc thông tin để hỗ trợ việc định xây dựng hệ thống với chức tạo lập sở liệu đa chiều phân tích hiển thị liệu Các từ khoá (Key Word): xử lý phân tích trực tuyến (OLAP), kho liệu (Data Warehouse), hệ trợ giúp định (DSS), khối (Cube) đa chiều (Multidimensional) Luận văn tốt nghiệp cao học chuyên ngành Xử lý Thông tin Truyền thông khoá 2004 - 2006 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399