Lý phan lu ll true ttiycn O l.AỈ'

Một phần của tài liệu Khai thác dữ liệu và xử lý phân tích trực tuyến (Trang 70)

CH Ư Ơ N G 4 : THIẾT k ẻ' h ệ t r ợ giúp QUYẾT đ ịn h

DỤfl V è o Dứ L IỆ a

4 . 1 GIỚI THIỆU HỆ T H Ố N G

4 . 1 .1 M ục tiê u củ a h ệ th ố n g

Hệ thống được xáy dựng với mong muốn cung cấp một công cụ để xử lý một mô hình OL-AP của một ứng dụng cụ thể: cho phép tổ chức nên CSDL đa chiều, và trên CSDL dã được thiết lập này, cung cấp khả nâng phân tích dữ liệu một cách dễ dàng, linh hoạt và nhanh chóng, nhằm trợ giúp cho việc ra quyết định.

Để thực hiện được những chức năng này, trong luận văn đã sử dụng mô hình đối tượng: DSO (Decision Support Objects) của Microsoft SQL Server 2000 và ADOMD (Microsoft ActiveX Data Objects (Multidimensional)) Irong VB (Visual Basic).

Với DSO, chúng ta có thể sử dụng để tạo ra những ứng dụng quản lý: databases, data sources, dimensions, cubes, mining models, và roles. Chúng ta cũng có thể cũng quản trị an ninh, xử lý cubes và khai thác m ẫ u , ...

4 . 1 . 2 T ổ ch ứ c củ a h ệ th ố n g

Một hê trợ giúp quyết định dựa vào dữ liêu, sử dụng hai thành tố chính là Data W arehouse và O L A P sẽ có dđu vào là các dữ liệu thu được từ các hoạt động tác nghiệp (của các hệ thống tác nghiệp) và đầu ra là các báo cáo thông tin phân tích dồi dào và phong phú được hiển thị một cách trực quan và linh hoạt. Ớ dây hoạt động phân tích có thể được tiến hành một cách dễ dàng, thuận tiện và nhanh chóng. Sau cùng, dựa trên những kết quả của các phân tích này, các nhà quản lý sẽ có dủ các thông tin cần thiết để có thổ ra được những quyết dịnh hợp lý nhất. Dưới đây là sơ đổ thể hiện kiến trúc của hệ thống trợ giúp quyết định dựa vào dữ liệu:

Hình 4-1. K iến trúc hê ihôiig “Trợ giúp quyết định dựa vào dữ liệu”

Hệ thống được cài đặt ở đây tập chung vào những phần chính yếu là các khối chức năng quan trọng sau:

(1) Xây dựng chức năng tạo lập CSDL đa chiều (Cubes).

(2) Xây dựng chức năng phân tích, hiển thị dữ liệu lên màn hình. Dưới đây là sơ đổ chi tiết của hệ thống sẽ được cài dật:

Hì nh 4. 2 Sơ dổ chi liết hộ ilìốiìg sẽ cài đặc

4 . 2 Cài đặt h ệ th ố n g

4 . 2 .1 C hức n ă n g tạ o lập C SD L đa ch iều

Là công cụ giúp tạo lập nên các khối và cấu trúc các chiều, từ mô hình OLAP của ứng dụng cụ thể. Dữ liệu nguồn được chứa trong bảng Fact.

T a o k hối

1. Chọn bảng Fact cho khối cần tạo.

2. Tạo các đơn vị đo (measures): chọn các cột (có kiểu dữ liệu là kiểu số) trong bảng Fact để làm các đơn vị đo, đổng thời gán công thức tính toán cho từng đơn vị đo (sum, average, max, min, ...)•

3. Tạo lập các chiều dữ liệu: mỗi chiều tương ứng với một bảng (bảng chiều) trong sơ đồ hình sao mà bảng Fact ở trên là bảng trung tâm. Trong mỗi bảng chiểu

chọn các cột làm các mức (level) của chiều đó. Chúng ta cần chọn các mức sao cho có thể đáp ứng được việc tham chiếu “ roll up” , “drill clown” theo mức.

4. Xử lý khối.

T a o k h ối ả o

Chức năng này giúp ta tạo ra một khối mới từ các khối dã có bằng cách sử dụng lại các đơn vị đo và các chiều của các khối cũ mà không cẩn tốn thêm không gian nhớ.

1. Chọn các khôi mà ta cẩn tạo khối ảo từ nó. 2. Chọn các đơn vị do cho khối ảo.

3. Chọn các chiểu cho khối ảo. 4. Xử lý khối.

4 . 2 . 2 C hứ c n ă n g phân tích và h iển thi dữ liệu

Sau khi khối đã được tạo, dữ liệu trong khối sẽ được phân tích qua thao tác xử lý khối. Và sau đó người sử dụng có thể tham khảo được kết quả phân lích một cách dẻ dàng bằng cách thực hiện các thao tác “roll up”, “drill down” theo mức trên mỗi chiểu của khối đã chọn. Với chức năng này ta có thể: cắ t lát các khối đa chiều (heo các mức, các chiểu tùy chọn; Khoan sâu xuống các mức dữ liệu chi tiết khi cần: Cuộn lên các mức dữ liệu tổng hợp hơn (theo phân cấp chiểu) nếu muốn. Tạo ra sự linh hoạt và tiện ích cho người sử dụng: dễ dàng mô tả, thay dổi yêu cầu phân tích dữ liệu.

4 . 2 . 3 C hứ c n ả n g tạ o và th ự c h iện c á c Q uery

Microsoft SQL Server OLAP cung cấp trình ứng dụng mẫu này, đó là MDX Sample Application để cho phép chúng ta thử nhiệm các query (MDX) biểu diễn đa chiều dựa vào một Server OLAP. Với MDX chúng la có thể tạo, thực thi các query và xem kết quả một cách uyển chuyển.

4 . 3 C h ư ơ n g trình cài đặt

Hệ thống được cài đặt thành chương trình có tên TGQD, được viết bằng công cụ lập trình VB (Visual Basic). Dưới đây là các giao diện của chương trình:

M àn h ìn h chính:

1 *. D ata-D riven D ecision S u p p o rt S y ste m s 1 Cubes Cube Editor MDXSample

1 1. New Database * r / *

2. DataSource3. New Cube 3. New Cube

New Virtual Cube * *

Browse Data LTrợ Gỉúp Quyết Định

Exit Dưa Vào Dữ I L Ỉ ê u > ♦ u tt - ♦ * f 1 , V , < ( r • .5 v ' l ì V . . % > . / r ' iu ’ ( • V K ‘ » ’ i ■ . >w -m I " v P / * • « C ác m en u chính:

Cubes 1 C u b e Editor M D XSam ple

1. N e w D a t a b a s e 1. E d it...

2 , D a ta S o u r c e 2, Process

3. New CubeNew Virtual Cube New Virtual Cube Browse Data

Exit

M enu “C u b e s ”

- Lệnh N ew Database: Tạo một Database để lưu, chứa các khối. - Lệnh DataSource: Tạo nguồn dữ liệu cho các khối trong Database. - Lệnh N ew Cube (tạo khối):

+ Chọn bảng Fact cho khối

Một phần của tài liệu Khai thác dữ liệu và xử lý phân tích trực tuyến (Trang 70)

Tải bản đầy đủ (PDF)

(86 trang)