Cụng nghệ xử lý phõn tớch trực tuyến

Một phần của tài liệu Công nghệ xử lý phân tích trực tuyến trong việc trợ giúp quyết định (Trang 50 - 55)

Xử lý phõn tớch trực tuyến là trung tõm của việc sử dụng kho dữ liệu cho mục đớch trợ giỳp quyết định. í tƣởng mụ phỏng cỏc chiều trong dữ liệu cú thể đƣợc mở rộng: một bảng với n thuộc tớnh cú thể đƣợc xem nhƣ một khụng gian n chiều. Ngƣời quản lý thƣờng đặt những cõu hỏi mà cú thể phõn tớch trong những phõn tớch đa chiều. Cỏc thụng tin này khụng phải dễ phõn tớch khi bảng đƣợc biểu diễn hai chiều và CSDL quan hệ chuẩn khụng thể đỏp ứng tốt cụng việc này. Trong trƣờng hợp nhƣ vậy, sử dụng OLAP tỏ ra thớch hợp.

Cũng cú một sự khỏc nhau giữa cỏc cụng cụ OLAP và khai thỏc dữ liệu khỏc là cụng cụ OLAP khụng thể học, khụng tạo ra tri thức mới, và khụng tỡm kiếm đƣợc

giải phỏp mới. Nhƣ vậy cú sự khỏc nhau cơ bản giữa tri thức đa chiều và kiểu tri thức mà một ngƣời cú thể lấy ra đƣợc từ một CSDL thụng qua khai thỏc dữ liệu.

1.1 Định nghĩa OLAP

Định nghĩa: OLAP là một chức năng thụng minh xử lý nghiệp vụ mà cú thể làm

cho cỏc thụng tin trong tổ chức kinh doanh cú thể hiểu được [15].

Cú hai khỏi niệm hỗ trợ cho việc định nghĩa OLAP là sự hiểu biết nghiệp vụ (Business Intelligence-BI) và hệ thống hỗ trợ quyết định.

- BI là cỏc hoạt động liờn quan đến việc đạt đƣợc một tầm hiểu biết trong việc thực hiện nghiệp vụ và cỏc cơ hội, sự đe doạ nhận đƣợc qua phõn tớch chuỗi sự kiện (kịch bản). Ngƣời sử dụng nghiệp vụ cú thể hiểu đƣợc bản chất bờn trong, quyết định thụng qua một kịch bản OLAP.

- Hệ thống hỗ trợ quyết định là bất kỳ hệ thống nào mà hỗ trợ mụi trƣờng truy vấn và xử lý OLAP. Nú cú thể là một nhúm cỏc cỏc cụng cụ phần mềm và phần cứng hoặc cú thể chỉ là một sản phẩm nào đú. DSS là cỏc ứng dụng OLAP hƣớng tới phục vụ việc lập kế hoạch, làm chiến lƣợc.

OLAP là một cụng nghệ phõn tớch dữ liệu thực hiện những cụng việc sau:

- Đƣa ra mụt khung nhỡn logic, nhiều chiều của dữ liệu trong kho dữ liệu. Khung nhỡn này hoàn toàn khụng phụ thuộc vào việc dữ liệu đƣợc lƣu trữ nhƣ thế nào (cú thể lƣu trữ trong một kho dữ liệu nhiều chiều hay một kho dữ liệu quan hệ)

- Thƣờng liờn quan tới những truy vấn phõn tớch tƣơng tỏc dữ liệu. Sự tƣơng tỏc thƣờng là phức tạp, liờn quan tới việc khoan sõu xuống những mức dữ liệu chi tiết hơn hoặc cuốn lờn mức dữ liệu cao hơn ở mức tổng hợp hoặc kết hợp. - Cung cấp khả năng thiết lập mụ hỡnh phõn tớch bao gồm một mụ tơ tớnh toỏn

cho việc tớnh tỉ lệ, những biến đổi v.v... liờn quan tới những đại lƣợng số hoặc dữ liệu là con số qua nhiều chiều.

- Tạo ra sự tổng hợp và kết hợp, phõn cấp và dựng những mức tổng hợp, kết hợp đú cho mỗi phộp giao của cỏc bảng theo chiều.

- Hỗ trợ những mụ hỡnh chức năng cho việc dự bỏo, phõn tớch cỏc xu hƣớng và phõn tớch thống kờ.

- Lấy và hiển thị dữ liệu theo những bảng 2 chiều hay 3 chiều, theo biểu đồ hay đồ thị, dễ dàng xoay đổi cỏc trục cho nhau. Khả năng xoay là quan trọng bởi vỡ những ngƣời sử dụng cần phõn tớch dữ liệu từ những cỏch nhỡn khỏc nhau và sự phõn tớch theo mỗi cỏch nhỡn sẽ dẫn đến một cõu hỏi khỏc, cõu hỏi này sẽ đƣợc kiểm tra tớnh đỳng đắn dựa trờn một cỏch nhỡn khỏc về dữ liệu đú. - Đỏp ứng những cõu trả lời nhanh, vỡ vậy quỏ trỡnh phõn tớch khụng bị cắt

ngang và thụng tin khụng bị cũ.

1.2 Đặc điểm cơ bản của OLAP

Cú 12 đặc điểm cơ bản hay cỏc luật của Codd trong OLAP đú là [14][15]:

- Khung nhỡn khỏi niệm đa chiều: Nhỡn nhận của ngƣời sử dụng về tổ chức,

doanh nghiệp là đa chiều, do đú khung nhỡn dữ liệu của ngƣời sử dụng là đa chiều. Vỡ vậy, mụ hỡnh OLAP phải là đa chiều về bản chất. Những ngƣời sử dụng cú thể tuỳ biến dễ dàng trờn những mụ hỡnh dữ liệu đa chiều nhƣ vậy thụng qua cỏc tớnh năng của OLAP: khoan sõu, cuộn lờn, lỏt cắt, chia thành khối nhỏ.

- Tớnh trong suốt: Kiến trỳc hệ thống mở. Cỏc cụng cụ phõn tớch cần phải

trong suốt với ngƣời sử dụng, cho phộp cỏc cụng cụ phõn tớch cú thể đƣợc nhỳng vào bất kỳ nơi nào mà ngƣời sử dụng yờu cầu mà khụng cú một sự tỏc động ngƣợc lại nào với cỏc chức năng của cụng cụ trờn mỏy chủ.

- Khả năng truy nhập được: Cụng cụ OLAP phải ỏnh xạ đƣợc lƣợc đồ logic

của chớnh nú tới kho dữ liệu vật lý hỗn tạp, truy nhập tới dữ liệu và thực hiện mọi chuyển đổi cần thiết để đƣa ra một khung nhỡn đơn giản, mạch lạc và đồng nhất cho ngƣời sử dụng. Dữ liệu vật lý của hệ thống thuộc kiểu này trở nờn trong suốt với ngƣời sử dụng và chỉ là mối quan tõm của cụng cụ.

- Hiệu suất tạo bỏo cỏo đồng nhất: Khi kớch thƣớc của mụ hỡnh/dữ liệu tăng

lờn thỡ hiệu suất tạo bỏo cỏo giảm đi

- Kiến trỳc khỏch - chủ: Dữ liệu đƣợc lƣu trữ trờn cỏc hệ thống mỏy chủ lớn.

Vỡ vậy kiến trỳc khỏch - chủ là cần thiết. Thành phần mỏy chủ của cỏc cụng cụ OLAP cần phải đủ thụng minh đến mức mà nhiều trạm cú thể truy nhập thực hiện một cỏch dễ dàng và cú thể lập trỡnh tớch hợp. Mỏy chủ thụng minh phải cú đủ khả năng để ỏnh xạ và xõy dựng dữ liệu từ những CSDL vật lý và

logic khỏc hẳn nhau. Điều đú rất cần thiết để đảm bảo tớnh trong suốt và xõy dựng một lƣợc đồ mức khỏi niệm, logic, vật lý chung.

- Cấu trỳc chiều chung: Tớnh năng chiều khụng bị khuynh hƣớng ảnh hƣởng (adsbygoogle = window.adsbygoogle || []).push({});

của bất kỳ chiều nào. Mỗi chiều của dữ liệu phải cõn bằng giữa cấu trỳc và khả năng thực hiện của nú. Thƣờng chỉ tồn tại một cấu trỳc chung cho tất cả cỏc chiều. Mọi chức năng đƣợc ỏp dụng cho một chiều cũng cú thể ỏp dụng cho cỏc chiều khỏc.

- Làm chủ ma trận thưa và động: Cấu trỳc vật lý của mỏy chủ OLAP cần

phải biến đổi cho phự hợp với mụ hỡnh phõn tớch cụ thể đƣợc tạo ra và tải vào để việc quản lý cỏc ma trận thƣa là tối ƣu nhất. Khi làm việc với cỏc ma trận thƣa thỡ mỏy chủ OLAP cú khả năng suy luận ra và tỡm ra cỏch lƣu trữ dữ liệu hiệu quả nhất. Cỏc phƣơng phỏp truy nhập vật lý cũng đƣợc thay đổi thƣờng xuyờn và cung cấp những kiểu cơ chế khỏc nhau vớ dụ nhƣ tớnh toỏn trực tiếp, cõy nhị phõn, kỹ thuật băm hoặc sự kết hợp tốt nhất những kỹ thuật nhƣ vậy.

- Hỗ trợ nhiều người sử dụng: OLAP mang ý nghĩa của cỏc cụng cụ “chiến

lƣợc”, vỡ vậy phải hỗ trợ mụ hỡnh nhiều ngƣời sử dụng đồng thời, tớnh toàn vẹn và an toàn để hỗ trợ cho những ngƣời sử dụng làm việc đồng thời với cựng một mụ hỡnh phõn tớch hoặc tạo ra những mụ hỡnh khỏc nhau từ cựng một dữ liệu.

- Khụng hạn chế cỏc thao tỏc giữa cỏc chiều: Trong phõn tớch dữ liệu đa

chiều, tất cả cỏc chiều đƣợc tạo ra và cú vai trũ nhƣ nhau. Cỏc cụng cụ OLAP quản lý những tớnh toỏn liờn quan tới cỏc chiều và khụng yờu cầu ngƣời sử dụng phải định nghĩa những phộp toỏn đú. Việc tớnh toỏn đũi hỏi phải định nghĩa cỏc cụng thức tựy thuộc vào một ngụn ngữ, ngụn ngữ này phải cho phộp tớnh và thao tỏc với một số lƣợng chiều bất kỡ, mà khụng bị hạn chế bởi mối quan hệ giữa cỏc phần tử, khụng liờn quan tới số thuộc tớnh chung của dữ liệu của mỗi phần tử.

- Thao tỏc dữ liệu trực giỏc: Những thao tỏc nhƣ định hƣớng lại đƣờng dẫn

xõy dựng dữ liệu hoặc khoan sõu xuống theo cỏc chiều hoặc cỏc hàng đƣợc thực hiện bằng cỏch thao tỏc trực tiếp trờn những phần tử của mụ hỡnh phõn

tớch mà khụng đũi hỏi phải sử dụng những menu hay ngắt cho giao diện với ngƣời sử dụng.

- Tạo bỏo cỏo linh hoạt: Với việc sử dụng mỏy chủ OLAP và cỏc cụng cụ của

nú, một ngƣời sử dụng cuối cú thể thao tỏc, phõn tớch, đồng bộ hoỏ và xem xột dữ liệu theo bất kỳ cỏch nào mà ngƣời đú mong muốn, bao gồm cả việc tạo ra những nhúm logic hoặc bố trớ những hàng, cột, phần tử cạnh những phần tử khỏc mà ngƣời đú mong muốn. Những phƣơng tiện tạo bỏo cỏo cũng phải cung cấp tớnh linh hoạt và đƣa ra những thụng tin đó đƣợc đồng bộ theo bất kỳ cỏch nào mà ngƣời sử dụng muốn hiển thị chỳng.

- Hỗ trợ khụng hạn chế số chiều và cỏc mức liờn kết: Một mỏy chủ OLAP

cú thể chứa đƣợc ớt nhất là 15 chiều trong một mụ hỡnh phõn tớch thụng thƣờng nhất. Mỗi chiều trong đú cho phộp một số lƣợng khụng giới hạn cỏc mức tổng kết và kết hợp dữ liệu do ngƣời sử dụng định nghĩa và đƣa ra cỏch xõy dựng cỏc mức.

1.3 Kiến trỳc của OLAP

OLAP là thành phần để tập hợp, thu thập thống tin từ kho dữ liệu tức là tập trung vào truy nhập tới cỏc thụng tin trong kho dữ liệu để hỗ trợ hiểu biết về nghiệp vụ và hỗ trợ quyết định. Thành phần truy xuất và phõn tớch của ngƣời sử dụng cuối cú thể chia thành ba lớp xử lý về mặt logic nhƣ sau[15]:

- Lớp truy xuất dữ liệu: liờn quan đến cỏc quỏ trỡnh chức năng hoặc cỏc thành phần cho phộp ngƣời sử dụng cuối xem xột và tạo cỏc truy vấn, nhận cỏc dữ liệu cần thiết yờu cầu cho cỏc cụng việc của ngƣời sử dụng, thờm nữa là hỗ trợ cỏc cụng việc của ngƣời quản trị quản lý mụi trƣờng, an toàn hệ thống. - Lớp phõn tớch dữ liệu: bao gồm cỏc quỏ trỡnh chức năng để tớnh toỏn hoặc

chuyển đổi dữ liệu từ tổng hợp và cục bộ đến tớnh toỏn chộo và đào sõu và tới cỏc kỹ thuật phõn tớch hữu ớch hơn nữa nhƣ phõn tớch thống kờ, phõn tớch nhiều chiều.

- Lớp phõn phối thụng tin: bao gồm cỏc quỏ trỡnh chức năng mà hỗ trợ phõn phối thụng tin nhƣ: tạo bỏo cỏo và phõn tớch tƣơng tỏc.

Kho dữ liệu

Meta data

Dữ liệu chủ đề

Dữ liệu chủ đề

Kho dữ liệu Truy xuất và phân tích

Tầng biến đổi Cơng cụ xây dựng truy

vấn SQL Engine Các giao diện CSDL Các công cụ quản trị

Dữ liệu chủ đề

Truy xuất dữ liệu Phân tích dữ liệu Phân phối thơng tin

Sự tổng hợp Các bộ lọc/cảnh báo

Tính tốn chéo Khoan sâu (adsbygoogle = window.adsbygoogle || []).push({});

Thống kê OLAP đa chiều Phân tích theo kịch

bản

Tạo báo cáo h-ớng t-ơng tác (Reporting interaction navigation) EIS Truy vấn Phân tích t-ơng tác Hỡnh 13. Cỏc thành phần của OLAP

Một phần của tài liệu Công nghệ xử lý phân tích trực tuyến trong việc trợ giúp quyết định (Trang 50 - 55)