9. Kết cấu luận văn:
1.3.5. Cỏc phộp toỏn OLAP trong mụ hỡnh dữ liệu nhiều chiều
Trong mụ hỡnh nhiều chiều, dữ liệu được tổ chức thành cỏc chiều, mỗi chiều chứa cỏc mức trừu tượng do phõn cấp khỏi niệm xỏc định. Tổ chức này đảm bảo mềm dẻo cho người dựng khi nhỡn dữ liệu theo cỏc hướng khỏc nhau. Một số phộp toỏn về khối dữ liệu OLAP cú khả năng hiển thị, cú cõu hỏi tương tỏc và phõn tớch dữ liệu. Tức là OLAP cú mụi trường người dựng để phõn tớch dữ liệu tương tỏc.
Cỏc phộp toỏn OLAP bao gồm:
- Cuốn : phộp cuốn, hay phộp khoan, thực hiện việc gộp trờn dữ liệu khối, hoặc leo lờn phõn cấp khỏi niệm đối với một chiều, hoặc giảm số chiều.
Khi cuốn do giảm số chiều, một hay nhiều chiều bị loại khổi khối dữ liệu. Cuốn cú thể xúa chiều thời gian, cho kết quả là tổng sản phẩm theo địa điểm, chứ khụng cũn theo địa điểm và thời gian nữa.
- Đào sõu : phộp đào sõu là một dạng cuốn. Nú quột từ dữ liệu ớt chi tiết đến dữ liệu chi tiết nhiều. Đào sõu cú thể thực hiện từng bước xuống phõn cấp khỏi niệm đối với một chiều dữ liệu, hoặc đưa ra cỏc chiều bổ sung. Chẳng hạn đi theo chiều thời gian để xột theo quớ, rồi theo thỏng…
Do việc đào sõu thờm chi tiết đối với dữ liệu đó cú, nú cho phộp bổ sung chiều mới, chẳng hạn chiều “nhúm cỏc khỏch hàng”.
- Cắt lỏt và kẻ ụ : phộp cắt lỏt chọn trờn một chiều của khối dữ liệu, tạo nờn một khối con. Chẳng hạn chọn thời gian = quớ 1. Phộp kẻ ụ xỏc định khối con bằng cỏch chọn hai hay vài chiều. Chẳng hạn chọn (địa điểm = Hà Đụng OR địa điểm = Hà Nội) AND thời gian = quớ 1.
- Xoay: phộp xoay hiển thị khối con xoay quanh trục dữ liệu để cú thể hiện khỏc của dữ liệu.
- Cỏc phộp OLAP khỏc : vài hệ thống OLAP cung cấp cỏc phộp đào sõu, chẳng hạn đào chộo, đào qua (i) đào chộo đặt cõu hỏi trờn nhiều bảng sự kiện; (ii) đào qua sử dụng tiện nghi ngụn ngữ SQL để đào qua mức thấp của khối dữ
liệu đến bảng quan hệ đầu người dựng.
Cỏc phộp OLAP khỏc cú thể sắp xếp hạng cỏc mục theo danh sỏch, cũng như thực hiện tớnh toỏn phụ.
Cuốn theo địa điểm (từ các tỉnh cuốn về các Miền) Quí 1 Quí 2 Hà Nội Hà Đông Giải trí Máy tính 10 20 15 25 50 60 65 Quí 1 Quí 2 Miền Bắc Giải trí Máy tính 25 45 105 125 Hà Nội Hà Đông Giải trí Máy tính 3 3 4 7 7 7 5 8 16 16 16 20 20 20 8 8 Tháng 1 Tháng 2 Tháng 3 Tháng 4 Tháng 5 Tháng 6 22 22 22 Đào sâu theo thời gian
(từ quí sang tháng) Quí 1 Quí 2 Hà Nội Giải trí Máy tính 10 20 50 60
Kẻ ô, với địa điểm = Hà Nội
Quí 1 Quí 2 Giải trí Máy tính 10 20 50 60 Lát cắt
hạn chế địa điểm = Hà Nội
Xoay Quí 1 Quí 2 Giải trí 20 60 10 50 Máy tính Hỡnh 1.3.1 Cỏc phộp toỏn OLAP
So sỏnh cỏc hệ thống OLAP với cỏc cơ sở dữ liệu thống kờ, người ta thấy : nhiều tớnh chất của hệ thống OLAP, như sử dụng mụ hỡnh dữ liệu nhiều chiều, kết hợp của độ đo với chiều, cỏc phộp toỏn cuốn, đào sõu cũng đó cú trong cơ sở dữ liệu thống kờ. Cơ sở dữ liệu thống kờ là hệ thống cơ sở dữ liệu được thiết kế để trợ giỳp cỏc ứng dụng thống kờ. Khỏc nhau giữa hai hệ thống nhiều khi là kớ phỏp, thuật ngữ.
OLAP và cơ sở dữ liệu thống kờ cũng khỏc nhau. Cơ sở dữ liệu thống kờ hướng ứng dụng kinh tế xó hội, OLAP cú đớch là ứng dụng nghiệp vụ. Khớa cạnh riờng liờn quan đến phõn cấp khỏi niệm liờn quan đến cơ sở dữ liệu thống kờ. Khụng như cơ sở dữ liệu thống kờ, OLAP được thiết kế để xử lớ khối lượng lớn cỏc dữ liệu một cỏch hiệu quả.
Hỏi trong mụ hỡnh dữ liệu nhiều chiều cú thể theo mụ hỡnh mạng sao. Mụ hỡnh mạng sao bao gồm cỏc tia ra từ điểm trung tõm; mỗi đường thể hiện một phõn cấp khỏi niệm đối với một chiều. Mỗi mức trừu tượng trong phõn cấp được gọi là dấu chõn. Cỏi này thể hiện tớnh hạt cú thể để dựng cỏc phộp toỏn OLAP như cuốn lờn, đào sõu.
Việc sử dụng phõn cấp khỏi niệm cho phộp (i) tổng quỏt húa dữ liệu bằng cỏch thay cỏc giỏ trị mức thấp, như ngày, bằng giỏ trị mức cao, như thỏng năm; (ii) đặc biệt húa bằng cỏch thay giỏ trị mức cao bằng mức thấp.