Cỏc dạng chuẩn của CSDL đa chiều

Một phần của tài liệu Công nghệ xử lý phân tích trực tuyến trong việc trợ giúp quyết định (Trang 42 - 50)

Từ khi cỏc CSDL đa chiều đƣợc sử dụng rộng rói cho việc thực hiện phõn tớch thống kờ, cõu hỏi đƣợc đƣa ra là cú cần cú cỏc dạng chuẩn đa chiều hay khụng?. Cõu trả lời là việc chuẩn hoỏ CSDL đa chiều là cần thiết cho việc đảm bảo việc tổng hợp trong cỏc lƣợc đồ ứng dụng (việc tổng hợp dữ liệu là cần thiết để đảm bảo tớnh đỳng đắn cho cỏc thao tỏc kết khối tiờu biểu trong OLAP nhƣ cỏc thao tỏc khoan sõu và cuộn lờn) đƣợc toàn vẹn và làm giảm bớt dữ liệu thƣa trong khối. Phần này luận văn sẽ đƣa ra hai dạng chuẩn hoỏ cần thiết cho thiết kế lƣợc đồ trong CSDL đa chiều [1,16].

2.1 Xõy dựng lại theo logic của thiết kế lƣợc đồ đa chiều

Theo cỏch nhỡn logic, đa chiều đƣợc xem nhƣ là phần bờn trong lý thuyết phõn lớp và khuụn mẫu của mụ tả đặc biệt. Lý thuyết phõn lớp đƣa ra là cần thiết để thể hiện sự khỏc biệt giữ cỏc đối tƣợng hỡnh thành lờn cỏc tập con của tập tõn từ.

2.1.1 Phõn lớp

Một chiều đƣợc mụ tả bằng một vị từ P thuộc lớp Pc. Giả sử Qi (i = 1,.., m) (Q1<> Q2, ..) là một hệ cỏc vị từ thuộc lớp Qic. Với mỗi Qi tồn tại ớt nhất một x  Pc

và x  Pc  x  Qi trong đú  là một hệ từ. Khi đú Qi đƣợc gọi là thành phần phõn lớp hay là cỏc vị từ của kiểu.

Một phõn lớp P1 = <Q1>, Q1 = {Q1c, Q2c ,.., Qmc } với m >= 2. Trƣờng hợp m = 2 thỡ việc phõn lớp đƣợc gọi là một phõn đụi, m = 3 gọi là phõn ba. Tƣơng ứng với

P1, thiết lập một phõn lớp khỏc là P1‟ = <R1c, R2c ,.., Rsc >. Khi đú P1 và P1‟ đƣợc gọi là phõn lớp song song nếu tõn từ Ri khụng bao hàm ý nghĩa của một tõn từ Qj.

Tuỳ theo quỏ trỡnh phõn lớp, cỏc hỡnh thỏi tõn từ Q1, Q2,.., Qm cú thể đƣợc xột là cỏc tõn từ chung. Một phõn lớp mới P2 cú thể bao gồm P1 và và một phõn lớp Qi ,

P2 cú thể đƣợc mụ tả là một bộ P2 = <P1, Q1,.., Qm>. Đặt K1= Q1,.., Qm là một ƣớc lƣợc, ta cú thể lặp lại P2 = <P1, K1> cho đến khi đạt đƣợc Pi = <Pi-1, Ki-1>, Pi gọi là phõn lớp thứ i của chiều P. Phõn lớp thứ nhất P1 đƣợc gọi là phõn lớp chớnh hoặc phõn hoạch chớnh.

2.1.2 Mụ tả tiềm năng và dị biệt

Cho qi1, qi2,..,qir là cỏc vị từ đụi một khỏc nhau của tõn từ chung, x  qi1 x 

qi2..x  qir -> x  Qi đƣợc gọi là chứng minh đỳng của tõn từ Qi. Vớ dụ Q1 = „Sản

phẩm Audio‟ và qi1 = „Ear-phone‟. Gọi nhƣ vậy rất quan trọng để phõn biệt trong tập tõn từ này khụng cú cỏc vị từ của tõn từ khỏc, qij cũn đƣợc gọi là một tớnh chất của tõn từ.

Một mụ tả dị biệt định nghĩa duy nhất một đối tƣợng bằng cỏc tớnh chất của nú thay vỡ phải mụ tả tờn của nú. Mụ tả dị biệt là chuyển từ tờn gọi thành tớnh chất. Nếu A(x) là một hỡnh thức gợi ý với một biến mụ tả dị biệt cú sẵn đƣợc định nghĩa bởi txA(x), trong đú tx đƣợc gọi là toỏn tử mụ tả gắn với biến x cú sẵn. Khi đú sự tồn tại và tớnh duy nhất đƣợc đƣa ra, một mụ tả dị biệt cú thể thay thế thuật ngữ dị biệt (vớ dụ một tờn). Bộ <txA(x), tyB(y), tzC(z)> tƣơng đƣơng với hỡnh thức bộ tờn <xi, yi, zi>.

Cú những trƣờng hợp mà ở đú tớnh duy nhất khụng bắt buộc, thay vỡ mụ tả dị biệt, ta đƣa ra một mụ tả sự khụng duy nhất đú, gọi là mụ tả tiềm năng. Trong một mụ tả tiềm năng xi = def txA(x) với xi khụng nhất thiết phải duy nhất, xi là thuật ngữ chung, tờn của một tập tức là một đối tƣợng trừu tƣợng. Một mụ tả tiềm năng mới

đỏp ứng hoàn chỉnh cho phõn tớch thống kờ, vỡ trong phõn tớch thống kờ khụng cú cỏc đối tƣợng dị biệt đƣợc đƣa ra.

2.1.3 Dạng chuẩn logic

Dạng chuẩn đa chiều theo cỏch nhỡn logic cú vai trũ quan trọng trong việc đơn giản hoỏ biểu thức logic. Cú thể dễ dàng chuyển đổi một dạng chuẩn logic sang một lƣợc đồ quan hệ. Hơn nữa dạng chuẩn logic ở đõy sẽ đƣa đến quỏ trỡnh định nghĩa cỏc dạnh chuẩn đa chiều.

Định nghĩa: Dạng chuẩn đa chiều theo cỏch nhỡn logic

Một lƣợc đồ đa chiều trong dạng chuẩn đa chiều logic bao gồm ba thành phần riờng biệt sau:

- Một tập cỏc phần tử sự kiện của kiểu <xi, yi, zi>  qtyi thể hiện dữ liệu nhỏ nhất của ứng dụng.

- Một tập cỏc cấu trỳc phõn lớp đa chiều.

- Một tập cỏc mụ tả tiểm năng để thay thế cỏc tờn vớ dụ xi = def txA(x), tuỳ theo truy vấn cụ thể.

2.2 Khuụn mẫu cho mụ hỡnh hoỏ đa chiều

Sử dụng mụ hỡnh dữ liệu hƣớng đồ hoạ để để mụ tả lƣợc đồ đa chiều. Vớ dụ một biểu đồ nhƣ sau: S X Dt Dt Dt Mặt hàng Tháng Cửa hàng Hỡnh 11. Mụ hỡnh dữ liệu nhỏ nhất

Trong biểu đồ nỳt S là thuộc tớnh tổng hợp thể hiện kiểu của ụ trong khối đa chiều. Mỗi thuộc tớnh tổng hợp bao gồm một thành phần định danh và một kiểu tổng hợp. Cỏc nỳt dƣới x, là cỏc thuộc tớnh mụ tả cấu trỳc vớ dụ cỏc chiều của khối dữ liệu đa chiều, đƣợc sử dụng bởi ngƣời dựng trong suốt quỏ trỡnh truy vấn CSDL.

Khỏi niệm phụ thuộc hàm là một khỏi niệm quan trọng trong mụ hỡnh hoỏ đa chiều. Cỏc phụ thuộc hàm mụ tả mối quan hệ giữa hai thuộc tớnh trong CSDL, nghĩa là chỳng chỉ ra một điều kiện cú ngữ nghĩa.

Định nghĩa: Phụ thuộc hàm

Giả sử A và B là tập cỏc thuộc tớnh trong một CSDL. B là phụ thuộc hàm vào A hay A là hàm xỏc định B (đƣợc ký hiệu là A->B) nếu và chỉ nếu với mỗi giỏ trị cụ thể aA, sẽ tồn tại một giỏ trị bB

2.3 Dạng chuẩn đa chiều giới hạn (adsbygoogle = window.adsbygoogle || []).push({});

2.3.1 Cỏc chiều

Tất cả cỏc thuộc tớnh của một chiều sẽ cú thể là một phụ thuộc hàm trờn cỏc mục cơ bản trong chiều này. Vớ dụ: Sản phẩm -> Nhúm sản phẩm hoặc Nhúm sản phẩm -> mặt hàng trong một chiều sản phẩm. Tuy nhiờn cú những thuộc tớnh mà về trực giỏc thuộc về một lƣợc đồ chiều nhất định, nhƣng khụng cú quan hệ hàm với cỏc thuộc tớnh khỏc (định nghĩa phụ thuộc hàm ở trờn cú nhiều hạn chế). Với cỏc thuộc tớnh kiểu này, ta định nghĩa một phụ thuộc hàm mà sẽ đƣợc sử dụng để định nghĩa lƣợc đồ đa chiều.

Định nghĩa1: Phụ thuộc hàm yếu

B đƣợc gọi là phụ thuộc hàm yếu vào A (ký hiệu là A => B), nếu với mỗi giỏ trị cụ thể aA, tồn tại nhiều nhất một giỏ trị bB

Định nghĩa 2: Lược đồ đa chiều (mụ tả lại dưới dạng cỏc phụ thuộc hàm)

Một lƣợc đồ đa chiều là một tập cỏc thuộc tớnh chiều D ={D1,..,Dn} trong đú với mỗi Di  D tồn tại một Dj  D -{Di} mà cú thể cú cả hai Di => Dj hoặc Dj => Di.

Định nghĩa 3: Thuộc tớnh kết thỳc (mụ tả lại dưới dạng cỏc phụ thuộc hàm)

Một thuộc tớnh chiều DtD đƣợc gọi là thuộc tớnh kết thỳc nếu khụng tồn tại một DiD - {Dt} nào mà Di =>Dt

Định nghĩa 4: Thuộc tớnh chiều yếu

Giả sử D là một lƣợc đồ chiều với thuộc tớnh cuồi Dt. Một thuộc tớnh chiều DiD đƣợc gọi là yếu nếu và chỉ nếu Dt => Di nhƣng khụng tồn tại Dt ->Di

2.3.2 Sử dụng phụ thuộc hàm cho phõn cấp

Trong CSDL phõn tớch OLAP, phõn cấp lớp là yếu tố cơ bản để định nghĩa dữ liệu tổng hợp. Phõn lớp yờu cầu khụng kết nối cỏc lớp và nhƣ vậy đảm bảo một trong cỏc điều kiện cần thiết cho khả năng tổng hợp.

Một phõn loại C của lƣợc đồ chiều D là một dóy cỏc phụ thuộc hàm D1 -> D2 - >..-> Dk-1 -> Dk trong đú Di  D (i= 1..k) , thuộc tớnh Di đƣợc gọi là mức phõn loại thứ i.

Thể hiện của kết quả phõn loại là sự phõn lớp cấp cơ sở cơ bản cho sự tổng hợp.

2.3.3 Loại bỏ cỏc phụ thuộc hàm yếu cho tổng hợp

Cỏc thuộc tớnh chiều yếu khụng thể đƣợc sử dụng để tạo cỏc phõn cấp, vỡ cỏc điều kiện hoàn chỉnh cho tổng hợp sẽ bị phỏ huỷ. Cú hai lý do cơ bản cho cỏc thuộc tớnh yếu là:

- Sự mõu thuẫn trong mụ hỡnh chiều. - Sự phụ thuộc tồn tại

2.3.4 Dạng chuẩn chiều

Định nghĩa: Dạng chuẩn chiều (DNF)

Một chiều với lƣợc đồ chiều D là trong dạng chuẩn chiều nếu cỏc điều kiện sau

đõy đƣợc thoả món:

- Cú tồn tại chớnh xỏc một thuộc tớnh kết thỳc Dt  D - Cỏc giỏ trị của Dt là toàn vẹn

- Tất cả cỏc phụ thuộc hàm giữa hai thuộc tớnh chiều bất kỳ Di, Dj  D khụng là

phụ thuộc hàm yếu

Điều kiện (1) cho rằng một chiều Địa lý với cỏc thuộc tớnh Khỏch hàng, Thành phố, Vựng, Nƣớc, Cửa hàng, trong đú sẽ khụng cú Cửa hàng -> Khỏch hàng và cũng khụng cú Khỏch hàng -> Cửa hàng, cú thể khụng bao giờ cú trong dạng chuẩn chiều. Trong trƣờng hợp này Khỏch hàng và Cửa hàng là cả hai thuộc tớnh nguyờn tố và do đú sẽ khụng đƣợc đƣa cựng trong một chiều đơn. Điều kiện 2 là giả thiết cơ bản cho tớnh toàn vẹn và khụng thể đƣợc kiểm tra một cỏch hỡnh thức. Nếu điều kiện 3 thoả món, tất cả cỏc thuộc tớnh chiều cú thể đƣợc sử dụng để tạo phõn cấp tuỳ ý tuý thuộc vào cỏc phụ thuộc hàm.

2.3.5 Dạng chuẩn đa chiều

Cỏc chiều đƣợc định nghĩa là cần thiết nhƣng khụng đủ là điều kiện tiờn quyết để tổng hợp trong quyết định đa chiều. Để đảm bảo tổng hợp trong việc đƣa thờm cỏc ràng buộc vào trong chiều. Trƣớc khi định nghĩa một dạng chuẩn chiều, ta sẽ nhắc

lại về lƣợc đồ đa chiều đƣợc sử dụng trong định nghĩa dạng chuẩn đa chiều nhƣ sau: Một lƣợc đồ đa chiều M = (D1,..,Dk, S) bao gồm một một tập cỏc lƣợc đồ chiều D1,..,Dk, một độ đo (hay thuộc tớnh tổng hợp) S và phụ thuộc hàm D1,..,Dk=>S.

Định nghĩa: Dạng chuẩn đa chiều (MNF)

Một lƣợc đồ đa chiều M = (D1,..,Dk, S) là trong dạng chuẩn đa chiều nếu cỏc (adsbygoogle = window.adsbygoogle || []).push({});

điều kiện sau đõy thoả món:

- Mỗi chiều Di là trong dạng chuẩn chiều

- Cỏc chiều là trực giao với cỏc chiều khỏc nghĩa là khụng tồn tại phụ thuộc hàm yếu C => D trong đú C  Di và D  Dj và i <> j.

- Thuộc tớnh tổng hợp S là hàm đầy đủ đƣợc xỏc định bởi tập cỏc thuộc tớnh kết thỳc của cỏc chiều.

Điều kiện thứ 2 giống với điều kiện 1 trong định nghĩa dạng chuẩn chiều. Điều kiện cuối cựng cho rằng sẽ khụng cú cỏc chiều vụ ớch trong lƣợc đồ đa chiều.

2.4 Dạng chuẩn đa chiều tổng quỏt

2.4.1 Phõn biệt cỏc thuộc tớnh chiều

Cỏc thuộc tớnh chiều là đƣợc sử dụng để định nghĩa cỏc cấu trỳc phõn lớp. Do đú cỏc thuộc tớnh đú đúng vai trũ của cỏc thuộc tớnh loại. Núi cỏch khỏc cỏc thuộc tớnh đƣợc sử dụng để làm bật cỏc cơ chế của cỏc mụ tả tiềm năng. Cỏc thuộc tớnh chiều đúng gúp để cỏc cơ chế đú đƣợc gọi là cỏc thuộc tớnh tớnh chất.

Định nghĩa: Cỏc thuộc tớnh loại

Giả sử D = D1, D2,..,Dn là một lƣợc đồ chiều. Một thuộc tớnh Di  D - Dt

đƣợc gọi là thuộc tớnh loại, nếu Dt -> Di và cú một thuộc tớnh khỏc Dj  D - Dt, Di

mà Di -> Dj hoặc Dj -> Di. Tất cả cỏc thuộc tớnh chiều khỏc đƣợc gọi là thuộc tớnh

tớnh chất. Cỏc tập con của cỏc thuộc tớnh loại và cỏc thuộc tớnh tớnh chất đƣợc ký hiệu tƣơng ứng là Dc  D và Dp  D.

Cỏc thuộc tớnh tớnh chất thể hiện cỏc tớnh chất rừ ràng mà cú thể đƣợc sử dụng trong cỏc mụ tả tiềm năng. Thuộc tớnh tớnh chất khụng yếu đƣợc xỏc định bởi một thuộc tớnh kết thỳc và nú khụng xỏc định bất kỳ một thuộc tớnh nào khỏc nữa. Do đú mọi thuộc tớnh chiều yếu sẽ là cỏc thuộc tớnh tớnh chất.

2.4.2 Ngữ cảnh hợp lệ

Hầu hết cỏc thuộc tớnh tớnh chất là hợp lệ chỉ quan tõm tới một một cõy con cụ thể của phõn cấp lớp. Định nghĩa sau sẽ giải thớch một cỏch hỡnh thức ngữ cảnh hợp lệ của một thuộc tớnh tớnh chất.

Định nghĩa: Ngữ cảnh hợp lệ của một thuộc tớnh tớnh chất

Giả sử Dt  D là thuộc tớnh kết thỳc và Dp  Dp là thuộc tớnh tớnh chất. Một lớp thể hiện c  Dc, trong đú Dc là một thuộc tớnh loại Dc  D - (Dt  Dp) đƣợc gọi là ngữ cảnh hợp lệ của thuộc tớnh tớnh chất Dp, nếu:

- Với mỗi phần tử kết thỳc thuộc về lớp c tồn tại một giỏ trị pDp

- Với mỗi phần tử kết thỳc khụng thuộc lớp c giỏ trị của Dp khụng xỏc định Chỳ ý rằng trong định nghĩa này khụng chỉ lƣợc đồ chiều nhƣng cỏc thể hiện thực sự của nú đúng một vai trũ quyết định. Trong vớ dụ Sản phẩm, khụng chỉ thuộc tớnh loại Nhúm sản phẩm là quan trọng, nhƣng thể hiện của nú Video (đƣợc định nghĩa trong VideoSystem-giả sử VHS) và Audio (khụng đƣợc định nghĩa trong VideoSystem) đƣợc đƣa vào trong sổ sỏch. Nếu một truy vấn bị hạn chế tới một cõy con mà ở đú gốc tƣơng ứng với một nỳt ngữ cảnh hợp lệ của một thuộc tớnh tớnh chất, thỡ thuộc tớnh tớnh chất cú thể đƣợc sử dụng trong cỏc mụ tả tiềm năng, thay vỡ sử dụng cấu trỳc phõn lớp đó đƣợc định nghĩa.

Nếu một thuộc tớnh đúng vai trũ của một thuộc tớnh loại bờn trong một lƣợc đồ đa chiều, thỡ chiều tƣơng ứng D_node đƣợc ký hiệu Dc (nỳt loại). Trong trƣờng hợp của một thuộc tớnh tớnh chất, nhón của nỳt tƣơng ứng bị thay đổi thành Dp (nỳt tớnh chất). Ngoài ra mỗi cạnh từ một thuộc tớnh tớnh chất tới một thuộc tớnh loại đƣợc gỏn nhón bởi tờn lớp xỏc định ngữ cảnh hợp lệ của nú. Vớ dụ chiều sản phẩm thuộc tớnh tớnh chất VideoSystem là hợp lệ bờn trong ngữ cảnh của lớp Video nhƣ là một thể hiện của nỳt loại Nhúm sản phẩm.

Video S-VHS VHS HI8 TR-75 TS1 S4 X435 X3 Nhóm sản phẩm VideoSystem Mặt hàng Video

Máy quay Đầu máy

TR-75 TS1 X435 S4 Nhóm sản phẩm Sản phẩm gia đình Mặt hàng X3 Thiết bị Audio

Radio CD-Player Băng

TI4 33-2 7H3 XS4 T401

ALLsản phẩm

Ngữ cảnh hợp lệ

Hỡnh 12. Phõn cấp lớp thay thế bằng thuộc tớnh của một mụ tả tiểm năng

Hai tớnh huống đặc biệt cú thể xuất hiện trong lƣợc đồ đa chiều. Nếu khụng cú bất kỳ thuộc tớnh tớnh chất nào, phƣơng phỏp thiết kế lƣợc đồ tƣơng ứng với khả năng của cỏc mụ hỡnh dữ liệu đồ hoạ truyền thống, ở đú cỏc nỳt loại phản ỏnh chỉ cơ chế nhúm bờn trong một chiều. Trong trƣờng hợp khỏc, nếu khụng cú loại rừ ràng đƣợc định nghĩa bờn trong lƣợc đồ, thỡ tất cả cỏc thuộc tớnh chiều là cỏc thuộc tớnh tớnh chất hợp lệ toàn cục. (adsbygoogle = window.adsbygoogle || []).push({});

2.4.3 Dạng chuẩn đa chiều tổng quỏt (GMNF)

Định nghĩa: Dạng chuẩn chiều tổng quỏt

Lƣợc đồ đa chiều M = (D1,..,Dk, S) là dạng chuẩn đa chiều tổng quỏt nếu thoả

món cỏc điều kiện sau:

- Với mỗi thuộc tinh tớnh chất Dip  Dip tồn tại một lớp c của một thuộc tớnh

loại Dic thể hiện ngữ cảnh hợp lệ của Dip - Di- Dip là dạng chuẩn chiều

- Và cỏc điều kiện (2) và (3) trong dạng chuẩn đa chiều (MNF)

Hai điều kiện 2 và 3 để đảm bảo dạng chuẩn đa chiều cho lƣợc đồ đa chiều mà khụng cần cỏc thuộc tớnh tớnh chất. Điều kiện thứ nhất tƣơng ứng là mỗi thuộc tớnh tớnh chất xỏc định phải cú một ngữ cảnh hợp lệ.

Một phần của tài liệu Công nghệ xử lý phân tích trực tuyến trong việc trợ giúp quyết định (Trang 42 - 50)