1. Trang chủ
  2. » Luận Văn - Báo Cáo

Mô hình hóa dữ liệu đa chiều

74 853 2
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 74
Dung lượng 2,51 MB

Nội dung

Mô hình hóa dữ liệu đa chiều

ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KHOA HỌC TIỂU LUẬN MÔN HỌC DATA WAREHOUSE Đề tài: HÌNH HÓA DỮ LIỆU ĐA CHIỀU Giáo viên hướng dẫn : TS. Nguyễn Thanh Bình Học viên thực hiện: Nhóm 7 Nguyễn Trí Nhân Trần Thái Sơn Trần Kiên Lớp Cao học Khoa học máy tính – Khoá 2008 - 2010 Hueá, thaùng 6/2009 A. MỞ ĐẦU .2 B. NỘI DUNG .3 1. Nền tảng cho cơ sở dữ liệu đa chiều (A Foundation for Multi-Dimensional Databases) .3 1.1. Giới thiệu 3 1.2. hình dữ liệu đa chiều(Multi-Dimensional Data Model) .5 1.3.Toán tử đại số(Algebra) 9 1.4. Phép tính (Calculus) .16 2. Ứng dụng kỹ thuật phân mảnh theo chiều dọc trong thiết kế logical của cở sở dữ liệu đa chiều (Applying vertical fragmentation techniques in logical design of Multidimensional Databases) 20 2.1. Giới thiệu 20 2.2. Kiến thức nền(Background) .22 2.2.1 Khối và hình(Cubes and Patterns) .22 2.2.2 The Workload 23 2.2.3 Các view 25 2.3. Phân mảnh dọc của các view 26 2.3.1 Problem Statement 27 2.3.2 Hàm chi phí (Cost Function) .30 2.3.3. Tiếp cận nhánh và cận (Branch-and-Bound) .31 2.4 . Test thử nghiệm .32 3. Một trong hai phương pháp mới cho hình ROLAP 35 3.1. Giới thiệu: .35 3.2. Phương pháp ROLAP truyền thống: 37 3.2.1. Lược đồ hình sao: .38 3.2.2. Lược đồ bông tuyết: .39 3.2.3. Tóm tắt và kết luận: 40 3.3. Cách thiết kế Object-Relational: 43 3.3.1. Định nghĩa kiểu: .43 3.3.2. Các định nghĩa Bảng Typed: 45 3.3.3. Thao tác dữ liệu: .46 3.4. Tóm tắt và kết luận: 48 4. hình cơ sở dữ liệu đa chiều (Modeling Multidimensional Databases) .49 4.1. Cơ sở dữ liệu đa chiều hiện tại .51 4.1.1. Ví dụ 51 4.1.2. Thuật ngữ 51 4.1.3. Ví dụ 52 4.1.4. Thực hiện xây dựng 53 4.1.5. Chức năng yêu cầu thêm vào .53 4.2. hình dữ liệu đề xuất .54 4.2.1. hình 54 4.2.2. Các phép toán .55 4.3. Áp dụng các phép toán vào câu truy vấn 64 4.3.1. Nhận xét 64 4.3.2. Áp dụng phép toán vào câu truy vấn .67 4.4 Kết luận và phương hướng .68 C. KẾT LUẬN 71 D. TÀI LIỆU THAM KHẢO 72 1 A. MỞ ĐẦU Hiện nay, cơ sở dữ liệu đa chiều được quan tâm đáng kể cho sự phát triển trong lĩnh vực phân tích kinh doanh và các ứng dụng hỗ trợ quyết định. Codd đã đề xuất khái niệm OLAP để biểu diễn dữ liệu của tổ chức kinh doanh bằng hình đa chiều, thực hiện phân tích dữ liệu trực tuyến bằng cách sử dụng các công thức toán học hoặc sự phân tích thống kê phức tạp hơn và dữ liệu tổng kết thống nhất. Công nghệ cơ sở dữ liệu quan hệ được cho là thích hợp hơn đối với việc quản lí các giao tác thực tế và các truy vấn đặc biệt. Mặc khác, OLAP hỗ trợ phân tích trực tuyến phức tạp, một vài vấn đề mà hình quan hệ truyền thống ít được hỗ trợ. Để giải quyết điều này, nhiều nhà cung cấp đã phát triển sản phẩm OLAP, ví dụ như Arbor Software’s Essbase và Oracle Express… hình đa chiều đang trở nên quan trọng như một tầng logic đối với dữ liệu truy vấn trong OLAP. Khía cạnh chính của dữ liệu đa chiều là sự tách rời các chiều và các dữ kiện. Trong khi các chiều tả dữ liệu tĩnh một cách tương đối, các dữ kiện cơ sở đã được tả giống như các điểm trong các không gian đã định nghĩa bởi các chiều. Một số hình đa chiều cho OLAP gần đây đã hợp nhất các chiều như là các thực thể. Tiểu luận “Mô hình hoá dữ liệu đa chiều” là tổng hợp nội dung của bốn bài báo tương ứng với bốn phần: Phần 1 Nền tảng cho cơ sở dữ liệu đa chiều A Foundation for Multi-Dimensional Databases (Thực hiện: Nguyễn trí Nhân) Phần 2 Ứng dụng kỹ thuật phân mảnh theo chiều dọc trong thiết kế logical của cở sở dữ liệu đa chiều Applying vertical fragmentation techniques in logical design of Multidimensional Databases (Thực hiện: Nguyễn Trí Nhân) Phần 3 Một trong hai phương pháp mới cho hình ROLAP (Thực hiện: Trần Kiên ) Phần 4 Trình bày hình cơ sở dữ liệu đa chiều (Thực hiện: Trần Thái Sơn) 2 B. NỘI DUNG 1. Nền tảng cho cơ sở dữ liệu đa chiều (A Foundation for Multi- Dimensional Databases) Tóm tắt Chúng tôi trình bày hình khối dữ liệu đa chiều có thể phục vụ như một hình khái niệm cho các ứng dụng phân tích trực tuyến on line (On-Line Analytical Processing (OLAP)). Bên cạnh cung cấp các chức năng cần thiết cho các ứng dụng dựa trên OLAP, nổi bậc của hình hỗ trợ sự tách biệt rõ ràng giữa cấu trúc và nội dung liên quan cho phép chúng ta định nghĩa ngôn ngữ thao tác, cách trong suốt. Cụ thể chỉ ra rằng thao tác khối(cube) dữ liệu có thể được trình bày dễ dàng. Cụ thể định nghĩa đại số và phép tính để biểu diễn chúng tương đương. Kết luận bởi việc so sánh phương pháp tới công việc liên quan. Khái niệm của hình cơ sở dữ liệu đa chiều là trực giao tới sự cài đặc, nó không phải là chủ đề của bài này. 1.1. Giới thiệu Gần đây, có sự quan tâm quan trọng trong hệ thống cơ sở dữ liệu đa chiều cho phân tích thương mại tiến triển và các ứng dụng hỗ trợ quyết định. Codd đưa ra khái niệm OLAP cho dữ liệu doanh nghiệp biểu diễn trong viễn cảnh đa chiều, thực hiện phân tích on-line của công thức toán học sử dụng dữ liệu hoặc phức tạp hơn phân tích thống kê và dữ liệu hợp nhất (consolidating and summarizing data) [Cod93, CCS93]. Điều đó tin rằng công nghệ cơ sở dữ liệu quan hệ là phù hợp tốt hơn cho quản lý giao dịch mạnh mẽ. Nói cách khác, OLAP gọi cho phân tích trực tuyến on- line phức tạp, đôi khi hình quan hệ truyền thống tỏ ra hỗ trợ ít. Cung cấp thêm cần thiết này, một vài máy bán tự động (vendor) thực sự phát triển các sản phẩm OLAP ví dụ Arbor Software’s Essbase and Oracle Ex- press gọi tên chỉ hai. Nhiều sản phẩm này chụi sự giới hạn theo: (i) Ad-hoc(truy vấn bộc phát) và không hỗ trợ ngôn ngữ truy vấn phức tạp tương tự như SQL; (ii) Tương tác người sử dụng thường bị giới hạn một thao tác ở một thời điểm. 3 (iii) Khung nhìn dữ liệu trong viễn cảnh đa chiều phức tạp bao gồm thuộc tính chứa đựng xử lý như các tham chiều và duy trì chúng như là dữ kiện(measures), phân tích chúng như một “hàm”(“function”) của các tham biến; nhiều sản phẩm xử lý bất đồng bộ các chiềudữ kiện cuối cùng. (iv) Không giống như hình quan hệ, không có rõ ràng, thích hợp chung chung, hình khái niệm cho OLAP hoặc cũng được gọi là cơ sở dữ liệu đa chiều (MDD). Nhiều sự thành công của cơ sở dữ liệu quan hệ có thiết lập logic rõ ràng cho hình dữ liệu, đầu tiên là Codd phát triển và sau đó đông đảo các nhà nghiên cứu. Trong phần này chúng tôi đưa ra như sau: 1. Phát triển hình khái niệm đơn giản cho OLAP hoặc MDD. 2. Có hỗ trợ kiến trúc bốn tầng cho ngôn ngữ truy vấn OLAP. Chỉ rằng sự tách biệt liên quan của nội dung chống lại cấu trúc, còn có thể phát triển đơn giản đại số mạnh mẽ và một tính toán tương đương, cả hai phù hợp đặc trưng xử lý tới tất cả bốn mức của kiến trúc. Hình 1.1: một ví dụ bảng hai chiều Sales với các chiều Category và Time. Tập hợp tham biến kết hợp là: {Part, City} và {Year, Month}, riêng biệt. Thuộc tính dữ kiện là Cost và Sale; Minh họa ở trên, chúng ta trình bày trong đại số thao tác khối dữ liệu thông dụng gần đây hỗ trợ bởi Gray et al.[GBLP95] cũng như hữu dụng và thực hành giá trị thu hút hơn. 4 Trong phần này tổ chức như sau. Trong đoạn 1.2 trình một sự giới thiệu không hình thức hình dữ liệu cho MDD. Trong đoạn 1.3 và 1.4, trình bày một đại số và phép tính cho MDD và minh họa năng lực biểu diễn theo các ví dụ. Biểu diễn cả hai ngôn ngữ tương đương trong khả năng biểu diễn. 1.2. hình dữ liệu đa chiều(Multi-Dimensional Data Model) Từ quan điểm nhận thức, OLAP được gọi cho 4 loại cơ bản sau: 1. Truy vấn(Querying): khả năng đưa ra truy vấn bộc phát một sự đơn giản giao diện khai báo. 2. Cấu trúc lại(Restrucring): khả năng cấu trúc lại thông tin trong sự bùn nổ cơ sở dữ liệu đa chiều của dữ liệu và đưa ra(bring out) phối cảnh khác của dữ liệu. 3. Sự phân loại(Classifition): khả năng phân loại hoặc nhóm tập dữ liệu trong phong cách thích hợp cho tổng kết theo sau: 4. Tổng kết(Summarization/Consolidation): Đây là tổng quát hóa của các phép toán đại số trong chuẩn SQL. Tổng quát summarization ánh xạ đa tập(multisets) của giá trị của một kiểu số tới một kiểu chuỗi(single), giá trị“hợp nhất”. Chúng tôi truy tìm một hình khái niệm và ngôn ngữ truy vấn đó là có thể hỗ trợ tất cả các chức năng ở trên và cho phép chúng tương tác với mỗi đối tượng khác kiểu liền mảnh(seamless). Cấu trúc dữ liệu cơ bản của dữ liệu đa chiều là cái chúng tôi gọi là bảng n chiều(n-dimensional table). Trước tiên đưa ra trực giác bên cạnh nó. Chúng ta mong ước có thể nhìn giá trị thuộc tính chắc chắn như một “chức năng” khác, trong bất kỳ cái cách nào phù hợp với chúng, khả năng bùn nổ vữa lót(rendering) đa chiều. Vẽ trên thuật ngữ của dữ liệu thông kê, chúng ta có thể phân loại tập thuộc tính kết hợp với lược đồ của một bảng vào trong hai loại: tham biến và dữ kiện. Không có sự phân biệt ưu tiên(priori) giữa tham biến và dữ kiện trong thuộc tính bất kỳ đó có chọn lựa vai trò. Một ví dụ bảng hai chiều được cho trong hình 1.1. Ở mức khái niệm, chúng ta cần hình của chúng ta duy trì thân thiện hình quan hệ chuẩn nếu có thể, do đâu thân dôi ra(rich body) của lý thuyết và công nghệ phát triển tốt cho hình quan hệ sẽ lúc đó dồn cho hình OLAP Một cách tự nhiên thực thi đối tượng này là thừa nhận đó chiều của các bảng là một đặc trưng cấu trúc vốn có, cái mà đầy đủ ý nghĩa nhất khi bảng là đưa tới cho người dùng. Nội 5 dung thực tế của bảng là trực giao cần thiết cho việc kết hợp cấu trúc, nghĩa là sự phân tán của các thuộc tính lên trên các chiềudữ kiện. Việc phân tách cả hai đặc tính dẫn đến view quan hệ của một bảng. Ví dụ đầu vào trong “ô”đầu tiên(tức là đầu cực trái) của bảng trong hình 1.1 đầu vào chứa (5, 6) tương ứng với bộ (PC, Montreal, 1996, Jan, 5,6) trên lược đồ {Part, City, Year, Month, Cost, Sale}trong view quan hệ của bảng đó. Hình 1.2: view khái niệm của bảng hình 1.1. Cấu trúc lưu trữ thực sự và sự thực thi không cần quan hệ. Chúng ta bây giờ chính thức tả không hình thức ở trên, trong định nghĩa của một bảng n chiều. Như thường lệ, chúng tôi giả sử hai tập hợp các ký hiệu phân biệt và vô hạn: N là một tập hợp tên và V là tập hợp các giá trị. Định nghĩa 1.2.1 (lược đồ bảng và thể hiện-Table Schemas and Instances) Một lược đồ bảng (Table Schema) n chiều là một bộ ba <D, R, par> ở đây D={ d 1 , ., d n } là một tập hợp các tên chiều, R={A 1 , ., A m } là tập các thuộc tính và par: D → 2 { 1 A , ., m A } , thoả mãn (i) Với mọi i,j=1, ,n, i ≠ j, par(d i ) I par(d j ) = ∅ và (ii) U d ∈ D par(d) ⊆ R Chúng ta thường ký hiệu par(d i ) bởi X i Cho M = R – 1 i n ≤ ≤ U X i. Một thể hiện(instance) của một bảng lược đồ n chiều <D, R, par> là một tập hợp n + 1 quan hệ hữu hạn theo dạng rd 1 (Tid, X 1 ), . , rd n (Tid, X n ), r m (rd 1 .Tid, ., rd n .Tid, M), thoả mãn 6 (i) Sự kết hợp Tid 1 Tid n (rd ) . (rd )π × ×π bằng )( ., .,. 1 rm TidrdTidrd n π , nghĩa là với mỗi sự kết hợp của các giá trị Tid trong các quan hệ rd 1 , ., rd n , có ít nhất một bản ghi tương ứng trong rm, và mỗi bản ghi trong rm tương ứng với một số sự kết hợp của các giá trị Tid trong các quan hệ rd 1, .rd n ; (ii) Với mọi i = 1, , n, Tid là một khoá của quan hệ rd i ; và (iii) với mọi i,j=1, ,n, i ≠ j, Tid i Tid j (rd ) (rd ) π π =∅ I , nghĩa là các giá trị Tid trong các quan hệ khác nhau rd i và rd j là rời nhau. Như vậy, một cơ sở dữ liệu được xếp thành bảng đa chiều (MDD–Multi Dimensional Databasse) là một tập các bảng. Trong định nghĩa 1.2.1, một bảng có một tập R gồm m thuộc tính và n chiều (n ≥ 0) d 1 , ., d n kết hợp với nó. Mỗi chiều được tả bởi một tập hợp con riêng biệt của các thuộc tính từ R, gọi là các tham số của chiều đó. Các thuộc tính trong R mà chúng không phải là tham số của bất kỳ chiều nào thì chúng được gọi là các thuộc tính dữ kiện của bảng. Bằng trực giác, chúng ta có thể xem các bản ghi trong các quan hệ rd 1 , ., rd n như là “các tọa độ”(coordinates) trong các chiều d 1 , ., d n theo thứ tự định sẵn. Từ quan điểm này, một bảng có thể được xem như là sự kết hợp của một tập các bộ trên các thuộc tính dữ kiện với mỗi điểm (t 1 , ., t n ) trong không gian n chiều, ở đây i=1, ., n, t i là giá trị T id duy nhất kết hợp với một bộ trong quan hệ rd i . Ngược lại, với mỗi bản ghi (t i , i i a ) rd∈ ur , chúng ta nói rằng i a ur là bộ X i đã trình bày bởi t i. Rõ ràng rằng, Các quan hệ truyền thống tương ứng với tất cả các bảng 0 chiều của các thuộc tính của chúng về cơ bản là các thuộc tính dữ kiện. Chúng ta đồng ý khung nhìn khái niệm của bảng đa chiều là hoàn toàn độc lập với cấu trúc lưu trữ hoặc chỉ đạo thực thi sử dụng cho các bảng này. Ví dụ 1.2.1 xem lược đồ bảng hai chiều Sales = ( {Category, Time}, {Part, City, Year, Month, Cost, Sale}, par), ở đây par(Category) = {Part, City} và par( Time) = {Year, Month}. Một thể hiện của lược đồ này bao gồm 3 quan hệ rCategory(Tid, Part, City), rTime(Tid, Year, Month), và rm((r)C(ategory).Tid, (r)T(ime).Tid, Cost, Sale) là biểu diễn trong hình 1.2. được hiển thị trong hình 1.2. Thể hiện này thực sự thoả mãn các ràng buộc trong định 7 nghĩa 1.2.1. Bảng thể hiện này thực sự tương ứng với bảng được chỉ ra trong hình 1.2.1. Chúng ta biểu diễn Tiếp theo rằng mọi bảng MDD có thể biểu diễn chính xác bởi quan hệ truyền thống và ngược lại trong trực giác đó chúng ta hẳn làm chính xác ở mức dưới. Chúng ta cần kết quả kết quả trong đoạn 1.3 để phát triển ngữ nghĩa đơn giản cho mỗi phép toán đại số cổ điển. Trước khi chúng ta có thể biểu kết quả trên, chúng tôi phải giới thiệu khái niệm đầy đủ của quan hệ với lược đồ bảng. Định nghĩa 1.2.2(Đầy đủ-Completion) Cho r(A 1 , ., A m ) là một quan hệ và S = <D, {A 1 , ., A m }, par> là một lược đồ bảng. Như thường lệ, chúng ta ký hiệu X i =par (d i ). Thì sự đầy đủ(completion) của r với mối liên hệ S, ký hiệu S r , được định nghĩa là quan hệ nhỏ nhất thoả mãn. (i) r ⊆ S r và (ii) Với tất cả các sự kết hợp của bộ n aa .,, 1 , với mọi i =1, ., n, i a uv ở trong i X π (r), nhưng ( n aa .,, 1 ) không ở trong 1 n X , . X ,π (r), chúng ta thấy rằng ( 1 n a , ,a u uuv v , ⊥ uv ) ở trong S r . Ở đây ⊥ uv là một bộ gồm |M| ký hiệu ⊥ tương ứng với các thuộc tính dữ kiện. Bằng trực giác, quan hệ r ở trên là tương đương với S r đầy đủ (completion) của nó: Các ký hiệu ⊥ thêm vào ở đó chỉ đơn thuần là do các giá trị rỗng không thích hợp trong việc biểu diễn dữ liệu đa chiều. Cho R là lược đồ quan hệ, và S = <D, R, par> là một lược đồ bảng. Cho ℜ (R) là lớp của tất cả các quan hệ hữu hạn trên R và T(S) là lớp của tất cả của các thể hiện của bảng lược đồ S. Cuối cùng, cho s R(R) = { S r | r ∈ ℜ (R) }. Chúng ta nói rằng lược đồ bảng S biểu diễn chính xác lược đồ quan hệ R (và ngược lại)đã cho và có sự tương ứng 1 – 1 từ lớp của các bảng T(S) đến lớp của các quan hệ s R)( ℜ . Định lý 1.2.1 Cho R là lược đồ quan hệ, và cho S = <D, R, par> là lược đồ bảng. Thì R biểu diễn chính xác S (và ngược lại). 8 [...]... các phép toán như khối dữ liệu hoặc roll-up cũng có thể được biểu diễn trong các phép tính 18 19 2 Ứng dụng kỹ thuật phân mảnh theo chiều dọc trong thiết kế logical của cở sở dữ liệu đa chiều (Applying vertical fragmentation techniques in logical design of Multidimensional Databases) Tóm tắt: Trong ngữ cảnh của cở sở dữ liệu đa chiều được sử dụng quan hệ DBMS thông qua lược đồ hình sao, kỹ thuật ảnh... trị theo vài hình kết tập(aggregation patterns), nghĩa là tập hợp các thuộc tính chiếm(taken) từ các bảng chiều để định nghĩa thô của kết tập Ngay cả dữ liệu tổng kết(summarized) theo từng hình được tổ chức vào một lược đồ hình sao, toàn bộ bản thực tế được gọi là view và import các thuộc tính bao gồm trong mẫu, dữ kiện được giá trị thu được của việc áp dụng một phép toán kết tập dữ liệu trong... trình bày một chiều có thể cho phân tích Một MD được thực hiện trên một quan hệ DBMS thường được tổ chức theo như vậy gọi là hình sao, trong đó mỗi khối(cube) được thể hiện bằng một lưu trữ bảng thực tế, dữ kiện và một bảng chiều denormalized cho mỗi chiều hướng của phân tích Khóa chính của mỗi bảng chiều (thường là khóa đại diện, tức là tạo ra nội bộ) import vào trong bảng thực tế,…; khóa chính của... trên thỏa thuận(trade-off) việc đọc dữ kiện kém và các bộ kém hơn Nói chung các nhân tố khác được xem xét trong thỏa thuận số định hình thực tế khóa bảng: cho các hình kém hơn, chiều dài của khóa là ngắn hơn và kích thước của các bộ đọc là nhỏ hơn Khả năng trả lời cho câu hỏi một truy vấn bằng nối phân mảnh truy cập của các hình khác các tác động về việc tối ưu hóa các truy vấn của cây thực thi... bảng chiều( dimension) Với mục đích của đơn giản hơn, chúng tôi sẽ xem xét các khả năng bình thường các bảng chiều đạt được lược đồ hình bông tuyết Định nghĩa 2.1 Cho một cube f, hình kết tập (hoặc hình đơn giản) trên f là tập P ⊂ Attr ( f ) như vậy mà không có tồn tại phụ thuộc hàm giữa mỗi cặp thuộc tính trong P: ∀ai ∈P (∃ai ∈P; ai →a j ) / Tham chiếu tới khối Lineltem, các ví dụ của các hình. .. cơ sở dữ liệu đa chiều được tập hợp nghiên cứu rộng rãi và quan tâm thị trường như lõi cuả ứng dụng hỗ trợ quyết định cũng như data warehouses Một cơ sở dữ liệu đa chiều( MD) có thể xem là một tuyển tập của "cubes" tập trung trên thực tế của lợi ích (thí dụ người bán hàng trong một dãy các cửa hiệu); trong một cube, mỗi một ô chứa đựng thông tin có ích về qui trình quyết định,… , một tập hợp của dữ kiện,... cở sở dữ liệu đa chiều là điều hành(operating) Nếu không, các nhà thiết kế có thể thử để xác định một lõi workload một priori: trên thực tế, nói cách khác, người sử dụng thông thường là biết trước kiểu dữ liệu phân tích, người ta sẽ thực hiện thường xuyên hơn cho các mục đích quyết định(decisional) hoặc thống kê; nói cách khác, một số lượng đáng kể các truy vấn được nhằm mục đích rút trích dữ liệu tóm... quan hệ trực tiếp đến cấu trúc của các bảng đa chiều, xét cho cùng thì kết quả của các toán tử được biểu diễn thành bảng là thích hợp với việc các quan hệ đã biểu diễn bằng cơ sở dữ liệu được xếp thành bảng ban đầu Ý tưởng này sẽ được phát triển trong phần sau 1.3.Toán tử đại số(Algebra) Trong đoạn này, chúng tôi phát triển một phép toán đại số cho dữ liệu đa chiều Trước khi tiến hành với trình bày toán... nửa nếu sự lựa chọn bao gồm các thuộc tính dữ kiện, định nghĩa của nó hơi khác và bất đối xứng ở trên Một định nghĩa trực tiếp sự lựa chọn bao gồm các tham biến và dữ kiện thậm chí phức tạp hơn Người đọc có thể dễ dàng hình dung sự phức tạp trong trường hợp nối giữa hai bảng MDD 9 Hình 1.3 kết quả của một toán tử lát cắt hình vuông trên bảng ở hình 1.1 Lát cắt hình vuông chỉ là một trường hợp đặc biệt... và sửa lại cho hợp từng bước Cuối cùng chúng ta đưa ra quan điểm kỹ thuật ở trên cũng có hiệu lực cho các ứng dụng khối dữ liệu hoặc roll-up đều với phép toán summarization khác hơn sum 1.4 Phép tính (Calculus) Trong đoạn này, chúng tôi hỗ trợ phép tính tương đương cơ sở dữ liệu đa chiều được trình bày đại số trong đoạn 1.3 Trong khi trong đại số chúng tôi tách biệt liên quan giữa cấu trúc và nội dung,

Ngày đăng: 26/04/2013, 11:19

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Marc Gyssens, Laks V.S. Lakshmanan, “A foundation for Multi-Demensional Databases” in Proceedings of the 23rd VLDB Conference Athens, Greece, 1997 Sách, tạp chí
Tiêu đề: A foundation for Multi-Demensional Databases
[2] Matteo Golfarelli, Dario Maio, and Stefano Rizzi “Applying Vertical Fragmentation Techniques on logical Design of Multidimensional Databases”DEIS – university of bologna, viale Risorgimento 2, 40136 Bologna, Italy Sách, tạp chí
Tiêu đề: Applying Vertical Fragmentation Techniques on logical Design of Multidimensional Databases
[3] Andreas Bauer, Wolfgang Hummer, Wolfgang lehner “An Alternative relationnal OLAP Modeling Approach” University of Erlangen-Nuremberg (database Systems) Sách, tạp chí
Tiêu đề: An Alternative relationnal OLAP Modeling Approach
[4] Rakesh Agrawal Ashish Gupta Sunita Sarawagi, “Modeling Multidimensional Databases” IBM Almaden ResearchCenter 650 Harry Road, San Jose CA 95120 Sách, tạp chí
Tiêu đề: Modeling Multidimensional Databases
[7] An Alternative Relational OLAP Modeling Approach Andreas Bauer, Wolfgang Hümmer, Wolfgang Lehner University of Erlangen-Nuremberg (Database Systems) Martensstr. 3, Erlangen, 91058, Germany EMail: {andreas.bauer Sách, tạp chí
Tiêu đề: An Alternative Relational OLAP Modeling Approach

HÌNH ẢNH LIÊN QUAN

MÔ HÌNH HÓA DỮ LIỆU ĐA CHIỀU - Mô hình hóa dữ liệu đa chiều
MÔ HÌNH HÓA DỮ LIỆU ĐA CHIỀU (Trang 1)
(iv) Khơng giống như mơ hình quan hệ, khơng cĩ rõ ràng, thích hợp chung chung, mơ hình khái niệm cho OLAP hoặc cũng được gọi là cơ sở dữ liệu đa chiều  (MDD) - Mô hình hóa dữ liệu đa chiều
iv Khơng giống như mơ hình quan hệ, khơng cĩ rõ ràng, thích hợp chung chung, mơ hình khái niệm cho OLAP hoặc cũng được gọi là cơ sở dữ liệu đa chiều (MDD) (Trang 6)
Hình 1.1: một ví dụ bảng hai chiều Sales với các chiều Category và Time. Tập  hợp tham biến kết hợp là: {Part, City} và {Year, Month}, riêng biệt - Mô hình hóa dữ liệu đa chiều
Hình 1.1 một ví dụ bảng hai chiều Sales với các chiều Category và Time. Tập hợp tham biến kết hợp là: {Part, City} và {Year, Month}, riêng biệt (Trang 6)
dung thực tế của bảng là trực giao cần thiết cho việc kết hợp cấu trúc, nghĩa là sự phân tán của các thuộc tính lên trên các chiều và dữ kiện - Mô hình hóa dữ liệu đa chiều
dung thực tế của bảng là trực giao cần thiết cho việc kết hợp cấu trúc, nghĩa là sự phân tán của các thuộc tính lên trên các chiều và dữ kiện (Trang 8)
Hình 1.2: view khái niệm của bảng hình 1.1. Cấu trúc lưu trữ thực sự và sự thực  thi không cần quan hệ. - Mô hình hóa dữ liệu đa chiều
Hình 1.2 view khái niệm của bảng hình 1.1. Cấu trúc lưu trữ thực sự và sự thực thi không cần quan hệ (Trang 8)
Hình 1.3 kết quả của một tốn tử lát cắt hình vuơng trên bảng ở hình 1.1. Lát cắt hình vuơng chỉ là một trường hợp đặc biệt của phép chọn quan hệ đã mở rộng cho  các bảng MDD. - Mô hình hóa dữ liệu đa chiều
Hình 1.3 kết quả của một tốn tử lát cắt hình vuơng trên bảng ở hình 1.1. Lát cắt hình vuơng chỉ là một trường hợp đặc biệt của phép chọn quan hệ đã mở rộng cho các bảng MDD (Trang 12)
Hình 1.3 kết quả của một toán tử lát cắt hình vuông trên bảng ở hình 1.1. Lát cắt  hình vuông chỉ là một trường hợp đặc biệt của phép chọn quan hệ đã mở rộng cho  các bảng MDD. - Mô hình hóa dữ liệu đa chiều
Hình 1.3 kết quả của một toán tử lát cắt hình vuông trên bảng ở hình 1.1. Lát cắt hình vuông chỉ là một trường hợp đặc biệt của phép chọn quan hệ đã mở rộng cho các bảng MDD (Trang 12)
Thêm vào đĩ các phép tốn ở trên biến đổi chủ yếu nội dung của bảng, chúng tơi giới thiệu hai phép tốn cấu trúc lại (restructuring) nĩ chỉ ảnh hưởng đến cấu trúc  của bảng - Mô hình hóa dữ liệu đa chiều
h êm vào đĩ các phép tốn ở trên biến đổi chủ yếu nội dung của bảng, chúng tơi giới thiệu hai phép tốn cấu trúc lại (restructuring) nĩ chỉ ảnh hưởng đến cấu trúc của bảng (Trang 13)
Ví dụ 1.3.2. Hình 1.4 minh họa một ứng dụng của phép toán fold và unfold - Mô hình hóa dữ liệu đa chiều
d ụ 1.3.2. Hình 1.4 minh họa một ứng dụng của phép toán fold và unfold (Trang 13)
Hình 1.5 sự minh họa của tính tốn khối dữ liệu trong ví dụ 1.3.7 với m= 3: (a) kết quả từ bước 2; (b) kết quả bảng cuối cùng từ bước 5. - Mô hình hóa dữ liệu đa chiều
Hình 1.5 sự minh họa của tính tốn khối dữ liệu trong ví dụ 1.3.7 với m= 3: (a) kết quả từ bước 2; (b) kết quả bảng cuối cùng từ bước 5 (Trang 18)
Hình 1.5 sự minh họa của tính toán khối dữ liệu trong ví dụ 1.3.7 với m = 3 : (a)  kết quả từ bước 2; (b) kết quả bảng cuối cùng từ bước 5. - Mô hình hóa dữ liệu đa chiều
Hình 1.5 sự minh họa của tính toán khối dữ liệu trong ví dụ 1.3.7 với m = 3 : (a) kết quả từ bước 2; (b) kết quả bảng cuối cùng từ bước 5 (Trang 18)
Hình 2.3 Mảng sự phân mảnh đại diện một giải pháp khả thi - Mô hình hóa dữ liệu đa chiều
Hình 2.3 Mảng sự phân mảnh đại diện một giải pháp khả thi (Trang 32)
Hình 2.3 Mảng sự phân mảnh đại diện một giải pháp khả thi - Mô hình hóa dữ liệu đa chiều
Hình 2.3 Mảng sự phân mảnh đại diện một giải pháp khả thi (Trang 32)
Hình 2.4 với mỗi truy vấn tỉ lệ giữa số của các trang đĩa khơng được đọc và với sự phân mảnh; trên mỗi cột số của các trang đĩa đọc khơng cĩ sự phân mảnh - Mô hình hóa dữ liệu đa chiều
Hình 2.4 với mỗi truy vấn tỉ lệ giữa số của các trang đĩa khơng được đọc và với sự phân mảnh; trên mỗi cột số của các trang đĩa đọc khơng cĩ sự phân mảnh (Trang 35)
Hình 2.4 với mỗi truy vấn tỉ lệ giữa số của các trang đĩa không được đọc và với  sự phân mảnh; trên mỗi cột số của các trang đĩa đọc không có sự phân mảnh - Mô hình hóa dữ liệu đa chiều
Hình 2.4 với mỗi truy vấn tỉ lệ giữa số của các trang đĩa không được đọc và với sự phân mảnh; trên mỗi cột số của các trang đĩa đọc không có sự phân mảnh (Trang 35)
Hình 2.5 Tỉ lệ giữa khơng gian lưu trữ cĩ và khơng cĩ sự phân mảnh - Mô hình hóa dữ liệu đa chiều
Hình 2.5 Tỉ lệ giữa khơng gian lưu trữ cĩ và khơng cĩ sự phân mảnh (Trang 36)
Hình 2.5 Tỉ lệ giữa không gian lưu trữ có và không có sự phân mảnh - Mô hình hóa dữ liệu đa chiều
Hình 2.5 Tỉ lệ giữa không gian lưu trữ có và không có sự phân mảnh (Trang 36)
Bảng I Các kết quả kiểm tra phức tạp n. truy vấn trong khối - Mô hình hóa dữ liệu đa chiều
ng I Các kết quả kiểm tra phức tạp n. truy vấn trong khối (Trang 36)
Ý tưởng chính của mơ hình đa chiều là mỗi chiều của khối dữ liệu đa chiều ví dụ như các sản  phẩm, các cửa hàng, hoặc thời gian cĩ thể được  xem như là phần của khĩa chính, tìm ra   tích Đề  các sản phẩm của các phần tử trong các chiều - Mô hình hóa dữ liệu đa chiều
t ưởng chính của mơ hình đa chiều là mỗi chiều của khối dữ liệu đa chiều ví dụ như các sản phẩm, các cửa hàng, hoặc thời gian cĩ thể được xem như là phần của khĩa chính, tìm ra tích Đề các sản phẩm của các phần tử trong các chiều (Trang 38)
Hình 3.2: Ví dụ các thuộc tính chiều - Mô hình hóa dữ liệu đa chiều
Hình 3.2 Ví dụ các thuộc tính chiều (Trang 38)
Hình 3.1 Ví dụ sự phân loại cấp bậcchúng tôi với các kỹ thuật truyền thống và đề xuất hai phương pháp khái quát hơn đó là các phương pháp mô hình thay thế. - Mô hình hóa dữ liệu đa chiều
Hình 3.1 Ví dụ sự phân loại cấp bậcchúng tôi với các kỹ thuật truyền thống và đề xuất hai phương pháp khái quát hơn đó là các phương pháp mô hình thay thế (Trang 38)
3.2.1. Lược đồ hình sao: - Mô hình hóa dữ liệu đa chiều
3.2.1. Lược đồ hình sao: (Trang 40)
tính của các phần tử chiều một cách rõ ràng đã qui định trong mơ hình đa chiều bị bỏ phí - Mô hình hóa dữ liệu đa chiều
t ính của các phần tử chiều một cách rõ ràng đã qui định trong mơ hình đa chiều bị bỏ phí (Trang 41)
Hình 3.4 Ví dụ bảng chiều lược đồ hình sao cho chiều sản phẩm - Mô hình hóa dữ liệu đa chiều
Hình 3.4 Ví dụ bảng chiều lược đồ hình sao cho chiều sản phẩm (Trang 41)
So sánh với phương pháp mơ hình cổ điển(hình 3.4), chỉ những thuộc tính cĩ giá trị trong bảng chiều mà nĩ được ứng dụng cho tất cả các phần tử chiều.Để địa chỉ  chính xác các nét đặc trưng, các bảng chiều con tương ứng được sử dụng, mà các  tên của chúng  - Mô hình hóa dữ liệu đa chiều
o sánh với phương pháp mơ hình cổ điển(hình 3.4), chỉ những thuộc tính cĩ giá trị trong bảng chiều mà nĩ được ứng dụng cho tất cả các phần tử chiều.Để địa chỉ chính xác các nét đặc trưng, các bảng chiều con tương ứng được sử dụng, mà các tên của chúng (Trang 44)
Để đặt nĩ vào bảng tĩm tắt, trong trường hợp phương pháp cổ điển, câu truy vấn (vơ nghĩa) như tìm tổng doanh thu của Home Appliances bởi ‘video system’   sẽ dẫn  đến một sự tìm kiếm hết trên bảng chiều - Mô hình hóa dữ liệu đa chiều
t nĩ vào bảng tĩm tắt, trong trường hợp phương pháp cổ điển, câu truy vấn (vơ nghĩa) như tìm tổng doanh thu của Home Appliances bởi ‘video system’ sẽ dẫn đến một sự tìm kiếm hết trên bảng chiều (Trang 45)
Hình 3.6: Bảng chiều tiêu biểu cho chiều sản phẩm (phương pháp thay thế) - Mô hình hóa dữ liệu đa chiều
Hình 3.6 Bảng chiều tiêu biểu cho chiều sản phẩm (phương pháp thay thế) (Trang 45)
Hình 4.1 Ví dụ khối dữ liệu. - Mô hình hóa dữ liệu đa chiều
Hình 4.1 Ví dụ khối dữ liệu (Trang 53)
Hình 4.1   Ví dụ khối dữ liệu. - Mô hình hóa dữ liệu đa chiều
Hình 4.1 Ví dụ khối dữ liệu (Trang 53)
Hình 4.2. Khối logic trong đĩ sales là một chiều. - Mô hình hóa dữ liệu đa chiều
Hình 4.2. Khối logic trong đĩ sales là một chiều (Trang 58)
quan tâm đến chiều Supplier và chỉ hiển thị chiều product, date và sales trong Hình 4.2 - Mô hình hóa dữ liệu đa chiều
quan tâm đến chiều Supplier và chỉ hiển thị chiều product, date và sales trong Hình 4.2 (Trang 58)
Hình 4.2. Khối logic trong đó sales là một chiều. - Mô hình hóa dữ liệu đa chiều
Hình 4.2. Khối logic trong đó sales là một chiều (Trang 58)
Hình 4.4 Chuyển số đầu của mỗi thành phần thành chiều sales - Mô hình hóa dữ liệu đa chiều
Hình 4.4 Chuyển số đầu của mỗi thành phần thành chiều sales (Trang 60)
Hình 4.4  Chuyển số đầu của mỗi thành phần thành chiều  sales - Mô hình hóa dữ liệu đa chiều
Hình 4.4 Chuyển số đầu của mỗi thành phần thành chiều sales (Trang 60)
của chiều mà khơng thỏa mãn điều kiện đã phát biểu. Hình 4.5 minh họa một ứng - Mô hình hóa dữ liệu đa chiều
c ủa chiều mà khơng thỏa mãn điều kiện đã phát biểu. Hình 4.5 minh họa một ứng (Trang 61)
Hình 4.5  Phép toán giới hạn - Mô hình hóa dữ liệu đa chiều
Hình 4.5 Phép toán giới hạn (Trang 61)
Hình 4.6 minh họa khố iC nối với khối C1 theo chiều D1 (hàm ánh xạ đồng nhất). Chiều D1 của khối kết quả chỉ cĩ 2 giá trị - Mô hình hóa dữ liệu đa chiều
Hình 4.6 minh họa khố iC nối với khối C1 theo chiều D1 (hàm ánh xạ đồng nhất). Chiều D1 của khối kết quả chỉ cĩ 2 giá trị (Trang 62)
Hình 4.6  minh họa khối  C  nối với khối  C1  theo chiều  D 1   (hàm ánh xạ đồng  nhất) - Mô hình hóa dữ liệu đa chiều
Hình 4.6 minh họa khối C nối với khối C1 theo chiều D 1 (hàm ánh xạ đồng nhất) (Trang 62)
Hình 4.7 Kết hợp hai khối - Mô hình hóa dữ liệu đa chiều
Hình 4.7 Kết hợp hai khối (Trang 64)
Hình 4.7  Kết hợp hai khối - Mô hình hóa dữ liệu đa chiều
Hình 4.7 Kết hợp hai khối (Trang 64)
Phép kết hợp là một phép tốn tập hợp. Nĩ được minh họa ở Hình 4.8. Hình minh họa cách phân cấp trong cơ sở dữ liệu đa chiều được thực hiện bởi phép tốn  kết hợp. - Mô hình hóa dữ liệu đa chiều
h ép kết hợp là một phép tốn tập hợp. Nĩ được minh họa ở Hình 4.8. Hình minh họa cách phân cấp trong cơ sở dữ liệu đa chiều được thực hiện bởi phép tốn kết hợp (Trang 65)
Phép kết hợp là một phép toán tập hợp. Nó được minh họa ở   Hình 4.8. Hình - Mô hình hóa dữ liệu đa chiều
h ép kết hợp là một phép toán tập hợp. Nó được minh họa ở Hình 4.8. Hình (Trang 65)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w