Mô hình hóa dữ liệu đa chiều
ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KHOA HỌC TIỂU LUẬN MÔN HỌC DATA WAREHOUSE Đề tài: MÔ HÌNH HÓA DỮ LIỆU ĐA CHIỀU Giáo viên hướng dẫn : TS. Nguyễn Thanh Bình Học viên thực hiện: Nhóm 7 Nguyễn Trí Nhân Trần Thái Sơn Trần Kiên Lớp Cao học Khoa học máy tính – Khoá 2008 - 2010 Hueá, thaùng 6/2009 A. MỞ ĐẦU .2 B. NỘI DUNG .3 1. Nền tảng cho cơ sở dữ liệu đa chiều (A Foundation for Multi-Dimensional Databases) .3 1.1. Giới thiệu 3 1.2. Mô hình dữ liệu đa chiều(Multi-Dimensional Data Model) .5 1.3.Toán tử đại số(Algebra) 9 1.4. Phép tính (Calculus) .16 2. Ứng dụng kỹ thuật phân mảnh theo chiều dọc trong thiết kế logical của cở sở dữ liệu đa chiều (Applying vertical fragmentation techniques in logical design of Multidimensional Databases) 20 2.1. Giới thiệu 20 2.2. Kiến thức nền(Background) .22 2.2.1 Khối và mô hình(Cubes and Patterns) .22 2.2.2 The Workload 23 2.2.3 Các view 25 2.3. Phân mảnh dọc của các view 26 2.3.1 Problem Statement 27 2.3.2 Hàm chi phí (Cost Function) .30 2.3.3. Tiếp cận nhánh và cận (Branch-and-Bound) .31 2.4 . Test thử nghiệm .32 3. Một trong hai phương pháp mới cho mô hình ROLAP 35 3.1. Giới thiệu: .35 3.2. Phương pháp ROLAP truyền thống: 37 3.2.1. Lược đồ hình sao: .38 3.2.2. Lược đồ bông tuyết: .39 3.2.3. Tóm tắt và kết luận: 40 3.3. Cách thiết kế Object-Relational: 43 3.3.1. Định nghĩa kiểu: .43 3.3.2. Các định nghĩa Bảng Typed: 45 3.3.3. Thao tác dữ liệu: .46 3.4. Tóm tắt và kết luận: 48 4. Mô hình cơ sở dữ liệu đa chiều (Modeling Multidimensional Databases) .49 4.1. Cơ sở dữ liệu đa chiều hiện tại .51 4.1.1. Ví dụ 51 4.1.2. Thuật ngữ 51 4.1.3. Ví dụ 52 4.1.4. Thực hiện xây dựng 53 4.1.5. Chức năng yêu cầu thêm vào .53 4.2. Mô hình dữ liệu đề xuất .54 4.2.1. Mô hình 54 4.2.2. Các phép toán .55 4.3. Áp dụng các phép toán vào câu truy vấn 64 4.3.1. Nhận xét 64 4.3.2. Áp dụng phép toán vào câu truy vấn .67 4.4 Kết luận và phương hướng .68 C. KẾT LUẬN 71 D. TÀI LIỆU THAM KHẢO 72 1 A. MỞ ĐẦU Hiện nay, cơ sở dữ liệu đa chiều được quan tâm đáng kể cho sự phát triển trong lĩnh vực phân tích kinh doanh và các ứng dụng hỗ trợ quyết định. Codd đã đề xuất khái niệm OLAP để biểu diễn dữ liệu của tổ chức kinh doanh bằng mô hình đa chiều, thực hiện phân tích dữ liệu trực tuyến bằng cách sử dụng các công thức toán học hoặc sự phân tích thống kê phức tạp hơn và dữ liệu tổng kết thống nhất. Công nghệ cơ sở dữ liệu quan hệ được cho là thích hợp hơn đối với việc quản lí các giao tác thực tế và các truy vấn đặc biệt. Mặc khác, OLAP hỗ trợ phân tích trực tuyến phức tạp, một vài vấn đề mà mô hình quan hệ truyền thống ít được hỗ trợ. Để giải quyết điều này, nhiều nhà cung cấp đã phát triển sản phẩm OLAP, ví dụ như Arbor Software’s Essbase và Oracle Express… Mô hình đa chiều đang trở nên quan trọng như một tầng logic đối với dữ liệu truy vấn trong OLAP. Khía cạnh chính của dữ liệu đa chiều là sự tách rời các chiều và các dữ kiện. Trong khi các chiều mô tả dữ liệu tĩnh một cách tương đối, các dữ kiện cơ sở đã được mô tả giống như các điểm trong các không gian đã định nghĩa bởi các chiều. Một số mô hình đa chiều cho OLAP gần đây đã hợp nhất các chiều như là các thực thể. Tiểu luận “Mô hình hoá dữ liệu đa chiều” là tổng hợp nội dung của bốn bài báo tương ứng với bốn phần: Phần 1 Nền tảng cho cơ sở dữ liệu đa chiều A Foundation for Multi-Dimensional Databases (Thực hiện: Nguyễn trí Nhân) Phần 2 Ứng dụng kỹ thuật phân mảnh theo chiều dọc trong thiết kế logical của cở sở dữ liệu đa chiều Applying vertical fragmentation techniques in logical design of Multidimensional Databases (Thực hiện: Nguyễn Trí Nhân) Phần 3 Một trong hai phương pháp mới cho mô hình ROLAP (Thực hiện: Trần Kiên ) Phần 4 Trình bày mô hình cơ sở dữ liệu đa chiều (Thực hiện: Trần Thái Sơn) 2 B. NỘI DUNG 1. Nền tảng cho cơ sở dữ liệu đa chiều (A Foundation for Multi- Dimensional Databases) Tóm tắt Chúng tôi trình bày mô hình khối dữ liệu đa chiều có thể phục vụ như một mô hình khái niệm cho các ứng dụng phân tích trực tuyến on line (On-Line Analytical Processing (OLAP)). Bên cạnh cung cấp các chức năng cần thiết cho các ứng dụng dựa trên OLAP, nổi bậc của mô hình hỗ trợ sự tách biệt rõ ràng giữa cấu trúc và nội dung liên quan cho phép chúng ta định nghĩa ngôn ngữ thao tác, cách trong suốt. Cụ thể chỉ ra rằng thao tác khối(cube) dữ liệu có thể được trình bày dễ dàng. Cụ thể định nghĩa đại số và phép tính để biểu diễn chúng tương đương. Kết luận bởi việc so sánh phương pháp tới công việc liên quan. Khái niệm của mô hình cơ sở dữ liệu đa chiều là trực giao tới sự cài đặc, nó không phải là chủ đề của bài này. 1.1. Giới thiệu Gần đây, có sự quan tâm quan trọng trong hệ thống cơ sở dữ liệu đa chiều cho phân tích thương mại tiến triển và các ứng dụng hỗ trợ quyết định. Codd đưa ra khái niệm OLAP cho dữ liệu doanh nghiệp biểu diễn trong viễn cảnh đa chiều, thực hiện phân tích on-line của công thức toán học sử dụng dữ liệu hoặc phức tạp hơn phân tích thống kê và dữ liệu hợp nhất (consolidating and summarizing data) [Cod93, CCS93]. Điều đó tin rằng công nghệ cơ sở dữ liệu quan hệ là phù hợp tốt hơn cho quản lý giao dịch mạnh mẽ. Nói cách khác, OLAP gọi cho phân tích trực tuyến on- line phức tạp, đôi khi mô hình quan hệ truyền thống tỏ ra hỗ trợ ít. Cung cấp thêm cần thiết này, một vài máy bán tự động (vendor) thực sự phát triển các sản phẩm OLAP ví dụ Arbor Software’s Essbase and Oracle Ex- press gọi tên chỉ hai. Nhiều sản phẩm này chụi sự giới hạn theo: (i) Ad-hoc(truy vấn bộc phát) và không hỗ trợ ngôn ngữ truy vấn phức tạp tương tự như SQL; (ii) Tương tác người sử dụng thường bị giới hạn một thao tác ở một thời điểm. 3 (iii) Khung nhìn dữ liệu trong viễn cảnh đa chiều phức tạp bao gồm thuộc tính chứa đựng xử lý như các tham chiều và duy trì chúng như là dữ kiện(measures), phân tích chúng như một “hàm”(“function”) của các tham biến; nhiều sản phẩm xử lý bất đồng bộ các chiều và dữ kiện cuối cùng. (iv) Không giống như mô hình quan hệ, không có rõ ràng, thích hợp chung chung, mô hình khái niệm cho OLAP hoặc cũng được gọi là cơ sở dữ liệu đa chiều (MDD). Nhiều sự thành công của cơ sở dữ liệu quan hệ có thiết lập logic rõ ràng cho mô hình dữ liệu, đầu tiên là Codd phát triển và sau đó đông đảo các nhà nghiên cứu. Trong phần này chúng tôi đưa ra như sau: 1. Phát triển mô hình khái niệm đơn giản cho OLAP hoặc MDD. 2. Có hỗ trợ kiến trúc bốn tầng cho ngôn ngữ truy vấn OLAP. Chỉ rằng sự tách biệt liên quan của nội dung chống lại cấu trúc, còn có thể phát triển đơn giản đại số mạnh mẽ và một tính toán tương đương, cả hai phù hợp đặc trưng xử lý tới tất cả bốn mức của kiến trúc. Hình 1.1: một ví dụ bảng hai chiều Sales với các chiều Category và Time. Tập hợp tham biến kết hợp là: {Part, City} và {Year, Month}, riêng biệt. Thuộc tính dữ kiện là Cost và Sale; Minh họa ở trên, chúng ta trình bày trong đại số thao tác khối dữ liệu thông dụng gần đây hỗ trợ bởi Gray et al.[GBLP95] cũng như hữu dụng và thực hành giá trị thu hút hơn. 4 Trong phần này tổ chức như sau. Trong đoạn 1.2 trình một sự giới thiệu không hình thức mô hình dữ liệu cho MDD. Trong đoạn 1.3 và 1.4, trình bày một đại số và phép tính cho MDD và minh họa năng lực biểu diễn theo các ví dụ. Biểu diễn cả hai ngôn ngữ tương đương trong khả năng biểu diễn. 1.2. Mô hình dữ liệu đa chiều(Multi-Dimensional Data Model) Từ quan điểm nhận thức, OLAP được gọi cho 4 loại cơ bản sau: 1. Truy vấn(Querying): khả năng đưa ra truy vấn bộc phát một sự đơn giản giao diện khai báo. 2. Cấu trúc lại(Restrucring): khả năng cấu trúc lại thông tin trong sự bùn nổ cơ sở dữ liệu đa chiều của dữ liệu và đưa ra(bring out) phối cảnh khác của dữ liệu. 3. Sự phân loại(Classifition): khả năng phân loại hoặc nhóm tập dữ liệu trong phong cách thích hợp cho tổng kết theo sau: 4. Tổng kết(Summarization/Consolidation): Đây là tổng quát hóa của các phép toán đại số trong chuẩn SQL. Tổng quát summarization ánh xạ đa tập(multisets) của giá trị của một kiểu số tới một kiểu chuỗi(single), giá trị“hợp nhất”. Chúng tôi truy tìm một mô hình khái niệm và ngôn ngữ truy vấn đó là có thể hỗ trợ tất cả các chức năng ở trên và cho phép chúng tương tác với mỗi đối tượng khác kiểu liền mảnh(seamless). Cấu trúc dữ liệu cơ bản của dữ liệu đa chiều là cái chúng tôi gọi là bảng n chiều(n-dimensional table). Trước tiên đưa ra trực giác bên cạnh nó. Chúng ta mong ước có thể nhìn giá trị thuộc tính chắc chắn như một “chức năng” khác, trong bất kỳ cái cách nào phù hợp với chúng, khả năng bùn nổ vữa lót(rendering) đa chiều. Vẽ trên thuật ngữ của dữ liệu thông kê, chúng ta có thể phân loại tập thuộc tính kết hợp với lược đồ của một bảng vào trong hai loại: tham biến và dữ kiện. Không có sự phân biệt ưu tiên(priori) giữa tham biến và dữ kiện trong thuộc tính bất kỳ đó có chọn lựa vai trò. Một ví dụ bảng hai chiều được cho trong hình 1.1. Ở mức khái niệm, chúng ta cần mô hình của chúng ta duy trì thân thiện mô hình quan hệ chuẩn nếu có thể, do đâu thân dôi ra(rich body) của lý thuyết và công nghệ phát triển tốt cho mô hình quan hệ sẽ lúc đó dồn cho mô hình OLAP Một cách tự nhiên thực thi đối tượng này là thừa nhận đó chiều của các bảng là một đặc trưng cấu trúc vốn có, cái mà đầy đủ ý nghĩa nhất khi bảng là đưa tới cho người dùng. Nội 5 dung thực tế của bảng là trực giao cần thiết cho việc kết hợp cấu trúc, nghĩa là sự phân tán của các thuộc tính lên trên các chiều và dữ kiện. Việc phân tách cả hai đặc tính dẫn đến view quan hệ của một bảng. Ví dụ đầu vào trong “ô”đầu tiên(tức là đầu cực trái) của bảng trong hình 1.1 đầu vào chứa (5, 6) tương ứng với bộ (PC, Montreal, 1996, Jan, 5,6) trên lược đồ {Part, City, Year, Month, Cost, Sale}trong view quan hệ của bảng đó. Hình 1.2: view khái niệm của bảng hình 1.1. Cấu trúc lưu trữ thực sự và sự thực thi không cần quan hệ. Chúng ta bây giờ chính thức mô tả không hình thức ở trên, trong định nghĩa của một bảng n chiều. Như thường lệ, chúng tôi giả sử hai tập hợp các ký hiệu phân biệt và vô hạn: N là một tập hợp tên và V là tập hợp các giá trị. Định nghĩa 1.2.1 (lược đồ bảng và thể hiện-Table Schemas and Instances) Một lược đồ bảng (Table Schema) n chiều là một bộ ba <D, R, par> ở đây D={ d 1 , ., d n } là một tập hợp các tên chiều, R={A 1 , ., A m } là tập các thuộc tính và par: D → 2 { 1 A , ., m A } , thoả mãn (i) Với mọi i,j=1, ,n, i ≠ j, par(d i ) I par(d j ) = ∅ và (ii) U d ∈ D par(d) ⊆ R Chúng ta thường ký hiệu par(d i ) bởi X i Cho M = R – 1 i n ≤ ≤ U X i. Một thể hiện(instance) của một bảng lược đồ n chiều <D, R, par> là một tập hợp n + 1 quan hệ hữu hạn theo dạng rd 1 (Tid, X 1 ), . , rd n (Tid, X n ), r m (rd 1 .Tid, ., rd n .Tid, M), thoả mãn 6 (i) Sự kết hợp Tid 1 Tid n (rd ) . (rd )π × ×π bằng )( ., .,. 1 rm TidrdTidrd n π , nghĩa là với mỗi sự kết hợp của các giá trị Tid trong các quan hệ rd 1 , ., rd n , có ít nhất một bản ghi tương ứng trong rm, và mỗi bản ghi trong rm tương ứng với một số sự kết hợp của các giá trị Tid trong các quan hệ rd 1, .rd n ; (ii) Với mọi i = 1, , n, Tid là một khoá của quan hệ rd i ; và (iii) với mọi i,j=1, ,n, i ≠ j, Tid i Tid j (rd ) (rd ) π π =∅ I , nghĩa là các giá trị Tid trong các quan hệ khác nhau rd i và rd j là rời nhau. Như vậy, một cơ sở dữ liệu được xếp thành bảng đa chiều (MDD–Multi Dimensional Databasse) là một tập các bảng. Trong định nghĩa 1.2.1, một bảng có một tập R gồm m thuộc tính và n chiều (n ≥ 0) d 1 , ., d n kết hợp với nó. Mỗi chiều được mô tả bởi một tập hợp con riêng biệt của các thuộc tính từ R, gọi là các tham số của chiều đó. Các thuộc tính trong R mà chúng không phải là tham số của bất kỳ chiều nào thì chúng được gọi là các thuộc tính dữ kiện của bảng. Bằng trực giác, chúng ta có thể xem các bản ghi trong các quan hệ rd 1 , ., rd n như là “các tọa độ”(coordinates) trong các chiều d 1 , ., d n theo thứ tự định sẵn. Từ quan điểm này, một bảng có thể được xem như là sự kết hợp của một tập các bộ trên các thuộc tính dữ kiện với mỗi điểm (t 1 , ., t n ) trong không gian n chiều, ở đây i=1, ., n, t i là giá trị T id duy nhất kết hợp với một bộ trong quan hệ rd i . Ngược lại, với mỗi bản ghi (t i , i i a ) rd∈ ur , chúng ta nói rằng i a ur là bộ X i đã trình bày bởi t i. Rõ ràng rằng, Các quan hệ truyền thống tương ứng với tất cả các bảng 0 chiều của các thuộc tính của chúng về cơ bản là các thuộc tính dữ kiện. Chúng ta đồng ý khung nhìn khái niệm của bảng đa chiều là hoàn toàn độc lập với cấu trúc lưu trữ hoặc chỉ đạo thực thi sử dụng cho các bảng này. Ví dụ 1.2.1 xem lược đồ bảng hai chiều Sales = ( {Category, Time}, {Part, City, Year, Month, Cost, Sale}, par), ở đây par(Category) = {Part, City} và par( Time) = {Year, Month}. Một thể hiện của lược đồ này bao gồm 3 quan hệ rCategory(Tid, Part, City), rTime(Tid, Year, Month), và rm((r)C(ategory).Tid, (r)T(ime).Tid, Cost, Sale) là biểu diễn trong hình 1.2. được hiển thị trong hình 1.2. Thể hiện này thực sự thoả mãn các ràng buộc trong định 7 nghĩa 1.2.1. Bảng thể hiện này thực sự tương ứng với bảng được chỉ ra trong hình 1.2.1. Chúng ta biểu diễn Tiếp theo rằng mọi bảng MDD có thể biểu diễn chính xác bởi quan hệ truyền thống và ngược lại trong trực giác đó chúng ta hẳn làm chính xác ở mức dưới. Chúng ta cần kết quả kết quả trong đoạn 1.3 để phát triển ngữ nghĩa đơn giản cho mỗi phép toán đại số cổ điển. Trước khi chúng ta có thể biểu kết quả trên, chúng tôi phải giới thiệu khái niệm đầy đủ của quan hệ với lược đồ bảng. Định nghĩa 1.2.2(Đầy đủ-Completion) Cho r(A 1 , ., A m ) là một quan hệ và S = <D, {A 1 , ., A m }, par> là một lược đồ bảng. Như thường lệ, chúng ta ký hiệu X i =par (d i ). Thì sự đầy đủ(completion) của r với mối liên hệ S, ký hiệu S r , được định nghĩa là quan hệ nhỏ nhất thoả mãn. (i) r ⊆ S r và (ii) Với tất cả các sự kết hợp của bộ n aa .,, 1 , với mọi i =1, ., n, i a uv ở trong i X π (r), nhưng ( n aa .,, 1 ) không ở trong 1 n X , . X ,π (r), chúng ta thấy rằng ( 1 n a , ,a u uuv v , ⊥ uv ) ở trong S r . Ở đây ⊥ uv là một bộ gồm |M| ký hiệu ⊥ tương ứng với các thuộc tính dữ kiện. Bằng trực giác, quan hệ r ở trên là tương đương với S r đầy đủ (completion) của nó: Các ký hiệu ⊥ thêm vào ở đó chỉ đơn thuần là do các giá trị rỗng không thích hợp trong việc biểu diễn dữ liệu đa chiều. Cho R là lược đồ quan hệ, và S = <D, R, par> là một lược đồ bảng. Cho ℜ (R) là lớp của tất cả các quan hệ hữu hạn trên R và T(S) là lớp của tất cả của các thể hiện của bảng lược đồ S. Cuối cùng, cho s R(R) = { S r | r ∈ ℜ (R) }. Chúng ta nói rằng lược đồ bảng S biểu diễn chính xác lược đồ quan hệ R (và ngược lại)đã cho và có sự tương ứng 1 – 1 từ lớp của các bảng T(S) đến lớp của các quan hệ s R)( ℜ . Định lý 1.2.1 Cho R là lược đồ quan hệ, và cho S = <D, R, par> là lược đồ bảng. Thì R biểu diễn chính xác S (và ngược lại). 8 [...]... các phép toán như khối dữ liệu hoặc roll-up cũng có thể được biểu diễn trong các phép tính 18 19 2 Ứng dụng kỹ thuật phân mảnh theo chiều dọc trong thiết kế logical của cở sở dữ liệu đa chiều (Applying vertical fragmentation techniques in logical design of Multidimensional Databases) Tóm tắt: Trong ngữ cảnh của cở sở dữ liệu đa chiều được sử dụng quan hệ DBMS thông qua lược đồ hình sao, kỹ thuật ảnh... trị theo vài mô hình kết tập(aggregation patterns), nghĩa là tập hợp các thuộc tính chiếm(taken) từ các bảng chiều để định nghĩa thô của kết tập Ngay cả dữ liệu tổng kết(summarized) theo từng mô hình được tổ chức vào một lược đồ hình sao, toàn bộ bản thực tế được gọi là view và import các thuộc tính bao gồm trong mẫu, dữ kiện được giá trị thu được của việc áp dụng một phép toán kết tập dữ liệu trong... trình bày một chiều có thể cho phân tích Một MD được thực hiện trên một quan hệ DBMS thường được tổ chức theo như vậy gọi là mô hình sao, trong đó mỗi khối(cube) được thể hiện bằng một lưu trữ bảng thực tế, dữ kiện và một bảng chiều denormalized cho mỗi chiều hướng của phân tích Khóa chính của mỗi bảng chiều (thường là khóa đại diện, tức là tạo ra nội bộ) import vào trong bảng thực tế,…; khóa chính của... trên thỏa thuận(trade-off) việc đọc dữ kiện kém và các bộ kém hơn Nói chung các nhân tố khác được xem xét trong thỏa thuận số định hình thực tế khóa bảng: cho các mô hình kém hơn, chiều dài của khóa là ngắn hơn và kích thước của các bộ đọc là nhỏ hơn Khả năng trả lời cho câu hỏi một truy vấn bằng nối phân mảnh truy cập của các mô hình khác các tác động về việc tối ưu hóa các truy vấn của cây thực thi... bảng chiều( dimension) Với mục đích của đơn giản hơn, chúng tôi sẽ xem xét các khả năng bình thường các bảng chiều đạt được lược đồ hình bông tuyết Định nghĩa 2.1 Cho một cube f, mô hình kết tập (hoặc mô hình đơn giản) trên f là tập P ⊂ Attr ( f ) như vậy mà không có tồn tại phụ thuộc hàm giữa mỗi cặp thuộc tính trong P: ∀ai ∈P (∃ai ∈P; ai →a j ) / Tham chiếu tới khối Lineltem, các ví dụ của các mô hình. .. cơ sở dữ liệu đa chiều được tập hợp nghiên cứu rộng rãi và quan tâm thị trường như lõi cuả ứng dụng hỗ trợ quyết định cũng như data warehouses Một cơ sở dữ liệu đa chiều( MD) có thể xem là một tuyển tập của "cubes" tập trung trên thực tế của lợi ích (thí dụ người bán hàng trong một dãy các cửa hiệu); trong một cube, mỗi một ô chứa đựng thông tin có ích về qui trình quyết định,… , một tập hợp của dữ kiện,... cở sở dữ liệu đa chiều là điều hành(operating) Nếu không, các nhà thiết kế có thể thử để xác định một lõi workload một priori: trên thực tế, nói cách khác, người sử dụng thông thường là biết trước kiểu dữ liệu phân tích, người ta sẽ thực hiện thường xuyên hơn cho các mục đích quyết định(decisional) hoặc thống kê; nói cách khác, một số lượng đáng kể các truy vấn được nhằm mục đích rút trích dữ liệu tóm... quan hệ trực tiếp đến cấu trúc của các bảng đa chiều, xét cho cùng thì kết quả của các toán tử được biểu diễn thành bảng là thích hợp với việc các quan hệ đã biểu diễn bằng cơ sở dữ liệu được xếp thành bảng ban đầu Ý tưởng này sẽ được phát triển trong phần sau 1.3.Toán tử đại số(Algebra) Trong đoạn này, chúng tôi phát triển một phép toán đại số cho dữ liệu đa chiều Trước khi tiến hành với trình bày toán... nửa nếu sự lựa chọn bao gồm các thuộc tính dữ kiện, định nghĩa của nó hơi khác và bất đối xứng ở trên Một định nghĩa trực tiếp sự lựa chọn bao gồm các tham biến và dữ kiện thậm chí phức tạp hơn Người đọc có thể dễ dàng hình dung sự phức tạp trong trường hợp nối giữa hai bảng MDD 9 Hình 1.3 kết quả của một toán tử lát cắt hình vuông trên bảng ở hình 1.1 Lát cắt hình vuông chỉ là một trường hợp đặc biệt... và sửa lại cho hợp từng bước Cuối cùng chúng ta đưa ra quan điểm kỹ thuật ở trên cũng có hiệu lực cho các ứng dụng khối dữ liệu hoặc roll-up đều với phép toán summarization khác hơn sum 1.4 Phép tính (Calculus) Trong đoạn này, chúng tôi hỗ trợ phép tính tương đương cơ sở dữ liệu đa chiều được trình bày đại số trong đoạn 1.3 Trong khi trong đại số chúng tôi tách biệt liên quan giữa cấu trúc và nội dung,