1. Trang chủ
  2. » Công Nghệ Thông Tin

Thuật ngữ OLAP và cơ sở dữ liệu đa chiều

32 900 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 32
Dung lượng 526,5 KB

Nội dung

Thuật ngữ OLAP và cơ sở dữ liệu đa chiều hay được đồng nhất với nhau, gây nên sự mập mờ xung quanh hai khái niệm này. Bản chất của cơ sở dữ liệu đa chiều là một kiến trúc cơ sở dữ liệu lưu giữ thông tin tổng hợp bao gồm tất cả các mục dữ liệu chính (hay các chiều) tham chiếu lẫn nhau. Còn bản chất cốt lõi của OLAP là dữ liệu được lấy ra từ DW hoặc DM sau đó được chuyển thành mô hình đa chiều và được lưu trữ trong một kho dữ liệu đa chiều (dữ liệu được lưu trữ theo mảng thay vì bản ghi như mô hình quan hệ). Công cụ OLAP lấy dữ liệu trong kho dữ liệu để thực hiện các công việc phân tích đặc biệt theo nhiều chiều và phức tạp hỗ trợ cho việc ra quyết định.Như vậy, OLAP là một thể hiện mặt trước cho phép người sử dụng đầu cuối lựa chọn các chiều và các sự kiện tham chiếu lẫn nhau. Các nguồn dữ liệu cho một ứng dụng OLAP bao gồm cơ sở dữ liệu đa chiều, cơ sở dữ liệu quan hệ và các dữ liệu bảng tính (lấy từ một kiến trúc CSDL bất kỳ). Nhưng vì kho dữ liệu đa chiều và các dịch vụ của OLAP thường được kết hợp với nhau nên mới có sự đồng nhất giữa 2 thuật ngữ trên.Từ đó nổi lên vấn đề cần quan tâm là: kho dữ liệu đa chiều và các dịch vụ của OLAP kết hợp với nhau như thế nào để đạt được những yêu cầu đa chiều của người sử dụng ? Hay đó chính là vấn đề lưu trữ trong OLAP.Với mong muốn biết rõ thêm về cách lưu trữ trong OLAP nên trong tiểu luận của mình, nhóm 5 xin trình bày một số tìm hiểu về: 1. Cách tổ chức hiệu quả đối với mảng đa chiều lớn2. Lưu trữ tích hợp dữ liệu cho truy vấn đa chiều3. Sự sắp xếp lại giá trị thuộc tính đối với hiệu quả của HOLAP4. DROLAP Một hướng tiếp cận dựa trên miền đặc đối với OLTPNhóm 5 xin chân thành cảm ơn sự hướng dẫn, giảng dạy tận tình của TS Trần Thanh Bình. Chắc chắn tiểu luận còn đơn giản và không tránh khỏi những sai sót, rất mong được sự chỉ bảo, góp ý của Thầy và các bạn để phần trình bày của nhóm 5 được hoàn chỉnh hơn.

Tiểu luận nhóm - Khoa học máy tính 2007 LỜI MỞ ĐẦU Thuật ngữ OLAP sở liệu đa chiều hay đồng với nhau, gây nên mập mờ xung quanh hai khái niệm Bản chất sở liệu đa chiều kiến trúc sở liệu lưu giữ thông tin tổng hợp bao gồm tất mục liệu (hay chiều) tham chiếu lẫn Còn chất cốt lõi OLAP liệu lấy từ DW DM sau chuyển thành mô hình đa chiều lưu trữ kho liệu đa chiều (dữ liệu lưu trữ theo mảng thay ghi mô hình quan hệ) Công cụ OLAP lấy liệu kho liệu để thực công việc phân tích đặc biệt theo nhiều chiều phức tạp hỗ trợ cho việc định Như vậy, OLAP thể mặt trước cho phép người sử dụng đầu cuối lựa chọn chiều kiện tham chiếu lẫn Các nguồn liệu cho ứng dụng OLAP bao gồm sở liệu đa chiều, sở liệu quan hệ liệu bảng tính (lấy từ kiến trúc CSDL bất kỳ) Nhưng kho liệu đa chiều dịch vụ OLAP thường kết hợp với nên có đồng thuật ngữ Từ lên vấn đề cần quan tâm là: kho liệu đa chiều dịch vụ OLAP kết hợp với để đạt yêu cầu đa chiều người sử dụng ? Hay "vấn đề lưu trữ OLAP" Với mong muốn biết rõ thêm cách lưu trữ OLAP nên tiểu luận mình, nhóm xin trình bày số tìm hiểu về: Cách tổ chức hiệu mảng đa chiều lớn Lưu trữ tích hợp liệu cho truy vấn đa chiều Sự xếp lại giá trị thuộc tính hiệu HOLAP DROLAP - Một hướng tiếp cận dựa miền đặc OLTP Nhóm xin chân thành cảm ơn hướng dẫn, giảng dạy tận tình TS Trần Thanh Bình Chắc chắn tiểu luận đơn giản không tránh khỏi sai sót, mong bảo, góp ý Thầy bạn để phần trình bày nhóm hoàn chỉnh Tiểu luận nhóm - Khoa học máy tính 2007 NỘI DUNG I CÁCH TỔ CHỨC HIỆU QUẢ CỦA MẢNG ĐA CHIỀU LỚN Các ứng dụng khoa học kỹ thuật thường sử dụng mảng đa chiều lớn Phương pháp thông thường việc lưu trữ mảng đa chiều định vị tuyến tính mảng bố trí cách tuyến tính tổ hợp đường ngang trục trật tự định trước Chiến lược (bắt chước cách mà Fortran lưu trữ mảng nhớ chính) dẫn đến kết tai hại nhớ thứ hai thứ ba Vì tối ưu hóa việc định vị mảng yêu cầu cấp thiết cho lưu trữ mảng đa chiều lớn Vấn đề lưu trữ mảng Chúng bắt đầu phần việc trình bày mô hình mẫu truy cập mà sử dụng để tối ưu hóa xếp đặt (bố trí) mảng Sau đó, mô tả bốn chiến lược tổ chức mảng phác họa thuật toán sử dụng để thi hành DBMS Xét mảng n chiều Chúng mô hình hóa yêu cầu truy cập người sử dụng hình chữ n chiều định vị nơi phạm vi mảng Hơn nữa, nhóm truy cập người sử dụng thành tập hợp lớp L1,….LK, Li chứa tất hình chữ nhật có kích cỡ cụ thể (Ai1,….,Ain) Cuối cùng, cho truy cập xuất đến số hình chữ nhật lớp thứ i với khả Pi Vì vậy, mẫu truy cập mảng miêu tả tập hợp: {(Pi, Ai1,Ai2,….,Ain) : ≤ i ≤ K} Tiểu luận nhóm - Khoa học máy tính 2007 Hình minh họa ví dụ mảng 10 x 10 Ba hình chữ nhật tô đậm (mỗi truy cập với khả 1/3) miêu tả việc truy cập vào hai lớp tương ứng với mẫu truy cập sau: Mẫu truy cập cung cấp người sử dụng đầu cuối xác định ví dụ thống kê truy cập mảng hệ thống quản lí sở liệu 1.1 Cắt khúc Thay sử dụng cách định vị tuyến tính kiểu FORTRAN, phân tích mảng thành khúc đa chiều, kích cỡ khối lưu trữ block A đơn vị chuyển giao sử dụng hệ thống tệp việc di chuyển liệu từ thiết bị lưu trữ đến thiết bị lưu trữ khác Hình dáng khúc chọn để cực tiểu hóa số khối trung bình tìm nạp cho mẫu truy cập đưa Để minh họa ý nghĩa việc cắt khúc xét ví dụ hình Hình 2(a) biểu diễn mảng chiều có kích cỡ X = 100, X2 = 2000 X3 = 8000 sử dụng cách lưu trữ định vị tuyến tính hình 2(b) minh họa cách lưu trữ tương tự sử dụng biểu diễn cắt khúc Giả sử mảng lưu trữ đĩa từ liệu chuyển giao nhớ đĩa khoảng 8Kb (trong ví dụ giả sử 8kb = 8000bytes) Tiểu luận nhóm - Khoa học máy tính 2007 Cho mẫu truy cập mảng {(0.5, 10, 400, 10), (0.5, 20, 5, 400)} Nếu mảng lưu trữ tuyến tính với X xem trục (as the innermost axis) theo sau X X1, biểu diễn hình 2(a), sau khối đĩa nắm giữ dòng giá trị dọc theo X Truy cập tìm nạp tổng 10 x 400 x = 4000 khối, truy cập thứ hai tìm nạp 20 x x = 100 khối Do đó, mẫu truy cập tìm nạp trung bình 4000 x 0.5 + 100 x 0.5 = 2050 khối Vì vậy, trung bình số byte yêu cầu vừa khớp khối, số lượng liệu tìm nạp gấp 410 lần lượng liệu thực tế sử dụng Giả sử chia mảng thành khúc 8Kb Hình dạng khúc hình khối (20,20,20) hình 2(b) Với mẫu truy cập giống nhau, số khối tìm nạp x 20 x lần truy cập x x 20 lần truy cập thứ hai, cho điểm bắt đầu hình chữ nhật truy cập hoàn toàn thẳng hàng với điểm bắt đầu khúc Số khối trung bình tìm nạp 20 x 0.5 + 20 x 0.5 = 20 mảng không cắt khúc 2050 Như vậy, kết cắt khúc làm giảm 100 lần số khối tìm nạp Nhằm thực cải tiến đó, cần cách để tối ưu hóa hình dạng khúc Bây trình bày định nghĩa xác toán Cho mảng n chiều [X1, X2,….,Xn] Xi chiều dài trục thứ i mảng, kích cỡ khối C mẫu truy cập {(P i, Ai1, Ai2,….,Ain): ≤ i ≤ K}, mục đích tìm hình dạng khúc mà mảng bị phân tách số khối trung bình tìm nạp nhỏ Hình dạng khúc định Tuple (c1,c2,…,cn) ci chiều dài trục thứ i khúc đa chiều Kích cỡ khúc nhập vào theo ràng buộc sau ci: Số khối trung bình tìm nạp mẫu truy cập theo lý thuyết hình dạng khúc cắt cho bởi: Tiểu luận nhóm - Khoa học máy tính 2007 Mục tiêu chọn hình dạng khúc cắt thõa mãn ràng buộc làm cho (1) cực tiểu Sự diện hàm trần (1) làm cho giải pháp hình thức khép kín khó khăn Một cách khác luôn tìm thấy giải pháp tối ưu cách tìm kiếm hết khía cạnh tất hình dạng mà thõa mãn ràng buộc kích cỡ Trong trường hợp này, số lượng hình dạng phát sinh theo luật số mũ theo chiều mảng Các phương pháp (kỹ thuật) khác sử dụng để hạn chế bớt không gian tìm kiếm Ví dụ: * Thay xét tất hình dạng có thể, tạo hình dạng lớn Một hình dạng lớn tăng chiều dài cạnh hình vi phạm đến ràng buộc kích thước Ví dụ, C = 15 n = hình dạng (5,3) cực đại (4,3) (5,2) không * Thay xem xét tất hình dạng có thể, trước tiên tạo giải pháp gấn tối ưu cách xem xét hình dạng có chiều dài cạnh lũy thừa Sau đó, giải pháp cải tiến cách xét hình dạng khác “vùng lận cận” với hình dạng xét Vùng lận cận bao gồm cạnh biến đổi từ đến gấp đôi cạnh tương ứng giải pháp gần tối ưu 1.2 Sắp xếp lại thứ tự Một lần mảng bị cắt khúc, cần đến phương pháp tốt để bố trí khúc cắt đĩa Cách tự nhiên bố trí khúc cách quay ngang mảng bị cắt khúc theo thứ tự trục Do đó, thứ tự trục khác dẫn đến việc bố trí khúc khác Lần tìm nạp khối cho hình chữ nhật yêu cầu giảm cách chọn thứ tự trục bên phải Bây xuất phát từ công thức đơn giản để tìm thứ tự tốt trục mảng cho khoảng cách tìm kiếm trung bình để lấy thông tin từ hình chữ nhật trung bình mẫu truy cập giảm xuống Chúng ta cho khối mảng đặt (bố trí) kề đĩa cylinder (một đơn vị lưu trữ bao gồm tập rãnh ghi chiếm vị trí) sử dụng hoàn toàn trước định vị liệu cylinder kế Tiểu luận nhóm - Khoa học máy tính 2007 tiếp Việc phân tích có liên quan đĩa sử dụng riêng cho phục hồi mảng liệu (retrievals on the array data) Xét mảng n chiều [X1, X2…Xn] chia thành khúc có dạng [c1,c2,…cn] Bổ đề Số rãnh ghi để tìm kiếm đĩa yêu cầu truy cập (y 1, y2,…,yn) là: zi = [yi/ci], di = Xi /ci (giả sử ci chia Xi xác) B số khối cylinder đĩa Bổ đề 2: Cho mẫu truy cập, giá trị biểu thức (2) tính toán mức trung bình tất phần tử mẫu truy cập cực tiểu thứ tự 1,2,…,n (với n trục cùng) Để minh họa thuận lợi việc xếp lại thứ tự trục mảng ta xét ví dụ hình 2(b) Giả sử số khối cylinder 60 Khi với mẫu truy cập cho hình số rãnh trung bình tìm kiếm (theo bổ đề 1) 67 thứ tự trục mảng (X 1, X2, X3) Sử dụng bổ đề 2, đổi lại thứ tự trục (X1, X3, X2) số rãnh tìm kiếm giảm xuống 17 1.3 Sự dư thừa Bố trí liệu sử dụng kích cỡ khúc làm giảm đến mức tối thiểu chi phí truy cập trung bình, nghĩa có hiệu vài hình chữ nhật không hiệu hình khác Chúng đề xuất việc trì dư thừa mảng mà tổ chức theo cách khác để tối ưu Tiểu luận nhóm - Khoa học máy tính 2007 lớp khác mẫu truy cập Cụ thể, chia lớp mẫu truy cập thành nhiều phân vùng (partition - phần khu vực lưu trữ đĩa cứng) số đề xuất tối ưu cho phân vùng kết hợp (tức tạo mối liên kết phân vùng) Do đó, bước tìm R phân vùng, R số thõa thời gian truy cập lũy tích (cumulative access time) truy vấn lớp mẫu truy cập cực tiểu Chúng ta làm điều cách sử dụng hai hướng tiếp cận sau: * Sử dụng brute force để thử tất phân vùng chọn phần vùng tốt Trong trường hợp xấu nhất, số phân vùng xét thuộc số mũ theo số phần tử mẫu truy cập * Sử dụng phương pháp (kỹ thuật) nhóm vector để nhóm lớp thành cluster Chúng ta có tập hợp bắt đầu K lớp muốn chia chúng thành R cluster Ban đầu, lớp thuộc cluster khác trộn cặp cluster với khoảng cách có trọng số tối thiểu chúng lại R clusters Khi yêu cầu đọc đến mảng hệ thống thực theo thời gian trước tiên tìm mảng (sao chép) với chi phí truy cập ước lượng nhỏ Chi phí ước lượng tổng trọng số số khối tìm nạp, khoảng cách tìm kiếm chuyển đổi phương tiện truyền thông (trong trường hợp thiết bị thứ ba) Sau chi phí tối thiểu dùng để trả lời truy vấn 1.4 Phân chia Thiết bị nhớ thứ ba hệ thống lưu trữ robo-line gồm có số lượng lớn phương tiện truyền thông (các băng từ đĩa) vài ổ đĩa đọc-ghi Một đầu đọc (robot arm) chuyển đổi phương tiện (media) ngăn xếp (shelves) ổ đĩa mười giây Để cải tiến thực số lần chuyển đổi phương tiện yêu cầu để truy cập hình chữ nhật yêu cầu nên làm nhỏ Mảng nên phân chia cho phần mảng thường xuyên bị truy cập Tiểu luận nhóm - Khoa học máy tính 2007 nằm phương tiện Chúng ta mở rộng phương pháp cắt khúc để xử lý việc chuyển đổi phương tiện cách: * Xây dựng kích cỡ khúc cắt (chunk) đĩa thay khối đĩa (disk block) * Cực tiểu hóa số lượng đĩa chuyển đổi đĩa thay số lượng trang tìm nạp (number of page fetches) Việc phân chia sử dụng để cực tiểu hóa chuyển đổi phương tiện cho đĩa lẫn thiết bị băng từ Tuy nhiên, băng từ thời gian tìm kiếm trung bình (45 giây) lớn so với thời gian chuyển đổi Do đó, cực tiểu hóa chuyển đổi phương tiện định (crucial) cực tiểu hóa thời gian tìm kiếm II LƯU TRỮ TÍCH HỢP CHO TRUY VẤN ĐA CHIỀU Hệ thống OLAP hệ thống hỗ trợ công cụ phân tích xử lý liệu đa chiều Ngày vấn đề đặt công nghệ kho liệu giải mẫu thuẫn việc ngày truy vấn phức tạp, với nhiều đòi hỏi cấp bậc cao với việc không ngừng nâng cao, cải tiến tốc độ trả lời truy vấn, tích hợp liệu Một phương pháp giải vấn đề đó, tìm hiểu ứng dụng cache hoạt động (Active cache) Chunk-based caching: Chunk-based caching lý thuyết nâng cao hiệu xử lý liệu OLAP đa chiều, chiều tổ chức thành không gian đa chiều (multidimension space) liệu tham chiếu vào không gian Với chiều (dữ liệu) giá trị phân biệt khác phân vào vùng riêng biệt, không gian đa chiều phân thành chunk (khúc liệu) Hình 1: chiều Sản phẩm Thời gian tổ chức vào không gian đa chiều Trong mô hình (lược đồ) chunk-based caching kết truy vấn mà chứa cache nằm chunk chunk chịu quản lý cache Và có truy vấn nhiệm vụ cache xác định dò chunk Tiểu luận nhóm - Khoa học máy tính 2007 lưu kết truy vấn Với phương thức đó, danh sách mục chunk gồm phần, phần chứa trả lời truy vấn nạp vào cache, phần hai chunk thiếu (chưa nạp vào cache), để hoàn thiện việc trả lời truy vấn chunk thiếu nạp truy vấn lựa chọn SQL (selection SQL) từ backend Tích hợp cache: Trong mô hình đa chiều, có nhiều cấp bậc tích hợp khác nhau, cấp bậc tương ứng với hoạt động group-by khác Các group-by tổ chức dạng mạng lưới mà nối với mối quan hệ “có thể xử lý bằng” Với group-by có nhiều mối quan hệ Một cách tổng quát, group-by (x1, y1 , z1) xử lý group-by (x2, y2 , z2) x1 ≤ x2, y1 ≤ y2 z1 ≤ z2 xét ví dụ sau: group-by (0,2,0) xử lý (0,2,1) (1,2,0) Khi sử dụng chunk-based caching vấn đề nảy sinh phức tạp khó khăn nhiều Vói tính chất đóng kín nên tương ứng chunk với cấp bậc tích hợp đơn sơ Ví dụ chunk cấp bậc (0,2,0) xem chunk ánh xạ đến tập hợp chunk cấp bậc (1,2,0) mà ta gọi chunk Để xử lý chunk (0,2,0) từ (1,2,0), cần chunk (1,2,0) Điều có lẻ xảy với chunk (1,2,0) lưu cache chunk xử lý thông qua chunk khác, điều có nghĩa có chunk xử lý cache Do đó, để biết chunk có phải xử cache hay không, ta phải dò hết mối quan hệ liên quan đến chunk mạng lưới từ group-by chứa chunk đến group-by Hình có nhiều cách khác để xử lý chunk (0,2,0) từ mạng lưới, ví dụ việc dùng phương pháp thông thường để xử lý chunk cache Phương pháp tìm kiếm vét cạn: Phương pháp tìm kiếm vét cạn (ESM) phương pháp tìm kiếm thông thường chunk xử lý từ cache Nếu chunk thuộc vào chunk Tiểu luận nhóm - Khoa học máy tính 2007 thiếu, tìm kiếm theo đường dẫn đến group-by để nạp chunk vào xử lý cache Ta có thuật toán sau: Bổ đề 1: Cho lược đồ n chiều, hi bậc kích thước chiều i Giả sử (l1, l2, l3 ln) cấp bậc group-by, ta có (0,0,0 ) cấp bậc tích hợp (h1, h2, h3 hn) cấp bậc Khi số đường dẫn mạng lưới từ cấp bậc group-by đến group-by tính theo công thức: Phương pháp dựa đếm ảo: Phương pháp dựa đếm ảo (VCM) cải tiến phương pháp thông thường (ESM), xuất phát từ hai ý tưởng: Do cấu trúc mạng lưới nên ESM tìm kiếm theo đường dẫn khác có đỉnh thăm nhiều lần Có nhiều truy vấn chunk theo nghĩa ta dùng mục trạng thái cache siêu thông tin chunk Ví dụ 3: 10 Tiểu luận nhóm - Khoa học máy tính 2007 ra, có thuật toán nén để giúp làm giảm yêu cầu lưu trữ ROLAP Trong khác, MOLAP nhanh hơn, đặc biệt tập hợp khối liệu dày đặc Có phần ngoại vi Speedware Microsoft sử dụng ghép lai OLAP (HOLAP), vùng lưu trữ dày đặc khối sử dụng MOLAP lưu trữ tạm thời sử dụng gần ROLAP Trong từ khác thay đổi thuận lợi có hiệu khối liệu mỏng hoàn chỉnh vùng dày đặc lưu trữ mảng đa chiều phần lại thưa thớt mô tả danh sách giá trị với sở liệu quan hệ 2 yrs $732 $643 $450 $43 $76 2 yrs $54 $450 $732 $76 $12 $643 Bảng 1: Hai bảng miêu tả khối lượng việc bán hàng theo ngày mức kinh nghiệm người bán hàng Cho ba thành phố có người có kinh nghiệm, vài thứ tự (trên cùng) khiến lưu trữ có hiệu (HOLAP) cách khác (dưới cùng) Trong tồn phương pháp giải có hiệu khác để tìm khối dày đặc khối liệu, vấn đề đối diện khối (sub-cube) phụ thuộc chuẩn hoá, tương tự liệu với giá trị thuộc tính thứ tự khác có lẽ có khối dày đặc khác hoàn toànvà lưu trữ nhiều hiệu đáng kể Một vấn đề có liên quan với MOLAP HOLAP giá trị thuộc tính quy tắc xếp, miêu tả xác lựa chọn cho khối tuỳ ý Trong ví dụ người bán hàng, hình dung “vị trí” có giá trị “Ottawa”, “Toronto”, “Montreal”, “Halifax”, “Vancouver” Cách xếp thành phố: điều khoảng dân số, khoảng cách, kinh độ thứ tự abc? Coi ví dụ cho bảng 1: rỏ ràng cách 18 Tiểu luận nhóm - Khoa học máy tính 2007 thực HOLAP phụ thuộc vào chuẩn khối liệu Chúng ta tin chuẩn lưu trữ hiệu thường dẫn đầu để thực thi truy vấn tốt Một cách mà tiêu chuẩn áp dụng giá trị thuộc tính không số mẫu Một tham số chuẩn trái ngược giá trị thuộc tính số mà lưu trữ sơ đồ mục từ giá trị đến mục thực tế lượng khối để lưu trữ mở rộng Một khối liệu với n giá trị thuộc tính chiều: nói khối regular n-regular Hầu hết cách khờ khạo để lưu trữ lựơc đồ cho giá trị thuộc tính hợp lý lưu trữ mục mời số nguyên từ đến n Ra vẻ số so sánh sử dụng lưu trữ khoảng logn bits, có nghĩa nlogn bits đòi hỏi Tuy nhiên, mảnglưu trữ sở khối liệu thông thường sử dụng n bits Trong khía cạnh khác, ngoại trừ d=1, dạng chuẩn dễ nhận thấy chủ đề tất chiều chuẩn hoá Trong trường hợp d=2 tương tự để nén tranh, nơi mà pixel xếp lại theo chiều rộng sử dụng kỹ xảo Trong khối liệu đa chiều, khả có lợi có thật Các khối liệu thứ tự khối Trong phần này, cho d số chiều (hoặc thuộc tính) khối liệu C n i , với Chúng ta cho thấy việc mã hoá m1 x m2 x … x md d / +1 block hiệu thấp khối liệu có mức độ dày đặc ρ tất block Trong trường hợp vậy, có giá trị lưu trữ thưa d/2+1 cho cell cấp phát ρ giá trị lưu trữ thưa d / +1 d / +1 Dựa vào khối liệu C, H(C) biểu giá trị lưu trữ Chúng ta có #C [...]... một khối dữ liệu, một lượt đồ từ tất cả các giá trị thuộc tính dựa vào một sự đo lường Trong ví dụ trên, một cách có thể vạch ra một lược đồ gồm ngày , kinh nghiệm của người bán hàng, và vị trí tương ứng số lượng của việc bán hàng Chúng ta phân biệt giữa hai kiểu của phương pháp OLAP: OLAP quan hệ (ROLAP) và OLAP đa chiều (MOLAP) Trong ROLAP, dữ liệu được lưu trữ chính nó trong một cơ sở dữ liệu quan... chủ đề và tất cả các chiều có thể được chuẩn hoá Trong trường hợp d=2 là tương tự để nén một bức tranh, nơi mà các pixel được sắp xếp lại theo một chiều rộng sử dụng kỹ xảo Trong các khối dữ liệu đa chiều, khả năng có lợi là có thật 1 Các khối dữ liệu sắp thứ tự khối Trong phần này, cho d là số chiều (hoặc thuộc tính) của khối dữ liệu C và n i , với 1

Ngày đăng: 04/09/2016, 11:14

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w