Một số mô hình phân tích dữ liệu trực tuyến điển hình

Một phần của tài liệu Phân tích dữ liệu phục vụ công tác quản lý đào tạo tại trường CĐSP Hưng Yên (Trang 30)

1.4.3.1. Mô hình MOLAP

Mô hình OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (là dữ liệu từ các bảng của KPL hoặc KDL chủ đề) và thông tin tổng hợp (là các độ đo được tính toán từ các bảng) trong các cấu trúc đa chiều gọi là các khối. Các cấu trúc này được lưu bên ngoài KDL chủ đề hoặc KPL [1].

Hình 1.7 Mô hình dữ liệu MOLAP

Lưu trữ các khối trong cấu trúc MOLAP là tốt nhất cho các truy vấn tổng hợp dữ

liệu thường xuyên mà cần thời gian hồi đáp nhanh.

Mô hình MOLAP cho phép thực hiện các truy vấn phân tích dữ liệu tốt nhất vì các đặc điểm sau:

Thông tin tổng hợp và dữ liệu cơ sở được lưu trữ trong cấu trúc đa chiều.

Các thao tác kết nối, là một trong những thao tác tốn chi phí nhất của mô hình

quan hệ, thì không cần thiết.

MOLAP sử dụng các thuật toán nén dữ liệu cho phép lưu trữ với ít không gian

hơn.

MOLAP sử dụng chỉ mục bitmap cho hiệu quả thực thi tốt hơn.

MOLAP lấy dữ liệu trong khối rất nhanh bằng cách sử dụng các xử lý truy vấn

tốc độ cao và cache dữ liệu. Thông tin nhận được từ khối và các bảng OLAP cơ sở chỉ được truy xuất thông tin chi tiết.

MOLAP không sử dụng cơ chế khoá vì dữ liệu chỉ đọc cho phép đọc.

MOLAP có thể được nạp trước vào bộ nhớ truy cập nhanh.

Dữ liệu có thể dễ dàng sao chép đến máy khách cho phân tích không trực tuyến.

1.4.3.2. Mô hình ROLAP

Mô hình OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở và thông tin tổng hợp trong các bảng quan hệ. Các bảng này được lưu trữ trong cùng cơ sở dữ liệu như là các bảng của KDL chủ đề hoặc KPL [1].

Hình 1.8 Mô hình dữ liệu ROLAP

Lưu trữ các khối trong cấu trúc ROLAP là tốt nhất cho các truy vấn dữ liệu

không thường xuyên. Ví dụ như nếu 80% người dùng chỉ truy vấn dữ liệu trong vòng

một năm trở lại đây, các dữ liệu cũ hơn một năm sẽ được đưa vào một cấu trúc ROLAP để giảm không gian đĩa bị chiếm dụng, hơn nữa còn để loại trừ dữ liệu trùng lắp. Lưu trữ dữ liệu trong cấu trúc ROLAP cung cấp các lợi ích sau:

ROLAP cho phép Cube Builder tự động tạo chỉ mục.

ROLAP ánh xạ các tổng hợp có sẵn từ KDL chủ đề hoặc KPL. OLAP Manager

được phép xử dụng các tổng hợp có sẵn để tổng hợp mà không cần tính toán lại cho mỗi truy vấn.

ROLAP tạo đòn bẩy cho hệ quản trị cơ sở dữ liệu quan hệ nhằm cho các nhà

quản trị hệ thống duy trì nó hiệu quả hơn.

ROLAP hỗ trợ Microsoft SQL Server, Oracle, Access và Open Database

Connectivity (ODBC).

1.4.2.3 Mô hình HOLAP

Mô hình OLAP lai (HOLAP) là sự kết hợp giữa MOLAP và ROLAP [1].

Lưu trữ các khối trong cấu trúc HOLAP là tốt nhất cho các truy vấn tổng hợp dữ liệu thường xuyên dựa trên một lượng lớn dữ liệu cơ sở.

Lợi ích của việc lƣu trữ trong cấu trúc HOLAP là:

Lấy dữ liệu trong khối nhanh hơn bằng cách sử dụng truy vấn tốc độ cao của

MOLAP.

Tiêu thụ ít không gian lưu trữ hơn MOLAP.

Tránh trùng lắp dữ liệu.

Kỹ thuật HOLAP đã giải quyết một số thách thức của việc thực thi MOLAP. Kỹ thuật này là một phương pháp ghép, trong đó các tập hợp ở mức cao hơn mà đã được truy cập thì thường được lưu trữ ở máy chủ và nhiều thông tin có thể chia tách thì được lưu trữ ở trong KDL. Kỹ thuật này đã được phát triển để tăng cường việc xác định các khối lớn hơn mà không ảnh hưởng đến thời gian xây dựng nó. Việc thiết kế khối có thể bổ sung các chi tiết hoặc chiều vào trong khối mà không làm tăng chi phí tổng thể của MOLAP [14].

1.4.3.4. So sách các mô hình:

Các mô hình lưu trữ tiêu biểu hỗ trợ OLAP được thể hiện ở bảng sau [1]:

Bảng 1.4 So sánh tổng hợp ba mô hình lưu trữ tiêu biểu hỗ trợ OLAP:

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thông tin tổng hợp Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn Nhanh nhất Chậm nhất Nhanh

Tiêu thụ không gian lưu trữ Nhiều Thấp Trung bình

Chƣơng 2. NHU CẦU PHÂN TÍCH DỮ LIỆU ĐÀO TẠO TẠI TRƢỜNG CĐSP HƢNG YÊN

Giới thiệu vai trò của CNTT trong dạy và học, công tác quản lí đào tạo; thực trạng ứng dụng CNTT tại trường CĐSP Hưng Yên; thực trạng và nhu cầu phân tích dữ liệu đào tạo tại của trường CĐSP Hưng Yên; ý nghĩa việc nghiên cứu để tìm ra quan hệ giữa kết quả tuyển sinh với kết quả học tập của HSSV.

Một phần của tài liệu Phân tích dữ liệu phục vụ công tác quản lý đào tạo tại trường CĐSP Hưng Yên (Trang 30)

Tải bản đầy đủ (PDF)

(71 trang)