.6 Khối xét tuyển trong công tác tuyển sinh

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân tích dữ liệu phục vụ công tác quản lý đào tạo tại trường CĐSP hưng yên (Trang 28 - 31)

Một khối dữ liệu không nhất thiết phải có cấu trúc 3 chiều (3-D), nhưng về cơ bản là có thể có N chiều (N-D).

Dữ liệu nguồn: Dữ liệu nguồn của một khối chỉ ra nơi chứa KPL cung cấp dữ

Các chiều: Các chiều được ánh xạ từ các thông tin của các bảng chiều trong

KPL vào các mức phân cấp, ví dụ như chiều Điểm trung bình chung toàn khóa

thì gồm các mức như Điểm trung bình chung năm học, Điểm trung bình chung

học kỳ, Điểm trung bình chung môn học. Các chiều có thể được tạo một cách độc

lập và có thể chia sẻ giữa các khối nhằm xây dựng các khối dễ dàng và để chắc chắn rằng thông tin tổng hợp cho phân tích luôn ổn định.

Chiều ảo: Chiều ảo là một dạng đặc biệt của chiều mà ánh xạ các thuộc tính từ

các thành viên của một chiều khác để sau đó có thể được sử dụng trong các khối.

Ví dụ, một chiều ảo của thuộc tính Điểm trung bình chung toàn khóa môn Triết

cho phép một khối tổng hợp dữ liệu như Điểm trung bình chung toàn khóa môn

Triết của các sinh viên nữ hoặc như Điểm trung bình chung toàn khóa môn Triết

của các sinh viên nam. Các chiều ảo và các thuộc tính thành viên được đánh giá là cần thiết cho các truy vấn và chúng không đòi hỏi phải có các khối lưu trữ vật lý.

Các độ đo: Các độ đo xác định các giá trị số từ bảng sự kiện mà được tổng hợp

cho phân tích như hệ số môn học, hệ số các bài thi, bài kiểm tra.

Các phân hoạch: Các phân hoạch là các vật lưu trữ dữ liệu đa chiều của khối.

Mỗi khối chứa ít nhất một phân hoạch, và dữ liệu của khối có thể kết hợp từ nhiều phân hoạch. Mỗi phân hoạch có thể lấy dữ liệu một nguồn dữ liệu khác nhau và có thể lưu trong một vị trí riêng biệt. Dữ liệu của một phân hoạch có thể được cập nhật độc lập với các phân hoạch khác trong một khối. Các phân hoạch của một khối có thể được lưu trữ độc lập trong các cách thức khác nhau với các mức độ tổng kết khác nhau. Các phân hoạch không thể hiện đối với người dùng, đối với họ một khối là một đối tượng đơn, và chúng cung cấp các tuỳ chọn đa dạng để quản lý dữ liệu OLAP.

Khối ảo: Là một khung nhìn logic của các phần chia của một hoặc nhiều khối.

Một khối ảo có thể được sử dụng để kết nối các khối khác nhau để chia sẻ một chiều chung nào đó, ví dụ như có thể kết hợp giữa khối Xét tuyển và khối Kết quả tuyển sinh nhằm các mục đích phân tích đặc biệt nào đó trong khi duy trì các khối tách biệt cho đơn giản.

Như vậy, OLAP là một thành phần trong các phần mềm cơ sở dữ liệu, cung cấp giao diện qua đó người sử dụng có thể biến đổi hoặc giới hạn các dữ liệu sơ khai tuỳ theo các hàm đã định nghĩa hoặc do chính người sử dụng định nghĩa. OLAP bao gồm việc tập hợp một số lượng khổng lồ các dữ liệu hết sức đa dạng, có thể là hàng triệu mục dữ liệu trong các mối quan hệ phức tạp. Mục tiêu của OLAP là phân tích các mối quan hệ đó và tìm kiếm các mô hình, xu hướng...

1.4.2. Vai trò của OLAP trong việc thể hiện dữ liệu

Hiện nay, đã có rất nhiều phần mềm cung cấp cho người sử dụng những khả năng truy vấn và lập các báo cáo thông tin, đặc biệt là các hệ quản trị cơ sở dữ liệu

quan hệ. Tuy nhiên, CSDL quan hệ, với cấu trúc hai chiều (dòng và cột), đã không được thiết kế để cung cấp các quan điểm đa chiều trên dữ liệu đầu vào của các phân tích phức tạp. Sử dụng các hệ thống này, chúng ta sẽ gặp rất nhiều khó khăn và bất tiện trong việc tổ chức dữ liệu đa chiều vào các bảng hai chiều. Hệ thống không thể triển khai dữ liệu phân tích với số lượng lớn, công cụ phân tích để tạo ra các dữ liệu quyết định không mạnh, thuận tiện, linh hoạt, nhanh chóng. Hệ thống không dễ dàng để sử dụng đối với các nhà quản lý, những người ra quyết định [4].

Để có khả năng cung cấp những dữ liệu quyết định cho những người ra quyết định, cần sử dụng một cách lưu trữ dữ liệu cho phép họ quản lý, khai thác dữ liệu dễ dàng hơn. Cách lưu trữ dữ liệu này là KDL. Một KDL là một CSDL được thiết kế để trả lời các câu hỏi của tổ chức. Nó là nơi chứa nhiều loại dữ liệu tổ chức từ các nguồn khác nhau (các hệ thống xử lý tác vụ). Dữ liệu từ những nguồn này được chuyển dịch vào trong KDL, được đánh chỉ mục, và được kết nối lại để có thể được truy xuất nhanh chóng và dễ dàng hơn, phục vụ cho các ứng dụng trợ giúp ra quyết định. Và một khi dữ liệu đã được thu thập, người sử dụng còn cần có một cách tốt để dễ dàng khai thác chúng, nhằm truy xuất được các mẫu dữ liệu mà họ quan tâm. Hệ thống OLAP giúp cho họ làm điều này [4].

Hệ thống OLAP là một hệ thống quản lý dữ liệu giàu năng lực. Nó cho phép người sử dụng phân tích dữ liệu qua việc cắt dữ liệu theo nhiều khía cạnh khác nhau, khoan xuống mức chi tiết hơn hay cuộn lên mức tổng hợp hơn của dữ liệu. Bản chất cốt lõi của OLAP là dữ liệu được lấy ra từ KDL hoặc từ KPL chủ đề sau đó được chuyển thành mô hình đa chiều và được lưu trữ trong một KPL đa chiều [4].

Trong khi KPL và KDLchủ đề lưu trữ dữ liệu cho phân tích, thì OLAP là kỹ thuật cho phép các ứng dụng máy khách truy xuất hiệu quả dữ liệu này. OLAP cung cấp nhiều lợi ích cho người phân tích, ví dụ như [1]:

Cung cấp mô hình dữ liệu đa chiều trực quan cho phép dễ dàng lựa chọn, định

hướng và khám phá dữ liệu.

Cung cấp một ngôn ngữ truy vấn phân tích, cung cấp sức mạnh để khám phá

các mối quan hệ trong dữ liệu kinh doanh phức tạp.

Dữ liệu được tính toán trước đối với các truy vấn thường xuyên nhằm làm cho

thời gian trả lời rất nhanh đối với các truy vấn đặc biệt.

1.4.3. Một số mô hình phân tích dữ liệu trực tuyến điển hình 1.4.3.1. Mô hình MOLAP 1.4.3.1. Mô hình MOLAP

Mô hình OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (là dữ liệu từ các bảng của KPL hoặc KDL chủ đề) và thông tin tổng hợp (là các độ đo được tính toán từ các bảng) trong các cấu trúc đa chiều gọi là các khối. Các cấu trúc này được lưu bên ngoài KDL chủ đề hoặc KPL [1].

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân tích dữ liệu phục vụ công tác quản lý đào tạo tại trường CĐSP hưng yên (Trang 28 - 31)

Tải bản đầy đủ (PDF)

(71 trang)