Với ví dụ 5, hình 3.18, đây là kết quả tồn khĩa học của mỗi sinh viên, nhìn vào hình vẽ người xem cĩ thể nhận kết quả của sinh viên qua các kì học, đại đa số càng những kì cuối kết quả cao hơn những kì đầu. Nguyên nhân gây ra vấn đề này cĩ thể do tâm lý, mơi trường thay đổi, ngành học…Điều đĩ, giúp những tân sinh viên khĩa mới xác định tâm lý ngay từ đầu bước vào giảng đường đại học.
Thơng qua các báo cáo đã thiết kế ở các ví dụ trên, những người lãnh đạo cĩ thể lợi dụng các kết quả này để điều chỉnh chương trình học đào tạo phù hợp, điều chỉnh các mơn học cho phù hợp với từng kỳ học, của mỗi hệ đào tạo khác nhau, quyết định dự kiến điểm đầu vào để thu hút nhân tài và nâng cao chất lượng đào tạo.
3.3.4. Tính ưu việt của báo cáo xây dựng từ kho dữ liệu [16]
Hệ quản trị cơ sở dữ liệu SQL Server 2008 xây dựng dịch vụ báo cáo là sự nâng cấp của bản 2000, 2005. Nhĩm tác giả của cuốn sách “Wrox - Professional Microsoft SQL Server 2008 Report Services (2008)” đã khẳng định được tính ưu việt vượt trội hơn hẳn so với một số cơng cụ tạo báo cáo truyền thống như Crystal Reports…
Báo cáo thiết kế đã được sử dụng các cơng cụ Crystal Reports, ví dụ, sẽ thường là một chút đe dọa bởi các cơng cụ báo cáo thiết kế dịch vụ này, họ cĩ thể khơng quen thuộc và với các tính năng nghèo nàn hơn.
Dịch vụ báo cáo là giải pháp báo cáo mở cho phép tạo, xuất bản và phân phối các báo cáo doanh nghiệp chi tiết một cách dễ dàng cả bên trong và bên ngồi tổ chức. Các báo cáo cĩ thể xuất ra nhiều dạng file và truy cập bằng cách gửi địa chỉ tới một trạm internet hoặc mạng cục bộ một cách thích hợp thành lập để máy chủ, do đĩ, nĩ khá linh hoạt.
Dịch vụ báo cáo đáp ứng các nhu cầu của dân cơng nghệ thơng tin nĩi chung và các chuyên gia nĩi riêng. Người thiết kế báo cáo khơng quá tốn nhiều thời gian để hồn thành một báo cáo; tùy biến các dạng hiển thị biểu đồ theo ý muốn.
Hơn thế nữa, dịch vụ báo cáo ngồi việc tạo ra các báo cáo thơng thường, dịch vụ cịn tạo ra các báo cáo cho phép dự đốn được sự thay đổi về dữ liệu, ra quyết định trong tương lai mà một báo cáo truyền thống khĩ làm được điều đĩ.
3.4. Kết luận chƣơng 3
Chương này trình bày các vấn đề:
Hiện trạng dữ liệu và nhu cầu xây dựng kho.
Xây dựng kho dữ liệu về điểm của sinh viên: Thơng tin về dữ liệu điểm, kiến trúc của kho dữ liệu, các chiều dữ liệu, các bước cài đặt kho dữ liệu.
Xây dựng báo cáo từ kho dữ liệu phục vụ quản lý: Yêu cầu về xây dựng báo cáo, lợi ích của báo cáo trong BI, xây dựng báo cáo và kết quả, tính ưu việt của báo cáo được xây dựng từ kho dữ liệu.
Chƣơng 4 - KHAI THÁC DỮ LIỆU TỪ KHO DỮ LIỆU 4.1. Ứng dụng kỹ thuật KPDL để dự báo, dự đốn
4.1.1. Yêu cầu dự báo, dự đốn xu thế
a. Yêu cầu chung
Trong cơng tác giáo dục - đào tạo. Bài tốn hoạch định chiến lược đào đạo của đơn vị nĩi chung, của một trường học nĩi riêng là yêu cầu trọng điểm và nâng cao hiệu quả đào tạo, thu hút sinh viên. Trong việc hoạch định chiến lược đào tạo cĩ nhiều vấn đề phải giải quyết: nguồn nhân lực, trang thiết bị, đội ngũ cán bộ giáo viên cĩ kinh nghiệm, xây dựng và quản lý chương trình đạo tạo, chỉ tiêu đào tạo... Ngồi những vấn đề này; việc quản lý, theo dõi tình hình học tập của sinh viên theo các ngành nghề khác nhau là một vấn đề quan trọng để đưa ra chỉ tiêu tuyển sinh của trường một cách nhanh và chính xác nhất. Cung cấp các báo cáo, thơng tin cho ban lãnh đạo đầy đủ và nhanh chĩng nhất, một loạt câu hỏi hĩc búa cần phải giải quyết như:
Làm thế nào để trường dự đốn đúng được chỉ tiêu tuyển sinh vào các ngành nghề?
Làm thế nào để thu hút, bồi dưỡng được nguồn lực tại trường mình?
Làm thế nào để lập kế hoạch cơng việc và đánh giá hiệu quả làm việc của cán bộ một cách chính xác và khách quan nhất?
Làm thế nào để đưa ra các báo cáo một cách nhanh và trực quan nhất?
b. Yêu cầu cụ thể:
Từ các yêu cầu chung hình thành các yêu cầu cụ thể bước đầu:
Hồn chỉnh bước đầu, lưu trữ đầy đủ thơng tin cơ bản của hồ sơ liên quan đến cán bộ: Thơng tin cơ bản, thơng tin cá nhân, thơng tin cơng việc;
Lưu trữ đầy đủ thơng tin cơ bản của hồ sơ liên quan đến học sinh - sinh viên: Thơng tin cá nhân, thơng tin về điểm của nhiều khĩa học liên tiếp nhau.
Quản lý được nguồn lực: Đáp ứng được việc hỗ trợ xây dựng quy trình nhân sự như: tuyển dụng, quy trình đánh giá nguồn nhân lực, đào tạo, giám sát bổ sung biên chế…;
Quản lý và xây dựng chương trình đào tạo cho phù hợp với từng chuyên ngành, từng loại hình đào tạo.
Giải pháp lưu trữ dữ liệu: Cơ sở dữ liệu thiết kế cĩ cấu trúc mở, dễ liên lạc với các hệ thống cơ sở dữ liệu khác liên quan hoặc thiết kế kho dữ liệu để lưu trữ. Tuy nhiên với 2 giải pháp này, nếu thiết kế cơ sở dữ liệu bằng phương pháp truyền thống thì bị hạn chế bởi kích thước về dữ liệu, tốc độ xử lý các truy vấn bị hạn chế nên giải pháp về kho dữ liệu là khả thi.
Dựa trên kho dữ liệu mà chúng tơi đã trình bày ở chương 3. Chúng tơi muốn khai thác dữ liệu tiền ẩn từ kho dữ liệu về điểm mà mình đã xây dựng. Với việc
khai thác nguồn ngữ liệu phong phú này sẽ giúp lãnh đạo của trường theo dõi được thơng tin về tình hình học tập, mối quan hệ giữa các mơn học…Từ đĩ, Dự đốn sinh viên học giỏi mơn tốn cĩ kết quả học tập cao khơng? Dự đốn kết quả của sinh viên trong năm học tiếp theo? quyết định chỉ tiêu tuyển sinh vào các ngành nghề một cách phù hợp nhất, điều chỉnh chương trình đào tạo cho phù hợp, đưa ra các chiến lược tuyển sinh phù hợp ở các năm sau.
4.1.2. Ưu điểm của một số thuật tốn khai phá trong BI
a. Ƣu điểm của phƣơng pháp Decision Tree:
Dễ dàng xây dựng.
Phân lớp mẫu mới nhanh
Dễ dàng diễn giải cho những cây cĩ kích thước nhỏ.
Độ chính xác chấp nhận được so với các kỹ thuật phân lớp khác trên nhiều tập dữ liệu lớn.
b. Ƣu điểm của phƣơng pháp Nạve Bayes:
Dễ cài đặt
Thời gian thi hành tương tự như cây quyết định.
Đạt kết quả tốt trong phần lớn các trường hợp.
Nhược điểm:
Giả thiết về tính độc lập điều kiện của các thuộc tính làm giảm độ chính xác.
4.2. Xây dựng mơ hình dự báo dựa trên Data Mining Tool
Trong phạm vi luận văn, chúng tơi sử dụng 3 thuật tốn: Microsoft Decision Tree, Microsoft Neural Network, Microsoft Nạve Bayes. [13], [15], [17]
4.2.1. Khảo sát dự đốn kết quả học tập của sinh viên
Xây dựng mơ hình khai phá dữ liệu:
Hình 4.1 – Cấu trúc mơ hình dùng cho các thuật tốn: Decision Tree, Nạve Bayes, Neural Network
Mơ hình khai phá:
Trong một mơ hình khai phá bao gồm các thuộc tính đầu vào, thuộc tính khĩa và thuộc tính dự đốn.