Chương 3. Thiết kế hệ thống dự đoán kết quả học tập của sinh viên
3.2. Phương pháp giải quyết bài toán
3.2.2. Xây dựng kho dữ liệu
Ta dựa trên công cụ BI được cài đặt sẵn trong hệ quản trị SQL Server 2008:
Bước 1: Tạo mới 1 project (Analysis Services Project)
Hình 3.2. Sử dụng Analysis Services Project Bước 2: Tạo một Data Source
Tạo 1 data source kết nối đến cơ sở dữ liệu quản lý Điểm ở trên.
Hình 3.3. Kết nối DataSource
Bước 3: Tạo Data Source View
Trong Data Source View, chọn dữ liệu lấy từ kho dữ liệu có tên là FinalDiem.
Hình 3.4. DataSource View FinalDiem Bước 4: Tạo dữ liệu khối (Cubes)
Bước này giúp ta tạo dữ liệu khối cho phân tích bằng cách nháy chuột phải lên Cube và chọn New Cube. Bấm Next tiếp tục và hệ thống sẽ tự động dò tìm các bảng sự kiện và bảng chiều.
Hình 3.5. Khối dữ liệu và các chiều
3.2.3. Khai phá từ kho dữ liệu a) Khối dữ liệu
Panel bên trái chứa các Measure (độ đo) và các chiều đã định nghĩa khi xây dựng khối. Panel bên phải chia làm 2 cửa sổ. Cửa sổ trên dùng để xác định các điều kiện để phân tích. Cửa sổ dưới chứa kết quả các Measure khi ta kéo thả (drag and drop) các measure từ panel bên trái qua. Tùy theo mục đích phân tích mà xác lập các biểu thức phân tích cho phù hợp.
Với thiết lập như dưới đây có nghĩa là cho biết điểm các môn học của sinh viên khóa 52 thuộc kỳ 1 năm học 2011-2012.
Hình 3.6. Khối dữ liệu Diem_MonHoc b) Xây dựng mô hình khai phá
Thuật toán luật kết hợp của Microsoft là một sự thực hiện đơn giản của thuật toán Apriori nổi tiếng, một công cụ rất hữu ích cho việc phân tích giỏ thị trường.
Bước 5: Tạo một Mining model structure.
Chọn luật kết hợp:
Hình 3.7. Tạo mới mô hình khai phá Lựa chọn chiều từ khối dữ liệu:
Hình 3.8. Lựa chọn chiều từ khối dữ liệu
Lựa chọn thuộc tính cho mô hình khai phá:
Hình 3.9. Lựa chọn thuộc tính cho mô hình khai phá
Chọn Key là MaSinhVien và TenMonHoc, cột dùng để dự đoán (Input) là DiemMH, các cột cần dự doán (Predictable) là DiemMH.
Đặt tên cho mô hình khai phá:
Hình 3.10. Đặt tên cho mô hình khai phá Màn hình Mining Models như sau:
Hình 3.11. Màn hình Mining Models
Hiệu chỉnh tham số cho mô hình: Trong cửa sổ Mining Models, bấm phím phải chuột vào Microsoft_Association_Rules và chọn Set Algorithm Parameters và thiết lập giá trị 2 tham số MINIMUM_PROBABILITY là 0.5 và MINIMUM_SUPPORT là 0.04 :
Hình 3.12. Thiết lập tham số trong mô hình Bước 6: Khai thác Mining models.
Kết quả của Microsoft Association Rules thể hiện trong Tab Mining Models Viewer bởi 3 nội dung chính là Itemsets, Rules, và Dependency Net.
Rules Tab: Phần này trình bày ác luật kết hợp được phát hiện bởi mô c hình. Các thông tin về luật kết hợp bao gồm:
Probability: Cho biết xác suất xảy ra của luật.
Importance: Đo lường tính hữu dụng của luật, giá trị này càng cao thì luật kết hợp càng tốt.
Rules: Phần này thể hiện các luật kết hợp dạng X⟶Y
Hình 3.13. Luật kết hợp phát hiện bởi mô hình
Ví dụ : Luật kết hợp thứ nhất cho biết rằng sinh viên đạt điểm số môn Vật lý 1 = 1 và môn Tiếng Anh cơ bản 1 = 1.5 thì sẽ đạt điểm số môn Tiếng Anh cơ bản 2 = 1.5 với xác suất 100%.
Itemsets: Itemsets cho biết các thông tin quan trọng của luật kết hợp như Support (độ hỗ trợ của luật kết hợp), Size (Số items trong Itemsets).
Hình 3.14. Các thông tin của luật kết hợp
Hình trên với Itemsets có Support là 10 gồm 2 items đó là Ngôn ngữ hình thức và Automat=3 và Tiếng Anh cơ bản 1=1,5 có nghĩa là trong tất cả các dữ liệu về điểm thì có 10 sinh viên đạt điểm môn Ngôn ngữ hình thức và Automat=3 thì cũng đạt điểm môn Tiếng Anh cơ bản 1=1,5.
Dependency Network (Mạng phụ thuộc): thể hiện sự tác động của các items khác nhau trong Model. Mỗi Node trong Dependency Net thể hiện một Item.
Hình 3.15. Mạng phụ thuộc của mô hình
KẾT LUẬN
Sau thời gian thực tập tốt nghiệp, dưới sự hướng dẫn của cô Trần Thị Hương em đã tìm hiểu thêm được nhiều kiến thức về khai phá dữ liệu, từ đó áp dụng vào bài toán dự đoán kết quả học tập của sinh viên trong khoa. Em đã cố gắng hoàn thành hoàn thành báo cáo thực tập đúng tiến độ theo quy định của nhà trường. Em hy vọng rằng đợt thực tập tốt nghiệp này sẽ giúp em hoàn thành đồ án tốt nghiệp.
Cuối cùng, em xin chân thành cảm ơn sự hướng dẫn, giúp đỡ của cô Trần Thị Hương trong qua trình làm thực tập tốt nghiệp. Em cũng chân thành cảm ơn các thầy cô giáo trong khoa Công nghệ thông tin, trường Đại học Hàng hải Việt Nam đã tận tình giảng dạy em trong suốt quá trình học ở trường.
Sinh viên Phạm Đức Việt