Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
844,86 KB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG LÊ THỊ NGỌC LINH ỨNG DỤNG HỆ TRỢ GIÚP QUYẾT ĐỊNH TRONG DỰ BÁO KẾT QUẢ HỌC TẬP CỦA HỌC SINH THCS Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2013 Cơng trình hồn thành ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: PGS.TS PHAN HUY KHÁNH Phản biện 1: TS NGUYỄN TẤN KHÔI Phản biện 2: PGS.TS LÊ MẠNH THẠNH Luận văn bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ Kỹ thuật họp Đại học Đà Nẵng vào ngày 19 tháng năm 2013 Có thể tìm hiểu luận văn tại: - Trung tâm Thông tin - Học liệu, Đại Học Đà Nẵng - Trung tâm Học liệu, Đại Học Đà Nẵng MỞ ĐẦU Lý chọn đề tài Bước vào kỷ XXI, Giáo dục Việt Nam đứng trước hội thách thức mới, với việc tăng quy mô đào tạo loại hình đào tạo mở rộng Trong đó, nguồn lực đào tạo cịn hạn chế, vấn đề chất lượng đào tạo điểm nóng tồn xã hội Chất lượng đào tạo đánh giá từ kết học tập học sinh, việc kiểm tra đánh giá không mục đích đánh giá kết q trình học người học mà cịn nguồn thơng tin phản hồi, giúp người thầy nắm chất lượng, phương pháp giảng dạy, để từ có điều chỉnh thích hợp cho cơng tác giảng dạy Như vậy, việc đánh giá kết học tập học sinh có mối quan hệ mật thiết với trình giảng dạy người thầy Đối với học sinh bậc THCS mục tiêu giúp cho học sinh: Củng cố phát triển kết giáo dục bậc Tiểu học Có học vấn phổ thơng, trình độ sở hiểu biết ban đầu kỹ thuật - hướng nghiệp Tiếp tục học bậc Trung học phổ thông, trung cấp, học nghề vào sống lao động Hiện nay, đa số học sinh bậc THCS có chất lượng đầu vào thấp, vài em cịn đọc không thạo (viết không thạo), đặc biệt lười học, Ngồi ra, em chịu khó tư duy, sáng tạo hồn tồn khơng xác định mơn học mà u thích đam mê Ngược lại, chất lượng đầu học sinh ngày cao, phận giáo viên coi “thành tích” quan trọng, số khác suy nghĩ “học sinh cần đủ điểm để công nhận hồn thành chương trình THCS, đủ điều kiện thi lớp 10, …” mà không quan tâm tới kiến thức mà em nắm bao nhiêu? Bảng Bảng thống kê chất lượng kiểm tra đầu vào học sinh Bảng Bảng thống kê chất lượng kiểm tra đầu học sinh Qua hai bảng thống kê trên, câu hỏi đặt học sinh đạt kết học tập với chất lượng kiến thức mà em đạt được? Mặt khác, chất lượng học tập bậc Tiểu học em đạt 99% học sinh giỏi, nên vào lớp bậc THCS gây khó khăn cho giáo viên việc giảng dạy, truyền đạt kiến thức Đối với học sinh lớp 9, chất lượng học em quan trọng hơn, em khơng kiến thức (Tốn, Văn, Anh) phần trăm khả chọn trường để thi vào lớp 10 em khó Các em khơng định hướng khả thi đậu vào trường nào, khơng biết học mơn để chọn ban học cho phù hợp, Do đó, đa số em lựa chọn trường theo bạn học lớp trường có tên tuổi Đặc biệt thầy cô dạy bồi dưỡng học sinh giỏi, lượng kiến thức học sinh nắm quan trọng Do vậy, vấn đề mà nhà quản lý giáo dục, thầy cô giáo phụ huynh quan tâm là: Làm để đánh giá kết học tập học sinh cách trung thực, xác, đầy đủ kiến thức mà người học tiếp thu? Làm để có phương pháp đánh giá kết học tập học sinh thích hợp nhất? Làm để học sinh ý thức mơn học mà có khả học tốt, để từ xác định lộ trình mơn học tương ứng Việc biết thực chất khả nắm kiến thức học sinh điều vô cần thiết cấp bách giai đoạn Qua đó, cần phải có thơng tin cụ thể, xác, có tính thuyết phục, có sở khoa học, để đưa giải pháp kịp thời Tôi nhận thấy hệ trợ giúp định kết hợp với định đưa dự đoán kết học tập có tính khả thi cho học sinh Đó việc làm có ý nghĩa, thơng tin có sở khoa học đáng tin cậy, thơng tin q giá hỗ trợ nhiều cho giáo viên, phụ huynh học sinh, đặc biệt Ban giám hiệu ngành Giáo dục Xuất phát từ lý trên, nên chọn đề tài “Ứng dụng hệ trợ giúp định dự báo kết học tập học sinh bậc THCS” Mục tiêu nhiệm vụ Mục tiêu mà đề tài hướng đến xây dựng áp dụng có hiệu việc trợ giúp định dự báo kết học tập học sinh THCS Để thực mục đích ý tưởng đề ra, cần nghiên cứu tiến hành triển khai nội dung sau: Tìm hiểu, phân tích trạng chất lượng học tập học sinh để đề giải pháp hợp lý việc xây dựng triển khai hệ thống Nghiên cứu thuật toán định, từ phân tích, đánh giá, triển khai áp dụng thuật toán C4.5 dự báo kết Áp dụng sở lý thuyết làm tảng để xây dựng triển khai ứng dụng Đối tượng phạm vi nghiên cứu Từ yêu cầu đề bài, ta xác định đối tượng phạm vi nghiên cứu đề tài cụ thể sau: Đối tượng nghiên cứu Dữ liệu bao gồm: thông tin cá nhân, môn đăng ký, điểm tuyển sinh đầu vào kết học tập học sinh Lý thuyết hệ hỗ trợ định, định, thuật toán C4.5 Phạm vi nghiên cứu Dữ liệu trường THCS Lê Thánh Tôn, Đà Nẵng Nghiên cứu quản lý, vận hành kho liệu theo cách hệ chuyên gia Xây dựng công cụ chuẩn bị liệu tư vấn lựa chọn môn học dựa kết dự báo Phương pháp nghiên cứu Để ứng dụng mục tiêu nhiệm vụ luận văn, cần kết hợp hai phương pháp nghiên cứu: Phương pháp nghiên cứu lý thuyết Nghiên cứu tài liệu, ngôn ngữ cơng nghệ có liên quan Tổng hợp, thu thập tài liệu liên quan đến đánh giá kết học sinh Phương pháp nghiên cứu thực nghiệm Vận dụng sở lý thuyết để xây dựng ứng dụng, sau tiến hành kiểm thử đánh giá hiệu suất hệ thống Kết đạt Ứng dụng CNTT vào quy trình dự báo kết nhằm đánh giá thực chất chất lượng học tập học sinh Cụ thể xây dựng hệ thống trợ giúp định dự báo kết học tập học sinh Ý nghĩa khoa học thực tiễn đề tài Ý nghĩa khoa học Luận văn tiến hành phân tích, tìm hiểu quy trình dự báo kết cho học sinh Nghiên cứu áp dụng thuật tốn C4.5 để xây dựng mơ hình dự đoán Ý nghĩa thực tiễn Dự báo giúp cho học sinh, phụ huynh đánh giá thực chất khả học tập em mình, để từ với GVCN GVBM định hướng cho em thi vào trường THPT với khả Đề tài giúp cho lãnh đạo nhà trường dự báo tỷ lệ học sinh giỏi môn học, chất lượng học tập học sinh từ giao tiêu mơn học cho giáo viên giảng dạy đưa sách, biện pháp, phương pháp dạy tốt nhằm nâng cao chất lượng học tập, việc dạy giáo viên ngày hoàn thiện Bố cục luận văn Nội dung luận văn chia làm chương: Chương 1: Tổng quan hệ trợ giúp định Chương 2: Phân tích thiết kế hệ thống Chương 3: Xây dựng ứng dụng CHƯƠNG TỔNG QUAN VỀ HỆ TRỢ GIÚP QUYẾT ĐỊNH 1.1 HỆ TRỢ GIÚP QUYẾT ĐỊNH 1.1.1 Khái niệm định Ra định q trình lựa chọn có ý thức hai hay nhiều phương án để chọn phương án tạo kết mong muốn điều kiện ràng buộc biết 1.1.2 Tại phải trợ giúp định 1.1.3 Hệ trợ giúp định a Khái niệm hệ trợ giúp định b Vai trò chức hệ trợ giúp định 1.1.4 Quá trình định 1.1.5 Các thành phần hệ trợ giúp định a Quản lý liệu b Mơ hình quản lý c Quản lý dựa kiến thức d Giao diện người dùng 1.1.6 Các loại hệ thống trợ giúp định a Hệ trợ giúp định nhóm b Hệ trợ giúp định mức xí nghiệp c Hệ quản trị kiến thức 1.1.7 Tổng quan trí tuệ nhân tạo a Trí tuệ nhân tạo b Những đặc trưng trí tuệ nhân tạo c Đối tượng mục tiêu nghiên cứu trí tuệ nhân tạo d Vai trị trí tuệ nhân tạo e Các kỹ thuật trí tuệ nhân tạo 1.1.8 Tri thức a Định nghĩa b Các phương pháp suy diễn 1.2 CÂY QUYẾT ĐỊNH 1.2.1 Giới thiệu chung 1.2.2 Phân lớp liệu dựa kiểu định Cây định có hai kiểu: Cây hồi quy (Regression tree): ước lượng hàm có giá trị số thực thay sử dụng cho nhiệm vụ phân loại Ví dụ: ước tính giá ngơi nhà hay khoảng thời gian bệnh nhân nằm viện Cây phân loại (Classification tree): y biến phân loại như: giới tính (nam/nữ), kết trận đấu (thắng/thua) Quá trình phân lớp liệu thông qua bước bản: Bước 1: Xây dựng mơ hình từ tập huấn luyện Bước 2: Sử dụng mơ hình, kiểm tra tính đắn mơ hình dùng để phân lớp liệu 1.2.3 Giải thuật xây dựng định 1.3 THUẬT TOÁN C4.5 1.3.1 Giới thiệu 1.3.2 Giải thuật C4.5 xây dựng định từ xuống a Thuật toán C4.5 Thuật toán C4.5 thực sau: Function xay_dung_cay (T) { ; IF THEN ELSE ; FOR DO ; ; IF THEN ; FOR DO (T’ tách theo quy tắc: - Nếu N.test thuộc tính liên tục tách theo ngưỡng bước 5; - Nếu N.test thuộc tính phân loại rời rạc tách theo giá trị thuộc tính này; 10 < Entropy(S) < 1: tập ví dụ S có số lượng ví dụ thuộc loại khác khơng Để đơn giản ta xét trường hợp ví dụ S thuộc loại âm (-) dương (+) Cho trước: Tập S tập liệu huấn luyện, thuộc tính phân loại có hai giá trị, giả sử âm (-) dương (+) Trong đó: p : phần ví dụ âm tập S p : phần ví dụ dương tập S Khi đó, Entropy đo độ pha trộn tập S theo công thức: Entropy S p log2 p p log2 p Một cách tổng quát hơn, ví dụ tập S thuộc nhiều hai loại, giả sử có c giá trị phân loại cơng thức tổng qt là: c Entropy S pi log pi i 1 e Lượng thông tin thu đo mức độ giảm Entropy mong đợi Entropy số đo đo độ pha trộn tập ví dụ, định nghĩa phép đo hiệu suất phân loại ví dụ thuộc tính Phép đo gọi lượng thơng tin thu (hay độ lợi thơng tin), đơn giản lượng giảm Entropy mong đợi gây việc phân chia ví dụ theo thuộc tính Một cách xác hơn, Gain(S, A) thuộc tính A, tập S định nghĩa sau: Gain S , A Entropy S Sv Entropy Sv vValue A S 11 Giá trị Value A tập giá trị cho thuộc tính A, Sv tập S mà A nhận giá trị v f Tỷ suất lợi ích Gain Ratio Khái niệm độ lợi thơng tin Gain có xu hướng ưu tiên thuộc tính có số lượng lớn giá trị Nếu thuộc tính D có giá trị riêng biệt cho bảng ghi (thuộc tính Ngày bảng liệu trên), Entropy(S, D) = 0, Gain(S, D) đạt giá trị cực đại Rõ ràng, phân vùng việc phân loại vơ ích Thuật tốn C4.5, cải tiến ID3, mở rộng cách tính Information Gain thành Gain Ratio để cố gắng khắc phục thiên lệch Gain Ratio xác định công thức sau: GainRatio(S, A) Gain(S, A) SplitInformation(S,A) Trong đó, SplitInformation(S, A) thơng tin phân tách A sở giá trị thuộc tính phân loại S Cơng thức tính sau: c Si i 1 |S| SplitInformation(S,A) log2 1.3.3 Phương pháp đánh giá mức độ hiệu 1.3.4 Chuyển dạng luật 1.4 TỔNG KẾT CHƯƠNG Si |S| 12 CHƯƠNG PHÂN TÍCH THIẾT KẾ HỆ THỐNG 2.1 TỔNG QUAN VỀ CÔNG TÁC GIÁO DỤC Ở BẬC THCS 2.1.1 Mục tiêu nhiệm vụ giáo dục bậc THCS Thống kê Bộ GD&ĐT, quy mô hệ thống giáo dục bậc THCS từ năm 2009-2012 là: Bảng 2.1 Thống kê hệ thống GD Bậc THCS 2009-2010 2010-2011 2011-2012 10064 10143 10243 317,2 316,2 312,0 5163,2 4945,2 4926,4 Số trường Số giáo viên (nghìn người) Số học sinh (nghìn người) 2.1.2 Quy chế tính điểm theo thơng tư số 58/2012/TTBGDĐT a Số lần kiểm tra cách cho điểm b Kết môn học học kỳ, năm học c Điểm trung bình mơn học kỳ, năm học 2.2 XÂY DỰNG BÀI TOÁN DỰ BÁO KẾT QUẢ HỌC TẬP CỦA HỌC SINH 2.2.1 Đặt vấn đề 2.2.2 Giải pháp xây dựng hệ thống trợ giúp định 2.3 ỨNG DỤNG CÂY QUYẾT ĐỊNH 2.3.1 Phân tích liệu Có nhiều yếu tố ảnh hưởng đến kết học tập học sinh, nhiên trọng phân tích yếu tố chính: 13 Mơn học (MH): Mơn học mà học sinh lựa chọn thi tuyển đầu vào Giới tính (GT): Giới tính học sinh (Nam, nữ) Điểm: tổng điểm khảo sát tuyển sinh đầu vào (Toán, Văn, Anh) Các yếu tố tập thuộc tính, dựa vào thuộc tính để dự đốn giá trị cho thuộc tính Kết Xét liệu ban đầu sau: Bảng 2.2 Bảng liệu định dự đoán kết STT Mã HS Mơn Giới tính Điểm Kết Quả LTT037 Toán Nam 89 Giỏi LTT038 Văn Nữ 70 Giỏi LTT039 Anh Nữ 58 Giỏi LTT040 Toán Nam 23 TB LTT041 Văn Nam 55 Khá … … … … … … Ta rút gọn thuộc tính sau: Mơn = [Toan, Van, Anh] GT = [0, 1] Điểm = [ 55 , 55 80 , 80 ] KQ = [G, K, TB] Bảng 2.3 Bảng liệu rút gọn STT Mã HS Môn GT Điểm Kết Quả LTT037 Toan 80 LTT038 Van 55 80 G LTT039 Anh 55 80 G G 14 LTT040 Toan 55 TB LTT041 Van 55 80 K … … … … … … 2.3.2 Triển khai giải thuật C4.5 xây dựng định Gọi S tập thuộc tính đích Áp dụng cơng thức tính Entropy, ta có: Đối với thuộc tính Mơn, ta tính Entropy tập S chia giá trị thuộc tính Mơn bảng sau: Entropy(S) phân theo Môn Bảng 2.4 Entropy (S) phân theo Môn Môn SL TOAN Kết Entropy Gioi Kha TB 1.53 VAN 0.99 ANH 2 1.50 Entropy S thuộc tính Mon là: Entropy (S, Mon) = (9/26) x 1.53 + (9/26) x 0.99 + (8/26) x 1.50 = 1.33 Độ lợi thông tin tương ứng là: Gain (S, Môn) = Entropy(S) – Entropy(S, Mon) = 1.54 – 1.33 = 0.21 Tỷ suất lợi ích Gain Ratio: 15 GainRatio (S, Mon) = Gain (S, Mon) / SplitInfor (S, Mon) = 0.21/1.58 = 0.13 Một cách tương tự, ta tính độ lợi thơng tin Gain tỉ suất lợi ích Gain Ratio thuộc tính cịn lại Bảng 2.5 Độ lợi thơng tin thuộc tính Giới tính Kết GT SL Entropy Gioi Kha TB (i) 14 1.56 12 1.38 Entropy Gain (S, GT) (S, GT) 1.48 0.06 Bảng 2.6 Độ lợi thơng tincủa thuộc tính Điểm Kết Điểm SL 80 55 80 55 Entropy Gioi Kha TB (i) 9 0 0.00 0.81 0.91 Entropy Gain (S, (S, diem) diem) 0.56 0.98 Bảng 2.7 So sánh kết tính GainRatio thuộc tính Thuộc tính Gain SplitInfor GainRatio Mon 0.21 1.58 0.13 GT 0.06 1.00 0.06 Điem 0.98 1.56 0.62 Ta nhận thấy GainRatio (S, Diem) = 0.62 đạt giá trị lớn nhất, thuộc tính Điểm có khả phân loại tốt Chính ta chọn thuộc tính làm nút gốc phân tách 16 Ta có định cấp hình vẽ: Hình 2.1 Cây định cấp Xét nhánh Diem = 55 Bảng 2.8 Bảng liệu trường họp Diem = 55 STT Mã HS Môn GT Điểm Kết Quả TB LTT040 Toan 55 LTT043 Toan 55 TB LTT046 Anh 55 TB LTT048 Van 55 K LTT052 Anh 55 TB … … … … … … Gọi S1 tập thuộc tính đích Áp dụng cơng thức tính Entropy, ta có: Entropy(S1) = -(6/9)xlog2(6/9) -(3/9)xlog2(3/9) -(0/9)xlog2(0/9) = 0,92 Lần lượt tính Gain thuộc tính, kết sau: Mon Toan Bảng 2.9 Độ lợi thông tin thuộc tính Mơn Kết Entropy Gain Entropy (S, (S, SL (i) Gioi Kha TB Mon) Mon) 0 0.00 0.2 0.72 17 Van 1 0.00 Anh 2 1.00 GT Bảng 2.10 Độ lợi thơng tin thuộc tính Giới tính Kết Entropy Gain Entropy (S, GT) (S, GT) SL (i) Gioi Kha TB 0 0.00 0.97 0.54 0.38 Bảng 2.11 So sánh kết tính GainRatio thuộc tính Thuộc tính Gain SplitInfor GainRatio Mon 0.72 1.39 0.52 GT 0.38 0.99 0.38 Cuối cùng, ta có định hình vẽ: Hình 2.2 Cây định hồn chỉnh 2.3.3 Rút luật từ định 2.4 TỔNG KẾT CHƯƠNG 18 CHƯƠNG XÂY DỰNG ỨNG DỤNG 3.1 XÂY DỰNG ỨNG DỤNG TRỢ GIÚP QUYẾT ĐỊNH 3.1.1 Chức hệ thống 3.1.2 Xây dựng mơ hình giải pháp tổng thể hệ thống Từ chức vừa phân tích trên, tơi tổ chức kiến trúc tổng thể hệ thống sau: Hình 3.1 Kiến trúc tổng thể hệ thống 3.1.3 Đặc tả chi tiết thành phần a Dữ liệu đầu vào (Input) b Quá trình xử lý liệu Hình 3.2 Mơ tả q trình tiền xử lý liệu ... suất hệ thống Kết đạt Ứng dụng CNTT vào quy trình dự báo kết nhằm đánh giá thực chất chất lượng học tập học sinh Cụ thể xây dựng hệ thống trợ giúp định dự báo kết học tập học sinh Ý nghĩa khoa học. .. TOÁN DỰ BÁO KẾT QUẢ HỌC TẬP CỦA HỌC SINH 2.2.1 Đặt vấn đề 2.2.2 Giải pháp xây dựng hệ thống trợ giúp định 2.3 ỨNG DỤNG CÂY QUYẾT ĐỊNH 2.3.1 Phân tích liệu Có nhiều yếu tố ảnh hưởng đến kết học tập. .. thành phần hệ trợ giúp định a Quản lý liệu b Mô hình quản lý c Quản lý dựa kiến thức d Giao diện người dùng 1.1.6 Các loại hệ thống trợ giúp định a Hệ trợ giúp định nhóm b Hệ trợ giúp định mức