1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phân cụm dữ liệu và ứng dụng thuật toán k means vào đánh giá kết quả học tập của học sinh trung học phổ thông

49 20 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 49
Dung lượng 1,05 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC VINH NGUYỄN THỊ TUYẾT PHÂN CỤM DỮ LIỆU VÀ ỨNG DỤNG THUẬT TOÁN K-MEANS VÀO ĐÁNH GIÁ KẾT QUẢ HỌC TẬP CỦA HỌC SINH THPT LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGHỆ AN, 2018 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC VINH NGUYỄN THỊ TUYẾT PHÂN CỤM DỮ LIỆU VÀ ỨNG DỤNG THUẬT TOÁN K-MEANS VÀO ĐÁNH GIÁ KẾT QUẢ HỌC TẬP CỦA HỌC SINH THPT Chuyên ngành: Công nghệ thông tin Mã số: 8480201 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Người hướng dẫn khoa học: TS PHAN LÊ NA NGHỆ AN, 2018 LỜI CAM ĐOAN Tôi xin cam đoan luận văn "Phân cụm liệu ứng dụng thuật toán K-means vào đánh giá kết học tập học sinh THPT" cơng trình nghiên cứu riêng tơi Các số liệu sử dụng luận văn trung thực Các kết nghiên cứu đƣợc trình bày luận văn chƣa đƣợc công bố công trình khác Tác giả Nguyễn Thị Tuyết LỜI CẢM ƠN Em xin chân thành cảm ơn cô giáo, TS Phan Lê Na tận tình hƣớng dẫn, giúp đỡ để tơi hồn thành tốt luận văn Em xin cảm ơn thầy giáo, cô giáo khoa Công nghệ thông tin Trƣờng Đại học Vinh tâm huyết, nhiệt tình truyền thụ kiến thức cho tơi q trình học tập và lần nữa, tơi xin gửi lời cảm ơn tới quan, bạn bè đồng nghiệp, gia đình ngƣời thân chia sẻ, giúp đỡ, động viên, tạo điều kiện thuận lợi để tơi hồn thành nhiệm vụ học tập luận văn Nghệ An, tháng năm 2018 Tác giả Nguyễn Thị Tuyết MỤC LỤC Trang LỜI CAM ĐOAN .3 LỜI CẢM ƠN .4 CÁC DANH MỤC VIẾT TẮT MỞ ĐẦU .7 Sự cần thiết vấn đề nghiên cứu Mục tiêu nghiên cứu Đối tượng phạm vi nghiên cứu .7 Kết cấu luận văn Chƣơng 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1 Giới thiệu chung khám phá tri thức khai phá liệu .9 1.2 Các phương pháp khai phá liệu 10 1.3 Các lĩnh vực ứng dụng thực tiễn trình khai phá liệu 10 1.4 Các hướng tiếp cận kỹ thuật áp dụng khai phá liệu 13 1.5 Kết luận chương 14 Chƣơng 2: 15 PHÂN CỤM DỮ LIỆU VÀ MỘT SỐ PHƢƠNG PHÁP 15 PHÂN CỤM DỮ LIỆU .15 2.1 Khái niệm mục tiêu phân cụm liệu 15 2.2 Các ứng dụng phân cụm liệu 17 2.3 Các yêu cầu vấn đề tồn phân cụm liệu 17 2.3.1 Các yêu cầu phân cụm liệu .17 2.3.2 Những vấn đề tồn phân cụm liệu .20 2.4 Những kỹ thuật tiếp cận phân cụm liệu 20 2.5 Kết luận Chƣơng .21 Chƣơng 3: 22 ĐÁNH GIÁ KẾT QUẢ HỌC TẬP CỦA HỌC SINH .22 VỚI THUẬT TOÁN K_MEANS .22 3.1 Đặt vấn đề 22 3.2 Giải vấn đề 25 3.3 Chương trình ứng dụng 40 3.4 Đánh giá kết thử nghiệm với thuật toán K-Mean 45 3.5 Kết luận chương 46 KẾT LUẬN .47 Kết luận 47 Kiến nghị hướng phát triển .47 TÀI LIỆU THAM KHẢO 49 CÁC DANH MỤC VIẾT TẮT STT KÝ HIỆU VIẾT TẮT KDD Knowledge Discovery and Data Mining CSDL Cơ sở liệu PCDL Phân cụm liệu THPT Trung học phổ thông MỞ ĐẦU Sự cần thiết vấn đề nghiên cứu Sự phát triển công nghệ thông tin việc ứng dụng công nghệ thông tin lĩnh vực nhiều năm qua đồng nghĩa với lƣợng liệu đƣợc quan thu thập lƣu trữ ngày tích lũy nhiều lên Mặt khác, môi trƣờng cạnh tranh, ngƣời ta ngày cần có nhiều thơng tin với tốc độ nhanh để trợ giúp việc định ngày có nhiều câu hỏi mang tính chất định tính cần phải trả lời dựa khối lƣợng liệu khổng lồ có Với lý nhƣ vậy, phƣơng pháp quản trị khai thác sở liệu truyền thống ngày không đáp ứng đƣợc thực tế làm phát triển khuynh hƣớng kỹ thuật Kỹ thuật khai phá tri thức khai phá liệu (KDD - Knowledge Discovery and Data Mining) Đối với trƣờng học việc phân loại kết học tập học sinh cần thiết, toán phân cụm liệu hỗ trợ hoạt động quản lý khai thác có hiệu vấn đề Chính lý mà em chọn đề tài “Nghiên cứu thuật toán phân cụm liệu Ứng dụng phân cụm đánh giá kết học sinh” hƣớng nghiên cứu cho luận văn Mục tiêu nghiên cứu - Hiểu phân cụm liệu số thuật toán phân cụm liệu - Ứng dụng phân cụm vào giải toán Đối tượng phạm vi nghiên cứu - Lý thuyết khám phá tri thức khai phá liệu - Nghiên cứu thuật toán phân cụm liệu trọng tâm thuật toán K-Means - Ứng dụng phân cụm vào toán liên quan đến trƣờng học Nội dung nghiên cứu - Nghiên cứu khám phá tri thức khai phá liệu - Nghiên cứu kỹ thuật phân cụm liệu khả ứng dụng - Ứng dụng phân cụm thuật toán K-Means vào toán đánh giá kết học sinh Kết cấu luận văn Ngoài phần mở đầu phần kết luận, luận văn đƣợc xếp theo bố cục sau đây: Chƣơng 1: Tổng quan khai phá liệu Chƣơng 2: Phân cụm liệu số phƣơng pháp phân cụm liệu Chƣơng 3: Đánh giá kết học tập học sinh với thuật toán KMeans Chƣơng 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1 Giới thiệu chung khám phá tri thức khai phá liệu Khai phá liệu (data mining) Là q trình tính tốn để tìm mẫu liệu lớn liên quan đến phƣơng pháp giao điểm máy học, thống kê hệ thống sở liệu Đây lĩnh vực liên ngành khoa học máy tính Mục tiêu tổng thể q trình khai thác liệu trích xuất thơng tin từ liệu chuyển thành cấu trúc dễ hiểu để sử dụng tiếp Ngồi bƣớc phân tích thơ, cịn liên quan tới sở liệu khía cạnh quản lý liệu, xử lý liệu trƣớc, suy xét mơ hình suy luận thống kê, thƣớc đo thú vị, cân nhắc phức tạp, xuất kết cấu trúc đƣợc phát hiện, hình hóa cập nhật trực tuyến Khai thác liệu bƣớc phân tích trình "khám phá kiến thức sở liệu" KDD Khai phá liệu bƣớc trình khai thác tri thức (Knowledge Discovery Process), bao gồm:  Xác định vấn đề không gian liệu để giải vấn đề (Problem understanding and data understanding)  Chuẩn bị liệu (Data preparation), bao gồm q trình làm liệu (data cleaning), tích hợp liệu (data integration), chọn liệu (data selection), biến đổi liệu (data transformation)  Khai thác liệu (Data mining): xác định nhiệm vụ khai thác liệu lựa chọn kỹ thuật khai thác liệu Kết cho ta nguồn tri thức thô 10  Đánh giá (Evaluation): dựa số tiêu chí tiến hành kiểm tra lọc nguồn tri thức thu đƣợc  Triển khai (Deployment) Quá trình khai thác tri thức khơng q trình từ bƣớc đến bƣớc cuối mà q trình lặp có quay trở lại bƣớc qua 1.2 Các phương pháp khai phá liệu  Phƣơng pháp phân loại  Phƣơng pháp gom cụm  Phƣơng pháp khai phá luật kết hợp  Phƣơng pháp dự báo 1.3  Các lĩnh vực ứng dụng thực tiễn trình khai phá liệu Phân tích liệu tài (Financial Data Analysis)  Công nghiệp bán lẻ (Retail Industry)  Công nghiệp viễn thơng (Telecommunication Industry)  Phân tích liệu sinh học (Biological Data Analysis)  Phát xâm nhập (Intrusion Detection)  Một số ứng dụng khoa học (Scientific Applications) Phân tích liệu tài (Financial Data Analysis) Dữ liệu tài ngân hàng ngành tài nói chung thƣờng đáng tin cậy có chất lƣợng cao, tạo điều kiện cho khai phá liệu Dƣới số ứng dụng điển hình khai phá liệu tài chính: 35 LẦN LẶP Mã HS Điểm Tốn Điểm Lí Điểm Hóa A01 A02 A03 A04 A05 A06 A07 A08 A09 A10 A11 A12 A13 A14 A15 A16 A17 A18 A19 A20 8 7 3 10 7 10 5 10 10 10 10 10 10 5 Tính khoảng cách Euclidean Lần Trọng Trọng Trọng Cụm Cụm Cụm tâm C1 tâm C2 tâm C3 Gần C1 Gần C2 Gần C3 0.0 6.1 4.1 7.0 6.3 1.0 3.7 4.2 6.4 6.5 8.0 5.3 9.1 5.8 5.1 8.3 6.1 6.4 6.1 8.0 6.4 8.3 3.1 1.7 2.2 5.4 6.4 3.0 0.0 7.8 5.4 5.4 8.1 10.0 3.1 5.0 1.0 6.0 8.1 6.0 8.0 11.3 7.6 5.1 7.2 7.3 8.7 4.5 6.0 11.0 2.4 8.8 7.3 9.4 6.7 9.8 6.0 8.5 8.1 0.0 Bảng 3.2 Kết lần lặp Tính lại trọng tâm cụm: Cụm 1: trọng tâm C1 (6.5; 8.2; 8.1) Cụm 2: trọng tâm C2 (7.2; 5.0; 4.5) Cụm 3: trọng tâm C3 (2.0; 6.0; 3.3) x x y y y x x y y x z x z x y y y y x z 36 LẦN LẶP Mã HS Điểm Toán Điểm Lí Điểm Hóa A01 A02 A03 A04 A05 A06 A07 A08 A09 A10 A11 A12 A13 A14 A15 A16 A17 A18 A19 A20 8 7 3 10 7 10 5 10 10 10 10 10 10 5 Tính khoảng cách Euclidean Lần Trọng Trọng Trọng Cụm Cụm Cụm tâm C1 tâm C2 tâm C3 Gần C1 Gần C2 Gần C3 3.7 3.0 5.5 6.6 5.4 3.3 0.5 4.9 6.6 3.2 7.5 2.5 6.4 4.3 3.8 6.3 5.8 3.2 3.2 8.6 5.6 6.3 3.3 2.1 0.9 4.6 4.6 2.8 2.0 5.8 5.4 3.4 6.7 8.5 1.1 3.7 1.1 4.0 6.4 6.5 7.8 9.3 7.6 4.4 6.1 7.0 7.1 4.5 5.8 8.8 1.0 6.8 4.1 7.8 5.2 8.0 5.4 6.0 5.8 3.2 Bảng 3.3 Kết lần lặp Tính lại trọng tâm cụm: Cụm 1: trọng tâm C1 (6.5; 8.3; 7.7) Cụm 2: trọng tâm C2 (7.2; 4.5; 4.5) Cụm 3: trọng tâm C3 (2.0; 6.0; 3.3) x x y y y x x y y x z x z x y y y x x z 37 LẦN LẶP Mã HS Điểm Tốn Điểm Lí Điểm Hóa A01 A02 A03 A04 A05 A06 A07 A08 A09 A10 A11 A12 A13 A14 A15 A16 A17 A18 A19 A20 8 7 3 10 7 10 5 10 10 10 10 10 10 5 Tính khoảng cách Euclidean Lần Trọng Trọng Trọng Cụm Cụm Cụm tâm C1 tâm C2 tâm C3 Gần C1 Gần C2 Gần C3 4.0 3.0 5.5 6.3 5.1 3.5 0.6 4.8 6.4 3.1 7.2 2.2 6.1 4.5 3.5 6.0 5.6 2.8 3.1 8.4 5.6 6.7 3.0 1.9 1.0 4.6 4.9 2.7 1.5 6.3 5.4 3.8 7.0 8.8 1.5 4.0 0.7 4.5 6.8 6.3 7.8 9.3 7.6 4.4 6.1 7.0 7.1 4.5 5.8 8.8 1.0 6.8 4.1 7.8 5.2 8.0 5.4 6.0 5.8 3.2 x x y y y x x y y x z x z x y y y x x Bảng 3.4 Kết lần lặp Tính lại trọng tâm cụm: Cụm 1: trọng tâm C1 (6.5; 8.3; 7.7) Cụm 2: trọng tâm C2 (7.2; 4.5; 4.5) Cụm 3: trọng tâm C3 (2.0; 6.0; 3.3) Ta thấy trọng tâm cụm ko thay đổi Vậy qua lần lặp ta dừng lại z 38 Cụm 1: trọng tâm C1 (6.5; 8.3; 7.7) gồm học sinh có mã A01, A02, A06, A07, A10, A12, A14, A18, A19 Cụm 2: trọng tâm C2 (7.2; 4.5; 4.5) gồm học sinh có mã A03, A04, A05, A08, A09, A15, A16, A17 Cụm 3: trọng tâm C3 (2.0; 6.0; 3.3) gồm học sinh có mã A11, A13, A20 Đến nay, có nhiều thuật toán kế thừa tƣ tƣởng thuật toán Kmeans áp dụng KPDL để giải tập liệu có kích thƣớc lớn đƣợc áp dụng hiệu phổ biến nhƣ thuật toán K-medoid, CLARA, PAM 3.2.4 Một số ứng dụng K-Means Thuật toán K-means clustering thƣờng đƣợc sử dụng để tìm nhóm mà khơng đƣợc gắn nhãn cách rõ ràng tập liệu Điều thƣờng có ý nghĩa việc xác nhận tính giả thiết kiểu nhóm tồn hay nhóm chƣa biết tập liệu phức tạp Một thuật tốn chạy nhóm đƣợc định nghĩa, liệu dễ dàng đƣợc gắn vào nhóm thích hợp Đây thuật toán phổ biến, đƣợc ứng dụng với kiểu phân hoạch, nhóm Một vài ví dụ nhƣ sau: - Một cơng ty chuyển vận muốn mở chuỗi trung tâm giao nhận hàng thành phố Trong tình họ cần đối mặt với vấn đề nhƣ sau: + Cần phải phân tích để biết khu vực mà có nhiều đơn đặt hàng thƣờng xuyên + Họ cần biết trung tâm nên đƣợc mở để đảm bảo giao nhận hiệu khu vực 39 + Họ cần tìm vị trí thích hợp để mở trung tâm khu vực nhằm đảm bảo tối ƣu khoảng cách trung tâm khách hàng họ Hình 3.12 Minh họa cụm K-means - Phân tích thơng tin tội phạm có liên quan tới nghiện ma túy Việt Nam Nguồn liệu bao gồm loại hình phạm tội nhiều loại thuốc khác gây ra, bao gồm Heroin, Cocaine loại gây nghiện toa bác sĩ, đặc biệt với trẻ vị thành niên Tỉ lệ phạm tội lạm dụng thuốc giảm nhờ việc xây dựng trung tâm cai nghiện chổ khu vực chịu tác động lớn loại hình tội phạm Với nguồn liệu đƣợc cho, mục tiêu khác đƣợc định Ví dụ nhƣ: + Phân loại tội phạm dựa việc lạm dụng dƣợc chất để tìm nguyên nhân + Phân loại tội phạm dựa nhóm tuổi + Phân tích liệu để xác định hình thức trung tâm cai nghiện cần xây dựng + Tìm số lƣợng trung tâm cai nghiện cần xây dựng để đạt hiệu việc giãm tỉ lệ tội phạm nghiện thuốc 40 Ngoài ra, việc theo dõi điểm liệu đƣợc giám sát chuyển đổi qua lại nhóm theo thời gian đem lại thơng tin hữu ích thay đổi tập liệu 3.3 Chương trình ứng dụng 3.3.1 Áp dụng CSDL trường THPT Tiến hành đánh giá kết học tập lớp thuộc khối tự nhiên học sinh khối 12 trƣờng THPT Anh Sơn với CSDL đƣợc lấy từ phần mềm VNEDU.VN - phần mềm quản lý học sinh nhà trƣờng Đây kết điểm tổng kết cuối năm học với đầy đủ tất môn học học sinh lớp học Hình 3.13 Bảng điểm tổng kết học sinh năm học 2018 Ta tiến hành gom cụm phân tích liệu để đánh giá học tập học sinh theo tiêu chí mơn học theo cụm mơn học (Tốn-Lý-Hóa, Tốn-Văn-NN, Tốn-Hóa-Sinh) 41 Để tiến hành gom cụm đƣợc tải bảng kết học tập từ phần mềm thành file Excel sau save file thành file csv Từ file csv ta đổi thành file arff chạy đƣợc WEKA 3.3.2 Kết với thuật toán K-Means với phần mềm WEKA Trong đề tài sử dụng kết học tập lớp 12 bao gồm lớp 12A, 12B, 12C, 12D, 12E trƣờng THPT Anh Sơn năm 2018 đƣợc tiến hành chuyển đổi thành file Diem12.arff với tiêu chí danh hiệu theo cụm môn học Kết gom cụm theo danh hiệu, với K=3: Hình 3.14 Kết gom cụm theo danh hiệu khơng có trƣờng phân lớp 42 Kết cho thấy: - Đối tƣợng đánh giá 194 (K=3) - Cụm 1: 134 (69%) - HS đạt danh hiệu Tiên tiến - Cụm 2: 37 (19%) - HS đạt danh hiệu Giỏi - Cụm 3: 23 (12%) - HS có kết TB Trong trƣờng hợp ta đánh giá kết Use training set tức khơng có trƣờng phân lớp tham gia vào Vì biết có học sinh đạt danh hiệu giỏi, khá, TB tổng số học sinh đƣợc đánh giá khơng biết số học sinh thuộc lớp học Để biết đƣợc điều tiến hành đánh giá có trƣờng phân lớp Hình 3.15 Kết gom cụm theo danh hiệu có trƣờng phân lớp 43 Ta thấy kết phân cụm không thay đổi nhƣng lần có thêm trƣờng phân lớp chứa thông tin tên lớp học giúp ta thấy đƣợc Cụm bao gồm học sinh đạt danh hiệu giỏi lớp 12D chiếm 32 em tổng số 37 Lớp 12A có em lớp B, C, E khơng có em Vậy Ban giám hiệu nhà trƣờng đánh giá sơ kết học tập học sinh lớp Kết gom cụm theo mơn Tốn, Lý, Hóa với K=4: Hình 3.16.a Kết gom cụm theo mơn Tốn-Lí-Hóa 44 Hình 3.16.b Kết gom cụm theo mơn Tốn-Lí-Hóa Thơng qua kết gom cụm mơn Tốn, Lý, Hóa 194 đối tƣợng với K=4 cho ta kết - Cụm 0: 136 (70%) - trọng tâm cụm Tốn 6.5, Lý 6.1, Hóa 6.2 - Cụm 1: 26 (13%) - Trọng tâm cụm Tốn 8.4, Lý 6.8, Hóa 7.4 - Cụm 2: 27 (14%) - Trọng tâm cụm Tốn 6.6, Lý 6.2, Hóa 6.3 - Cụm 3: ( 3%) - Trọng tâm cụm Tốn 6.1, Lý 5.5, Hóa 6.8 Trong trƣờng hợp tiến hành gom cụm có sử dụng trƣờng phân lớp để đánh giá kết Trong trƣờng hợp trƣờng phân lớp có giá trị tên lớp học đƣợc đặt A, B, C, D, E Từ kết ta thấy Cụm tập hợp kết học tập tốt tập trung chủ yếu học sinh lớp 12D có 14 học sinh tổng số 26 học sinh cụm Trong lúc lớp cịn lại có: 12A có 4, 12B có 1, 12C có 12E có Vậy ta đánh giá học sinh lớp 12D có kết học tập mơn Tốn, 45 Lý, Hóa tốt số học sinh có kết trung bình chiếm tỉ lệ thấp phần thể phân luồng khối học học sinh tƣơng đối tốt 3.3.3 So sánh kết thuật toán K-Means với công cụ khác Để xác minh kết gom cụm thuật tốn K-means WEKA chúng tơi tiến hành kiểm thử kết theo danh hiệu phần mềm Microsoft Excel thấy kết hoàn toàn trùng khớp Cịn kết gom cụm theo mơn Tốn-Lí-Hóa không thực đƣợc Microsoft Excel Vậy yên tâm kết luận gom cụm theo thuật toán Kmeans WEKA phần mang giá trị thiết thực có hiệu việc đánh giá kết học sinh nhà trƣờng Hình 3.17 Bảng thống kê kết theo danh hiệu Microsoft Excel 3.4 Đánh giá kết thử nghiệm với thuật toán K-Mean Ƣu điểm thuật toán k-means: Đây phƣơng pháp đơn giản, hiệu quả, tự tổ chức, đƣợc sử dụng tiến trình khởi tạo nhiều thuật toán khác, hiệu suất tƣơng đối, thƣờng kết thúc tối ƣu cục bộ, tìm đƣợc tối ƣu toàn cục 46 Nhƣợc điểm thuật toán này: Số cụm k phải đƣợc xác định trƣớc, áp dụng đƣợc xác định đƣợc giá trị trung bình, khơng thích hợp với cụm có kích thƣớc khác nhau, thuật toán độc lập tuyến tính 3.5 Kết luận chương Từ kết nghiên cứu lý thuyết thực nghiệm, thu nhận đƣợc kiến thức hữu ích thuộc lĩnh vực khai phá liệu ứng dụng trƣờng học Các kết thử nghiệm thể Hình 3.14, 3.15 3.16 cho thấy thuật toán phân cụm đánh giá thành cơng kết học tập học sinh cách tƣơng đối xác Tuy nhiên để lại số trở ngại nhƣ việc phải tiến hành chuyển đổi file liệu trƣớc đƣa vào đánh giá Điều gây khơng phiền phức cho ngƣời ứng dụng 47 KẾT LUẬN Kết luận Luận văn hoàn thành với nỗ lực thân với giúp đỡ tận tình giáo hƣớng dẫn Phan Lê Na Trong thời gian này, thân tích lũy đƣợc số kết sau: a) Về mặt lý thuyết - Nghiên cứu tổng quan khai phá liệu kỹ thuật khai phá liệu; - Tìm hiểu tốn phân cụm thuật tốn phân cụm nhƣ K-means; - Tìm hiểu bƣớc quy trình để khai phá liệu tập liệu cho trƣớc b) Về thực nghiệm: Sử dụng công cụ khai phá liệu WEKA để đánh giá thuật toán phân cụm đề cập tập liệu điểm học sinh nhằm có nhìn khác ứng dụng khai phá liệu lĩnh vực đánh giá học sinh Kiến nghị hướng phát triển Mục tiêu nghiên cứu để kiểm tra xem thuật toán phân cụm K-means thực thành cơng việc đánh giá kết học tập học sinh hay khơng Mục tiêu thứ hai tìm thuật tốn tốt ứng dụng trƣờng học Trong nghiên cứu tiếp theo, sử dụng nhiều thuật toán phân cụm nhƣ phân lớp để có nhìn tổng quan ứng dụng vào toán thực tế hay giúp cho ngành giáo dục nói chung 48 trƣờng học nói riêng có nhiều thuận lợi trình thực nhiệm vụ Trong thời gian thực luận văn, với nỗ lực thân đƣợc giúp đỡ tận tình giáo hƣớng dẫn, luận văn thực theo nhiệm vụ đƣợc giao thời hạn theo yêu cầu Tuy nhiên với thân, đề tài mới, khơng thể tránh khỏi khiếm khuyết tơi mong đƣợc Q Thầy, Cơ giáo đồng nghiệp góp ý để tơi hồn thiện hƣớng nghiên cứu tƣơng lai Một lần xin bày tỏ lịng biết ơn chân thành tới Q Thầy, Cô ngành Công nghệ Thông tin, Viện Kỹ thuật Công nghệ, Trƣờng Đại học Vinh truyền thụ kiến thức, kinh nghiệm giúp đỡ tơi q trình học tập nhƣ trình thực luận văn Đặc biệt, xin chân thành cảm ơn tới Cô giáo TS Phan Lê Na hƣớng dẫn tận tình nhƣ Q Thầy, Cơ giáo phản biện đóng góp ý kiến q báu để luận văn đƣợc hoàn thiện 49 TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt: [1] Hoàng Văn Dũng, "Khai phá liệu kỹ thuật phân cụm", Luận văn thạc sỹ, trƣờng Đại học sƣ phạm Hà Nội [2] Ông Xuân Hồng, Gom nhóm (Clustering analysis) tập liệu Labor; [3] Nguyễn Văn Nhƣợng (2012), Khai phá liệu kết học tập học sinh trƣờng cao đẳng nghề Văn lang Hà Nội [4] Thuật toán K-means trang http://ungdung.khoa-hnvd.com/Hoc_thuat/KMeans.html [5] Trịnh Thị Nhị (2011), Nghiên cứu, khai thác kho liệu điểm trường Đại học Sư phạm kỹ thuật Hưng Yên dựa công cụ BI hệ quản trị CSDL SQL Server 2008, Luận văn Thạc sĩ, Trƣờng Đại học Công nghệ, Đại học Quốc gia Hà Nội [6] Nguyễn Thái Nghe (2009), Paul Janecek, Peter Haddawy Một phân tích kỹ thuật dự đoán kết học tập Tài liệu Tiếng Anh [7] Brijesh Kumar Baradwaj, Saurabh Pal (2011): Mining Educational Data to Analyze Students Performance, (IJACSA) International Journal of Advanced Computer Science and Applications, Vol 2, No [8] Sajadin Sembiring (2011), Prediction of student academic performance by an application of datamining techniques, 2011 International Conference on Management and Artificial Intelligence IPEDR vol.6 (2011) © IACSIT Press, Bali, Indonesia ... Vậy phân cụm ứng dụng nhƣ vào trƣờng học sang tìm hiểu chƣơng 3: Đánh giá k? ??t học tập học sinh với thuật toán K- means 22 Chƣơng 3: ĐÁNH GIÁ K? ??T QUẢ HỌC TẬP CỦA HỌC SINH VỚI THUẬT TOÁN K_ MEANS. .. trƣờng học 8 Nội dung nghiên cứu - Nghiên cứu khám phá tri thức khai phá liệu - Nghiên cứu k? ?? thuật phân cụm liệu khả ứng dụng - Ứng dụng phân cụm thuật toán K- Means vào toán đánh giá k? ??t học sinh. .. cứu thuật toán phân cụm liệu Ứng dụng phân cụm đánh giá k? ??t học sinh? ?? hƣớng nghiên cứu cho luận văn Mục tiêu nghiên cứu - Hiểu phân cụm liệu số thuật toán phân cụm liệu - Ứng dụng phân cụm vào

Ngày đăng: 01/08/2021, 11:41

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Hoàng Văn Dũng, "Khai phá dữ liệu bằng kỹ thuật phân cụm", Luận văn thạc sỹ, trường Đại học sư phạm Hà Nội Sách, tạp chí
Tiêu đề: Khai phá dữ liệu bằng kỹ thuật phân cụm
[6] Nguyễn Thái Nghe (2009), Paul Janecek, Peter Haddawy. Một phân tích giữa các kỹ thuật trong dự đoán kết quả học tập.Tài liệu Tiếng Anh Sách, tạp chí
Tiêu đề: Một phân tích giữa các kỹ thuật trong dự đoán kết quả học tập
Tác giả: Nguyễn Thái Nghe
Năm: 2009
[7] Brijesh Kumar Baradwaj, Saurabh Pal (2011): Mining Educational Data to Analyze Students Performance, (IJACSA) International Journal of Advanced Computer Science and Applications, Vol. 2, No. 6 Sách, tạp chí
Tiêu đề: Mining Educational Data to Analyze Students Performance
Tác giả: Brijesh Kumar Baradwaj, Saurabh Pal
Năm: 2011
[8] Sajadin Sembiring (2011), Prediction of student academic performance by an application of datamining techniques, 2011 International Conference on Management and Artificial Intelligence IPEDR vol.6 (2011) © IACSIT Press, Bali, Indonesia Sách, tạp chí
Tiêu đề: Prediction of student academic performance by an application of datamining techniques
Tác giả: Sajadin Sembiring
Năm: 2011
[4] Thuật toán K-means trên trang http://ungdung.khoa-hnvd.com/Hoc_thuat/KMeans.html Link
[2] Ông Xuân Hồng, Gom nhóm (Clustering analysis) tập dữ liệu Labor Khác
[3] Nguyễn Văn Nhƣợng (2012), Khai phá dữ liệu về kết quả học tập của học sinh trường cao đẳng nghề Văn lang Hà Nội Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w