Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 70 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
70
Dung lượng
1,52 MB
Nội dung
Tài liu lun s phm of 63 TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN NGUYỄN THỊ THU TÌM HIỂU VỀ KHAI PHÁ DỮ LIỆU VÀ ỨNG DỤNG TRONG ĐÀO TẠO KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC Chuyên ngành: Sư phạm Tin học HÀ NỘI, 2019 Footer Page of 63 Tài liu lun s phm of 63 TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN NGUYỄN THỊ THU TÌM HIỂU VỀ KHAI PHÁ DỮ LIỆU VÀ ỨNG DỤNG TRONG ĐÀO TẠO KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC Chuyên ngành: Sư phạm Tin học Giáo viên hướng dẫn: Đỗ Thị Lan Anh HÀ NỘI, 2019 Footer Page of 63 Tài liu lun s phm of 63 LỜI CẢM ƠN Trong thời gian nghiên cứu làm đề tài, em gặp khơng khó khăn cách làm kiến thức Tuy nhiên, em nhận giúp đỡ tận tình giáo bạn, em hồn thành đề tài Có thành này, cho phép em bày tỏ lời cảm ơn đến thầy cô giáo Viện Công Nghệ Thông Tin Trường Đại Học Sư Phạm Hà Nội giúp em hồn thành chương tìn đề tài Đồng thời em gửi lời cảm ơn đặc biệt hướng dẫn bảo cô giáo Ths Đỗ Thị Lan Anh tận tình giúp đỡ em suốt q trình hồn thành chương trình đề tài Cùng với góp ý hỗ trợ bạn lớp K41- Sư phạm Tin học Tuy nhiên thời gian có hạn, kinh nghiệm thiếu nên đề tài khơng tránh khỉ thiếu xót, hạn chế định Những ý kiến, nhận xét thầy cô bạn sở để em học hỏi hồn thiện tốt kiến thức Em mong nhận nhận xét góp ý thầy cô bạn Em xin chân thành cảm ơn! Sinh viên thực Nguyễn Thị Thu Footer Page of 63 Tài liu lun s phm of 63 LỜI CAM ĐOAN Tơi xin cam đoan khố luận hoàn thành cố gắng thân, hướng dẫn tận tình giảng viên Ths Đỗ Thị lan Anh tham khảo số tài liệu ghi rõ nguồn Khố luận hồn tồn khơng chép từ tài liệu có sẵn Kết nghiên cứu không trùng lặp với tác giả khác Nếu sai, tơi xin hồn tồn chịu trách nhiệm! Sinh viên thực Nguyễn Thị Thu Footer Page of 63 Tài liu lun s phm of 63 MỤC LỤC ĐẶT VẤN ĐỀ CHƯƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1 Khái niệm khai phá liệu phát triển tri thức 1.2 Các bước trình phát tri thức 1.3 Kiến trúc hệ thống khai phá liệu 1.4 Các nhiệm vụ khai phá liệu 1.4.1 Phát luật tối ưu truy vấn ngữ nghĩa 1.4.2 Phát phụ thuộc sở liệu 1.4.3 Phát sai lệch 1.4.4 Phát luật kết hợp 1.4.5 Mơ hình hóa phụ thuộc 1.4.6 Mơ hình hóa nhân 1.4.7 Phân nhóm 10 1.4.8 Phân lớp 10 1.4.9 Hồi quy 11 1.4.10 Tổng hợp 11 1.5 Sơ lược số kĩ thuật khai phá liệu 12 1.5.1 Phân lớp liệu 12 1.5.2 Phân cụm liệu 12 1.5.3 Cây định 12 1.5.4 Luật kết hợp 13 1.5.5 Hồi quy 13 1.5.6 Mạng Nơron 14 1.5.7 Giải thuật di truyền 14 1.6 Các cách thức giải pháp 14 1.7 Kết luận 16 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT LUẬT KẾT HỢP 17 2.1 Lí thuyết luật kết hợp 17 Footer Page of 63 Tài liu lun s phm of 63 2.1.1 Luật thừa 17 2.1.2 Luật kết hợp 18 2.1.3 Một số tính chất luật kết hợp 21 2.1.4 Phát biểu toán khai phá luật kết hợp 22 2.1.5 Một số hướng tiếp cận khai phá luật kết hợp 23 2.2 Các đặc trưng luật kết hợp 26 2.2.1 Khơng gian tìm kiếm luật 26 2.2.2 Độ hỗ trợ luật 28 2.3 Một số thuật toán 29 2.3.1 Thuật toán Apriori 29 2.3.2 Thuật toán Apriori-tid 34 2.3.3 Thuật toán AIS 37 2.3.4 Thuật toán SETM 39 2.3.5 Thuật toán CHARM 42 2.4 Kết luận 44 CHƯƠNG 3: ỨNG DỤNG KHAI PHÁ LUẬT KẾT HỢP TRONG ĐÀO TẠO 45 3.1 Bài toán 45 3.2 Công cụ sử dụng chương trình 45 3.3 Mơ tả liệu tốn 47 3.4 Chuẩn hoá liệu đầu vào cho thuật toán 48 3.5 Kết khai phá luật kết hợp sử dụng thuật toán Apriori 50 3.6 Kết khai phá liệu từ sở liệu điểm trường Đại học Sư Phạm Hà Nội 53 3.7 Kết luận 53 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 54 TÀI LIỆU THAM KHẢO 55 Footer Page of 63 Tài liu lun s phm of 63 DANH MỤC CÁC TỪ VIẾT TẮT Từ viết tắt Tiếng Anh Tiếng Việt Ck Ck Tập K-itemset ứng cử Conf Confidence Độ tin cậy CSDL Database Cơ sở liệu Item Item Khoản mục Itemset Itemset Tập khoản mục K-itemset K- itemset Tập gồm K mục KDD Knowledge Discovery and Kĩ thuật phát tri thức Data Mining khai phá liệu Lk Lk Tập K- itemset phổ biến Min_conf Minimum Confidence Độ tin cậy tối thiểu Minsup Minimum Support Độ hỗ trợ tối thiểu Supp Support Độ hỗ trợ TID Transaction Indentification Định danh giao tác SQL Structured Query Language Ngôn ngữ vấn đáp chuẩn SQO Sematics Query Optimization Footer Page of 63 Tối ưu hoá truy vấn ngữ nghĩa Tài liu lun s phm of 63 DANH MỤC HÌNH VẼ Hình 1.1 Quy trình phát tri thức Hình 2.1: Dàn cho tập I = {1, 2, 3, 4} 26 Hình 2.2 Cây cho tập I = {1, 2, 3, 4} 27 Hình 2.3: Các bước thực thuật tốn apriori 33 Hình 2.4: Các bước thực thuật toán Apriori_TID 36 Hình 2.5 Các bước thực thuật tốm AIS 38 Hình 2.6: Các bước thực thuật toám SETM 41 Hình 3.1 Giao diện phần mềm WEKA 46 Hình 3.2 Môi trường Weka Explorer 47 Hình 3.3: Bảng liệu khố 41 48 Hình 3.4: Phân bố điểm sinh viên học mơn Tin học đại cương 50 Hình 3.5: Phân bố điểm sinh viên ứng với môn khác 51 Footer Page of 63 Tài liu lun s phm of 63 DANH MỤC BẢNG Bảng 2.1: Ví dụ sở liệu dạng giao dịch - F 19 Bảng 2.2 : Các tập phổ biến sở liệu bảng 2.1 với độ hỗ trợ tối thiểu 25% 20 Bảng 2.3 Cơ sở liệu giao dịch D 32 Bảng 2.4: Cơ sở liệu giao dịch D1 35 Bảng 3.1: Các luật thu liệu sinh viên lớp Sư phạm Tin học khoá 41 52 Footer Page of 63 Tài liu lun s phm 10 of 63 ĐẶT VẤN ĐỀ Lí chọn đề tài Khai phá liệu (KPDL) trình dựa liệu có sẵn, tìm kiếm mẫu mới, thơng tin tiềm ẩn mang tính dự đốn khối liệu lớn Những công cụ khai phá liệu dự đốn xu hướng tương lai Sự phân tích cách tự động mang tính dự báo khai phá liệu có ưu hẳn so với phân tích thơng thường chỗ, khai phá liệu sử dụng với sở liệu (CSDL) chứa liệu không đầy đủ biến đổi liên tục Một nội dung khai phá liệu phổ biến phát luật kết hợp Phương pháp nhằm tìm tập thuộc tính thường xuất đồng thời sở liệu rút luật ảnh hưởng tập thuộc tính dẫn đến xuất thuộc tính khác Apriori thuật toán luật kết hợp, việc áp dụng thuật toán Apriori vào khai phá liệu giúp phát luật kết hợp Vì vậy, việc lựa chọn thuật toán luật kết hợp để ứng dụng vào việc khai phá liệu mang lại hiệu tốt Đây phương pháp điển hình cho việc tư vấn, đặc biệt đào tạo.Vì tơi chọn đề tài “Tìm hiểu khai phá liệu ứng dụng đào tạo” Kết nghiên cứu cung cấp thông tin hỗ trợ sinh viên lựa chọn môn học, hướng nghiên cứu, đồng thời hỗ trợ cán phòng đào tạo thuận lợi cơng tác đào tạo Cụ thể tìm luật có ích giúp cho nhà quản lí đào tạo xếp khung chương trình, lên thời khố biểu,… Mục đích nhiệm vụ nghiên cứu - Mục đích: Giúp tư vấn cho trình đào tạo từ việc cài đặt thuật tốn Apriori sinh luật kết hợp từ giúp tư vấn đào tạo - Nhiệm vụ nghiên cứu: + Tìm hiểu khai phá liệu + Tìm hiểu thuật toán khai phá đặc biệt thuật toán Apriori Footer Page 10 of 63 Tài liu lun s phm 56 of 63 Hình 3.2 Môi trường Weka Explorer 3.3 Mô tả liệu toán Dữ liệu đầu vảo toán file excel lưu trữ điểm thành phần sinh viên khoá khác Ở khoá sinh viên chia thành lớp: Sư phạm Tin học Công nghệ thơng tin Dữ liệu lớp gồm có số thứ tự, họ tên sinh viên, ngày sinh, điểm mơn học theo kì, điểm thực tập,… 47 Footer Page 56 of 63 Tài liu lun s phm 57 of 63 Hình 3.3: Bảng liệu khoá 41 3.4 Chuẩn hoá liệu đầu vào cho thuật toán Đầu vào phần mềm Weka file định dạng arff nên toàn bộ liệu excel toán phải chuyển đổi sang dạng chuẩn arff Cấu trúc file arff sau: Một file arff gồm có phần Phần Header phần khai báo quan hệ biến, phần Data phần liệu ứng với thuộc tính khai báo phần Header Mở đầu file arff từ khóa @relation định nghĩa tên hay quan hệ liệu Ví dụ: @relation Khoa41SP Tiếp sau dòng thuộc tính liệu với từ khóa @attribute Dữ liệu Weka định nghĩa theo kiểu sau: - Numeric: kiểu liệu số, gồm kiểu số nguyên (integer) kiểu số thực (real) - Nominal: kiểu liệu danh sách - String: kiểu liệu dạng chuỗi - Date: kiểu liệu thời gian (ngày tháng năm, phút giây) 48 Footer Page 57 of 63 Tài liu lun s phm 58 of 63 Phần liệu tốn mở đầu từ khóa @data Sau giá trị thuộc tính liên tiếp ngăn cách dấu phẩy Ví dụ: @data C,B,A,B,A,C,A,B+,B,A,C,B,C,B+,A+,B,B,A+,B,A,B+,A,B+,C+,B+,A, A,A,A,B,A,B,B,B+,A,B,C,C,B+,B,C,B,B+,C+,A,B,C,B,B,C+ Như để chuyển từ file excel sang file dạng arff, công việc cần phải làm sau: - Mỗi lớp khóa lưu thành file arff với tên tên lớp khóa - Loại bỏ thuộc tính khơng liên quan đến việc phân tích luật kết hợp như: số thứ tự, mã sinh viên, họ tên sinh viên, ngày sinh - Mỗi mơn học thuộc tính Do sử dụng luật kết hợp Weka không cho phép sử dụng liệu số liên tục nên thuộc tính nhận giá trị rời rạc {F,F+,D,D+,C,C+,B,B+,A} Ví dụ: @attribute “Ngon ngu SQL” { F,F+,D,D+,C,C+,B,B+,A } - Điểm môn học sinh viên lưu vào phần data với điểm môn ngăn cách dấy phẩy - Tất tên lớp môn học phải đổi sang chữ tiếng việt không dấu phần mềm Weka khơng hỗ trợ ngơn ngữ tiếng việt Có nhiều cách chuyển đổi file liệu excell sang file arff Cách chuyển đơn giản thủ công ta xóa thơng tin khơng cần thiết file excell, xóa trường số thứ tự, mã sinh viên, họ tên, ngày sinh Tạo file với tên tên lớp khóa, có phần mở rộng arff Trong file này, tên lớp bổ sung thêm @relation trước Các môn học chuyển thành tên thuộc tính 49 Footer Page 58 of 63 Tài liu lun s phm 59 of 63 Với file excel để lại cột điểm môn sinh viên, ta lưu file dạng cvs (Comma delimited) lưu lại Mở file arff tạo, thêm từ khóa @data vào cuối file chép toàn liệu file text vừa tạo sang Như ta chuẩn hóa file liệu dạng excel sang dạng chuẩn arff 3.5 Kết khai phá luật kết hợp sử dụng thuật toán Apriori Sau liệu chuẩn hóa theo định dạng ARFF Weka, sử dụng phần mềm Weka để tiến hành khai phá luật kết hợp sử dụng thuật toán Apriori trình bày Chương Trong chương khảo sát mối liên hệ điểm thi sinh viên lớp ứng với khóa Xét sinh viên lớp sư phạm Tin học khoá 41 Bảng liệu gồm 50 ghi theo 29 trường thuộc tính Mỗi thuộc tính tương ứng mơn học mà sinh viên lớp sư phạm Tin học khoá 41 học F F+ D D+ C C+ B B+ A Hình 3.4: Phân bố điểm sinh viên học môn Tin học đại cương 50 Footer Page 59 of 63 Tài liu lun s phm 60 of 63 Hình 3.4 mơ tả phân bố điểm sinh viên học môn học “Tin học đại cương” số sinh viên nhận điểm A, B+, C+ C 13, 7, 12, 12 Khơng có sinh viên điểm F, F+, D D+ mơn Hình 3.5: Phân bố điểm sinh viên ứng với môn khác Tương tự hình 3.4, có phân bố điểm mơn khác Hình 3.5 Sau sử dụng công cụ Apriori Weka với tham số cấu Hình 3.5.Kết thu luật bảng 3.1 Phuong phap day hoc Tin hoc 1=B+ 29 ==> Phuong phap day hoc Tin hoc 2=B 29 Nhap mon lap trinh=B+ Ngon ngu lap trinh Java=B 25 ==> Cau truc du lieu va giai thuat=B 25 Nhap mon lap trinh=B+ Cau truc du lieu va giai thuat=B 25 ==> Ngon ngu lap trinh Java=B 25 Lap trinh huong doi tuong=B Ngon ngu lap trinh Java=B 25 ==> Cau truc du lieu va giai thuat=B 25 Cau truc du lieu va giai thuat=B Lap trinh huong doi tuong=B 25 ==> Ngon ngu lap trinh Java=B 25 51 Footer Page 60 of 63 Tài liu lun s phm 61 of 63 Cau truc du lieu va giai thuat=B 27 ==> Ngon ngu lap trinh Java=B 26 Lap trinh huong doi tuong=B 26 ==> Cau truc du lieu va giai thuat=B 25 Lap trinh huong doi tuong=B 26 ==> Ngon ngu lap trinh Java=B 25 Cau truc du lieu va giai thuat=B Ngon ngu lap trinh Java=B 26 ==> Nhap mon lap trinh=B+ 25 10 Cau truc du lieu va giai thuat=B Ngon ngu lap trinh Java=B 26 ==> Lap trinh huong doi tuong=B 25 Bảng 3.1: Các luật thu liệu sinh viên lớp Sư phạm Tin học khoá 41 Bảng 3.1 cho thấy mối quan hệ tương quan môn học lớp Sư phạm Tin học khoá 41 Các luật xếp theo chiều giảm dần độ tin cậy Ví dụ luật 6, môn “Cấu trúc liệu giải thuật” sinh viên nhận điểm B phần lớn mơn “Ngơn ngữ lập trình Java” nhận điểm B Độ tin cậy 96% nghĩa tổng số 27 ghi tìm thấy giá trị B môn “Cấu trúc liệu giải thuật” có 26 ghi nhận giá trị B mơn “Ngơn ngữ lập trình Java” Việc xếp môn theo chiều giảm dần độ tin cậy cho phép đưa thứ tự ưu tiên chọn luật cho sinh viên chọn môn học phù hợp để thu điểm số cao theo mơn Ví dụ bảng 3.1, mơn “Phương pháp dạy học tin học 1” xếp học trước môn “Phương pháp dạy học tin học 2” điểm mơn “Phương pháp dạy học tin học 1” B+ mơn “Phương pháp dạy học tin học 2” chắn B Ý nghĩa luật kết hợp tìm cho sinh viên lớp Sư phạm tin học khoá 41 làm rõ 52 Footer Page 61 of 63 Tài liu lun s phm 62 of 63 3.6 Kết khai phá liệu từ sở liệu điểm trường Đại học Sư Phạm Hà Nội Đối với liệu chương bao gồm khóa liên tiếp lớp Viện Công nghệ thông tin – Trường Đại học Sư phạm Hà Nội 2, khố luận sử dụng cơng cụ Apriori với cấu hình tham số phần khố luận trình bày để tìm luật kết hợp lớp Kết ghi phần Phụ Lục Để giới hạn lại, thực xếp luật thu bảng phụ lục chọn luật có min_conf cao nhất, nhóm theo lớp khóa Mục đích việc phân tích nhằm giúp cho sinh viên khóa sau lựa chọn môn học phù hợp để đạt điểm số cao Các kết tư vấn cho sinh viên cách thức chọn môn học phù hợp để nhằm đạt điểm số cao Các luật lựa chọn theo độ tin cậy cao nên kênh thông tin phù hợp cho việc cho nhà quản lí đào tạo tư vấn cho sinh viên lựa chọn môn học 3.7 Kết luận Chương khố luận mơ tả phần mềm Weka, cách thức chuyển đổi liệu phù hợp cho thuật toán Và áp dụng thuật toán Apriori Weka liệu thu số kết để hỗ trợ cho công tác quản lí đào tạo, tư vấn việc chọn mơn học, lên khung chương trình, thời khố biểu,… 53 Footer Page 62 of 63 Tài liu lun s phm 63 of 63 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Nội dung khố luận tập trung vào tìm hiểu kiến thức khai phá luật kết hợp sâu vào tìm hiểu cơng cụ khai phá liệu mã nguồn mở sử dụng phổ biến Weka Khố luận trình bày được: - Tổng quan lĩnh vực khai phá liệu - Chi tiết thuật toán khai phá luật kết hợp Apriori dựa khái niệm độ hỗ trợ độ tin cậy - Trong chương 3, khoá luận ứng dụng chạy thuật toán Apriori phần mềm Weka cho liệu điểm thi môn học sinh viên trường Đại học Sư phạm Hà Nội Các kết thu gồm bảng luật phụ lục Các kết góp phần hỗ trợ cơng tác quản lí đào tao, tư vấn việc chọn mơn học lên khung chương trình, thời khoá biểu,… Khoá luận đạt số định chưa thể đáp ứng yêu cầu thực tế tồn số khó khăn như: Cơ sở liệu chưa đủ lớn, chưa xây dựng thiết kế giao diện chương trình Trong tương lai tác giả cải thiện bổ sung CSDL, thiết kế giao diện chương trình để hoàn thiện đưa vào sử dụng 54 Footer Page 63 of 63 Tài liu lun s phm 64 of 63 TÀI LIỆU THAM KHẢO Tiếng Việt [1] TS Lê Văn Phùng, Ths Quách Xuân Trường, Khai phá liệu,Nhà xuất [2] Trường Đại học Hàng Hải Việt Nam – Khoa Công nghệ thông tin, Bài giảng khai phá liệu, Hải Phòng - 2011 [3] Nguyễn Nhật Quang, Bài giảng môn học: Khai phá liệu, Trường Đại học Bách Khoa Hà Nội, 2010 [4] Đỗ Trung Tuấn (1999), Cơ sở liệu, Nhà xuất Giáo dục [5] Nguyễn Thanh Thuỷ, Khai phá liệu – kĩ thuật ứng dụng, Hà Nội, 2001 Tiếng Anh [6] Bao Ho Tu (1998), Introduction to Knowledge Discovery and Data mining, Institute of Information Technology National Center for Natural Science and Technology [7] Mohammet J.Zaki and Jui Hasiao CHAM, An effficient Algorithm for Close Itemset Mining [8] Jean – Marc Adamo (2001), Data Minning for Association Rules and Sequential Patterns, Sequential and Parallel Algorithms, Springer – Verlag New York, Inc 55 Footer Page 64 of 63 Tài liu lun s phm 65 of 63 PHỤ LỤC Ngon ngu SQL=B+ 31 ==> Lap rinh Web=B 31 conf:(1) Lap trinh huong doi tuong=B+ 30 ==> Ngon ngu lap trinh C=A 29 Thuc hanh chuyen nganh=B+ 30 ==> Thuc tap chuyen nganh=A 29 Ngon ngu lap trinh C=A 31 ==> Lap trinh huong doi tuong=B+ 29 lift:(1.56) Ly thuyet nhan dang=B 29 ==> Nhap mon khai pha du lieu=B 27 An toan du lieu=B 31 ==> Nhap mon khai pha du lieu=B 28 Tinh toan song song=C+ 31 ==> He chuyen gia=B 28 Bảng 1: Các luật thu liệu sinh viên lớp CNTT khoá 41 Footer Page 65 of 63 Tài liu lun s phm 66 of 63 Day hoc Tin hoc theo chu de=B 14 ==> Thiet ke to chuc hoat dong trai nghiem sang tao=B+ 14 Phuong phap day hoc Tin hoc 1=B+ Day hoc Tin hoc theo chu de=B 13 ==> Thiet ke to chuc hoat dong trai nghiem sang tao=B+ 13 Thiet ke to chuc hoat dong trai nghiem sang tao=B+ 15 ==> Phuong phap day hoc Tin hoc 1=B+ 14 Phuong phap day hoc Tin hoc 1=B+ 15 ==> Thiet ke to chuc hoat dong trai nghiem sang tao=B+ 14 Ngon ngu SQL=B 15 ==> He quan tri co so du lieu=B+ 14 Thiet ke to chuc hoat dong trai nghiem sang tao=B+ 15 ==> Day hoc Tin hoc theo chu de=B 14 Day hoc Tin hoc theo chu de=B 14 ==> Phuong phap day hoc Tin hoc 1=B+ 13 Day hoc Tin hoc theo chu de=B Thiet ke to chuc hoat dong trai nghiem sang tao=B+ 14 ==> Phuong phap day hoc Tin hoc 1=B+ 13 Phuong phap day hoc Tin hoc 1=B+ Thiet ke to chuc hoat dong trai nghiem sang tao=B+ 14 ==> Day hoc Tin hoc theo chu de=B 13 10 Day hoc Tin hoc theo chu de=B 14 ==> Phuong phap day hoc Tin hoc 1=B+ Thiet ke to chuc hoat dong trai nghiem sang tao=B+ 13 Bảng 2: Các luật thu liệu sinh viên lớp Sư phạm Tin học khoá 42 Footer Page 66 of 63 Tài liu lun s phm 67 of 63 Nhap mon CSDL=A 27 ==> Ngon ngu SQL=B+ 27 Nhap mon CSDL=A 27 ==> CSDL phan tan=B 27 Nhap mon CSDL=A CSDL phan tan=B 27 ==> Ngon ngu SQL=B+ 27 Nhap mon CSDL=A Ngon ngu SQL=B+ 27 ==> CSDL phan tan=B 27 Nhap mon CSDL=A 27 ==> Ngon ngu SQL=B+ CSDL phan tan=B 27 Lap trinh huong doi tuong=B+ 29 ==> Ngon ngu lap trinh C=A 28 CSDL phan tan=B 29 ==> Ngon ngu SQL=B+ 28 Ngon ngu SQL=B+ 29 ==> CSDL phan tan=B 28 Ngon ngu SQL=B+ CSDL phan tan=B 28 ==> Nhap mon CSDL=A 27 10 Ngon ngu lap trinh C=A 30 ==> Lap trinh huong doi tuong=B+ 28 Bảng 3: Các luật thu liệu sinh viên lớp CNTT khoá 42 Footer Page 67 of 63 Tài liu lun s phm 68 of 63 Cau truc du lieu va giai thuat=C+ 29 ==> Nhap mon lap trinh=C 28 Nhap mon lap trinh=C 29 ==> Cau truc du lieu va giai thuat=C+ 28 Phuong phap day hoc Tin hoc 2=C+ 27 ==> Phuong phap day hoc Tin hoc 1=B 26 Phuong phap day hoc Tin hoc 2=C+ 27 ==> Thuc hanh su pham 1=B 26 Phuong phap day hoc Tin hoc 2=C+ Thuc hanh su pham 1=B 26 ==> Phuong phap day hoc Tin hoc 1=B 25 Phuong phap day hoc Tin hoc 1=B Phuong phap day hoc Tin hoc 2=C+ 26 ==> Thuc hanh su pham 1=B 25 Phuong phap day hoc Tin hoc 2=C+ 27 ==> Phuong phap day hoc Tin hoc 1=B Thuc hanh su pham 1=B 25 Tin hoc dai cuong=B+ 31 ==> Ren nghiep vu su pham thuong xuyen=B+ 28 Bảng 4: Các luật thu liệu sinh viên lớp Sư phạm Tin học khoá 43 Footer Page 68 of 63 Tài liu lun s phm 69 of 63 Nhap mon CSDL=B+ 32 ==> He dieu hanh Unix=B+ 32 He dieu hanh Unix=B+ 32 ==> Nhap mon CSDL=B+ 32 Nhap mon khai pha du lieu=B 32 ==> Ngon ngu mo hinh hoa=B 32 Ngon ngu mo hinh hoa=B 32 ==> Nhap mon khai pha du lieu=B 32 Kien truc may tinh=A 30 ==> Nguyen li he dieu hanh=B 30 Nhap mon CSDL=B+ Ngon ngu mo hinh hoa=B 30 ==> He dieu hanh Unix=B+ 30 He dieu hanh Unix=B+ Ngon ngu mo hinh hoa=B 30 ==> Nhap mon CSDL=B+ 30 Nhap mon CSDL=B+ Nhap mon khai pha du lieu=B 30 ==> He dieu hanh Unix=B+ 30 He dieu hanh Unix=B+ Nhap mon khai pha du lieu=B 30 ==> Nhap mon CSDL=B+ 30 10 He dieu hanh Unix=B+ Nhap mon khai pha du lieu=B 30 ==> Ngon ngu mo hinh hoa=B 30 Bảng 5: Các luật thu liệu sinh viên lớp CNTT khoá 43 Footer Page 69 of 63 Tài liu lun s phm 70 of 63 Kien truc may tinh=A He dieu hanh Unix=B 27 ==> Nhap mon lap trinh=A 27 He dieu hanh Unix=B 30 ==> Nhap mon lap trinh=A 29 Nhap mon lap trinh=A Kien truc may tinh=A 28 ==> He dieu hanh Unix=B 27 Kien truc may tinh=A 30 ==> Nhap mon lap trinh=A 28 Nhap mon lap trinh=A He dieu hanh Unix=B 29 ==> Kien truc may tinh=A 27 ) Nhap mon lap trinh=A 32 ==> He dieu hanh Unix=B 29 He dieu hanh Unix=B 30 ==> Kien truc may tinh=A 27 Kien truc may tinh=A 30 ==> He dieu hanh Unix=B 27 He dieu hanh Unix=B 30 ==> Nhap mon lap trinh=A Kien truc may tinh=A 27 10 Kien truc may tinh=A 30 ==> Nhap mon lap trinh=A He dieu hanh Unix=B 27 Bảng 6: Các luật thu liệu sinh viên lớp CNTT khoá 44 Cau truc du lieu va giai thuat=A 30 ==> Nhap mon lap trinh=A 29 Kien truc may tinh=A Cau truc du lieu va giai thuat=A 26 ==> Nhap mon lap trinh=A 25 Kien truc may tinh=A 30 ==> Nhap mon lap trinh=A 28 Nhap mon lap trinh=A 32 ==> Cau truc du lieu va giai thuat=A 29 Bảng 7: Các luật thu liệu sinh viên lớp Sư phạm Tin học khoá 44 Footer Page 70 of 63 ... 1.7 Kết luận Nội dung chương tìm hiểu trình phát tri thức vấn đề khai phá liệu Phát tri thức trình rút tri thức từ liệu mà khai phá liệu giai đoạn quan trọng Khai phá liệu nhiệm vụ tìm liệu có... VỀ KHAI PHÁ DỮ LIỆU 1.1 Khái niệm khai phá liệu phát triển tri thức 1.2 Các bước trình phát tri thức 1.3 Kiến trúc hệ thống khai phá liệu 1.4 Các nhiệm vụ khai phá liệu. .. lượng lớn liệu Trong chương tóm tắt số kĩ thuật dùng để khai phá liệu phân tích việc khai phá liệu Trong kĩ thuật khai phá liệu, phát luật kết hợp lĩnh vực quan tâm lĩnh vực nghiên cứu khoá luận,