Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 93 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
93
Dung lượng
3,4 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO NGUYỄN HỮU TOÀN TRƢỜNG ĐẠI HỌC MỞ HÀ NỘI LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN PHÂN LỚP DỮ LIỆU SINH VIÊN ĐỂ TƢ VẤN HỌC SINH LỰA CHỌN NGÀNH TRONG TRUNG TÂM ELEARNING NGUYỄN HỮU TOÀN 2016 - 2018 HÀ NỘI - 2018 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC MỞ HÀ NỘI LUẬN VĂN THẠC SỸ PHÂN LỚP DỮ LIỆU SINH VIÊN ĐỂ TƢ VẤN HỌC SINH LỰA CHỌN NGÀNH TRONG TRUNG TÂM ELEARNING NGUYỄN HỮU TỒN CHUN NGÀNH : CƠNG NGHỆ THƠNG TIN MÃ SỐ: 8.48.02.018 PGS.TS NGUYỄN QUANG HOAN HÀ NỘI - 2018 LỜI CAM ĐOAN Tôi cam đoan cơng trình nghiên cứu riêng tơi Các số liệu, kết nêu luận văn trung thực chƣa đƣợc công bố công trình khác Hà Nội, ngày 28 tháng 12 năm 2018 HỌC VIÊN Nguyễn Hữu Toàn i LỜI CẢM ƠN Em xin chân thành cảm ơn Trung tâm Đào tạo Elearning – Trƣờng Đại học Mở Hà Nội tạo điều kiện thuận lợi giúp em hoàn thành luận văn Em xin chân thành cảm ơn hƣớng dẫn, bảo tận tình PGS.TS Nguyễn Quang Hoan suốt thời gian thực đề tài, cảm ơn thày ln dành thời gian giúp đỡ em để hoàn thành đƣợc luận văn Em xin bày tỏ lòng biết ơn đến thầy Khoa Đào tạo Sau Đại học Trƣờng Đại học Mở Hà Nội cung cấp kiến thức quý báu cho tơi suốt q trình học tập nghiên cứu trƣờng Tôi xin gởi lời cảm ơn đến gia đình, bạn bè ngƣời thân ln quan tâm giúp đỡ suốt thời gian học tập làm luận văn Do thời gian kiến thức có hạn nên luận văn khơng tránh khỏi thiếu sót định Kính mong nhận đƣợc thơng cảm đóng góp ý kiến q Thầy Cô bạn ii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT TIẾNG ANH v DANH MỤC CHỮ VIẾT TẮT TIẾNG VIỆT vi DANH SÁCH CÁC BẢNG vii DANH SÁCH CÁC HÌNH VẼ viii LỜI MỞ ĐẦU CHƢƠNG PHƢƠNG PHÁP PHÂN LỚP DỮ LIỆU 1.1 Khái quát phân lớp liệu 1.1.1 Phân lớp liệu .4 1.1.2 Các vấn đề liên quan đến phân lớp liệu 1.2 Phân lớp liệu định 11 1.2.1 Định nghĩa 11 1.2.2 Xây dựng định 12 1.2.3 Các đặc trưng phân lớp liệu sử dụng định 12 1.2.4 Đánh giá định phân lớp liệu .14 1.3 Phân lớp liệu mạng Naïve Bayes .16 1.4 Phân lớp liệu Neural Network 17 1.5 Tình hình nghiên cứu giải thuật 18 1.6 Kết luận chƣơng 19 CHƢƠNG GIẢI THUẬT C4.5 VÀ NAIVE BAYES 20 2.1 Giải thuật C4.5 .20 2.1.1 Tổng quan giải thuật 20 2.1.2 Sử dụng Gain – Entropy làm độ lựa chọn thuộc tính “tốt nhất” 22 2.1.3 Ví dụ minh họa cho giải thuật C4.5 23 2.1.4 Xử lý giá trị thiếu C4.5 29 2.1.5 Tránh vừa liệu 30 2.1.6 Chuyển đổi từ định sang luật 31 2.1.7 Hiệu cho tập liệu vừa nhỏ 32 iii 2.2 Giải thuật Naïve Bayes đơn giản 32 2.2.1 Ý tưởng mục đích giải thuật 32 2.2.2 Thuật giải Naïve Bayes 32 2.2.3 Ví dụ minh họa cho giải thuật Naïve Bayes 34 2.3 Đánh giá độ hiệu thuật giải dùng ma trận 35 2.4 Kết luận chƣơng 38 CHƢƠNG PHÂN LỚP DỮ LIỆU SINH VIÊN VÀ ỨNG DỤNG TƢ VẤN CHỌN NGÀNH 39 3.1 Giới thiệu toán 39 3.2 Khảo sát thu thập liệu 40 3.3 Xử lý liệu 45 3.3.1 Trích chọn đặc trưng 45 3.3.2 Chuyển đổi liệu 45 3.3.3 Làm liệu 47 3.4 Phân lớp liệu sinh viên sử dụng giải thuật C4.5 47 3.4.1 Áp dụng giải thuật 47 3.4.2 Chạy giải thuật C4.5 (J48) phần mềm Weka 48 3.5 Ứng dụng tƣ vấn chọn ngành sử dụng giải thuật Naïve Bayes 57 3.5.1 Tổng quan ứng dụng 57 3.5.2 Mơ hình cấu trúc hệ thống .58 3.5.3 Phân tích thiết kế hệ thống 58 3.6 So sánh kết giải thuật C4.5 Naïve Bayes 70 3.7 Kết luận chƣơng 71 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 72 Kết đạt đƣợc từ nghiên cứu 72 Đóng góp luận văn 72 Hạn chế .73 DANH MỤC TÀI LIỆU THAM KHẢO 74 PHỤ LỤC 76 iv DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT TIẾNG ANH Viết tắt Tiếng Anh Tiếng Việt ACC Accuracy Độ xác ANN Artificial Neural Network Mạng nơ-rôn nhân tạo FDR False Discovery Rate Tỷ lệ khám phá sai FN False Negative Sai âm tính FNR False Negative Rate Tỷ lệ bỏ lỡ tỷ lệ nhầm sang âm FOR False Omission Rate Tỷ lệ bỏ sót sai FP False Positive Nhầm sang dƣơng G Gain Độ lợi GR Gain Ratio Tỉ số độ lợi ID3 Inductive Dichotomizer Giải thuật quy nạp ID3 IG Information Gain Độ lợi thông tin MCC Matthews Correlation Coefficient Hệ số tƣơng quan Matthews MLP Multilayer Perceptron Mạng nơ-rôn Perceptron N Condition Negatives Điều kiện phủ định NB Naïve Bayes Naïve Bayes (Giải thuật Bayes) NN Neural Network Mạng nơ-rôn Perceptron NPV Negative Predictive Value Giá trị tiên đoán âm P Condition Positive Điều kiện dƣơng PPV Precision or positive predictive value Giá trị tiên đốn xác tích cực SplitInfor Split Information Thơng tin phân phối liệu SQL Structured Query Language Ngôn ngữ truy vấn mang tính cấu trúc TN True Negative Âm tính thực TNR Specificity or True Negative Rate Cụ thể tỷ lệ tiêu cực thực TP True Positive Dƣơng tính thực TPR Sensitivity - Recall Tỷ lệ thực dƣơng v DANH MỤC CHỮ VIẾT TẮT TIẾNG VIỆT Chữ viết tắt Chữ gốc CĐ Cao đẳng CNTT Công nghệ Thông tin CSDL Cơ sở liệu ĐH Đại học ĐTB Điểm trung bình G Giỏi K Khá KPDL Khai phá liệu KT Kế toán LKT Luật Kinh tế NNA Ngơn ngữ Anh NNLT Ngơn ngữ lập trình NST Nhóm sở thích QĐ QTKD Quyết định Quản trị Kinh doanh ST SV Sở thích Sinh viên TB Trung bình THPT Trung học phổ thông vi DANH SÁCH CÁC BẢNG Bảng 2.1 Bảng sở liệu dự đoán chọn ngành 23 Bảng 2.2 Bảng sở liệu dự đoán ngành cho học sinh 34 Bảng 2.3 Ma trận Confusion [13,14] 36 Bảng 3.1 Bảng cấu trúc liệu 40 Bảng 3.2 Bảng tập luật áp dụng giải thuật C4.5 54 Bảng 3.3 Bảng thông tin liệu khảo sát 59 Bảng 3.4 Bảng thông tin liệu đƣợc làm 60 Bảng 3.5 Bảng thơng tin nhóm sở thích khả 60 Bảng 3.6 Bảng thông tin học sinh tham gia tƣ vấn 61 Bảng 3.7 Bảng thông tin kết dự đoán chọn ngành 61 Bảng 3.8 Dữ liệu mẫu cần dự báo Bayes 66 Bảng 3.9 Kết so sánh thuật toán Bayes .68 Bảng 3.10 Dữ liệu mẫu cần dự báo 70 Bảng 3.11 Kết so sánh giải thuật Bayes C4.5 .71 vii DANH SÁCH CÁC HÌNH VẼ Hình 1.1 Bài toán phân lớp liệu 04 Hình 1.2 trình phân lớp liệu – Bƣớc xây dựng mơ hình phân lớp .06 Hình 1.3 Quá trình phân lớp liệu – Phân lớp liệu 07 Hình 1.4 Ƣớc lƣợng độ xác mơ hình phân lớp với PP holdout .10 Hình 1.5 Ví dụ định 11 Hình 2.1 Mã giả giải thuật C4.5 .21 Hình 2.2 Ví dụ Cây định hoàn chỉnh 29 Hình 3.1 Giao diện đăng ký thơng tin tham gia khảo sát 41 Hình 3.2 Giao diện nhóm ngƣời thực tế 42 Hình 3.3 Giao diện nhóm ngƣời thích nghiên cứu 42 Hình 3.4 Giao diện nhóm ngƣời có tính xã hội 43 Hình 3.5 Giao diện ngƣời dám nghĩ dám làm 43 Hình 3.6 Giao diện ngƣời cơng chức – văn phòng 44 Hình 3.7 Giao diện kết đánh giá khả sở thích 44 Hình 3.8 Giao diện khảo sát điểm 45 Hình 3.9 Giao diện Weka 49 Hình 3.10 Giao diện Preprocess .49 Hình 3.11 Giao diện chọn file liệu 50 Hình 3.12 Giao diện Classify 50 Hình 3.13 Giao diện chọn giải thuật 51 Hình 3.14 Giao diện Classify 51 Hình 3.15 Kết Classifer Output 52 Hình 3.16 Cây định sử dụng giải thuật C4.5 Weka 53 Hình 3.17 Mơ hình cấu trúc hệ thống 58 Hình 3.18 Giao diện đăng ký thơng tin tham gia tƣ vấn 62 Hình 3.19 Giao diện lựa chọn khả sở thích 63 Hình 3.20 Giao diện kết đánh giá khả sở thích 64 Hình 3.21 Giao diện nhập điểm mơn học để đƣa dự đốn 65 Hình 3.22 Chọn liệu dự đốn 67 Hình 3.23 Chuyển sang Plain text 67 Hình 3.24 Kết dự đoán weka 68 Hình 3.25 Kết chạy giải thuật Naïve Bayes Weka 69 viii - Đánh giá độ xác thuật tốn chạy phần mềm Weka Sau chạy giải thuật phần mềm Weka với đầu vào 807 ghi thu đƣợc kết nhƣ hình sau: Hình 3.25: Kết chạy giải thuật Naïve Bayes Weka Từ cửa sổ kết Classifer Output (Hình 3.25), ta đọc đƣợc số thơng số đánh giá độ xác thuật tốn Nạve Bayes nhƣ sau: TP số dự đoán CNTT : 92 TP số dự đoán NNA : 144 TP số dự đoán KT: 205 TP số dự đoán QTKD: 131 TP số dự đoán LKT: 100 FP số dự đoán sai CNTT: 21 FP số dự đoán sai NNA: 25 FP số dự đoán sai KT: 37 FP số dự đoán sai QTKD: 43 FP số dự đoán sai LKT: ACC độ xác: 83,27% 69 Tỉ suất sai trung bình: 16,73% TPR(CNTT) Tỉ suất CNTT : 0,76 TPR(NNA) Tỉ suất NNA : 0,95 TPR(KT) Tỉ suất KT : 0,86 TPR(QTKD) Tỉ suất QTKD : 0,71 TPR(LKT) Tỉ suất LKT : 0,87 FPR Tỉ số sai CNTT : 0,031 FPR Tỉ số sai NNA: 0,038 FPR Tỉ số sai KT: 0,065 FPR Tỉ số sai QTKD: 0,069 FPR Tỉ số sai LKT: 0,013 3.6 So sánh kết giải thuật C4.5 Naïve Bayes Với mẫu liệu sử dụng phần mềm Weka để đƣa kết dự đốn theo thuật tốn C4.5 Nạve Bayes.Cho liệu cần dự báo bảng 3.10 Bảng 3.10: Dữ liệu mẫu cần dự báo STT TOÁN LÝ ANH VĂN SỬ ĐỊA NHĨM SỞ THÍCH K K K TB TB K NHOM1 G K K TB TB TB NHOM2 TB TB K K K K NHOM3 G K K TB TB TB NHOM4 K K K TB TB K NHOM5 K K K TB TB TB NHOM1 TB TB K K K K NHOM2 TB TB K K TB K NHOM3 K TB G TB K K NHOM4 10 K K K TB TB TB NHOM5 QD Sau chạy phần mềm weka với liệu dự báo bảng 3.10 ta có kết bảng 3.11 nhƣ sau: 70 Bảng 3.11: Kết so sánh thuật toán Nạve Bayes C4.5 STT TỐN LÝ ANH VĂN SỬ ĐỊA NHĨM SỞ THÍCH KẾT QUẢ KQ C4.5 BAYES K K K TB TB K NHOM1 CNTT CNTT G K K TB TB TB NHOM2 CNTT CNTT TB TB K K K K NHOM3 LKT LKT G K K TB TB TB NHOM4 KT KT K K K TB TB K NHOM5 QTKD QTKD K K K TB TB TB NHOM1 CNTT CNTT TB TB K K K K NHOM2 LKT LKT TB TB K K TB K NHOM3 LKT NNA K TB G TB K K NHOM4 QTKD QTKD 10 K K K TB TB TB NHOM5 KT QTKD Nhƣ vậy, với bảng liệu mẫu huấn luyện bảng liệu mẫu tin cần dự báo Hai giải thuật cho kết phân lớp liệu (gán nhãn) khác Ở mẫu tin thứ thứ 10 giải thuật C4.5 cho kết lựa chọn ngành “NNA” “QTKD” nhƣng giải thuật Naïve Bayes lại lựa chọn ngành “LKT” ngành “KT” Điều cho thấy độ xác giải thuật khác 3.7 Kết luận chƣơng Sau thƣc toán phân lớp liệu sinh viên Trung tâm Elearning tác giả rút đƣợc nhận xét, đánh giá nhƣ sau: Đối với thuật tốn C4.5: Chƣơng trình cài đặt dễ dàng, nhanh chóng, hoạt động ổn định, hiển thị kết nhanh thuận tiện cho ngƣời dùng Đối với thuật tốn Nạve Bayes: Dựa chủ yếu vào định lý xác suất đơn giản tính tốn hiệu phân lớp tốt Ứng dụng xây dựng có giao diện gần gũi với ngƣời dung, khai phá đƣợc thông tin lựa chọn ngành học để hỗ trợ em học sinh lựa chọn ngành nhƣ giúp cán tuyển sinh nhìn nhận đánh giá xác em học sinh 71 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN Kết đạt đƣợc từ nghiên cứu Trong khuôn khổ luận văn tốt nghiệp này, nghiên cứu, phân tích, đánh giá giải thuật phân lớp liệu Tiêu biểu giải thuật C4.5 giải thuật Naïve Bayes đơn giản C4.5 Naïve Bayes có cách thức lƣu trữ liệu xây dựng định dựa độ đo khác Do hai giải thuật có phạm vi ứng dụng vào sở liệu có kích thƣớc khác Áp dụng giải thuật để đƣa dự đoán nhằm hỗ trợ học sinh lựa chọn ngành học phù hợp với thân Luận văn đƣa giải pháp từ việc phân loại liệu phiếu khảo sát thông tin lựa chọn ngành học, đến việc tiến hành khai thác xử lý chúng để đƣa tri thức cần thiết Các tri thức đƣợc tối ƣu hóa đem vào sử dụng cách hiệu việc tƣ vấn chọn ngành học cho liệu Về mặt lý thuyết, nêu đƣợc giải pháp ứng dụng kỹ thuật phân lớp liệu vào toán tƣ vấn chọn ngành học cho học sinh THPT Về mặt thực tiễn, luận văn đáp ứng đƣợc mục tiêu ban đầu đặt ra, hệ thống khai phá đƣợc thông tin lựa chọn ngành học sinh viên, nhằm hỗ trợ em học sinh lựa chọn cho ngành học phù hợp, không cho học sinh lựa chọn ngành học phù hợp với , mà hỗ trợ ban tuyển sinh việc đánh giá, nhìn nhận đặc biệt học sinh để đƣa chiến lƣợc tuyển sinh hiệu Từ giảm thiểu khả chán học, nghỉ học sinh viên nâng cao chất lƣợng đào tạo sinh viên đƣợc tốt Thuật tốn Nạve Bayes hỗ trợ việc lựa chọn kết tối ƣu, phù hợp tập hợp liệu khổng lồ Từ đó, liệu trả đƣợc tận dụng tối đa công việc, ngƣời tƣ vấn việc dùng kết để thực cơng việc mình: tƣ vấn cho học sinh ngành học phù hợp với khả thân Đóng góp luận văn Ứng dụng hỗ trợ học sinh việc xác định lựa chọn ngành học Trung tâm Elearning 72 Hạn chế Luận văn áp dụng đƣợc đối tƣợng thuộc THPT Dữ liệu thu thập thiếu nhiều, chƣa có phƣơng pháp tối ƣu hóa liệu thực liệu lớn Hệ thống chạy riêng độc lập chƣa thể tích hợp đƣợc vào hệ thống khác Hƣớng phát triển luận văn Thuật toán phân lớp mà luận văn sử dụng sinh mơ hình phân lớp dễ hiểu, nhƣng độ xác phân lớp chƣa cao Có thể kết hợp thêm nhiều phƣơng khác để thực nhằm đạt độ xác cao Xây dựng ứng dụng thành hệ thống chuyên gia chuyên nghiệp đóng vai trò nhƣ chun gia tƣ vấn ngành học cho tất học sinh nƣớc Thu thập thêm mẫu liệu để đạt độ xác lớn Nghiên cứu phƣơng pháp xử lý tốn với liệu lớn Mở rộng mơ hình để đáp ứng đƣợc nhiều đối tƣợng 73 DANH MỤC TÀI LIỆU THAM KHẢO Tài liệu tiếng Anh [1] Anurag Srivastava , Eui- Hong Han, Vipin Kumar, Vieet Singh (1998), Parallel Formulations of Decision-Tree Classification Algorithm, Kluwer Academic Publisher [2] Irving John Good (1965), The Estimation of Probabilities: An Essay on Modern Bayesian Methods, MIT Press [3] John Shafer, Rakesh Agrawal, Manish Mehta (1996), SPRINT- A Scalable Paralllel Classifier for Data mining, In Predeeings of the 22nd International Conference on Very Large Database, India [4] Manish Mehta, Rakesh Agrawal, Jorma Rissanen SLIQ (1996), Classifier for Data Mining, IBM Amaden Research Center [5] Mohammed J Zaki, Ching-Tien Ho, Rekesh Agrawal (1999), Parallel Classification for Data Mining on Shared-Memory Multiprocessors, IVM Almaden Research Center, San Jose, CA 95120 [6] Quinlan J (1993), C4.5: Programs for Machine Learning, Morgan Kaufmann Publishers [7] Richard Kufrin (1997), Generating C4.5 Production Rules in Parallel, In Proceeding of Fourteenth National Conference on Artificial Intelligence, Providence RI [8] Ron Kohavi, J Ross Quinlan (1999), Decision Tree Discovery [9] The Morgan Kaufmann Series in Data Management Systems, Jim Gray (2000), Datamining- Concepts and Techniques, Chapter - Classification and Prediction Series Editor Morgan Kaufmann Publishers [10] Shannon C-E (1948), A Mathematical Theory of Conmmunication, Bell System Technological Journal (27) [11] Wu X and Kumar V (2009), Top 10 Algorithms in Data Mining, Chapman & Hall/CRC [12] John Holland (2010), MU Career Center’s Guide to Holland Code: Part 74 of the Career and Major Exploration Guide Series, University of Missouri – MU Career Center Tài liệu tiếng Việt [13] Đỗ Nghị (2011), Khai mỏ liệu, giáo trình, Nhà xuất Đại học Cần Thơ [14] Lê Anh Tú, Nguyễn Quang Hoan (2016), A Growing Hierarchical Semi-Supervised SOM for Classification Problem IJCSIS September, Vol 14 No [15] Nguyễn Quang Hoan, Nguyễn Thị Thanh Lan, Hoàng Phú Quang (2017), Phân loại chất lượng học sinh trường cao đẳng nghề xây dựng Quảng Ninh sử dụng phương pháp học máy Tạp chí KHCN DHSPKTHY; ISSN 2354-0575 Website tham khảo [16] https://www.cs.waikato.ac.nz/ml/weka/ [17] ttps://vi.wiktionary.org/ [18] website: www.careerkey.org/english 75 PHỤ LỤC Bộ công cụ trắc nghiệm định hƣớng nghề nghiệp John Holland John Lewis Holland (21.10.1919 – 27.11.2008) giáo sƣ xã hội học danh dự Trƣờng Đại học Johns Hopkins nhà tâm lý học Mỹ Ông đƣợc biết đến nhƣ tác giả học thuyết lựa chọn nghề nghiệp hay gọi Mã Holland (Holland Codes) thƣờng đƣợc viết tắt RIASEC Trên sở lý thuyết này, John Holland xây dựng câu hỏi dành cho ngƣời muốn tự tìm hiểu Qua nhiều năm phát triển, trắc nghiệm giúp cho ngƣời ta tự phát đƣợc kiểu ngƣời trội tiềm ẩn ngƣời để tự định hƣớng lựa chọn nghề Bảng liệu mẫu dùng để khai phá với 300/807 ghi đƣợc xếp theo Nhóm sở thích ngành lựa chọn : STT 10 11 12 13 14 15 16 17 18 19 20 21 22 Toán TB TB K TB K TB K K K TB K K K K K K K K K TB K K Lý K K K K G K TB TB K K K G K TB TB G TB TB K K G K Anh K K K K G K K TB K K TB K K K K K K K K TB K K Văn TB TB TB K K TB K TB TB K K TB TB TB TB TB TB TB TB K TB K Sử K G TB TB TB G K K K K K TB G G TB K G K TB K TB K 76 Địa G G K K TB K TB TB K TB TB TB TB TB K TB G TB TB K K K Nhóm sở thích Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Ngành CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 K TB TB TB K K TB K K K K K K K K K K TB K K K K TB K K TB TB TB K TB K K K K TB K K K K TB K K K K K G K K TB TB K G K TB K G K K TB G K K G K TB G K TB G G G K G TB K TB TB TB K K TB G K K K K TB K K TB TB TB TB K TB TB TB TB TB TB TB TB TB TB K G K K TB G K K TB K K K K K K K K TB K TB TB TB TB TB K K K TB TB TB TB K TB TB K TB TB K K K K K K K K K TB K TB TB TB K K K K K K K TB TB K TB TB K K TB K TB TB TB TB K K K K TB TB TB TB TB TB K TB K TB G K TB K K G TB K G K TB TB K TB K K 77 G TB G K TB TB K TB TB K TB TB TB TB K K TB TB TB G TB TB TB K TB TB TB K TB TB TB G K TB K K TB TB K TB K Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 Nhom1 CNTT CNTT CNTT CNTT CNTT CNTT CNTT KT KT KT KT KT KT KT KT KT KT KT KT KT KT KT QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 K K TB K K TB TB TB TB K K K K TB K K K K TB K K K K K TB TB K TB K K TB TB TB TB TB TB TB TB TB TB TB G K K TB K K K K K TB G K TB K TB TB G K K G K TB TB K K TB K K K G K TB TB K TB K K TB TB TB TB K K K K K K K TB K K TB K TB K K K TB K K K K TB K TB K TB K TB K K K K K TB TB K K K K TB K TB K TB TB TB TB TB K TB K TB TB K K TB TB TB K K TB TB TB TB K TB TB TB K TB TB K K K K K K K K K K K TB K K G K K K K G K K TB K TB G TB K TB K TB G K K K TB TB TB TB K K G K TB K G K K TB G G G 78 K K G G K TB K TB K TB TB TB TB TB TB K K TB TB TB TB TB TB TB TB TB K TB G TB K G K K TB K G TB G K TB Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT CNTT LKT LKT LKT LKT LKT LKT LKT LKT LKT LKT LKT 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 TB TB TB TB TB TB TB TB TB TB K K K K K K K K K K K K K K K TB TB TB TB TB TB TB TB TB TB TB TB TB TB TB TB TB K TB TB K TB TB TB TB TB K G K G G TB TB K G TB TB K K K K TB TB K G TB G G TB K TB TB TB G G K TB TB TB TB TB K K TB TB K K TB TB TB TB TB TB TB TB TB TB TB TB TB TB TB TB K K TB K K K TB K K K K K TB K TB K K K K K K K K K K TB K K TB K K TB K TB K K K TB K TB TB K K K TB K K K K K K K K K K K TB G K K TB G K G K K K TB TB K K TB TB K TB K TB TB TB TB TB TB K K K K K K G TB G TB G TB G K K 79 K G G TB K K K G K TB TB TB G K TB TB TB TB TB TB K TB K K TB TB TB K K K TB G K TB TB TB G TB G TB G Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom2 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 LKT LKT LKT LKT LKT LKT LKT LKT LKT LKT KT KT KT KT KT KT KT KT KT KT KT KT KT KT KT KT LKT LKT LKT LKT LKT LKT LKT LKT LKT LKT LKT LKT LKT LKT LKT 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 TB TB TB TB TB G G G TB TB TB TB K TB K TB K K K TB TB TB K K K TB TB TB TB K K K TB K TB TB TB TB TB TB K TB K K G TB K K K TB TB K G TB G TB K K TB K K K TB TB TB TB K K TB K TB TB G TB K TB K TB TB TB G K K K TB TB TB TB TB TB TB TB TB K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K TB K K K K K K K TB TB TB TB TB TB TB TB TB TB TB K TB TB K K TB TB K TB TB K K K K K TB K G G TB K TB K K G G TB K K G G K K K K K TB K TB G K K K TB TB TB TB TB K TB K TB TB G TB TB TB 80 K K G TB TB TB TB TB G TB TB K TB K TB G K G TB TB G G K K TB G K G K K G K G K TB G K K G K G Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 Nhom3 LKT LKT LKT LKT LKT KT KT KT LKT LKT LKT LKT LKT LKT NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 K K K K K TB K K K K K K K K K K K K K K TB TB TB TB TB TB TB TB TB TB TB TB TB TB TB TB TB TB K K K K K K K K TB G G G K K G TB TB TB K K G K TB TB K TB G TB K TB K K K K TB K K TB TB TB K TB TB G K TB TB K TB TB TB TB TB TB TB TB TB TB TB TB TB TB K TB TB TB K K K K K K K K K K K K K K K K K TB K TB TB K TB TB TB TB TB K K K K K TB K K TB TB K K K K TB K K K K K TB TB K TB K TB K K TB TB K K TB K K TB K TB TB G K TB TB K K TB TB TB TB TB TB K K K K TB TB TB K TB TB K K TB K K K G K K TB TB K TB 81 G TB K TB TB TB TB K TB G TB TB TB TB G TB K TB K TB G K G K G K K K TB G G G G K K G TB G K G K Nhom3 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 NNA KT KT KT KT KT KT KT KT KT KT KT KT KT KT KT KT KT KT KT LKT LKT NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA NNA QTKD QTKD QTKD 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 TB K G K K K K K K K K K K K TB K K K TB K TB K K K K K G K G K K K K K K K G K K TB K K K G G TB K TB K TB G TB TB G TB K K TB G TB TB TB TB K K K G K G K G G K K K G K G K K TB K K K TB K K K K K TB K TB K K K TB TB K K K TB TB TB K K TB TB TB K TB TB TB TB K TB TB K TB K TB TB TB K TB TB TB K K K K TB K K K TB K TB TB K K K TB TB K TB K TB TB TB TB TB K K K TB TB TB K TB K TB K K TB G TB G K TB TB K K G K G TB K TB G TB TB G TB TB TB TB K TB TB TB TB TB K TB TB TB TB K TB TB TB G K K 82 TB G K K TB K G TB TB K K TB G K K TB TB TB G TB TB TB TB TB K K K TB TB TB TB TB K TB K TB TB K TB TB K Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom4 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 QTKD QTKD KT QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD KT KT KT KT KT KT KT KT KT KT KT KT KT KT KT KT KT KT QTKD QTKD QTKD QTKD 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 K TB TB K K K K K K K K TB G TB TB K TB K K K K G K TB TB TB K TB TB K TB K TB TB TB TB K TB G TB G TB G G G K K TB G TB K K G G TB TB K TB G K G K K K TB K TB K TB TB K K K K K K TB TB K K K K TB TB K K K K K TB K TB K K K TB K K K K TB K K K TB K TB TB TB K K TB TB K K K TB TB TB K K TB TB TB K TB K K K TB K TB K K TB TB TB K G G TB K TB K K K K TB TB TB TB K G K K TB G G K K 83 G K K TB TB TB TB K G K K K TB TB TB TB TB TB TB K K TB K K TB TB K K K G K G Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 Nhom5 QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD KT QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD KT QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD QTKD ... học sinh lựa chọn ngành Trung tâm E-learning” Đề tài thực việc khai phá liệu sinh viên việc lựa chọn ngành học Trung tâm Elearning – Trƣờng Đại học Mở Hà Nội để dự đoán ngành học cho học sinh THPT... DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC MỞ HÀ NỘI LUẬN VĂN THẠC SỸ PHÂN LỚP DỮ LIỆU SINH VIÊN ĐỂ TƢ VẤN HỌC SINH LỰA CHỌN NGÀNH TRONG TRUNG TÂM ELEARNING NGUYỄN HỮU TOÀN CHUYÊN NGÀNH : CÔNG NGHỆ THÔNG TIN... hƣớng chọn ngành nghề giúp cho em tránh khỏi vấn đề trên.Vì việc tƣ vấn chọn ngành nghề phù hợp với học sinh THPT điều cần thiết Với lý trên, chọn đề tài Phân lớp liệu sinh viên để tƣ vấn học sinh