Cụm dữ liệu và ứng dụng trong phân tích lương của cán bộ trường cao đẳng nghề hà nam

78 5 0
Cụm dữ liệu và ứng dụng trong phân tích lương của cán bộ trường cao đẳng nghề hà nam

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

i ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ĐÀO MỸ HẠNH CỤM DỮ LIỆU VÀ ỨNG DỤNG TRONG PHÂN TÍCH LƢƠNG CỦA CÁN BỘ TRƢỜNG CAO ĐẲNG NGHỀ HÀ NAM Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số chuyên ngành: 60 48 0101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2015 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ii LỜI CẢM ƠN Tôi xin chân thành cảm ơn tập thể thầy cô khoa đào tạo sau đại học trƣờng Đại học Công nghệ Thông tin Truyền thông Thái Nguyên trang bị cho kiến thức năm học tập trƣờng để tơi hồn thành tốt luận văn tốt nghiệp Tôi xin cảm ơn đồng nghiệp ngƣời thân động viên, giúp đỡ tơi q trình nghiên cứu thực luận văn Đặc biệt, xin cảm ơn GS.TS Vũ Đức Thi, ngƣời trực tiếp, tận tâm hƣớng dẫn, giúp đỡ, cung cấp tài liệu tạo điều kiện thuận lợi cho nghiên cứu thành công luận văn tốt nghiệp Thái Nguyên, ngày … tháng … năm 2015 Tác giả luận văn Đào Mỹ Hạnh Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn iii LỜI CAM ĐOAN Tơi xin cam đoan tồn nội dung luận văn tự sƣu tầm, tra cứu xếp cho phù hợp với nội dung yêu cầu đề tài Nội dung luận văn chƣa đƣợc công bố hay xuất dƣới hình thức khơng đƣợc chép từ cơng trình nghiên cứu Các số liệu, kết nêu luận văn trung thực chƣa đƣợc công bố cơng trình khác Tơi xin cam đoan giúp đỡ cho việc thực luận văn đƣợc cảm ơn thơng tin trích dẫn luận văn đƣợc rõ nguồn gốc Nếu sai tơi xin hồn tồn chịu trách nhiệm Thái Nguyên, ngày … tháng … năm 2015 Ngƣời cam đoan Đào Mỹ Hạnh Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn iv DANH MỤC TỪ VIẾT TẮT CSDL: Cơ sở liệu KPDL: Khai phá liệu PCDL: Phân cụm liệu DANH MỤC CÁC BẢNG Bảng 1.1: Thuộc tính liệu nhị phân………………….……………… ………8 Bảng 1: Các nhóm sở tƣơng ứng……………………………… ………….43 DANH MỤC HÌNH VẼ Hình 1.1: Phân cụm liệu Hình 1.2: Ví dụ minh họa phân cụm phân hoạch 11 Hình 2.1: Kết phân nhóm thuật tốn K–Means (a), Seed–Kmeans (b) 18 Hình 2.2: Lân cận p với ngƣỡng Eps 18 Hình 2.3: Mật độ đến đƣợc trực tiếp 19 Hình 2.4: Mật độ đến đƣợc 19 Hình 2.5: Mật độ liên thông 20 Hình 2.6: Đồ thị xếp 4-dist CSDL mẫu 23 Hình 2.7: Các nhóm phát đƣợc DBSCAN 23 Hình 2.8: Các đối tƣợng bị ảnh hƣởng CSDL mẫu 27 Hình 2.9: Các trƣờng hợp khác thuật toán 30 Hình 2.10: Thể trộn nhóm A, B, C thuật tốn thêm 31 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn v Hình 2.11: Các trƣờng hợp khác thuật tốn xóa 32 Hình 2.12: Suffix trie hậu tố xâu S = abaab 35 Hình 2.13: Cây hậu tố cho chuỗi S = xabxac 36 Hình 2.14: Các bƣớc tạo hậu tố xâu S=abaab 37 Hình 2.15: Quy tắc thêm kí tự vào chứa 37 Hình 2.16: Cây hậu tố T xâu S = axabx 38 Hình 2.17: Cây hâu tố T xâu S=axabxb theo quy tắc 38 Hình 2.18: Cây hậu tố T xâu S = axabxb theo quy tắc 39 Hình 2.19: Cây hậu tố với liên kết hậu tố cho chuỗi xabxa abxbx 40 Hình 2.20: Cây hậu tố chuỗi "cat ate cheese", "mouse ate cheese too" and "cat ate mouse too" 43 Hình 2.21: Đồ thị nhóm sở 44 Hình 3.1: Mơ hình 3-Tier 54 Hình 3.2: Mơ hình use case tổng quan hệ thống 55 Hình 3.3: Giao diện form đăng nhập 56 Hình 3.4: Giao diện form quản lý danh mục 57 Hình 3.5: Màn hình 58 Hình 3.6: Dữ liệu đầu vào 59 Hình 3.7: Kết phân cụm liệu Incremencal DBSCAN 60 Hình 3.8: Dữ liệu đƣợc thêm 61 Hình 3.9: Kết phân cụm sau thêm liệu 61 Hình 3.10: Màn hình quản lý ngƣời dùng 62 Hình 3.11: Màn hình thêm ngƣời dùng 62 Hình 3.12: Màn hình sửa thơng tin ngƣời dùng 63 Hình 3.13: Cửa sổ xác thực xóa thơng tin ngƣời dùng 63 Hình 3.14: Màn hình quản lý thơng tin khoa/viện 64 Hình 3.15: Màn hình quản lý thơng tin giảng viên 64 Hình 3.16 : Màn hình quản lý thông tin giảng viên 65 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn vi MỤC LỤC LỜI CẢM ƠN i LỜI CAM ĐOAN iii DANH MỤC TỪ VIẾT TẮT iv DANH MỤC CÁC BẢNG iv DANH MỤC HÌNH VẼ iv MỤC LỤC vi MỞ ĐẦU ix CHƢƠNG I: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU VÀ PHÂN CỤM DỮ LIỆU 1.1 Khai phá liệu 1.1.1 Giới thiệu khai phá liệu 1.1.2 Quá trình khai phá liệu 1.1.3 Các kỹ thuật khai phá liệu 1.1.4 Ứng dụng Khai phá liệu 1.1.5 Các xu vấn đề cần giải khai phá liệu 1.2 Kỹ thuật phân cụm Khai phá liệu Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn vii 1.2.1 Tổng quan kỹ thuật phân cụm 1.2.2 Một số khái niệm cần thiết tiếp cận phân cụm liệu 1.2.2.1 Các kiểu liệu thuộc tính phép phân cụm 1.2.2.2 Đo độ tƣơng đồng 1.2.3 Các yêu cầu kĩ thuật phân cụm liệu 1.2.4 Các hƣớng tiếp cận phân cụm liệu 11 1.2.4.1 Phƣơng pháp phân hoạch: 11 1.2.4.2 Phƣơng pháp phân cụm phân cấp 12 1.2.4.3 Phƣơng pháp phân cụm dựa mật độ 13 1.2.4.4 Phƣơng pháp phân cụm dựa lƣới 13 CHƢƠNG II: 15 MỘT SỐ THUẬT TỐN PHÂN CỤM DỮ LIỆU ĐIỂN HÌNH 15 2.1 Thuật toán K-Means 15 2.2 Thuật toán DBSCAN 18 2.3 Thuật toán BIRCH 24 2.4 Thuật toán INCREMENTAL DBSCAN 25 2.4.1 Các đối tƣợng bị ảnh hƣởng 26 2.4.2 Trƣờng hợp thêm 29 2.4.3 Trƣờng hợp xóa 31 2.5 Thuật tốn phân nhóm hậu tố 34 2.5.1 Cây hậu tố 34 2.5.2 Cây hậu tố - Cây hậu tố tổng quát 39 2.5.3 Thuật toán STC 41 2.6 Thuật toán dựa vào phân loại véc-tơ hỗ trợ 46 2.6.1 Phƣơng pháp SVM 46 2.6.2 Phƣơng pháp FSVM 48 CHƢƠNG III: 52 ỨNG DỤNG PHƢƠNG PHÁP PHÂN NHÓM DỮ LIỆU 52 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn viii VÀO PHÂN TÍCH LƢƠNG CỦA CÁN BỘ 52 TRƢỜNG CAO ĐẲNG NGHỀ HÀ NAM 52 3.1 Đặt vấn đề 52 3.2 Giải vấn đề: 53 3.2.1 Công cụ lựa chọn xây dựng chƣơng trình phần mềm : 53 3.2.2 Biểu đồ phân cấp chức 54 3.2.3 Mơ hình tổng quan hệ thống 55 3.2.4 Thiết kế giao diện chƣơng trình: 56 3.2.4.1 Giao diện form đăng nhập: 56 3.2.4.2 Giao diện form quản lý danh mục: 56 3.2.4.3 Giao diện chƣơng trình chính: 57 3.2.5 Chạy chƣơng trình : 57 3.2.6 Giao diện quản lý ngƣời dùng : 62 3.2.7 Giao diện quản lý Khoa/Viện: 64 3.2.8 Giao diện quản lý giảng viên : 64 3.2.9 Giao diện quản lý lƣơng : 65 KẾT LUẬN … 66 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ix MỞ ĐẦU Khám phá tri thức - Khai phá liệu (Knowledge discovery - Data mining) lĩnh vực quan trọng ngành Công nghệ thông tin, thu hút quan tâm đông đảo nhà khoa học giới nƣớc tham\gia nghiên cứu Khai phá liệu đời vào năm cuối thập kỷ 80 kỷ XX, lĩnh vực đƣợc nghiên cứu nhằm tự động khai thác thông tin, tri thức hữu ích, tiềm ẩn từ CSDL lớn, kho liệu, Những vấn đề đƣợc quan tâm khai phá liệu phân lớp nhận dạng mẫu, luật kết hợp, phân cụm liệu, Trong đó, phân cụm liệu (Data Clustering) kỹ thuật khai thác liệu có hiệu Phân cụm liệu trình tìm kiếm phát cụm mẫu liệu tự nhiên sở liệu lớn Phân cụm liệu đƣợc ứng dụng nhiều lĩnh vực khác nhƣ giáo dục, y tế, kinh tế, bảo hiểm, phân đoạn ảnh, Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn x Việc áp dụng phân cụm liệu để phân tích ngành kế tốn cần thiết, lƣợng liệu lƣu trữ lƣơng lớn, việc phân tích đánh giá lƣơng để đƣa chiến lƣợc cân đối nguồn chi phí đơn vị, dự báo quỹ lƣơng có kế hoạch cân đối tài cho phù hợp gặp nhiều khó khăn Ngồi việc phân tích lƣơng cịn phục vụ cơng tác quản lý nhân sự, giúp nắm đƣợc tình hình sử dụng ngƣời đơn vị từ đƣa sách tuyển dụng phù hợp, có giải pháp tạo động lực cho ngƣời lao động sách tài Việc phân cụm liệu để phân tích lƣơng cho kết thu đƣợc phân loại theo giá trị lƣơng cán bộ, phân loại mức thu nhập cao thấp khác từ đƣa sách cân đối thu chi để có sách ƣu đãi phù hợp mà đảm bảo tài đơn vị Với lý nhƣ chọn đề tài: “Một số phƣơng pháp phân cụm liệu ứng dụng phân tích lƣơng cán trƣờng Cao đẳng Nghề Hà Nam” làm đề tài luận văn tốt nghiệp Bố cục luận văn gồm có chƣơng: Chƣơng I: Tổng quan khai phá liệu phân cụm liệu Chƣơng II: Một số thuật tốn phân cụm liệu điển hình Chƣơng III: Ứng dụng phƣơng pháp phân nhóm liệu vào phân tích lƣơng cán trƣờng Cao đẳng Nghề Hà Nam Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 54 Hình 3.1: Mơ hình 3-Tier 3.2.2 Biểu đồ phân cấp chức Từ chức ta xác định chƣơng I.Ta xây dựng biểu đồ phân cấp chức hệ thống Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 55 3.2.3 Mơ hình tổng quan hệ thống Quản lý thông tin người dùng Quản lý thông tin Khoa/Viện Quản lý danh mục Quản lý thông tin giảng viên Quản lý thơng tin lương Phân cụm liệu Phân cụm tồn liệu lương Phân cụm liệu lương khoảng thời gian Phân cụm liệu lương cán thuộc Khoa/Viện Hình 3.2: Mơ hình use case tổng quan hệ thống Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 56 3.2.4 Thiết kế giao diện chƣơng trình: 3.2.4.1 Giao diện form đăng nhập: Tên đăng nhập : Mật : Quên mật Đăng nhập Thốt Hình 3.3: Giao diện form đăng nhập  Ngƣời dùng nhập tài khoản truy cập mật vào textbox tên đăng nhập mật  Sau nhập tài khoản truy cập mật ngƣời dùng bấm nút đăng nhập để vào hệ thống.Hoặc bấm nút để khỏi chƣơng trình  Bấm nút quên mật để lấy lại mật 3.2.4.2 Giao diện form quản lý danh mục:  Bố cục chung form quản lý danh mục : quản lý thông tin ngƣời dùng, quản lý khoa/viện, quản lý giảng viên, quản lý lƣơng có bố cục nhƣ hình dƣới.Bao gồm bên tay trái bảng liệu hiển thị tất liệu danh mục.Bên tay trái bao gồm thông tin nhập liệu hiển thị chi tiết danh mục nút chức thêm mới, sửa, xóa danh mục Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 57 Thông tin Thông tin : Thông tin : Thông tin : GridView hiển thị danh sách danh mục Thông tin : Thêm Sửa Xóa Thốt Hình 3.4: Giao diện form quản lý danh mục 3.2.4.3 Giao diện chƣơng trình chính:  Phía bao gồm menu chức chƣơng trình : đổi mật truy cập, quản lý ngƣời dùng, quản lý giảng viên, …  Phía dƣới chia : từ trái qua phải ô thứ ô chọn tham số cho phân cụm, ô thứ hai biểu đồ, ô thứ thông số cụm, ô thứ chi tiết cụm 3.2.5 Chạy chƣơng trình : Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 58 Đăng nhập thành cơng hình lên : Hình 3.5: Màn hình Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 59 Tiến hành phân cụm với liệu đầu vào nhƣ sau: Hình 3.6: Dữ liệu đầu vào Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 60 Tiến hành phân cụm toàn liệu: Hình 3.7: Kết phân cụm liệu Incremencal DBSCAN Kết sau phân cụm nhƣ sau: Tổng số mẫu: 40 Số cụm: Số nhiễu: 10 Cụm 1: 22 phần tử chiếm 73.33% Cụm 2: phần tử chiếm 10% Cụm 3: phần tử chiếm 16.67% Trƣờng hợp liệu thêm mới: Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 61 Hình 3.8: Dữ liệu thêm Sau thêm liệu, kết phân cụm mới: Hình 3.9: Kết phân cụm sau thêm liệu Tổng số mẫu: 43 Số cụm: Số nhiễu: 10 Cụm 1: 25 phần tử chiếm 75.76% Cụm 2: phần tử chiếm 9.09% Cụm 3: phần tử chiếm 15.15% Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 62 3.2.6 Giao diện quản lý ngƣời dùng : Hình 3.10: Màn hình quản lý người dùng Để thêm ngƣời dùng ta click vào button thêm Nhập liệu bấm nút chấp nhận để thêm liệu ấn bỏ qua để khơng thêm Hình 3.11: Màn hình thêm người dùng Để sửa đổi liệu ta click vào liệu muốn sửa bảng liệu Rồi bấm nút sửa nhập thông tin sửa đổi vào ô nhập liệu Bấm nút chấp nhận để thêm liệu ấn bỏ qua để bỏ qua bƣớc sửa đổi Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 63 Hình 3.12: Màn hình sửa thơng tin người dùng Để xóa thơng tin ngƣời dùng ta click vào liệu muốn xóa bảng liệu.Rồi bấm nút xóa để xóa thơng tin ngƣời dùng.Hộp thoại xác nhận lên bấm OK để xóa bấm Cancel để bỏ qua Hình 3.13: Cửa sổ xác thực xóa thơng tin người dùng Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 64 3.2.7 Giao diện quản lý Khoa/Viện: Hình 3.14: Màn hình quản lý thơng tin khoa/viện Việc thêm mới, sửa, xóa thơng tin khoa/viện tƣơng tự quản lý thông tin ngƣời dùng 3.2.8 Giao diện quản lý giảng viên : Hình 3.15: Màn hình quản lý thơng tin giảng viên Việc thêm mới, sửa, xóa thơng tin giảng viên tƣơng tự quản lý thông tin ngƣời dùng Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 65 3.2.9 Giao diện quản lý lƣơng : Hình 3.16 : Màn hình quản lý thơng tin giảng viên Việc thêm mới, sửa, xóa thơng tin lƣơng tƣơng tự quản lý thông tin ngƣời dùng Kết luận chƣơng 3: Chƣơng xây dựng đƣợc chƣơng trình với mục đích thử nghiệm thuật tốn Incremental DBSCAN đề chƣơng thực yêu cầu sau: Quản lý thông tin ngƣời dùng, quản lý thông tin Khoa/ Viện, giảng viên, liệu lƣơng Phân cụm với toàn liệu, phân cụm theo khoảng thời gian, phân cụm theo cán Khoa/ Viện Thông tin phân cụm gồm có: Tổng số cụm, số mẫu, số nhiễu, số phần tử cụm, phần trăm, biểu đồ cụm, thông tin phần tử cụm Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 66 KẾT LUẬN Luận văn nghiên cứu, tìm hiểu, tổng hợp nét đặc trƣng lĩnh vực Khai phá liệu nói chung phƣơng pháp Phân cụm liệu nói riêng Luận văn trình bày đƣợc số kỹ thuật thuật toán phân cụm liệu điển hình, dựa phƣơng pháp có, cài đặt thử nghiệm thuật tốn Incremental DBSCAN tốn phân tích lƣơng cán giáo viên trƣờng Cao đẳng Nghề Hà Nam theo yêu cầu cụ thể Thuật tốn thử nghiệm có ƣu điểm vƣợt trội so với thuật toán phân cụm liệu tĩnh liệu thay đổi ta phân cụm liệu lại từ đầu mà kết tự cập nhật theo liệu đƣợc thêm Điều rút giảm thiểu thời gian, chi phí, giúp đánh giá kết cách đa chiều Với mà luận văn đạt đƣợc, hƣớng phát triển luận văn nhƣ sau: Về lý thuyết: Tiếp tục nghiên cứu phƣơng pháp, cách tiếp cận lĩnh vực Khai phá liệu nói chung phân cụm liệu nói riêng nhƣ: phân cụm mờ, phân cụm thống kê,… tìm kiếm so sánh, chọn lựa thuật toán tối ƣu để giải tốn đƣa ra, nghiên cứu tìm hiểu thêm Khai phá liệu dự đoán mơ tả Về thực tiễn: Phát triển tốn với liệu lớn hơn, quan tâm đến nhiều lựa chọn Phát triển ứng dụng Khai phá liệu phân cụm liệu nhiều lĩnh vực đời sống Mặc dù cố gắng tập trung tham khảo nhiều tài liệu, tạp chí khoa học ngồi nƣớc, nhƣng luận văn khơng thể tránh khỏi nhiều thiếu sót, mong đƣợc bảo đóng góp q thầy giáo Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 67 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Lê Văn Phùng, Quách Xuân Trƣờng (2012), Khai phá liệu (Data Mining), NXB Thông tin Truyền thơng [2] Phạm Đình Hồng, Nghiên cứu phương pháp phân nhóm liệu áp dụng vào hệ thống truy vấn thông tin, Luận văn thạc sỹ khoa học máy tính – ĐH Đà Nẵng, 2013 Tiếng Anh [3] Anil K.Jain (2010), “Data Clustering: 50 Year Beyond K-Means”, Pattenrn Recognition Letters, Volume 31 Issue [4] Beckmann N., Kriegel H.-P., Schneider R., Seeger B (1990), “The R*- tree: An Efficient and Robust Access Method for Points and Rectangles”, Proc ACM SIGMOD Int Conf.on Management of Data, Atlantic City, NJ, pp 322331 [5] Ciaccia P., Patella M., Zezula (1997), “M-tree: An Efficient Access Method for imilarity Search in Metric Spaces”, Proc 23rd Int Conf on Very Large Data Bases, Athens, pp 426-435 [6] Ester M., Kriegel H.-P., Sander J., Xu X (1996), “A Density-Based Algorithm for iscovering Clusters in Large Spatial Databases with Noise”, Proc 2nd Int Conf on Knowledge Discovery and Data Mining, Portland, OR, pp 226-231 [7] Gan, Guojun, Chaoqun Ma, and Jianhong Wu (2007), Data Clustering: Theory, Algorithms, and Applications, ASA-SIAM Serie on Statistics and Applied Probability, SIAM, Philadephia, American Statiscal Association, Alexandria, Virginia [8] Jiawei Han, Micheline Kamber and Jian Pei (2012), Data Mining: Concepts and Techniques (3rd Edition), Morgan Kaufmann Publishers, USA Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 68 [9] Michal Wroblewski (2003), A hierarchical www pages clustering algorithm based on the vec-tơ space model, MASTER THESIS Submitted in partial fulfillment of the requirements for the degree of Master of Science, Poznań University of Technology, Poland, July [10] Nathan Edwards (2005), Lecture 12: suffix tree, Alorithms in Biosequence Analysis-Fall, USA [11] Oren Zamir and Oren Etzioni (1998), Web document Clustering: A Feasibility Demonstration, University of Washington, USA, ACM, 1998 [12] R Krishnapuram, A Joshi, L Yi (1999), A Fuzzy Relative of the k- Medoids Algorithm with Application to Web Document and Snippet Clustering, Proc.IEEE Intl Conf Fuzzy Systems, Korea [13] Wai-chiu Wong Ada Fu (2000), Incremental Document Clustering for Web Page Classification, IEEE 2000 Int, Conf on Infor, Society in the 21st [14] Xiufeng Jiang, Zhang Yi and Jian Cheng Lv (2006), Fuzzy SVM with a new fuzzy membership function, Neural Computing and Application, Volume 15(3), pp 268-276 [15] Y Yang J Pedersen (1997), A Comparative Study on Feature Selection in Text Categorization, In Proc of the 14th International Conference on Machine Learning Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ... 52 ỨNG DỤNG PHƢƠNG PHÁP PHÂN NHÓM DỮ LIỆU 52 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn viii VÀO PHÂN TÍCH LƢƠNG CỦA CÁN BỘ 52 TRƢỜNG CAO ĐẲNG NGHỀ HÀ NAM ... phƣơng pháp phân cụm liệu ứng dụng phân tích lƣơng cán trƣờng Cao đẳng Nghề Hà Nam? ?? làm đề tài luận văn tốt nghiệp Bố cục luận văn gồm có chƣơng: Chƣơng I: Tổng quan khai phá liệu phân cụm liệu Chƣơng... Chƣơng II: Một số thuật tốn phân cụm liệu điển hình Chƣơng III: Ứng dụng phƣơng pháp phân nhóm liệu vào phân tích lƣơng cán trƣờng Cao đẳng Nghề Hà Nam Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Ngày đăng: 12/06/2021, 16:54

Tài liệu cùng người dùng

Tài liệu liên quan