Nghiên cứu một số thuật toán phân cụm dữ liệu và ứng dụng hỗ trợ đánh giá thi đua tại trường thpt bình sơn, quảng ngãi

91 16 0
Nghiên cứu một số thuật toán phân cụm dữ liệu và ứng dụng hỗ trợ đánh giá thi đua tại trường thpt bình sơn, quảng ngãi

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Đ IăH CăĐĨăN NG TR NGăĐ IăH CăS ăPH Mă H ăPHÚC NGHIểNăC UăM TăS PHỂNăC MăD ăLI UăVĨă ĐÁNHăGIÁăTHIăĐUAăT BỊNHăS N,ăQU ăTHU TăTOÁN NGăD NGăH ăTR ă IăTR NGăTHPT NGăNGĩI LU NăVĔNăTH CăSƾă H ăTH NGăTHÔNG TIN ĐƠăN ngă- Nĕmă2019 Đ IăH CăĐĨăN NG TR NGăĐ IăH CăS ăPH Mă H ăPHÚC NGHIểNăC UăM TăS PHỂNăC MăD ăLI UăVĨă ĐÁNHăGIÁăTHIăĐUAăT BỊNHăS N,ăQU ăTHU TăTOÁN NGăD NGăH ăTR ă IăTR NGăTHPT NGăNGĩI ChuyênăngƠnh:ăH ăth ngăthôngătin Mưăs :ă848.01.04 LU NăVĔNăTH CăSƾ Ng iăh ngăd năkhoaăh c:ăPGS.TS Võ Trung Hùng ĐƠăN ngă- Nĕmă2019 ii M CL C L IăCAMăĐOAN i M CăL C ii DANHăM CăT ăVI TăT T iv DANHăM CăCÁCăB NG .v DANHăM CăCÁCăHỊNH vi M ăĐ U 1 Lý chọn đề tài Mục tiêu nhiệm vụ đề tài Đối t ợng phạm vi nghiên cứu .3 Ph ơng pháp nghiên cứu Mục đích ý nghĩa đề tài .3 Kết dự kiến .4 Bố cục luận văn CH NGă1 T NGăQUANăV ăPHỂNăC MăD ăLI U 1.1 Khái niệm mục tiêu phân cụm liệu 1.2 Các ứng dụng phân cụm liệu 1.3 Các yêu cầu vấn đề tồn phân cụm liệu 1.4 Những kỹ thuật tiếp cận phân cụm liệu .8 1.4.1 Ph ơng pháp phân cụm phân hoạch .8 1.4.2 Ph ơng pháp phân cụm phân cấp 1.4.3 Ph ơng pháp phân cụm dựa mật độ 1.4.4 Ph ơng pháp phân cụm dựa l ới 10 1.4.5 Ph ơng pháp phân cụm dựa mơ hình 10 1.4.6 Ph ơng pháp phân cụm có liệu ràng buộc .11 1.5 Các kiểu liệu độ đo .11 1.5.1 Phân loại kiểu liệu .11 1.5.2 Độ đo t ơng tự phi t ơng tự .13 1.6 Tổng kết ch ơng .15 CH NGă Lụă THUY Tă M ă VĨă M Tă S ă THU Tă TOÁNă PHỂNă C Mă D ăLI U 17 2.1 Lý thuyết m 17 2.1.1 Tập m 18 2.1.2 Biến ngôn ngữ .20 iii 2.1.3 Các phép toán logic m 21 2.1.4 Suy diễn m 25 2.1.5 Cấu trúc hệ thống logic m 27 2.2 Thuật toán phân cụm liệu K-Means 28 2.3 Kỹ thuật phân cụm liệu m .32 2.3.1 Tổng quan phân cụm m 32 2.3.2 M hóa liệu 34 2.3.3 Thuật toán Fuzzy C-Means 39 2.3.4 Thuật toán Fuzzy C-Means m rộng 42 2.3.5 Giải m 46 2.4 Tổng kết ch ơng .47 CH NGă3 PHÁTăTRI Nă NGăD NGăVĨăTH ăNGHI M .48 3.1 Tổng quan công tác thi đua, khen th ng ngành giáo dục 48 3.1.1 Một số khái niệm thi đua, khen th ng 48 3.1.2 Quản lý nhà n ớc thi đua, khen th ng 49 3.2 Xây dựng hàm để hỗ trợ phân tích đánh giá 50 3.2.1 Phát biểu toán 50 3.2.2 Cơ s thu thập thông tin 50 3.2.3 Mô tả đầu vào, đầu 51 3.2.4 Xử lý liệu Matlab 52 3.3 Thực nghiệm, đánh giá, nhận xét 59 3.3.1 Thực nghiệm liệu tr ng 59 3.2.2 Đánh giá, nhận xét 66 K TăLU NăVĨăH NGăPHÁTăTRI N 67 TĨIăLI UăTHAMăKH O 68 QUY TăĐ NHăGIAOăĐ TÀI LU NăVĔNă(B n sao) iv DANH M C T VI T T T STT T ăVI TăT T Ý NGHƾA CNTT Công nghệ thông tin CSDL Cơ s liệu FCM Fuzzy C-Means KPDL Khai phá liệu PCDL Phân cụm liệu THPT Trung học phổ thông 65 Phạm Q ới 61.58 Nguyễn Thị Thu 34.17 Nguyễn Thị Thanh Huyền 38.21 Đặng Thanh Nga 58.16 Phạm Thị Trà 49.24 Võ Thị Thanh Thủy Bùi Thị Thu Thu Tr ơng Thị Minh 46.28 Nguyệt 58.16 Nguyễn Thị Bích Vân 34.63 Huỳnh Trung Châu 45.89 Hồ Phúc 66.89 Đặng Văn Thủy 37.12 Nhom Ty le thuoc nhom (%) Hồ Văn Lực 56.25 Trần Thanh Thảo 32.05 Phạm thị Xuân 32.79 Lê Phát Đạt 31.14 Nguyễn Thị Thiềm 40.26 Trần văn Chí 41.43 Lê Văn Quý 70.67 Lê văn Tiến 44.79 Thủy 65.27 Nguyễn văn Ph ớc 37.79 Lê Thị Ba Vân 35.45 Nguyễn Thị Thu ThanhĐ Trần Thị Thu Hà 50.56 Nguyến Thị Hồng Phi 46.55 Nguyễn Thị Thúy Kiều 39.18 Trần Hớn 57.44 Đặng Thanh Hải 68.49 Nguyễn Thị Hồng Hoa Trịnh Thị Hoàng Nga 32.61 Hà Thị Dạ Quỳnh 41.55 Nguyễn Thị Bích Thùy 65.38 Phạm Ngọc Liêm 71.48 Nguyễn Thị Lệ Quyên 50.97 Ng Thị Thanh Nga 44.31 Nguyễn Thị Bích Liễu 69.53 Nguyễn Thị Thúy Hà 43.62 Cao Thị Lệ 65.38 Lê Tấn Phát 36.13 Huỳnh Đình Long 50.97 Đồn Thuật 60.53 Mai Việt Thái 42.27 Lê Thị Kim Bông 48.1 Trịnh Cơng Minh 40.67 Lê Thị Anh Hồng 49.19 Phạm Thị Ph 64.31 Nguyễn Ngọc Hoanh 47.82 Ung Văn Hiếu 54.06 Đậu Công Hữu 56.38 Lại Thị bảo Uyên 44.86 Nhom Ty le thuoc nhom (%) 47.88 Võ Thị Thiếu Khanh Nguyễn Thị Thanh ng 40.4 72.5 83.9 66 3.2.2 Đánh giá, nhận xét Qua thực nghiệm với liệu cụ thể trên, ta thấy với liệu ngẫu nhiên qua trình phân cụm Nếu ta chạy ch ơng trình với C=5 ta phân đ ợc 05 cụm liệu có độ t ơng đồng nh sau: - Nhóm 1: Có viết sáng kiến kinh nghiệm, chuyên môn đ ợc đánh giá tốt, th i gian làm việc đảm bảo nh ng hiệu thực cơng việc ch a cao - Nhóm 2: Có tác phong tốt, chun mơn đ ợc đánh giá cao, hiệu công việc đ ợc nhận xét tốt, hiệu cao, công tác khác làm tốt nh ng khơng viết sáng kiến kinh nghiệm - Nhóm 3: Đ ợc nhận xét tác phong tốt, chuyên môn tốt, có viết sáng kiến kinh nghiệm nh ng thực tế vào làm việc hiệu ch a cao số thuộc tính khác cịn hạn chế - Nhóm 4: Khơng viết sáng kiến kinh nghiệm, tác phong khơng tốt cịn hạn chế nhiều mặt - Nhóm 5: Có viết sáng kiến kinh nghiệm, hiệu cơng việc cao, cơng tác khác tốt nh ng cịn số thuộc tính ch a tốt Dựa vào kết phân cụm Hội đồng thi đua nhanh chóng nhìn giáo viên có độ t ơng đồng nhận xét đánh giá thi đua, s để Hội đồng đánh giá thi đua đánh giá xác, khách quan cơng tác thi đua khen th ng đơn vị Trên bảng phân tích kết ngồi việc phân nhóm thi đua cịn có tính phần trăm liệu gần điểm tâm nhóm (vì liệu phân chia tính m ) giúp ban giám hiệu hội đồng thi đua phân tích thêm cho giáo viên cụ thể nh ng độ t ơng đồng nhóm đư đ ợc phân theo cụm cụ thể Tùy thuộc vào độ xác liệu độ xác nhận xét ng i theo dõi thi đua độ hội tụ tâm cụm liệu cao 67 K T LU NăVĨăH NG PHÁT TRI N 1.ăK tălu n Đề tài đư giới thiệu cách có hệ thống kiến thức tổng quan phân cụm liệu, kiểu liệu độ đo, tổng quan lý thuyết Logic m , thuật toán phân cụm nh ng đặc biệt nghiên cứu thuật toán phân cụm FCM giáo s Bezdek Một số khái niệm công tác thi đua, khen th ng ngành giáo dục đào tạo Phát biểu đ ợc toán kh i đầu, vận dụng lý thuyết đư xây dựng đ ợc hàm để tìm kết toán đặt Trong phần ứng dụng đư chạy đ ợc liệu thực đư phân đ ợc cụm cụm có độ t ơng đồng nhau, dựa cụm ng i quản lý phân tích cho đối t ợng đ ợc đánh giá thi đua thỏa mưn đ ợc kết thi đua D ới h ớng dẫn thầy PGS.TS Võ Trung Hùng th i gian thực đề tài: “Nghiên cứu số thuật toán phân cụm liệu ứng dụng hỗ trợ đánh giá thi đua trường THPT Bình Sơn, Quảng Ngãi” em rút số nhận xét sau:  u điểm - Nghiên cứu sâu mặt lý thuyết phân cụm liệu, logic m thuật toán phân cụm liệu m - Nội dung nghiên cứu vấn đề cấp thiết có nhiều ứng dụng thực tế  Nh ợc điểm - Do th i gian có hạn, nên sử dụng phần mềm MATLAB để viết code chạy phân cụm, ch a xây dựng đ ợc ch ơng trình chạy độc lập thực nghiệm liệu với số l ợng ghi ch a lớn 2.ăH ngăphátătri n Ðề tài đ ợc nghiên cứu áp dụng phạm vi liệu thực tr ng THPT Bình Sơn nên t ơng lai chạy liệu nhiều tr ng khác tỉnh Tiếp tục viết ch ơng trình hồn thiện để chạy độc lập ứng dụng với liệu lớn viết ch ơng trình chạy với nhiều loại liệu khác lĩnh vực khác nh phân loại sách th viện, hay phân loại khách hàng lĩnh vực kinh doanh… Cuối với kết đạt đ ợc đề tài hạn chế nh ng đư giúp em có đ ợc nghiên cứu phân cụm liệu lý thuyết logic m đư phân đ ợc cụm liệu hỗ trợ công tác đánh giá thi đua Bên cạnh làm tài liệu phục vụ giảng dạy tham khảo 68 TÀI LI U THAM KH O Ti ngăVi t [1] Nguyễn Cát Hồ, Nguyễn Cơng Hào (2009), Giáo trình sau đại học Logic mờ ứng dụng, Huế [2] Nguyễn Hà Nam, Hà Trí Thành, Hà Quang Thụy, 2016, Giáo trình khai phá dữliệu, NXB Quốc gia Hà Nội Ti ngăAnh [3] A.K Jain and R.C Dubes, Algorithms for Clustering Data Englewood Cliffs, N.J.: Prentice Hall, 1988 [4] A.K Jain, M.N Murty, and P.J Flynn, ªData Clustering: A Review,º ACM Computing Surveys, vol 31, no 3, pp 264-323, 1999 [5] A.K Jain, P.W Duin, and J Mao, ªStatistical Pattern Recognition: A Review,ºIEEE Trans Pattern Analysis and Machine Intelligence, vol 22, no 1, pp 4-37, Jan 2000 [6] E H Ruspini, J Information Sciences, vol 2, no 3, (1970) [7] J C Bezdek, Editor, “Pattern Recognition with Fuzzy Objective Function Algorithms”, Springer Publishers, New York, (1981) [8] J C Dunn, J Cybernetics, vol 3, no 3, (1974) [9] J C Bezdek, R Ehrlich and W Full, J Computers & Geosciences, vol 10, (1984), pp 2-3 [10] N R Pal and I C Bezdek, J IEEE Transactions on Fuzzy Systems, vol 3, no 4, (1995) [11] The Matworks, Inc “Fuzzy Logic Toolbox for Use with MATLAB” www.matworks.com [12] Zadeh L.A., Fuzzy Sets, ‘’Information and Control’’, (1965) ... tài: ? ?Nghiên cứu số thuật toán phân cụm liệu ứng dụng hỗ trợ đánh giá thi đua trường THPT Bình Sơn, Quảng Ngãi? ?? M cătiêuăvƠănhi măv ăđ ătƠi 2.1 Mục tiêu Biết đ ợc khai phá liệu gì, phân cụm liệu. .. ng đ ợc ứng dụng lĩnh vực nào, tìm hiểu kỹ thuật phân cụm liệu đư đ ợc nghiên cứu, biết logic m thuật toán phân cụm liệu m để ứng dụng vào phân cụm liệu thi đua Viết hàm hỗ trợ phân cụm giáo viên... toán Fuzzy C-Means để phân loại đánh giá thi đua tr ng THPT Bình Sơn, Quảng Ngãi Dữ liệu phục vụ cho việc đánh giá thi đua tr Ngãi ng THPT Bình Sơn, Quảng Ph ngăpháp? ?nghiên? ?c u Tìm hiểu tài liệu

Ngày đăng: 07/05/2021, 14:16

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan