Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 72 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
72
Dung lượng
6,83 MB
Nội dung
CHƯƠNG MƠ HÌNH QUẢN LÝ HỌC TẬP NHẰM CHỐNG GIAN LẬN SAO CHÉP Đề tài tập trung cải tiến phần module PDVAL (Plagiarism Detection on the Vietnamese Academic Literature), kế thừa từ kết nghiên cứu trước Chương trình bày lại mơ hình quản lý học tập nhằm chốn gian lận chép Mô hình phát triển theo mơ hình LMS Moodle, tích hợp module kiểm tra chép PDVAL 2.1 Mơ hình tổng thể Thiết kế Khóa học (LHP) Triển khai hoạt động LHP Giao BT/TL Nộp Kiểm tra chép Yes Sao chép? No Đánh giá kết học tập Thu nạp tài liệu Hình 2.1 Mơ hình tổng thể chống gian lận chép [32] Mơ hình quản lý học tập nhằm chống gian lận chép học tập Sinh viên đề xuất bao gồm bước tương tự cách quản lý lớp học phần phổ biến hệ thống quản lý học tập (learning management system), tích hợp cơng cụ kiểm tra chép Sinh viên nộp (bài tập, tiểu luận, đồ án, luận văn, ) Hệ thống thực bước kiểm tra theo qui trình chi tiết trình bày phần sau Khi đó, Sinh viên thông báo mức độ nguyên báo cáo nộp 12 (ngược với mức độ chép tài liệu) Đây sở để Giảng viên tham khảo đánh giá kết học tập nghiên cứu Sinh viên 2.2 Mơ hình LMS đề xuất [32] Trên sở phân tích yêu cầu đối tượng có tham gia vào hệ thống quản lý học tập [11-12] Quy định tào tạo tín Việt Nam [13][14], mơ hình LMS đề xuất mô tả sơ đồ đây: Hình 2.2 Sơ đồ hoạt động Các danh mục khóa học tạo theo lớp học phần cụ thể để việc sử dụng thuận lợi việc quản lý dễ dàng theo môn giảng viên Để sử dụng hệ thống, người dùng đăng nhập vào hệ thống (nếu chưa có tài khoản đăng ký mới) Thành viên hệ thống phân vai trị như: Người quản lý, Giảng viên, Học viên, Khách Việc phân quyền người 13 quản trị hệ thống thực giảng viên thành viên (học viên) vào khóa học Ngồi ra, hệ thống LMS tích hợp chung với hệ thống PDAVL để giúp giảng viên dễ dàng kiểm tra đạo văn assignment mà học viên nộp hệ thống 2.3 Các chức LMS đề xuất 2.3.1 Dành cho sinh viên Hình 2.3 Chức dành cho Học viên [32] Học viên đăng ký thành viên để tham gia vào hệ thống Học viên quản lý thơng tin cá nhân nhật ký học tập Tìm kiếm khóa học, diễn đàn: Học viên dễ dàng tìm kiếm tham gia vào khóa học Học viên download tài nguyên học tập, tham gia thảo luận làm tập 14 2.3.2 Dành cho giảng viên Hình 2.4 Chức dành cho Giảng viên Quản lý học viên: Được phép /xóa/sửa học viên, học viên vào khóa học phù hợp Quản lý khóa học: Được phép /xóa/sửa khóa học, upload giảng, tài nguyên theo chuẩn SCORM Quản lý điểm: Có thể nhập điểm, xuất báo cáo điểm số sinh viên Kiểm tra đạo văn: Hệ thống tích hợp với module PDVAL cho phép giảng viên kiểm tra tập học viên có phải chép hay khơng 2.3.3 Dành cho quản lý Hình 2.5 Chức dành cho Quản lý 15 Quản lý site: Cho phép quản lý thiết lập tùy chọn nâng cao, bật tắt module, thay đổi giao diện ngôn ngữ Quản lý người dùng: Có khả quản lý tồn tài khoản, bao gồm học viên giảng viên, phân quyền tài khoản Thiết lập module PDVAL: Cấu hình thơng số cần thiết để kết nối module PDVAL với hệ thống LMS dạng Plugin 2.4 Tích hợp module PDVAL vào hệ thống LMS Module PDVAL thiết kế xây dựng để tích hợp vào hệ thống LMS theo chuẩn Plugin Plagiarism Moodle [15, 16] Để tích hợp vào hệ thống LMS, bước thực sau: 2.4.1 Plugin installing Hình 2.6 Cài đặt Plugin PDVAL 16 2.4.2 Plugin setting Hình 2.7 Thiết lập Plugin PDVAL 2.4.3 Plugin enable in courses (assignments) Hình 2.8 Bật Plugin PDVAL 17 2.4.4 View result 2.4.4.1 Giao diện người dạy Hình 2.9 Giao diện Plugin PDVAL người dạy [32] 2.4.4.2 Giao diện người học Hình 2.10 Giao diện Plugin PDVAL người học [32] 18 2.5 Hoạt động chức kiểm tra chép LMS Chức kiểm tra chép hoạt động người học nộp lên hệ thống Hình 2.11 Hoạt động PDVAL hệ thống LMS [32] Các bước thực sau: 1: Upload file lên Web server 2: Web server upload file lên Plagiarism server để xử lý so sánh 3: Plagiarism server trả kết (dữ liệu thô ngram, thống kê) 4: Web server trả kết (đã xử lý nối chuỗi, tô màu, kết dạng pdf) Quy trình hoạt động sau: Upload file lên Web server Khi người học nộp hệ thống LMS, hệ thống tự động upload file lên Web server thông qua plugin “Plagiarism PDVAL” (định thời plugin chạy xử lý kiểm tra file upload lên hệ thống) Input: file upload Output: kết upload Web server upload file lên plagiarism server để kiểm tra chép Khi nhận file từ hệ thống LMS, Web server lưu trữ liệu cần thiết tự động upload lên Plagiarism server yêu cầu so sánh (scrontab định thời check file cần upload) Input: file upload Output: domhtml file upload Plagiarism server trả kết kiểm tra chép (dữ liệu thô ngram, thống kê) 19 Khi nhận yêu cầu kiểm tra chép từ Web server, Plagiarism server bắt đầu trình xử lý trả kết Kết trình đánh dấu vị trí chép, phục vụ cho việc tô màu Input: ID tài liệu cần so sánh Output: Kết đánh dấu vị trí chép Nối chuỗi, tơ màu, tinh tốn tỉ lệ chép Khi nhận liệu kết so sánh file từ Plagiarism server, hệ thống tiến hành xử lý nối chuỗi, tô màu, ghi tài liệu trùng xuất kết file pdf, trả kết cho hệ thống LMS Input: Kết đánh dấu vị trí chép từ Plagiarism server Output: File pdf kết so sánh tô màu tinh tốn tỉ lệ chép 2.6 Mơ hình thiết kế Hình 2.12 Hệ thống LMS tích hợp module PDVAL [32] 2.6.1 Tầng User Interface Chịu trách nhiệm cung cấp giao diện cho nhiều loại người dùng Kết sau xử lý trả lại cho người dùng Có khả xử lý yêu cầu từ nhiều loại thiết bị người dùng khác 20 2.6.2 Tầng LMS LMS Web Server: đảm nhận nhiệm vụ xử lý yêu cầu từ tầng User Interface trả cho client LMS Database Server: Chứa CSDL tồn hệ thống LMS Ngồi cịn chứa CSDL module PDVAL ứng dụng ngồi tích hợp khác 2.6.3 Tầng PDVAL Plagiarism Webservices: Đây hệ thống phát đạo văn, có nhiệm vụ cung cấp API để tương tác với LMS IUH Plagiarism Server: Quy trình xử lý nghiệp vụ phát đạo văn Server đảm nhiệm Khi xử lý yêu cầu từ người dùng, kết báo cáo trả cho LMS Elasticsearch: Server chứa liệu phân tích tài liệu nguồn 21 Hình 4.4 Kết nhận diện chép giảm chiều dài chuỗi chép 59 4.2 Kết thực nghiệm tìm kiếm dựa elasticsearch 4.2.1 Các bước thực thực nghiệm Bước 1: Lấy liệu từ https://archive.org/download/stackexchange cho liệu tiếng Anh Đối với liệu tiếng Việt, liệu tải từ https://tailieu.vn/ luận văn sinh viên khoa Quản trị kinh doanh trường Đại học Công nghiệp TP.HCM Bước 2: Đánh giá kết tìm kiếm Elasticsearch theo trường hợp chép phổ biến Bước 3: Sử dụng plugin để cải thiện kết tìm kiếm Tiếng Việt Bước 4: Tích hợp kết trả Elasticsearch vào toán kiểm tra chép 4.2.2 Giao diện thực thực nghiệm Hình 4.5 Mơ hình lọc tài liệu nguồn có nguy bị đạo văn 4.2.3 Kết thực nghiệm Tìm kiếm tiếng Việt: 60 Tìm kiếm tiếng Việt khơng dấu: cho kết tương đối xác Hình 4.6 Tìm kiếm tiếng Việt khơng dấu Tìm kiếm tiếng Việt có dấu: cho kết tương đối xác Hình 4.7 Tìm kiếm tiếng Việt có dấu Tìm kiếm tiếng Anh: Kết phù hợp 61 Hình 4.8 Tìm kiếm tiếng Anh So sánh trường hợp sau chép cụ thể: chép nguyên đoạn, chép phần từ tài liệu, chép từ nhiều tài liệu không xáo trộn từ, chép từ nhiều tài liệu có xáo trộn từ Trường hợp 1: Tìm kiếm chép nguyên đoạn Bảng 4.3 Tìm kiếm tiếng Việt chép nguyên đoạn Câu tìm kiếm Kết tìm Vì cấu nguồn vốn công ty khoản nợ phải trả chiếm lớn điều chứng tỏ khả đảm bảo mặt tài cơng ty thấp cơng ty dễ gặp rủi ro khoản toán đến hạn mà công ty chưa thu hồi vốn chưa có khả tốn Vì cấu nguồn vốn công ty khoản nợ phải trả chiếm lớn điều chứng tỏ khả đảm bảo mặt tài cơng ty thấp công ty dễ gặp rủi ro khoản tốn đến hạn mà cơng ty chưa thu hồi vốn chưa có khả tốn 62 Hình 4.9 Tìm kiếm chép nguyên đoạn Trường hợp 2: Tìm kiếm chép có đảo ngữ Bảng 4.4 Tìm kiếm chép có đảo ngữ Câu tìm kiếm Kết tìm nâng cao chất lượng sản phẩm, nỗ lực phấn đấu để tự hoàn thiện mình, mở rộng mối quan hệ với nhiều khách hàng Nỗ lực phấn đấu để tự hồn thiện mình, nâng cao chất lượng sản phẩm, mở rộng mối quan hệ với nhiều khách hang 63 Hình 4.10 Tìm kiếm chép có đảo ngữ Trường hợp 3: tìm kiếm chép có sửa số từ xem kẽ Bảng 4.5 Tìm kiếm chép có sửa số từ xem kẽ Câu tìm kiếm Kết tìm Vì cấu nguồn vốn công ty, khoản nợ phải trả chiếm lớn chứng tỏ khả đảm bảo tài cơng ty Vì cấu nguồn vốn cơng ty khoản nợ phải trả chiếm lớn điều chứng tỏ khả đảm bảo mặt tài cơng ty 64 Hình 4.11 Tìm kiếm chép có sửa số từ xem kẽ Trường hợp 4: tìm kiếm cụm từ bị sai tả lỗi đánh máy: Bảng 4.6 Tìm kiếm cụm từ bị sai tả lỗi đánh máy Câu tìm kiếm ý thức nguoi qá trình kh thác Kết tìm ý thức người trình khai thác 65 Hình 4.12 Tìm kiếm cụm từ bị sai tả lỗi đánh máy 4.2.4 Đánh giá kết thực nghiệm Elasticsearch máy hỗ trợ tìm kiếm mạnh mẽ Việc đánh sai cú pháp, tả khơng thể tránh khỏi q trình tìm kiếm Tuy nhiên, elasticsearch hỗ trợ tốt Đồng thời việc chéo nguyên câu, nguyên đoạn xảy phổ biến sinh viên nên việc kiểm tra trở nên xác Ngồi Elasticsearch Cluster cụm phân tán giúp giảm tải cho trình xử lý liệu máy chủ Việc liệu lớn dần theo thời gian làm ảnh hưởng đến tốc độ 66 tìm kiếm khơng thể tránh khỏi Vì vậy, sử dụng elasticsearch phù hợp cho toán kiểm tra đạo văn sinh viên, giúp tăng tốc độ tìm kiếm Thời gian thực bước kho liệu nhỏ 800ms hiệu so với mơ hình chưa cải tiến (trên tập tài liệu) Như vậy, đề tài giải vấn đề đặt sử dụng NoSql để lưu trữ liệu lớn, cụ thể Elasticsearch Cơ chế tìm kiếm search Lucene giúp xác định nhanh tập tài liệu nghi vấn có trùng lắp với tài liệu kiểm tra Kết thực tích hợp vào hệ thống kiểm tra chép đề tài “Nghiên cứu xây dựng hệ thống quản lý học tập nhằm chống chép trường Đại học Cơng nghiệp TP.Hồ Chí Minh” số 04416/ĐTKHCN/HĐ-KHCN ngày 15/01/2016 67 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Kết luận Luận văn trình bày tổng quan khái niệm liên quan đến hệ thống kiểm tra đạo văn, đặc biệt ngôn ngữ tiếng Việt Đồng thời luận văn thu thập liệu luận án, luận văn thuộc ngành quản trị kinh doanh, kế tốn kiểm tốn, tài ngân hàng tải từ website từ sinh viên khoa Quản trị kinh doanh thuộc trường Đại học công nghiệp TP.HCM, góp phần vào database hệ thống quản lý học tập để giúp kiểm tra chép Luận văn đề xuất phương pháp cải tiến mơ hình kiểm tra chép sinh viên thông qua công cụ tìm kiếm phổ biến Elasticsearch Từ đó, tích hợp vào hệ thống quản lý học tập để kiểm tra chép đồ án sinh viên Hướng phát triển Bên cạnh kết đạt được, luận văn số hạn chế: Dữ liệu thu thập cịn Đồng thời liệu tải từ trang web nên tính nguyên chưa xác thực Do đó, hướng phát triển đề tài cần thu thập nhiều liệu đồ án, luận văn Song song đó, việc kiểm tra tính nguyên tập liệu đầu vào cần trọng Luận văn tập trung xử lý dựa nguyên tắc việc xử lý ngôn ngữ tự nhiên Do đó, phù hợp với đồ án, luận văn chuyên ngành kinh tế Việc xử lý chép hình ảnh, code, biểu đồ, … chuyên ngành kỹ thuật cần nghiên cứu tiếp để phát triển đề tài ứng dụng vào thực tiễn Số lượng luận án, luận văn sinh viên tăng lên cách nhanh chóng theo thời gian Vì vậy, cách lưu trữ liệu cần tìm hiểu thêm cập nhật liên tục công nghệ để ngày cải thiện tốc độ tìm kiếm nhanh 68 TÀI LIỆU THAM KHẢO [1] R.Vidhya1 and G.Vadivu2 “Research Document Search using Elastic Search,” Indian Journal of Science and Technology Vol 9, September 2016 [2] Manda Sai Divya and Shiv Kumar Goyal “ElasticSearch An advanced and quick search technique to handle voluminous data,” An International Journal of Advanced Computer Technology Vol 2, no 6, pp.171-175, June 2013 [3] Trần Cao Đệ cộng “Phát triển hệ thống phát đạo văn cho trường Đại học Việt Nam,” Tạp chí khoa học trường Đại học Cần Thơ Số 34, trang 31-39, tháng 12/ 2014 [4] Nguyễn Kim Anh Trịnh Thị Ngọc Hương “Nghiên cứu kỹ thuật đánh giá độ tương đồng văn ứng dụng so sánh văn tiếng Việt,” Đề tài nghiên cứu khoa học cấp trường Đại học Hàn hải Việt Nam Tháng 5/ 2016 [5] Preeti Mulay and Karuna Puri “Hawk Eye: A Plagiarism Detection System,” Advances in Intelligent Systems and Computing Vol 96, no 23, pp.10-20, July 2015 [6] Vaughn M.Segers and JamesConnan “An Online System for Plagiarism Detection,” Department of Computer Science, University of the Western Cape, 2018, pp 2-5 [7] Arkady Borisov et al “Research into Plagiarism Cases and Plagiarism Detection Methods,” Scientific Journal of Riga Technical University Vol 44, pp.139-144, 2010 [8] Changlin He “Survey on NoSQL Database Technology,” Journal of Applied Science and Engineering Vol 2, no 2, pp 50-54, 2015 [9] Rujia Gao et al “Application of Full Text Search Engine Based on Lucene,” Advances in Internet of Things Pp 106-109, Oct 2012 [10] Sai Divya M and Goyal SK “ElasticSearch: An advanced and quick search technique to handle voluminous data COM-PUSOFT,” An International Journal of Advanced Computer Technology Vol 9, no 11, pp 171-175, Jun 2013 69 [11] Dougiamas et al Moodle: Using learing communities to create an open source course management system National Key Centre for Science and Mathematics Education, Australia: Lonely Planet, 2003, pp 171-178 [12] Kats and Yefim Learning Management System Technologies and Software Solutions for Online Teaching: Tools and Applications USA: Information Science Publishing IGI Global, 2010, pp 40 [13] Bộ Giáo dục Đào tạo “Quyết định ban hành Quy chế đào tạo đại học cao đẳng hệ quy theo hệ thống tín chỉ.” Số 43, 2007 [14] Trường Đại học Công nghiệp Tp Hồ Chí Minh “Quy chế học vụ.” Số 928, 2014 [15] Zhigang et al “Moodle plugins for highly efficient programming courses,” School of Computer Science and Technology, Harbin Institute of Technology, China, 2001 [16] Kautsar and Irwan Alnarus “Developing Moodle plugin for creating learning content with another REST function call,” Global Engineering Education Conference(EDUCON) Spain, 2014 [17] Hartmut Schlosser “Top databases in 2017: Trends for SQL, NoSQL, Big Data, Fast Data.” Internet: 132912.html, March 30, 2017 https://jaxenter.com/top-databases-2017- [18] Pragya Gupta and Sreeja Nair “Survey Paper on Elastic Search,” International Journal of Science and Research Vol 5, no 1, pp 333-336, Jan 2016 [19] Vatika Sharma1 and Meenu Dave “SQL and NoSQL Databases,” International Journal of Advanced Research in Computer Science and Software Engineering Vol 2, no.8, pp 20-27, Aug 2012 [20] PAN09 data “PAN.” Internet: http://pan.webis.de/data.html, tháng 06 ngày 01 năm 2016 [21] Clinton Gormley and Zachary Tong Elasticsearch The Defnitive Guide O'Reilly, 2015, pp 153-169 [22] Quách Chí Cường “Tìm hiểu Elasticsearch Cluster.” Internet: https://cuongquach.com/tim-hieu-elasticsearch-cluster.html, 05/10/2018 70 [23] Iti Mathur and Nisheeth Joshi “Plagiarism Detection: Keeping Check on Misuse of Intellectual Property,” National Conference on Recent Advances of Computer Engineering Jaipur, India, 2011 [24] Alshafie Gafaar Mhmoud Mohmmed and Saife Eldin Fatoh Osman “SQL vs NoSQL,” Journal of Multidisciplinary Engineering Science Studies (JMESS) Vol 3, no 5, pp 1790-1792, May, 2017 [25] Baeldung “Quick Intro to Full-Text Search with ElasticSearch.” Internet: https://www.baeldung.com/elasticsearch-full-text-search-rest-api, 05/02/2019 [26] Hang Hoang “Top 10 Phần Mềm Kiểm Tra Đạo Văn Chuyên Nghiệp Nhất.” Internet: https://delaydots.com/phan-mem-may-tinh/top-10-phan-mem-kiemtra-dao-van-chuyen-nghiep-nhat/, 25/07/2019 [27] Duy Khánh “NoSQL Overview.” Internet: https://viblo.asia/p/nosqloverview-bxjvZwEdGJZ, 27/09/2016 [28] Solid IT “DB-Engines engines.com/en/ranking, 25/08/2019 Ranking.” Internet: https://db- [29] Lê Văn Phú “Tìm hiểu Elasticsearch với laravel.” Internet: https://levanphu.info/tim-hieu-elastic-search-voi-laravel, 26/04/2019 [30] Phan Dang Hai Vu “Elasticsearch trình phân tích liệu.” Internet: https://viblo.asia/p/elasticsearch-va-qua-trinh-phan-tich-du-lieugDVK2zW0KLj, 19/10/2019 [31] Cuong Quach “Tìm hiểu Elasticsearch Cluster.” https://cuongquach.com/tim-hieu-elasticsearch-cluster.html Internet: [32] Nguyễn Chí Hiếu “Nghiên cứu xây dựng hệ thống quản lý học tập nhằm chống chép trường Đại học Cơng nghiệp TP.Hồ Chí Minh,” Đề tài nghiên cứu cấp Bộ Số 04416/ĐTKHCN/HĐ-KHCN, 15/01/2016 71 LÝ LỊCH TRÍCH NGANG CỦA HỌC VIÊN I LÝ LỊCH SƠ LƯỢC: Họ tên: Võ Thị Mỹ Phượng Giới tính: Nữ Ngày, tháng, năm sinh: 07/11/1987 Nơi sinh: Bến Tre Email: myphuongit7@gmail.com Điện thoại: 0909711874 II QUÁ TRÌNH ĐÀO TẠO: Từ 1994 đến 1999: học sinh trường Tiểu học Thạnh Phú Đông, huyện Giồng Trôm, tỉnh Bến Tre Từ 1999 đến 2003: học sinh trường Trung học sở Thạnh Phú Đông, huyện Giồng Trôm, tỉnh Bến Tre Từ 2003 đến 2005: học sinh trường Trung học Phổ thông Phan Văn Trị, huyện Giồng Trôm, tỉnh Bến Tre Từ 2005 đến 2008: sinh viên Cao đẳng trường Đại học Công nghiệp Thành Phố Hồ Chí Minh, quận Gị vấp, Tp Hồ Chí Minh Từ 2009 đến 2012: sinh viên Đại học trường Đại học Công nghiệp Thành Phố Hồ Chí Minh, quận Gị vấp, Tp Hồ Chí Minh Từ 2015 đến 2017: học viên Cao học trường Đại học Cơng Nghiệp, quận Gị Vấp, Tp Hồ Chí Minh III Q TRÌNH CƠNG TÁC CHUN MƠN: Thời gian 1/2009 9/2012 9/2012 Nơi công tác → Trường Công việc đảm nhiệm Đại học Công Nghiệp Giáo vụ khoa Quốc tế Đại học Cơng Nghiệp Chun viên phịng Đào TP.HCM → Trường 72 4/2013 TP.HCM 04/2013 → Trường đến tạo Đại học Công TP.HCM Nghiệp Giáo vụ khoa Công nghệ Điện Tp HCM, ngày tháng năm 2019 Người khai (Ký tên) Võ Thị Mỹ Phượng 73 ... sử dụng cho lần kiểm tra chép 3.3.3 Tìm kiếm lọc tài liệu Tài liệu tham khảo lưu trữ kho liệu (ở sử dụng sở liệu Elasticsearch) Từ đó, chế tìm kiếm Full text search giúp xác định tài liệu nghi... bước thực tài liệu nguồn (lưu kho tài liệu) tài liệu đích (cần kiểm tra tính nguyên bản) thời điểm tiếp nhận thu nạp văn Nhằm tối ưu thời gian thực thi, tài liệu nguồn phân tích lưu lại kết thực... dàng kiểm tra đạo văn assignment mà học viên nộp hệ thống 2.3 Các chức LMS đề xuất 2.3.1 Dành cho sinh viên Hình 2.3 Chức dành cho Học viên [32] Học viên đăng ký thành viên để tham gia vào hệ