Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 61 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
61
Dung lượng
2,04 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM NGUYỄN THỊ PHƯƠNG THY XÂY DỰNG BỘ KIỂM TRA CĂN CỨ PHÁP LÝ CỦA VĂN BẢN HÀNH CHÍNH LUẬN VĂN THẠC SĨ Chuyên ngành: Cơng Nghệ Thơng Tin Mã ngành: 60480201 TP HỒ CHÍ MINH, năm 2017 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM NGUYỄN THỊ PHƯƠNG THY XÂY DỰNG BỘ KIỂM TRA CĂN CỨ PHÁP LÝ CỦA VĂN BẢN HÀNH CHÍNH LUẬN VĂN THẠC SĨ Chuyên ngành: Công Nghệ Thông Tin Mã ngành: 60480201 CÁN BỘ HƯỚNG DẪN KHOA HỌC : TS ĐẶNG TRƯỜNG SƠN TP HỒ CHÍ MINH, năm 2017 CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI TRƯỜNG ĐẠI HỌC CƠNG NGHỆ TP HCM Cán hướng dẫn khoa học : TS Đặng Trường Sơn Luận văn Thạc sĩ bảo vệ Trường Đại học Công nghệ TP HCM ngày 19 tháng 11 năm 2017 Thành phần Hội đồng đánh giá Luận văn Thạc sĩ gồm: Họ Tên TT Chức danh Hội đồng PGS.TS Đỗ Phúc Chủ tịch TS Nguyễn Thị Thúy Loan Phản biện TS Lê Thị Ngọc Thơ Phản biện TS Nguyễn Hà Giang Ủy viên TS Trần Minh Thái Ủy viên, Thư ký Xác nhận Chủ tịch Hội đồng đánh giá Luận văn sau Luận văn sửa chữa (nếu có) Chủ tịch Hội đồng đánh giá LV Đỗ Phúc TRƯỜNG ĐH CƠNG NGHỆ TP HCM CỘNG HỊA Xà HỘI CHỦ NGHĨA VIỆT NAM PHÒNG QLKH – ĐTSĐH Độc lập – Tự – Hạnh phúc TP HCM, ngày 15 tháng 03 năm 2017 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: NGUYỄN THỊ PHƯƠNG THY Giới tính: NỮ Ngày, tháng, năm sinh: 28/11/1983 Nơi sinh: Kiên Giang Chuyên ngành: Công nghệ thông tin MSHV: 1541860049 I- Tên đề tài: XÂY DỰNG BỘ KIỂM TRA CĂN CỨ PHÁP LÝ CỦA VĂN BẢN HÀNH CHÍNH II- Nhiệm vụ nội dung: - Tìm hiểu văn hành đề dẫn văn hành - Tìm hiểu kỹ thuật tách từ văn tiếng Việt - Xây dựng kiểm tra hợp lệ hay không hợp lệ III- Ngày giao nhiệm vụ: 15/03/2017 IV- Ngày hoàn thành nhiệm vụ: 31/08/2017 V- Cán hướng dẫn: TS ĐẶNG TRƯỜNG SƠN CÁN BỘ HƯỚNG DẪN TS Đặng Trường Sơn KHOA QUẢN LÝ CHUYÊN NGÀNH i LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu riêng tơi Các số liệu, kết nêu Luận văn trung thực chưa công bố cơng trình khác Tơi xin cam đoan giúp đỡ cho việc thực Luận văn trích dẫn hay tài liệu học thuật tham khảo cảm ơn đến tác giả thơng tin trích dẫn Luận văn rõ nguồn gốc Học viên thực Luận văn Nguyễn Thị Phương Thy ii LỜI CÁM ƠN Trước hết, cho gửi lời cảm ơn đến hướng dẫn giúp đỡ tận tình TS Đặng Trường Sơn Xin cảm ơn Thầy/Cô, Khoa CNTT Đại Học Công Nghệ TP HCM giúp đỡ cung cấp cho kiến thức quý giá suốt thời gian học tập nghiên cứu thực luận văn Tơi xin gởi lời cảm ơn đến gia đình, bạn bè đồng nghiệp quan tâm giúp đỡ suốt thời gian học tập nghiên cứu hoàn thành luận văn Luận văn khơng thể tránh khỏi sai sót, mong nhận ý kiến đóng góp người cho luận văn hồn thiện Tơi xin chân thành cảm ơn Nguyễn Thị Phương Thy iii TÓM TẮT Văn quản lý hành nhà nước (QLHCNN) quan quản lý nhà nước soạn thảo ban hành theo trình tự, thủ tục, hình thức định; trình biên soạn văn quan nhà nước phải dựa vào pháp lý để làm sở ban hành sau cho văn hợp hiến, hợp pháp tăng giá trị văn biên soạn Việc đề dẫn pháp lý vào văn soạn thảo sau cho xác không sai lệch số ký hiệu, ngày ban hành, quan ban hành, nội dung trích yếu văn ban hành trước điều cần thiết giúp cho văn nâng cao tính logic giá trị pháp lý ban hành Luận văn tập trung vào nghiên cứu giải pháp kiểm tra đề dẫn vào văn soạn thảo phần mềm Microsoft Word có hợp lệ hay khơng Sử dụng giải pháp tách từ văn soạn thảo để đề dẫn, tách thông tin gồm: số ký hiệu văn bản, ngày ban hành, quan ban hành, trích yếu văn bản, sau so sánh với liệu (các công văn đến ban hành) lưu trữ tập tin XML, thông tin đề dẫn trùng khớp với liệu hợp lệ, ngược lại khơng hợp lệ Hình thức sản phẩm phần mềm Kiểm tra văn hành Được viết ngôn ngữ C# NET Framework Microsoft Cơ sở liệu phần mềm văn ban hành lưu tập tin XML Bộ văn lấy từ nguồn: nguồn thứ tập hợp 59.156 văn pháp luật trung ương ngành ban hành lấy từ nguồn sở liệu quốc gia [15], nhóm liệu dùng để kiểm tra cho tất loại văn hành Nguồn liệu thứ 3100 văn hành trường Cao đẳng Kinh tế Kỹ thuật Kiên Giang ban hành, nhóm liệu dùng để kiểm tra văn trường Cao đẳng Kinh tế Kỹ thuật biên soạn Dữ liệu kiểm tra phần mềm văn trường KTKT Kiên Giang, UBND tỉnh Kiên Giang, Bộ Lao Động TBXH ban hành iv ABSTRACT State administrative management documents are drafted and issued by state agencies in a certain sequences, procedures and forms; during the process of compiling documents, state agencies must base on the legal basis to make the document promulgated so that these documents are constitutional, legal, and more valuable The insertion legal basis into the draft documents accurately the number of symbols, the date of issue, the promulgating agency, or the abstract of the previous promulgated documents is essential in order that the new texts improve logical and legal validity when they are issued This thesis focuses on researching solutions to check the insertion legal basis into the drafted documents on Microsoft Word software if they are valid or invalid Using the word separation solution in the document to identify the legal basis, on each base separating the information includes: the number of the document symbol, the date of issue, the promulgating agency, and the abstract of the document, then compared to the data set (the incoming and outgoing dispatches) are stored in the XML file, if the information of the legal basis matches the data, it is valid and vice versa The form of the product is the test administrative documents software It is written in C # on Microsoft's NET Framework The database of the software is the document set that have been issued and saved in the XML file This document set is from two sources: the first source is a collection of 59,156 legal documents issued by the central government and ministries issued from the national database [15] These are the main database used to check the basis for all types of administrative documents The second source of data is 3100 administrative documents issued by Kien Giang Technical and Economic College, which is a data group used to check the basis of Kien Giang Technical and Economic College issued Data for testing software are documents issued by Kien Giang Technical and Economic College and Ministry of Labor, Invalids and Social Affairs and General Department of Vocational Training v MỤC LỤC LỜI CAM ĐOAN i LỜI CÁM ƠN ii ABSTRACT iv MỤC LỤC v DANH MỤC CÁC TỪ VIẾT TẮT vii DANH MỤC CÁC BẢNG viii DANH MỤC CÁC HÌNH ix PHẦN MỞ ĐẦU 1 Lý chọn đề tài Mục tiêu đề tài: Nội dung nghiên cứu: Phương pháp nghiên cứu Chương 1: TỔNG QUAN VỀ CĂN CỨ TRONG VĂN BẢN HÀNH CHÍNH 1.1 Giới thiệu văn hành 1.2 Soạn thảo văn hành 1.3 Đề dẫn văn hành 1.4 Căn hợp lệ không hợp lệ 1.4.1 Căn hợp lệ: 1.4.2 Căn không hợp lệ 10 1.4.3 Các trường hợp ngoại lệ 11 Chương 2: PHƯƠNG PHÁP TÁCH TỪ TRONG VĂN BẢN TIẾNG VIỆT 13 2.1 Vấn đề tách từ văn tiếng Việt 13 2.2 Các hướng tiếp cận kỹ thuật tách từ tiếng Việt 14 2.2.1 Hướng tiếp cận dựa từ 14 2.2.2 Hướng tiếp cận dựa ký tự 15 2.3 Một số phương pháp tách từ tiếng Việt 16 2.3.1 So khớp từ dài (Longest Matching) 16 2.3.2 Học dựa cải biến 17 vi 2.3.3 Chuyển đổi trạng thái trọng số hữu hạn 18 Chương 3: XÂY DỰNG BỘ KIỂM TRA CĂN CỨ VĂN BẢN HÀNH CHÍNH 21 3.1 Lưu đồ kiểm tra văn hành 21 3.2 Đọc tập tin văn soạn thảo 22 3.3 Trích lọc 23 3.4 Tách câu, tách từ 24 3.5 Kiểm tra cứ: 26 3.6 Trình bày kết quả: 28 Chương 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 29 4.1 Thực nghiệm 29 4.1.1 Trích lọc từ hay nhiều văn 29 4.1.2 Hiệu chỉnh Tách từ với VnTokenizer 33 4.1.3 Kiểm tra hợp lệ hay không hợp lệ: 37 4.2 Đánh giá kết 43 CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 46 5.1 Kết luận 46 5.2 Hướng phát triển 46 TÀI LIỆU THAM KHẢO 47 34 Căn cứ tháng Nghị định 4 số năm 110/2004 2004 / của NĐ Chính phủ - về CP công tác ngày văn thư 08 ; Hình 4.5 Kết tách từ vnTokenizer Trong kết có nhiều từ tách nghĩa như: Căn cứ, Nghị định, ngày, tháng, năm, Chính phủ, về, cơng tác, văn thư Tuy nhiên có nhiều cụm từ đặt thù số văn chưa tách từ xác số ký hiệu 110/2004/NĐ-CP viết liền thành từ đơn khơng có nghĩa nên tách thành 111/2004, /, NĐ, -, CP Đê khắc phục hạn chế việc tách số ký hiệu văn vnTokenizer, chỉnh sửa tập tin models/tokenization/exers/lexers.xml gói cơng cụ vnTokenizer bổ sung thêm biểu thức quy để lọc số ký hiệu Xét số ký hiệu 110/2004/NĐ-CP, có định dạng Số hiệu/Năm ban hành/Loại-Cơ quan ban hành, để lọc chuỗi ký tự viết biểu thức sau: ([0-9])*/([0-9])*/([a-zA-Z\\])+[AZầảãáạăằẳẵắặâầẩẫấậbcd[đĐ]ẻẽéẹêềểễếệfghiìỉĩíịjklmnỏõóọơồổỗốộơờởỡớợpqrst úủũúụưừửữứựvwxyỳỷỹýỵz\d]+([\.\-/][\dAZầảãáạăằẳẵắặâầẩẫấậbcdđẻẽéẹêềểễếệfghiìỉĩíịjklmnỏõóọơồổỗốộơờởỡớợpqrstú ủũúụưừửữứựvwxyỳỷỹýỵz]+)*[\dA- 35 Zầảãáạăằẳẵắặâầẩẫấậbcdđẻẽéẹêềểễếệfghiìỉĩíịjklmnỏõóọơồổỗốộơờởỡớợpqrstú ủũúụưừửữứựvwxyỳỷỹýỵz]+ Hình 4.6 Biểu thức nhận dạng tách từ số hiệu Theo quy định kỹ thuật trình bày số, ký hiệu văn hành sau: Từ “Số” trình bày chữ in thường, ký hiệu chữ in hoa, cỡ chữ 13, kiểu chữ đứng; sau từ “Số” có dấu hai chấm; với số nhỏ 10 phải ghi thêm số phía trước; số ký hiệu văn có dấu gạch chéo (/), nhóm chữ viết tắt ký hiệu văn có dấu gạch nối (-) khơng cách chữ [5] Có dạng văn số, ký hiệu khơng có năm ban hành 42-NQ/TW7 có định dạng là: Số-Loại/Tên quan ban hành, để lọc chuỗi ký tự sử dụng biểu thức: ([0-9]+){1,4}([-/])([A-ZAZầảãáạăằẳẵắặâầẩẫấậbcd[đĐ]ẻẽéẹêềểễếệfghiìỉĩíịjklmnỏõóọơồổỗốộơờởỡớợpqrst úủũúụưừửữứựvwxyỳỷỹýỵz[-]A-Z]+)+ Hình 4.7 Biểu thức nhận dạng tách từ số hiệu Và có số hiệu văn định dạng như: Số/Loại-Tên quan ban hành, biểu thức lọc chuỗi sau: ([0-9]+){1,4}([-/])([A-ZAZầảãáạăằẳẵắặâầẩẫấậbcd[đĐ]ẻẽéẹêềểễếệfghiìỉĩíịjklmnỏõóọơồổỗốộơờởỡớợpqrst úủũúụưừửữứựvwxyỳỷỹýỵz[-]A-Z]+)+ Hình 4.8 Biểu thức nhận dạng tách từ số hiệu Nghị số 42-NQ/TW ngày 30/11/2004 Bộ trị 36 Căn cứ 4 Nghị định năm số 2004 110/2004/NĐ-CP của Chính phủ ngày về 08 công tác tháng văn thư Hình 4.9 Kết tách từ sau hiệu chỉnh biểu thức laxers Từ kết thấy số hiệu văn tách thành chuỗi lưu trữ dòng xác định thuộc tính có tên “sohieu” tập tin kết phân tích xml Ngày ban hành văn xác định dạng phổ biến sau: dd/mm/yyyy, dd-mm-yyyy, ngày dd tháng mm năm yyyy Trong định dạng sữ dụng biểu thức vntokenizer kết trả lưu trữ dòng có tên thuộc tính “date_dd/mm/yyyy” tập tin kết Nhưng định dạng thứ ngày tháng năm kết ngày, tháng, năm tách lưu dòng có thuộc tính tên là number Ví dụ: Hình 4.10 Kết tách từ định dạng ngày tháng năm Đây cấu trúc có tính thống thể ngày tháng năm ban hành văn bản, với cấu trúc định nghĩa thêm biểu thức để tách khỏi câu lưu dòng tập tin kết 37 ([n|N]gày\s)([0-9]*)?[0-9]+(\s)([t|T]háng\s)([0-9]*)?[0-9]+(\s) ([n|N]ăm\s)(19|20)\d\d Hình 4.11 Biểu thức tách ngày tháng năm ban hành văn Từ biểu thức trên, chạy lại chương trình phân tích cho kết sau: Hình 4.12 Kết tách từ ngày tháng năm sau định nghĩa biểu thức Với kết sử dụng phương thức thay chuỗi để chuyển đổi ngày 05 tháng 01 năm 2016 thành 05/01/2016 4.1.3 Kiểm tra hợp lệ hay không hợp lệ: Từ kết tách thành phần như: loại văn bản, số hiệu, ngày ban hành, quan ban hành trích yếu Từ thành phần đem so sánh với số liệu văn quan có thẩm quyền ban hành để tìm hợp lệ không hơp lệ Bộ liệu văn kiểm tra Bộ liệu văn dùng để kiểm tra tập hợp văn pháp luật văn hành phủ, ngành, trung ương, UBND tỉnh, trường Cao đẳng KTKT Kiên Giang ban hành Gồm có 62256 văn bản, có 59156 văn pháp luật, 3100 văn hành công văn đến trường Cao đẳng KTKT Kiên Giang Được xây dựng lưu trữ tập tin cấu trúc XML, với dung lượng 36.6 MB liệu hiệu chỉnh khó khăn, tập tin việc truy xuất liệu đơn giản, nhanh gọn, dễ dàng so sánh kết văn soạn thảo với văn liệu 38 Bảng 4.1 Danh sách số lượng văn ban hành làm sở liệu STT Tên quan, ban ngành Số lượng văn Trung Ương 33,066 Bộ Tài 7,544 Bộ Nơng nghiệp phát triển nông thôn 2,641 Bộ Công Thương 2,052 Bộ Nội vụ 1,427 Ngân hàng nhà nước Việt Nam 1,425 Bộ LĐTBXH 1,237 Bộ giao thông 1,216 Bộ Y tế 1,183 10 Bộ Khoa học công nghệ 958 11 Bộ GDĐT 884 12 Bộ Tư pháp 766 13 Bộ Thông tin truyền thông 684 14 Bộ Văn hóa thể thao 649 15 Bộ Xây dựng 623 16 Bộ Công An 569 17 UBND tỉnh Kiên Giang 556 18 Bộ Kế hoạch Đầu tư 552 19 Bộ Tài Nguyên Và Môi Trường 527 39 STT Tên quan, ban ngành Số lượng văn 20 Bộ Quốc phòng 381 21 Thanh tra phủ 166 22 Viện kiểm soát nhân dân tối cao 150 23 Bộ Ngoại giao 105 24 Ủy ban dân tộc 100 25 Kiểm tốn nhà nước 61 26 Tòa án nhân dân tối cao 48 27 Văn phòng Chính phủ 34 TỔNG 59604 Tổng số lượng văn lưu trữ tập tin XML có dung lượng 37MB Mỗi dòng tập tin văn bản, thuộc tính dòng thuộc tính văn ban hành Hình 4.13 Cấu trúc tập tin liệu văn ban hành XML 40 Kiểm tra hợp lệ không hợp lệ Đọc văn văn ban hành so sánh với Nếu trùng khớp số hiệu, loại văn bản, ngày ban hành quan ban hành tồn liệu trạng thái văn ban hành phải hiệu lực hiệu lực phần hợp lệ Ngược lại chưa hợp lệ khơng tìm thấy, trường hợp đưa thích Giả sử văn cần kiểm tra soạn thảo thời điểm tại, có lưu đồ kiểm tra thực sau: Nếu Loại “Luật” khơng có số hiệu Đ Loại, Ngày ban hành, Trích yếu tồn tại? S S Số hiệu, Loại, Ngày ban hành, Cơ quan ban hành, Trích yếu tồn tại? S Đ Khơng hợp lệ Hợp lệ Hình 4.14 Lưu đồ thuật toán kiểm tra Trong lưu đồ Đ đúng, S sai Đ 41 Algorithm KiemTraCanCu input: - Danh sách cần kiểm tra - Tập tin CSDL XML chứa danh sách văn ban hành: output: true: hợp lệ, false khơng hợp lệ, thêm thích cho “tìm thấy” hay “khơng tìm thấy” Method foreach CanCu c1 N = V.nodes[c1.loai] foreach XmlNode n N c2 = new CanCu from n SoSanh(c1,c2) end foreach if c1.ghiChu == then c.ghichu = “khơng tìm thấy” end end for each end KiemTraCanCu Algorithm SoSanh(c1, c2) Begin if c1.loaivanban == “Luật” and c1.sohieu = then c1.tinhTrangHieuLuc = c2 tinhTrangHieuLuc if \ sohieu then if c1.tinhTrangHieuLuc "Hết hiệu lực hoàn toàn" then c1.ghiChu = "hợp lệ" c1.hopLe = true else c1.ghiChu = “không hợp lệ” c1.hopLe = false end if 42 end if else if c1.sohieu == c2.sohieu then if then if c1.tinhTrangHieuLuc "Hết hiệu lực hoàn toàn" then c1.ghiChu = "hợp lệ" c1.hopLe = true else c1.ghiChu = “không hợp lệ” c1.hopLe = false end if end if end if end if end SoSanh Hình 4.15 Thuật toán kiểm tra 43 4.2 Đánh giá kết Kiểm tra văn Thực nghiệm chức kiểm tra văn bản, đầu vào văn bản, đầu kết luận văn hợp lệ, không hợp lệ không tìm thấy Trong trường hợp thực nghiệm 10 văn pháp luật UBND tỉnh Kiên Giang ban hành năm 2017 Cơng thức tính Precision = số hợp lệ / số kiểm tra Cơng thức tính Recall = số hợp lệ / số lượng có Tính F1 = 2/((1/ Precision) + (1/ Recall)) Và kết thực nghiệm thu sau: 10 01.2017.QĐUBND.doc 02.2017.QĐUBND.doc 03.2017.QĐUBND.doc 04.2017.QĐUBND.doc 05.2017.QĐUBND.doc 06.2017.QĐUBND.doc 07.2017.QĐUBND.doc 08.2017.QĐUBND.doc 09.2017.QĐUBND.doc 10.2017.QĐUBND.doc 7.36 1.00 0.63 0.77 5 6.15 1.00 0.83 0.91 5 6.52 1.00 0.83 0.91 5 6.33 1.00 0.71 0.83 5 6.9 1.00 0.83 0.91 3 6.37 1.00 0.75 0.86 3 6.72 1.00 0.75 0.86 4 6.51 1.00 0.80 0.89 3 6.14 1.00 0.75 0.86 4 6.58 1.00 0.67 0.80 1.00 0.76 0.86 Trung bình F1 Recall Precision Không hợp lệ Không tìm thấy CSDL Thời gian thực Hợp lệ Căn kiểm tra ST Tên Văn Bản T Lượng Bảng 4.2 Kết thực nghiệm chi tiết 10 văn UBND tỉnh Kiên Giang 44 Từ kết thực nghiệm 10 văn UBND Tỉnh Kiên Giang tìm thấy 56 cứ, 42 hợp lệ, khơng hợp lệ, 14 khơng tìm thấy thời gian tìm kiếm trung bình 6.59 giây Giá trị trung bình Precision 1.00, Recall 0.67 F1 = 0.80 Kiểm tra nhiều văn Thực nghiệm chức kiểm tra nhiều văn thực nghiệm 100 văn Bộ LĐTB&XH, cho chương trình chạy liên tục kết thúc, kết thực nghiệm là: Số Văn Bản Tổng Căn kiểm tra Hợp lệ Khơng hợp lệ Khơng tìm thấy CSDL Thời gian thực Precision Recall F1 Bảng 4.3 Kết thực nghiệm đồng loạt 100 văn Bộ LĐTBXH 100 272 189 85 104 83 4:12.84 0.45 0.31 0.37 Hình 4.16 Giao diện chương trình thực nhiều văn 45 Từ kết thực nghiệm 100 văn Bộ LĐTBXH tìm thấy 272 cứ, 109 hợp lệ, 100 không hợp lệ (do văn hết hiệu lực), 62 khơng tìm thấy, tổng thời gian thực phút 12.84 giây, thời gian xử lý trung bình văn 2.44 giây Qua thấy thực nhiều văn lúc thời gian kiểm tra văn nhanh Giá trị trung bình Precision 0.45, Recall 0.31 F1 = 0.37 Những văn Bộ ngành ban hành tìm nhiều hơn, việc khơng tìm thấy sở liệu có hai lý chính: CSDL thiếu, hai số hiệu viết sai dẫn đến khơng tìm thấy 46 CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 5.1 Kết luận Luận văn tập trung tìm hiểu kỹ thuật tách đoạn văn để tìm văn hành chính, ứng dụng kỹ thuật tách từ vnTokenizer để tìm thuộc tính cứ, có hiệu chỉnh regular expressions cho phù hợp với thuật ngữ chuyên ngành văn hành chính, cho tách cụm từ số hiệu, ngày ban hành xác Qua đó, luận văn đưa chuẩn regular cho tách từ văn hành Chương trình thực nghiệm CSDL với 59156 văn qui phạm pháp luật văn hành phủ, ngành ban hành Đây sở liệu rộng lớn đủ để xác minh ban hành hay chưa ban hành cách hiệu Bộ kiểm tra văn hành sản phẩm tiện dụng cho người soạn thảo văn công tác kiểm tra pháp lý hợp lệ hay không hợp lệ giúp tăng giá trị pháp lý văn ban hành Chương trình giúp cho người làm công tác tra, kiểm tra tính pháp lý văn 5.2 Hướng phát triển Các hướng nghiên cứu tương lai tập trung xây dựng liệu văn đầy đủ, đặc biệt cần bổ sung thêm sở liệu văn đơn vị soạn thảo ban hành thời gian trước đó, để làm sở kiểm tra pháp lý cho trích dẫn từ nguồn văn này, qua góp phần nâng cao tính đóng góp đề tài vào thực tiễn Mặc dù thân cố gắng tập trung nghiên cứu tham khảo tài liệu, báo, tạp chí khoa học ngồi nước, trình độ nhiều hạn chế nên khơng thể tránh khỏi thiếu sót Rất mong nhận đóng góp q thầy nhà khoa học để luận văn hoàn thiện 47 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Bộ Tư pháp (2010), Thông tư Bộ Tư pháp quy định chi tiết thi hành số điều Nghị định số 40/2010/NĐ-CP ngày 12/04/2010 Chính phủ kiểm tra xử lý văn quy phạm pháp luật, 20/2010/TT-BTP Tồn quốc [2] Chính phủ (2010), Nghị định phủ việc kiểm tra xử lý văn quy phạm pháp luật, 40/2010/NĐ-CP Toàn quốc [3] Đỗ Phúc (2006), ‘Nghiên cứu ứng dụng tập phổ biến luật kết hợp vào toán phân loại văn tiếng Việt có xem xét ngữ nghĩa’, Tạp chí phát triển KH&CN, tập 9, số 2, pp.23-32 [4] Nguyễn Việt Cường (2006), “Sử dụng khái niệm mờ biểu diễn văn áp dụng vào toán phân lớp văn bản”, luận văn tốt nghiệp đại học, trường Đại học Công nghệ, Đại học Quốc gia Hà Nội [5] Chính phủ (2011), Thơng tư Bộ Nội vụ hướng dẫn thể thức kỹ thuật trình bày văn hành chính, 01/2011/TT-BNV Tồn quốc [6] Nguyễn Việt Bình (2004), “Dùng lý thuyết tập thơ kỹ thuật khác để phân loại, phân cụm văn tiếng Việt”, Kỷ yếu hội thảo ICT.rda’04 Hà Nội [7] Nguyễn Minh Thuyết, Nguyễn Văn Hiệp (2004), Thành phần câu tiếng Việt, Nhà xuất Giáo dục, Việt Nam [8] Lưu Tuấn Anh (2012) Ứng dụng phương pháp Pointwise vào toán tách từ cho tiếng Việt Tiếng Anh [9] Foo S., Li H, Chinese Word Segmentation and Its Effect on Information Retrieval, Information Processing & Management: An International Journal, 40(1), 2004, pp161-190 Tài liệu Internet [10] GS Hồ Tú Bảo (2014) Xử lí văn tiếng Việt thuộc đề tài KC01.01/06-10 "Nghiên cứu phát triển số sản phẩm thiết yếu xử lí tiếng nói văn tiếng 48 Việt" [online], truy cập ngày 14/4/2017, từ https://vlsp.hpda.vn/demo/?page=resources [11] Nguyễn Thị Vân Anh (2016) Căn pháp lý - Cơ sở để kiểm tra văn quy phạm pháp luật [online], truy cập ngày 01/04/2017, từ http://sotuphap.namdinh.gov.vn/so-tu phap/1222/28300/39090/68786/xay-dung kiem-tra-van-ban-quy-pham-phap-luat/can-cu-phap-ly -co-so-de-kiem-tra-vanban-quy-pham-phap-luat.aspx [12] Bộ tư pháp (2015) Căn pháp lý - Cơ sở để kiểm tra văn quy phạm pháp luật [online], truy cập ngày 16/4/2017, từ http://ktvb.moj.gov.vn/qt/tintuc/Pages/nghien-cuu-trao-doi.aspx?ItemID=10 [13] Nguyen Van Hai (2015), Vietnamese Natural Language Processing [online], truy cập 14/4/2017, từ http://viet.jnlp.org/ [14] Lưu Tuấn Anh, Yamamoto Kazuhide (2012) [online], truy cập ngày 14/5/2017, từ http://viet.jnlp.org/dongdu [15] Cục Công nghệ thông tin - Bộ Tư pháp (2013) Cơ sở liệu quốc gia văn pháp luật [online], truy cập ngày 15/3/2017, từ http://vbpl.vn/pages/portal.aspx [16] Ths NCS Nguyễn Mạnh Cường (2013), Trao đổi cách viện dẫn ban hành số định (cá biệt) [online], truy cập ngày 15/6/2017, từ http://www.netcvca.edu.vn/index.php?option=com_content&view=article& id=211:trao-d-i-v-cachvi-n-d-n-cac-can-c-ban-hanh-trong-m-t-s-quy-t-d-nh-ca-bi-t-hi-nnay&catid=167&Itemid=578 ... tài: XÂY DỰNG BỘ KIỂM TRA CĂN CỨ PHÁP LÝ CỦA VĂN BẢN HÀNH CHÍNH II- Nhiệm vụ nội dung: - Tìm hiểu văn hành đề dẫn văn hành - Tìm hiểu kỹ thuật tách từ văn tiếng Việt - Xây dựng kiểm tra hợp lệ hay... nghiên cứu giải pháp kiểm tra pháp lý văn hành việc cần thiết bối cảnh Mục tiêu đề tài: - Mục tiêu tổng quát: Xây dựng kiểm tra pháp lý văn hành - Mục tiêu/cơng việc cụ thể: + Xây dựng liệu văn. .. hành khó khăn 1.3 Đề dẫn văn hành Căn pháp lý xem sở để kiểm tra tính hợp hiến, hợp pháp, tính thống văn Khi tiến hành kiểm tra văn hành chính, người có thẩm quyền kiểm tra xem xét nội dung văn