CHƯƠNG 3 MƠ HÌNH HĨA TRI THỨC CHO VĂN BẢN LUẬT
3.3. Mô tả phương pháp
3.3.1. Phân tích và lựa chọn kỹ thuật biểu diễn
Với 6 tính chất được phân tích ở mục trước, các văn bản pháp luật chứa cả những thuộc tính tĩnh và những thuộc tính động. Ví dụ số hiệu của một văn bản là thuộc tính tĩnh, tính có hiệu lực của nó là thuộc tính động phụ thuộc vào thời gian. Bên cạnh đó, giữa các VBPL tồn tại cả những quan hệ mang tính chất bất biến và những quan hệ có thể thay đổi theo thời gian. Ví dụ bộ luật lao động quy định khung pháp lý về mức lương tối thiểu và quy định chi tiết thi hành do chính phủ ban hành thay đổi theo từng năm nên quan hệ giữa chúng luôn thay đổi (Bảng 3.1).
Bảng 3.1. Mức lương tối thiểu vùng thay đổi qua từng năm
Vùng Năm 2014 Năm 2015 Năm 2016 Năm 2017
1 2.700.000 3.100.000 3.500.000 3.750.000
2 2.400.000 2.750.000 3.100.000 3.320.000
3 2.100.000 2.400.000 2.700.000 2.900.000
4 1.900.000 2.150.000 2.400.000 2.580.000
NĐ 182/2013/NĐ-CP 103/2014/NĐ-CP 122/2015/NĐ-CP 153/2016/NĐ-CP
Với những phân tích như trên, mạng ngữ nghĩa chứa các đồ thị mô tả các khái niệm và quan hệ giữa chúng không phải là kỹ thuật phù hợp với hệ thống văn bản luật. Tại hai thời điểm khác nhau, phần tử trên mạng và quan hệ giữa chúng cũng khác nhau. Nếu sử dụng mạng ngữ nghĩa để biểu diễn dữ liệu kết hợp với các kỹ thuật rời rạc hóa thời gian thì số lượng đồ thị phải lưu trữ vẫn là rất lớn.
Bên cạnh đó, sử dụng riêng lẻ luật sinh hoặc ngơn ngữ khung đều không đủ hiệu quả trong biểu diễn tri thức cho văn bản luật. Luật sinh có nhược điểm trong hoạt động định nghĩa, mô tả các đối tượng hoặc những mối liên kết tĩnh giữa các đối tượng. Ngược lại, ngôn ngữ khung không cung cấp cơ chế suy diễn nên khơng thích ứng được với tính chất ln vận động thay đổi của hệ thống VBPL.
Vì những lý do trên, luận văn đề xuất sử dụng kết hợp hai phương pháp là ngôn ngữ khung và luật sinh đề mơ hình hóa tri thức cho hệ thống văn bản luật. Ngôn ngữ khung hiệu quả trong đặc tả những đối tượng xuất hiện trong luật, tạo chỉ mục và phân loại, luật sinh cung cấp cơ chế suy diễn hiệu quả, giúp cơ sở tri thức có thể trả lời truy vấn một cách linh hoạt và chủ động cập nhật khi có thơng tin mới.
3.3.2. Cấu trúc khung
Hệ thống văn bản luật là hệ thống có cấu trúc, đây là tính chất thuận tiện cho việc phân loại chúng. Phân loại VBPL giúp cho việc tổ chức thông tin được hiệu quả. Các văn bản pháp luật cùng một loại thường có những tính chất chung. Bên cạnh đó, phân loại văn bản pháp luật là cơ sở để phát hiện quan hệ giữa chúng. Bảng 3.2 thể hiện danh sách các loại văn bản pháp luật của Việt Nam.
Bảng 3.2. Các loại văn bản pháp luật
Cơ quan ban hành Loại văn bản
Quốc hội
- Hiến pháp. - Bộ Luật. - Luật.
- Nghị quyết
Ủy ban Thường vụ Quốc hội - Pháp lệnh
Ủy ban thường vụ Quốc hội với Đoàn Chủ tịch Ủy ban
trung ương Mặt trận Tổ quốc Việt Nam. - Nghị quyết liên tịch.
Chủ tịch nước - Lệnh.
- Quyết định.
Chính phủ - Nghị định.
Chính phủ với Đồn Chủ tịch Ủy ban trung ương Mặt
trận Tổ quốc Việt Nam - Nghị quyết liên tịch.
Thủ tướng Chính phủ - Quyết định
Chánh án Tịa án nhân dân tối cao
Thơng tư Viện trưởng Viện kiểm sát nhân dân tối cao
Bộ trưởng, Thủ trưởng cơ quan ngang Bộ
Chánh án Tòa án nhân dân tối cao với Viện trưởng Viện kiểm sát nhân dân tối cao.
Thông tư liên tịch Bộ trưởng, Thủ trưởng cơ quan ngang Bộ với Chánh án
Tòa án nhân dân tối cao, Viện trưởng Viện kiểm sát nhân dân tối cao
Tổng Kiểm toán Nhà nước Quyết định
Hội đồng nhân dân cấp tỉnh, cấp huyện, cấp xã Nghị quyết. Ủy ban nhân dân cấp tỉnh, cấp huyện và cấp xã Quyết định
Bảng 3.3 là Khung chứa thông tin của loại văn bản. Theo đó, Khung sẽ lưu các thơng tin như Tên loại văn bản, Cơ quan ban hành và Loại văn bản tổng quát của nó. Tên loại văn bản có thể là: Hiến pháp, Bộ Luật, Luật, Nghị quyết, Pháp lệnh, Nghị quyết liên tịch, Lệnh, Quyết định, Nghị định, Nghị quyết liên tịch, Thông tư, Thông tư liên tịch. Cơ quan ban hành là thông tin quan trọng trong việc xác định chính xác loại văn bản, trong tập hợp các văn bản tồn tại các loại văn bản có cùng tên nhưng do các cơ quan khác nhau ban hành, có nội dung và tính chất khơng đồng nhất. Loại văn bản tổng quát bao gồm: Văn bản quy phạm pháp luật, văn bản hành chính và văn bản áp dụng pháp luật.
Bảng 3.3. Khung về loại văn bản
Slot Type Giải thích
title Prop Tên loại văn bản
institution Prop Cơ quan ban hành
isA IS-A Loại văn bản (kế thừa)
Như đã phân tích ở các phần trước, hệ thống pháp luật là một hệ thống luôn vận động. Tại hai thời điểm khác nhau, nếu biểu diễn tri thức bằng mạng ngữ nghĩa thì sẽ tồn tại hai mạng ngữ nghĩa khác nhau. Để giải quyết vấn đề này, chúng tôi đưa vào một cơ chế giúp vơ hiệu hóa các nút và các cạnh trong đồ thị tại một thời
điểm nhất định. Cơ sở để thực hiện phương pháp này là tính có hiệu lực của văn bản luật và tính có hiệu lực của một quan hệ tại một thời điểm nhất định. Dưới đây là Khung đơn (individual frame) mô tả thực thể văn bản luật:
Bảng 3.4. Khung về văn bản pháp luật
Slot Type Giải thích
number Prop Số hiệu văn bản
standing Prop Hiệu lực không gian
title Prop Tên văn bản
content Prop Nội dung văn bản
dateCreated Prop Ngày ban hành
dateExecute Prop IF-ADDED [updateRelation] Ngày có hiệu lực
dateApprove Prop Ngày thông qua
confirmation Prop Người ký
institution Prop Cơ quan ban hành
isValid IF-NEEDED [checkDocValidity] Giá trị hiệu lực
category INSTANCE-OF Loại văn bản
Trong hệ thống văn bản luật, các thực thể văn bản luật có mối liên hệ chặt chẽ về mặt ý nghĩa cũng như hiệu lực. Căn cứ vào sáu tính chất của văn bản pháp luật được phân tích tại Mục 3.2, có thể thấy giữa các văn bản pháp luật tồn tại ba quan hệ chính là quan hệ trích dẫn (citation relationship), quan hệ hướng dẫn (clarify relationship) và quan hệ thay thế (replacement relationship).
Quan hệ trích dẫn xuất hiện giữa hai văn bản khi có một văn bản dẫn chiếu đến một phần hoặc toàn bộ văn bản khác trong nội dung của nó. Quan hệ này tồn
tại phổ biến trong các văn bản quy phạm pháp luật và tồn tại mặc định trong các văn bản áp dụng pháp luật.
Ví dụ Nghị định 102/2009/NĐ-CP của chính phủ quy định về quản lý đầu tư ứng dụng công nghệ thông tin sử dụng nguồn vốn ngân sách nhà nước có trích dẫn đến ba văn bản khác là Luật Tổ chức Chính phủ 2001, Luật Ngân sách nhà nước 2002 và Luật công nghệ thông tin 2006 ngay tại phần đầu của nội dung luật. Hình 3.1 minh họa quan hệ trích dẫn giữa các văn bản pháp luật. Các văn bản thường xun có những trích dẫn tới các văn bản khác loại hoặc cùng loại với nó.
Hình 3.1. Minh họa quan hệ trích dẫn giữa các VBPL
Giữa hai văn bản tồn tại quan hệ hướng dẫn khi một văn bản có ý nghĩa hướng dẫn hoặc quy định chi tiết thi hành. Ví dụ Điều 25 Hiến pháp 2013 quy định “Cơng dân có quyền tự do ngơn luận, tự do báo chí, tiếp cận thơng tin, hội họp, lập hội, biểu tình. Việc thực hiện các quyền này do pháp luật quy định.”. Luật Bầu cử đại biểu Quốc hội và đại biểu Hội đồng nhân dân 2015 quy định chi tiết cụ thể các vấn đề của điều 25 Hiến pháp 2013, do đó giữa hai văn bản này có quan hệ hướng dẫn.
Minh họa về quan hệ hướng dẫn giữa các loại văn bản pháp luật được thể hiện trong Hình 3.2. Hiến pháp được hướng dẫn chi tiết bằng các luật do Quốc hội ban hành và các nghị định của Chính phủ, luật được hướng dẫn chi tiết bởi các nghị định, nghị định được hướng dẫn bởi thông tư của các bộ hoặc các quyết định có liên quan. Giữa hai văn bản có quan hệ hướng dẫn có thể tồn tại quan hệ trích dẫn,
mặc dù vậy chúng khơng đồng nhất và có ý nghĩa khác nhau, vì vậy cần được mơ tả đầy đủ trong cơ sở tri thức.
Hình 3.2. Minh họa quan hệ hướng dẫn giữa các VBPL
Quan hệ thay thế giữa hai văn bản xuất hiện khi một văn bản hết hiệu lực và bị thay thế bởi một văn bản khác. Thời điểm thay thế này được quy định rõ trong luật, thường trùng với thời điểm văn bản mới có hiệu lực hoặc được quy định trong một văn bản khác. Ví dụ vào thời điểm Bộ luật dân sự 2015 có hiệu lực thì cũng là lúc Bộ luật dân sự 2005 hết hiệu lực. Hình 3.3 dưới đây minh họa quan hệ thay thế giữa các văn bản pháp luật.
Hình 3.3. Minh họa quan hệ thay thế giữa các VBPL
Hiến pháp Luật Nghị định Nghị định Nghị định
Thông tư Quyết
Quan hệ giữa các văn bản luật thuộc các kiểu hướng dẫn, thay thế và trích dẫn được thể hiện bởi Khung được thể hiện trong bảng 3.5 dưới đây.
Bảng 3.5. Khung về quan hệ
Slot Type Ý nghĩa
fromDoc prop Số hiệu văn bản gốc
toDoc prop Số hiệu văn bản tới
type prop Loại quan hệ
clause prop Điều khoản phát sinh
isValid IF-NEEDED [checkRelaValidity] Tính hiệu lực
3.3.3. Các luật suy diễn
Như đã phân tích, hệ thống văn bản luật là hệ thống tri thức có sự cập nhật khơng ngừng, vì vậy cần có những cơ chế suy diễn để cập nhật cấu trúc của mơ hình tri thức tại một thời điểm cụ thể. Chúng tôi sử dụng các luật suy diễn để giải quyết yêu cầu này.
Do đặc trưng của hệ thống văn bản luật, việc xảy ra xung đột giữa các luật suy diễn là không thể tránh khỏi. Để giải quyết xung đột, các chiến lược áp dụng luật được sử dụng như sau:
- Luật suy diễn xuất hiện trước được áp dụng trước.
- Các kết quả đã có (đã được lưu trong các slot) sẽ khơng bị thay thế bởi luật - Luật có nhiều điều kiện nhất sẽ được áp dụng trước
- Áp dụng luật phù hợp với sự kiện được đưa vào gần nhất
Bảng 3.6 thể hiện các luật suy diễn trong mơ hình tri thức. Trong đó clarify, cite, replace thể hiện quan hệ hướng dẫn, trích dẫn và thay thế, isValid trả về giá trị đúng nếu văn bản có hiệu lực và trả về giá trị sai nếu văn bản khơng có hiệu lực. Tất cả các quan hệ này đều xét trong một mốc thời gian ấn định trước.
Bảng 3.6. Danh sách các luật suy diễn Tiền đề Kết luận Tiền đề Kết luận A.replace(B) !B.isValid() AND A.clarify(B) !B.isValid() !A.isValid() AND A.replace(B) !A.isValid() B.isValid() AND A.clarify(B) C.replace(A) C.clarify(B) AND B.replace(C) A.replace(B) A.replace(C) AND A.cite(B) C.replace(B) A.cite(C) 3.5. Đánh giá phương pháp
Sau khi nghiên cứu và đề xuất phương pháp mơ hình hóa tri thức cho văn bản luật, chúng tôi thấy rằng phương pháp này có một số điểm mạnh và hạn chế sau đây.
3.5.1. Điểm mạnh của phương pháp
- Mơ hình tri thức được đề xuất dựa trên những phân tích về tính chất của văn bản pháp luật, giải quyết được yêu cầu của bài toán nghiên cứu.
- Ưu và nhược của các phương pháp biểu diễn tri thức kinh điển như mạng ngữ nghĩa, ngôn ngữ khung và luật sinh được phân tích, kế thừa vào phương pháp một cách có chọn lọc.
- Cấu trúc của mơ hình thể hiện linh hoạt các đối tượng cũng như quan hệ giữa chúng tại các thời điểm khác nhau và có tính đến khả năng mở rộng trong tương lai. - Mơ hình tri thức có thể được xây dựng tự động bằng các giải thuật và phương pháp xử lý ngôn ngữ tự nhiên như nhận diện thực thể, trích chọn quan hệ, thuật toán so khớp chuỗi, các giải thuật Heuristic, các giải thuật học máy thống kê và các mơ hình xác suất.
3.5.2. Hạn chế của phương pháp
- Mơ hình tri thức chưa đủ linh hoạt để biểu diễn văn bản pháp luật cịn hiệu lực một phần. Ví dụ như trong trường hợp một văn bản bị sửa đổi bổ sung một số điều.
- Cơ chế giải quyết giữa các mâu thuẫn đối với các trường hợp văn bản trái luật, vi hiến, cơ chế này sẽ không hoạt động hiệu quả.
- Chưa đưa ra được phương pháp bảo tồn tính thống nhất trong mơ hình tri thức khi tồn tại văn bản tự mâu thuẫn, văn bản phủ định nhưng không thay thế văn bản khác hoặc trường hợp người ký khơng có thẩm quyền.
CHƯƠNG 4. THỰC NGHIỆM 4.1. Phương pháp và dữ liệu thực nghiệm 4.1. Phương pháp và dữ liệu thực nghiệm
Để xác thực tính đúng đắn của phương pháp được đề xuất, chúng tôi xây dựng thực nghiệm với đặc tả bài tốn đã nêu ở chương 3, sau đó thống kê kết quả và tính tốn các độ đo. Do số lượng các văn bản luật là rất lớn, để có thể kiểm chứng được tính đúng đắn của phương pháp, chúng tôi chỉ thu thập các văn bản được ban hành bởi các cơ quan cấp trung ương liên quan đến 4 văn bản luật: Bộ luật Dân sự, Bộ luật Tố tụng dân sự, Bộ luật Hình sự và Bộ luật Tố tụng hình sự từ năm 1981 đến nay .
Hình 4.1. Dữ liệu thu thập được
Tập dữ liệu chúng tơi sử dụng để xác thực tính đúng đắn của phương pháp gồm 383 văn bản và 766 quan hệ giữa chúng được biểu diễn như đã mơ tả. Sau q trình suy luận, hệ thống trả lại những văn bản có hiệu lực tại một mốc thời gian ấn định trước. Dựa trên kết quả trả về của hệ thống, các phép đo như độ chính xác, độ
hồi tưởng, độ đo F1 được tính để làm cơ sở phân tích và chứng minh tính đúng đắn của phương pháp.
Về nguồn dữ liệu, trong quá trình tiến hành thực nghiệm, chúng tơi nhận thấy có 3 trang web cung cấp dữ liệu về các văn bản luật có độ tin cậy cao:
- Cơ sở dữ liệu quốc gia về văn bản pháp luật (http://vbpl.vn/pages/portal.aspx): Cơ sở dữ liệu quốc gia về pháp luật được xây dựng thực hiện Nghị quyết 48-NQ/TW ngày 24/05/2005 của Bộ Chính trị về Chiến lược xây dựng và hoàn thiện hệ thống pháp luật Việt Nam đến năm 2010, định hướng đến năm 2020.
- Hệ thống văn bản pháp luật của Bộ Tư pháp (http://moj.gov.vn/vbpq): Trang web chính thống được xây dựng bởi Cục Công nghệ thông tin, Bộ Tư pháp cung cấp dữ liệu về các văn bản pháp luật.
- Trang thông tin Thư viện pháp luật (https://thuvienphapluat.vn/): Trang web cung cấp thông tin về các văn bản pháp luật của công ty cổ phần LawSoft với mục đích thương mại.
Đối với nội dung của các văn bản, cả 3 trang web đều cung cấp một cách chính xác, mặc dù vậy chúng có cách bố trí thơng tin khác nhau, phù hợp với từng nhu cầu trích xuất thơng tin cụ thể vì thế chúng tơi kết hợp sử dụng cả 3 trang web này. Trang thơng tin Thư viện pháp luật có tốc độ truy cập tốt, các văn bản đã được gõ lại theo định dạng text, điều này giúp chúng tôi dễ dàng lấy và lưu được nội dung đầy đủ của các văn bản. Hệ thống văn bản pháp luật của Bộ Tư pháp có thiết kế trực quan, dễ dàng bóc tách các quan hệ giữa các văn bản pháp luật. Cơ sở dữ liệu quốc gia về văn bản pháp luật chứa thơng tin về ngày có hiệu lực và hết hiệu lực, đây là những thông tin quan trọng sử dụng trong việc xác thực tính đúng đắn của phương pháp. Thống kê dữ liệu theo loại văn bản và năm ban hành được sử dụng để kiểm thử được thể hiện trong Bảng 4.1 và Bảng 4.2.