1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Khoa học máy tính: Nghiên cứu một giải pháp biểu diễn tri thức về luật đất đai và ứng dụng xây dựng hệ thống tra cứu kiến thức dựa trên cơ sở tri thức

48 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu một giải pháp biểu diễn tri thức về luật đất đai và ứng dụng xây dựng hệ thống tra cứu kiến thức dựa trên cơ sở tri thức
Tác giả Nguyễn Hoàng Thịnh
Người hướng dẫn Ts. Nguyễn Đình Hiền
Trường học Đại học Quốc gia Thành phố Hồ Chí Minh
Chuyên ngành Khoa học máy tính
Thể loại Luận văn thạc sĩ
Năm xuất bản 2022
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 48
Dung lượng 21,02 MB

Cấu trúc

  • Chương 2: Thu Thập Kiến Thức Về Luật Đắt Đai (6)
    • 2.1 Giới thiệu về văn bản Luật Dat đai 2013 (0)
    • 2.2 Thu thập kiến thức trong văn bản Luật Dat đai 2013._ (0)
  • Chương 3: Mô Hình Biểu Diễn Tri Thức Luật Đất Dai (12)
    • 3.1 Ontology biểu diễn tri thức trong văn bản luật............................::-¿-©22v22cccesvccvvsveccee 27 (28)
    • 3.2 Cấu trúc các thành phan của ontology Legal Rela-model (30)

Nội dung

GIỚI THIỆU ĐÈ TÀI Luật dat đai là tng hợp các quy phạm pháp luật nhà nước ban hành nhằm thiết lập quan hệ đất đai trên cơ sở chế độ sở hữu toàn dân về đất đai và sự bảo hộ đầy đủ của nhà

Thu Thập Kiến Thức Về Luật Đắt Đai

Thu thập kiến thức trong văn bản Luật Dat đai 2013._

Thu thập kiến thức về Luật đất đai

2.1 GIỚI THIỆU VE VAN BẢN LUAT DAT DAI 2013

Trong lịch sử xây dựng hệ thống pháp luật về đất đai ở nước ta, Nhà nước đã ban hành Luật đất đai vào năm 1988 Luật đất đai ban hành năm 1993 Luật sửa đồi, bổ sung một số điều của Luật dat đai ban hành năm 1998 Luật sửa đổi, b6 sung một số điều của Luật đất đai ban hành năm 2001 và Luật đất đai ban hành năm 2003 Vào kỳ họp thứ 6 ngày 29 tháng 11 năm 2013 Quốc hội đã thông qua Bộ Luật Dat Dai 2013.

Luật này quy định về chế độ sở hữu đất đai, quyền hạn và trách nhiệm của Nhà nước đại diện chủ sở hữu toàn dân về đất đai và thống nhất quản lý về đất đai, chế độ quản lý và sử dụng đất đai, quyền và nghĩa vụ của người sử dụng đất đối với đất đai thuộc lãnh thổ của nước Cộng hòa xã hội chủ nghĩa Việt Nam.

Bộ Luật Đất Đai 2013 bao gồm 14 chương và 212 Điều và đã được Quốc hội nước

Cộng hòa xã hội chủ nghĩa Việt Nam khóa XIII, kỳ họp thứ 6 thông qua ngày 29 tháng

Mô Hình Biểu Diễn Tri Thức Luật Đất Dai

Ontology biểu diễn tri thức trong văn bản luật ::-¿-©22v22cccesvccvvsveccee 27

Hệ thống văn bản quy phạm pháp luật Việt Nam bao gồm:

> Hién pháp: văn bản có giá trị pháp lý cao nhất dé xây dựng các văn bản khác.

> Bộ luật / Luật và Nghị quyết của Quốc hội: Trong một lĩnh vực xác định, văn bản này là quy tắc xử sự chung, có tính ràng buộc và áp dụng nhiều lần đối với các cơ quan, tổ chức, cá nhân trên phạm vi cả nước hoặc trong một đơn vị hành chính nhất định thuộc lĩnh vực này.

> Văn bản dưới luật: Là văn bản hướng dẫn chỉ tiết luật do Quốc hội ban hành Một số văn bản dưới luật là: Nghị định của Chính phủ, Quyết định của Thủ tướng Chính phủ, Thông tư hoặc Thông tư liên tịch của các Bộ trưởng có liên quan đến phạm vi điều chỉnh của Luật, Quyết định của Ủy ban nhân dân cấp tỉnh, v.v.

Phan này trình bày mô hình thé hiện một văn bản luật theo nội dung và ý nghĩa của nó Mô hình này được cải tiến dựa trên Rela-model, được gọi là Legal Rela-model. Ontology này là sự tích hợp giữa Ontology Rela-model biểu thị kiến thức về luật và một biểu dé khái niệm biéu thị mối quan hệ giữa các key phrases Hơn nữa, mô hình ontology Legal Rela-model này được kết nối với cấu trúc của văn bản quy phạm pháp luật Việt

Tại Điều 11 Thông tư của Bộ Tư pháp Việt Nam (2011), cấu trúc của một văn bản luật là một trong những loại sau: a) Phần, Chương, Mục, Điều, Khoản, Điểm; hoặc b) Chương, Mục, Điều, Khoản, Điểm; hoặc c) Mục, Điều, Khoản, Điểm; hoặc d) Khoản, Điểm.

Dựa trên những cấu trúc đó, cơ sở dữ liệu cho nội dung của một văn bản luật có thể được tổ chức Thông qua cơ sở dữ liệu đó, kiến thức của văn bản luật có thé thé hiện bằng mô hình ontology Legal Rela-model. Định nghĩa 3.1: Ontology để biểu diễn cho một văn bản Luật, được gọi là Legal Rela- model, bao gồm các thành phần như sau:

(C, R, Rules) là một cấu trúc của Rela-model (Do et al., 2018, Nguyen et al., 2020b), trong đó C là một tập hợp các khái niệm, nhưng mỗi khái niệm trong C đã được cải thiện cầu trúc bên trong của nó tổ chức thông tin luật của mình; R là tập hợp các quan hệ, các quan hệ đó là giữa các khái niệm, cụm từ khóa và cơ sở dit liệu lưu trữ nội dung của văn bản luật; và Rules là tập hợp các quy tắc suy luận của miền tri thức.

(Key, Rel, weight) là biểu đồ khái niệm thể hiện mối quan hệ giữa các cụm từ chính của văn bản quy phạm pháp luật Trong đó, Key là tập hợp các key phrases của văn bản luật, Rel là tập các cung và trọng số là ánh xạ từ Key sang vector tương tự nhị phân

+ Relations between keyphrases + Relations between keyphraer anda concept

Hình 1 Cấu trúc của mô hình ontology Legal Rela-model.

Trong cấu trúc này, Rela-model được kết hợp với biểu đồ của các keyphrases thông qua các key phrases và mối quan hệ của chúng Khi các key phrases là đối tượng củaLuật đất đai thì các quan hệ giữa chúng là hành vi của chúng đã được xác định trong luật.Cấu trúc các thành phần của mô hình Legal Rela-model sẽ được trình bày trong mục 3.2

Cấu trúc các thành phan của ontology Legal Rela-model

3.2.1 C- Tập hợp các khái niệm

Luật đất đai bao gồm các quy tắc chung được xây dựng dựa trên các khái niệm được coi là đương nhiên Trong thế giới thực, một khái niệm trong văn bản pháp luật được xác định dựa trên cấu trúc và quan hệ của nó trong các điều khoản của văn bản luật. Định nghĩa sau đây là về cấu trúc của một khái niệm trong mỗi văn bản luật d. Định Nghĩa 3.2: Cầu trúc của một khái niệm

Mỗi khái niệm trong C có cấu trúc gồm năm thành phần:

(Name, Content, InerRel, Phrase, Attributes) trong do:

Name: Tên của Concept trong luật.

Content: Nội dung hoặc ý nghĩa của các Concept.

Vv VY InnerRel: Danh sách các Điều luật trong văn bản luật d liên quan đến concept tương ứng.

> Phrases: Danh sách các cụm từ chính liên quan đến các khái niệm trong mỗi bai viết của tài liệu d.

> Attributes: Danh sách các thành phần (hoặc các khái niệm khác) là nền tảng dé xây dựng khái niệm tương ứng (nếu cần) trong tài liệu d.

Ví dụ 1: Với Luật Đất đai Việt Nam 2013 tại (Quốc hội Việt Nam, 2013), các thành phần của khái niệm “Giấy chứng nhận quyền sử dụng dat” là:

Thành Phân Nội dung Name Giây chứng nhận quyên sử dụng đât

Giây chứng nhận quyên sử dụng đât là chứng thư pháp lý

Content trong đó Nhà nước xác nhận quyền sử dụng dat, quyền sở hữu nhà ở và tài sản gắn liền với đất hợp pháp của người có quyên sử dụng đât, quyên sở hữu nhà ở và tài sản găn liên với đất. Điêu 3, Diém 16. Điều 11, Điểm 1.

InnerRel Điều 75, Điểm I. Điều 97, Điểm 1,2. Điều 100, Điểm 1,2,3,4,5. quyên sử dụng dat, quyên sở hữu nhà ở, tài sản gan liên Phrases : —m : với đât, nhà ở gắn liên với đât

Thừa kế tài sản gắn liền với đất, Tặng cho tài sản gắn liền với đất, Attributes Ban giao nhà tình nghĩa gắn liền với dat,

Chuyén nhượng quyền sử dụng đất,

Mua nhà ở gắn liền với đất, Thanh lý nhà gắn dat thô cư.

3.2.2 R- Tập hợp các quan hệ

Tập R được phân loại thành ba loại quan hệ:

+ Reoncept là một tập hợp các quan hệ giữa các khái niệm trong C Các quan hệ đó là

"là một", "có một", "một phần của" và các quan hệ khác giữa các khái niệm.

Một số tinh chat của mỗi quan hệ r € Reoncept được coi là: đối xứng, bắc cầu.

+ Rkeyphrases là tập hợp các quan hệ giữa các cụm từ khóa trong văn bản luật Nó cũng bao gồm một số mối quan hệ giữa các cụm từ khóa và một khái niệm là đặc điểm để xác định ý nghĩa của khái niệm.

+ Raatabase là tập hợp các quan hệ giữa các khái niệm, từ khóa được kết nối với cơ sở di liệu của văn bản luật.

3.2.3 RULES - Tập hợp các luật của tri thức

Các rules trong bộ Rules đại diện cho mối quan hệ ràng buộc và suy luận giữa keyphrases, và các concepts Sử dụng các quy tắc suy diễn giúp giảm bớt khối lượng công việc của việc truy xuất tri thức khi xây dựng dữ liệu Bộ Rules suy ra mối quan hệ trực tiếp hoặc gián tiếp giữa các key phrases hoặc concepts chính được sử dụng dé xác định sự giống nhau về ngữ nghĩa giữa các key phrases và concepts.

Một rule r € Rules là một quy tắc suy diễn dựa trên các dữ kiện liên quan đến các key phrases và khái niệm Nó có thé được mô tả như sau:

Pf fa Ins {81 83c, Bn} với ffi, fy ƒ„} là các sự kiện giả thuyết va {21, 82.) Zm} là các sự kiện mục tiêu của luật Các sự kiện thuộc một trong ba loại sau:

Bảng 1 Các loại sự kiện

1 Hiên thị thuộc tính của quan hệ rel € R là một quan hệ. ke Pe cent []

2 Môi quan hệ giữa các khái niệm cị, c;€C Â iên nd ht []

3 Quan hệ giữa các cụm từ chính ki, ky € Key

4 Môi quan hệ giữa các cum từ chính và một khái | [] niệm ke Key,c EC

Vi dụ 2: Một số quy định trong miền: ry: nếu [© là đối xứng] va [ky © k;] thì [k; © ky] rạ: nếu [9 là Bắc Cầu] va [ky 9 k;] va [kz 9 kạ] thì[k; 9 ks]

3.2.4 (Key, Rel, weight) - Đồ thị khái niệm

Cấu trúc của mô hình Rela-model (C, R, Rules) tổ chức kiến thức trong văn bản luật Tuy nhiên, trong thực tế, khi truy xuất một nội dung luật, có một số key phrases chính trong câu truy van đã được kết nối với kiến thức thông qua ngữ nghĩa của chúng. Trong nghiên cứu này, ngữ nghĩa của các cụm từ khóa được tổ chức bằng một biểu đồ khái niệm. Định nghĩa 3.3: Cho một văn bản luật ở Cấu trúc của biéu đồ biểu diễn mối quan hệ giữa các key phrases trong tài liệu d có dạng:

(Key, Rel, weight) Trong đó: ® Key = {k | k là một key phrase của văn bản pháp luật }. © Rel = {e = (ky, ky) € Key x Key | ky va ky là key phrases xuất hiện trong cùng 1 Điều của văn bản luật} weight: Key — R x R là một bản mapping để tính toán vector nhị phân cho mỗi key phrase trong Key (R là tập hợp các số thực).

Số đo cho các cụm từ khóa tương tự được tinh theo ống (tf(v, d), idf(v, d)), trong đó tf(v, d) là tần số thuật ngữ biểu thị tần suất của cum từ khóa v trong tài liệu d, và idf(v, đ) là tần số mạo từ nghịch đảo thé hiện tính cụ thể của cụm từ khóa v trong tài liệu d Công thức của (tf(v, d), idf(v, đ)) được thiết lập như sau [26]:

Trong đó, n,,, là số lần xuất hiện của cụm từ khóa v trong tài liệu, c € [0, 1] là tham số là giá trị nhỏ nhất cho mọi cụm từ khóa. card| ff Lephses(a) arcAniek(4) idf(v,d) = log (2)

1+card({ar € Article(d)| v € keyphrase(ar)})

Trong đó, Article(d) là tập hợp các điều của văn ban luật d. keyphrase(ar) là tập hợp các cụm từ khóa của Điều ar trong tài liệu d.

Các vấn đề truy vấn kiến thức trên văn bản luật và các thuật giải truy vấn

4.1 Các vấn đề truy vấn kiến thức luật

Gọi 9 là miền tri thức của văn bản luật d là ontology Legal Rela-model và cơ sở dữ liệu của văn bản d Khi một truy vấn được nhập dé truy xuất kiến thức từ K, hệ thống tìm kiếm sẽ xử lý để trích xuất một số cụm từ khóa chính và so sánh với cấu trúc của các thành phần của mô hình kiến thức thông qua quan hệ giữa các cụm từ khóa dẫn đến các khái niệm tương ứng Trong quá trình đối sánh, các quy tắc suy luận của cơ sở tri thức giúp suy ra nhiều quan hệ hơn liên quan đến nội dung của truy van và truy xuất kết quả cho truy vấn đã nhập Một sé vấn đề chính như sau:

Vấn đề 4.1: Phân loại truy vấn đã nhập Từ truy vấn được nhập dưới dạng văn bản tiếng Việt, bài toán này trích xuất các cụm từ khóa chính của truy vấn đề xác định ý nghĩa của truy van và phân loại nó.

Vấn đề 4.2: Lay các Điều, Khoản phù hợp trong văn bản pháp luật và tìm kiếm nội dung của các khái niệm dựa trên việc kết hợp các key phrases Dựa trên các key phrases được trích xuất, một phương pháp dé so sánh sự giống nhau giữa nghĩa của các key phrases và nội dung trong cơ sở kiến thức được đề xuất.

4.2 Thuật giải truy vấn kiến thức luật Để giải quyết vấn dé 1, truy vấn đã nhập cần được phân loại Đầu vào có thé được phân loại thành hai loại: truy vấn về ý nghĩa của một khái niệm (“là gì?”, “như thế nào?”) Sau đó, từ loại truy van, các từ khóa chính của nó được trích xuất Ngoài ra, một số từ tương tự cho các từ khóa được trích xuất cũng đạt được Các từ khóa tương tự có thể được thu thập từ các nguồn tài liệu pháp lý, các chuyên gia (như luật sư hoặc giảng viên pháp lý), hoặc từ các từ điển Với các từ khóa được trích xuất và các từ tương tự được xác định, các khái niệm liên quan đến các từ khóa đó được xác định bằng cách sử dụng các quy tắc trong Ruleinfer Quá trình này cũng tìm ra các quy tắc suy luận được sử dung dé suy ra các khái niệm và các quan hệ của chúng

Thuật toán 4.1: Cho một văn bản luật d đã được biéu diễn bằng ontology dựa trên mô hình Legal Rela-model.

> Input: Cơ sở tri thức % = (C, R, Rules) dưới dang ontology Legal Rela-model

> Output: Một tập các từ khóa, quan hệ và quy tắc được truy xuất từ truy vấn g và kiến thức 9C

Bước 1: Phân loại truy van bằng bộ công cụ NLP tiếng Việt Bước 2: Trích xuất từ khóa từ truy vấn q và tìm các từ tương tự dựa trên cơ sở tri thức K.

Bước 3: Phân loại loại từ khóa dựa trên truy vấn trong W.

Bước 4: Mở rộng W với các từ khóa tương tự được thu thập từ các nguồn hợp pháp.

G: = {} // Tập hợp các khái niệm

P: = () / Tap hợp các quy tắc Đối với mỗi từ khóa w € W do

Sử dụng Ruleinfer dé tìm kiếm các khái niệm và quy tắc liên quan đến w.

Từ các khái niệm đã tìm được, hãy xác định các từ khóa bắt buộc và thêm chúng vào G.

Thêm quy tắc vào P nếu không ton tại

Ngày đăng: 08/11/2024, 17:34

HÌNH ẢNH LIÊN QUAN

Hình 1 Cấu trúc của mô hình ontology Legal Rela-model. - Luận văn thạc sĩ Khoa học máy tính: Nghiên cứu một giải pháp biểu diễn tri thức về luật đất đai và ứng dụng xây dựng hệ thống tra cứu kiến thức dựa trên cơ sở tri thức
Hình 1 Cấu trúc của mô hình ontology Legal Rela-model (Trang 29)
Bảng 1. Các loại sự kiện - Luận văn thạc sĩ Khoa học máy tính: Nghiên cứu một giải pháp biểu diễn tri thức về luật đất đai và ứng dụng xây dựng hệ thống tra cứu kiến thức dựa trên cơ sở tri thức
Bảng 1. Các loại sự kiện (Trang 32)
Hình 2. Kiến trúc của hệ thống truy van luật đất đai. - Luận văn thạc sĩ Khoa học máy tính: Nghiên cứu một giải pháp biểu diễn tri thức về luật đất đai và ứng dụng xây dựng hệ thống tra cứu kiến thức dựa trên cơ sở tri thức
Hình 2. Kiến trúc của hệ thống truy van luật đất đai (Trang 39)
Bảng 2. Phân loại các câu truy vấn Loại Y nghia Training | Tested Khái niệm Yéu câu Xác định định nghĩa hoặc các thuộc 21 54 - Luận văn thạc sĩ Khoa học máy tính: Nghiên cứu một giải pháp biểu diễn tri thức về luật đất đai và ứng dụng xây dựng hệ thống tra cứu kiến thức dựa trên cơ sở tri thức
Bảng 2. Phân loại các câu truy vấn Loại Y nghia Training | Tested Khái niệm Yéu câu Xác định định nghĩa hoặc các thuộc 21 54 (Trang 40)
Hình 5. Độ chính xác của hệ thống truy vấn từng nội dung của Luật Đất đai Việt Nam. - Luận văn thạc sĩ Khoa học máy tính: Nghiên cứu một giải pháp biểu diễn tri thức về luật đất đai và ứng dụng xây dựng hệ thống tra cứu kiến thức dựa trên cơ sở tri thức
Hình 5. Độ chính xác của hệ thống truy vấn từng nội dung của Luật Đất đai Việt Nam (Trang 42)
Bảng 4. Compare systems in tasks. - Luận văn thạc sĩ Khoa học máy tính: Nghiên cứu một giải pháp biểu diễn tri thức về luật đất đai và ứng dụng xây dựng hệ thống tra cứu kiến thức dựa trên cơ sở tri thức
Bảng 4. Compare systems in tasks (Trang 42)
Bảng 4 so sánh hệ thống của chúng tôi với một số hệ thống tốt, Aleph và AimeLaw, trong ALQAC-2021 tại Hội nghị KSE 2021 ở tak 1 - Truy xuất văn bản pháp lý và task 2 - Luận văn thạc sĩ Khoa học máy tính: Nghiên cứu một giải pháp biểu diễn tri thức về luật đất đai và ứng dụng xây dựng hệ thống tra cứu kiến thức dựa trên cơ sở tri thức
Bảng 4 so sánh hệ thống của chúng tôi với một số hệ thống tốt, Aleph và AimeLaw, trong ALQAC-2021 tại Hội nghị KSE 2021 ở tak 1 - Truy xuất văn bản pháp lý và task 2 (Trang 42)

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

w