1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khóa luận tốt nghiệp Kỹ thuật phần mềm: Xây dựng ứng dụng tìm kiếm tài liệu pháp lý Việt Nam

87 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây dựng ứng dụng tìm kiếm tài liệu pháp lý Việt Nam
Tác giả Nguyen Ngoc Dung, Phan Minh Toan
Người hướng dẫn TS. Tran Son Hai, THS. Huynh Nguyen Khac Huy
Trường học Trường Đại học Công nghệ Thông tin - ĐHQG TP.HCM
Chuyên ngành Kỹ thuật phần mềm
Thể loại Khóa luận tốt nghiệp
Năm xuất bản 2021
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 87
Dung lượng 52,44 MB

Nội dung

Mục đích của dé tài là xây dựng một Website cung cấp các chức năng về tra cứu thông tin văn bản pháp luật trong hệ thống văn bản pháp lý Việt Nam, mang tính ứng dụng và thiết thực cao..

Trang 1

ĐẠI HỌC QUOC GIA TP HO CHÍ MINH

TRUONG DAI HOC CONG NGHE THONG TIN

KHOA CONG NGHE PHAN MEM

NGUYEN NGỌC DUNG PHAN MINH TOAN

KHOA LUAN TOT NGHIEP

XAY DUNG UNG DUNG TIM KIEM TAI LIEU PHAP LY

VIET NAM

Build an application for looking up information from the

Vietnamese legal document corpus

KY SU NGANH KY THUAT PHAN MEM

TP HO CHi MINH, 2021

Trang 2

ĐẠI HỌC QUOC GIA TP HO CHÍ MINH

TRUONG DAI HOC CONG NGHE THONG TIN

KHOA CONG NGHE PHAN MEM

NGUYEN NGOC DUNG PHAN MINH TOAN

XAY DUNG UNG DUNG TIM KIEM TAI LIEU PHAP LY

VIET NAM

Build an application for looking up information from the

Vietnamese legal document corpus

KY SU NGANH KY THUAT PHAN MEM

GIANG VIEN HUONG DAN

TS TRAN SON HAI THS HUYNH NGUYEN KHAC HUY

TP HO CHÍ MINH, 2021

Trang 3

DANH SÁCH HOI DONG BẢO VE KHÓA LUẬN

Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số

của Hiệu trưởng Trường Đại học Công nghệ Thông tin.

Trang 4

LOI CAM ON

Sau quá trình học tập và rèn luyện tại khoa Công nghệ phan mềm trường Đại học

Công nghệ Thông tin - ĐHQG TP.HCM chúng em đã được trang bị các kiến thức

cơ bản, các kỹ năng thực tế dé có thể hoàn thành Khóa luận tốt nghiệp của mình.

Để hoàn thành khóa luận này, chúng em xin gửi lời cảm ơn chân thành đến: Ban

Giám hiệu trường Dai học Công nghệ Thông tin - ĐHQG TP.HCM vi đã tạo điều

kiện về cơ sở vật chất với hệ thống thư viện hiện đại, đa dạng các loại sách, tài liệu thuận lợi cho việc tìm kiếm, nghiên cứu thông tin.

Chúng em xin gửi lời cảm ơn chân thành đến thầy THS Huỳnh Nguyễn Khắc Huy

và thầy TS Trần Sơn Hải đã tận tình giúp đỡ, định hướng cách tư duy và cách làm việc khoa học Đó là những góp ý hết sức quý báu không chi trong quá trình thực hiện luận văn này mà còn là hành trang tiếp bước cho chúng em trong quá trình học tập và lập nghiệp sau này.

Va cuối cùng, chúng em xin gửi lời cảm ơn đến gia đình, tất cả thầy cô trong khoa,

bạn bè, tập thể lớp PMCL2016 là những người luôn sẵn sàng sẻ chia và giúp đỡ trong học tập và cuộc sống Mong rằng, chúng ta sẽ mãi mãi gắn bó với nhau.

Trong quá trình làm khóa luận này chúng em không tránh khỏi được những sai sót,

chúng em kính mong nhận được sự chỉ dẫn và góp ý của quý thầy cô để khóa luận

được hoàn thiện hơn.

Chúng em xin chân thành cảm ơn Xin chúc những điều tốt đẹp nhất sẽ luôn đồng

Trang 5

Chương 2 TONG QUAN -2¿-222222222222+22221112222112222112 2221 6

2.1 Thư viện pháp luật https://thuvienphapluat.vn/

2.1.1 — Tìm hiểu Website 22222 ccccEEErrtrrrrrrrrrrrrrereerrrer 6

2.1.2 Ưu điểm nói lại trả về top cao hơn

2.1.3 Nhược điểm -c22222vccSEEvErrrtrrttrrrrrrtrrrrrrrrvee 9

2.2 Van bản pháp luật http://vbpl.vn/

2.2.1 Tìm hiểu Website Ăăcccccerrrririrrrrrrrirrrri 20

222 UufDÊm NA GV ae ee 23 2.2.3 Nhược điểm 2222cccECCEEEtEEEEErrrrrrrrrrrrve 23

2.3 Van bản pháp luật https://vanbanphapluat.CO/ -=+s=5s+=++ 24

2.3.1 Tìm hiểu Website vector 24 2.3.2 Ưuđiểm vvvnnhhnnhhnhhrriiiiiirreee 28

2.3.3 Nhược điểm -sccSrririrrrrrrirrirrrrrrrriirrrrri 28 2.4 Bảng tổng hợp so sánh các Website hỗ trợ tìm kiếm tài liệu pháp lý 29 Chương 3 TÌM HIEU CÔNG NGHỆ SỬ DỤNG -:cc5scc2 31 3.1 Tìm hiểu công cụ tìm kiếm tìm kiếm - : ¿522s+c++ccvszcesrx 31 3.1.1 KIA MGM ae ceccccccessssssscccccccecssssssssssunnununnsssesssececceeceecesssssnnssnunnente 31 3.1.2 Nguyên lý hoạt d6ng oo cseeeeeseseeeeneseseseeeenesesesesneeeseseseanes 31

Trang 6

3.1.2.1 Bộ thu thập thông tin — Web crawling ‹- - eee 32

3.2.4.3 ShaHHể c.y 2 NẾP vưưm , ⁄ ào 36

3.2.4.4 NOde HH Ho oD

3.2.4.5 CUSter Heo oD

3.2.5 Cài đặt ElastiCsearCh 5c cSc St St SESesrErerrsrrrerrrrerrsee 37

3.2.5.1 Yêu cầu cài đặt Hee 37

3.2.5.2 Cài đặt trên WindOwWs ngư 38

3.2.5.3 Cài đặt trên Linux «St 39

3.2.6 Sử dung API để thêm, xóa, sửa, tìm kiếm dữ liệu trong Elasticsearch

40 3.2.6.1 Index ch 41

3.2.6.2 DOCUMENL cccccccceseeeseeseseseeeeeesescseseeseesseseseeseseseseseeeeasseeeeeeneaeee 44

3.2.7 Bulk API che AT

Trang 7

3.3 Thu thập dữ liệu bằng crawler -.-. -:222v+++etEvvvrrerrrrvrrerrrrrrrrrg 49

3.3.1 Thư viện Axios và Cheerio

kh nG ` " 49 3.3.1.2 Cheerio.

3.3.2 Bóc tách dữ liệu trên trang vanbanphapluat.co -‹-«- 49

3.4.2 Phan trang HH HH HH HH trên 58

3.4.3 Hiền thị kết qua tìm Ki6M oes ceccesccsscssssessssssesesesseessssssecesssseessesseeeeeessees 59 3.5 Xử lý câu truy vấn -©2222222c+tEEEEEEEvrrrrrrttrrkkkrrrrrrrrrrrrrrrreerrro 60 3.5.1 Search — Tìm kiếm từ khóa -2 ¿22+z++2vzxvze+rvzsereerr 60

3.5.2 Suggestion — Gợi ý tìm kiếm - ¿¿222cc+cccvvrrerrrvrrrrrrrrree 60 3.5.3 Filter— Lọc kết quả tìm kiếm - -¿ 2c+++22vvc+vcvvvrrrrrsscee 61 3.5.4 Advanced Search — Tìm kiếm nâng Ca0 sssssssssscsssssseesssccesssneeeeeeee 61 Chuong4 TRÌNH BAY, DANH GIA BAN LUẬN VE CAC KET QUẢ 62

4.1 Giao diện WebSite occ ccececceseeseseeseseeseeseseeeeseeseseeseeecsessesecseeesseeseseeaeeeees! 62

4.2 Hiệu suất của việc thu thập dữ liệu bằng Crawler s2 65

4.3 Đánh giá kết quả của việc thu thập dữ liệu bằng Crawler 66 4.4 Đánh giá kết quả kết quả câu truy vấn - -cc22cvvceccvvrrrrrrrer 71 Chương 5 KÉT LUẬN, HƯỚNG PHAT TRIEN cccsssssssssssesssssssescsssseesssssees 83

Trang 8

lẽ ` 83

Trang 9

DANH MỤC HÌNH

Hình 1.1 Biểu đồ thể hiện tỷ lệ phạm tội theo độ tuổi ở Việt Nam 14

Hình 2.1 Giao diện Website thuvienphapluặVIn -¿-¿ 55c +5+scccsceceeeex 17 Hình 2.2 Website yêu cầu người dùng sử dụng tài khoản thành viên 17 Hình 2.3 Hướng dẫn tìm kiếm tài liệu văn bản pháp luật . : 18 Hình 2.4 Kết quả tìm kiếm trên thuvienphapluat.vn với từ khóa “uống rượu” 18 Hình 2.5 Hiển thị nội dung văn bản trên Websitẹ - - ¿5-5 +ccsccsrekecer 18

Hình 2.6 Website yêu cầu người dùng trả phí để sử dụng . -cc+ 19

Hình 2.7 Giao diện Website VDpÏ.VỊ th it 20 Hình 2.8 Kết quả tìm kiếm đơn giản trên vbpl.vn với từ khóa “uống rượu” 21 Hình 2.9 Kết quả tìm kiếm nâng cao trên vbpl.vn với từ khóa “uống rượu” 21 Hình 2.10 Nội dung văn bản hiền thị trên Websitẹ -7222cccccccccccrveee 22 Hình 2.11 Kết quả tìm kiếm trên vbpl.vn với từ khóa “đèn đỏ” - - 22

Hình 2.12 Giao diện Website vanbanphapluat.CỌ -.- - - 2 + +5++cc+secez+zxsxs> 24

Hình 2.13 Hướng dẫn tìm kiếm với “từ khóa” . -:-ccccvvvvvveererrrrrrrrrrrrree 25

Hình 2.14 Hướng dẫn lọc kết quả tìm kiếm -2+z222222vvvzzretrrrrrvree 25 Hình 2.15 Kết qua tìm kiếm trên vanbanphapluat.co với từ khóa “uống rượu” 26 Hình 2.16 Hiển thị nội dung van bản trên file PDẸ 5 +55+++c+<++<ccxe 26

Hình 2.17 Kết qua tìm kiếm trên vanbanphapluat.co với từ khóa “vượt đèn d6” 27

Hình 2.18 Hiển thị nội dung văn bản trên Websitẹ 222cccccccerrrrrrrree 27 Hình 2.19 Kết quả tìm kiếm chính xác trên vanbanphapluat.co với từ khóa “vượt

lo ốố ố ố ố ố 28 Hình 3.1 Nguyên lý hoạt động của Elasticsearch -+c cec. .- Í

Hình 3.2 Cách thức hoạt động của Elasticsearch - -¿- ¿+ + + s++x+x+*ccrexsee 34 Hình 3.3 Các thành phần trong Elasticsearch -: ¿©25cz+22szcezz 35

Hình 3.4 Hình anh mô tả Cluster, Node trong Elasticsearch -.- 37

Hình 3.5 File ding dé kích hoạt Elasticsearch Servicẹ - -c2ccccccc+2 38

Hình 3.6 Service của Elasticsearch với port mặc định 9200 . : 38 Hình 3.7 Sử dụng Ađon Chrome Elasticsearch Head 39

Trang 10

Hình 3.8 Demo Run Elasticsearch trên Linux OS .- - - - 2 5555++c+c+s<++ 40

Hình 3.9 Các mối quan hệ tương ứng trong Database và Elasticsearch 40

Hình 3.10 Index được tạo thành công Hình 3.11 Index tạo không thành công, Index đã tôn tại .-. -+-+-+ 4I Hình 3.12 Các thành phần bên trong Index -¿2+2z++22+zzz+zzxseez 42 Hình 3.13 Số Replica, Shard mặc định khi tạo Index -: ¿:+c5sc+2 43 Hình 3.14 Xóa Index không thành công, Index không tổn tại -. 44

Hình 3.15 Xóa Index thành công . ¿-¿- 5+5 S22E‡E‡E2EEkkEerrrrkrkerrree 44 Hình 3.16 Các hàm được sử dụng để thu thập dữ liệu -c-c-<++ 50 Hình 3.17 Element trên http://vanbanphapluat.CO -. ‹-‹-5 c555+5+5x+5< 51 Hình 3.18 Sử dụng Bulk Client Helper để đánh chỉ mục - 54

Hình 3.19 Các thuộc tinh input được sử dụng trên web -. - 5+5 - 55 Hình 3.20 Giao diện tìm kiếm nâng cao „56

Hình 3.21 Lọc kết quả tìm kiếm theo một số tiêu chí „61 Hình 4.1 Trang chủ của Website Legal Document Corpus 62

Hình 4.2 Suggestion khi tìm kiếm với từ khóa “quyết đỉnh 38/” Hình 4.3 Hiền thị phân trang trên Website 63

Hình 4.4 Kết quả tìm kiếm văn ban với từ khóa “quyết định” - 63

Hình 4.5 Nội dung chỉ tiết văn bản 22:2¿£22222S2c++etEEEEEEYvrrrerrrrrrrrrrrcee 64 Hình 4.6 Kết quả tìm kiếm với từ khóa “luật về ovid” - -: c-ccccccsscee 64 Hình 4.7 Biểu đồ hiển thị thời gian Crawl trung bình . - -ccccc-e 65 Hình 4.8 Kết quả File thứ nhất với một số trường cơ bản .-: -: 66

Hình 4.9 Nghị quyết 04/NQ-CP trên trang vanbanphapluat.co - 66

Hình 4.10 Kết quả File thứ hai với một số trường cơ bản . -¿ 67

Hình 4.11 Quyết định 1921/QD-TLD trên trang vanbanphapluat.co - 67

Hình 4.12 Kết qua File thứ ba với một số trường cơ bản - 68

Hình 4.13 Thông báo 06/TB-VPCP trên trang vanbanphapluat.co 68

Hình 4.14 Kết quả File thứ tư với một số trường cơ bản -cccc++ 69 Hình 4.15 Quyết định 141/QD-BYT trên trang vanbanphapluat.co - 69

Trang 11

Hình 4.16 Kết quả File thứ năm với một số trường cơ bản - 70

Hình 4.17 Quyết định 39/QĐ-TTg trên trang vanbanphapluat.co 70

Hình 4.18 Biểu đồ độ bao phủ tại top k điều luật trả về trên 100 câu hỏi 72 Hình 4.19 Kết quả câu hỏi đầu tiên -¿-©222+++2222+++ttEESvrretrrrvrrerrrrrrrrrr 73

Hình 4.20 Kết quả câu hỏi thứ hai -222-2222£222E22+2EEESEttEEEEEzrrtrrkerrrrrkrcee 74 Hình 4.21 Kết quả câu hỏi thứ ba .:c::¿cc+cc222EEEEEEEtkrttrttirrirrrrrrrrrrree 75

Hình 4.22 Kết quả câu hỏi thứ tư - -.2¿:¿-22222222v+22222221222.22222.111 rrrrrrree 76 Hình 4.23 Kết quả câu hỏi thứ năm -: 2+222+++t22vv+rettvrvrrerrrrrrrrrr 71

Hình 4.24 Kết quả câu hỏi thứ sáu 222222+2222222v2+rrrttrvvrvvvrrrrrrrrrrrree 78

Hình 4.25 Kết quả câu hỏi thứ bảy -2222222¿2222222vvvvrrtrtrrrkrrrrrrrrrrrrrree 79 Hình 4.26 Kết quả câu hỏi thứ tám ¿ +©22+++222S+++ttEvvvrrrrrrxrrrrrrrrree 80

Hình 4.27 Kết quả câu hỏi thứ chín . -2222+22222222S22++tEEE2SSvrrrrrrrrrrrser 81

Hình 4.28 Kết qua câu hoi thứ mười „82

DANH MỤC BÁNG

29

30

Bang 2.1 Bảng đánh giá Website.

Bảng 2.2 Bảng đánh giá chỉ tiết Website

Bang 4.1 Bảng kết quả thời gian Crawl đữ liệu trung bình từ vanbanphapluat.co 65

Bang 4.2 Bảng kết quả của việc đánh giá độ chính xác dựa trên 100 câu hỏi 71

Trang 12

DANH MỤC TU VIET TAT

Từ viết tat | Từ đầy đủ Giải thích

CSDL Cơ sở dữ liệu Cơ sở dữ liệu cho ứng dụng.

CSS Cascading Style Sheets Các tập định dạng theo tầng.

DOM Document Object Model Mô hình các đối tượng trong tài

liệu.

ELK Elasticsearch, LogStash, Kibana Tập hợp 3 phần mềm phục vụ

công việc logging.

HTTP HyperText Transfer Protocol Giao thức truyền siêu văn bản JSON JavaScript Object Noattion Định dạng trao đồi dữ liệu.

JS JavaScript Ngôn ngữ lập trình JavaScript.

Trang 13

TOM TAT KHÓA LUẬN Tom tắt nội dung khóa luận tốt nghiệp:

Luận văn tốt nghiệp đề tài “Xây dựng ứng dụng tìm kiếm tài liệu pháp lý Việt Nam

- Build a tool to look up information from the legal document corpus” được thực

hiện từ ngày 10/9/2020 đến ngày 31/1/2021 Mục đích của dé tài là xây dựng một Website cung cấp các chức năng về tra cứu thông tin văn bản pháp luật trong hệ

thống văn bản pháp lý Việt Nam, mang tính ứng dụng và thiết thực cao Thông qua

việc nghiên cứu và áp dụng các công nghệ liên quan cho việc thu thập, xử lý và tô chức lưu trữ dữ liệu, chúng em đã xây dựng một hệ thống đáp ứng những yêu cầu

dé ra Mặc đù kết quả còn một số thiếu sót nhưng đây là cơ sở quan trọng nhằm phát triển sau này.

Báo cáo luận văn tốt nghiệp gồm:

Chương 1: GIỚI THIỆU CHUNG: Trình bày lý do chọn dé tài, mục đích, đối tượng

nghiên cứu và sử dụng, phạn vi thực hiện.

Chương 2: TONG QUAN: Tìm hiểu và so sánh các Website hiện có hỗ trợ tìm kiếm

văn bản pháp lý Việt Nam.

Chương 3: TÌM HIỂU CÔNG NGHE SỬ DỤNG: Trình bày các công nghệ được sử

dụng trong quá trình xây dựng đề tài.

Chương 4: TRÌNH BAY, DANH GIA BAN LUẬN VE CÁC KET QUA: Trình bày đánh giá các kết quả sau khi đề tài kết thúc.

Chương 5: KÉT LUẬN: Trình bày ưu, nhược điểm của sản phẩm.

Chương 6: HƯỚNG PHÁT TRIEN: Trinh bày hướng phát triển sản phẩm.

Chương 7: TÀI LIỆU THAM KHẢO: Đường dẫn đến các tài liệu mà nhóm đã tìm hiểu, nghiên cứu.

Trang 14

Chương 1 GIỚI THIỆU CHUNG

1.1 Lý do chọn đề tài

Theo Tòa án nhân dân tối cao thì tình trạng phạm tội ở Việt Nam ngày càng tăng cao và đặc biệt hơn là độ tuổi phạm tội ngày càng trẻ hóa Trung bình mỗi năm có

10.000 vụ phạm pháp hình sự do người vị thành niên thực hiện Người phạm tội từ

18 — 30 tuổi chiếm khoảng 70%, dưới 18 tuổi chiếm 8%, tỷ lệ này cũng đang có

chiều hướng gia tăng.

m Dưới 18 tudi mTừ18-30tuổi = Trên 30 tuổi

Hình 1.1 Biểu đồ thể hiện tỷ lệ phạm tội theo độ tuổi ở Việt Nam.

Theo như sự tìm hiểu của nhóm, việc phạm tội ở độ tuổi vị thành niên là do nhiều nguyên do như thiếu sự quan tâm từ gia đình, có hoàn cảnh đặc biệt và đặc biệt hơn

là do thiếu hiểu biết về pháp luật Pháp luật chưa được giảng dạy thông qua các môn học dành cho các bạn học sinh vì một số lý do nào đó, nên dẫn tới việc các bạn học

sinh chưa hiểu rõ được mức độ nghiêm trọng cũng như tính cần thiết của pháp luật.

Trong đời sống xã hội ngày nay, pháp luật có vai trò đặc biết quan trọng Pháp luật

là phương tiện không thể thiếu, bảo đảm cho sự tồn tại, vận hành bình thường của

xã hội nói chung và của nền đạo đức nói riêng Pháp luật không chỉ là một công cụ quản lý nhà nước hữu hiệu, mà còn tạo môi trường thuận lợi cho sự phát triển của ý

14

Trang 15

thức đạo đức, làm lành mạnh hoá đời sống xã hội và góp phần bồi đắp nên những

1.2 Mục dich

Website tìm kiếm tài liệu pháp lý Việt Nam được xây dựng dựa trên ba mục đích

chính sau:

e Thứ nhất là rút trích, thu thập các tài liệu, các văn bản pháp luật trong hệ

thống văn bản pháp lý Việt Nam thuộc các lĩnh vực sau: Bộ máy hành chính, Tài Nguyên — Môi trường, Vi phạm hành chính, Quyền dân sự, Trách nhiệm

hình sự, Giáo dục, Giao thông vận tai, từ http://vanbanphapluat.co có van

bản pháp lý uy tín vào hệ cơ sở dữ liệu.

© Thứ hai là xây dựng Website hỗ trợ tìm kiếm văn ban bằng cách sử dụng

Elasticsearch engine Website xử lý tìm kiếm với tốc độ nhanh.

1.3 Đối tượng

¢ _ Ngôn ngữ lập trình JavaScript, nền tảng NodeJS.

© Tt cả “văn bản pháp luật” từ hệ thống văn bản pháp lý Việt Nam từ các

Website có sẵn (Crawler), chủ yêu từ Website http://vanbanphapluat.co.

© Tao chỉ mục văn bản pháp lý và tìm kiếm bằng Elasticsearch.

1.4 Phạm vi thực hiện

e Phạm vi nội dung: Lập trình Website (sử dụng ngôn ngữ lập trình JavaScript,

trên nền tảng NodeJS) Sử dụng Elasticsearch tạo nên một Server giúp lưu

trữ dữ liệu cũng như xử lý câu truy van.

¢ Phạm vi không gian: Các văn bản pháp luật trong hệ thống văn bản pháp lý

Việt Nam thuộc các lĩnh vực sau: Bộ máy hành chính , Tài Nguyên — Môi

trường, Vi phạm hành chính, Quyền dân sự, Trách nhiệm hình sự, Giáo dục,

Giao thông vận tải,

© Pham vi thời gian: Từ ngày 10/9/2020 đến ngày 31/1/2021.

15

Trang 16

Chuong 2 TONG QUAN

Phân tích một số Website hiện có hỗ trợ tim kiếm tài liệu pháp lý Việt Nam

2.1 Thư viện pháp luật https://thuvienphapluat.vn/

Website là sử dụng công nghệ cao để tô chức lại hệ thống văn bản pháp luật và kết

nối cộng đồng dân luật Việt Nam.

Với phiên bản đầu tiên từ 2005, đến nay là phiên bản thứ 5, đang được hơn 50.000

doanh nhân, viên chức, luật sư, chuyên viên pháp lý, sử dụng và cập nhật văn bản

luật Website hoạt động từ tháng 1/2008, hiện có hơn 2.000.000 thành viên đăng kí

sử dụng thường xuyên Mỗi ngày tiếp nhận hơn 600 lượt hỗ trợ, tư vấn sơ bộ vềpháp luật qua điện thoại, email, skype và các kênh hỗ trợ trực tiếp khác Việc hỗ trợ

này sẽ giúp cho công chúng và doanh nghiệp nhanh chóng có giải pháp xử lý cho

các van đề pháp lý đang gặp phải

16

Trang 17

ức Pháp Luật Cộng đồng DanLuat = Liên ne

0838 22 99 66 Quên mật khdu? Đăng ky mới

B® Thông Báo Van Ban Mới B® Thời Sự Pháp Luật EP Luật Sư Tư Vấn

‘Thanh viên cơ quan VN ở nước T1 Hướng dẫn quyết toàn khoản chỉ hỗ trợ đoàn Thủ tục xóa

ngoài được hỗ trợ phí khám Covid- viên, NLĐ bị ảnh án tích?

19 NLD có thé từ chối làm thêm giờ trong

Âqggg„„ Vua qua, Chính phủ a ban hành J teong hep ae Ora z

Nghị quyết 98/NQ.CP vẻ hỗ trợ kinh Hướng dẫn về chứng tir chứng nhận xuất xứ ð Diện ch xây dựng trái với quy

phí khám và điều trị COVID-19 đổi tăng hóa trong Higp hoạch cô được bồi thưởng khi + 32 nhỏm công việc cô yêu câu nghiêm ngạt về Tử thi tr hành vi quay rồi tinh dục tại thu hội đất?

Hình 2.1 Giao diện Website thuvienphapluat.vn

Ban thư ký luật có trách nhiệm kiểm tra nội dung các văn bản mới được ban hành,

nắm bắt ngay vấn đề pháp lý mới và tóm lược những thông tin này thành Thông báo

ngắn gọn, súc tích, theo từng lĩnh vực, ngành nghề dé gửi đến khách hàng, giúpkhách hàng biết được ngay những thay đổi của pháp luật phục vụ cho công việc.Hiện có hơn 1.500.000 khách hàng có nhu cầu này

Người dùng muốn tìm kiếm cần nhập thông tin vào ô Tìm Văn bản Pháp luật sau đóEnter hoặc chọn nút Tìm kiếm Các chức năng Tra cứu nhanh cần phải đăng kíthành viên mới được sử dụng Người dùng cũng có thể tìm kiếm theo tiêu đề hoặc

số hiệu văn bản, kết quả phải chính xác cụm từ trên Ngoài ra còn có thời gian ban

hành, loại văn bản, cơ quan ban hành, người ký, sắp xếp theo,

Văn bản Pháp Luật Tiêu Chuẩn Việt Nam _ Tra cứu bản án Dự thảo Công văn

Hình 2.2 Website yêu cầu người dùng sử dụng tài khoản thành viên

17

Trang 18

# Trang chủ

(> Tra cứu ¡ VĂN BẢN PHAP LUẬT

Tử kno’ $6 Hiệu, Tiêu đề hoặc Nội dung ngân gon của Văn Bản (Lưu kw tm kiếm)

Ÿ Các gói dịch vụ Ml Tin tức Pháp Luật @ Lien hệ 19 đồng DanLust

đà Sơ dd WebSite @Gicithieu #ÊHướngdấnsửdụng Rss WHomepage Widget

%

Ban đang tìm kiếm : VAN BAN PHÁP LUAT

uống rượu Tim kiém _ Hệ thống tìm kiếm được các Văn Bản liên quan sau :

Tim trong: ® Tát cả © Tiếu đẻ văn bản “` Số hiệu văn bản ~ 296 CÔNG VĂN (Xem & Tra cứu Công văn)

ng BiuMimD T5j én 20872020 H3 TT + 171 TEU CHUAN VIỆT NAM (Xem & Tra cứu)

Kết quả phải: '® Có tắt cả các từ trên Chinh xác cụm tử trên mm cản Văn bản hey TCVN nào, Bim

Ngôn ngữ (?): Tiếng Việt x

Tinh trang: Tất cả M

Loại Văn bản: Tắt cả he

Co quan Ban hanh: [Tất ca vị

Người kỷ Tất cả v

Sắp xếp theo: Van bản chinh xác sẽ nằm trên „"

tớ gap khó khán trong việc tìm kiếm, vui lòng bam vào đây dé được hỗ trợ trực tiếp từ THƯ VIỆN PHÁP.

Kết quả 1-20 trong 4819 văn ban

® Tài khoản :

Loc KET QUÁ 4 Chỉ thị 17/CT-UBND nam 2018 về thực hiện nghiêm quy định Ban hành: 26/11/2018 nguyendung104

Linh vực ina lái xe khi TH Sseevie am Tinton Os 2 cet hdaise , Cập nhật: 18/03/2019 +_ Chuyển loại thành viên

‘BO máy hành chính (1506) Thương mại (1002) CHÍ THỊ VE VIỆC THỰC HIỆN NGHIÊM QUY ĐỊNH KHÔNG ƯỐNG.

| Văn bản gốc | Lược đồ | Liên quan hiệu lực | Tải vẻ

Hình 2.3 Hướng dẫn tìm kiếm tài liệu văn bản pháp luật

Loc KET QUÁ

Van hóa - Xã hội (879)

-Giao thông - Vận tài (41)

Tài chính nhà nước (396)

Thué - Phí - Lệ Phí (278)

“Xuất nhập khẩu (250) Doanh nghiệp (238) Tai nguyên - Mỗi trưởng (153) Bảo hiểm (144)

Giáo dục (140)

'Công nghệ thông tin (134) Lao động - Tiên lương (129) Lĩnh vực khác (125)

'Quyền dân su (27)

Sở hữu trí tuệ (25)

Kế toán - Kiếm toán (21)

‘Dich vụ pháp lý (10)

Tiên tê - Ngân hàng (11

Kết quả 1-20 trong 4819 văn ban

® Tài khoản :

4 Chỉ thị 17/CT-UBND nam 2018 về thực hiện nghiém quy định Ban hành: 26/11/2018 nguyendung104

không tiống rượu, bia, đồ uống có cồn trong giờ làm việc và Hou hrc: Đã biết + Thong tin cả nhân

Tình trạng: Dã biết

không lái xe khi đã Wốfg fƯỢu, bia do tinh Ninh Thuận ban hành

Cập nhật 18/03/2019.

¡lực | Tải vẻ

wih | Văn bản gốc | Lược đồ { !

+ Chuyển loại thành viên

+ Van bản của tôi (0)

'CHÍ THỊ VỀ VIỆC THỰC HIỆN NGHIÊM QUY ĐỊNH KHÔNG UỐNG + Đổi mật khẩu ee

RƯỢU BIA, ĐÔ UỐNG CÓ CÔN TRONG GIỜ LAM VIỆC VA KHONG LAI + Thoát s

XE KHI ĐÃ UỐNG RƯỢU, BIA Trong thời gian qua, đa sé can bộ, công.

'chức, viên chức, người lao động trong các cơ quan, đơn vị và cán bộ,

'chiến sĩ lực lượng vũ trang trên địa bản tinh đã chấp hành tốt quy định của TRA CỨU NHANH.

nhà nước về không.

Ban hành: 25/10/2018

Hiệu lực: Đã biết

Tình trạng: Đã biết Cập nhật: 29/11/2018

2 Chỉ thị 06/CT-UBND năm 2018 thực hiện nghiêm quy định không

tiống rượu, bia trong giờ làm việc và không điều khiển phương

tiện cơ giới tham gia giao thông khi đã tống rượu, bia vượt quá

nồng độ cho phép do tỉnh Tuyên Quang ban hành.

ông Anh | Van bản gốc | Lược dd | ! uiuo 4 Tải về HỖ TRỢ NHANH

CHÍ THỊ VỀ VIỆC THU HIEN NGHIÊM QUY ĐỊNH KHÔNG UỐNG.

RƯỢU, BIA TRONG GIỜ LÀN! VIỆC VÀ KHÔNG DIEU KHIÊN PHƯƠNG @ Dịch Vụ

TIEN CƠ GIỚI THAM GIA GIAO THONG KHI ĐÃ UỐNG RƯỢU, BIA Š Hỗ trợ trực tuyến

'VƯỢT QUÁ NÔNG ĐỘ CHO PHÉP Trong thỏi gian qua, thực hiện Chỉ thị Bien thoai - (028)39303279

số 26/CT-TTg ngày 05/9/2016 của Thủ tướng Chính phủ vẻ tang cường kỷ Hoang 88672886

luôt, kỳ cương trong các cơ quan hành x

MỜI GÓP ¥

Ban hành: 12/10/2018

Hiệu lực: Đã biết Tinh trang: Đã biết Cập nhật 22/11/2018

3 Chỉ thị 04/CT-UBND nam 2018 về cán bộ, chiến sĩ, công chức, viên chức nêu gương thực hiện nghiêm quy định của pháp luật

về không uống rượu, bia trong giờ làm việc và không uống.

Tượu, bla khi lái xe do tinh Ca Mau ban hành

tông Anh | Văn bản gốc | Lược đồ |

tôi hỗ trợ bại

Hình 2.4 Kết quả tìm kiếm trên thuvienphapluat.vn với từ khóa “uống rượu”

Truce tin EE Van bản gắc/PDF | Luge dd) Liên quan hiệu luc) Liên quan nội dung) Tải về

ban Pháp Luật

© Được hỗ trợ pháp lý sơ bộ.

© Tra cứu hơn 11.000 Tiêu

© Tra cứu Văn bản Tiếng Anh và xem ở chế độ song ngữ

@ và nhiều Tiện ich quan

trọng khác.

UY BAN NHÂN DAN CONG HOA XA HOI CHU NGHIA VIETNAM 4

TINH NINH THUAN Độc lập - Tự do - Hạnh phúc in nổi bật nhất

g ®

Số: 17/CT-UBND Ninh Thuận, ngày 26 thang 11 nắm 2018

Lưuwữ Ghichủ2 Ýkiến

CHỈ THỊ i 8 (8

'VÊ VIỆC THỰC HIEN NGHIÊM QUY ĐỊNH KHONG UỐNG RƯỢU, BIA, ĐÔ UỐNG CÔ CON Facebook Emaa in

KHI ĐÃ UỐNG RƯỢU, BIA

TRONG GIO LAM VIỆC VÀ KHÔNG LAI

Trong thời gian qua, da số cản bô, công chức, viên.

va cân bộ, chiên sĩ lực lượng vũ trang trên địa ban

không udng rượu, bla đồ uống cô côn trong giờ |

‘quy định của nhà nước vẻ

phạm.

Để khắc phục tinh trạng trên, giữ nghiêm kj luật, kỷ cương hành chinh, nang cao tinh thản trách.

nhiệm va hiệu quả công việc tại các cơ quan, đơn vị trên địa ban tỉnh; đồng thoi, thực hiện két luận

của Pho Thủ tướng Chính phủ Trương Hòa Binh - Chủ tịch Uy ban An toàn giao thong Quốc gia tại

Hội nghị sơ kết công tac bảo đảm trật tự an toàn giao thông 06 thang đầu năm, nhiệm vụ trong tâm

6 thang cuối nam 2018 (tại Thông bảo số 242/TB-VPCP ngây 12/7/2018 của Văn phòng Chính

phủ), Chủ tịch Ủy ban nhân dân tinh yếu cẩu:

1, Thủ trưởng các Sở, ban, ngành, tổ chức hội oan thé, cơ quan, đơn vị đông trên địa ban tinh và

Chủ tịch Ủy ban nhân dân các huyện, thành phé tổ chức quân triệt nội dung Chỉ thị đến toan thé

‘can bộ, công chức, viên chức, người lao động trong cơ quan, đơn vị va can bộ, chiến sĩ lực lượng

Hình 2.5 Hién thị nội dung văn bản trên Website

18

Trang 19

Kết quả tìm kiếm văn bản được hiển thị và highlight những từ ngữ liên quan Người

dùng chọn tiêu dé của văn bản dé xem chỉ tiết nội dung văn bản Văn bản sẽ hiển thi

trực tiếp trên Website

Chào bạn nguyendung10404@gmail.com

1 Thông tin về bạn

Bạn đang là thành viên FREE

-Tiện ích tra cứu của Bạn được sử dụng đến ngày 31/12/2021

*

Họ và tên: [Dung Nguyén Ngoc

E-mail: Inguyendung10404@gmail.con!|

2 Dang ky chuyền đổi thành viên:

Bạn đăng ký chuyển đổi thành Thành Viên có nhiều tiện ích cao hơn Mời bạn c Thành viên mới, bên dưới.

Thành viên TVPL Pro

© TVPL Pro V: (05 người sử dụng củng lúc) 109.600 đ/người/tháng

© TVPL Pro Il: (02 người sử dụng cùng lúc) 134.000đ/người/tháng

© TVPL Pro I: (01 người sử dụng cùng lúc) 169.000đ/người/tháng

Bam vào đây dé xem thêm thông tin về các loại Thành viên

Thời gian sử dụng:| 1 năm v

Tổng sé tiền: 1.164.000 d

Hình 2.6 Website yêu cầu người dùng trả phí để sử dụng

2.1.2 Ưu điểm nói lại trả về top cao hơn

e Số lượng văn bản pháp luật lớn (225628 văn bản pháp luật) Các văn bản

luôn được cập nhật.

e Có đội ngũ tư van pháp luật chuyên môn

e Gửi email thống báo cho thành viên những thông tin pháp luật nổi bật hàng

tuân.

2.1.3 Nhược điểm

e Giao diện có quá nhiều thông tin cũng như các quảng cáo của trang web có

thé khiến người dùng bị rối

e Yêu cầu người dùng đăng kí tài khoản nếu muốn tra cứu nâng cao

© Mất phí dé sử dung các tiện ích cao hơn

19

Trang 20

2.2 Văn bản pháp luật http://vbpl.vn/

2.2.1 Tim hiểu Website

[2] Hệ thống chứa toàn bộ các văn bản quy phạm pháp luật, văn bản hợp nhất trêntoàn quốc, bao gồm các văn bản do cơ quan nhà nước ban hành hoặc phối hợp banhành Ngoài ra, CSDL văn bản còn chứa các văn bản điều hành được ban hành và

quản lý bởi Hội đồng nhân dân (HĐND), Ủy ban nhân dân (UBND) cấp tỉnh, thành

phô trên toàn quôc.

Người dùng có thể dễ dàng tìm kiếm, xem thông tin của các văn bản có trong CSDLnhư: Văn bản pháp luật, Văn bản hợp nhất, Văn bản điều hành, Điều ước quốc tế

Các tính năng hỗ trợ: Chương trình hỗ trợ cho người dùng dễ dàng Tìm kiếm, Khaithác thông tin cũng như tham gia đóng góp ý kiến cho các văn bản thông qua các

chức năng được hỗ trợ trên chương trình.

Ngoài ra, khi truy cập vào chương trình, người dùng còn dễ dàng theo dõi, tìm

kiếm được các Tin tức, Các Tình huống pháp luật có liên quan đến các văn bản quyphạm pháp luật đã, đang và sắp được ban hành

) eơeofruiệu aude cu Về vi claret wr

TRANGCHỦ TÌMKIẾM TINTỨC TỈNHHUÔNGPHÁPLUẬT ENGLISH Tìm kiếm văn bản

Từ khóa tìm kiêm

| @ TAtea từ trên © Chính xác cụm từ trên

| Tìm trong © Tắt cả © Số hiệu @ Số hiệu & trích yếu

Văn bản pháp luật Trung ương Van ban pháp luật địa phương quy phạm pháp luật do Chính phủ, Thủ tướng Chính phủ ban hat

CONG THONG TIN ĐIỆN TỬ BỘ PHAP DIEN CƠ SỞ DU LIỆU QUỐC GIA VE

BỘ TƯ PHAP ĐIỆN TỬ THỦ TỤC HÀNH CHÍNH

Văn bản mới Tin tức Tình huống pháp luật

Hình 2.7 Giao diện Website vbpl.vn.

20

Trang 21

Người dùng muốn tìm kiếm cần nhập thông tin vào ô Tìm Văn bản Pháp luật sau đónhắn “Enter” hoặc chọn vào nút “Tìm kiếm” Người dùng cũng có thé “Tìm kiếm

đơn giản” theo 2 option sau:

e_ Chính xác cụm từ trên: kết quả trả về chứa chính xác cụm từ được nhập theo

đúng thứ tự hiên thị của từ khóa

e Có tat cả từ trên: kết quả trả về chưa tất cả các từ trong cum từ khóa, không

quan tâm vi trí hiên thi.

Người dùng cũng có thê chọn ““Tìm trong”: lựa chọn từ khóa cân tìm năm trong thuộc tính nào của văn bản hoặc tìm kiêm thông qua nhiêu tiêu chí trong “Tìm

kiêm nâng cao”.

TRANGCHỦ TÌMKIẾM TINTỨC TÌNHHUÓNGPHÁPLUẬT ENGLISH

> Văn bản pháp luật Trung ương

> Văn bản pháp luật địa phương

> Bộ Pháp điển điện tir

Van bản mới

Van bản phapquy Văn bản hợp nhất

Quyết định 59/2019/QĐ-UBND Ban hành bảng giá —,

đất trên địa bàn huyện Quy Châu, tỉnh Nghệ An Tim thấy 7 van bản Pham vi) Tất - v | Hiển thị:| 10 v |bảnghi

giai đoạn từ ngày 01/01/2020 đến ngày Z

31/12/2024 # Quyết định 1081/QĐ-TTg.

Thông tư 55/2014/TT-BGTVT Sửa đổi, bổ sung Thanh lập ban Chỉ Đạo quốc gia phỏng, chống tác hại của lạm dụng Ban hàm: 18/07/2018

một số điều của Thông tư số 31/2011/TT-BGTVT

rượu, bia và đỗ uéng có côn khác

thông vận tải quy định về kiểm tra chat lượng an PRB lién quan ¥ Thuộctỉnh wilượcđồ lTổivẽ

toàn kỹ thuật và bảo vệ môi trường xe cơ giới = nhập khẩu :

+ Quyết định 47/2003/QĐ-BTC

Thông tư 06/2020/TT-BLĐTBXH Ban hành Danh.

mục công việc có yêu cầu nghiêm ngặt vẻ an toàn, Về việc bãi bỏ áp dụng giá tính thuế nhập khẩu thối thiểu đối với Ban hành: 11/04/2003

vệ sinh lao độn: bud ò ó lộ lộng mat hàng rượu và đồ uống có cồn, có nguồn gốc từ EU Tư X20

Quyết định 16/2020/QĐ-UBND Về việc sửa đổi [ẦVðlênquan Z Thuộctính ailượcđồ ETiếnganh J Tải về

Khoản 2 Điều 3 Quy định chức năng, nhiệm vụ,

quyền hạn và cơ cau to chức của Sờ Giao thông a

vận tải tinh Quảng Ngãi ban hành kèm theo Quyết = Quyết định 52/2012/QĐ-UBND

đính số 67/2016/QĐ-UBND ngày 29/12/2016 của

Hình 2.8 Kết quả tìm kiếm đơn giản trên vbpl.vn với từ khóa “uống rượu”

TRANGCHỦ TÌMKIẾM TINTỨC TÌNHHUỐNGPHÁPLUẬT ENGLISH

> Văn bản pháp luật Trung ương [ Van bản hợp nhất Tìm kiếm đơn giản

Thông tư 55/2014/TT-BGTVT Sửa đổi, bổ sung À

một số điều của Thông tư số 31/2011/TT-BGTVT _ Im thay 1180 văn ban.

ngày 15 tháng 4 năm 2011 của Bộ trường Bộ Giao

thông vận tải quy định về kiểm tra chất lượng an „ Bộ luật 91/2015/QH13

toàn kỹ thuật và bảo vệ môi trường xe cơ giới :

Thông tư 06/2020/TT-BLDTBXH Ban hành Danh Hiệu lực: 01/01/2017

mục công việc có yêu cau nghiêm ngặt ve an loằn, noynpop [aviinquan # Thudctinh uiượcđồ Tai v8

vệ sinh lao động

Quyết định 16/2020/QĐ-UBND Vẻ việc sửa đổi ¥ Bộ luật 10/2012/QH13

Khoản 2 Điểu 3 Quy định chức năng, nhiệm vụ

quyển hạn và cơ cấu tổ chức của Sở Giao théng Lao động Ban hành 18/06/2012 vận tải tỉnh Quảng Ngãi ban hành kèm theo Quyết

định số 67/2016/QĐ-UBND ngày 29/12/2016 của Hiệu lực 0082013Hình 2.9 Kết quả tìm kiếm nâng cao trên vbpl.vn với từ khóa “uống rượu”

21

Trang 22

Khác với các Website khác, từ khóa được tìm kiếm không được highlight mà chỉ

hiển thị một số nội dung cơ bản của văn bản pháp lý như tiê đề, ngày ban hành,ngày hiệu lực Dé xem chi tiết văn bản, người dùng nhấn chọn vào tiêu đề của văn

bản đó.

Văn bản hợp nhất | toan van lâu 105 Lich sit VBIiênquan Lượcđồ Taivé Bảnin

Hệ thống hóa VBQPPL Hiệu lực: Còn hiệu lực Ngày có hiệu lực: 15/07/2015

THU TƯỚNG CHÍNH PHU CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM

Căn cứ Luật Tổ chức Chính phủ ngay 25 tháng 12 năm 2001;

Căn cứ Quyết định số 244/QĐ-TTg ngày 12 tháng 02 năm 2014 của Thủ tướng Chính phù vẻ Chính sách quốc gia phòng,

chốn ức can ng đống cóchủđẫnnăn 202

š Căn cir Quyết định số 3412007IQĐ-TTg ngày 12 tháng 3 năm 2007 của Thủ tướng Chính phủ ban hành Quy chế thành lập, tổ

Quốc hội chức và hoạt động của tổ chức phối hợp liền ngành;

> Ủy ban thường vụ Quốc hội Xét để nghị của Bộ trưởng Bộ Y té,

® Các cơ quan khác sau đây: A 5

— 1 Trưởng ban: Ba Nguyễn Thi Kim Tiền, Bộ trưởng Bộ Y tế.

2 Phé Trưởng ban thường trực: Ông Nguyễn Thanh Long, Thứ trưởng Bộ Y té LÊN ĐÀU TRANG

~ Ông Đỗ Thắng Hài, Thứ trưởng Bộ Công Thương.

Hình 2.10 Nội dung văn bản hién thị trên Website

=N.

Van bản pháp quy Van bản hợp nhất

Tìm thấy 3 văn bản x| Hiển thị:

*# Nghị định 71/2000/NĐ-CP

Quy định việc kéo dài thời gian công tác của cán bộ, công chức đến Ban hành: 23/11/2000

độ tuoi nghỉ hưu Hiệu lực: 08/12/2000

[AVBliênquan ¥ Thudctinh ølLượcđồ ETiếnganh Ï Tải về

¥ Thông tư 19/2001/TT-BTCCBCP

Về việc hướng dẫn thực hiện Nghị định số 71/2000/NĐ-CP ngày Ban hành: 25/04/2001

23/11/2000 của Chính phủ quy định việc kéo dài thời gian công tác Hiệu lực: 28/04/2001 của cán bộ, công chức đên độ tuôi nghỉ hưu

[AVBliênquan ¥ Thuộctính ul Lượcđồ § Tải về

+ Quyết định 5329/QĐ-UBND

Quyết định 5329/QĐ-UBND năm 2013 duyệt đồ án quy hoạch chỉ Ban hành: 26/09/2013

tiết tỷ lệ 1/500 khu công viên Mũi Đèn Đỏ và khu nhà ở đô thị tại ee 28Jao/2naa

Hình 2.11 Kết quả tìm kiếm trên vbpl.vn với từ khóa “đèn đỏ”

22

Trang 23

2.2.2 Uu điểm

e Số lượng văn bản pháp lý lớn và được cập nhật thường xuyên

e Nội dung văn bản day đủ

e Khong chứa các quảng cáo.

2.2.3 Nhược điểm

e Độ chính xác của chức năng tìm kiếm chưa cao

e Kết quả trả về khi tìm kiếm chưa trực quan, không hightligh những từ khóa

tìm kiếm, không thông báo tình trạng của văn bản.

e Nội dung văn bản chi tiết hiện thị khó nhìn

23

Trang 24

2.3 Văn bản pháp luật https://vanbanphapluat.co/

2.3.1 Tìm hiểu Website

[3] Cơ sở dit liệu văn bản pháp luật cung cấp nội dung, file văn bản gốc các loại vănbản pháp luật, công văn, tiêu chuẩn Việt Nam, dự thảo văn bản Được xây dựng vàphát triển CSDL từ đầu năm 2013 với tên miền luatvn.net Đến đầu năm 2016 cậpnhật lại và xây dựng lại hoàn toàn CSDL này Đến tháng 08 2017 CSDL về văn bảnpháp luật chính thức đi vào hoạt động với tên miền mới vanbanphapluat.co

Giải pháp của Website nhằm cung cấp đến tổ chức, cá nhân, doanh nghiệp công cụtra cứu, tìm kiếm hữu ích các tài liệu liên quan đến pháp luật Việt Nam

Mục tiêu của Website là:

e Sử dụng công nghệ hiện đại dé tô chức lại hệ thông văn bản trên cả nước

e Cập nhật nhanh chóng, chính xác va kip thời.

e Kếtnối cộng đồng dân luật Việt Nam

o Tìm kiếm nhanh chóng, chính xác thông tin văn bản

o Tìm kiếm cơ hội giao thương

Hệ thống tìm kiếm & tra cứu hiệu lực Van ban pháp luật

Chào mừng bạn đến với hệ thống CSDL Văn bản pháp luật Tại đây bạn có thể tìm kiếm, tra cứu thông tin tổng hợp hơn 300,000 văn bản các loại bao gồm: Văn bản Quy phạm pháp luật, Công văn, Tiêu chuẩn Việt Nam, Văn bản Tiếng anh & dự thảo văn bản mới nhất được tổng hợp

Còn hiệu lực Công văn

thiểu số và miền núi gị

Cập nhật 41 phút trước

TCVN

Hình 2.12 Giao diện Website vanbanphapluat.co.

Người dùng muôn tìm kiêm cân nhập thông tin mình muôn tìm kiêm vào ô “Gõ từ

khóa tìm kiếm ” sau đó nhân Enter hoặc chọn nút tìm kiếm Một số hướng dẫn từ

24

Trang 25

Website: có thê nhập bât cứ thông tin muôn tìm, nêu muôn tìm chính xác từ khóa

trong tìm kiếm thì đặt trong dấu “ ”, hoặc có thể kết hợp thêm các từ khóa khác

vanbanphapluat.co Trang chủ

Hướng dẫn tìm kiếm

Nhập bất cứ thông tin bạn muốn tìm Ví dụ: 5 văn bản, Lĩnh vực, Cơ quan ban hành, Người ký

Để tìm chính xác, hãy nhập từ khóa tìm kiếm trong ngoặc kép hoặc kết hợp các từ khóa Ví dụ: "Từ khóa 1" "Từ khóa

Để thu hẹp phạm vi tìm kiếm bạn có thể sử dụng chức năng lọc văn bản bên dưới.

Tìm kiếm uống rượu khi lái xe

Tìm thấy 128,212 văn bản phù hợp.

## > TÌM KIẾM: UỐNG RƯỢU KHI LAI XE

LOC KẾT QUA CSDL VAN BAN

Hình 2.13 Hướng dan tìm kiếm với “từ khóa”

Đề thu hẹp phạm vi tìm kiếm, Website cho phép người dùng sử dụng chức năng lọc

văn bản theo nhiều cách:

o Loại văn bản: Văn bản pháp luật, Công văn, TCVN (Tiêu chuẩn Việt Nam),

Dự thảo văn bản.

o Tùy vào loại văn bản, người dùng có thể lọc theo Lĩnh vực, Loại văn bản,

Người ký, Hiệu lực, Cơ quan ban hành.

LỌC KẾT QUẢ CSDL VĂN BAN

Linh vực Loại văn bản Người ký Hiệu lực Cơ quan ban hành van bên pháp hist

Bộ máy hành chính €ŒTiOA ván: -›ã hoi Tài chính nhà nước Công văn 20,017

Tài nguyên - Môi trường GED trẽthao-vtẽ ŒW% thuong mai

Thuế - Phí - Lệ Phí GD c¡ouuc GED \aooong-rin lương TCVN œ°

Xây dựng - Đô thị ŒẰ%W% bocannphiep ŒW CS Giao thong - van tai ixjthdio vău Bản cn°

Bất động sản GD s6 €Ẫi Cong nghé thong tin 7 Lĩnh vực khác Œ#ẰW% teènte- Ngan hàng f#ẤẦ®3 ss Xuat nap khau

Quyền dân sự ŒWằ bsiohcm ŒWQ thituc Tétung

Vi phạm hành chính ED ketoin-kểmtoán @D soDichvuphaply Trach nhiém hinh sy GD chung khoan ED sso hau tritue

T-UBND năm 2018 về cán bộ, chiến sĩ

c hiện nghiêm quy định của phái

ong giờ làm việc và không ‘iti tới ia

hành

chức, viên chức

Còn hiệu lực Cập nhật: năm ngoái

BB NOI dung sh Lược đồ 9 Lịch sử Bile liên quan

Chỉ thị 19/CT-UBND

awe Ban hành: 04/10/2018 javascript

Hình 2.14 Hướng dẫn lọc kết quả tim kiếm

25

Trang 26

Với mỗi “từ khóa tìm kiếm” Kết quả trả về sẽ được hiển thị va highlight những từ

ngữ liên quan Đề xem chỉ tiết văn bản pháp lý đã tìm kiếm, người dùng chọn vào

hình ảnh của văn ban đó dé đọc file PDF hoặc chọn tiêu dé của văn bản dé xem chi

tiết trên Website

# > TÌM KIẾM: UỐNG RƯỢU KHI LÁI XE > VĂN BẢN PHÁP LUẬT

LỌC KẾT QUẢ CSDL VĂN BAN

Lĩnh vực Loại văn bản Người k: Hiệu lực Cơ quan ban hành

l ie 7 : Văn bản pháp luạt fEFED

KH ĐHANIGUEND Ban hành 26/11/2018 Công văn exp

Chỉ thị 17/CT-UBND năm 20+8/ã-skue-biệa.agiiôna.ay định khôn/ cồn

rong giờ làm việc và khér a do tỉn 26/11/2018

Chỉ thị 04/CT-UBND năm 2018 về can bộ, chiến! sĩ, công chức, viên chứ:

n nghiêm quy định v Ngày hiệu It 12/10/2018

= giờ làm việc va không tống FARg, bia Khi lãi xe do t Hiệu lực Còn hiệu lực

: ’ } ập nhật năm ngoái

javascript Ban hant 04/10/2018

Hình 2.15 Kết quả tìm kiếm trên vanbanphapluat.co với từ khóa “uống rượu”

Chỉ thị 04/CT-UBND 2018 công chức viên chức không 1 of 18 uống rượu bia trong giờ làm việc Cà Mau

Hình 2.16 Hiển thị nội dung văn bản trên file PDF

26

Trang 27

EổNộidung «&Lượcđồ RiVănbảnliênquan Đt|chsửhiệulực Lá Lá | sốn © torpor to ihe is

Nội dung toàn văn Chỉ thị 04/CT-UBND 2018 công chức viên chức không uống rượu bia trong giờ làm việc Cà Mau Đã xem: Đánh giá: #9'œýW@

ỦY BAN NHÂN DÂN CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TINH CÀ MAU Độc lập - Tự do - Hanh phúc

Số: 04/CT-UBND Củ Mau, ngày 12 thang 10 nam 2018

CHỈ THỊ

VỀ VIỆC CÁN BỘ, CHIẾN SĨ, CÔNG CHỨC, VIÊN CHỨC NÊU GƯƠNG THỰC HIỆN NGHIÊM QUY ĐỊNH CỦA PHÁP LUẬT VỀ

JỘC TÍNH VAN BAN PHAP LUAT 04/

KHONG UỐNG RƯỢU, BIA TRONG GIỜ LAM VIỆC VÀ KHONG UỐNG RƯỢU, BIA KHI LAI XE M

i F ‘ Loại văn ban Chỉ thị

Thời gian qua, hầu hết cản bộ, chiến sĩ, công chức, viên chức, người lao động trong các cơ quan, đơn vị trên địa bàn tinh

đã chấp hành khá tốt quy định vẽ không uống rượu bia trong giờ làm việc và không uống rượu, bia khi lãi xe Từ đó, đã si S4CLUBND

góp phần nâng cao hiệu lực, hiệu quả hoạt động của bộ máy hành chính nhà nước các cấp, bảo đảm trật tự, an toàn giao thông trên địa ban tính Tuy nhiên, bên cạnh đó vẫn còn một số cán bộ, chiến st, công chức, viên chức, người lão cụ an ban hành ih cả lim

động thực hiện chưa nghiêm, vẫn uống rượu, bia ngay trước hoặc trong giờ làm việc; điều khiến phương tiện tham gia

lao thông sau khi đã uống rượu, bia, làm ảnh hưởng đến hình ảnh của người cán bộ, chiến sĩ, công chức, viên chức, you jy Nguyễn Tiến Hai _

ảnh hưởng đến chất lượng, hiệu quả giải quyết công việc, tiềm ấn nguy cơ gây mất an toàn giao thông +

Ngày ban hành 12/10/2018

Đế khác phục tình trạng trên, nhằm tăng cường kỷ luật, kỷ cương hành chính, góp phần bảo đảm trật tự, an toàn giao

Hình 2.18 Hién thị nội dung văn bản trên Website

® > TÌM KIẾM: VUOT DEN DO

C KẾT

x Lĩnh vực * Loại văn bản v Người ký v Hiệu lực v Cơ quan ban hành

Quyết định 83/QD-UBND

Quyết định 83/QD-UBND năm 2018 phê duyệt Chương trình phát triển @6 thị thị trấn Ba Tơ, huyện Ba Tơ, Ban Dành: 19/01/2018

tinh Quang Ngãi giai đoạn 2016-2020, định hướng @@n năm 2025 Ngày hiệu lực: 19/01/2018

Hiéu luc: Con hiéu luc

Cập nhật: 8 tháng trước

(08/01/2020)

lầNội dung sa Lược đồ ti) Bản PDF Lịch sử EX VB liên quan

Quyết định 44/QD-UBND

Quyết định 44/QĐÐ-UBND năm 2018 về Quy hoạch thăm đỗ, khai thác, sử dụng 10/01/2018

khoáng sản thành phố Cần Tho đểfñ năm 2020, tầm nhìn đểñ năm 2030 : 10/01/2018

Hiệu lực: Còn hiệu lực

Cập nhật: 2 năm trước

Nội dung «hh Lược đồ 'D Lịch sử tBïÏ VB liên quan

Quyết định 1263/QĐ-UBND Ain fe ea = _ ` Ban hành: 26/04/2017

Hình 2.17 Kết quả tìm kiếm trên vanbanphapluat.co với từ khóa “vượt đèn đỏ”

27

Trang 28

# > TÌM KIẾM: "VƯỢT ĐÈN ĐỎ"

LỌC KẾT QUẢ

v Lĩnh vực v Loại văn ban v Người ký x Hiệu lực v Cơ quan ban hành

Công văn 1713/BGDĐT-GDCTHSSV

Công văn 1713/BGDĐT-GDCTHSSV năm 2020 về tăng cường triển khai công tác Pan bent ko zy ges

bảo đảm trật tự an toàn giao thông trong học sinh phổ thông đỗ Bộ Giáo dục Ngày hiệu lực: 18/05/2020

và Đào tạo ban hành Hiệu lực: Không xác định

Cập nhật: 4 tháng trước

(20/05/2020)

l Nội dung s Lược đồ II Bản PDF 'D Lịch sử EX VB liên quan

Xu == al Công van 437/TTg-CN

= = Công văn 437/TTg-CN về triển khai nhiệm vụ bảo đảm trật tự an toàn giao Ban “ưa 15/04/2020

thông quý II năm 2020 @@ Thủ tướng Chính phủ ban hành Ngày hiệu lực: 15/04/2020

Hiệu lực: Không xác định

Cập nhật: 5 tháng trước

(18/04/2020)

Nội dung sh Lược đồ 'D Lịch sử lÏ VB liên quan

Hình 2.19 Kết quả tìm kiếm chính xác trên vanbanphapluat.co với từ khóa “vượt

đèn đỏ”.

2.3.2 Uu điểm

e Website dé sử dụng, giao diện đơn giản.

e Cơ sở dữ liệu pháp luật lớn thường xuyên được cập nhật và thêm các văn bản

mới.

e Không có nhiều quảng cáo gây khó chịu cho người dùng

e Ngoài việc cung cấp văn bản hiển thị bằng tiếng Việt còn hiển thi văn ban

bang tiếng Anh

e Cung cấp RESTful APIs chia sẻ cơ sở dữ liệu

2.3.3 Nhược điểm

e Chua có quá nhiều nồi bật trong chức năng tìm kiếm, độ chính xác của việc

tìm kiêm chưa cao (Kêt quả tìm kiêm hình 2.17 và 2.18).

e_ Còn hién thị quảng cáo của Google

28

Trang 29

2.4 Bảng tổng hợp so sánh các Website hỗ trợ tìm kiếm tài liệu pháp lý.

[4] Dựa vào một số tiêu chí đánh giá Website:

WEBSITE | Legal Van bản Thư viện pháp luật | Văn bản pháp luật

CHỨC Document phap luat thuvienphapluat.vn | vanbanphapluat.co

f | Bố cục Website cân đối? M v x v

g | Chứa quảng cáo? > ch v v

II Nội dung

a | Nội dung bài viết rõ v v v v

mỗi bài viết?

d | Đưa ảnh nội bộ doanh v x M x

Trang 30

TIEU CHÍ CÁCH ĐÁNH GIÁ

I Giao diện Website

a | Có logo? (+1) Có logo đề rõ ràng về mặt thương hiệu.

b | Bố cục menu rõ ràng/ day | Day đủ gồm: Trang chủ, giới thiệu, sản phâm, các chính sách

đủ? (+1) giao hàng/ đổi trả/ hỗ trợ, liên hệ.

c | Mau sắc thương hiệu rõ | Màu sắc Website cũng đồng nhất với mau của bộ nhận dang

nét? (+1) thương hiệu.

d | Hình ảnh nét/ đẹp? (+1) Dùng mat thường để đánh giá độ nét của ảnh, ảnh tự chụp

được đánh giá cao Ảnh copy, tải về bị đánh giá là thấp Ảnh

nét/ đẹp được đánh giá cao Ảnh mờ/ xấu được đánh giá thấp.

e | Có POPUP? (+1) POPUP nên đưa ra nội dung dé thu hút được người đọc, tránh

làm phiền khách hàng mà k mang lại giá trị cho họ.

f | Bé cục Website cân đối? | Thường Website chia thành 3 phần: Phần Sidebar bên trái,

(+1) phần nội dung ở giữa, phần Sidebar bên phải Chỉ cần chiều

dài của 3 cột này gần tương đương nhau, không cột nào quá

đài hơn so với 2 cột còn lại thì được gọi là "cân đối".

g | Chứa quảng cáo? (_— 1) Website chứa quá content quảng cáo.

II Tính năng

a | Có tính năng tim kiếm? | Tính năng tìm kiếm giúp khách hàng có trải nghiệm tốt hơn

(+1) khi duyét Website.

b | Tôi ưu hóa cho di động? | Vào thử bang điện thoại của minh Có thé ding thêm Tool

(+1) "check Website mobile friendly" Nếu hiển thi đầy đủ nội

dung thì gọi là tốt.

c | Tốc độ load trang nhanh? | Vào thử Website bằng máy tính, điện thoại Có thé dùng công

(+1) cụ check speed online

d | Google Analytics? (+1) Việc liên kết ananlytics gan như là điều bắt buộc

e | Bài viết liên quan? (+1) Giúp giữ chân người đọc lâu hơn, đưa cho người đọc nhiêu

thông tin hơn

f | Live chat? (+1) Công cụ không thê thiểu khi làm online

g | Miễn phí cho người dùng? | Website không yêu cầu người dùng phải trả phí để sử dụng

(+1) tính năng như: xem, tải,

h | Hỗ trợ đa ngôn ngữ (+1) Website hỗ trợ sử dụng đa ngôn ngữ và cho phép người dùng

chuyển đổi qua lại giữa các ngôn ngữ: tiếng Việt, tiếng Anh,

III Nội dung

a | Nội dung bài viết rõ ràng? | Đọc hiểu được nội dung người viết muốn nói

(+)

b | Thông tin liên hệ rõ ràng, | Day đủ dé khách hàng có thé dé dang tìm được khi họ có nhu

day đủ? (text, maps) (+1) cau

c | St dung anh/video trong | Sử dung ảnh vs video níu chân khách hang lâu hon, tăng chất

mỗi bài viết? (+1) lượng nội dung Website.

d| Đưa ảnh nội bộ doanh | Dua hình ảnh, văn hóa doanh nghiệp lên Website giúp tang sự

nghiệp (+1) uy tín từ khách hàng.

Thời gian trung bình tìm | Thời gian trung bình trả về kết quả tìm kiếm hiển thị cho kiếm (+1) người dùng.

Tong điểm đánh giá Điểm tôi đa 18.

Bảng 2.2 Bảng đánh giá chỉ tiết Website

30

Trang 31

Chương 3 TÌM HIỂU CÔNG NGHỆ SỬ DUNG

3.1 Tìm hiểu công cu tìm kiếm tìm kiếm

3.1.1 Khái niệm

[51 Search Engine (Công cụ tìm kiếm, máy tìm kiếm) là một hệ thống phần mềm,

được truy cập trên Internet, có chức năng tìm kiếm cơ sở dữ liệu thông tin theo truyvẫn của người dùng Máy tìm kiếm sẽ cung cấp một danh sách các kết quả phù hợp

nhất với những gì người dùng đang cố gắng tìm kiếm

Các bộ phận cau thành hệ thống máy tìm kiếm search engine bao gồm:

e B6 thu thập thông tin (Web crawling).

e Bo lập chỉ mục (Indexing).

e Bộ tìm kiếm thông tin (Searching)

3.1.2 Nguyên lý hoạt động

/ ` io \ ⁄ \ ⁄ > a N / \

( => Download pag ‘iret Indexer F— Index F— Retrieval ==—t Queties >

\ Servers / TL „ cache X ) \ / \ Engine \ /

Hình 3.1 Nguyên lý hoạt động của Elasticsearch

Search Engine điều khiển robots (hay Spider, Web wanderer, Web worm) đi thu

thập thông tin trên mang thông qua các siêu liên kết (hyperlink) Khi robots pháthiện ra một website mới, nó gởi tài liệu (Web page) về cho Server chính dé tạo cơ

sở dtr liệu chỉ mục phục vụ cho nhu cầu tìm kiếm thông tin Boi vì thông tin trênmạng luôn thay đổi nên robots phải liên tục cập nhật các Website cũ Mật độ cập

nhật phụ thuộc vào từng hệ thong search engine Khi search engine nhan cau truy

31

Trang 32

vấn từ user, nó sẽ tiến hành phân tích, tim trong cơ sở dữ liệu chỉ mục và trả về

những tài liệu thoả yêu cầu tìm kiếm

3.1.2.1 Bộ thu thập thông tin — Web crawling

[6] Web crawling là một chương trình tự động duyệt qua các cấu trúc siêu liên kết

dé thu thập tài liệu & một cách đệ quy nó nhận về tat cả tài liệu có liên kết với tàiliệu này Robot được biết đến dưới nhiều tên gọi khác nhau : spider, web wanderer

hoặc web worm, Những tên gọi này đôi khi gây nhằm lẫn, như từ ‘spider’,

‘wanderer’ làm người ta nghĩ rằng robot tự nó di chuyên va từ ‘worm’ làm người taliên tưởng đến virus Về bản chất robot chỉ là một chương trình duyệt và thu thập

thông tin từ các site theo đúng giao thức web Những trình duyệt thông thường

không được xem là robot do thiếu tính chủ động, chúng chỉ duyệt web khi có sự tác

động của con người.

3.1.2.2 Bộ lập chỉ mục — Indexing

[7] Hệ thống lập chỉ mục hay còn gọi là hệ thống phân tích và xử lý dữ liệu, thựchiện việc phân tích, trích chọn những thông tin cần thiết (thường là các từ đơn, từ

ghép , cụm từ quan trọng) từ những dữ liệu mà robots thu thập được va tô chức

thành cơ sở đữ liệu riêng để có thê tìm kiếm trên đó một cách nhanh chóng, hiệuquả Hệ thong chi mục là danh sách các từ khoá, chỉ rõ các từ khoá nào xuất hiện ở

trang nào, địa chỉ nào.

3.1.2.3 Bộ tìm kiếm thông tin — Searching

[8] Search engine là cụm từ dùng chỉ toàn bộ hệ thống bao gồm bộ thu thập thông

tin, bộ lập chỉ mục & bộ tìm kiếm thông tin Các bộ này hoạt động liên tục từ lúckhởi động hệ thống, chúng phụ thuộc lẫn nhau về mặt dữ liệu nhưng độc lập vớinhau về mặt hoạt động Search engine tương tác với user thông qua giao diện web,

có nhiệm vụ tiêp nhận & trả vê những tài liệu thoả yêu câu của user.

Tóm lai, tìm kiếm từ là tìm kiếm các trang mà những từ trong câu truy van (query)xuất hiện nhiều nhat, ngoại trừ stopword (các từ quá thông dụng như mao từ a, an,

32

Trang 33

the, ) Một từ càng xuất hiện nhiều trong một trang thì trang đó càng được chọn

dé trả về cho người dùng Và một trang chứa tất cả các từ trong câu truy van thì tốthơn là một trang không chứa một hoặc một số từ Ngày nay, hầu hết các searchengine đều hỗ trợ chức năng tìm cơ bản và nâng cao, tìm từ đơn, từ ghép, cụm từ,danh từ riêng, hay giới hạn phạm vi tim kiếm như trên đề mục, tiêu đề, đoạn vănbản giới thiệu về Website,

Ngoài chiến lược tìm chính xác theo từ khoá, các search engine còn có gắng “hiểu”

ý nghĩa thực sự của câu hỏi thông qua những câu chữ do người dùng cung cấp Điềunày được thể hiện qua chức năng sửa lỗi chính tả, tìm cả những hình thức biến đổi

khác nhau của một từ.

32 C6 33 66

Ví dụ: Search engine sẽ tìm những từ như “speaker”, “speaking”, “spoke” khi người

dùng nhập vào từ khóa tìm kiếm là: “speak”

3.2 Tìm hiểu Elasticsearch

3.2.1 Khái niệm

[9] Elasticsearch là một công cụ tìm kiếm search engine dựa trên nền tảng ApacheLucene Nó cung cấp một bộ máy tìm kiếm dạng phân tán, có đầy đủ công cụ với

một giao diện web HTTP có hỗ trợ dữ liệu JSON.

Elasticsearch là một mã nguồn mở được phát triển bằng ngôn ngữ Java, thực chathoạt như một Web Server, có khả năng tìm kiếm nhanh chóng (near realtime) thông

qua giao thức RESTful.

Elasticsearch chạy trên Server riêng và đồng thời giao tiếp thông qua RESTful do

vậy nên nó không phụ thuộc vào Client hay hệ thống Nên việc tích hợp nó vào hệ

thống là dễ dàng, chỉ cần gửi request HTTP sẽ nhận được kết quả trả về

Với các dữ liệu nhỏ và vừa, người dùng có thé tìm kiếm trên file, trên các nền tang

dữ liệu như Oracle, MySQL, MongoDB nhưng đối với những trường hợp dữ liệu

lớn thì Elasticsearch giúp cho việc tìm kiêm trở nên tôi ưu và hiệu qua rat lớn.

33

Trang 34

thì sẽ tìm kiếm trên Elasticsearch, tốc độ vừa nhanh, vừa giảm tải cho database.

3.2.3 Ưu, nhược điểm của Elasticsearch

3.2.3.1 Ưu điểm

e Khả năng tim kiếm mạnh mẽ dựa trên Apache Lucene và phân tích dữ liệu

e Khả năng mở rộng theo chiều ngang Dù tìm kiếm từ khóa sai chính tả hay

không đúng cú pháp thì vẫn được hỗ trợ trả về kết quả rất tốt

se - Hỗ trợ tìm kiếm khi từ khóa tìm kiếm có thé bị lỗi

e Hỗ trợ đặc tả những câu truy vấn phức tạp một cách cụ thé và rõ ràng bằng

JSON, các Structured Query DSL (Domain Specific Language),

Elasticsearch client nhu Java, Php, JS, Ruby,

3.2.3.2 Nhược điểm

e Elasticsearch được tạo ra với mục đích tìm kiếm, nhưng với những nhiệm vụ

khác ngoài search Curd thì Elastic yếu hơn so với những database khác như

MongoDB, MySQL Do vậy người ta ít khi dùng Elasticsearch làm

database chính như MongoDB hay MySQL.

e Trong Elasticsearch không có khái niệm database transaction, vì thế

Elasticsearch không đảm bảo được dữ liệu của các hoạt động như Insert,

Update hay Delete, khi chúng ta thực hiện thay đổi nhiều bản ghi nếu xảy ra

34

Trang 35

lỗi làm logic sai hay dẫn tới mat dữ liệu Day cũng là một phần khiến

Elasticsearch không nên là database primary.

e Đối với những hệ thống thường xuyên cập nhật dữ liệu thì việc sử dụng

Elasticsearch sẽ rất tốn kém cho việc đánh index dit liệu

e Việc tìm kiếm của Elasticsearch được phân trang, thông qua hai giá

trị “from” và “size” Việc phân trang này diễn ra rất phô biến, trên hầu hết

các ứng dụng và thậm chí, trên giao diện, người dùng có thé dễ dàng nhảy từ

trang này sang trang khác Nhưng Elasticsearch có những vẫn đề của riêng

nó liên quan đến phân trang, khi mà người dùng nhảy đến những trang quá

lớn, nhất là trang cuối cùng Với Elasticsearch, nó sẽ phải thực hiện tính

toán, đánh giá độ tương quan cho từng trang Ví dụ, bạn cân truy cập trang

thứ 20, thì Elasticsearch sẽ phải tính toán và thực hiện tìm kiếm trên tất cả

các trang từ 1— 20 Trong trường hợp thì sẽ là thực hiện tính toán trên 20 *

20 * 5 = 2000 bản ghi (nếu phân trang là 20 bản ghi mỗi trang) Số trang

càng lớn, mức độ tính toán càng nhiều Do đó, trên thực tế, người dùng sẽ phải tìm cách giải quyết van dé này, dù tỉ lệ người dùng tìm đến các trang sâu như vậy là không nhiều.

3.2.4 Các khái niệm cơ bản trong Elasticsearch

[10] Cách khải niệm cơ bản trong Elasticsearch

Trang 36

3.2.4.1 Documents

Là đơn vị nhỏ nhất đề lưu trữ dir liệu trong Elasticsearch Day là một đơn vị lưu trữ

thông tin cơ bản trong Elasticsearch, là một JSON obJect đối với một số dữ liệu

3.2.4.2 Index

Trong Elasticsearch, “Indexing a document” giống như là “Insert/Update adocument” Elasticsearch có một cấu trúc tim kiếm gọi là inverted index, nó được

thiết kế dé cho phép tìm kiếm full- text search Cách thức khá đơn giản, các văn

bản được tách ra thành từng từ có nghĩa sau đó sẽ được map xem thuộc văn bản nào

và khi search sẽ ra kết quả cụ thê

Có 2 kiểu đánh Index và Forward Index và Inverted Index

e Inverted Index đánh theo keyword: words — > pages

e Forward Index đánh theo nội dung: pages — > words.

Chúng ta có thé thấy việc đánh theo keyword thì việc tìm kiếm sẽ nhanh hon việcchúng ta phải tìm kiếm theo từng page Elasticsearch sử dung Apache lucence dé

quản lý và tạo Inverted Index.

3.2.4.3 Shard

e Shard là một đối tượng của Lucence, là tập hợp con của một Index Một

Index có thể được lưu trên nhiều Shard

e Một Node bao gồm nhiều Shard, Shard chính là đối tượng nhỏ nhất hoạt

động ở mức thấp nhất, đóng vai trò lưu trữ dữ liệu

e Chúng ta sẽ không bao giờ làm việc với các Shard vì Elasticsearch sẽ hỗ trợ

chúng ta toàn bộ việc giao tiếp cũng như tự động thay đổi các Shard khi cầnthiết

e Elasticsearch cung cấp 2 cơ chế của Shard đó là primary Shard va Replica

Shard.

e Primary Shard sẽ lưu trữ dữ liệu và đánh Index, sau khi đánh dữ liệu xong sé

được vận chuyên đến các Replica Shard, mặc định của Elasticsearch mỗi

index sẽ có 5 Primary Shard thì sẽ đi kèm với một Replica Shard.

e Replica Shard là nơi lưu trữ dữ liệu nhân bản của Elasticsearch, đóng vai trò

đảm bảo tính toàn vẹn đữ liệu khi Primary Shard xảy ra vấn đề, ngoài ra nó

36

Trang 37

còn giúp tăng tốc độ tìm kiếm vì chúng ta có thé cau hình lượng Replica

Shard nhiêu hơn câu hình mặc định của Elasticsearch.

3.2.4.4 Node

e La trung tâm hoạt động cua Elasticsearch, là nơi lưu trữ dữ liệu, tham gia

thực hiện đánh index của Cluster cũng như thực hiện các thao tác tìm kiêm.

© Mỗi Node được xác định bằng một tên riêng và không được phép trùng lặp

3.2.4.5 Cluster

e Tập hợp các Node hoạt động cùng với nhau, chia sẻ với nhau cùng một thuộc

tính Cluster name Chính vì thế Cluster sẽ được xác định bằng một tên riêng

và không được phép trùng lặp Việc tên của các Cluster Elasticsearch mà

trùng nhau sẽ gây ra lỗi cho các Node vì vậy khi cấu hình cần phải chú ý

e© Mỗi Cluster có một Node chính gọi là master, Node master được lựa chọn

một cách tự động và có thê thay đổi nếu như có sự cô xảy ra Một Cluster cóthé bao gom nhiều Node Các Node có thé hoạt động trên cùng một Server

Tuy nhiên trên thực tế, một Cluster sẽ gồm nhiều Node hoạt động trên các

Server khác nhau để đảm bảo nếu một Server gap sự cố thì các Node trên các

Server khác có thể hoạt động đầy đủ chức năng Các Node có thể tìm thấynhau dé hoạt động trên cùng một Cluster thông qua giao thức Unicast

e_ Chức năng chính của Cluster là quyết định xem Shard nào được phân bồ cho

Node nào và khi nào thì di chuyển các Cluster dé cần bang lại Cluster

Hình 3.4 Hình ảnh mô tả Cluster, Node trong Elasticsearch.

3.2.5 Cai đặt Elasticsearch.

CLUSTER

3.2.5.1 Yêu cầu cài đặt

e Java 8 trở lên, kiểm tra bằng cách gõ java — version

e_ Thiết lập biến môi trường JAVA_HOME cho java Kiểm tra biến môi trường

JAVA_ HOME đã được thiết lập hay chưa bằng lệnh: echo $JAVA_HOME

37

Trang 38

3.2.5.2 Cài đặt trên Windows.

Download install file tại https://www.elastic.co/fr/downloads/past—

releases/Elasticsearch— 6— 4— 0.

Sau đó giải nén file Elasticsearch vừa tải xuống

Run file /bin/Elasticsearch.bat dé khởi tạo Elasticsearch thành một Service

Sau khi thành công, service được khởi tạo với port mặc định 9200.

w Volume (E:) > New folder (3) >» New folder (2) > 2020 > elasticsearch-6.4.0 > elasticsearch-6.4.0 > bin vy Dd.

Name ° Date modified Type Size

— x-pack 9/2/2020 10:50 AM File folder

[%] elasticsearch-keystore.bat 9/2/2020 10:50 AM Windows Batch File 1KB

Hình 3.5 File dùng dé kích hoạt Elasticsearch Service

Trang 39

Như vậy, Elasticsearch đã cài đặt thành công, sau đây là một số phần mềm hỗ trợ

Test và truy vấn Elasticsearch:

e Addon Chrome Elasticsearch Head.

e Plugin Elasticsearch Head cho Elasticsearch 2.x.

e CURL.

e Fiddler Web Debugger.

Elasticsearch _ "!9/ozno52o connoct | clasticsearch IREMEEBNBBIRREBEEBRHHHGEDDE

Overview | Indices | Browser Structured Query [+] _ Any Request [+]

* 9qr5RmH

{into =}

Tt

Hinh 3.7 Su dung Addon Chrome Elasticsearch Head.

3.2.5.3 Cai dat trên Linux.

Tương tự với cai đặt trên Windows, Elasticsearch yêu cầu sử dung Java 8 trở lên vàthiết lập biến môi trường JAVA_ HOME Sử dụng lệnh sau dé download và cài đặt

Elasticsearch PGP key: wget — qO — _https://artifacts.elastic.co/GPG— Elasticsearch | sudo apt— key add —.

KEY-Dé cài đặt Elasticsearch trên Ubuntu ta có 2 cách:

e Cài từ Repository

e Cài từ file deb

Cài đặt Elasticsearch bang APT Repository

e Cài gói apt— transport— https: sudo apt— get install apt- transport— https

e Lưu định nghĩa repository vào /etc/apt/sources.list.d/elastic— 6.x.list

(Repository mặc định ko có Elasticsearch): echo "deb https://artifacts.elastic.co/packages/6.x/apt stable main" | sudo tee — a

/etc/apt/sources list.d/elastic— 6.x list

e Cài đặt Elasticsearch bang lệnh: sudo apt- get update && sudo apt- get

install Elasticsearch.

39

Trang 40

Cài đặt Elasticsearch bằng gói deb

e weet https://artifacts.elastic.co/downloads/Elasticsearch/Elasticsearch—

6.4.0.deb.

e weet https://artifacts.elastic.co/downloads/Elasticsearch/Elasticsearch—

6.4.0.deb.sha5 12.

e shasum—a512~—c Elasticsearch— 6.4.0.deb.sha512

e sudo dpkg — i Elasticsearch— 6.4.0.deb.

Kich hoat Elasticsearch.

Tương tự Windows OS, Elasticsearch sau khi được cai dat sẽ không tự động chạy.

Đề khởi động Start, Stop Elasticsearch ta làm như sau:

e Kích hoạt serivce Elasticsearch và tự động start khi khởi động máy:

o sudo /bin/systemctl daemon- reload.

o sudo /bin/systemctl enable Elasticsearch.service.

e Dé start, stop, xem thông tin service Elasticsearch ta dùng các lệnh sau:

o sudo systemctl start Elasticsearch.

o sudo systemctl stop Elasticsearch.

o sudo systemctl status Elasticsearch.

3.2.6 Sir dụng API để thêm, xóa, sửa, tim kiếm dữ liệu trong Elasticsearch

Các thành phần được định nghĩa trong Elasticsearch được hiểu tương ứng với các

Relation Database như sau:

Relation Databases Elasticsearch

* Database (ep lndex

Ngày đăng: 02/10/2024, 03:45

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN