Mục đích của dé tài là xây dựng một Website cung cấp các chức năng về tra cứu thông tin văn bản pháp luật trong hệ thống văn bản pháp lý Việt Nam, mang tính ứng dụng và thiết thực cao..
Trang 1ĐẠI HỌC QUOC GIA TP HO CHÍ MINH
TRUONG DAI HOC CONG NGHE THONG TIN
KHOA CONG NGHE PHAN MEM
NGUYEN NGỌC DUNG PHAN MINH TOAN
KHOA LUAN TOT NGHIEP
XAY DUNG UNG DUNG TIM KIEM TAI LIEU PHAP LY
VIET NAM
Build an application for looking up information from the
Vietnamese legal document corpus
KY SU NGANH KY THUAT PHAN MEM
TP HO CHi MINH, 2021
Trang 2ĐẠI HỌC QUOC GIA TP HO CHÍ MINH
TRUONG DAI HOC CONG NGHE THONG TIN
KHOA CONG NGHE PHAN MEM
NGUYEN NGOC DUNG PHAN MINH TOAN
XAY DUNG UNG DUNG TIM KIEM TAI LIEU PHAP LY
VIET NAM
Build an application for looking up information from the
Vietnamese legal document corpus
KY SU NGANH KY THUAT PHAN MEM
GIANG VIEN HUONG DAN
TS TRAN SON HAI THS HUYNH NGUYEN KHAC HUY
TP HO CHÍ MINH, 2021
Trang 3DANH SÁCH HOI DONG BẢO VE KHÓA LUẬN
Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số
của Hiệu trưởng Trường Đại học Công nghệ Thông tin.
Trang 4LOI CAM ON
Sau quá trình học tập và rèn luyện tại khoa Công nghệ phan mềm trường Đại học
Công nghệ Thông tin - ĐHQG TP.HCM chúng em đã được trang bị các kiến thức
cơ bản, các kỹ năng thực tế dé có thể hoàn thành Khóa luận tốt nghiệp của mình.
Để hoàn thành khóa luận này, chúng em xin gửi lời cảm ơn chân thành đến: Ban
Giám hiệu trường Dai học Công nghệ Thông tin - ĐHQG TP.HCM vi đã tạo điều
kiện về cơ sở vật chất với hệ thống thư viện hiện đại, đa dạng các loại sách, tài liệu thuận lợi cho việc tìm kiếm, nghiên cứu thông tin.
Chúng em xin gửi lời cảm ơn chân thành đến thầy THS Huỳnh Nguyễn Khắc Huy
và thầy TS Trần Sơn Hải đã tận tình giúp đỡ, định hướng cách tư duy và cách làm việc khoa học Đó là những góp ý hết sức quý báu không chi trong quá trình thực hiện luận văn này mà còn là hành trang tiếp bước cho chúng em trong quá trình học tập và lập nghiệp sau này.
Va cuối cùng, chúng em xin gửi lời cảm ơn đến gia đình, tất cả thầy cô trong khoa,
bạn bè, tập thể lớp PMCL2016 là những người luôn sẵn sàng sẻ chia và giúp đỡ trong học tập và cuộc sống Mong rằng, chúng ta sẽ mãi mãi gắn bó với nhau.
Trong quá trình làm khóa luận này chúng em không tránh khỏi được những sai sót,
chúng em kính mong nhận được sự chỉ dẫn và góp ý của quý thầy cô để khóa luận
được hoàn thiện hơn.
Chúng em xin chân thành cảm ơn Xin chúc những điều tốt đẹp nhất sẽ luôn đồng
Trang 5Chương 2 TONG QUAN -2¿-222222222222+22221112222112222112 2221 6
2.1 Thư viện pháp luật https://thuvienphapluat.vn/
2.1.1 — Tìm hiểu Website 22222 ccccEEErrtrrrrrrrrrrrrrereerrrer 6
2.1.2 Ưu điểm nói lại trả về top cao hơn
2.1.3 Nhược điểm -c22222vccSEEvErrrtrrttrrrrrrtrrrrrrrrvee 9
2.2 Van bản pháp luật http://vbpl.vn/
2.2.1 Tìm hiểu Website Ăăcccccerrrririrrrrrrrirrrri 20
222 UufDÊm NA GV ae ee 23 2.2.3 Nhược điểm 2222cccECCEEEtEEEEErrrrrrrrrrrrve 23
2.3 Van bản pháp luật https://vanbanphapluat.CO/ -=+s=5s+=++ 24
2.3.1 Tìm hiểu Website vector 24 2.3.2 Ưuđiểm vvvnnhhnnhhnhhrriiiiiirreee 28
2.3.3 Nhược điểm -sccSrririrrrrrrirrirrrrrrrriirrrrri 28 2.4 Bảng tổng hợp so sánh các Website hỗ trợ tìm kiếm tài liệu pháp lý 29 Chương 3 TÌM HIEU CÔNG NGHỆ SỬ DỤNG -:cc5scc2 31 3.1 Tìm hiểu công cụ tìm kiếm tìm kiếm - : ¿522s+c++ccvszcesrx 31 3.1.1 KIA MGM ae ceccccccessssssscccccccecssssssssssunnununnsssesssececceeceecesssssnnssnunnente 31 3.1.2 Nguyên lý hoạt d6ng oo cseeeeeseseeeeneseseseeeenesesesesneeeseseseanes 31
Trang 63.1.2.1 Bộ thu thập thông tin — Web crawling ‹- - eee 32
3.2.4.3 ShaHHể c.y 2 NẾP vưưm , ⁄ ào 36
3.2.4.4 NOde HH Ho oD
3.2.4.5 CUSter Heo oD
3.2.5 Cài đặt ElastiCsearCh 5c cSc St St SESesrErerrsrrrerrrrerrsee 37
3.2.5.1 Yêu cầu cài đặt Hee 37
3.2.5.2 Cài đặt trên WindOwWs ngư 38
3.2.5.3 Cài đặt trên Linux «St 39
3.2.6 Sử dung API để thêm, xóa, sửa, tìm kiếm dữ liệu trong Elasticsearch
40 3.2.6.1 Index ch 41
3.2.6.2 DOCUMENL cccccccceseeeseeseseseeeeeesescseseeseesseseseeseseseseseeeeasseeeeeeneaeee 44
3.2.7 Bulk API che AT
Trang 73.3 Thu thập dữ liệu bằng crawler -.-. -:222v+++etEvvvrrerrrrvrrerrrrrrrrrg 49
3.3.1 Thư viện Axios và Cheerio
kh nG ` " 49 3.3.1.2 Cheerio.
3.3.2 Bóc tách dữ liệu trên trang vanbanphapluat.co -‹-«- 49
3.4.2 Phan trang HH HH HH HH trên 58
3.4.3 Hiền thị kết qua tìm Ki6M oes ceccesccsscssssessssssesesesseessssssecesssseessesseeeeeessees 59 3.5 Xử lý câu truy vấn -©2222222c+tEEEEEEEvrrrrrrttrrkkkrrrrrrrrrrrrrrrreerrro 60 3.5.1 Search — Tìm kiếm từ khóa -2 ¿22+z++2vzxvze+rvzsereerr 60
3.5.2 Suggestion — Gợi ý tìm kiếm - ¿¿222cc+cccvvrrerrrvrrrrrrrrree 60 3.5.3 Filter— Lọc kết quả tìm kiếm - -¿ 2c+++22vvc+vcvvvrrrrrsscee 61 3.5.4 Advanced Search — Tìm kiếm nâng Ca0 sssssssssscsssssseesssccesssneeeeeeee 61 Chuong4 TRÌNH BAY, DANH GIA BAN LUẬN VE CAC KET QUẢ 62
4.1 Giao diện WebSite occ ccececceseeseseeseseeseeseseeeeseeseseeseeecsessesecseeesseeseseeaeeeees! 62
4.2 Hiệu suất của việc thu thập dữ liệu bằng Crawler s2 65
4.3 Đánh giá kết quả của việc thu thập dữ liệu bằng Crawler 66 4.4 Đánh giá kết quả kết quả câu truy vấn - -cc22cvvceccvvrrrrrrrer 71 Chương 5 KÉT LUẬN, HƯỚNG PHAT TRIEN cccsssssssssssesssssssescsssseesssssees 83
Trang 8lẽ ` 83
Trang 9DANH MỤC HÌNH
Hình 1.1 Biểu đồ thể hiện tỷ lệ phạm tội theo độ tuổi ở Việt Nam 14
Hình 2.1 Giao diện Website thuvienphapluặVIn -¿-¿ 55c +5+scccsceceeeex 17 Hình 2.2 Website yêu cầu người dùng sử dụng tài khoản thành viên 17 Hình 2.3 Hướng dẫn tìm kiếm tài liệu văn bản pháp luật . : 18 Hình 2.4 Kết quả tìm kiếm trên thuvienphapluat.vn với từ khóa “uống rượu” 18 Hình 2.5 Hiển thị nội dung văn bản trên Websitẹ - - ¿5-5 +ccsccsrekecer 18
Hình 2.6 Website yêu cầu người dùng trả phí để sử dụng . -cc+ 19
Hình 2.7 Giao diện Website VDpÏ.VỊ th it 20 Hình 2.8 Kết quả tìm kiếm đơn giản trên vbpl.vn với từ khóa “uống rượu” 21 Hình 2.9 Kết quả tìm kiếm nâng cao trên vbpl.vn với từ khóa “uống rượu” 21 Hình 2.10 Nội dung văn bản hiền thị trên Websitẹ -7222cccccccccccrveee 22 Hình 2.11 Kết quả tìm kiếm trên vbpl.vn với từ khóa “đèn đỏ” - - 22
Hình 2.12 Giao diện Website vanbanphapluat.CỌ -.- - - 2 + +5++cc+secez+zxsxs> 24
Hình 2.13 Hướng dẫn tìm kiếm với “từ khóa” . -:-ccccvvvvvveererrrrrrrrrrrrree 25
Hình 2.14 Hướng dẫn lọc kết quả tìm kiếm -2+z222222vvvzzretrrrrrvree 25 Hình 2.15 Kết qua tìm kiếm trên vanbanphapluat.co với từ khóa “uống rượu” 26 Hình 2.16 Hiển thị nội dung van bản trên file PDẸ 5 +55+++c+<++<ccxe 26
Hình 2.17 Kết qua tìm kiếm trên vanbanphapluat.co với từ khóa “vượt đèn d6” 27
Hình 2.18 Hiển thị nội dung văn bản trên Websitẹ 222cccccccerrrrrrrree 27 Hình 2.19 Kết quả tìm kiếm chính xác trên vanbanphapluat.co với từ khóa “vượt
lo ốố ố ố ố ố 28 Hình 3.1 Nguyên lý hoạt động của Elasticsearch -+c cec. .- Í
Hình 3.2 Cách thức hoạt động của Elasticsearch - -¿- ¿+ + + s++x+x+*ccrexsee 34 Hình 3.3 Các thành phần trong Elasticsearch -: ¿©25cz+22szcezz 35
Hình 3.4 Hình anh mô tả Cluster, Node trong Elasticsearch -.- 37
Hình 3.5 File ding dé kích hoạt Elasticsearch Servicẹ - -c2ccccccc+2 38
Hình 3.6 Service của Elasticsearch với port mặc định 9200 . : 38 Hình 3.7 Sử dụng Ađon Chrome Elasticsearch Head 39
Trang 10Hình 3.8 Demo Run Elasticsearch trên Linux OS .- - - - 2 5555++c+c+s<++ 40
Hình 3.9 Các mối quan hệ tương ứng trong Database và Elasticsearch 40
Hình 3.10 Index được tạo thành công Hình 3.11 Index tạo không thành công, Index đã tôn tại .-. -+-+-+ 4I Hình 3.12 Các thành phần bên trong Index -¿2+2z++22+zzz+zzxseez 42 Hình 3.13 Số Replica, Shard mặc định khi tạo Index -: ¿:+c5sc+2 43 Hình 3.14 Xóa Index không thành công, Index không tổn tại -. 44
Hình 3.15 Xóa Index thành công . ¿-¿- 5+5 S22E‡E‡E2EEkkEerrrrkrkerrree 44 Hình 3.16 Các hàm được sử dụng để thu thập dữ liệu -c-c-<++ 50 Hình 3.17 Element trên http://vanbanphapluat.CO -. ‹-‹-5 c555+5+5x+5< 51 Hình 3.18 Sử dụng Bulk Client Helper để đánh chỉ mục - 54
Hình 3.19 Các thuộc tinh input được sử dụng trên web -. - 5+5 - 55 Hình 3.20 Giao diện tìm kiếm nâng cao „56
Hình 3.21 Lọc kết quả tìm kiếm theo một số tiêu chí „61 Hình 4.1 Trang chủ của Website Legal Document Corpus 62
Hình 4.2 Suggestion khi tìm kiếm với từ khóa “quyết đỉnh 38/” Hình 4.3 Hiền thị phân trang trên Website 63
Hình 4.4 Kết quả tìm kiếm văn ban với từ khóa “quyết định” - 63
Hình 4.5 Nội dung chỉ tiết văn bản 22:2¿£22222S2c++etEEEEEEYvrrrerrrrrrrrrrrcee 64 Hình 4.6 Kết quả tìm kiếm với từ khóa “luật về ovid” - -: c-ccccccsscee 64 Hình 4.7 Biểu đồ hiển thị thời gian Crawl trung bình . - -ccccc-e 65 Hình 4.8 Kết quả File thứ nhất với một số trường cơ bản .-: -: 66
Hình 4.9 Nghị quyết 04/NQ-CP trên trang vanbanphapluat.co - 66
Hình 4.10 Kết quả File thứ hai với một số trường cơ bản . -¿ 67
Hình 4.11 Quyết định 1921/QD-TLD trên trang vanbanphapluat.co - 67
Hình 4.12 Kết qua File thứ ba với một số trường cơ bản - 68
Hình 4.13 Thông báo 06/TB-VPCP trên trang vanbanphapluat.co 68
Hình 4.14 Kết quả File thứ tư với một số trường cơ bản -cccc++ 69 Hình 4.15 Quyết định 141/QD-BYT trên trang vanbanphapluat.co - 69
Trang 11Hình 4.16 Kết quả File thứ năm với một số trường cơ bản - 70
Hình 4.17 Quyết định 39/QĐ-TTg trên trang vanbanphapluat.co 70
Hình 4.18 Biểu đồ độ bao phủ tại top k điều luật trả về trên 100 câu hỏi 72 Hình 4.19 Kết quả câu hỏi đầu tiên -¿-©222+++2222+++ttEESvrretrrrvrrerrrrrrrrrr 73
Hình 4.20 Kết quả câu hỏi thứ hai -222-2222£222E22+2EEESEttEEEEEzrrtrrkerrrrrkrcee 74 Hình 4.21 Kết quả câu hỏi thứ ba .:c::¿cc+cc222EEEEEEEtkrttrttirrirrrrrrrrrrree 75
Hình 4.22 Kết quả câu hỏi thứ tư - -.2¿:¿-22222222v+22222221222.22222.111 rrrrrrree 76 Hình 4.23 Kết quả câu hỏi thứ năm -: 2+222+++t22vv+rettvrvrrerrrrrrrrrr 71
Hình 4.24 Kết quả câu hỏi thứ sáu 222222+2222222v2+rrrttrvvrvvvrrrrrrrrrrrree 78
Hình 4.25 Kết quả câu hỏi thứ bảy -2222222¿2222222vvvvrrtrtrrrkrrrrrrrrrrrrrree 79 Hình 4.26 Kết quả câu hỏi thứ tám ¿ +©22+++222S+++ttEvvvrrrrrrxrrrrrrrrree 80
Hình 4.27 Kết quả câu hỏi thứ chín . -2222+22222222S22++tEEE2SSvrrrrrrrrrrrser 81
Hình 4.28 Kết qua câu hoi thứ mười „82
DANH MỤC BÁNG
29
30
Bang 2.1 Bảng đánh giá Website.
Bảng 2.2 Bảng đánh giá chỉ tiết Website
Bang 4.1 Bảng kết quả thời gian Crawl đữ liệu trung bình từ vanbanphapluat.co 65
Bang 4.2 Bảng kết quả của việc đánh giá độ chính xác dựa trên 100 câu hỏi 71
Trang 12DANH MỤC TU VIET TAT
Từ viết tat | Từ đầy đủ Giải thích
CSDL Cơ sở dữ liệu Cơ sở dữ liệu cho ứng dụng.
CSS Cascading Style Sheets Các tập định dạng theo tầng.
DOM Document Object Model Mô hình các đối tượng trong tài
liệu.
ELK Elasticsearch, LogStash, Kibana Tập hợp 3 phần mềm phục vụ
công việc logging.
HTTP HyperText Transfer Protocol Giao thức truyền siêu văn bản JSON JavaScript Object Noattion Định dạng trao đồi dữ liệu.
JS JavaScript Ngôn ngữ lập trình JavaScript.
Trang 13TOM TAT KHÓA LUẬN Tom tắt nội dung khóa luận tốt nghiệp:
Luận văn tốt nghiệp đề tài “Xây dựng ứng dụng tìm kiếm tài liệu pháp lý Việt Nam
- Build a tool to look up information from the legal document corpus” được thực
hiện từ ngày 10/9/2020 đến ngày 31/1/2021 Mục đích của dé tài là xây dựng một Website cung cấp các chức năng về tra cứu thông tin văn bản pháp luật trong hệ
thống văn bản pháp lý Việt Nam, mang tính ứng dụng và thiết thực cao Thông qua
việc nghiên cứu và áp dụng các công nghệ liên quan cho việc thu thập, xử lý và tô chức lưu trữ dữ liệu, chúng em đã xây dựng một hệ thống đáp ứng những yêu cầu
dé ra Mặc đù kết quả còn một số thiếu sót nhưng đây là cơ sở quan trọng nhằm phát triển sau này.
Báo cáo luận văn tốt nghiệp gồm:
Chương 1: GIỚI THIỆU CHUNG: Trình bày lý do chọn dé tài, mục đích, đối tượng
nghiên cứu và sử dụng, phạn vi thực hiện.
Chương 2: TONG QUAN: Tìm hiểu và so sánh các Website hiện có hỗ trợ tìm kiếm
văn bản pháp lý Việt Nam.
Chương 3: TÌM HIỂU CÔNG NGHE SỬ DỤNG: Trình bày các công nghệ được sử
dụng trong quá trình xây dựng đề tài.
Chương 4: TRÌNH BAY, DANH GIA BAN LUẬN VE CÁC KET QUA: Trình bày đánh giá các kết quả sau khi đề tài kết thúc.
Chương 5: KÉT LUẬN: Trình bày ưu, nhược điểm của sản phẩm.
Chương 6: HƯỚNG PHÁT TRIEN: Trinh bày hướng phát triển sản phẩm.
Chương 7: TÀI LIỆU THAM KHẢO: Đường dẫn đến các tài liệu mà nhóm đã tìm hiểu, nghiên cứu.
Trang 14Chương 1 GIỚI THIỆU CHUNG
1.1 Lý do chọn đề tài
Theo Tòa án nhân dân tối cao thì tình trạng phạm tội ở Việt Nam ngày càng tăng cao và đặc biệt hơn là độ tuổi phạm tội ngày càng trẻ hóa Trung bình mỗi năm có
10.000 vụ phạm pháp hình sự do người vị thành niên thực hiện Người phạm tội từ
18 — 30 tuổi chiếm khoảng 70%, dưới 18 tuổi chiếm 8%, tỷ lệ này cũng đang có
chiều hướng gia tăng.
m Dưới 18 tudi mTừ18-30tuổi = Trên 30 tuổi
Hình 1.1 Biểu đồ thể hiện tỷ lệ phạm tội theo độ tuổi ở Việt Nam.
Theo như sự tìm hiểu của nhóm, việc phạm tội ở độ tuổi vị thành niên là do nhiều nguyên do như thiếu sự quan tâm từ gia đình, có hoàn cảnh đặc biệt và đặc biệt hơn
là do thiếu hiểu biết về pháp luật Pháp luật chưa được giảng dạy thông qua các môn học dành cho các bạn học sinh vì một số lý do nào đó, nên dẫn tới việc các bạn học
sinh chưa hiểu rõ được mức độ nghiêm trọng cũng như tính cần thiết của pháp luật.
Trong đời sống xã hội ngày nay, pháp luật có vai trò đặc biết quan trọng Pháp luật
là phương tiện không thể thiếu, bảo đảm cho sự tồn tại, vận hành bình thường của
xã hội nói chung và của nền đạo đức nói riêng Pháp luật không chỉ là một công cụ quản lý nhà nước hữu hiệu, mà còn tạo môi trường thuận lợi cho sự phát triển của ý
14
Trang 15thức đạo đức, làm lành mạnh hoá đời sống xã hội và góp phần bồi đắp nên những
1.2 Mục dich
Website tìm kiếm tài liệu pháp lý Việt Nam được xây dựng dựa trên ba mục đích
chính sau:
e Thứ nhất là rút trích, thu thập các tài liệu, các văn bản pháp luật trong hệ
thống văn bản pháp lý Việt Nam thuộc các lĩnh vực sau: Bộ máy hành chính, Tài Nguyên — Môi trường, Vi phạm hành chính, Quyền dân sự, Trách nhiệm
hình sự, Giáo dục, Giao thông vận tai, từ http://vanbanphapluat.co có van
bản pháp lý uy tín vào hệ cơ sở dữ liệu.
© Thứ hai là xây dựng Website hỗ trợ tìm kiếm văn ban bằng cách sử dụng
Elasticsearch engine Website xử lý tìm kiếm với tốc độ nhanh.
1.3 Đối tượng
¢ _ Ngôn ngữ lập trình JavaScript, nền tảng NodeJS.
© Tt cả “văn bản pháp luật” từ hệ thống văn bản pháp lý Việt Nam từ các
Website có sẵn (Crawler), chủ yêu từ Website http://vanbanphapluat.co.
© Tao chỉ mục văn bản pháp lý và tìm kiếm bằng Elasticsearch.
1.4 Phạm vi thực hiện
e Phạm vi nội dung: Lập trình Website (sử dụng ngôn ngữ lập trình JavaScript,
trên nền tảng NodeJS) Sử dụng Elasticsearch tạo nên một Server giúp lưu
trữ dữ liệu cũng như xử lý câu truy van.
¢ Phạm vi không gian: Các văn bản pháp luật trong hệ thống văn bản pháp lý
Việt Nam thuộc các lĩnh vực sau: Bộ máy hành chính , Tài Nguyên — Môi
trường, Vi phạm hành chính, Quyền dân sự, Trách nhiệm hình sự, Giáo dục,
Giao thông vận tải,
© Pham vi thời gian: Từ ngày 10/9/2020 đến ngày 31/1/2021.
15
Trang 16Chuong 2 TONG QUAN
Phân tích một số Website hiện có hỗ trợ tim kiếm tài liệu pháp lý Việt Nam
2.1 Thư viện pháp luật https://thuvienphapluat.vn/
Website là sử dụng công nghệ cao để tô chức lại hệ thống văn bản pháp luật và kết
nối cộng đồng dân luật Việt Nam.
Với phiên bản đầu tiên từ 2005, đến nay là phiên bản thứ 5, đang được hơn 50.000
doanh nhân, viên chức, luật sư, chuyên viên pháp lý, sử dụng và cập nhật văn bản
luật Website hoạt động từ tháng 1/2008, hiện có hơn 2.000.000 thành viên đăng kí
sử dụng thường xuyên Mỗi ngày tiếp nhận hơn 600 lượt hỗ trợ, tư vấn sơ bộ vềpháp luật qua điện thoại, email, skype và các kênh hỗ trợ trực tiếp khác Việc hỗ trợ
này sẽ giúp cho công chúng và doanh nghiệp nhanh chóng có giải pháp xử lý cho
các van đề pháp lý đang gặp phải
16
Trang 17ức Pháp Luật Cộng đồng DanLuat = Liên ne
0838 22 99 66 Quên mật khdu? Đăng ky mới
B® Thông Báo Van Ban Mới B® Thời Sự Pháp Luật EP Luật Sư Tư Vấn
‘Thanh viên cơ quan VN ở nước T1 Hướng dẫn quyết toàn khoản chỉ hỗ trợ đoàn Thủ tục xóa
ngoài được hỗ trợ phí khám Covid- viên, NLĐ bị ảnh án tích?
19 NLD có thé từ chối làm thêm giờ trong
Âqggg„„ Vua qua, Chính phủ a ban hành J teong hep ae Ora z
Nghị quyết 98/NQ.CP vẻ hỗ trợ kinh Hướng dẫn về chứng tir chứng nhận xuất xứ ð Diện ch xây dựng trái với quy
phí khám và điều trị COVID-19 đổi tăng hóa trong Higp hoạch cô được bồi thưởng khi + 32 nhỏm công việc cô yêu câu nghiêm ngạt về Tử thi tr hành vi quay rồi tinh dục tại thu hội đất?
Hình 2.1 Giao diện Website thuvienphapluat.vn
Ban thư ký luật có trách nhiệm kiểm tra nội dung các văn bản mới được ban hành,
nắm bắt ngay vấn đề pháp lý mới và tóm lược những thông tin này thành Thông báo
ngắn gọn, súc tích, theo từng lĩnh vực, ngành nghề dé gửi đến khách hàng, giúpkhách hàng biết được ngay những thay đổi của pháp luật phục vụ cho công việc.Hiện có hơn 1.500.000 khách hàng có nhu cầu này
Người dùng muốn tìm kiếm cần nhập thông tin vào ô Tìm Văn bản Pháp luật sau đóEnter hoặc chọn nút Tìm kiếm Các chức năng Tra cứu nhanh cần phải đăng kíthành viên mới được sử dụng Người dùng cũng có thể tìm kiếm theo tiêu đề hoặc
số hiệu văn bản, kết quả phải chính xác cụm từ trên Ngoài ra còn có thời gian ban
hành, loại văn bản, cơ quan ban hành, người ký, sắp xếp theo,
Văn bản Pháp Luật Tiêu Chuẩn Việt Nam _ Tra cứu bản án Dự thảo Công văn
Hình 2.2 Website yêu cầu người dùng sử dụng tài khoản thành viên
17
Trang 18# Trang chủ
(> Tra cứu ¡ VĂN BẢN PHAP LUẬT
Tử kno’ $6 Hiệu, Tiêu đề hoặc Nội dung ngân gon của Văn Bản (Lưu kw tm kiếm)
Ÿ Các gói dịch vụ Ml Tin tức Pháp Luật @ Lien hệ 19 đồng DanLust
đà Sơ dd WebSite @Gicithieu #ÊHướngdấnsửdụng Rss WHomepage Widget
%
Ban đang tìm kiếm : VAN BAN PHÁP LUAT
uống rượu Tim kiém _ Hệ thống tìm kiếm được các Văn Bản liên quan sau :
Tim trong: ® Tát cả © Tiếu đẻ văn bản “` Số hiệu văn bản ~ 296 CÔNG VĂN (Xem & Tra cứu Công văn)
ng BiuMimD T5j én 20872020 H3 TT + 171 TEU CHUAN VIỆT NAM (Xem & Tra cứu)
Kết quả phải: '® Có tắt cả các từ trên Chinh xác cụm tử trên mm cản Văn bản hey TCVN nào, Bim
Ngôn ngữ (?): Tiếng Việt x
Tinh trang: Tất cả M
Loại Văn bản: Tắt cả he
Co quan Ban hanh: [Tất ca vị
Người kỷ Tất cả v
Sắp xếp theo: Van bản chinh xác sẽ nằm trên „"
tớ gap khó khán trong việc tìm kiếm, vui lòng bam vào đây dé được hỗ trợ trực tiếp từ THƯ VIỆN PHÁP.
Kết quả 1-20 trong 4819 văn ban
® Tài khoản :
Loc KET QUÁ 4 Chỉ thị 17/CT-UBND nam 2018 về thực hiện nghiêm quy định Ban hành: 26/11/2018 nguyendung104
Linh vực ina lái xe khi TH Sseevie am Tinton Os 2 cet hdaise , Cập nhật: 18/03/2019 +_ Chuyển loại thành viên
‘BO máy hành chính (1506) Thương mại (1002) CHÍ THỊ VE VIỆC THỰC HIỆN NGHIÊM QUY ĐỊNH KHÔNG ƯỐNG.
| Văn bản gốc | Lược đồ | Liên quan hiệu lực | Tải vẻ
Hình 2.3 Hướng dẫn tìm kiếm tài liệu văn bản pháp luật
Loc KET QUÁ
Van hóa - Xã hội (879)
-Giao thông - Vận tài (41)
Tài chính nhà nước (396)
Thué - Phí - Lệ Phí (278)
“Xuất nhập khẩu (250) Doanh nghiệp (238) Tai nguyên - Mỗi trưởng (153) Bảo hiểm (144)
Giáo dục (140)
'Công nghệ thông tin (134) Lao động - Tiên lương (129) Lĩnh vực khác (125)
'Quyền dân su (27)
Sở hữu trí tuệ (25)
Kế toán - Kiếm toán (21)
‘Dich vụ pháp lý (10)
Tiên tê - Ngân hàng (11
Kết quả 1-20 trong 4819 văn ban
® Tài khoản :
4 Chỉ thị 17/CT-UBND nam 2018 về thực hiện nghiém quy định Ban hành: 26/11/2018 nguyendung104
không tiống rượu, bia, đồ uống có cồn trong giờ làm việc và Hou hrc: Đã biết + Thong tin cả nhân
Tình trạng: Dã biết
không lái xe khi đã Wốfg fƯỢu, bia do tinh Ninh Thuận ban hành
Cập nhật 18/03/2019.
¡lực | Tải vẻ
wih | Văn bản gốc | Lược đồ { !
+ Chuyển loại thành viên
+ Van bản của tôi (0)
'CHÍ THỊ VỀ VIỆC THỰC HIỆN NGHIÊM QUY ĐỊNH KHÔNG UỐNG + Đổi mật khẩu ee
RƯỢU BIA, ĐÔ UỐNG CÓ CÔN TRONG GIỜ LAM VIỆC VA KHONG LAI + Thoát s
XE KHI ĐÃ UỐNG RƯỢU, BIA Trong thời gian qua, đa sé can bộ, công.
'chức, viên chức, người lao động trong các cơ quan, đơn vị và cán bộ,
'chiến sĩ lực lượng vũ trang trên địa bản tinh đã chấp hành tốt quy định của TRA CỨU NHANH.
nhà nước về không.
Ban hành: 25/10/2018
Hiệu lực: Đã biết
Tình trạng: Đã biết Cập nhật: 29/11/2018
2 Chỉ thị 06/CT-UBND năm 2018 thực hiện nghiêm quy định không
tiống rượu, bia trong giờ làm việc và không điều khiển phương
tiện cơ giới tham gia giao thông khi đã tống rượu, bia vượt quá
nồng độ cho phép do tỉnh Tuyên Quang ban hành.
ông Anh | Van bản gốc | Lược dd | ! uiuo 4 Tải về HỖ TRỢ NHANH
CHÍ THỊ VỀ VIỆC THU HIEN NGHIÊM QUY ĐỊNH KHÔNG UỐNG.
RƯỢU, BIA TRONG GIỜ LÀN! VIỆC VÀ KHÔNG DIEU KHIÊN PHƯƠNG @ Dịch Vụ
TIEN CƠ GIỚI THAM GIA GIAO THONG KHI ĐÃ UỐNG RƯỢU, BIA Š Hỗ trợ trực tuyến
'VƯỢT QUÁ NÔNG ĐỘ CHO PHÉP Trong thỏi gian qua, thực hiện Chỉ thị Bien thoai - (028)39303279
số 26/CT-TTg ngày 05/9/2016 của Thủ tướng Chính phủ vẻ tang cường kỷ Hoang 88672886
luôt, kỳ cương trong các cơ quan hành x
MỜI GÓP ¥
Ban hành: 12/10/2018
Hiệu lực: Đã biết Tinh trang: Đã biết Cập nhật 22/11/2018
3 Chỉ thị 04/CT-UBND nam 2018 về cán bộ, chiến sĩ, công chức, viên chức nêu gương thực hiện nghiêm quy định của pháp luật
về không uống rượu, bia trong giờ làm việc và không uống.
Tượu, bla khi lái xe do tinh Ca Mau ban hành
tông Anh | Văn bản gốc | Lược đồ |
tôi hỗ trợ bại
Hình 2.4 Kết quả tìm kiếm trên thuvienphapluat.vn với từ khóa “uống rượu”
Truce tin EE Van bản gắc/PDF | Luge dd) Liên quan hiệu luc) Liên quan nội dung) Tải về
ban Pháp Luật
© Được hỗ trợ pháp lý sơ bộ.
© Tra cứu hơn 11.000 Tiêu
© Tra cứu Văn bản Tiếng Anh và xem ở chế độ song ngữ
@ và nhiều Tiện ich quan
trọng khác.
UY BAN NHÂN DAN CONG HOA XA HOI CHU NGHIA VIETNAM 4
TINH NINH THUAN Độc lập - Tự do - Hạnh phúc in nổi bật nhất
g ®
Số: 17/CT-UBND Ninh Thuận, ngày 26 thang 11 nắm 2018
Lưuwữ Ghichủ2 Ýkiến
CHỈ THỊ i 8 (8
'VÊ VIỆC THỰC HIEN NGHIÊM QUY ĐỊNH KHONG UỐNG RƯỢU, BIA, ĐÔ UỐNG CÔ CON Facebook Emaa in
KHI ĐÃ UỐNG RƯỢU, BIA
TRONG GIO LAM VIỆC VÀ KHÔNG LAI
Trong thời gian qua, da số cản bô, công chức, viên.
va cân bộ, chiên sĩ lực lượng vũ trang trên địa ban
không udng rượu, bla đồ uống cô côn trong giờ |
‘quy định của nhà nước vẻ
phạm.
Để khắc phục tinh trạng trên, giữ nghiêm kj luật, kỷ cương hành chinh, nang cao tinh thản trách.
nhiệm va hiệu quả công việc tại các cơ quan, đơn vị trên địa ban tỉnh; đồng thoi, thực hiện két luận
của Pho Thủ tướng Chính phủ Trương Hòa Binh - Chủ tịch Uy ban An toàn giao thong Quốc gia tại
Hội nghị sơ kết công tac bảo đảm trật tự an toàn giao thông 06 thang đầu năm, nhiệm vụ trong tâm
6 thang cuối nam 2018 (tại Thông bảo số 242/TB-VPCP ngây 12/7/2018 của Văn phòng Chính
phủ), Chủ tịch Ủy ban nhân dân tinh yếu cẩu:
1, Thủ trưởng các Sở, ban, ngành, tổ chức hội oan thé, cơ quan, đơn vị đông trên địa ban tinh và
Chủ tịch Ủy ban nhân dân các huyện, thành phé tổ chức quân triệt nội dung Chỉ thị đến toan thé
‘can bộ, công chức, viên chức, người lao động trong cơ quan, đơn vị va can bộ, chiến sĩ lực lượng
Hình 2.5 Hién thị nội dung văn bản trên Website
18
Trang 19Kết quả tìm kiếm văn bản được hiển thị và highlight những từ ngữ liên quan Người
dùng chọn tiêu dé của văn bản dé xem chỉ tiết nội dung văn bản Văn bản sẽ hiển thi
trực tiếp trên Website
Chào bạn nguyendung10404@gmail.com
1 Thông tin về bạn
Bạn đang là thành viên FREE
-Tiện ích tra cứu của Bạn được sử dụng đến ngày 31/12/2021
*
Họ và tên: [Dung Nguyén Ngoc
E-mail: Inguyendung10404@gmail.con!|
2 Dang ky chuyền đổi thành viên:
Bạn đăng ký chuyển đổi thành Thành Viên có nhiều tiện ích cao hơn Mời bạn c Thành viên mới, bên dưới.
Thành viên TVPL Pro
© TVPL Pro V: (05 người sử dụng củng lúc) 109.600 đ/người/tháng
© TVPL Pro Il: (02 người sử dụng cùng lúc) 134.000đ/người/tháng
© TVPL Pro I: (01 người sử dụng cùng lúc) 169.000đ/người/tháng
Bam vào đây dé xem thêm thông tin về các loại Thành viên
Thời gian sử dụng:| 1 năm v
Tổng sé tiền: 1.164.000 d
Hình 2.6 Website yêu cầu người dùng trả phí để sử dụng
2.1.2 Ưu điểm nói lại trả về top cao hơn
e Số lượng văn bản pháp luật lớn (225628 văn bản pháp luật) Các văn bản
luôn được cập nhật.
e Có đội ngũ tư van pháp luật chuyên môn
e Gửi email thống báo cho thành viên những thông tin pháp luật nổi bật hàng
tuân.
2.1.3 Nhược điểm
e Giao diện có quá nhiều thông tin cũng như các quảng cáo của trang web có
thé khiến người dùng bị rối
e Yêu cầu người dùng đăng kí tài khoản nếu muốn tra cứu nâng cao
© Mất phí dé sử dung các tiện ích cao hơn
19
Trang 202.2 Văn bản pháp luật http://vbpl.vn/
2.2.1 Tim hiểu Website
[2] Hệ thống chứa toàn bộ các văn bản quy phạm pháp luật, văn bản hợp nhất trêntoàn quốc, bao gồm các văn bản do cơ quan nhà nước ban hành hoặc phối hợp banhành Ngoài ra, CSDL văn bản còn chứa các văn bản điều hành được ban hành và
quản lý bởi Hội đồng nhân dân (HĐND), Ủy ban nhân dân (UBND) cấp tỉnh, thành
phô trên toàn quôc.
Người dùng có thể dễ dàng tìm kiếm, xem thông tin của các văn bản có trong CSDLnhư: Văn bản pháp luật, Văn bản hợp nhất, Văn bản điều hành, Điều ước quốc tế
Các tính năng hỗ trợ: Chương trình hỗ trợ cho người dùng dễ dàng Tìm kiếm, Khaithác thông tin cũng như tham gia đóng góp ý kiến cho các văn bản thông qua các
chức năng được hỗ trợ trên chương trình.
Ngoài ra, khi truy cập vào chương trình, người dùng còn dễ dàng theo dõi, tìm
kiếm được các Tin tức, Các Tình huống pháp luật có liên quan đến các văn bản quyphạm pháp luật đã, đang và sắp được ban hành
) eơeofruiệu aude cu Về vi claret wr
TRANGCHỦ TÌMKIẾM TINTỨC TỈNHHUÔNGPHÁPLUẬT ENGLISH Tìm kiếm văn bản
Từ khóa tìm kiêm
| @ TAtea từ trên © Chính xác cụm từ trên
| Tìm trong © Tắt cả © Số hiệu @ Số hiệu & trích yếu
Văn bản pháp luật Trung ương Van ban pháp luật địa phương quy phạm pháp luật do Chính phủ, Thủ tướng Chính phủ ban hat
CONG THONG TIN ĐIỆN TỬ BỘ PHAP DIEN CƠ SỞ DU LIỆU QUỐC GIA VE
BỘ TƯ PHAP ĐIỆN TỬ THỦ TỤC HÀNH CHÍNH
Văn bản mới Tin tức Tình huống pháp luật
Hình 2.7 Giao diện Website vbpl.vn.
20
Trang 21Người dùng muốn tìm kiếm cần nhập thông tin vào ô Tìm Văn bản Pháp luật sau đónhắn “Enter” hoặc chọn vào nút “Tìm kiếm” Người dùng cũng có thé “Tìm kiếm
đơn giản” theo 2 option sau:
e_ Chính xác cụm từ trên: kết quả trả về chứa chính xác cụm từ được nhập theo
đúng thứ tự hiên thị của từ khóa
e Có tat cả từ trên: kết quả trả về chưa tất cả các từ trong cum từ khóa, không
quan tâm vi trí hiên thi.
Người dùng cũng có thê chọn ““Tìm trong”: lựa chọn từ khóa cân tìm năm trong thuộc tính nào của văn bản hoặc tìm kiêm thông qua nhiêu tiêu chí trong “Tìm
kiêm nâng cao”.
TRANGCHỦ TÌMKIẾM TINTỨC TÌNHHUÓNGPHÁPLUẬT ENGLISH
> Văn bản pháp luật Trung ương
> Văn bản pháp luật địa phương
> Bộ Pháp điển điện tir
Van bản mới
Van bản phapquy Văn bản hợp nhất
Quyết định 59/2019/QĐ-UBND Ban hành bảng giá —,
đất trên địa bàn huyện Quy Châu, tỉnh Nghệ An Tim thấy 7 van bản Pham vi) Tất - v | Hiển thị:| 10 v |bảnghi
giai đoạn từ ngày 01/01/2020 đến ngày Z
31/12/2024 # Quyết định 1081/QĐ-TTg.
Thông tư 55/2014/TT-BGTVT Sửa đổi, bổ sung Thanh lập ban Chỉ Đạo quốc gia phỏng, chống tác hại của lạm dụng Ban hàm: 18/07/2018
một số điều của Thông tư số 31/2011/TT-BGTVT
rượu, bia và đỗ uéng có côn khác
thông vận tải quy định về kiểm tra chat lượng an PRB lién quan ¥ Thuộctỉnh wilượcđồ lTổivẽ
toàn kỹ thuật và bảo vệ môi trường xe cơ giới = nhập khẩu :
+ Quyết định 47/2003/QĐ-BTC
Thông tư 06/2020/TT-BLĐTBXH Ban hành Danh.
mục công việc có yêu cầu nghiêm ngặt vẻ an toàn, Về việc bãi bỏ áp dụng giá tính thuế nhập khẩu thối thiểu đối với Ban hành: 11/04/2003
vệ sinh lao độn: bud ò ó lộ lộng mat hàng rượu và đồ uống có cồn, có nguồn gốc từ EU Tư X20
Quyết định 16/2020/QĐ-UBND Về việc sửa đổi [ẦVðlênquan Z Thuộctính ailượcđồ ETiếnganh J Tải về
Khoản 2 Điều 3 Quy định chức năng, nhiệm vụ,
quyền hạn và cơ cau to chức của Sờ Giao thông a
vận tải tinh Quảng Ngãi ban hành kèm theo Quyết = Quyết định 52/2012/QĐ-UBND
đính số 67/2016/QĐ-UBND ngày 29/12/2016 của
Hình 2.8 Kết quả tìm kiếm đơn giản trên vbpl.vn với từ khóa “uống rượu”
TRANGCHỦ TÌMKIẾM TINTỨC TÌNHHUỐNGPHÁPLUẬT ENGLISH
> Văn bản pháp luật Trung ương [ Van bản hợp nhất Tìm kiếm đơn giản
Thông tư 55/2014/TT-BGTVT Sửa đổi, bổ sung À
một số điều của Thông tư số 31/2011/TT-BGTVT _ Im thay 1180 văn ban.
ngày 15 tháng 4 năm 2011 của Bộ trường Bộ Giao
thông vận tải quy định về kiểm tra chất lượng an „ Bộ luật 91/2015/QH13
toàn kỹ thuật và bảo vệ môi trường xe cơ giới :
Thông tư 06/2020/TT-BLDTBXH Ban hành Danh Hiệu lực: 01/01/2017
mục công việc có yêu cau nghiêm ngặt ve an loằn, noynpop [aviinquan # Thudctinh uiượcđồ Tai v8
vệ sinh lao động
Quyết định 16/2020/QĐ-UBND Vẻ việc sửa đổi ¥ Bộ luật 10/2012/QH13
Khoản 2 Điểu 3 Quy định chức năng, nhiệm vụ
quyển hạn và cơ cấu tổ chức của Sở Giao théng Lao động Ban hành 18/06/2012 vận tải tỉnh Quảng Ngãi ban hành kèm theo Quyết
định số 67/2016/QĐ-UBND ngày 29/12/2016 của Hiệu lực 0082013Hình 2.9 Kết quả tìm kiếm nâng cao trên vbpl.vn với từ khóa “uống rượu”
21
Trang 22Khác với các Website khác, từ khóa được tìm kiếm không được highlight mà chỉ
hiển thị một số nội dung cơ bản của văn bản pháp lý như tiê đề, ngày ban hành,ngày hiệu lực Dé xem chi tiết văn bản, người dùng nhấn chọn vào tiêu đề của văn
bản đó.
Văn bản hợp nhất | toan van lâu 105 Lich sit VBIiênquan Lượcđồ Taivé Bảnin
Hệ thống hóa VBQPPL Hiệu lực: Còn hiệu lực Ngày có hiệu lực: 15/07/2015
THU TƯỚNG CHÍNH PHU CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Căn cứ Luật Tổ chức Chính phủ ngay 25 tháng 12 năm 2001;
Căn cứ Quyết định số 244/QĐ-TTg ngày 12 tháng 02 năm 2014 của Thủ tướng Chính phù vẻ Chính sách quốc gia phòng,
chốn ức can ng đống cóchủđẫnnăn 202
š Căn cir Quyết định số 3412007IQĐ-TTg ngày 12 tháng 3 năm 2007 của Thủ tướng Chính phủ ban hành Quy chế thành lập, tổ
Quốc hội chức và hoạt động của tổ chức phối hợp liền ngành;
> Ủy ban thường vụ Quốc hội Xét để nghị của Bộ trưởng Bộ Y té,
® Các cơ quan khác sau đây: A 5
— 1 Trưởng ban: Ba Nguyễn Thi Kim Tiền, Bộ trưởng Bộ Y tế.
2 Phé Trưởng ban thường trực: Ông Nguyễn Thanh Long, Thứ trưởng Bộ Y té LÊN ĐÀU TRANG
~ Ông Đỗ Thắng Hài, Thứ trưởng Bộ Công Thương.
Hình 2.10 Nội dung văn bản hién thị trên Website
=N.
Van bản pháp quy Van bản hợp nhất
Tìm thấy 3 văn bản x| Hiển thị:
*# Nghị định 71/2000/NĐ-CP
Quy định việc kéo dài thời gian công tác của cán bộ, công chức đến Ban hành: 23/11/2000
độ tuoi nghỉ hưu Hiệu lực: 08/12/2000
[AVBliênquan ¥ Thudctinh ølLượcđồ ETiếnganh Ï Tải về
¥ Thông tư 19/2001/TT-BTCCBCP
Về việc hướng dẫn thực hiện Nghị định số 71/2000/NĐ-CP ngày Ban hành: 25/04/2001
23/11/2000 của Chính phủ quy định việc kéo dài thời gian công tác Hiệu lực: 28/04/2001 của cán bộ, công chức đên độ tuôi nghỉ hưu
[AVBliênquan ¥ Thuộctính ul Lượcđồ § Tải về
+ Quyết định 5329/QĐ-UBND
Quyết định 5329/QĐ-UBND năm 2013 duyệt đồ án quy hoạch chỉ Ban hành: 26/09/2013
tiết tỷ lệ 1/500 khu công viên Mũi Đèn Đỏ và khu nhà ở đô thị tại ee 28Jao/2naa
Hình 2.11 Kết quả tìm kiếm trên vbpl.vn với từ khóa “đèn đỏ”
22
Trang 232.2.2 Uu điểm
e Số lượng văn bản pháp lý lớn và được cập nhật thường xuyên
e Nội dung văn bản day đủ
e Khong chứa các quảng cáo.
2.2.3 Nhược điểm
e Độ chính xác của chức năng tìm kiếm chưa cao
e Kết quả trả về khi tìm kiếm chưa trực quan, không hightligh những từ khóa
tìm kiếm, không thông báo tình trạng của văn bản.
e Nội dung văn bản chi tiết hiện thị khó nhìn
23
Trang 242.3 Văn bản pháp luật https://vanbanphapluat.co/
2.3.1 Tìm hiểu Website
[3] Cơ sở dit liệu văn bản pháp luật cung cấp nội dung, file văn bản gốc các loại vănbản pháp luật, công văn, tiêu chuẩn Việt Nam, dự thảo văn bản Được xây dựng vàphát triển CSDL từ đầu năm 2013 với tên miền luatvn.net Đến đầu năm 2016 cậpnhật lại và xây dựng lại hoàn toàn CSDL này Đến tháng 08 2017 CSDL về văn bảnpháp luật chính thức đi vào hoạt động với tên miền mới vanbanphapluat.co
Giải pháp của Website nhằm cung cấp đến tổ chức, cá nhân, doanh nghiệp công cụtra cứu, tìm kiếm hữu ích các tài liệu liên quan đến pháp luật Việt Nam
Mục tiêu của Website là:
e Sử dụng công nghệ hiện đại dé tô chức lại hệ thông văn bản trên cả nước
e Cập nhật nhanh chóng, chính xác va kip thời.
e Kếtnối cộng đồng dân luật Việt Nam
o Tìm kiếm nhanh chóng, chính xác thông tin văn bản
o Tìm kiếm cơ hội giao thương
Hệ thống tìm kiếm & tra cứu hiệu lực Van ban pháp luật
Chào mừng bạn đến với hệ thống CSDL Văn bản pháp luật Tại đây bạn có thể tìm kiếm, tra cứu thông tin tổng hợp hơn 300,000 văn bản các loại bao gồm: Văn bản Quy phạm pháp luật, Công văn, Tiêu chuẩn Việt Nam, Văn bản Tiếng anh & dự thảo văn bản mới nhất được tổng hợp
Còn hiệu lực Công văn
thiểu số và miền núi gị
Cập nhật 41 phút trước
TCVN
Hình 2.12 Giao diện Website vanbanphapluat.co.
Người dùng muôn tìm kiêm cân nhập thông tin mình muôn tìm kiêm vào ô “Gõ từ
khóa tìm kiếm ” sau đó nhân Enter hoặc chọn nút tìm kiếm Một số hướng dẫn từ
24
Trang 25Website: có thê nhập bât cứ thông tin muôn tìm, nêu muôn tìm chính xác từ khóa
trong tìm kiếm thì đặt trong dấu “ ”, hoặc có thể kết hợp thêm các từ khóa khác
vanbanphapluat.co Trang chủ
Hướng dẫn tìm kiếm
Nhập bất cứ thông tin bạn muốn tìm Ví dụ: 5 văn bản, Lĩnh vực, Cơ quan ban hành, Người ký
Để tìm chính xác, hãy nhập từ khóa tìm kiếm trong ngoặc kép hoặc kết hợp các từ khóa Ví dụ: "Từ khóa 1" "Từ khóa
Để thu hẹp phạm vi tìm kiếm bạn có thể sử dụng chức năng lọc văn bản bên dưới.
Tìm kiếm uống rượu khi lái xe
Tìm thấy 128,212 văn bản phù hợp.
## > TÌM KIẾM: UỐNG RƯỢU KHI LAI XE
LOC KẾT QUA CSDL VAN BAN
Hình 2.13 Hướng dan tìm kiếm với “từ khóa”
Đề thu hẹp phạm vi tìm kiếm, Website cho phép người dùng sử dụng chức năng lọc
văn bản theo nhiều cách:
o Loại văn bản: Văn bản pháp luật, Công văn, TCVN (Tiêu chuẩn Việt Nam),
Dự thảo văn bản.
o Tùy vào loại văn bản, người dùng có thể lọc theo Lĩnh vực, Loại văn bản,
Người ký, Hiệu lực, Cơ quan ban hành.
LỌC KẾT QUẢ CSDL VĂN BAN
Linh vực Loại văn bản Người ký Hiệu lực Cơ quan ban hành van bên pháp hist
Bộ máy hành chính €ŒTiOA ván: -›ã hoi Tài chính nhà nước Công văn 20,017
Tài nguyên - Môi trường GED trẽthao-vtẽ ŒW% thuong mai
Thuế - Phí - Lệ Phí GD c¡ouuc GED \aooong-rin lương TCVN œ°
Xây dựng - Đô thị ŒẰ%W% bocannphiep ŒW CS Giao thong - van tai ixjthdio vău Bản cn°
Bất động sản GD s6 €Ẫi Cong nghé thong tin 7 Lĩnh vực khác Œ#ẰW% teènte- Ngan hàng f#ẤẦ®3 ss Xuat nap khau
Quyền dân sự ŒWằ bsiohcm ŒWQ thituc Tétung
Vi phạm hành chính ED ketoin-kểmtoán @D soDichvuphaply Trach nhiém hinh sy GD chung khoan ED sso hau tritue
T-UBND năm 2018 về cán bộ, chiến sĩ
c hiện nghiêm quy định của phái
ong giờ làm việc và không ‘iti tới ia
hành
chức, viên chức
Còn hiệu lực Cập nhật: năm ngoái
BB NOI dung sh Lược đồ 9 Lịch sử Bile liên quan
Chỉ thị 19/CT-UBND
awe Ban hành: 04/10/2018 javascript
Hình 2.14 Hướng dẫn lọc kết quả tim kiếm
25
Trang 26Với mỗi “từ khóa tìm kiếm” Kết quả trả về sẽ được hiển thị va highlight những từ
ngữ liên quan Đề xem chỉ tiết văn bản pháp lý đã tìm kiếm, người dùng chọn vào
hình ảnh của văn ban đó dé đọc file PDF hoặc chọn tiêu dé của văn bản dé xem chi
tiết trên Website
# > TÌM KIẾM: UỐNG RƯỢU KHI LÁI XE > VĂN BẢN PHÁP LUẬT
LỌC KẾT QUẢ CSDL VĂN BAN
Lĩnh vực Loại văn bản Người k: Hiệu lực Cơ quan ban hành
l ie 7 : Văn bản pháp luạt fEFED
KH ĐHANIGUEND Ban hành 26/11/2018 Công văn exp
Chỉ thị 17/CT-UBND năm 20+8/ã-skue-biệa.agiiôna.ay định khôn/ cồn
rong giờ làm việc và khér a do tỉn 26/11/2018
Chỉ thị 04/CT-UBND năm 2018 về can bộ, chiến! sĩ, công chức, viên chứ:
n nghiêm quy định v Ngày hiệu It 12/10/2018
= giờ làm việc va không tống FARg, bia Khi lãi xe do t Hiệu lực Còn hiệu lực
: ’ } ập nhật năm ngoái
javascript Ban hant 04/10/2018
Hình 2.15 Kết quả tìm kiếm trên vanbanphapluat.co với từ khóa “uống rượu”
Chỉ thị 04/CT-UBND 2018 công chức viên chức không 1 of 18 uống rượu bia trong giờ làm việc Cà Mau
Hình 2.16 Hiển thị nội dung văn bản trên file PDF
26
Trang 27EổNộidung «&Lượcđồ RiVănbảnliênquan Đt|chsửhiệulực Lá Lá | sốn © torpor to ihe is
Nội dung toàn văn Chỉ thị 04/CT-UBND 2018 công chức viên chức không uống rượu bia trong giờ làm việc Cà Mau Đã xem: Đánh giá: #9'œýW@
ỦY BAN NHÂN DÂN CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TINH CÀ MAU Độc lập - Tự do - Hanh phúc
Số: 04/CT-UBND Củ Mau, ngày 12 thang 10 nam 2018
CHỈ THỊ
VỀ VIỆC CÁN BỘ, CHIẾN SĨ, CÔNG CHỨC, VIÊN CHỨC NÊU GƯƠNG THỰC HIỆN NGHIÊM QUY ĐỊNH CỦA PHÁP LUẬT VỀ
JỘC TÍNH VAN BAN PHAP LUAT 04/
KHONG UỐNG RƯỢU, BIA TRONG GIỜ LAM VIỆC VÀ KHONG UỐNG RƯỢU, BIA KHI LAI XE M
i F ‘ Loại văn ban Chỉ thị
Thời gian qua, hầu hết cản bộ, chiến sĩ, công chức, viên chức, người lao động trong các cơ quan, đơn vị trên địa bàn tinh
đã chấp hành khá tốt quy định vẽ không uống rượu bia trong giờ làm việc và không uống rượu, bia khi lãi xe Từ đó, đã si S4CLUBND
góp phần nâng cao hiệu lực, hiệu quả hoạt động của bộ máy hành chính nhà nước các cấp, bảo đảm trật tự, an toàn giao thông trên địa ban tính Tuy nhiên, bên cạnh đó vẫn còn một số cán bộ, chiến st, công chức, viên chức, người lão cụ an ban hành ih cả lim
động thực hiện chưa nghiêm, vẫn uống rượu, bia ngay trước hoặc trong giờ làm việc; điều khiến phương tiện tham gia
lao thông sau khi đã uống rượu, bia, làm ảnh hưởng đến hình ảnh của người cán bộ, chiến sĩ, công chức, viên chức, you jy Nguyễn Tiến Hai _
ảnh hưởng đến chất lượng, hiệu quả giải quyết công việc, tiềm ấn nguy cơ gây mất an toàn giao thông +
Ngày ban hành 12/10/2018
Đế khác phục tình trạng trên, nhằm tăng cường kỷ luật, kỷ cương hành chính, góp phần bảo đảm trật tự, an toàn giao
Hình 2.18 Hién thị nội dung văn bản trên Website
® > TÌM KIẾM: VUOT DEN DO
C KẾT
x Lĩnh vực * Loại văn bản v Người ký v Hiệu lực v Cơ quan ban hành
Quyết định 83/QD-UBND
Quyết định 83/QD-UBND năm 2018 phê duyệt Chương trình phát triển @6 thị thị trấn Ba Tơ, huyện Ba Tơ, Ban Dành: 19/01/2018
tinh Quang Ngãi giai đoạn 2016-2020, định hướng @@n năm 2025 Ngày hiệu lực: 19/01/2018
Hiéu luc: Con hiéu luc
Cập nhật: 8 tháng trước
(08/01/2020)
lầNội dung sa Lược đồ ti) Bản PDF Lịch sử EX VB liên quan
Quyết định 44/QD-UBND
Quyết định 44/QĐÐ-UBND năm 2018 về Quy hoạch thăm đỗ, khai thác, sử dụng 10/01/2018
khoáng sản thành phố Cần Tho đểfñ năm 2020, tầm nhìn đểñ năm 2030 : 10/01/2018
Hiệu lực: Còn hiệu lực
Cập nhật: 2 năm trước
Nội dung «hh Lược đồ 'D Lịch sử tBïÏ VB liên quan
Quyết định 1263/QĐ-UBND Ain fe ea = _ ` Ban hành: 26/04/2017
Hình 2.17 Kết quả tìm kiếm trên vanbanphapluat.co với từ khóa “vượt đèn đỏ”
27
Trang 28# > TÌM KIẾM: "VƯỢT ĐÈN ĐỎ"
LỌC KẾT QUẢ
v Lĩnh vực v Loại văn ban v Người ký x Hiệu lực v Cơ quan ban hành
Công văn 1713/BGDĐT-GDCTHSSV
Công văn 1713/BGDĐT-GDCTHSSV năm 2020 về tăng cường triển khai công tác Pan bent ko zy ges
bảo đảm trật tự an toàn giao thông trong học sinh phổ thông đỗ Bộ Giáo dục Ngày hiệu lực: 18/05/2020
và Đào tạo ban hành Hiệu lực: Không xác định
Cập nhật: 4 tháng trước
(20/05/2020)
l Nội dung s Lược đồ II Bản PDF 'D Lịch sử EX VB liên quan
Xu == al Công van 437/TTg-CN
= = Công văn 437/TTg-CN về triển khai nhiệm vụ bảo đảm trật tự an toàn giao Ban “ưa 15/04/2020
thông quý II năm 2020 @@ Thủ tướng Chính phủ ban hành Ngày hiệu lực: 15/04/2020
Hiệu lực: Không xác định
Cập nhật: 5 tháng trước
(18/04/2020)
Nội dung sh Lược đồ 'D Lịch sử lÏ VB liên quan
Hình 2.19 Kết quả tìm kiếm chính xác trên vanbanphapluat.co với từ khóa “vượt
đèn đỏ”.
2.3.2 Uu điểm
e Website dé sử dụng, giao diện đơn giản.
e Cơ sở dữ liệu pháp luật lớn thường xuyên được cập nhật và thêm các văn bản
mới.
e Không có nhiều quảng cáo gây khó chịu cho người dùng
e Ngoài việc cung cấp văn bản hiển thị bằng tiếng Việt còn hiển thi văn ban
bang tiếng Anh
e Cung cấp RESTful APIs chia sẻ cơ sở dữ liệu
2.3.3 Nhược điểm
e Chua có quá nhiều nồi bật trong chức năng tìm kiếm, độ chính xác của việc
tìm kiêm chưa cao (Kêt quả tìm kiêm hình 2.17 và 2.18).
e_ Còn hién thị quảng cáo của Google
28
Trang 292.4 Bảng tổng hợp so sánh các Website hỗ trợ tìm kiếm tài liệu pháp lý.
[4] Dựa vào một số tiêu chí đánh giá Website:
WEBSITE | Legal Van bản Thư viện pháp luật | Văn bản pháp luật
CHỨC Document phap luat thuvienphapluat.vn | vanbanphapluat.co
f | Bố cục Website cân đối? M v x v
g | Chứa quảng cáo? > ch v v
II Nội dung
a | Nội dung bài viết rõ v v v v
mỗi bài viết?
d | Đưa ảnh nội bộ doanh v x M x
Trang 30TIEU CHÍ CÁCH ĐÁNH GIÁ
I Giao diện Website
a | Có logo? (+1) Có logo đề rõ ràng về mặt thương hiệu.
b | Bố cục menu rõ ràng/ day | Day đủ gồm: Trang chủ, giới thiệu, sản phâm, các chính sách
đủ? (+1) giao hàng/ đổi trả/ hỗ trợ, liên hệ.
c | Mau sắc thương hiệu rõ | Màu sắc Website cũng đồng nhất với mau của bộ nhận dang
nét? (+1) thương hiệu.
d | Hình ảnh nét/ đẹp? (+1) Dùng mat thường để đánh giá độ nét của ảnh, ảnh tự chụp
được đánh giá cao Ảnh copy, tải về bị đánh giá là thấp Ảnh
nét/ đẹp được đánh giá cao Ảnh mờ/ xấu được đánh giá thấp.
e | Có POPUP? (+1) POPUP nên đưa ra nội dung dé thu hút được người đọc, tránh
làm phiền khách hàng mà k mang lại giá trị cho họ.
f | Bé cục Website cân đối? | Thường Website chia thành 3 phần: Phần Sidebar bên trái,
(+1) phần nội dung ở giữa, phần Sidebar bên phải Chỉ cần chiều
dài của 3 cột này gần tương đương nhau, không cột nào quá
đài hơn so với 2 cột còn lại thì được gọi là "cân đối".
g | Chứa quảng cáo? (_— 1) Website chứa quá content quảng cáo.
II Tính năng
a | Có tính năng tim kiếm? | Tính năng tìm kiếm giúp khách hàng có trải nghiệm tốt hơn
(+1) khi duyét Website.
b | Tôi ưu hóa cho di động? | Vào thử bang điện thoại của minh Có thé ding thêm Tool
(+1) "check Website mobile friendly" Nếu hiển thi đầy đủ nội
dung thì gọi là tốt.
c | Tốc độ load trang nhanh? | Vào thử Website bằng máy tính, điện thoại Có thé dùng công
(+1) cụ check speed online
d | Google Analytics? (+1) Việc liên kết ananlytics gan như là điều bắt buộc
e | Bài viết liên quan? (+1) Giúp giữ chân người đọc lâu hơn, đưa cho người đọc nhiêu
thông tin hơn
f | Live chat? (+1) Công cụ không thê thiểu khi làm online
g | Miễn phí cho người dùng? | Website không yêu cầu người dùng phải trả phí để sử dụng
(+1) tính năng như: xem, tải,
h | Hỗ trợ đa ngôn ngữ (+1) Website hỗ trợ sử dụng đa ngôn ngữ và cho phép người dùng
chuyển đổi qua lại giữa các ngôn ngữ: tiếng Việt, tiếng Anh,
III Nội dung
a | Nội dung bài viết rõ ràng? | Đọc hiểu được nội dung người viết muốn nói
(+)
b | Thông tin liên hệ rõ ràng, | Day đủ dé khách hàng có thé dé dang tìm được khi họ có nhu
day đủ? (text, maps) (+1) cau
c | St dung anh/video trong | Sử dung ảnh vs video níu chân khách hang lâu hon, tăng chất
mỗi bài viết? (+1) lượng nội dung Website.
d| Đưa ảnh nội bộ doanh | Dua hình ảnh, văn hóa doanh nghiệp lên Website giúp tang sự
nghiệp (+1) uy tín từ khách hàng.
Thời gian trung bình tìm | Thời gian trung bình trả về kết quả tìm kiếm hiển thị cho kiếm (+1) người dùng.
Tong điểm đánh giá Điểm tôi đa 18.
Bảng 2.2 Bảng đánh giá chỉ tiết Website
30
Trang 31Chương 3 TÌM HIỂU CÔNG NGHỆ SỬ DUNG
3.1 Tìm hiểu công cu tìm kiếm tìm kiếm
3.1.1 Khái niệm
[51 Search Engine (Công cụ tìm kiếm, máy tìm kiếm) là một hệ thống phần mềm,
được truy cập trên Internet, có chức năng tìm kiếm cơ sở dữ liệu thông tin theo truyvẫn của người dùng Máy tìm kiếm sẽ cung cấp một danh sách các kết quả phù hợp
nhất với những gì người dùng đang cố gắng tìm kiếm
Các bộ phận cau thành hệ thống máy tìm kiếm search engine bao gồm:
e B6 thu thập thông tin (Web crawling).
e Bo lập chỉ mục (Indexing).
e Bộ tìm kiếm thông tin (Searching)
3.1.2 Nguyên lý hoạt động
/ ` io \ ⁄ \ ⁄ > a N / \
( => Download pag ‘iret Indexer F— Index F— Retrieval ==—t Queties >
\ Servers / TL „ cache X ) \ / \ Engine \ /
Hình 3.1 Nguyên lý hoạt động của Elasticsearch
Search Engine điều khiển robots (hay Spider, Web wanderer, Web worm) đi thu
thập thông tin trên mang thông qua các siêu liên kết (hyperlink) Khi robots pháthiện ra một website mới, nó gởi tài liệu (Web page) về cho Server chính dé tạo cơ
sở dtr liệu chỉ mục phục vụ cho nhu cầu tìm kiếm thông tin Boi vì thông tin trênmạng luôn thay đổi nên robots phải liên tục cập nhật các Website cũ Mật độ cập
nhật phụ thuộc vào từng hệ thong search engine Khi search engine nhan cau truy
31
Trang 32vấn từ user, nó sẽ tiến hành phân tích, tim trong cơ sở dữ liệu chỉ mục và trả về
những tài liệu thoả yêu cầu tìm kiếm
3.1.2.1 Bộ thu thập thông tin — Web crawling
[6] Web crawling là một chương trình tự động duyệt qua các cấu trúc siêu liên kết
dé thu thập tài liệu & một cách đệ quy nó nhận về tat cả tài liệu có liên kết với tàiliệu này Robot được biết đến dưới nhiều tên gọi khác nhau : spider, web wanderer
hoặc web worm, Những tên gọi này đôi khi gây nhằm lẫn, như từ ‘spider’,
‘wanderer’ làm người ta nghĩ rằng robot tự nó di chuyên va từ ‘worm’ làm người taliên tưởng đến virus Về bản chất robot chỉ là một chương trình duyệt và thu thập
thông tin từ các site theo đúng giao thức web Những trình duyệt thông thường
không được xem là robot do thiếu tính chủ động, chúng chỉ duyệt web khi có sự tác
động của con người.
3.1.2.2 Bộ lập chỉ mục — Indexing
[7] Hệ thống lập chỉ mục hay còn gọi là hệ thống phân tích và xử lý dữ liệu, thựchiện việc phân tích, trích chọn những thông tin cần thiết (thường là các từ đơn, từ
ghép , cụm từ quan trọng) từ những dữ liệu mà robots thu thập được va tô chức
thành cơ sở đữ liệu riêng để có thê tìm kiếm trên đó một cách nhanh chóng, hiệuquả Hệ thong chi mục là danh sách các từ khoá, chỉ rõ các từ khoá nào xuất hiện ở
trang nào, địa chỉ nào.
3.1.2.3 Bộ tìm kiếm thông tin — Searching
[8] Search engine là cụm từ dùng chỉ toàn bộ hệ thống bao gồm bộ thu thập thông
tin, bộ lập chỉ mục & bộ tìm kiếm thông tin Các bộ này hoạt động liên tục từ lúckhởi động hệ thống, chúng phụ thuộc lẫn nhau về mặt dữ liệu nhưng độc lập vớinhau về mặt hoạt động Search engine tương tác với user thông qua giao diện web,
có nhiệm vụ tiêp nhận & trả vê những tài liệu thoả yêu câu của user.
Tóm lai, tìm kiếm từ là tìm kiếm các trang mà những từ trong câu truy van (query)xuất hiện nhiều nhat, ngoại trừ stopword (các từ quá thông dụng như mao từ a, an,
32
Trang 33the, ) Một từ càng xuất hiện nhiều trong một trang thì trang đó càng được chọn
dé trả về cho người dùng Và một trang chứa tất cả các từ trong câu truy van thì tốthơn là một trang không chứa một hoặc một số từ Ngày nay, hầu hết các searchengine đều hỗ trợ chức năng tìm cơ bản và nâng cao, tìm từ đơn, từ ghép, cụm từ,danh từ riêng, hay giới hạn phạm vi tim kiếm như trên đề mục, tiêu đề, đoạn vănbản giới thiệu về Website,
Ngoài chiến lược tìm chính xác theo từ khoá, các search engine còn có gắng “hiểu”
ý nghĩa thực sự của câu hỏi thông qua những câu chữ do người dùng cung cấp Điềunày được thể hiện qua chức năng sửa lỗi chính tả, tìm cả những hình thức biến đổi
khác nhau của một từ.
32 C6 33 66
Ví dụ: Search engine sẽ tìm những từ như “speaker”, “speaking”, “spoke” khi người
dùng nhập vào từ khóa tìm kiếm là: “speak”
3.2 Tìm hiểu Elasticsearch
3.2.1 Khái niệm
[9] Elasticsearch là một công cụ tìm kiếm search engine dựa trên nền tảng ApacheLucene Nó cung cấp một bộ máy tìm kiếm dạng phân tán, có đầy đủ công cụ với
một giao diện web HTTP có hỗ trợ dữ liệu JSON.
Elasticsearch là một mã nguồn mở được phát triển bằng ngôn ngữ Java, thực chathoạt như một Web Server, có khả năng tìm kiếm nhanh chóng (near realtime) thông
qua giao thức RESTful.
Elasticsearch chạy trên Server riêng và đồng thời giao tiếp thông qua RESTful do
vậy nên nó không phụ thuộc vào Client hay hệ thống Nên việc tích hợp nó vào hệ
thống là dễ dàng, chỉ cần gửi request HTTP sẽ nhận được kết quả trả về
Với các dữ liệu nhỏ và vừa, người dùng có thé tìm kiếm trên file, trên các nền tang
dữ liệu như Oracle, MySQL, MongoDB nhưng đối với những trường hợp dữ liệu
lớn thì Elasticsearch giúp cho việc tìm kiêm trở nên tôi ưu và hiệu qua rat lớn.
33
Trang 34thì sẽ tìm kiếm trên Elasticsearch, tốc độ vừa nhanh, vừa giảm tải cho database.
3.2.3 Ưu, nhược điểm của Elasticsearch
3.2.3.1 Ưu điểm
e Khả năng tim kiếm mạnh mẽ dựa trên Apache Lucene và phân tích dữ liệu
e Khả năng mở rộng theo chiều ngang Dù tìm kiếm từ khóa sai chính tả hay
không đúng cú pháp thì vẫn được hỗ trợ trả về kết quả rất tốt
se - Hỗ trợ tìm kiếm khi từ khóa tìm kiếm có thé bị lỗi
e Hỗ trợ đặc tả những câu truy vấn phức tạp một cách cụ thé và rõ ràng bằng
JSON, các Structured Query DSL (Domain Specific Language),
Elasticsearch client nhu Java, Php, JS, Ruby,
3.2.3.2 Nhược điểm
e Elasticsearch được tạo ra với mục đích tìm kiếm, nhưng với những nhiệm vụ
khác ngoài search Curd thì Elastic yếu hơn so với những database khác như
MongoDB, MySQL Do vậy người ta ít khi dùng Elasticsearch làm
database chính như MongoDB hay MySQL.
e Trong Elasticsearch không có khái niệm database transaction, vì thế
Elasticsearch không đảm bảo được dữ liệu của các hoạt động như Insert,
Update hay Delete, khi chúng ta thực hiện thay đổi nhiều bản ghi nếu xảy ra
34
Trang 35lỗi làm logic sai hay dẫn tới mat dữ liệu Day cũng là một phần khiến
Elasticsearch không nên là database primary.
e Đối với những hệ thống thường xuyên cập nhật dữ liệu thì việc sử dụng
Elasticsearch sẽ rất tốn kém cho việc đánh index dit liệu
e Việc tìm kiếm của Elasticsearch được phân trang, thông qua hai giá
trị “from” và “size” Việc phân trang này diễn ra rất phô biến, trên hầu hết
các ứng dụng và thậm chí, trên giao diện, người dùng có thé dễ dàng nhảy từ
trang này sang trang khác Nhưng Elasticsearch có những vẫn đề của riêng
nó liên quan đến phân trang, khi mà người dùng nhảy đến những trang quá
lớn, nhất là trang cuối cùng Với Elasticsearch, nó sẽ phải thực hiện tính
toán, đánh giá độ tương quan cho từng trang Ví dụ, bạn cân truy cập trang
thứ 20, thì Elasticsearch sẽ phải tính toán và thực hiện tìm kiếm trên tất cả
các trang từ 1— 20 Trong trường hợp thì sẽ là thực hiện tính toán trên 20 *
20 * 5 = 2000 bản ghi (nếu phân trang là 20 bản ghi mỗi trang) Số trang
càng lớn, mức độ tính toán càng nhiều Do đó, trên thực tế, người dùng sẽ phải tìm cách giải quyết van dé này, dù tỉ lệ người dùng tìm đến các trang sâu như vậy là không nhiều.
3.2.4 Các khái niệm cơ bản trong Elasticsearch
[10] Cách khải niệm cơ bản trong Elasticsearch
Trang 363.2.4.1 Documents
Là đơn vị nhỏ nhất đề lưu trữ dir liệu trong Elasticsearch Day là một đơn vị lưu trữ
thông tin cơ bản trong Elasticsearch, là một JSON obJect đối với một số dữ liệu
3.2.4.2 Index
Trong Elasticsearch, “Indexing a document” giống như là “Insert/Update adocument” Elasticsearch có một cấu trúc tim kiếm gọi là inverted index, nó được
thiết kế dé cho phép tìm kiếm full- text search Cách thức khá đơn giản, các văn
bản được tách ra thành từng từ có nghĩa sau đó sẽ được map xem thuộc văn bản nào
và khi search sẽ ra kết quả cụ thê
Có 2 kiểu đánh Index và Forward Index và Inverted Index
e Inverted Index đánh theo keyword: words — > pages
e Forward Index đánh theo nội dung: pages — > words.
Chúng ta có thé thấy việc đánh theo keyword thì việc tìm kiếm sẽ nhanh hon việcchúng ta phải tìm kiếm theo từng page Elasticsearch sử dung Apache lucence dé
quản lý và tạo Inverted Index.
3.2.4.3 Shard
e Shard là một đối tượng của Lucence, là tập hợp con của một Index Một
Index có thể được lưu trên nhiều Shard
e Một Node bao gồm nhiều Shard, Shard chính là đối tượng nhỏ nhất hoạt
động ở mức thấp nhất, đóng vai trò lưu trữ dữ liệu
e Chúng ta sẽ không bao giờ làm việc với các Shard vì Elasticsearch sẽ hỗ trợ
chúng ta toàn bộ việc giao tiếp cũng như tự động thay đổi các Shard khi cầnthiết
e Elasticsearch cung cấp 2 cơ chế của Shard đó là primary Shard va Replica
Shard.
e Primary Shard sẽ lưu trữ dữ liệu và đánh Index, sau khi đánh dữ liệu xong sé
được vận chuyên đến các Replica Shard, mặc định của Elasticsearch mỗi
index sẽ có 5 Primary Shard thì sẽ đi kèm với một Replica Shard.
e Replica Shard là nơi lưu trữ dữ liệu nhân bản của Elasticsearch, đóng vai trò
đảm bảo tính toàn vẹn đữ liệu khi Primary Shard xảy ra vấn đề, ngoài ra nó
36
Trang 37còn giúp tăng tốc độ tìm kiếm vì chúng ta có thé cau hình lượng Replica
Shard nhiêu hơn câu hình mặc định của Elasticsearch.
3.2.4.4 Node
e La trung tâm hoạt động cua Elasticsearch, là nơi lưu trữ dữ liệu, tham gia
thực hiện đánh index của Cluster cũng như thực hiện các thao tác tìm kiêm.
© Mỗi Node được xác định bằng một tên riêng và không được phép trùng lặp
3.2.4.5 Cluster
e Tập hợp các Node hoạt động cùng với nhau, chia sẻ với nhau cùng một thuộc
tính Cluster name Chính vì thế Cluster sẽ được xác định bằng một tên riêng
và không được phép trùng lặp Việc tên của các Cluster Elasticsearch mà
trùng nhau sẽ gây ra lỗi cho các Node vì vậy khi cấu hình cần phải chú ý
e© Mỗi Cluster có một Node chính gọi là master, Node master được lựa chọn
một cách tự động và có thê thay đổi nếu như có sự cô xảy ra Một Cluster cóthé bao gom nhiều Node Các Node có thé hoạt động trên cùng một Server
Tuy nhiên trên thực tế, một Cluster sẽ gồm nhiều Node hoạt động trên các
Server khác nhau để đảm bảo nếu một Server gap sự cố thì các Node trên các
Server khác có thể hoạt động đầy đủ chức năng Các Node có thể tìm thấynhau dé hoạt động trên cùng một Cluster thông qua giao thức Unicast
e_ Chức năng chính của Cluster là quyết định xem Shard nào được phân bồ cho
Node nào và khi nào thì di chuyển các Cluster dé cần bang lại Cluster
Hình 3.4 Hình ảnh mô tả Cluster, Node trong Elasticsearch.
3.2.5 Cai đặt Elasticsearch.
CLUSTER
3.2.5.1 Yêu cầu cài đặt
e Java 8 trở lên, kiểm tra bằng cách gõ java — version
e_ Thiết lập biến môi trường JAVA_HOME cho java Kiểm tra biến môi trường
JAVA_ HOME đã được thiết lập hay chưa bằng lệnh: echo $JAVA_HOME
37
Trang 383.2.5.2 Cài đặt trên Windows.
Download install file tại https://www.elastic.co/fr/downloads/past—
releases/Elasticsearch— 6— 4— 0.
Sau đó giải nén file Elasticsearch vừa tải xuống
Run file /bin/Elasticsearch.bat dé khởi tạo Elasticsearch thành một Service
Sau khi thành công, service được khởi tạo với port mặc định 9200.
w Volume (E:) > New folder (3) >» New folder (2) > 2020 > elasticsearch-6.4.0 > elasticsearch-6.4.0 > bin vy Dd.
Name ° Date modified Type Size
— x-pack 9/2/2020 10:50 AM File folder
[%] elasticsearch-keystore.bat 9/2/2020 10:50 AM Windows Batch File 1KB
Hình 3.5 File dùng dé kích hoạt Elasticsearch Service
Trang 39Như vậy, Elasticsearch đã cài đặt thành công, sau đây là một số phần mềm hỗ trợ
Test và truy vấn Elasticsearch:
e Addon Chrome Elasticsearch Head.
e Plugin Elasticsearch Head cho Elasticsearch 2.x.
e CURL.
e Fiddler Web Debugger.
Elasticsearch _ "!9/ozno52o connoct | clasticsearch IREMEEBNBBIRREBEEBRHHHGEDDE
Overview | Indices | Browser Structured Query [+] _ Any Request [+]
* 9qr5RmH
{into =}
Tt
Hinh 3.7 Su dung Addon Chrome Elasticsearch Head.
3.2.5.3 Cai dat trên Linux.
Tương tự với cai đặt trên Windows, Elasticsearch yêu cầu sử dung Java 8 trở lên vàthiết lập biến môi trường JAVA_ HOME Sử dụng lệnh sau dé download và cài đặt
Elasticsearch PGP key: wget — qO — _https://artifacts.elastic.co/GPG— Elasticsearch | sudo apt— key add —.
KEY-Dé cài đặt Elasticsearch trên Ubuntu ta có 2 cách:
e Cài từ Repository
e Cài từ file deb
Cài đặt Elasticsearch bang APT Repository
e Cài gói apt— transport— https: sudo apt— get install apt- transport— https
e Lưu định nghĩa repository vào /etc/apt/sources.list.d/elastic— 6.x.list
(Repository mặc định ko có Elasticsearch): echo "deb https://artifacts.elastic.co/packages/6.x/apt stable main" | sudo tee — a
/etc/apt/sources list.d/elastic— 6.x list
e Cài đặt Elasticsearch bang lệnh: sudo apt- get update && sudo apt- get
install Elasticsearch.
39
Trang 40Cài đặt Elasticsearch bằng gói deb
e weet https://artifacts.elastic.co/downloads/Elasticsearch/Elasticsearch—
6.4.0.deb.
e weet https://artifacts.elastic.co/downloads/Elasticsearch/Elasticsearch—
6.4.0.deb.sha5 12.
e shasum—a512~—c Elasticsearch— 6.4.0.deb.sha512
e sudo dpkg — i Elasticsearch— 6.4.0.deb.
Kich hoat Elasticsearch.
Tương tự Windows OS, Elasticsearch sau khi được cai dat sẽ không tự động chạy.
Đề khởi động Start, Stop Elasticsearch ta làm như sau:
e Kích hoạt serivce Elasticsearch và tự động start khi khởi động máy:
o sudo /bin/systemctl daemon- reload.
o sudo /bin/systemctl enable Elasticsearch.service.
e Dé start, stop, xem thông tin service Elasticsearch ta dùng các lệnh sau:
o sudo systemctl start Elasticsearch.
o sudo systemctl stop Elasticsearch.
o sudo systemctl status Elasticsearch.
3.2.6 Sir dụng API để thêm, xóa, sửa, tim kiếm dữ liệu trong Elasticsearch
Các thành phần được định nghĩa trong Elasticsearch được hiểu tương ứng với các
Relation Database như sau:
Relation Databases Elasticsearch
* Database (ep lndex