1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm hiểu công nghệ động cơ tìm kiếm của lucene xây dựng ứng dụng minh họa

40 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 40
Dung lượng 17,13 MB

Nội dung

~ff"C;;:> KEJ ~ B600 van ban, oa s6 la cac lo~ti van bim thong dVng nhu doc, docx, xIs, xIsx, ppt, pptx, html, va chua oVng nhiSu bang ma ti~ng Vi~t K~t qua thu ouqc la r~t kha quan Trang 37 Chuang 4: KSt lu?n va dinh huang CHU'ONG : KET LU~N vA DINH HU'ONG 4.1 KET LuAN vE DE TAL Qua nghien Clm d~ tai t6t nghi~p nay, nh6m chung em dff biSt them m9t cong ngh~ h6 t1'q tim kiSm m~nh me lInh vvc cong ngh~ thong tin, va hi~u duqc tinh c~n thiSt va thvc ti~n Clla n6 Qua d6 t1'ang bi kiSn thuc cho minh, ap dVng phat t1'i~n cac chuang t1'inh lrng dVng h6 t1'Q'tim kiSm D~ tai dff d~t duqc kSt qua kha quan 4.1.1 Uu Di~m: 4.1.1.1 V~ ph~n nghien cu'u: N~m dUQ'c cac tinh nang co ban, co chS lam vi~c Clla thu vi~n Lucene t1'ong tiSn trinh l?p chi m\lc tai li~u va tim kiSm tai li~u N~m duqc nhfrng khai ni~m m6'i v~ cac 16'p d6i tuqng Lucene ch~ng h~n nhu Token, Analyzer N~m duqc cong d\lng Clla cac 16'pma Lucene Slr dVng l~p chi m\lc va tim kiSm Tich hqp duqc b9 thu vi~n Lucene d~ xay dVng ph~n m~m quan 1;' h6 so cong van 4.1.1.2 V~ ph~n m~m: Giao di~n dan gian d~ Slr dVng, than thi~n v6'i nguc)'i dung Cung c~p hai chuc nang chinh tim kiSm va l?p chi mvc Ngoai 1'a, can c6 chuc nang xem th6ng ke d~ nguo'i dung c6 th~ biSt duqc SlJ xu~t hi~n Clla cac tu' minh c~n t1'a cuu t1'ong tai li~u chi m\lc nhu thS nao Han thS nfra, chu'c nang xem highlight cling duqc phat t1'i~n t1'ong ung d\lng t1'en 4.1.2 KhuySt Di~m: Ngoai nhfrng kiSn thuc ma Lucene dff mang l~i, chung em cam th~y vfrn can h~n chS ma nh6m c~n kh~c plwc: Lucene la m9t thu vi~n dUQ'cxem la kha 16'n, chung em chi m6'i tim hi~u duqc cac tinh nang co b~m eua n6; H~ th6ng ma chung em xay dlJng chi m6'i ap dvng ph~m vi nhc v6'i s6 luqng van ban can lwn chS, k9 thu?t tim kiSm nang cao chua c6 a ChuO'ng 4: K~t lu~n va dinh huang 4.2 DE Trang 38 XUAT HU'6NG PHAT TRIEN US dua nhfrng dS xu~t ma nh6m dff th6ng nhM ttl' tru6'c, chung em kh~ng dinh l~i Lucene khong phai la mQt c6 may tim ki~m Lucene chi c6 thS lam thu vi~n cho cac nha phM triSn (mg dt,ll1g su dt,ll1g,tich hQ'p vao chuO'ng trinh ung dt,ll1g Chung em nh~n th~y r&ng, v6i vi~c phat triSn nhanh ch6ng cua cong ngh~ thong tin cling nhu nhu c~u tim ki~m thong tin cua nguc)'i dung mQt nhiSu thi h~ th6ng dt c6 kha nang dS phat triSn Chung em dg dinh se phM triSn (mg dt,ll1g cua minh them cac chu'c nang khac nhu: chuc nang W dQng nh~n di~n bang ma ti~ng Vi~t, chuySn d6i ti~ng Vi~t vS d~ng tieu chu:1n TCVN, hay nghien cuu cac k5' thu~t tim ki~m nang cao Trang 39 Danh ml,lc tai li~u tham khao va trich dftn DANH Ml)C TAl LI~U TRAM KHAo [1] Erik Hatcher - Otis Gospodnetic, Lucene In Action [2] http://www codepro iecL com/KE/l ibrary/lntroducingLucene [3] http://www.codeproject.com/KE/cs/lucene aspx analysis.aspx [4] http://www.codeproject.com/KE/string/pdf2text.aspx [5] http://www.codeproject.com/KB/reCipes/TokenParser.aspx [6] http://www.codeproiect.com/KE/ cs/HTML Page Parser aspx [7] http://www.codeproject.com/KE/recipes/FFHtm [8] http://www.codeproject.com/KE/ IParser aspx cs/html parser aspx [9] http://www.codeproject.com/At1icles/57176/Parsing-HTML- Tags-in- Csharp.aspx [10].http://l11cene.apache.org/java [11 ].http://wiki.apache.org/lucene-java [ 12].http://www.dotllicene.net/ ' • , [13].http://lucene.apache.org/lucene.net/docs/ PHl) CHi; TRicH DAN Trong bao cao lu~n van t6t nghi~p nh6m chung em c6 Slr dl,lng mQt s6 hinh imh tai li~u "Lucene in action" bao g6m: [1] Hinh 1.5: A typical application integration with Lucene - t?i trang s6 [2] Hinh 2.1: Indexing with Lucene breaks down into three main operations: converting data to text, analyzing it, and saving it to the index - t?i trang s630 [3] Hinh 7.1: DocumentHandler interface that all document format parsers will implement - t?i trang s6 225 [4] Hinh 7.2: XML snippet representing an address book entry - t?i trang s6 227 [5] Hinh 7.3: DocumentHandler using the SAX API to parse an address book entry - t?i trang s6 228 [6] Bang 1.1: Lucene's release history - t?i trang s6

Ngày đăng: 01/09/2023, 22:04

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN