Cỏc ứng dụng

Một phần của tài liệu (LUẬN văn THẠC sĩ) hệ thống tìm kiếm thông tin và thuật toán đối sánh đa mẫu trong hệ thống tìm kiếm (Trang 77 - 81)

3.4 Thuật toỏn đối sỏnh nhanh đa mẫu

3.4.6 Cỏc ứng dụng

được ứng dụng để tỡm kiếm cỏc file trong tập lớn cỏc file của hệ thống, tỡm kiếm cỏc bản ghi, cỏc kiểu dữ liệu cú cấu trỳc. Việc tỡm kiếm một khoỏ duy nhất là một trong những vấn đề cơ bản dựa trờn ký thuật chung là sử dụng cõy cấu trỳc hoặc hàm băm. Thấy rừ hiệu quả của việc tỡm kiếm đa mẫu cựng một lỳc dựa trờn hàm băm thỡ hầu hết cỏc ứng dụng khỏc ỏp dụng giải phỏp này [11].

Lợi ớch của giải phỏp này:

- Khụng cần khụng gian lưu trữ cấu trỳc dữ liệu. - Khụng cần xử lý trước hay sắp xếp dữ liệu.

- Tỡm kiếm một cỏch mềm dẻo (cú thể tỡm kiếm kiểu dữ liệu cú cấu trỳc). Tuy nhiờn, với số lượng mẫu ớt và ớch thước của mẫu quỏ ngắn thỡ ỏp dụng giải phỏp này khụng cú hiệu quả. Trong cỏc trường hợp khỏc thuật toỏn này cú hiệu quả hơn.

78

Kết luận

1. Kết quả đạt được trong luận văn:

- Luận văn này trỡnh bày kiến trỳc và kỹ thuật xõy dựng cỏc hệ tỡm kiếm, cũng như quy trỡnh hoạt động chung của chỳng.

- Trờn cơ sở tỡm hiểu về hệ tỡm kiếm, nắm được quỏ trỡnh hoạt động, cỏch lưu trữ, cỏc giải phỏp dựng trong cỏc hệ thống, luận văn tập trung phõn tớch và đỏnh giỏ một số thuật toỏn tỡm kiếm đa mẫu tối ưu để ứng dụng cho hệ thống tỡm kiếm thụng tin.

- Thụng qua việc phõn tớch đỏnh giỏ đặc điểm của thuật toỏn trỡnh bày trờn, đề xuất thuật toỏn đối sỏnh đa mẫu để cài đặt vào hệ thống tỡm kiếm thụng tin.

- Thực hiện cài đặt thử nghiệm, so sỏnh, đỏnh giỏ kết quả của thuật toỏn đối sỏnh đa mẫu khi số lượng mẫu nhiều hoặc kớch thước của mẫu lớn.

Trong quỏ trỡnh thực hiện luận văn cũng như quỏ trỡnh học tập, tụi đó cố gắng tập trung tỡm hiểu và tham khảo khỏ nhiều tài liệu liờn quan. Tuy nhiờn, với thời gian và trỡnh độ cú hạn nờn khụng trỏnh khỏi những hạn chế và thiếu sút. Tụi rất mong nhận được sự nhận xột và gúp ý của cỏc thầy cụ giỏo và cỏc bạn để hoàn thiện hơn cỏc kết quả nghiờn cứu của mỡnh.

2. Phương hướng nghiờn cứu tiếp theo

Bài toỏn tỡm kiếm thụng tin đó và đang được quan tõm rất nhiều, đặc biệt là hệ thống tỡm kiếm thụng tin trờn Internet. Hệ thống tỡm kiếm thụng tin được xõy dựng và phỏt triển khỏ nhiều, với sự phỏt triển mạnh mẽ và đa dạng của thụng tin, cỏc hệ thụng tỡm kiếm núi chung, hệ tỡm kiếm núi riờng càng phải được xõy dựng ngày một tốt hơn. Trong hệ tỡm kiếm, vấn đề lưu trữ dữ liệu, tỡm kiếm dữ liệu, cụ thể như lưu trữ, sắp xếp, tỡm kiếm trang Web,... cần được ỏp dụng những giải phỏp, kỹ thuật hiệu quả, tối ưu hơn. Những bài toỏn trờn là nội dung nghiờn cứu tiếp theo của luận văn này.

79

Tài liệu tham khảo

Tài liệu tiếng việt

1. Nguyễn Hoàng Long (2002), Hệ thống tỡm kiếm thụng tin theo chủ đề dựa trờn cơ sở lý thuyết tập mờ, Luận văn tốt nghiệp cao học, Hà Nội, tr.15-35.

2. Bựi Quang Minh (2002), Mỏy tỡm kiếm VietSeek, Bỏo cỏo kết quả nghiờn cứu thuộc đề tài khoa học đặc biệt cấp ĐHQG Hà Nội, mó số QG-02-02.

3. Phạm Thanh Nam (2003), Một số giải phỏp cho bài toỏn tỡm kiếm trong cơ sở dữ liệu Hypertext, Luận văn tốt nghiệp cao học, Hà Nội, tr.23-40.

Tài liệu tiếng anh

4. Amihood Amir, Moshe Lewenstein, ElyForat (2000), “Faster Algorithms for string Matching with k mismatches”, Proceedings of the eleventh annual ACM- SIAM symposium on Discrete algorithms Bar-Ilan University and Georgia Tech, Weizmann Institute San Francisco, 5 California, United States, ISBN:0-89871- 453-2, pp.794 – 803.

5. Arvind Arasu, Junghoo Cho, Hector Garcia-Molina, Andreas Paepcke, Sriram Raghavan (2001), “Searching the Web”, Technical Report Computer Science Department, Standfort University TOIT 1(1), pp.2-43.

http://rose.cs.ucla.edu/~cho/papers/cho-toit01.pdf

6. A Nayak (2003), World wide Web, Data Mining for Web-Enabled Electronic Business Applications, pp.128-138.

http:zSzzSzwww.eng.auburn.eduzSz~wenchenzSzpaper.pdf/world-wide-web- search.pdf

7. C.J Van Rjjsbergen (1992), “Information Retrieval”, Deparment of computing Science - University of Glasgow, 2nd edn Butterworths London, ISBN:0-89791- 523-2, pp.37-50.

80

8. Christian Charras Thierry Lecroq (2002), Hand book of Exact String-Matching Algorithms, pp.165-343.

http:zSzzSzwww-igm.univ-lv.frzSz~lecroqzSzcpm98.pdf/charras98very.pdf

9. Hosam M.Mahmoud, Robert T.Smythe, Mireille Regnier (1997), “Analysis of Boyer–Moore-Horspool String–matching Heuristic”. Deparment of Statistics, The George Washington University, Washington, USA, pp.169-186.

10. Kin Kolyshkin, Alexander F.Avdonkin (2002), ASPSeck User‟s Guide, SWSoft.

http://www.aspseek.org/man/manual.pdf

11. Maxime Crochemore, Institut Gaspard Monge (2003), “Pattern Matching in String” Universitộ de Marne-la-vallộe Christophe Hancart, Laboratoire d‟Informatique de Rouen, Universitộ de Rouen.

12. Michael W.Berry and Murray Browne (1999), “World Wide Web Seach Technologies‟.

13. Robert Sedgewick (1988), Second Edition Algorithms, Princeton University. 14. Sunny Lam (2001), “The Overview of The Web search Engine”, Department of

computer Science University of Waterloo Canada.

15. Sun Wu (1994), “A Fast Algorithms for Multi-Pattern Searching”, Department of Computer Science Chung-Cheng University Chia-Yi, Taiwan.

16. Sergey Brin and Lawrence Page (2000), “The Anatomy of a Large –Seale Hypertextual, Stanford, USA.

http://www7.scu.edu.au/programme/fullpapers/1921/com1921.htm

Một phần của tài liệu (LUẬN văn THẠC sĩ) hệ thống tìm kiếm thông tin và thuật toán đối sánh đa mẫu trong hệ thống tìm kiếm (Trang 77 - 81)

Tải bản đầy đủ (PDF)

(81 trang)