Trang Search_Engine.aspx

Một phần của tài liệu Nghiên cứu search engine và các thuật toán đối sánh mẫu cho hệ thống tìm kiếm thông tin trên mạng (Trang 30 - 33)

Trang Search_Engine.aspx cho phép người sử dụng nhập vào một từ khoá hoặc cụm từ khoá, sau đó nó tiến hành tìm trong Danh mục từ Catalog và trả về kết quả là các trang có chứa từ khoá.

Hình 3.11: Màn hình trang tìm kiếm chính Search_engine.aspx

Hình 3.13: Màn hình kết quả tìm kiếm với cụm từ khoá: Search Engine

KẾT LUẬN

Kết quả đạt được của luận văn:

- Luận văn đã trình bày kiến trúc và nguyên tắc hoạt động chung của các hệ thống tìm kiếm thông tin trên mạng. Các kỹ thuật trong việc xây dựng các mô đun trong Search Engine như kỹ thuật xây dựng mô đun tìm duyệt Crawler, mô đun đánh chỉ mục Indexer, mô đun phân hạng Ranking,…Từ đó tìm hiểu Search Engine điển hình Google.

- Trên cơ sở tìm hiểu về hệ thống tìm kiếm, cũng như cách thức tìm kiếm trên mạng luận văn đã tập trung phân tích và đánh giá một số thuật toán đỗi sánh mẫu để áp dụng cho hệ thống tìm kiếm.

- Xây dựng một Search Enginetrên cơ sở mã nguồn mở, ngôn ngữ lập trình C# và công nghệ ASP.NET. Search Engine này chạy trên trình chủ localhost, và nó hoạt động dựa theo nguyên lý chung của một hệ thống tìm kiếm trên mạng. Search Engine thực hiện được chức năng dò tìm các tệp html, phân tích các tệp mà nó tìm được thành các từ và xây dựng danh mục từ Catalog. Sau đó cho phép người sử dụng gõ vào từ hoặc cụm từ cần tìm và Search Engine sẽ trả về kết quả tìm kiếm theo thứ tự phân hạng trang.

KIẾN NGHỊ VÀ HƯỚNG NGHIÊN CỨU TIẾP THEO

Hiện nay trên mạng Internet đã có rất nhiều công cụ tìm kiếm mạnh được hầu hết người sử dụng trên thế giới biết đến và sử dụng hàng ngày như công cụ tìm kiếm Google, Yahoo, Altavista,…Và ở Việt Nam cũng đã có những công cụ tìm kiếm giành cho người Việt như Sóc bay, Xa lộ, …Tuy nhiên do sự phát triển mạnh mẽ của cỗ máy tìm kiếm lớn nhất thế giới Google với việc cho ra đời phiên bản Google Việt Nam cỗ máy này đã chiếm hầu hết thị phần tìm kiếm của người Việt, nên các cỗ máy tìm kiếm trong nước đang gặp rất nhiều khó khăn. Nên phương hướng phát triển đề tài là phát triển các hệ thống tìm kiếm trong nước để thu hút được đa số người sử dụng tiếng Việt. Muốn vậy chúng ta cần tập trung đi sâu vào nghiên cứu phát triển các cỗ máy tìm kiếm tiếng Việt với khả năng bản địa hoá sâu sắc. Các cỗ máy này phải nắm bắt được thói quen tìm kiếm thông tin của người Việt, có khả năng hiểu được các cách viết tắt, các từ thường được dùng theo thói quen địa phương, các từ ngữ thuộc lĩnh vực đặc biệt như lĩnh vực dân tộc, tôn giáo, tín ngưỡng…. Ngoài ra các cỗ máy này phải có một hệ thống máy chủ đủ mạnhđể có thể lưu trữ được số lượng trang web lớn, khả năng phân tích yêu cầu tìm kiếm nhanh, kết quả trả về chất lượng, phù hợp với yêu cầu tìm kiếm.

Một phần của tài liệu Nghiên cứu search engine và các thuật toán đối sánh mẫu cho hệ thống tìm kiếm thông tin trên mạng (Trang 30 - 33)