Kết quả của ứng dụng Web

Một phần của tài liệu Đánh giá và thu thập thông tin tự động trên internet sử dụng dịch vụ tìm kiếm (Trang 73 - 79)

CHƯƠNG 3: THỰC NGHIỆM ỨNG DỤNG ĐÁNH GIÁ VÀ THU THẬP THÔNG TIN

3.3. Kết quả thực nghiệm

3.3.2. Kết quả của ứng dụng Web

Ứng dụng web đƣợc viết bằng ngôn ngữ java, chạy trên server Apache Tomcat 7.0.34. Với một kết quả của trang web nhƣ sau

Giao diện màn hình chính khi truy cập ứng dụng web

Hình 3.7: Giao diện chương trình.

Màn hình chính hiển thị các kết quả theo dõi các từ khóa của người dùng đã đăng kí với hệ thống, trên màn hình cung cấp các chức năng xem danh sách kết quả theo từng từ khóa của người dùng, xem lại thông tin (CSDL) đã lưu trữ trên MongoDB bằng cách click vào mục " Xem bản sao lưu" (hình 3.8)

Hình 3.8: Màn hình chính.

Cho phép lọc các tin bài đã lưu trong cơ sở dữ liệu theo thời gian giờ trước, hoặc ngày trước …(hình 3.9)

Hình 3.9: Lọc thông tin theo thời gian

Chức năng xem thông tin cá nhân của người dùng. Trong đó sẽ thống kê chi tiết các từ khóa của người dùng, những từ khóa nào vẫn đang tiếp tục được theo dõi, và những từ khóa đã ngừng việc theo dõi :

Hình 3.10: Thông tin tài khoản

Màn hình xem thông tin cá nhân và chi tiết các từ khóa của người dùng đã đăng kí cũng nhƣ trạng thái của những từ khóa đó:

Qua những kết quả thực nghiệm đã đạt đƣợc và trình bày ở trên, nhận thấy rằng hệ thống đã phần nào đáp ứng đƣợc những yêu cầu bài toán đặt ra ngay từ đầu trong chương 1. Qua thực nghiệm cho thấy thời gian cho một lần thu thập dữ liệu là khá thấp và chấp nhận được, số lượng kết quả tương đối nhiều và đáp ứng được mục đích hiển thị của yêu cầu của hệ thống.

Tuy nhiên hệ thống vẫn có nhiều những điểm chƣa thực sự tốt. Phía máy chủ chịu trách nhiệm thu thập theo dõi các tin bài còn khá thủ công ở giai đoạn phân tích mã nguồn HTML của trang tìm kiếm nên tốc độ vẫn khá chậm và các trường thông tin còn khá đơn giản. Chƣa có chức năng lọc nội dung các từ của tin bài kết quả sao cho liên quan đến từ khóa nhiều nhất mà chỉ dừng lại ở việc lưu trữ hiển thị các kết quả của công cụ tìm kiếm Google, nên đôi khi vẫn còn những tin bài chƣa thực sự liên quan và đáp ứng được nhu cầu cập nhật tin tức của người dùng. Giao diện web mới chỉ đáp ứng được các chức năng đơn giản cơ bản của người dùng chứ chƣa có nhiều chức năng chuyên sâu hơn phục vụ việc sắp xếp theo dõi.

KẾT LUẬN CHUNG Kết quả đạt đƣợc của luận văn:

- Luận văn đã trình bày kiến trúc và nguyên tắc hoạt động chung của các hệ thống tìm kiếm thông tin trên mạng.

- Trên cơ sở tìm hiểu về hệ thống tìm kiếm, cũng nhƣ cách thức tìm kiếm trên mạng luận văn đã tập trung phân tích và đánh giá một số thuật toán đỗi sánh mẫu để áp dụng cho hệ thống tìm kiếm.

- Xây dựng một ứng dụng trên cơ sở mã nguồn mở, ngôn ngữ lập trình Java và một số công cụ phần mềm. Ứng dụng đánh giá và thu thập thông tin này chạy trên trình chủ localhost, và nó hoạt động dựa theo nguyên lý chung của một hệ thống tìm kiếm google. Với khả năng theo dõi sắp xếp và cập nhật những thông tin mới nhất liên quan đến các lĩnh vực mà người dùng quan tâm một cách nhanh nhất ứng dụng thực hiện đƣợc chức năng dò tìm các tệp html, phân tích các tệp mà nó tìm được và lưu trữ database vào MongoDB.

Tuy nhiên do hạn chế về thời gian, khả năng tìm hiểu, thiếu sót về kinh nghiệm nên kết quả thu đƣợc còn rất hạn chế và cần tiếp tục xây dựng và cải thiện nhiều hơn nữa trong tương lai sắp tới.

Hướng phát triển:

- Xây dựng hoàn thiện hơn các chức năng đã có của hệ thống để cải thiện hiệu suất.

- Thêm các chức năng phân tích ngôn ngữ tự nhiên để phân tích nội dung của các tin bài, lọc đƣợc những tin bài liên quan nhất đến từ khóa của người dùng đăng kí. Thêm khả năng phân loại, xếp hạng, nhận dạng các chủ đề liên quan. Cải thiện khả năng theo dõi với nhiều từ khóa từ nhiều người sử dụng.

- Nghiên cứu cách cải thiện hiệu năng truy xuất và lưu trữ đối với cơ sở dữ liệu MongoDB.

- Thêm các chức năng cho phép người dùng tương tác nhiều hơn với ứng dụng web.

Trong thời gian tới, tôi sẽ cố gắng hoàn thiện hơn hệ thống của mình để có thể phục vụ một cách tốt nhất các nhu cầu đã đặt ra nói riêng và các nhu cầu của người dùng nói chung.

Một phần của tài liệu Đánh giá và thu thập thông tin tự động trên internet sử dụng dịch vụ tìm kiếm (Trang 73 - 79)

Tải bản đầy đủ (PDF)

(80 trang)