CHƯƠNG 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 6.1 Kết luận.

Một phần của tài liệu KHÓA LUẬN TỐT NGHIỆP LÀM GIÀU KHO DỮ LIỆU CHỈ MỤC BÀI BÁO KHOA HỌC (Trang 66)

6.1 Kết luận.

Trong khóa luận này, chúng tôi hiện thực một hệ thống dùng để cập nhập kho dữ liệu chỉ mục các bài báo khoa học từ các thư viện số vào các dữ liệu chỉ mục có sẵn. Như vậy, so với hệ thống DBLP hay các hệ thống được giới thiệu trong các bài báo [14][5][16] chúng tôi đã cải thiện được độ chính xác cũng như hiệu năng khi rút trích thông tin các bài báo trực tiếp trên các thư viện số. Khác với giải pháp được giới thiệu trong [3] của hệ thống ACI, thì hệ thống chúng tôi đã tận dụng được dữ liệu có sẵn từ DBLP cũng như thu thập được dữ liệu chỉ mục có sẵn trực tiếp từ thư viện số mà không cần download tài liệu về. Ngoài ra với chức năng tự động cập nhật theo thời gian định sẵn hệ thống đảm bảo được tính cập nhật các bài báo mới được công bố trên thư viện số.

Ngoài ra chúng tôi có được những kinh nghiệm về kỹ năng mềm như: kỹ năng làm việc nhóm, kỹ năng lập trình … Vận dụng được quy trình phát triển phần mềm trong quá trình thực hiện hệ thống. Ngoài ra các thành viên trong nhóm có được những kiến thức về rút trích thông tin chỉ mục cũng như hiểu biết về các hệ thống xây dựng kho dữ liệu chỉ mục hiện có.

6.2 Hướng phát triển.

Bước tiếp theo trong tương lai chúng tôi sẽ hoàn thiện hệ thống với các chức năng: - Hoàn thiện các chức năng của chương trình.

- Mở rộng thêm nhiều nguồn thu thập khác nhau. Bao gồm những thư viện số khác và từ các trang cá nhân của tác giả.

- Phân loại chủ đề cho các bài báo khoa học đã được thu thập dựa trên những thông tin về chỉ mục của bài báo.

- Tích hợp các module khác như module rút trích thông tin bài báo khoa học từ một tập các bài báo được người dùng nhập vào hay các module truy vấn và hỏi đáp trên dữ liệu thu thập được.

Một phần của tài liệu KHÓA LUẬN TỐT NGHIỆP LÀM GIÀU KHO DỮ LIỆU CHỈ MỤC BÀI BÁO KHOA HỌC (Trang 66)