.25 – Khung tìm kiếm nâng cao của Google Scholar

Một phần của tài liệu Đề tài: ĐÁNH GIÁ NĂNG LỰC NGHIÊN CỨU CỦA CÁ NHÂN, TỔ CHỨC DỰA TRÊN PHÂN TÍCH, TÍNH TOÁN CÁC CHỈ SỐ KHOA HỌC potx (Trang 68 - 70)

Hình 2.26 – Kết quả tìm kiếm các bài báo và bằng sáng chế với từ khóa “data”.

2.5.7 CiteSeerX

CiteSeerX, được nâng cấp lên từ CiteSeer, là một hệ thống thư viện điện tử được cung cấp bởi trường khoa học và công nghệ thuộc đại học bang Pennsylvania [CS][CSH].

Bảng sau thể hiện thông tin chi tiết của CiteSeerX:

Bảng 2.6 – Thông tin chi tiết về CiteSeerX.

Tên hệ thống CiteSeerX

Địa chỉ http://citeseerx.ist.psu.edu

Loại thư viện

CiteSeerX cung cấp các các tài liệu miễn phí tới người dùng theo một chứng nhận mở “Creative Commons Attribution- NonCommercial-ShareAlike 3.0 Unported License”, cho phép người dùng được tìm kiếm, xem thơng tin chỉ mục, xem và tải các văn bản tài liệu được cung cấp trên CiteSeerX. Ngồi ra, dự án CiteSeerX cịn cung cấp cho người dùng những công cụ hỗ trợ việc nghiên cứu và xây dựng các thư viện số, ví dụ các thuật tốn, dữ liệu, các cơng nghệ…

Cho phép người dùng tìm kiếm tài liệu, xem và tải tài liệu nếu có sẵn, đi đến nguồn của tài liệu, ngồi ra cịn thể thể tìm hiểu về các thuộc tính khác như số trích dẫn của tài liệu, các mối quan hệ ngữ nghĩa như quan hệ tác giả, quan hệ trích dẫn…

Các chức năng

Tìm kiếm: Hỗ trợ tìm kiếm nhiều loại tài liệu từ nguồn trên

internet, người dùng có thể chọn loại tài liệu cần tìm: bài báo khoa học, bằng sáng chế, tạp chí, văn bản luật …

CiteSeerX hiển thị phần nội dung tìm kiếm được dùng trong tài liệu, do đó nâng cao hiệu quả tìm kiếm. CiteSeerX cho phép xem các ngữ cảnh trích dẫn trong các tài liệu.

Người dùng có thể tìm kiếm cơ bản hoặc tìm kiếm nâng cao với nhiều tiêu chí tìm kiếm hơn.

Chức năng tìm kiếm nâng cao: CiteSeerX hỗ trợ các tiêu chí

tìm kiếm tài liệu theo nội dung tài liệu, tựa đề, nội dung phần tổng quan, tác giả, hội nghị, tạp chí, tổ chức, năm xuất bản, từ khóa.

Chức năng tìm kiếm bài báo liên quan: CiteSeerX có hỗ trợ

chức năng liệt kê những bài báo có liên quan hay tương tự với bài báo đang duyệt về mặt nội dung và mặt trích dẫn. Chức năng này hoạt động dựa trên thuật tốn CCIDF để tìm các bài báo tương đồng về mặt trích dẫn.

Autonomous Citation Indexing (ACI): tự động tạo chỉ mục

trích dẫn.

Thống kê trích dẫn: CiteSeerX thống kê trích dẫn cho tất cả

các tài liệu được tham khảo, không chỉ các tài liệu được lập chỉ mục.

Liên kết tham khảo: CiteSeerX cho phép duyệt cơ sở dữ liệu

CiteSeerX có chức năng thơng báo cho người dùng nêu có các trích dẫn mới đến một tài liệu nào đó, hoặc có tài liệu mới thuộc loại người dùng mong muốn.

CiteSeerX có thể được duyệt theo các tài liệu liên quan, dựa trên nội dung của tài liệu và các trích dẫn.

Cách xếp hạng kết quả tìm kiếm

Máy tìm kiếm CiteSeerX dựa trên lõi là máy tìm kiếm Solr, là một dự án con của Lucene. Kết quả tìm kiếm cũng được sắp xếp dựa trên việc tổng hợp hai tiêu chí: độ tương quan của nội dung mỗi đối tượng với câu truy vấn và độ quan trọng tồn cục của đối tượng đó.

Nội dung Nội dung dữ liệu và siêu dữ liệu của CiteSeerX được thu thập tự động bằng cách sử dụng web crawler với cơ chế crawl chọn lọc từ một số nguồn nhất định, dữ liệu trên CiteSeerX vẫn đang được cập nhật liên tục, tập trung vào lĩnh vực khoa học thơng tin và máy tính.

Sau chi crawl về, CiteSeerX tiến hành phân tích các tài liệu crawl được để lấy thông tin metadata cần thiết.

Số lượng cụ thể của các tài liệu không được công bố, và phụ thuộc mật thiết vào số lượng tài liệu mà crawler của CiteSeerX tiếp cận được.

Sau đây là các hình ảnh minh họa cho CiteSeerX:

Một phần của tài liệu Đề tài: ĐÁNH GIÁ NĂNG LỰC NGHIÊN CỨU CỦA CÁ NHÂN, TỔ CHỨC DỰA TRÊN PHÂN TÍCH, TÍNH TOÁN CÁC CHỈ SỐ KHOA HỌC potx (Trang 68 - 70)