Chương 3 : CÁCH TIẾP CẬN CỦA ĐỀ TÀI
3.3 Thảo luận về các phương pháp xếp hạng
Ở trên đề tài đã khảo sát PageRank và PopRank, đây đều là các thuật toán xếp hạng độ phổ biến tốt. PageRank đã ra đời khá lâu và được ứng dụng thành
cơng thực tế trong máy tìm kiếm Google Search. Thuật tốn PageRank cũng có thể được dùng trong việc phân tích mạng và xếp hạng một loại đối tượng nào đấy, với điều kiện là các đối tượng này phải thuần nhất và các liên kết cũng thuần nhất. Từ đó ta thấy PageRank cũng có thể ứng dụng để tính độ phổ biến của các bài báo khoa học, nhưng phải giới hạn đối tượng tham gia vào tính tốn chỉ có bài báo khoa học và liên kết tham gia vào tính tốn chỉ có liên kết trích dẫn. Điều này làm hạn chế độ chính xác khi xếp hạng. PopRank và các thuật tốn tương tự như PopRank đưa vào tính tốn của mình nhiều loại đối tượng và nhiều loại liên kết khác nhau. Những tác giả của PopRank khi đề xuất thuật tốn này đã so sánh trực tiếp nó với PageRank và kết quả thử nghiệm cho thấy nó tốt hơn PageRank trong việc xếp hạng độ phổ biến các bài báo khoa học. Tuy nhiên tác giả đã không so sánh PopRank với các thuật tốn có cùng ý tưởng khác, ngoài ra tập dữ liệu dùng trong việc tính tốn, đánh giá cũng khá nhỏ để có thể có kết luận mạnh (45 đối tượng dùng để tính tốn, 22 đối tượng dùng để đánh giá). Trong q trình tính tốn PopRank, có một phần quan trọng là gán giá trị của các hệ số truyền, PopRank gán các hệ số này theo một thuật tốn heuristic với khá nhiều sự phỏng đốn, vì vậy việc thử nghiệm nhiều nhiều hơn rất cần thiết để bảo đảm thuật toán heuristic này hoạt động tốt.
Như đã nói ở phần trên, độ phổ biến của một đối tượng không đồng nghĩa với chất lượng của đối tượng đó, tuy nhiên xếp hạng độ phổ biến là một tham khảo tốt để xếp hạng chất lượng các đối tượng khi việc xếp hạng chính xác chất lượng là không thể.