Phát triển một giải thuật xếp hạng các thông tin truy hồi trên môi trường web dựa trên các thực thể có tên

87 13 0
Phát triển một giải thuật xếp hạng các thông tin truy hồi trên môi trường web dựa trên các thực thể có tên

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ðại Học Quốc Gia Tp Hồ Chí Minh TRƯỜNG ðẠI HỌC BÁCH KHOA NGÔ THI PHÁT TRIỂN MỘT GIẢI THUẬT XẾP HẠNG CÁC THÔNG TIN TRUY HỒI TRÊN MÔI TRƯỜNG WEB DỰA TRÊN CÁC THỰC THỂ CÓ TÊN Chuyên ngành: Khoa học máy tính Mã số ngành: 60.48.01 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng năm 2008 ii CƠNG TRÌNH ðƯỢC HỒN THÀNH TẠI TRƯỜNG ðẠI HỌC BÁCH KHOA ðẠI HỌC QUỐC GIA TP HỒ CHÍ MINH Cán hướng dẫn khoa học : TS Quản Thành Thơ Cán chấm nhận xét : PGS TS Cao Hoàng Trụ Cán chấm nhận xét : TS Nguyễn ðức Cường Luận văn thạc sĩ ñược bảo vệ HỘI ðỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ TRƯỜNG ðẠI HỌC BÁCH KHOA, ngày tháng năm 2008 ðẠI HỌC QUỐC GIA TP HCM TRƯỜNG ðẠI HỌC BÁCH KHOA CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM ðộc Lập - Tự Do - Hạnh Phúc -oOo Tp HCM, ngày 20 tháng năm 2008 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên : Ngơ Thi Giới tính : Nam / Nữ Ngày, tháng, năm sinh : 9/7/1983 .Nơi sinh : Khánh Hoà Chuyên ngành : Khoa học máy tính Khoá : 2006 1- TÊN ðỀ TÀI : PHÁT TRIỂN MỘT GIẢI THUẬT XẾP HẠNG CÁC THÔNG TIN TRUY HỒI TRÊN MÔI TRƯỜNG WEB DỰA TRÊN CÁC THỰC THỂ CÓ TÊN 2- NHIỆM VỤ LUẬN VĂN : 3- NGÀY GIAO NHIỆM VỤ : 21/1/2008 4- NGÀY HOÀN THÀNH NHIỆM VỤ : 30/6/2008 5- HỌ VÀ TÊN CÁN BỘ HƯỚNG DẪN : TS Quản Thành Thơ Nội dung ñề cương Luận văn thạc sĩ ñã ñược Hội ðồng Chuyên Ngành thông qua CÁN BỘ HƯỚNG DẪN (Họ tên chữ ký) CHỦ NHIỆM BỘ MÔN QUẢN LÝ CHUYÊN NGÀNH (Họ tên chữ ký) TS Quản Thành Thơ TS ðinh ðức Anh Vũ LỜI CAM ðOAN Tơi cam đoan rằng, ngoại trừ kết tham khảo từ cơng trình khác ghi rõ luận văn, cơng việc trình bày luận văn tơi thực chưa có phần nội dung luận văn ñược nộp ñể lấy cấp trường trường khác Ngày 20 tháng năm 2008 Ngô Thi LỜI CẢM ƠN ðầu tiên, xin ñược gởi lời cảm ơn sâu sắc ñến Thầy TS Quản Thành Thơ, người Thầy tận tình hướng dẫn tơi mơn chun đề hồn thành luận văn, xin cảm ơn Thầy đề tài thật hay Em xin cảm ơn Thầy PGS.TS Cao Hoàng Trụ, chủ nhiệm ñề tài VN-KIM, ñã tạo ñiều kiện thuận lợi để em hồn thành luận văn Xin cảm ơn thạc sĩ Huỳnh Tấn ðạt, kỹ sư Nguyễn Minh Luân, kỹ sư Hồng Trung Dũng, kỹ sư Hoàng Minh Sơn nhóm dự án VN-KIM tận tình giúp đỡ để luận văn hồn thành hơm Cuối cùng, cảm ơn Ba, Má người thân khích lệ, động viên thời gian học tập, nghiên cứu để có thành ngày Tháng năm 2008 Học viên Ngô Thi TĨM TẮT Ngày thơng tin đóng vai trị quan trọng lĩnh vực ñời sống, kinh tế, xã hội Cùng với bùng nổ liệu web, vai trị cơng cụ truy hồi hạng thơng tin khẳng định Giải thuật xếp hạng thơng tin truy hồi theo từ khóa PageRank giải thuật cho chất lượng xếp hạng tốt Mặt khác việc thích ngữ nghĩa cho tài liệu web truyền thống ñã ñạt ñược kết khả quan Việc kết hợp giải thuật PageRank ngữ nghĩa thực thể có tên nhận diện trang web ñể cải thiện chất lượng xếp hạng hướng ñi hợp lý Trong luận văn này, chúng tơi đề hướng áp dụng giải thuật PageRank ñể xây dựng vector PageRank cho không gian name, class, name+class id thực thể có tên cho trang web (NE PageRank) Kết ñạt ñược sở cho hai phương pháp hạng dựa việc kết hợp hai ñộ ño NE PageRank Sim (ñộ tương tự truy vấn với trang web) Kết ñạt ñược cho thấy, kết theo hạng giải thuật NE PageRank có chất lượng tốt Hai phương pháp hạng dựa kết hợp hai ñộ ño NE PageRank Sim kế thừa ñược ưu ñiểm hai hệ thống ðộ xác kết ñược truy hồi tốt hệ thống dựa từ khóa truyền thống nhờ dựa thực thể có tên Kết luận, web ngữ nghĩa hướng phát triển tất yếu hệ web Tiếp tục phát triển giải thuật xếp hạng cho thông tin truy hồi mơi trường web nói chung web có ngữ nghĩa nói riêng hướng đúng, đem lại nhiều lợi ích to lớn cần ñược trì Mục lục LỜI CAM ðOAN LỜI CẢM ƠN TÓM TẮT .6 Danh mục hình Danh mục bảng .11 Chương Phát biểu vấn ñề 12 1.1 Thực thể có tên 12 1.2 Bộ máy tìm kiếm .13 1.3 Kết hợp giải thuật PageRank NE 15 Chương Tổng thuật cơng trình liên quan ñến ñề tài 16 2.1 Giải thuật HITS 16 2.2 Giải thuật PageRank 17 2.3 Giải thuật Topic-Sensitive PageRank 18 2.4 Truy hồi thơng tin theo thực thể có tên 18 Chương Cơ sở lý thuyết 21 3.1 Hệ thống thích thực thể có tên VN-KIM 21 3.1.1 Tổng quan .21 3.1.2 VN-KIM Ontology (VN-KIMO) .23 3.1.3 Cơ sở tri thức VN-KIM 26 3.1.4 Sự rút trích thơng tin VN-KIM 26 3.1.5 Ứng dụng thích NE trang web với plug-in cho trình duyệt Internet Explorer 28 3.2 Chi tiết giải thuật PageRank 29 3.2.1 Tổng quan .29 3.2.2 Giải thuật PageRank 30 3.2.2.1 Một minh họa ñơn giản cho giải thuật PageRank 31 3.2.2.2 Giải thuật PageRank tổng quát 32 3.2.2.3 Mã giả giải thuật PageRank 36 3.3 Mơ hình khơng gian vector ñộ tương tự Sim .37 3.3.1 Mơ hình khơng gian vector (VSM) cho truy hồi thơng tin theo từ khóa 37 3.3.2 ðộ tương tự tài liệu truy vấn Sim 37 3.3.3 Mô hình áp dụng cho NE 38 Chương Các giải thuật hạng thông tin truy hồi môi trường web dựa thực thể có tên .39 4.1 Giải thuật NE PageRank 39 4.2 Kết hợp giá trị NE PageRank ñộ tương tự truy vấn tài liệu Sim .44 4.2.1 Giải thuật hạng theo Sim có hỗ trợ NE PageRank 44 4.2.2 Giải thuật hạng theo NE PageRank có hỗ trợ Sim 45 Chương Hiện thực kết thực nghiệm .47 5.1 Hiện thực 47 5.2 Thời gian tính tốn NE PageRank kích thước liệu lưu trữ 50 5.3 Các kết thực nghiệm 52 5.3.1 Khác biệt hạng theo NE PageRank theo Sim 52 5.3.2 Chất lượng hạng theo Sim có hỗ trợ NE PageRank tốt so với dựa Sim 58 5.3.3 Sắp hạng theo NE PageRank có hỗ trợ Sim tốt dựa NE PageRank 61 5.3.4 Ưu ñiểm độ xác nhờ hạng dựa thực thể có tên 66 5.3.5 So sánh hạng theo Sim có hỗ trợ NE PageRank với Google Desktop 70 5.3.6 So sánh hạng theo NE PageRank có hỗ trợ Sim với Google Desktop 74 5.3.7 So sánh truy vấn theo class hạng theo NE PageRank có hỗ trợ Sim với Google Desktop 77 5.3.8 So sánh truy vấn theo class hạng theo Sim có hỗ trợ NE PageRank với Google Desktop 80 Chương Kết luận hướng mở rộng 83 6.1 Các đóng góp cơng trình .83 6.2 Kiến nghị nghiên cứu .83 Tài liệu tham khảo 85 Danh mục hình Hình 2-1 Sơ đồ mơ hình truy hồi thơng tin dựa thực thể có tên .20 Hình 3-1 Ontology sở tri thức .22 Hình 3-2 Kiến trúc VN-KIM .23 Hình 3-3 Ontology VN-KIM [26] .25 Hình 3-4 Thành phần rút trích thơng tin VN-KIM [10] 27 Hình 3-5 Plug-in cho Internet Explorer 29 Hình 3-6 Các liên kết site dùng cho tính tốn PageRank [24] 30 Hình 3-7 Vùng sink 33 Hình 4-1 Tính giá trị PageRank cho thành phần thứ vector PRN 40 Hình 4-2 Mơ hình đề nghị 43 Hình 4-3 Sắp hạng nội khoảng Sim bị thay ñổi dựa NE PageRank 45 Hình 4-4 Sắp hạng nội khoảng NE PageRank bị thay đổi dựa Sim 46 Hình 5-1 Kiến trúc hệ thống truy hồi thông tin thời .47 Hình 5-2 Kiến trúc hệ thống truy hồi thông tin 49 Hình 5-3 Truy vấn Nha Trang hạng theo NE PageRank 54 Hình 5-4 Truy vấn Nha Trang hạng theo Sim (trang 1) 55 Hình 5-5 Truy vấn Nha Trang hạng theo Sim (trang 2) 56 Hình 5-6 Kết hạng Google Desktop truy vấn từ khóa "Nha Trang" 57 Hình 5-7 Truy vấn Nha Trang hạng theo Sim với hỗ trợ NE PageRank (trang 1) 59 Hình 5-8 Truy vấn Nha Trang hạng theo Sim với hỗ trợ NE PageRank (trang 2) .60 Hình 5-9 Truy vấn Bình Nhưỡng hạng theo NE PageRank (trang 1) 62 Hình 5-10 Truy vấn Bình Nhưỡng hạng theo NE PageRank (trang 2) 63 10 Hình 5-11 Truy vấn Bình Nhưỡng hạng theo NE PageRank có hỗ trợ Sim (trang 1) 64 Hình 5-12 Truy vấn Bình Nhưỡng hạng theo NE PageRank có hỗ trợ Sim (trang 2) 65 Hình 5-13 Truy vấn người tên Thế Anh hạng theo NE PageRank có hỗ trợ Sim 67 Hình 5-14 Truy vấn người tên Thế Anh hạng theo Sim có hỗ trợ NE PageRank 68 Hình 5-15 Truy vấn Thế Anh hạng Google Desktop .69 Hình 5-16 Truy vấn sân vận động Vinh hạng theo Sim có hỗ trợ NE PageRank (trang 1) 71 Hình 5-17 Truy vấn sân vận ñộng Vinh hạng theo Sim có hỗ trợ NE PageRank (trang 2) 72 Hình 5-18 Truy vấn "sân vận động" Vinh hạng Google Desktop 73 Hình 5-19 Các đường dẫn có liên quan đến Mai Phương Thuý 74 Hình 5-20 Truy vấn Mai Phương Thuý hạng NE PageRank có hỗ trợ Sim 75 Hình 5-21 Truy vấn Mai Phương Thuý hạng Google Desktop 76 Hình 5-22 Truy vấn class “Câu lạc thể thao” hạng theo NE có hỗ trợ Sim .78 Hình 5-23 Truy vấn “câu lạc thể thao” hạng theo Google Desktop 79 Hình 5-24 Truy vấn “Tổ chức thể thao” hạng theo Sim có hỗ trợ NE PageRank 81 Hình 5-25 Truy vấn “tổ chức thể thao” hạng Google Desktop 82 73 Hình 5-18 Truy vấn "sân vận ñộng" Vinh hạng Google Desktop 74 5.3.6 So sánh hạng theo NE PageRank có hỗ trợ Sim với Google Desktop Với truy vấn hoa hậu Mai Phương Thuý ("Mai Phương Thuý /*/*"), kết hạng theo NE PageRank có hỗ trợ Sim Hình 5-20 Hai tin ñược ñược title không xuất chữ “Mai Phương Thuý” tin ñáng quan tâm, với tin ñược ñầu “Việt Hùng ñầu tư cho Hoa hậu VN khơng vụ lợi” đề cập ñến nhà thiết kế “Việt Hùng” gắn liền với thành cơng “Mai Phương Th” đoạt giải hoa hậu Việt Nam tiếp tục dự thi hoa hậu giới, có số lần xuất “Mai Phương Thuý” lên tới 14 lần, kèm trang tập hợp hầu hết đường dẫn quan trọng có liên quan đến “Mai Phương Thuý” Tin ñược thứ hai “Ứng viên sáng giá cho danh hiệu Hoa hậu Việt Nam” dự đốn kết thi hoa hậu, có đề cập đến đánh giá “Mai Phương Thuý” có triển vọng cao, trang tin chứa đường dẫn quan trọng có liên quan (Hình 5-19) Các tin so sánh với trang tin Google Desktop Hình 5-21 ñáng quan tâm quan trọng Trong tin giành vị trí thứ thứ với hạng Google Desktop Hình 5-19 Các đường dẫn có liên quan đến Mai Phương Th 75 Hình 5-20 Truy vấn Mai Phương Thuý hạng NE PageRank có hỗ trợ Sim 76 Hình 5-21 Truy vấn Mai Phương Thuý hạng Google Desktop 77 5.3.7 So sánh truy vấn theo class hạng theo NE PageRank có hỗ trợ Sim với Google Desktop Truy vấn dùng class “*/Câu_lạc_bộ_thể_thao/*” hạng dùng NE PageRank có hỗ trợ Sim, kết Hình 5-22 liên quan trực tiếp ñến hay vài câu lạc thể thao Chẳng hạn kết ñầu tiên chứa lịch thi ñấu nhiều câu lạc bóng đá, đường dẫn liên quan ñến câu lạc quan trọng, tên câu lạc ñược ñề cập tên ñường dẫn, kết thứ hai ñề cập ñến giải thi đấu vơ địch quốc gia Việt Nam V-League với nhiều câu lạc bóng đá tham gia Trong kết truy vấn cụm “câu lạc thể thao” Google Desktop Hình 5-23 có chất lượng không tốt Chẳng hạn với kết Google Desktop, trang có xuất cụm từ “thể thao, câu lạc bộ”, trang tin ñề cập ñến thắc mắc thí sinh ngành, trung tâm thể thao trường đại học Hay kết thứ hai nói trang web GenQ ñược gọi “câu lạc bộ” có tổ chức số hoạt động “âm nhạc, thể thao hoạt động ngoại khố trường đại học” thấy tiêu điểm khơng phải câu lạc thể thao Có điều nhờ khả nhận diện thực thể NE thuộc lớp hệ thống, Google Desktop khơng có được, Google Desktop dựa vào xuất cụm từ truy vấn để tìm kiếm 78 Hình 5-22 Truy vấn class “Câu lạc thể thao” hạng theo NE có hỗ trợ Sim 79 Hình 5-23 Truy vấn “câu lạc thể thao” hạng theo Google Desktop 80 5.3.8 So sánh truy vấn theo class hạng theo Sim có hỗ trợ NE PageRank với Google Desktop Với truy vấn theo class “*/Tổ_chức_thể_thao/*”, kết ñầu hạng theo Sim có hỗ trợ NE PageRank Hình 5-24 ñề cập ñến tổ chức thể thao lớn, ñược quan tâm Trong kết ñầu theo Google Desktop Hình 5-25 khơng xác dựa vào xuất cụm từ truy vấn Kết Google Desktop nhầm lẫn ñộng từ “tổ chức” câu “Việt Nam tổ chức ðại hội Thể thao” với cụm từ truy vấn, lỗi tương tự xảy kết thứ 81 Hình 5-24 Truy vấn “Tổ chức thể thao” hạng theo Sim có hỗ trợ NE PageRank 82 Hình 5-25 Truy vấn “tổ chức thể thao” hạng Google Desktop 83 Chương Kết luận hướng mở rộng 6.1 Các đóng góp cơng trình Việc dựa thực thể có tên để hạng thơng tin truy hồi từ mơi trường web đóng góp luận văn Chúng tơi đề xuất thực việc áp dụng giải thuật NE PageRank ñể xây dựng vector PageRank cho bốn không gian name, class, name+class id thực thể có tên cho trang web, làm sở cho việc hạng kết truy vấn Việc dựa trọng số NE PageRank, ñã cho chất lượng hạng trang tốt ðề xuất thực thành cơng hai mơ hình hạng cho thơng tin truy hồi dựa thực thể có tên là: • Sắp hạng theo NE PageRank có hỗ trợ Sim, • Sắp hạng theo Sim có hỗ trợ NE PageRank Hai mơ hình kế thừa ưu ñiểm hai hệ thống ñộ ño NE PageRank Sim, giúp gia tăng chất lượng hạng, đồng thời có ưu điểm bật độ xác so với mơ hình dựa từ khóa truyền thống, nhờ dựa thực thể có tên 6.2 Kiến nghị nghiên cứu Hiện hệ thống tính trọng số độ tương tự Sim chưa có phân biệt vị trí xuất NE, chẳng hạn NE xuất tiêu ñề quan trọng hơn, hay dựa 84 việc NE ñược in ñậm, kích thước chữ, màu sắc…Nếu thực cải tiến chắn giúp gia tăng chất lượng ñộ ño Sim Mặt khác, thực luận văn chưa hỗ trợ truy vấn Boolean, truy vấn lồng nhau, hướng nghiên cứu ñể hệ thống ñược hoàn thiện 85 Tài liệu tham khảo [1] Allan borodin, Gareth O Roberts, Jeffrey S Rosenthal, Panayiotis Tsaparas Link Analysis Ranking: Algorithms, Theory, and Experiments ACM Transactions on Internet Technology, Vol 5, No 1, pp 231–297, 2/2005 [2] Amy N Langville, Carl D Meyer Deeper Inside PageRank 10/2004 [3] Amy N Langville, Carl D Meyer A Survey of Eigenvector Methods for Web Information Retrieval Society for Industrial and Applied Mathematics, Vol 47, No 1, pp 135–161, 2005 [4] Andrei Mikheev, Marc Moens, Claire Grover Named Entity Recognition without Gazetteers Proceedings of EACL, 1999 [5] Atanas Kiryakov, Borislav Popov, Damyan Ognyanoff, Dimitar Manov, Angel Kirilov, Miroslav Goranov Semantic Annotation, Indexing, and Retrieval Ontotext Lab, Sirma AI EOOD [6] Ayman Farahat, Thomas LoFaro, Joel C Miller, Gregory Rae, Lesley A Ward Authority Rankings From Hits, Pagerank, And Salsa: Existence, Uniqueness, And Effect Of Initialization Society for Industrial and Applied Mathematics, Vol 27, No 4, pp 1181–1201, 2006 [7] Benjamin M Schmidt, Matthew M Chingos Ranking Doctoral Programs by Placement:A New Method Apsanet [8] Borislav Popov, Atanas Kiryakov, Angel Kirilov, Dimitar Manov, Damyan Ognyanoff, Miroslav Goranov KIM – Semantic Annotation Platform Ontotext Lab, Sirma AI EOOD [9] Borislav Popov, Ilian Kitchukov, Krasimir Angelov, Atanas Kiryakov Co- occurrence and Ranking of Entities Ontotext Lab, Sirma Group Corp [10] Cao Hoàng Trụ Báo cáo khoa học kỹ thuật Nghiên cứu phát triển kĩ thuật xây dựng khai thác thông tin Web có ngữ nghĩa 9/2006 [11] Demetrios Eliopoulos, Calvin Gotlieb Evaluating Web Search EBSCO Publishing, 2003 [12] Devanshu Dhyani, Wee Keong Ng, Sourav S Bhowmick A Survey of Web Metrics ACM Computing Surveys, Vol 34, No 4, pp 469–503, 12/2002 86 [13] F Rimbach, M Dannenberg, U Bleimann Page ranking and topic-sensitive page ranking: micro-changes and macro-impact Internet Research, Vol 17 No 1, pp 38-48, 2007, Emerald Group [14] Google’s technology http://www.google.com/corporate/tech.html, 10/2007 [15] Héctor Oscar Nigro, Sandra Elizabeth González Císaro, Daniel Hugo Xodo Data Mining with Ontologies: Implementations, Findings, and Frameworks Information Science Reference, ISBN 978-1-59904-620-4 [16] Jon Kleinberg Authoritative sources in a hyperlinked environment Proc Ninth Ann ACM-SIAM Symp Discrete Algorithms, pp 668-677, ACM Press, New York [17] Li Ding, Rong Pan, Tim Finin, Anupam Joshi, Yun Peng, Pranam Kolari Finding and Ranking Knowledge on the Semantic Web Proceedings of the 4th International Semantic Web Conference, Galway IE, November 2005, Springer-Verlag [18] Martin P Courtois, Michael W Berry Results ranking in Web Search Engines [19] Michael C Daconta, Leo J Obrst, Kevin T Smith The Semantic Web: A Guide to the Future of XML, Web Services, and Knowledge Management John Wiley & Sons, 2003 [20] Michael P Evans Analysing Google rankings through search engine optimization data Emerald Group, Internet Research, Vol 17, No 1, pp 21-37, 2007 [21] Monica Bianchini, Marco Gori, Franco Scarselli Inside PageRank ACM Journal [22] Monica Bianchini, Marco Gori, Franco Scarselli PageRank A Circuital Analysis http://www2002.org/CDROM/poster/165.pdf [23] Ngô Minh Vương Truy hồi thơng tin theo thực thể có tên Luận văn thạc sĩ, ñại học Bách Khoa, TP.HCM, 7/2007 [24] PageRank http://en.wikipedia.org/wiki/PageRank 10/2007 [25] Peter T Davis, David K Elson, Judith L Klavans Methods for Precise Named Entity Matching in Digital Collections IEEE, 2003 87 [26] Phạm Thế Nghĩa, Hoàng Minh Sơn Hiện thực hệ thống quản lý xử lý trang web tiếng Việt có thích nghữ nghĩa Luận văn tốt nghiệp ñại học, ñại học Bách Khoa, TP.HCM, 1/2008 [27] Ricardo Baeza-Yates, Berthier Ribeiro-Neto Modern Information Retrieval ACM Press, New York, 1999 [28] Satoshi Sekine Named Entity: History and http://www.cs.nyu.edu/~sekine/papers/NEsurvey200402.pdf Future I [29] Sergey Brin, Lawrence Page The Anatomy of a Large-Scale Hypertextual Web Search Engine In Proc 7th International World Wide Web Conference, Brisbane, Australia, 5/1998 [30] Sergey Brin, Lawrence Page, Rajeev Motwani, Terry Winograd The PageRank Citation Ranking: Bringing Order to the Web Stanford Publication, 1/1998 [31] Sixth Message Understanding Conference (MUC-6) Morgan Kaufmann Publishers, Inc., ISBN 1-55860-402-2, 11/1995 [32] Susan Dumais, Edward Cutrell, JJ Cadiz, Gavin Jancke, Raman Sarin, Daniel C Robbins Stuff I’ve Seen: A System for Personal Information Retrieval and Re-Use Microsoft Research SIGIR’03, Toronto, Canada, ACM, 2003 [33] Taher H Haveliwala Topic-Sensitive PageRank ACM, ISBN 1-58113-449- 5, 5/2002 [34] Taher H Haveliwala Efficient Computation of PageRank Stanford Publication, 10/1999 ... truy? ??n thống nhờ dựa thực thể có tên Kết luận, web ngữ nghĩa hướng phát triển tất yếu hệ web Tiếp tục phát triển giải thuật xếp hạng cho thông tin truy hồi mơi trường web nói chung web có ngữ nghĩa... 2006 1- TÊN ðỀ TÀI : PHÁT TRIỂN MỘT GIẢI THUẬT XẾP HẠNG CÁC THÔNG TIN TRUY HỒI TRÊN MƠI TRƯỜNG WEB DỰA TRÊN CÁC THỰC THỂ CĨ TÊN 2- NHIỆM VỤ LUẬN VĂN : ... xây dựng giải thuật hạng có chất lượng cao cho thơng tin truy hồi mơi trường web dựa thực thể có tên 16 Chương Tổng thuật cơng trình liên quan ñến ñề tài Các kỹ thuật truy hồi thơng tin truy? ??n

Ngày đăng: 08/03/2021, 23:54

Tài liệu cùng người dùng

Tài liệu liên quan