Chương 5 CÁC ỨNG DỤNG SEMANTIC WEB
5.4.2.1 Search Engine truyền thống
Không thể tìm ra các tài nguyên thích hợp một cách hiệu quả vì:
• Những tài liệu người dùng muốn tìm có thể sử dụng những thuật ngữ khác (hay những từ đồng nghĩa khác). Ví dụ, ‘Myocardial infarction’ và ‘coronary thrombosis’ là tương đương nhau.
• Những lỗi chính tả và các biến thể của từ ngữ được xem là những thuật ngữ khác nhau đối với môi trường máy tính. Ví dụ, ‘psoriasis’ (đúng chính tả) và ‘psoriaisis’ (lỗi in ấn) được cho là khác nhau; tương tự, ‘anaemia’ (đúng chính tả đối với T.Anh) và ‘anemia’ (đúng chính tả đối với T.Mỹ) cũng được xem là khác nhau.
• Search Engine không thể xử lý các trang HTML một cách thông minh. Ví dụ, việc tìm kiếm các tài nguyên về ‘psoriasis’ (bệnh vảy nến) sẽ lấy tất cả các tài liệu có chứa từ này. Tuy nhiên, đa số các tài liệu đều không thích hợp/liên quan; nghĩa là, ‘psoriasis’ trong các tài liệu này được đề cập theo một cách khác với chủ đề của chúng. Ví dụ, một vài tài liệu sẽ đề cập đến ‘psoriasis’ ở
Luận văn tốt nghiệp: Nghiên cứu, tìm hiểu và xây dựng ứng dụng với
103
những câu ‘See also: psoriasis’; nghĩa là, tại đáy trang (hay tại một phần nào đó của trang) có đề cập đến những bệnh có triệu chứng tương tự.
Vì thế, người dùng phải:
• Học cách sử dụng Search Engine (SE) một cách hiểu quả nhất: tìm liên quan (related searches): vd: tìm ‘mar’, SE hiển thị những liên kết liên quan khác như ‘mission to mars’, ‘life on mars’, …tìm theo gốc từ (stemming): vd: tìm ‘swimming’, SE trả về những kết quả có chứa ‘swim’, ‘swims’, … tìm trên kết quả (search wthin): vd: nếu kết quả trả về quá nhiều, người dùng có thể chọn chức năng search within để SE tìm trên kết quả trả về trước đó. Ngoài ra còn có các đặc tính khác như: tìm theo phiên bản, tìm theo ngôn ngữ, tìm theo ngày (phạm vi ngày), … Các kĩ năng tìm kiếm khác như: dùng dấu ‘+’
(tìm tài liệu chứa tất cả các từ), dấu ‘-’ (tìm tài liệu không chứa những từ),
dấu “” (tìm cụm từ), các toán tử AND, OR, NOT, tìm theo site, tìm trên URL, tìm trên link, tìm trên title, dùng wildcard (kí tự thay thế), tìm gần kề
(vd: NEAR/5: các từ phải nằm cách nhau tối đa 5 từ), dùng NEST (dấu đóng/mở ngoặc), …
• Dùng nhiều Search Engine để mong có kết quả theo ý muốn. • Dùng các Search Engine chuyên biệt (theo lĩnh vực muốn tìm).