Search Engine truyền thống

Một phần của tài liệu Tìm hiểu và xây dựng ứng dụng với Sematic web (Nguyên Thúc Anh Duy vs Nguyễn Thị Khánh Hòa) - 2 docx (Trang 55 - 56)

Chương 5 CÁC ỨNG DỤNG SEMANTIC WEB

5.4.2.1 Search Engine truyền thống

Không thể tìm ra các tài nguyên thích hợp một cách hiệu quả vì:

• Những tài liệu người dùng muốn tìm có thể sử dụng những thuật ngữ khác (hay những từ đồng nghĩa khác). Ví dụ, ‘Myocardial infarction’ và ‘coronary thrombosis’ là tương đương nhau.

• Những lỗi chính tả và các biến thể của từ ngữ được xem là những thuật ngữ khác nhau đối với môi trường máy tính. Ví dụ, ‘psoriasis’ (đúng chính tả) và ‘psoriaisis’ (lỗi in ấn) được cho là khác nhau; tương tự, ‘anaemia’ (đúng chính tả đối với T.Anh) và ‘anemia’ (đúng chính tả đối với T.Mỹ) cũng được xem là khác nhau.

• Search Engine không thể xử lý các trang HTML một cách thông minh. Ví dụ, việc tìm kiếm các tài nguyên về ‘psoriasis’ (bệnh vảy nến) sẽ lấy tất cả các tài liệu có chứa từ này. Tuy nhiên, đa số các tài liệu đều không thích hợp/liên quan; nghĩa là, ‘psoriasis’ trong các tài liệu này được đề cập theo một cách khác với chủ đề của chúng. Ví dụ, một vài tài liệu sẽ đề cập đến ‘psoriasis’ ở

Luận văn tốt nghiệp: Nghiên cứu, tìm hiểu và xây dựng ứng dụng với

103

những câu ‘See also: psoriasis’; nghĩa là, tại đáy trang (hay tại một phần nào đó của trang) có đề cập đến những bệnh có triệu chứng tương tự.

Vì thế, người dùng phải:

• Học cách sử dụng Search Engine (SE) một cách hiểu quả nhất: tìm liên quan (related searches): vd: tìm ‘mar’, SE hiển thị những liên kết liên quan khác như ‘mission to mars’, ‘life on mars’, …tìm theo gc t (stemming): vd: tìm ‘swimming’, SE trả về những kết quả có chứa ‘swim’, ‘swims’, … tìm trên kết qu (search wthin): vd: nếu kết quả trả về quá nhiều, người dùng có thể chọn chức năng search within để SE tìm trên kết quả trả về trước đó. Ngoài ra còn có các đặc tính khác như: tìm theo phiên bn, tìm theo ngôn ngữ, tìm theo ngày (phm vi ngày), … Các kĩ năng tìm kiếm khác như: dùng du ‘+’

(tìm tài liệu chứa tất cả các từ), du ‘-’ (tìm tài liệu không chứa những từ),

du “” (tìm cụm từ), các toán tử AND, OR, NOT, tìm theo site, tìm trên URL, tìm trên link, tìm trên title, dùng wildcard (kí tự thay thế), tìm gn k

(vd: NEAR/5: các từ phải nằm cách nhau tối đa 5 từ), dùng NEST (dấu đóng/mở ngoặc), …

• Dùng nhiều Search Engine để mong có kết quả theo ý muốn. • Dùng các Search Engine chuyên biệt (theo lĩnh vực muốn tìm).

Một phần của tài liệu Tìm hiểu và xây dựng ứng dụng với Sematic web (Nguyên Thúc Anh Duy vs Nguyễn Thị Khánh Hòa) - 2 docx (Trang 55 - 56)

Tải bản đầy đủ (PDF)

(61 trang)