chương trình quảng cáo, người dùng thấy một sản phẩm ưu thích, có thể chọn sản phẩm đó và công cụ tìm kiếm sẽ vận dụng Semantic Web, web 3.0 sẽ được miêu tả đầy đủ với nguồn thông tin rất dồi dào, từ giá cả, đánh giá, nơi bán, kèm nhiều hình ảnh, video clip và các sản phẩm tương đồng, cùng loại...
6. Vận dụng cơ sở tri thức khai thác dữ liệu và áp dụng cải tiến thuật toán K-Means, thuật toán di truyền trong việc phân cụm văn bản để nhóm các đối tượng tương tự nhau trong tập dữ liệu vào các cụm sao cho các đối tượng thuộc cùng một lớp là tương đồng còn các đối tượng thuộc các cụm khác nhau sẽ không tương đồng, nhằm cải thiện hiệu năng và tính hiện thực tìm kiếm thông tin nhanh chóng và chính xác.
Trên bộ dữ liệu lớn, việc vận dụng các thuật toán đã học như: Thuật toán K-means và giải thuật dựa trên mạng nơron thần kinh, lưới Kohonen được sử dụng. thành công nhất. Là lời giải cho các vấn đề thú vị, hữu ích, và đầy thách thức. Nó có tiềm năng lớn trong các ứng dụng như nhận điện đối tượng, phân đoạn hình ảnh, và các chọn lọc và truy hồi thông tin.
7. Vận dụng cơ sở tri thức khai thác dữ liệu, cải tiến thuật toán Caffeine: tập trung vào lập chỉ mục và thu thập thông tin các trang web để gia tăng tốc độ hiển thị kết quả, thành dạng tập trung vào xếp hạng các trang web cho kết quả phù hợp tốt hơn bằng cách khai thác sâu vào Knowledge Graph, để gia tăng tương tác tự nhiên hơn của người dùng với công cụ tìm kiếm (người dùng hỏi, Google Search
trả lời), tăng độ chính xác và kết quả phù hợp. Đồng thời xếp hạng các câu trả lời cho những câu hỏi đó từ nội dung đã xác định và xếp chỉ mục (index) cho các câu hỏi phức tạp từ người dùng.
Phân tích cú pháp tìm kiếm để giải đáp các câu hỏi phức tạp và dài hơi từ người dùng bao gồm cả những truy vấn câu hỏi bằng giọng nói, hướng đến việc tương tác giữa người dùng và công cụ tìm kiếm qua âm thanh như tìm trên smartphone hay tablet, thay vì tìm kiếm qua một từ hay cụm từ như hiện nay, giải đáp mọi thứ mà người dùng cần ngay trên Google mà không phải truy cập vào website khác.
TÀI LIỆU THAM KHẢO
[1] Slide bài giảng của Thầy GS.TSKH Hoàng Văn Kiếm .
[2] Shian - Hua Lin, Meng Chang Chen, Jan-Ming Ho, ACIRD: Intelligent Internet
Document Organization and Retrival, IEEE transaction on knowledge and data
engineering VOL 14, NO 3 May/June 2002.
[3] Osmar R.Zaiane, From Resource Discovery to Knowledge Discovery in the Internet, School of Computing Science, Simon Fracer University, Burnaby, BC Canada V5A 1S6.
[4] Wikipedia, URLs: 1. http://blog.kelseygroup.com/index.php/2012/05/11/comscore-data-finds-google- leads-u-s-internet-search-in-april/ 2. http://searchengineland.com/bing-rises-above-17-search-market-share-as-google- slips-comscore-159746 3. http://dantri.com.vn/suc-manh-so/nhung-thu-thuat-tim-kiem-voi-bing-co-the-ban- chua-biet-404661.htm 4. http://dantri.com.vn/suc-manh-so/nhung-thu-thuat-tim-kiem-voi-bing-co-the-ban- chua-biet-404661.htm
5. http://dientutieudung.vn/van-phong/web/i6684-yahoo-search-nhung-tinh-nang-doc- nhat-vo-nhi/ 6. http://searchengineland.com/bing-rises-above-17-search-market-share-as-google- slips-comscore-159746 7. http://soha.vn/cong-nghe/google-maps-cap-nhat-cho-ios-ho-tro-ban-do-trong-nha- tren-ipad-20130717151815275.htm 8. http://soha.vn/cong-nghe/google-ra-tinh-nang-tim-kiem-bang-giong-noi-cho-nguoi- viet-20130724095633463.htm http://www.thanhnien.com.vn/pages/20130803/google-se-co-ung-dung-tim-kiem- dien-thoai-that-lac.aspx