1. Trang chủ
  2. » Luận Văn - Báo Cáo

ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot

59 280 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 59
Dung lượng 1,33 MB

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Uông Huy Long GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG VẤN TRONG HỆ THỐNG VẤN TIN TỨC KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin HÀ NỘI - 2010 Lời cảm ơn Trước tiên, tôi xin gửi lời cảm ơn và lòng biết ơn sâu sắc nhất tới Phó Giáo sư Tiến sĩ Hà Quang Thụy và Thạc sĩ Trần Mai Vũ, người đã tận tình chỉ bảo và hướng dẫn tôi trong suốt quá trình thực hiện khoá luận tốt nghiệp. Tôi chân thành cảm ơn các thầy, cô đã tạo những điều kiện thuận lợi cho tôi học tập và nghiên cứu tại trường Đại Học Công Nghệ. Tôi cũng xin gửi lời cảm ơn tới các anh chị và các bạn sinh viên trong nhóm “Khai phá dữ liệu” đã giúp tôi rất nhiều trong việc hỗ trợ kiến thức chuyên môn để hoàn thành tốt khoá luận. Cuối cùng, tôi muốn gửi lời cảm vô hạn tới gia đình và bạn bè, những người thân yêu luôn bên cạnh và động viên tôi trong suốt quá trình thực hiện khóa luận tốt nghiệp. Tôi xin chân thành cảm ơn! Sinh viên Uông Huy Long ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Uông Huy Long GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG VẤN TRONG HỆ THỐNG VẤN TIN TỨC KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin Cán bộ hướng dẫn: Th.S Trần Mai Vũ HÀ NỘI - 2010 i Lời cảm ơn Trước tiên, tôi xin gửi lời cảm ơn và lòng biết ơn sâu sắc nhất tới Phó Giáo sư Tiến sĩ Hà Quang Thụy và Thạc sĩ Trần Mai Vũ, người đã tận tình chỉ bảo và hướng dẫn tôi trong suốt quá trình thực hiện khoá luận tốt nghiệp. Tôi chân thành cảm ơn các thầy, cô đã tạo những điều kiện thuận lợi cho tôi học tập và nghiên cứu tại trường Đại Học Công Nghệ. Tôi cũng xin gửi lời cảm ơn tới các anh chị và các bạn sinh viên trong nhóm “Khai phá dữ liệu” đã giúp tôi rất nhiều trong việc hỗ trợ kiến thức chuyên môn để hoàn thành tốt khoá luận. Cuối cùng, tôi muốn gửi lời cảm vô hạn tới gia đình và bạn bè, những người thân yêu luôn bên cạnh và động viên tôi trong suốt quá trình thực hiện khóa luận tốt nghiệp. Tôi xin chân thành cảm ơn! Sinh viên Uông Huy Long ii Tóm tắt Với sự phát triển của Internet, con người ngày nay không chỉ có nhiều hơn cơ hội tiếp xúc với các nguồn cung cấp tin tức mà còn có thể có được nó đúng lúc hơn. Các tờ báo điện tử ở Việt Nam cung cấp mỗi ngày hàng chục cho tới hàng trăm tin mới thuộc nhiều lĩnh vực khác nhau sẵn sàng đáp ứng các yêu cầu mọi lúc, mọi nơi của người đọc. Tuy nhiên, bên cạnh những tiện ích, tồn tại những vấn đề cần được giải quyết như sự gia tăng về số lượng, tính đa dạng về nội dung của tin tức ở các nguồn khác nhau, sự phù hợp cá nhân, Trong bối cảnh đó, sự giúp đỡ của một hệ thống vấn tin tức là cần thiết, bằng cách duyệt qua không gian các lựa chọn, nó dự đoán các tin tức hữu ích tiềm năng với từng người dùng cá nhân. Xây dựng hồ sơ sở thích người dùng là một trong các thành phần cơ bản nhất của hệ thống vấn. Tuy nhiên, những hình (như trong khảo sát của Gauch và cộng sự [14] ) đang được sử dụng hiện nay vẫn tồn tại nhiều vấn đề chưa được giải quyết, ví dụ như: tính nhập nhằng ngữ nghĩa trong các hồ sơ dựa trên từ khóa, hoặc đòi hòi thông tin suy diễn từ WordNet để xác định ngữ nghĩa trong các hồ sơ dựa trên mạng ngữ nghĩa, Thêm vào đó, các giải pháp này còn thiếu khả năng tính hợp mềm dẻo các nhân tố ngữ cảnh. Khóa luận này trình bày một hình hệ thống vấn tin tức sử dụng một hình sở thích ngươi dùng mới. Dựa trên khai phá dữ liệu từ ngữ cảnh duyệt web của người dùng, hệ thống coi sở thích của người sử dụng là một kết hợp của tập các chủ đề ẩn xuất hiện phổ biến và tập các thực thể trong các tin tức người dùng từng quan tâm. iii Mục lục Mở đầu 1 Chương 1. Khái quát về các hệ thống vấn 3 1.1. Bài toán vấn 3 1.2. Các kĩ thuật vấn 5 1.2.1. Kĩ thuật vấn dựa trên nội dung 5 1.2.2. Kĩ thuật vấn cộng tác 8 1.2.3. Kĩ thuật vấn lai 11 1.3. Sơ lược về hệ thống vấn tin tức của khóa luận 13 1.3.1. Đặc trưng của vấn tin tức. 13 1.3.2. Hướng tiếp cận của khóa luận 14 Chương 2. hình hóa sở thích người dùng cho các hệ vấn dựa trên nội dung. 16 2.1. Tiến trình hình sở thích người dùng 16 2.2. Thu thập thông tin về người dùng 17 2.2.1. Phương pháp định danh người dùng 17 2.2.2. Các phương pháp thu thập thông tin 18 2.3. Xây dựng hình sở thích người dùng 21 2.3.1. Phương pháp dựa trên từ khóa có trọng số 21 2.3.2. Phương pháp dựa trên mạng ngữ nghĩa 22 2.3.3. Phương pháp dựa trên cây phân cấp khái niệm 23 Chương 3. hình 24 3.1. Cơ sở lý thuyết 25 3.1.1. Phân tích thông tin chủ đề dựa trên hình chủ đề LDA. 25 3.1.2. Nhận dạng các thực thể trong tài liệu dựa trên từ điển 27 3.2. Phân tích sở thích người dùng 28 3.2.1. Thông tin trong phiên duyệt web người dùng 28 3.2.2. hình sở thích người dùng 29 3.3. Áp dụng hình môi quan tâm người dùng vào vấn tin tức 30 3.3.1. Pha phân tích dữ liệu vấn 30 3.3.2. Pha vấn trực tuyến 33 3.4. Đánh giá kết quả vấn. 36 Chương 4: Thực nghiệm và đánh giá 37 iv 4.1. Môi trường thực nghiệm 37 4.2. Dữ liệu và công cụ 37 4.2.1. Dữ liệu 37 4.2.2. Công cụ 38 4.3. Thực nghiệm 39 4.3.1. Ví dụ về phân tích tin tức 39 4.3.2. Ví dụ phân tích sở thích người dùng 40 4.3.3. vấn tin tức 42 4.4. Kết quả thực nghiệm và đánh giá 43 Kết luận 46 Tài liệu tham khảo 48 v Danh sách hình Hình 1. Các thành phần chính của hệ thống vấn. 4 Hình 2. Tiến trình hình hóa sở thích người dùng. 16 Hình 3. Các hệ thống vấn dựa trên thông tin phản hồi hiện. 19 Hình 4. hình mối quan tâm người dùng dựa trên từ khóa. 22 Hình 5. hình mối quan tâm người dùng dựa trên mạng ngữ nghĩa 22 Hình 6. hình mối quan tâm người dùng dựa trên mạng khái niệm 23 Hình 7. Tài liệu với K chủ đề ẩn. 25 Hình 8. Biểu diễn đồ họa LDA 26 Hình 9. Ước lượng tham số tập dữ liệu văn bản. 26 Hình 10. Suy diễn chủ đề sử dụng tập dữ liệu VnExpress 27 Hình 11. hình sở thích người dùng dựa trên chủ đề ẩn và thực thể. 29 Hình 12. hình pha phân tích dữ liệu vấn 31 Hình 13. hình pha vấn trực tuyến. 33 Hình 14. Biểu diễn tin tức theo chủ đề và thực thể. 39 Hình 15. Kết quả phân tích cho thấy các thông tin liên quan đến chủ đề 19. 42 vi Danh sách các bảng Bảng 1. Đánh giá theo thang điểm về một số bộ phim đã xem. 5 Bảng 2. Các kĩ thuật thu thập thông tin ẩn. 20 Bảng 3. Ví dụ về một hồ sơ sở thích người dùng. 24 Bảng 4. Thông tin trong phiên duyệt web. 28 Bảng 5. Môi trường thực nghiệm. 37 Bảng 6. Công cụ. 38 Bảng 7. Một số chủ đề ẩn 39 Bảng 8. Ví dụ về phân tích sở thích người dùng. 40 Bảng 9. Đánh giá hình phân tích sở thích. 44 Bảng 10. Độ chính xác của hình dựa vào đánh giá của người sử dụng. 44 1 Mở đầu Từ khi những bài báo đầu tiên về lọc công tác được công bố từ những năm 90 của thế kỉ trước, hệ vấn đã chứng tỏ được vai trò quan trọng của mình trong cả hai khía cạnh nghiên cứu và ứng dụng. Chúng ta có thể dễ dàng tiếp cận với các bài báo khoa học liên quan đến từ khóa “Recommender System” trong hơn 8600 kết quả trả về từ máy tìm kiếm GoogleScholar 1 với hơn 1100 kết quả cho riêng năm 2009 hoặc sử dụng các ứng dụng vấn nổi tiếng như sách trên Amazon 2 , phim trên NetFlix 3 . Các hệ vấn hoạt động như một bộ lọc thông tin [8], nhằm cố gắng đưa ra các thông tin về nội dung hoặc thông tin về sản phẩm (như phim, sách, website, tin tức,…) có nhiều khả năng thuộc được người dùng quan tâm. Thông thường, một hệ vấn so sánh mối quan tâm của người dùng (trong khóa luận, hai khái niệm mối quan tâm người dùng hay sở thích người dùng có thể được sử dụng thay thế cho nhau) với một vài đặc trưng tham chiếu để đưa ra các ước lượng đánh giá cho các sản phẩm. Các đặc trưng này có thể đến từ các thông tin của sản phẩm (hướng tiếp cận lọc dựa trên nội dung) hoặc từ môi trường xã hội người dùng (hướng tiếp cận lọc cộng tác). Mặc dù các hệ thống vấn đã được nghiên cứu từ khá lâu, và đã có nhiều ứng dụng chứng minh được tính hiệu quả của các hệ thống vấn trên thế giới, các nghiên cứu về lĩnh vực này ở Việt Nam còn hạn chế. Mong muốn phát triển một hệ thống vấn, khóa luận tập trung vào xây dựng một hệ thống vấn các tin tức tiếng Việt. Ngày nay, khái niệm “báo điện tử” cũng như việc đọc tin tức điện tử đã không còn xa lạ với đa số người dân Việt Nam. Những thốngtrong gần đây trên BaoMoi 4 về số lượt người sử dụng internet để xem các tin tức điện tử hiện nay đang cho thấy nhu cầu ngày một tăng của xã hội trong lĩnh vực truyền thông này. Tuy nhiên, một vấn đề còn tồn tại hiện nay đó là trong khi có quá nhiều tin tức mỗi ngày được cập nhật, người dùng giường như bị chìm ngập trong biển thông tinvẫn không tìm ra được các thông tin phù hợp, đó chính là môi trường cho các lĩnh vực liên quan đến vấn tin tức phát triển. Nắm bắt được nhu cầu này, khóa luận đề xuất một giải pháp vấn các nội dung thông tin liên quan đến ngữ cảnh tiếp nhận thông tin hiện tại của người sử dụng, qua đó mong 1 http://www.scholar.google.com 2 http://www.amazon.com 3 http://www.netflix.com 4 http://www.baomoi.com/Statistics/Report.aspx 2 muốn cung cấp được những chỉ dẫn đúng, nhanh chóng, và không có các phiền toái từ việc phải đăng kí hay cung cấp các thông tin cá nhân. Nội dung chính của khóa luận được chia làm 4 phần:  Chương 1. Các hệ thống vấn: Trình bày các khái niệm, các thuật ngữ, các kĩ thuật liên quan đến hệ thống vấn. Các ưu và nhược điểm của các kĩ thuật này cũng được trình bày chi tiết hơn trong các mục 1.2 và 1.3.  Chương 2. hình hóa sở thích người dùng cho các hệ vấn dựa trên nội dung: Giới thiệu về bài toán xây dựng sở thích người dùng, các thông tin được sử dụng để phân tích và một số kĩ thuật hình sở thích người dùng.  Chương 3. hình: Trình bày đề xuất xây dựng sở thích người dùng dựa trên phân tích chủ đề ẩn phổ biến và các thực thể, và áp dụng của hình này vào hệ thống vấn tin tức.  Chương 4. Thực nghiệm và đánh giá: Trình bày một số kết quả đánh giá ban đầu. [...]... thích người dùng 3.2.1 Thông tin trong phiên duyệt web người dùng Một phiên duyệt web là một chuỗi các pageview của một người dùng đơn trong một lần duyệt đơn [7] Trong đó, các pageview là tập hợp các đối ng web hiển thị tới người dùng Mỗi pageview có thể được xem như một tập hợp các đối ng web hay các tài nguyên biểu diễn cho một hành vi người dùng cụ thể như đọc một trang tin tức, xem thông tin. .. tâm người dùng dựa trên mạng khái niệm [24] 23 Chương 3 hình Đối với người dùng trong các hệ thống vấn, các yếu tố thuộc về ngữ cảnh sử dụng hiện tại của người dùng ảnh hưởng lớn tới các lựa chọn trong ng lai của họ Các tin tức trong phiên duyệt web hiện phản ánh chính xác hơn những chủ đề hay các thực thể người dùng muốn tìm hiểu thêm thông tin Do vậy, phân tích thông tin từ các tin tức này... giải pháp vấn được triển khai 1.3.1 Đặc trưng của vấn tin tức vấn tin tức là một lĩnh vực giàu tiềm năng bởi số lượng các sản phẩm vấn, số lượng người dùng và số lượt sử dụng cao hơn nhiều so với các đối ng vấn khác Tuy nhiên, đi kèm theo đó là các thử thách về các đặc trưng riêng có của miền đối ng tin tức cũng như các đặc trưng chung của người sử dụng vấn Tin tức là một đối ng... về người dùng) và cũng không yêu cầu bật cookie ở trình duyệt 2.2.2 Các phương pháp thu thập thông tin Thông thường, các kĩ thuật thu thập thông tin được phân theo tính chất của dữ liệu thu thập được Theo đó, ng ứng với hai kiểu thông tin người dùng ẩn và hiện, có hai phương pháp thu thập thông tin người dùng 2.2.2.1 Phương pháp thu thập thông tin người dùng hiện Phương pháp thu thập thông tin người. .. thu thập thông tin được sử dụng để thu thập các dữ liệu từ người dùng, có thể chia các dữ liệu này thành hai loại cơ bản: các thông tin người dùng hiện (hay thông tin người dùng rõ) và các thông tin người dùng ẩn Những thông tin này sau đó được tổng hợp để xây dựng hình sở thích người dùng trong pha còn lại, pha xây dựng hồ sơ người dùng 16 2.2 Thu thập thông tin về người dùng Bước đầu tiên trong kĩ... quan tâm 14 Theo đó, hệ thống đề xuất giải quyết hai vấn đề cơ bản của tiến trình vấn:  Đầu tiên là dựa trên khảo sát về các phương pháp xây dựng hình hóa sở thích người dùng dựa trên các dữ liệu văn bản thường được áp dụng cho hướng tiếp cận lọc nội dung, đề xuất giải pháp hình sở thích người dùng dựa trên phân tích chủ đề ẩn phiên duyệt web người dùng (ngữ cảnh đọc tin tức)  Sau đó, dựa... lớn những vấn được tạo ra lại chỉ tập trung vào những sản phẩm phổ biến nhất Ví dụ điển hình cho những cản trở của vấn đề này là ở các hệ thống vấn tin tức, trong khi những tin tức mới hơn có thể mang nhiều giá trị hơn, những tin tức được nhiều người đọc trước đây lại thường xuyên được vấn 1.2.3 Kĩ thuật vấn lai Một vài hệ vấn kết hợp cả phương pháp cộng tác và dựa trên nội dung nhằm tránh... hệ thống Quickstep và Foxtrot sử dụng ontology về chủ đề của các bài báo khoa học để gợi ý những bài báo phù hợp cho người dùng 1.3 Sơ lược về hệ thống vấn tin tức của khóa luận hình hệ vấn do khóa luận đề xuất không được triển khai một cách độc lập mà tích hợp vào hệ thống cung cấp tin tức Với việc phân tích những đặc trưng của đối ng vấn này, khóa luận đề xuất ý ng ban đầu cho giải. .. người dùng khác nhau Hơn nữa, giải pháp này cũng gặp vấn đề khi có nhiều hơn một người dùng cho một máy, hoặc trường hợp người dùng xóa, hay tắt cookie Đối với phiên duyệt web, trở ngại cũng ng tự khi có nhiều hơn một người dùng cho một máy hay có sử dụng nhiều hơn một máy, một trình duyệt, nhưng nó không lưu trữ userid giữa những lần duyệt Một người dùng bắt đầu với một phiên duyệt web mới, thông tin. .. & Webert sẽ vấn các trang liên kết khác Thêm vào đó, hệ thống còn có thể tạo một truy vấn tới máy tìm kiếm Lycos1 để trích xuất các trang web có thể người dùng sẽ ưa thích Một vấn đề với các thông tin phản hồi hiện đó là nó đặt gánh nặng cung cấp thông tin về phía người dùng Vì vậy, nếu người dùng không muốn phải cung cấp các thông tin riêng tư, họ sẽ không tham gia hoặc không cung cấp thông tin . TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Uông Huy Long GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC KHOÁ. TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Uông Huy Long GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC KHOÁ. hình là trong các hệ thống tư vấn tin tức, những tin tức tư vấn được đánh giá cao hơn nếu nó không phải là một bản trích dẫn hoặc có nội dung thông tin trùng lặp. 8  Vấn đề người dùng mới

Ngày đăng: 27/06/2014, 16:20

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Uông Huy Long, Nguyễn Đạo Thái, Trần Xuân Tứ. Mô hình tư vấn dựa trên việc phân tích chủ đề ẩn sự quan tâm của người dùng, Công trình sinh viên nghiên cứu khoa học, Đại học Công Nghệ, ĐHQGHN, 2009.Tiếng Anh Sách, tạp chí
Tiêu đề: Công trình sinh viên nghiên cứu khoa học", Đại học Công Nghệ, ĐHQGHN, 2009
[3] Aho, Alfred V.; Margaret J. Corasick. "Efficient string matching: An aid to bibliographic search". Communications of the ACM 18 (6): 333–340, June 1975 Sách, tạp chí
Tiêu đề: Efficient string matching: An aid to bibliographic search
[4] Ansari, A., S. Essegaier, and R. Kohli. Internet recommendations systems. Journal of Marketing Research, pages 363-375, 2000 Sách, tạp chí
Tiêu đề: Internet recommendations systems
[8] Belkin, N.J., Croft, W.B.: Information filtering and information retrieval: two sides of the same coin?. Communications of the ACM 35(12), 29–38 (1992) Sách, tạp chí
Tiêu đề: Communications of the ACM
[10] Breese, J. S., D. Heckerman, and C. Kadie. Empirical analysis of predictive algorithms for collaborative filtering. In Proceedings of the Fourteenth Conference on Uncertainty in Artificial Intelligence, Madison, WI, 1998 Sách, tạp chí
Tiêu đề: In Proceedings of the Fourteenth Conference on Uncertainty in Artificial Intelligence
[11] Burke, R. Hybrid Recommender Systems: Survey and Experiments. User Modeling and User-Adapted Interaction 12, 4 (Nov. 2002), 331-370 Sách, tạp chí
Tiêu đề: User Modeling and User-Adapted Interaction
[12] Chen, L., Sycara, K.: A Personal Agent for Browsing and Searching. In: Proceedings of the 2nd International Conference on Autonomous Agents, Minneapolis/St. Paul, May 9-13, (1998) 132-139 Sách, tạp chí
Tiêu đề: Proceedings of the 2nd International Conference on Autonomous Agents
[14] Gauch, S., Speretta, M., Chandramouli, A., Micarelli, A. User profiles for personalized information access, In: Brusilovsky, P., Kobsa, A., and Neidl, W., Eds.The Adaptive Web: Methods and Strategies of Web Personalization. Springer- Verlag, Berlin Heidelberg New York, 2007, 54-89 Sách, tạp chí
Tiêu đề: In: Brusilovsky, P., Kobsa, A., and Neidl, W., Eds. "The Adaptive Web: Methods and Strategies of Web Personalization. Springer- Verlag, Berlin Heidelberg New York
[15] Gentili, G., Micarelli, A., Sciarrone, F.: Infoweb: An Adaptive Information Filtering System for the Cultural Heritage Domain. Applied Artificial Intelligence 17(8-9) (2003) 715-744 Sách, tạp chí
Tiêu đề: Applied Artificial Intelligence
[16] Guarino, N., Masolo, C., Vetere, G.: OntoSeek: Content-Based Access to the Web. IEEE Intelligent Systems, May 14(3) (1999) 70-80 Sách, tạp chí
Tiêu đề: IEEE Intelligent Systems
[17] Heinrich, G., “Parameter Estimation for Text Analysis”, Technical Report Sách, tạp chí
Tiêu đề: Parameter Estimation for Text Analysis
[20] Kelly, D., Teevan, J.: Implicit feedback for inferring user preference: a bibliography. ACM SIGIR Forum 37(2) (2003) 18-28 Sách, tạp chí
Tiêu đề: ACM SIGIR Forum
[21] Le Dieu Thu. Online context advertising, Undergraduate Thesis, College of Technology, Vietnam National University, Hanoi, 2008 Sách, tạp chí
Tiêu đề: Undergraduate Thesis
[22] Nguyen Cam Tu. Hidden Topic Discovery toward Classification and Clustering in Vietnamese Web Documents, Master Thesis, College of Technology, Vietnam National University, Hanoi, 2008 Sách, tạp chí
Tiêu đề: Master Thesis
[23] Pazzani, M., Muramatsu, J., Billsus, D.: Syskill & Webert: Identifying Interesting Web Sites. In: Proceedings of the 13th National Conference On Artificial Intelligence Portland, Oregon, August 4–8 (1996) 54-61 Sách, tạp chí
Tiêu đề: In: Proceedings of the 13th National Conference On Artificial Intelligence Portland
[24] Pretschner, A.: Ontology Based Personalized Search. Master’s thesis. University of Kan- sas, June (1999) Sách, tạp chí
Tiêu đề: Master’s thesis
[26] R.Baeza, F.Silvestri. Web Query Log Mining, ACM SIGIR Conference tutorial, 2009 Sách, tạp chí
Tiêu đề: ACM SIGIR Conference tutorial
[27] G. Salton, A. Wong, C.S. Yang. A Vector Space Model for Automatic Indexing, Communication of the ACM, 18 (11), 1975 Sách, tạp chí
Tiêu đề: Communication of the ACM
[2] G.Adomavicius, A.Tuzhilin. Towards the Next Generation of Recommender Systems:A Survey of the State-of-the-Art and Possible Extensions, IEEE Transactions on Knowledge and Data Engineering, 2005 Khác
[5] Basu, C., H. Hirsh, and W. Cohen. Recommendation as classification: Using social and content-based information in recommendation. In Recommender Systems. Papers from 1998 Workshop. Technical Report WS-98-08. AAAI Press, 1998 Khác

HÌNH ẢNH LIÊN QUAN

Hình 1. Các thành phần chính của hệ thống tư vấn. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Hình 1. Các thành phần chính của hệ thống tư vấn (Trang 12)
Bảng 1. Đánh giá theo thang điểm về một số bộ phim đã xem. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Bảng 1. Đánh giá theo thang điểm về một số bộ phim đã xem (Trang 13)
Hình 2. Tiến trình mô hình hóa sở thích người dùng. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Hình 2. Tiến trình mô hình hóa sở thích người dùng (Trang 24)
Hình 3. Các hệ thống tư vấn dựa trên thông tin phản hồi hiện. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Hình 3. Các hệ thống tư vấn dựa trên thông tin phản hồi hiện (Trang 27)
Bảng 2. Các kĩ thuật thu thập thông tin ẩn [14]. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Bảng 2. Các kĩ thuật thu thập thông tin ẩn [14] (Trang 28)
Hình 4. Mô hình mối quan tâm người dùng dựa trên từ khóa. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Hình 4. Mô hình mối quan tâm người dùng dựa trên từ khóa (Trang 30)
Hình 5. Mô hình mối quan tâm người dùng dựa trên mạng ngữ nghĩa[15]. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Hình 5. Mô hình mối quan tâm người dùng dựa trên mạng ngữ nghĩa[15] (Trang 30)
Hình 6. Mô hình mối quan tâm người dùng dựa trên mạng khái niệm [24]. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Hình 6. Mô hình mối quan tâm người dùng dựa trên mạng khái niệm [24] (Trang 31)
Bảng 3. Ví dụ về một hồ sơ sở thích người dùng. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Bảng 3. Ví dụ về một hồ sơ sở thích người dùng (Trang 32)
Hình 7. Tài liệu với K chủ đề ẩn. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Hình 7. Tài liệu với K chủ đề ẩn (Trang 33)
Hình 8. Biểu diễn đồ họa LDA[13]. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Hình 8. Biểu diễn đồ họa LDA[13] (Trang 34)
Hình 9. Ước lượng tham số tập dữ liệu văn bản. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Hình 9. Ước lượng tham số tập dữ liệu văn bản (Trang 34)
Hình 10. Suy diễn chủ đề sử dụng tập dữ liệu VnExpress[22]. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Hình 10. Suy diễn chủ đề sử dụng tập dữ liệu VnExpress[22] (Trang 35)
Bảng 4. Thông tin trong phiên duyệt web. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Bảng 4. Thông tin trong phiên duyệt web (Trang 36)
Hình 11. Mô hình sở thích người dùng dựa trên chủ đề ẩn và thực thể. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Hình 11. Mô hình sở thích người dùng dựa trên chủ đề ẩn và thực thể (Trang 37)
Hình 12. Mô hình pha phân tích dữ liệu tư vấn - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Hình 12. Mô hình pha phân tích dữ liệu tư vấn (Trang 39)
Bảng 5. Môi trường thực nghiệm. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Bảng 5. Môi trường thực nghiệm (Trang 45)
Bảng 6. Công cụ. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Bảng 6. Công cụ (Trang 46)
Bảng 7. Một số chủ đề ẩn - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Bảng 7. Một số chủ đề ẩn (Trang 47)
Hình 14. Biểu diễn tin tức theo chủ đề và thực thể. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Hình 14. Biểu diễn tin tức theo chủ đề và thực thể (Trang 47)
Bảng 8. Ví dụ về phân tích sở thích người dùng. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Bảng 8. Ví dụ về phân tích sở thích người dùng (Trang 48)
Hình 15. Kết quả phân tích cho thấy các thông tin liên quan đến chủ đề 19. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Hình 15. Kết quả phân tích cho thấy các thông tin liên quan đến chủ đề 19 (Trang 50)
Bảng 10. Độ chính xác của mô hình dựa vào đánh giá của người sử dụng. - ĐỀ TÀI " GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC " pot
Bảng 10. Độ chính xác của mô hình dựa vào đánh giá của người sử dụng (Trang 52)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w