Content-Based
Recommendation System
(Hệ thông tư vẫn nội dung)
GVHD: Thây Nguyễn Văn Đoàn
Thân Thị Ngọc Huyện 11320966
Trang 2
fh Khai quat Recommendation System
II Phan loai Recommendation System
III Content-Based Recommendation System
VỊ Xu hướng
VII.Kết luận
`
IV Xay dung Content-Based Recommendation System V Ung dung Content-Based Recommendation System
oY
Trang 3
Generated by Foxit PDF Creator © Foxit Software
http:/Awww.foxitsoftware.com For evaluation only
“a Recommendation System la g1? >
Recommendation System 1a mot thanh phan trong hệ thông thông tin nhăm mục đích hỗ trợ người dùng tìm kiêm được đúng thông tin cân
thiết
> Bai toan tu van chinh 1a bai toan prediction một kiểu của bài toán machine learning và
datamining /
Trang 4⁄2 Mục đích: SN
°Ò “Ghi nhận thong tin” nhăm hô trợ người dùng tim kiêm được nguôn tài nguyên (thông tin) phủ hợp
°© Là một trong những ứng dụng thiết yêu trong E- Commerce, cung cap những đê xuât được cho là phụ hợp, nhăm lược bỏ không gian thông tịn không lô, tạo khả năng điêu hướng trực tiếp nguol ding đến những san phẩm phủ hợp nhất
vớ nhu câu và sở thích của họ —J
Trang 5
Generated by Foxit PDF Creator © Foxit Software
http:/Awww.foxitsoftware.com For evaluation only
3 Một số hệ tư vẫn nỗi tiếng hiện nay như SN
Phim / TV/ am nhac: MovieLens, EachMovie, Morse, Firefly, Flycasting - Tin tuc / bao chi: Tapestry, GroupLens, Lotus Notes, Anatagonomy - Sach / Tài liệu: Amazon.com, Foxtrot, InfoFinder, Vinabook
- Web: Phoaks, Gab, Fab, IfWeb, Let's Browse
- Nha hang: Adaptive Place Advisor, Polylens, Pocket restaurent finder
- Du lich: Dietorecs, LifestyleFinder
Trang 7Generated by Foxit PDF Creator © Foxit Software
http:/Awww.foxitsoftware.com For evaluation only
4 Loi ich Recommendation System >
° Trợ giúp hữu ích cho việc tìm kiêm thông tin
s Tiết kiệm thời gian tìm kiếm
° Tăng hiệu suất và tăng độ tin cậy ¢ Tang kha nang mua hàng
> Doanh thu tang nho hiéu ung cross-sell va thu
ae su gan bo cua người dùng /
Trang 8
a Content-based: "Show me more of the
À4 same what I've liked"
User profile & ~ contextual prameters \ ` item | score 1 | 09 bs i2 1 3 | 03 Title | Genre | Actors | bú —— Recommendation Recommendation
Product features component list
Trang 9Generated by Foxit PDF Creator © Foxit Software
http:/Awww.foxitsoftware.com For evaluation only "`
Trang 11Generated by Foxit PDF Creator © Foxit Software
http:/Awww.foxitsoftware.com For evaluation only
Hybrid: combinations of various inputs k2 and/or composition of different mechanism
Trang 12
“a Khái niệm SN
° - Là hệ thông / vấn cho khách hàng một cach tw dong dua trên việc đổi sánh những sở thích phủ hợp với nội dung san pham
° - Sản phẩm của hệ tư vấn lọc nội dung thường mang tinh chat “textual” Vd: théng tin Website hay các tin ttc, van ban> keyword
` duoc coi la rat quan trong 7
ẨỂS,,N
Na .———ằẶŒSœ
Trang 13
Generated by Foxit PDF Creator © Foxit Software
http:/Awww.foxitsoftware.com For evaluation only
2 Uu diém Content-based Recommendation system \
Không cân thông tin của người dùng khác
Trang 14
2 Nhuoc diém Content-based Recommendation SN
System
¢ Su phan tich noi dung bi han ché
Trang 15Generated by Foxit PDF Creator © Foxit Software
http:/Awww.foxitsoftware.com For evaluation only Mô hình sở thích người dùng Hệ thông “hiệu” người dùng thích gì
Các đối tượng tứ vấn + Phim
Tuvan Thu thap thong tin
+ Sach Ap dung một thuật Cp người dũng
Trang 16
User u, all es]
Trang 17Generated by Foxit PDF Creator © Foxit Software
http:/Awww.foxitsoftware.com For evaluation only
IV Xay dung Content-based Recommendation System
1 Thu thap thong tin người dùng
Cac dang thong tin VD
Thong tin ca nhan Họ tên, tuổi , giới tính, nghề
nghiệp
Đánh øiá/xếp hạng của người Sản phẩm A: rất tốt, tốt, chưa tốt, dùng trên sản phẩm xâu
Hành vi của người dùng Thời gian duyệt site, số lần click Giao dịch Ngày mua, giá mua, số lượng
mua, gia giam
Trang 181 Thu thập thong tin người dùng (ft) Edit Favorites Mark the categories that interest you the most ¥ Books Your Books Favorites Categories
Biographies & Memoirs FY Business & Investing F¥ Computers & Internet
Add to Your Favorites
I Arts & Photography I~ Children's Books
Il Comics & Graphic Novels I~ Cooking, Food & Wine I Entertainment
I¥ Nonfiction
[ Outdoors & Nature 5
I~ Parenting & Families T7
Trang 192 Cac cyt thuật
Trang 20
2 Cac ky thuat
Recommendation | Recommendation Technique |
Approach Heuristic-based Model-based
Content-based Commonly used techniques: Commonly used techniques: ¢ — TF-IDF (information retrieval) ¢ Bayesian classifiers ¢ Clustering ¢ Clustering
Representative research examples: ¢ — Decision trees
¢ Lang |995 ¢ — Artificial neural networks ¢ Balabanovic & Shoham 1997 Representative research examples: ¢ = Pazzani & Billsus 1997 ¢ = Pazzani & Billsus 1997
¢ Mooney et al 1998 ¢ Mooney & Roy 1999
e — Billsus & Pazzani 1999, 2000 !)
¢ Zhang et al 2002 )
Trang 21
Generated by Foxit PDF Creator © Foxit Software
http:/Awww.foxitsoftware.com For evaluation only
e IR: dua trén tu khoa cua đoạn văn ban
Tính toán độ tương đông giữa các Item và profile của người dùng dựa trên các keyword chông lên nhau
Title Genre Author Type Price Keywords
The Memoir David Paperback 29.90 Pres and jour-
Night of Carr nalism, drug
the Gun addiction, per-
sonal memoirs, New York
The Lace Fiction, Brunonia Hardcover 49.90 American contem-
Reader Mystery — Barry porary fiction, de-
tective, historical Into the Romance, Suzanne Hardcover 45.90 American fic- Fire Suspense Brock- tion, Murder,
mann Neo-nazism
Trang 22
¢ IR: dua trén tu khoa cua doan van bản
"= Loc bo tu khoa cua van ban: Xac dinh muc do
quan trong cua tu khoa k M(1,7) = TF (i, ) * IDF (i)
Trang 23Generated by Foxit PDF Creator © Foxit Software
http:/Awww.foxitsoftware.com For evaluation only
Trang 24
¢ Phan lop Bayesian:
° Dự đoán lớp của mẫu cân kiểm tra dựa trên những thông tin từ tập huân luyện ban đâu (đã được gan nhãn lớp)
°© Là phương pháp phân loại sử dụng tr1 thức các xác suât đã qua huân luyện
¢ Gom nhom
= Mo hinh gom cum dir liéu (khong co nhan) sao cho
các dữ liệu cùng nhóm có các tính chất tuong tu’
nhau và dữ liệu của 2 nhóm khác nhau sẽ có các tính
Trang 25Generated by Foxit PDF Creator © Foxit Software
Trang 26
5 Cac loi khuyén
¢ Hiéu vé khach hang va san pham
¢ X4y dung tiéu su ngudi ding: so thich, thoi quen ° Thông tin sản pham: đặc điểm điểm quan trong
»°- Giúp khách hàng hiểu về hệ tư vẫn ¢ Tang do tin cay
Trang 27Generated by Foxit PDF Creator © Foxit Software
http:/Awww.foxitsoftware.com For evaluation only
V Ung dung ciia Content-based Recommendation System
1 Website am nhac: Pandora, eMusic
Trang 282 Phim / TV/Video: Netflix, Youtube,
¢ Netflix: Suggestions to watch instantly aaa
Watch unlimited movies & TV episodes over the Internet!
For one low monthly price
“ Watch right on your TV or computer Sorry, Netflix is not available “ Cancel online anytime in your country yet
Enter your name and email address below and we'll email you when Netflix is available
Let me know
Trang 29
Generated by Foxit PDF Creator © Foxit Software
http:/Awww.foxitsoftware.com For evaluation only
3 Website mua ban : amazon, vinabook
¢ Amazon: King of Recommendations
L_] 8 Amazon.com: Recommender Systems: A | +
| “ ›> al | Ñ http://www.amazon.com/Recommender-Systems-Introduction-Dietmar- lannach/dp/0521493366/ref=sr_1_1?s=books&tie=UTF88qid=1318594900&<r
Price For All Three: $245.83
=) Add all three to Cart ) | Add all three to Wish List
Some of these items ship sooner than the others Show details
This item: Recommender Systems: An Introduction by Dietmar Jannach Hardcover $53.21 Recommender Systems Handbook by Francesco Ricci Hardcover $166.23
Programming Collective Intelligence: Building Smart Web 2.0 Applications by Toby Segaran Paperback
$26.39
Customers Who Bought This Item Also Bought
LOUK INSIDE! LOOK INSIDE!
= 7
Recommender Systems Networks, Crowds, and Algorithms of the Mining the Social Web: Programming Collective a= | Back | Handbook by Francesco Markets: Reasoning Intelligent Web by Analyzing Data from Intelligence: Building =
Trang 303 Website mua ban : amazon, vinabook ¢ Vinabook vb Hat Cơ Bản -Tiểu thuyết - Sách Vinaboo | Ty +E] [SB so \ G )> | | vb http://www.vinabook.com/hat-co-ban-tieu-thuyet-m11i20596.html Sách nên mua kèm với sách này =o
Hat Co Ban -Tiéu thuyét - Miche! Houellebecq - 55.000 VND M6 Rong Pham Vi Dau Tranh - Michel Houellebecq - 35.000 VND
Tên Của Khí Trời - Alberro Ruy Sanchez - 32.000 VND
Khách hàng mua cuốn sách trên cũng từng mua một trong những cuốn sách dưới đây
x£M TRÍCH ĐOAM
: "`
Trang 31Generated by Foxit PDF Creator © Foxit Software
http:/Awww.foxitsoftware.com For evaluation only
V Ung dung cia Content-based Recommendation System
4 Social Web: Facebook, Twitter, Flickr,
Tu van tim ban bé, tai nguyén (pictures, videos)
Facebook giúp bạn kết nổi và chia sẻ với mọi người
Hội những người muốn kết bạn với những người sinh cùng ngày với mình EJ Tường [E] Thông tin fF] Ghi Chú {fi} Album Anh H Video = Cau hoi = oS Thao Luan Giới thiệu Vô link: www.facebook.com/album.php?ai d=410868id=109502065750487 để tìm bạn Thâm (Link ngu6n: http://recsys.acm.org/2011/industry_track.shtml) Hội những người muốn kết bạn với những người sinh cùng Tạo Trang ngày với mình z5 Thích pes mmo | mum nKS-——S— —— > = Các trang Facebook tương tự — Ệ re Nhat ky \ 601.702 thích điều này Tường Hội những người muốn kết : Tất cả mọi người (Bài đăng nổi ~ Chia sẻ: Ej Đăng [[Š) Hình ảnh li VY ee ee
Nhung Cau Noi Bat Hu
Hãy viết qì đó a */ 197.132 thich diéu nay
5Q Hội những người muốn kết bạn với những người sinh cùng ngày với P+ Dién Dan
ie minh 295.625 thich diéu nay
Các bạn ấy nhiều hơn mình nghĩ
Trang 32
5 E learning: UmeL
Đề tài trọng điểm B2009-18-01TĐ - Mô hình đặc trưng người dùng phục vụ cho đảo tạo trực tuyên (User Modeling for e-Learning - UMeL) được ĐHQG PHCM
cấp kinh phí thực hiện trong hai năm (2009 - 2011) theo quyết định số 128/ĐHQG-KHCN ngày 06/02/2009
Recommenation system:
Trang 33Generated by Foxit PDF Creator © Foxit Software
Trang 34
¢ Két hop cdc phuong phap trong recommendation systems:
content-based, collaboration
¢ Media recommendation systems
¢ Recommendation systems trên các thiết bị di động: M-
Commerce, Tourism and visitor guides, Cultural heritage and museum guides, Home computing and entertainment
Trang 35Generated by Foxit PDF Creator © Foxit Software
http:/Awww.foxitsoftware.com For evaluation only
1 V6i cdc site E commerce, néu tich hop recommendation sys(em tốt sẽ trở thành lợi thế cạnh tranh của doanh nghiệp
2 Có rất nhiều lĩnh vực có thể tích hợp với hệ thông
recommendation (E learning, digital library, email, y khoa, ) để mang lại những lợi ích to lớn
3 Bài toán Recommendation system là bài toán khó, phức tạp
Trang 36
1 Toward the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions
Gediminas Adomavicius, Member, IEEE, and Alexander Tuzhilin, Member, IEEE
2 A Survey of E-Commerce Recommender Systems Kangning Wei, Jinghua Huang, Shaohong Fu