Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 71 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
71
Dung lượng
1,04 MB
Nội dung
0 B GIÁO DCăVÀăĐÀOăTO TRNGăĐI HCăSăPHM HÀ NI TRN TH PHNGăDUNG TÌM HIU H TăVN VÀ XÂY DNG H TăVN CHO TRANG WEB HC TOÁN ONLINE LUNăVĔNăTHCăSƾ:ăăKHOAăHC CÔNG NGH THÔNG TIN HÀ NI,ăNĔMă2014 0 B GIÁO DCăVÀăĐÀOăTO TRNGăĐI HCăSăPHM HÀ NI TRN TH PHNGăDUNG TÌM HIU H TăVN VÀ XÂY DNG H TăVN CHO TRANG WEB HC TOÁN ONLINE Chuyên ngành: KHOA HC MÁY TÍNH Mã số: 60480101 LUNăVĔNăTHCăSƾ:ăKHOAăHC CÔNG NGH THÔNG TIN Ngưiăhướng dn khoa hc: PGS.TS PHM TH HOÀN HÀ NI,ăNĔMă2014 0 Mc lc Ni dung Trang M đầu 1 Chươngă1:ăTổng quan h tưăvấn (Recommender System) 3 1.1. Giới thiu h tưăvấn. 3 1.1.1 H tưăvấn là gì? 3 1.1.2 Nhim vụ ca h tưăvấn. 5 1.1.3 Vai trò ca h tưăvấn. 7 1.1.4 ng dụng h tưăvấn. 8 1.2 Cácăphươngăphápătiếp cn h tưăvấn. 9 1.2.1 Phươngăphápălc cộng tác (Collaborative Filtering). 10 1.2.2 Phươngăphápătưăvấn dựa trên nội dung (Content-based). 27 1.2.3 Phươngăphápălaiă(Hybrid) 34 Chươngă2:ăXâyădựng h tưăvấn hc toán online 37 2.1 Giới thiu h thống. 37 2.2 Mục tiêu. 38 2.3 Mô tả bài toán. 38 2.4 Phươngăphápăgiải quyết bài toán. 38 Chươngă3:ăCàiăđặt và triển khai 51 3.1 Phân tích h thống. 51 3.2 Thiết kế dữ liu. 52 3.3 Thiết kế chcănĕng. 54 3.3.1 Lấy thông tin thực hành. 54 3.3.2 Lấy thông tin yêu thích. 56 3.3.3 Đề xuất kỹ nĕngăcaănhómăngưiădùngătươngăđồng. 59 3.3.4 Đề xuất kỹ nĕngăphổ biến 59 1 3.4 Kết quả thực nghim. 60 Kết lun 63 Tài liu tham khảo 64 0 Danh mục hình Hình 1.1 Xếp hng caăngưi dùng với các bộ phim. 6 Hình 1.2 Ví dụ lc cộngătácăngưi dùng. 11 Hình 1.3 Ma trn xếp hng. 13 Hình 1.4 Ma trn trong lc cộngătácăngưi dùng. 14 Hìnhă1.5ăCácăbước thực hin lc cộng tác ngưi dùng. 15 Hìnhă1.6ăTínhăđộ tươngăđồng giữaăhaiăngưi sử dụng 19 Hình 1.7 Ví dụ lc cộng tác mục. 21 Hình 1.8 Ma trn trong lc cộng tác mục. 22 Hìnhă1.9ăCácăbước thực hin lc cộng tác mục. 23 Hìnhă1.10ăTínhăđộ tươngăđồng giữa hai mục. 25 Hình 1.11 Ví dụ phươngăphápătưăvấn dựa trên nội dung. 28 Hìnhă1.12ăCácăbước thực hinătưăvấn dựa trên nội dung. 29 Hình 1.13 Danh sách phim và thể loi. 31 Hình 1.14. Mcăđộ yêu thích caăngưi dùng với từng thể loi. 31 Hình 1.15 Mcăđộ yêu thích caăngưi dùng với từng phim. 32 Hình 1.16 Phân loiăphươngăphápălai. 34 Hìnhă1.17ăPhươngăphápălaiătrng số. 35 Hìnhă1.18ăPhươngăphápălaiăhỗn hợp. 36 Hình 2.1 Quy trình thực hinătưăvấn. 40 Hìnhă2.2.ăTưăvấn dựa trên ch đề quan tâm. 42 Hìnhă2.3ăTưăvấn dựa trên dng toán quan tâm. 44 Hìnhă2.4ăTưăvấn dựa trên lc cộngătácăngưi dùng. 45 Hìnhă2.5ăTưăvấn dựa trên lc cộng tác mục. 47 Hình 2.6 Nhóm kỹ nĕngădựa trên nội dung. 48 Hìnhă2.7ăTưăvấn dựa trên nội dung. 49 Hình 3.1 Mô hình phân cấp chcănĕng. 51 Hình 3.2 Bảngă“Math_score”. 52 Hình 3.3 Bảngă“Math_skill”. 53 Hình 3.4 Bảngă“Math_chude”. 53 Hình 3.5 Bảngă“Math_subcate”. 53 Hình 3.6 Quan h giữa các bảng. 54 Hình 3.7 Giao dinăngưi dùng truy cp vào h thống. 55 Hình 3.8 Giao dinăngưi dùng thực hành kỹ nĕng. 55 1 Hình 3.9 Giao din ngưi dùng truy cp vào lớp hc. 57 Hình 3.10 Giao din cp nht thông tin yêu thích. 58 Hình 3.11 Giao dinătưăvấn kỹ nĕngăphổ biến. 59 Hình 3.12 Giao dinătưăvấn kỹ nĕngăyêuăthích. 60 Hình 3.13ăDanhăsáchăngưi dùng ngu nhiên. 60 Hìnhă3.14ăĐánhăgiáăhiu quả h tưăvấn. 62 1 Mở đu 1. Lý do chnăđ tài. Kể từ lầnăđầu tiên xuất hin bài báo lc cộng tác từ nĕmă1990,ăh tưă vấn tr thànhălƿnhăvực nghiên cu quan trng. Hin nay, h tưăvấn nhnăđược sự quan tâm rất lớn vì tác dụng không nhỏ ca nó với nhiềuălƿnhăvực khác nhau trong cuộc sốngănhưă kinhă doanh,ă giải trí và giáo dục.ă Đặc bit trong nhữngănĕmăgầnăđây,ăcôngăcuộc xây dựngăvàăđổi mới giáo dụcăđangăđược rất nhiềuăngưi quan tâm. Ngoài cách hc truyền thống là thầy và trò có sự tươngă tác trực tiếp trên lớp hc, giáo dục hin nay còn m rộng cách thc dy và hc trực tuyến mang li hiu quả caoăhơnăsoăvới cách hc truyền thống. Nh có h tưăvấn, vic hc trực tuyến có hiu quả hơnărất nhiều. Một trang web hc toán trực tuyến dành cho hc sinh tiểu hc, trang web cung cấp các kỹ nĕngăchoăhc sinh thực hànhăđể nắm rõ và thực hành thành tho các kiến thc trên lớpăcũngănhưănângăcao.ăCóăhàngănghìnăhc sinh truy cpătrangăwebăđể hc và thực hành, mỗi hc sinh li có những s thích thực hành khác nhau. H tưăvấn có thể hỗ trợ cho toàn bộ hc sinh tham gia trong h thốngă vàă đưaă raă những li khuyên phù hợp cho từngă ngưi hc. Những li khuyên này rấtăđángătinăcy vì nó dựa trên lch sử thực hành kỹ nĕngăcaăchínhăngưi dùng trong h thốngăvàăđề xuất những kỹ nĕngăphùăhợp vớiănĕngălực ca từng hcăsinh.ăTaăđặt một câu hỏi nêu không có h tưăvấn và số lượng kỹ nĕngăthực hành sẽ càng nhiều, hc sinh tiểu hc khi tham gia hc trực tuyến sẽ lựa chn kỹ nĕngăthực hành phù hợp vớiănĕngălực caămìnhănhưă thế nào? Tht là khó khi lựa chn kỹ nĕngăyêuăthíchătrongăsố rất nhiều kỹ nĕngăca h thống và la tuổi ca các em, rấtăkhóăđể tìm kiếm kỹ nĕngăphùă hợp vớiănĕngălực ca mình. Vì lí do trên, tôi lựa chnăđề tàiă“Tìmăhiểu h tưăvấn và xây dựng h tưă vấn cho trang web hcătoánăonline”. 2 2. Mcăđíchănghiênăcu. - Tìm hiểu h tưăvấn vàăcácăphươngăphápătiếp cn h tưăvấn. - Tìm hiểu h thống thực hành kỹ nĕngătrênătrangăwebăhc toán online. - Nghiên cuăcácăphươngăphápătiếp cn có thể hỗ trợ xây dựng h tưăvấn trên trang web hc toán online. - Lựa chnăphươngăphápătiếp cn và ng dụng xây dựng h tưăvấn kỹ nĕngăhỗ trợ hc sinh thực hành trên trang web hc toán online. 3. Đốiătng nghiên cu. - Để tìm hiểu nội dung h tưăvấn, tôi đãătìmăkiếmăvàăđc hiểu các bài báo trongăvàăngoàiănước, các dinăđànătraoăđổi kiến thc h tưăvấn và các tài liu nghiên cuăđược chia sẻ trên mng Internet. - Nghiên cu ngôn ngữ lp trình php và viếtăchươngătrìnhăchcănĕngătưă vấn kỹ nĕngăchoăngưi dùng thực hành trên trang web hc toán online. 4. Tóm tắt luậnăvĕn. Lunăvĕn trình bày tổng quan h tưăvấn, bao gồm khái nim h tưăvấn, nhim vụ phổ biến ca h tưăvấn, vai trò ca h tưăvấnăđối với nhà cung cấp vàăngưi dùng, một số ng dụng ca h tưăvấn trong thực tế vàăcácăphươngă pháp tiếp cn h tưăvấn. Để xây dựng h tưăvấn cho trang web hc toán online, lunăvĕnăđãăgiới thiu trang web hc toán online và trình bày mục tiêu, mô tả vàăphươngăphápă giải quyết bài toán xây dựng h tưăvấn cho trang web hc toán online. Lunăvĕnătrìnhăbàyăcácăbướcăcàiăđặt h tưăvấn và giới thiu một số giao din chính ca chcănĕngătưăvấn. Đánhăgiáăhiu quả ca h tưăvấn dựa ngưi dùng trên h thống. 3 Chngă1: Tổng quan h tăvn (Recommender System) 1.1. Gii thiu h tăvn. 1.1.1 H tăvn là gì? H tưăvấn (recommender system) là một h thống có chcănĕngătưăvấn giúp ngưi dùng (user) tìm kiếm các mục, mặt hàng (item) liênăquanăđến s thích, nhu cầu thông qua các giao dch,ă tươngă tácă (transaction)ă caă ngưi dùng với các mục, mặtăhàngăđó. H tưăvấn có thể hotăđộngăđộc lp hoặc đóngăvaiătròănhưămột chc nĕngătrongămột trang web hay một h thống khác User làăngưi dùng truy cp vào h thống [5] (thành viên đĕngăký hoặc khách vãng lai).ăUserălàăđốiătượngăđược tưăvấn. Item là các mặt hàng, sản phẩm, mục [5]. Itemălàăđốiătượngătưăvấn. Ví dụ: item có thể là các bộ phim mà một trang web xem phim muốnătưăvấn cho ngưi dùng, trong bán hàng trực tuyến item có thể là các mặt hàng, sản phẩm màăngưi cung cấp muốnătưăvấn. Transaction là tươngătácăgiữa user với item [5]. Transaction có thể là lch sử tìm kiếm, lch sử mua hàng, lch sử xem mặt hàng hay xếp hng,ăđánhă giá ca ngưi dùng với một mục. H thốngătưăvấnăthưngăchiaănhómăngưi dùng thành hai loi:ăngưi dùngăchưaăcóălch sử tươngătácăvới h thốngă(nhómă1)ăvàăngưiădùngăđãăcóă lch sử tươngătácăvới h thốngă(nhómă2).ăNgưi dùng thuộc nhóm 1 có thể là khách vãng lai hoặcăthànhăviênăđĕngăkýămới, h chưaăcóălch sử tươngătácăvới h thống hoặcăchưaăcp nhtăđ thông tin để h tưăvấnăcóăcơăs đưaăraătưăvấn. Nhóm th 2 là nhữngăngưi dùng có đ thông tin và lch sử tươngătácăvới h thống để h tưăvấnăđề xuất những mục có thể sẽ đượcăngưi dùng thích, quan tâm. 4 H tưăvấn có nhiềuăưuăđiểm, mang li lợi ích cho cả ngưi tiêu dùng ln nhà cung cấp. Chính vì thế h tưăvấnăcàngăngàyăcàngăđượcăquanătâm,ăđiển hìnhănhưămột số sự kin [5] sauăđây: - Cácă trangă webă đượcă đánhă giáă caoă nhưă Amazon.com, Youtube.com, Netflix.com, có một h thốngă tưă vấnă tươngă đối hiu quả. Hơnănữa, bây gi nhiều công ty truyềnăthôngăđangătriển khai và phát triển h thốngătưăvấnănhưămột phần dch vụ quan trng mà h cần phải cung cấp. Ví dụ nhưătrang Netflix.com là một trang web xem phim trực tuyến nổi tiếngăđãă cung cấp giải thưng 1 triuăđôălaăchoănhững ngưiăđưaăra thutătoánăđầu tiên đánhăbiăđược 10% thutătoánătưăvấn ca h. Và giảiăthưngăđóăđãăđược một nhóm nghiên cuă cóă tênă làă “Bellkor’să Pragmatică Chaos”ă giành đượcă nĕmă 2009. - Có nhiều hội ngh và hội thảo dành riêngăchoălƿnhăvực này. Hội ngh đặc bită được nhiềuă ngưi quan tâm là ACM Recommender Systems (viết tắtălàăRecSys)ăđược thành lpănĕmă2007ălàăsự kin uy tín tổ chc hàng nĕmăđể nghiên cu về công ngh tưăvấn và ng dụng. Ngoài ra, h thốngătưă vấn cònăđược thảo lun trong các hội ngh truyền thống về lƿnhăvựcăcơăs dữ liu, h thống thông tin và h thống thích nghi. Trong số những hội ngh đó,ă cần nhắcăđến một số hội ngh lớnănhư:ăACMăSIGIRăSpecialăInterestăGroupăonă Information Retrieval (SIGIR), User Modeling, Adaptation and Personalizationă(UMAP),ăandăACM’săSpecialăInterestăGroupăonăManagementă Of Data (SIGMOD). - Tiăcácătrưngăđi hcăvàăsauăđi hc trên thế giớiăđãăcóănhững khóa hc dành riêng cho vic nghiên cu h tưăvấn,ăhướng dn h tưăvấn cũngă được phổ biến trong các hội ngh khoa hc máy tính. [...]... phẩm tùy theo từng h thống tư vấn - Tìm kiếm t vấn tin cậy: Có một số ngư i sử dụng không tin c y h thống tư vấn, vì v yăđể đưaăra tư vấn tốt nhất cho h cần kiểm tra hành vi tìm kiếm c a h th tăđầyăđ , chính xác và dựa trên những thông tin th t sự có ích cho vi căđưaăra tư vấn - T vấn một danh sách các mục tốt nhất H tư vấn có thể đề xuất một danh sách một số mục tốt nhấtă cho ngư i dùng Mục tốt nhất... play.google.com Ví dụ h tư vấn trênă trang youtube.com,ă ngư i dùng truy c p vào gmailăsauăđó tìm kiếm các video, h thống sẽ lưuăl ch sử tìm kiếm và xem video c aăngư iădùngăđể đề xuất những video gần với nộiădungăngư i dùng đã tìm kiếm - Trong lĩnh vực giáo dục Các trang web h c trực tuyến hay các trang cung cấp tài li uănhưăslideshare.net, tailieu.vn cũngăđưaăh tư vấn vào h thống hỗ trợ ngư i dùng tìm kiếm tài... cáchăkhácănhauăđể tìm kiếm mục có thể ngư i dùng quan tâm - Ngư i dùng nhóm 1 (chưaăcóătiểu sử tư ngătácăvới các mục trên h thống) có thể xây dựng h tư vấn theo những cách sau: + Tư vấn những mục phổ biến nhất hoặcăđược yêu thích nhất + Sử dụngăphươngăpháp tư vấn dựa trên nội dung - Ngư i dùng nhóm 2 (cóăđ thôngătin tư ngătácăvới các mục trên h thống) có những cách sau để xây dựng h tư vấn: + Sử dụng... phươngăphápălai - Dựaă trênă ýă tư ng quảng cáo truyền mi ng, h tư vấn đưaă raă phươngăphápătiếp c n l c cộng tác, những mục tư vấn cho ngư i dùng sẽ dựa trên những mục mà nhữngăngư iădùngăđiătrước yêu thích Chính vì thế h tư vấn sử dụng phươngăphápănày mang tính chất tư vấn những mục, mặt hàng theo xuăhướng,ătràoălưu ngư i dùng - Vớiăphươngăpháp tư vấn dựa trên nội dung, h tư vấn dựa trên tính chất, nội... sự tư ngătácătíchăcực từ ngư i dùng 7 ng d ng h t ăv n 1.1.4 H tư vấn được ng dụng trong nhiềuălƿnhă vực khác nhau đặc bi t là trongălƿnhăvực kinh doanh, giải trí và giáo dục - Trong lĩnh vực kinh doanh H tư vấn được sử dụng rộng rãi trên các trang web bán hàng trực tuyếnănhưăamazon.comălà trang bánăsách,ăđƿaăCDă online nổi tiếng thế giới có h tư vấn giúp mang l i hi u quả cho h thống Vi t Nam có trang. .. trên tính chất, nội dung những mụcămàăngư iădùngăyêuăthíchăđể tìm ra các mục có tính chất, nộiădung tư ngătự để tư vấn - Phươngăphápă l c cộngă tácă và phươngă pháp tư vấn dựa trên nội dungăđều có nhữngăưuănhượcăđiểm c a nó Vì v yăphươngăphápălaiăraăđ iăđể h n chế nhượcăđiểm và phát triểnăưuăđiểm c aăhaiăphươngăphápătrên Khi xây dựng h tư vấn có thể sử dụng mộtăphươngăphápăhoặc kết hợp nhiềuăphươngăphápănàyăvới... phápănàyăđể tìm kiếm các mục tư vấn - Thiên vị các mục phổ biến Một mục phổ biến có thể đượcăđưaă vào danh sách tư vấn cho nhiều ngư i - Dữ liệu th a thớt Mộtăngư i dùng có thể chỉ đánhăgiáămột hoặc một vài mục trong số rất nhiều mục h quan tâm 26 1.2.2 Ph ngăphápăt ăv n d a trên n i dung (Content-based) Ý t ởng Ý tư ng c aăphươngăpháp tư vấn dựa trên nộiădungălà tư vấn một mục cho mộtăngư i sử dụng dựa... hai mục i và j Sự tư ngăđồng giữa hai mục i và j dựaătrênăđánhăgiáăc a những ngư iădùngăđãăxếp h ng cho cả hai mục Có ba công th căđể tính toán sự tư ngăđồng giữa hai mục [7] - Độ tư ngăđồng Cosine (Cosine similarity) Độ tư ngă đồng cosine giữa các vecto xếp h ng mục là số đoă tư ngă đồng phổ biến nhấtă vìă nóă đơnă giản, nhanh và cung cấp các dự đoánă cóă độ ∑ = || ||2 || ||2 √∑ ∈ chínhăxác tư ngăđối... tư vấn thuộc nhiều thể lo i khác nhau mục Các vấn đề c a ph ơng pháp lọc cộng tác - Quy mô đ ợc mở rộng theo thời gian Số lượngăngư i sử dụng, số lượng mục và số lượng xếp h ngăcũngătĕngătheoăth i gian và quy mô muốn m rộng c a nhà cung cấp - Không t vấn cho ng ời dùng mới và mục mới Nhữngă ngư i dùng mới và mục mới không có l ch sử thực hành không thể sử dụngăphươngă phápănàyăđể tìm kiếm các mục tư vấn. .. y ch ng tỏ rằng,ălƿnhăvực nghiên c u h tư vấn rấtăđược nhiều ngư i quan tâm và khẳngăđ nh giá tr c a nó trong thực tế.ăTrong tư ngălai,ă lƿnhăvực này sẽ cònăđược quan tâm nhiềuăhơn 1.1.2 Nhi m v c a h t ăv n Để hiểu rõăhơnăcôngăvi c c a h tư vấn ta sẽ xem một số nhi m vụ phổ biến sau: - Lấy ý kiến cá nhân H tư vấn t oăđiều ki n cho ngư iădùngăđóngă gópăđánhăgiá và bàyătỏ ý kiến với các mục.ăNgư i dùng . tư vấn cho trang web hc toán online, lunăvĕnăđãăgiới thiu trang web hc toán online và trình bày mục tiêu, mô tả và phươngăphápă giải quyết bài toán xây dựng h tư vấn cho trang web hc toán. thống và la tuổi ca các em, rấtăkhóăđể tìm kiếm kỹ nĕngăphùă hợp vớiănĕngălực ca mình. Vì lí do trên, tôi lựa chnăđề tàiă Tìm hiểu h tư vấn và xây dựng h tư vấn cho trang web hc toán online trợ xây dựng h tư vấn trên trang web hc toán online. - Lựa chnăphươngăphápătiếp cn và ng dụng xây dựng h tư vấn kỹ nĕngăhỗ trợ hc sinh thực hành trên trang web hc toán online. 3. Đốiătng