Xác định bài viết chứa ý định người dùng trên diễn đàn (LV thạc sĩ)

59 322 0
Xác định bài viết chứa ý định người dùng trên diễn đàn (LV thạc sĩ)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Xác định bài viết chứa ý định người dùng trên diễn đàn (LV thạc sĩ)Xác định bài viết chứa ý định người dùng trên diễn đàn (LV thạc sĩ)Xác định bài viết chứa ý định người dùng trên diễn đàn (LV thạc sĩ)Xác định bài viết chứa ý định người dùng trên diễn đàn (LV thạc sĩ)Xác định bài viết chứa ý định người dùng trên diễn đàn (LV thạc sĩ)Xác định bài viết chứa ý định người dùng trên diễn đàn (LV thạc sĩ)Xác định bài viết chứa ý định người dùng trên diễn đàn (LV thạc sĩ)Xác định bài viết chứa ý định người dùng trên diễn đàn (LV thạc sĩ)Xác định bài viết chứa ý định người dùng trên diễn đàn (LV thạc sĩ)Xác định bài viết chứa ý định người dùng trên diễn đàn (LV thạc sĩ)Xác định bài viết chứa ý định người dùng trên diễn đàn (LV thạc sĩ)Xác định bài viết chứa ý định người dùng trên diễn đàn (LV thạc sĩ)

HC VIN CễNG NGH BU CHNH VIN THễNG - Th Thu H XC NH BI VIT CHA í NH NGI DNG TRấN DIN N LUN VN THC S K THUT (Theo nh hng ng dng) H NI - 2016 HC VIN CễNG NGH BU CHNH VIN THễNG - Th Thu H XC NH BI VIT CHA í NH NGI DNG TRấN DIN N Chuyờn ngnh: Khoa hc mỏy tớnh Mó s: 60.48.01.01 LUN VN THC S K THUT (Theo nh hng ng dng) NGI HNG DN KHOA HC: TS NGễ XUN BCH H NI - 2016 i LI CAM OAN Tụi xin cam oan, lun ny l cụng trỡnh nghiờn cu khoa hc thc th ca cỏ nhõn, c thc hin di s hng dn khoa hc ca TS Ngụ Xuõn Bỏch Cỏc s liu, kt qu nghiờn cu v kt lun c trỡnh by lun l trung thc v cha c cụng b bt k hỡnh thc no Tụi xin chu trỏch nhim v cụng trỡnh nghiờn cu ca mỡnh HC VIấN Th Thu H ii LI CM N Li u tiờn, tụi xin chõn thnh cm n TS Ngụ Xuõn Bỏch Hc vin Cụng ngh Bu chớnh Vin Thụng, ngi ó trc tip hng dn tụi thc hin lun ny Vi s hng dn, cung cp ti liu, ng viờn ca Thy ó giỳp tụi vt qua nhiu khú khn v chuyờn mụn sut quỏ trỡnh thc hin lun Tụi xin chõn thnh cm n, Ban Giỏm c, Ban ch nhim Khoa Sau i hc v Khoa Cụng ngh Thụng tin, cựng cỏc Thy, Cụ ó ging dy v qun lý o to sut hai nm theo hc ti Hc vin Cụng ngh Bu chớnh Vin thụng Tụi xin chõn thnh cm n, Hi ng chm cng ó a gúp ý cho cng lun vn, giỳp tụi xỏc nh rừ v hon thin hn v mc ớch cng nh ni dung cho lun Cui cựng, tụi xin cm n gia ỡnh, bn bố, v cỏc ng nghip ó ng viờn, to iu kin cho tụi sut thi gian hc v nghiờn cu Mt ln na, tụi xin chõn thnh cm n ! iii MC LC LI CAM OAN .i LI CM N ii MC LC iii DANH MC Kí HIU, VIT TT vi DANH MC CC BNG vii DANH MC CC HèNH V viii M U CHNG 1: TNG QUAN BI TON PHT HIN í NH NGI DNG 1.1 X lý ngụn ng t nhiờn 1.2 Khỏi nim phõn loi bn 1.2.1 Bi toỏn phõn loi bn 1.3 Bi toỏn phỏt hin ý nh ngi dựng trờn din n 1.4 Cỏc nghiờn cu liờn quan 1.5 Kt chng 10 CHNG 2: CC PHNG PHP PHT HIN í NH NGI DNG DA TRấN HC MY 11 2.1 Phng phỏp gii quyt bi toỏn 11 2.2 Cỏc phng phỏp biu din c trng ca bn 12 2.2.1 Phng phỏp TF-IDF 12 a Gii thiu phng phỏp 12 2.2.2 Phng phỏp N-Gram 16 a Gii thiu phng phỏp 16 b Cụng thc tớnh xỏc sut thụ 17 2.3 Cỏc phng phỏp hc mỏy xõy dng mụ hỡnh phõn lp d liu 18 iv 2.3.1 Phng phỏp Naùve Bayes 18 a nh lý Bayes 18 b Mng Bayes (Bayesian Network) 19 c Khỏi nim mng Bayes 19 d Tớnh c lp xỏc sut mng Bayes 20 e Cỏch xõy dng mng Bayes 21 f Phõn lp Naive Bayes 22 2.3.2 Phng phỏp SVM (Support Vector Machine) 22 a Gii thiu phng phỏp 22 b Thut toỏn SVM 23 c Hun luyn SVM 25 d Cỏc u th ca SVM phõn lp bn 26 2.4 Xõy dng chng trỡnh gii quyt bi toỏn 27 2.4.1 Thut toỏn EM 27 2.4.2 Thut toỏn FS-EM 29 2.4.3 Thut toỏn Co-Class 30 2.5 Kt chng 32 CHNG 3: THC NGHIM V NH GI 33 3.1 D liu thc nghim 33 3.2 Thit lp thc nghim 34 3.3 Cụng c thc nghim 34 3.3.1 Thc nghim trờn d liu 35 3.3.2 Thc nghim trờn d liu 36 a Kch bn 36 b Kch bn 37 3.4 Kt qu thc nghim 37 v 3.4.1 Thc nghim trờn d liu 37 3.4.2 Thc nghim trờn d liu 38 a Kch bn 38 b Kch bn 39 3.4.3 So sỏnh kt qu thc nghim Co-Class vi cỏc thut toỏn khỏc 42 3.5 Nhn xột thc nghim v kt lun 44 KT LUN V KIN NGH 46 PH LC 47 TI LIU THAM KHO 49 vi DANH MC Kí HIU, VIT TT EM Expectation - Maximization Cc i húa k vng NPL Natural language processing X lý ngụn ng t nhiờn OCI Online commercial intention í nh thng mi trc tuyn SVM Support Vector Machine Mỏy vộc-t h tr vii DANH MC CC BNG Bng 3.1: Danh sỏch trang web thu thp d liu 33 Bng 3.2: Danh sỏch d liu thu c v nhón d liu 33 Bng 3.3: chớnh xỏc trung bỡnh thc nghim d liu cựng 38 Bng 3.4: chớnh xỏc thc nghim d liu khỏc kch bn 39 Bng 3.5: chớnh xỏc thc nghim ch in thoi, in t 40 Bng 3.6: chớnh xỏc thc nghim ch Camera, TV 41 viii DANH MC CC HèNH V Hỡnh 1.1: Bi toỏn phõn lp bn Hỡnh 1.2: Bi toỏn phỏt hin ý nh ngi dựng Hỡnh 2.1: Phng phỏp xõy dng chng trỡnh cho bi toỏn 11 Hỡnh 2.2: Mụ t mụ hỡnh vector ca bn 14 Hỡnh 3.1: So sỏnh chớnh xỏc thc nghim cựng thut toỏn 42 Hỡnh 3.2: So sỏnh chớnh xỏc thc nghim chộo thut toỏn 43 Hỡnh 3.3: So sỏnh chớnh xỏc thc nghim chộo thut toỏn 43 35 T kt qu thu c sau thc nghim, ta se kt lun c mụ hỡnh gỏn nhón cho d liu no l phự hp cho ti xỏc nh ý nh ca bn Cỏc o c bn cho bi toỏn xỏc nh ý nh ngi dựng: - Precision: l ty l cỏc ti liu c tr v thc s cú liờn quan n ti liu truy Precission = - |{}| (3.1) Recall: l ty l cỏc ti liu cú liờn quan n ti liu truy v trờn thc t c trớch xut tr v Recall = - |{}{}| |{}{}| |{}| (3.2) Fscore: Mt h thng IR cn phi cõn i gia recall v precision, bi vy mt o khỏc cng thng c s dng ú l Fscore c xõy dng da trờn recall v precision: Fscore = 2ìrecallìprecission recall+precisstion (3.3) Trong ú: - {relevant} l s cỏc ti liu liờn quan ti cõu truy - {retrieval} l s cỏc ti liu liờn quan m b phõn lp tr v 3.3.1 Thc nghim trờn d liu Ta se a kch bn thc nghim trờn d liu, d liu gỏn nhón v d liu cha gỏn nhón c ly trờn forum v tho lun v cựng ch Vi ln lt tng ch , trờn gn 1000 mu d liu, ta chia d liu thnh 10 phn ngu nhiờn, vi t l nhón v l tng ng nhau, ta ly ngu nhiờn phn d liu lm d liu cha gỏn nhón kim tra, v phn cũn li lm d liu hc Nh vy ta cn thc hin thc nghim 10 ln vi tng ch v trờn ch ta se cú 40 bn d liu cn thc nghim 36 Vic thc nghim c thc hin ln lt vi cỏc thut toỏn trớch chn c trng v phõn lp ó nờu trc ú, sau chy thc nghim xong se tớnh giỏ tr trung bỡnh ca cỏc tham s Precission, Recall, Fscore a nhn xột thut toỏn no phự hp nht vi bi toỏn xỏc nh ý nh ngi dựng cho d liu cựng 3.3.2 Thc nghim trờn d liu Ta se a kch bn thc nghim trờn d liu, d liu gỏn nhón v d liu cha gỏn nhón c ly trờn forum khỏc v tho lun v ch khỏc a Kch bn p dng theo phng phỏp 3TR-1TE: s dng d liu ly trờn forum ó c gỏn nhón tng ng vi d liu lm d liu hc v d liu trờn cũn li lm d liu kim tra Nh vy ta cn lm thc nghim nh sau: D liu hc D liu kim tra TV, in t, Camera in thoi TV, in t, in thoi Camera TV, Camera, in thoi in t in t, Camera, in thoi TV Vic thc nghim c thc hin ln lt vi cỏc thut toỏn trớch chn c trng v phõn lp ó nờu phn trờn, sau chy thc nghim xong se tớnh giỏ tr trung bỡnh ca cỏc tham s Precission, Recall, Fscore v a ỏnh giỏ kt qu thc nghim 37 b Kch bn S dng d liu ó gỏn nhón ca d liu c ly trờn forum v tho lun v ch lm d liu hc v d liu trờn forum khỏc v tho lun v ch khỏc lm d liu kim tra Nh vy ta cn lm ln lt 12 thc nghim nh sau: D liu hc D liu kim tra D liu hc D liu kim tra TV in thoi in t TV TV in t in t in thoi TV Camera in t Camera Camera in thoi in thoi TV Camera in t in thoi in t Camera TV in thoi Camera Vic thc nghim c thc hin ln lt vi cỏc thut toỏn trớch chn c trng v phõn lp ó nờu phn trờn, sau chy thc nghim xong se tớnh giỏ tr trung bỡnh ca cỏc tham s Precission, Recall, Fscore v a ỏnh giỏ kt qu thc nghim 3.4 Kt qu thc nghim 3.4.1 Thc nghim trờn d liu Sau thc hin thc nghim trờn d liu ta thu c kt qu gỏn nhón khỏ chớnh xỏc v c thng kờ li bng di õy: 38 Bng 3.3: chớnh xỏc trung bỡnh thc nghim d liu cựng NAẽVE BAYES SVM Ch TFIDF N1Gram N2Gram N3Gram TFIDF N1Gram N2Gram N3Gram 67.8 68.7 72.1 69.9 70.1 63.7 65.5 66.4 64.3 66.5 68.1 68.5 68.8 66.5 63.5 66.6 69.1 66.7 68.3 66.4 67.3 67.8 65.6 69.6 67.8 68.5 70.3 70.2 69.6 65.9 69.9 65.4 in thoi in t TV Camera Khi thc nghim vi d liu, vi kt qu thu c bng, ta nhn thy: - chớnh xỏc ỏp dng cỏc thut toỏn gỏn nhón d liu ri vo khong 63-72%, mc tng i chớnh xỏc i vi c d liu - Trong ú vi ch in t thut toỏn cú chớnh xỏc trung bỡnh l thp nht, v ch TV cú chớnh xỏc l cao nht - Da vo bng d liu thu c, ta nhn thy s dng thut toỏn SVM phõn lp d liu se a kt qu kộm chớnh xỏc hn so vi thut toỏn phõn lp v ú, thut toỏn trớch chn c trng N2Gram kt hp vi thut toỏn Naùve Bayes l a li kt qu chớnh xỏc cao nht 3.4.2 Thc nghim trờn d liu a Kch bn Sau thc hin thc nghim trờn d liu vi kch bn 1, ly d liu ca lm d liu hc v d liu ca cũn li lm d liu cha gỏn nhón ta thu c kt qu c thng kờ li bng di õy: 39 Bng 3.4: chớnh xỏc thc nghim d liu khỏc kch bn NAẽVE BAYES SVM Ch TFIDF N1Gram N2Gram N3Gram TFIDF N1Gram N2Gram N3Gram in thoi 64.32 69.95 71.94 68.33 65.36 72.24 71.51 72.54 in t 64.23 65.24 64.68 65.82 67.17 66.32 66.52 69.02 TV 66.04 68.83 70.75 70.75 65.98 67.74 65.23 74.73 Camera 68.66 69.48 67.52 67.74 70.49 70.59 68.90 75.73 Khi thc nghim vi d liu vi kch bn ó nờu phn trc, vi kt qu thu c bng, ta nhn thy: - chớnh xỏc ỏp dng cỏc thut toỏn gỏn nhón d liu ri vo khong c61-76%, mc tng i chớnh xỏc - Trong ú, thc nghim d liu hc t cỏc ch in thoi, TV, Camera ỏp dng cho d liu kim tra l ch in t l em li kt qu chớnh xỏc thp nht - Kt qu thc nghim vi thut toỏn phõn lp SVM a chớnh xỏc trung bỡnh cao hn so vi thut toỏn Naùve Bayes, v ỏp dng thut toỏn trớch chn c trng N3-Gram kt hp vi thut toỏn phõn lp SVM cú kt qu chớnh xỏc l cao nht b Kch bn Sau thc hin thc nghim trờn d liu vi kch bn 2, ly d liu ca lm d liu hc v d liu ca cũn li lm d liu cha gỏn nhón ta thu c kt qu c thng kờ li bng di õy: 40 Bng 3.5: chớnh xỏc thc nghim ch in thoi, in t D liu kim th D liu hc TFIDF NAẽVE BAYES N1Gram N2Gram N3Gram TFIDF N1Gram SVM N2Gram N3Gram IN THOI IN T in t Camera TV in thoi Camera TV 67.36 71.63 70.06 63.84 64.36 61.65 65.27 70.54 65.86 62.64 64.07 62.67 70.43 69.14 67.59 63.86 62.98 64.38 66.94 69.22 68.83 62.57 63.70 64.19 71.41 71.26 66.15 62.48 63.76 61.72 70.73 66.18 69.48 64.74 62.43 64.99 69.68 66.99 65.69 64.52 64.95 62.40 72.39 73.02 68.30 64.19 64.27 65.20 41 Bng 3.6: chớnh xỏc thc nghim ch Camera, TV D liu kim th D liu hc NAẽVE BAYES CAMERA TV in t in thoi TV in thoi Camera in t TFIDF 71.65 69.34 67.02 69.54 68.03 70.35 N1Gram 71.95 66.96 70.15 70.05 70.24 66.28 N2Gram 71.58 71.74 65.87 71.96 70.45 69.32 N3Gram 70.61 67.03 71.88 65.47 68.16 66.03 TFIDF 68.83 69.18 71.99 65.31 68.97 67.27 N1Gram 66.19 68.21 69.02 65.66 70.28 65.44 N2Gram 66.82 71.98 66.04 69.08 66.42 68.86 N3Gram 70.14 67.24 71.35 70.99 69.83 72.43 SVM Khi thc nghim vi d liu vi kch bn ó nờu phn trc, vi kt qu thu c bng, ta nhn thy: - chớnh xỏc ỏp dng cỏc thut toỏn gỏn nhón d liu ri vo khong 59-71%, mc khỏ chớnh xỏc - Trong ú ỏp dng ln lt tng ch ch in thoi, TV, Camera lm d liu hc, v s dng d liu ch in t lm d liu kim th, thỡ chớnh xỏc ỏp dng vi ch in t l em li kt qu chớnh xỏc thp nht - Thut toỏn phõn lp d liu SVM em li chớnh xỏc gỏn nhón cao hn so vi thut toỏn Naùve Bayes ỏp dng vi kch bn d liu chộo 42 - Khi ỏp dng thc nghim trờn d liu khỏc nhau, vi cỏc thut toỏn trớch chn c trng thỡ thut toỏn N3-Gram kt hp vi thut toỏn phõn lp bn SVM a li kt qu gỏn nhón cao nht 3.4.3 So sỏnh kt qu thc nghim Co-Class vi cỏc thut toỏn khỏc Thc nghim d liu cựng Khi thc nghim so sỏnh kch bn phõn loi trờn vi ln lt cỏc thut toỏn EM, FS-EM v Co-Class ta thu c th phõn loi di õy: So sỏnh thut toỏn trng hp d liu cựng 71.0 70.0 69.7 69.0 68.9 68.0 67.8 67.0 67.3 66.5 66.0 67.6 66.9 68.7 68.9 66.4 67.4 66.6 67.9 65.0 64.2 64.0 64.3 69.3 67.1 67.0 66.0 65.5 66.1 65.8 64.5 64.8 63.0 EM FS-EM Co-Class 62.0 61.0 Hỡnh 3.1: So sỏnh chớnh xỏc thc nghim cựng thut toỏn Ta nhn thy, thc nghim trờn cựng d liu, kt qu xỏc nh ý nh ca bn khụng chờnh lch nhiu ỏp dng thut toỏn EM, FS-EM, CoClass, thut toỏn Co-Class cha hn vt tri hn v chớnh xỏc so vi thut toỏn trc ú Ngay mt s trng hp thc nghim ỏp dng thỡ thut toỏn FS-EM a kt qu chớnh xỏc hn so vi Co-Class Thc nghim d liu chộo 43 Tip theo, ta thc nghim vi d liu trỏi min, ln lt vi kch bn, ta thu c kt qu nh d th di õy So sỏnh thut toỏn trng hp d liu chộo kch bn 80.0 70.0 66.1 60.0 62.8 50.0 46.5 40.0 30.0 20.0 10.0 0.0 66.1 64.9 48.2 70.7 62.2 66.4 65.2 67.4 64.8 66.8 65.1 68.5 63.6 72.6 66.0 42.4 44.4 42.5 44.4 44.6 44.0 EM FS-EM Co-Class Hỡnh 3.2: So sỏnh chớnh xỏc thc nghim chộo thut toỏn So sỏnh thut toỏn trng hp d liu chộo kch bn 80.0 70.0 67.9 59.4 60.0 50.0 41.6 67.2 68.2 56.3 49.2 57.1 45.1 67.0 63.0 67.3 64.1 66.9 65.4 48.2 48.2 45.7 66.9 69.6 67.7 55.6 45.7 44.9 40.0 30.0 20.0 10.0 0.0 EM FS-EM Co-Class Hỡnh 3.3: So sỏnh chớnh xỏc thc nghim chộo thut toỏn 44 Nhn thy, thc nghim trờn d liu khỏc nhau, kt qu xỏc nh ý nh ca bn ó cho thy s chờnh lch rừ rng hn ỏp dng thut toỏn EM, FS-EM, Co-Class Thut toỏn Co-Class ó th hin c im mnh ỏp dng trng hp d liu chộo Trong ú - Thut toỏn EM th hin c kh nng phõn loi yu nht thut toỏn chớnh xỏc ca thut toỏn thp, khong 39-54% - Thut toỏn FS-EM cú chớnh xỏc mc tng i chớnh xỏc 5366% - V Thut toỏn Co-Class a li kt qu gỏn nhón hiu qu nht thc nghim xỏc nh ý nh bn, trng hp ỏp dng kt hp thut toỏn trớch chn c trng N3-Gram v thut toỏn phõn lp SVM, thut toỏn Co-Class a c kt qu phõn loi chớnh xỏc n 71% 3.5 Nhn xột thc nghim v kt lun Khi ỏp dng thut toỏn Co-Class vo bi toỏn xỏc nh ý nh ngi dựng, ta nhn thy: - Khi ỏp dng gỏn nhón trờn ch nht nh, thỡ thut toỏn phõn lp Naùve Bayes em li kt qu cao hn so vi thut toỏn SVM Cú th núi, thut toỏn Naùve Bayes phự hp vi bi toỏn phõn loi d liu trờn cựng hn so vi thut toỏn SVM V ngc li, thut toỏn SVM em li kt qu cao hn ỏp dng th nghim vi trng hp d liu chộo - Thut toỏn SVM a kt qu chớnh xỏc vi cỏc bn ngn 5070 t, xỏc nh vi bn di ln hn 150 t v b nh hng bi d liu nhiu dn n thut toỏn SVM xỏc nh thiu chớnh xỏc - Khi thc nghim xỏc nh trờn d liu, vi thut toỏn EM, cho kt qu xỏc nh ý nh kộm chớnh xỏc hn so vi thut toỏn cũn li l thut toỏn FS-EM v thut toỏn Co-Class - Khi thc nghim trờn d liu khỏc nhau, thut toỏn EM a kt qu chớnh xỏc thp, v thut toỏn FS-EM a kt qu kộm 45 chớnh xỏc hn so vi Co-Class Vic xỏc nh c ý nh ca ngi dựng ta cha th thu thp c d liu hc ca riờng ch ú l rt hay xy ra, v thut toỏn Co-Class ó th hin c u im tỡnh d liu hc mỏy khụng thuc mt ch nht nh (kch bn gp ch lm d liu hc) hay ỏp dng d liu hc mỏy l ca mt ch khỏc, khụng liờn quan vi ch kim tra (kch bn ly d liu ch khỏc khụng cựng d liu lm d liu hc) - Kt qu thc nghim ca Co-Class vi d liu trỏi em li kt qu cao v xp x bng vi kt qu xỏc nh ý nh bn trờn d liu cựng Nh vy, t kt qu thc nghim thu c cho thy Co-Class giỳp cho vic xỏc nh ý nh bn t chớnh xỏc khỏ cao v se khụng gp khú khn ln ỏp dng trờn bt k ch no v vic cha cú d liu hc mỏy ca chớnh ch ú cng se khụng cũn l tr ngi ln xỏc nh ý nh ngi dựng 46 KT LUN V KIN NGH Lun trung nghiờn cu phỏt hin chớnh xỏc ý nh ca ngi vit trờn din n tho lun Trong lun ó trung nghiờn cu sõu cỏc phng phỏp biu din c trng ca bn (N-grams, TF-IDF), cỏc phng phỏp hc mỏy xõy dng mụ hỡnh phõn lp d liu (Naùve Bayes, SVM) v a bi toỏn phỏt hin ý nh ngi dựng ỏp dng trờn d liu cựng v chộo C th, lun ó t c mt s kt qu sau: - Nghiờn cu cỏc mụ hỡnh biu din c trng ca bn, mụ hỡnh phõn lp d liu ỏp dng bi toỏn xỏc nh ý nh ca ngi vit - xut mt s ci tin nhm nõng cao chớnh xỏc ca vic phỏt hin ý nh ngi dựng thụng qua bi vit - p dng thut toỏn nõng cao chớnh xỏc, thc nghim v ỏnh giỏ kt qu Trong tng lai, lun cú th c phỏt trin theo cỏc hng: - Nghiờn cu cỏc phng phỏp nõng cao chớnh xỏc v ci thin tc x lý i vi vic phỏt hin bn cha ý nh ngi dựng - Nghiờn cu cỏc phng phỏp thu thp d liu t ng, t ú kt hp vi cỏc h thng t vn, qung cỏo a qung cỏo phự hp, vi lng ngi quan tõm cao 47 PH LC Xõy dng ng dng ng dng h tr ngi dựng se c xõy dng bng ngụn ng Java s dng trờn mụi trng mỏy tớnh, yờu cu cu hỡnh mỏy tớnh ci t mụi trng: Java JDK7 Chi tit v chc nng, kin trỳc v giao din c mụ t di õy Chc nng ca ng dng bao gm: - Da vo bn ngi dựng a ra, ng dng x lý v a ý nh ca bn l cú mun mua sn phõm hay khụng - ng dng x lý d liu v a ch v sn phõm m ngi dựng mun mua hoc mun tỡm hiu thờm T ú tớch hp vi cỏc h thng qung cỏo a qung cỏo phự hp vi bn Giao din ng dng nh sau: Hỡnh 1: Giao din ng dng 48 Hỡnh 2: Mụ t ng dng ng dng gm vựng d liu chớnh: - Vựng 1: Nhp d liu, bn cn xỏc nh ý nh - Vựng 2: Kt qu xỏc nh ý nh ngi dựng (Cú ý nh hoc khụng cú ý nh) - Vựng 3: a ch , sn phõm bn ang núi n VD: Ch in thoi, TV s dng ng dng ta thc hin cỏc bc nh sau: - Bc 1: Nhp bn vo vựng d liu - Bc 2: Nhn vo nỳt xỏc nh ý nh ngi dựng kim tra kt qu v kt qu se hin ta ti vựng d liu v nh hỡnh trờn 49 TI LIU THAM KHO [1] Ngo Xuan Bach, Tu Minh Phuong, Leveraging User Ratings for ResourcePoor Sentiment Classification, In Proceedings of the 19th International Conference on Knowledge-Based and Intelligent Information & Engineering Systems (KES), Procedia Computer Science, pp 322331, 2015 [2] Nguyen Thi Duyen, Ngo Xuan Bach, Tu Minh Phuong, An Empirical Study on Sentiment Analysis for Vietnamese In Proceedings of the International Conference on Advanced Technologies for Communications (ATC), Special session on Computational Science and Computational Intelligence (CSCI), pp 309-314, 2014 [3] Zhiyuan Chen, Bing Liu, Meichun Hsu, Malu Castellanos, and Riddhiman Ghosh, Identifying Intention Posts in Discussion Forums, 2013 [4] Honghua (Kathy) Dai, Lingzhi Zhao, Zaiqing Nie, Ji-Rong Wen, Lee Wang, Ying Li, Detecting online commercial intention (OCI), 2006 [5] Steve R Gunn, Support Vector Machines for Classification and Regression, 1998 [6] R A S C Jayasanka, M D T Madhushani, E R Marcus, I A A U Aberathne, S C Premaratne Sentiment Analysis for Social Media, 2014 [7] Hiroshi Kanayama, Tetsuya Nasukawa , Textual demand analysis: detection of users' wants and needs from opinions, 2008 [8] Fariba Sadri, Weikun Wang, Afroditi Xafi, Intention Recognition with Clustering, 2012 [9] P Hiroshi Shimodaira, Text Classification using Naive Bayes, 2015 ... giải toán xác định ý định người dùng sau: - Xác định viết có chứa ý định rõ ràng - Giữa thông tin gây nhiễu, xác định xác ý định viết thể - Nghiên cứu áp dụng toán xác định ý định người dùng trường... dụng xác định ý định người dùng sẽ làm rõ vấn đề sau: - Xác định viết có chứa ý định viết ý định - Việc xử lý tập liệu để trích xuất đâu liệu nhiễu không liên quan tới ý định người dùng để trích... identification [4]” việc xác định ý định người dùng dựa lịch sử người dùng tìm kiếm mạng xã hội hay website tìm kiếm Khi xác định quan điểm người dùng dựa lịch sử tìm kiếm người dùng, việc xác định sẽ dựa

Ngày đăng: 27/04/2017, 14:08

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan