Hình 5 .2 Mơ-đunăTrainingă ca mơ hình CROAS
B ng 3.5 So sánhăđ chính xác ca Fine-Tuning1 vƠ Fine-Tuning2
STT T c m xúc Mô-đun Fine-Tuning1 Mô-đun Fine-Tuning2
1 Great 0,9221 0,9825 2 Good 0,9313 0,9859 3 Nice 0,9367 0,9753 4 Light 0,8514 0,9608 5 Fast 0,8598 0,9730 6 Cheap 0,9703 0,9831 7 Bad 0,9268 0,8947 8 Amazing 0,9747 0,9643 9 Loud 0,8814 1,0000 10 Beautiful 0,9464 0,9167 11 Expensive 0,9355 1,0000 12 Powerful 0,9615 1,0000 13 Slow 0,9167 1,0000 14 Strong 0,9444 0,5000
51
Ti pătheoăs ălƠăph ngăphápăđánhăgiáămơăhìnhăIAI:
- tp lƠ s c p khía c nh-c m xúcăđúng trong t păđ c phân l p. - fp lƠ s c p khía c nh-c m xúc sai trong t păđ c phân l p. - fn lƠ s c p khía c nh-c m xúc sai trong t p phân l p mong mu n.
Khiăđóđ chính xácăP,ăđ truy h i R vƠ đ đoăF1-scoreăđ c tính theo cơng th c 3.2, 3.3 vƠ 3.4.
P (3.2)
R (3.3)
F1 (3.4)
Mơăhìnhăphơnăl păc aăIAIăđ căđánhăgiáătrongăbaătr ngăh p:ă
- Tr ng h p 1: L y k t qu c a mơ-đun Trainingăđ đánhăgiáătrênăDocuments,ă khơng có Fine-Tuning, ký hi u IAI1.
- Tr ng h p 2: L y k t qu c a mô-đun Fine-Tuning1ăđánhăgiáătrên Documents, ký hi u IAI2.
- Tr ng h p 3: L y k t qu c a mô-đun Fine-Tuning2ăđánhăgiáătrênăDocuments,ă ký hi u IAI3.
Ápăd ngăcôngăth că(3.2),ă(3.3)ăvƠă(3.4)ătrênăt păv năb năc măxúcăDocumentsl yăt ă
t păd ăli uăc aăcông ty YounetMedia2 v i 110ăv năb năc măxúc không gán nhãn, v ă
smartphone đ cămôăt ănh ăB ng 3.6. Trongă110ăv năb năc măxúcănƠyăcóă121ăcơuăcóă
ch aăkhíaăc nhă năvƠăt ngăs ăkhíaăc nhă nălƠă124.ăNh ăv ym tăcơuăcóăth ăch aăh năm tă
khíaăc nhă n.
B ng 3.6 Mơăt ăt păd ăli uăsmartphoneădùng cho đánhăgiáăth cănghi mămơ hình IAI
S n ph m S v n b n S cơu có khía c nh n S khía c nh n
Smartphone 110 121 124
52
SauăđơyălƠăhaivíăd ăv ăv năb năc măxúcătrongă110ăv năb nătrongăB ng 3.6:
Víăd ă3.6:ăắI bought ip6s yesterday. It is very fast and I love it.”
Víăd ă3.7:ăắI purchased iPhone 6 in silver color. It is expensive. But, iPhone has a retina display. It is very awesome.”
Trong Víăd ă3.6 cóă2ăcơuăvƠăcơuăth ăhaiăch aăkhíaăc nhă năđ căth ăhi năc măxúc b iăt ăắfast”.ăVíăd ă3.7 cóă4ăcơuăvƠătrongăcơuăth ăhaiăcóăkhíaăc nhă năđ căth ăhi năc mă xúc b iăt ăắexpensive”.
TrongăDocumentsăcóă110ăv năb năv ăsmartphoneăbaoăg mă124 t ăc măxúcăkhơngărõă
khíaăc nh.ăK tăqu ăphơnăl p khíaăc nhă năchoăcácăt ăc măxúcătrongăDocumentsăđ că
trình bày trong B ng 3.7 vƠăk tăh păsoăsánhăv iăph ngăphápă[103],ăḱăhi uăML-KB*.
Ph ngăphápăc aălu n ánăđ căđánhăgiáăl năl tăquaăt ngămô-đun: Training (IAI1),
Fine-Tuning1 (IAI2) và Fine-Tuning2ă(IAI3).ăV iăk tăqu ătrongăB ng 3.7 cho th yăđ ă chính xác (0,88) và F1 (0,81)ăc aăIAI3ăcaoănh t.ă ătruyăh iă(0,83)ăc aăML-KB* cao nh tăsoăv iăph ngăphápăc aăbƠiăbáo.
NgoƠiăra,ăk tăqu ăđ ăchínhăxácăc aăIAI1ă(0,52)ăr tăth păsoăv iăIAI2ă(0,81) và IAI3
(0,88).ă i uănƠyăch ngăminhăđ căhi uăqu ăc a mơăhìnhăIAIă ăHình 3.2 khiăápăd ngă
Fine-Tuning,ăm tăph ngăphápăph ăbi năhi nănayăđ căápăd ngătrongăh căsơu,ănh mă nơngăcaoăhi uăqu ăc aăbƠiătốnăphơnăl p.ăHình 3.6 s ătr căquanăhóaăk tăqu ă ăB ng 3.7
và th ăhi năđ căhi uăqu ăc aăph ngăphápămƠ lu n ánăđ ăxu tăkhiăsoăsánhăv iăph ngă
pháp ML-KB*.
B ng 3.7 B ng so sánh mơ hình IAI và ML-KB*ătrênăDocumentsăcóă110ăv năb năv ă smartphone
Mơ hình Precision Recall F1
ML-KB* 0,71 0,83 0,76
IAI1 0,52 0,44 0,48
IAI2 0,81 0,68 0,74
53
Hình 3.6 SoăsánhămơăhìnhăIAIăv iăph ngăphápăML-KB*.
K t lu n
Xácăđ nhăkhíaăc nhă nălƠăm tăv năđ ăph ăthu căvƠoăph măviămi năchuyênăbi tăvƠă ng ăc nhăc aăcácăt ,ăc măt ,ătrongăđóăph iăk ăđ năt ăch ăđ iăt ng,ăkhíaăc nhăvƠăc mă
xúc.ăVìăv y,ăv iăđ ăxu tăs ăd ngăvéc-t ăcóăng ăc nhăđ căsinhăraăt ămơăhình ngơn ng
vƠđ aăvƠoămơăhìnhăh căsơuăIAIăc a lu n án, th c nghi măđưăchoăk tăqu ăkháăt t.ăTrongă
mơ hìnhăIAIăcóăs ăk tăh păphơnătíchăcúăphápăc aăv năph măph ăthu căvƠăphơnăgi iăđ ngă
thamăchi uăđ iăt ăđ ăsinhăraăb ăd ăli uăhu năluy nălƠăcácăc păc măxúcă- khíaăc nh.ăM iă
quanăh ăgi aăc măxúcă- khíaăc nhăđư t o nên nh ng ch d n r tăquanătr ngăđ ămơăhìnhă
h căvƠăt oăraăcácăb ăphơnăl păt ngă ngăv iăm iăt ăc măxúcănh măt ngăđ ăchínhăxácă
khiăxácăđ nhăkhíaăc nhă nătrongăm tămi năchuyênăbi t.D̀ăk tăqu ăđ ăchínhăxácăkháăt t,ă
mơăhìnhăIAIăv năcịnăh năch ălƠăph ăthu cămi năchunăbi t.
3.2 Mơ hình phân gi i đ ng tham chi u đ i t ng cho phân tích c m xúc có m t
đ i t ng
Mơăhìnhăphơnăgi iăđ ngăthamăchi uăđ iăt ngăchoăcácăv năb năc măxúcăcóăm tăđ iă t ngălƠxácăđ nhăđ ngăthamăchi uăb ba: đ i t ng - khía c nh - c m xúcđ călu n án đ ăxu tăvƠtrìnhăbƠyă ăHình 3.7.
Mơăhìnhă ăHình 3.7 có các mơ-đun sau.
- Document lƠăv năb năcóắăki nă(c măxúc)ăv ăcácăsmartphone,ălƠăd ăli uăđ uăvƠoăc aă mơ hình;
54
- Parse là mơ-đun phân tích cú pháp: xácăđ nh các quan h ng ngh a, cú pháp cho các t , c m t .
- Anaphora & Entity CR: mô-đunăphơnăgi iăđ ngăthamăchi uăđ iăt ăvƠăth căth ;
- Embedding Context Word: mô-đunchuy năđ iăcácăt ăthƠnhăcácăvéc-t d aătheoăng ă
c nhătráiăvƠăph iăc aăcácăt ăc aăm tăcơuătrongăm tăđo năv năb n,ăt ngăt mô-đună
ECW trong ph n 3.1.2.
- Aspect-based Sentiment Analysis: mơ-đunphơnătíchăc măxúcăm căkhíaăc nh;
- Sentiment Ontology: m tăc ăs ătriăth căchunăbi tăcóăc măxúc;
- OBASCore: mơ-đun do lu n ánă đ ă xu t.ăOBASCore s ă d ngă c ă s ă triă th că c aă ontologyăđ ăxácăđ nhăcácăb ăbaăđ ngăthamăchi uăgi aăđ iăt ngăv iăkhíaăc nhăcóă
c măxúcă(TripletăofăObject-Aspect-Sentiment).ăGi iăthu tămơăt ăch căn ngăc aămơ-
đunOBASCoreăđ cătrìnhăbƠyă ăHình 3.9.
- Triplets of Object-Aspect-Sentiment lƠ k t qu c a bƠi toán, g m các b ba:ăđ iăt ng ậ khía c nh ậ c m xúc trong Document.
3.2.1 Parse – Phân tích cú pháp
ơyălƠăb căquanătr ngăvƠăc ăb năc aăb tăk ăbƠiătốnăliênăquanăđ năphơnătíchăv nă b n.ăM tăv năb năd iăd ngăngônăng ăt ănhiênăc aăb tăk ăngônăng ănƠo,ăsauăkhiăti nă x ăĺăd ăli uă(xóaăb ănh ngăḱăt ,ănh ngăv̀ngăkhơngăc năthi tăc aăh ăth ng,ătáchăđo n,ă
cơu,ăt ,ăv.v.)ăcácăv năb năs ăquaăb căphơnătíchăcúăphápănh :ăgánănhưnăt ălo i,ănhưnă
quanăh ăng ăpháp,ăt o cây cú phápăv.v.ăM iăngơnăng ăs ăcóăm tăb ăphơnătích cú pháp
55
Hình 3.7 Mơăhìnhăphơnăgi iăđ ngăthamăchi uăcho phân tích c m xúc có m tăđ iăt ng.
3.2.2 Anaphora & Entity CR - Phân gi i đ ng tham chi u đ i t và th c th
Trongăm tăv năb n,ăcácăc mădanhăt ăho cădanhăt ăch ăm tăđ iăt ngă(th căth ăcóă
tên)ăđ cănh c l iătrongăcácăcơuăho căcácăđo năv năb năphíaăsauăb iăcácăđ iăt ăthayăth ă
ho căc mădanhăt ănguyênăg căho căcácăc măt ăkhácăng năg năh năhayăm tăcáchăg iă khácăc aăđ iăt ng,ăth căth ăbanăđ u.ăT đ căđi m nƠy c aăv năb n, lu n án chia thƠnh
haiătr ng h p riêng bi t xácăđ nhăđ ng tham chi uătrongăv năb n cho mơ-đun Anaphora
&ăEntityăCR,ăđó lƠ:
- Tr ngăh pă1:ăxácăđ nhăcácăđ iăt ăđ ăc păđ năđ iăt ng,ăth căth ăbanăđ uăđ că
g iălƠăphơnăgi iăđ ngăthamăchi uăđ iăt ;
- Tr ngăh pă2:ăxácăđ nhăcácăc mădanhăt ăc̀ngăđ ăc păđ năđ iăt ng,ăth căth ăbană
56
Víăd ă3.8: “1I have just bought a Samsung Galaxy Note7. 2I like Note7 because it looks beautiful. 3However, it is expensive. 4It has a camera. 5I took a photo and it is
amazing.”
Trong Víăd ă3.8,ăđ iăt ngălƠăắSamsung Galaxy Note7”ăvƠăc ngăd ănh năraăắNote7”ă
lƠăcáchăg iăkhácăc aăắSamsung Galaxy Note7”,ătr ngăh pănƠyăg iălƠăđ ngăthamăchi uă
th căth ăcóătên.ăTuyănhiên,ăt ăắit”ătrongăcơuth ă2,ă3ăvƠă4ălƠăcácăđ iăt ăđ căd̀ngăđ ăthayă th ăắNote7”;ăho căt ăắit”ătrongăcơuăth ă5ăthayăth ăt ăắphoto”,ăcácătr ngăh pănƠyăg iălƠă
đ ngăthamăchi uăđ iăt ă(AnaphoraăCRă- ACR).
Hi nănayăphơnăgi iăđ ngăthamăchi uăđ iăt ăvƠăth căth ăcóătênăcóăkháănhi uăcơngăc ă h ătr ăvƠăđ tăđ căđ ăchínhăxácăkháăcao,ănh ăCoreNLPăc aăStanford,ăNeuralCorefăc aă spaCy,ăv.v.ăChínhăvìăv yălu năánăs ăkhơngănghiênăc uăsơuăđ ăđ aăraăti păc năm iăchoăc ă
haiătr ngăh pă1ăvƠă2.ăTácăgi ăs ăd ngăcácăcơngăc ăcóăs nănƠyăđ ăgi iăquy tămơ-đun
Anaphora & Entity CR c a mơ hình (Hình 3.7).
3.2.3 Aspect-based sentiment analysis - Phân tích c m xúc m c khía c nh
V i mơ hình Hình 3.7,ăv năđ ăxácăđ nhăm iăquanăh ăgi aăđ iăt ngă- c m xúc, khía
c nhă- c măxúcătrongăm tăv năb năg iălƠăphơnătíchăc măxúcăm căkhíaăc nh.ăM tăkhía
c nhăđ cănh năxétăv iăc măxúcălƠăgì,ătíchăc c,ătiêuăc căhayătrungăl p.ăBƠiătốnănƠyăcóă
r tănhi uăcáchăti păc năvƠăđ cănhi uănhƠănghiênăc uăquanătơmăvƠăhi n nay có r t nhi u
cơngăc ăh ătr ăcóăhi uăqu ăcaoănh ăđư gi i thi uătrongăch ngă2.ă
3.2.4 Ontology c m xúc
OntologyălƠăm tăc ăs ătriăth căch aăcácăđ căt ăv ăcácăkháiăni măc ngănh ăquanăh ă gi aăcácăkháiăni măđóătrongăđaăl nhăv c.ăT̀yătheoămi năchunăbi tămƠăontologyăl uă
tr ăvƠăt ăch căthơngătinăđ ăh ăth ngăcóăth ăx ăĺ.ăHi nănayăontologyălƠăm tătrongnh ngă
cơngăc ăh uăhi uăchoăcácăbƠiătốnăh ngăđ nătriăth cănh ătruyăv năthơngătin,ăh ăth ngă h iăđáp,ăv.v.ăC ăth ănóăđ căs ăd ngătrongăcácăl nhăv cătríătu ănhơnăt o,ăwebăng ăngh a,ă x ăĺăngơnăng ăt ănhiên,ăv.v.
TrongăbƠiătốnăphơnăgi iăđ ngăthamăchi uăđ it ngăcho phơnătíchăc măxúcăchoăv nă
b năcóăm tăđ iăt ng,ăvi căxácăđ nhăcácăkháiăni măvƠăm iăquanăh ăgi aăchúngălƠătr ngă tơmăc aăbƠiătoán.
57
ăgi iăquy tăm cătiêuăc aăđ ătƠiălu năán,ăbanăđ uătácăgi ăs ăxơyăd ngăth ăcơngă Ontologyăc măxúcăchoămi năchunăbi tă(smartphone)ătrênăc ăs ăápăd ngăvƠăphátătri nă cơng trình [8], v iăhaiăt pă(C, R). Trongăđó:ă
C = (CO, CA, CS), lƠt păcác khái ni m. CO là t păkhái ni măc aăđ iăt ngă(object), ví d Samsung, IPhone, Oppo, v.v.; CA là t păkhái ni măc aăkhía c nh (aspect): có ba l pă con,ă ví d nh ă Deviceă (camera,ă battery,ă v.v.), Attribute (design, price, v.v.) và
Application (Bluetooth, wifi, v.v.); CS là t păkhái ni m c m xúc (sentiment) cóăcácătr ă thu căcácăl pătíchăc că(Positive),ătiêuăc că(Negative)ăvƠătrungăl pă(Neutral).ă
R = (RT, RN, RS) t păcácquanăh gi aăcácăl pă(class)ăv iănhau,ăgi aăcácăcáăth ătrongă
c̀ngăclassăho căkhácăclass.ăRTlƠăt păcácăm iăquanăh ăcóăphơnăc păchaăconă(subconcept-
of); RN lƠă t pă cácă m iă quană h ă khôngă phơpă c pă chaă conă (isCore,ă hasAttribute,ă hasComponent, hasApplication); RS lƠă t pă cácă m iă quană h ă c mă xúcă (isPositive,ă isNegative, isNeutral).
Cáăth ă(Individual)ălƠăth căth ăhayăđ iăt ngăc ăth : +ăc aăđ iăt ng:ăSamsungăGalaxyăJ3,ăOppoăA37,ăv.v. +ăc aăkhíaăc nh:ăprice,ădesign,ăcamera,ăv.v.
+ăc aăc măxúc:ăcheap,ăexpensive,ăbeautiful,ălong,ăv.v.
ăhi uărõăh năv ăc uătrúcăc aăOntologyăc măxúcăh ătr ăphơnăgi iăđ ngăthamăchi uă
đ iăt ngăậ khíaăc nhă ậ c măxúc,ălu n ánă minhăh aăthơngăquaăHình 3.8.ăKi nătrúcă
ontologyăcóăbaăl păObject,ăAspectăvƠăSentiment.ă ngăm iătênăcóăth ăxu tăhi năgi aă
cácăcáăth ătrongăc̀ngăm tăl păho căgi aăcácăl păkhácănhau.ă ngăm iătênăth ăhi năs ă
đ ngăthamăchi uăgi aăđ iăt ngăậkhíaăc nh,ăkhíaăc nhăậc măxúc.
Trongăđó,ăl păOBJECTăbaoăg mătênăcácăđ iăt ngătheoămi n,ăđ căḱăhi uăObj.
M iăth căth ăcóătênăriêngălƠăcácădanhăt ăriêngă(NNP)ăvƠăcóăth ăđ ngăthamăchi uăv iă
nhau.ă ơyăc ngălƠm tăy u t quanătr ngăh ătr ăbƠiătoánăphơnăgi iăđ ngăthamăchi uăth că
th ă(NNP).ăM iăth căth ăcóăth ăcóănhi uăcáchăg iăkhácănhauăv iătênăđ yăđ ăho cătênă l căb tăt ănh ngăng iăngheăv năbi tăchúngăc̀ngăm tăđ iăt ngăc ăth .
L păth ăhaiăASPECT,ăbaoăg măcácăkhíaăc nhăc aăđ iăt ng,ăđ căḱăhi uăAsp. Khía
c nhăcóăth ălƠăcácăthƠnhăph năc uăt oănênăđ iăt ngăho căcóăth ălƠăthu cătínhăc aăđ iă t ng.ăXétăv ăt ălo i,ăkhíaăc nhăcóăth ălƠădanhăt ,ăc mădanhăt ăho călƠăcácăđ ngăt ăch ă ch căn ngăc aăđ iăt ng,ăc aăcácăthi tăb ăh ătr .ăVíăd ătrongăph măviăsmartphone,ăcácă
58
khíaăc nhăđ căchiaăthƠnhăbaăl păcon,ăđóălƠăắDEVI”ăch aăcácăt ăch ăđ năcácăthi tăb ăc uă thƠnhăhayăh ătr ăchoăm tăsmartphone;ăắATTR”ăch aăcácăt ăch ătínhăch t,ăthu cătínhăc aă đ iăt ngăho căcácăthi tăb ;ăắAPPL”ăch ăđ năcácă ngăd ngăchunăv ăph năm măti năíchă đ căcƠiăđ tătrongăsmartphone.
Hình 3.8 Ki nătrúcăOntologyăc măxúc.
L păth ăbaăSENTIMENT,ălƠăcácắăki n,ăc măxúcăhayănh năxétăv ăcácăkhíaăc nhăc aă
đ iăt ngăvƠăđ căḱăhi uăSen.ăCácắăki năcóăth ălƠăkhen,ăchêăhayătrungăl p,ăvìăv yăđ că
chiaăthƠnhăbaăl păcon:ăắPOS”,ăắNEG”ăvƠăắNEU”.ăCácăt ăc măxúcăthu căcácălo iăt ănh ă tínhăt ,ătr ngăt ăho căđ ngăt ăch ăc măxúcă(love,ăhate,ăv.v.).
NgoƠiăbaăl păkháiăni m,ătrongăontologyăc măxúcăcịnăcóăm iăquanăh ăgi aăcácăl pă v i các th ăhi n(instance).ăM tăontologyăh ătr ăchoăbƠiătốnăphơnăgi iăđ ngăthamăchi uă trongăv năb năcóăc măxúcănênăcácăquanăh ăc ngăkhơngăqăph căt p.ăM tăs ăquanăh ă
nh :ăisCoreă(đ ngăthamăchi u);ăisAsp,ăhasAspă(quanăh ăđ ngăthamăchi uăđ iăt ngă-
khíaăc nh;ăisSen,ăhasSenă(quanăh ăđ ngăthamăchi uăkhíaăc nhă- c măxúc);ăisPos,ăhasPosă
(quanăh ăkhíaăc nhăcóăc măxúcătíchăc căgi aăAspăv iăcácăSen);ăisNeg,ăhasNegă(quanăh ă khíaăc nhăcóăc măxúcătiêuăc căgi aăAspăv iăcácăSen);ăisSubClassă(quanăh ăl păchaăvƠă l păcon);ăv.v.
59
• nh n di n các t thu c l păđ iăt ng, khía c nh ho c c m xúc
• xácăđ nhăkhíaăc nhă(aspect)ă năchoăc măxúc,
• xácăđ nhăkhíaăc nhă(aspect)ăv iăđ iăt ngă(object)
• ontologyăcóăth gi iăquy tăđ ngăthamăchi uăth căth ăc mădanhăt ,
• xácăđ nhăc măxúcălƠătíchăc căhayătiêuăc c.
Sauăkhiăcóăđ căb ăđ ngăthamăchi uăth căth ,ăb ăc măxúcăvƠăontologyăc măxúcăh ă tr ăphơnăgi iăđ ngăthamăchi u,ălu n ánăk tăh păbaăthƠnhăph nănƠyătrongăđ ăth ăđ ng tham chi u.
3.2.5 th đ ng tham chi u (CoReference Graph – CRG)
ăth ăCRGălƠăm tăđ ăth ăcóăh ngăg măm tăc pă(V,ăE):
- VălƠăt păcácăđ nhăch aăcácăcáăth ăc aăl păđ iăt ng,ăcácăc mădanhăt ,ăcácăđ iăt ,ă
khíaăc nhăvƠăc măxúc.
- EălƠăt păcácăcungă(v1, v2) có h ngăth ăhi năbaăm iăquanăh ăđ ngăthamăchi u:ă
thamăchi uăth căth ă(Core),ăthamăchi uăc măxúcă(Sent)ăvƠăthamăchi uăkhíaăc nhă (Asp). Các tham chi u nƠy có th đ căbi uăth b ngăcácăc păCore(v1, v2), Sent(v1, v2) và Asp(v1, v2). Trongăđóăv1 là đ nhăđ u,ăv2 lƠăđ nhăcu i.
- Trênăm iăc nhăc aăđ ăth ăcóătr ngăs .ăTr ngăs ăth ăhi năkho ngăcáchăgi aăcácă
đ nh,ăv iăcácăđ nhăthu căl păObjectăvƠăAspectăho căgi aăl păAspectăvƠăSentimentă
cóătr ngăs ăb ngă1,ăgi aăl păObjectăvƠăSentimentăcóătr ngăs ăb ngă2,ăgi a các
đ nhăc̀ngăthu căm tăl pă(đ ngăthamăchi uăth căth )ăcóătr ngăs ă0. Cácătínhăch tăc aăđ ăth :
- Cácăđ nhăkhơngătr̀ngănhauălƠăcácăđ nhăkhácănhauăv ăt ăti ngăAnh,ăv ătríătrongă
cơuăvƠăv ătríăcơu.
- ăth ăCRGăcóăth ăcóăt ăhaiăđ ăth ăconătr ălênăph thu c vƠo các k t qu đ ng
tham chi u th c th , c m xúc vƠ khía c nh.
- N uăquanăh ăSent(v1, v2) có v1 lƠăcácăc mădanhăt ăho căđ iăt ăđ iădi năchoăcácă
th hi n c aăđ iăt ng,ăkhíaăc nhăthìăv2 ch ăcóăth ălƠăcácăcáăth ăc aăc măxúc.
- N uăquanăh ăAsp(v1, v2) có v1 lƠăcácăc mădanhăt ,ăđ iăt ăđ iădi năchoăcácăth ăhi nă c aăđ iăt ngăthìăv2 ch ăcóăth ălƠăcácăcáăth ăc aăkhíaăc nh.
- ăth ăCRGăs ăcóăcácăđ nhătreoălà cácăđ nhăcu iăcóăb căb ngă1 và lƠăcácăth ăhi nă
60
Xétăl iăVíăd ă3.8:ăắ1I have just bought a Samsung Galaxy Note7. 2I like it because it looks beautiful. 3However, it is expensive. 4It has a camera. 5I took a photo and it is amazing.”
S ăd ngăAnaphoraă&ăEntityăCR,ătaăcóăđ căk tăqu ăđ ngăthamăchi uăvƠăgánănhưnă c măxúcănh ăsau:
Core1(a Samsung Galaxy Note71, it2,3, It2,5, It3,2, It4,1) Core2(Photo5,4, It5,6)
Sent1(It2,5, beautiful2) Sent2(It3,2, expensive3) Sent3(It5,6, amazing5)
T ăk tăqu ăxu tăraăc aăACRăvƠăphơnătíchăc măxúc,ătaăcóăCRGă=ă(V,ăE)ăđ căminhă h aă ăHình 3.10,ătrongăđó:
V = {Samsung Galaxy Note71, it2,3, It2,5, It3,2, It4,1, Photo5, beautiful2, expensive3, amazing5 }
E = { Core(a Samsung Galaxy Note71, it2,3);
Core(it2,3, It2,5); Core(It2,5, It3,2); Core(It3,2, It4,1); Core2(photo5, It5,6) Sen1(It2,5, beautiful2); Sen2(It3,2, expensive3); Sen3(It5,6, amazing5) }
3.2.6 Mơ-đun OBASCore
Hình 3.9 trìnhăbƠyăchiăti tăgi iăthu tăc aăOBASCore.ăTrongăđó cácăb c 1, 2 vƠ 3 lƠ kh i t oăđ th CRG t t p đ ng tham chi u C vƠ t p c m xúc S. C vƠ S lƠ k t qu c a hai mô-đun:ăAnaphora & Entity CR - mô-đun phơnăgi iăđ ngăthamăchi uăvƠ Aspect- Based Sentiment Analysis - mơ-đunphơnătíchăc măxúcăm căkhíaăc nhă(Hình 3.7).
Ti pătheoăb c 4, th c hi n gán nhưn cácăđ nh thu căđ iăt ng, khía c nh hay c m xúc d a theo ontology c m xúc.
B c 5 gán tr ng s cho các c nh c aăđ th CRG lƠ 0, 1 ho c 2 t̀y thu c vƠo hai đnh t o nên m t c nh thu c l p nƠoătrongăontology.ăB c 6, b sung thêm các c nh đ ng tham chi u th c th có tr ng s b ng 0 cho cácătr ng h p không xu t hi n trong
Cănh ngăcó đ ng tham chi uătrongăontologyăSO.ăB c 7, áp d ng các thu t tốn tìm
ki m theo chi u sâu ho c chi u r ng (DFS ho căBFS)ăđ xácăđnh cácăđnh treo vƠđ ng điăliênăk t v i cácăđnh nƠy.ă ng th i tính t ng tr ng s trên cácăđ ngăđiăđó vƠ có ba tr ng h p x y ra. Th nh t t ng b ng 0, cácăđnh c̀ng thu c m t chu iăđ ng tham
61
chi u vƠđ nh treo lƠ m tăđ i t ,ăkhiăđó đnh nƠy s đ c lo i b kh iăđ th CRG. Th hai t ng b ngă1,ăđ nh b tăđ u lƠ t ch khía c nh vƠ đnh treo lƠ t ch c m xúc,ăb c nƠy s lo i b cácăđnh trung gian ch gi l iăđnh b tăđ u vƠđ nhătreo.ăTr ng h p cu i c̀ng lƠ t ng b ngă2,ăđ nh ngu n thu c l p Object vƠđ nh treo thu c l p Sentiment, s d ng ontology c m xúc xácăđnh khía c nhăt ngă ng v i t c m xúc vƠthêmăđ nh m i nƠy vƠoăđ th CRG.ăB c 8, b sung thêm c nh gi aăđnh l p Object v iăđnh khía c nh m i. Cu i c̀ng,ăb c 9 thu g năđ th CRG b ng vi c xóa cácăđnh trung gian khơng thu c m t trong ba l p c a ontology.
Ápăd ngăgi iăthu tă(Hình 3.9) cho Víăd ă3.8 đ năb că3ăvƠă4,ătaăcóăđ ăth ănh ăHình 3.10.
Hình 3.9 Gi iăthu tăc aămơ-đun OBASCore.
Sauăb că4ăvƠă5,ăđ ăth ăHình 3.10 s ăđ căgánăgiáătr ătr ngăs ăchoăcácăcungăvƠăcácă đ nhăđ căphơnălo iăthu căl păt ngă ngătrongăOntology.ăK tăqu ăđ căminhăh aă ă Hình 3.11,ăv iăđ nhăthu căl păđ iăt ngălƠăđ nhăinăđ mă(Samsung Galaxy Note7);ăđ nhă
thu căl păkhíaăc nhălƠăđ nhăinăđ m,ănghiêngă(photo);ăđ nhăthu căl păc măxúcălƠăđ nhăină
g chăchơnă(beautiful, expensive, amazing);ăcácăđ nhăcịnăl iăkhơngăthu căl pănƠoătrongă
Ontology.
Input: T păđ ngăthamăchi uăC,ăt păc măxúcăS,ăOntologyăc măxúcăO
Output: T păcácăđ iăt ngă- khíaăc nhă- c măxúcăObjAspSen Algorithm:
1.ăKh iăt oăCRG
2. Add(VC, EC, CRG)
3. AddNoDuplicate(VS, ES, CRG) 4. ClassifyVertices(CRG, O) 5. UpdateWeight(CRG, O) 6. AddEdges(VC, O, 0, CRG)
7. Xét cácăđ nhăđ uăvăkhôngălƠăđ nhăcu i:ă
sum = SumOfWeights(v, outerVertices)
If (sum=2) addVertexAspect(outerVertices, O, CRG)
Else If (sum=1)
removeVertex(intermediateVertex, CRG)
Else removeVertex(outerVertices, CRG)
8. AddEdges(V.Object, V.Aspects, 1, CRG)
9. For each edge (v1, v2) of E: if getWeight(v1, v2)=0
62
Hình 3.10 ăth ăCRGăc aăVíăd ă3.8.
Th căhi năti păcácăb că6,ă7,ă8ăvƠă9ăc aăgi iăthu tă ăHình 3.9,ătaăcóăđ ăth ăcu iăc̀ngă c aăVíăd ă3.8 nh ăHình 3.12.ăKhiăđóăđ ăth ăCRGăxu tăhi năhaiăđ nhăprice và design đ că
xácăđ nhăd aăvƠoăhaiăt ăc măxúcăbeautiful và expensive thôngăquaăontologyăc măxúcă
SO. ngăm iătênă(cungănétăđ t)ăth ăhi năđ ngăthamăchi uăgi aăđ iăt ngăậkhíaăc nh.ă
Cungănétăli năth ăhi năthamăchi uăkhíaăc nhăậc măxúc.
ăth ăCRGăxácăđ nhăđ iăt ngăSamsungăGalaxyăNote7ăcóăbaăc păkhíaăc nhă- c mă
xúc là photo - amazing, design - beautiful, price - expensive.
Hình 3.11 ăth ăCRGăc aăVíăd ă3.8 sauăb că5ăc a gi i thu t Hình 3.9. It2,5
It3,2
photo5
amazing5 it2,3 Samsung Galaxy Note71
It4,1 expensive3 beautiful2 It5,6 It2,5 It3,2 photo5 amazing5 it2,3
Samsung Galaxy Note71
It4,1 expensive3 beautiful2 It5,6 ヰ ヰ ヰ ヰ ヲ ヲ ヱ ヰ Object Aspect Sentiment Sentiment Sentiment
63
Hình 3.12 CRGăc aăVíăd ă3.8 đ căth căhi năb iăgi i thu t Hình 3.9.
3.2.7 K t qu th c nghi m
V iăgi iăthu tăc aăOBASCoreă(Hình 3.9)ăđ călu n ánăđ ăxu t,ăch yătrênăt păd ăli uă
v iă320ăv năb năcóăc măxúcăv đi n tho iăthôngăminhăđ c cung c p b i công ty YouNet