Ph¥n lîp quan i”m düa tr¶n kh‰a c⁄nh

Một phần của tài liệu Phân tích quan điểm dựa theo khía cạnh và ứng dụng xác định sở thích của du khách về sản phẩm du lịch (Trang 28 - 31)

X¡c ành sð th‰ch cıa du kh¡ch v•

2.2.3 Ph¥n lîp quan i”m düa tr¶n kh‰a c⁄nh

T÷ìng øng vîi t“p kh‰a c⁄nh cıa mºt thüc th” ¢ ÷æc x¡c ành tr÷îc, cho tr÷îc mºt t“p nh¢n quan i”m (v‰ dö bao gçm c¡c nh¢n: t‰ch cüc, trung l“p, ti¶u cüc,

1 https://github.com/stopwords/vietnamese-stopwords/blob/master/vietnamese-stopwords.txt stopwords.txt

Łi vîi mºt c¥u ƒu v o ¢ ÷æc g¡n nh¢n kh‰a c⁄nh, b i to¡n cƒn dü o¡n nh¢n quan i”m t÷ìng øng cho nâ.

Ti‚n tr…nh ph¥n lîp quan i”m hay x¡c ành h÷îng quan i”m cıa kh‰a c⁄nh ÷æc mæ t£ nh÷ sau:

H…nh 2.2: Quy tr…nh ph¥n lîp quan i”m düa tr¶n kh‰a c⁄nh

Vector hâa v«n b£n l c¡ch th” hi»n v«n b£n d÷îi d⁄ng mºt vector m khæng gian cıa nâ l t“p c¡c tł chı • ¢ x¡c ành tł tr÷îc. MØi v«n b£n s‡ ÷æc bi”u di„n b‹ng mºt vector n chi•u, mØi chi•u l mºt tł chı • cıa kh‰a c⁄nh.

Trong lu“n v«n n y, chóng tæi sß döng thu“t to¡n SVM ” ph¥n lîp quan i”m cho v«n b£n.

SVM l mºt ph÷ìng ph¡p håc câ gi¡m s¡t bao gçm ph¥n t‰ch dœ li»u v ph¡t hi»n m¤u, ÷æc sß döng cho ph¥n lîp v ph¥n t‰ch hçi quy. Thu“t to¡n SVM lƒn ƒu ÷æc Vladimir Vapnik • xu§t v o n«m 1995 v Corina Cortes còng vîi Vladimir Vapnik ¢ • xu§t h…nh thøc chu'n hi»n nay.

Þ t÷ðng ch‰nh cıa thu“t to¡n n y l cho tr÷îc mºt t“p hu§n luy»n ÷æc bi”u di„n trong khæng gian vector, trong â mØi t i li»u l mºt i”m, ph÷ìng ph¡p n y t… m ra mºt si¶u phflng h quy‚t ành tŁt nh§t câ th” chia c¡c i”m tr¶n khæng gian n y th nh c¡c lîp ri¶ng bi»t. Ch§t l÷æng cıa si¶u phflng n y ÷æc quy‚t ành bði kho£ng c¡ch cıa i”m dœ li»u gƒn nh§t cıa mØi lîp ‚n m°t phflng n y. Kho£ng c¡ch bi¶n c ng lîn th… m°t phflng quy‚t ành c ng tŁt, çng thíi vi»c ph¥n lo⁄i c ng ch‰nh x¡c. Möc ‰ch cıa thu“t to¡n SVM l t…m ÷æc kho£ng c¡ch bi¶n lîn nh§t ” t⁄o ra k‚t qu£ ph¥n lîp tŁt [6]. H…nh 2.3 minh håa cho thu“t to¡n SVM.

Si¶u phflng tŁi ÷u ph¥n chia dœ li»u th nh hai lîp h…nh trÆn v h…nh vuæng. C¡c i”m gƒn h nh§t l c¡c vector hØ træ ÷æc tæ “m. SVM thüc ch§t l b i to¡n tŁi ÷u, möc ti¶u cıa thu“t to¡n n y l t…m ÷æc mºt khæng gian H v si¶u phflng

H…nh 2.3: Mæ t£ thu“t to¡n SVM

h tr¶n H sao cho sai sŁ ph¥n lo⁄i l th§p nh§t. Ph÷ìng tr…nh si¶u m°t phflng chøa !

vector di trong khæng gian nh÷ sau:

(2.1)

Nh÷ th‚ h(d ) bi”u di„n sü ph¥n lîp cıa d! n‚u

y

câ si¶u m°t phflng h ta s‡ ph£i gi£i b i to¡n sau:

jj

T…m min!

Cho t“p hu§n luy»n: (xi; yi); i = 1; n

Thu“t to¡n SVM xem mØi vector xi l mºt vector °c tr÷ng bi”u di„n cho ph£n hçi cıa kh¡ch h ng v yi l nh¢n ph¥n lo⁄i Łi vîi dœ li»u hu§n luy»n.Trong â m¤u l c¡c vector Łi t÷æng ÷æc ph¥n lîp th nh c¡c m¤u t‰ch cüc v m¤u ti¶u cüc:

24

ˆC¡c m¤u t‰ch cüc l C¡c m¤u ti¶u cüc l

Một phần của tài liệu Phân tích quan điểm dựa theo khía cạnh và ứng dụng xác định sở thích của du khách về sản phẩm du lịch (Trang 28 - 31)

Tải bản đầy đủ (DOCX)

(48 trang)
w