0
Tải bản đầy đủ (.pdf) (73 trang)

Quan hệ mờ

Một phần của tài liệu PHƯƠNG PHÁP BIỂU DIỄN VĂN BẢN SỬ DỤNG TẬP MỜ VÀ ỨNG DỤNG TRONG KHAI PHÁ DỮ LIỆU VĂN BẢN (Trang 29 -29 )

Định nglìĩa 2 .13: Đổ thị mờ(Fuy.zy Cniph)

Cho E|, E2 là hai tâp hựp và xeE|, y eE 2. Ký hiệu (x,y) là cặp thứ tự nằm

trong tích Đồ-các E|XE2. Tạp mờ G Irong F.|XF

<2

với hàm thuẠc

^ (x .y ) : E|XE2 -> |0,l I V(x,y)e EịXEi được gọi là một đổ thị mờ.

Ví dụ:

Giả sử Eị={ X

I

,x

2

,x:, }, E2= I y , ,y2}. Ta có

E ,xE

2

= |(x „ y ,), (x

2

,y ,), (x

3

ty ,) t (x „ y 2), (x

2

,y2), (x

3

,y2)Ị

Giả sử ta có ^ c(x „ y ,) = 0.3, Hc(x

2

,y,) = 0.4, Mc(*

3

.yi) = 0 .9 , M X |,y a) = 1 0 -

fio (x2,y2) = 0 .7 , Mo(x,,y,) = 0.5. Khi đó G = |((X |,y,), 0.3), ((x

2

,y,), 0 .4 ), ((x „ y ,),

0.9) ((x „ y 2), 1.0), ((x

2

,y2), 0.7), ((x

3

,y2), 0.5) ) là một đồ thị mờ trong E|XE2.

X |

X2

X3

TẠp m ờ G có thể biổu diễn bằng ma trân như hình vẽ.

Tổng quát hoá định nghĩa trên: Giả sử E|, E

2

..En là các tập hợp và x¡eE¡,

i= l..n . E|XE

2

X..XE„ là tích Đ ề-các của các tập E¡. Tập mờ G trong E|XE

2

X..XE

0

với

hàm thuộc |iG(X |,x

2

,..xn): E lxE

2

x..xE„ —> | 0 , l | gọi là đổ thị m ờ trong E|XE

2

x..xE n.

Định nghĩa 2.14: Quan hệ mờ (Fuzzy Relation)

Một đổ thị mờ có thể gọi theo một lên khác là một quan hệ mờ. Già sử G là

một tập mờ trong E = E|XE

2

X..XEM . Khi đó G được gọi là một quan hệ mờ n ngối.

Quan hệ m ờ hai ngôi còn được gọi là quan hộ mờ nhị phân.

Các phép toán trên quan hệ mờ

Các phcp toán trên quan hệ m ờ như hợp, giao, phần bù, lổng rời, lổng đại

sô',... chính là các phép toán trên tẠp m ờ trong tạp tích Đé-các nên định nghĩa các

phép toán trên quan hệ mờ hoàn toàn không có gì thay đổi. Ngoài các phép toán đã

nêu, trôn quan hộ mờ có các phép toán quan trọng sau.

Phép hợp thảnh max-min (nmx-min compostìon). Giả sử R| là quan hệ mờ

trong E|XE2, R ỉ là quan hệ mờ trong E

2

XE

3

. Ta định ngliĩa hợp thành max-miti R| o

R

2

của hai quan hệ mờ R |,R

2

là quan hệ mờ trong E

2

xE

3

thoả mãn:

V x e E |, VZ£Ej, Hri

0

r

2

(x,z) = m a x (m m (m ,(x,y), f.iK

2

(y,z))) V y € E 2.

0.3 1.0

0.4 0 .7

0.9 0 .5

Phép hợp thành max-tích (max - product composition).

G ià s ử R | là q u a n h ệ m ờ tr o n g E |X E 2, R2 là q u a n h ệ m ờ tr o n g E2x E ,. T a đ ịn h n g h ĩa h ợ p th à n h m a x -tíc h R |. R2 c ù a h ai q u a n h ệ m ờ R |, R2 là q u a n h ệ m ờ tr o n g E2x E3 th o à m ã n : V x e E ị , V z e E - ,, R2( x ,z ) = m a x (j.iK| ( x , y ) . | i R2( y ,z ) ) V y e E j .

Phép hợp thành

/773A -* .(m a x - * c o m p o s it io n ) (* là to á n tử h a i n g ô i bất k ỳ ). G iả sử R | là q u a n h ệ m ờ tr o n g E ,x E 2, R2 là q u a n hộ m ờ tr o n g E2x E 3. T a đ ịn h n g h ĩa h ợ p th à n h m a x - * R | * R2 c ù a h ai q u a n h ệ m ờ R |,R2 là q u a n h ệ m ờ Iro n g E 2 x E 3 th o à m ãn : V x e E | , V z e E j , H r ,.r2( x ) = m a x ( n RI( x ,y ) * f.iR2( y ,z ) ) V y e E 2.

Đ ịn h n g h ĩa 2 .1 4 .

Hàm tích hợp mờ (Fuzzy Aggregation)

MỎI h à m (íc h h ự p d ư ự c (.lịnh Iiglũn là m ò l (o á n l ỉ m n g ỏ i Iilu r su u : F: |0 ,11" —» | 0 , I]

th o à m ã n h ai đ iề u k iệ n d ư ớ i đ â y :

1. F ( 0 , 0 ) = 0 và F ( 1 , . . . . ỉ ) = 1. ( Đ iề u k iộ n b iê n )

2 . F ( x ... . x n) > ... . y„) v ớ i (Xị

>y-„

i = l , ... n ). ( T ín h đ ơ n đ iệ u )

G iả s ử c ó c á c tậ p m ờ A | , A 2, ..A „ d ư ợ c x á c đ ịn h trên X . K h i đ ó b ằ n g v iệ c líc h hợ p c á c h à m th u ộ c c ủ a c á c lậ p m ờ A | , A, ta s ẽ c ó m ộ t lẠp m ờ A là k ết q u ả c ủ a v iệ c tíc h h ợ p .

C ó n h iề u h à m tíc h h ợ p m ờ đ ư ợ c x á c đ ịn h th o ả m ã n c á c đ iề u k iộ n trên . C h ú n g ta h ã y x é l c á c h à m tíc h h ợ p sau :

Toán tử t-nomi.


t-n o r m lìi to á n lử h a i Iig ỏ i T : ị(), I |x |( ) , 1 1

—>

| 0 . 1 1 th o ả m ã n c á c đ ié u k iộ n sau : 1. T ( x ,y ) = T ( y ,x ) . T ín h g i a o h o á n .

2 . T ( x , T ( y , z ) ) = T ( T ( x , y ) ,

-/).

T ín h kết h ợ p .

3 . N ế u X < y và w < z thì T ( x , w ) < T ( y , z ). T ín h đ ơ n đ iệ u . 4 . T ( x , 0 ) = 0 v à T ( x , 1) = X. Đ ié u k iệ n b iê n .

tr o n g đ ó X , y , z , w e X .

V í d ụ v ề to á n tử t-n o rm : G iả s ử ta c ó X , Y ,

z

là c á c tập m ờ tro n g

X,

ta c ó thể d ễ d à n g k iổ m tra c á c tín h c h ấ t c ủ a c á c h à m t - n o n n sau :

T |(H x (x ), M x )) = m in (H x (x ). Hy(x))

T2(|J x ( x ) , ụ v ( x ) ) = --- — --- --- 1 = = : — — ... , p e R , p > 0. 1 + V ( ( 1 - Mx (X )) / Mx ( x ) ) p + ((1 - Mv (X )) / Mv ( x ) ) p

Tj(nx(x), H v(x))=

m ax(0, (1 + p ) (

|ax ( x )

+

|xY( x ) -

1)

- /H x ( x ) H y ( x ) ) ,

p & R , p > - l .

T4(|XX(X ), H y (* )) - / -

mind,

Ự(1 - ụ x ( x ) ) p + (1 — ụ Y( y » p

),

p

e

R , p > 0 .

T5(Hx(x). M-y(x)) = Hx(x) M x)

T « * ) , M»)>---—- •,|J; 'X|Mr,(y,' ■■■■■, . . .P s K,p Ï 0.

p + (1 - p) (ịa x(x) + n v ( y ) - Ị .ix ( x ) f i v ( y ) )

T o á n tử s -n o r m .

s -n o r m là to á n tử h ai n g ô i

s

: |(), 1 |x |( ) , 1 1 —>• |ü , 1 1 tlio ả m ã n c á c đ iể u k iệ n sau: 1. S (x , y ) = S (y , x ). T ín h g ia o h o á n .

2 . S ( x , S ( y , z ) ) = S ( S ( x , y ) , z ). T ín h kết h ợ p .

3 . N ế u X < y và w ^ z th ì S ( x , w ) < S (y ,

■/.).

T ín h dưn d iộ u . 4 . S ( x , 0 ) = X v à S ( x , 1 ) = I . Đ iể u k iệ n b iê n ,

tr o n g đ ó X , y , z , w e X .

V í dụ v ề to á n tỉr s-n o r m : G iả s ử ta c ó X , Y , z là c á c tập m ờ tr o n g X , ta c ó th ể d ễ d à n g k iể m tra c á c tín h c h ấ t c ủ a c á c h à m s -n o r m sau:

S |( H x ( x ) , M x ) ) = m a x (H x (x ), H v (x )).

Si (M,v (*).m (*)) = --- 7 — ===== ■.— : , Ị) € R, p > 0.

1+ # , ( * ) / ( !

s3( f ix ( x ) , \XỴ( \ ) ) = |ax ( x ) +

H v (x ) T*-/?|.ix(x) M * u

p e

R,

p > Ü.

S4(H x (x ), M * ) ) = m in ( 1, Ự m ^ Õ Õ + K Õ Õ ), p e R , p > 0. S5(H x (x ), M * ) ) = H x ( x ) -'LM X) - m ( x ) M * ) - __________________

MX(X) + M X ) - M X) M X ) - ( 1 - P ) M X)M X )

_ _ r , S6(^ x(x),H y(x))=--- — - — — ; —— — 7--- , p e R , p > 0 . 1 - C l - p ) ^ x ( x ) ^ iY ( x )

M ộ t s ố hàm tích hợp khác

H à m tru n g b ìn h tổ n g q u á t.

F ( x „ . . . , x J = J - ¿ ( x' ) r , p e R , p * 0 .

V" M

1 n

H à m tru n g b ìn h s ố h ọ c (/? = 1):

¥ ( x h. . , x j = - ^ ( x

, ) . n

1=1

H à m tru n g b ìn h h ìn h h ọ c (/> -> 0): F( X / , . . , X J = ( X /

Xì .x ,y M .

H à m tru n g b ìn h H a r m o n ic ( / > - » - 1): F

( x , , . . , x j =

— - — .

Ẻ l/jr-#-l

H à m m in (/>-> - 0 0): F

(xh..,x„)

-

m in(x„ X x n).

H à m m a x (/> -» + 0 0): F

= m a x (x h x 2, .. , x j .

Toán tử O W A .

(O r d e r W e ig h t e d A v e r a g in g o p e r a to r s). T o á n từ n à y d ư ợ c Y a g e r đ ề x u ất n ă m 1 9 8 8 . G ọ i w = / 1

V/, w2, ..,W„Ị

là v e c t o r tr ọ n g s ố th o a m ãn

Ị > , = I.

/-I G ọ i c h u ỗ i c á c h à m

{\i.A (x )Ị

là c á c h à m th u ộ c c ủ a c á c tập m ờ A , và đ ư ợ c s ắ p c ó th ứ tự

ịiA (x) < \x¿ (x ) <... < ịiÀ (x).

K h i d ó , lo á n tử O W A đ ư ợ c đ ịn h n g h ĩa n h ư sau:

F ( A ) = 0 W A ( A ,

>-1

T o á n tử O W A là to á n tử h ết sứ c q u a n tr ọ n g tr o n g lý th u y ế t tập m ờ v à đ ã c ó n h ữ n g ứ n g d ụ n g r ộ n g rãi h iệ n n a y .

2 .3 .2 . B iể u d iễ n văn b ả n sử d ụ n g c á c k h á i n iệ m m ờ

T r o n g p h ẩn n à y , c h ú n g tôi d ư a ra k h á i n iệ m v ề k h á i n iệ m m ờ ( tr o n g n g ô n n g ữ ) và h à m tíc h h ợ p n g ô n n g ữ m ờ . C h ú n g tô i c ũ n g x e m x é t m ộ t s ố tín h c h ấ t c ủ a k h á i n iê m IĨ1Ờ v à m ố i q u a n h ệ c ủ a c h ú n g v ớ i c á c từ k h o á . T rên c ơ s ở k h á i n iệ m m ờ , c h ú n g tô i đ ề x u ấ t m ộ t p h ư ơ n g p h á p b iể u d iễ n văn bản v à c á c c h ủ đ ể .

Biểu diễn văn bàn

G iả s ử c h ú n g ta c ó m ộ t tậ p c á c v ãn b àn . D = ( d „ d 2,

K h i đ ó ta c ó m ộ t tập c á c từ k h o á , k í h iệ u K = { k „ k2, ...k p ị

S ự liê n q u a n c ủ a c á c từ k h o á tới m ộ t vă n bản đ ư ợ c x á c đ ịn h tư ơ n g ứ n g b ằ n g c á c h s ứ d ụ n g m ó t p h ư ơ n g p h á p clánli c h í s ỏ IIÌIO d ó d ã biết:

Đ ể tiệ n c h o v iệ c trình b à y ở p hần sa u , c h ú n g ta d ễ d à n g c h u ẩ n h o á c á c g iá trị c ủ a tập v à o k h o á n g |0, l |.

T rư ớ c h ế t c h ú n g ta x e m xét m ộ t vài th u ật n g ữ :

T ừ ‘ k h ái n i ệ m ’ th e o lừ đ iể n H á n V iệ t c ủ a Đ à o D u y A n h là: “ Đ e m c á c th ứ q u a n n iệ m m à tó m lA'y c á c c h ỗ g iố n g n h au là m th àn h m ộ t c á i q u a n n iộ m c h u n g ” . ( T h e o Đ à o D u y A n h , “ T ừ đ iể n H á n V iệ t ” , N X B K h o a h ọ c xã h ộ i, 1 9 9 6 )

K h á i n iệ m ‘c o n c e p t ’ ih e o từ đ iể n M e iïa m - W e b s le r c ù a M ỹ là: “ a n a b str a c t or g e n e r ic id e a g é n é r a liz e d fro tn p a r tic u la r in s t a n c e s ” , lạ m d ịc h là “ m ộ t s ự trừu tư ợ n g h o ặ c m ộ t ý tư ờ n g c h u n g đ ư ợ c t ổ n g q u á t h o á từ n h ũ n g m in h h o ạ c ụ t h ể ” . ( T h e o từ đ iổ n M c r ia m - W c b s lc r w w w .m - w .c o m ).

K h á i n iệ m ‘c o n c e p t ’ th e o từ d iổ n H a c h e tte c ù a P h áp là: “ r e p r é se n ta tio n m e n ta le a b s tr a ite et g é n é r a le ” , lạ m d ịc h là “ m ộ t s ự h iể u d iẻ n c ó liê n tư ờ n g tới s ự trừu tư ợ n g và tổ n g q u á t” . (T h e o tìr đ iể n H a c h e tte

WWW.fr a n c o p h o n ie .h a c h e t t e -

liv r e . fr ).

N h ư v ậ y c h ú n g ta c ó th ể h iể u m ộ t k h ái n iệ m từ m ộ t từ k h o á th e o n g h ĩa th ô n g th ư ờ n g là g ồ m c á c từ c ó liê n q u a il tie'll lừ k h o á d ó . V í d ụ c h ú n g ta c ó m ộ t k h á i n iộm ‘c o m p u t e r ’, k hi đ ó ‘C o m p u te r ’ c ó th ổ c h ứ a c á c lừ k lio á ‘m a c h in e ’, ‘h a r d w a r e ’, ‘s o f t w a r e ’, ‘ P C ’, ‘m o u s e ’. C á c từ n à y c ó thổ là từ đ ồ n g n g h ĩa h o ặ c từ c ó liê n quan g ẩ n tới k h ái n iệ m d ó .

G iả s ử c h ú n g ta c ó m ộ t tậ p c á c k h á i n iệ m c ó liê n q u a n tớ i c h ủ đ ể , k í h iệ u T = { t | , t2, ...tn ).

T r o n g đ ó tj là c á c k h á i n iệ m d o n g ư ừ i d ù n g x á c đ ịn h . X é t m ộ t k h á i n iệ m t n ào đ ó tr o n g tậ p c á c k h á i n iệ m , k h i đ ó m ộ t k h ái n iệ m c ó th ể b a o g ồ m m ộ t s ố từ k h o á và đ ư ợ c x á c đ ịn h n h ư sa u .

t= { k ị } - tr o n g d ó i e l,p .

T ừ (ló c lìú n g la c ó Ihổ xAy d ự n g m ộ t k liói Iiiộm m ờ n lu r sn ii.

K h ái n iệ m m ờ là m ộ t tậ p m ờ tư ơ n g ứ n g v ớ i k h ái n iộ m tr o n g đ ó h à m th u ộ c c ủ a n ó đ ư ợ c x á c đ ịn h b ằ n g đ ộ q u a n tr ọ n g c ủ a c á c từ c ó liê n q u a n tớ i k h á i n iệ m d ó. K í h iệ u m ộ t k h ái n iệ m m ờ c ù a k h á i n iệ m I là t

p

Ị = Z M k , ) / k , .« r o n g d ó

¡«1

O n ế u k ị không tlniỏc vào khái n iệm t. f.iK( k j) = ' ln ế u k j th u ộc hoàn toàn vào khái n iệ m t.

( k ; ) nếu k thuộc vào khái Iiiôin t.

M ứ c đ ộ q u a n tr ọ n g c ù a m ộ t k h á i n iệ m m ờ k h i đ ó đ ư ợ c x á c đ ịn h b ằ n g m ột h à m tíc h h ợ p m ờ , k í h iệ u là |i ( t ) .

Hình ớ.

Mối quan hê giữa khái niêm và từ khoá, khái niêm với văn bàn.

Định Iighĩa 2.15. Hàm tích họp khái niệm mờ (Fuzzy Concept Aggregation)

Một hàm tích hợp khái niệm mờ là một hàm tích hợp F: [0, 1]" ->[0, 1] thoả

mãn các tính chất của hàm tích hợp, tức là:

1. 0 < F(fj.K( k | ) ...ị i K(kp)) - L

2. F(|iK(k,), ...,HK(kp))

F(ị.iK(k’,), ...,fiK(k’n)) với (nK(k¡) 5:

| i K( k ’i).

i=l,

...

n)

(Tính đơn điệu).

trong đó nK(k|) Mk(^’i) biểu diễn mức độ quan trọng của các từ khoá. Về

mặt ngữ nghĩa, nếu trong hai khái niệm, khái niệm nào có các từ khoá liên quan tới

văn bản lớn hơn thì trọng sô' của khái niệm đó sẽ lớn hơn, nghĩa của khái niệm đó sẽ

được xác định rõ ràng hơn và ngược lại.

Mối quan hệ giữa các từ khoá với khái niệm và văn bản được biểu diẻn trên

hình 6.

Các hàm tích hợp mở có thể là các hàm tích hợp trong định nghĩa 2.15.

Ví dụ: Chúng la có một tạp các từ khoá: ‘machine’, ‘hardware’, ‘software’,

‘PC’, ‘mouse*.

K=| ‘machine’, ‘hardware’, software’, ‘PC’, ‘mouse’ I


với độ liên quan tới văn bản được xác định bằng một hàm đánh chỉ số tương

ứng:

f i = ( | i ( ‘m a c h in e ’), jx(‘h a r w a r e ’), ^ ( ‘s o f t w a r e ’), }.i(‘ P C ’), | i ( ‘ m o u s e ’) ) = { 0 . 4 , 0 . 7 , 0 . 1 , 0 . 5 , 0 . 8 1

T a đ ịn h n g h ĩa k h ái n iệ m t = ‘c o m p u lc r ’ :

‘c o m p u t e r ^ ! ‘m a c h i n e ’, ‘h a r d w a r e ’ , ‘s o f t w a r e ’ ! k h i đ ó đ ộ q u a n tr ọ n g tr o n g v ãn b ả n c ủ a ‘c o m p u t e r ’ c ó th ể đ ư ợ c x á c đ ịn h là: H (‘c o m p u t e r ’) = F ( n ( ‘ m a c h in e ’) , Ịj.(‘h a r w a r e ’), ^ ( ‘s o f t w a r e ’) ) V ớ i h à m tíc h h ợ p là M A X : f i ( ‘c o m p u t c r ’ )= M A X ( 0 .4 , 0 . 7 , 0 .1 )= 0 .7 V ớ i h à m tíc h h ợ p là h à m tr u n g b ìn h : (¿(‘c o m p u t e r ’ ) = A V E G ( 0 . 4 , 0 . 7 , 0 . 1 )= 0 .6

T a đ ịn h n g h ĩa lại k h á i n iệ m t = ‘c o m p u t e r ’ : ‘c o m p u t e r ’= { ‘h a r d w a r e ’, ‘s o f t w a r e ’ ) V ớ i h à m tíc h h ợ p là M A X :

ị i ( ‘c o m p u t e r ’) = M A X ( 0 . 7 , 0 . 1 ) = 0 .7 V ớ i h à m tíc h h ợ p là h à m tru n g b ìn h :

H (‘c o m p u t e r ’) = A V E G ( 0 .7 , 0 .1 )= 0 . 4

K h i đ ó m ộ t văn b ản d| c ó th ể đ ư ợ c b iể u d iễ n d ư ớ i d ạ n g n h ư sa u : d = j j a ( t , ), n ( t j ) , . . . n ( t B )}

V ă n b ả n ờ p h ần trư ớc c ó th ể đ ư ợ c b iể u d iễ n n h ư sa u :

0.8 AI

there are many types of AI concepts that I can apply it. However, I donot know which one is suitable. The employees are scheduled to different shifts and system is supposed to identify the pick hours and schedule the employees accordingly.... Subject: Scheduling problem

I am a student and I want to create an employee timetabling system that uses AI. I know that

0.0 Database

0.5 Os

0.5 Parallel

0.9 AI 0.9 Schedule 0.5 System 0.2 Timetable 0.5 Create 0.4 Student 0.5 Problem

K h âi n iê m m d c ö t h é g ià i quyê't van clé tir d ô n g n g h îa tr o n g xir lÿ v a n b an . T r o n g n g ô n n g û v â n b à n , c â c tir d ô n g n g b ïa xuâ't h iê n tlurcrng x u y ô n . V iê c tim kiê'm h o à c xir lÿ c â c tir d ö n g nghTa tr o n g m o t van ban là m ô t v â n d e râ't th ü vj tr o n g xir lÿ van b à n .

B à n g c à c h sir d u n g h à m tic h h o p , c h ü n g ta c ô thê’ g ià i quyê't vâ'n d ê tir d ô n g nghTa. C â c tir d ô n g n g h ïa d ir o c x à c d in h và tic h h o p v à o tr o n g m ô t k h â i n iê m c h u n g , v iê c x û lÿ v â n b àn s ë xir lÿ trên k h â i n iê m m d d o th a y c h o tin h to â n trên c â c tir k h o â .

M ố i q u a n h ệ g iữ a c á c k h á i n iệ m m ờ c ó th ể đ ư ợ c b iể u d iễ n b ằ n g s ơ đ ồ n h ư h ìn h 8, tr o n g đ ó c h ú n g ta th ấ y p h ạ m v i n g ữ n g h ĩa c ủ a c á c k h ái n iệ m c ó th ể g ia o n h a u .

V ê m ặt n g ữ n g h ĩa , đ iề u n à y c ó n g h ĩa là m ộ t k h ái n iệ m c ó thô g ổ m n h iề u từ k h o á g iố n g n h a u . Đ iể u n à y phù h ợ p vớ i q u a n h ệ th ô n g th ư ờ n g tr o n g n g ô n n g ữ tự

Hình N: Mối qimn hệ giữa aíc khái niệm

n lê n .

T rên c ơ s ờ b iể u d iễ n vãn b ả n , c h ú n g ta c ó th ể b iể u d iễ n c á c c h ủ đ é d ư ớ i d ạ n g c á c k hái n iộ m m ờ . M ố i q u a n h ệ g iữ a c h ủ đ ể , k h á i n iệ m , c á c từ k h o á và văn bản c ó th ể đ ư ợ c m ô tả tr o n g h ìn h 7 .

B iổ u d iỗ n c h ủ đ ồ

V iộ c b iổ u d iỗ n c h ủ đ ề c h ủ y ế u p h ụ c vụ c h o q u á trình tìm k iế m văn b ản (I n fo r m a tio n R e t r ie v a l) th e o c h ủ đ ề , c h ẳ n g h ạn c h ú n g ta c ó th ể p h ân ra c á c lo ạ i c h ủ đ ề n h ư c h ín h trị, k in h tế , x ã h ộ i, v ă n h ọ c ,... Y ê u cầ u c ủ a tìm k iế m th e o c h ủ đ ể là tìm ra c á c v ă n bản c ó n ộ i d u n g p h ù h ợ p n h ấ t vớ i y ê u cầ u c ù a n gư ờ i d ù n g , th ô n g th ư ờ n g

thì c á c v ăn b ả n đ ư ợ c g ắ n v ớ i m ộ t đ ộ q u a n tr ọ n g và đ ư ợ c x ế p t h e o thứ tự đ ố i v ớ i c â u h ỏ i đư a v à o .

T ừ d ó , v iộ c tìm k iế m vãn b ả n th e o n ộ i d u n g n ả y s in h m m ộ l s ố vấ n ilồ sau: T h ứ nhất là cAu h ỏ i đ ư a v à o th ô n g th ư ờ n g là c á c lừ k h o á v à c ó th ể đ ư ợ c h iể u tlic o n g h ĩa k h á c n hau đ ố i v ớ i từ n g n g ư ờ i sir d ụ n g . C h ẳ n g hạn n h ư đ ố i v ớ i từ k h o á ‘c o m p u t e r ’ thì c ó th ể h iổ u là n g ư ờ i d ù n g m u ố n tìm n h ữ n g vã n b à n c ó liê n q u a n đốn m á y tính n ó i c h u n g , n h ư n g đ ố i v ớ i m ộ t c h u y ô n g ia m á y tín h th ì y ê u c ầ u c ó th ể là n h ữ n g vấ n đ ề về p h ầ n c ứ n g m á y tín h h o ặ c n h ữ n g th ô n g tin v ể c ô n g n g h ệ c ó liên q u an tới m á y tín h , đ ố i v ớ i m ộ t n h à v ă n th ì từ ‘c o m p u t e r ’ c ó th ể á m c h ỉ n h ữ n g vãn bản liê n q u a n đ ế n n h ữ n g c â u c h u y ệ n v é m á y tín h , d ố i v ớ i h ọ c s in h thì c ó th ổ đ ư ợ c

Một phần của tài liệu PHƯƠNG PHÁP BIỂU DIỄN VĂN BẢN SỬ DỤNG TẬP MỜ VÀ ỨNG DỤNG TRONG KHAI PHÁ DỮ LIỆU VĂN BẢN (Trang 29 -29 )

×