LLSF là m t cách ti p c n ánh x đ c phát tri n b i Yang và Chute vào n m 1992 [Yang & Chute, 1992] u tiên, LLSF đ c Yang và Chute th nghi m trong l nh v c xác đnh t đ ng ngh a sau đĩ s d ng trong phân lo i vào n m 1994 [Yang & Chute, 1994]. Các th nghi m c a ang cho th y hi u su t phân lo i c a LLSF cĩ th ngang b ng v i ph ng pháp kNN kinh đi n.
2.2.6.1. Ý t ng
LLSF s d ng ph ng pháp h i quy đ h c t t p hu n luy n và các ch đ cĩ s n [Yang & Chute, 1994]. T p hu n luy n đ c bi u di n d i d ng m t c p vector đ u vào và đ u ra nh sau :
Vector đ u vào m t v n b n bao g m các t và tr ng s
Vector đ u ra g m các ch đ cùng v i tr ng s nh phân c a v n b n ng v i vector đ u vào
Gi i ph ng trình các c p vector đ u vào/ đ u ra, ta s đ c ma tr n đ ng hi n c a h s h i quy c a t và ch đ (matrix of word-category regression coefficients)
2.2.6.2. Cơng th c chính 2 arg min LS F F = FA B− Trong đĩ Ü A, B là ma tr n đ i di n t p d li u hu n luy n ( các c t trong ma tr n t ng ng là các vector đ u vào và đ u ra ) Ü FLS là ma tr n k t qu ch ra m t ánh x t m t v n b n b t k vào vector c a ch đ đã gán tr ng s
Nh vào vi c s p x p tr ng s c a các ch đ , ta đ c m t danh sách ch đ cĩ th gán cho v n b n c n phân lo i. Nh đ t ng ng lên tr ng s c a các ch đ mà ta tìm đ c ch đ thích h p cho v n b n đ u vào. H th ng t đ ng h c các ng ng t i u cho t ng ch đ , gi ng v i kNN. M c dù LLSF và kNN khác nhau v m t th ng kê, nh ng ta v n tìm th y đi m chung ho t đ ng c a hai ph ng pháp là vi c h c ng ng t i u.