TIỂU LUẬN Mật Mã và An Toàn Dữ Liệu Thống kê số lần xuất hiện của từ khóa trong văn bản. Trước khi Internet ra đời, đã có một số thống kê để lọc thông tin. Ví dụ, một chính phủ điều khiển và hạn chế luồng thông tin bất lợi, các biên tập viên, nhà báo cũng cần chọn lọc thông tin khi cung cấp cho độc giả, khán giả. Thậm chí trong trường học, giáo viên cũng cần chọn lọc thông tin để giảng dạy cho học sinh…
!"#$% &#'()*+,-.*/01%2)#$3456,)758 +9:;< =>?>8@))#A BCDEFG HGIGF IJGFKILG M#NGKOFGIP 1 Q3Q3 2 1. R+S%5&)*+,-)T+#)$)*+)*+,-8 +/U3)T+# !"!#$%&''!()*+, $% ,/!01(234)15*67)896:2 69;<=)*17;!%9+:$, ;"9;<=)*!(-3>; &? & !"/ 67( <#(17* ,7+@012>!)2$A!9(9*7!0)2*2; )2=4"-BC7!02>92D1!! E9)$!(F #(:!8*=4;$G /!0.($%9!%+ H:>)**)2$%9$$<*I 3J92)1!K+1>& !"2A / * -3!KL7!00)*$%9!%JM1 E<,N!OP2>-Q!4& !"/ 01')* !%+:>)*)2L242;)2$%')*C 2'*)2)RD19M19L17* ,8AN 2);36P**,8;"&K + *!817#()2A6 S6$;T67U -3*2;!8& N9E*1>0*+ 2'*%;01D 9 1/ * *)4M1L$4$;9$9>L$4$)$ ))* $9>/? %')*6 ;5$$%&'*.F$"L$7> V*#9W7&X4$" !YYZ$!#)2 V*!F;92)1FW72#9W+[96% )2><!8&K !(\D271F*$%9,Z9 -](1+[96%)2>7=4;94M11!8/ 9*. L$4$+[9DA/ 6%)*N!8!( #!82)1^629*!1M1E+ [#701')2'*9 1_901> )`E9a1:2$0D ?b!01#$.117 ;"&K V*=4);36P9**B 8+H1>)`\64!8&K ;)*)21>)`- 2; -V)1_c d &-b21>)`- 2;D_e;S)-d &-b+[9a 3 1:)!89(- 0N)R1>7*9 *f);3*+ ;1*\2)12> &XL$(1E9)2' *;N# ;')& $$ )+ 2. U3)*+,-)T+#)V 6,)75 N# )2$%1G9`_$%N$%.$N;TN4gb+ 2'*;N# ;h63ATV S6 V$ )?#%-1*B8;T !8V:N # &i#+, !()%-1*B8;N# 1>: M1h%-11>:2;$9>,2L$9N$2!8 );$%- &9!+% S66WT41##D 67DN 2;%-1=46j9&;9N# ;%-1 S6 $ )?;- &9T!#+LD)N!89 !' V>1=1_M1&b!8K!N$9>,!(!$6;1>:!'N # 7$!8) >N!=1+%;VE4/ 9 S6)2!( $$%&'AL$4$N# !( ^6/ :$,41 *&(W+HVN2>&X!8/ ^6 S)& $2;- $.!8&K 6J9*.L$4$/ 2& 1!## (!8L$7>6j9)S6+c;!#)N# 9 !(!' 9N# Z17; S6L$4$ >k$ / %-1 9 S61>:+ %&'8!($)N# I($ %-1-3A6 *($ !'9L+[.(!'V S6 1-f$4H 4H:#VN%!W 2L& =)LVN;94l4;2;2$79 + e9V )N# T"8N# =)j$;.$N# R 92;V6'9 1&X#R *=)+ .$N)2$%"8$J%/ )N# +.$N ($&;9%-11>:*M1 $%.$N*Z$ZhNN $%Z17;.$N!#+69)2>!34M1 ;E01 &;)N# 34'! "89&/ N# #R 9 1;6'9 1+ m 1!f> &XL$(1$%D &K )2'*; N# !(Z9!W& $$ )+ 4 3. )% W5#VX5YV.#5Z+[Q+8 +/U3.\5]]5#/ 3.1 Thut ton lc t kha Naive Bayesian d%)d >& ;3!%- !W)`d >&!(,;9Z9&17Z> $%&- 2;V&Z> !#+ea1:E:> !8&K !(f);3& $+H41$%&'=A6Z17" Z1>;9& $"*Z17;9$ )* "L#(4)1:j$ )!#)2& $+ #()$ )6j6%)d >& "-B=3; E&J -V)1N# 2-711_)2`1n!W Io29$0+++b&1=$ N9& $29$ )*8)9+ GN;T$G-711&X!8;$%9WZ9&17Z179W 2>- ,;9#6 ;1N" >&K ;& $$2 ;9$ )8)"*&K +,;92>!8 6j9f,V$ )K!/ "-B2f,9(1 & $!64+ d%)d >&/>41,;9Z9&17Z$$%$ )#D !;3 & $ >;_peqH&b+@(6%)d >& ;3!%,Z92# 1M1 ;=3; E&J-V)109$ )*"2& $ B8!TB/ *+[E&J-V)12>!8L26%) M1 !;3r17)1>s+H"-B17$Q1*"2 $Q1& $!(6%)f,3; E&J-V)1N# ;#+ t9&17!($%2)1- 1%2;)A6 _ bu _ v b _ v b _ b k i k k i i P c P d c P c d P d = wJ- Z9&17Z17/ $%N >.$N$%)$ )+ 1:;9&X($ 9N# ;:& $2:$ )89f ,99W)2$%1GpeqH+m 1!#Zf>-x & 6)E D;9peqH;&')=Z17/ 91GpeqH)2 =&'/ N+[F ,;9Z9&17/ 1GpeqH!53; & 6)6jP= . ^y)2=&'/ 1GpeqH7!W2)2!%-2 / & 6)ED+o6(1WZ9&17/ $ )$:!8)2 & $%-1D 1GpeqH+[1'B :!8M1>4!W 96j9,;9;*D\8!# x x x x x z z _ v bu _ b _ v b _ v bu _ b _ v bu _ b P x c P c P c x P x c P c P x c P c = + 5 ;!# x )2)9 z )2)8) Z)2$%$ )67L o_Zv b{o_S x v buo_S z v bu?uo_S v b ;!#o_S v b)2Z9&17Z17/ NS ;)A6 _{x|{xzb +e4M1)E}M1>!WF 9$ )!#)2& $41 *L$ ))26L"+ #(: N1:;9d >&j & $$#(r)9)1:s6j9~$%f1 >NQ1+dJ6% )- a1:9.!%R+@ &';!##" 1 M1*-2+@(M1>47!0& $;4 ).4 6%)+ 1:;96 >&!!89 2;EL)9& $6 >& 2;4M1)91M1+ 3.2 Chương trình và thực nghiệm ;=$2> 42$&K EL =$0$!84*V[•+[ELm $d >& & $ )9- %-19 1:;9d >&+ :-V)117)1>5$$ )6L"2& $$ )+t9&17N €+•••‚J)!4x#A)2& $ ;+t9&17Ex)26L"+ 6 :N# & 1!17)1>+ ($ K$%$Q1*& $ Z9&17)Ex+ 7 $%$Q1& $Z9&17&X)2+€••••+ 8 9 4. #/#$%)5],); ' A Keyword Filters Method for Spam via Maximum Independent Sets. Provided by Science & Engineering Research Support soCiety (SERSC), May 2013. Phát triển một số phương pháp lọc thông tin cho hệ tư vấn – Nguyễn Duy Phương – Luận án tiến sĩ ĐH Công Nghệ 2011 – Mã số 62 48 01 01 http://www.paulgraham.com/spam.html 10