Th穎 nghi羽m v噂i kho ng英 li羽u email ch英 :

Một phần của tài liệu Tìm hiểu các hướng tiếp cận phân loại EMAIL và xây dựng phần mềm mail client hỗ trợ tiếng việt (Trang 79 - 106)

7.2.2.1 K鵜ch b違n ki吋m th穎:

Chúng tôi th穎 nghi羽m hai thu壱t toán AdaBoost 8ã cài8員t v噂i T 8逢嬰c ch丑n l亥n l逢嬰t là 5, 10, 50, 100, 200, và 500.

7.2.2.2 K院t qu違 ki吋m th穎:

Ng英 li羽u email v<n b違n tr挨n, s嘘 email ki吋m th穎 : Spam =98, non- spam=100

Ng英 li羽u email html, s嘘 email ki吋m th穎:Spam =50, non-spam=50

v K院t qu違 th詠c hi羽n ki吋m th穎 v噂i thu壱t toán ADaBoost with real value predictions Ng英 li羽u T=5 T=10 T=50 T=100 T=200 T=500 HTML S S 48 48 49 49 49 49 S N 2 2 1 1 1 1 N N 49 49 49 49 49 49 N S 1 1 1 1 1 1 SR 96.00% 96.00% 98.00% 98.00% 98.00% 98.00% SP 97.96% 97.96% 98.00% 98.00% 98.00% 98.00% TEXT S S 84 93 98 98 98 98 S N 14 5 0 0 0 0 N N 98 97 98 99 99 99 N S 2 3 2 1 1 1 SR 85.71% 94.90% 100.00% 100.00% 100.00% 100.00% SP 97.67% 96.88% 98.00% 98.99% 98.99% 98.99%

D違ng 7-3 k院t qu違 th穎 nghi羽m phân lo衣i email v噂i ng英 li羽u email ch英 b茨ng thu壱t toán AdaBoost with real-value predictions

v K院t qu違 th詠c hi羽n ki吋m th穎 v噂i thu壱t toán ADaBoost with discrete predictions Ng英 li羽u T=5 T=10 T=50 T=100 T=200 T=500 HTML S S 48 49 50 50 50 50 S N 2 1 0 0 0 0 N N 49 49 49 49 49 49 N S 1 1 1 1 1 1 SR 96.00% 98.00% 100.00% 100.00% 100.00% 100.00% SP 97.96% 98.00% 98.04% 98.04% 98.04% 98.04%

TEXT S S 91 91 95 97 96 97 S N 7 7 3 1 2 1 N N 98 98 98 98 99 99 N S 2 2 2 2 1 1 SR 92.86% 92.86% 96.94% 98.98% 97.96% 98.98% SP 97.85% 97.85% 97.94% 97.98% 98.97% 98.98%

D違ng 7-4 K院t qu違 th穎 nghi羽m phân lo衣i email v噂i ng英 li羽u email ch英 b茨ng thu壱t toán AdaBoost with discrete predictions

Nh壱n xét : hi羽u qu違 phân lo衣i trên ng英 li羽u email là ch英 c栄a thu壱t toán AdaBoost khá t嘘t, so v噂i ph逢挨ng pháp phân lo衣i Naïve Bayesian thì ADaBoost phân lo衣i email html t嘘t h挨n, hi羽u qu違 phân lo衣i trên email là

x<n b違n tr挨n c ng t逢挨ng 8逢挨ng v噂i Naïve Bayesian.

7.3 u Î nh逢嬰c 8k吋m ca ph逢挨ng pháp phân loi AdaBoost:

7.3.1 姶u 8k吋m :

• M瓜t逢u 8i吋m c栄a AdaBoost gi嘘ng v噂i ph逢挨ng pháp phân lo衣i Naïve Bayes là nó cho phép h丑c c壱p nh壱t, ngh a là khi m瓜t email spam v逢嬰t qua

8逢嬰c b瓜 l丑c thì ng逢òi dung có th吋"8ánh d医u email 8ó là spam và hu医n luy羽n l衣i b瓜 l丑c

• Hi羽u qu違 phân lo衣i là khá cao

• Vi羽c l逢u tr英 t壱p lu壱t 8ã qua hu医n luy羽n khá g丑n nh姻, trong khi 8ó v噂i ph逢挨ng pháp phân lo衣i Naïve Bayes thì d英 li羽u sau khi h丑c là khá l噂n n. V噂i ph逢挨ng pháp phân lo衣i Naïve Bayesian, d英 li羽u hu医n luy羽n s胤 phình to sau m厩i l亥n hu医n luy羽n c壱p nh壱t thêm, 8i隠u này v噂i cách th詠c hi羽n theo ph逢挨ng pháp AdaBoost là không 8áng k吋.

7.3.2 Khuy院t 8k吋m :

• C ng gi嘘ng nh逢 các ph逢挨ng pháp máy h丑c c栄a ph逢挨ng pháp phân lo衣i d詠a trên thu壱t toán AdaBoost chính là vi羽c ph違i hu医n luy羽n cho nó, vi羽c hu医n luy羽n hi羽u qu違 hay không còn ph違i ph映 thu瓜c vào kho ng英 li羽u hu医n luy羽n ban 8亥u

• Khuy院t 8k吋m th泳 hai là th運i gian hu医n luy羽n, so v噂i Naïve Bayesian,"8吋

hu医n luy羽n cùng m瓜t kho ng英 li羽u thì ph逢挨ng pháp AdaBoost c亥n th運i gian lâu h挨n r医t nhi隠u, theo chúng tôi nh壱n th医y thì s詠 chênh l羽ch 医y khá l噂n.

Ch逢挨ng 8 : XÂY DNG CH姶愛NG TRÌNH

MAIL CLIENT TING VIT H TR PHÂN

8.1 Chc n<ng:

Chúng tôi xây d詠ng ph亥n m隠m Mail Client v噂i các ch泳c n<ng chính nh逢 sau: Ch泳c n<ng g荏i nh壱n email

Lu逢 tr英 email t逢挨ng泳ng v噂i t瑛ng m映c So衣n email

Xây d詠ng s鰻"8鵜a ch雨

L丑c email spam

Qu違n lý email nh逢 sao chép, chuy院n, xóa … email Và m瓜t s嘘công c映 h厩 tr嬰 khác khác : …

A吋 h厩 tr嬰 cho vi羽c ki吋m th穎 Mail Client chúng tôi xây d詠ng ch逢挨ng trình Flood Mail g荏i mail hàng lo衣t 8院n m瓜t 8鵜a ch雨 nh壱n nào 8ó.

8.2 Xây dng b lc email spam :

Chúng tôi s穎 d映ng b瓜 l丑c d詠a trên thu壱t toán h丑c Naïve Bayes và AdaBoost, v噂i Naivê Bayes chúng tôi s穎 d映ng cách cài 8員t theo cách tính xác su医t spam cho m厩i token d詠a trên s嘘 l亥n xu医t hi羽n trong t壱p hu医n luy羽n ban 8亥u, ch丑n s嘘 token 8吋

duy羽t m瓜t email là 15, ch丑n λ =9 do 8ó ng逢õng phân lo衣i email spam làt=0.9. V噂i b瓜 l丑c d詠a trên AdaBoost chúng tôi ch丑n cách cài 8員t theo AdaBoost.MH with real value predictions. Chúng tôi xây d詠ng thành các component tích h嬰p vào ch逢挨ng trình d逢噂i d衣ng các dll.

Chúng tôi c ng xây d詠ng ch泳c n<ng l丑c email theo ph逢挨ng pháp BlackList và lu壱 do ng逢運i dùng t詠"8鵜nh ngh a, ph逢挨ng pháp này s胤 h厩 tr嬰 cho b瓜 l丑c email ng<n ch員n email spam.

8.3 T chc d liu cho ch逢挨ng trình :

D英 li羽u ch逢挨ng trình :g欝m n瓜i dung các email, các lu壱t do ng逢運i dùng thi院t l壱p.

N逢u tr英 n瓜i dung các email g荏i và nh壱n : 8逢嬰c l逢u d逢噂i d衣ng các t壱p tin v<n b違n, v噂i m厩i th逢 m映c t逢挨ng泳ng nh逢 h瓜p th逢"8院n, h瓜p th逢"8i,.. s胤 có m瓜t t壱p tin l逢u n瓜i dung các email trong các thu m映c này, l逢u tr英 d逢噂i d衣ng xml, c医u trúc t壱p tin nh逢 sau : <?xml version=1.0?” <MessageList NumberUnReadMail="1"> <Message MessageID=” ”> <From>…</From> <To>…</To> <Cc> …</Cc> <BCC>…</BCC> <Subject>… </Subject> <Body>…</Body> <Date>…</Date> <Attach>…</Attach> <Priority>…</Priority> <Read>…</Read> </Message> …… </MessageList>

Các thông tin liên quan 8院n m瓜t email mà chúng tôi l逢u tr英 g欝m có : thu瓜c tính 8鵜nh danh email (tr逢運ng MessageID ), tiêu 8隠 email (Subject ), 8鵜a ch雨 ng逢運i g荏i ( tr逢運ng from ),"8鵜a ch雨"8欝ng g荏i ( tr逢運ng Cc), 8鵜a ch雨"8欝ng g荏i 育n ( tr逢運ng Bcc ), n瓜i dung email ( tr逢運ng body),có 8ính kèm t壱p tin ( tr逢運ng Attach ), m泳c 8瓜 quan tr丑ng ( Prority), ngày tháng ( Date)

• 姶逢"8i吋m c栄a cách t鰻 ch泳c d英 li羽u xml:

Xml là cách l逢u tr英 d英 li羽u 8逢嬰c t鰻 ch泳c v噂i c医u trúc cây, xml 8逢嬰c các ngôn ng英 l壱p trình hi羽n 8衣i h厩 tr嬰 khá t嘘t, nh逢 v壱y vi羽c thao tác v噂i d英 li羽u ch逢挨ng trình r医t thu壱n l嬰i.

Xml là chu育n giao ti院p gi英a các h羽 th嘘ng v噂i các cách l逢u tr英 d英 li羽u khác nhau, s穎 d映ng xml ti羽n l嬰i cho vi羽c giao ti院p v噂i h羽 th嘘ng bên ngoài nh逢 chuy吋n

8鰻i hay thu nh壱n thông tin.

• Khuy院t 8k吋m :D英 li羽u 8逢嬰c l逢u d逢噂i d衣ng v<n b違n, không b違o m壱t

8.4 Giao din ng逢運i dùng :

8.4.1 S挨"8欝 màn hình :

Hình 8-1:S挨"8欝 màn hình c栄a ch逢挨ng trình

Hình 8-2 Màn hình chính c栄a ch逢挨ng trình Mail Client

B違ng chú thích cho màn hình chính: Di宇n gi違i

1 N逢噂i hi吋n th鵜 danh sách các email g穎i cho ng逢運i dùng. Các s詠 ki羽n

8i kèm:

§ NhXp 8¬n chuじt trên dòng: A丑c email nhanh.

§ NhXp 8ôi chuôt trên dòng: A丑c email chi ti院t.

§ Aánh dXu chがn trên dòng: Aánh d医u email c亥n xóa.

§ : Thông báo th逢 có 8ính kèm.

§ : Thông báo email ch逢a 8丑c.

2 Khung hi吋n th鵜 cây th逢 m映c l逢u tr英 các h瓜p th逢 c栄a ng逢運i dùng: 1 2 3 4 5

§ Hじp th⇔ nhfn: L逢u th逢 g穎i 8院n cho ng逢運i dùng.

§ Hじp th⇔ ch⇔a gぬi: L逢u th逢"8ã so衣n nh逢ng ch逢a g穎i

§ Hじp th⇔"8ã gぬi: L逢u th逢"8ã8逢嬰c g穎i 8i.

§ Hじp th⇔ spam: L逢u th逢 spam (t詠"8瓜ng)

§ Hじp th⇔ xóa: L逢u th逢 b鵜 xóa b荏i ng逢運i dùng.

3 Khung hi吋n th鵜 nhanh n瓜i dung email khi ng逢運i dùng click ch丑n m瓜t email trên l逢噂i hi吋n th鵜 danh sách email.

4 Thanh công c映. § Nh壱n th逢: Nh壱n th逢 t瑛 email server. § So衣n th逢: So衣n th逢 m噂i. § S鰻"8鵜a ch雨: Tra c泳u s鰻"8鵜a ch雨 liên l衣c. § Tr違 l運i th逢: So衣n th逢 tr違 l運i. § Xóa th逢: Xóa các th逢"8逢嬰c 8ánh d医u ch丑n.

§ Xem: Hi吋n th鵜 danh sách email trên l逢噂i theo tiêu chí xem.

§ Tìm ki院m: Tìm ki院m email theo tiêu 8隠 /n瓜i dung /ng逢運i g荏i. 5 Th詠c"8挨n chính. T壱p tin: § T衣o m噂i th逢: So衣n th逢 m噂i. § T衣o m噂i th逢 m映c: T衣o th逢 m映c m噂i (h瓜p th逢 m噂i) trên cây th逢 m映c.

§ A鰻i tên th逢 m映c: A鰻i tên th逢 m映c (h瓜p th逢) trên cây th逢

m映c.

§ Xóa th逢 m映c: Xóa th逢 m映c (h瓜p th逢) trên cây th逢 m映c (Xóa luôn n瓜i dung bên trong tj逢 m映c).

§ M荏 th逢"8ã l逢u: M荏 th逢"8ã l逢u d衣ng t壱p tin (.eml) Hi羽u ch雨nh:

ng逢運i dùng.

§ Tìm ki院m: Tìm ki院m email theo tiêu 8隠 /n瓜i dung /ng逢運i g荏i.

§ Chuy吋n 8院n th逢 m映c: Chuy吋n th逢"8院n th逢 m映c 8逢嬰c ch丑n

§ Sao chép 8院n th逢 m映c: T衣o b違n sao th逢"8院n th逢 m映c 8逢嬰c ch丑n.

§ Xóa th逢: Xoá th逢"8逢嬰c ch丑n.

§ Xóa th逢 trong th逢 m映c xóa: Xóa t医t c違 th逢 có trong h瓜p th逢

xoá. Công c映:

§ S鰻"8鵜a ch雨: Tra c泳u danh sách 8鵜a ch雨 liên l衣c.

§ Thêm liên l衣c: Thêm liên l衣c m噂i(tên liên l衣c, 8鵜a ch雨

email…)

§ Qui 8鵜nh (Rules): Qui 8鵜nh l丑c th逢 t噂i vào th逢 m映c 8鵜nh tr逢噂c (ho員c xóa).

Th逢:

§ So衣n th逢 m噂i: So衣n th逢"8吋 g穎i 8i.

§ Tr違 l運i th逢: Tr違 l運i th逢"8院n ng逢運i g穎i th逢 t噂i.

§ Thêm qui 8鵜nh: Thêm qui 8鵜nh nh壱n th逢 g穎i t噂i.

§ Ch員n ng逢運i g穎i: Không nh壱n th逢 c栄a ng逢運i g穎i có trong danh sách.

Tr嬰 giúp:

§ Gi噂i thi羽u: Ng逢運i th詠c hi羽n.

Hình 8-3 Màn hình "A丑c email"

v B違ng chú thích cho màn hình “A丑c email”: Di宇n gi違i

1 Hi吋n th鵜 thông tin v隠 email.

2 Khung hi吋n th鵜 n瓜i dung email.

3 Thanh công c映. § Nh壱n th逢: Nh壱n th逢 t瑛 email server. § So衣n th逢: So衣n th逢 m噂i. § S鰻"8鵜a ch雨: Tra c泳u s鰻"8鵜a ch雨 liên l衣c. § Tr違 l運i th逢: So衣n th逢 tr違 l運i. § Xóa th逢: Xóa các th逢"8逢嬰c 8ánh d医u ch丑n. § N逢u th逢: L逢u th逢 xu嘘ng 鰻 c泳ng d衣ng t壱p tin(.eml). 2 1 3 4

§ Th逢 tr逢噂c: A丑c th逢 li隠n tr逢噂c.

§ Th逢 k院<A丑c th逢 li隠n sau.

§ Spam: Aánh d医u spam v逢嬰t qua b瓜 l丑c (Yêu c亥u h丑c spam). 4 Th詠c 8挨n chính. T壱p tin: § T衣o m噂i th逢: § T衣o m噂i liên l衣c: § M荏 th逢"8ã l逢u: § N逢u th逢: Hi羽u ch雨nh: § Tìm ki院m th逢: § Chuy吋n 8院n th逢 m映c: § Sao chép 8院n th逢 m映c: § Xóa th逢: Xóa th逢"8逢嬰c ch丑n. Công c映: § S鰻"8鵜a ch雨: § Thêm liên l衣c: § Qui 8鵜nh (Rules): Th逢: § So衣n th逢 m噂i § Tr違 l運i th逢: § Th逢 tr逢噂c: § Th逢 k院:

§ N逢u t壱p tin 8ính kèm: L逢u t壱p tin 8ính kèm trong th逢

xu嘘ng 8 a c泳ng.

§ Xóa t壱p tin 8ính kèm: Xóa t壱p tin 8ính kèm 8逢嬰c ch丑n trong danh sách 8ính kèm.

Hình 8-4 Màn hình g荏i email

v B違ng chú gi違i cho màn hình “G荏i email”: Di宇n gi違i

1 Khung nh壱p thông tin v隠 email: g穎i t瑛"8âu, g穎i 8院n 8âu, g穎i cho nhi隠u ng逢運i (CC), g穎i nhi隠u ng逢運i nh逢ng育n 8鵜a ch雨 g穎i (BCC). Ch泳c n<ng 8i kèm: § Ch丑n 8鵜a ch雨 g穎i 8院n t瑛 danh sách. § Ch丑n danh sách 8鵜a ch雨 g穎i cùng lúc. § Ch丑n danh sách 8鵜a ch雨 g穎i cùng lúc (育n 8鵜a ch雨 ng逢運i g穎i). 2 Khung so衣n th違o email. 2 1 5 3 4

3 Thanh công c映. § G穎i th逢: Th詠c hi羽n g穎i th逢"8院n ng逢運i nh壱n. § S鰻"8鵜a ch雨: Tra c泳u s鰻"8鵜a ch雨 liên l衣c. § N逢u th逢: L逢u th逢 xu嘘ng 鰻 c泳ng d衣ng t壱p tin(.eml). § Aính kèm: M荏 và thêm t壱p tin 8ính kèm. 4 Th詠c 8挨n chính. T壱p tin: § T衣o th逢 m噂i: § M荏 th逢"8ã l逢u: § N逢u th逢: § N逢u m噂i th逢: L逢u l衣i th逢 xu嘘ng 8 a c泳ng v噂i tên m噂i. Hi羽u ch雨nh: § Ch丑n t医t c違: Ch丑n t医t c違 n瓜i dung v<n b違n (text). § Tìm ki院m th逢: § Chuy吋n 8院n th逢 m映c: § Sao chép 8院n th逢 m映c: § Ki吋u ch英: Ch丑n ki吋u ch英 cho v<n b違n so衣n. Xem:

§ Hi吋n th鵜 thanh công c映: Ch丑n hi吋n th鵜 hay 育n thanh công c映. Công c映: § S鰻"8鵜a ch雨: § Thêm liên l衣c: Th逢: § So衣n th逢 m噂i: § N逢u th逢: § G荏i th逢: G穎i th逢"8院n ng逢運i nh壱n.

§ Thêm t壱p tin 8ính kèm: Thêm t壱p tin 8inh kèm vào trong th逢 g穎i 8i.

§ Xóa t壱p tin 8ính kèm: Tr嬰 giúp:

§ Gi噂i thi羽u:

§ J逢挨ng d磯n:

Ch逢挨ng 9 : TNG KT VÀ H姶閏NG PHÁT TRIN

9.1 Các vic 8ã thc hin 8逢嬰c :

Trong khoá lu壱n này chúng tôi 8ã trình bày các h逢噂ng nghiên c泳u, ti院p c壱n trong phân lo衣i email và ch嘘ng spam. Chúng tôi c ng 8ã t壱p trung 8i sâu vào

j逢逢óng ti院p c壱n phân lo衣i email d逢衣 trên n瓜i dung.雲"8ây chúng tôi trình bày hai ph逢挨ng pháp phân lo衣i email khá m噂i và hi羽u qu違 là phân lo衣i email d詠a trên thu壱t toán hu医n luy羽n Naïve Bayes và d詠a trên thu壱t toán AdaBoost.K院t qu違 th穎 nghi羽m v噂i d英 li羽u s嘘 và d英 li羽u v<n b違n tr挨n là khá hi羽u qu違, tuy nhiên 8嘘i v噂i email html thì v磯n ch逢a 8逢嬰c nh逢 mong mu嘘n, 8k隠u này là do kho ng英 li羽u email html ch逢a 8栄

l噂n, m員t khác email html có nh英ng 8員c 8k吋m c栄a riêng nó mà chúng tôi ch逢a kh逸c ph映c 8逢嬰c nh逢 n瓜i dung ch栄 y院u là các hình違nh.

Chúng tôi c ng 8ã xây d詠ng th穎 nghi羽m ph亥n m隠m Mail Client h厩 tr嬰 l丑c email. B瓜 l丑c email 8逢嬰c tính h嬰p vào ch逢挨ng trình 8逢嬰c xây d詠ng theo nh英ng

j逢噂ng 8ã ti院p c壱n.Ch逢挨ng trình h厩 tr嬰 m瓜t s嘘 ch泳c n<ng chính c栄a m瓜t ph亥n m隠m Mail Client thông th逢運ng nh逢 g噂i, nh壱n email, tìm ki院m, qu違n lý email...

9.2 H逢噂ng ci tin, m rng :

Vì th運i gian có h衣n, do 8ó v磯n còn nh英ng 8k隠u chúng tôi mu嘘n th詠c hi羽n nh逢ng ch逢a th吋 th詠c hi羽n 8逢嬰c.D詠a trên nh英ng k院t qu違"8ã 8衣t"8逢嬰c, chúng tôi 8隠

xu医t nh英ng h逢噂ng c違i ti院n, m荏 r瓜ng cho ch逢挨ng trình

9.2.1 V隠 phân lo衣i và l丑c email spam:

a) V隠 cách rút trích các token :

Có th吋 c違i ti院n cách l医y token, thay vì cách ch丑n token 8挨n, có th吋

ch丑n token nh逢 là m瓜t ng英 ( g欝m nhi隠u t瑛) – token g欝m hai hay nhi隠u token

b) M荏 r瓜ng v噂i email là ti院ng Vi羽t thay vì ch雨 th詠c hi羽n v噂i email ti院ng Anh , tuy nhiên v医n 8隠 phân lo衣i email ti院ng Vi羽t có m瓜t s嘘 8k吋m khó kh<n là không có s印n m瓜t kho ng英 li羽u email ti院ng Vi羽t ph映c v映 cho vi羽c h丑c Thêm n英a ti院ng Vi羽t là m瓜t t逢挨ng 8嘘i ngôn ng英 ph泳c t衣p và 8a d衣ng, do 8ó vi羽c phân lo衣i email ti院ng Vi羽t l衣i liên quan 8院n v医n 8隠 tách t瑛 (tách token ),

8ây là bài toán ph泳c t衣p.

c) Có th吋 xây d詠ng b瓜 l丑c thành các ph亥n m隠m riêng r胤 và tích h嬰p (plug in ) vào các ph亥n m隠m email Client hi羽n có nh逢 Outlook Express, Mozzila ThunderBird.

d) Áp d映ng b瓜 l丑c email t衣i m泳c Server, ng<n ch員n email spam ngay t衣i các Server email.

e) Có th吋 s穎 d映ng k院t h嬰p hai b瓜 l丑c theo hai ph逢挨ng pháp Naïve Bayesian và AdaBoost, khi 8ó vi羽c xây d詠ng t壱p lu壱t y院u dùng 8吋 ch丑n l丑c ban 8亥u có th吋 d詠a vào nh英ng token có xác su医t spam cao và xác su医t non- spam th医p t瑛 d英 li羽u hu医n luy羽n c栄a Naïve Bayesian.

9.2.2 V隠 ch逢挨ng trình Mail Client:

Ch逢挨ng trình hi羽n ch雨 m噂i 8逢嬰c xây d詠ng v噂i m瓜t vài ch泳c n<ng chính, v磯n còn nhi隠u h衣n ch院. V噂i mong mu嘘n xây d詠ng hoàn thi羽n m瓜t ph亥n m隠m Mail Client h厩 tr嬰 ti院ng Vi羽t thì bên c衣nh vi羽c hoàn thi羽n nh英ng cái 8ã có , chúng tôi d詠"8鵜nh xây d詠ng thêm m瓜t s嘘 ch泳c n<ng:

H厩 tr嬰 b違o m壱t : d英 li羽u c栄a ch逢挨ng trình8逢嬰c l逢u d衣ng t壱p tin

x<n b違n,"8i隠u 8ó không b違o m壱t. Có th吋 cài ti院n 8k隠u này b茨ng cách mã hoá t壱p tin, l逢u d逢噂i d衣ng nh鵜 phân

H厩 tr嬰 nhi隠u tài kho違n (Account) trên MailClient, hi羽n t衣i ch逢挨ng trình ch雨 h厩 tr嬰 m瓜t tài kho違n .

TÀI LIU THAM KHO

Ting Vit :

[4] Hoàng Hoài S挨n, Th逢 rác n厩i kh鰻 chung, báo TH吋 thao V<n hoá, s嘘 28 6-4- 2004, Tr 34.

[8]A員ng H医n (1992), “Xác su医t th嘘ng kê ”, Nhà xu医t b違n Giáo D映c

Ting Anh :

[1] Monty Python’s Flying Circus.Just the words, volume 2, chapter 25, pages 27– 28.Methuen, London, 1989.

[2] B. Leiba and N. Borenstein. A Multi-Faceted Approach to Spam Prevention,

Proceedings of the First Conference on E-mail and Anti-Spam,2004.

[3] Ion Androutsopoulos, John Koutsias, Konstantinos V. Chandrinos, George Paliouras

and Constantine D. Spyropoulos, An Evaluation Bayes Antispam Filtering,

Proceedings of the workshop on Machine Learning in the New Information Age

[5] P.Graham, Stopping Spam,http://paulgraham.com/stoppingspam.html, August 2003

[6] Flavio D. Garcia.Spam Filter Analysis Arxiv.preprint cs.CR/0402046, 2004 - arxiv.org

[7] P. Graham, A Plan for Spam, http://paulgraham.com/spam.html, August 2002

Một phần của tài liệu Tìm hiểu các hướng tiếp cận phân loại EMAIL và xây dựng phần mềm mail client hỗ trợ tiếng việt (Trang 79 - 106)

Tải bản đầy đủ (PDF)

(106 trang)