1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng ứng dụng ngăn chặn tin nhắn rác trên thiết bị di động

54 848 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 54
Dung lượng 1,33 MB

Nội dung

Xây dựng ứng dụng ngăn chặn tin nhắn rác trên thiết bị di độngXây dựng ứng dụng ngăn chặn tin nhắn rác trên thiết bị di độngXây dựng ứng dụng ngăn chặn tin nhắn rác trên thiết bị di độngXây dựng ứng dụng ngăn chặn tin nhắn rác trên thiết bị di độngXây dựng ứng dụng ngăn chặn tin nhắn rác trên thiết bị di độngXây dựng ứng dụng ngăn chặn tin nhắn rác trên thiết bị di độngXây dựng ứng dụng ngăn chặn tin nhắn rác trên thiết bị di độngXây dựng ứng dụng ngăn chặn tin nhắn rác trên thiết bị di động

HC VIN CễNG NGH BU CHNH VIN THễNG - NGUYN TRNG THANH XY DNG NG DNG NGN CHN TIN NHN RC TRấN THIT B DI NG LUN VN THC S K THUT (Theo nh hng ng dng) H NI - 2016 HC VIN CễNG NGH BU CHNH VIN THễNG - NGUYN TRNG THANH XY DNG NG DNG NGN CHN TIN NHN RC TRấN THIT B DI NG CHUYấN NGNH : KHOA HC MY TNH M S: 60.48.01.01 LUN VN THC S K THUT (Theo nh hng ng dng) NGI HNG DN KHOA HC: TS NGUYN TRNG NG H NI - 2016 i LI CAM OAN Tụi cam oan õy l cụng trỡnh nghiờn cu ca riờng tụi Cỏc s liu, kt qu nờu lun l trung thc v cha tng c cụng b bt c cụng trỡnh no TC GI Nguyn Trng Thanh ii LI CM N Trong sut khúa hc cao hc ti Hc vin Cụng ngh Bu chớnh Vin thụng, vi s n lc ca bn thõn v s giỳp tn tỡnh ca cỏc thy cụ giỏo trng c bit l cỏc thy cụ giỏo khoa CNTT ó giỳp tụi cú mt tri thc vng vng hon thnh lun Xin cm n cỏc thy cụ giỏo khoa Quc t v o to Sau i hc ó ging dy cho tụi nhng kin thc chuyờn mụn lm c s thc hin tt lun v to iu kin cho tụi hon thnh tt khúa hc Tụi xin gi li cm n chõn thnh ti TS Nguyn Trng ng, ThS Nguyn c Tuõn l nhng ngi hng dn luụn theo sỏt ch bo hng i v cho tụi nhng li khuyờn quý bỏu cng nh cung cp cỏc thụng tin v cn c khoa hc tụi hon thnh lun Xin cm n gia ỡnh, bn bố ó ng viờn v giỳp tụi quỏ trỡnh lm lun Do thi gian thc hin lun v kin thc cú hn nờn khụng trỏnh nhng thiu xút, rt mong nhn c nhng ý kin úng gúp ca cỏc thy cụ v bn bố lun c hon thin hn Trõn trng cỏm n Tỏc gi Nguyn Trng Thanh iii MC LC LI CAM OAN i LI CM N ii DANH MC T VIT TT v DANH MC CC BNG BIU vi DANH MC CC HèNH V vii M U Tớnh cp thit ca ti Tng quan v nghiờn cu Mc ớch, i tng, phm vi v phng phỏp nghiờn cu Cu trỳc lun CHNG - CC GII PHP NGN CHN TIN NHN RC .5 1.1 Tng quan v tin nhn rỏc Tin nhn SMS Tin nhn SMS rỏc 1.2 Thc trng tin nhn rỏc ti Vit Nam Thc trng tin nhn rỏc ti Vit Nam Cỏc loi tin nhn rỏc chớnh xut hin ti Vit Nam 11 1.3 Cỏc gii phỏp ngn chn tin nhn rỏc 12 Gii phỏp v mt phỏp lý .12 Gii phỏp v mt k thut 14 1.4 Cỏc phng phỏp phõn loi bn 15 Phõn loi bn 15 Tin trỡnh phõn loi bn 16 Cỏc phng phỏp phõn loi bn .18 1.5 Kt lun chng 21 CHNG - P DNG THUT TON NAẽVE BAYES XY DNG B LC TIN NHN RC .23 2.1 C s lý thuyt .23 Cụng thc xỏc sut cú iu kin 23 Cụng thc xỏc sut y 23 Phỏt biu thut toỏn Naùve Bayes 23 2.2 Bi toỏn phõn loi bn vi Naùve Bayes .24 iv 2.3 Cỏc u im ca b lc tin nhn rỏc Naùve Bayes 28 2.4 Cỏc bc xõy dng b lc Naùve Bayes 30 La chn cỏc c trng 30 Biu din cỏc tin nhn 32 Xỏc nh ngng 32 Th nghim h thng lc tin nhn rỏc hiu qu thc t .32 2.5 Kt lun chng 33 CHNG - XY DNG NG DNG NGN CHN TIN NHN RC TRấN THIT B DI NG .34 3.1 Gii thiu bi toỏn 34 3.2 Phõn tớch v xõy dng ng dng 35 3.3 Giao din ng dng 37 Giao din danh sỏch tin nhn 37 Giao din chi tit hi thoi 38 Giao din danh sỏch Blacklist .39 Mn hỡnh danh sỏch t xu 40 3.4 Thc nghim v ỏnh giỏ thut toỏn 41 3.5 Kt lun chng 42 KT LUN 43 TI LIU THAM KHO 45 v DANH MC T VIT TT STT T vit tt CDMA GPRS GSM PC PDA SMS SVM í ngha Code Division Multiple Access General Packet Radio Service Global System for Mobile Communications Personal Computer Personal Digital Assistant Short Message Services Support Vectors Machines vi DANH MC CC BNG BIU Bng 2.1 Vớ d minh thut toỏn Naùve Bayes 27 Bng 2.2 Tớnh giỏ tr xỏc sut ca cỏc thuc tớnh 28 vii DANH MC CC HèNH V Hỡnh 1.1 Thng kờ cỏc loi hỡnh tin nhn rỏc 10 Hỡnh 1.2 Tin nhn cú tớnh cht la o 11 Hỡnh 1.3 Tin nhn gi mo .12 Hỡnh 1.4 La chn mt c trng 16 Hỡnh 1.5 La chn nhiu c trng 17 Hỡnh 1.6 Phng phỏp SVM 20 Hỡnh 3.1 To c s d liu cho tin nhn hp l v tin nhn rỏc 35 Hỡnh 3.2 Kim tra ni dung tin nhn n 36 Hỡnh 3.3 Giao din danh sỏch tin nhn 37 Hỡnh 3.4 Giao din tựy chn ca mt cuc hi thoi .38 Hỡnh 3.5 Giao din chi tit hi thoi v cỏc tựy chn tin nhn 39 Hỡnh 3.6 Giao din danh sỏch Blacklist 40 Hỡnh 3.7 Giao din danh sỏch cỏc t xu 41 M U Tớnh cp thit ca ti S phỏt trin ca khoa hc, k thut ó to nhiu cụng ngh mi phc v hot ng liờn lc, trao i thụng tin, ú cú SMS Hin nay, SMS c ỏnh giỏ l mt nhng phng tin liờn lc ph bin, n gin v hiu qu nht SMS cng c coi l cụng c phc v c lc hot ng kinh doanh, c bit l qung cỏo Cng nh th in t rỏc, tin nhn rỏc l mt nhng nn phỏt sinh bờn cnh nhng c im tớch cc m tin nhn mang li Ti Vit Nam, tin nhn rỏc ó v ang tr thnh mt nn ln i vi thuờ bao di ng v din bin ngy mt tinh vi v phc Cha bao gi vic phỏt tỏn nhng tin nhn rỏc d dng nh hin Tin nhn rỏc khụng ch cú ni dung v mua bỏn, qung cỏo m cũn xut hin rt nhiu tin nhn rỏc la o qua tin nhn, d d ngi dựng, thm mang tớnh cht phn ng, bụi nh danh d ngi khỏc Mi nm cú hng trm triu tin nhn rỏc c phỏt tỏn i Chỳng gõy khú chu c v ni dung ln s lng cho nhng ngi s dng in thoi Theo nh ngha v tin nhn rỏc ti Lut Cụng ngh Thụng tin thỡ tin nhn rỏc l tin nhn c gi n ngi nhn m ngi nhn ú khụng mong mun hoc khụng cú trỏch nhim phi tip nhn theo quy nh ca phỏp lut iu ny chng t vai trũ rt quan trng ca cỏc ng dng, phn mm ngn chn tin nhn rỏc dnh cho ngi dựng Vỡ vy, bờn cnh cỏc gii phỏp ngn chn tin nhn rỏc l t phớa doanh nghip di ng, thỡ cỏc phn mm, ng dng cho phộp ngi dựng ch ng ngn chn tin nhn rỏc l rt quan trng Nu nh doanh nghip di ng cú th ngn chn nhng tin nhn vi ni dung, tiờu nht nh, thỡ vi cỏc phn mm, ng dng ci t trờn in thoi, ngi dựng cú th ch ng la chn nhng ni dung tin nhn m h khụng mong mun, coi l rỏc v la chn nhng ni dung m h mun nhn c Hin nay, in thoi thụng minh ngy cng ph bin v tr thnh mt vt dng khụng th thiu i vi nhiu ngi Vỡ vy, phm vi lun thc s, 31 Phng phỏp k thut u tiờn s dng lnh vc phõn loi bn Vi mi t xut hin ni dung ca cỏc tin nhn bn mu, chỳng ta s a vo mt c trng thớch hp Vi mi tin nhn, c trng ny s nhn giỏ tr l nu ni dung ca cỏc tin nhn cú cha nú v nhn giỏ tr khụng trng hp ngc li T cỏc c trng ny chỳng ta chn 2002 c trng vi lng tin tng h l ln nht nhn cỏc giỏ tr [7,5,6,4] chỳng ta tớnh toỏn lng tin tng h cho mi c trng ng X nh sau: MI ( X ;Y ) P( X x,Y y) log x 0,1 , y( 0,1) P( X x,Y y) P( X x) * P(Y y) (2.12) Mt li th ca phng phỏp ny l thụng tin c t ng húa mt cỏch d dng, cỏc c trng ng viờn v cỏc lng tin tng h MI ca chỳng cú th gi mt phm vi nht nh v cú th cp nht mi ni d liu mi c a vo, v khong 200 c trng u tiờn cú th la chn li nu cn thit Con ng kiu mi ny ca tin nhn rỏc hay tin nhn hp l cú th c kt hp cht ch b lc qua thi gian, phự hp vi mc ớch ca chỳng ta l t ng hc v thớch nghi vi tin nhn rỏc Phng phỏp th hai m chỳng ta s dng la chn cỏc c trng a n mt lnh vc kin thc c bit kt qu tớnh toỏn, nú i lp vi phng phỏp u tiờn, nú cú th hin th quỏ trỡnh lc tin nhn rỏc nh chung ca phõn loi bn Chỳng ta chc chn cỏc tin nhn rỏc cú khuụn mu m chỳng khỏc bit so vi cỏc tin nhn hp l Khụng gian c trng thng cú kớch thc l rt ln (thụng thng nhng yờu cu cú kớch thc khong vi ngn t) Bi vy chỳng ta phi la chn cỏc c trng vi nhiu lớ u tiờn gim bt kớch thc giỳp ớch cho vic cung cp mt iu khin rừ rng mụ hỡnh kt qu khỏc t s c lng nhiu tham s Hn na la chn c trng cng giỳp cho vic lm gim mc nú khụng ph thuc vo cỏc gi nh c a bi phõn hoch Naive Bayes 32 Biu din cỏc tin nhn Sau chn c cỏc c trng bn chỳng ta tin hnh biu din cỏc tin nhn thnh cỏc vector m khụng gian ca nú l cỏc t hay cm t ó phõn tớch Cỏc cm t ny ó xỏc nh rừ s ln xut hin ca chỳng mi tin nhn Kt hp cỏc tin nhn mi lp tin nhn ta c mt vector biu din lp tin nhn ú (trong trng hp ny s cú hai vector c to ú l vector biu din lp tin nhn hp l v vector biu din lp tin nhn rỏc) Tin hnh ghộp ni hai vector trờn ly c mt cỏc c trng bao gm: cỏc t hay cm t v s ln xut hin ca chỳng c hai lp tin nhn v tớnh cỏc xỏc sut tng ng ta s c mt cỏc c trng Tt c cỏc c trng ny s c lu vo mt bng mụ t lm cn c phõn loi cỏc tin nhn Mi tin nhn c gi n s c biu din thụng qua c trng trờn S dng cụng thc tớnh xỏc sut Naive Bayes ta s tớnh c xỏc sut mt tin nhn cú phi l tin nhn rỏc hay khụng Giỏ tr xỏc sut ny c dựng so sỏnh vi ngng (ranh gii phõn nh tin nhn v tin nhn hp l) Xỏc nh ngng Xỏc nh rừ ngng loi b tt c cỏc tin nhn m xỏc sut ca chỳng ln hn xỏc sut ny Chng hn coi 0.9 l gii hn trờn khng nh mt tin nhn l tin nhn rỏc hay tin nhn hp l Nu quỏ trỡnh xỏc nh cỏc giỏ tr xỏc sut ca cỏc t khúa chng hn P(spam/content)=0.92 thỡ khng nh tin nhn cha t ú l tin nhn rỏc ngc li l tin nhn hp l (vỡ õy l phõn loi bn hai lp) Th nghim h thng lc tin nhn rỏc hiu qu thc t Cú th tin hnh th nghim nh sau: Ly mt mu khong mt trm tin nhn ú cú 75% tng s tin nhn c phõn loi cũn 25% cũn li cú th dựng b lc Naive Bayes phõn loi Hiu qu thc t ca b lc s c ỏnh giỏ theo s tin nhn rỏc m nú phõn loi c Khõu ny tin hnh rt nhiu ln cú th ly c feedback t ngi s dng hon chnh b lc hay b sung c s d liu cho b lc ci tin hiu qu 33 Khi xõy dng b lc tin nhn rỏc bng Naive Bayes cú th lm tng thờm hiu qu ca b lc bng cỏch kt hp vi vic lc tin nhn rỏc qua cỏc cỏch khỏc nh: s dng Blacklist, Graylist hay cỏc Keyword thng dựng tin nhn rỏc Nhng thụng tin ú cng cú th lu vo mt file d liu lm c s phõn loi tin nhn rỏc, v nú s lm cho hiu qu ca b lc tin nhn rỏc tng lờn rt nhiu õy l ni dung ca ng dng chn tin nhn rỏc m tỏc gi mun trỡnh by 2.5 Kt lun chng Chng ó a c s lý thuyt ca thut toỏn Naùve Bayes, nhng u im s dng thut toỏn Naùve Bayes phõn loi bn ng thi, chng cng nờu cỏc thc to mt b lc s dng thut toỏn Naùve Bayes, õy l tin xõy dng nờn ng dng ngn chn tin nhn rỏc trờn thit b di ng m lun cp chng 34 CHNG - XY DNG NG DNG NGN CHN TIN NHN RC TRấN THIT B DI NG 3.1 Gii thiu bi toỏn Vi s phỏt trin vt bc ca khoa hc cụng ngh, in thoi thụng minh ngy cng tr nờn ph bin hn bao gi ht S a dng v mu mó, giỏ thnh, tớnh nng khin cho vic s hu chic smartphone rt d dng Ni tri hn c cỏc h iu hnh trờn di ng ú l h iu hnh Android, ca Google õy l mt h iu hnh mó ngun m Chớnh vỡ m ngun m cựng vi mt giy phộp s dng khụng cú nhiu rng buc ó cho phộp cỏc nh phỏt trin thit b, mng di ng v cỏc lp trỡnh viờn c iu chnh v phỏt trin Android mt cỏch t Ngoi ra, Android cũn cú mt cng ng lp trỡnh viờn ụng o chuyờn vit cỏc ng dng m rng chc nng ca thit b Do vy, lun s xõy dng ng dng ngn chn tin nhn rỏc trờn in thoi di ng s dng h iu hnh Android Cỏc tớnh nng chớnh ca ng dng: - Gi, nhn tin nhn nh ng dng tin nhn mc nh ca mỏy - Theo dừi cỏc tin nhn theo cuc hi thoi - Chn tin nhn rỏc theo nhiu phng phỏp khỏc nhau: + S dng phng phỏp Blacklist: a cỏc s in thoi phỏt tỏn tin nhn rỏc vo danh sỏch en Cỏc tin nhn c gi i t s in thoi ny s c coi l tin nhn rỏc + S dng phng phỏp Keyword: thờm cỏc t khúa thng xut hin tin nhn rỏc, nu ni dung tin nhn cú cha cỏc t khúa trờn thỡ tin nhn ú c coi l tin nhn rỏc + S dng thut toỏn hc mỏy Naùve Bayes: cung cp b lc tin nhn cho phn mm, cỏc d liu v tin nhn rỏc v tin nhn thụng thng u vo ca b lc l ni dung tin nhn gi n, kt qu sau chy qua b lc s phõn loi c tin nhn n cú phi tin nhn rỏc hay khụng 35 - Nhng tin nhn c phõn loi l tin nhn rỏc s khụng thụng bỏo, trỏnh lm phin ngi dựng Sau ú ngi dựng cú th xem li ni dung tin nhn rỏc ú nh bỡnh thng - Report tin nhn rỏc ti u s 456 tip nhn v x lý tin nhn rỏc ca b Truyn thụng Thụng tin 3.2 Phõn tớch v xõy dng ng dng Bn cht ca vic xõy dng b lc tin nhn rỏc chớnh l s dng thut toỏn Naùve Bayes phõn loi ni dung tin nhn Cỏc tin nhn s c chia thnh loi: Tin nhn spam (SPAM) v tin nhn hp l (HAM) Tin nhn hp l (HAM) C s d liu ca xỏc sut cỏc t Tin nhn rỏc (SPAM) Hỡnh 3.1 To c s d liu cho tin nhn hp l v tin nhn rỏc cú th to dng b lc tin nhn rỏc, trc ht cn phi cú d liu hun luyn cho thut toỏn Cỏc tin nhn rỏc v tin nhn hp l s c hp li v gỏn nhón SPAM i vi tin nhn rỏc v HAM i vi tin nhn hp l Trong khuụn kh ca lun vn, d liu hun luyn vi khong 200 bn ghi bao gm cỏc tin nhn rỏc v tin nhn hp l ó c gỏn nhón Ni dung ch yu ca cỏc tin nhn rỏc lun l cỏc tin nhn rỏc mi cho bt ng sn, mua bỏn sim s p, thụng bỏo trỳng thng Ni dung ca cỏc tin nhn hp l l cỏc mu chuyn, cỏc cõu hi, cõu tr li, cõu thụng bỏo ngn gn Ngoi d liu hun luyn, ng dng cũn cú mt d liu test kim tra ỏnh giỏ chớnh xỏc ca thut toỏn Naùve Bayes vi khong 100 bn ghi bao gm c tin nhn rỏc v tin nhn hp l ó c gỏn nhón Sau d liu test 36 c phõn loi nh b lc, ta s so khp vi cỏc nhón ó c phõn loi bng tay ỏnh giỏ c chớnh xỏc ca thut toỏn Hai d liu lu di dng file text, c lu b nh mỏy ng dng s c cỏc d liu v to b lc tin nhn rỏc t cỏc d liu trờn Quỏ trỡnh x lý tin nhn rỏc c x lý ngm Khi cú tin nhn mi n, ni dung tin nhn s c chy qua b lc tin nhn rỏc Nu nh b lc phõn loi tin nhn ú l tin nhn hp l, ng dng s thụng bỏo cho ngi dựng bit cú tin nhn mi n Nu tin nhn ú c phõn loi l tin nhn rỏc, ng dng s khụng thụng bỏo n ngi dựng Tin nhn n Ni dung tin nhn c chy qua b lc Tin nhn SPAM Sai Thụng bỏo cú tin nhn mi ỳng Khụng thụng bỏo Hỡnh 3.2 Kim tra ni dung tin nhn n 37 3.3 Giao din ng dng Giao din danh sỏch tin nhn Mn hỡnh danh sỏch tin nhn: Hin th ton b cỏc tin nhn cú mỏy Cỏc tin nhn c a di dng cỏc cuc hi thoi theo tng s in thoi Tin nhn mi s c a lờn u ngi s dng d dng xem ni dung xem chi tit mt cuc hi thoi, ngi s dng chm vo cuc hi thoi Gúc trờn bờn phi cú menu iu hng n mn hỡnh hin th Blacklist v mn hỡnh danh sỏch cỏc t xu ngi dựng t nh ngha Hỡnh 3.3 Giao din danh sỏch tin nhn 38 Khi nhn v gi mt cuc hi thoi s hin th mt menu vi cỏc tớnh nng: - Xúa hi thoi - ỏnh du l Spam (a s in thoi gi vo danh sỏch Blacklist) - Xúa danh sỏch Blacklist (vi nhng s ó cú danh sỏch Blacklist) Hỡnh 3.4 Giao din tựy chn ca mt cuc hi thoi Giao din chi tit hi thoi Ti mn hỡnh ny, cỏc tin nhn cuc hi thoi s c hin th theo thi gian t c n mi, cỏc tin nhn mi n s c hin th di, to cho ngi dựng cm giỏc nh ang i thoi Khi nhn v gi vo mt tin nhn bt k s cú cỏc tựy chn: - Sao chộp ni dung tin nhn - Xúa tin nhn 39 - Bỏo cỏo spam: Chuyn tip tin nhn ti u s 456 tng i tip nhn v x lý tin nhn rỏc ca B Truyn thụng Thụng tin vi cu trỳc (so_dien_thoai)(thoi_gian_nhan) noi_dung_tin Hỡnh 3.5 Giao din chi tit hi thoi v cỏc tựy chn tin nhn Giao din danh sỏch Blacklist Vi nhng s in thoi ó danh sỏch Blacklist, cỏc s ny s c hin th mn hỡnh danh sỏch Blacklist Khi ngi dựng nhn vo mt s in thoi, ng dng chuyn sang mn hỡnh chi tit cuc hi thoi nh mn hỡnh danh sỏch tin nhn 40 Hỡnh 3.6 Giao din danh sỏch Blacklist Mn hỡnh danh sỏch t xu Mn hỡnh danh sỏch t xu hin th nhng t xu m ngi dựng nh ngha Cỏc t xu ny xut hin ni dung tin nhn lp tc s c coi ú l tin nhn rỏc Ngi dựng cú th thờm, sa, xúa cỏc t xu ny, mi t cỏch bi du ; (chm phy) 41 Hỡnh 3.7 Giao din danh sỏch cỏc t xu 3.4 Thc nghim v ỏnh giỏ thut toỏn Khi chy ng dng ngn chn tin nhn rỏc, b lc tin nhn s c ng theo Ton b quỏ trỡnh np d liu v hun luyn d liu c x lý ngm nhm nõng cao hiu qu ca ng dng cng nh giỳp tri nghim ngi dựng c tt hn Khi cú tin nhn n, ng dng s kim tra xem tin nhn cú phi l tin nhn rỏc hay khụng Trc tiờn, tin nhn n s c kim tra xem s in thoi gi n cú nm danh sỏch Blacklist hay khụng Nu nm danh sỏch ny thỡ xỏc nh ú l tin nhn rỏc luụn Nu khụng nm danh sỏch Blacklist, h thng s kim tra ni dung tin nhn cú cha cỏc t khúa ca tin nhn rỏc ngi dựng t nh ngha hay khụng Nu cú cha mt t khúa tr lờn thỡ xỏc nh ú l tin nhn rỏc Sau cựng, nu khụng cha t khúa tin nhn rỏc, h thng s kim tra ni dung 42 tin nhn bng b lc ó c to trờn phõn loi tin nhn xem cú phi l tin nhn rỏc hay khụng Vi tin nhn cú ni dung Anh len Ha Noi roi nhe, b lc d oỏn õy l tin nhn hp l, thụng bỏo cho ngi dựng cú tin nhn n Vi tin nhn cú ni dung Em ban sim gia re, lien he: 0987654321, b lc d oỏn õy l tin nhn rỏc, khụng thụng bỏo cho ngi dựng bit cú tin nhn n Ngi dựng sau ú cú th xem ni dung ca tin nhn ny nh vi tin nhn hp l khỏc Trong quỏ trỡnh to b lc, sau ó hun luyn thnh cụng b lc t d liu hun luyn, d liu test c np vo vi khong 100 bn ghi bao gm cỏc tin nhn hp l v tin nhn rỏc ó c gỏn nhón bng tay kim tra tớnh chớnh xỏc ca thut toỏn Kt qu kim nghim cho thy h thng cú th nhn din ỳng 94%, 6% nhn din sai (nhn din tin nhn hp l thnh tin nhn rỏc hoc tin nhn rỏc thnh tin nhn hp l) 3.5 Kt lun chng Chng ó trỡnh by v cỏc tớnh nng chớnh ca ng dng ngn chn tin nhn rỏc trờn h iu hnh Android, cỏc k thut ngn chn tin nhn rỏc c s dng ng dng Thut toỏn Naùve Bayes cú chớnh xỏc khỏ cao phỏt hin cỏc tin nhn l tin nhn rỏc 43 KT LUN Kt qu t c Lun ó a c cỏi nhỡn tng quan v tin nhn v tin nhn rỏc, thc trng tỡnh hỡnh tin nhn rỏc ti Vit Nam Cỏc gii phỏp v mt phỏp lý v gii phỏp v mt k thut gúp phn khụng nh vo vic hn ch s phỏt tỏn ca tin nhn rỏc T nhng gii phỏp k thut, lun ó ch rng s dng cỏc thut toỏn phõn loi bn l cỏch tt nht xem tin nhn no l tin nhn rỏc V vi nhng u im ca thut toỏn Naùve Bayes, lun ó la chn thut toỏn trờn lm c s phỏt trin ng dng ngn chn tin nhn rỏc trờn in thoi di ng s dng h iu hnh Android ng dng ngn chn tin nhn rỏc phỏt trin vi y cỏc tớnh nng c bn ca mt ng dng tin nhn trờn in thoi di ng nh gi, nhn tin nhn, qun lý tin nhn Ngoi b lc tin nhn rỏc s dng thut toỏn Naùve Bayes, ng dng ngn chn tin nhn rỏc cũn cú thờm cỏc cỏch ngn chn tin nhn rỏc nh thờm cỏc s in thoi vo danh sỏch Blacklist, cỏc t khúa xut hin tin nhn rỏc Khi ó xỏc nh c tin nhn rỏc, tin nhn n s khụng thụng bỏo cho ngi dựng, trỏnh nh hng n ngi dựng Sau ú ngi dựng cú th xem li ni dung tin nhn rỏc nh thng Bờn cnh ú, ng dng cũn cú chc nng gi ni dung tin nhn rỏc n u s 456, õy l tng i tip nhn v x lý tin nhn rỏc ca B Truyn thụng Thụng tin Vi t l phỏt hin tin nhn rỏc chớnh xỏc l trờn 90%, ng dng khỏ hu ớch i vi nhng thng xuyờn b tin nhn rỏc lm phin Hn ch Do thi gian thc hin lun khụng nhiu v hn ch v mt kin thc, cụng ngh nờn lun vn cũn mt hn ch ng dng cha x lý c vi ngụn ng Ting Vit Hin ti cỏc d liu u vo, d liu hun luyn v d liu test u c tin x lý loi b du iu ny dn n vic tỏch cỏc t b sai lch i vi cỏc t ghộp, cỏc cm t ting Vit õy l mt khú khn b nh ca cỏc thit b di ng cú hn, mun tỏch t ting Vit ũi hi phi cú mt b t in ting Vit vi y cỏc 44 t n v t ghộp T ú mi cú th nõng cao c t l chớnh xỏc ca thut toỏn Naùve Bayes S lng bn ghi b d liu hun luyn v d liu test ớt v mang tớnh cỏ nhõn Hin ti giao din v cỏc tựy chn ca ng dng s si, cha cú nhng tớnh nng mi hp dn Hng phỏt trin Trong tng lai, ng dng ngn chn tin nhn rỏc s h tr tỏch t ting Vit nhm tng t l phỏt hin tin nhn rỏc Tp d liu hun luyn s phong phỳ v a dng hn c v s lng ln ch ng dng ngn chn tin nhn rỏc cú th phỏt trin thờm c cỏc nn tng di ng khỏc nh iOS hay Windowphone phự hp vi nhiu i tng s dng Vic phỏt hin tin nhn rỏc s x lý trờn server, giỳp gim ti hiu nng cho ng dng chy trờn in thoi di ng 45 TI LIU THAM KHO Ti liu Ting Vit [1] Chớnh ph (2008) Ngh nh 90/2008/N-CP V chng th rỏc [2] Chớnh ph (2013) Ngh nh 174/2013/N-CP Quy nh x pht vi phm hnh chớnh lnh vc bu chớnh, vin thụng, cụng ngh thụng tin v tn s vụ tuyn in Ti liu Ting Anh [3] GFI Software (2011), Why Bayes filtering is the most effective anti-spam technology, GFI White Paper [4] Arnulf B.A Graf, Olivier Bousquet,Gunnar Ratsch, Bernhard Scholkopf (2008), Prototype Classification: Insights from Machine Learning, Max Planck Institute for Biological Cybernetics, Tubingen, Germany [5] Juniper Networks (2012), 2011 Mobile Threats Report, North Mathilda Avenue, Sunnyvale, USA [6] S M Kamruzzaman, Ahmed Ryadh Hasan (2010), Pattern Classification using Simplified Neural Networks with Pruning Algorithm Available: http://arxiv.org/abs/1009.4983 [7] Wei-Yin Loh (2010), Classification and regression trees, John Wiley & Sons, Inc [8] Yiming Yang, Xin Liu (1999), A re- examination of text categorization methods, ACM SIGIR conference Ti liu Web [9] http://kinhdoanh.vnexpress.net/tin-tuc/doanh-nghiep/gan-14-trieu-tin-nhanrac-phat-tan-moi-ngay-3358144.html, truy cp ngy 20 thỏng nm 2016 [10] https://wikipedia.org/wiki/SMS, truy cp ngy 25 thỏng nm 2016 [...]... NHN RC 1.1 Tng quan v tin nhn rỏc Tin nhn SMS Tin nhn SMS (Short Messaging Service hay Simple Message Service) l dch v nhn tin ngn SMS cho phộp gi v nhn bn tin ngn (tin nhn) gia cỏc mỏy in thoi di ng cng nh gia in thoi di ng v cỏc thit b cung cp thụng tin khỏc (PC, PDA, ) [10] Bn tin nhn SMS cú th bao gm cỏc ký t ch v s Mi tin nhn cú th cú di ti 160 ký t nu s dng bng ch cỏi Latin (mó 7 bit), hoc 70... th in t rỏc v tin nhn [1] Tin nhn rỏc cú th n thun l cỏc tin nhn cú tớnh cht qung cỏo cho mt sn phm, dch v c gi ti ngi nhn m cha cú s ng ý trc, hoc cỏc tin nhn cú ch ớch quy ri, gi mo, hoc la o Da vo tớnh cht, mc gõy hi cú th phõn loi tin nhn rỏc thnh: tin nhn qung cỏo, tin nhn la o, tin nhn gian ln, tin nhn cú s tham gia ca mó c, tin nhn vi phm chớnh sỏch ngi dựng 7 Tin nhn qung cỏo: dựng cho mc ớch... cỏi phi Latin (mó 16 bit) Tin nhn vn bn SMS h tr a ngụn ng ton cu, lm vic tt vi mi ngụn ng c h tr bi Unicode, bao gm ting rp, ting Trung Hoa, ting Nht v ting Triu Tiờn Tin nhn SMS cú rt nhiu cỏc u im Tin nhn SMS cú th c v gi bt c lỳc no Ngy nay hu ht mi ngi u cú mt in thoi di ng v luụn mang theo chỳng Vỡ vy chỳng ta cú th gi v nhn tin nhn mi lỳc mi ni, bt k l nh, vn phũng hay trờn xe buýt Tin nhn... gõy thit hi cho ngi dựng v ti chớnh Hỡnh 1.2 Tin nhn cú tớnh cht la o Tin nhn gi mo: õy l cỏc tin nhn gi mo mt s in thoi ca cỏ nhõn hoc t chc nhm la o ngi dựng 12 Hỡnh 1.3 Tin nhn gi mo Vi s bựng phỏt ca tin nhn rỏc c v s lng ln loi hỡnh tin nhn rỏc, nhu cu ngn chn tin nhn rỏc v cỏc gii phỏp ngn chn tin nhn rỏc ra i nh mt s tt yu nhm gim ti tỡnh trng trờn 1.3 Cỏc gii phỏp ngn chn tin nhn rỏc Gii phỏp... chn tin nhn rỏc trờn in thoi thụng minh, c bit l i vi tin nhn rỏc ti Vit Nam theo c hai hng t ng v ch ng, giỳp ngi dựng loi b tin nhn rỏc Xut phỏt t thc t v mc tiờu nh vy, tỏc gi thc hin ti lun vn cú tờn Xõy dng ng dng ngn chn tin nhn rỏc trờn thit b di ng gii quyt vn nờu trờn Tng quan v vn nghiờn cu Tin nhn rỏc l nhng tin nhn cú ni dung qung cỏo, rao vt, la o m ngi nhn khụng mong mun nhn c nhng tin. .. v di chuyn hng nghỡn ụla khi ti khon ca khỏch hng 8 Tin nhn vi phm chớnh sỏch ngi dựng, vi phm phỏp lut: l cỏc tin nhn gi khụng ỳng i tng Vớ d tin cú ni dung khiờu dõm gi ti tr em cha v thnh niờn 1.2 Thc trng tin nhn rỏc ti Vit Nam Thc trng tin nhn rỏc ti Vit Nam Vi s bựng n ca vin thụng cụng ngh thụng tin, con ngi cú th kt ni vi nhau qua tớch tc dự cỏch xa nhau ngn vn cõy s cng nh nm bt thụng tin. .. SMS ngay lp tc Hn na, vit v c tin nhn SMS khụng gõy bt k ting n no 6 Tin nhn SMS h tr 100% in thoi GSM v cú th trao i vi nhng mng khụng dõy khỏc Tin nhn SMS l mt cụng ngh rt ph bin Mi in thoi di ng GSM u h tr nú Ngi dựng khụng ch cú th trao i SMS vi nhng ngi s dng di ng cựng mng m cũn cú th trao i SMS vi nhng ngi s dng di ng ca cỏc nh cung cp dch v khỏc trờn ton th gii Tin nhn SMS l mt cụng ngh thớch... a ra cỏi nhỡn tng quỏt v tin nhn rỏc, khỏi nim tin nhn rỏc v thc trng tin nhn rỏc ti Vit Nam, ng thi a ra c cỏc phng phỏp 22 ngn chn tin nhn rỏc ngn chn tin nhn rỏc, tỏc gi s dng thut toỏn hc mỏy Naùve Bayes phõn loi tin nhn xem õu l tin nhn thng, õu l tin nhn rỏc Chi tit v thut toỏn Naùve Bayes c cp ti Chng 2 ca lun vn 23 CHNG 2 - P DNG THUT TON NAẽVE BAYES XY DNG B LC TIN NHN RC 2.1 C s lý thuyt... 08.38955226- 0969797999 Tin nhn cú tớnh cht d d khỏch hng: Cỏc tin nhn ny nhm mc ớch d d thuờ bao nhn tin ti mt u s no ú, nu thuờ bao nhn tin thỡ s b tr mt khon tin gp nhiu ln so vi tin nhn thụng thng Vớ d *Thong Bao SDT: 01684206048 Nam trong Danh Sach Duoc Nhan KetQua TruongQuay 6/8 *CamKet 100% trung voi KetQua TruongQuay XoSo *Nhan ngay: >>Soan: BL gui 6747 Tin nhn cú tớnh cht la o: Cỏc tin nhn ny nhm la... nhn c nhng tin nhn nh vy Vic phỏt tỏn tin nhn rỏc hin nay rt n gin Mi ngy cú n hng triu tin nhn rỏc c phỏt tỏn, trung bỡnh mi ngi dõn Vit Nam nhn hng chc tin nhn rỏc trong ngy õy l mt vn gõy nhc nhi i vi c ngi dựng v c cỏc c quan qun lý iu ngi dựng mong mun ú l khụng b lm phin bi cỏc tin nhn vi ni dung khụng mong mun nhn Cỏc ng dng chn tin nhn rỏc trờn cỏc thit b di ng ti Vit Nam cú khỏ nhiu Nhng a

Ngày đăng: 02/12/2016, 04:44

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[2] Chính phủ (2013). Nghị định 174/2013/NĐ-CP Quy định xử phạt vi phạm hành chính trong lĩnh vực bưu chính, viễn thông, công nghệ thông tin và tần số vô tuyến điệnTài liệu Tiếng Anh Sách, tạp chí
Tiêu đề: Nghị định 174/2013/NĐ-CP Quy định xử phạt vi phạm hành chính trong lĩnh vực bưu chính, viễn thông, công nghệ thông tin và tần số vô tuyến điện
Tác giả: Chính phủ
Năm: 2013
[3] GFI Software (2011), Why Bayes filtering is the most effective anti-spam technology, GFI White Paper Sách, tạp chí
Tiêu đề: Why Bayes filtering is the most effective anti-spam technology
Tác giả: GFI Software
Năm: 2011
[4] Arnulf B.A. Graf, Olivier Bousquet,Gunnar Ratsch, Bernhard Scholkopf (2008), Prototype Classification: Insights from Machine Learning, Max Planck Institute for Biological Cybernetics, Tubingen, Germany Sách, tạp chí
Tiêu đề: Prototype Classification: Insights from Machine Learning
Tác giả: Arnulf B.A. Graf, Olivier Bousquet,Gunnar Ratsch, Bernhard Scholkopf
Năm: 2008
[5] Juniper Networks (2012), 2011 Mobile Threats Report, North Mathilda Avenue, Sunnyvale, USA Sách, tạp chí
Tiêu đề: 2011 Mobile Threats Report
Tác giả: Juniper Networks
Năm: 2012
[6] S. M. Kamruzzaman, Ahmed Ryadh Hasan (2010), Pattern Classification using Simplified Neural Networks with Pruning Algorithm. Available:http://arxiv.org/abs/1009.4983 Sách, tạp chí
Tiêu đề: Pattern Classification using Simplified Neural Networks with Pruning Algorithm
Tác giả: S. M. Kamruzzaman, Ahmed Ryadh Hasan
Năm: 2010
[7] Wei-Yin Loh (2010), Classification and regression trees, John Wiley & Sons, Inc Sách, tạp chí
Tiêu đề: Classification and regression trees
Tác giả: Wei-Yin Loh
Năm: 2010
[8] Yiming Yang, Xin Liu (1999), A re- examination of text categorization methods, ACM SIGIR conferenceTài liệu Web Sách, tạp chí
Tiêu đề: A re- examination of text categorization methods
Tác giả: Yiming Yang, Xin Liu
Năm: 1999
[1] Chính phủ (2008). Nghị định 90/2008/NĐ-CP Về chống thư rác Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w