phát hiện tin giả sử dụng học máy

55 8 0
phát hiện tin giả sử dụng học máy

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BË GI�O DÖC V� ��O T�O TR×ÍNG ��I HÅC QUY NHÌN ��O THÀ NGÅC B�CH PH�T HI�N TIN GI� SÛ DÖNG HÅC M�Y LU�N V�N TH�C S� KHOA HÅC M�Y T�NH B¼nh �ành N«m 2022 BË GI�O DÖC V� ��O T�O TR×ÍNG ��I HÅC QUY NHÌN[.]

BË GIO DƯC V€ €O T„O TR×ÍNG „I HÅC QUY NHÌN €O THÀ NGÅC BCH PHT HI›N TIN GIƒ SÛ DÖNG HÅC MY LUŠN V‹N TH„C Sž KHOA HÅC MY TNH Bẳnh nh - Nôm 2022 Bậ GIO DệC V €O T„O TR×ÍNG „I HÅC QUY NHÌN €O THÀ NGÅC BCH PHT HI›N TIN GIƒ SÛ DÖNG HÅC MY KHOA HC MY TNH M số : 8480101 Chuyản ngnh : Ngữới hữợng dăn : TS L QUANG HềNG Lới cam oan Tổi xin cam oan bi luên vôn PhĂt hiằn tin giÊ sỷ dửng hồc mĂy l kát quÊ nghiản cựu, tẳm hiu cừa tổi, ữủc thỹc hiằn dữợi sỹ hữợng dăn cừa TS Lả Quang Hũng CĂc nởi dung trẵch dăn tứ cĂc nghiản cựu cừa cĂc tĂc giÊ khĂc m tổi trẳnh by luên vôn ny  ữủc ghi ró nguỗn phƯn ti liằu tham khÊo i Lới cÊm ỡn Lới Ưu tiản tổi xin cÊm ỡn sƠu sưc TS Lả Quang Hũng v Cổ Lả Th Xinh, Khoa Cổng nghằ thổng tin, Trữớng Ôi hồc Quy Nhỡn,  nh hữợng à ti v tên tẳnh hữợng dăn, ch bÊo cho tổi suốt quĂ trẳnh thỹc hiằn bi luên vôn tốt nghiằp ny Tổi cụng xin trƠn trồng cÊm ỡn cĂc ThƯy, Cổ Khoa Cổng nghằ thổng tin, Trữớng Ôi hồc Quy Nhỡn  tên tẳnh giÊng dÔy, hữợng dăn nghiản cựu khoa hồc cho tổi suốt thới gian theo hồc tÔi trữớng cụng nhữ quĂ trẳnh lm luên vôn Xin cÊm ỡn cĂc anh, ch v cĂc bÔn hồc viản Khoa hồc mĂy tẵnh, nhỳng ngữới  giúp ù, ởng viản tinh thƯn v chia s kinh nghiằm quỵ bĂu giúp tổi vữủt qua cĂc khõ khôn, vữợng mưc  cõ th hon thnh bi luên tốt nghiằp cừa mẳnh Mc dũ  cố gưng, tổi tin rơng bi luên vôn cừa mẳnh cỏn nhiÃu thiáu sõt v cõ nhiÃu nëi dung câ thº ho n thi»n tèt hìn Tỉi r§t mong nhên ữủc nhỳng ỵ kián Ănh giĂ, phả bẳnh v gõp ỵ cừa cĂc thƯy cổ, anh ch v cĂc bÔn ii Tõm tưt Sỹ gia tông tin giÊ dữợi sỹ phĂt trin cừa mÔng x hởi  lm Ênh hững tiảu cỹc án x hởi v e dồa án sỹ an ton cừa cởng ỗng PhĂt hiằn tin giÊ thừ cổng khổng phũ hủp vợi lữủng lợn thổng tin mợi ữủc tÔo ra, c biằt l trản phữỡng tiằn truyÃn thổng x hởi Do õ cƯn thiát phÊi thüc hi»n mët c¡ch tü ëng ph¡t hi»n tin gi£  phũ hủp vợi tẳnh hẳnh x hởi hiằn tÔi Theo cĂc nghiản cựu hiằn tÔi, cõ nhõm tiáp cên chẵnh  phĂt hiằn tin giÊ: (i) dỹa trản nëi dung (content-based) v  (ii) düa tr¶n sü lan truy·n (propagation-based) Ph¡t hi»n tin gi£ düa tr¶n nëi dung ¡nh giĂ ỵ nh v/hoc tẵnh xĂc thỹc cừa bi bĂo bơng cĂch phƠn tẵch nởi dung Trong khi, phĂt hiằn tin gi£ düa tr¶n sü lan truy·n khai th¡c c¡ch bi bĂo lan truyÃn trản mÔng x hởi Trong luên vôn ny, chúng tổi nghiản cựu cÊ hai cĂch tiáp cên trản Trữợc hát, chúng tổi trẳnh by tờng quan v· tin gi£ v  ph¡t hi»n tin gi£ Ti¸p theo, ph¡t biºu b i to¡n ph¡t hi»n tin gi£ düa tr¶n nëi dung v  ngú c£nh x¢ hëi Sau â, chóng tổi à xuĐt mổ hẳnh v thỹc hiằn thỹc nghiằm bơng thuêt toĂn hồc mĂy, bao gỗm SVM, Naive Bayes, k -NN Kát quÊ cho thĐy cÊ ba mổ hẳnh phƠn lợp Ãu cõ ở chẵnh xĂc hỡn 80% Chóng tỉi sû dưng bë dú li»u PolitiFact v  GossipCop chùa dú li»u vỵi nëi dung tin tùc v  thỉng tin ngỳ cÊnh x hởi  thỹc nghiằm mổ hẳnh à xuĐt Kát quÊ thỹc nghiằm cho thĐy rơng hƯu hát cĂc thuêt toĂn Ăp dửng vợi bở dỳ liằu ngỳ cÊnh x hởi Ãu cho kát quÊ o F1 tèt hìn ¡p dưng tr¶n bë dú li»u ch¿ câ nëi dung Tø khâa : Tin gi£, ph¡t hi»n tin gi£, nëi dung, ngú c£nh x¢ hëi, lan truy·n, hồc mĂy, mổ hẳnh phƠn lợp Mửc lửc Lới cam oan i Líi c£m ìn ii Tâm t­t iii Danh mưc c¡c vi¸t t­t vi Danh mưc c¡c hẳnh v vii Danh mửc cĂc bÊng viii M Ưu Têng quan 1.1 1.2 1.3 1.4 Tin gi£ 1.1.1 Giỵi thi»u 1.1.2 Mët sè kh¡i ni»m CĂc phữỡng phĂp tiáp cên phĂt hi»n tin gi£ 1.2.1 Düa tr¶n tri thùc 1.2.2 Dỹa trản vôn phong 1.2.3 Düa tr¶n sü lan truy·n 1.2.4 Düa tr¶n ë tin cªy C¡c nghi¶n cùu li¶n quan Têng kát chữỡng Ph¡t hi»n tin gi£ sû döng håc m¡y 2.1 ành ngh¾a b i to¡n iv 3 7 11 14 14 17 18 18 2.2 2.3 2.4 2.5 2.6 Nëi dung tin v  ngú c£nh x¢ hëi 2.2.1 Nëi dung tin 2.2.2 Ngú c£nh x¢ hëi Sì l÷đc v· håc m¡y 2.3.1 Giỵi thi»u 2.3.2 Thuªt to¡n Nave Bayes 2.3.3 Thuªt to¡n SVM 2.3.4 Thuªt to¡n k -NN Mổ hẳnh phƠn lỵp p döng mët sè thuªt to¡n v o ph¡t 2.5.1 Thuªt to¡n Nave Bayes 2.5.2 Thuªt to¡n SVM 2.5.3 Thuªt to¡n k -NN Tờng kát chữỡng hi»n tin 20 20 20 21 21 24 27 28 29 gi£ 30 30 31 32 32 Thüc nghiằm 33 Kát luên Ti liằu tham khÊo 40 41 3.1 3.2 3.3 Dú li»u C i °t K¸t qu£ v  th£o luªn v 33 35 37 Danh mưc c¡c vi¸t t­t BoW CNN k -NN LR ML NB POS PCFG RF RNN RST SVM TF TF-IDF Bag of Words Convolutional Neural Network k Nearest Neighbors Linear Regression Machine Learning Naive Bayes Part Of Speech Probabilistic Context Free Grammar Random Forest Recurrent Neural Network Rhetorical Structure Theory Support Vector Machine Term Frequency Term Frequency - Inverse Document Frequency vi Danh s¡ch h¼nh v³ 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 Váng íi cõa tin giÊ v phữỡng phĂp phĂt hiằn Vẵ dử xĂc minh thổng tin dỹa trản chuyản gia [45] Vẵ dử xĂc minh thổng tin dỹa trản cởng ỗng [45] Vẵ dử và cĐu trúc cƠy cú phĂp [45] Biºu di¹n sỹ lan truyÃn tin theo dÔng cƠy [45] Vẵ dử mÔng ỗng nhĐt [45] Vẵ dử mÔng khổng ỗng nhĐt [45] V½ dư mÔng khổng ỗng nhĐt [45] 10 12 13 13 14 2.1 2.2 2.3 2.4 Mæ t£ b i to¡n Mỉ h¼nh håc m¡y câ gi¡m s¡t Minh håa thuªt to¡n SVM Mổ hẳnh à xuĐt 19 22 27 30 3.1 3.2 3.3 3.4 Mët ph¦n dú li»u GossipCop Minh håa new_body (Nëi dung ch½nh cõa tin) Minh håa user_ids (ành danh cõa c¡c ng÷íi dịng) So s¡nh ë o F1 tr¶n bë dú li»u PolitiFact(C), PolitiFact(SC) v  PolitiFact(C+SC) So s¡nh ë o F1 tr¶n bë dú li»u GossipCop(C), GossipCop (SC) v  GossipCop (C+SC) 34 35 35 3.5 vii 38 39 Danh s¡ch b£ng 1.1 So s¡nh c¡c kh¡i ni»m li¶n quan v· tin tùc gi£ mÔo 2.1 Dỳ liằu huĐn luyằn và thới tiát 26 3.1 3.2 3.3 3.4 3.5 Mæ t£ dú li»u thüc nghi»m Biºu di¹n Confusion Matrix K¸t qu£ thüc nghi»m tr¶n bë dú li»u ch¿ câ nëi dung tin Kát quÊ thỹc nghiằm trản bở dỳ liằu ch cõ ngỳ cÊnh x hởi Kát quÊ thỹc nghiằm trản bở dỳ liằu kát hủp nởi dung tin v ngú c£nh x¢ hëi 33 36 37 37 viii 38 ... thổng tin dỹa trản chuyản gia [45] Hẳnh 1.3: Vẵ dử xĂc minh thổng tin dỹa trản cởng ỗng [45] Trong xĂc minh thổng tin tỹ ởng, vợi lữủng thổng tin tÔo ngy mởt lợn thẳ viằc xĂc minh thổng tin thõ... tẳm kiám v xem tin tực tứ phữỡng ti»n truy·n thỉng x¢ hëi hìn l  c¡c tê chùc bĂo chẵ truyÃn thống Trong õ, vợi lữủng thổng tin ngy cng quĂ tÊi thẳ viằc phƠn nh giỳa tin úng v tin giÊ l khõ... tiáp cên  phĂt hi»n tin gi£, mët sè nghi¶n cùu li¶n quan v· ph¡t hi»n tin gi£ ˆ Ch÷ìng PHT HI›N TIN GIƒ SÛ DƯNG HÅC MY: Chóng tỉi tr¼nh b y chi tiát bi toĂn phĂt hiằn tin giÊ tữỡng ựng vợi

Ngày đăng: 24/11/2022, 22:56

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan