BËGIO�O DÖCV€ €OT„OTR×ÍNG„IH Å C Q U Y N H Ì N €OTHÀNGÅCB CH�CH PHT�O HI›NTINGIƒSÛDÖNGHÅCMY�O LUŠNV‹NTH„CSžKHOAHÅCMY�O TNH�CH B¼nhà n h N«m2022 BËGIO�O DÖCV€ €OT„OTR×ÍNG„IH Å C Q U Y N H Ì N €OTHÀNGÅC[.]
BËGIO O DƯCV€ €OT„OTR×ÍNG„IH Å C Q U YNHÌN €OTHÀNGÅCBCHCH PHT O HI›NTINGIƒSÛDƯNGHÅCMY O LUŠNV‹NTH„CSžKHOAHÅCMY O TCHNH B¼nhà n h -Nôm2022 BậGIO O DệCV OTOTRìNGIH C Q U YNHèN €OTHÀNGÅCBCHCH PHT O HI›NTINGIƒSÛDƯNGHÅCMY O Chuy¶nng nh:KHOAH Å C M O Y T CH N H M Âsố:8480101 Ngữớihữợngdăn: T S L – Q U A N G H Ị N G Líicamoan Tỉi xin camoan b i luªn v«nP h ¡ t h i » n t i n g i £ s û d ö n g h å c m ¡ y l k ¸ t quÊ nghiản cựu, tẳm hiu cừa tổi,ữủc thỹc hiằn dữợi sỹ hữợng dăn cừaTS.LảQuangHũng.CĂcnởidungtrẵchdăntứcĂcnghiảncựucừa cĂctĂcgiÊ khĂc m tổi trẳnh b y luên vôn n yÂữủc ghi ró nguỗn trongphƯnt iliằuthamkhÊo LớicÊmỡn LớiƯutiảntổixincÊmỡnsƠuscTS.LảQuangHũngv C ổLảThXinh,KhoaCổngnghằthổngtin,TrữớngÔihồcQuyNhỡn,  n h hữợng Ãt iv têntẳnhhữợngdăn,chbÊochotổitrongsuốtquĂtrẳnhthỹchiằnb iluênvôntốt nghiằpn y Tổi cụng xin trƠn trång c£m ìn c¡c Th¦y, Cỉ Khoa Cỉng ngh»thỉng tin, TrữớngÔi hồc Quy Nhỡn tên tẳnh giÊng dÔy, hữợng dănnghiảncựukhoahồcchotổitrongsuốtthớigiantheohồc tÔitrữớn gc ụngnhữtrongquĂtrẳnhl mluênvôn XincÊmỡncĂcanh,chv cĂcbÔnhồcviảnKhoahồcmĂytẵnh,nhỳngngữới Âgiúpù,ởngviảntinhthƯnv chiaskinhnghiằmquỵbĂugiúptổi vữủt qua cĂc khõ khôn, vữợng mc cõ th ho n th nh b i luên tốtnghiằpcừamẳnh Mc dũ cố gng, tổi tin rơng b i luên vôn cừa mẳnh cỏn nhiÃuthiáusõtv cõnhiÃunởidungcõthho nthiằntốthỡn.TổirĐtmongnhên ữủcnhỳngỵkiánĂnhgiĂ,phảbẳnhv gõpỵcừacĂcthƯycổ,anhchv cĂcbÔn Tõmtt SỹgiatôngtingiÊdữợisỹphĂttrincừamÔngxÂhởiÂl mÊnhhữngtiảucỹcánxÂhởiv edồaánsỹanto ncừacởngỗng.PhĂthiằntingiÊ thừ cổng khổng phũ hủp vợi lữủng lợn thổng tin mợiữủc tÔo ra,cbiằt l trản phữỡng tiằn truyÃn thổng x hởi Doõ c Ư n t h i ¸ t p h £ i thüc h i ằ n mởtcĂchtỹởngphĂthiằntingiÊphũhủpvợitẳnhhẳnhx ÂhởihiằntÔi TheocĂcnghiảncựuhiằntÔi,cõ2nhõmtiápcênchẵnhphĂthiằntingiÊ: (i)dỹatrảnnởidung(content-based)v (ii)dỹatrảnsỹlantruyÃn(propagationbased) PhĂt hiằn tin giÊ dỹa trản nởi dungĂnh giĂ ỵnhv /hoctẵnhxĂcthỹccừab ibĂobơngcĂchphƠntẵchnởidung.Trongkhi,phĂt hiằn tin gi£ düa tr¶n sü lan truy·n khai th¡c c¡ch b i bĂo lan truyÃntrảnmÔngxÂhởi Trong luên vôn n y, chúng tổi nghiản cựu cÊ hai cĂch tiáp cên trản Trữợchát,chúngtổitrẳnhb ytờngquanvÃtingiÊv phĂthiằntingiÊ.Tiáptheo,phĂtbiub itoĂnphĂthiằntingiÊdỹatrảnnởidungv ngỳcÊnhx Âhởi.Sauõ,chúngtổiÃxuĐtmổhẳnhv thỹchiằnthỹcnghiằmbơng3thuêttoĂn hồc mĂy, bao gỗm SVM, Naive Bayes,k-NN Kát quÊ cho thĐy cÊ bamổ hẳnhphƠnlợpÃucõởchẵnh xĂchỡn80% ChúngtổisỷdửngbởdỳliằuPolitiFactv GossipCopchựadỳliằuvợinởidungti ntựcv thổngtinngỳcÊnhxÂhởithỹcnghiằmmổhẳnhÃxuĐt Kát quÊ thỹc nghiằm cho thĐy rơng hƯu hát cĂc thuêt toĂn Ăp dửngvợi bở dỳ liằu ngỳ cÊnh x hởiÃu cho kát quÊoF t è t hìn ¡p d n g trảnbởdỳliằuchcõnởidung Tứkhõa :TingiÊ,phĂthiằntingiÊ,nởidung,ngỳcÊnhx Âhởi,lantruyÃn,hồcmĂy,mổhẳnhphƠnlợp Mửclửc Lớic am o a n LớicÊmỡn i ii Tõmtt iii DanhmửccĂcchỳviáttt vi DanhmửccĂchẳnhv vii Danhmưcc¡cb£ng viii Mð¦ u 1 Têngquan 1.1 Tingi£ 1.1.1 Giỵithi»u 1.1.2 Mëtsèkh¡ini»m 1.2 CĂcphữỡngphĂptiápcênphĂthiằntingiÊ 1.2.1 Düatr¶ntrithùc 1.2.2 Dỹatrảnvônphong 1.2.3 Düatr¶nsülantruy·n 11 1.2.4 Dỹatrảnở tincêy .14 1.3 C¡cnghi¶ncùuli¶nquan 14 1.4 Tờngkátchữỡng1 17 Ph¡thi»ntin gi£sûdưnghåcm¡y 18 2.1 ànhngh¾ab ito¡n 18 iv 2.2 Nëidungtinv ngúc£nhx¢hëi 20 2.2.1 Nëidungtin 20 2.2.2 Ngúc£nhx¢hëi 20 2.3 Sìl÷đcv·håcm¡y .21 2.3.1 Giỵithi»u 21 2.3.2 Thuªtto¡nNaveBayes 24 2.3.3 Thuªtto¡nSVM .27 2.3.4 Thuªtto¡nk-NN 28 2.4 MổhẳnhphƠnlợp .29 2.5 pO dưngmëtsèthuªtto¡nv oph¡thi»ntingi£ 30 2.5.1 Thuªtto¡nNaveBayes 30 2.5.2 Thuªtto¡nSVM .31 2.5.3 Thuªtto¡nk-NN 32 2.6 Tờngkátchữỡng2 32 Thücnghi»m 33 3.1 Dúli»u 33 3.2 C i° t 35 3.3 KátquÊv thÊoluên .37 Kátl uê n 40 TiliằuthamkhÊo 41 v DanhmửccĂcchỳviáttt BoW CNN k-NN Bago fW ords ConvolutionalNeuralNetwork kN earestN eighborsLR ML NB POS PCFG LinearR egression MachineLearning NaiveBayes PartO fS peech ProbabilisticC ontextF reeG rammarRF RandomForest RNN RecurrentN euralN etworkRST RhetoricalS tructureT heorySVM SupportVectorMachineTF TermFrequency TF-IDF TermFrequency-InverseDocumentFrequency Danhs¡chh¼nhv³ 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 2.1 2.2 2.3 2.4 3.1 3.2 3.3 3.4 VỏngớicừatingiÊv phữỡngphĂpphĂthiằn VẵdửxĂcminhthổngtindỹatrảnchuyảngia[45] VẵdửxĂcminhthổngtindỹatrảncởngỗ n g [45] VẵdửvÃcĐutrúccƠycúphĂp[45] 10 BiudiạnsỹlantruyÃntintheodÔngcƠy[45] .12 VẵdửmÔngỗ n g nhĐt[45] 13 Vẵ dử mÔngkhổngỗ n g n h Đ t [45] 13 Vẵ dử mÔngkhổngỗ n g n h Đ t [45] 14 Mæt£b ito¡n .19 Mỉh¼nhhåcm¡ycâgi¡ms¡t 22 Minhhåathuªtto¡nSVM 27 Mổhẳnhà xuĐt .30 Mëtph¦ndúli»uGossipCop 34 Minhhồanew_body(Nởidungchẵnhcừatin) 35 Minhhồauser_ids(nhdanhcừacĂcngữớidũng) 35 Sos¡nhëo F tr¶nbëdúli»uPolitiFact(C),PolitiFact(SC) v PolitiFact(C+SC) 38 3.5 Sos¡nhëo F tr¶n bëdúli»uGossipCop(C),GossipCop (SC)v GossipCop(C+SC) 39 1