(Luận văn) nghiên cứu giải pháp phục vụ công tác đánh giá tin tức trên một số trang mạng xã hội trong phạm vi tỉnh ninh bình

76 0 0
(Luận văn) nghiên cứu giải pháp phục vụ công tác đánh giá tin tức trên một số trang mạng xã hội trong phạm vi tỉnh ninh bình

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - lu NGUYỄN THỊ THANH HƯỜNG an n va p ie gh tn to NGHIÊN CỨU GIẢI PHÁP PHỤC VỤ CÔNG TÁC ĐÁNH GIÁ TIN TỨC TRÊN MỘT SỐ TRANG MẠNG XÃ HỘI TRONG PHẠM VI TỈNH NINH BÌNH d oa nl w u nf va an lu ll LUẬN VĂN THẠC SĨ KỸ THUẬT oi m (Theo định hướng ứng dụng) z at nh z m co l gm @ an Lu HÀ NỘI - 2020 n va ac th si HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - lu NGUYỄN THỊ THANH HƯỜNG an n va p ie gh tn to NGHIÊN CỨU GIẢI PHÁP PHỤC VỤ CÔNG TÁC ĐÁNH GIÁ TIN TỨC TRÊN MỘT SỐ TRANG MẠNG XÃ HỘI TRONG PHẠM VI TỈNH NINH BÌNH d oa nl w CHUYÊN NGÀNH : MÃ SỐ: HỆ THỐNG THÔNG TIN 8.48.01.04 u nf va an lu LUẬN VĂN THẠC SĨ KỸ THUẬT ll oi m (Theo định hướng ứng dụng) z at nh z @ m co l gm NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TSKH HOÀNG ĐĂNG HẢI an Lu n va HÀ NỘI - 2020 ac th si i LỜI CAM ĐOAN Tôi xin cam đoan Luận văn thạc sĩ “Nghiên cứu giải pháp phục vụ công tác đánh giá tin tức số trang mạng xã hội phạm vi tỉnh Ninh Bình”, cơng trình nghiên cứu c a riêng tơi Các số li u thông tin tr ch nđ Luận văn n y ho n to n ch nh xác trung th c tin cậy; k t c trình h c tập nghiên cứu c a gi p đ Giáo viên h ng ản th n v s h ng cs đ cl ụng o n tận tình c a n PGS.TSKH Ho ng Đăng Hải lu Hà Nội, ngày 10 tháng 05 năm 2020 Tác giả luận văn an n va tn to p ie gh Nguyễn Thị Thanh Hường d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si ii LỜI CẢM ƠN Để th c hi n v ho n th nh đề t i nghiên cứu khoa h c n y em nhận hỗ tr gi p đ nh quan t m động viên từ nhiều quan tổ chức v đ c s cá nhân Nghiên cứu khoa h c đ c ho n th nh a s tham khảo h c tập kinh nghi m từ k t nghiên cứu liên quan sách áo chuyên ng nh c a nhiều tác giả tr ờng Đại h c tổ chức nghiên cứu tổ chức ch nh trị…Đặc i t l s h p tác c a cán ộ phòng nghiên cứu v phát triển c a Trung t m công ngh thông tin v lu an Bình s truyền thơng - Sở Thơng thông tin v truyền thông tỉnh Ninh gi p đ tạo điều ki n vật chất v tinh thần từ ph a gia đình ạn è v n va đồng nghi p c tiên em xin g tn to Tr gh Hải, ng ời tr c ti p h ng ng n khoa h c nh nhiều thời gian n em suốt trình th c hi n nghiên cứu v công sức ho n th nh đề t i p ie h i lời cảm ơn s u sắc đ n Thầy PGS.TSKH Ho ng Đăng nghiên cứu khoa h c tr ờng Quốc t to n thể thầy cô khoa Cơng ngh d B u Chính Viễn Thơng sở I - H an em trình h c tập v va ki n thức quý áu gi p đ nhiều cố gắng nh tránh khỏi thi u s t ll nghi p v ời quan t m đ n đề t i ti p tục c Em k nh mong Quý thầy cô chuyên gia đồng g p gi p đ để đề t i đ c ho n thi n z Tr n tr ng cảm ơn! ý ki n đ ng z at nh è ng oi m ạn nghiên cứu ng đề t i nghiên cứu khoa h c n y không u nf Tuy c Nội tận tình truyền đạt lu Vi n Cơng ngh Khoa sau đại h c v thông tin, tr ờng H c oa Quan h nl w Em xin tr n tr ng cảm ơn Ban giám hi u nh @ gm Tác giả m co l Nguyễn Thị Thanh Hường an Lu n va ac th si iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii DANH MỤC HÌNH iv MỞ ĐẦU CHƯƠNG I: TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU 1.1 Các nguy lĩnh v c quản lý trang thông tin n t đặc i t l trang mạng xã hội Face ook phạm vi tỉnh Ninh Bình lu Công tác nghi p vụ quản lý nội ung trang thông tin n t v trang mạng xã hội an va 1 Quản lý trang thông tin n t tỉnh Ninh Bình n 1 Một số công tác nghi p vụ quản lý nội ung trang thông tin n t v trang mạng xã hội p ie gh tn to 1.3 Một số mô hình ph ơng pháp thu thập thơng tin kiểm sốt nội ung trang mạng xã hội w 1.3 Khái ni m v đặc điểm thông tin mục đ ch thu thập thông tin oa nl 1.3.2 Khái ni m đặc điểm v lý thông tin d 1.3.3 Khái ni m đặc điểm x lu an 1.3.4 Ph ơng pháp thu thập thông tin 10 u nf va Các ph ơng pháp x lý thông tin 13 ll 1.3.6 Vai trò c a vi c thu thập v x lý thông tin 19 m oi Kỹ thuật thu thập thông tin đánh giá phần nội ung trang mạng xã hội 21 1.4.2 Các z at nh Kỹ thuật thu thập thông tin 22 c thu thập thông tin 23 z 1.4.3 Kĩ x lý thông tin 24 @ m co l gm Nghiên cứu mơ hình ph ơng pháp kỹ thuật liên quan đ n thu thập thông tin đánh giá phần nội ung trang mạng xã hội 26 an Lu Ph ơng pháp x y ng mơ hình h thống hỗ tr quản lý trang mạng xã hội 28 Nhận i n thông tin xấu độc: 10 iểu hi n 28 n va ac th si iv Các c x lý thông tin xấu độc 29 Một số vi phạm th ờng gặp v k t x lý thời gian gần đ y 30 Những kh khăn v ng mắc vi c thu thập thông tin v x lý vi phạm 30 Nhu cầu nghi p vụ quản lý nội ung thông tin trang mạng xã hội 31 CHƯƠNG II: HỆ THỐNG HỖ TRỢ QUẢN LÝ TRANG MẠNG XÃ HỘI VÀ TRANG THÔNG TIN ĐIỆN TỬ TẠI TRUNG TÂM CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THƠNG NINH BÌNH 33 Khái quát ki n tr c chung c a trang mạng xã hội .33 lu 1 Khái quát thông tin môi tr ờng mạng Vi t Nam 48 an 2 Ph ơng pháp thu thập thông tin từ trang mạng xã hội 49 va n 2.2.1 Ph ơng pháp th c nghi m 46 Xác định từ kh a cần thu thập 51 p ie gh tn to Ph ơng pháp thu thập thông tin từ trang mạng xã hội c liên quan t i tỉnh Ninh Bình 49 oa nl w Ph ơng pháp thu thập thông tin ằng ph ơng pháp chuẩn h a cấu tr c Mạng Xã hội We 51 d CHƯƠNG III: MỘT SỐ THỬ NGHIỆM 60 ụng công cụ 60 an lu 31S u nf va 1 Công cụ 60 C i đặt sản phẩm 60 ll oi m Sản phẩm phần mềm 60 2 Cấu tr c z at nh Các chức ch nh c a phần mềm 60 ảng ữ li u 61 z 3 Một số giao i n ch nh c a phần mềm 64 @ gm 3.3 Đánh giá k t th nghi m Lỗi! Thẻ đánh dấu không xác định l KẾT LUẬN .Lỗi! Thẻ đánh .ấu không đ c xác định m co DANH MỤC CÁC TÀI LIỆU THAM KHẢOLỗi! Thẻ đánh ấu không đ định c xác an Lu n va ac th si v DANH MỤC HÌNH Hình 1 Sơ đồ công tác nghi p vụ hi n Hình Các c ản x lý thông tin định t nh 15 Hình Sơ đồ quản lý trang mạng xã hội Face ook v trang thông tin n t 20 Hình Sơ đồ tổng quát công tác thu thập thông tin 21 Hình Sơ đồ chức thống kê trang mạng xã hội Face ook v trang thông tin n t 21 Hình Sơ đồ kỹ thuật thu thập thông tin 22 lu an n va Hình Sơ đồ c thu thập thông tin 23 Hình Sơ đồ c x lý thông tin xấu độc 29 ụng 34 tn to Hình Ki n tr c ph n l p ứng gh Hình 2 Ki n tr c mơ đun chức c a mạng xã hội 35 p ie Hình Ki n tr c c a trang mạng xã hội nhỏ 36 w Hình Ki n tr c c a trang mạng xã hội l n 37 oa nl Hình 5: Mơ hình h thống 50 d Hình 6: Chuẩn h a cấu tr c Html 55 ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si MỞ ĐẦU Trang mạng xã hội Face ook l trang We đặc i t tập h thông tin c t nh chất cá nh n nh m đ a thông tin p nội ung i m i ch đề liên quan đ n ý ki n quan điểm ình luận cá nh n… Trang mạng xã hội Face ook trở nên phổ i n Tuy nhiên triển lan rộng c a hình thức chia sẻ thông tin đ n số l mạng vi c kiểm soát nội ng l n ng ời ùng ung trang mạng xã hội Face ook trở th nh lu vấn đề l n đối v i quan quản lý Nhiều an Facebook mang m u sắc ch nh trị va n ung đồi trụy mê t n… c o s phát ản tin trang mạng xã hội c nội văn h a không l nh mạnh tiêu c c nội ảnh h ởng không nhỏ đ n xã hội Do đ cần c in tn to pháp giám sát kiểm tra c a quan quản lý Song song v i ch nh sách pháp i n pháp v gh luật quản lý cần c h thống kỹ thuật hỗ tr nhanh chóng phát p ie hi n nội ung thơng tin xấu độc vai trị quan tr w Công tác phân công theo dõi thông tin c thông tin v oa nl hoạt động Trung tâm Công ngh truyền thông c a Sở thông tin v nhi m vụ m d truyền thông tỉnh Ninh Bình đ y l đơn vị Trung t m đ lu an hàng năm Công tác n y địi hỏi nhiều thời gian cơng sức v c giao t nh kỷ luật cao thông tin; H thống quản lý u nf va V i s phát triển không ngừng c a công ngh công tác r soát đ ng đối v i c phát triển để hỗ tr v hiên đại h a công tác phân công, theo ll giám sát công vi c Trung t m Công ngh thông tin v truyền thông v oi m õi v ứng ụng tin h z at nh quan t m t i vi c đầu t c Công tác ph n công công vi c ằng kỹ v số công cụ đơn lẻ nên đ gm nhiều thời gian Công tác m co công nên không hi u Qua an Lu c th c hi n th số li u v l công c nhiều kh khăn o không đ thống nhất; Công tác tổng h p áo cáo vất vả v theo õi giám sát công vi c đ thông tin c a lãnh @ đạo phòng đ ơc n ng cao Tuy nhiên vi c th c hi n th i t Công ngh z chức th c hiên nghiêm t c Nhận thức hiểu c cán ộ công chức viên n va ac th si trình h c tập v tìm hiểu em nghiên cứu giải pháp phục vụ công tác đánh giá tin tức số trang mạng xã hội phạm vi tỉnh Ninh Bình CHƯƠNG I: TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU Trên th gi i hi n Vi t Nam đứng thứ 80 ứng ụng công ngh thơng tin tức l mức trung ình Nh ng an to n thông tin ch ng ta đứng thứ 100 c nghĩa l i t quan t m v i mức trung ình y u Đ y l giải pháp cụ thể ch ng ta c chặt chẽ v thc trạng cần đặc quy t li t N u ảo đảm tốt an ninh mạng sở vững để ngăn chặn v x lý kịp thời hi u cao thông tin xấu độc lu an Hi n vi c theo õi kiểm soát nội n va gần 2000 trang tin n t c ch tn to truyền thông tỉnh Ninh Bình v Trên sở đ v sở hữu l ng ời Ninh Bình Sở thơng tin v Sở thông tin v truyền thông khác ch y u công xuất phát từ nhu cầu nghi p vụ th c t đề t i nghiên cứu p ie gh th c hi n ằng hình thức th ung trang mạng xã hội Face ook c a luận văn đặt l : “Nghiên cứu giải pháp phục vụ công tác đánh giá tin tức oa nl w số trang mạng xã hội phạm vi tỉnh Ninh Bình” l điều cần thi t d 1.1 Các nguy cơ, lĩnh vực quản lý trang thông tin điện tử đặc biệt lu u nf va an trang mạng xã hội Facebook phạm vi tỉnh Ninh Bình đặc i t trang ll Hi n trang thông tin n t m n tội phạm oi Face ook tỉnh Ninh Bình th l c thù địch v z at nh th nh công cụ đắc l c cho hoạt động phá hoại t hoạt động phạm tội nh sau: mạng xã hội t ởng “ iễn i n hịa inn ình” v z  Mạng xã hội trở thành công cụ để lực thù địch lợi dụng gm @ l Các th l c thù địch phản động lập nhiều trang mạng xã hội tập trung m co xuyên tạc n i xấu ch nghĩa Mác - Lênin t t ởng Hồ Ch Minh v vai trò lãnh đạo c a Đảng Cộng sản Vi t Nam Chúng th ờng xuyên đăng tải i vi t v i lời lẽ chống an Lu Đảng Tuyên truyền xuyên tạc ch tr ơng ch nh sách c a Đảng Nh n va ac th si n c lãnh đạo địa ph ơng để đăng tải i vi t c thông tin sai l ch suy iễn L i ụng sơ hở thi u s t triển khai ch nh sách phát triển kinh t - xã hội c a ch nh quyền cấp k ch động luận nhân dân, hình thành tâm lý ất mãn, chống đối  Mạng xã hội làm gia tăng nguy lộ lọt bí mật nhà nước Nhiều ng ời c th i quen th ch chia sẻ thông tin sống công vi c động c a quan đơn vị lên mạng xã hội Trong đ v mật nh n lộ l t c ch a cao trách nhi m ý thức lu an n va h ởng đ n giá trị văn h a tốt đẹp c ng đăng tải lại t i li u mật n i xấu ch nh quyền mạng xã hội ảnh a cộng đồng Hoạt động tung tin đồn ng l n ng ời quan t m theo giật luận Một số vụ vi c thu õi hình th nh t m lý đám đông áp l c gh tn to g n c u “like” mạng xã hội g y hoang mang h t số l ảo ảo mật ch a tốt L i ụng vụ mật nh n c internet nhiều đối t mạng xã hội tạo iễn đ n xuyên tạc hiểu i t công tác hoạt luận tạo giá trị l ch lạc phức tạp văn h a ứng x p ie  Mạng xã hội trở thành công cụ để tội phạm lợi dụng hoạt động c đối t ng phạm tội nl w V i đặc t nh ảo mạng xã hội th ờng xuyên đ kinh t để k t ạn l m quen sau đ d lừa đảo chi m đoạt tiền t i sản; ti n h nh đánh cắp mật va chi m giữ quyền kiểm soát t i khoản trái phép để thu thập thông tin cá mật t i ch nh tìm cách trục l i u nf nhân, thông tin cần phải c ll Từ vấn đề nêu nhi m vụ đặt l m ng hi u vi c quản lý mạng xã hội Ch z at nh tác động xấu từ mạng xã hội đ n an ninh trật t z vô hi u h a trang mạng xã hội c a đối t ng c h nh vi tuyên truyền chống n c Tăng c ờng đấu tranh v i loại tội phạm mạng cao l i tội phạm ụng mạng xã hội để hoạt động Ch động thu thập l ụng công ngh công gm s Kịp thời phát hi n @ phá Đảng Nh s quản lý định động phòng ngừa ngăn chặn oi h tạo t i khoản ảo an lu ma t y l i ụng để hoạt động v i th đoạn nh oa hình s i quan cơng an can thi p v o vụ vi c vi phạm c a đối t ng để kịp thời x lý Thông tin tuyên truyền định h ng an Lu luận đấu tranh l m thất ại m co thông tin, ch ng phối h p v m m u hoạt động c a th l c thù địch n va ac th si 53 file mặc định N u điều n y l đ ng ch ng c thể đ c lấy ằng cách s ụng URL sở Bước 4: Loại bỏ từ dừng chuyển dạng thức từ sang dạng gốc Khi uy t trang we URL m trang đ để tr ch thông tin nội ung để t nh điểm trỏ t i thông th ờng ta nên loại ỏ từ đ c ùng th ờng xuyên hay từ ừng (stopwor s) nh „it‟ hay „can‟ Ti ng Anh lý vi c loại từ ỏ từ ừng khỏi văn ản đ c g i l stoplisting Ngo i vi c x ừng ta cần lấy từ gốc c stemming chuẩn h a từ lu ạng gốc hay stem V ằng cách đ Ti n trình x a từ c văn lý ản Quá trình c k t hình thái c a từ th nh từ an ụ: từ connect connecte hay connection đ c đ a n va ạng connect Các ch ơng trình theo chuẩn URL c a HTML c thể đánh giá giá trị c a gh tn to Bước 5: Xây dựng thẻ HTML ie URL từ nội ung trang we c điều n y cần s p HTML m n thuộc v o Để l m đ c lấy l m gốc c a c y thẻ khác v Đáng ti c l nhiều trang we c an lu ụ thẻ đầu c thể không c thẻ đ ng tiêu chuẩn c tiền x lý để chuẩn h a văn cấu tr c khơng chuẩn q trình x oi z at nh lý n y g il ao gồm vi c chèn thêm thẻ c lồng l m (ti ying) trang ị thi u v x p lại thứ t thẻ cần thi t để ánh xạ nội ung c a gm cha uy Ch ý vi c ph n t ch cấu ảo t nh to n vẹn n t c m co l ph n t ch nên cấu tr c c y c a thẻ tr c DOM cần thi t n u c ý định s ị ản HTML c @ trang v o cấu tr c c y để đảm z trang Vi c l m trang HTML l ụng cấu tr c c a trang HTML cho an Lu ph n t ch phức tạp cấu tr c HTML không chuẩn a cấu tr c (structure-based m criteria) th ờng cần c từ đ text tạo th nh thẻ không đ ll thi u trang HTML Do đ HTML N i văn ản Trong nhiều tr ờng h p thẻ < o y> u nf cách h p lý va V d oa HTML nguồn Thẻ đ n t c a c y ụng c y thẻ cấu cấu tr c c y c a thẻ t ơng ứng v nl w trúc DOM c a trang HTML ằng cách xem xét ngữ cảnh c a thẻ Còn n u vi c tr ch xuất thẻ HTML cần liên k t n va ac th si 54 trang từ kh a v vị tr xuất hi n c a ch ng trang we cần s ụng ộ uy t HTML thông th ờng Các ộ uy t n y ngơn ngữ lập trình x lý V ụ: Projects lu Projects an n va
  • NICE The network infrastructure for combinatorial gh tn to LAMP Linkage analysis with multiple processors.
  • ie exploration.
  • p AMASS A DNA sequence assembly algorithm.
  • nl w
  • DALI A distributed, adaptive, first-order logic u nf va an lu
d oa theorem prover. ll Ta chuẩn h a theo cấu tr c html sau: oi m z at nh z m co l gm @ an Lu n va ac th si 55 lu an n va gh tn to Hình 2.6: Chuẩn hóa cấu trúc Html p ie Bước 6: Sử dụng hàm API Facebooks để đọc liệu y u để lấy ữ li u v o v w Face ook API l cách ch HTTP API a mức độ thấp m ạn c oa nl Face ook Đ l khỏi đồ thị c a loạt nhi m d truy vấn ữ li u g i c u chuy n m i tải lên hình ảnh v lu an vụ khác m ứng ụng c thể cần phải l m ùng ph ơng pháp đồ thị h a: ll u nf va Khi ùng API Face ook ta thể s ụng để oi m z at nh z m co l gm @ an Lu n va ac th si 56 Cụ thể: API Face ook đ c đặt tên theo ý t ởng c a "đồ thị" l đại i n c a thông tin Face ook ao gồm: • No e (n t): Một cách ản l "thứ" ng ời ta s ụng hình ảnh trang, nhận xét face ook • E ge (cạnh): L k t nối "thứ" ảnh v trang chứa ảnh đ ghi ch v chẳng hạn nh ức ảnh đ k t nối hình c ghi ch đ • Fiel (tr ờng/lĩnh v c): Thông tin "thứ" chẳng hạn nh c a ng ời s ụng tên c a trang lu • Graph API l an a HTTP o đ l m vi c v gh tn to i đ y nh ng n c nghĩa l ụng Graph API tr c ti p trình ny ie hỏi i ất kỳ ngôn ngữ n o c th Ch ng giải th ch thêm ch t ạn c thể l m v i điều n y phần n va vi n HTTP nh cURL urlli thể s ng y sinh nhật uy t c a ạn v t ơng ạn c ụ nh g i đòi đ ơng v i: p http://graph.facebook.com/facebook/picture?redirect=false c k t n chứa thông tin icon c a face ook graph Copy giá trị nl w V nhận đ án lên trình uy t ạn c đ c thơng tin Face ooke d oa url c k t v { ll m "url": u nf "data": { va an lu đ oi "https://fbcdn-profile-a.akamaihd.net/hprofile-ak-xpf1/t1.0-1/p50x50/1377580_101 z at nh 52203108461729_809245696_n.png", "is_silhouette": false m co l Lấy O ject ID gm Cách thức lấy tin API Facebook @ } z } an Lu Mỗi n t c ID uy đ c s ụng để truy cập thông qua Graph API Đ y l n va cách s ụng cho No e: ac th si 57 Node: GET graph.facebook.com /{node-id} POST graph.facebook.com /{node-id} Edge: GET graph.facebook.com /{node-id}/{edge-name} POST lu graph.facebook.com /{node-id}/{edge-name} an n va s ụng Access Token Sau đ chuyển t i "Graph API Explorer" n cho phép ạn Từ "Graph API Explorer" ta c phần quan tr ng: gh tn to khám phá m Graph API mang t i cho ạn cách tr c quan ie Access Token: L mã cho phép g p String n i đòi hỏi t i Server Access Token l đoạn giống nh giấy phép cho phép ạn truy cập v o Face ook Graph để Mỗi Access Token mang thông tin ạn c quyền l m đ Để c d n an lu Face ook c a ạn tạo Access Token v i quyền hạn l URL g i t c tối đa quyền khám phá Face ook Graph API t i khoản oa nl w lấy ữ li u n o đ i server để nhận giá thông tin gi p ạn ễ oi ng tra cứu Chuyển t i: ộ t i li u tra cứu t ơng đối tốt m Face ook Graph API c ll u nf va  Kết thực Graph API z at nh https://developers.facebook.com/docs/ z ụng sau đo lấy thông tin an Lu từ “Graph Explorer" để xem cách s m co Abum l No e Graph API l gm @ /abum n va ac th si 58 Ta có c thể c đ c {album-id} từ vi c truy vấn Al um c a Facebook cần s ụng: Lấy thông tin Comment cho Album: Bước 7: Sử dụng Google để đọc liệu Ta s ụng chức tìm ki m c a google v i từ tìm ki m “ Tin tức m i Ninh Bình” lu an n va L c n y h thống cho ta khoảng 102 000 000 k t tìm ki m nh ch ng ụ ta v o link https://news.skydoor.net/place/Ninh_B%C3%ACnh Ta đ p ie gh tn to ta lấy k t tìm ki m trang để đ c ữ li u V ng c khoảng 30 tin l c n y ta s ụng vi c chuẩn h a html c để nl w l c tin n y a k t tìm ki m Google v ụ ta d oa T ơng t ta c thể lấy link thứ c c khoảng 20 tin t ơng t nh ta lại s u nf L c n y ta đ va an lu lấy link https://www.24h.com.vn/ninh-binh-c46e4362.html c số ll chuẩn h a html để lấy tin ụng m oi Quá trình lặp lặp lại cho đ n h t trang đầu c a k t tìm ki m google z at nh Bước 8: Xử lý tin lỗi liệu lấy lớn Vi c lấy tin phát sinh vấn đề v i tin m ỏ qua tin n y v ụ tin không lấy đ cl ạng chuẩn m tin không we site hay ùng Khi lấy tin ộ nh l ữ li u l n o đ c tin v định ạng đ h thống t m co l u nhiều tin l m phát sinh khoảng 5s phải lấy đ c l c gm @ đăng theo đinh z n y h thống ta không lấy đ c tin n y 5s đm xác định ỏ qua tin n y an Lu n va ac th si 59 Bước 9: Lưu liệu sau chuẩn hóa Sau tin tức đ c lấy h thống đ c lập trình qua ộ l c Face ook API Google API HTML tin tức đ tr ch n ảnh c s nội ung ình luận n u c ) Ti p theo ta so sánh tin n y xem trùng lặp hay không vi c so sánh gian đăng B đánh giá v c chuẩn h a th nh ạng (tên tin a tiêu ch tên tin nguồn tin thời c cuối ta l u v o sở ữ li u trung t m phục vụ cho vi c tổng h p áo cáo lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si 60 CHƯƠNG III: MỘT SỐ THỬ NGHIỆM 3.1 Sử dụng công cụ 3.1.1 Cơng cụ Cơng cụ lập trình: PHP Database: MySQL Cơng cụ hỗ tr : Html Java FreamWork Microsof Excell … 3.1.2 Cài đặt sản phẩm lu an Máy ch c i đặt H điều h nh Linux (Cấu hình tối thiểu CPU Ghz Ram G ổ n va cứng 500G c c i we server Apache (c thể ùng LAMP để thay th ) tn to Máy ch đ ie gh Cơ sở ữ li u ta c i đặt MySQL p 3.2 Sản phẩm phần mềm w oa nl 3.2.1 Các chức phần mềm d Các chức phần mềm: lu va an - Chức lấy thông tin mạng xã hội (Facebook Group) u nf - Chức lấy thông tin mạng xã hội (Face ook Fanpage) ll - Chức lấy thông tin mạng c nội ung liên quan t i Ninh Bình m oi - Chức xem tin lấy (tên tin tr ch - Chức đánh giá thông tin lấy ung ng ời đăng z at nh tin ình luận tin tức) n thời gian tin nội z c ản report tổng @ - Chức xuất áo cáo tổng h p (Vi c thống kê xuất đ l gm h p theo thời gian đ l thống kê thơng tin Ninh Bình áo thống kê tin tức Group FaceBook v Fanpage FaceBook) m co - Chức đổi mật an Lu n va ac th si 61 3.2.2 Cấu trúc bảng liệu Bảng người dùng STT Thuộc tính id Kiểu Chiều dài Ý nghĩa lu an Mã ng ời ùng name varchar Tên đăng nhập pass varchar Nội ung đánh giá role int Quyền hoten nvarchar 50 H v tên chucvu nvarchar 100 Chức vụ sodienthoai nvarchar 12 Số n thoại Chiều dài Ý nghĩa n va int p ie gh tn to Thuộc tính Kiểu oa nl w STT Bảng tin Group id tentin tomtat nguon noidung domain Nvarchar 50 Domain url Nvarchar 100 Link tr c ti p time1 Nvarchar danhgia d Mã group Nvarchar Tên tin Nvarchar Tóm tat tin Nvarchar Nguồn tin ll u nf va an lu Int (auto) Nội ung tin oi m Ntext z at nh z @ Thời gian đăng m co l gm Int 30 Đánh giá an Lu n va ac th si 62 lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si 63 Bảng tin Fanpage STT Thuộc tính Kiểu Chiều dài Ý nghĩa lu an n va Id Int (auto) Mã fanpage tentin nvarchar Tên tin tomtat nvarchar T m tắt tin nguon nvarchar Nguồn tin noidung ntext Nội ung tin domain nvarchar 50 Domain url nvarchar 100 Link tr c ti p time1 nvarchar 30 Thời gian đăng danhgia int Đánh giá p ie gh tn to w oa nl Bảng tin khác Thuộc tính Kiểu d STT nguon Mã tin nvarchar Tên tin T m tắt tin nvarchar Nguồn tin noidung ntext Nội ung tin domain nvarchar url nvarchar time1 nvarchar danhgia oi nvarchar m tomtat Int (auto) ll Ý nghĩa u nf tentin va an Id lu Chiều dài z at nh z Domain @ 100 Link tr c ti p m co 30 l gm Thời gian đăng Đánh giá an Lu int 50 n va ac th si 64 3.2.3 Một số giao diện phần mềm Màn hình đăng nhập lu an n va tn to ie gh Màn hình M n hình ch nh hiển thị menu chức v p ảng điều khiển chức năng: w d oa nl Xem v đánh giá tin Face ook Group lu u nf va an Xem v đánh giá tin Face ook Fanpage ll Xem v đánh giá tin Face ook Fanpage oi m z at nh Quản trị ng ời ùng z Chức đổi mật m co l gm @ Báo cáo thống kê ữ li u an Lu n va ac th si 65 Màn hình đổi mật lu an n va to gh tn Đ y l m n hình hiển thị chức đ c ùng cho to n ộ ng ời h ùng c c quản p ie thống gi p ng ời ùng c thể đổi mật c a sau đ trị tạo h Màn hình xem liệu lấy từ nguồn Facebook Group d oa nl w thống ll u nf va an lu oi m z at nh z gm @ l Đ y l m n hình hiển thị chức đ c ùng cho cán ộ đánh giá tin Khi phần m co mềm t động lấy tin Group Face ook v t động đ a v o sở ữ li u cán ộ đánh an Lu giá tin v o đ c tin để l m sở cho vi c đánh giá tin đ c lấy n va ac th si 66 Màn hình xem liệu lấy từ nguồn Facebook Fanpage lu an n va p ie gh tn to d oa nl w m n hình hiển thị chức đ c ùng cho cán ộ đánh giá tin Khi an lu Đyl động đ a v o sở ữ va phần mềm t động lấy tin Fanpage Face ook v t ll oi m c lấy u nf li u cán ộ đánh giá tin v o đ c tin để l m sở cho vi c đánh giá tin đ z at nh z m co l gm @ an Lu n va ac th si 67 Màn hình xem liệu lấy từ nguồn có liên quan đến Ninh Bình lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z @ gm Đ y l m n hình hiển thị chức đ c ùng cho cán ộ đánh giá tin Khi phần l mềm t động lấy tin Mạng xã hội khác nguồn đ c lấy qua ph ơng pháp an Lu cho vi c đánh giá tin đ c lấy m co API google v t động đ a v o sở ữ li u cán ộ đánh giá tin v o đ c tin để l m sở n va ac th si

Ngày đăng: 12/07/2023, 17:27

Tài liệu cùng người dùng

Tài liệu liên quan