Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 114 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
114
Dung lượng
14,29 MB
Nội dung
ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VŨ QUANG HUY PHÂN LOẠI VÀ ĐÁNH GIÁ CÁC BÀI VIẾT TRÊN BÁO ĐIỆN TỬ VỀ TỈNH LONG AN LUẬN VĂN THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH Mã số: 60.48.01.01 NGƯỜI HƯỚNG DẪN KHOA HỌC: TS DƯƠNG MINH ĐỨC TP HỒ CHÍ MINH – Năm 2018 LỜI CẢM ƠN LỜI CẢM ƠN Để hoàn thành luận văn này, không thủ tục luận văn mà lời tri ân chân thành tơi đến: - Thầy TS Dương Minh Đức trực tiếp hướng dẫn, tận tình trợ giúp cho tơi suốt q trình triển khai nghiên cứu hồn thành luận văn “Phân loại đánh giá viết báo điện tử tỉnh Long An” - Sở Thông tin Truyền thông Long An giúp đỡ, tạo điều kiện cung cấp số liệu, tài liệu cần thiết cho việc nghiên cứu hoàn thành luận văn - Quý Thầy Cô giảng dạy truyền đạt kiến thức bổ ích suốt q trình học tập Trường Đại học Công nghệ Thông tin, ĐHQG.HCM - Các Anh, Chị Phòng Đào tạo Sau Đại học ln nhiệt tình hỗ trợ tạo điều kiện thuận lợi để học tập nghiên cứu - Cuối tơi xin chân thành cảm ơn gia đình bạn bè động viên, khích lệ, chia sẽ, giúp đỡ đồng hành sống trình học tập nghiên cứu Mặc dù có nhiều cố gắng để thực luận văn hoàn chỉnh nhất, song buổi đầu làm quen với công việc nghiên cứu khoa học hạn chế kiến thức kinh nghiệm nên khơng thể tránh khỏi thiếu sót định Rất mong đóng góp, phê bình chân thành Q Thầy Cơ để luận văn hồn chỉnh Sau cùng, xin kính chúc người dồi sức khỏe thành công Chúc Trường Đại học Công nghệ Thơng tin, ĐHQG.HCM ngày phát triển Tp Hồ Chí Minh, ngày 20 tháng 12 năm 2017 Tác giả luận văn Vũ Quang Huy LỜI CAM ĐOAN LỜI CAM ĐOAN Tơi xin cam đoan luận văn thực hướng dẫn khoa học TS Dương Minh Đức giảng viên Trường Đại học Công nghệ thông tin TP.HCM Các liệu nghiên cứu luận văn trung thực, tơi lập trình, phân tích, thiết kế Các thơng tin trích dẫn luận văn rõ nguồn gốc Nếu sai, tơi xin chịu hồn tồn trách nhiệm Tác giả luận văn Vũ Quang Huy MỤC LỤC MỤC LỤC LỜI CẢM ƠN LỜI CAM ĐOAN MỤC LỤC DANH SÁCH KÝ HIỆU, CHỮ VIẾT TẮT DANH SÁCH HÌNH DANH SÁCH BẢNG MỞ ĐẦU 10 Chương TỔNG QUAN 12 1.1 Tình hình nghiên cứu 12 1.1.1 Trên giới 12 1.1.2 Trong nước 13 1.2 So sánh trang thông tin điện tử tổng hợp 14 Chương CƠ SỞ LÝ THUYẾT 15 2.1 Nghiên cứu tri thức (Knowledge) 15 1.2.1 Thành phần Ontology: 15 1.2.2 Phương pháp xây dựng Ontology 16 2.2 Nghiên cứu web ngữ nghĩa 20 2.1.1 Ontology Semantic Web 22 2.1.2 Kiến trúc Semantic Web 23 2.1.3 Các ngôn ngữ dùng để xây dựng Semantic Web 24 2.3 Nghiên cứu rút trích thơng tin báo điện tử 25 2.4 Các phương pháp tách từ tiếng việt 29 2.3.1 Tách câu dựa công cụ vnSentDectector 29 2.3.2 Phương pháp khớp tối đa (Maximum Matching) 30 2.3.3 Phương pháp tách từ WFST (Weighted Finite – State Transducer) 30 MỞ ĐẦU 2.3.4 Bài tốn tách từ cơng cụ vnTokenizer 31 2.3.5 Tách từ sử dụng n-grams 33 2.3.6 So sánh phương pháp tách từ tiếng Việt 33 2.5 Nghiên cứu phân lớp văn 34 2.4.1 Phân loại văn sử dụng Mạng Neural nhân tạo: 34 2.4.2 Phân loại văn sử dụng mơ hình vector 40 2.4.3 Vấn đề Overfitting 42 Chương PHÂN TÍCH, THIẾT KẾ HỆ THỐNG WEBSITE TỔNG HỢP VÀ ĐÁNH GIÁ TIN TỨC 45 3.1 Khảo sát trạng 45 3.2 Xây dựng mơ hình hệ thống 46 3.2.1 Mơ hình kiến trúc tổng thể 46 3.2.2 Mơ hình hệ thống thành phần 48 3.3 Xây dựng sở liệu, xây dựng kho liệu huấn luyện 55 3.3.1 Xây dựng sở liệu 55 3.3.2 Lược đồ thực thể (Entity-relationship diagram) 59 3.3.3 Xây dựng sở liệu 65 3.3.4 Xây dựng kho liệu huấn luyện 69 3.4 Xây dựng hệ thống rút trích thơng tin 69 3.4.1 Thiết kế chi tiết (Use-Case Diagrams) 70 3.4.2 Chức hệ thống tổng hợp tin tức 76 Chương CÀI ĐẶT VÀ ĐÁNH GIÁ KẾT QUẢ THỰC NGHIỆM 95 4.1 Mơ hình thử nghiệm thuật toán 95 4.2 Đánh giá thuật toán 96 Chương KẾT LUẬN VÀ KIẾN NGHỊ 99 5.1 Kết luận 99 6.1.1 Ý nghĩa khoa học kết nghiên cứu 99 6.1.2 Ý nghĩa thực tiễn khả ứng dụng kết khoa học 100 MỞ ĐẦU 5.2 Kiến nghị 100 TÀI LIỆU THAM KHẢO 101 Tiếng Việt 101 Tiếng Anh 101 PHỤ LỤC I: DANH SÁCH TRANG THÔNG TIN ĐIỆN TỬ 103 PHỤ LỤC II: TỔNG HỢP KHẢO SÁT 105 DANH SÁCH KÝ HIỆU, CHỮ VIẾT TẮT DANH SÁCH KÝ HIỆU, CHỮ VIẾT TẮT LAN Local Area Network - Mạng nội ANN Africa neural network CSDL Cơ sở liệu DOM Document Object Model HTML Hypertext Markup Language IP Internet Protocol NB Naive Bayes SVM Support Vector Machine UC Use case URI Uniform Resource Identifier WAN Wide Area Network XML eXtensible Markup Language DANH SÁCH HÌNH DANH SÁCH HÌNH Hình 2.1 Liên kết ngữ nghĩa đối tượng Semantic Web 21 Hình 2.2 Mơ hình kiến trúc Semantic Web 23 Hình 2.3 Cấu trúc DOM tài liệu văn html 28 Hình 2.4 Quy trình tách từ cơng cụ vnTokenizer 32 Hình 2.5 Cấu trúc lớp phân cấp 19 Hình 2.6 Ràng buộc thuộc tính 20 Hình 3.1 Mơ hình kiến trúc tổng thể hệ thống 47 Hình 3.2 Mơ hình Hệ thống “Tự động rút trích thơng tin” từ báo điện tử 49 Hình 3.3 Mơ hình Hệ thống “Chuẩn hóa tin” 51 Hình 3.4 Mơ hình hệ thống “Phân lớp tin” theo chủ đề 53 Hình 3.5 Lược đồ thực thể (Entity-relationship diagram) 62 Hình 3.6 Các khái niệm chủ yếu 66 Hình 3.7 Sơ đồ phân cấp lớp thực thể Con người 67 Hình 3.8 Sơ đồ phân cấp quản lý đơn vị hành Việt Nam 68 Hình 3.9 Giao diện tin liên quan 80 Hình 3.10 Giao diện tin chủ đề 81 Hình 3.11 Giao diện giao diện thống kê theo thời gian 82 Hình 3.12 Giao diện thống kê theo tháng, năm 83 Hình 3.13 Giao diện thống kê theo địa phương 84 Hình 3.14 Giao diện thống kê theo quan tỉnh 86 Hình 3.15 Giao diện thống kê theo lãnh đạo 88 Hình 3.16 Giao diện thống kê theo quan báo chí 89 MỞ ĐẦU Hình 3.17 Giao diện thống kê theo tác giả 90 Hình 3.18 Giao diện xuất nội dung danh sách tin chọn 91 Hình 3.19 Giao diện tìm kiếm tin 93 Hình 4.1 Mơ hình thử nghiệm thuật toán 96 DANH SÁCH BẢNG DANH SÁCH BẢNG Bảng 1.1 Bảng so sánh trang thông tin điện tử tổng hợp 14 Bảng 2.1 Phân biệt Semantic Web với Web 21 Bảng 3.1.TB-01: Xã 62 Bảng 3.2.TB-02: Huyện 62 Bảng 3.3 TB-03: Đường 62 Bảng 3.4 TB-04: Địa danh 62 Bảng 3.5 TB-05: Mức độ 63 Bảng 3.6 TB-06: Chủ đề 63 Bảng 3.7 TB-07: Phân loại 63 Bảng 3.8 TB-08: Sự kiện 63 Bảng 3.9 TB-09: Cơ quan báo chí 64 Bảng 3.10 TB-10: Tác giả 64 Bảng 3.11 TB-11: Bản tin 64 Bảng 3.12 Mô tả chức Giao diện phân loại tin 78 Bảng 3.13 Mô tả chức Giao diện tin liên quan 80 Bảng 3.14 Mô tả chức Giao diện tin chủ đề 81 Bảng 3.15 Mô tả chức Giao diện thống kê theo thời gian 82 Bảng 3.16 Mô tả chức Giao diện thống kê theo tháng, năm 83 Bảng 3.17 Mô tả chức Giao diện thống kê theo địa phương 84 Bảng 3.18 Mô tả chức Giao diện thống kê theo đơn vị 86 Bảng 3.19 Mô tả chức Giao diện thống kê theo lãnh đạo 88 Bảng 3.20 Mô tả chức Giao diện thống kê theo quan báo chí 89 Bảng 3.21 Mô tả chức Giao diện thống kê theo tác giả 90 Bảng 3.22 Mô tả chức Giao diện xuất nội dung danh sách tin 92 Bảng 3.23 Mô tả chức Giao diện tìm kiếm tin 93 Bảng 4.1 So sánh thuật toán máy học 97 Bảng 4.2 So sánh thuật toán thay đổi thứ tự lấy mẫu 97 Bảng 4.4 Đánh giá phân lớp tin 98 Chương KẾT LUẬN VÀ KIẾN NGHỊ Chương KẾT LUẬN VÀ KIẾN NGHỊ 5.1 Kết luận 6.1.1 Ý nghĩa khoa học kết nghiên cứu Sau thời gian nghiên cứu làm việc nghiêm túc, luận văn đạt số kết sau đây: - Nghiên cứu sở lý thuyết khai phá liệu, tập trung vào kỹ thuật khai phá liệu áp dụng cho mô hình phân lớp: mạng nơ ron nhân tạo (Backpropagation) so sánh với thuật toán khác Tiến hành thu thập tiền xử lý liệu, thu 18.000 tin viết tỉnh Long An, từ xây dựng CSDL hệ quản trị SQL Server 2008, phục vụ cho việc phát triển hệ thống tổng hợp tin tức - Kết hợp nghiên cứu, tìm hiểu mơ hình tổ chức, lưu trữ, quản lý danh mục địa trang thông tin, báo điện tử nước với nhu cầu ứng dụng thực tế việc tìm kiếm, nắm bắt thơng tin theo hướng có ngữ nghĩa trang thông tin, báo điện tử theo yêu cầu người dùng, Luận văn xây dựng quy trình chuẩn mơ hình cụ thể gồm hệ thống thành phần (Phân tích cấu trúc trang thơng tin điện tử; Rút trích tin theo định dạng chuẩn; chuẩn hóa, xếp tin vào nhóm lĩnh vực thuộc phạm vi nghiên cứu luận văn, thư mục định nghĩa sẵn; truy vấn tin theo phương pháp ngữ nghĩa, …) Quy trình có khả áp dụng cho việc quản lý, tìm kiếm ứng dụng khác - Xây dựng thành công giải pháp tự động tổng hợp, rút trích tin tức viết Long An từ trang thông tin, báo điện tử nước tiến hành chuẩn hóa tin rút trích theo cấu trúc định nghĩa; thực hóa giải pháp, kỹ thuật biểu diễn xử lý ngữ nghĩa rút trích, tìm kiếm thông tin văn tiếng Việt; xây dựng sở liệu bao gồm 1000 thực thể có lên quan đến tỉnh Long An lĩnh vực (thuộc phạm vi nghiên cứu luận văn) đáp ứng nhu cầu thực tế Kết hợp sở liệu xây dựng được, luận văn tiến hành phân lớp tin theo lĩnh vực cụ thể 99 Chương KẾT LUẬN VÀ KIẾN NGHỊ phạm vi nghiên cứu luận văn (Thời - Chính trị, Văn hóa – Xã hội, Kinh tế - Phát triển, An ninh – Quốc phòng, An tồn giao thơng) để phục vụ cho cơng tác tìm kiếm, thống kê, báo cáo sau Đồng thời đánh giá tinh theo tính chất (phản ánh vấn đề tích cực hay phản ánh vấn đề tiêu cực) để người sử dụng dễ dàng theo dõi nắm bắt thông tin kịp thời Xây dựng chức tìm kiếm tin theo mơ hình kết hợp tìm kiếm theo từ khóa tìm kiếm theo ngữ nghĩa; xây dựng hoàn tiện chức tổng hợp, thống kê, báo cáo theo nhiều tiêu chí khác theo yêu cầu quan quản lý nhà nước báo chí 6.1.2 Ý nghĩa thực tiễn khả ứng dụng kết khoa học - Sản phẩm luận văn triển khai sử dụng thử nghiệm số quan, hỗ trợ tốt cho quan, đơn vị chuyên môn, nghiệp vụ Sản phẩm luận văn hồn tồn có khả áp dụng thực tế tỉnh Long An - Sản phẩm luận văn trình bày tin hiển thị tốt máy tính thiết bị di động, tạo điều kiện thuận lợi, hỗ trợ tối đa cho người dùng 5.2 Kiến nghị - Xây dựng sở liệu cho phù hợp hoàn toàn lĩnh vực toán lớn Việc rút trích keyphrase hay gán độ ưu tiên TF-IDF thay đổi nâng cấp theo thời gian - Nghiên cứu phát triển thêm phần nắm bắt thông tin dư luận xã hội diễn đàn, mạng xã hội - Phát triển công cụ giúp người dùng khai báo, chỉnh sửa thẻ html website thay đổi cấu trúc 100 TÀI LIỆU THAM KHẢO TÀI LIỆU THAM KHẢO Tiếng Việt [1] Đỗ Văn Nhơn (2014): Nghiên cứu hệ thống hỗ trợ chọn lọc tin tỉnh Bình Dương báo mạng, Báo cáo đề tài KHCN tỉnh Bình Dương [2] Trần Cao Đệ Phạm Nguyên Khang (2012): Phân loại văn với máy học vector hỗ trợ định, Tạp chí Khoa học 2012:21a 52-63 Tiếng Anh [3] A N Chy; M H Seddiqui; S Das (2014): Bangla news classification using naive Bayes classifier, Computer and Information Technology (ICCIT), 2013 16th International Conference on, pp 366–371 [4] Dang Tuan Nguyen; Ha Quy-Tinh Luong (2009): Document Searching System based on Natural Language Query Processing for Vietnam Open Courseware Library, CoRR abs/0912.1829 [5] Gurmeet Kaur; Karan Bajaj: News Classification and Its Techniques: A Review, IOSR Journal of Computer Engineering (IOSR-JCE), Volume 18, Issue 1, Ver III (Jan – Feb 2016), pp 22–26 [6] I Dilrukshi; K De Zoysa; A Caldera (2013): Twitter news classification using SVM, 2013 8th International Conference on Computer Science Education, pp 287–291 [7] K H Y Lin; C Yang; H H Chen (2008): Emotion Classification of Online News Articles from the Reader’s Perspective, 2008 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology, vol 1, pp 220–226 [8] L Cui; F Meng; Y Shi; M Li; A Liu (2014): A Hierarchy Method Based on LDA and SVM for News Classification, 2014 IEEE International Conference on Data Mining Workshop, pp 60–64 101 TÀI LIỆU THAM KHẢO [9] M I Rana; S Khalid; M U Akbar (2014): News classification based on their headlines: A review, 17th IEEE International Multi Topic Conference 2014, pp 211– 216 [10] Pope, Mark W (2007): Automatic Classification of Online News Headlines Master's Papers: https://cdr.lib.unc.edu/record/uuid:aea8bf74-4003-4d65-b4f2- 250bd52dcd81 [11] Phan Thi Ha; Nguyen Quynh Chi: Automatic Classification for Vietnamese News, ACSIJ Advances in Computer Science: an International Journal, Vol 4, Issue 4, No.16, July 2015, pp 126–132 [12] Tetko, I V.; Livingstone, D J.; Luik, A I (1995): Neural network studies Comparison of Overfitting and Overtraining, Journal of Chemical Information and Modeling 35 (5): 826–833 [13] S M H Dadgar; M S Araghi; M M Farahani (2016): A novel text mining approach based on TF-IDF and Support Vector Machine for news classification, 2016 IEEE International Conference on Engineering and Technology (ICETECH), pp 112– 116 [14] S Padmaja; S S Fatima; S Bandu; P Kosala; M C Abhignya (2014): Comparing and evaluating the sentiment on newspaper articles: A preliminary experiment, 2014 Science and Information Conference, pp 789–792 [15] Z Li-juan; Z Feng; P Qing-qing; Y Xin; Y Zheng-tao (2015): A classification method of Vietnamese news events based on maximum entropy model, 2015 34th Chinese Control Conference (CCC), pp 3981–3986 102 PHỤ LỤC PHỤ LỤC I: DANH SÁCH TRANG THÔNG TIN ĐIỆN TỬ STT Tên trang báo điện tử Địa trang báo Báo Giao Thông - atgt.vn http://www.atgt.vn/ Báo Chính Phủ http://baochinhphu.vn/ Báo Giao Thơng http://www.baogiaothong.vn/ Báo Đất Việt http://baodatviet.vn/ Báo Hải Quan http://www.baohaiquan.vn/ Báo Long An http://baolongan.vn/ Báo Pháp Luật Việt Nam http://baophapluat.vn/ Báo Tin Tức http://baotintuc.vn/ Tạp chí CafeLand http://cafeland.vn/ 10 Báo Công An Nhân Dân http://cand.com.vn/ 11 Báo Công An TP HCM http://congan.com.vn/ 12 Báo Công Luận http://congluan.vn/ 13 Báo Cơng Lý http://congly.com.vn/ 14 Báo Đại Đồn Kết http://daidoanket.vn/ 15 Báo Dân Trí http://dantri.com.vn/ 16 Báo Dân Việt http://danviet.vn/ 17 Báo Đời sống Pháp luật http://www.doisongphapluat.com/ 18 Báo Lao Động http://laodong.com.vn/ 19 Cổng TTĐT tỉnh Long An https://www.longan.gov.vn/ 20 Báo Một Thế Giới http://motthegioi.vn/ 21 Báo Zing http://news.zing.vn/ 22 Báo Người Lao Động http://nld.com.vn/ 23 Báo Người Đưa Tin http://www.nguoiduatin.vn/ 24 Báo Nhân Dân http://nhandan.com.vn/ 103 PHỤ LỤC 25 Báo Pháp Luật TP HCM http://plo.vn/ 26 Báo PL VN - phapluatplus.vn http://www.phapluatplus.vn/ 27 Báo NĐT - phununews.vn http://phununews.vn/ 28 Báo Quân Đội Nhân Dân http://www.qdnd.vn/ 29 Báo Tiền Phong http://www.tienphong.vn/ 30 Báo Tri Thức Trẻ http://ttvn.vn/ 31 Báo Sài Gòn Giải Phóng http://www.sggp.org.vn/ 32 Báo Tầm Nhìn http://tamnhin.net/ 33 Tạp chí Giao Thơng http://www.tapchigiaothong.vn/ 34 Báo Tuổi Trẻ http://tuoitre.vn/ 35 Báo Thanh Niên http://thanhnien.vn/ 36 Tạp chí Thanh Niên Việt http://thanhnienviet.vn/ 37 Báo Thanh Tra http://thanhtra.com.vn/ 38 Báo VietNamNet http://vietnamnet.vn/ 39 Báo VietnamPlus http://www.vietnamplus.vn/ 40 Báo VnExpress http://vnexpress.net/ 41 Báo VOV http://vov.vn/ 42 Báo VTC http://www.vtc.vn/ 43 Báo VTV http://vtv.vn/ 44 Trang TTĐT VietPress http://vietpress.vn/ 45 Trang TTĐT Soha http://soha.vn/ 104 PHỤ LỤC PHỤ LỤC II: TỔNG HỢP KHẢO SÁT Mẫu phiếu phục vụ cho cán lãnh đạo STT Nội dung khảo sát Thông tin khảo sát Tỷ lệ Thường xun tìm kiếm thơng Hàng ngày 83% 2-4 lần/tuần 19% tin, đọc báo trang báo điện tử trang thông tin điện tử Quan tâm đến lĩnh vực thông tin Thông tin thời nước 89% báo điện tử/trang thông tin điện tử Thông tin thời quốc tế 89% Pháp luật 83% Kinh tế - Chính trị 81% Xã hội – Giáo dục – Y tế 72% Nơng nghiệp, nơng thơn 49% Văn hóa – Thể thao 64% Khoa học 49% Sức khỏe 53% Thể thao 38% Giá thị trường 27% Giải trí 36% Nắm tình hình thời 94% 105 PHỤ LỤC Mục đích tìm đọc, theo dõi Bổ sung kiến thức thơng tin báo điện tử/trang thông tin điện tử thông tin điện tử Phục vụ công việc 96% Giải trí 32% Đánh giá nội dung thơng Nhanh, cập nhật liên tục tin báo điện tử/trang 85% 94% Hấp dẫn 27% Chính xác 19% Đầy đủ 40% Rõ ràng 32% Khơng đáng tin cậy 11% Khơng xác 8.5% Hay thay đổi 13% Kể lể dong dài 6.4% Tạp nham 6.4% Các thông tin báo điện Nắm thông tin 98% tử/trang thông tin điện tử giúp nước giới ích Biết thơng tin tỉnh 64% Tư vấn, dẫn, tìm ý tưởng 51% Khơng có ích lợi 106 PHỤ LỤC Thường đọc báo điện tử Máy tính quan (PC, thiết bị 77% Laptop) Điện thoại thơng minh 49% (Smartphone) Máy tính bảng (Ipad,…) 36% Máy tính nhà riêng 62% Thường sử dụng cơng Thủ cơng (từ người quen) cụ để tìm kiếm thơng tin mạng Các trang cơng cụ tìm kiếm 6.4% 94% mạng (google, bing, yahoo,…) Danh bạ có sẵn Khơng biết Thường chủ động sử dụng Thường xun cơng cụ tìm kiếm mạng Hiếm 30% 87% 4.3% tìm thơng tin liên quan đến tỉnh, lĩnh vực cơng Biết, chưa làm lần tác Không biết Nhu cầu sử dụng công cụ tự Tham nhũng động hỗ trợ việc cung Đất đai 2% 49% 30% cấp nhanh tóm tắt thông tin, viết Lĩnh vực đầu tư công 107 60% PHỤ LỤC trang thông tin, báo điện tử Tệ nạn xã hội liên quan đến khía cạch cụ thể quan tâm 10 Tài nguyên môi trường 34% Tai nạn giao thông 23% Đối tượng cần quan tâm, theo Địa danh tỉnh dõi 34% 100% Cơ quan, đơn vị tỉnh 100% Lãnh đạo, người phát ngôn 60% tỉnh Cơ quan báo chí, tác giả 34% Mẫu phiếu phục vụ cho cán quản lý Nhà nước báo chí: STT Nội dung khảo sát Thơng tin khảo sát Tỷ lệ Thường xun tìm kiếm thơng Hàng ngày 88% 2-4 lần/tuần 9.4% tin, đọc báo trang báo điện tử trang thông tin điện tử Quan tâm đến lĩnh vực thông tin Thông tin thời nước 100% báo điện tử/trang thông tin điện tử Thông tin thời quốc tế 75% Pháp luật 75% Kinh tế - Chính trị 69% Xã hội – Giáo dục – Y tế 75% 108 PHỤ LỤC 47% Văn hóa – Thể thao 63% Khoa học 41% Sức khỏe 53% Thể thao 22% Giá thị trường 31% Giải trí 50% Mục đích tìm đọc, theo dõi Nắm tình hình thời thơng tin báo điện tử/trang thông tin điện tử Nông nghiệp, nông thôn Bổ sung kiến thức 84% Phục vụ cơng việc 97% Giải trí 50% Đánh giá nội dung thông Nhanh, cập nhật liên tục tin báo điện tử/trang thông tin điện tử 91% 84% Hấp dẫn 31% Chính xác 19% Đầy đủ 25% Rõ ràng 12.5% Khơng đáng tin cậy 3% Khơng xác 9% 109 PHỤ LỤC Hay thay đổi Kể lể dong dài Tạp nham Các thông tin báo điện Nắm thông tin 3% 3% 94% tử/trang thông tin điện tử giúp nước giới ích Biết thơng tin tỉnh 78% Tư vấn, dẫn, tìm ý tưởng 34% Khơng có ích lợi Thường đọc báo điện tử Máy tính quan (PC, thiết bị 81% Laptop) Điện thoại thông minh 41% (Smartphone) Máy tính bảng (Ipad,…) 6% Máy tính nhà riêng 38% Chủ động sử dụng cơng cụ tìm tháng/lần kiếm mạng tìm thơng tin liên quan đến tỉnh, lần/tuần 9% 25% địa phương, … để phục vụ Khoảng lần/tuần 9% cho công tác 50% Nhiều lần/tuần 110 PHỤ LỤC Thường sử dụng cơng Cơng cụ tìm kiếm báo 41% cụ để tìm kiếm thơng tin điện tử/Trang thông tin điện tử mạng Các trang cơng cụ tìm kiếm 88% mạng (google, bing, yahoo,…) Danh bạ có sẵn Khác Thường chủ động sử dụng Thường xun cơng cụ tìm kiếm mạng Hiếm 9% 66% 9% tìm thơng tin liên quan đến tỉnh, lĩnh vực quan Biết, chưa làm lần tâm để phục vụ cho công tác Khơng biết 6% quản lý báo chí 10 Khoảng thời gian cần thiết để phút tìm thông tin 11 15 phút 22% 3% Lâu 3% Thời gian cần thiết để đọc hết Ít phút tin 69% 38% 3-5 phút 41% 15 phút 13% Hơn 15 phút 9% 111 PHỤ LỤC 12 Nhu cầu sử dụng công cụ tự Tham nhũng động hỗ trợ việc cung Đất đai 47% 28% cấp nhanh tóm tắt thơng tin, viết Lĩnh vực đầu tư công 34% trang thông tin, báo điện tử Tệ nạn xã hội 44% Tài nguyên môi trường 19% Tai nạn giao thông 25% liên quan đến khía cạch cụ thể quan tâm 13 Có sử dụng cơng cụ để thống Có kê, báo cáo tin liên quan đến tỉnh, địa phương, Không 38% 56% lĩnh vực quản lý Nhu cầu sử dụng cơng cụ để Có thống kê, báo cáo nhanh tin liên quan đến tỉnh, địa 69% Không 25% Hằng ngày 41% ngày/lần 6% tuần/lần 31% Hằng tháng 9% Email 59% phương, lĩnh vực quản lý 14 15 Thống kê, báo cáo vào lúc 112 PHỤ LỤC Nhận thống kê, báo cáo Văn giấy cách Văn điện tử (qua chương 3% 38% trình QLVB) SMS có tin nóng, quan trọng 113 16% ... hình báo điện tử viết tỉnh theo thời gian, theo lĩnh vực, theo quan báo chí, Xây dựng thành công giải pháp tự động tổng hợp, rút trích tin tức viết Long An từ trang thông tin, báo điện tử nước... suốt q trình triển khai nghiên cứu hồn thành luận văn Phân loại đánh giá viết báo điện tử tỉnh Long An - Sở Thông tin Truyền thông Long An giúp đỡ, tạo điều kiện cung cấp số liệu, tài liệu cần... thông tin báo điện tử viết Long An sẵn sàng phục vụ cho công tác thống kê, báo cáo quan quản lý nhà nước báo chí 11 Chương TỔNG QUAN Chương TỔNG QUAN 1.1 Tình hình nghiên cứu 1.1.1 Trên giới