Lọc thông minh tin nhắn rác, tin nhắn quảng cáo trên thiết bị di động

74 170 0
Lọc thông minh tin nhắn rác, tin nhắn quảng cáo trên thiết bị di động

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

LỜI CAM ĐOAN Tôi – Nguyễn Minh Đức, học viên lớp Cao học CLC2016A Trƣờng Đại học Bách Khoa Hà Nội – cam kết luận văn công trình nghiên cứu thân dƣới hƣớng dẫn TS Trịnh Anh Phúc – Viện Công Nghệ Thông Tin Truyền Thông – Đại học Bách Khoa Hà Nội Các số liệu, kết nêu luận văn trung thực chƣa đƣợc công bố công trình khác Tác giả luận văn xin chịu trách nhiệm nghiên cứu Hà Nội, ngày 25 tháng 10 năm 2016 Tác giả Nguyễn Minh Đức Xác nhận giáo viên hƣớng dẫn mức độ hoàn thành luận văn tốt nghiệp cho phép bảo vệ: Hà Nội, ngày 25 tháng 10 năm 2016 Giảng viên hƣớng dẫn TS Trịnh Anh Phúc Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang DANH MỤC HÌNH VẼ Hình 1: Quy trình xây dựng ứng dụng học máy 13 Hình 2: Tổng quan hệ điều hành Android 15 Hình 3: Khối tiền xử lý 19 Hình 4: Ví dụ tinh nhắn quảng cáo 19 Hình 5: Tin nhắn sau qua bước lọc bỏ ký tự đặc biệt .21 Hình 6: Một phần từ điển từ trọng số 22 Hình 7: phần từ điển tin thường tin quảng cáo cho phương pháp Bayes 23 Hình 8: Một tin nhắn chuyển sang không gian vector 25 Hình 9: Khối xử lý tin nhắn 26 Hình 10: Sơ đồ khối phân lớp tin nhắn học máy 26 Hình 11: Minh họa chi tiết khối hình 10 28 Hình 12: Ví dụ cho thuật toán K-NN .33 Hình 13:Một đường thẳng tuyến tính phân chia lớp điểm (hình vuông hình tròn) không gian hai chiều 38 Hình 14: Lề lớn tính toán SVM tuyến tính .39 Hình 15: bên trái, biên định cho SVM với giá trị cao C mà bắt chước hành vi SVM biên cứng dẫn tới lỗi huấn luyện Một giá trị C nhỏ (bên phải) cho phép bỏ qua điểm gần ranh giới, làm lề lớn 45 Hình 16:Mức độ tác động kernel đa thức Kernel đa thức dẫn đến phân tách tuyến tính (A) Kernel đa thức cho phép ranh giới định linh hoạt (B - C) 47 Hình 17:Ảnh hưởng số chiều Gaussian kernel (σ) cho giá trị cố định số biên mềm Đối với giá trị σ (A) lớn định ranh giới gần tuyến Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang tính Khi giảm σ tính linh hoạt ranh giới định tăng (B) Giá trị σ nhỏ dẫn đến học (overfitting) (C) 48 Hình 18: Ví dụ phân lớp sử dụng chiến lược OAR 49 Hình 19: Ví dụ phân lớp sử dụng chiến lược OAO .50 Hình 20: Ví dụ đầu vào LibSVM 53 Hình 21: Huấn luyện SVM 54 Hình 22: Độ xác phân lớp LibSVM 54 Hình 23: Kết Naïve Bayes 56 Hình 24: Thời gian thực thi Naïve Bayes .57 Hình 25: Kết thuật toán K-NN 58 Hình 26: Thời gian thực thi KNN 59 Hình 27: Kết thuật toán SVM với nhân khác 60 Hình 28: Thời gian thực thi thuật toán SVM 60 Hình 29: UseCace Diagram 65 Hình 30Giao diện hội thoại tin nhắn trả lời nhanh 66 Hình 31: Giao diện cài đặt 67 Hình 32: Giao diện quản lý tin nhắn cá nhân .68 Hình 33Sản phẩm BK SMS Pro Google play .69 Hình 34: Giao diện Go SMS Pro tính lọc rác 70 Hình 35: Giao diện chặn rác Bkav Mobile Security 73 Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang CÁC THUẬT NGỮ VIẾT TẮT Chữ viết tắt NB K-NN SVM SMS BMS Chữ viết đầy đầy đủ Naïve Bayes K Nearest Neighbour Support Vector Machine Short Message Service BK Mobile Security Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang MỤC LỤC DANH MỤC HÌNH VẼ CÁC THUẬT NGỮ VIẾT TẮT TÓM TẮT NỘI DUNG LUẬN VĂN TỐT NGHIỆP ABSTRACT OF THESIS CHƢƠNG 1: ĐẶT VẤN ĐỀ 11 1.1 Nhiệm vụ luận văn 11 1.1.1 Tổng quan 11 1.1.2 Chi tiết nhiệm vụ 12 1.2 Mô hình toán phân loại tin nhắn rác 12 CHƢƠNG 2: NỀN TẢNG ANDROID VÀ CƠ CHẾ GỬI NHẬN TIN NHẮN SMS 14 2.1 Nền tảng Android 14 2.2 Cơ chế gửi nhận tin nhắn 16 2.3 Cơ chế lƣu trữ tin nhắn hệ thống 17 CHƢƠNG 3: CÁC BƢỚC TIỀN XỬ LÝ VĂN BẢN 19 3.1 Biểu diễn tin nhắn 19 3.2 Phƣơng pháp tách từ để tạo từ điển 20 3.2.1 Phƣơng pháp tách từ dựa khoảng trắng 20 3.2.2 Phƣơng pháp tách từ theo n-gram 21 3.3 Tạo từ điển, trọng số không gian vector cho tập học 22 CHƢƠNG 4: CÁC THUẬT TOÁN VÀ CÀI ĐẶT TRÊN THIẾT BỊ ANDROID 26 4.1 Bài toán phân lớp tổng quát 27 4.2 Các thuật toán 29 4.2.1 Thuật toán Naive Bayes 29 4.2.2 Thuật toán K-Ngƣời láng giềng gần (K-Nearest-Neigbour) 33 4.2.3 Support Vector Machine 37 Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang CHƢƠNG 5: KẾT QUẢ ĐẠT ĐƢỢC 55 5.1 Thuật toán Naive Bayes 56 5.1.1 Độ xác 56 5.1.2 Thời gian thực thi 57 5.2 Thuật toán KNN 58 5.2.1 Độ xác 58 5.2.2 Thời gian thực thi 59 5.3 Thuật toán SVM 60 5.3.1 Độ xác 60 5.3.2 Thời gian thực thi 60 KẾT LUẬN 62 TÀI LIỆU THAM KHẢO 63 PHỤ LỤC: GIAO DIỆN CHƢƠNG TRÌNH VÀ SO SÁNH VỚI CÁC ỨNG DỤNG TƢƠNG TỰ 64 Các Usecase 65 Kết cài đặt thử nghiệm hệ thống 66 So sánh với sản phẩm có thị trƣờng 69 Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang TÓM TẮT NỘI DUNG LUẬN VĂN TỐT NGHIỆP Hiện nay, thiết bị hỗ trợ cá nhân nói chung điện thoại di động nói riêng ngày trở lên phổ biến Với xu xã hội ngày tiến thiết bị thông minh trở nên thông dụng hơn, đặc biệt thiết bị di động sử dụng hệ điều hành Android với tính mở cao đơn giản sử dụng làm mƣa làm gió thị trƣờng di động Dịch vụ tin nhắn dịch vụ ngƣời dùng sử dụng điện thoại Tuy nhiên tiện lợi trao đổi thông tin, dịch vụ tin nhắn mang lại cho ngƣời dùng phiền toái, điển hình ngƣời dùng phải nhận tin nhắn mà họ không mong muốn hay gọi tin nhắn rác với nội dung chào mời giới thiệu sản phẩm dịch vụ Nhận thấy tính cần thiết đem lại tiện ích cho ngƣời sử dụng, đề tài “Lọc thông minh tin nhắn rác, tin nhắn quảng cáo thiết bị di động” có nhiệm vụ nghiên cứu triển khai phƣơng án lọc tin nhắn rác dựa thuật toán phân lớp văn đƣợc nghiên cứu từ trƣớc cụ thể hóa thành ứng dụng điện thoại di động sử dụng hệ điều hành Android Bố cục luận văn tốt nghiệp gồm chƣơng : Chương 1: Đặt vấn đề Nội dung phân tích yêu cầu toán tìm hƣớng giải Chương2: Nền tảng android chế gửi nhận tin nhắn SMS Trình bày kiến trúc tảng android, chế gửi nhận tin nhắn SMS xử lý nhƣ Chương3: Các bước tiền xử lý văn Chƣơng trình bày cách tiền xử lý văn làm đầu vào cho việc huấn luyện nhƣ phân lớp Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang Chương4: Các thuật toán cài đặt thiết bị android Trình bày nội dung thuật toán triển khai thuật toán thiết bị di động Chương5: Kết đạt Các kết thử nghiệm đánh giá độ xác thuật toán triển khai Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang ABSTRACT OF THESIS Today,Smart Phone is more and more popular.The trend of increasingly progressive society, these smart devices become more common Especially, mobile devices using the Android operating system is storming on the market Short Messaging Services (SMS) is one of basis services on mobile phone Besides the convenience of communication, SMS is bringing nuisance that users unwanted In this case the user is getting the message that they don‟t want to get, it was called spam message with promotional content of products and services introduced Recognizing the necessity and utility provides for users I decided to choose the topic "Intelligent filtering spam messages, advertising messages on mobile devices" for my thesis It will responsible for researching and implementing spam filtering options based on text classification algorithms have been studied before and concretized into an application on the mobile phone using the operating system Android Thesis presented consists of chapters: Chapter 1: Introduction Content is analysis require of thesis Chapter2: Android Platform and Sent Receiver SMS Introduce about android platform, send and receiver SMS method How to catch SMS and classify? Chapter3: The text pre-processing Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang Processing SMS content and preparing input data for machine learning Chapter4: The algorithms and setup on Android devices Introduce about Machine Learning and how to setup on Android Chapter5: Results Test results and assess the accuracy of the algorithm implemented Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 10 5.3 Thuật toán SVM 5.3.1 Độ xác Accuracy 100 95 % 90 85 80 75 N Gram N Gram N Gram None Radian Basic Function 85.51 92.5 92.88 90.09 Linear 87.2 96.92 98.33 94.88 Polynomial 91.14 89.58 85.84 88.04 Sigmoid 84.85 93.4 93.31 93.788 Hình 27: Kết thuật toán SVM với nhân khác Với SVM ta tiến hành test với nhân SVM Nhân tuyến tính cho kết tốt với N-gram = độ xác 98.33% cao thuật toán Ta xét tới thời gian thực thi SVM 5.3.2 Thời gian thực thi Time Execute seconds 80 70 60 50 40 30 20 10 N Gram N Gram N Gram None Radian Basic Function 10 45 68 31 Linear 25 18 23 12 Polynomial 44 56 32 Sigmoid 42 58 29 Hình 28: Thời gian thực thi thuật toán SVM Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 60 N-gram = với nhân tuyến tính cho kết xác 98.33% so với 98.08% Bayes Và thời gian cho SVM 23 giây so với 19 giây Bayes Rõ ràng kết không chênh lệch nhiều thời gian thực thi hoàn toàn chấp nhận đƣợc Ta chọn cách Tuy nhiên việc triển khai thuật toán SVM phức tạp nhiều so với công thức xác suất Bayes Ngoài việc sử dụng libSVM cần thêm vào chƣơng trình thƣ viện libSVM khoảng 3Mb làm tăng dung lƣợng chƣơng trình lên lớn Tổng hợp kết phƣơng pháp SVM N Gram Accuracy Time (%) exe(s) Kenel Radian Basic Function Linear Polynomial Sigmoid 85.51 87.2 91.14 84.85 10 25 N Gram Accuracy Time (%) exe(s) 92.5 96.92 89.58 93.4 N Gram Accuracy Time (%) exe(s) 45 18 44 42 92.88 98.33 85.84 93.31 None Accuracy Time (%) exe(s) 68 23 56 58 90.09 94.88 88.04 93.788 31 12 32 29 Bảng 3: Tổng hợp độ xác thời gian thực thi KNN Từ kết test với điều kiện khác thuật toán ta có đƣợc tổng hợp kết tốt thuật toán The best result N Gram N Gram N Gram None Algorithm Accuracy Time Accuracy Time Accuracy Time Accuracy Time (%) exe(s) (%) exe(s) (%) exe(s) (%) exe(s) Bayes 77.08 13 82.46 140 84.01 452 98.08 19 KNN 74.39 25 93.31 1313 94.68 1538 98.1 369 SVM 87.2 25 96.92 18 98.33 23 94.88 12 Bảng 4: Tổng hợp kết tốt phương án Dựa kết thử nghiệm thuật toán Tác giả định lựa chọn phƣơng pháp Bayes với kiểu tách từ vựng theo khoảng trắng đê cài đặt cho chƣơng trình lọc tin nhắn rác điện thoại với độ xác 98.08% thời gian thực thi 19s cho 6166 tin mẫu Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 61 KẾT LUẬN Các công việc thực luận văn tốt nghiêp Tìm hiểu kiến trúc hệ điều hành android lập trình tảng Android Đã xây dựng hoàn chỉnh ứng dụng quản lý tin nhắn cho điện thoại, chƣơng trình dùng thay cho chƣơng trình tin nhắn hệ thống Xây dựng đƣợc chƣc hỗ trợ ngƣời dùng thao tác với tin nhắn nhƣ trả lời tin nhắn (các chức foward, copy text, add contact, trả lời nhanh) Dựa khái niệm phân lớp văn nghiên cứu phƣơng pháp phân lớp văn : Naive Bayes, K-Nearest Neighbour, Support Vector Machine Triển khai cài đặt ba thuật toán Naive Bayes, K-Nearest Neighbour, SVM hệ thống android Tiến hành thử nghiệm chƣơng trình kịch mô khác Đánh giá hiệu thuật toán lựa chọn thông số cài đặt hiệu Cải thiện phƣơng án lọc rác cách đƣa phƣơng án hỗ trợ cho lọc tin nhƣ: lọc tin nhắn theo đầu số đăng ký trƣớc, chặn tin nhắn không rõ ngƣời gửi, lọc theo nội dung cho phép lựa chọn thuật toán lọc Hƣớng nghiên cứu thời gian tới: Tối ƣu hóa hiệu thuật toán để nâng cao hiệu nhận diện tin nhắn rác Nâng hiệu nhận diện lên 100% Tìm phƣơng án cải thiện khả nhậnn diện nhƣ tăng tốc độ tính toán hệ thống nhằm mục tiêu đƣa liệu mẫu lớn hiệu Triển khai lọc tin nhắn rác từ phía Server nhà mạng tận dụng khả tính toán nguồn liệu khổng lồ từ phía nhà mạng Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 62 TÀI LIỆU THAM KHẢO N-Gram : https://en.wikipedia.org/wiki/N-gram Machine learning 101, http://scikit-learn.github.io/scikit-learn- tutorial/general_concepts.html Bayes : https://en.wikipedia.org/wiki/Naive_Bayes_classifier Dan Jurafsky Text Classification and Naïve Bayes http://www.stanford.edu/class/cs124/lec/naivebayes.pdf Jeff Robble, Brian Renzenbrink and Doug Roberts NEAREST NEIGHBOR RULE http://www.cs.rit.edu/~rlaz/PatternRecognition/slides/kNearestNeighbor.pdf Nguyễn Thị Thảo, Nguyễn Thị Huyền, Đoàn Thị Thu Hà Trần Thị Thu Huyền, Nguyễn Thị Thủy PHƢƠNG PHÁP PHÂN LỚP SỬ DỤNG MÁY VEC-TƠ HỖ TRỢ ỨNG DỤNG TRONG TIN SINH HỌC Tạp chí Khoa học Phát triển 2011: Tập 9, số 6: 1021 - 1031 TRƢỜNG ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI Source: http://www.vjol.info/index.php/NNHN/article/viewFile/19226/16931 Nguyễn Linh Giang Nguyễn Mạnh Hiển, Phân loại văn tiếng Việt với phân loại véctơ hỗ trợ SVM, Chuyên san Các công trình nghiên cứu - triển khai viễn thông công nghệ thông tin, Tạp chí Bưu viễn thông Công nghệ thông tin, số 15, trang 66-75, 2005 Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 63 PHỤ LỤC: GIAO DIỆN CHƢƠNG TRÌNH VÀ SO SÁNH VỚI CÁC ỨNG DỤNG TƢƠNG TỰ Sau có đƣợc kết đánh giá thuật toán Tác giả lựa chọn kết tối ƣu để triển khai vào chƣơng trình lọc thông minh tin nhắn thiết bị android Với mục tiêu hƣớng tới ngƣời sử dụng, chƣơng trình xây dựng ứng dụng quản lý tin nhắn hoàn chỉnh Các chức mà chƣơng trình thực hiện:  Chức chặn tin nhắn rác theo nội dung, theo đầu số đƣợc ngƣời sử dụng đăng ký, theo số danh bạ Với chức chặn tin rác theo nội dung triển khai theo thuât toán Naïve Bayes  Hiển thị tin nhắn, hội thoại, cài đặt ngôn ngữ  Chức gửi nhận tin nhắn, gọi điện từ số điện thoại ngƣời gửi thông báo cho ngƣời dùng có tin nhắn đến, cho phép trả lời nhanh tin nhắn đến  Chức thao tác với tin nhắn: Tạo tin nhắn mới, chuyển tiếp tin nhắn, xóa tin nhắn báo cáo tin rác, xem chi tiết tin nhắn, chép nội dung tin nhắn  Chức với hội thoại: Xem chi tiết ngƣời gửi, xóa hội thoại, đăng ký số coi gửi tin nhắn rác, gọi điện thoại  Chức quản lý tin nhắn cá nhân: Cho phép ngƣời sử dụng cài đặt mật số đƣợc đăng ký mục tin nhắn cá nhân đƣợc bảo mật, ngƣời khác xem mật  Chức quản lý tin nhắn rác: Trong trƣờng hợp chƣơng trình nhận nhầm tin nhắn rác ngƣời dùng vào chức để xem xác nhận tin nhắn rác Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 64 Các Usecase Hình 29: UseCace Diagram Sơ đồ UseCase cho thấy chức mà chƣơng trình thể tƣơng tác chức Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 65 Kết cài đặt thử nghiệm hệ thống Chƣơng trình đƣợc cài đặt thử nghiệm emulator thiết bị Galaxy J5 Một số hình ảnh chạy chƣơng trình (ảnh chụp từ hình thiết bị) (a) (b) (c) Hình 30Giao diện hội thoại tin nhắn trả lời nhanh Hình 30(a) thể giao diện hiển thị hội thoại có máy: Hiển thị tên, số lƣợng tin nhắn hội thoại, ảnh ngƣời gửi – ngƣời gửi có ảnh danh bạ Nếu danh bạ hiển thị ảnh unknow sender ngƣời dùng thêm nhanh ngƣời vào danh bạ giữ lâu vào hội thoại Hình 30(b) thể giao diện tin nhắn bên hội thoại tin nhắn đến đi, giao diện ngƣời dùng trả lời tin nhắn, gọi điện thao tác với tin nhắn long click vào tin nhắn Hình 30(c) thể giao diện trả lời nhanh: Giao diện xuất có tin nhắn đến, xuất hình hoạt động thiết bị ngƣời Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 66 dùng thực tác vụ khác Giao diện cho phép ngƣời dùng trả lời ngay, gọi điện, tới nội dung hội thoại tiếp tục làm công việc với nút todo (a) ( b) (c) Hình 31: Giao diện cài đặt Hình 31(a) thể giao diện lựa chọn chức chƣơng trình Hình 31(b) thể giao diện tùy chọn hội thoại ngƣời dùng giữ lâu vào hội thoại Hình 31(c) thể giao diện tùy chon mội tin nhắn ngƣời dùng giữ lâu vào tin nhắn Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 67 (a) (b)(c) (d) (e) (f) Hình 32: Giao diện quản lý tin nhắn cá nhân Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 68 Hình 32(a) thể giao diện đăng nhập vào tin nhắn cá nhân Hình 32(b) thể giao diện thêm vào danh bạ cá nhân Hình 32(c) thể giao diện hội thoại tin nhắn cá nhân Hình 32(d) thể chức câu hỏi bảo mật Hình 32(e) thể giao diện lấy lại mật câu hỏi bảo mật Hình 32(f) thể giao diện soạn tin nhắn Chƣơng trình đƣợc đƣa lên google play với tên BK SMS Pro để cộng đồng ngƣời dùng sử dụng đánh giá hình dƣới sản phẩm Google play Hình 33Sản phẩm BK SMS Pro Google play So sánh với sản phẩm có thị trƣờng  Chặn rác phần mềm tin nhắn chuẩn máy điện thoại Android Samsung Hệ điều hành Android đƣợc Samsung viết lại chức theo hãng có phần chặn Spam SMS chƣơng trình có tùy chọn: o Lọc tin nhắn theo số điện thoại đăng ký trƣớc Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 69 o Lọc tin nhắn theo số điện thoại danh bạ o Lọc tin nhắn theo đoạn text mà ngƣời dùng nhập vào Chƣơng trình lọc đơn theo nội dung text mà ngƣời dùng định nghĩa độ tin cậy không cao, khả tự động lọc rác Vì chƣơng trình đƣợc viết cho nhiều ngôn ngữ khác nên việc thiết kế liệu không phù hợp, xét riêng khía cạnh lọc tin rác BK SMS Pro vƣợt trội xây dựng riêng cho tin nhắn tiếng việt nhận diện rác thông minh Ngoài ra, chƣơng trình có khả cho phép trả lời nhanh tin nhắn, ngƣời dùng xem trả lời thực tác vụ khác mà quay xem tin nhắn  Phần mềm GO SMS Pro Đây phần mềm thuộc gói phần mềm Go tiếng giao diện hấp dẫn nhiên tiêu tốn pin đáng kể (a) (b) (c) Hình 34: Giao diện Go SMS Pro tính lọc rác Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 70 Ngoài tính chƣơng trình quản lý tin nhằn thông thƣờng GO SMS Pro có tính sau o Quản lý tin nhắn cá nhân mật khẩu(mục private box hình 34(a) ) giống chức private message o Sao lƣu phục hồi tin nhắn(mục SMS Backup hình 34(a)) phải trả phí o SMS Bolcker  Quản lý số điện thoại blacklist, số đƣợc cập nhật spam, số Whitelist (hình 34(b)) giống với chức Register number as spam hình 34(b)  Block theo Keywords (hình 34(b)) chức chƣơng trình cảm thấy không cần thiết xác định từ thi ngắn hay dài cung không xác định đƣợc nội dung  Block mode hình 34(b)): cho phép chọn kiểu chặn spam giống chức spam setting BK SMS Pro o Block mode (hình 34(c))  Smart mode: kết hợp chặn theo Blacklist, chặn theo keyword, chấp nhận số có danh bạ  Các mode lại thể mode riêng rẽ Nhận xét tính lọc tin rác GO SMS Pro xây dựng chức cho lọc tin nhắn rác hoàn toàn ngây thơ không sử dụng thuật toán để lọc tin nhắn rác Điều dễ hiểu GO SMS Pro phần mềm nƣớc họ đƣợc đặc trƣng tin nhắn rác đất nƣớc khác So sánh với BK SMS Pro tính GO SMS Pro chƣơng trình có, trừ backup khuôn khổ luận văn chƣa xây dựng chức Tuy nhiên việc thực thời gian tới Về mặt lọc tin rác thị trƣờng Việt Nam chƣơng trình luận văn vƣợt trội Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 71  Phần mềm Bkav Mobile Security “Phần mềm bảo vệ SmartPhone tốt (Hiệp hội an toàn thông tin VNISA bình chọn) Phiên Bkav Mobile Security Pro đƣợc trang bị lọc thông minh Smart Filter để tự động chặn tin nhắn rác với tỷ lệ lên đến 100% chặn gọi không mong muốn.” “Với tin nhắn quảng cáo rác đƣợc gửi từ nhiều số điện thoại khác nhau, lọc thông minh đƣợc trang bị phần mềm tự động chặn hoàn toàn Bên cạnh đó, bạn bổ sung chặn tin nhắn theo từ khóa xuất nội dung mà không phụ thuộc vào số điện thoại gửi (content filtering) Để loại bỏ chúng, bạn cần nhập từ khóa đặc trƣng vào lọc nội dung nhƣ “QC”, “bán sim”, “cá cƣợc”, “ lô đề”, “xem bói”… Tất tin nhắn gửi đến có nội dung chứa từ khóa bị chặn lại” Trên lời BKAV website công ty Tuy nhiên thử kểm tra với số tin nhắn rác điển hình BMS không nhạy để lọt số tin nhắn có nội dung rác Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 72 (a) (b) (c) Hình 35: Giao diện chặn rác Bkav Mobile Security Chức BMS Trong khuôn khổ tin nhắn: Chặn spam (Call/Sms) o Danh sách đen hình 35(b) (tƣơng đƣơng block theo số BK SMS Pro) o Chặn số danh bạ (Tƣơng đƣơng chức Block Unknows sender nhiên chức khuyên không nên dùng không hợp lý) o Danh sách trắng (Luôn không chặn) không cần thiết o Chặn theo nội dung hình 34(c) bên có chức không chặn số có danh bạ (với chƣơng trình BK SMS Pro chức mặc định hoạt động ) Nội dung ngƣời dùng nhập o Nhật ký chặn (tƣơng đƣơng folder spam chƣơng trình) Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 73 o Chặn tin nhắn WAP Push (Tuy nhiên cài đặt nhận đƣợc tin nhắn loại này) Vẫn chặn theo nội dung text nhập vào tính chặn theo đầu số BMS chƣơng trình quản lý tin nhắn nên chức chủ yếu chặn từ bên ngƣời dùng thiết lập Học viên thực hiện: Nguyễn Minh Đức – CAC16010 Khóa CLC2016 Trang 74 ... thấy tính cần thiết đem lại tiện ích cho ngƣời sử dụng, đề tài Lọc thông minh tin nhắn rác, tin nhắn quảng cáo thiết bị di động có nhiệm vụ nghiên cứu triển khai phƣơng án lọc tin nhắn rác dựa... ngày tiến thiết bị thông minh trở nên thông dụng hơn, đặc biệt thiết bị di động sử dụng hệ điều hành Android với tính mở cao đơn giản sử dụng làm mƣa làm gió thị trƣờng di động Dịch vụ tin nhắn dịch... quan tâm đến tin tức tài chính, bất động sản tin nhắn mua bán simcard tin nhắn với họ lại tin nhắn quan trọng Đó nội dung mà luận văn hƣớng đến việc tạo lọc cho tin nhắn rác Bộ lọc biết phân

Ngày đăng: 25/07/2017, 21:39

Mục lục

  • CHƯƠNG 1:ĐẶT VẤN ĐỀ

  • CHƯƠNG 2: NỀN TẢNG ANDROID VÀ CƠ CHẾ GỬINHẬN TIN NHẮN SMS

  • CHƯƠNG 3: CÁC BƯỚC TIỀN XỬ LÝ VĂN BẢN

  • CHƯƠNG 4: CÁC THUẬT TOÁN VÀ CÀI ĐẶT TRÊNTHIẾT BỊ ANDROID

  • CHƯƠNG 5: KẾT QUẢ ĐẠT ĐƯỢC

  • TÀI LIỆU THAM KHẢO

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan