Ứng dụng mạng nơron xây dựng thuật toán tự động phát hiện các trang Web đánh cắp thông tin trên mạng (Phishing)

36 321 0
Ứng dụng mạng nơron xây dựng thuật toán tự động phát hiện các trang Web đánh cắp thông tin trên mạng (Phishing)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ GIAO THÔNG VẬN TẢI TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM Nguyễn Lương Anh Tuấn NG ỤNG MẠNG N RON X Y NG THUẬT TO N T ĐỘNG PHÁT HIỆN C C TRANG W Đ NH CẮP TH NG TIN TR N MẠNG (PHISHING) Chuyên Ngành: Kỹ thuật điều khiển Tự động hóa Mã số: 62.52.02.16 TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT TP HỒ CHÍ MINH – 2016 Công trình hoàn thành tại: Trường Đại học Giao thông vận tải TP.HCM Người hướng dẫn khoa học: PGS.TS Nguyễn Hữu Khương Phản biện 1: PGS.TS Phạm Ngọc Tiệp – Đại học Hàng hải Việt Nam Phản biện 2: PGS.TS Nguyễn Thanh Phương – Đại học Công nghệ TP.HCM Phản biện 3: TS Võ Công Phương - Đại học Giao thông vận tải TP.HCM Luận án bảo vệ trước Hội đồng chấm luận án họp tại: Trường Đại học Giao thông vận tải TP.HCM Vào lúc: ngày tháng năm Có thể tìm hiểu luận án thư viện: - Thư viện Khoa học Tổng hợp Tp HCM - Thư viện Trường Đại học Giao thông vận tải TP.HCM CHƯ NG GIỚI THIỆU Mục đích đối tượng nghiên cứu luận án Mục đích chung nghiên cứu luận án phân tích đối tượng, xác định sở lý luận, phát triển, thiết kế xây dựng mô hình nơron mờ đáp ứng hệ thống trình có đặc trưng ngõ vào không ổn định (chẳng hạn như, phát sinh thêm đặc trưng giảm bớt đặc trưng vừa thêm vừa giảm đặc trưng) ứng dụng xây dựng hệ thống tự động nhận dạng trang web phishing Đối tượng nghiên cứu trình tự động nhận dạng trang web phishing Để phục vụ cho việc nghiên cứu đối tượng này, luận án cần phải nghiên cứu vấn đề sau: Mạng nơron, lý thuyết mờ, mạng nơrơn mờ, trang web phishing, Web service Add-on trình duyệt web Firefox Các phương pháp nghiên cứu sử dụng - Thu thập, phân tích, tổng hợp tài liệu, kết nghiên cứu tác giả khác công bố nước liên quan đến luận án - Nghiên cứu lý thuyết: Phân tích vấn đề nghiên cứu sở lý thuyết mạng nơron, logic mờ mạng nơrơn mờ Tìm hiểu phân tích đối tượng nhận dạng trang web phishing - Nghiên cứu thực nghiệm: Thu thập tập mẫu, lập trình thuật toán để thực nghiệm biểu diễn kết nghiên cứu cách trực quan - So sánh phân tích kết nghiên cứu với công trình liên quan khác ố cục luận án Luận án bao gồm chương tổ chức thành phần Phần giới thiệu tổng quan sở lý thuyết Phần trình bày đóng góp luận án Phần kết luận chung hướng phát triển Phần bao gồm chương Chương giới thiệu tổng quan luận án Chương giới thiệu mô hình mờ, mạng nơron mô hình nơron mờ Chương giới thiệu trang web giả mạo, đặc trưng trang web giả mạo (trang web phishing) công trình liên quan đến việc nhận dạng trang web phishing Phần bao gồm chương Chương trình bày đề xuất phương pháp tự động hóa trình nhận dạng trang web phishing dựa vào điều khiển sử dụng mô hình nơron mờ với kết thực nghiệm so sánh với phương pháp công bố trước Chương trình bày đề xuất điều khiển sử dụng dạng mô hình nơron mờ tổng quan luận án nghiên cứu phát triển đề áp dụng cho toán nhận dạng khác Chương trình bày hệ thống nhận dạng tự động trang web phishing trực tuyến hệ thống phần mềm add-on nhúng vào trình duyệt web sở kết nghiên cứu luận án Phần trình bày kết luận chung mà luận án đạt hướng phát triển luận án CHƯ NG M HÌNH N RON MỜ NHẬN ẠNG NG ỤNG TRONG Trong chương này, trình bày nghiên cứu tổng quan lý thuyết mờ, mạng nơron mạng nơron mờ lai ứng dụng nhận dạng CHƯ NG GIỚI THIỆU PHISHING “Phishing” tạo hai từ “Phreaking” “fishing”, “Phreaking” định nghĩa từ “Phone” “breaking”, có nghĩa lừa người khác để sử dụng điện thoại mà trả phí Do đó, phishing hiểu hành động “câu” nạn nhân vào trang web giả mạo để đánh cắp thông tin cá nhân mật mã, tài khoản ngân hàng, thẻ tín dụng, v.v thông qua việc gửi email, gửi tin nhắn cho người dùng đưa yêu cầu “xác nhận thông tin” hay “cập nhật thông tin”, người dùng click vào liên kết trang web, trang web giả mạo có giao diện giống trang web thật mở làm người dùng không nghi ngờ nhập thông tin cá nhân vào, sau đó, thông tin cá nhân gửi đến email hay server người tạo trang web giả mạo [24, 36] Theo tổ chức APWG (Anti-Phishing Working Group) [22], Hình 3.1 trình bày báo cáo số lượng trang web phishing quý năm 2014 Hình 3.1 - Số trang web phishing quý năm 2014 Cách thức đánh lừa người dùng trang web phishing sử dụng liên kết (URL) gần giống với trang web thật thiết kế giao diện trang web giả giống trang web thật, chí đường liên kết bên nội dung dẫn đến trang web thật làm cho người dùng tin tưởng không chút nghi ngờ 3.1 Các công trình liên quan Trong phần này, luận án bàn luận phương pháp nhận dạng trang web phishing tác giả khác giới, đồng thời đánh giá ưu điểm khuyết điểm phương pháp Sau đó, so sánh kết thực nghiệm phương pháp với phương pháp đề xuất luận án 3.2 Đặc trưng trang web phishing Trong phần này, luận án trình bày loại đặc trưng có trang web phishing mà đa số tác giả khác giới sử dụng để nhận dạng trang web phishing Từ trình phân tích đặc trưng này, luận án đóng góp đặc trưng giúp nhận dạng trang web phishing hiệu 3.3 Kết luận chương Hiện nay, kỹ thuật tạo trang web có giao diện giống trang web khác dễ dàng, chí dùng hình ảnh, video, âm thanh, v.v từ trang web thật để đưa vào trang web phishing Vì vậy, nhận dạng trang web phishing dựa vào đặc trưng nội dung không hiệu Luận án tìm đóng góp số đặc trưng dựa vào địa web giúp cho việc nhận dạng hiệu quả, đặc trưng trình bày cụ thể chương Một số đặc trưng trang web phishing đến không ý nghĩa nữa, cá nhân hay tổ chức tạo trang web phishing luôn thay đổi để đánh lừa người dùng tránh bị nhận dạng công cụ Vì vậy, phương pháp nhận dạng trang web phishing phải đáp ứng với thay đổi đặc trưng phương pháp hiệu tổng quan CHƯ NG ĐỀ XUẤT C C PHƯ NG PH P T ĐỘNG HÓA QUÁ TRÌNH NHẬN ẠNG PHISHING Chương trình bày đóng góp luận án Trước tiên, luận án đề xuất số đặc trưng hiệu cho việc nhận dạng phishing Sau đó, luận án đề xuất năm phương pháp tự động hóa trình nhận dạng phishing đồng thời sử dụng đặc trưng đề xuất để thực nghiệm phương pháp Năm phương pháp nhận dạng đề xuất luận án là:  Phương pháp tự động nhận dạng phishing với điều khiển sử dụng đặc trưng heuristic  Phương pháp tự động nhận dạng phishing với điều khiển sử dụng lý thuyết mờ  Phương pháp tự động nhận dạng phishing với điều khiển sử dụng mạng nơron đơn lớp  Phương pháp tự động nhận dạng phishing với điều khiển sử dụng mô hình nơron mờ lớp không dùng tập luật If-Then  Phương pháp tự động nhận dạng phishing với điều khiển sử dụng mô hình nơron mờ lớp không dùng tập luật If-Then, hàm liên thuộc loại bỏ hết tham số, thuật toán luyện mạng với tỷ lệ học thích nghi, giá trị ngõ vào mạng nơron chuẩn hóa cách sử dụng phần mờ mô hình nơron mờ Trong phương pháp mà luận án đóng góp nêu phương pháp tự động nhận dạng phishing với điều khiển sử dụng mô hình nơron mờ lớp mục tiêu đề luận án 4.1 Các đặc trưng đề xuất luận án Trong nghiên cứu trước vài tác giả sử dụng đặc trưng URL đóng vai trò thứ yếu [66] Luận án đề xuất số đặc trưng dựa vào URL kết hợp với chức tìm kiếm Suggestion công cụ tìm kiếm mạnh Internet Google Trong luận án này, NCS đề xuất đặc trưng để nhận dạng trang web phishing hiệu PrimaryDomain, SubDomain, PathDomain, AlexaRank, AlexaReputation, GoogleIndex, BackLink 4.2 Phương pháp tự động nhận dạng phishing với điều khiển sử dụng đặc trưng heuristic Phương pháp tính giá trị hệ thống cách sử dụng giá trị heuristic trọng số chúng, sau dùng giá trị hệ thống so sánh với ngưỡng nhận dạng trang web phishing xác định phương pháp thống kê thừ sai để xác định trang web trang web phishing trang web thật Mỗi heuristic đặc trưng sử dụng cho hệ thống Phương pháp trình bày công trình nghiên cứu sinh [CT8, CT9] 4.2.1 Mô hình hệ thống Mô hình hệ thống thực qua giai đoạn trình bày hình 4.1  Giai đoạn 1: Chọn heuristic sử dụng cho hệ thống  Giai đoạn 2: Tính giá trị cho heuristic  Giai đoạn 3: Tính giá trị hệ thống (vs – value of system) Trong giai đoạn này, giá trị hệ thống tính theo công thức (4.1) N vs Vi *Wi (4.1) i Ở đây, Vi giá trị heuristic tính giai đoạn Wi trọng số cho heuristic Các trọng số Wi xác định dựa vào kinh nghiệm chuyên gia khai thác liệu tập liệu huấn luyện Hình 4.1 - Mô hình hệ thống phương pháp tự động nhận dạng phishing với điều khiển sử dụng đặc trưng heuristic  Giai đoạn 4: So sánh giá trị hệ thống vs với ngưỡng nhận dạng trang web phishing Hệ thống so sánh giá trị vs với ngưỡng nhận dạng trang web phishing (ngưỡng nhận dạng trang web phishing xác định trình thực nghiệm) để định trang web phishing hay không, thuật toán thực trình bày hình 4.2 Giá trị ngưỡng xác định dựa vào tập mẫu If vs < ngưỡng then “Trang web phishing ” else “Trang web thật” End if Hình 4.2 - Thuật toán xác định kết nhận dạng theo ngưỡng 4.2.2 Thực nghiệm 4.2.2.1 Dữ liệu thực nghiệm Dữ liệu thực nghiệm nghiên cứu nghiên cứu sinh tập hợp 11.660 trang web phishing từ Phishtank [75] 5.000 trang web thật từ DMOZ [33] Quá trình thực nghiệm thực phần mềm lập trình ngôn ngữ PHP tập liệu quản lý hệ quản trị sở liệu MYSQL 4.2.2.2 Kết thực nghiệm Kết thực nghiệm đánh giá theo hai phương pháp sai số RMSE (Root Mean Square Error – sai số bình phương trung bình) theo ROC (Receiver Operating Characteristics), sau so sánh với phương pháp khác  Kết thực nghiệm đánh giá theo sai số RMSE Kết thực nghiệm đánh giá theo sai số RMSE đạt tỷ lệ nhận dạng xác 97,161%  Kết thực nghiệm đánh giá theo sai số ROC Kết thực nghiệm tập liệu kiểm tra trình bày bảng 4.1 Bảng 4.1 - Kết tỷ lệ nhận dạng theo ROC phương pháp tự động nhận dạng phishing với điều khiển sử dụng đặc trưng heuristic Tỷ lệ Tỷ lệ Tỷ lệ Tỷ lệ Tỷ lệ “True “False “True “False trung Positive” Positive” Negative” Negative” bình 97,10% 2,80% 97,20% 2,90% 97,15% 97,81% 1,71% 98,29% 2,19% 98,05% 96,54% 2,23% 97,77% 3,46% 97,15% 97,69% 2,88% 97,12% 2,31% 97,40% 95,63% 1,55% 98,45% 4,37% 97,00% Tập liệu kiểm tra Để đánh giá hiệu nhận dạng mức độ kém, hay tốt, luận án sử dụng đồ thị ROC mô tả hình 4.3 Hình 4.3 - Đánh giá kết tỷ lệ theo ROC  So sánh kết thực nghiệm với phương pháp [82] Từ kết nhận dạng phương pháp biểu diễn thông qua đồ thị ROC hình 4.4 4.5, nhận thấy hiệu nhận dạng phương pháp [82] phương pháp sử dụng đặc trưng heuristic Hình 4.4 - Đồ thị ROC so sánh tỷ lệ nhận dạng trang web phishing phương pháp tự động nhận dạng với điều khiển sử dụng đặc trưng heuristic phương pháp [82] Hình 4.5 - Đồ thị ROC so sánh tỷ lệ nhận dạng trang web thật phương pháp tự động nhận dạng với điều khiển sử dụng đặc trưng heuristic phương pháp [82] 4.2.3 Thảo luận Phương pháp tự động nhận dạng phishing với điều khiển sử dụng đặc trưng heuristic tính toán đơn giản, tốc độ tính toán nhanh, thuật toán dễ cài đặt với độ phức tạp thuật toán O(n) hiệu tốt với tỷ lệ nhận dạng khoảng 97% tỷ lệ nhận dạng sai khoảng 3% Hơn nữa, thực nghiệm nhận dạng online ảnh hưởng nhiều yếu tố tốc độ đường truyền Internet, thời gian truy xuất API, v.v thời gian nhận dạng chưa đến giây đáp ứng yêu cầu thời gian thực hệ thống online Tuy nhiên, phương pháp tồn vài khuyết điểm cần nghiên cứu phát triển thêm vấn đề xác định trọng số đặc trưng ngưỡng nhận dạng trang web phishing dựa vào phương pháp thử sai phụ thuộc vào kinh nghiệm chuyên gia phụ thuộc vào việc khai thác tập liệu mẫu 4.3 Phương pháp tự động nhận dạng phishing với điều khiển sử dụng lý thuyết mờ Theo lý thuyết mờ, điều khiển mờ thông thường phải có khối sau: khối mờ hóa, khối luật suy diễn, khối tổng hợp luật khối giải mờ Tuy nhiên, phương pháp tự động nhận dạng phishing với điều khiển sử dụng lý thuyết mờ này, nghiên cứu sinh kết hợp hai khối mờ hóa khối luật suy diễn thành khối cách sử dụng hàm liên thuộc để xác định mức độ thuộc đặc trưng vào trực tiếp tập kết KQ bao gồm Phishing Legitimate (trong Phishing trang web phishing Legitimate trang web thật) Do đó, phương pháp không cần xây dựng khối luật suy diễn If-Then xác định mức độ thuộc vào tập kết KQ dựa vào giá trị mờ đặc trưng Mỗi đặc trưng có biến ngôn ngữ Phishing Legitimate, biến ngôn ngữ có hàm liên thuộc để tính giá trị mờ Kế tiếp, nghiên cứu sinh xây dựng khối tổng hợp mức độ thuộc tất đặc trưng kết Phishing tổng hợp mức độ thuộc tất đặc trưng kết Legitimate Sau cùng, so sánh giá trị mức độ thuộc tổng hợp để xác định trang web trang web phishing trang web thật Phương pháp không dùng khối giải mờ mục đích kết nhận dạng trang web phishing trang web thật, dựa vào kết nhận dạng hệ thống điều khiển trình duyệt web Phương pháp trình bày công trình nghiên cứu sinh [CT7] 4.3.1 Mô hình hệ thống Mô hình hệ thống phương pháp bao gồm giai đoạn mô tả hình 4.6  Giai đoạn 1: Chọn đặc trưng sử dụng cho hệ thống PrimaryDomain, SubDomain, PathDomain, PageRank, AlexaRank, AlexaReputation  Giai đoạn 2: Tiền xử lý tính giá trị cho đặc trưng  Giai đoạn 3: Tính giá trị mờ hay gọi tính mức độ thuộc đặc trưng vào hai biến ngôn ngữ Phishing Legitimate cách sử dụng hàm liên thuộc s-shaped z-shaped theo công thức (4.2) (4.3) Hai biến ngôn ngữ tập kết KQ cần nhận dạng hệ thống Do vậy, hệ thống không cần sử dụng tập luật suy diễn If-Then mà xác định mức độ thuộc đặc trưng vào tập kết KQ Trong trình nghiên cứu tính chất đặc trưng, nghiên cứu sinh nhận thấy đặc trưng có chung đặc điểm giá trị đặc trưng vượt ngưỡng giá trị có xu hướng trang web phishing trang web thật giá trị đặc trưng nhỏ ngưỡng giá trị ngược lại Do vậy, hàm liên thuộc dùng để tính giá trị mờ cho đặc trưng phải có đồ thị dạng hình chữ s z phù hợp 20 - Hàm liên thuộc nên loại bỏ hết tham số làm tăng thêm tính khách quan cho việc xử lý kết đạt 4.6 Phương pháp tự động nhận dạng phishing với điều khiển sử dụng mô hình nơron mờ lớp Mô hình nơron mờ phương pháp bao gồm lớp phát triển từ mô hình nơron mờ lớp, kế thừa tất ưu điểm mô hình nơron mờ lớp khắc phục khuyết điểm mô hình nơron mờ lớp cách sử dụng phép tính mờ để tổng hợp giá trị mờ biến ngôn ngữ giai đoạn tổng hợp mức độ thuộc đặc trưng vào tập kết KQ nhằm làm tăng hiệu tính toán, đồng thời loại bỏ tất tham số hàm liên thuộc làm tăng tính khách quan tính giá trị mờ cho biến ngôn ngữ Trong mô hình nơron mờ lớp này, sử dụng khối hệ thống mờ để chuẩn hóa liệu ngõ vào cho mạng nơron trước luyện mạng nơron nhằm làm tăng hiệu luyện mạng, tránh tối ưu cục làm tăng tính hội tụ luyện mạng Tỷ lệ học trình luyện mạng sử dụng tỷ lệ học thích nghi Phương pháp trình bày công trình nghiên cứu sinh [CT1, CT2, CT5] 4.6 Mô hình hệ thống Mô hình hệ thống bao gồm giai đoạn thể hình 4.18 Hình 4.18 - Mô hình hệ thống phương pháp tự động nhận dạng phishing với điều khiển sử dụng mô hình nơron mờ lớp  Giai đoạn 1: Trích lọc đặc trưng PrimaryDomain, SubDomain, PathDomain, PageRank, GoogleIndex, BackLink  Giai đoạn 2: Tiền xử lý tính giá trị đặc trưng Giá trị đặc trưng tính đoạn [0, 1] 21  Giai đoạn 3: Sử dụng mô hình nơron mờ lớp để tính giá trị hệ thống (xem chi tiết mục 4.6.2 4.6.3)  Giai đoạn 4: Xác định kết nhận dạng dựa vào kết xuất mạng nơron mờ ngưỡng 4.6.2 Bộ điều khiển sử dụng mô hình nơron mờ lớp Mô hình nơron mờ lớp bao gồm hai phần, phần đầu phần mờ phần sau mạng nơron đơn lớp Trong đó, phần đầu bao gồm lớp thứ nhất, lớp thứ hai lớp thứ ba; phần sau mạng nơron đơn lớp bao gồm lớp thứ tư lớp thứ năm Mô hình nơron mờ mô tả hình 4.19 Hình 4.19 - Mô hình nơron mờ lớp Lớp thứ bao gồm N nút N đặc trưng Mỗi nút có biến ngôn ngữ Phishing (trang web phishing) Legitimate (trang web thật) Giá trị N đặc trưng đoạn từ 0-1 tính trình tiền xử lý Hình 4.20 mô tả ý nghĩa giá trị đặc trưng lớp thứ Lớp thứ hai bao gồm 2*N nút, N nút thuộc biến ngôn ngữ Phishing tính theo công thức hàm liên thuộc left sigmoid (4.8) N nút thuộc biến ngôn ngữ Legitimate tính theo công thức hàm liên thuộc right sigmoid (4.9) Giá trị nút lớp thứ đoạn từ 0-1 ánh xạ sang đoạn từ Min- 22 Max theo công thức (4.10) trước đưa vào hàm liên thuộc tính toán tính chất đặc trưng hàm liên thuộc P( x) L( x ) e x e 1 e (4.8) x (4.9) x Valuenew Valueold *(Max Min) Min (4.10) Ở đây, Valueold giá trị đặc trưng đoạn từ 0-1, Min Max giá trị người thiết kế mô hình xác định cho phù hợp Hình 4.20 - Biểu thị ý nghĩa giá trị nút lớp thứ Hình 4.21 biểu diễn đồ thị hàm liên thuộc right sigmoid L(x) hình 4.22 biểu diễn đồ thị hàm liên thuộc left sigmoid P(x) Hình 4.21 - Đồ thị hàm liên thuộc right sigmoid L(x) cho mô hình nơron mờ lớp Hình 4.22 - Đồ thị hàm liên thuộc left sigmoid P(x) cho mô hình nơron mờ lớp Lớp thứ ba bao gồm nút πp πL , nút πp tổng hợp nút Pi lớp thứ hai nút πL tổng hợp nút Li lớp thứ hai theo phép toán AND Giá trị nút lớp tính theo công thức (4.11) (4.12) [23] 23 N P Pi (4.11) Li (4.12) i N L i Lớp thứ tư bao gồm nút, nút NP NL chuẩn hóa giá trị theo công thức (4.13) (4.14) Lớp lớp thứ kết hợp lại thành mạng nơron đơn lớp (SingleLayer) lớp lớp nhập mạng nơron, giá trị nút chuẩn hóa làm tăng hiệu tính hội tụ mạng nơron P NP (4.13) P L L NL (4.14) P L Lớp thứ năm bao gồm nút, nút xuất kết nút kết mô hình Mạng nơron mô hình sử dụng hàm tác động hàm sigmoid theo công thức (4.15) O 1 e x (4.15) 4.6.3 Thuật toán luyện mạng cho mô hình nơron mờ lớp Thuật toán luyện mạng thuật toán lan truyền ngược sai số [44], thuật toán thực giai đoạn lan truyền tiến lan truyền ngược thể hình 4.24 4.6.4 Thực nghiệm 4.6.4.1 Dữ liệu thực nghiệm Giống phần 4.2.2.1 4.6.4.2 Kết thực nghiệm  Kết thực nghiệm đánh giá theo sai số RMSE Kết thực nghiệm đánh giá theo sai số RMSE đạt tỷ lệ nhận dạng xác 99,30%  Kết thực nghiệm đánh giá theo ROC Kết thực nghiệm tập liệu kiểm tra trình bày bảng 4.5 24 Bảng 4.5 – Kết tỷ lệ nhận dạng theo ROC phương pháp nơron mờ lớp Tập liệu kiểm tra Tỷ lệ “True Positive” Tỷ lệ “False Positive” Tỷ lệ “True Negative” Tỷ lệ “False Negative” Tỷ ệ trung bình 99,42% 0,66% 99,34% 0,58% 99,38% 99,20% 0,60% 99,40% 0,80% 99,30% 99,24% 0,62% 99,38% 0,76% 99,31% 99,22% 0,74% 99,26% 0,78% 99,24% 99,46% 0,68% 99,32% 0,54% 99,39%  So sánh kết thực nghiệm với phương pháp khác Trong phần sử dụng 100 tập liệu kiểm tra phát sinh ngẫu nhiên, kết thực nghiệm phương pháp so sánh với mô tả hình 4.23 Hình 4.23 - So sánh kết thực nghiệm phương pháp tự động nhận dạng phishing với điều khiển sử dụng mô hình nơron mờ lớp với phương pháp khác 4.6.5 Thảo luận Phương pháp tự động nhận dạng phishing với điều khiển sử dụng mô hình nơron mờ lớp không dựa vào tập luật If-Then nhằm mục đích ứng dụng cho hệ thống có đặc trưng ngõ vào không ổn định không phụ thuộc tri thức chuyên gia xây dựng tập luật If-Then Quá trình luyện mạng phương pháp thực off-line, trình nhận dạng thực online với tính toán đơn giản, tốc độ tính toán nhanh với độ phức tạp thuật toán O(n), hiệu tốt với tỷ lệ nhận dạng khoảng 99,3% tỷ lệ nhận dạng sai khoảng 0,7% Hơn nữa, thực nghiệm nhận dạng online ảnh hưởng nhiều yếu tố tốc độ đường truyền Internet, thời gian truy xuất API, v.v thời gian nhận dạng chưa đến giây Tuy nhiên, phương pháp số điểm cần phát triển để hoàn thiện hơn: 25 - Cải tiến thuật toán luyện mạng tối ưu nhằm tăng hiệu mạng - Mở rộng mô hình cho sử dụng nhiều biến ngôn ngữ - Phát triển thành mô hình ứng dụng cho nhiều toán nhận dạng khác Khởi tạo trọng số tham số bias Trích đặc trưng tập liệu huấn luyện tính giá trị cho đặc trưng lớp Tính giá trị mờ cho đặc trưng lớp Tính giá trị cho nút lớp Chuẩn hóa giá trị cho nút lớp Tính giá trị nhập xuất cho nút xuất Tính lỗi cho nút xuất Tính lỗi hệ thống Lỗi hệ thống [...]... Luận án xây dựng một hệ thống nhận dạng tự động trang web phishing trực tuyến để điều khiển trình duyệt web hỗ trợ người dùng tránh được các trang web phishing Hệ thống này là một phần mềm dạng Add-on được nhúng vào trình duyệt web Hệ thống hoạt động như sau: Khi người dùng nhập vào địa chỉ một trang web để xem, hệ thống sẽ truyền địa chỉ trang web này xuống Web Service, Web Service chứa mô hình nơron. .. được các đặc trưng mới để nhận dạng trang web phishing hiệu quả, đồng thời xây dựng các thuật toán tổng quan tiền xử lý giá trị cho các đặc trưng 2 Thiết kế các thuật toán cho 3 phương pháp nhận dạng phishing đó là phương pháp nhận dạng sử dụng heuristic, phương pháp nhận dạng sử dụng lý thuyết mờ và phương pháp nhận dạng sử dụng mạng nơron Cả 3 phương pháp này mang lại hiệu quả tốt và làm tiền đề để xây. .. thích hợp để ứng dụng Cấu trúc mô hình nơron mờ 5 lớp này bao gồm hai khối: phần đầu là khối mô hình mờ, phần sau là khối mạng nơron đơn lớp Ngõ vào của mạng norơn đơn lớp là các giá trị mờ được tính thông qua khối mô hình mờ giúp cho quá trình luyện mạng nhanh hội tụ và hiệu quả hơn Thuật toán luyện mạng là thuật toán lan truyền ngược sai số với tỷ lệ học thích nghi Kết quả xuất của mạng nơron cũng... nghiệm giữa phương pháp [105] và phương pháp sử dụng mạng nơron đơn lớp được trình bày trong hình 4.11 Hình 4.11 - So sánh kết quả thực nghiệm giữa phương pháp [105] và phương pháp sử dụng mạng nơron đơn lớp 4.4.4 Thảo luận Phương pháp tự động nhận dạng phishing với bộ điều khiển sử dụng mạng nơron đơn lớp đã ứng dụng được khả năng học của mạng nơron để xác định các trọng số tối 14 ưu cho từng đặc trưng... dụng lý thuyết mờ để đưa tri thức vào ngõ vào của nơron nhằm biến các nơron đầu vào thành nơron mờ” trước khi đưa vào mạng nơron Nhờ vậy, làm tăng tốc độ học và quá trình luyện mạng của mạng nơron Đồng thời, vì mô hình nơron mờ 4 lớp kế thừa các ưu điểm của bộ điều khiển sử dụng lý thuyết mờ không dựa vào tập luật nên khi có sự thay đổi các đặc trưng ngõ vào thì vẫn giữ nguyên cấu trúc mô hình nơron. .. tốt và làm tiền đề để xây dựng các mô hình nơron mờ 3 Luận án đề xuất bộ điều khiển sử dụng mô hình nơron mờ 4 lớp không dựa vào tập luật với nhiều cách sử dụng hàm liên thuộc khác nhau Trong mô hình này, phần đầu là khối mô hình mờ và phần sau là khối mạng nơron 3 lớp, ngõ vào của mạng nơron này là các giá trị mờ được tính thông qua khối mô hình mờ, kết quả xuất của mạng nơron chính là kết quả của... dạng 4 Dựa trên nền tảng bộ điều khiển sử dụng mô hình nơron mờ 4 lớp, nghiên cứu sinh xây dựng bộ điều khiển sử dụng mô hình nơron mờ 5 lớp không dựa vào tập luật và loại bỏ các tham số của hàm liên thuộc Mô hình nơron mờ 5 lớp này có 4 dạng khác nhau để có thể ứng dụng cho các bài toán nhận dạng tổng quát khác nhau, tùy vào yêu cầu phân tích từng bài toán mà chúng ta chọn dạng mô hình nơron mờ 5... 4.6.3 Thuật toán luyện mạng cho mô hình nơron mờ 5 lớp Thuật toán luyện mạng là thuật toán lan truyền ngược sai số [44], thuật toán này thực hiện 2 giai đoạn lan truyền tiến và lan truyền ngược được thể hiện trong hình 4.24 4.6.4 Thực nghiệm 4.6.4.1 Dữ liệu thực nghiệm Giống phần 4.2.2.1 4.6.4.2 Kết quả thực nghiệm  Kết quả thực nghiệm được đánh giá theo sai số RMSE Kết quả thực nghiệm được đánh giá... của luận án là xây dựng một hệ thống phần mềm trực tuyến được nhúng vào trình duyệt web và để điều khiển trình duyệt web dựa vào kết quả nhận dạng trang web phishing Do vậy, để đáp ứng đúng mục tiêu được đề ra, mô hình tổng quan của hệ thống ứng dụng tự động nhận dạng trang web phishing trực tuyến được cấu trúc như trong hình 6.1 Trình duyệt web Điều khiển Add-on URL URL Kết quả nhận dạng Web Service... thuyết mờ và mạng nơron thành mô hình nơron mờ lai nhằm khắc phục khuyết điểm của từng phương pháp riêng biệt, nghiên cứu sinh kết hợp phương pháp tự động nhận dạng phishing với bộ điều khiển sử dụng lý thuyết mờ không dựa vào tập luật (trình bày mục 4.3) với phương pháp sử dụng mạng nơron thành phương pháp tự động nhận dạng phishing với bộ điều khiển sử dụng mô hình nơron mờ 4 lớp Mô hình nơron mờ 4 ... kết mô hình Mạng nơron mô hình sử dụng hàm tác động hàm sigmoid theo công thức (4.15) O 1 e x (4.15) 4.6.3 Thuật toán luyện mạng cho mô hình nơron mờ lớp Thuật toán luyện mạng thuật toán lan truyền... để xác định trang web phishing theo thuật toán trình bày hình 4.7 If MP > ML then Trang web phishing ” else Trang web thật” End if Hình 4.7 - Thuật toán xác định kết phương pháp tự động nhận... chương Hiện nay, kỹ thuật tạo trang web có giao diện giống trang web khác dễ dàng, chí dùng hình ảnh, video, âm thanh, v.v từ trang web thật để đưa vào trang web phishing Vì vậy, nhận dạng trang web

Ngày đăng: 31/03/2016, 14:38

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan