Mục đích chung nghiên cứu của luận án là phân tích đối tượng, xác định cơ sở lý luận, phát triển, thiết kế và xây dựng mô hình nơron mờ đáp ứng các hệ thống hoặc quá trình có các đặc trưng ngõ vào không ổn định (chẳng hạn như, phát sinh thêm các đặc trưng mới hoặc giảm bớt các đặc trưng hoặc vừa thêm vừa giảm các đặc trưng) và ứng dụng xây dựng hệ thống tự động nhận dạng trang web phishing.
BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ GIAO THÔNG VẬN TẢI TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM Nguyễn Lương Anh Tuấn NG ỤNG MẠNG N RON X Y NG THUẬT TO N T ĐỘNG PHÁT HIỆN C C TRANG W Đ NH CẮP TH NG TIN TR N MẠNG (PHISHING) Chuyên Ngành: Kỹ thuật điều khiển Tự động hóa Mã số: 62.52.02.16 TĨM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT TP HỒ CHÍ MINH – 2016 Cơng trình hồn thành tại: Trường Đại học Giao thơng vận tải TP.HCM Người hướng dẫn khoa học: PGS.TS Nguyễn Hữu Khương Phản biện 1: PGS.TS Phạm Ngọc Tiệp – Đại học Hàng hải Việt Nam Phản biện 2: PGS.TS Nguyễn Thanh Phương – Đại học Công nghệ TP.HCM Phản biện 3: TS Võ Công Phương - Đại học Giao thông vận tải TP.HCM Luận án bảo vệ trước Hội đồng chấm luận án họp tại: Trường Đại học Giao thông vận tải TP.HCM Vào lúc: ngày tháng năm Có thể tìm hiểu luận án thư viện: - Thư viện Khoa học Tổng hợp Tp HCM - Thư viện Trường Đại học Giao thông vận tải TP.HCM CHƯ NG GIỚI THIỆU Mục đích đối tượng nghiên cứu luận án Mục đích chung nghiên cứu luận án phân tích đối tượng, xác định sở lý luận, phát triển, thiết kế xây dựng mơ hình nơron mờ đáp ứng hệ thống trình có đặc trưng ngõ vào khơng ổn định (chẳng hạn như, phát sinh thêm đặc trưng giảm bớt đặc trưng vừa thêm vừa giảm đặc trưng) ứng dụng xây dựng hệ thống tự động nhận dạng trang web phishing Đối tượng nghiên cứu q trình tự động nhận dạng trang web phishing Để phục vụ cho việc nghiên cứu đối tượng này, luận án cần phải nghiên cứu vấn đề sau: Mạng nơron, lý thuyết mờ, mạng nơrơn mờ, trang web phishing, Web service Add-on trình duyệt web Firefox Các phương pháp nghiên cứu sử dụng - Thu thập, phân tích, tổng hợp tài liệu, kết nghiên cứu tác giả khác cơng bố ngồi nước liên quan đến luận án - Nghiên cứu lý thuyết: Phân tích vấn đề nghiên cứu sở lý thuyết mạng nơron, logic mờ mạng nơrơn mờ Tìm hiểu phân tích đối tượng nhận dạng trang web phishing - Nghiên cứu thực nghiệm: Thu thập tập mẫu, lập trình thuật tốn để thực nghiệm biểu diễn kết nghiên cứu cách trực quan - So sánh phân tích kết nghiên cứu với cơng trình liên quan khác ố cục luận án Luận án bao gồm chương tổ chức thành phần Phần giới thiệu tổng quan sở lý thuyết Phần trình bày đóng góp luận án Phần kết luận chung hướng phát triển Phần bao gồm chương Chương giới thiệu tổng quan luận án Chương giới thiệu mơ hình mờ, mạng nơron mơ hình nơron mờ Chương giới thiệu trang web giả mạo, đặc trưng trang web giả mạo (trang web phishing) cơng trình liên quan đến việc nhận dạng trang web phishing Phần bao gồm chương Chương trình bày đề xuất phương pháp tự động hóa q trình nhận dạng trang web phishing dựa vào điều khiển sử dụng mơ hình nơron mờ với kết thực nghiệm so sánh với phương pháp công bố trước Chương trình bày đề xuất điều khiển sử dụng dạng mơ hình nơron mờ tổng quan luận án nghiên cứu phát triển đề áp dụng cho toán nhận dạng khác Chương trình bày hệ thống nhận dạng tự động trang web phishing trực tuyến hệ thống phần mềm add-on nhúng vào trình duyệt web sở kết nghiên cứu luận án Phần trình bày kết luận chung mà luận án đạt hướng phát triển luận án CHƯ NG M HÌNH N RON MỜ NHẬN ẠNG NG ỤNG TRONG Trong chương này, trình bày nghiên cứu tổng quan lý thuyết mờ, mạng nơron mạng nơron mờ lai ứng dụng nhận dạng CHƯ NG GIỚI THIỆU PHISHING “Phishing” tạo hai từ “Phreaking” “fishing”, “Phreaking” định nghĩa từ “Phone” “breaking”, có nghĩa lừa người khác để sử dụng điện thoại mà trả phí Do đó, phishing hiểu hành động “câu” nạn nhân vào trang web giả mạo để đánh cắp thông tin cá nhân mật mã, tài khoản ngân hàng, thẻ tín dụng, v.v thơng qua việc gửi email, gửi tin nhắn cho người dùng đưa yêu cầu “xác nhận thông tin” hay “cập nhật thông tin”, người dùng click vào liên kết trang web, trang web giả mạo có giao diện giống trang web thật mở làm người dùng không nghi ngờ nhập thơng tin cá nhân vào, sau đó, thơng tin cá nhân gửi đến email hay server người tạo trang web giả mạo [24, 36] Theo tổ chức APWG (Anti-Phishing Working Group) [22], Hình 3.1 trình bày báo cáo số lượng trang web phishing quý năm 2014 Hình 3.1 - Số trang web phishing quý năm 2014 Cách thức đánh lừa người dùng trang web phishing sử dụng liên kết (URL) gần giống với trang web thật thiết kế giao diện trang web giả giống trang web thật, chí đường liên kết bên nội dung dẫn đến trang web thật làm cho người dùng tin tưởng không chút nghi ngờ 3.1 Các cơng trình liên quan Trong phần này, luận án bàn luận phương pháp nhận dạng trang web phishing tác giả khác giới, đồng thời đánh giá ưu điểm khuyết điểm phương pháp Sau đó, so sánh kết thực nghiệm phương pháp với phương pháp đề xuất luận án 3.2 Đặc trưng trang web phishing Trong phần này, luận án trình bày loại đặc trưng có trang web phishing mà đa số tác giả khác giới sử dụng để nhận dạng trang web phishing Từ trình phân tích đặc trưng này, luận án đóng góp đặc trưng giúp nhận dạng trang web phishing hiệu 3.3 Kết luận chương Hiện nay, kỹ thuật tạo trang web có giao diện giống trang web khác dễ dàng, chí dùng hình ảnh, video, âm thanh, v.v từ trang web thật để đưa vào trang web phishing Vì vậy, nhận dạng trang web phishing dựa vào đặc trưng nội dung khơng hiệu Luận án tìm đóng góp số đặc trưng dựa vào địa web giúp cho việc nhận dạng hiệu quả, đặc trưng trình bày cụ thể chương Một số đặc trưng trang web phishing đến khơng ý nghĩa nữa, cá nhân hay tổ chức tạo trang web phishing luôn thay đổi để đánh lừa người dùng tránh bị nhận dạng cơng cụ Vì vậy, phương pháp nhận dạng trang web phishing phải đáp ứng với thay đổi đặc trưng phương pháp hiệu tổng quan CHƯ NG ĐỀ XUẤT C C PHƯ NG PH P T ĐỘNG HÓA QUÁ TRÌNH NHẬN ẠNG PHISHING Chương trình bày đóng góp luận án Trước tiên, luận án đề xuất số đặc trưng hiệu cho việc nhận dạng phishing Sau đó, luận án đề xuất năm phương pháp tự động hóa q trình nhận dạng phishing đồng thời sử dụng đặc trưng đề xuất để thực nghiệm phương pháp Năm phương pháp nhận dạng đề xuất luận án là: Phương pháp tự động nhận dạng phishing với điều khiển sử dụng đặc trưng heuristic Phương pháp tự động nhận dạng phishing với điều khiển sử dụng lý thuyết mờ Phương pháp tự động nhận dạng phishing với điều khiển sử dụng mạng nơron đơn lớp Phương pháp tự động nhận dạng phishing với điều khiển sử dụng mơ hình nơron mờ lớp không dùng tập luật If-Then Phương pháp tự động nhận dạng phishing với điều khiển sử dụng mơ hình nơron mờ lớp không dùng tập luật If-Then, hàm liên thuộc loại bỏ hết tham số, thuật toán luyện mạng với tỷ lệ học thích nghi, giá trị ngõ vào mạng nơron chuẩn hóa cách sử dụng phần mờ mơ hình nơron mờ Trong phương pháp mà luận án đóng góp nêu phương pháp tự động nhận dạng phishing với điều khiển sử dụng mơ hình nơron mờ lớp mục tiêu đề luận án 4.1 Các đặc trưng đề xuất luận án Trong nghiên cứu trước vài tác giả sử dụng đặc trưng URL đóng vai trò thứ yếu [66] Luận án đề xuất số đặc trưng dựa vào URL kết hợp với chức tìm kiếm Suggestion cơng cụ tìm kiếm mạnh Internet Google Trong luận án này, NCS đề xuất đặc trưng để nhận dạng trang web phishing hiệu PrimaryDomain, SubDomain, PathDomain, AlexaRank, AlexaReputation, GoogleIndex, BackLink 4.2 Phương pháp tự động nhận dạng phishing với điều khiển sử dụng đặc trưng heuristic Phương pháp tính giá trị hệ thống cách sử dụng giá trị heuristic trọng số chúng, sau dùng giá trị hệ thống so sánh với ngưỡng nhận dạng trang web phishing xác định phương pháp thống kê thừ sai để xác định trang web trang web phishing trang web thật Mỗi heuristic đặc trưng sử dụng cho hệ thống Phương pháp trình bày cơng trình nghiên cứu sinh [CT8, CT9] 4.2.1 Mơ hình hệ thống Mơ hình hệ thống thực qua giai đoạn trình bày hình 4.1 Giai đoạn 1: Chọn heuristic sử dụng cho hệ thống Giai đoạn 2: Tính giá trị cho heuristic Giai đoạn 3: Tính giá trị hệ thống (vs – value of system) Trong giai đoạn này, giá trị hệ thống tính theo cơng thức (4.1) N vs Vi *Wi (4.1) i Ở đây, Vi giá trị heuristic tính giai đoạn Wi trọng số cho heuristic Các trọng số Wi xác định dựa vào kinh nghiệm chuyên gia khai thác liệu tập liệu huấn luyện Hình 4.1 - Mơ hình hệ thống phương pháp tự động nhận dạng phishing với điều khiển sử dụng đặc trưng heuristic Giai đoạn 4: So sánh giá trị hệ thống vs với ngưỡng nhận dạng trang web phishing Hệ thống so sánh giá trị vs với ngưỡng nhận dạng trang web phishing (ngưỡng nhận dạng trang web phishing xác định trình thực nghiệm) để định trang web phishing hay khơng, thuật tốn thực trình bày hình 4.2 Giá trị ngưỡng xác định dựa vào tập mẫu If vs < ngưỡng then “Trang web phishing ” else “Trang web thật” End if Hình 4.2 - Thuật tốn xác định kết nhận dạng theo ngưỡng 4.2.2 Thực nghiệm 4.2.2.1 Dữ liệu thực nghiệm Dữ liệu thực nghiệm nghiên cứu nghiên cứu sinh tập hợp 11.660 trang web phishing từ Phishtank [75] 5.000 trang web thật từ DMOZ [33] Quá trình thực nghiệm thực phần mềm lập trình ngơn ngữ PHP tập liệu quản lý hệ quản trị sở liệu MYSQL 4.2.2.2 Kết thực nghiệm Kết thực nghiệm đánh giá theo hai phương pháp sai số RMSE (Root Mean Square Error – sai số bình phương trung bình) theo ROC (Receiver Operating Characteristics), sau so sánh với phương pháp khác Kết thực nghiệm đánh giá theo sai số RMSE Kết thực nghiệm đánh giá theo sai số RMSE đạt tỷ lệ nhận dạng xác 97,161% Kết thực nghiệm đánh giá theo sai số ROC Kết thực nghiệm tập liệu kiểm tra trình bày bảng 4.1 Bảng 4.1 - Kết tỷ lệ nhận dạng theo ROC phương pháp tự động nhận dạng phishing với điều khiển sử dụng đặc trưng heuristic Tỷ lệ Tỷ lệ Tỷ lệ Tỷ lệ Tỷ lệ “True “False “True “False trung Positive” Positive” Negative” Negative” bình 97,10% 2,80% 97,20% 2,90% 97,15% 97,81% 1,71% 98,29% 2,19% 98,05% 96,54% 2,23% 97,77% 3,46% 97,15% 97,69% 2,88% 97,12% 2,31% 97,40% 95,63% 1,55% 98,45% 4,37% 97,00% Tập liệu kiểm tra Để đánh giá hiệu nhận dạng mức độ kém, hay tốt, luận án sử dụng đồ thị ROC mơ tả hình 4.3 Hình 4.3 - Đánh giá kết tỷ lệ theo ROC So sánh kết thực nghiệm với phương pháp [82] Từ kết nhận dạng phương pháp biểu diễn thơng qua đồ thị ROC hình 4.4 4.5, nhận thấy hiệu nhận dạng phương pháp [82] phương pháp sử dụng đặc trưng heuristic Hình 4.4 - Đồ thị ROC so sánh tỷ lệ nhận dạng trang web phishing phương pháp tự động nhận dạng với điều khiển sử dụng đặc trưng heuristic phương pháp [82] Hình 4.5 - Đồ thị ROC so sánh tỷ lệ nhận dạng trang web thật phương pháp tự động nhận dạng với điều khiển sử dụng đặc trưng heuristic phương pháp [82] 4.2.3 Thảo luận Phương pháp tự động nhận dạng phishing với điều khiển sử dụng đặc trưng heuristic tính tốn đơn giản, tốc độ tính tốn nhanh, thuật tốn dễ cài đặt với độ phức tạp thuật toán O(n) hiệu tốt với tỷ lệ nhận dạng khoảng 97% tỷ lệ nhận dạng sai khoảng 3% Hơn nữa, thực nghiệm nhận dạng online ảnh hưởng nhiều yếu tố tốc độ đường truyền Internet, thời gian truy xuất API, v.v thời gian nhận dạng chưa đến giây đáp ứng yêu cầu thời gian thực hệ thống online Tuy nhiên, phương pháp tồn vài khuyết điểm cần nghiên cứu phát triển thêm vấn đề xác định trọng số đặc trưng ngưỡng nhận dạng trang web phishing dựa vào phương pháp thử sai phụ thuộc vào kinh nghiệm chuyên gia phụ thuộc vào việc khai thác tập liệu mẫu 4.3 Phương pháp tự động nhận dạng phishing với điều khiển sử dụng lý thuyết mờ Theo lý thuyết mờ, điều khiển mờ thông thường phải có khối sau: khối mờ hóa, khối luật suy diễn, khối tổng hợp luật khối giải mờ Tuy nhiên, phương pháp tự động nhận dạng phishing với điều khiển sử dụng lý thuyết mờ này, nghiên cứu sinh kết hợp hai khối mờ hóa khối luật suy diễn thành khối cách sử dụng hàm liên thuộc để xác định mức độ thuộc đặc trưng vào trực tiếp tập kết KQ bao gồm Phishing Legitimate (trong Phishing trang web phishing Legitimate trang web thật) Do đó, phương pháp khơng cần xây dựng khối luật suy diễn If-Then xác định mức độ thuộc vào tập kết KQ dựa vào giá trị mờ đặc trưng Mỗi đặc trưng có biến ngơn ngữ Phishing Legitimate, biến ngơn ngữ có hàm liên thuộc để tính giá trị mờ Kế tiếp, nghiên cứu sinh xây dựng khối tổng hợp mức độ thuộc tất đặc trưng kết Phishing tổng hợp mức độ thuộc tất đặc trưng kết Legitimate Sau cùng, so sánh giá trị mức độ thuộc tổng hợp để xác định trang web trang web phishing trang web thật Phương pháp không dùng khối giải mờ mục đích kết nhận dạng trang web phishing trang web thật, dựa vào kết nhận dạng hệ thống điều khiển trình duyệt web Phương pháp trình bày cơng trình nghiên cứu sinh [CT7] 4.3.1 Mơ hình hệ thống Mơ hình hệ thống phương pháp bao gồm giai đoạn mô tả hình 4.6 Giai đoạn 1: Chọn đặc trưng sử dụng cho hệ thống PrimaryDomain, SubDomain, PathDomain, PageRank, AlexaRank, AlexaReputation Giai đoạn 2: Tiền xử lý tính giá trị cho đặc trưng Giai đoạn 3: Tính giá trị mờ hay gọi tính mức độ thuộc đặc trưng vào hai biến ngôn ngữ Phishing Legitimate cách sử dụng hàm liên thuộc s-shaped z-shaped theo công thức (4.2) (4.3) Hai biến ngôn ngữ tập kết KQ cần nhận dạng hệ thống Do vậy, hệ thống không cần sử dụng tập luật suy diễn If-Then mà xác định mức độ thuộc đặc trưng vào tập kết KQ Trong q trình nghiên cứu tính chất đặc trưng, nghiên cứu sinh nhận thấy đặc trưng có chung đặc điểm giá trị đặc trưng vượt ngưỡng giá trị có xu hướng trang web phishing trang web thật giá trị đặc trưng nhỏ ngưỡng giá trị ngược lại Do vậy, hàm liên thuộc dùng để tính giá trị mờ cho đặc trưng phải có đồ thị dạng hình chữ s z phù hợp 20 - Hàm liên thuộc nên loại bỏ hết tham số làm tăng thêm tính khách quan cho việc xử lý kết đạt 4.6 Phương pháp tự động nhận dạng phishing với điều khiển sử dụng mơ hình nơron mờ lớp Mơ hình nơron mờ phương pháp bao gồm lớp phát triển từ mơ hình nơron mờ lớp, kế thừa tất ưu điểm mơ hình nơron mờ lớp khắc phục khuyết điểm mơ hình nơron mờ lớp cách sử dụng phép tính mờ để tổng hợp giá trị mờ biến ngôn ngữ giai đoạn tổng hợp mức độ thuộc đặc trưng vào tập kết KQ nhằm làm tăng hiệu tính tốn, đồng thời loại bỏ tất tham số hàm liên thuộc làm tăng tính khách quan tính giá trị mờ cho biến ngơn ngữ Trong mơ hình nơron mờ lớp này, sử dụng khối hệ thống mờ để chuẩn hóa liệu ngõ vào cho mạng nơron trước luyện mạng nơron nhằm làm tăng hiệu luyện mạng, tránh tối ưu cục làm tăng tính hội tụ luyện mạng Tỷ lệ học trình luyện mạng sử dụng tỷ lệ học thích nghi Phương pháp trình bày cơng trình nghiên cứu sinh [CT1, CT2, CT5] 4.6 Mô hình hệ thống Mơ hình hệ thống bao gồm giai đoạn thể hình 4.18 Hình 4.18 - Mơ hình hệ thống phương pháp tự động nhận dạng phishing với điều khiển sử dụng mơ hình nơron mờ lớp Giai đoạn 1: Trích lọc đặc trưng PrimaryDomain, SubDomain, PathDomain, PageRank, GoogleIndex, BackLink Giai đoạn 2: Tiền xử lý tính giá trị đặc trưng Giá trị đặc trưng tính đoạn [0, 1] 21 Giai đoạn 3: Sử dụng mơ hình nơron mờ lớp để tính giá trị hệ thống (xem chi tiết mục 4.6.2 4.6.3) Giai đoạn 4: Xác định kết nhận dạng dựa vào kết xuất mạng nơron mờ ngưỡng 4.6.2 Bộ điều khiển sử dụng mơ hình nơron mờ lớp Mơ hình nơron mờ lớp bao gồm hai phần, phần đầu phần mờ phần sau mạng nơron đơn lớp Trong đó, phần đầu bao gồm lớp thứ nhất, lớp thứ hai lớp thứ ba; phần sau mạng nơron đơn lớp bao gồm lớp thứ tư lớp thứ năm Mơ hình nơron mờ mơ tả hình 4.19 Hình 4.19 - Mơ hình nơron mờ lớp Lớp thứ bao gồm N nút N đặc trưng Mỗi nút có biến ngôn ngữ Phishing (trang web phishing) Legitimate (trang web thật) Giá trị N đặc trưng đoạn từ 0-1 tính q trình tiền xử lý Hình 4.20 mơ tả ý nghĩa giá trị đặc trưng lớp thứ Lớp thứ hai bao gồm 2*N nút, N nút thuộc biến ngơn ngữ Phishing tính theo cơng thức hàm liên thuộc left sigmoid (4.8) N nút thuộc biến ngôn ngữ Legitimate tính theo cơng thức hàm liên thuộc right sigmoid (4.9) Giá trị nút lớp thứ đoạn từ 0-1 ánh xạ sang đoạn từ Min- 22 Max theo công thức (4.10) trước đưa vào hàm liên thuộc tính tốn tính chất đặc trưng hàm liên thuộc P( x) L( x ) e x e 1 e (4.8) x (4.9) x Valuenew Valueold *(Max Min) Min (4.10) Ở đây, Valueold giá trị đặc trưng đoạn từ 0-1, Min Max giá trị người thiết kế mơ hình xác định cho phù hợp Hình 4.20 - Biểu thị ý nghĩa giá trị nút lớp thứ Hình 4.21 biểu diễn đồ thị hàm liên thuộc right sigmoid L(x) hình 4.22 biểu diễn đồ thị hàm liên thuộc left sigmoid P(x) Hình 4.21 - Đồ thị hàm liên thuộc right sigmoid L(x) cho mơ hình nơron mờ lớp Hình 4.22 - Đồ thị hàm liên thuộc left sigmoid P(x) cho mơ hình nơron mờ lớp Lớp thứ ba bao gồm nút πp πL , nút πp tổng hợp nút Pi lớp thứ hai nút πL tổng hợp nút Li lớp thứ hai theo phép toán AND Giá trị nút lớp tính theo cơng thức (4.11) (4.12) [23] 23 N P Pi (4.11) Li (4.12) i N L i Lớp thứ tư bao gồm nút, nút NP NL chuẩn hóa giá trị theo cơng thức (4.13) (4.14) Lớp lớp thứ kết hợp lại thành mạng nơron đơn lớp (SingleLayer) lớp lớp nhập mạng nơron, giá trị nút chuẩn hóa làm tăng hiệu tính hội tụ mạng nơron P NP (4.13) P L L NL (4.14) P L Lớp thứ năm bao gồm nút, nút xuất kết nút kết mơ hình Mạng nơron mơ hình sử dụng hàm tác động hàm sigmoid theo công thức (4.15) O 1 e x (4.15) 4.6.3 Thuật toán luyện mạng cho mơ hình nơron mờ lớp Thuật tốn luyện mạng thuật toán lan truyền ngược sai số [44], thuật toán thực giai đoạn lan truyền tiến lan truyền ngược thể hình 4.24 4.6.4 Thực nghiệm 4.6.4.1 Dữ liệu thực nghiệm Giống phần 4.2.2.1 4.6.4.2 Kết thực nghiệm Kết thực nghiệm đánh giá theo sai số RMSE Kết thực nghiệm đánh giá theo sai số RMSE đạt tỷ lệ nhận dạng xác 99,30% Kết thực nghiệm đánh giá theo ROC Kết thực nghiệm tập liệu kiểm tra trình bày bảng 4.5 24 Bảng 4.5 – Kết tỷ lệ nhận dạng theo ROC phương pháp nơron mờ lớp Tập liệu kiểm tra Tỷ lệ “True Positive” Tỷ lệ “False Positive” Tỷ lệ “True Negative” Tỷ lệ “False Negative” Tỷ ệ trung bình 99,42% 0,66% 99,34% 0,58% 99,38% 99,20% 0,60% 99,40% 0,80% 99,30% 99,24% 0,62% 99,38% 0,76% 99,31% 99,22% 0,74% 99,26% 0,78% 99,24% 99,46% 0,68% 99,32% 0,54% 99,39% So sánh kết thực nghiệm với phương pháp khác Trong phần sử dụng 100 tập liệu kiểm tra phát sinh ngẫu nhiên, kết thực nghiệm phương pháp so sánh với mơ tả hình 4.23 Hình 4.23 - So sánh kết thực nghiệm phương pháp tự động nhận dạng phishing với điều khiển sử dụng mơ hình nơron mờ lớp với phương pháp khác 4.6.5 Thảo luận Phương pháp tự động nhận dạng phishing với điều khiển sử dụng mơ hình nơron mờ lớp không dựa vào tập luật If-Then nhằm mục đích ứng dụng cho hệ thống có đặc trưng ngõ vào không ổn định không phụ thuộc tri thức chuyên gia xây dựng tập luật If-Then Quá trình luyện mạng phương pháp thực off-line, q trình nhận dạng thực online với tính tốn đơn giản, tốc độ tính tốn nhanh với độ phức tạp thuật toán O(n), hiệu tốt với tỷ lệ nhận dạng khoảng 99,3% tỷ lệ nhận dạng sai khoảng 0,7% Hơn nữa, thực nghiệm nhận dạng online ảnh hưởng nhiều yếu tố tốc độ đường truyền Internet, thời gian truy xuất API, v.v thời gian nhận dạng chưa đến giây Tuy nhiên, phương pháp số điểm cần phát triển để hồn thiện hơn: 25 - Cải tiến thuật tốn luyện mạng tối ưu nhằm tăng hiệu mạng - Mở rộng mơ hình cho sử dụng nhiều biến ngôn ngữ - Phát triển thành mơ hình ứng dụng cho nhiều tốn nhận dạng khác Khởi tạo trọng số tham số bias Trích đặc trưng tập liệu huấn luyện tính giá trị cho đặc trưng lớp Tính giá trị mờ cho đặc trưng lớp Tính giá trị cho nút lớp Chuẩn hóa giá trị cho nút lớp Tính giá trị nhập xuất cho nút xuất Tính lỗi cho nút xuất Tính lỗi hệ thống Lỗi hệ thống