Nghiên Cứu Giải Pháp Phát Hiện Tấn Công Website Dựa Vào Dấu Hiệu Bất Thường (LV thạc sĩ)Nghiên Cứu Giải Pháp Phát Hiện Tấn Công Website Dựa Vào Dấu Hiệu Bất Thường (LV thạc sĩ)Nghiên Cứu Giải Pháp Phát Hiện Tấn Công Website Dựa Vào Dấu Hiệu Bất Thường (LV thạc sĩ)Nghiên Cứu Giải Pháp Phát Hiện Tấn Công Website Dựa Vào Dấu Hiệu Bất Thường (LV thạc sĩ)Nghiên Cứu Giải Pháp Phát Hiện Tấn Công Website Dựa Vào Dấu Hiệu Bất Thường (LV thạc sĩ)Nghiên Cứu Giải Pháp Phát Hiện Tấn Công Website Dựa Vào Dấu Hiệu Bất Thường (LV thạc sĩ)Nghiên Cứu Giải Pháp Phát Hiện Tấn Công Website Dựa Vào Dấu Hiệu Bất Thường (LV thạc sĩ)Nghiên Cứu Giải Pháp Phát Hiện Tấn Công Website Dựa Vào Dấu Hiệu Bất Thường (LV thạc sĩ)Nghiên Cứu Giải Pháp Phát Hiện Tấn Công Website Dựa Vào Dấu Hiệu Bất Thường (LV thạc sĩ)Nghiên Cứu Giải Pháp Phát Hiện Tấn Công Website Dựa Vào Dấu Hiệu Bất Thường (LV thạc sĩ)Nghiên Cứu Giải Pháp Phát Hiện Tấn Công Website Dựa Vào Dấu Hiệu Bất Thường (LV thạc sĩ)Nghiên Cứu Giải Pháp Phát Hiện Tấn Công Website Dựa Vào Dấu Hiệu Bất Thường (LV thạc sĩ)
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - HUỲNH VĂN THỊNH NGHIÊN CỨU GIẢI PHÁP PHÁT HIỆN TẤN CÔNG WEBSITE DỰA VÀO DẤU HIỆU BẤT THƯỜNG LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) TP HỒ CHÍ MINH – 2017 HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THÔNG - HUỲNH VĂN THỊNH NGHIÊN CỨU GIẢI PHÁP PHÁT HIỆN TẤN CÔNG WEBSITE DỰA VÀO DẤU HIỆU BẤT THƯỜNG Chuyên ngành: Hệ thống thông tin Mã số: 60.48.01.04 LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) NGƯỜI HƯỚNG DẪN KHOA HỌC: TS NGUYỄN HỒNG SƠN TP HỒ CHÍ MINH – 2017 i LỜI CAM ĐOAN Tơi cam đoan cơng trình nghiên cứu riêng tơi Các số liệu, kết nêu luận văn trung thực chưa công bố cơng trình khác TP Hồ Chí Minh, ngày 22 tháng năm 2017 Học viên thực luận văn Huỳnh Văn Thịnh ii LỜI CẢM ƠN Trước tiên, xin chân thành cảm ơn Thầy TS Nguyễn Hồng Sơn tận tình hướng dẫn tạo điều kiện thuận lợi để tơi hồn thành tốt luận văn Tôi xin gửi lời cảm ơn đến Q Thầy Cơ Học Viện Cơng Nghệ Bưu Chính Viễn Thơng sở Thành phố Hồ Chí Minh tận tình giảng dạy trang bị cho tơi kiến thức quý báu trình tham gia học tập Trường Tôi chân thành biết ơn sâu sắc đến gia đình bạn bè động viên giúp đỡ tơi hồn thành khóa học TP Hồ Chí Minh, ngày 22 tháng năm 2017 Học viên thực luận văn Huỳnh Văn Thịnh iii MỤC LỤC Lời cam đoan i Lời cảm ơn ii Danh mục thuật ngữ, chữ viết tắt v Danh sách bảng vi Danh sách hình vẽ vii MỞ ĐẦU CHƯƠNG – CƠ SỞ LÝ THUYẾT 1.1 Ứng dụng web 1.1.1 Khái niệm 1.1.2 Vấn đề bảo mật ứng dụng web 1.2 Giao thức HTTP 1.2.1 HTTPs 1.2.2 Các kỹ thuật lảng tránh HTTP 1.3 Ngôn ngữ PHP 10 1.4 Các rủi ro bảo mật cho ứng dụng web 11 1.4.1 Chèn mã 12 1.4.2 Phá vỡ xác thực quản lý phiên làm việc 12 1.4.3 Thực thi mã lệnh xấu 13 1.4.4 Tham chiếu đối tượng trực tiếp không an toàn 14 1.4.5 Sai sót cấu hình bảo mật 15 1.4.6 Phơi bày liệu nhạy cảm .15 1.4.7 Thiếu chức điều khiển truy cập .16 1.4.8 Giả mạo yêu cầu .17 1.4.9 Sử dụng thành phần tồn lỗ hổng 17 1.4.10 Chuyển hướng chuyển tiếp không kiểm tra 18 1.5 Kỹ thuật nhận diện công ứng dụng web 19 CHƯƠNG – XÂY DỰNG CÔNG CỤ PHÁT HIỆN TẤN CÔNG WEBSITE 22 2.1 Các Profile .22 iv 2.1.1 Profile – Cấu trúc yêu cầu .23 2.1.2 Profile – Các giá trị yêu cầu 24 2.1.3 Profile – Phản hồi máy chủ 26 2.1.4 Profile – Cấu trúc phiên 27 2.1.5 Profile – Hồ sơ người dùng 29 2.1.6 Profile – Tổng quan hệ thống 30 2.2 Đánh giá profile .32 2.3 Đề xuất profile .38 2.4 Nguồn liệu huấn luyện .40 2.5 Profile Các yêu cầu người dùng .41 2.6 Xây dựng công cụ nhận dạng bất thường .42 CHƯƠNG – THỰC NGHIỆM VÀ ĐÁNH GIÁ 51 3.1 Thực nghiệm 51 3.2 Kết thực nghiệm đánh giá 57 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 61 TÀI LIỆU THAM KHẢO 62 Phụ lục Danh sách mã trạng thái HTTP 65 Phụ lục Định dạng nhật ký chung 67 Phụ lục Định dạng nhật ký kết hợp .69 v DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT Viết tắt ASP CMS CSRF DDoS FQDN HIDS HQL HTML HTTP ICD IDS IIS JSP LDAP NFA NIDS OWASP PHP RBID SQL SSL TCP URL URI XML XSS Tiếng Anh Tiếng Việt Ngôn ngữ lập trình ASP Hệ quản trị nội dung Giả mạo yêu cầu Tấn công từ chối dịch vụ phân tán Địa tên miền đầy đủ Hệ thống phát xâm nhập máy chủ Ngôn ngữ truy vấn hibernate Ngôn ngữ đánh dấu siêu văn Giao thức truyền tải siêu văn Sự phân bố ký tự lý tưởng Hệ thống phát xâm nhập Dịch vụ máy chủ web chạy hệ điều hành Windows Java Server Pages Ngơn ngữ lập trình JSP Lightweight Directory Access Giao thức truy cập nhanh dịch Protocol vụ thư mục Non-deterministic finite automaton Ơtơmát hữu hạn khơng đơn định Network-based Intrusion Detection Hệ thống phát xâm nhập System mạng Open Web Application Security Dự án mở bảo mật ứng dụng Project Web Hypertext Preprocessor Ngôn ngữ lập trình PHP Rule-based Intrusion Detection Phát xâm nhập dựa vào luật Structured Query Language Ngôn ngữ truy vấn cấu trúc Secure Sockets Layer Giao thức bảo mật SSL Transmission Control Protocol Giao thức điều khiển truyền vận Uniform Resource Locator Định vị tài nguyên thống Uniform Resource Identifier Định dạng tài nguyên thống eXtensible Markup Language Ngôn ngữ đánh dấu mở rộng Cross-Site Scripting Thực thi mã lệnh xấu Active Server Pages Content Management System Cross-Site Request Forgery Distributed Denial of Service Fully Qualified Domain Name Host-based Intrusion Detection System Hibernate Query Language Hyper Text Markup Hypertext Transfer Protocol Idealized Character Distribution Intrusion Detection System Internet Information Services vi DANH SÁCH BẢNG Bảng 2.1 Các mô hình profile – Cấu trúc yêu cầu 23 Bảng 2.2 Các mơ hình profile – Các giá trị yêu cầu 24 Bảng 2.3 Các mô hình profile – Phản hồi máy chủ 26 Bảng 2.4 Các mơ hình profile – Cấu trúc phiên 27 Bảng 2.5 Các mơ hình profile – Hồ sơ người dùng 30 Bảng 2.6 Các mơ hình profile – Tổng quan hệ thống 31 Bảng 2.7 Đánh giá profile – Cấu trúc yêu cầu 33 Bảng 2.8 Đánh giá profile – Các giá trị yêu cầu 34 Bảng 2.9 Đánh giá profile – Phản hồi máy chủ 35 Bảng 2.10 Đánh giá profile – Cấu trúc phiên 36 Bảng 2.11 Đánh giá profile – Hồ sơ người dùng 37 Bảng 2.12 Đánh giá profile – Tổng quan hệ thống 38 Bảng 2.13 Profile đề xuất – Các yêu cầu người dùng 40 Bảng 2.14 Ví dụ thống kê thuộc tính URL 45 Bảng 3.1: Thống kê mẫu liệu tập liệu kiểm tra cho trường hợp thử nghiệm khác tập liệu 52 Bảng 3.2 Thống kê mẫu liệu tập liệu kiểm tra trường hợp 3.5 tập liệu 53 Bảng 3.3 Thống kê mẫu liệu tập liệu kiểm tra tập liệu 56 Bảng 3.4 Kết dự báo lớp thực trường hợp 3.1 tập liệu 57 Bảng 3.5 Kết dự báo lớp thực trường hợp 3.2 tập liệu 57 Bảng 3.6 Kết dự báo lớp thực trường hợp 3.3 tập liệu 57 Bảng 3.7 Kết dự báo lớp thực trường hợp 3.4 tập liệu 58 Bảng 3.8 Kết dự báo lớp thực trường hợp 3.5 tập liệu tập liệu 58 vii DANH SÁCH HÌNH VẼ Hình 1.1 Mơ hình hoạt động ứng dụng web Hình 1.2 Mơ hình hoạt động chi tiết ứng dụng web Hình 1.3 Các bước cơng vào ứng dụng web Hình 1.4 Kỹ thuật phát cơng ứng dụng web 19 Hình 2.1 Thơng tin chi tiết lỗ hổng WordPress Plugin Apptha Slider Gallery v1.0 ngày 09/3/2017 bị cơng SQL Injection 39 Hình 2.2 Ví dụ phần tử nhật ký truy cập máy chủ web 41 Hình 2.3 Mơ hình chức nhận dạng bất thường sử dụng profile “Các yêu cầu người dùng” 43 Hình 2.4 Mơ hình chi tiết giai đoạn dự báo lớp 50 Hình 3.1 Giao diện cơng cụ thực nghiệm 51 Hình 3.2 Tiền xử lý liệu huấn luyện 53 Hình 3.3 Tiền xử lý liệu kiểm tra 54 Hình 3.4 Sử dụng liệu huấn luyện để dựng mơ hình 54 Hình 3.5 Sử dụng mơ hình sau huấn luyện để dự báo lớp cho liệu kiểm tra 55 Hình 3.6 Tỉ lệ dự đoán dự đoán sai trường hợp khác tập liệu 59 Hình 3.7 Tỉ lệ dự đốn dự đốn sai loại cơng trường hợp 3.5 tập liệu tập liệu 59 MỞ ĐẦU Ngày nay, số lỗ hổng bảo mật tìm thấy ứng dụng cao nhiều so với số lỗ hổng tìm thấy hệ điều hành Các công nhằm vào ứng dụng web khai thác lỗ hổng lớp ứng dụng lớp truyền tải lớp mạng công thông thường khứ Đồng thời, số lượng mức độ tác động lỗ hổng bảo mật ứng dụng ngày tăng cao Khơng có nghi ngờ bảo mật ứng dụng web chủ đề phổ biến có giá trị Nó liên quan đến tất cả: Các doanh nghiệp mà doanh thu tăng từ thương mại điện tử Internet, người dùng tin tưởng ứng dụng web với thông tin nhạy cảm, tội phạm kiếm nhiều tiền cách đánh cắp liệu toán xâm nhập vào tài khoản ngân hàng Danh tiếng đóng vai trò quan trọng, không muốn kinh doanh với website khơng an tồn, tổ chức muốn tiết lộ chi tiết lỗ hổng bảo mật riêng họ tình trạng bị xâm nhập Vì thế, nghiên cứu giải pháp phát cơng cho ứng dụng web chủ để cần thiết Theo thống kê w3techs.com [20] cho thấy PHP chiếm 81,9% tất website sử dụng ngơn ngữ lập trình server-side Viết ứng dụng PHP dễ dàng, số đơng lập trình viên lại bỏ qua khía cạnh an ninh quan tâm khơng mức Hiện tại, ngơn ngữ lập trình PHP hỗ trợ hầu hết máy chủ web nhiều nhà cung cấp dịch vụ web hosting, viết công cụ phát công cho ứng dụng web PHP lợi lớn Đề tài tập trung nghiên cứu xây dựng công cụ phát công cho ứng dụng web PHP dựa vào dấu hiệu bất thường công nghệ học máy, cách xây dựng profile sử dụng mơ hình positive (các mơ hình học hành vi bình thường) ... giải pháp phát công website dựa vào dấu hiệu bất thường theo hướng sử dụng profile Kết luận văn đạt được: - Luận văn trình bày tổng quan vấn đề phát công website dựa vào dấu hiệu bất thường như:... - HUỲNH VĂN THỊNH NGHIÊN CỨU GIẢI PHÁP PHÁT HIỆN TẤN CÔNG WEBSITE DỰA VÀO DẤU HIỆU BẤT THƯỜNG Chuyên ngành: Hệ thống thông tin Mã số: 60.48.01.04 LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định... cụ phát công cho ứng dụng web PHP dựa vào dấu hiệu bất thường, cách sử dụng profile đề xuất sử dụng mơ hình học hành vi bình thường xây dựng Hướng phát triển tiếp theo: - Nghiên cứu cải thiện