Cài đặt chương trình

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu một số phương pháp phát hiện thay đổi nội dung trang web (Trang 52 - 58)

 Chương trình thử nghiệm được phát triển bằng ngôn ngữ C# và hệ quản trị CSDL Microsoft SQL Server 2012. Với cấu hình máy sử dụng là:

- Bộ xử lý: Intel(R) Core(TM) i5-3210M CPU @ 2.50GHz - Bộ nhớ Ram: 6.00 GB.

- Hệ điều hành: Windows 10 Professional 64-bit.

 Web-server được cài đặt trên hệ thống máy ảo VirtualBox và những website đã được công bố trên mạng Internet như 24h.com.vn, viettel.com.vn,…

Hình 3.4. Giao diện chính của hệ thông theo dõi thay đổi nội dung trang web

Chức năng một số nút lệnh:

- Nút File: Mở một tập tin đã được lưu trữ. - Nút Hash: Tính giá trị băm.

- Nút Add CSDL: Lưu các thuộc tính và giá trị băm vào cơ sở dữ liệu. - Nút Del CSDL: Xoá các thuộc tính và giá trị băm khỏi CSDL.

- Nút Multi Checker Basic mode: Kiểm tra các trang web dựa trên các thuộc tính.

- Nút Multi Checker Advance mode: Kiểm tra các trang web dựa trên giá trị băm.

- ListWeb: Lưu danh sách các trang web cần giám sát theo dõi.

- Trang web được chọn: Cho biết những trang web nào đang được giám sát. - Nút Multi Thread: Bắt đầu chế độ giám sát đa luồng (nhiều website cùng lúc). - Nút Start: Bắt đầu giám sát một website.

- Nút Stop: Dừng giám sát.

3.3.2. Thử nghiệm chương trình

 Chương trình được thử nghiệm kiểm tra về thời gian xử lý của thuật toán Rabin Fingerprint và thuật toán cải tiến Rabin Fingerprint với dữ liệu vào là 4 website (sử dụng hàm stopwatch() trong C# để đo thời gian xử lý của thuật toán).

- Kết quả thử nghiệm của chương trình với 4 trang web về thời gian tính toán của thuật toán Rabin Fingerprint và cải tiến thuật toán Rabin Fingerprint như bảng biểu sau:

Website Rabin fingerprint (Thời gian)

Cải tiến Rabin fingerprint (Thời gian) Kích thước (kí tự) 24h.com.vn 00:07:52.2659048 00:00:00.0179612 197342 bongda.com.vn 00:10:56.6508695 00:00:00.0237493 260318 viettel.com.vn 00:00:29.7748576 00:00:00.0053756 34798 tmasolutions.com 00:00:07.4765326 00:00:00.0032503 96819

 Chương trình được thử nghiệm kiểm tra về thời gian xử lý của hệ thống kiểm tra cơ bản và kiểm tra chi tiết với dữ liệu vào là 5 trang web.

- Kết quả thử nghiệm của hệ thống kiểm tra cơ bản và kiểm tra nâng cao như bảng sau:

Website Basic mode (Thời gian) Advanced mode (Thời gian) Kích thước (kí tự) 24h.com.vn 00:00:00.0013731 00:00:00.0038273 197342 bongda.com.vn 00:00:00.0021435 00:00:00.0042867 260318 viettel.com.vn 00:00:00.0058100 00:00:00.0026037 34798 tmasolutions.com 00:00:00.0010857 00:00:00.0026319 96819 vnexpress.net 00:00:00.0017357 00:00:00.0047003 272277

 Chương trình được thử nghiệm theo dõi giám sát đa luồng, cùng một lúc theo dõi 4 website. Chức năng Multi-thread đã hoạt động tốt, đưa ra được cảnh báo khi có sự thay đổi nội dung trang web.

Hình 3.5. Chương trình theo dõi 4 website đồng thời

 Chương trình được thử nghiệm kiểm tra ở chế độ nâng cao, đã chỉ ra được vị trí thay đổi của nội dung trang web.

3.3.3. Nhận xét kết quả

- Thời gian xử lý của thuật toán cải tiến Rabin Fingerprint là nhanh hơn rất nhiều so với thuật toán Rabin Fingerprint (đặc biệt khi kích thước trang web lớn).

- Thời gian xử lý của hệ thống Multi-checker ở hai chế độ kiểm tra cơ bản (basic mode) và kiểm tra nâng cao (advanced mode) là tương đương nhau vì cùng độ phức tạp thuật toán.

- Chương trình đã giám sát được sự thay đổi bất thường của website khi theo dõi đơn tiến trình (một website) cũng như đa tiến trình (nhiều website đồng thời), và đã đưa ra được cảnh báo hợp lý.

- Ở chế độ Advaced Mode đã chỉ ra được vị trí thay đổi của nội dung trang web.

3.4. Kết luận chương 3

Trong chương này luận văn đề xuất xây dựng hệ thống phát hiện thay đổi nội dung trang web dựa trên cải tiến thuật toán của Rabin Fingerprint và xây dựng hệ thống theo dõi giám sát dựa trên các thay đổi bất thường nội dung trang web, đưa ra cảnh báo kịp thời có ý nghĩa. Xây dựng chương trình phát hiện thay đổi nội dung trang web, thử nghiệm phân tích đánh giá kết quả đạt được.

KẾT LUẬN VÀ KHUYẾN NGHỊ 1. Kết luận

Luận văn đã đánh giá được tình hình mất an toàn, an ninh trên nền web hiện nay, nghiên cứu cách thức thường sử dụng để bảo toàn các tài liệu trên Internet, mô tả ngắn gọn cách các lỗ hổng web và một số tấn công nhằm vi phạm tính toàn vẹn của các trang web cụ thể như: phân tích, tìm hiểu, nghiên cứu về các loại hình tấn công như: Sql Injection, XSS, DOS thông dụng hiện nay, và các hình thức tấn công mới trên lĩnh vực an ninh mạng. Đề xuất phương pháp giúp ngăn chặn tấn công Sql Injection, XSS và tấn công DOS.

Luận văn đề xuất xây dựng hệ thống phát hiện thay đổi nội dung trang web dựa trên cải tiến thuật toán của Rabin Fingerprint và xây dựng một chương trình theo dõi giám sát dựa trên các thay đổi bất thường nội dung trang web, đưa ra cảnh báo kịp thời có ý nghĩa. Tuy nhiên chương trình còn một số hạn chế như sau:

Hiện tại chương trình chỉ dừng lại ở thử nghiệm trên hệ thống mạng cục bộ (LAN-Local Area Network), máy chủ cung cấp dịch vụ web cục bộ (hostlocal). Kiểm tra theo dõi giám sát trực tiếp trang web dựa trên phát hiện các thay đổi bất thường đang còn ở mức độ đơn giản.

2. Khuyến nghị

Do điều kiện nghiên cứu còn nhiều hạn chế nên kết quả nghiên cứu chưa thực sự như mong muốn. Tác giả tiếp tục nghiên cứu để tiếp tục phát triển hoàn thiện chương trình được tốt hơn như:

- Cải tiến thuật toán để tăng tốc độ xử lý. - Xây dựng hệ thống phục hồi trang Web

Trên đây là toàn bộ luận văn thạc sỹ kỹ thuật của tác giả. Trong quá trình thực hiện không tránh khỏi những thiếu sót, tác giả rất mong nhận được sự đóng góp ý kiến của thầy cô và các bạn.

TÀI LIỆU THAM KHẢO Tiếng Việt:

1. Lê Đình Duy (2003) “Tấn Công Kiểu SQL Injection – Tác Hại Và Cách Phòng Tránh” Đại học Khoa Học Tự Nhiên TPHCM.

2. Nguyễn Thanh Nghị, HVA-2008 “Tấn công từ chối dịch vụ Dos, Ddos, DRDos”.

Tiếng Anh:

3. Dr. Mazin S. Al-Hakeem “ANTI WEB SITE DEFACEMENT SYSTEM (AWDS)”.

4. Abdulkader A. Alfantookh, College of Computer and information Sciences, King Saud University, Saudi Arabia, 2006 "WHDRM".

5. Selvitri F, 2004 “High Performance Issues in Web Search Engines”, 6. V.A.Narayana, P.Premchnd, IEEE International Advance Computing Conference (IACC2009), Patiala, India, 6-7 March 2009 “A Novel and Efficient Approach for Near Duplicate Page Detection in Web Crawling”,.

7. A. Z. Broder, Springer-Verlag, 1993 "Some Applications of Rabin's Fingerprinting Method".

8. Rabin-Karp Algorithm, February 18, 2011. “Rolling Hash”

9. Tushar Kanti, Vineet Richariya, Vivek Richariya 2011 “Implementing a Web Browser with Web Defacement Detection Techniques”.

10. B. J. Mckenzie, R. Harries AND T. Bell, “Selecting a Hashing Algorithm”.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu một số phương pháp phát hiện thay đổi nội dung trang web (Trang 52 - 58)