BỘ GIÁO DỤC VÀ ĐÀO TẠO
DAI HOC HUE
TRUONG DAI HOC KHOA HOC
PHAM THI THOA
TIM HIEU MOT SO PHUONG PHAP DU BAO TAN CONG NGAP LUT TRONG
MANG CHUYEN MACH CHUM QUANG
CHUYEN NGANH: KHOA HOC MAY TINH MA SO: 8 48 01 01
LUAN VAN THAC SI KHOA HOC
DINH HUONG NGHIEN CUU
NGUOI HUONG DAN KHOA HOC PGS.TS VO VIET MINH NHAT
Thừa Thiên Huế, 2020
Trang 2
LỜI CAM ĐOAN
Tơi xin cam đoan:
Đây là cơng trình nghiên cứu khoa học của riêng tơi Các số liệu, trích dẫn, kết quả thực nghiệm và cài đặt được trình bày trong luận văn là trung thực và cĩ nguồn gơc rõ ràng
Học viên
Trang 3LỜI CÁM ƠN
Đề hồn thành được luận văn này, trước tiên, tơi xin bày tỏ sự cảm ơn tới Ban
giám hiệu, phịng quản lý sau Đại học và quý Thầy Cơ khoa Cơng nghệ thơng tin,
Trang 4MỤC LỤC
DANH MỤC CÁC BẢNG 2 22 222221221112111211121112112112212121222ee i DANH MUC CAC CHU VIET TAT ooo ccoc esos csossesesessesesestertesetereearetereteeseresanesases ii DANH MỤC CÁC HÌNH VÀ ĐƠ THỊ 22 S221221222122121121121121222 xe iii PHAN MỞ ĐẦU 52 222222122112111211122112111111111211211212222222222re 1 1 Lý đo chọn để tài - 52-221 22122112111211221122112111211211112222122 re 1
VN 0190013009 0 aaẫá 2 3 Đối tượng và phạm vi nghiên cứu 22-222 222222112211211121112111211121121122 xe 2 4; Phuong phap nghiÊn 'CỨUseascnsetes2tUDEGEIEEIOSIESIADAIEEHEDNHEEIVHEEIVEEHEEISRANGSSEPRSESBB 2
5 Cấu trúc luận văn - 1 s21 1211112111121111211112111121111 211122112212 12x ty 2 CHƯƠNG 1 TONG QUAN VE MANG CHUYEN MACH CHUM QUANG 4 1.1 GIGI THIEU VE MANG CHUYEN MACH CHUM QUANG 4 1.2 MANG CHUYEN MACH CHÙM QUANG 2-©2222222222225221522222222-e2 4
1.2.1 Kiến trac mang chuyén mach chim quan go cccccece cscs cece esse eece tess eeeeeeeeeeeee 6 1.2.2 Tập hợp chủm c2: 211 121121111 E11 111 tt HT HT Hà HT HH HH Hết 7 1.2.3 Báo hiệu trong mạng chuyên mạch chùm quang 2: 2s22z+22z+2zz>zz2 8 1.2.4 Lập lịch chùm - 1S 211211112 12 Hy HT TH TH HH HH re 11 1.2.5 Giải quyết tranh chấp -©2s222222122212211121112111211121112112112122 xe 13 1.3 TIỂU KÉT CHƯƠNG l -©22222222211221122122112112112112112222 e6 15
CHUONG 2 PHUONG PHAP PHAT HIEN TAN CONG NGAP LUT
TRONG MANG CHUYEN MACH CHUM QUANG 22cccczcccee 16
2.1 GIGI THIEU VE TAN CONG MẠNG .-2-222222122212211222221.2 re 16
DAD Khai ni ieee ceccccecosessseeseseesssessssesssseseseesariesarerasiesariesarestaseesaseesaesseesseeee 16
2.1.2 Các hình thức tấn cơng mạng phơ biến 22222 22122212221122122112222 e6 17
22 TAN CONG NGAP LUT TRONG MANG CHUYEN MACH CHUM
Trang 52.2.2 Một số phương pháp phân tích và phát hiện tấn cơng ngập lụt 22
2.3 TIỂU KÉT CHƯƠNG 2 -©22-2221221222122212221211211211212212222 xe 29
CHƯƠNG 3 MO PHONG VA PHAN TICH KET QUẢ - 2: 30
3.1 MO TA PHAN MEM MƠ PHỎNG WEKA 2222212221222122121222 e6 30 3.1.1 Giới thiệu chung về Weka -2- 22 22221121112111211121112211211122122 xe 30
3.1.2 Các chức năng chính của Weka St St vn nh Hy Hào 32
Trang 6DANH MỤC CÁC BẢNG
Bảng 2.1: Ma trận nhằm lẫn 2-© 22 222122122122122112112112112112122222 e6 24
Bảng 2.2: Kết quả phân loại trước CES 5-2222 2212221211221221222222 e6 24
Bảng 2.3: Kết quả phân loại sau CES -22222222221222121122222222.222 e6 25
Bảng 2.4: Mối tương quan Pearson giữa các thuộc tính và lớp . - 26 Bảng 2.5: Ma trận nhằm lẫn của NB và SVM 2522222222222 ee 28 Bảng 2.6: Ma trận nhằm lẫn của KNN và DƠNN 5222222221222 xee 28 Bảng 2.7: Kết quả phân loại với 3 kỹ thuật máy học và mơ hình học sâu 29 Bang 3.1: Kết quả phân loại kỹ thuật Nạve Bays -2-22 221222222 eee 39 Bảng 3.2: Kết quả phân loại kỹ thuật Bays Net 2222222222222 ee 40 Bảng 3.3: Kết quả phân loại kỹ thuật J48 222222 22222122212222222222 e6 40 Bảng 3.4: Kết quả phân loại kỹ thuật MLP - 22222 2221222122122122122122.2 e0 41
Bang 3.5: Két qua phan loai NB,BN,J48,MLP ooo eeeceeceeeceeeneeneeeeseneentereneenes 41
Trang 7DANH MỤC CÁC CHỮ VIẾT TAT
Từ viết tắt Từ đầy đủ
OBS Optical Burst Switching BHP Burst packet Header OCS Optical Circuit Switching OPS Optical Packet Switching
SIR Source Initiated Reservation ACK Acknowledged
BDP Burst Data Packet BCP Burst Control Packet
TCP Transmission Control Protocol DoS Denial of Service
ANN Artificial Neural Network MLP Multi Layer Neural Network NB NaiveBays
DCNN Deep convolution neural network SVM Support vector machines
KNN k-Nearest Neighbor JVM Java virtual machine
DIR Destination Initiated Reservation FDL Fiber Delay Line
FFUC First Fit Unscheduled Channel
FFUC-VF First Fit Unscheduled Channel with Void Filling LAUC Lastest Available Unscheduled Channel
LAUC-VF Latest Available Unscheduled Channel with Void Filling LAUT Latest Available Unscheduled Time
LUUC-VF Least-Used Unscheduled Channel with Void Filling WDM Wavelength Division Multiplexing
Trang 8Hình 1.1 Hình 1.2 Hình 1.3 Hình 1.4 Hình 1.5 Hình 1.6 Hình 2.1 Hình 2.2 Hình 2.3 Hình 2.4 Hình 3.1 Hình 3.2 Hình 3.3 Hình 3.4 Hình 3.5 Hình 3.6 Hình 3.7 Hình 3.8 Hình 3.9 DANH MỤC CÁC HÌNH VÀ ĐỎ THỊ
Kiến trúc của mạng chuyển mạch chùm quang -©-2¿22zz2zz+>zs2 6 Tap hơp:chủm:v3 tách ChOm seescccewrees reer 7
Quá trình đặt trước tức thời và sau một thời gian m cecececcceseseeveeseeseeees 10 Trang thái kênh dữ liệu với các trường hợp lập lịch - : 12
Chuyển đổi bước sĩng W¡ qua W¿ 22222 221221211221212222 e6 14 Định tuyến lệch hướng 22 2222E22E222E122112211271221112711271211212 e0 14
Một ví dụ tấn cơng bằng phan mm Oc hai cececcccecscsecsceecessevecsesesveseseesees 17
Phương pháp tấn cơng ngập lụt -©222222222222122212221222122222 e6 19 Kiến trúc mạng DCNN được sử dung dé phát hiện tấn cơng ngập lụt 25 Kết quả phân loại của các phương pháp học máy (ML) và DƠNN 29 Biểu tượng của ứng dụng Weka - 22 22222112212112222222ee 30 Một số hình ảnh về giao diện người sử dụng của Weka - 31 Các chức năng trong EXPÏOT€T 1S v32 EE SE rrEtrrrrerrerrerrrrerre 32
Lựa chọn thuộc tính được dự đốn . 2 1 2221112221121 sxxx 34
Xây dựng mơ hình phân loại dé dự báo -©22222222212221222122e6 36
Các đặc trưng của bộ dữ liệu - :- c 232112 2 xrErrrrktrrrerreerre 37 Lua chọn đặc trưng .- c2 2S này HH tre 38 Một số dặc trưng được chọn .-.- :ccc St xe 39 Kết quả thuốc tính được CON sszeszzrreresrssgbdrdsotbogtotiitthosyiyihowgiiitens 42
Trang 9PHAN MO DAU
1 Ly do chon dé tai
Trong những năm gần đây, nhu cầu truyền thơng ngày càng lớn với nhiều dich vụ mới yêu cầu băng rộng tốc độ cao và đa phương tiện Đề đáp ứng và thúc đầy sự phát triển của kỷ nguyên thơng tin, mạng truyền thơng cần phải cĩ khả năng linh
hoạt cao, tốc độ truyền dẫn lớn, băng thơng rộng, đa dịch vụ Các nhà khoa học, các
tổ chức viễn thơng, các hãng cung cấp thiết bị đã và đang nghiên cứu phát triển và áp dụng các giải pháp cơng nghệ mới băng rộng với tốc độ cao và đa phương tiện đổi với mạng viễn thơng Mạng truyền dẫn quang với những kỹ thuật truyền tin tiên tiến, là một giải pháp hữu hiệu nhất hiện nay để đáp ứng những yêu cầu hiện tại và cĩ thể cả trong tương lai
Với sự phát triển theo thời gian, cĩ 3 cơng nghệ chuyên mạch quang đã được đề xuất: chuyển mạch kênh quang (Optical Circuit Switching - OCS), chuyén mach gĩi quang (Optical Packet Switching - OPS) va chuyén mach chim quang (Optical Burst Switching - OBS) Méi cong nghé nay déu cĩ các ưu và nhược điểm trong đĩ chuyển mạch chùm quang dung hịa được những ưu và nhược điểm của hai loại chuyển mạch kia và là cơng nghệ cĩ thể triển khai và đáp ứng được nhu cầu băng thơng trong tương lai gần
Trong mạng OBS, đơn vị mang đữ liệu là chùm dữ liệu (hay ngắn gọn là
chùm), cĩ thể cĩ độ dài thay đổi Một chùm cĩ hai thành phần: gĩi điều khiển
(Burst Packet Header - BHP) và chùm dữ liệu Gĩi điều khiến mang thơng tin báo
hiệu, trong khi chùm dữ liệu mang dữ liệu truyền tải Đầu tiên, BHP thiết lập một
đường truyền từ nguồn tới đích Sau đĩ, dữ liệu được truyền trên đường truyền này Trong mạng OBS cĩ nhiều hình thức bị tấn cơng, trong đĩ tấn cơng ngập lụt BHP
(BHP Flooding Attack) 1a loai hinh phé bién nhất
Trong tấn cơng ngập lụt BHP, nhiều bản sao của BHP được tạo ra tại bất kỳ nút nào mà kẻ tấn cơng chiếm giữ được Cùng với các bản sao được tạo, rất nhiễu
Trang 10gian cho các BHP giả này Do đĩ, các tài nguyên bị cạn kiệt và khơng thể cấp phát cho các BHP hợp lệ khi chúng đến
Cĩ nhiều phương pháp khác nhau để phát hiện tấn cơng ngập lụt trong mạng OBS như dựa trên cây quyết định, mạng Bayes, luật suy diễn Trong luận văn
này, tơi chọn mạng nơ-ron nhân tạo để phát hiện tấn cơng ngập lụt BHP Do đĩ đề
tài được chọn nghiên cứu la “Tim hiểu một số phương pháp dự báo tắn cơng ngập lụt trong mạng chuyển mạch chùm quang”
2 Mục tiêu nghiên cứu
e_ Tìm hiểu về mạng chuyên mạch chùm quang
e Tìm hiểu một số phương pháp phân tích và phát hiện tấn cơng ngập lụt trong mạng chuyên mạch chùm quang
e©_ Cài đặt, so sánh và đánh giá các phương pháp phân tích và phát hiện tấn cơng ngập lụt
3 Đối tượng và phạm vi nghiên cứu
e_ Đối tượng nghiên cứu: Phương pháp phân tích và phát hiện tấn cơng ngập lụt
e Pham vi nghién ctu: Mang chuyên mạch chùm quang 4 Phương pháp nghiên cứu
e Nghiên cứu lý thuyết: thu thập và tổng hợp từ một số cơng trình nghiên
cứu, bài báo khoa học về lĩnh vực nghiên cứu
e Cài đặt thực nghiệm, mơ phỏng: mơ phỏng bằng phần mềm Weka 5 Cấu trúc luận văn
Luận văn bao gồm phần mở đầu và ba chương nội đung:
Chương 1 Tổng quan về mạng chuyển mạch chùm quang, giới thiệu mạng truyền dẫn quang và mạng chuyển mạch chùm quang, bao gồm các khái niệm cơ bản và kiến trúc, hoạt động, ý nghĩa thực tiễn của mạng chuyển mạch chùm quang
Trang 11Chương 3 Cài đặt mơ phỏng và phân tích kết quả, giới thiệu phần mềm mơ phỏng Weka và mơ phỏng một số phương pháp và phát hiện tấn cơng ngập lụt trong Weka
Trang 12CHƯƠNG 1 TONG QUAN VE MANG CHUYEN MACH CHUM QUANG
1.1 GIOI THIEU VE MANG CHUYEN MACH CHUM QUANG
Trong những năm gần đẩy, tốc độ phát triển nhanh của Internet với sự bùng nỗ của các loại hình địch vụ thơng tin, đã làm gia tăng khơng ngừng nhu cầu về băng thơng mạng: trong khi việc khai thác khả năng truyền tải của cáp đồng đã đạt đến ngưỡng giới hạn Điều này địi hỏi phải xây dựng và phát triển một cơng nghệ mạng mới nhằm đáp ứng được những nhu cầu đĩ
Mạng sợi quang đã được cơng nhận như là một giải pháp tốt nhất để đáp ứng những yêu cầu về băng thơng hiện tại của người dùng và hỗ trợ cho các địch vụ khác trong tương lai Điều đĩ là do, theo lý thuyết mỗi sợi quang cĩ thê hỗ trợ băng thơng lên tới 50 THz [3] Ngồi ra việc sản xuất cáp sợi quang cĩ chỉ phí và độ lỗi bit thấp (khoảng 10-2dB) [4] Hơn thé, mat mat tín hiệu truyền trên sợi quang thấp hơn nhiều so với cáp đồng vì thế rất thuận tiện trong vấn để bảo mật mạng
Một mạng tồn quang, trong đĩ dữ liệu được chuyền hồn tồn trong miễn quang cịn gĩi tin điều khiển được xử lý trong miễn điện, là mục tiêu hướng tới trong tương lai gần mà chúng ta cĩ thể xây đựng được Hiện nay các cơng nghệ chuyển mạch quang đã được đề xuất như chuyên mạch kênh quang, chuyển mạch gĩi quang và chuyên mạch chùm quang, trong đĩ mỗi cơng nghệ cĩ các ưu và nhược điểm riêng Riêng chuyển mạch chùm quang dung hịa được những ưu và nhược điểm của hai loại chuyển mạch kia và là cơng nghệ hứa hẹn trong tương lai
Chương l sẽ giới thiệu về kiến trúc và các hoạt động của mạng chuyển mạch chùm quang
1.2 MANG CHUYEN MACH CHUM QUANG
Trang 13giữa khả năng truyền dẫn quang và khả năng xử lý điện tử; thêm vào đĩ khả năng sử đụng các bộ nhớ truy cập ngẫu nhiên trong miền quang là khơng khả dụng, vì vậy khơng thê giữ được dữ liệu đợi xử lý trong miền quang Mạng chuyển mach chùm quang được để xuất vào cuối năm 1990 và nĩ trở thành một cơng nghệ hứa hẹn cĩ thể tận dụng được những ưu điểm của mạng chuyển mạch kênh quang và mạng chuyển mạch gĩi quang để tránh được những bất lợi về kỹ thuật trong thời gian này
Mạng chuyên mạch chùm quang được xem như là một cơng nghệ hứa hẹn cho mạng Internet tồn quang thế hệ kế tiếp Nĩ cĩ nhiều chức năng riêng và nhiều ưu điểm hơn so với các kỹ thuật chuyên mạch khác Mạng chuyên mạch chùm quang là một giải pháp cho phép truyền tải lưu lượng trực tiếp qua mạng WDM mà khơng cần bộ đệm quang Mạng chuyển mạch chùm quang sử dụng các sơ đổ định trước một hướng với quá trình truyền tức thời, chùm đữ liệu truyền đi sau gĩi điều khiển tương ứng mà khơng đợi phản hồi (báo nhận) từ nút đích
Thực chất, mạng chuyển mạch chùm quang xem xét lớp quang đơn thuần như một phương tiện truyền thơng trong suốt cho các ứng dụng Tuy nhiên cho đến hiện nay chưa cĩ định nghĩa chung nào cho chuyên mạch chùm quang
Một số đặc trưng chung của mạng chuyên mạch chùm quang như sau:
- Tách biệt giữa kênh truyền goi diéu khién BCP (Burst Control Packet) và kênh truyền chùm dit ligu BDP (Burst Data Packet): g6i diéu khiển được truyền
trên một kênh riêng biệt
- Sự dành riêng một chiêu: tài nguyên được cấp phát theo kiêu dành riêng một chiều, nghĩa là nút nguồn khơng cần đợi thơng tin phản hồi từ nút đích trước khi nĩ bắt đầu truyền chùm
- Độ dài chùm thay đổi được: kích thước của chùm cĩ thể thay đổi được theo
yêu cầu
- Khơng cần bộ đệm quang: nút trung gian trong mạng quang khơng yêu cầu phải cĩ bộ đệm quang Các chùm đi qua các nút trung gian mà khơng chịu bất kỳ sự
Trang 141.2.1 Kiến trúc mạng chuyển mạch chùm quang
Một mạng chuyển mạch chùm quang bao gồm các nút chuyển mạch chùm quang kết nối với nhau thơng qua các sợi cáp quang Mỗi sợi quang cĩ khả năng hỗ
trợ các kênh đa bước sĩng Như được trình bày ở Hình 1.1, các nút trên mạng
chuyển mạch chùm quang cĩ hai kiểu: nút biên và nút lõi Nút biên được xem như là giao điện giữa miền điện tử và miền quang Nút biên cĩ thể là nút biên vào hoặc
là nút biên ra Nút biên vào thực hiện tập hợp các gĩi điện tử (chang han cac goi IP)
cĩ cùng đích thành một đơn vị truyền dẫn lớn gọi là chim quang (burst), sau do
thực hiện định tuyến, ấn định bước sĩng và lập lịch cho chùm trên một kênh dữ liệu
ở ngõ ra, sau đĩ được truyền qua mạng chuyên mạch chùm quang và cuối cùng
được tách gĩi tại nút biên ngõ ra Nút lõi được xem như là một ma trận chuyền mạch và là một đơn vi chuyên mạch cĩ trách nhiệm chuyển tiếp các chùm dữ liệu đến nút khác 1 nút OBS ' uần lý việc ' Bắt trước tài ' 1 nguyén : ' Thời gian chuyển „=, _ mạch tính bằng đơn vị ¡s -ms iKénh dieu _ 1 ‘ iF) ! khiển [tt ' Nợ ' ' Se) — Liên kết WDM Ị out-of-band-signal ' '
Hinh 1.1 Kién tric ctia mang chuyén mạch chùm quang
Trang 15mạch quang Phần điện cĩ các module vào/ra, điều khiển định tuyến và lập lịch Đơn vị chuyền mạch quang điều khiển các chùm dữ liệu từ một cơng vào và ra một
cổng tương ứng với đích đến của chúng
Khi một nút biên chuẩn bị truyền một chùm dữ liệu, nĩ sẽ gửi một gĩi điều khiển đi trên một bước sĩng riêng tới nút lõi Gĩi điều khiển thực hiện việc báo
hiệu, cấu hình các chuyển mạch tại nút lõi để chuyên chùm từ cơng vào đến cổng ra và giải quyết xung đột nếu xảy ra Các hoạt động của mạng chuyên mạch chùm quang sẽ được trình bày ngay sau đây
1.22 Tập hợp chùm
Tap hop chùm là quá trình tập hợp các gĩi tin điện tử và đĩng gĩi thành chùm tại nút biên ngõ vào của mạng chuyên mạch chùm quang Tất cả gĩi đến sẽ chuyển đến hàng đợi tùy theo đích của chúng như trình bày trong Hình 1.2 Một giá trị
ngưỡng được sử dụng như một tham số giới hạn để quyết định khi nào tạo ra một
chùm và gửi chùm vào trong mạng
mut Goi diéu khién f{V\ Gĩi điều khiển LMIHIL + a | a ‘ | i a x~+ 'Mang | II II /Burst de liệu QBS_ jBurst | mf Mang | dữ liệu” \ ~— LLL | | 1 ⁄ | Tap hop burst WW Tach burst ! F " a ợ urs ac urs F IIIIIIf ”° "*? UO Hình 1.2 Tập hợp chùm và tách chùm
Hiện nay cĩ nhiều kỹ thuật tập hợp chùm được để xuất, trong đỏ cĩ ba kỹ thuật phổ biến nhất là tập hợp chùm dựa vào ngưỡng thoi gian (timer-based), dua trén ngu6ng do dai chum (threshold-based) và lai (dựa vào ngưỡng thời gian và
ngưỡng độ dài); trong đĩ: các ngưỡng được xác định trước, cố định Các kỹ thuật
này cịn được gọi là các kỹ thuật tập hợp chùm tĩnh
Trang 16gĩi tin đến sẽ được đưa vào hàng đợi tương ứng với đích đến của chúng Khi kích thước hàng đợi đạt đến một ngưỡng hoặc thời gian chờ đợi của các gĩi tin trong
hàng đợi đạt đến một ngưỡng thì một chùm sẽ được hình thành và được gui di
1.2.3 Báo hiệu trong mạng chuyển mạch chùm quang
Trong mạng chuyển mạch chùm quang, khi một chùm được gửi tới một nút
lõi, tiến trình báo hiệu được thực hiện trước để đặt trước tài nguyên và cầu hình bộ
chuyên mạch quang tại mỗi nút đĩ sao cho phù hợp với chùm dữ liệu tương ứng
Tiến trình báo hiệu trong mạng chuyển mạch chùm quang được thực hiện bởi các
gĩi điều khiển và các gĩi này được truyền độc lập với các chùm dữ liệu
Cĩ nhiều phương thức báo hiệu khác nhau tùy thuộc vào cách thực hiện và
thời gian mà tài nguyên dọc theo đường đi được đặt trước cho chùm Phân tiếp theo sẽ trình bày các loại phương thức báo hiệu
e_ Báo hiệu một chiều, hai chiêu hay hỗn hợp
Đối với sơ đồ báo hiệu một chiều, nút nguồn gửi đi một gĩi điều khiển yêu cầu mỗi nút trên cùng một tuyến cấp phát tài nguyên cần thiết cho chùm dữ liệu và cầu hình chuyển mạch quang tương ứng Sau đĩ nguồn sẽ gửi chùm đữ liệu đi mà khơng cần chờ tín hiệu ACK từ nút trung gian hay nút đích trả lời về Vì khơng cần tín hiệu ACK nên chùm dữ liệu cĩ thé gửi đi sớm hơn và giảm độ trễ truyền dẫn đầu ~ cuối (end-to-end)
Sơ đỗ báo hiệu hai chiều cũng tương tự như báo hiệu một chiều tuy nhiên nút
nguồn chờ nhận được tín hiệu ACK phản hơi sau đĩ mới quyết định cĩ truyền chùm đi hay khơng Như vậy, nếu việc đặt trước tài nguyên và cấu hình chuyển mạch quang thành cơng, chùm dữ liệu được gửi đi Ngược lại, nếu bất kỳ nút trung gian nào đĩ khơng thể điều tiết được tài nguyên thì tại nút trung gian này sẽ cĩ một thơng báo tắc nghẽn được gửi trở lại nguồn để báo rằng việc đặt trước thất bại và nút nguồn sẽ hủy bỏ các liên kết đã đặt trước được thiết lập trước đĩ trên đường đi tương ứng Báo hiệu hai chiều tăng độ trễ truyền dẫn đầu - cuối
Trang 17chiều và hai chiều, đây là phương pháp dự phịng bộ phận Trong phương pháp báo
hiệu kết hợp, việc đặt trước từ nút nguồn tới các nút trung gian trên tuyến được xác
nhận bằng tín hiệu ACK, trong khi việc dành riêng từ nút trung gian tới đích sẽ
khơng được xác nhận VỊ trí của nút được chỉ định làm nút trung gian sẽ quyết định
khả năng mất hay độ trễ của chùm dữ liệu Nếu nút trung gian được chọn gần với
nguồn thì hoạt động của mạng sẽ giống như việc báo hiệu một chiều, và nếu nút
trung gian gần về phía đích thì hoạt động giống như việc báo hiệu hai chiều
s Đặt trước tài nguyên bắt đầu từ nguồn, từ đích hoặc từ nút trung gian Đặt true tir nguén (Source Initiated Reservation - SIR): tai nguyên được cấp phát cùng hướng báo hiệu khi gĩi điều khiển đi từ nguồn về đích Nếu quá trình đặt
trước thành cơng tử nguồn đến đích, một tín hiệu ACK được gửi ngược từ đích về
nguồn chỉ định bước sĩng đành riêng mà chùm dữ liệu sẽ được truyền đi
Đặt trước tr dich (Destination Initiated Reservation - DIR): nguén giti mot yêu cầu đặt trước tài nguyên đến nút đích, yêu cầu này sẽ lựa chọn các bước sĩng phù hợp với thơng tin trên mỗi liên kết cùng hướng Dựa trên sự lựa chọn thơng tin, nút đích sẽ chọn một bước sĩng phù hợp (nếu như nĩ tổn tại) tương ứng với khoảng thời gian và gửi yêu cầu dành riêng trở về nút nguơồn, yêu cầu dành riêng sẽ được chuyên qua các nút trung gian, dành riêng này sẽ được chọn một bước sĩng để giữ cho hết thời gian quy định
Nguyên nhân chính gây ra tắc nghẽn (hoặc mất dữ liệu) trong SIR vì thiếu tài nguyên rỗi, trong khi dé đối với DIR việc mắt dữ liệu vì thơng tin hết hạn
Dành riéng tai nut trung gian (intermediate Node Initiated Reservation- (NI): đặc trưng dành riêng tài nguyên của nĩ giống như DIR từ nguồn đến một vài nút trung gian, và giống như SIR từ nút trung gian đến nút đích
Nhìn chung, dé giảm sự mất dữ liệu tại các nút trong hướng thuận, SIR dựa
Trang 18nguồn Ngược lại, DIR dựa trên kỹ thuật chỉ lựa chọn những thơng tin sẵn sang của
tất cả các nút trung gian và dựa trên những thơng tin đĩ mà lựa chọn bước sĩng
e Đặt trước tức thời hay đặt trước sau một thời gian trễ
Kỹ thuật báo hiệu cĩ thể thực hiện đặt trước tài nguyên tức thời hoặc sau một
khoảng thời gian trễ Trong kỹ thuật đặt trước tức thời, kênh (tài nguyên) sẽ được dành riêng ngay lập tức khi gĩi điều khiển đến các nút Ngược lại, đối với kỹ thuật
đặt trước sau khoảng thời gian trễ, các kênh được đặt chỗ dựa trên thời gian thực tế của chùm dữ liệu đến tại nút đĩ (Hình 1.3)
Gĩi điều khiển Burst dữ liệu Thời gian Offset
T——— REL
Dành trước tức thời Dành trước cĩ trễ Giải phĩng tường minh Giải phĩng ẩn
——
Thời gian
Hình 1.3 Quá trình đặt trước tức thời và sau một thời gian trễ
Để sử đụng kỹ thuật đặt trước sau khoảng thời gian trễ, gĩi điều khiển phải
được gửi đi trước chùm dữ liệu một khoảng thời gian offset Ví dụ của đặt trước tức
thời là giao thức JIT (Just-In-Time), trong khi giao thức JET (Just-Enough-Time) dùng kỹ thuật đặt trước sau khoảng thời gian trễ Nhìn chung đặt trước tức thời đơn giản và cĩ thê thực hiện ngay lập tức nhưng dễ tạo ra tắc nghẽn lớn, ảnh hưởng đến hiệu quả sử dụng băng thơng trên tồn mạng Ngược lại đặt trước sau khoảng thời gian trễ giải quyết được tỉnh trạng trên một cách hiệu quả
e Giải phĩng tài nguyên tường mình hoặc ngầm định
Giải phĩng tài nguyên cĩ thể thực hiện bằng hai cách đĩ là giải phĩng ngầm định và giải phĩng tường mình Trong đĩ kỹ thuật giải phĩng tường minh, một gĩi điều khiến riêng biệt theo sau chum dé liệu từ nguồn đến đích để giải phĩng hoặc kết thúc việc sử đụng tài nguyên đã được đặt trước Ngược lại kỹ thuật giải phĩng
Trang 19ngầm định thì gĩi điều khiển (BHP/BCP) phải mang thêm thơng tin như là độ đài khối dữ liệu và độ lệch thời gian giữa gĩi điều khiển và chùm đữ liệu để tại nút đĩ
biết được thời gian để giải phĩng tài nguyên dành trước Đối với hai cách giải phĩng tài nguyên đặt trước trên thì giải phĩng tài nguyên tường minh phức tạp, chiếm dụng băng thơng và làm tăng số lượng gĩi thơng báo ở trong mạng
1.24 Lập lịch chùm
Trong mạng chuyển mạch chùm quang một vấn dé quan trọng khác là lập lịch
cho chùm Khi một gĩi điều khiển đến một nút, một thuật tốn lập lịch được gọi ra dé gan chum chua duoc lập lịch với một kênh dữ liệu trên liên kết ra Dựa vào
thơng tin trong gĩi điều khiến, bộ lập lịch biết được thời gian đến của chùm và
khoảng thời gian chùm chưa được lập lịch Mục đích chính của việc lập lịch này là
cực tiểu hĩa các “khoảng hở” (gap) trong mỗi lịch biểu của kênh, trong đĩ một khoảng hở là khoảng thời gian giữa hai chùm đã được truyền trên cùng bước sĩng ra Lập lịch kênh trong mạng OBS khác với lập lịch trong mạng IP truyền thống Trong mạng IP, mỗi nút trung tâm lưu trữ các gĩi tin trong các bộ đệm điện tử và lập lịch cho chúng trên cổng ra mong muốn Trong OBS, mỗi lần chùm tới tại một nút lõi, nĩ phải được gửi tới nút tiếp theo mà khơng lưu trữ chùm trong các bộ đệm điện tử Chúng ta giả sử rằng mỗi nút lõi OBS hỗ trợ quá trình chuyên đổi bước song toan quang
Thuật tốn lập lịch chùm cần duy trì thời điểm chưa lập lịch khả dụng gần nhất
(LAUT - Latest Available Unscheduled Time), các khoảng hở (gap) và các khoảng
trống (voids) trên mọi kênh dữ liệu ra Theo truyền thống, LAUT của một kênh dữ liệu là thời điểm sớm nhất mà tại đĩ kênh dữ liệu cĩ giá trị đối với chùm dữ liệu
chưa được lập lịch Khoảng hở (gap) là thời gian khác nhau giữa thời điểm đến của
chùm chưa lập lịch và thời điểm kết thúc của chùm đã lập lịch trước đĩ Khoảng
trống (voids) là khoảng thời gian khơng đùng đến giữa hai chùm đã lập lịch trên một kênh dữ liệu Đối với các thuật tốn dùng để lấp đầy các khoảng trống, thời
điểm bắt đầu và kết thúc mỗi chùm tín hiệu trên mọi kênh đữ liệu phải được duy trì Các thuật tốn lập lịch cho kênh dữ liệu cĩ thể được phân thành 2 loại: lap day
Trang 20khoảng trống và khơng lấp đầy khoảng trống (Hình 1.4) Các thuật tốn khác nhau chủ yếu ở kiểu và số lượng thơng tin trạng thái được duy trì tại một nút trên mỗi kênh Trong các thuật tốn lập lịch kênh dữ liệu mà khơng lấp đầy khoảng trống,
LAUT; trên mỗi kênh đữ liệu D, (=0, 1, , W) được duy trì bằng bộ lập lịch kênh ;— [tun LAUTa - —— Do LAUTs FFUG i Dị LAUT2 LAUG Ì De LAUT; <n mm Ds Thời gian (a) Khơng lấp đầy khoảng trồng _ Burstđễn li af sf a! sử FEUC-VE Db a, sỉ Dy ef 57 D, os" sẽ E8” sĩ _.Ỷỷ—_— Eˆˆ — mmmma Dy Thởi gian
(b) Lap đầy khoảng trồng
Hình 14 Trạng thái kênh đữ liệu với các trường hợp lập lịch
Khi một gĩi điều khiển đến tại một nút lõi, nút lõi chuyên nĩ thành tín hiệu
điện và thu được thời gian đến của chùm và khoảng thời gian từ chùm đến gĩi điều
khiển của nĩ Một thuật tốn lập lịch kênh dữ liệu được gọi để lập lịch chùm trên một bước sĩng của liên kết ra chùm Chuyển mạch quang được cầu hình lại dựa trên
các kết quả lập lịch
Để tìm ra một bước sĩng phù hợp trong số các bước sĩng (kênh) cĩ thê chỉ
định cho một chùm đến, một vài thuật tốn lập lịch kênh khơng lấp đầy khoảng
Trang 21tréng truyén théng nhu FFUC (First Fit Unscheduled Channel), LAUC (Latest Available Unscheduled Channel) va cac thuat tốn lập lịch lấp đầy khoảng trống truyền thống, như: FFUC-VFE (First Fit Unscheduled Channel with Void Filling), LAUC-VF (Latest Available Unscheduled Channel with Void Filling) duoc dé xuat
trong [5]
1.2.5 Giải quyết tranh chấp
Trong mạng chuyển mạch chùm quang, cũng như các mạng chuyên mạch gĩi
khác, tổn tại khả năng một chùm cĩ thể tranh chấp với một chùm khác tại một nút
Sự tranh chấp sẽ xảy ra nếu nhiều chùm đến từ nhiều cổng vào khác nhau được định trước cho cùng một cơng ra tại cùng thời điểm Điền hình của việc giải quyết tranh chấp trong các mạng chuyển mạch gĩi điện tử truyền thống được quản lý thơng qua
bộ đệm, tuy nhiên trong lĩnh vực quang, việc sử dụng bộ đệm tại các nút đang gặp
khĩ khăn Để giải quyết tình trạng tranh chấp và việc mất chùm một số phương pháp cơ bản được trình bày ngay sau đây
e Sử dụng các đường dây trễ (FDL)
Sử dụng các đường dây trễ nhằm cố gắng làm trì hỗn thời gian ra của chùm cho đến khi một kênh nào đĩ rỗi Trong các mạng chuyển mạch gĩi điện tử truyền thống được thực thi bằng cách lưu trữ các gĩi trong các bộ nhớ truy cập ngẫu nhiên
RAM (Random Access Memory) Tuy nhiên, bộ đệm như RAM khơng thực sự hiện
hữu trong lĩnh vực mạng quang Do đĩ, các đường trễ FDL cĩ thể được sử dụng để làm trễ các chùm ra trong một khoảng thời gian xác định Phương pháp này mang lại khả năng mất mát chùm thấp hơn, nhưng nĩ khơng đảm bảo thứ tự các chủm
một cách chính xác
e Chuyển đổi bước sĩng
Quá trình chuyển đổi bước sĩng là quá trình chuyển đổi bước sĩng của một kênh vào thành một bước sĩng khác trên một kênh ra Các bộ chuyển đổi bước sĩng
là các thiết bị mà chúng chuyển đổi một tín hiệu của bước sĩng vào thành một bước
sĩng ra khác Với cách này cho phép tăng khả năng sử dùng lại các bước sĩng hiệu
Trang 22quả hơn, tức là cùng một bước sĩng cĩ thê được tái sử dụng về mặt khơng gian để mang các kết nối khác nhau trên các sợi khác nhau trong mạng
Trong mạng chuyển mạch chùm quang cĩ sử dụng phương pháp chuyền đổi
bước sĩng, tranh chấp sẽ được giảm nhờ việc tạo ra nhiều bước sĩng trên một kết nối; Một chùm bị xung đột cĩ thể được chuyển mạch đến bất kì bước sĩng rỗi nào tai dau ra
Hinh 1.5 Chuyén déi bude song W, qua W, e Định tuyến lệch hướng
Định tuyến lệch hướng là một phương pháp giải quyết tắc nghẽn bằng việc định tuyến một chùm tranh chấp đến một cổng ra khác so với cơng ra theo dự kiến Trong định tuyến lệch hướng, một chùm được lệch hướng sẽ làm đường truyền tới
đích dài hơn, dẫn tới làm tăng độ trễ và giảm chất lượng tín hiệu Hơn nữa, nĩ cĩ
thê dẫn đến chùm cĩ khả năng lặp vơ hạn trong mạng và nĩ sẽ dẫn tới tắt nghẽn Vì
vậy cần cĩ các cơ chế để thực hiện ngăn chặn độ dài đường đi quá mức
Trang 23
1.3 TIEU KET CHUONG 1
Mạng chuyển mạch chùm quang (OBS) kết hợp nhiều ưu điểm của chuyển mạch kênh quang và chuyên mạch gĩi quang và đang được xem là cơng nghệ hiện đại và thích hợp nhất đối với mạng thơng tin quang hiện nay và tương lai
Trong chương này tơi đã giới thiệu tổng quan về mạng chuyển mạch chùm quang OBS cũng như giới thiệu cấu trúc, các hoạt động cũng như các giao thức đặt trước tài nguyên và các phương pháp giải quyết tắc nghẽn của mạng qua đĩ nêu bật lên những ưu điểm của mạng chuyên mạch chùm quang so với các mạng chuyển mạch khác Trong chương tiếp theo, tơi sẽ trình bày một số phương pháp phát hiện tấn cơng ngập lụt trong mạng chuyển mach chùm quang
Trang 24CHƯƠNG 2 PHƯƠNG PHÁP PHÁT HIỆN TÁN CƠNG NGẬP LỤT TRONG MẠNG CHUYÉN MACH CHUM QUANG
2.1 GIỚI THIỆU VỀ TÂN CƠNG MẠNG
2.1.1 Khái niệm
Khái niệm tấn cơng mạng (hoặc tấn cơng khơng gian mạng) trong tiếng Anh là Cyber attack (hoặc Cyberattack), được ghép bởi 2 từ: Cyber (thuộc khơng gian
mang internet) va attack (su tan cơng, phá hoại)
Tấn cơng mạng là tất cả các hình thức xâm nhập trái phép vào một hệ thống
máy tính, website, cơ sở dữ liệu, hạ tầng mạng, thiết bị của một cá nhân hoặc tổ
chức thơng qua mạng internet với những mục đích bất hợp pháp
Mục tiêu của một cuộc tấn cơng mạng rất đa dạng, cĩ thể là vi phạm dữ liệu (đánh cắp, thay đổi, mã hĩa, phá hủy), cũng cĩ thể nhắm tới sự tồn vẹn của hệ thống (gây gián đoạn, cản trở dịch vụ), hoặc lợi dụng tài nguyên của nạn nhân (hiển thị quảng cáo, mã độc đào tiền ảo)
Tấn cơng mạng khác với pentest (kiểm thử xâm nhập) Mặc đù cả 2 đều chỉ việc xâm nhập vào một hệ thống, tuy nhiên tấn cơng mạng là xâm nhập trái phép gây hại cho nạn nhân, cịn pentest là xâm nhập với mục đích tìm ra điểm yếu bảo mật trong hệ thống đề khắc phục
Đối tượng bị tấn cơng cĩ thể là cá nhân, doanh nghiệp, các tổ chức chính phủ
hoặc phi chính phủ, cơ quan nhà nước, thậm chí đối tượng cĩ thể là cả một quốc
gia Tuy nhiên, đối tượng phổ biến nhất của các cuộc tấn cơng mạng là các doanh nghiệp Đơn giản vì mục tiêu chính của những kẻ tấn cơng là vì lợi nhuận
Mục đích tấn cơng mạng bên cạnh những mục đích phơ biến như trục lợi phi phap, tống tiền doanh nghiệp, hiện thị quảng cáo kiếm tiền, thì cịn tồn tại một số
mục đích khác phức tạp và nguy hiểm hơn: cạnh tranh khơng lành mạnh giữa các doanh nghiệp, tấn cơng an ninh hoặc kinh tế của một quốc gia, tấn cơng đánh sập
một tổ chức tơn giáo, Ngồi ra, một số hacker tấn cơng mạng chỉ để mua vui, thử
Trang 25sức, hoặc tị mị muốn khám phá các vấn để về an ninh mạng
2.1.2 Các hình thức tân cơng mạng phổ biến e Tấn cơng bằng phần mỗồn độc hại
Tấn cơng malware (phần mềm độc hại) là hình thức phổ biến nhất Malware bao gồm spyware (phần mềm gián điệp), ransomware (mã độc tống tiền), virus và worm (phần mềm độc hại cĩ khả năng lây lan nhanh) Thơng thường, tin tặc sẽ tấn cơng người đùng thơng qua các lỗ hồng bảo mật, cũng cĩ thê là đụ đỗ người dùng
click vào một đường link hoặc email (phishing) dé phan mềm độc hại tự động cài đặt vào máy tính Một khi được cài đặt thành cơng, malware sẽ gây ra:
- Ngăn cản người dùng truy cập vào một file hoặc folder quan trọng
(ransomware)
- Cài đặt thêm những phan mềm độc hại khác
Trang 26e Tấn cơng giả mạo
Phishing (tấn cơng giả mạo) là hình thức giả mạo thành một đơn vị cá nhân uy tín để chiếm lịng tin của người dùng, thơng thường qua email Mục đích của tấn cơng Phishing thường là đánh cắp đữ liệu nhạy cảm như thơng tin thé tin dung, mat khẩu, đơi khi phishing là một hình thức để lừa người đùng cai dit malware vào thiết bị (khi đĩ, phishing là một cơng đoạn trong cuộc tấn cơng malware)
e Tân cơng trung gian
Tấn cơng trung gian (Man-in-the-middle attack), hay tấn cơng nghe lén, xây ra khi kẻ tấn cơng xâm nhập vào một giao dịch/sự giao tiếp giữa 2 đối tượng Khi đã chen vào giữa thành cơng, chúng cĩ thể đánh cắp dữ liệu của giao dịch đĩ
Loại hình này xảy ra khi:
- Nạn nhân truy cập vào một mạng Wifđi cơng cộng khơng an tồn, kẻ tấn
cơng cĩ thể “chen vào giữa” thiết bị của nạn nhân và mang Wifi đĩ Vơ tình,
những thơng tin nạn nhân gửi đi sẽ rơi vào tay kẻ tấn cơng
- Khi phần mềm độc hại được cài đặt thành cơng vào thiết bị, một kẻ tấn
cơng cĩ thể dễ dàng xem và điều chỉnh đữ liệu của nạn nhân e_ Tấn cơng ngập lụt
Tấn cơng ngập lụt hay cịn gọi là hình thức tấn cơng từ chối địch vụ DoS
(Denial of Service) là hình thức tấn cơng mà tin tặc “đánh sập tạm thời” một hệ thống, máy chủ, hoặc mạng nội bộ Để thực hiện được điều này, chúng thường tạo ra một lượng traffic/request khơng 166 cùng một thời điểm, khiến cho hệ thống bị
quá tải, từ đĩ người dùng khơng thé truy cập vào địch vụ trong khoảng thời gian mà cuộc tân céng DoS diễn ra
Trang 27Ys Attacker se“ Controller Đ > Zombies Va Vietinn Hình 2.2 Phương pháp tấn cơng ngập lụt
Một hình thức biến thể của DoS 1a DDoS (Distributed Denial of Service): tin tặc sử đụng một mạng lưới các máy tính (botnet) để tấn cơng nạn nhân Điều nguy hiểm là chính các máy tính thuộc mạng lưới botnet cũng khơng biết bản thân đang
bi loi dung dé lam cơng cụ tấn cơng
e Tấn cơng cơ sở dữ liệu
Tin tặc “tiêm” một đoạn code độc hại vào server sử dụng ngơn ngữ truy vấn
cĩ cấu trac (SQL), muc đích là khiến máy chủ trả về những thơng tin quan trọng mà lẽ ra khơng được tiết lộ Các cuộc tấn cơng SQL injection (tấn cơng cơ sở đữ liệu) xuất phát từ các lỗ hổng của website, đơi khi tin tặc cĩ thể tấn cơng chỉ bằng cách
chèn một đoạn mã độc vào thanh cơng cu “Tim kiếm” là đã cĩ thể tấn cơng website e Các loại khác
Ngồi ra, cịn rất nhiều hình thức tấn cơng mạng khác như: Tấn cơng chuỗi cung ứng, Tấn cơng email, Tấn cơng vào con người, Tấn cơng nội bộ tổ chức, v.v Mỗi hình thức tấn cơng đều cĩ những đặc tính riêng, và chúng ngày cảng tiến hĩa
phức tạp, tinh vi địi hỏi các cá nhân, tổ chức phải liên tục cảnh giác & cập nhật các
cơng nghệ phịng chống mới
Trang 282.2 TAN CONG NGAP LUT TRONG MANG CHUYEN MACH CHUM QUANG
2.2.1 Giới thiệu
Với các loại hình tấn cơng mạng như được trình bày trong Mục 2.1 thì loại
hình tấn cơng phổ biến nhất ở trong mạng chuyên mạch chùm quang là hình thức tấn cơng ngập lụt Theo đĩ, khi sử dụng chuyên mạch chùm quang dé truyền dữ liệu các gĩi điều khiến (BHP) thường được gửi trước các chùm dữ liệu để đặt trước tài nguyên mạng [4] Tuy nhiên, trong nhiễu trường hợp, mạng bị sẽ bị tấn cơng ngập lụt bởi các gĩi BHP cĩ hại được truyền từ những kẻ tấn cơng mà khơng gửi chùm dữ liệu tương ứng của gĩi BHP đĩ, do đĩ gây lãng phí mạng tài nguyên Điều này cĩ thể gây ra sự suy giảm đáng kề hiệu năng của mạng chuyên mạch chùm quang và cĩ thê dẫn đến vấn để nghiêm trọng hơn là từ chối dịch vụ được cung cấp Đề tránh
các vẫn để gây ra bởi BHP cĩ hại nhằm thuận lợi cho việc phát hiện tại nút biên
đang hoạt động sai và liên tục gửi các BHP này để cĩ thể ngăn chặn Điều này cĩ thé cải thiện hiệu suất tổng thể của mạng và giảm vấn để tấn cơng ngập lụt
Cĩ rất ít cơng trình nghiên cứu điều tra vấn đề tấn cơng ngập lụt trong mạng chuyển mạch chùm quang, các tác giả trong [4] [5] [6] tích hợp mơ hình phân loại bảo mật máy tính tại các nút biên dựa trên thơng tin lịch sử truyền gĩi BHP trong mạng OBS Trong mơ hình này các tập luật theo chuyên gia được tạo chủ yếu bằng cách sử dụng tỉ lệ mất gĩi trong khi chạy trên phần mềm mơ phỏng mạng NCTUns Những tập luật sau đĩ được sử dụng để phân loại các nút và xử lý những hành vi
truyền BHP độc hại Trong một số trường hợp, các nút nhận được bị chặn một thời
gian cho đến khi nút đĩ sửa đổi hành vi của nĩ tại điểm mà mơ hình phát hành phong tỏa
Một cách tiếp cận tương tự dựa trên phân tích thống kê dữ liệu thu thập trong quá trình mơ phỏng được để xuất bởi [6] Sử dụng cách tiếp cận này, các tập luật khác nhau được tạo ra dựa trên kết quả phân tích thống kê Các chuyên gia tên miền
đã được đào tạo đề phân biệt giữa các nút biên và xác định những nút đĩ hành vi sai
Trang 29cơ của các cuộc tấn cơng ngập lụt và để xuất rằng tự động hĩa quá trình tạo quy tắc
cĩ thể thực sự tăng tỷ lệ phát hiện
Vài nghiên cứu về các cuộc tấn cơng ngập lụt BHP ở mạng OBS đã được tiến hành và phần lớn trong số này nghiên cứu dựa trên kinh nghiệm của con người và thống kê phân tích đơn giản Hai trở ngại chính liên quan đến những nghiên cứu này là:
1 Cách phát hiện nút biên cĩ hành vị bất thường khơng được thực hiện tự
động vì chúng dựa vào đánh giá của các chuyên gia tên miễn 2 Tỷ lệ phát hiện các cuộc tấn cơng ngập lụt là khơng cao
Một cách để cải thiện việc phát hiện các nút biên cĩ hành vi bất thường trong
mạng OBS là sử dụng các hệ thống phân loại bắt nguồn từ các kỹ thuật như khai phá dữ liệu liên quan đến việc khám phá thơng tin quan trọng và hữu ích trong cơ
sở dữ liệu hoặc bộ dữ liệu để cải thiện việc ra quyết định [Š] Trong bối cảnh của
vấn để tấn cơng ngập lụt, khai phá dữ liệu cĩ thể gắn nhãn các nút biên như một
điển hình của học cĩ giám sát trong đĩ một bộ phân loại được xây dựng từ mơ
phỏng trước đây của mạng OBS Trong khi mơ phỏng, các sự kiện quan trọng liên
quan đến hiệu suất nút biên cĩ thể được thu thập, chẳng hạn như tỉ lệ mất, tỉ lệ
băng thơng bị mất, gĩi tin nhận được, độ trễ trung bình và khả năng sử dụng băng
thơng Dữ liệu này sau đĩ cĩ thể được lưu trong một tập dữ liệu huấn luyện Một thuật tốn học được chọn nhằm xử lý tập dữ liệu huấn luyện để lay cac phan loai
cĩ thê gắn nhãn các nút biên càng chính xác càng tốt dựa trên hiệu suất lịch sử của nĩ Những phân loại này cũng cĩ thể là được sử dụng bởi các chuyên gia thuộc
lĩnh vực hoặc quản trị viên bảo mật máy tính để xác minh kết quả và tăng nhận
thức về an ninh mạng OBS Giải pháp thơng minh này là mối quan tâm của luận văn, trong đĩ chúng tơi tìm hiểu một số giải thuật về khai phá đữ liệu dé phân tích và phát hiện tấn cơng ngập lụt BHP trong mạng OBS Cụ thể, chúng tơi kiểm tra khả năng ứng dụng của phương pháp dựa trên luật nhằm xác định xem nĩ cĩ thê dự đốn hiệu quả nút biên cĩ hành vi bất thường hay khơng Thơng tin được xây dựng dưới dạng tập các luật ¡ƒ#ˆ/ben dựa trên phương pháp khai phá tập dữ liệu
Trang 30huấn luyện [7] Luận văn xem xét một tập luật xây dựng một nên tảng kiến thức tự động để đánh giá sự hiểu biết về cách các nút biên được gan nhãn dựa trên hành vi
của chúng trong mạng OBS Chỉ tiết các phương pháp phát hiện tấn cơng ngập lụt được trình bày ở phần sau
2.2.2 Một số phương pháp phân tích và phát hiện tắn cơng ngập lụt
e Dua trén kỹ thuật khai phá dữ hiệu
Uzel và các cộng sự trong [12] đã nghiên cứu phương pháp phát hiện tắn cơng ngập lụt sử dụng phương pháp khai phá dữ liệu Thứ nhất, bộ đữ liệu được nhân đơi vì dữ liệu khơng cân bằng Sau đĩ, nĩ được phân loại bởi các phương pháp phân
loại phân loại khác nhau Ngồi ra, lựa chọn đặc trưng (feature) cũng được áp dụng
cho kết quả phân loại tốt hơn Sau đĩ, kết quả được so sánh với đặc trưng trước và
sau khi lựa chọn đặc trưng
A Bộ dữ liệu
Trong nghiên cứu này, tấn cơng ngập lụt BHP trên mạng OBS được sử đụng
từ kho dữ liệu của ỦCI [13] Bộ dữ liệu cĩ 1075 trường hợp và 22 đặc trưng Đặc
trưng thứ hai mươi hai là nhãn lớp Nĩ cĩ 4 nhãn lớp Đĩ là Misbehaving-Bloek (Block), Behaving-No Block (No Block), Misbehaving-No Block (NB-No Block)
va Misbehaving-Wait (NB- Wait) Đầu tiên, bộ dữ liệu được chia thành tập dữ liệu
huấn luyện và đánh giá Tập đữ liệu cĩ phân phối nhãn lớp khơng cân bằng Nên để
làm cho nĩ trở thành cân bằng, nhãn Block được nhân 4 lần và nhãn No Block được
nhân 3 lần
B Các phương pháp phân loại
148 là một phương pháp phân loại cây quyết định tạo ra cây nhị phân với sự trợ giúp của entropy thơng tin Sau khi cây được xây dựng, nĩ cĩ thể được sử dụng dé gán nhãn lớp cho mỗi bộ dữ liệu trong tập dữ liệu huấn luyện
Mạng nơ-ron nhân tạo (ANN) là một mơ hình lay cảm hứng từ bộ não con
người và hệ thần kinh Một ANN cĩ thê cĩ nhiều lớp Lớp đầu tiên được gọi là lớp vào và lớp cuối cùng được gọi là lớp ra Các lớp ở giữa được gọi là lớp ấn Mỗi lớp
Trang 31chứa một số lượng tế bào nơ-ron nhất định được kết nối bởi các khớp nơ-ron
Perceptron đa lớp (MLP) là một loại ANN và sử dụng giải thuật lan truyền ngược dé huấn luyện mạng
Thuật tốn Naive Bayes (NB) [11] là một phương pháp phân loại xác suất đơn giản sử dụng định lý Bayes Nĩ tính tốn xác suất bằng cách đếm tần số của các giá
trị thuộc tính cho mỗi lớp trong một tập dữ liệu huấn luyện nhất định Thuật tốn
giả định rằng tất cả các thuộc tính là độc lập với giá trị của biến lớp € Lựa chọn đặc trưng
Lựa chọn đặc trưng là một bước tiền xử lý cho các phương pháp học máy
Mục đích của việc lựa chọn đặc trưng là giảm số chiều, loại bỏ dữ liệu khơng liên
quan và tăng độ chính xác trong huấn luyện
Trong phương pháp lựa chọn đặc trưng dựa trên tương quan (phương pháp CFS) [14], một đặc trưng là quan trọng nếu nĩ cĩ liên quan cao trong phân loại hoặc khơng liên quan đến các đặc trưng khác Phương pháp lọc được sử đụng để chọn đặc trưng CFS sử dụng mối tương quan giữa các đặc trưng
D Kết quả cài đặt
Các tác giả trong [12] sử dụng cơng cụ khai thác dữ liệu Weka [15] đề lựa
chọn đặc trưng và phân loại, Netbeans [16] được sử dụng cho việc tiền xử lý như chia tách tập dữ liệu thành huấn luyện và kiểm tra
Bến tiêu chí đánh giá được sử dụng để phân loại Đĩ là Accuracy, Precision,
Recall và F-measure [17] Ma trận nhằm lẫn (confusion matrix) được mơ tả trong Bảng 2.1 được sử dụng để tính tốn bốn tiêu chí đánh giá này
Aeeuraey là tỷ lệ phần trăm các mẫu được phân loại chính xác trong bộ dữ liệu
thi nghiém Precision là tỷ lệ tích cực đúng đối với tất cả các mẫu được dán nhãn tích cực Recall là tỷ lệ tích cực đúng đối với tất cả các mẫu tích cực trong bộ dữ
liệu thử nghiệm #-measure là giá trị trung bình hài hịa của Precision va Recall Phương trình 2.1, 2.2, 2.3 và 2.4 mơ tả cách tính bốn tiêu chí đánh giá này
Trang 32Bảng 2.1: Ma trận nhằm lẫn Dự đốn Positive Negative True positive | False negative (TP) (FN) Positive Thục tế — - False positive | True negative Negative (FP) (TN) Accuracy = (IP +TN)/IP+TN + FP + FN) (2.1) Precision = TP /(1P + FP) (2.2) Recall = TP (TP + FN) (2.3)
F-measure = 2(Precision + Recall) /(Precision* Recall) (2.4)
J48, MLP, NB được sử đụng là phương pháp phân loại CFS được sử đụng để
lựa chọn đặc trưng
Mục đích nghiên cứu trong [12] là phát hiện tấn cơng ngập lụt BHP trong
mạng OBS Bộ dữ liệu cĩ 4 lớp nhãn và 3 trong số đĩ là cĩ hành vi bất thường, một
trong số đĩ là cĩ hành vi bình thường: Block, No Block, NB-No Block và NB-Wait Kết quả phân loại mà khơng cĩ lựa chọn đặc trưng là như trong Bảng 2.2
Trang 33Bảng 2.3: Kết quả phân loại sau CFS Phan loai| Accuracy | Precision | Recall | F-measure J48 100% 1.000 1.000 1.000 MLP 89.35% 0.892 10.894 0.892 NB 82.41% 0.796 | 0.824 0.783
Theo Bang 2.3, với CFS, J48 cho tỷ lệ chính xác tốt nhất, hiệu suất của NB
được tăng lên, trong khi MLP bị giảm
e Dựa trên máy học và học sâu
Trong [18], khái niệm mạng nơ ron tích chập sâu (deep convolution neural
network - DCNN) duoc su dung để ước tính các nút biên của mạng chuyên mạch
chùm quang (Hình 2.3) Vì đầu vào đã sử dụng một vectơ đơn (X) trong mạng của được xem xét đến lớp vào của DƠNN, nên các lớp chập tuân theo điều này Trong lớp
chập, mỗi nơ ron thu được một số đầu vào đề thực hiện hoạt động tính tổng Các lớp tích chập trong mạng được biết đến như là chỉ báo mẫu mạnh của các đặc trưng cục bộ
Trong Hình 2.3, cĩ hai lớp tích chập được theo sau bởi một trong các lớp gộp chiều Các đặc trưng cấp thấp cĩ thể được trích xuất như là kết quả của các lớp
chập Đối với các đặc trưng của mạng, lớp gộp được coi là trình trích xuất các đặc
Trang 34Để mơ hình hĩa một mối quan hệ phi tuyến lớp ReLU (Đơn vị tuyến tính chỉnh lưu) được sử dụng sau khi lớp gộp Ở đây, hiển thị ngưỡng hoạt động của hàm ReLU:
f() = t, nếu t>0 ; f(t) =0, néut <0
Trong đĩ, t là số đầu vào nơ ron Hàm này được áp dụng cho từng thành phần của ma trận đặc trưng và thay thế tất cả các giá trị âm bằng 0 (max (0, x)) A Tập dữ liệu Bảng 2.4: Mỗi tương quan Pearson giữa các thuộc tính và lớp [18] Pearson’s Pearson’s
Attributes correlation Attributes correlation
Node 0.12 Packet Size Byte 0
Utilized Bandwidth Rate -0.14 Packet Transmitted -.09
Packet Drop Rate 0.14 Packet Received -0.15
Full Bandwidth -.09 Packet lost 03
Reserved Bandwidth -.04 Transmitted Byte -.09
Average Delay Time 0.14 Received Byte -0.13
Percentage Of Lost Packet Rate 0.14 10-Run-AVG-Drop-Rate 611 Percentage Of Lost Byte Rate -0.14 10-Run-AVG-Bandwidth-Use = -0).15
Packet Received Rate -0.13 10-Run-Delay ~.07
Used Bandwidth 03 Node Status 0.13
- - Flood Status 0.12
Nghiên cứu trong [18] sử dụng tập dữ liệu tấn cơng ngập lụt BHP trong mạng
OBS được cơng khai tại UCI [19] Bộ dữ liệu này bao gồm 21 thuộc tính và 4 biến lớp là NB-No Block, Block, No Block và NB-Watt với 1075 mẫu l5 giá trị bi thiếu được loại bỏ khỏi bộ dữ liệu này ở giai đoạn tiền xử lý dữ liệu Bảng 2.4 thể hiện
mối tương quan Pearson giữa các thuộc tính và lớp B Đo lường hiệu suất phân loại
Ba kỹ thuật học máy cĩ giám sat, Naive Bayes (NB), May vector hỗ trợ (SVM) và K láng giềng gần nhất (KNN) và kỹ thuật học sâu DCNN được triển khai để phân loại phát hiện tấn cơng BHP Đánh giá mơ hình phân loại được dựa trên
Trang 35mười một tiêu chí sau
e True positive (TP) - Được nhận diện chính xác
e False positive (FP) - Được nhận diện khơng chính xác
e True negative (TN) - Bi tir chéi chinh xdc
e False negative (FN) - Bi từ chối khơng chính xác
Các tiêu chí chất lượng để tính tốn hiệu suất phân loại được thể hiện như sau:
e Classification Accuracy = (TP + TN) /(TP+FN+FP+ TN) Sensitivity or Recall = TP / (TP + FN)
e Precision = TP / (TP + FP) Specificity = TN / (TN + FP)
Negative Predictive Value = TN / (TN + FN) False Positive Rate = FP / (FP + TN)
False Negative Rate = FN / (FN + TP)
Rate of Misclassification = (FP + FN) / (TP + FN + FP + TN) F1 Score = (2 « (Precision < Recall)) / (Precision + Recall) G-mean = \ (Sensitivity x Specificity)
e Informedness = Sensitivity + Specificity - 1
C Két qua cai dat
Hiệu suất của phương pháp học máy và phương pháp học sâu đã được chứng
minh rằng tất cả các phân loại được huấn luyện với tất cả 21 thuộc tính Việc thực hiện tất cả các nhiệm vụ phân loại được sử dụng bởi phan mém python Két qua du đốn của ma trận nhằm lẫn được thể hiện trong Bảng 2.5 và Bảng 2.6 cho NB, SVM
và KNN tương ứng
Trang 36Bảng 2.5: Ma trận nhằm lẫn của NB và SVM Naive Bayes Support Vector Machine NB - No NB-No Block Block NoBlock = NB - Wait Block Block No Block = NB - Wait NB - No NB - No Block 68 § 0 29 Block 87 0 0 16 Block ũ 1 0 4 Block ũ 21 0 Z No Block 0 0 27 0 No Block ũ 0 37 ũ NB- Wait 15 14 0 30 NH- Wait 20 z 0 37
Bảng 2 6: Ma trận nhâm lân của KNN và DCNN
K-Nearest Neighbour’s Deep Convolutional Neural Networks (proposed) NB - No ‘NB - No Block Block No Block NB - Wait Block Block No Block NB - Wait NB - No NB -No Block 90 3 0 10 Block 102 0 oO 1 Block ũ 23 o 0 Block 0 23 0 0 No Block ũ 0 1 0 No Block 0 0 27 0 NB- Wait 6 3 ũ 30 NB- Wait 0 0 0 59
Giá trị đường chéo coi là TP (True positive) của lớp cĩ liên quan và giả trị ngồi đường chéo được coi là giá trị lỗi trong ma trận nhằm lẫn đối với nhiều lớp Đối với một lớp, TP là tổng của các giá trị đường chéo của lớp tương ứng của chúng, FN (False negative) là tổng các giá trị trong hàng tương ứng khơng cĩ TP, FP (False positive) la tổng các giá trị trong cột tương ứng ngoại trừ TP và TN (True negative) là tổng của tất cả các cột và hàng khơng bao gồm cột và hàng của lớp đĩ
Theo như mơ tả ở trên, TP, EN, EP và TN cĩ thể được tính tốn từ Bảng 2.5 và
Bảng 2.6 để cĩ được kết quả phân loại của Naive Bayes, May vecto hé tro, KNN va DCNN tương ứng
Trang 37Bảng 2.7: Kết quả phân loại với 3 kỹ thuật máy học và mơ hình học sâu TP FN FP TN NB 146 66 66 340 SVM 172 40 40 412 ENN 190 22 22 383 DCNN 211 1 1 422
Theo kết quả phân loại trong Bang 2.7, téng s6 TP cia DCNN là 211 trong dé
cac lép NB-No Block, Block, No Block va NB-Wait duoc du đốn chính xác Téng số FN của DCNN là 1 trong đĩ các lớp NB-No Block, Block, No Block va NB-Wait duoc
dự đốn khơng chính xác FP của DCNN là l1 trong đĩ các lớp NB-No Block, Block,
No Block va NB-Wait bi loại bỏ khơng chính xác và tổng số TN của DCNN là 422 trong đĩ các lớp NB-No Block, Block, No Block va NB-Wait được loại bỏ một cách
chính xác DCNN dự đốn số lượng TP và TN cao nhất và số lượng FEP và FN thấp nhất Hình 2 vẽ sơ đỗ kết quả phân loại của các phương phap hoc may (ML) va DCNN Classification Results 500 400 300 200 “ll 5 En Un TP FN FP TN @NB @SVM BKNN @ CNN So
Hình 2.4 Kết quả phân loại của các phương pháp học máy (ML) va DCNN
2.3 TIEU KET CHUONG 2
Trong chương này, tơi đã giới thiệu về các loại hình tấn cơng mạng thơng dụng Ngồi ra tơi đã giới thiệu về mơ hình tấn cơng ngập lụt trong mạng chuyền mạch chùm quang, và các phương pháp phát hiện tấn cơng ngập lụt trong mạng chuyển mạch chùm quang, là cơ sở cho các mơ phỏng sau này ở Chương 3
Trang 38CHƯƠNG 3 MƠ PHỎNG VÀ PHÂN TÍCH KÉT QUÁ
3.1 MO TA PHAN MEM MO PHONG WEKA
3.1.1 Giới thiệu chung về Weka
'Weka là một bộ phan mém ma nguồn mở miễn phí khai thác dữ liệu, được xây
dựng bằng ngơn ngữ lập trình Java, theo kiến trúc hướng đối tượng, được tơ chức
thành thư viện phục vụ cho lĩnh vực học máy và khai phá dữ liệu
Weka la phan mềm thuộc dự án phát triển của Đại học Waikato, New Zealand,
nĩ là tên viết tắt của Waikato Environment for Knowledge Analysis Ngồi khuơn
khổ trường đại học, Weka được phát âm van điệu với Mecca, đây là một lồi chim
khơng bay với bản chất tị mị chỉ tìm thấy trên các đảo ở New Zealand, đồng thời, lồi chim này cũng chính là biêu tượng cho phần mềm Weka ; sw EKA The University of Waikato
Hình 3.1 Biểu tượng của ứng dụng Weka
Năm 1993, Đại học Watkato khởi động dự án nghiên cứu và xây dung
phiên bản đầu tiên của Weka Năm 1997, Đại học Waikato quyết định xây dựng lại Weka từ đầu bằng ngơn ngữ Java và cĩ cài đặt các thuật tốn mơ hình hĩa Đến năm 2005, Weka được nhận giải thưởng SIGKDD Data Mining and Knowledge Discovery Service Award
Weka duoc chia sé rong rãi trên website htip://www.cs.waikato.ac.nz/ml/weka/index.html Hiện tại, phiên ban ổn định mới
Trang 39
nhất của Weka là Weka 3.8 Ngồi ra, Đại học Waikato cịn cung cấp phiên bản dang phat trién Weka 3.9 Đối với mỗi phiên bản, Weka được cung cấp đây đủ các
phiên bản cho hệ diéu hanh Windows, Mac OS X, Linux Luu y, may tinh can
phải phiên bản Java cần thiết để để chạy một phiên bản Weka cụ thể Với bản
'Weka 3.8 hiện tại, máy tính cần cài đặt phiên bản Java 1.7 trở lên
Weka được xây dựng với hơn 600 lớp, tổ chức thành 10 packages, mỗi
package thực hiện một nhiệm vụ trong quá trình khai phá dữ liệu Các lớp,
packages này được mơ tả một cách chỉ tiết trong tài liệu hướng dẫn sử dụng của nhà cung cấp Giao diện đồ họa người sử dụng của Weka được phát triển theo hướng trực quan và đễ sử dụng
© Weta GUI Chooser o b3
Program Visualization Toots Help Applications ; WE KA [Explorer | The University of Waikato | Experimenter | KnowledgeFlow | ‘Waikato Environment for Knowledge Analysis, | Venion 3.8.0 workbench | jo) 1888-2016
‘The University of Waikato | Simple CLI Hamilton, New Zealand - a Giao diện chính € tan trgione - ag x Preprocess | Classity | Custos | Associate | Select atritetes | isuaizo [ mm |, openure | ngmpg Generate | zm ee ‘iter
Choose | Mae Apr Covrreat retanon $4leElef gilrEulle
‘Retaton Datsbase_Chuan_Traint anesuies: 13 Name CPU_hnacc Tre8: Nominsi Insdlaneas- 38 Sum otweigins: 538 Missing 090%) Destine & Unique! 0 (04%) Atinbutes No Lael Count ‘weight 1 k#@lCEleeft 6 lãi 4 MHRICGIEIE T63 680 7 No Name 4â NhaDC đ.(Cisas MH_DPG.8IMum) ®|| tánuakza ae | 21 Gia ) : —' + CPul,TecDa Ỉ i : i 7 Dị " # œ Ce *9
b Giao diện chức năng “Explorer”
Hình 3.2 Một số hình ảnh về giao điện người sử dụng của Weka
Trang 403.1.2 Các chức năng chính của Weka
Phiên bản mới nhất của Weka được cập nhật vào ngày 9/4/2018 thì ứng đụng đã được cập nhật lên phiên bản 3.8.3 Trong phiên bản mới nhất, menu của Weka gồm 5 thành phần chính nhằm hỗ trợ người sử dụng hai chức năng chính là khai phá
đữ liệu và thực nghiệm, đánh giá các mơ hình học máy Cụ thể:
- Explorer: Là mơi trường được sử dụng nhiều nhất cho phép tiến hành khai phá dữ liệu với các tính năng tiền xử lý đữ liệu (Preprocess), phân lớp (Classify), phân cụm (Cluster), khai thác luật kết hợp (Associate) Ngồi ra, nĩ cịn cung cấp
thêm tính năng hỗ trợ lựa chọn thuộc tính (Select attributes) va m6 hình hĩa dữ liệu (Visualize) @ Weka Explorer _ n x
| Preprocess | Classify | Cluster | Associate | Selectattibutes | Visualize |}
{open tite || openurL | | OpenDs | | Generate Edit \{ Save Filter
| Choose | None : | Apply |
| Lefi-click to edit properties for this abject, right-click/Alt+Shift+left-click for menu
Current relation K§ Selected attribute -
Relation: weather.symbolic Attributes: 5 Name: outlook Type: Nominal Instances: 14 ‘Sum of weights: 14 Missing: 0 (0%) Distinct: 3 Unique: 0 (0%)
Attributes No |Label Count | Weignt 1 sunny 5 50 2 overcast 4 40 ( All j|[ None || Imen | | Pattern Alga 5 50 No | Name 1 oulook 2 L_] temperature 3 L] humidiy 4L] Wndy 5 L] play = | class: play (Mom) *||_ Visualize all 4 ‘ Status Oe | Log | eae
Hinh 3.3 Cac chitc nang trong Explorer
- Experimenter: M6i truong cho phép thuc nghiém (Setup, Run), so sanh, phan tich (Analyse) cac m6 hinh hoc may
- KnowledgeFlow: Mơi trường này hỗ trợ các tính năng cơ bản giống như