4.3.2 Kh i b t và phân tích gĩi tin
Theo nh mơ hình đ c đ nh ngh a trong ph n 7.2. u vào c a h th ng bao g m 18 đ c tr ngnh sau:
• Các thu c tính liên quan t i đ dài gĩi:
- Fwd Packet Length Max
- Fwd Header Length
- Fwd Packet Length Min
- Fwd Packet Length Std
- Min Packet Length
- Max Packet Length
- Packet Length Std
- Average Packet Size
- Subflow Fwd Bytes
- Init_Win_bytes_forward
13 Cách tính tốn và ý ngh a c a các đ c tr ng đ c tham kh o c a ph n m m CICFlowMeter:
33
- min_seg_size_forward
• Các thu c tính liên quan t i t ng s gĩi trong lu ng:
- Fwd Packets/s
• Các thu c tính liên quan t i th i gian c a m t lu ng:
- Flow Duration
• Các thu c tính liên quan t i kho ng th i gian gi a hai gĩi tin:
- Flow IAT Mean
- Flow IAT Max
- Fwd IAT Mean
- Fwd IAT Max
• Các thu c tính liên quan t i các c trong gĩi tin:
- ACK Flag Count
Khi m i b t đ u, h th ng kh i t o m t phiên nghe lén các gĩi tin đi vào, c ng nh đi ra thi t b . Vi c nghe lén này khơng làm nh h ng t i n i dung c a các gĩi tin. Các gĩi tin nghe lén đ c s đ c c p nh t vào t ng lu ng t ng ng. M t lu ng đ c cho là k t thúc khi: V t quá th i gian t i đa c a m t lu ng cho phép đ c quy đ nh; t s gĩi tin mà m t lu ng cĩ th l u tr đ c; ho c nh n th y c FIN trong gĩi tin.
4.3.3 Kh i phân lo i và c nh báo cho ng i dùng
Sau khi phân tích đ c các lu ng d li u t các gĩi tin t kh i b t và ph n tích gĩi tin. D li u đ c đ a qua mơ hình MLP đã c t gi m s k t n i và đã t i u thơng qua thu t tốn SRGM. N u h th ng cho r ng 1 lu ng là lành tính, nĩ s đ c l u vào t p d li u cho đ n khi đ t đ s l ng đ g i đ n cho thi t b Server thơng qua giao th c FTP cùng v i c update_required đ thơng báo cho server bi t thi t b đang c n c p nh t mơ hình máy h c. Sau đĩ thi t b s ch server hu n luy n xong mơ hình và g i lên l i FTP server. Thi t b s liên t c đ c c update_available đ bi t đ c tr ng thái c a mơ hình m i đ c đào t o m i hay ch a.
M c khác khi h th ng cho r ng 1 lu ng là t n cơng, thi t b đ nh tuy n s c nh báo cho ng i dùng thơng qua hai ph ng th c: C nh báo qua giao di n Web và c nh báo qua LED đ cg n trên thi t b đ nh tuy n BKRouter. V i ph ng th c c nh báo qua Web, thi t b g i m t danh sách các đ a ch đ c cho là t n cơng lên giao di n đ hi n th t i ng i dùng. Cùng lúc đĩ, khi cĩ phát hi n s xâm nh p, tr ng thái LED trên thi t b BKRouterđ c b t lên đ c nh báo cho ng i dùng bi t đang cĩ s t n cơng đ n m ng c a mình.
34
• Thi t k giao di n Web LuCI v i ch c n ng thơng báo ch a ng i dùng bi t cĩ cĩ cu c t n cơng đ n thi t b :
Hình 4-6: S đ kh i c a h th ng phát hi n xâm nh p và c nh báo ng i dùng b ng Web và Led.
Kh i c nh báo ng i dùng s mơ hình M-C-V (Module-Controller-View) c a LuCI đ hi n th đ a ch IP c a nh ng lu ng đ c xem là t ng cơng lên Web c ng nh báo LED cho ng i dùng bi t cĩ s xâm nh p. Trong đĩ m M-C-V g m 3 kh i chính:
- Controller: áp ng các yêu c u HTTP (Request). Controller là đi m truy c p (entry point) vào ng d ng.
- View: t ng h p các file HTML, JS và CSS đ hi n th giao di n. HTML / JS s ch a logic nh các trình x lý nh p vào nút s g i m t hành đ ng tr l i b đi u khi n thơng qua XMLHttpRequest.
- Model: N i giao ti p v i user space thơng qua h th ng UCI c a OpenWRT. Kh i Model là n i dành cho nh ng ng i phát tri n giaoti p các ng d ng c a mình v i giao di n Web LuCI. Nĩ s d ng h th ng UCI c a OpenWRT đ t ng tác v i các file config trong userspace c ng nh ch y tr c ti p các ng d ng hay file script, c th là file script antiddos_init;
file này cĩ ch c n ng ch y ng d ng antiddos m i khi thi t b kh i đ ng, b i vì c ch c a OpenWRT kh i đ ng thơng qua t ng file script init riêng bi t, v i đ u tiên đ c quy đ nh trong t ng file. T c sau khi thi t b đã kh i đ ng đ c kernel, nĩ s g i các file init trong th m c /etc/init.d/ đ g i các ng d ng c n thi t. Ngồi ra script antiddos cịn cĩ vai
35 trị phiên d ch blacklist đ c t o ra b i kh i phân lo i t n cơng (MLP model) thành file config. Do kh i Model trong mơ hình M-C-V c a LuCI đ c các thơng tin trong file config đ hi n th lên giao di n web LuCI. C u trúc c a file config nh sau:
- Config Attacker: khai báo cho mơ hình M-C-V cĩ m t đ i t ng c u hình m i, c th là các đ a ch IP c a nh ng k t n cơng.
- ng v i m i Config Attacker là các tùy ch n v IP c a k t n cơng (target) và tùy ch n b qua các IP này (ignored). V i tùy ch n target: các đ a ch IP cĩ trong blacklist đ c d ch thơng qua file script antiddos_init. M c khác tùy ch n ignored do ng i dùng c u hình. Nĩ cĩ ch c n ng báo cho h th ng bi t ng i dùng đã bi t đ c các m i đe d a này, t đĩ t t đèn LED14 báo hi u đã đ c b t tr c đĩ.
14 H th ng giao ti p v i LED c a thi t b BKRouter thơng qua giao ti p I2C nh đ c đ c p trong ph n 7.4.5
36
CH NG 5: K T QU
5.1 So sánh hi u n ng c a thu t tốn t i u RigL, SET và thu t tốn phân b l i đ th a th t d a trên trung bình Gradient (SRGM) phân b l i đ th a th t d a trên trung bình Gradient (SRGM)
so đánh giá hi u n ng c a thu t tốn t i u đ c đ xu t (thu t tốn t i u mơ hình th a th t b ng cách phân b l i đ th a th t d a trên trung bình gradient: SRGM), trong ph n này, hai thu t tốn t i u RigL, SET đ c l y đ so sánh trên cùng m t t p d li u và cùng m t mơ hình máy h c.
Thơng s c a mơ hình máy h c và t p d li u đ c trình bày B ng 5-1: T p d li u và mơ hình h c máy đ c áp d ng đ đánh giá hi u n ng các thu t tốn t i u.nh sau:
B ng 5-1: T p d li u và mơ hình h c máy đ c áp d ng đ đánh giá hi u n ng các thu t tốn t i u. tốn t i u.
T p d li u Mơ hình máy h c Ghi chú
CICDDoS2019 MLP hidden layer(40,40)
MNIST Lenet5
Cifar10 GoogleNet
VGG16
Các bài đánh giá th c hi n theo quy trình nh đã đ c đ c p trong ph n 3.2.1. C th , tr c khi mơ hình b c vào giai đo n t i u, mơ hình c n đ c hu n luy n ban đ u c ng nh c t t a các k t n i. Tuy nhiên trong ph n này, chúng ta s khơng nĩi rõ v giai đo n ti n t i u, do c 3 thu t tốn đ u cùng t i u trên mơ hình đã tr i qua b c ti n t i u. Vì v y, các k t qu nh ng ph n sau t p trung vàogiai đo n t i u mơ hình th a th t.
M t khác đ i v i t ng t p d li u, t ng mơ hình máy h c. tài so sánh các thu t tốn trên nhi u m c đ th a th t khác nhau nh 90%, 95% và 99% đ đánh giá t ng quát nh t cho t ng thu t tốn.
5.1.1 ánh giá hi u n ng trên t p d li u MNIST
T pd li u MNIST là t p h p c a 60.000 m u v i kích th c 28x28 pixel g m các ch s vi t tay t 0 t i 9[21]. M c khác,Mơ hình Lenet-5 là m t trong nh ng mơ hình đ c đào do Yann LeCun và các c ng s đ c đ xu t vào n m 1998, trong bài nghiên c u Gradient-
Based Learning Applied to Document Recognition. H đã s d ng ki n trúc này đ nh n d ng các ký t vi t tay và in b ng máy.Vì v y, trong bài đánh giá này, đ tài s đánh giá hi u n ng đ t đ c khi s d ng c ba thu t tốn t i u l n l t là RigL, SET và SRGMv i l n l t các m c th a th t 90% và 99%
37
Hình 5-1: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình Lenet5 cĩ đ th a th t 90% khi áp d ng cho t p d li u MNIST.
V i đ th a th t 90%, Sau khi mơ hình đã đ c hu n luy n g n 12.000 l n l p ban đ u bao g m giai đo n ti n c t t a và giai đo n c t t a. Mơ hình đ t đ c đ chính xác là quanh 99%. Sau đĩ mơ hình s đ c t i u b ng ba thu t tốn v i Tlà 100. Sau kho ng 8000 l n hu n luy n, hi u n ng đ t đ c c a c ba thu t tốn th t s khơng cĩ nhi u khác bi t. Do
hi u n ng khi ch a th c hi n b c t i u mơ hình đã đ t đ chính xác g n 100%. Nh v y khĩ cĩ th th y đ c s chênh l ch trong bài đánh giá này.
Hình 5-2: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình Lenet5 cĩ đ th a th t 99% khi áp d ng cho t p d li u MNIST.
38 M c khác, khi mơ hình ch cịn g n 1% s k t n i, t c ch cịn g n 450 k t n i so v i 44190 k t n i đ yđ . Hi u n ng đ t đ c c a c ba bây gi đã cĩ s chênh l ch rõ r t. C th , thu t tốn SRGM sau h n 2000 l n l p đã giúp cho mơ hình t ng g n 10% và sau 6000 l n l p sau đĩ, mơ hình đã cĩ s chính xác g n 85% so v i m c 70% khi mơ hình ch a đ c t i u. M ckhác, thu t tốn RigL c ng đã giúp cho mơ hình c i thi n đ c g n 10% và sau cùng là thu t tốn SET ch giúp cho mơ hình t ng đ c 5% sau h n 8000 l n l p và Tlà 100.
5.1.2 ánh giá hi u n ng trên t p d li u Cifar10
B d li u CIFAR-10 bao g m 60000 hình nh màu 32x32đ c chia thành 10 l p, v i 6000 hình nh cho m i l p. Trongbài đánh giá l n này, đ tài s áp d ng hai mơ hình khác nhau là GoogleNet và VGG16 v i đ ph c t p c a mơ hình t ng d n đ đánh giá hi u n ng đ t đ c khi áp d ng c ba thu t tốn v i các m c th a th t t 90 đ n 99%.
a. ánh giá hi u su t trên mơ hình GoogleNet
Hình 5-3: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình GoogleNet cĩ đ th a th t 95% khi áp d ng cho t p d li u Cifar10.
Khi áp d ng mơ hình GoogleNet v i s k t n i đ y đ ban đ u là g n 6 tri u k t n i. Và sau h n 30.000 l n l p hu n luy n ban đ u,mơ hình đ t đ c đ chính xác quanh 80% khi đã c t t a 5% s k t n i đ y đ . Sau đĩ, khi áp d ng thu t tốn t i u cho mơ hình này. S chênh l ch c a c ba khơng cĩ s khác bi t khi đ t quang 85%sau g n 15.000 l n l p và T 781.
39
Hình 5-4: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình GoogleNet cĩ đ th a th t 99% khi áp d ng cho t p d li u Cifar10.
M ckhác, khi mơ hình ch cịn 1% s k t n i. S chênh l ch hi u n ng c a c bađã cĩ s khác bi t. Thu t tốn SRGM đã cho th y nĩ cĩ th giúp cho mơ hình t ng đ c g n 10% v đ chính xác tuy r ng trong nh ng l n l p t i u đ u tiên, mơ hình cĩ s gi m sút m ch v quanh m c 15% nh ng sau đĩ nĩ đã kh c ph c đ c và t ng lên l i v t qua hai thu t tốn RigL và SET.
b. ánh giá hi u su t trên mơ hình VGG16
Hình 5-5: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình VGG16 cĩ đ th a th t 95% khi áp d ng cho t p d li u Cifar10.
40 Nh ng khi t ng đ th a th t lên 95%, thu t tốn SRGM đã cho th y đ c kho ng chênh l ch h n 5% so v i hai thu t tốn cịn l i sau 20.000 l n l pvà kho ng th i gian Tb ng 195.ffa
Hình 5-6: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình VGG16 cĩ đ th a th t 99% khi áp d ng cho t p d li u Cifar10.
Cu icùng, khi s k t n i ch cịn 1%. Thu t tốn SRGM c ng đã giúp cho mơ hình t ng t 68% lên t i 80%, trong khi hai thu t tốn RigL và SET giúp cho mơ hình t ng lên g n 75%.Nh v y sau bài đánh giá này cĩ th th y khi đ th a th t t ng d n, c ba thu t tốn đã c i thi n khá nhi u đ chính xác cho mơ hình, đ c bi t là thu t tốn SRGM đã giúp cho mơ hình cĩ lúc t ng đ c h n 10% so v i khi ch a đ c t i u.
5.1.3 ánh giá hi u n ng trên t p d li u CICDDoS2019
Bàiđánh giá cu i cùng là v i t p d li u CICDDoS2019v i kích th c là 18x1 và g n h n 3.5 tri u m u sau khi đã đ c lo i b s m u b trùng l pđ c chia thành 6 l p. Và mơ hình đ c đ xu t áp d ng cho t p d li u này mơ hình MLP cĩ hai l p n l n l t là 40, 40. S d ng hai hàm kích ho t ReLU cho các l p n và Softmax cho l p output.Cĩ th th y mơ hình này khá khiêm t n so v i các mơ hình đ c đánh giá các ph n tr c v i ch 4310 s k t n i đ y đ .Nh ng mơ hình c ng s đ c đánh giá các m c th a th t t 85 đ n 99% đ cĩ cái nhìn t ng quát h n v c ba thu t tốn t ng m c đ ph c t p c a mình khác nhau.
41
Hình 5-7: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình MLP cĩ đ th a th t 90% khi áp d ng cho t p d li u CICDDoS2019.
Ban đ u khi đ th a th t là 90%, mơ hình đ t đ c đ chính xác g n 100% sau h n 12000 l n l p ban đ u. Sau đĩ mơ hình s đ c t i u v i 3 thu t tốn RigL, SET và SRGM v i T b ng 400. Nh k t qu cĩ th th y, khi áp d ng các k thu t t i u, hi u n ng mang l i c a c ba thu t tốn khơng cĩ nhi u s khác bi t. C th các thu t tốn c i thi n đ chính xác c a mơ hình t 92% lên h n 94%.
Hình 5-8: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình MLP cĩ đ th a th t 95% khi áp d ng cho t p d li u CICDDoS2019.
T ng t v i k t qu đ t đ c khi áp d ng cho mơ hình cĩ đ th a th t 90%. Hi u n ng đ t đ c gi a các thu t tốn trong l n này c ngkhơng cĩ quá nhi u s khác bi t.