Sđ khi thi tk cho các thi tb Client

Một phần của tài liệu Thiết kế và xây dựng mô hình máy học cho hệ thống nhận diện xâm nhập mạng bất thường (Trang 44 - 57)

4.3.2 Kh i b t và phân tích gĩi tin

Theo nh mơ hình đ c đ nh ngh a trong ph n 7.2. u vào c a h th ng bao g m 18 đ c tr ngnh sau:

Các thu c tính liên quan t i đ dài gĩi:

- Fwd Packet Length Max

- Fwd Header Length

- Fwd Packet Length Min

- Fwd Packet Length Std

- Min Packet Length

- Max Packet Length

- Packet Length Std

- Average Packet Size

- Subflow Fwd Bytes

- Init_Win_bytes_forward

13 Cách tính tốn và ý ngh a c a các đ c tr ng đ c tham kh o c a ph n m m CICFlowMeter:

33

- min_seg_size_forward

Các thu c tính liên quan t i t ng s gĩi trong lu ng:

- Fwd Packets/s

Các thu c tính liên quan t i th i gian c a m t lu ng:

- Flow Duration

Các thu c tính liên quan t i kho ng th i gian gi a hai gĩi tin:

- Flow IAT Mean

- Flow IAT Max

- Fwd IAT Mean

- Fwd IAT Max

Các thu c tính liên quan t i các c trong gĩi tin:

- ACK Flag Count

Khi m i b t đ u, h th ng kh i t o m t phiên nghe lén các gĩi tin đi vào, c ng nh đi ra thi t b . Vi c nghe lén này khơng làm nh h ng t i n i dung c a các gĩi tin. Các gĩi tin nghe lén đ c s đ c c p nh t vào t ng lu ng t ng ng. M t lu ng đ c cho là k t thúc khi: V t quá th i gian t i đa c a m t lu ng cho phép đ c quy đ nh; t s gĩi tin mà m t lu ng cĩ th l u tr đ c; ho c nh n th y c FIN trong gĩi tin.

4.3.3 Kh i phân lo i và c nh báo cho ng i dùng

Sau khi phân tích đ c các lu ng d li u t các gĩi tin t kh i b t và ph n tích gĩi tin. D li u đ c đ a qua mơ hình MLP đã c t gi m s k t n i và đã t i u thơng qua thu t tốn SRGM. N u h th ng cho r ng 1 lu ng là lành tính, nĩ s đ c l u vào t p d li u cho đ n khi đ t đ s l ng đ g i đ n cho thi t b Server thơng qua giao th c FTP cùng v i c update_required đ thơng báo cho server bi t thi t b đang c n c p nh t mơ hình máy h c. Sau đĩ thi t b s ch server hu n luy n xong mơ hình và g i lên l i FTP server. Thi t b s liên t c đ c c update_available đ bi t đ c tr ng thái c a mơ hình m i đ c đào t o m i hay ch a.

M c khác khi h th ng cho r ng 1 lu ng là t n cơng, thi t b đ nh tuy n s c nh báo cho ng i dùng thơng qua hai ph ng th c: C nh báo qua giao di n Web và c nh báo qua LED đ cg n trên thi t b đ nh tuy n BKRouter. V i ph ng th c c nh báo qua Web, thi t b g i m t danh sách các đ a ch đ c cho là t n cơng lên giao di n đ hi n th t i ng i dùng. Cùng lúc đĩ, khi cĩ phát hi n s xâm nh p, tr ng thái LED trên thi t b BKRouterđ c b t lên đ c nh báo cho ng i dùng bi t đang cĩ s t n cơng đ n m ng c a mình.

34

• Thi t k giao di n Web LuCI v i ch c n ng thơng báo ch a ng i dùng bi t cĩ cĩ cu c t n cơng đ n thi t b :

Hình 4-6: S đ kh i c a h th ng phát hi n xâm nh p và c nh báo ng i dùng b ng Web và Led.

Kh i c nh báo ng i dùng s mơ hình M-C-V (Module-Controller-View) c a LuCI đ hi n th đ a ch IP c a nh ng lu ng đ c xem là t ng cơng lên Web c ng nh báo LED cho ng i dùng bi t cĩ s xâm nh p. Trong đĩ m M-C-V g m 3 kh i chính:

- Controller: áp ng các yêu c u HTTP (Request). Controller là đi m truy c p (entry point) vào ng d ng.

- View: t ng h p các file HTML, JS và CSS đ hi n th giao di n. HTML / JS s ch a logic nh các trình x lý nh p vào nút s g i m t hành đ ng tr l i b đi u khi n thơng qua XMLHttpRequest.

- Model: N i giao ti p v i user space thơng qua h th ng UCI c a OpenWRT. Kh i Model là n i dành cho nh ng ng i phát tri n giaoti p các ng d ng c a mình v i giao di n Web LuCI. Nĩ s d ng h th ng UCI c a OpenWRT đ t ng tác v i các file config trong userspace c ng nh ch y tr c ti p các ng d ng hay file script, c th là file script antiddos_init;

file này cĩ ch c n ng ch y ng d ng antiddos m i khi thi t b kh i đ ng, b i vì c ch c a OpenWRT kh i đ ng thơng qua t ng file script init riêng bi t, v i đ u tiên đ c quy đ nh trong t ng file. T c sau khi thi t b đã kh i đ ng đ c kernel, nĩ s g i các file init trong th m c /etc/init.d/ đ g i các ng d ng c n thi t. Ngồi ra script antiddos cịn cĩ vai

35 trị phiên d ch blacklist đ c t o ra b i kh i phân lo i t n cơng (MLP model) thành file config. Do kh i Model trong mơ hình M-C-V c a LuCI đ c các thơng tin trong file config đ hi n th lên giao di n web LuCI. C u trúc c a file config nh sau:

- Config Attacker: khai báo cho mơ hình M-C-V cĩ m t đ i t ng c u hình m i, c th là các đ a ch IP c a nh ng k t n cơng.

- ng v i m i Config Attacker là các tùy ch n v IP c a k t n cơng (target) và tùy ch n b qua các IP này (ignored). V i tùy ch n target: các đ a ch IP cĩ trong blacklist đ c d ch thơng qua file script antiddos_init. M c khác tùy ch n ignored do ng i dùng c u hình. Nĩ cĩ ch c n ng báo cho h th ng bi t ng i dùng đã bi t đ c các m i đe d a này, t đĩ t t đèn LED14 báo hi u đã đ c b t tr c đĩ.

14 H th ng giao ti p v i LED c a thi t b BKRouter thơng qua giao ti p I2C nh đ c đ c p trong ph n 7.4.5

36

CH NG 5: K T QU

5.1 So sánh hi u n ng c a thu t tốn t i u RigL, SET và thu t tốn phân b l i đ th a th t d a trên trung bình Gradient (SRGM) phân b l i đ th a th t d a trên trung bình Gradient (SRGM)

so đánh giá hi u n ng c a thu t tốn t i u đ c đ xu t (thu t tốn t i u mơ hình th a th t b ng cách phân b l i đ th a th t d a trên trung bình gradient: SRGM), trong ph n này, hai thu t tốn t i u RigL, SET đ c l y đ so sánh trên cùng m t t p d li u và cùng m t mơ hình máy h c.

Thơng s c a mơ hình máy h c và t p d li u đ c trình bày B ng 5-1: T p d li u và mơ hình h c máy đ c áp d ng đ đánh giá hi u n ng các thu t tốn t i u.nh sau:

B ng 5-1: T p d li u và mơ hình h c máy đ c áp d ng đ đánh giá hi u n ng các thu t tốn t i u. tốn t i u.

T p d li u Mơ hình máy h c Ghi chú

CICDDoS2019 MLP hidden layer(40,40)

MNIST Lenet5

Cifar10 GoogleNet

VGG16

Các bài đánh giá th c hi n theo quy trình nh đã đ c đ c p trong ph n 3.2.1. C th , tr c khi mơ hình b c vào giai đo n t i u, mơ hình c n đ c hu n luy n ban đ u c ng nh c t t a các k t n i. Tuy nhiên trong ph n này, chúng ta s khơng nĩi rõ v giai đo n ti n t i u, do c 3 thu t tốn đ u cùng t i u trên mơ hình đã tr i qua b c ti n t i u. Vì v y, các k t qu nh ng ph n sau t p trung vàogiai đo n t i u mơ hình th a th t.

M t khác đ i v i t ng t p d li u, t ng mơ hình máy h c. tài so sánh các thu t tốn trên nhi u m c đ th a th t khác nhau nh 90%, 95% và 99% đ đánh giá t ng quát nh t cho t ng thu t tốn.

5.1.1 ánh giá hi u n ng trên t p d li u MNIST

T pd li u MNIST là t p h p c a 60.000 m u v i kích th c 28x28 pixel g m các ch s vi t tay t 0 t i 9[21]. M c khác,Mơ hình Lenet-5 là m t trong nh ng mơ hình đ c đào do Yann LeCun và các c ng s đ c đ xu t vào n m 1998, trong bài nghiên c u Gradient-

Based Learning Applied to Document Recognition. H đã s d ng ki n trúc này đ nh n d ng các ký t vi t tay và in b ng máy.Vì v y, trong bài đánh giá này, đ tài s đánh giá hi u n ng đ t đ c khi s d ng c ba thu t tốn t i u l n l t là RigL, SET và SRGMv i l n l t các m c th a th t 90% và 99%

37

Hình 5-1: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình Lenet5 cĩ đ th a th t 90% khi áp d ng cho t p d li u MNIST.

V i đ th a th t 90%, Sau khi mơ hình đã đ c hu n luy n g n 12.000 l n l p ban đ u bao g m giai đo n ti n c t t a và giai đo n c t t a. Mơ hình đ t đ c đ chính xác là quanh 99%. Sau đĩ mơ hình s đ c t i u b ng ba thu t tốn v i Tlà 100. Sau kho ng 8000 l n hu n luy n, hi u n ng đ t đ c c a c ba thu t tốn th t s khơng cĩ nhi u khác bi t. Do

hi u n ng khi ch a th c hi n b c t i u mơ hình đã đ t đ chính xác g n 100%. Nh v y khĩ cĩ th th y đ c s chênh l ch trong bài đánh giá này.

Hình 5-2: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình Lenet5 cĩ đ th a th t 99% khi áp d ng cho t p d li u MNIST.

38 M c khác, khi mơ hình ch cịn g n 1% s k t n i, t c ch cịn g n 450 k t n i so v i 44190 k t n i đ yđ . Hi u n ng đ t đ c c a c ba bây gi đã cĩ s chênh l ch rõ r t. C th , thu t tốn SRGM sau h n 2000 l n l p đã giúp cho mơ hình t ng g n 10% và sau 6000 l n l p sau đĩ, mơ hình đã cĩ s chính xác g n 85% so v i m c 70% khi mơ hình ch a đ c t i u. M ckhác, thu t tốn RigL c ng đã giúp cho mơ hình c i thi n đ c g n 10% và sau cùng là thu t tốn SET ch giúp cho mơ hình t ng đ c 5% sau h n 8000 l n l p và T 100.

5.1.2 ánh giá hi u n ng trên t p d li u Cifar10

B d li u CIFAR-10 bao g m 60000 hình nh màu 32x32đ c chia thành 10 l p, v i 6000 hình nh cho m i l p. Trongbài đánh giá l n này, đ tài s áp d ng hai mơ hình khác nhau là GoogleNet và VGG16 v i đ ph c t p c a mơ hình t ng d n đ đánh giá hi u n ng đ t đ c khi áp d ng c ba thu t tốn v i các m c th a th t t 90 đ n 99%.

a. ánh giá hi u su t trên mơ hình GoogleNet

Hình 5-3: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình GoogleNet cĩ đ th a th t 95% khi áp d ng cho t p d li u Cifar10.

Khi áp d ng mơ hình GoogleNet v i s k t n i đ y đ ban đ u là g n 6 tri u k t n i. Và sau h n 30.000 l n l p hu n luy n ban đ u,mơ hình đ t đ c đ chính xác quanh 80% khi đã c t t a 5% s k t n i đ y đ . Sau đĩ, khi áp d ng thu t tốn t i u cho mơ hình này. S chênh l ch c a c ba khơng cĩ s khác bi t khi đ t quang 85%sau g n 15.000 l n l p và T 781.

39

Hình 5-4: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình GoogleNet cĩ đ th a th t 99% khi áp d ng cho t p d li u Cifar10.

M ckhác, khi mơ hình ch cịn 1% s k t n i. S chênh l ch hi u n ng c a c bađã cĩ s khác bi t. Thu t tốn SRGM đã cho th y nĩ cĩ th giúp cho mơ hình t ng đ c g n 10% v đ chính xác tuy r ng trong nh ng l n l p t i u đ u tiên, mơ hình cĩ s gi m sút m ch v quanh m c 15% nh ng sau đĩ nĩ đã kh c ph c đ c và t ng lên l i v t qua hai thu t tốn RigL và SET.

b. ánh giá hi u su t trên mơ hình VGG16

Hình 5-5: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình VGG16 cĩ đ th a th t 95% khi áp d ng cho t p d li u Cifar10.

40 Nh ng khi t ng đ th a th t lên 95%, thu t tốn SRGM đã cho th y đ c kho ng chênh l ch h n 5% so v i hai thu t tốn cịn l i sau 20.000 l n l pvà kho ng th i gian Tb ng 195.ffa

Hình 5-6: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình VGG16 cĩ đ th a th t 99% khi áp d ng cho t p d li u Cifar10.

Cu icùng, khi s k t n i ch cịn 1%. Thu t tốn SRGM c ng đã giúp cho mơ hình t ng t 68% lên t i 80%, trong khi hai thu t tốn RigL và SET giúp cho mơ hình t ng lên g n 75%.Nh v y sau bài đánh giá này cĩ th th y khi đ th a th t t ng d n, c ba thu t tốn đã c i thi n khá nhi u đ chính xác cho mơ hình, đ c bi t là thu t tốn SRGM đã giúp cho mơ hình cĩ lúc t ng đ c h n 10% so v i khi ch a đ c t i u.

5.1.3 ánh giá hi u n ng trên t p d li u CICDDoS2019

Bàiđánh giá cu i cùng là v i t p d li u CICDDoS2019v i kích th c là 18x1 và g n h n 3.5 tri u m u sau khi đã đ c lo i b s m u b trùng l pđ c chia thành 6 l p. Và mơ hình đ c đ xu t áp d ng cho t p d li u này mơ hình MLP cĩ hai l p n l n l t là 40, 40. S d ng hai hàm kích ho t ReLU cho các l p n và Softmax cho l p output.Cĩ th th y mơ hình này khá khiêm t n so v i các mơ hình đ c đánh giá các ph n tr c v i ch 4310 s k t n i đ y đ .Nh ng mơ hình c ng s đ c đánh giá các m c th a th t t 85 đ n 99% đ cĩ cái nhìn t ng quát h n v c ba thu t tốn t ng m c đ ph c t p c a mình khác nhau.

41

Hình 5-7: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình MLP cĩ đ th a th t 90% khi áp d ng cho t p d li u CICDDoS2019.

Ban đ u khi đ th a th t là 90%, mơ hình đ t đ c đ chính xác g n 100% sau h n 12000 l n l p ban đ u. Sau đĩ mơ hình s đ c t i u v i 3 thu t tốn RigL, SET và SRGM v i T b ng 400. Nh k t qu cĩ th th y, khi áp d ng các k thu t t i u, hi u n ng mang l i c a c ba thu t tốn khơng cĩ nhi u s khác bi t. C th các thu t tốn c i thi n đ chính xác c a mơ hình t 92% lên h n 94%.

Hình 5-8: Hi u n ng c a ba thu t tốn SRGM, RigL và SET trên mơ hình MLP cĩ đ th a th t 95% khi áp d ng cho t p d li u CICDDoS2019.

T ng t v i k t qu đ t đ c khi áp d ng cho mơ hình cĩ đ th a th t 90%. Hi u n ng đ t đ c gi a các thu t tốn trong l n này c ngkhơng cĩ quá nhi u s khác bi t.

Một phần của tài liệu Thiết kế và xây dựng mô hình máy học cho hệ thống nhận diện xâm nhập mạng bất thường (Trang 44 - 57)

Tải bản đầy đủ (PDF)

(81 trang)