Các kết quả thựcnghiệm

Một phần của tài liệu Khóa luận tốt nghiệp An toàn thông tin: Fed-LSAE: Phương pháp ngăn chặn tấn công đầu độc cho bộ khung liên kết phát hiện tác nhân đe dọa sử dụng chiến lược phân tích không gian tiềm ẩn (Trang 80 - 100)

Kịch bản 1

Hiệu suất phát hiện mối đe dọa từ hai mô hình CNN và LeNet trên cả hai bộ dữ

liệu CIC-ToN-IoT và N-BaloT được thể hiện tại Hình 4.1. Có thể thấy, mô hình IDS

toàn cục nhanh chóng hội tụ sau khoảng 3 round, và đạt đến ngưỡng hơn 99% đối với tất cả 4 tiêu chí Accuracy, Precision, Recall và F1-Score. Mặc dù trường hợp LeNet với bộ dữ liệu N-BaloT dao động tương đối tai round 3 đến round 5,

mô hình vẫn hội tụ ở mức 98% ngay sau đó. Kết quả trên chứng tỏ tính hiệu quả

10 10

os oo

08 gos

704 “o4

02 02

số oo1 2 5 4 896 7 8.9 1 12 8 # &§ 6 7 8 8

or Round

“Accuracy —+-Precision Recall —+-F1-Score “Accuracy —>-Preeslon Recall —--F1-Score

(A) CNN (B) LeNet

10 10

sẽ os

v0 v06

“04 “o4

02 02

sẽ oo

12 3 4 8 6 7 8 9 1203 4 5 6 7 8 8 8

Round Round

“Accuracy —+-Precison Recall —--F1-Score “Accuracy —+-Precision Recall —--F1-Score

(C) CNN (D) LeNet

HINH 4.1: Kết quả huấn luyện các mô hình phát hiện mối de doa

trên hai bộ dữ liệu (A,B) CIC-ToN-IoT và (C,D) N-BaloT.

57

Chương 4. HIỆN THỤC VÀ ĐÁNH GIÁ, THẢO LUẬN

của các mô hình phát hiện mối đe dọa mạng trên FL trong việc phát hiện các lưu lượng mang bắt thường trong mạng lưới IơT.

Kịch bản 2

Dưới đây là sự so sánh về hiệu suất của hệ thống IDS học liên kết trước và sau khi tích hợp mô-đun Fed-LSAE để phòng chống poisoning attacks. Từ đó, chứng,

minh được hiệu quả của Fed-LSAE trong cả hai trường hợp m = 20% vam = 40%.

Trong các biểu đồ đường sau đây, các đường nét đứt với kí hiệu A dé cập đến thang đo về hiệu suất của hệ thống IDS dua trên FL khi bị tắn công, va các đường nét liền với kí hiệu D mô tả hiệu suất của mô hình sau khi được trang bị Fed-LSAE

để chống tan công.

Label Flipping.

Value

os

os

04

02

00

—®—Aeeuray (D) =e—Preelslon (0) ~=— Recall(D)

== Accuracy (A) —=- Precision (A) ~°- Recall (A)

: 2 ——s > aT

Round

—=-F1-8core

(0)

== F1-Score (A)

Value ` —.‹ `—

of

Round

—e—Aeeuracy (D) —*-Precision (0) ~>-Recall(D)

<= Accuracy (A) —=- Precision (A) —=- Recall (A)

—#—F1-Score (0)

—E- F1-Score (A)

Value

os

os

04

02

00

—#—Aeeuracy (D) =+—Preclslon (0) ~>-Rocall(D)

== Accuracy (A) —=- Precision (A) ~°- Recall (A)

(a) CNN (B) LeNet

to ee

os

am“...

/ *s Zon VÉ —

a ý A 2

o2 v `4

00 Ÿ

TT AT

Round Round

—*-F1-Score (0)

<= F1-Score (A)

—®—F1-Score (0)

<= F1-Score (A)

—®—Aeeuracy (0) —*—Precision (0) —*Recall (0)

<= Accuracy (A) —=- Precision (A) ~°- Recall (A)

(c) CNN (D) LeNet

HINH 4.2: Kết quả phòng thủ của Fed-LSAE trước cuộc tan công la-

bel flipping trên hai bộ dữ liệu (A,B) CIC-ToN-IoT và (C,D) N-BaloT

trong trường hợp m = 20%.

Chương 4. HIỆN THỤC VÀ ĐÁNH GIÁ, THẢO LUẬN

Hình 4.2 (đối với m = 20%) và Hình 4.3 (đối với m = 40%) lần lượt thể hiện

sự khác biệt về khả năng của IDS cộng tác trước và sau khi tích hợp mô-đun Fed-LSAE để phòng chống cuộc tắn công label flipping. Trong cả hai bối cảnh

m = 20% vam = 40%, các cuộc tân công lật nhãn này đều làm hiệu suất của

mô hình toàn cục dao động mạnh, lên xuống không ổn định. Thậm chí trong một

số trường hợp, ví dụ như Hình 4.3c, chỉ số Recall của mô hình chạm mức xấp xỉ 0.1% tại một số round. Điều này có nghĩa rằng nếu có 100 lưu lượng mạng tấn công đến thì mô hình chỉ phát hiện ra được 1 lưu lượng mạng là tan công. Lúc này mô hình IDS này hoàn toàn vô hại trước các cuộc tân công mạng hiện nay.

Tuy nhiên, tình trạng này gần như hoàn toàn được khắc phục sau khi hệ thống huấn luyện tích hợp cơ ché Fed-LSAE của chúng tôi. Có thể thấy, hiệu suất phát hiện mối đe dọa mạng của mô hình IDS học liên kết đã trở lại ổn định ở mức trên

00

1 2 3 4 5 6 L 8 9 10 2 3 4 5 6 T 8 9 10

ound ound

—*Accuracy (D) —*~ Precision (D)—*—Recall (D) =s-F1-§core (D) .—=® Accuracy (D) —*—Precision (D) -s- Recall(D) =s-F1-§core (D)

—# Accuracy (A)—# Precision (A)~#- Recall (A) =% F1-Score (A) =® Accuracy (A)=# Precision (A) ~=- Recall (A) ==- F1-§core (A)

(A)CNN (B) LeNet

dos 3, tàn:

3 r3 h : báo 5

= ` 2 7

NS Z7 \ ý \ rd

02 Yt / 02 Lf Nf NZ

Nw 7¥ ¥ ¥

00 oo

1 2 3 4 8 6 7 8 8 Ww 1 203 4 5 6 7 8 8 w

Round Round

—*—Accuracy (D) —*—Precision (D) —*—Recall (D) =®-F1-§core (D) ~®=Accuracy (D) =®-Precision (D) -*—Recall (D)_ —*~F1-Score (D)

=# Accuracy (A) =" Precision (A)~=- Recall (A) ==- F1-Score (A) —® Accuracy (A)—=- Precision (A)~=- Recall (A) =*- F1-Score (A)

(c) CNN (D) LeNet

HINH 4.3: Kết qua phòng thủ của Fed-LSAE trước cuộc tấn công la-

bel flipping trên hai bộ di liệu (A,B) CIC-ToN-IoT va (C,D) N-BaloT

trong trường hợp m = 40%.

59

Chương 4. HIỆN THỤC VÀ ĐÁNH GIÁ, THẢO LUẬN

10

os

06

Boa

02 02

o0 00

1 9203 4 5 6 7 8 9 © 1 2 3 4 5 6 7 8 9

Round Round

~#—Aeeuracy (D) Precision (D) ~+—Reeall(D) __ =+—F1:Score(D) —đ~Aeeuraey (D}~+~Preelalon (D) ~s~ Recall(D) __ —ằ-F1-Score (0)

=# Accuracy (A)=®- Precision (A)~s- Recall (A) ~*~ F1-Score (A) —® Accuracy (A)—®- Precision (A)~—=- Recall (A) | —=~ F1-Score (A)

(a) CNN (B) LeNet

10 “.=x.ư an xẽmm—=

Mm ov pry `, VN

08 op ` Ne fanned oy

OND VN x7 ee eh

08 06 2 NAY” Z2 ẰNG 22 fay

$ .# vẦw⁄ N

Soa S04 v

02 02

o0 09

+1 2 3 4 5 6 7 8 9 0 402 3 4 5 6 7 8 9 W

Round Round Accuracy (D) =—Precision (D)—*—Recall (D)__ =s-F1-Score (D) —® Aeeuracy (D) =—Precision (D) —s— Recall (D) —=s—F1-Score (D)

<= Accuracy [A) =8 Precision (A)—=- Recall (A) ==- F1-Score (A) —=- Accuracy (A) ~=- Precision (A)~=- Recall (A) =°- F1-Score (A)

(c) CNN (D) LeNet

HÌNH 4.4: Kết quả phòng thủ của Fed-LSAE trước cuộc tấn công

GAN trên hai bộ dữ liệu (A,B) CIC-ToN-IoT và (C,D) N-BaloT trong

trường hợp = 20%.

92% đối với cả bốn tiêu chí ở tat cả các trường hợp. Bằng việc học đặc trưng dữ liệu thông qua LSR thu được, Fed-LSAE dễ dàng phát hiện các cập nhật đầu độc bởi label flipping và loại bỏ nó khỏi quá trình tổng hợp.

GAN.

Tinh trạng tương tự cũng bắt gặp tại trường hợp của cuộc tan công đầu độc bằng GAN. Theo đó, bằng việc sinh ra các mẫu đối kháng giống với các lưu lượng mạng tấn công ban đầu và gán nhãn chúng là lành tính, mô hình IDS toàn cục gần như bị nhằm lẫn trong việc phân biệt các lưu lượng mạng, đầu vào sau khi bị đầu độc. Cụ thể, Hình 4.4 và Hình 4.5 lần lượt cho biết hiệu năng của mô hình IDS học liên kết gần như bị tàn phá khi dao động quanh ngưỡng 50% trên cả bốn tiêu chí. Mặc dù không tan công mạnh như label flipping nhưng poisoning attack

60

Chương 4. HIỆN THỤC VÀ ĐÁNH GIÁ, THẢO LUẬN

“ 0

Bound Bona

se terrae }—e-trchlan ee Recah} —e-Ftstcom(o) | —aeAccagyO)me-Precrion -- h6. doors T1 AE VỊ mon ho KHE eveSeam ts} | ev Aceusey Ohms-prstlon io Reese) -CEOESSNj

(A) CNN (B) LeNet

ơ==—

spay

ea 3ZS

Wy a WN Z2 —

02 02

1 23 + 6Z⁄ dn + 0 12 3/4 § 6 7 8 8 ©

2/4 Bune

“=-..../7 7 essay | Nera x...,.ẻẽ (0) TRỢ Ie men aloo Recan(ySecetSeery | -TAKMYU-C Proton aj-o- Recta) ms FrScor

(c) CNN (D) LeNet

HINH 45: Kết quả phòng thủ của Fed-LSAE trước cuộc tấn công

GAN trên hai bộ dữ liệu (A,B) CIC-ToN-IoT và (C,D) N-BaloT trong

trường hợp m = 40%.

bằng GAN cũng đủ khiến mô hình phân vân trong giai đoạn đưa ra quyết định đâu là mẫu lành tính đâu là mẫu tan công.

Mặt khác, Fed-LSAE cho thay khả năng phát hiện poisoning attack bằng GAN của mình thông qua việc phân tích không gian tiềm ẩn LSR từ các mô hình cập nhật. Kết quả từ Hình 4.4 và Hình 4.5 lần lượt cho thấy Fed-LSAE nhận biết được tat cả các kẻ tấn công trong cả hai trường hợp m = 20% và m = 40%. Hiệu suất

mô hình IDS đã trở lại đạt trên 92% ở tiêu chí Accuracy và thậm chí là 100% ở tiêu chí Recall.

Weight-scaling model poisoning.

Trong cuộc tan công weight-scaling model poisoning, những tổ chức không thiện chí thực hiện khuếch đại trọng số mô hình cục bộ của họ lên y = 10 lần trước

61

Chương 4. HIỆN THỤC VÀ ĐÁNH GIÁ, THẢO LUẬN

oo

—#—Aeeuraey (D) —*Precision (D) ~ằ—Recall (0)

== Accuracy (A) ~= Precision (A) =>- Recall (A)

Bone ah

Nita .-...

nv và và W

1 92 3 4 5 6 7 8 8 10

Round

—-F1-Score (0)

== Ft-Score (A)

LAA LẦN

06 Tight HN

$ TH ha `.

gos ƯA

bd 1 NÀ uy) N

tự 1 la v

02 sự ẹ ỳ \

. \ Ậ \

oo đ ooo

40203 4 5 6 7 8 8 10

Round

=F 1-Score (D)

<= F1-Score (A)

—#—Aeeuraey (D) —e—Precision (D) —>—Recall (0)

== Accuracy (A) ~=- Precision (A) =*~ Recall (A)

—đ—Aeeuraey (D) Precision (D) —ằ—Recall (D)

== Accuracy (A) =#- Precision (A) ~ằ~ Recall (A)

(A) CNN

1 2 3 4 § 6 7 8 9 10

Round

—®-F1-Score (0)

== Ft-Score (A)

(B) LeNet

+02 3 4 5 6 7 8 9 10

Round

—*Aecuracy (DJ —>-Precision (D) ~*~ Recall (D)

== Accuracy (A) =* Precision (A) ~*- Recall (A)

—*-F1-Score (D)

<= Ft-Score (A)

(c) CNN (D) LeNet

HINH 4.6: Kết quả phòng thủ của Fed-LSAE trước cuộc tấn công

weight-scaling model poisoning trên hai bộ dữ liệu (4,B) CIC-ToN-

IoT và (C,D) N-BaloT trong trường hợp m = 20%.

khi cập nhật lên máy chủ toàn cục. Kết quả thực nghiệm tại Hình 4.6 và Hình 4.7 cho thay cuộc tan công này phá hủy hoàn toàn mô hình toàn cục khi hiệu năng của mô hình giảm xuống xấp xỉ 0% trên cả ba tiêu chí Precision, Recall, F1-Score trong tất cả các trường hợp. Có vẻ như weight-scaling model poisoning vừa dễ đàng thực hiện vừa có hiệu quả cao khi tác động trực tiếp lên từng trọng số mô

hình.

Mặc dù vậy, sau khi sử dụng Fed-LSAE để phòng thủ, hiệu suất mô hình đã tăng trở lại và duy trì ổn định ở mức trên 90%. Ví dụ như trường hợp m = 40% với mô

hình LeNet và bộ dữ liệu CIC-ToN-IoT (Hình 4.7b), Accuracy và F1-Score hội tu

ở 97% trong khi Recall vẫn xấp xỉ 100%. Điều này chứng tỏ tác dụng tối đa của LSR trong ngữ cảnh phát hiện các cuộc tắn công model poisoning như thé này.

62

Chương 4. HIỆN THỤC VÀ ĐÁNH GIÁ, THẢO LUẬN

10 * 1 ƒm—————————=—

ì

ơ..

08 vA 06

Boe al

3 Nip eo ome ee 8 " ee i ee

dos Nà dos

`

"

02 N °

00 b—e—-—-e—-=—-=——= 00 mm eae`

Round Round Accuracy (D) —*—Precision (D) >—Recall (D)__ —*—F1-Score (D) —sAccuracy (D) Precision (D)—ằ—Recall (D)_ —ằ—F'1-Score (D)

“Zr Accuracy (A) -e Precision (A) © Recall(A) —s-Ft-Seore (a) | —e- Accuracy A) -e- Precision (A) —=- Recall(A) _—o- Pt-Seore (A)

(a) CNN (B) LeNet

10 — a 10

os os

06 os

B04 s04

02 02

000 eo see Sao ale 06

TPP Pe a a TC 12 3 8 8 8 7 8 8 8

Round Round

—*—Accuracy (D) —*— Precision (D) —ằ—Recall (D) _ —*—F1-Score (D) Accuracy (D) =đ=Precision (D) =— Recall(D) =s-F1-Score (D)

== Accuracy (A)~# Precision (A) =*- Recall (A) =*- F1-Score (A) “<= Accuracy (A) = Precision (A) ~*~ Recall (A) —ằ~ F1-Score (A)

(©) CNN (D) LeNet

HINH 4.7: Kết quả phòng thủ của Fed-LSAE trước cuộc tấn công.

weight-scaling model poisoning trên hai bộ dữ liệu (A,B) CIC-ToN-

ToT và (C,D) N-BaloT trong trường hợp m = 40%.

Kịch bản 3

Trong kịch bản này, chúng tôi sẽ so sánh hiệu năng của Fed-LSAE đối với FedCC trong việc phát hiện cuộc tấn công đầu độc Untargeted-Med trên cả hai môi

trường IID và non-IID với m = 40%.

Trường hợp IID.

Các thống kê biéu diễn trong Bang 4.9 đã cho thấy rằng giải pháp Fed-LSAE của chúng tôi đạt được tỷ lệ phát hiện tốt hơn so với FedCC đối với cuộc tấn công Untargeted-Med trong tất cả các trường hợp. Như chúng ta có thể thấy, bộ khung Fed-LSAE có thể nhận dang tat cả kẻ tắn công trong số 10 tổ chức và ghi nhận một xu hướng ổn định trong hiệu suất bảo vệ trong suốt 10 vòng, với Accuracy trung bình hơn 93% và F1-Score 96% trên bốn trường hợp. Trong khi đó, giải pháp

63

Chương 4. HIỆN THỤC VÀ ĐÁNH GIÁ, THẢO LUẬN

FedCC van gặp khó khăn trong việc phát hiện cuộc tan công Untargeted-Med với kết quả trung bình khoảng 66% và 77% lần lượt ở Accuracy và F1-Score trong trường hợp xấu nhất của mô hình LeNet trên bộ dir liệu N-BaloT.

Lí do Fed-LSAE vượt trội là do sự chênh lệch đáng kể trong điểm CKA giữa LSR

của các cập nhật độc hại và lành tính so với LSR của mô hình toàn cục (GLS) nhờ

sự hỗ trợ của AE. Trong khi đó, ranh giới này khá mơ hồ trong FedCC. Hình 4.8 cho thấy điểm CKA của các mô hình đầu độc (Client 2-5) trong Fed-LSAE khác biệt so với các tổ chức còn lại. Ví dụ, trong trường hợp mô hình LeNet trên bộ dir liệu N-BaloT (Hình 4.84), các vectơ không gian tiềm ẩn độc hại đạt được điểm đưới 0.4 hay tương đương 40% mức độ tương đồng so với GLS, trong khi các mẫu lành tính gần như tương đồng 98% với mô hình toàn cục. Trong khi đó, FedCC chỉ ghi nhận khoảng cách nhỏ trong điểm CKA giữa các tổ chức cộng tác đó. Don

cử là trường hợp CNN với bộ dữ liệu N-BaloT (Hình 4.8e) khi véc-tơ LSR của tat

cả các mô hình cục bộ đều giống mô hình toàn cục đến xấp xỉ 96%, kể cả các cập nhật đầu độc. Điều này dẫn đến khó khăn đáng kể trong giai đoạn clustering sau

đó để phân loại các tổ chức đầu độc khỏi quá trình tổng hợp FL. Những kết quả này đã chứng minh tác dụng tích cực của việc tích hợp AE vào hệ thống phòng

thủ Fed-LSAE.

BẢNG 4.9: So sánh hiệu suất phòng thủ giữa FedCC và Fed-LSAE đối với cuộc tan công đầu độc Untargeted-Med trong trường hợp

IID.

CIC-ToN-IoT N-BaloT Accuracy | Precision | Recall | Fl-Score | Accuracy | Precision | Recall | Fl-Score

FedCC 0.98923 0.9932 | 0.98676 0.98981 | 0.94178 0.94172 | 0.99995 | 0.96973

Fed-LSAE | 0.99118 0.99923 | 0.98413 | 0.99159 | 0.95613 0.95623 | 0.99978 | 0.97719

FedCC 0.80766 0.80428 | 0.99928 0.87304 | 0.65797 0.99999 | 0.63044 | 0.76556

Fed-LSAE | 0.96116 0.94727 | 0.99602 | 0.96819 0.93106 0.93251 | 0.99841 | 0.96420

Model | Scheme

CNN

LeNet

BANG 4.10: So sánh hiệu suất phòng thủ giữa FedCC và Fed-LSAE đối với cuộc tấn công đầu độc Untargeted-Med trong trường hợp

non-IID.

CIC-ToN-IoT N-BaloT

Model | Scheme LẠ TS [Precision | Recall | Fi-Score | Accuracy | Precision | Recall [ Fl-Score

FedCC | 054266 | 0.34839 | 06 | 043725 | 0.6816 | 0.63453 | 0.9 07443

CNN Fed-LSAE | 0.60364 0.5928 0.9988 | 0.73679 0.72094 0.67387 0.9 0.77069

LeNet FedCC 0.59378 0.57047 | 0.85507 | 0.65917 | 0.63907 0.60248 | 0.88016 0.69647

Fed-LSAE | 0.71483 0.71731 | 0.99333 | 0.81232 0.72651 0.73692 | 0.98014 0.82102

64

Chương 4. HIỆN THỤC VÀ ĐÁNH GIÁ, THẢO LUẬN

a, 0 D0 0 0 0W 0N 0W 0W 0 a oa ne

sẽ os

gor go

Sos Sos

os as

oa oa

sẽ os AM A

Cệen 1 Gien2 Glen's Clarl4 CleniS Clon8 CleL7 Girt Clent 9 lent 10 Cent Gien'2 Clơn3 Clan 4 ClentS Cien’6 Cien'7 Csr 8 Clent 9 Clen 10

aFedcc sFed+SAE aFedCC =FedLSAE

(a) CNN () LeNet

a, 0 0 0 0 0§ ee 0 oo Aen a ao 0w Be 0 0g Bh' 1

sẽ sẽ

gor gor

Boe Bos

os os

oa oa

63 63 mn An AM 2

len 1 Glen 2 Get’ Clest 4 ClentS Clent6 Glen 7 Cien 8 Clent 9 len 10 len 1 Cleat 2 Clen3 Clent4 Clem S

aFedCe ôFed LSAE GFedCC ôFed SAE

(c) CNN (D) LeNet

HINH 4.8: So sánh mức độ tương đồng giữa không gian tiém ẩn của

mô hình toàn cục (GLS) và từng không gian tiềm ẩn của mô hình cục bộ bằng điểm CKA trong FedCC và Fed-LSAE trên hai bộ dữ

liệu (A,B) CIC-ToN-IoT and (C,D) N-BaloT.

Trường hợp non-IID.

Đối với trường hợp non-IID, phân phối dữ liệu giữa các bên tham gia được biểu diễn tại Hình 4.9. Trong đó, trên cả hai bộ dữ liệu, 6 client đầu tiên bao gồm 4

kẻ tần công (Client 2-5) có phân phối giống nhau vẻ số lượng mẫu cũng như về

tỉ lệ giữa mẫu lành tính và mẫu tan công. 4 tổ chức còn lại có phân phối đối lập nhau khi client 7 và client 9 sử dụng 100% các mẫu lành tính trong khi client 8

va client 10 chỉ thu thập các mẫu tan công. Lí do chúng tôi chọn phân phối nay

là để làm rõ sự khác biệt giữa FedCC và Fed-LSAE trong việc phân biệt các mô hình bị poisoning attack với các mô hình lành tính được huấn luyện bằng dữ liệu

non-IID.

Dua vào Bang 4.10 có thể thay, Fed-LSAE vẫn dat được hiệu suất ổn định hon so với FedCC trong tất cả các trường hợp mặc dù kết quả không cao do vẫn bị ảnh hưởng bởi non-IID. Cụ thể, khi sử dung mô hình LeNet trên tập dữ liệu CIC-ToN- IơT, Accuracy và F1-Score của Fed-LSAE cao hơn đáng kể lần lượt là 12% và 16%

so với FedCC. Lý do cho sự vượt trội của Fed-LSAE là khả năng phân biệt giữa

65

Chương 4. HIỆN THỤC VÀ ĐÁNH GIÁ, THẢO LUẬN

: Z Z :

mm. ate spelpn

(A) CIC-ToN-IoT (B) N-BaloT

HINH 4.9: Phan phối dữ liệu giữa các tổ chức học liên kết trên bộ dữ

liệu (a) CIC-ToN-IoT và (b) N-BaloT trong trường hợp non-IID.

các đối tượng độc hại và không độc có đữ liệu không đồng nhất. Trong Hình 4.10, điểm CKA của các véc-tơ LSR đầu độc (Client 2-5) trong FedCC gần như giống

với LSR của các mô hình cục bộ non-IID lành tính (Client 7-10) khi so sánh với

mô hình toàn cục (GLS). Cụ thể chúng đều lớn hơn 0.9 trong tat cả các trường hợp, dẫn đến việc phân loại sai giữa các mô hình độc hại và các mô hình lành

a oA A

09 8 p ủ| A ứ ứ

on

gor

Bos

os

oa 4 A

len 8 Clent& Clent Clent@ Clent7 Clent8 Clent9 Clen 10 Clert1 Chent2 Clent8 Clent 4 Cleni5 Clent6 Clent 7 Clert8 Cien 9 Clen 10 aFedcC =Fedi SAE ĐFedOC =FedA.SAE

(A) CNN, (B) LeNet

1 on oy 1

° nỄ n pm n Đ A

on

go7

Bos

os

oa l

oa 0

Clent1 Clent2 Clen3 Clenl4 Clert5 Clenl6 Clen7 Clent8 Clent 9 Clen 10 Cleot 1 Clent2 Clen3 Clent4 Glens Clent6 Clen7 Clent® Cient9 Clen10

BFedcC =Fod.LSAE 0FedOC =Fod-LSAE

(c) CNN (D) LeNet

HINH 4.10: So sánh mức độ tương đồng giữa không gian tiềm ẩn của

mô hình toàn cục (GLS) và từng không gian tiém ẩn (LSR) của mô hình cục bộ bằng điểm CKA trong FedCC và Fed-LSAE trên hai bộ

dữ liệu (A,B) CIC-ToN-IoT and (C,D) N-BaloT ở trường hợp non-IID.

66

Chương 4. HIỆN THỤC VÀ ĐÁNH GIÁ, THẢO LUẬN

tính huấn luyện bang dit liệu non-IID. Do đó, mô hình toàn cục vẫn bị ảnh hưởng bởi các cập nhật độc hại, và hiệu suất của nó trong việc phát hiện các mối đe dọa mang bị giảm đáng kể (Bảng 4.10). Như đã được dé cập, đây chính là điểm yếu của FedCC khi trích xuất trực tiếp chuỗi PLR từ các mô hình được cập nhật mà không cùng tập dữ liệu, dẫn đến sự không ổn định của các véc-tơ PLR trong môi trường non-IID. Ngược lại trong Fed-LSAE, với sự hỗ trợ của AE đã được đào tạo trước, cập nhật của các kẻ tấn công (Client 2-5) hoàn toàn khác biệt so với phan còn lại. Một trường hợp điển hình để chứng minh khả năng này là khi sử dụng

mô hình LeNet trên tập dữ liệu N-BaloT (Hình 4.10). Các cập nhật non-IID lành

tính tuân theo cùng một xu hướng như các cập nhật IID lành tính của client 1 và

client 6 với điểm CKA lớn hơn 0.9. Trong khi đó, các véc-tơ không gian tiềm ẩn LSR độc hai chỉ tương đồng khoảng 40% so với LSR của mô hình toàn cục. Điều nay tao ra sự khác biệt rõ rang và từ đó dé dang để nhận biết các cập nhật bị nhiễm độc. Do đó, Fed-LSAE dé dàng ngăn chặn những cập nhật bat thường này ảnh hưởng đến giai đoạn tổng hợp trong khi vẫn duy trì hiệu suất của các tổ chức lành tính với di liệu non-IID. Các kết quả từ những thí nghiệm này cho thấy hiệu quả của Fed-LSAE trong xây dựng một hệ thống phát hiện mối đe dọa dựa trên

FL bén vững, ngay cả trong môi trường non-IID.

4.3 Thao luận

Nhìn chung, các kết quả thực nghiệm đều đúng với kỳ vọng ban đầu. Các kết quả đã chứng minh được các mục tiêu của từng kịch bản, từ đó cho thấy sự hiệu quả của mô hình Fed-LSAE khi có khả năng phát hiện các cuộc tan công đầu độc poisoning attack tiên tiền trong ngữ cảnh IDS học liên kết. Khóa luận này đã khai thác một xu hướng mới bằng cách sử dụng chiến thuật phân tích không gian tiêm

ẩn để tìm ra những bat thường trong các mô hình cập nhật của các tổ chức tham gia cộng tác. So với các nghiên cứu trước, Fed-LSAE cho thay độ hiệu quả hon

mà không yêu cầu một bộ dit liệu bổ trợ hay kiến thức gì trước đó. Giải pháp hứa hẹn sẽ mang lại trào lưu huấn luyện bền vững các mô hình nhận diện mồi đe dọa học máy bằng phương pháp FL, đặc biệt trong bối cảnh an ninh mạng hiện nay.

Tuy nhiên, giải pháp Fed-LSAE vẫn còn tồn tại một số hạn chế cần giải quyết

trong tương lai.

67

Một phần của tài liệu Khóa luận tốt nghiệp An toàn thông tin: Fed-LSAE: Phương pháp ngăn chặn tấn công đầu độc cho bộ khung liên kết phát hiện tác nhân đe dọa sử dụng chiến lược phân tích không gian tiềm ẩn (Trang 80 - 100)

Tải bản đầy đủ (PDF)

(100 trang)