Khóa luận tốt nghiệp Mạng máy tính và truyền thông: Phát triển hệ thống quản lý cấp phát thuốc cho bệnh nhân dựa trên các mô hình vision transformer và federated learning

Đồng thời, kiến trúc học liên kết Federated Learning FL được sử dụng dé quản lý thông tin thuốc và bệnh lý một cách bảo mật, bảo vệ thông tin cá nhân của bệnh nhân vì dữ liệu không bao g

Trang 1

ĐẠI HỌC QUOC GIA THÀNH PHO HO CHÍ MINH

TRUONG DAI HOC CONG NGHE THONG TIN

KHOA MẠNG MAY TÍNH VÀ TRUYEN THONG

TRƯƠNG TUẦN KIỆT - 20521507

KHOÁ LUẬN TỐT NGHIỆP

TRANSFORMER VÀ FEDERATED LEARNING

DEVELOPING A DRUG DISTRIBUTION MANAGEMENT SYSTEM FOR

PATIENTS USING VISION TRANSFORMER AND FEDERATED

LEARNING MODELS

CỬ NHÂN NGANH MẠNG MAY TÍNH VA TRUYEN THONG

GIANG VIEN HUGNG DAN

ThS Nguyễn Khánh Thuật

ThS Trần Thị Dung

TP HO CHÍ MINH, 2024

Trang 2

LỜI CẢM ƠN

Lời đầu tiên, nhóm muốn sửi lời biết ơn sâu sắc tới quý thầy cô, ban giám hiệu và

toàn thể nhân viên của Trường Đại hoc Công Nghệ Thông Tin — Dai Học Quốc GiaTP.HCM, những người cho tôi cơ hội được tiếp xúc môi trường học tập và nghiên

cứu chất lượng cao, qua đó tích lũy thêm nhiều trải nghiệm và kỹ năng cần thiết cho

định hướng sự nghiệp trong tương lai.

Trong quá trình thực hiện đề tài nghiên cứu, tôi đã may mắn được sự hỗ trợ và

định hướng từ ThS Nguyễn Khánh Thuật và ThS Tran Thi Dung, những người đãnhiệt tình giúp đỡ và góp ý cho dự án của nhóm ngay từ những bước đầu tiên

Cuối cùng, tôi cũng không quên bày tỏ lòng cảm kích tới gia đình và bạn bè,

những người đã luôn là nguồn cổ vũ, sát cánh cùng tôi trong suốt quãng đường học van và nghiên cứu Sự ủng hộ và quan tâm không ngừng của họ đã trở thành động

lực quan trọng, giúp tôi tin tưởng và kiên định trên con đường mình đã chọn.

Trân trọng.

Nhóm tác giả

li

Trang 3

TOM TAT

Trong nhiều bệnh viện, việc phân phát thuốc thủ công có thể gây ra sai sót donhân viên bận rộn hoặc mệt mỏi Để giải quyết vấn đề này, việc áp dụng trí tuệ nhântạo Artificial Intelligence (AI) trong lĩnh vực y tế đang trở thành xu hướng không

thể thiếu AI có thể hỗ trợ bệnh viện phân phát thuốc nhanh chóng và chính xác,

giúp cải thiện hiệu quả và giảm thiểu sai sót.

Để giải quyết các thách thức trong việc quản lý thông tin y tế và phân phối thuốc,nhóm nghiên cứu đã dé xuất một hệ thống hỗ trợ bệnh viện tiên tiến Hệ thống

nay sử dung Vision Transformer (ViT) để nhận diện khuôn mặt bệnh nhân một cách nhanh chóng và chính xác, từ đó hỗ trợ việc phân phối thuốc một cách hiệu quả Đồng thời, kiến trúc học liên kết Federated Learning (FL) được sử dụng dé quản lý thông tin thuốc và bệnh lý một cách bảo mật, bảo vệ thông tin cá nhân của bệnh

nhân vì dữ liệu không bao giờ rời khỏi thiết bị của họ và chỉ các thông tin mô hình

mới được chia sẻ.

Kết hợp hai công nghệ này, hệ thống đề xuất không chỉ cải thiện quy trình phânphối thuốc mà còn đảm bảo an toàn thông tin bệnh nhân Thông tin thuốc và bệnh

lý được lưu trữ an toàn trên cloud, và việc sử dụng FL giúp bảo mật thông tin bệnh

nhân, mang lại sự yên tâm cho cả bệnh nhân và nhân viên y tế Hệ thống này mở ra

hướng tiếp cận mới trong việc quản lý thông tin y tế, đặc biệt quan trọng trong thờiđại số hóa ngày nay

1H

Trang 4

MỤC LỤC

Thông tin hội đồng bảo vệ khóa luận i

Lời cảm on ii Tóm tat iii

Muc luc iv

Danh muc cac bang viii

Danh mục các hình vẽ và đồ thị ix Danh mục từ viết tắt x

Chuong 1 Tổng quan đề tai 1

11 Lýdochọnđểtài 1

1.2 Các nghiên cứu lên quan - 1

1.3 Mục tiêu, đối tượng và phạm vi nghiên cứu 4

1.3.1 Mục tiêunghiên cỨu 4

1.3.2 Đối tượng nghiêncứu - 4

143.3 Phạmvinghincứu 4

1.4 Cấu trúc Khoá luận tốt nghiệp - 4

Chương 2 Co sở lý thuyết 6 2.1 Internet of Things-lơlš ẶẶẶ 6 2.1.1 TéngquanvéloIs - 6

2.1.2 Ưu và nhược điểm của løT §

2.1.2.1 UuđiểmcủaldT 8

2.1.2.2 Nhược điểm củaldøT 9

2.2 Mohinh Vision Transformer - 10

2.2.1 Tổng quan về TransfOrmer - 10

2.2.2 Cau trúc mô hình Vision Transformer - 12

2.2.3 Các thách thức khi sử dụng mô hình ViT 14

1V

Trang 5

MỤC LỤC

2.2.3.1 Quá trình pre-training đòi hỏi lượng lớn dữ liệu 14

2.2.3.2 Việc tính toán tốnkếmlớn 14

2.2.3.3 Không thể tạo các feature map ở nhiễu tỉ lệ khác nhau 15 23 Hocliénkét Ặ ee 15 2.3.1 Tổng quan về học lên kết - 15

2.3.2 Cách thức hoạt động của học liên kết 16

2.3.3 Chiến lược của học lién két 17

2.3.3.1 Học liên kết tập trung (Centralized federated learning) 17 2.3.3.2 Học liên kết phân tán (Decentralized federated learn- | 2 ee 18 2.3.3.3 Học liên kết không đồng nhất (Heterogeneous feder-ated learnng) Ặ 20 2.3.4 Thuật toán của học lên kết 22

2.3.4.1 Federated stochastic gradient descent (FedSGD) 22

2.3.4.2 Federated averaging (FedAvg) 23

2.3.4.3 Federated learning with dynamic regularization (Fed-Dym gpm fw ee 25 Chương 3 Phương pháp thực hiện 28 3.1 Kiếntrúchệthống 28

3.1.1 Kiến trúc tổng quát 28

3.1.1.1 Server(Máychủ): 29

3.1.1.2 Client (May khách) 30

3.2 Trién khai mô hình Vision Transformer - 31

3.3 Triển khai ứng dụng đầu cuối - 32

3.3.1 Giao diện ứng dụng đầu cuối 33

3.3.1.1 Giao diện đăng nhập va đăng ký tài khoản cho nhân Vinyté ".- ad a a 33

3.3.1.2 Giaodiénchinh 33

3.3.1.3 Giao diện khi sử dụng hệ thống nhận diện 34

Trang 6

MỤC LỤC

3.3.1.4 Giao diện để nhập thông tin bệnh nhân mới và truy

xuất thông tin bệnh nhân cũ 35

3.3.2 Giai đoạn lấy dữ liệu bệnh nhân khi là bệnh nhânmới 36

3.3.3 Giai đoạn thực hiện nhận diện bệnh nhân và đưa ra đơn thuốc (fƯƠnEỨng Q Q Q LH HQ vo 37 3.4 Triển khai học liên kết (Federated Learning) 38

3.4.1 Bộ dữ lệu cụcbộ 38

3.4.2 Nguyên lý hoạt động của quá trình Federated Learning 40

3.4.3 Federated Client (Máy khách Liên Kết) 42

3.4.4 Federated Server (Máy chủ Liên KếtU) 43

3.4.4.1 Phan Federated Learning Server 43

3.4.4.2 Phan APIServer 44

Chương 4 Thực nghiệm, đánh giá va thảo luận 46 4.1 Fine-tuning mô hình Vision Transformer 46

4.1.1 Thucnghiém ẶẶSẶẶẶ S 46 4.1.2 Daly ciI ẤP NIB / 47

4.2 Hiệu suất ứng dụng đầu cuối 51

4.2.1 Thucnghiém 0.000000 eee eee 51 4.2.1.1 Bộ dữ liệu thuốc sửdụng 51

4.2.1.2 Giao diện thé hiện các loại thuốc cho các bénh 53

4.2.2 Danhgia Ặ HQ ee ee 54 4.3 Quá trình FederatedLearnng 56

43.1 Thucnghiém Ặ.ẶẶ eee 56 4.3.1.1 Federated Client (Máy khách Liên Kết) 56

4.3.1.2 Federated Server (Máy chủ Lién Két) 56

4.3.2 Danhgia ee ko 57

Chương 5 Kết luận và hướng phat triển 59

5.1 Kétluan ae aaaAIA {a( ee 59

52 Hạnchế Ặ Q Q Q Q Q Q Q Q Q n va 59

5.3 Hướng phát triển ẶẶ 59

VI

Trang 7

MỤC LỤC

Tài liệu tham khảo

vil

64

Trang 8

1.2

3.1

4.1

4.2

4.3

4.4

4.5

4.6

DANH MỤC CÁC BANG

Hiệu suất của ViT, BiT và ResNet50V2 trên tập dif liệu ImageNet-1k

TT H«-‹x 2

So sánh các thuộc tính và hiệu suất của mô hình trên bộ dữ liệu Ima-geNet|[7] Ặ Q Q Q Q HQ ee 3 Bộ dữ liệu cục bộ của Clent 39

Bộ dữ liệu thuốc điều trị bệnh Rungnhĩ 52

Bộ dữ liệu thuốc điều trị bệnh Suy tim phân suất tống m4u 52

Bộ dữ liệu thuốc điều trị bệnh Tăng huyết áp 53

Các nghiên cứu đã đánh giá thực tiễn kê đơn và cấp phát thuốc tại nhiều quốc gia, dựa trên các chỉ số của WHO/INRUD [24, 25, 26] 55

Thông số khi huấn luyện của Client và Server trong Federated Learning 57 Thông số sau huấn luyện của từng Round trong Federated Learning 57

VII

Trang 9

2.2

2.3

2.4

2.5

2.6

2.7

2.8

3.1

3.2

3.3

3.4

3.5

3.6

3.7

3.6

3.9

4.1

4.2

4.3

4.4

4.5

4.6

4.7

DANH MUC CAC HINH VE VA DO THI

IơT trong kỷ nguyên số [I0] - 7

Thanh phan chính trong hệ thống IøT[lI] - 7

Cấu trúc của mang Transformer[l2] - 12

Cấu trúc của mô hình Vision Transformer [13] 13

Cơ chế của học liên kết [l4] - 16

Quá trình của Centralized federated learning [15] 18

Quá trình của Decentralized federated learning [16] 20

Quá trình của Heterogeneous federated learning [17] 21

Kiến trúc hệ thống hoạtđộng - 28

Giao diện đăng nhập và đăng ký 33

Giao diện tổng quan cảu hệ thống - 34

Giao diện trước khi nhận diện bệnh nhân 34

Giao diện sau khi nhận diện bệnh nhân 35

Giao diện truy xuất và lấy thông tin bệnh nhân 36

Flowchart lấy dữ liệu bệnh nhân - 36

Flowchart nhận diện bệnh nhân và đưa ra đơn thuốc 37

Flowchart quá trình Federated Learning 41

Biểu đồ thể hiện giá trị hàm mat mát của tập huấn luyện qua thời gian 48 Biểu đồ thể hiện giá trị hàm mat mát của tập kiểm tra qua thời gian 49 Biểu đồ thể hiện giá trị độ chính xác của tập kiểm tra qua thời gian 49 Biểu đồ thể hiện giá trị Precsion của tập kiểm tra qua thời gian 50

Biểu đồ thể hiện giá trị Recall của tập kiểm tra qua thời gian 50

Biểu đồ thể hiện giá trị F1-score của tập kiểm tra qua thời gian 51

Giao diện thông tin các loại thuốc cho các bệnh 54

1X

Trang 10

DANH MỤC TU VIET TAT

AI Artificial Intelligence

CNN Convolutional Neural Network

FedAvg Federated averaging

FedDyn Federated learning with dynamic regularization

FedSGD _ Federated stochastic gradient descent

FL Federated Learning

INRUD International Network of Rational Use of Drugs loT Internet of Things

LEW Labeled Faces in the Wild

STPSTM Suy tim phân suất tống máu

THA Tăng huyết áp

VỊT Vision Transformer

WHO World Health Organization

Trang 11

Chương 1 TỔNG QUAN ĐỀ TÀI

1.1 Lý do chọn dé tài

Trong nhiều cơ sở y tế, việc cung cấp thuốc thủ công vẫn được thực hiện bởi cácnhân viên y tế như y tá, điều dưỡng hoặc bác sĩ Quá trình này có thể tốn nhiều thời

gian và có nguy cơ cao gây ra sai sót khi họ bận rộn hoặc mệt mỏi Thực tế, với

nguồn [1] theo số liệu từ Cục quản lý Thực phẩm và Dược phẩm Hoa Ky (FDA),

họ nhận được hơn 100.000 báo cáo mỗi năm liên quan đến "sai sót trong sử dụngthuốc" tính tới năm 2019 Theo WHO, sai sót trong sử dụng thuốc gây ra ít nhất một

ca tử vong mỗi ngày tại Mỹ vào năm 2017 Ở Việt Nam, theo bài báo [2] được đăng

trên tạp chí y học Việt Nam thì tỷ lệ sai sót trong sử dụng thuốc là 4,07%, với y tá là người thường xuyên gây ra sai sót nhất (72,22%).

Do đó, áp dụng trí tuệ nhân tạo vào y tế là xu hướng không thể thiếu, điều nàycho phép hỗ trợ phân phát thuốc nhanh chóng và chính xác Tuy nhiên xây dựng hệthống này đối mặt với thách thức về bảo mật thông tin cá nhân và đa dạng hóa dữ

liệu huấn luyện.

Trong khóa luận tốt nghiệp này, tôi đưa ra một giải pháp cho các van dé đã nêu

bằng cách xây dựng một hệ thông hỗ trợ phân phối thuốc tại bệnh viện, dựa trên việc

áp dụng ViT để xác định thông tin của bệnh nhân qua khuôn mặt và quan lý dit liệu

về thuốc và bệnh tình được lưu giữ trên các dịch vụ đám mây, cùng với việc sử dụng

FL để đảm bảo an toàn cho thông tin cá nhân của bệnh nhân.

1.2 Các nghiên cứu liên quan

Bài báo [3] khảo sát các giải pháp bảo mật va bảo vệ quyền riêng tư dữ liệu trong

IoMT, nhấn mạnh vai trò tiềm năng của Federated Learning (FL) Bài viết giới thiệu

các kiến trúc FL tiên tiến như học liên kết ngang hàng và học liên kết tập trung,cùng với các phương pháp bảo vệ dữ liệu như mã hóa và chia sẻ thông tin tối thiểu

Ngoài ra, bài báo cũng thảo luận các thách thức nghiên cứu mở như xử lý dữ liệu

không đồng nhất, tối ưu hóa hiệu suất mạng và đảm bảo tính bảo mật khi triển khai

FL trong các ứng dụng IoMT.

Bài báo [4] đề xuất một phương pháp mới kết hợp Federated Learning (FL) va

Trang 12

CHƯƠNG 1 TỔNG QUAN DE TÀI

mã hóa hình ảnh để thực hiện phân loại hình ảnh với sự bảo vệ quyền riêng tư Sử

dụng mô hình Vision Transformer (ViT), bài viết mô tả cách mã hóa hình ảnh giúp bảo vệ dữ liệu người dùng trong khi vẫn duy trì hiệu suất phân loại cao Kết quả thực nghiệm cho thấy phương pháp này không chỉ bảo vệ quyền riêng tư mà còn giữ

nguyên độ chính xác của mô hình, phù hợp cho các ứng dụng yêu cầu bảo mật cao

Bài báo [5] giới thiệu một phương pháp Federated Learning (FL) để phát hiện

bệnh tiểu đường gây tổn thương võng mạc (DR) sử dụng kiến trúc Vision

Trans-former (ViT) Bài viết mô tả chi tiết cách FL cho phép các thiết bị y tế học hỏi từ dữ

liệu phân tán mà không cần chia sẻ trực tiếp thông tin nhạy cảm Mô hình ViT được

triển khai trong FL đã cải thiện độ chính xác phát hiện DR lên đến 3% so với các

phương pháp truyền thống, chứng minh tính hiệu quả và tiềm năng ứng dụng rộngrãi của kỹ thuật này trong lĩnh vực y tế

Với việc sử dụng mô hình Vision Transformer cho giải pháp đề xuất thì nghiêncứu [6] đã so sánh hiệu suất và độ bền vững của ViT với các mô hình ConvolutionalNeural Network (CNN) Nghiên cứu cho thay rằng ViT không chỉ đạt hiệu suất tương

đương hoặc cao hơn mà còn có khả năng chồng lại các tân công và biến đổi dữ liệu

tốt hơn so với các mô hình CNN Bảng so sánh 1.1 thể hiện rõ điều này

Model Parameters (Million) | FLOPS (Million) | Top-1 Acc (%) ResNet50V2 25.61 4144.85 76.0

Bang 1.1 Hiệu suất của ViT, BiT va ResNet50V2 trên tập dữ liệu ImageNet-1k [6]

Ngoài ra, Bảng 1.2 cung cấp một bản tóm tắt toàn diện về các đặc điểm và chỉ sốhiệu suất của các mô hình khác nhau trên bộ dữ liệu ImageNet Nhìn chung, VisionTransformer (ViT) cho thấy độ chính xác top-1 tương đương hoặc vượt trội so vớicác mô hình CNN, mặc dù thường có thông lượng thấp hơn Những so sánh này ủng

Trang 13

hộ quan điểm rằng Vision Transformer có thể là một bộ học mạnh mẽ, mang lại độchính xác cạnh tranh mặc dù có yêu cầu tính toán cao hơn.

Model Params | FLOPs | Throughput | Top-1

(M) (B) (image/s) (%)

CNN

ResNet-50 25.6 4.1 1226 79.1

ResNet-101 44.7 7.9 753 79.9 ResNet-152 60.2 11.5 526 80.8

EfficientNet-BO 5.3 0.39 2694 771 EfficientNet-B 1 7.8 0.70 1662 79.1

EfficientNet-B2 9.2 1.0 1255 80.1 EfficientNet-B3 12 1.8 732 81.6

EfficientNet-B4 19 4.2 349 82.9

Pure Transformer

DeiT-Ti 5 1.3 2536 72.2 DeiT-S 22 4.6 940 79.8

DeiT-B 86 17.6 292 81.8

T2T-ViT-14 21.5 5.2 764 81.5

T2T-ViT-19 39.2 8.9 464 81.9 T2T-ViT-24 64.1 14.1 312 82.3

CPVT-B 88 17.6 285 82.3 Swin-T 29 4.5 755 81.3

Swin-S 50 8.7 437 83.0

Swin-B 88 15.4 278 83.3

Bang 1.2 So sánh các thuộc tính va hiệu suất của mô hình trên bộ dif liệu ImageNet

[7]

Một khảo sát toàn diện về học liên kết (federated learning) đã nhấn mạnh những

lợi ích về bảo mật thông tin cá nhân, lưu ý rằng phương pháp này giữ đữ liệu tại chỗ,

từ đó bảo vệ thông tin cá nhân khỏi các truy cập trái phép và nguy cơ rò ri đữ liệu.

Đặc biệt, học liên kết rất hữu ích trong các lĩnh vực nhạy cảm như chăm sóc sức khỏe và tài chính, nơi mà quyển riêng tư của dữ liệu là yếu t6 quan trọng hàng đầu

[8].

Nghiên cứu [9] cũng cho thấy học liên kết không chi bảo vệ quyển riêng tu mà

Trang 14

CHƯƠNG 1 TONG QUAN DE TÀI

còn nang cao hiệu quả hoc tap trong môi trường phân tan Ví dụ, các nghiên cứu da

chứng minh tính khả thi của việc triển khai học liên kết trong các mạng biên di động

và thiết bị IoT, qua đó thể hiện tính linh hoạt và độ bền của phương pháp này trong nhiều ứng dụng khác nhau.

1.3 Mục tiêu, đối tượng và phạm vi nghiên cứu

1.3.1 Mục tiêu nghiên cứu

Mục tiêu của nghiên cứu này là xây dựng và phát triển một hệ thống phân phát thuốc

chính xác và bảo mật trong môi trường bệnh viện Mục tiêu cụ thể của nghiên cứu

bao gồm:

1 Thiết kế kiến trúc hệ thống tổng quát.

2 Huan luyện mô hình ViT cho nhận diện khuôn mặt bệnh nhân

3 Triển khai dịch vụ cloud để quản lý thông tin thuốc và bệnh lý của bệnh nhân

4 Ấp dung FL để cập nhật mô hình ViT trên các thiết bị đầu cuối

5 Đánh giá hiệu năng của hệ thống và đề xuất cải tiến

1.3.2 Đối tượng nghiên cứu

Đối tượng nghiên cứu là hệ thống quản lý thông tin bệnh nhân và thuốc, nhận diệnkhuôn mặt bệnh nhân, ViT, FL, giao diện tương tác đầu cuối

1.3.3 Pham vi nghiên cứu

Phạm vi nghiên cứu sẽ tập trung vào việc đánh giá sự hiệu quả của hệ thống phân

phát thuốc và ứng dụng trong việc dự đoán và quản lý bệnh nhân cũng như thông tin

bệnh án, đảm bảo tinh bao mật và toàn vẹn của dữ liệu bệnh nhân.

1.4 Cấu trúc Khoá luận tốt nghiệp

Khóa luận với đề tài “PHÁT TRIEN HE THONG QUAN LY CAP PHÁT THUỐC

CHO BỆNH NHÂN DỰA TRÊN CÁC MÔ HÌNH VISION TRANSFORMER VÀ

4

Trang 15

FEDERATED LEARNING?” được trình bày bao gồm 5 chương Nội dung tóm tắt

từng chương được trình bày như sau:

* Chương 1: TONG QUAN DE TÀI

Tóm tắt về chủ đề nghiên cứu của dé tài luận văn mà nhóm thực hiện

* Chương 2: CƠ SỞ LÝ THUYET

Cung cấp cơ sở lý thuyết, định nghĩa các thuật ngữ và kiến thức có liên quan

trong phạm vi nghiên cứu.

* Chương 3: PHƯƠNG PHAP THUC HIỆN

Đề xuất mô hình hệ thống triển khai và giải thích phương pháp thực hiện

* Chương 4: THUC NGHIEM VA ĐÁNH GIÁ

Thực hiện các phương pháp đã được đề xuất, mô tả kết quả thu được và đưa ra

đánh giá dựa trên công việc đã thực hiện.

* Chương 5: KẾT LUẬN VA PHÁT TRIỂN

Đánh giá kết quả thực hiện và dé xuất hướng phát triển cho các nghiên cứu

trong tương lai.

Trang 16

Chương 2 CƠ SỞ LÝ THUYET

2.1 Internet of Things - IoTs

2.1.1 Tổng quan về IoTs

Trong kỷ nguyên số, Internet đã không chỉ là công cụ mà còn là một phần thiết yếu

trong đời sống hàng ngày Điều này đã dẫn đến sự ra đời của Internet of Things

(IoT), nơi mà không chỉ con người, mà cả máy móc và các đối tượng khác cũng có

thể giao tiếp với nhau IoT tạo thành một hệ thống các thiết bi vật lý được trang bị

cảm biến thông minh, có khả năng tương tác với môi trường xung quanh và cung

cấp dữ liệu liên tục cho người dùng Các thiết bị IoT có thé thu thập dữ liệu từ môi

trường, xử lý dữ liệu này và sau đó sử dụng nó để thực hiện các hành động cụ thể hoặc gửi nó đến các thiết bị khác Như vậy, IơT đã mở ra một thé giới mới của khả năng kết nối và tương tác, tạo ra nhiều cơ hội mới cho cải tiến và đổi mới trong nhiều lĩnh vực khác nhau của cuộc sống và công việc.

Hình 2.1 cho thấy ứng dụng của IoT trong các ngành nghề dang mở ra những cơhội mới và tao ra những thay đổi đáng kể IoT giúp cải thiện hiệu suất, tăng cường

quy trình làm việc và tạo ra những trải nghiệm mới cho người dùng Công nghệ

này đã mang lại sự thay đổi tích cực cho nhiều ngành công nghiệp, bao gồm việc cá

nhân hóa các ngôi nhà thông minh để phù hợp với nguyện vọng của người dùng, cho

phép theo déi sức khỏe của bệnh nhân một cách từ xa thông qua thiết bị y tế, hay cảithiện hiệu quả trong nông nghiệp nhờ vào việc sử dụng cảm biến độ ẩm đất, cũngnhư trong lĩnh vực vận tải nhờ vào các phương tiện được kết nối mạng

Trang 17

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT

Hình 2.1 IoT trong kỷ nguyên số [10]

Internet of Things (IoTs) được hình thành từ bốn thành phan quan trọng, đó làcốt lõi của hoạt động của hầu hết các hệ thống IoT

Perception Layer

Transport Layer

Application Layer 5 a

Smart Health Smart Home

Hinh 2.2 Thanh phan chinh trong hé théng IoT [11]

* Cam biến/Thiết bị:

La những cơ quan quan trong của hệ thống IoTs, các cảm biến giúp thiết biphát hiện và thu thập dữ liệu từ môi trường xung quanh Chúng bao gồm cảmbiến nhiệt độ, cảm biến ánh sáng, cảm biến chuyển động và nhiều loại khác,

chuyển đổi thông tin vật lý thành dif liệu điện tử.

- Kết nỗi mạng:

Thành phan này đảm bảo việc truyền tai dữ liệu từ các cảm biên đên các nút

Trang 18

trung tâm hoặc máy chủ đám mây Các công nghệ kết nối như Wi-Fi, tooth, 3G/4G/5G, và LoRaWAN hỗ trợ kết nói thiết bị IoTs với Internet và với

Blue-nhau.

« Trung tâm xử lý dữ liệu:

Đây là nơi nhận, xử lý và lưu trữ dữ liệu từ các cảm biến Bao gồm máy chủ

đám mây và cơ sở dữ liệu lớn, trung tâm này phân tích, tổ chức và chuyển đổi

dữ liệu thành thông tin hữu ích.

- Ung dung và giao diện người dùng

Thành phần này tập trung vào việc cung cấp trải nghiệm cho người dùng Các

ứng dụng và giao diện người dùng cho phép tương tác với dif liệu và thiết bi

IoTs, cung cấp khả năng ra quyết định và điều khiển các thiết bị thông qua các

ứng dụng di động, trang web hoặc các giao diện người dùng khác.

2.1.2 Ưu và nhược điểm của IoT

2.1.2.1 Ưu điểm của IoT

IơT đã trải qua một số biến đổi lớn và tự nâng cấp minh theo thời gian Một số ưu

điểm chính của IoT là:

« Tăng cường hiệu qua và tự động hóa: IơT cho phép tự động hóa và tối ưu

hóa quy trình trong nhiều ngành công nghiệp khác nhau Các nhiệm vụ có thể

được phối hợp một cách hiệu quả bằng cách kết nối các thiết bị và hệ thống,

giảm thiểu sự can thiệp của con người và các lỗi tiềm ẩn Tự động hóa dựa trên IoT cải thiện hiệu suất và năng suất trong mọi thứ từ các ngôi nha thông

minh quản lý tiêu thụ năng lượng đến các nhà máy thông minh tối ưu hóa dây

chuyên sản xuat.

« Tăng cường thu thập va phân tích dữ liệu: Các thiết bị IoT tao ra lượng dữ

liệu khổng 16, có thể được sử dụng để thu thập thông tin quý giá về hành vi của

người dùng, sở thích và mẫu sử dụng Doanh nghiệp có thể sử dụng thông tin

này để đưa ra quyết định thông minh hơn, cung cấp trải nghiệm cá nhân hóa

Trang 19

và tôi ưu hóa hoạt động Hơn nữa, dữ liệu được tạo ra có thé dùng cho những

số liệu dự đoán, cho phép thực hiện bảo trì tối ưu và các chiến lược cắt giảmchi phí.

* Kết nối và tích hợp liền mạch: IơT khuyến khích kết nối liền mạch giữa các

thiết bị, cho phép chúng tồn tại hòa hợp Sự tích hợp này tạo ra một hệ sinh thái

thống nhất giúp đơn giản hóa nhiệm vụ của người dùng và cải thiện hiệu suất

hệ thống Tích hợp hợp nhất đang trở thành một điểm tập trung chính trongphát triển IơT, cho phép các thiết bị từ nhiều nhà sản xuất khác nhau giao tiếp

và đảm bảo một thế giới liên kết và bền vững trong tương lai

* Cho phép giám sát và kiểm soát từ xa: Các thiết bị IoT giúp người dùng

giám sát và kiểm soát từ xa nhiều khía cạnh của cuộc sống của họ, từ an ninh

nhà cửa đến chăm sóc sức khỏe Khả năng này nâng cao sự an toàn, tiện lợi vàkhả dụng, đặc biệt là đối với người già hoặc những người khuyết tật Ngoài ra,

các doanh nghiệp có thể giám sát tài sản và quy trình từ xa, giảm chi phí bảo

trì và thời gian bảo dưỡng.

* Lợi ích về môi trường: IơT có thể hỗ trợ các nỗ lực về bền vững bằng cách tối

ưu hóa việc sử dụng tài nguyên Hệ thống lưới thông minh có thể phân phối

năng lượng một cách hiệu quả hơn, giảm lãng phí và khí thải nhà kính Các kỹ

thuật canh tác chính xác được sử dụng trong nông nghiệp thông minh để tối ưu

hóa việc sử dụng nước và giảm lượng hóa chất đầu vào Những đổi mới này

đóng góp vào một tương lai xanh hơn.

2.1.2.2 Nhược điểm của IoT

¢ Lo ngại về quyền riêng tư và bảo mật: Nguy cơ về việc xâm phạm dữ liệu

và vi phạm quyên riêng tư tăng lên khi có nhiều thiết bị kết nối với nhau thuthập dữ liệu nhạy cảm Tin tặc có thể tận dụng nhược điểm trong các thiết bịIơT để truy cập thông tin cá nhân hoặc thậm chí kiểm soát cơ sở hạ tang quan

trọng Để giải quyết những lo ngại này, bảo vệ dữ liệu và các biện pháp bảo mật mạnh mẽ là rất quan trọng.

Trang 20

- Thách thức về tương thích và tiêu chuẩn hóa: Sự lan rộng nhanh chóng của

các thiết bị IoT đã dẫn đến sự thiếu tiêu chuẩn và các vấn đề tương thích Các

thiết bị từ các nhà sản xuất khác nhau có thể không giao tiếp hiệu quả với nhau, làm trở ngại cho trải nghiệm liền mach mà IoT hứa hẹn Các nỗ lực để tiêu

chuẩn hóa đang được triển khai, nhưng việc đạt được tính tương thích toàn cầu

vẫn là một thách thức lớn.

+ Sự đáng tin cậy và các sự cố kết nối: Để hoạt động đúng cách, các thiết bi

IơT phụ thuộc nhiều vào một kết nối Internet ổn định Các sự cố hoặc giánđoạn trong mạng có thể dẫn đến mất kết nối, làm cho các thiết bị tạm thời

không hoạt động Tính đáng tin cậy là rất quan trọng trong các ứng dụng quan

trọng như chăm sóc sức khỏe hoặc tự động hóa công nghiệp, làm cho các giải

pháp dự phòng cần thiết.

* Chi phí và Yêu cầu Về Cơ sở Ha tang: Việc triển khai các giải pháp IoT có

thể đắt đỏ, đặc biệt là đối với các doanh nghiệp nhỏ hoặc cá nhân Đối với một

số người, việc đầu tư ban đầu vào thiết bị, cơ sở hạ tầng và đào tạo nhân viên

có thể vượt quá những lợi ích ngay lập tức Hơn nữa, bảo trì liên tục và cập

nhật phần mềm là cần thiết để đảm bảo tính khả dụng dài hạn của các hệ thống

lof.

¢ Phụ thuộc quá mức và su thay đổi công việc: Việc sử dung rộng rai của tự

động hóa được điều khiển bởi IoT có thể dẫn đến việc thay đổi công việc, đặc

biệt là trong các ngành công nghiệp nơi các nhiệm vụ hàng ngày được tự động

đây thường được xử lý bởi các mô hình RNNs và CNNs So với các mô hình truyền

10

Trang 21

thống, Transformer có khả năng xử lý các phụ thuộc dài hạn và cho phép thực hiệnsong song hóa, đồng thời cải thiện đáng kể hiệu suất trong các ứng dụng xử lý ngôn

ngữ tự nhiên.

Module Attention của Transformer là trọng tâm của kiến trúc này, giúp mô hình

tính toán mối quan hệ giữa từng từ trong câu, cung cấp một hiển thị ngữ cảnh đầy

đủ hơn Bằng cách sử dụng các vector queries, keys và values, Transformer có thể

đo lường sự tương tác giữa các thành phần của câu một cách hiệu quả và toàn diện

Để nắm bắt vị trí của từng thành phần trong câu, Transformer áp dụng mã hóa vịtrí bằng cách sử dụng hàm embedding được học hoặc hàm sine đã định nghĩa trước

Điều này giúp mô hình hiểu được vai trò vị trí của từng thành phần trong ngữ liệuđầu vào, đóng vai trò quan trọng trong việc hiểu và biểu diễn ngữ nghĩa của câu

Kiến trúc của Transformer bao gồm hai thành phần chính là encoder và decoder,

mỗi thành phan có thể có nhiều lớp Encoder sử dụng multihead self-attention va

một mạng truyền thang theo vị trí (Position-wise Feedforward Network - PFFN),

trong khi decoder có thêm một lớp multihead cross-attention để kết nối thông tin từ encoder và chuỗi các tokens đầu vào Điều này giúp cho Transformer có thể thực

hiện các tác vụ dịch thuật, tổng hợp văn bản, hay sinh văn bản tự động một cách hiệu

quả và chính xác.

II

Trang 22

CHƯƠNG 2 CƠ SỞ LÝ THUYET

Multi-Head Attention

Hình 2.3 Cấu trúc của mang Transformer [12]

2.2.2 Cấu trúc mô hình Vision Transformer

Khác biệt với các công trình sử dụng các mô-đun transformer hoặc attention kết hợp

với mô hình CNN để giải quyết các nhiệm vụ thị giác, VĩT là một kiến trúc máy hoàntoàn sử dụng Transformer thuần túy mà không sử dụng mạng tích chập, nó được déxuất như một phương pháp để làm Backbone cho việc xử lý hình ảnh Kiến trúc

mang tổng thể của ViT được trình bày trong Hình 2.4 Ý tưởng chính của việc áp

dụng Transformer vào dif liệu hình ảnh là cách chuyển đổi hình ảnh đầu vào thành

một chuỗi các token, điều này thường được yêu cầu bởi Transformer

12

Trang 23

Vision Transformer (ViT) Transformer Encoder

phần sau đó được chuyển đổi thành một embedding sử dụng một lớp tuyến tính Các

embedding này được gộp lại để tạo thành một chuỗi các token, trong đó mỗi token

đại diện cho một phần nhỏ của hình ảnh đầu vào Một token có thể học thêm, tức làtoken phân loại, được thêm vào đầu chuỗi Nó được sử dụng bởi các lớp transformernhư một nơi để thu hút sự chú ý từ các vị trí khác nhằm tạo ra kết quả dự đoán Các

embedding vi trí được thêm vào chuỗi token N+1 này và sau đó được đưa vào bộ mã

hóa transformer.

Như được trình bày trong Hình 2.3 va 2.4, bộ mã hóa transformer trong ViT

tương tự như bộ mã hóa transformer gốc của Vaswani và cộng sự [12] Sự khác biệtduy nhất là trong ViT, việc chuẩn hóa lớp được thực hiện trước khi thực hiện multi-

head attention và MLP, trong khi transformer của Vaswani thực hiện chuẩn hóa sau các quá trình này Đầu ra của bộ mã hóa transformer là một chuỗi các token có cùng

kích thước với đầu vào, tức là N+1 token Tuy nhiên, chỉ có token đầu tiên, tức làtoken phân loại, được đưa vào đầu dự đoán, là perceptron đa tầng (MLP), để tạo ra

nhãn lớp dự đoán.

13

Trang 24

2.2.3 Các thách thức khi sử dụng mô hình ViT

2.2.3.1 Quá trình pre-training đòi hỏi lượng lớn dữ liệu

Pre-training dường như là một yếu tố quan trọng trong một số mạng lưới dựa trên

transformer Tuy nhiên, như được trình bày trong công trình ViT gốc [13] và cáccông trình khác, so với CNN, ViT đòi hỏi một lượng dữ liệu hình ảnh lớn hơn nhiềucho quá trình pre-training để đạt được hiệu suất cạnh tranh

Như báo cáo trong [13], việc pre-training ViT trên ImageNet-21k (21,000 lớp

và 14 triệu hình ảnh) hoặc JFT-300M (18,000 lớp và 303 triệu hình ảnh độ phân

giải cao) có thể đạt được hiệu suất tương tự Trong khi đó, việc pre-training ViT

trên ImageNet-1k (1,000 lớp và 1.3 triệu hình ảnh) thì không đạt được hiệu suất nhưmong muốn Không những thế, việc pre-training ViT sử dụng các bộ dữ liệu lớn nàyđòi hỏi thời gian tính toán rất dài và lượng tài nguyên tính toán lớn

2.2.3.2 Việc tính toán tôn kém lớn

Ngoài việc cần pre-train trên các bộ dữ liệu rất lớn, độ phức tạp tính toán của ViT làmột van dé khác, do đầu vào là một hình ảnh chứa lượng thông tin lớn Việc tokenhóa dường như được thực hiện ở mức độ pixel để tận dụng tốt hơn cơ chế attentioncho hình ảnh đầu vào, tức là chuyển đổi mỗi pixel thành một token trong trường hợp

tốt nhất.

Tuy nhiên, độ phức tạp tính toán của mô-đun attention tăng theo hàm bậc hai với

kích thước hình ảnh, dẫn đến các vấn đề không thể giải quyết về độ phức tạp tính

toán và sử dụng bộ nhớ Công trình [13] cũng đã thử nghiệm với các hình ảnh độ

phân giải thông thường và chọn các patch không chồng chéo kích thước 16x16, giúp

giảm độ phức tạp của mô-đun attention theo tỉ lệ 16x16.

Van dé này càng trở nên trầm trọng hơn khi ViT được sử dụng như backbone cho các nhiệm vụ dự đoán dày đặc như phát hiện đối tượng hoặc phân đoạn ngữ nghĩa,

vì đầu vào hình ảnh độ phân giải cao là cần thiết để đạt được hiệu suất hàng đầu

14

Trang 25

2.2.3.3 Không thể tạo các feature map ở nhiều tỉ lệ khác nhau

Do thiết kế, ViT chỉ sử dụng bộ mã hóa transformer gốc dé xử lý dữ liệu hình ảnh,

do đó chỉ có thể tạo ra các feature map đơn tỉ lệ Tuy nhiên, tầm quan trọng củacác feature map đa tỉ lệ đã được chứng minh trong nhiều phương pháp phát hiện đối

tượng và phân đoạn ngữ nghĩa.

Các nhiệm vụ này có thể liên quan đến các đối tượng ở các tỉ lệ khác nhau (nhỏ,

vừa, hoặc lớn) xuất hiện trong cùng một hình ảnh, do đó việc sử dụng feature map ởmột tỉ lệ duy nhất sẽ không thể đại diện cho tất cả các đối tượng một cách hiệu quả.Các đối tượng có thể không được phát hiện hiệu quả khi chỉ sử dụng feature map

đơn tỉ lệ.

2.3 Học liên kết

2.3.1 Tổng quan về học liên kết

Federated learning (học liên kết) là một phương pháp phân tán để đào tạo các mô

hình học máy, trong đó điểm nổi bật chính là không cần phải trao đổi dữ liệu từ thiết bị của khách hàng đến máy chủ toàn cầu Thay vì gửi dữ liệu gốc về máy chủ,

phương pháp này huấn luyện mô hình một cách cục bộ bang cách sử dụng dữ liệu có

sẵn trên các thiết bị biên, điều này giúp cải thiện khả năng bảo vệ dữ liệu và quyền

riêng tư của người dùng Cuối cùng, một mô hình tổng thể được hình thành bằng

cách tổng hợp các cập nhật cục bộ từ nhiều thiết bị khác nhau

15

Trang 26

2.3.2 Cách thức hoạt động của học liên kết

Cloud Server My New Learning L2 = avg(deltat +delta2)

Step 2 : Updating local models and generating aa

new learnings using private data qr? =>

Trong quá trình thực hiện Federated learning, một mô hình cơ bản sẽ được lưu trữ

trên một máy chủ trung tâm Từ đây, một bản sao của mô hình này sẽ được gửi đến

các thiết bị khách hàng Các thiết bị này sẽ sử dụng dữ liệu cục bộ mà chúng tạo ra

để huấn luyện mô hình Qua thời gian, các mô hình trên từng thiết bị sẽ trở nên cánhân hóa hơn, từ đó mang lại trải nghiệm người dùng tốt hơn và phù hợp hơn vớinhu cầu cụ thể của mỗi người dùng

Ở giai đoạn tiếp theo, các bản cập nhật của mô hình được đào tạo cục bộ (thường

là các tham số mô hình) sẽ được chia sẻ lại với mô hình chính nằm trên máy chủtrung tâm Điều này được thực hiện bằng các kỹ thuật tổng hợp an toàn (secure

aggregation techniques) để đảm bao rằng không có dữ liệu cá nhân nào bị tiết lộ

trong quá trình chuyển giao Máy chủ trung tâm sau đó sẽ kết hợp và lấy trung bìnhnhiều yếu tố đầu vào khác nhau để tạo ra các bài học mới Vì dif liệu được thu thập

từ nhiều nguồn khác nhau, phạm vi của mô hình sẽ rộng hơn và có khả năng tổng quát hóa tốt hơn.

Sau khi mô hình trung tâm được cập nhật và đào tạo lại theo các tham số mới,

nó sẽ được chia sẻ lại với các thiết bị khách hàng trong lần lặp tiếp theo Quá trìnhnày được lặp đi lặp lại qua nhiều chu kỳ, mỗi lần như vậy mô hình sẽ thu thập một

lượng thông tin mới và tiếp tục cải thiện mà không gây ra bất kỳ nguy hại nào về

quyền riêng tư cho người dùng Điều này không chỉ giúp mô hình học máy trở nên

16

Trang 27

mạnh mẽ hơn mà còn bảo vệ dữ liệu cá nhân của người dùng khỏi bị lam dụng hoặc

bị xâm phạm.

Federated learning không chỉ là một giải pháp kỹ thuật mà còn là một bước tiễn

quan trọng trong việc cân bằng giữa việc cải thiện khả năng học máy và bảo vệquyền riêng tư cá nhân Bang cách cho phép các thiết bị biên tham gia vào quá trìnhhuấn luyện mà không cần phải chia sẻ dữ liệu thô, phương pháp này mở ra cơ hộicho nhiều ứng dụng học máy trong các lĩnh vực nhạy cảm với dữ liệu như y tế, tài

chính, và các dịch vụ cá nhân hóa Với sự phát triển không ngừng của công nghệ và

nhu cầu ngày càng tăng về quyền riêng tu, Federated learning hứa hen sẽ trở thành

một trụ cột quan trọng trong tương lai của học máy.

2.3.3 Chiến lược của học liên kết

2.3.3.1 Hoc liên kết tập trung (Centralized federated learning)

Học liên kết tập trung là một phương pháp đào tạo mô hình hoc máy yêu cầu một

máy chủ trung tâm để quản lý toàn bộ quá trình Máy chủ trung tâm này đóng vai trò

quan trọng trong việc lựa chọn các thiết bị khách hàng tham gia vào quá trình đàotạo và thu thập các bản cập nhật mô hình từ các thiết bị biên Trong hệ thống này,tất cả các tương tác chỉ xảy ra giữa máy chủ trung tâm và từng thiết bị biên riêng lẻ,không có sự giao tiếp trực tiếp giữa các thiết bị khách hàng

Trong quá trình học liên kết tập trung, máy chủ trung tâm đầu tiên sẽ chọn một

nhóm thiết bị khách hàng để tham gia vào quá trình huấn luyện Các thiết bị này sau

đó sẽ tải xuống mô hình hiện tại từ máy chủ và sử dụng dữ liệu cục bộ của mình đểthực hiện việc huấn luyện mô hình Sau khi hoàn thành giai đoạn này, các thiết bị

sẽ gửi các bản cập nhật mô hình, chẳng hạn như các tham số mới, trở lại máy chủ

trung tâm Máy chủ sẽ tong hợp và kết hợp các bản cập nhật này để cải thiện mô

hình chung.

Một trong những ưu điểm chính của phương pháp học liên kết tập trung là nó có

thể mang lại một mô hình chính xác và hiệu quả nhờ vào việc tổng hợp các thông tin

từ nhiều thiết bị biên Tuy nhiên, phương pháp này cũng tiềm ẩn những thách thức

không nhỏ Việc phụ thuộc vào một máy chủ trung tâm có thé dẫn đến các vấn dé

tắc nghẽn, đặc biệt là khi có nhiều thiết bị tham gia vào quá trình huấn luyện cùng

17

Trang 28

một lúc Điều này có thể gây ra sự chậm trễ và giảm hiệu suất của hệ thống

Ngoài ra, các sự cố mạng có thể gây gián đoạn trong quá trình truyền tải dữ liệu

giữa máy chủ và các thiết bị biên Nếu kết nối mạng không ổn định hoặc bị gián đoạn, quá trình huấn luyện có thể bị dừng lại hoặc không thể hoàn tất đúng hạn.

Điều này đặc biệt quan trọng trong các ứng dụng thời gian thực hoặc khi yêu cầutính khả dụng cao, nơi mà mỗi sự chậm trễ đều có thể ảnh hưởng lớn đến hiệu quả

và độ tin cậy của hệ thống

Một vấn đề khác của học liên kết tập trung là rủi ro về an ninh và bảo mật dữliệu Mặc dù dif liệu thô không được truyền từ các thiết bị biên đến máy chủ trung

tâm, nhưng các bản cập nhật mô hình có thể chứa thông tin nhạy cảm và có thể bị

khai thác nếu không được bảo vệ đúng cách Điều này đặt ra nhu cầu cấp thiết vềcác biện pháp bảo mật mạnh mẽ để bảo vệ thông tin trong suốt quá trình huấn luyện

Hình 2.6 Quá trình của Centralized federated learning [15]

2.3.3.2 Học liên kết phân tán (Decentralized federated learning)

Học liên kết phân tán là một phương pháp đào tạo mô hình học máy không yêu cầu

máy chủ trung tâm để điều phối quá trình học Thay vào đó, quá trình này được thựchiện bằng cách chia sẻ các bản cập nhật mẫu giữa các thiết bị biên được kết nối với

nhau trong một mạng phân tán Mỗi thiết bị biên sẽ đóng góp vào quá trình huấn

luyện mô hình bằng cách sử dụng dif liệu cục bộ của mình, và mô hình cuối cùng thu

được trên mỗi thiết bị biên là kết quả của việc tổng hợp các bản cập nhật từ nhiều

18

Trang 29

thiết bị khác nhau trong mạng

Quá trình học liên kết phân tán bắt đầu bằng việc mỗi thiết bị biên sử dụng dữ

liệu cục bộ của mình để huấn luyện mô hình ban đầu Sau khi hoàn thành giai đoạn này, các thiết bị sẽ chia sẻ các bản cập nhật mô hình của mình với các thiết bị khác

trong mạng Thông qua quá trình trao đối và tổng hợp các bản cập nhật này, mỗi

thiết bị sẽ dần dần cải thiện mô hình của mình Quá trình này được lặp đi lặp lại quanhiều vòng, và kết quả cuối cùng là một mô hình được huấn luyện đầy đủ trên cácthiết bị biên mà không cần đến sự can thiệp của máy chủ trung tâm

Một trong những ưu điểm nổi bật của phương pháp học liên kết phân tán là nóloại bỏ khả năng xảy ra lỗi một điểm (single point of failure), một van dé phổ biếntrong các hệ thống phụ thuộc vào máy chủ trung tâm Bằng cách phân phối quá trìnhhuấn luyện trên nhiều thiết bị biên, hệ thống trở nên linh hoạt hon và có khả năngchịu đựng cao hơn đối với các sự cô cá nhân của từng thiết bị Điều nay làm cho họcliên kết phân tán trở nên hấp dẫn đối với các ứng dụng yêu cầu độ tin cậy và tính khả

hình không đạt được độ chính xác mong muốn hoặc quá trình huấn luyện bị kéo dài.

Việc đảm bảo tính đồng bộ và nhất quán trong một mạng phân tán cũng là một thách

thức Khi các thiết bị hoạt động độc lập và chỉ trao đổi thông tin một cách không

đồng bộ, có thể xảy ra tình trạng mô hình không hội tụ hoặc hội tụ chậm Việc pháttriển các giao thức và thuật toán hiệu quả để điều phối quá trình huấn luyện trong

một môi trường phân tán là một lĩnh vực nghiên cứu quan trọng để cải thiện hiệu

suất của học liên kết phân tán

Bảo mật và quyền riêng tư cũng là những yếu t6 cần được xem xét Mặc dù dữ

liệu thô không được chia sẻ giữa các thiết bị, các bản cập nhật mô hình có thể chứa

thông tin nhạy cảm Do đó, các kỹ thuật bảo mật như mã hóa và tổng hợp an toàn

cần được áp dụng để bảo vệ thông tin trong quá trình trao đổi

19

Trang 30

Roof

t7 có

Hình 2.7 Quá trình của Decentralized federated learning [16]

2.3.3.3 Học liên kết không đồng nhất (Heterogeneous federated learning)

Học liên kết không đồng nhất là một phương pháp đào tạo mô hình học máy đòi hỏi

sự hiện diện của nhiều loại thiết bị người dùng cuối khác nhau, chẳng hạn như điện

thoại di động, máy tính và các thiết bị IơT Các thiết bi này khác nhau về phần cứng,

phần mềm, sức mạnh tính toán và kiểu dữ liệu, tạo ra một môi trường huấn luyện

phức tạp và đa dạng.

Trong bối cảnh học liên kết không đồng nhất, mỗi thiết bị biên có khả năng và

đặc điểm riêng biệt, làm cho quá trình huấn luyện trở nên linh hoạt hơn và phù hợpvới điều kiện thực tế Khác với chiến lược học liên kết thông thường, vốn giả địnhrằng các thuộc tính của mô hình cục bộ trên mỗi thiết bị giống hệt với các thuộc tínhcủa mô hình chính, học liên kết không đồng nhất được phát triển để đáp ứng các tìnhhuống thực tế hơn, nơi mà sự đồng nhất này hiếm khi xảy ra

Quá trình học liên kết không đồng nhất bắt đầu bằng việc mỗi thiết bị sử dụng

dữ liệu cục bộ và khả năng tính toán của mình để huấn luyện mô hình cục bộ Mỗi

mô hình cục bộ này sẽ phản ánh đặc điểm và giới hạn riêng của từng thiết bị, từ đó tạo ra một tập hợp các mô hình cục bộ đa dạng Sau khi hoàn thành giai đoạn huấn

luyện ban đầu, các thiết bị sẽ chia sẻ các tham số mô hình hoặc các bản cập nhật

mô hình của mình với máy chủ trung tâm hoặc với nhau, tùy thuộc vào kiến trúc hệthống cụ thể

Máy chủ trung tâm (hoặc một hệ thống phân tán) sẽ kết hợp các bản cập nhật này

20

Trang 31

để tạo ra một mô hình toàn cầu duy nhất Mô hình toàn cầu này không chỉ tổng hợpthông tin từ các mô hình cục bộ mà còn phản ánh sự đa dạng và không đồng nhất

của các thiết bị biên Kết quả là một mô hình có khả năng tổng quát hóa tốt hơn và

có thể áp dụng được trên nhiều loại thiết bị và môi trường khác nhau.

Một trong những thách thức lớn của học liên kết không đồng nhất là việc quản

lý và tổng hợp các mô hình cục bộ không đồng nhất Do sự khác biệt về phần cứng,phần mềm và dữ liệu, việc kết hợp các bản cập nhật mô hình có thể gặp khó khăn vàđòi hỏi các kỹ thuật phức tạp để đảm bảo tính nhất quán và hiệu quả Các thuật toántổng hợp phải được thiết kế sao cho có thể xử lý sự không đồng nhất này mà vẫn giữđược độ chính xác và hiệu suất của mô hình toàn cầu Mặc dù dữ liệu thô khôngđược chia sẻ giữa các thiết bị, các bản cập nhật mô hình vẫn có thể chứa thông tinnhạy cảm Các kỹ thuật bảo mật như mã hóa và tổng hợp an toàn cần được áp dụng

để bảo vệ thông tin trong quá trình trao đổi và tổng hợp.

Học liên kết không đồng nhất mang lại nhiều lợi ích đáng kể trong việc đào tạo

mô hình học máy, đặc biệt là trong các môi trường đa dạng và phức tạp Phương

pháp này không chỉ tăng cường khả năng học máy mà còn giúp tạo ra các mô hình

có thể hoạt động hiệu quả trên nhiều loại thiết bị khác nhau Tuy nhiên, để tận dụng

tối đa tiềm năng của học liên kết không đồng nhất, cần có sự phát triển và cải tiếnliên tục về các thuật toán và kỹ thuật tổng hợp, cũng như các biện pháp bảo mật và

quản lý dữ liệu.

Hình 2.8 Quá trình của Heterogeneous federated learning [17]

21

Trang 32

2.3.4 Thuật toán của học liên kết

2.3.4.1 Federated stochastic gradient descent (FedSGD)

SGD (Stochastic Gradient Descent) truyền thống là một phương pháp tối ưu hóa

trong học máy, tính toán gradient bằng cách sử dụng các lô nhỏ (mini-batches), là

một phần của các mẫu dữ liệu được lấy từ tổng số mẫu Quá trình này giúp giảmchi phí tính toán và cải thiện hiệu quả huấn luyện mô hình Trong học liên kết

(Federated Learning), cách tiếp cận này có thể được mở rộng bằng cách xem các lô

nhỏ này dưới dạng các thiết bị khách hàng khác nhau, mỗi thiết bị bao gồm dữ liệu

cục bộ của riêng nó.

Trong FedSGD (Federated Stochastic Gradient Descent), mô hình trung tâm

được phân phối đến các thiết bị khách hàng, và mỗi khách hàng sử dụng dữ liệucục bộ của mình để tính toán gradient Các gradient này sau đó được chuyển đếnmột máy chủ trung tâm, nơi chúng được tổng hợp dựa trên số lượng mẫu có sẵn cho

mỗi khách hàng Máy chủ trung tâm sau đó sử dụng các gradient tổng hợp này để

thực hiện các bước gradient descent, từ đó cập nhật mô hình trung tâm.

Quá trình FedSGD bắt đầu bằng việc máy chủ trung tâm gửi mô hình hiện tạiđến một tập hợp các thiết bị khách hàng Mỗi thiết bị khách hàng sau đó sẽ sử dụng

dữ liệu cục bộ của mình để tính toán gradient, tương tự như cách các lô nhỏ được sử dụng trong SGD truyền thống Sau khi tính toán xong, các gradient này được gửi trở lại máy chủ trung tâm Máy chủ trung tâm sẽ kết hợp các gradient từ tất cả các thiết

bị khách hàng, tạo ra một gradient tổng hợp, và sử dụng gradient này để cập nhật

mô hình trung tâm Thuật toán được biểu diễn qua công thức trong bài báo [18].

Trang 33

« K: Số lượng client tham gia.

Phương pháp FedSGD mang đến nhiều ưu điểm đáng kể Trước hết, nó cho phépkhai thác dữ liệu từ nhiều nguồn phân tán mà không cần tập trung hóa, góp phần

bảo vệ quyền riêng tư và an toàn thông tin của người dùng Hơn nữa, bằng cách tận

dụng sức mạnh tính toán của các thiết bị cục bộ, phương pháp này giúp giảm tải chomáy chủ trung tâm và nâng cao hiệu suất quá trình huấn luyện

Tuy nhiên, FedSGD cũng đối mặt với một số thách thức đáng kể Việc tổng hợp

gradient từ các thiết bị khách hàng có thể gặp khó khăn do sự không đồng nhất về

dữ liệu và năng lực xử lý Sự khác biệt về cấu hình phần cứng, phần mềm và điềukiện mạng có thể ảnh hưởng đến tốc độ và độ chính xác của quá trình huấn luyện.Thêm vào đó, việc truyền tải gradient từ thiết bị khách hàng đến máy chủ trung tâm

có thể tiêu tốn nhiều băng thông và gặp van đề về độ trễ.

Để khắc phục thì các kỹ thuật tối ưu hóa và các thuật toán hiệu quả cần được

phát triển Các kỹ thuật như việc chọn lựa thiết bị khách hàng một cách thông minh,

cân nhắc độ không đồng nhất của dữ liệu, và sử dụng các phương pháp bảo mật như

mã hóa và tổng hợp an toàn có thể giúp cải thiện hiệu quả của FedSGD.

Ngoài ra, việc đảm bảo tính ổn định và khả năng mở rộng của hệ thống cũng làmột yếu tổ quan trong Các thuật toán phải có khả năng thích ứng với sự thay đổi va

sự không đồng nhất của các thiết bị khách hàng, đồng thời đảm bảo rằng quá trìnhhuấn luyện có thể tiếp tục một cách mượt mà ngay cả khi có sự cô mạng hoặc cácthiết bị bị ngắt kết nối

2.3.4.2 Federated averaging (FedAvg)

FedAvg (Federated Averaging) là một phần mở rộng của thuật toán FedSGD

(Feder-ated Stochastic Gradient Descent) trong học liên kết (Feder(Feder-ated Learning) Khác với

FedSGD, nơi các khách hàng thực hiện các cập nhật gradient cục bộ và gửi gradient

về máy chủ trung tâm, trong FedAvg, các khách hàng có thể thực hiện nhiều cậpnhật giảm gradient cục bộ trước khi chia sẻ kết quả với máy chủ trung tâm Thay

23

Trang 34

vì chia sẻ gradient, các khách hàng chia sẻ các trọng số đã được điều chỉnh của môhình cục bộ Máy chủ trung tâm sau đó tổng hợp các trọng số này (các tham số mô

hình) từ các thiết bị khách hàng để cập nhật mô hình toàn cầu.

FedAvg bat đầu bằng cách phân phối mô hình hiện tại từ máy chủ trung tâm đếncác thiết bị khách hàng Mỗi thiết bị khách hàng sau đó sử dụng dữ liệu cục bộ củamình để thực hiện nhiều bước cập nhật gradient cục bộ, điều chỉnh các trọng số của

mô hình Sau khi hoàn thành các cập nhật này, các thiết bị không gửi gradient màgửi trực tiếp các trọng số đã được điều chỉnh của mô hình cục bộ về máy chủ trung

tâm Máy chủ trung tâm sẽ kết hợp các trọng số này bằng cách tính trung bình có

trọng số, dựa trên số lượng mẫu dif liệu cục bộ của mỗi thiết bị, để tạo ra một mô

hình toàn cầu mới và cải tiến Thuật toán được biểu diễn qua công thức trong bài

* nz: Số lượng mau dữ liệu tai nút k

FedAvg là một sự tổng quát hóa của FedSGD Nếu tat cả các máy khách đều bắt

đầu với cùng một lần khởi tạo, thì việc tính trung bình các gradient sẽ tương đươngvới việc tính trung bình theo trọng số Tuy nhiên, FedAvg cho phép các thiết bị thựchiện nhiều bước cập nhật cục bộ, điều này làm cho quá trình huấn luyện trở nên linhhoạt và hiệu quả hơn Bằng cách thực hiện nhiều cập nhật cục bộ trước khi gửi cáctrọng số về máy chủ trung tâm, FedAvg giúp giảm tải lượng truyền tải dữ liệu và

tăng tốc độ hội tụ của mô hình.

Mội trong những ưu điểm chính của FedAvg là khả năng tận dụng sức mạnh tính

toán phân tán của các thiết bị khách hàng, cho phép thực hiện nhiều bước cập nhậtcục bộ mà không cần phải liên tục giao tiếp với máy chủ trung tâm Điều này giúpgiảm tải băng thông mạng và cải thiện hiệu suất của quá trình huấn luyện Đồng thời,

24

Trang 35

FedAvg cũng tăng cường tính bảo mật và quyền riêng tư của dữ liệu người dùng, vi

dữ liệu thô không bao giờ rời khỏi thiết bị cục bộ.

Tuy nhiên, FedAvg cũng gặp phải ciệc các thiết bị thực hiện nhiều bước cập nhật cục bộ có thể dẫn đến sự không đồng bộ trong quá trình huấn luyện, đặc biệt khi các

thiết bị có khả năng tính toán và kết nối mạng khác nhau Điều này có thể gây ra sựkhông đồng nhất trong các trọng số được chia sẻ và làm cho quá trình hội tụ trở nênkhó khăn hơn Ngoài ra, việc tổng hợp các trọng số cục bộ có thể phức tạp hơn do

sự khác biệt về dữ liệu và môi trường của từng thiết bị

Các kỹ thuật và thuật toán tối ưu hóa để quản lý sự không đồng bộ và khôngđồng nhất trong quá trình huấn luyện là cần thiết để cải thiện nhược điểm trên Cácphương pháp như cân nhắc trọng số theo số lượng mẫu dữ liệu cục bộ, sử dụng các

kỹ thuật bảo mật như mã hóa và tổng hợp an toàn, và phát triển các giao thức hiệu

quả để điều phối quá trình huấn luyện phân tán có thể giúp cải thiện hiệu quả và độ

tin cậy của FedAvg.

2.3.4.3 Federated learning with dynamic regularization (FedDyn)

Regularization trong các phương pháp hoc máy truyền thống nhằm mục đích cải

thiện tính tổng quát hóa của mô hình bằng cách thêm một hình phạt vào hàm mấtmát Điều này giúp ngăn chặn mô hình quá khớp với dữ liệu huấn luyện và cải thiện

khả năng dự đoán trên dữ liệu mới Trong học tập liên kết (Federated Learning), việc tính toán độ mat mát toàn cầu đòi hỏi phải dựa trên độ mất mát cục bộ do các thiết bị khác nhau tạo ra, tạo ra những thách thức đặc biệt do sự đa dạng của dữ liệu

và điều kiện tính toán trên các thiết bị này

Với tính đa dạng của các khách hàng, việc giảm độ mắt mát toàn cầu không thể

đơn giản bằng cách giảm độ mất mát cục bộ trên từng thiết bị riêng lẻ Sự khác biệt

về dữ liệu, khả năng tính toán và chi phí truyền thông giữa các thiết bị làm cho quá

trình này trở nên phức tạp hơn Do đó, FedDyn (Federated Dynamic Regularization)

được phát triển nhằm mục đích tạo ra regularization cho độ mat mát cục bộ bangcách điều chỉnh số liệu thống kê dữ liệu như khối lượng dữ liệu và chi phí truyền

thông, đảm bảo rằng mô hình toàn cầu được huấn luyện hiệu quả và công bằng

FedDyn bắt đầu bằng việc máy chủ trung tâm gửi mô hình hiện tại đến các thiết

25

Trang 36

bị khách hàng Mỗi thiết bị sau đó sẽ sử dụng dữ liệu cục bộ của mình để tính toán

độ mất mát và thực hiện các cập nhật mô hình Tuy nhiên, khác với các phương

pháp học liên kết truyền thống, FedDyn áp dụng một hình phạt regularization vào

độ mất mát cục bộ, điều chỉnh theo các yếu tố như khối lượng dữ liệu và chi phí

truyền thông của từng thiết bị Sau khi hoàn thành các cập nhật, các thiết bị sẽ gửitrọng số mô hình đã điều chỉnh về máy chủ trung tâm Thuật toán được biểu diễn

qua pseudocode trong bài báo [19].

Algorithm 1 Federated Dynamic Regularizer-(FedDyn)

May chủ trung tâm sẽ tổng hợp các trong số nay để tao ra mô hình toàn cầu mới.

Bằng cách điều chỉnh độ mat mát cục bộ với regularization động, FedDyn giúp cânbằng ảnh hưởng của các thiết bị khác nhau, giảm thiểu tác động của sự không đồng

nhất dữ liệu và cải thiện tính tổng quát hóa của mô hình toàn cầu.

FedDyn mang lại khả năng quản lý sự đa dạng của các thiết bị khách hàng một

cách hiệu quả Bằng cách điều chỉnh regularization dựa trên các thông số như khối

lượng dữ liệu và chi phí truyền thông, FedDyn giúp đảm bảo rằng các thiết bị với dữ

liệu ít hơn hoặc khả năng tính toán hạn chế không bị bỏ qua trong quá trình huấn

luyện Điều này tạo ra một mô hình công bằng và đại diện tốt hơn cho toàn bộ dữ

liệu phân tán.

Việc điều chỉnh regularization cho từng thiết bị yêu cầu tính toán phức tạp và quản lý nhiều thông số Đảm bảo rằng quá trình huấn luyện vẫn hiệu quả và không

26

Trang 37

tốn quá nhiều tài nguyên tính toán là một van dé quan trọng Ngoài ra, việc truyềntải các trọng số mô hình đã điều chỉnh có thể gặp khó khăn do băng thông mạng và

độ trễ.

Để giải quyết thách thức này, cần phát triển các thuật toán và kỹ thuật tối ưu hóa

hiệu quả Các phương pháp như chọn lựa thiết bị khách hàng một cách thông minh,

sử dụng các kỹ thuật nén dif liệu và tối ưu hóa quá trình truyền tải có thể giúp cảithiện hiệu suất của FedDyn Đồng thời, việc áp dụng các biện pháp bảo mật như mãhóa và tổng hợp an toàn cũng cần được xem xét để bảo vệ thông tin người dùng

27

Tiêu đề	Phát triển hệ thống quản lý cấp phát thuốc cho bệnh nhân dựa trên các mô hình vision transformer và federated learning
Tác giả	Trương Tuấn Kiệt
Người hướng dẫn	ThS. Nguyễn Khỏnh Thuật, ThS. Trần Thị Dung
Trường học	Đại học Quốc gia Thành phố Hồ Chí Minh
Chuyên ngành	Mạng máy tính và truyền thông
Thể loại	khóa luận tốt nghiệp
Năm xuất bản	2024
Thành phố	Thành phố Hồ Chí Minh

Định dạng
Số trang	74
Dung lượng	78,15 MB