Đồng thời, kiến trúc học liên kết Federated Learning FL được sử dụng dé quản lý thông tin thuốc và bệnh lý một cách bảo mật, bảo vệ thông tin cá nhân của bệnh nhân vì dữ liệu không bao g
Trang 1ĐẠI HỌC QUOC GIA THÀNH PHO HO CHÍ MINH
TRUONG DAI HOC CONG NGHE THONG TIN
KHOA MẠNG MAY TÍNH VÀ TRUYEN THONG
TRƯƠNG TUẦN KIỆT - 20521507
KHOÁ LUẬN TỐT NGHIỆP
TRANSFORMER VÀ FEDERATED LEARNING
DEVELOPING A DRUG DISTRIBUTION MANAGEMENT SYSTEM FOR
PATIENTS USING VISION TRANSFORMER AND FEDERATED
LEARNING MODELS
CỬ NHÂN NGANH MẠNG MAY TÍNH VA TRUYEN THONG
GIANG VIEN HUGNG DAN
ThS Nguyễn Khánh Thuật
ThS Trần Thị Dung
TP HO CHÍ MINH, 2024
Trang 2LỜI CẢM ƠN
Lời đầu tiên, nhóm muốn sửi lời biết ơn sâu sắc tới quý thầy cô, ban giám hiệu và
toàn thể nhân viên của Trường Đại hoc Công Nghệ Thông Tin — Dai Học Quốc GiaTP.HCM, những người cho tôi cơ hội được tiếp xúc môi trường học tập và nghiên
cứu chất lượng cao, qua đó tích lũy thêm nhiều trải nghiệm và kỹ năng cần thiết cho
định hướng sự nghiệp trong tương lai.
Trong quá trình thực hiện đề tài nghiên cứu, tôi đã may mắn được sự hỗ trợ và
định hướng từ ThS Nguyễn Khánh Thuật và ThS Tran Thi Dung, những người đãnhiệt tình giúp đỡ và góp ý cho dự án của nhóm ngay từ những bước đầu tiên
Cuối cùng, tôi cũng không quên bày tỏ lòng cảm kích tới gia đình và bạn bè,
những người đã luôn là nguồn cổ vũ, sát cánh cùng tôi trong suốt quãng đường học van và nghiên cứu Sự ủng hộ và quan tâm không ngừng của họ đã trở thành động
lực quan trọng, giúp tôi tin tưởng và kiên định trên con đường mình đã chọn.
Trân trọng.
Nhóm tác giả
li
Trang 3TOM TAT
Trong nhiều bệnh viện, việc phân phát thuốc thủ công có thể gây ra sai sót donhân viên bận rộn hoặc mệt mỏi Để giải quyết vấn đề này, việc áp dụng trí tuệ nhântạo Artificial Intelligence (AI) trong lĩnh vực y tế đang trở thành xu hướng không
thể thiếu AI có thể hỗ trợ bệnh viện phân phát thuốc nhanh chóng và chính xác,
giúp cải thiện hiệu quả và giảm thiểu sai sót.
Để giải quyết các thách thức trong việc quản lý thông tin y tế và phân phối thuốc,nhóm nghiên cứu đã dé xuất một hệ thống hỗ trợ bệnh viện tiên tiến Hệ thống
nay sử dung Vision Transformer (ViT) để nhận diện khuôn mặt bệnh nhân một cách nhanh chóng và chính xác, từ đó hỗ trợ việc phân phối thuốc một cách hiệu quả Đồng thời, kiến trúc học liên kết Federated Learning (FL) được sử dụng dé quản lý thông tin thuốc và bệnh lý một cách bảo mật, bảo vệ thông tin cá nhân của bệnh
nhân vì dữ liệu không bao giờ rời khỏi thiết bị của họ và chỉ các thông tin mô hình
mới được chia sẻ.
Kết hợp hai công nghệ này, hệ thống đề xuất không chỉ cải thiện quy trình phânphối thuốc mà còn đảm bảo an toàn thông tin bệnh nhân Thông tin thuốc và bệnh
lý được lưu trữ an toàn trên cloud, và việc sử dụng FL giúp bảo mật thông tin bệnh
nhân, mang lại sự yên tâm cho cả bệnh nhân và nhân viên y tế Hệ thống này mở ra
hướng tiếp cận mới trong việc quản lý thông tin y tế, đặc biệt quan trọng trong thờiđại số hóa ngày nay
1H
Trang 4MỤC LỤC
Thông tin hội đồng bảo vệ khóa luận i
Lời cảm on ii Tóm tat iii
Muc luc iv
Danh muc cac bang viii
Danh mục các hình vẽ và đồ thị ix Danh mục từ viết tắt x
Chuong 1 Tổng quan đề tai 1
11 Lýdochọnđểtài 1
1.2 Các nghiên cứu lên quan - 1
1.3 Mục tiêu, đối tượng và phạm vi nghiên cứu 4
1.3.1 Mục tiêunghiên cỨu 4
1.3.2 Đối tượng nghiêncứu - 4
143.3 Phạmvinghincứu 4
1.4 Cấu trúc Khoá luận tốt nghiệp - 4
Chương 2 Co sở lý thuyết 6 2.1 Internet of Things-lơlš ẶẶẶ 6 2.1.1 TéngquanvéloIs - 6
2.1.2 Ưu và nhược điểm của løT §
2.1.2.1 UuđiểmcủaldT 8
2.1.2.2 Nhược điểm củaldøT 9
2.2 Mohinh Vision Transformer - 10
2.2.1 Tổng quan về TransfOrmer - 10
2.2.2 Cau trúc mô hình Vision Transformer - 12
2.2.3 Các thách thức khi sử dụng mô hình ViT 14
1V
Trang 5MỤC LỤC
2.2.3.1 Quá trình pre-training đòi hỏi lượng lớn dữ liệu 14
2.2.3.2 Việc tính toán tốnkếmlớn 14
2.2.3.3 Không thể tạo các feature map ở nhiễu tỉ lệ khác nhau 15 23 Hocliénkét Ặ ee 15 2.3.1 Tổng quan về học lên kết - 15
2.3.2 Cách thức hoạt động của học liên kết 16
2.3.3 Chiến lược của học lién két 17
2.3.3.1 Học liên kết tập trung (Centralized federated learning) 17 2.3.3.2 Học liên kết phân tán (Decentralized federated learn- | 2 ee 18 2.3.3.3 Học liên kết không đồng nhất (Heterogeneous feder-ated learnng) Ặ 20 2.3.4 Thuật toán của học lên kết 22
2.3.4.1 Federated stochastic gradient descent (FedSGD) 22
2.3.4.2 Federated averaging (FedAvg) 23
2.3.4.3 Federated learning with dynamic regularization (Fed-Dym gpm fw ee 25 Chương 3 Phương pháp thực hiện 28 3.1 Kiếntrúchệthống 28
3.1.1 Kiến trúc tổng quát 28
3.1.1.1 Server(Máychủ): 29
3.1.1.2 Client (May khách) 30
3.2 Trién khai mô hình Vision Transformer - 31
3.3 Triển khai ứng dụng đầu cuối - 32
3.3.1 Giao diện ứng dụng đầu cuối 33
3.3.1.1 Giao diện đăng nhập va đăng ký tài khoản cho nhân Vinyté ".- ad a a 33
3.3.1.2 Giaodiénchinh 33
3.3.1.3 Giao diện khi sử dụng hệ thống nhận diện 34
Trang 6MỤC LỤC
3.3.1.4 Giao diện để nhập thông tin bệnh nhân mới và truy
xuất thông tin bệnh nhân cũ 35
3.3.2 Giai đoạn lấy dữ liệu bệnh nhân khi là bệnh nhânmới 36
3.3.3 Giai đoạn thực hiện nhận diện bệnh nhân và đưa ra đơn thuốc (fƯƠnEỨng Q Q Q LH HQ vo 37 3.4 Triển khai học liên kết (Federated Learning) 38
3.4.1 Bộ dữ lệu cụcbộ 38
3.4.2 Nguyên lý hoạt động của quá trình Federated Learning 40
3.4.3 Federated Client (Máy khách Liên Kết) 42
3.4.4 Federated Server (Máy chủ Liên KếtU) 43
3.4.4.1 Phan Federated Learning Server 43
3.4.4.2 Phan APIServer 44
Chương 4 Thực nghiệm, đánh giá va thảo luận 46 4.1 Fine-tuning mô hình Vision Transformer 46
4.1.1 Thucnghiém ẶẶSẶẶẶ S 46 4.1.2 Daly ciI ẤP NIB / 47
4.2 Hiệu suất ứng dụng đầu cuối 51
4.2.1 Thucnghiém 0.000000 eee eee 51 4.2.1.1 Bộ dữ liệu thuốc sửdụng 51
4.2.1.2 Giao diện thé hiện các loại thuốc cho các bénh 53
4.2.2 Danhgia Ặ HQ ee ee 54 4.3 Quá trình FederatedLearnng 56
43.1 Thucnghiém Ặ.ẶẶ eee 56 4.3.1.1 Federated Client (Máy khách Liên Kết) 56
4.3.1.2 Federated Server (Máy chủ Lién Két) 56
4.3.2 Danhgia ee ko 57
Chương 5 Kết luận và hướng phat triển 59
5.1 Kétluan ae aaaAIA {a( ee 59
52 Hạnchế Ặ Q Q Q Q Q Q Q Q Q n va 59
5.3 Hướng phát triển ẶẶ 59
VI
Trang 7MỤC LỤC
Tài liệu tham khảo
vil
64
Trang 81.2
3.1
4.1
4.2
4.3
4.4
4.5
4.6
DANH MỤC CÁC BANG
Hiệu suất của ViT, BiT và ResNet50V2 trên tập dif liệu ImageNet-1k
TT H«-‹x 2
So sánh các thuộc tính và hiệu suất của mô hình trên bộ dữ liệu Ima-geNet|[7] Ặ Q Q Q Q HQ ee 3 Bộ dữ liệu cục bộ của Clent 39
Bộ dữ liệu thuốc điều trị bệnh Rungnhĩ 52
Bộ dữ liệu thuốc điều trị bệnh Suy tim phân suất tống m4u 52
Bộ dữ liệu thuốc điều trị bệnh Tăng huyết áp 53
Các nghiên cứu đã đánh giá thực tiễn kê đơn và cấp phát thuốc tại nhiều quốc gia, dựa trên các chỉ số của WHO/INRUD [24, 25, 26] 55
Thông số khi huấn luyện của Client và Server trong Federated Learning 57 Thông số sau huấn luyện của từng Round trong Federated Learning 57
VII
Trang 92.2
2.3
2.4
2.5
2.6
2.7
2.8
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.6
3.9
4.1
4.2
4.3
4.4
4.5
4.6
4.7
DANH MUC CAC HINH VE VA DO THI
IơT trong kỷ nguyên số [I0] - 7
Thanh phan chính trong hệ thống IøT[lI] - 7
Cấu trúc của mang Transformer[l2] - 12
Cấu trúc của mô hình Vision Transformer [13] 13
Cơ chế của học liên kết [l4] - 16
Quá trình của Centralized federated learning [15] 18
Quá trình của Decentralized federated learning [16] 20
Quá trình của Heterogeneous federated learning [17] 21
Kiến trúc hệ thống hoạtđộng - 28
Giao diện đăng nhập và đăng ký 33
Giao diện tổng quan cảu hệ thống - 34
Giao diện trước khi nhận diện bệnh nhân 34
Giao diện sau khi nhận diện bệnh nhân 35
Giao diện truy xuất và lấy thông tin bệnh nhân 36
Flowchart lấy dữ liệu bệnh nhân - 36
Flowchart nhận diện bệnh nhân và đưa ra đơn thuốc 37
Flowchart quá trình Federated Learning 41
Biểu đồ thể hiện giá trị hàm mat mát của tập huấn luyện qua thời gian 48 Biểu đồ thể hiện giá trị hàm mat mát của tập kiểm tra qua thời gian 49 Biểu đồ thể hiện giá trị độ chính xác của tập kiểm tra qua thời gian 49 Biểu đồ thể hiện giá trị Precsion của tập kiểm tra qua thời gian 50
Biểu đồ thể hiện giá trị Recall của tập kiểm tra qua thời gian 50
Biểu đồ thể hiện giá trị F1-score của tập kiểm tra qua thời gian 51
Giao diện thông tin các loại thuốc cho các bệnh 54
1X
Trang 10DANH MỤC TU VIET TAT
AI Artificial Intelligence
CNN Convolutional Neural Network
FedAvg Federated averaging
FedDyn Federated learning with dynamic regularization
FedSGD _ Federated stochastic gradient descent
FL Federated Learning
INRUD International Network of Rational Use of Drugs loT Internet of Things
LEW Labeled Faces in the Wild
STPSTM Suy tim phân suất tống máu
THA Tăng huyết áp
VỊT Vision Transformer
WHO World Health Organization
Trang 11Chương 1 TỔNG QUAN ĐỀ TÀI
1.1 Lý do chọn dé tài
Trong nhiều cơ sở y tế, việc cung cấp thuốc thủ công vẫn được thực hiện bởi cácnhân viên y tế như y tá, điều dưỡng hoặc bác sĩ Quá trình này có thể tốn nhiều thời
gian và có nguy cơ cao gây ra sai sót khi họ bận rộn hoặc mệt mỏi Thực tế, với
nguồn [1] theo số liệu từ Cục quản lý Thực phẩm và Dược phẩm Hoa Ky (FDA),
họ nhận được hơn 100.000 báo cáo mỗi năm liên quan đến "sai sót trong sử dụngthuốc" tính tới năm 2019 Theo WHO, sai sót trong sử dụng thuốc gây ra ít nhất một
ca tử vong mỗi ngày tại Mỹ vào năm 2017 Ở Việt Nam, theo bài báo [2] được đăng
trên tạp chí y học Việt Nam thì tỷ lệ sai sót trong sử dụng thuốc là 4,07%, với y tá là người thường xuyên gây ra sai sót nhất (72,22%).
Do đó, áp dụng trí tuệ nhân tạo vào y tế là xu hướng không thể thiếu, điều nàycho phép hỗ trợ phân phát thuốc nhanh chóng và chính xác Tuy nhiên xây dựng hệthống này đối mặt với thách thức về bảo mật thông tin cá nhân và đa dạng hóa dữ
liệu huấn luyện.
Trong khóa luận tốt nghiệp này, tôi đưa ra một giải pháp cho các van dé đã nêu
bằng cách xây dựng một hệ thông hỗ trợ phân phối thuốc tại bệnh viện, dựa trên việc
áp dụng ViT để xác định thông tin của bệnh nhân qua khuôn mặt và quan lý dit liệu
về thuốc và bệnh tình được lưu giữ trên các dịch vụ đám mây, cùng với việc sử dụng
FL để đảm bảo an toàn cho thông tin cá nhân của bệnh nhân.
1.2 Các nghiên cứu liên quan
Bài báo [3] khảo sát các giải pháp bảo mật va bảo vệ quyền riêng tư dữ liệu trong
IoMT, nhấn mạnh vai trò tiềm năng của Federated Learning (FL) Bài viết giới thiệu
các kiến trúc FL tiên tiến như học liên kết ngang hàng và học liên kết tập trung,cùng với các phương pháp bảo vệ dữ liệu như mã hóa và chia sẻ thông tin tối thiểu
Ngoài ra, bài báo cũng thảo luận các thách thức nghiên cứu mở như xử lý dữ liệu
không đồng nhất, tối ưu hóa hiệu suất mạng và đảm bảo tính bảo mật khi triển khai
FL trong các ứng dụng IoMT.
Bài báo [4] đề xuất một phương pháp mới kết hợp Federated Learning (FL) va
Trang 12CHƯƠNG 1 TỔNG QUAN DE TÀI
mã hóa hình ảnh để thực hiện phân loại hình ảnh với sự bảo vệ quyền riêng tư Sử
dụng mô hình Vision Transformer (ViT), bài viết mô tả cách mã hóa hình ảnh giúp bảo vệ dữ liệu người dùng trong khi vẫn duy trì hiệu suất phân loại cao Kết quả thực nghiệm cho thấy phương pháp này không chỉ bảo vệ quyền riêng tư mà còn giữ
nguyên độ chính xác của mô hình, phù hợp cho các ứng dụng yêu cầu bảo mật cao
Bài báo [5] giới thiệu một phương pháp Federated Learning (FL) để phát hiện
bệnh tiểu đường gây tổn thương võng mạc (DR) sử dụng kiến trúc Vision
Trans-former (ViT) Bài viết mô tả chi tiết cách FL cho phép các thiết bị y tế học hỏi từ dữ
liệu phân tán mà không cần chia sẻ trực tiếp thông tin nhạy cảm Mô hình ViT được
triển khai trong FL đã cải thiện độ chính xác phát hiện DR lên đến 3% so với các
phương pháp truyền thống, chứng minh tính hiệu quả và tiềm năng ứng dụng rộngrãi của kỹ thuật này trong lĩnh vực y tế
Với việc sử dụng mô hình Vision Transformer cho giải pháp đề xuất thì nghiêncứu [6] đã so sánh hiệu suất và độ bền vững của ViT với các mô hình ConvolutionalNeural Network (CNN) Nghiên cứu cho thay rằng ViT không chỉ đạt hiệu suất tương
đương hoặc cao hơn mà còn có khả năng chồng lại các tân công và biến đổi dữ liệu
tốt hơn so với các mô hình CNN Bảng so sánh 1.1 thể hiện rõ điều này
Model Parameters (Million) | FLOPS (Million) | Top-1 Acc (%) ResNet50V2 25.61 4144.85 76.0
Bang 1.1 Hiệu suất của ViT, BiT va ResNet50V2 trên tập dữ liệu ImageNet-1k [6]
Ngoài ra, Bảng 1.2 cung cấp một bản tóm tắt toàn diện về các đặc điểm và chỉ sốhiệu suất của các mô hình khác nhau trên bộ dữ liệu ImageNet Nhìn chung, VisionTransformer (ViT) cho thấy độ chính xác top-1 tương đương hoặc vượt trội so vớicác mô hình CNN, mặc dù thường có thông lượng thấp hơn Những so sánh này ủng
Trang 13CHƯƠNG 1 TỔNG QUAN DE TÀI
hộ quan điểm rằng Vision Transformer có thể là một bộ học mạnh mẽ, mang lại độchính xác cạnh tranh mặc dù có yêu cầu tính toán cao hơn.
Model Params | FLOPs | Throughput | Top-1
(M) (B) (image/s) (%)
CNN
ResNet-50 25.6 4.1 1226 79.1
ResNet-101 44.7 7.9 753 79.9 ResNet-152 60.2 11.5 526 80.8
EfficientNet-BO 5.3 0.39 2694 771 EfficientNet-B 1 7.8 0.70 1662 79.1
EfficientNet-B2 9.2 1.0 1255 80.1 EfficientNet-B3 12 1.8 732 81.6
EfficientNet-B4 19 4.2 349 82.9
Pure Transformer
DeiT-Ti 5 1.3 2536 72.2 DeiT-S 22 4.6 940 79.8
DeiT-B 86 17.6 292 81.8
T2T-ViT-14 21.5 5.2 764 81.5
T2T-ViT-19 39.2 8.9 464 81.9 T2T-ViT-24 64.1 14.1 312 82.3
CPVT-B 88 17.6 285 82.3 Swin-T 29 4.5 755 81.3
Swin-S 50 8.7 437 83.0
Swin-B 88 15.4 278 83.3
Bang 1.2 So sánh các thuộc tính va hiệu suất của mô hình trên bộ dif liệu ImageNet
[7]
Một khảo sát toàn diện về học liên kết (federated learning) đã nhấn mạnh những
lợi ích về bảo mật thông tin cá nhân, lưu ý rằng phương pháp này giữ đữ liệu tại chỗ,
từ đó bảo vệ thông tin cá nhân khỏi các truy cập trái phép và nguy cơ rò ri đữ liệu.
Đặc biệt, học liên kết rất hữu ích trong các lĩnh vực nhạy cảm như chăm sóc sức khỏe và tài chính, nơi mà quyển riêng tư của dữ liệu là yếu t6 quan trọng hàng đầu
[8].
Nghiên cứu [9] cũng cho thấy học liên kết không chi bảo vệ quyển riêng tu mà
Trang 14CHƯƠNG 1 TONG QUAN DE TÀI
còn nang cao hiệu quả hoc tap trong môi trường phân tan Ví dụ, các nghiên cứu da
chứng minh tính khả thi của việc triển khai học liên kết trong các mạng biên di động
và thiết bị IoT, qua đó thể hiện tính linh hoạt và độ bền của phương pháp này trong nhiều ứng dụng khác nhau.
1.3 Mục tiêu, đối tượng và phạm vi nghiên cứu
1.3.1 Mục tiêu nghiên cứu
Mục tiêu của nghiên cứu này là xây dựng và phát triển một hệ thống phân phát thuốc
chính xác và bảo mật trong môi trường bệnh viện Mục tiêu cụ thể của nghiên cứu
bao gồm:
1 Thiết kế kiến trúc hệ thống tổng quát.
2 Huan luyện mô hình ViT cho nhận diện khuôn mặt bệnh nhân
3 Triển khai dịch vụ cloud để quản lý thông tin thuốc và bệnh lý của bệnh nhân
4 Ấp dung FL để cập nhật mô hình ViT trên các thiết bị đầu cuối
5 Đánh giá hiệu năng của hệ thống và đề xuất cải tiến
1.3.2 Đối tượng nghiên cứu
Đối tượng nghiên cứu là hệ thống quản lý thông tin bệnh nhân và thuốc, nhận diệnkhuôn mặt bệnh nhân, ViT, FL, giao diện tương tác đầu cuối
1.3.3 Pham vi nghiên cứu
Phạm vi nghiên cứu sẽ tập trung vào việc đánh giá sự hiệu quả của hệ thống phân
phát thuốc và ứng dụng trong việc dự đoán và quản lý bệnh nhân cũng như thông tin
bệnh án, đảm bảo tinh bao mật và toàn vẹn của dữ liệu bệnh nhân.
1.4 Cấu trúc Khoá luận tốt nghiệp
Khóa luận với đề tài “PHÁT TRIEN HE THONG QUAN LY CAP PHÁT THUỐC
CHO BỆNH NHÂN DỰA TRÊN CÁC MÔ HÌNH VISION TRANSFORMER VÀ
4
Trang 15CHƯƠNG 1 TỔNG QUAN DE TÀI
FEDERATED LEARNING?” được trình bày bao gồm 5 chương Nội dung tóm tắt
từng chương được trình bày như sau:
* Chương 1: TONG QUAN DE TÀI
Tóm tắt về chủ đề nghiên cứu của dé tài luận văn mà nhóm thực hiện
* Chương 2: CƠ SỞ LÝ THUYET
Cung cấp cơ sở lý thuyết, định nghĩa các thuật ngữ và kiến thức có liên quan
trong phạm vi nghiên cứu.
* Chương 3: PHƯƠNG PHAP THUC HIỆN
Đề xuất mô hình hệ thống triển khai và giải thích phương pháp thực hiện
* Chương 4: THUC NGHIEM VA ĐÁNH GIÁ
Thực hiện các phương pháp đã được đề xuất, mô tả kết quả thu được và đưa ra
đánh giá dựa trên công việc đã thực hiện.
* Chương 5: KẾT LUẬN VA PHÁT TRIỂN
Đánh giá kết quả thực hiện và dé xuất hướng phát triển cho các nghiên cứu
trong tương lai.
Trang 16Chương 2 CƠ SỞ LÝ THUYET
2.1 Internet of Things - IoTs
2.1.1 Tổng quan về IoTs
Trong kỷ nguyên số, Internet đã không chỉ là công cụ mà còn là một phần thiết yếu
trong đời sống hàng ngày Điều này đã dẫn đến sự ra đời của Internet of Things
(IoT), nơi mà không chỉ con người, mà cả máy móc và các đối tượng khác cũng có
thể giao tiếp với nhau IoT tạo thành một hệ thống các thiết bi vật lý được trang bị
cảm biến thông minh, có khả năng tương tác với môi trường xung quanh và cung
cấp dữ liệu liên tục cho người dùng Các thiết bị IoT có thé thu thập dữ liệu từ môi
trường, xử lý dữ liệu này và sau đó sử dụng nó để thực hiện các hành động cụ thể hoặc gửi nó đến các thiết bị khác Như vậy, IơT đã mở ra một thé giới mới của khả năng kết nối và tương tác, tạo ra nhiều cơ hội mới cho cải tiến và đổi mới trong nhiều lĩnh vực khác nhau của cuộc sống và công việc.
Hình 2.1 cho thấy ứng dụng của IoT trong các ngành nghề dang mở ra những cơhội mới và tao ra những thay đổi đáng kể IoT giúp cải thiện hiệu suất, tăng cường
quy trình làm việc và tạo ra những trải nghiệm mới cho người dùng Công nghệ
này đã mang lại sự thay đổi tích cực cho nhiều ngành công nghiệp, bao gồm việc cá
nhân hóa các ngôi nhà thông minh để phù hợp với nguyện vọng của người dùng, cho
phép theo déi sức khỏe của bệnh nhân một cách từ xa thông qua thiết bị y tế, hay cảithiện hiệu quả trong nông nghiệp nhờ vào việc sử dụng cảm biến độ ẩm đất, cũngnhư trong lĩnh vực vận tải nhờ vào các phương tiện được kết nối mạng
Trang 17CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Hình 2.1 IoT trong kỷ nguyên số [10]
Internet of Things (IoTs) được hình thành từ bốn thành phan quan trọng, đó làcốt lõi của hoạt động của hầu hết các hệ thống IoT
Perception Layer
Transport Layer
Application Layer 5 a
Smart Health Smart Home
Hinh 2.2 Thanh phan chinh trong hé théng IoT [11]
* Cam biến/Thiết bị:
La những cơ quan quan trong của hệ thống IoTs, các cảm biến giúp thiết biphát hiện và thu thập dữ liệu từ môi trường xung quanh Chúng bao gồm cảmbiến nhiệt độ, cảm biến ánh sáng, cảm biến chuyển động và nhiều loại khác,
chuyển đổi thông tin vật lý thành dif liệu điện tử.
- Kết nỗi mạng:
Thành phan này đảm bảo việc truyền tai dữ liệu từ các cảm biên đên các nút
Trang 18CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
trung tâm hoặc máy chủ đám mây Các công nghệ kết nối như Wi-Fi, tooth, 3G/4G/5G, và LoRaWAN hỗ trợ kết nói thiết bị IoTs với Internet và với
Blue-nhau.
« Trung tâm xử lý dữ liệu:
Đây là nơi nhận, xử lý và lưu trữ dữ liệu từ các cảm biến Bao gồm máy chủ
đám mây và cơ sở dữ liệu lớn, trung tâm này phân tích, tổ chức và chuyển đổi
dữ liệu thành thông tin hữu ích.
- Ung dung và giao diện người dùng
Thành phần này tập trung vào việc cung cấp trải nghiệm cho người dùng Các
ứng dụng và giao diện người dùng cho phép tương tác với dif liệu và thiết bi
IoTs, cung cấp khả năng ra quyết định và điều khiển các thiết bị thông qua các
ứng dụng di động, trang web hoặc các giao diện người dùng khác.
2.1.2 Ưu và nhược điểm của IoT
2.1.2.1 Ưu điểm của IoT
IơT đã trải qua một số biến đổi lớn và tự nâng cấp minh theo thời gian Một số ưu
điểm chính của IoT là:
« Tăng cường hiệu qua và tự động hóa: IơT cho phép tự động hóa và tối ưu
hóa quy trình trong nhiều ngành công nghiệp khác nhau Các nhiệm vụ có thể
được phối hợp một cách hiệu quả bằng cách kết nối các thiết bị và hệ thống,
giảm thiểu sự can thiệp của con người và các lỗi tiềm ẩn Tự động hóa dựa trên IoT cải thiện hiệu suất và năng suất trong mọi thứ từ các ngôi nha thông
minh quản lý tiêu thụ năng lượng đến các nhà máy thông minh tối ưu hóa dây
chuyên sản xuat.
« Tăng cường thu thập va phân tích dữ liệu: Các thiết bị IoT tao ra lượng dữ
liệu khổng 16, có thể được sử dụng để thu thập thông tin quý giá về hành vi của
người dùng, sở thích và mẫu sử dụng Doanh nghiệp có thể sử dụng thông tin
này để đưa ra quyết định thông minh hơn, cung cấp trải nghiệm cá nhân hóa
Trang 19CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
và tôi ưu hóa hoạt động Hơn nữa, dữ liệu được tạo ra có thé dùng cho những
số liệu dự đoán, cho phép thực hiện bảo trì tối ưu và các chiến lược cắt giảmchi phí.
* Kết nối và tích hợp liền mạch: IơT khuyến khích kết nối liền mạch giữa các
thiết bị, cho phép chúng tồn tại hòa hợp Sự tích hợp này tạo ra một hệ sinh thái
thống nhất giúp đơn giản hóa nhiệm vụ của người dùng và cải thiện hiệu suất
hệ thống Tích hợp hợp nhất đang trở thành một điểm tập trung chính trongphát triển IơT, cho phép các thiết bị từ nhiều nhà sản xuất khác nhau giao tiếp
và đảm bảo một thế giới liên kết và bền vững trong tương lai
* Cho phép giám sát và kiểm soát từ xa: Các thiết bị IoT giúp người dùng
giám sát và kiểm soát từ xa nhiều khía cạnh của cuộc sống của họ, từ an ninh
nhà cửa đến chăm sóc sức khỏe Khả năng này nâng cao sự an toàn, tiện lợi vàkhả dụng, đặc biệt là đối với người già hoặc những người khuyết tật Ngoài ra,
các doanh nghiệp có thể giám sát tài sản và quy trình từ xa, giảm chi phí bảo
trì và thời gian bảo dưỡng.
* Lợi ích về môi trường: IơT có thể hỗ trợ các nỗ lực về bền vững bằng cách tối
ưu hóa việc sử dụng tài nguyên Hệ thống lưới thông minh có thể phân phối
năng lượng một cách hiệu quả hơn, giảm lãng phí và khí thải nhà kính Các kỹ
thuật canh tác chính xác được sử dụng trong nông nghiệp thông minh để tối ưu
hóa việc sử dụng nước và giảm lượng hóa chất đầu vào Những đổi mới này
đóng góp vào một tương lai xanh hơn.
2.1.2.2 Nhược điểm của IoT
¢ Lo ngại về quyền riêng tư và bảo mật: Nguy cơ về việc xâm phạm dữ liệu
và vi phạm quyên riêng tư tăng lên khi có nhiều thiết bị kết nối với nhau thuthập dữ liệu nhạy cảm Tin tặc có thể tận dụng nhược điểm trong các thiết bịIơT để truy cập thông tin cá nhân hoặc thậm chí kiểm soát cơ sở hạ tang quan
trọng Để giải quyết những lo ngại này, bảo vệ dữ liệu và các biện pháp bảo mật mạnh mẽ là rất quan trọng.
Trang 20CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
- Thách thức về tương thích và tiêu chuẩn hóa: Sự lan rộng nhanh chóng của
các thiết bị IoT đã dẫn đến sự thiếu tiêu chuẩn và các vấn đề tương thích Các
thiết bị từ các nhà sản xuất khác nhau có thể không giao tiếp hiệu quả với nhau, làm trở ngại cho trải nghiệm liền mach mà IoT hứa hẹn Các nỗ lực để tiêu
chuẩn hóa đang được triển khai, nhưng việc đạt được tính tương thích toàn cầu
vẫn là một thách thức lớn.
+ Sự đáng tin cậy và các sự cố kết nối: Để hoạt động đúng cách, các thiết bi
IơT phụ thuộc nhiều vào một kết nối Internet ổn định Các sự cố hoặc giánđoạn trong mạng có thể dẫn đến mất kết nối, làm cho các thiết bị tạm thời
không hoạt động Tính đáng tin cậy là rất quan trọng trong các ứng dụng quan
trọng như chăm sóc sức khỏe hoặc tự động hóa công nghiệp, làm cho các giải
pháp dự phòng cần thiết.
* Chi phí và Yêu cầu Về Cơ sở Ha tang: Việc triển khai các giải pháp IoT có
thể đắt đỏ, đặc biệt là đối với các doanh nghiệp nhỏ hoặc cá nhân Đối với một
số người, việc đầu tư ban đầu vào thiết bị, cơ sở hạ tầng và đào tạo nhân viên
có thể vượt quá những lợi ích ngay lập tức Hơn nữa, bảo trì liên tục và cập
nhật phần mềm là cần thiết để đảm bảo tính khả dụng dài hạn của các hệ thống
lof.
¢ Phụ thuộc quá mức và su thay đổi công việc: Việc sử dung rộng rai của tự
động hóa được điều khiển bởi IoT có thể dẫn đến việc thay đổi công việc, đặc
biệt là trong các ngành công nghiệp nơi các nhiệm vụ hàng ngày được tự động
đây thường được xử lý bởi các mô hình RNNs và CNNs So với các mô hình truyền
10
Trang 21CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
thống, Transformer có khả năng xử lý các phụ thuộc dài hạn và cho phép thực hiệnsong song hóa, đồng thời cải thiện đáng kể hiệu suất trong các ứng dụng xử lý ngôn
ngữ tự nhiên.
Module Attention của Transformer là trọng tâm của kiến trúc này, giúp mô hình
tính toán mối quan hệ giữa từng từ trong câu, cung cấp một hiển thị ngữ cảnh đầy
đủ hơn Bằng cách sử dụng các vector queries, keys và values, Transformer có thể
đo lường sự tương tác giữa các thành phần của câu một cách hiệu quả và toàn diện
Để nắm bắt vị trí của từng thành phần trong câu, Transformer áp dụng mã hóa vịtrí bằng cách sử dụng hàm embedding được học hoặc hàm sine đã định nghĩa trước
Điều này giúp mô hình hiểu được vai trò vị trí của từng thành phần trong ngữ liệuđầu vào, đóng vai trò quan trọng trong việc hiểu và biểu diễn ngữ nghĩa của câu
Kiến trúc của Transformer bao gồm hai thành phần chính là encoder và decoder,
mỗi thành phan có thể có nhiều lớp Encoder sử dụng multihead self-attention va
một mạng truyền thang theo vị trí (Position-wise Feedforward Network - PFFN),
trong khi decoder có thêm một lớp multihead cross-attention để kết nối thông tin từ encoder và chuỗi các tokens đầu vào Điều này giúp cho Transformer có thể thực
hiện các tác vụ dịch thuật, tổng hợp văn bản, hay sinh văn bản tự động một cách hiệu
quả và chính xác.
II
Trang 22CHƯƠNG 2 CƠ SỞ LÝ THUYET
Multi-Head Attention
Hình 2.3 Cấu trúc của mang Transformer [12]
2.2.2 Cấu trúc mô hình Vision Transformer
Khác biệt với các công trình sử dụng các mô-đun transformer hoặc attention kết hợp
với mô hình CNN để giải quyết các nhiệm vụ thị giác, VĩT là một kiến trúc máy hoàntoàn sử dụng Transformer thuần túy mà không sử dụng mạng tích chập, nó được déxuất như một phương pháp để làm Backbone cho việc xử lý hình ảnh Kiến trúc
mang tổng thể của ViT được trình bày trong Hình 2.4 Ý tưởng chính của việc áp
dụng Transformer vào dif liệu hình ảnh là cách chuyển đổi hình ảnh đầu vào thành
một chuỗi các token, điều này thường được yêu cầu bởi Transformer
12
Trang 23CHƯƠNG 2 CƠ SỞ LÝ THUYET
Vision Transformer (ViT) Transformer Encoder
phần sau đó được chuyển đổi thành một embedding sử dụng một lớp tuyến tính Các
embedding này được gộp lại để tạo thành một chuỗi các token, trong đó mỗi token
đại diện cho một phần nhỏ của hình ảnh đầu vào Một token có thể học thêm, tức làtoken phân loại, được thêm vào đầu chuỗi Nó được sử dụng bởi các lớp transformernhư một nơi để thu hút sự chú ý từ các vị trí khác nhằm tạo ra kết quả dự đoán Các
embedding vi trí được thêm vào chuỗi token N+1 này và sau đó được đưa vào bộ mã
hóa transformer.
Như được trình bày trong Hình 2.3 va 2.4, bộ mã hóa transformer trong ViT
tương tự như bộ mã hóa transformer gốc của Vaswani và cộng sự [12] Sự khác biệtduy nhất là trong ViT, việc chuẩn hóa lớp được thực hiện trước khi thực hiện multi-
head attention và MLP, trong khi transformer của Vaswani thực hiện chuẩn hóa sau các quá trình này Đầu ra của bộ mã hóa transformer là một chuỗi các token có cùng
kích thước với đầu vào, tức là N+1 token Tuy nhiên, chỉ có token đầu tiên, tức làtoken phân loại, được đưa vào đầu dự đoán, là perceptron đa tầng (MLP), để tạo ra
nhãn lớp dự đoán.
13
Trang 24CHƯƠNG 2 CƠ SỞ LÝ THUYET
2.2.3 Các thách thức khi sử dụng mô hình ViT
2.2.3.1 Quá trình pre-training đòi hỏi lượng lớn dữ liệu
Pre-training dường như là một yếu tố quan trọng trong một số mạng lưới dựa trên
transformer Tuy nhiên, như được trình bày trong công trình ViT gốc [13] và cáccông trình khác, so với CNN, ViT đòi hỏi một lượng dữ liệu hình ảnh lớn hơn nhiềucho quá trình pre-training để đạt được hiệu suất cạnh tranh
Như báo cáo trong [13], việc pre-training ViT trên ImageNet-21k (21,000 lớp
và 14 triệu hình ảnh) hoặc JFT-300M (18,000 lớp và 303 triệu hình ảnh độ phân
giải cao) có thể đạt được hiệu suất tương tự Trong khi đó, việc pre-training ViT
trên ImageNet-1k (1,000 lớp và 1.3 triệu hình ảnh) thì không đạt được hiệu suất nhưmong muốn Không những thế, việc pre-training ViT sử dụng các bộ dữ liệu lớn nàyđòi hỏi thời gian tính toán rất dài và lượng tài nguyên tính toán lớn
2.2.3.2 Việc tính toán tôn kém lớn
Ngoài việc cần pre-train trên các bộ dữ liệu rất lớn, độ phức tạp tính toán của ViT làmột van dé khác, do đầu vào là một hình ảnh chứa lượng thông tin lớn Việc tokenhóa dường như được thực hiện ở mức độ pixel để tận dụng tốt hơn cơ chế attentioncho hình ảnh đầu vào, tức là chuyển đổi mỗi pixel thành một token trong trường hợp
tốt nhất.
Tuy nhiên, độ phức tạp tính toán của mô-đun attention tăng theo hàm bậc hai với
kích thước hình ảnh, dẫn đến các vấn đề không thể giải quyết về độ phức tạp tính
toán và sử dụng bộ nhớ Công trình [13] cũng đã thử nghiệm với các hình ảnh độ
phân giải thông thường và chọn các patch không chồng chéo kích thước 16x16, giúp
giảm độ phức tạp của mô-đun attention theo tỉ lệ 16x16.
Van dé này càng trở nên trầm trọng hơn khi ViT được sử dụng như backbone cho các nhiệm vụ dự đoán dày đặc như phát hiện đối tượng hoặc phân đoạn ngữ nghĩa,
vì đầu vào hình ảnh độ phân giải cao là cần thiết để đạt được hiệu suất hàng đầu
14
Trang 25CHƯƠNG 2 CƠ SỞ LÝ THUYET
2.2.3.3 Không thể tạo các feature map ở nhiều tỉ lệ khác nhau
Do thiết kế, ViT chỉ sử dụng bộ mã hóa transformer gốc dé xử lý dữ liệu hình ảnh,
do đó chỉ có thể tạo ra các feature map đơn tỉ lệ Tuy nhiên, tầm quan trọng củacác feature map đa tỉ lệ đã được chứng minh trong nhiều phương pháp phát hiện đối
tượng và phân đoạn ngữ nghĩa.
Các nhiệm vụ này có thể liên quan đến các đối tượng ở các tỉ lệ khác nhau (nhỏ,
vừa, hoặc lớn) xuất hiện trong cùng một hình ảnh, do đó việc sử dụng feature map ởmột tỉ lệ duy nhất sẽ không thể đại diện cho tất cả các đối tượng một cách hiệu quả.Các đối tượng có thể không được phát hiện hiệu quả khi chỉ sử dụng feature map
đơn tỉ lệ.
2.3 Học liên kết
2.3.1 Tổng quan về học liên kết
Federated learning (học liên kết) là một phương pháp phân tán để đào tạo các mô
hình học máy, trong đó điểm nổi bật chính là không cần phải trao đổi dữ liệu từ thiết bị của khách hàng đến máy chủ toàn cầu Thay vì gửi dữ liệu gốc về máy chủ,
phương pháp này huấn luyện mô hình một cách cục bộ bang cách sử dụng dữ liệu có
sẵn trên các thiết bị biên, điều này giúp cải thiện khả năng bảo vệ dữ liệu và quyền
riêng tư của người dùng Cuối cùng, một mô hình tổng thể được hình thành bằng
cách tổng hợp các cập nhật cục bộ từ nhiều thiết bị khác nhau
15
Trang 26CHƯƠNG 2 CƠ SỞ LÝ THUYET
2.3.2 Cách thức hoạt động của học liên kết
Cloud Server My New Learning L2 = avg(deltat +delta2)
Step 2 : Updating local models and generating aa
new learnings using private data qr? =>
Trong quá trình thực hiện Federated learning, một mô hình cơ bản sẽ được lưu trữ
trên một máy chủ trung tâm Từ đây, một bản sao của mô hình này sẽ được gửi đến
các thiết bị khách hàng Các thiết bị này sẽ sử dụng dữ liệu cục bộ mà chúng tạo ra
để huấn luyện mô hình Qua thời gian, các mô hình trên từng thiết bị sẽ trở nên cánhân hóa hơn, từ đó mang lại trải nghiệm người dùng tốt hơn và phù hợp hơn vớinhu cầu cụ thể của mỗi người dùng
Ở giai đoạn tiếp theo, các bản cập nhật của mô hình được đào tạo cục bộ (thường
là các tham số mô hình) sẽ được chia sẻ lại với mô hình chính nằm trên máy chủtrung tâm Điều này được thực hiện bằng các kỹ thuật tổng hợp an toàn (secure
aggregation techniques) để đảm bao rằng không có dữ liệu cá nhân nào bị tiết lộ
trong quá trình chuyển giao Máy chủ trung tâm sau đó sẽ kết hợp và lấy trung bìnhnhiều yếu tố đầu vào khác nhau để tạo ra các bài học mới Vì dif liệu được thu thập
từ nhiều nguồn khác nhau, phạm vi của mô hình sẽ rộng hơn và có khả năng tổng quát hóa tốt hơn.
Sau khi mô hình trung tâm được cập nhật và đào tạo lại theo các tham số mới,
nó sẽ được chia sẻ lại với các thiết bị khách hàng trong lần lặp tiếp theo Quá trìnhnày được lặp đi lặp lại qua nhiều chu kỳ, mỗi lần như vậy mô hình sẽ thu thập một
lượng thông tin mới và tiếp tục cải thiện mà không gây ra bất kỳ nguy hại nào về
quyền riêng tư cho người dùng Điều này không chỉ giúp mô hình học máy trở nên
16
Trang 27CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
mạnh mẽ hơn mà còn bảo vệ dữ liệu cá nhân của người dùng khỏi bị lam dụng hoặc
bị xâm phạm.
Federated learning không chỉ là một giải pháp kỹ thuật mà còn là một bước tiễn
quan trọng trong việc cân bằng giữa việc cải thiện khả năng học máy và bảo vệquyền riêng tư cá nhân Bang cách cho phép các thiết bị biên tham gia vào quá trìnhhuấn luyện mà không cần phải chia sẻ dữ liệu thô, phương pháp này mở ra cơ hộicho nhiều ứng dụng học máy trong các lĩnh vực nhạy cảm với dữ liệu như y tế, tài
chính, và các dịch vụ cá nhân hóa Với sự phát triển không ngừng của công nghệ và
nhu cầu ngày càng tăng về quyền riêng tu, Federated learning hứa hen sẽ trở thành
một trụ cột quan trọng trong tương lai của học máy.
2.3.3 Chiến lược của học liên kết
2.3.3.1 Hoc liên kết tập trung (Centralized federated learning)
Học liên kết tập trung là một phương pháp đào tạo mô hình hoc máy yêu cầu một
máy chủ trung tâm để quản lý toàn bộ quá trình Máy chủ trung tâm này đóng vai trò
quan trọng trong việc lựa chọn các thiết bị khách hàng tham gia vào quá trình đàotạo và thu thập các bản cập nhật mô hình từ các thiết bị biên Trong hệ thống này,tất cả các tương tác chỉ xảy ra giữa máy chủ trung tâm và từng thiết bị biên riêng lẻ,không có sự giao tiếp trực tiếp giữa các thiết bị khách hàng
Trong quá trình học liên kết tập trung, máy chủ trung tâm đầu tiên sẽ chọn một
nhóm thiết bị khách hàng để tham gia vào quá trình huấn luyện Các thiết bị này sau
đó sẽ tải xuống mô hình hiện tại từ máy chủ và sử dụng dữ liệu cục bộ của mình đểthực hiện việc huấn luyện mô hình Sau khi hoàn thành giai đoạn này, các thiết bị
sẽ gửi các bản cập nhật mô hình, chẳng hạn như các tham số mới, trở lại máy chủ
trung tâm Máy chủ sẽ tong hợp và kết hợp các bản cập nhật này để cải thiện mô
hình chung.
Một trong những ưu điểm chính của phương pháp học liên kết tập trung là nó có
thể mang lại một mô hình chính xác và hiệu quả nhờ vào việc tổng hợp các thông tin
từ nhiều thiết bị biên Tuy nhiên, phương pháp này cũng tiềm ẩn những thách thức
không nhỏ Việc phụ thuộc vào một máy chủ trung tâm có thé dẫn đến các vấn dé
tắc nghẽn, đặc biệt là khi có nhiều thiết bị tham gia vào quá trình huấn luyện cùng
17
Trang 28CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
một lúc Điều này có thể gây ra sự chậm trễ và giảm hiệu suất của hệ thống
Ngoài ra, các sự cố mạng có thể gây gián đoạn trong quá trình truyền tải dữ liệu
giữa máy chủ và các thiết bị biên Nếu kết nối mạng không ổn định hoặc bị gián đoạn, quá trình huấn luyện có thể bị dừng lại hoặc không thể hoàn tất đúng hạn.
Điều này đặc biệt quan trọng trong các ứng dụng thời gian thực hoặc khi yêu cầutính khả dụng cao, nơi mà mỗi sự chậm trễ đều có thể ảnh hưởng lớn đến hiệu quả
và độ tin cậy của hệ thống
Một vấn đề khác của học liên kết tập trung là rủi ro về an ninh và bảo mật dữliệu Mặc dù dif liệu thô không được truyền từ các thiết bị biên đến máy chủ trung
tâm, nhưng các bản cập nhật mô hình có thể chứa thông tin nhạy cảm và có thể bị
khai thác nếu không được bảo vệ đúng cách Điều này đặt ra nhu cầu cấp thiết vềcác biện pháp bảo mật mạnh mẽ để bảo vệ thông tin trong suốt quá trình huấn luyện
Hình 2.6 Quá trình của Centralized federated learning [15]
2.3.3.2 Học liên kết phân tán (Decentralized federated learning)
Học liên kết phân tán là một phương pháp đào tạo mô hình học máy không yêu cầu
máy chủ trung tâm để điều phối quá trình học Thay vào đó, quá trình này được thựchiện bằng cách chia sẻ các bản cập nhật mẫu giữa các thiết bị biên được kết nối với
nhau trong một mạng phân tán Mỗi thiết bị biên sẽ đóng góp vào quá trình huấn
luyện mô hình bằng cách sử dụng dif liệu cục bộ của mình, và mô hình cuối cùng thu
được trên mỗi thiết bị biên là kết quả của việc tổng hợp các bản cập nhật từ nhiều
18
Trang 29CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
thiết bị khác nhau trong mạng
Quá trình học liên kết phân tán bắt đầu bằng việc mỗi thiết bị biên sử dụng dữ
liệu cục bộ của mình để huấn luyện mô hình ban đầu Sau khi hoàn thành giai đoạn này, các thiết bị sẽ chia sẻ các bản cập nhật mô hình của mình với các thiết bị khác
trong mạng Thông qua quá trình trao đối và tổng hợp các bản cập nhật này, mỗi
thiết bị sẽ dần dần cải thiện mô hình của mình Quá trình này được lặp đi lặp lại quanhiều vòng, và kết quả cuối cùng là một mô hình được huấn luyện đầy đủ trên cácthiết bị biên mà không cần đến sự can thiệp của máy chủ trung tâm
Một trong những ưu điểm nổi bật của phương pháp học liên kết phân tán là nóloại bỏ khả năng xảy ra lỗi một điểm (single point of failure), một van dé phổ biếntrong các hệ thống phụ thuộc vào máy chủ trung tâm Bằng cách phân phối quá trìnhhuấn luyện trên nhiều thiết bị biên, hệ thống trở nên linh hoạt hon và có khả năngchịu đựng cao hơn đối với các sự cô cá nhân của từng thiết bị Điều nay làm cho họcliên kết phân tán trở nên hấp dẫn đối với các ứng dụng yêu cầu độ tin cậy và tính khả
hình không đạt được độ chính xác mong muốn hoặc quá trình huấn luyện bị kéo dài.
Việc đảm bảo tính đồng bộ và nhất quán trong một mạng phân tán cũng là một thách
thức Khi các thiết bị hoạt động độc lập và chỉ trao đổi thông tin một cách không
đồng bộ, có thể xảy ra tình trạng mô hình không hội tụ hoặc hội tụ chậm Việc pháttriển các giao thức và thuật toán hiệu quả để điều phối quá trình huấn luyện trong
một môi trường phân tán là một lĩnh vực nghiên cứu quan trọng để cải thiện hiệu
suất của học liên kết phân tán
Bảo mật và quyền riêng tư cũng là những yếu t6 cần được xem xét Mặc dù dữ
liệu thô không được chia sẻ giữa các thiết bị, các bản cập nhật mô hình có thể chứa
thông tin nhạy cảm Do đó, các kỹ thuật bảo mật như mã hóa và tổng hợp an toàn
cần được áp dụng để bảo vệ thông tin trong quá trình trao đổi
19
Trang 30CHƯƠNG 2 CƠ SỞ LÝ THUYET
Roof
t7 có
Hình 2.7 Quá trình của Decentralized federated learning [16]
2.3.3.3 Học liên kết không đồng nhất (Heterogeneous federated learning)
Học liên kết không đồng nhất là một phương pháp đào tạo mô hình học máy đòi hỏi
sự hiện diện của nhiều loại thiết bị người dùng cuối khác nhau, chẳng hạn như điện
thoại di động, máy tính và các thiết bị IơT Các thiết bi này khác nhau về phần cứng,
phần mềm, sức mạnh tính toán và kiểu dữ liệu, tạo ra một môi trường huấn luyện
phức tạp và đa dạng.
Trong bối cảnh học liên kết không đồng nhất, mỗi thiết bị biên có khả năng và
đặc điểm riêng biệt, làm cho quá trình huấn luyện trở nên linh hoạt hơn và phù hợpvới điều kiện thực tế Khác với chiến lược học liên kết thông thường, vốn giả địnhrằng các thuộc tính của mô hình cục bộ trên mỗi thiết bị giống hệt với các thuộc tínhcủa mô hình chính, học liên kết không đồng nhất được phát triển để đáp ứng các tìnhhuống thực tế hơn, nơi mà sự đồng nhất này hiếm khi xảy ra
Quá trình học liên kết không đồng nhất bắt đầu bằng việc mỗi thiết bị sử dụng
dữ liệu cục bộ và khả năng tính toán của mình để huấn luyện mô hình cục bộ Mỗi
mô hình cục bộ này sẽ phản ánh đặc điểm và giới hạn riêng của từng thiết bị, từ đó tạo ra một tập hợp các mô hình cục bộ đa dạng Sau khi hoàn thành giai đoạn huấn
luyện ban đầu, các thiết bị sẽ chia sẻ các tham số mô hình hoặc các bản cập nhật
mô hình của mình với máy chủ trung tâm hoặc với nhau, tùy thuộc vào kiến trúc hệthống cụ thể
Máy chủ trung tâm (hoặc một hệ thống phân tán) sẽ kết hợp các bản cập nhật này
20
Trang 31CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
để tạo ra một mô hình toàn cầu duy nhất Mô hình toàn cầu này không chỉ tổng hợpthông tin từ các mô hình cục bộ mà còn phản ánh sự đa dạng và không đồng nhất
của các thiết bị biên Kết quả là một mô hình có khả năng tổng quát hóa tốt hơn và
có thể áp dụng được trên nhiều loại thiết bị và môi trường khác nhau.
Một trong những thách thức lớn của học liên kết không đồng nhất là việc quản
lý và tổng hợp các mô hình cục bộ không đồng nhất Do sự khác biệt về phần cứng,phần mềm và dữ liệu, việc kết hợp các bản cập nhật mô hình có thể gặp khó khăn vàđòi hỏi các kỹ thuật phức tạp để đảm bảo tính nhất quán và hiệu quả Các thuật toántổng hợp phải được thiết kế sao cho có thể xử lý sự không đồng nhất này mà vẫn giữđược độ chính xác và hiệu suất của mô hình toàn cầu Mặc dù dữ liệu thô khôngđược chia sẻ giữa các thiết bị, các bản cập nhật mô hình vẫn có thể chứa thông tinnhạy cảm Các kỹ thuật bảo mật như mã hóa và tổng hợp an toàn cần được áp dụng
để bảo vệ thông tin trong quá trình trao đổi và tổng hợp.
Học liên kết không đồng nhất mang lại nhiều lợi ích đáng kể trong việc đào tạo
mô hình học máy, đặc biệt là trong các môi trường đa dạng và phức tạp Phương
pháp này không chỉ tăng cường khả năng học máy mà còn giúp tạo ra các mô hình
có thể hoạt động hiệu quả trên nhiều loại thiết bị khác nhau Tuy nhiên, để tận dụng
tối đa tiềm năng của học liên kết không đồng nhất, cần có sự phát triển và cải tiếnliên tục về các thuật toán và kỹ thuật tổng hợp, cũng như các biện pháp bảo mật và
quản lý dữ liệu.
Hình 2.8 Quá trình của Heterogeneous federated learning [17]
21
Trang 32CHƯƠNG 2 CƠ SỞ LÝ THUYET
2.3.4 Thuật toán của học liên kết
2.3.4.1 Federated stochastic gradient descent (FedSGD)
SGD (Stochastic Gradient Descent) truyền thống là một phương pháp tối ưu hóa
trong học máy, tính toán gradient bằng cách sử dụng các lô nhỏ (mini-batches), là
một phần của các mẫu dữ liệu được lấy từ tổng số mẫu Quá trình này giúp giảmchi phí tính toán và cải thiện hiệu quả huấn luyện mô hình Trong học liên kết
(Federated Learning), cách tiếp cận này có thể được mở rộng bằng cách xem các lô
nhỏ này dưới dạng các thiết bị khách hàng khác nhau, mỗi thiết bị bao gồm dữ liệu
cục bộ của riêng nó.
Trong FedSGD (Federated Stochastic Gradient Descent), mô hình trung tâm
được phân phối đến các thiết bị khách hàng, và mỗi khách hàng sử dụng dữ liệucục bộ của mình để tính toán gradient Các gradient này sau đó được chuyển đếnmột máy chủ trung tâm, nơi chúng được tổng hợp dựa trên số lượng mẫu có sẵn cho
mỗi khách hàng Máy chủ trung tâm sau đó sử dụng các gradient tổng hợp này để
thực hiện các bước gradient descent, từ đó cập nhật mô hình trung tâm.
Quá trình FedSGD bắt đầu bằng việc máy chủ trung tâm gửi mô hình hiện tạiđến một tập hợp các thiết bị khách hàng Mỗi thiết bị khách hàng sau đó sẽ sử dụng
dữ liệu cục bộ của mình để tính toán gradient, tương tự như cách các lô nhỏ được sử dụng trong SGD truyền thống Sau khi tính toán xong, các gradient này được gửi trở lại máy chủ trung tâm Máy chủ trung tâm sẽ kết hợp các gradient từ tất cả các thiết
bị khách hàng, tạo ra một gradient tổng hợp, và sử dụng gradient này để cập nhật
mô hình trung tâm Thuật toán được biểu diễn qua công thức trong bài báo [18].
Trang 33CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
« K: Số lượng client tham gia.
Phương pháp FedSGD mang đến nhiều ưu điểm đáng kể Trước hết, nó cho phépkhai thác dữ liệu từ nhiều nguồn phân tán mà không cần tập trung hóa, góp phần
bảo vệ quyền riêng tư và an toàn thông tin của người dùng Hơn nữa, bằng cách tận
dụng sức mạnh tính toán của các thiết bị cục bộ, phương pháp này giúp giảm tải chomáy chủ trung tâm và nâng cao hiệu suất quá trình huấn luyện
Tuy nhiên, FedSGD cũng đối mặt với một số thách thức đáng kể Việc tổng hợp
gradient từ các thiết bị khách hàng có thể gặp khó khăn do sự không đồng nhất về
dữ liệu và năng lực xử lý Sự khác biệt về cấu hình phần cứng, phần mềm và điềukiện mạng có thể ảnh hưởng đến tốc độ và độ chính xác của quá trình huấn luyện.Thêm vào đó, việc truyền tải gradient từ thiết bị khách hàng đến máy chủ trung tâm
có thể tiêu tốn nhiều băng thông và gặp van đề về độ trễ.
Để khắc phục thì các kỹ thuật tối ưu hóa và các thuật toán hiệu quả cần được
phát triển Các kỹ thuật như việc chọn lựa thiết bị khách hàng một cách thông minh,
cân nhắc độ không đồng nhất của dữ liệu, và sử dụng các phương pháp bảo mật như
mã hóa và tổng hợp an toàn có thể giúp cải thiện hiệu quả của FedSGD.
Ngoài ra, việc đảm bảo tính ổn định và khả năng mở rộng của hệ thống cũng làmột yếu tổ quan trong Các thuật toán phải có khả năng thích ứng với sự thay đổi va
sự không đồng nhất của các thiết bị khách hàng, đồng thời đảm bảo rằng quá trìnhhuấn luyện có thể tiếp tục một cách mượt mà ngay cả khi có sự cô mạng hoặc cácthiết bị bị ngắt kết nối
2.3.4.2 Federated averaging (FedAvg)
FedAvg (Federated Averaging) là một phần mở rộng của thuật toán FedSGD
(Feder-ated Stochastic Gradient Descent) trong học liên kết (Feder(Feder-ated Learning) Khác với
FedSGD, nơi các khách hàng thực hiện các cập nhật gradient cục bộ và gửi gradient
về máy chủ trung tâm, trong FedAvg, các khách hàng có thể thực hiện nhiều cậpnhật giảm gradient cục bộ trước khi chia sẻ kết quả với máy chủ trung tâm Thay
23
Trang 34CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
vì chia sẻ gradient, các khách hàng chia sẻ các trọng số đã được điều chỉnh của môhình cục bộ Máy chủ trung tâm sau đó tổng hợp các trọng số này (các tham số mô
hình) từ các thiết bị khách hàng để cập nhật mô hình toàn cầu.
FedAvg bat đầu bằng cách phân phối mô hình hiện tại từ máy chủ trung tâm đếncác thiết bị khách hàng Mỗi thiết bị khách hàng sau đó sử dụng dữ liệu cục bộ củamình để thực hiện nhiều bước cập nhật gradient cục bộ, điều chỉnh các trọng số của
mô hình Sau khi hoàn thành các cập nhật này, các thiết bị không gửi gradient màgửi trực tiếp các trọng số đã được điều chỉnh của mô hình cục bộ về máy chủ trung
tâm Máy chủ trung tâm sẽ kết hợp các trọng số này bằng cách tính trung bình có
trọng số, dựa trên số lượng mẫu dif liệu cục bộ của mỗi thiết bị, để tạo ra một mô
hình toàn cầu mới và cải tiến Thuật toán được biểu diễn qua công thức trong bài
* nz: Số lượng mau dữ liệu tai nút k
© n= Soh, np: Tổng số mẫu dữ liệu từ tất cả các nút.
FedAvg là một sự tổng quát hóa của FedSGD Nếu tat cả các máy khách đều bắt
đầu với cùng một lần khởi tạo, thì việc tính trung bình các gradient sẽ tương đươngvới việc tính trung bình theo trọng số Tuy nhiên, FedAvg cho phép các thiết bị thựchiện nhiều bước cập nhật cục bộ, điều này làm cho quá trình huấn luyện trở nên linhhoạt và hiệu quả hơn Bằng cách thực hiện nhiều cập nhật cục bộ trước khi gửi cáctrọng số về máy chủ trung tâm, FedAvg giúp giảm tải lượng truyền tải dữ liệu và
tăng tốc độ hội tụ của mô hình.
Mội trong những ưu điểm chính của FedAvg là khả năng tận dụng sức mạnh tính
toán phân tán của các thiết bị khách hàng, cho phép thực hiện nhiều bước cập nhậtcục bộ mà không cần phải liên tục giao tiếp với máy chủ trung tâm Điều này giúpgiảm tải băng thông mạng và cải thiện hiệu suất của quá trình huấn luyện Đồng thời,
24
Trang 35CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
FedAvg cũng tăng cường tính bảo mật và quyền riêng tư của dữ liệu người dùng, vi
dữ liệu thô không bao giờ rời khỏi thiết bị cục bộ.
Tuy nhiên, FedAvg cũng gặp phải ciệc các thiết bị thực hiện nhiều bước cập nhật cục bộ có thể dẫn đến sự không đồng bộ trong quá trình huấn luyện, đặc biệt khi các
thiết bị có khả năng tính toán và kết nối mạng khác nhau Điều này có thể gây ra sựkhông đồng nhất trong các trọng số được chia sẻ và làm cho quá trình hội tụ trở nênkhó khăn hơn Ngoài ra, việc tổng hợp các trọng số cục bộ có thể phức tạp hơn do
sự khác biệt về dữ liệu và môi trường của từng thiết bị
Các kỹ thuật và thuật toán tối ưu hóa để quản lý sự không đồng bộ và khôngđồng nhất trong quá trình huấn luyện là cần thiết để cải thiện nhược điểm trên Cácphương pháp như cân nhắc trọng số theo số lượng mẫu dữ liệu cục bộ, sử dụng các
kỹ thuật bảo mật như mã hóa và tổng hợp an toàn, và phát triển các giao thức hiệu
quả để điều phối quá trình huấn luyện phân tán có thể giúp cải thiện hiệu quả và độ
tin cậy của FedAvg.
2.3.4.3 Federated learning with dynamic regularization (FedDyn)
Regularization trong các phương pháp hoc máy truyền thống nhằm mục đích cải
thiện tính tổng quát hóa của mô hình bằng cách thêm một hình phạt vào hàm mấtmát Điều này giúp ngăn chặn mô hình quá khớp với dữ liệu huấn luyện và cải thiện
khả năng dự đoán trên dữ liệu mới Trong học tập liên kết (Federated Learning), việc tính toán độ mat mát toàn cầu đòi hỏi phải dựa trên độ mất mát cục bộ do các thiết bị khác nhau tạo ra, tạo ra những thách thức đặc biệt do sự đa dạng của dữ liệu
và điều kiện tính toán trên các thiết bị này
Với tính đa dạng của các khách hàng, việc giảm độ mắt mát toàn cầu không thể
đơn giản bằng cách giảm độ mất mát cục bộ trên từng thiết bị riêng lẻ Sự khác biệt
về dữ liệu, khả năng tính toán và chi phí truyền thông giữa các thiết bị làm cho quá
trình này trở nên phức tạp hơn Do đó, FedDyn (Federated Dynamic Regularization)
được phát triển nhằm mục đích tạo ra regularization cho độ mat mát cục bộ bangcách điều chỉnh số liệu thống kê dữ liệu như khối lượng dữ liệu và chi phí truyền
thông, đảm bảo rằng mô hình toàn cầu được huấn luyện hiệu quả và công bằng
FedDyn bắt đầu bằng việc máy chủ trung tâm gửi mô hình hiện tại đến các thiết
25
Trang 36CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
bị khách hàng Mỗi thiết bị sau đó sẽ sử dụng dữ liệu cục bộ của mình để tính toán
độ mất mát và thực hiện các cập nhật mô hình Tuy nhiên, khác với các phương
pháp học liên kết truyền thống, FedDyn áp dụng một hình phạt regularization vào
độ mất mát cục bộ, điều chỉnh theo các yếu tố như khối lượng dữ liệu và chi phí
truyền thông của từng thiết bị Sau khi hoàn thành các cập nhật, các thiết bị sẽ gửitrọng số mô hình đã điều chỉnh về máy chủ trung tâm Thuật toán được biểu diễn
qua pseudocode trong bài báo [19].
Algorithm 1 Federated Dynamic Regularizer-(FedDyn)
May chủ trung tâm sẽ tổng hợp các trong số nay để tao ra mô hình toàn cầu mới.
Bằng cách điều chỉnh độ mat mát cục bộ với regularization động, FedDyn giúp cânbằng ảnh hưởng của các thiết bị khác nhau, giảm thiểu tác động của sự không đồng
nhất dữ liệu và cải thiện tính tổng quát hóa của mô hình toàn cầu.
FedDyn mang lại khả năng quản lý sự đa dạng của các thiết bị khách hàng một
cách hiệu quả Bằng cách điều chỉnh regularization dựa trên các thông số như khối
lượng dữ liệu và chi phí truyền thông, FedDyn giúp đảm bảo rằng các thiết bị với dữ
liệu ít hơn hoặc khả năng tính toán hạn chế không bị bỏ qua trong quá trình huấn
luyện Điều này tạo ra một mô hình công bằng và đại diện tốt hơn cho toàn bộ dữ
liệu phân tán.
Việc điều chỉnh regularization cho từng thiết bị yêu cầu tính toán phức tạp và quản lý nhiều thông số Đảm bảo rằng quá trình huấn luyện vẫn hiệu quả và không
26
Trang 37CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
tốn quá nhiều tài nguyên tính toán là một van dé quan trọng Ngoài ra, việc truyềntải các trọng số mô hình đã điều chỉnh có thể gặp khó khăn do băng thông mạng và
độ trễ.
Để giải quyết thách thức này, cần phát triển các thuật toán và kỹ thuật tối ưu hóa
hiệu quả Các phương pháp như chọn lựa thiết bị khách hàng một cách thông minh,
sử dụng các kỹ thuật nén dif liệu và tối ưu hóa quá trình truyền tải có thể giúp cảithiện hiệu suất của FedDyn Đồng thời, việc áp dụng các biện pháp bảo mật như mãhóa và tổng hợp an toàn cũng cần được xem xét để bảo vệ thông tin người dùng
27