Các biện pháp bảo mật như mã hóa dữ liệu, phân quyền truy cập, và kỹ thuật mã hóa được áp dụng để đảm bảo tính riêng tư và an toàn cho đữ liệu y tế trong quá trình truyền tải và xử lý..
Trang 1ĐẠI HỌC QUOC GIA THÀNH PHO HO CHÍ MINH
TRUONG DAI HOC CONG NGHE THONG TIN KHOA MẠNG MAY TÍNH VÀ TRUYEN THONG
NGUYEN KHANH DUY - 20521240
HUYNH PHU LỢI - 20521555
KHOÁ LUẬN TỐT NGHIỆP
TĂNG CƯỜNG BẢO MẬT VÀ TỰ ĐỘNG HÓA CHO HỆ
ENHANCING SECURITY AND AUTOMATING FOR SMART
EHEALTHCARE SYSTEM BASED ON IOT AND FEDERATED
LEARNING
CU NHÂN NGANH MẠNG MAY TÍNH VA TRUYEN THONG DU LIEU
GIANG VIEN HUGNG DAN
PGS.TS LE TRUNG QUAN
ThS NGUYEN KHANH THUAT
TP HO CHÍ MINH, 2024
Trang 2LỜI CẢM ƠN
Trong suốt quá trình học tập và làm khóa luận tốt nghiệp chúng em luôn được
sự quan tâm, hướng dẫn và giúp đỡ tận tình của các thay, cô trong Khoa Mang MáyTính Và Truyền Thông đặc biệt là sự động viên và giúp đỡ của bạn bè đồng nghiệp
Lời đầu tiên chúng em xin được bày tỏ lòng biết ơn sâu sắc đến Ban giám hiệu
Trường Đại Học Công Nghệ Thông Tin, và phòng thực hành E3.1 đã tận tình giúp
đỡ chúng em suốt thời gian thực hiện đồ án
Đặc biệt chúng em xin bày tỏ lòng biết ơn chan thành sâu sắc tới thầy PGS.TS Lê
Trung Quân, thầy ThS Nguyễn Khánh Thuật và các thầy ở Phòng thí nghiệm thực
hành mang máy tính và truyền thông E3.1 đã trực tiếp giúp đố, hướng dẫn chúng em hoàn thành khóa luận tốt nghiệp này.
Tuy nhiên trong quá trình thực hiện khóa luận tốt nghiệp, do kiến thức còn hạn
chế nên chúng em còn nhiều thiếu sót khi tìm hiểu, đánh giá về dé tài Rất mongnhận được sự quan tâm, góp ý của các thầy/ cô giảng viên để dé tài của chúng emđược đầy đủ và hoàn chỉnh hơn
Chúng em xin chân thành cảm ơn!
Nhóm tác giả
li
Trang 3TOM TAT
Trong thời đại số hóa ngày nay, hệ thống chăm sóc sức khỏe thông minh đã trởthành một xu hướng quan trọng, mang lại nhiều lợi ích đáng kể cho cả bệnh nhân
và nhà cung cấp dịch vụ y tế Kết hợp giữa Internet of Things (IoT) và Federated
Learning (FL), hai công nghệ tiên tiến, hứa hẹn mở ra một tương lai mới đầy tiềm
năng cho lĩnh vực chăm sóc sức khỏe.
Trong lĩnh vực y tế, thông tin bệnh nhân là dữ liệu nhạy cảm và cần được bảo vệmột cách nghiêm ngặt Hệ thống IoT thu thập dữ liệu từ các thiết bị y tế, như cảmbiến sức khỏe và thiết bị theo dõi, và truyền dữ liệu này đến các nút cục bộ cho việc
xử lý và huấn luyện mô hình FL Các biện pháp bảo mật như mã hóa dữ liệu, phân quyền truy cập, và kỹ thuật mã hóa được áp dụng để đảm bảo tính riêng tư và an toàn cho đữ liệu y tế trong quá trình truyền tải và xử lý.
Áp dụng tự động hóa vào quy trình giúp làm giảm thời gian và công sức của
nhân viên y tế, đồng thời tăng cường độ chính xác và hiệu suất Hệ thống có thể tựđộng phát hiện và báo cáo các biểu hiện bất thường trong sức khỏe của bệnh nhândựa trên dữ liệu được thu thập từ các thiết bị IoT FL giúp cập nhật mô hình học máy
trên dữ liệu phân tán từ nhiều nguồn khác nhau một cách tự động, đồng nhất và bảo
mật.
Việc tích hợp IơT va FL trong hệ thông chăm sóc sức khỏe thông minh không chi
mang lại lợi ích về tự động hóa và tăng cường hiệu suất mà còn đảm bảo tính riêng
tư và an toàn của dữ liệu y tế, góp phần nâng cao chất lượng phục vụ và quản lý sức
khỏe cho người dùng.
1H
Trang 4MỤC LỤC
Thông tin hội đồng bảo vệ khóa luận
Lời cảm ơn
Tóm tắt
Mục lục
Danh mục các bảng
Danh mục các hình vẽ va đồ thị
Danh mục từ viết tắt
Chương1 Mở dau
1.1
1.2
1.3
1.4
1.5
1.6
Các nghiên cứu liên quan
-Mục tiêu, đối tượng và phạm vi nghiên cứu
-1.3.1 Mục tiêunghiên cỨu
1.3.2 Đối tượng nghiêncứu
-143.3 Phạmvinghincứu
Phương pháp nghiên cứu
Các đóng góp chính của để
tài -Câu trúc Khoá luận tốt
nghiệp -Chương 2 Co sở lý thuyết 2.2 2.1.2 Cách Federated Learning hoạtđộng
213 Nhượcđiểểm Ặ Ặố Học sâu (Deep Learning)
-2.2.1 Cách thức hoạt động của học sâu
2.2.2 Ưu và nhược điểm của học sâu
1V
ii
iii
iv
Vili
ix
xi
NA YN DA Wun +> Ff
‘eo
Trang 52.3.7 Pre-Trained Models: 19
2.3.7.1 ResNet 0 eee ee ee 19 2.3.7.2 ANGSNcH5 x6 ^ NA www weet 19 2.3.7.3 ResNet5U: 0.0.2 00 0000 20 2.3.7.4 DenseNetl6ó9: 21
2.3.8 Ưu và nhược điểm của các Pre-Trained Models 22
2.3.8.1 ResNet 2 ee ee 22
2.3.8.2 ResNetI52 0.020000 2 0 22 2.3.8.3 ResNet5O 0.00002 eee ee 23
2.5.5 FedlrimmedAvg Ặ.Ặ ee eee 27
Chương 3 Phương pháp thực hiện 28
3.1 Thiết kế kiến trúc hệ thống tổng quan 28
Trang 6MỤC LỤC
3.1.1 Xác định mục tiêu chính, mô hình hệ thống và đối tượng hệ
thống sẽ phục
vụ -3.1.1.1 Mục tiêuchính
3.1.1.2 Môhìnhhệthống
3.1.1.3 Flowchart cuahéthéng
3.1.1.4 Flowchart Add Client
3.1.2 Các công nghệ và nền tang mà hệ thống sẽ sử dung
3.1.3 Đối tượng mà ứng dụng phục vụ
3.14 Ứng dụng
hệthống -3.2 Triển khai mô hình Deep Learning & Federated Learning .
3.2.1 Bộdữliệu Ặ.ẶẶẶ ee ee ee 3.2.2 Triển khai mô hình Học sâu
3.2.2.1 Triển khai môhìnhhCNN
3.2.2.2 Triển khai mô hình các mô hình pre-trained
3.3 Triển khai mô hình Học liên kết
-3.4 Tăng cường bảo mật dif liệu bằng phương pháp Homomorphic En-CTYPUON QC Q Q Q HQ HQ va Chương 4 Thực nghiệm, đánh giá và thảo luận 4.1 So sánh, đánh giá giữa mô hình học tập trung và mô hình học liên kết 4.2 Thực nghiệm so sánh sự thay đổi độ chính xác khi thay đổi tỉ lệ dataset giữa 2 client 2 2.2 0 2 eee ee eee 4.3 So sánh hiệu suất và thời gian huấn luyện giữa các hàm tổng hợp 4.4 So sánh kết quả của các lần train trên nhiều model khác nhau giữa FL&FL+HE
Chương 5 Kết luận và hướng phát triển 51 Kétluan nu va 52 Hạnchế Ống ee 5.3 Hướng pháttriển
Tài liệu tham khảo
VI
45
50
53 53
54 57
58
60 60 60 60
64
Trang 7MỤC LỤC
Phụ lục A Công bố khoa học
vil
64
Trang 83.2
4.1
4.2
4.3
4.4
4.5
4.6
DANH MUC CAC BANG
Phân bố các trường hợp lành tính & ác tinh trong tập dữ liệu 45
Kiến trúc và tham số của mô hnhCNN 47
Kết quả thực nghiệm chạy trên mô hình tập trung 53
Kết quả thực nghiệm chạy trên mô hình học liên kết 53
Kết quả huấn luyện mô hình CNN khi thay đổi tỷ lệ dif liệu giữa hai Kết quả huấn luyện mô hình ResNet152 khi thay đổi tỷ lệ dữ liệu giữa hai clent Q Q ee ee 56 Kết quả huấn luyện trên các hàm tổng hợp khác nhau 57
Kết quả so sánh giữa khi sử dụng FL và FL+HE 58
VII
Trang 9DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ
1.1 FedMLLIbrary 0000 eee eee 2
2.1 Hình minh họa cách hoạt động của Federated Learning 9
2.2 Cơ chế của Federated Learning - 11
2.3 Deep Learning Archiecture 12
2.4 Hình minh họa cách hoạt động củaCNN 15
2.5 Hình minh họa ResNet Architecture 19
2.6 Hình minh họa ResNetl52 Architecture 20
2.7 Hình minh họa ResNet50 Architecture 21
2.8 Hình minh họa DensNet169 Architectue 21
2.9 Hình minh họa mã hóa đồngcấu 25
3.1 MainnSystenModel 29
3.2 Các thành phần trongFLServer 30
3.3 Các thành phan trong FL Client 31
3.4 Flowchart của quá trình tran -.- 32
3.5 Flowchart của quá trình add clien - 34
3.6 Màn hình đăng nhập của hệ thống - 37
3.7 Dashboard Q Q Q ee ee 37 3.8 AddClient Ặ 2 Q Q Q Q Q Q H ee 38
3.9 ManageClien Q Q Q Q Q Q Q H ee ee 38 3.10 Training Model Ặ.ẶẶ ee 39 3.11 GetResult 2 Q Q Q Q Q H Q Q ee Vo 40 3.12 Mongoonl Ặ Ặ Ặ Q HQ HH 40
3.14 server-returntoken 2 2 ee ee 41
1X
Trang 103.25 Luéng dữ liệu của mô hìnhFL 50 3.26 Luéng dữ liệu của mô hình FL kết hợp với HE 52
Trang 11DANH MỤC TU VIET TAT
AIoT Artificial Intelligence of Things
API Aplication Programing Interface
CNN Convolutional Neural Network
DensNet Dense Convolutional Network
FedAvg Federated Averaging
FedAvgM Federated Averaging with Momentum
FedOpt — Federated Optimization
FHE Fully Homomorphic Encryption
FL Federated Learning
HE Homomorphic Encryption
IoMT Internet of Medical Things
Tol Internet of Things
ML Machine Learning
MRI Magnetic Resonance Imaging
NN Neural Networks
ReLU Rectified Linear Unit
ResNet Residual Network
XI
Trang 12Chương 1 MỞ ĐẦU
1.1 Lý do chọn dé tài
Học liên kết (Federated Learning (FL)) và Internet vạn vật (Internet of Things (IoT))hiện đang là các lĩnh vực đầy tiềm năng và cần thiết trong thời đại 4.0 ngày nay, việc
nghiên cứu về nó mang lại nhiều thành tựu quan trọng cho đời sống hàng ngày nói
chung và ở lĩnh vực y tế nói riêng vì [1]:
» Dữ liệu y tế là thông tin nhạy cảm và đòi hỏi mức độ bảo mật cao nhất để đảm
bảo tính riêng tư và tuân thủ các quy định pháp luật Kết hợp giữa lol và FL
giúp giảm thiểu rủi ro liên quan đến việc truyền tải và lưu trữ dữ liệu y tế, từ
đó nâng cao mức độ bảo mật và tin cậy của hệ thống [2].
* Tự động hóa các quy trình trong chăm sóc sức khỏe giúp tối ưu hóa công sức
và thời gian của các nhân viên y tế, từ đó tăng cường hiệu quả và chất lượng
phục vụ IoT cung cấp dữ liệu liên tục về sức khỏe của bệnh nhân, trong khi
FL cho phép cập nhật mô hình học máy một cách tự động và bảo mật trên dữ
liệu phân tán [3].
» Kết hợp giữa IoT và FL cho phép hệ thống chăm sóc sức khỏe thông minh phát
hiện và dự đoán các van đề sức khỏe sớm hơn, từ đó giúp cung cấp chăm sóc
cá nhân hóa và phòng ngừa bệnh tốt hơn Tính toàn diện của dữ liệu từ IoT va
tính bảo mật của FL làm cho quá trình này trở nên hiệu quả và an toàn hơn [4].
1.2 Các nghiên cứu liên quan
Khi Internet vạn vật và Trí tuệ nhân tạo kết hợp với nhau (Artificial Intelligence of Things (AIoT)) đã tạo ra một loạt ứng dụng trong moi mặt của đời sống Sự kết hợp
này dẫn đến sự phát triển mạnh mẽ của các ứng dụng nhằm mục đích hỗ trợ con
người trong cuộc sống hàng ngày Trong lĩnh vực y tế, sự kết hợp giữa AloT và phân
tích hình ảnh bằng Machine Learning (ML) đang mang lại những cải tiến đáng kể
trong việc chăm sóc sức khỏe và điều trị bệnh [5], hình 1.1 Với AIoT, các thiết bị y
tế như máy đo huyết áp thông minh, điện tâm đồ di động và cảm biến theo dõi sứckhỏe đã trở nên thông minh hơn bằng cách kết nối va chia sẻ dữ liệu trực tuyén[6]
1
Trang 13CHUONG 1 MỞ ĐẦU
Điều này giúp bác sĩ và nhà điều dưỡng có thể theo dõi sức khỏe của bệnh nhân từ
xa và dua ra các phản ứng kip thời Trong khi đó, khả năng phân tích hình anh của
ML đã cung cấp một công cụ mạnh mẽ trong việc chẩn đoán bệnh và theo dõi tiếntriển của bệnh Các hệ thống phân tích hình ảnh có thể nhận diện các dấu hiệu của
bệnh từ hình ảnh chụp từ em-rai (Magnetic Resonance Imaging (MRI)), CT scan,
hoặc cả hình ảnh chụp bề mặt da Điều này giúp giảm thời gian và chi phí cho quátrình chẩn đoán, cũng như tăng khả năng phát hiện sớm các bệnh lý Sự phản hồi
nhanh của hệ thống AIoI và ML cũng là yếu tố quan trọng trong việc cung cấp dịch
vụ y tế hiệu quả Từ việc phát hiện các biểu hiện bat thường trong dữ liệu sức khỏeđến việc tự động gợi ý liệu pháp điều trị, các hệ thống này giúp cải thiện quy trìnhchăm sóc và giảm thiểu nguy cơ sai sót Do đó, nhiều ứng dụng chăm sóc sức khỏe
dựa trên Internet of Medical Things (IoMT) được triển khai và sử dụng trong cuộc sống hàng ngày [7].
Mobile, loT (Ti So) Standalone
FedML-Mobile FedML-loT
j H { H H H H {
| [Android NVIDIA loTs
i iOS RaspBerry Pi FedAvg |{ FedOpt || FedNova | [FedNAS |
H
H i
MPI || MOTT | Other Backend | PyTorch | Mobile Training | '
Distributed Communication Training Engine '
Hình 1.1 Hình minh họa thu viện FedML.!
'He, C., Li, S., So, J., Zeng, X., Zhang, M., Wang, H., & Avestimehr, S (2020) Fedml: A
research library and benchmark for federated machine learning arXiv preprint arXiv:2007.13518.
Trang 14CHUONG 1 MỞ ĐẦU
Theo truyền thống, các mô hình học máy (ML) sử dung quá trình tổng hợp vàhọc tập dữ liệu tập trung, điều này là không thực tế trong khuôn khổ chăm sóc sứckhỏe do các vấn dé về quyền riêng tư và bảo mật dữ liệu ngày càng gia tăng (do dữ
liệu về y tế và sức khỏe bệnh nhân là riêng tư) Học tập Liên kết (FL) đã được coi
là một mô hình tập thể phân tán đang phát triển, phù hợp nhất cho khuôn khổ chăm
sóc sức khỏe hiện đại, quản lý các bên liên quan khác nhau (ví dụ: bệnh nhân, bệnh
viện, phòng thí nghiệm, v.v.) để thực hiện đào tạo các mô hình mà không cần traođổi thực tế của dữ liệu y tế nhạy cảm Tuy nhiên, các lo ngại về đạo đức và quy định
về quyển riêng tư ngăn chặn việc chia sẻ tự do của dif liệu y tế Các kỹ thuật mã hóa
như mã hóa toàn diện (Fully Homomorphic Encryption (FHE)) cho phép đánh giá
trên dữ liệu đã được mã hóa [8] Sử dụng FHE, các mô hình học máy như học sâu
(Deep Learning - DL), đã được triển khai cho các ứng dụng bảo vệ quyền riêng tư
sử dụng dữ liệu y tế [9] Hình 1.2
naecán Qq
oa@ tỳ
Public & partial private key
- BÙ results
wae private keys 4 ae 4°
Cloud server
ee parameters Local parameters
User 1 User 2 User 3 User 4
Hình 1.2 Hình minh hoa phương pháp bảo mật với mô hình học liên kết.”
?Park, J., & Lim, H (2022) Privacy-preserving federated learning using homomorphic
encryp-tion Applied Sciences, 12(2), 734.
Trang 15CHUONG 1 MỞ ĐẦU
Tự động hóa là một phan quan trong của FL, cho phép quy trình huấn luyện mô
hình diễn ra một cách tự động và đồng nhất trên nhiều nút phân tán Điều này không chỉ giúp tiết kiệm thời gian và công sức mà còn tăng cường hiệu suất và đảm bảo tính nhất quán của mô hình trên toàn hệ thống [10].
1.3 Mục tiêu, đối tượng và phạm vi nghiên cứu
1.3.1 Mục tiêu nghiên cứu
1) Xây Mô hình Convolutional Neural Network (CNN) trong việc huấn luyện và dựđoán trên các tập dataset về y tế:
« Xây dựng và tối ưu hóa mô hình CNN cho việc phân loại và dự đoán trên các
tập dataset chứa dữ liệu y tế.
* Nghiên cứu về cách sử dụng CNN để chẩn đoán bệnh, dự đoán kết quả điều
trị, hoặc phân loại các biểu hiện lâm sàng từ dữ liệu hình ảnh, dữ liệu y lệnh
hoặc dữ liệu văn bản trong lĩnh vực y tế
2) Mô hình FL để tăng tính bảo mật của dữ liệu và mô hình học máy.
¢ Phát triển và triển khai mô hình học máy phân tán dựa trên FL trong lĩnh vực
y tế
* Nghiên cứu cách tích hợp FL vào hệ thống chăm sóc sức khỏe thông minh để
tăng tính bảo mật của dữ liệu y tế và mô hình học máy, đồng thời giữ cho dữ
liệu tại chỗ mà không cần phải truyền dif liệu qua mang.
3) Homomorphic Encryption (HE) để thực hiện tính toán trên dữ liệu được mã hóa
mà không cần phải giải mã nó trước
¢ Nghiên cứu va phát triển các phương pháp và công nghệ HE để thực hiện các
tính toán trên dữ liệu y tế được mã hóa mà không cần giải mã trước
¢ Áp dụng HE vào các quy trình tính toán trong lĩnh vực y tế như phân tích dữ
liệu, huấn luyện mô hình học máy và dự đoán kết quả bệnh lý
4) Tự động hóa và đơn giản hóa quy trình làm việc cũng như triển khai máy học.
4
Trang 16CHUONG 1 MỞ ĐẦU
¢ Nghiên cứu và phát triển các công cụ và quy trình để tự động hóa và đơn giản
hóa quy trình huấn luyện, triển khai và quản lý mô hình học máy trong môi trường y tế.
¢ Áp dung tự động hóa vào hệ thống chăm sóc sức khỏe để tối ưu hóa quy trình
làm việc của nhân viên y tế, cải thiện hiệu suất và tính linh hoạt của hệ thống
1.3.2 Đối tượng nghiên cứu
Hệ thống chăm sóc sức khỏe thông minh:
* Các thiết bị IoT y tế
» Hệ thống phần mềm quan lý dữ liệu y tế và sức khỏe.
s Các dịch vụ cham sóc sức khỏe từ xa.
Công nghệ IoT (Internet of Things):
* Các cảm biến và thiết bị IoT được sử dụng trong y tế
« Các Giao thức truyền thông giữa các thiết bị IơT
« Các phương thức thu thập và xử lý dữ liệu từ thiết bị IoT
Học liên kết (Federated Learning):
* Các thuật toán học liên kết áp dụng trong y tế
«Bảo mật và quyền riêng tư trong học liên kết
Bảo mật và quyển riêng tư trong hệ thống IoT y tế:
« Phương pháp mã hóa và bảo vệ dif liệu y tế.
* Các lỗ hổng và mối đe doa bao mật đối với hệ thống IoT y tế
Tự động hóa các quy trình trong chăm sóc sức khỏe:
* Tự động hóa trong việc huấn luyện các tập dataset
* Tự động hóa trong việc thêm các client vào hệ thống.
5
Trang 17CHƯƠNG I MỞ ĐẦU
Các tập dataset: The Pima Indians diabetes, Chest-xray, Parkinson’s Drawings,
In-dicators of Heart Disease, The Lung Image Database Consortium (LIDC) va Image
Database Resource Initiative (DRI).
1.3.3 Pham vi nghiên cứu
° Nghiên cứu về cách tích hợp IoT va FL để xây dựng hệ thống chăm sóc sức
khỏe thông minh có khả nang tự động hóa và bao mật cao.
* Khao sát cách sử dụng công nghệ tự động hóa để cải thiện hiệu suất và hiệu
quả trong việc cung câp dịch vụ chăm sóc sức khỏe.
* Nghiên cứu về các vấn dé bảo mật đặc biệt liên quan đến dữ liệu y tế nhạy
”
cam.
* Nghiên cứu về cách FL có thể được áp dung trong lĩnh vực chăm sóc sức khỏe
để tạo mô hình dự đoán hoặc phân loại trên dữ liệu phân tán từ nhiều nguồnkhác nhau mà không cần truyền dữ liệu đến một trung tâm tập trung
1.4 Phuong pháp nghiên cứu
Nội dung 1: Thiết kế kiến trúc tổng quan:
» Xác định mục tiêu chính của hệ thống và đối tượng mà hệ thống sẽ phục vụ
* Nêu rõ các công nghệ và nền tang mà hệ thống sẽ sử dụng
Nôi dung 2: Triển khai mô hình Federated Learning và CNN:
« Giải thích cách mô hình Federated Learning hoạt động trong việc huấn luyện
mô hình trên dữ liệu phân tán từ nhiều nguồn
« Nêu rõ ưu điểm như bảo vệ quyền riêng tư, giảm lượng dif liệu di chuyển.
* Mô tả kiến trúc cơ bản của mạng nơ-ron tích chập và cách nó thực hiện quá
trình học từ dữ liệu hình anh.
» Nêu rõ sức mạnh của CNN trong việc phân loại và xử lý hình ảnh.
Trang 18CHƯƠNG I MỞ ĐẦU
Nội dung 3: Bảo mật dữ liệu khi truyền bằng Homomorphic Encryption:
¢ Mô tả cách Homomorphic Encryption đóng vai trò trong việc bảo vệ dữ liệu
trước những mối đe dọa mạng
Nội dung 4: So sánh các hàm tổng hợp khác của Federated Learning:
* Mô tả cách các hàm tổng hợp trong Federated Learning chịu trách nhiệm gom
nhóm và tổng hợp thông tin từ các thiết bị người dùng phân tán.
* Nêu rõ tầm quan trong của các hàm tổng hợp trong quá trình đào tao mô hình
1.5 Các đóng góp chính của đề tài
* Tăng cường bảo mật cho dữ liệu y tế.
¢ Tự Động Hóa Quy Trinh Chăm Sóc Sức Khỏe
¢ Ap Dung Federated Learning trong Hệ Thống Chăm Sóc Sức Khỏe
* Ung Dung Homomorphic Encryption (TenSeal) để bảo vệ dữ liệu
1.6 Cấu trúc Khoá luận tốt nghiệp
Khóa luận với đề tài “TĂNG CƯỜNG BẢO MẬT VÀ TỰ ĐỘNG HÓA CHO HỆTHONG CHAM SOC SỨC KHỎE THONG MINH DUA TREN IOT VÀ HỌC
LIEN KET” được trình bay bao gồm 5 chương Nội dung tóm tat từng chương được
trình bày như sau:
* Chương 1: Mở đầu Lý do chọn dé tài, các công trình nghiên cứu liên quan
& phương pháp thực hiện cho đề tài
* Chương 2: Cơ sở lý thuyết Nêu định nghĩa và các công nghệ sử dụng trong
đề tài
* Chương 3: Phương pháp thực hiện Thiết kế kiến trúc và triển khai ứng
dụng
Trang 19CHƯƠNG 1 MỞ ĐẦU
« Chương 4: Thực nghiệm và đánh giá Tiến hành chạy thử nghiệm và tổng
hợp các kết quả đạt được
* Chương 5: Kết luận và hướng phát triển Kết luận dựa trên các đánh giá ở
chương 4, đề xuất ý kiến và các công việc trong tương lai
Trang 20Chương 2 CƠ SỞ LÝ THUYET
Federated Learning (FL) là một phương pháp máy học cho phép huấn luyện môhình trên dữ liệu phân tán ma không cần chuyển dif liệu về một mô hình tập trung.Thay vì gửi dữ liệu về trung tâm để huấn luyện mô hình, thiết bị hoặc nguồn dữ liệu
tại các điểm cuối (như thiết bị di động, cảm biến IơT) thực hiện việc huấn luyện mô hình trên dữ liệu của chính mình Sau đó, các tham số được cập nhật và kết hợp
để tao ra một mô hình toàn cầu Khi kết hợp với AIoT (Artificial Intelligence of
Things), FL trở thành một công cụ mạnh mẽ cho các lĩnh vực chăm sóc sức khỏe
thông minh.
2.1 Federated Learning
Federated Learning (thường được gọi là hoc liên kết) là một phương pháp phi tậptrung để dao tạo các mô hình học máy Nó không yêu cầu trao đổi dữ liệu từ các
thiết bị khách hàng (client) đến các máy chủ toàn cầu Thay vào đó, đữ liệu nguyên
gốc trên các thiết bị biên được sử dụng để đào tạo mô hình cục bộ, từ đó nâng cao
quyên riêng tư dữ liệu Cuối cùng, mô hình được hình thành bằng cách tổng hợp các
ban cập nhật cục bộ Được minh họa trong hình 2.1.
FL Clients
Ela Bees Local Training x
Private Data Local Model
lÌm seo Local Training
Private Data Local Model
[=Ð
ED | a
[=Ð
Hình 2.1 Hình minh họa cách hoạt động của Federated Learning.!
‘https://nvflare.readthedocs.io/en/main/fl_introduction.html (Truy cập ngày: 10/05/2024)
Trang 21CHƯƠNG 2 CƠ SỞ LÝ THUYET
2.1.1 Federated Learning quan trọng bởi những lí do sau:
* Quyên riêng tư: Khác với các phương pháp truyền thống, trong đó dữ liệu được
gửi đến máy chủ tập trung để đào tạo, Federated Learning cho phép đào tạocục bộ trên thiết bị biên, ngăn chặn lỗ hổng dữ liệu tiềm năng
¢ An toàn, bao mật dữ liệu: Chi các bản cập nhật mô hình được mã hóa được
chia sẻ với máy chủ tập trung, đảm bảo bảo mật dữ liệu Ngoài ra, các kỹ thuật
tổng hợp an toàn như Secure Aggregation Principle cho phép giải mã chỉ các
kết quả được tổng hợp
* Truy cập vào dữ liệu không đồng nhất: Federated learning đảm bảo truy cập
vào dữ liệu được phân tán trên nhiều thiết bi, địa điểm và tổ chức Nó cho phép
đào tạo các mô hình trên dt liệu nhạy cảm, chẳng hạn như đữ liệu tài chính
hoặc chăm sóc sức khỏe trong khi vẫn duy trì bảo mật và quyển riêng tư Và
nhờ sự đa dạng dif liệu lớn hơn, các mô hình có thể mang tính tổng quát hơn.
2.1.2 Cách Federated Learning hoạt động
¢ Một mô hình cơ bản được lưu trữ trên máy chủ tập trung Các bản sao của mô
hình này được chia sẻ với các thiết bị khách hàng, sau đó các thiết bị này sẽ
đào tạo các mô hình dựa trên các dữ liệu cục bộ mà chúng tạo ra Theo thời
gian, các mô hình trên các thiết bị riêng lẻ trở nên cá nhân hóa và cung cấp trảinghiệm người dùng tốt hơn
To giai đoạn tiếp theo, các bản cập nhật (tham số mô hình) được đào tạo cục bộ
được chia sẻ với mô hình chính nằm ở máy chủ tập trung bằng cách sử dụng
các kỹ thuật tổng hợp an toàn (secure aggregation techniques) Mô hình này
kết hợp và trung bình hóa các đầu vào khác nhau để tạo ra các bài học mới
Vì dữ liệu được thu thập từ các nguồn đa dạng, nên có phạm vi lớn hơn và mô
hình trở nên tổng quát hơn.
« Khi mô hình trung tâm đã được đào tạo lại trên các tham số mới, nó lại được
chia sẻ với các thiết bị khách hàng cho lần lặp tiếp theo Với mỗi chu kỳ, các
10
Trang 22CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
mô hình thu thập một lượng thông tin đa dạng và tiếp tục cải thiện mà khôngtạo ra các lỗ hổng về quyền riêng tư Được minh hoa ở hình 2.2
‘Step 1: Server sharing initial Learnings (L1)
Step 2 : Updating local models and generating se Ss
new learnings using private data eo 0! )
Step 1: Server sharing initial Learning(L1)
Hình 2.2 Cơ chế của Federated Learning.”
2.13 Nhược điểm
Mặc dù học phân tán mang đến nhiều lợi ích, nó cũng đi kèm với một số thách thức
đáng kể:
* Quan lý đồng bộ: Việc đảm bảo sự đồng bộ giữa các mô hình va dữ liệu phân
tán trên nhiều thiết bị hoặc máy tính có thể trở nên phức tạp, đặc biệt khi cầntruyền tải dữ liệu và trọng số giữa chúng Điều này có thể dẫn đến tình trạng
tac nghẽn và giảm hiệu suất.
» Giao tiếp: Việc giao tiếp liên tục giữa các nút phân tán có thể tạo ra chi phí
mạng va độ trễ đáng kể, nhất là khi mô hình và dif liệu có kích thước lớn Việc
này có thể ảnh hưởng đến hiệu suất tổng thể của hệ thống và trải nghiệm người
dùng.
*https://vinbigdata.com/kham-pha/federated-learning-trong-thi-giac-may-tinh-huong-dan-chi-tiet-tung-buoc.html (Truy cap ngay: 20/01/2024)
II
Trang 23CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
« Bảo mật: Bảo mật dữ liệu mô hình là một trong các van dé quan trọng cần
được quan tâm khi quản lý nhiều nút và thiết bị phân tán Nguy cơ vi phạm dữ
liệu và tấn công mạng có thể cao hơn trong môi trường phân tán.
« Chi phí: Việc quản lý và duy trì cơ sở hạ tầng mạng và hệ thống phân tán phức
tạp có thể dẫn đến chi phí triển khai và vận hành cao hơn so với các mô hìnhhọc tập truyền thống
Nhìn chung, học phân tán mang đến nhiều tiềm năng cho việc cải thiện hiệu suất vàkhả năng mở rộng của các mô hình học máy Tuy nhiên, cần phải giải quyết nhữngthách thức về đồng bộ, giao tiếp, bảo mật và chi phí để đảm bảo triển khai thànhcông các hệ thống học phân tán
2.2 Học sau (Deep Learning)
Học sâu (Deep Learning) là một nhánh con của hoc máy (Machine Learning) sử
dụng các mạng nơ-ron nhân tao (Convolutional Neural Networks - CNN) có cấu trúc sâu để học hỏi từ dữ liệu hình ảnh Mạng nơ-ron nhân tạo được lấy cảm hứng
từ cấu trúc và hoạt động của não bộ con người, bao gồm nhiều lớp nơ-ron được kết
nối với nhau bằng các khớp nối (Synapse), hình 2.3
Artificial
Intelligence
Machine Learning
Data
Science
Deep
Learning
Hình 2.3 Kiến trúc Deep Learning.”
3https:/www.geeksforgeeks.org/introduction-deep-learning/ (Truy cập ngày: 20/01/2024)
12
Trang 24CHƯƠNG 2 CƠ SỞ LÝ THUYET
2.2.1 Cách thức hoạt động của học sâu
° Một mạng nơ-ron bao gồm nhiều lớp khác nhau, càng nhiều lớp thì mạng sé
càng “sâu” Trong mỗi lớp là các nút mạng và được liên kết với các lớp khác
bên cạnh.
* Mỗi kết nối giữa các nút sẽ có một trọng số tương ứng, trọng số càng cao thì
mức độ ảnh hưởng của kết nỗi này đến mạng no-ron sẽ càng lớn
° Mỗi nơ-ron có một chức năng kích hoạt, về cơ bản sẽ chịu trách nhiệm "chuẩn
hóa” dau ra từ nơ-ron này.
* Dữ liệu được người dùng nhập vào mang thần kinh di qua tat cả các lớp va trả
về kết quả ở lớp cuối cùng, được gọi là lớp đầu ra
« Trong quá trình đào tạo mô hình mạng nơ-ron, các trọng số sẽ được thay đổi
và nhiệm vụ của mô hình là tìm tập giá trị của các trọng số sao cho phán đoán
đúng nhất
2.2.2 Ưu và nhược điểm của học sâu.
2.2.2.1 Ưu điểm:
« Cấu trúc Neural Networks (NN) dễ dàng thay đổi linh hoạt để phù hợp với
nhiều thuật toán và bài toán khác nhau.
* Có khả năng giải nhiều van đề phức tạp với độ chính xác cao
* Có khả năng thực hiện tính toán song song với hiệu năng tốt và xử lý lượng dữ
liệu lớn.
2.2.2.2 Nhược điểm:
* Deep Learning thường doi hỏi một lượng lớn tài nguyên tính toán và bộ nhớ,
đặc biệt khi làm việc với các mô hình lớn và phức tạp Việc huấn luyện các
mô hình này đòi hỏi phần cứng mạnh mẽ như GPU hoặc TPU, dẫn đến chi phí
cao.
13
Trang 25CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
* Quá trình huấn luyện các mô hình deep learning có thể mất rất nhiều thời gian,
đặc biệt với các bộ dữ liệu lớn và các mô hình phức tạp Điều này có thể làm
chậm quá trình phát triển và triển khai các ứng dụng.
2.2.3 Ứng dụng
* Học sâu có các đóng góp đáng kể cho lĩnh vực y tế, trong đó các mô hình phổ
biến bao gồm mô hình dự đoán bệnh, chẩn đoán ung thư, phân tích kết quả
chụp MRI, X-quang
* Doanh nghiệp có thé ứng dung Deep Learning để hiểu và phán đoán cảm xúc
của khách hàng dựa trên các đánh giá, bình luận, feedback từ đó đưa ra các
chiến lược kinh doanh, marketing phù hợp với từng phân khúc khách hàng.
s Nhận dạng hình ảnh (Image Recognition): Các mô hình deep learning như
CNN (Convolutional Neural Networks) được sử dung để nhận dạng và phân loại hình ảnh trong các ứng dụng như phân loại đối tượng, nhận diện khuôn
vực học sâu (Deep Learning) cho các nhiệm vụ xử lý ảnh (Image Processing) và
nhận dạng hình ảnh (Computer Vision) CNN được lấy cảm hứng từ cấu trúc thịgiác của sinh vật học, với khả năng trích xuất các đặc trưng (Feature) từ dữ liệu hình
ảnh một cách hiệu quả, hình 2.4.
14
Trang 26CHƯƠNG 2 CƠ SỞ LÝ THUYET
Input n1 channels n1 channels n2 channels n2 channels
n3units Output
Hình 2.4 Hình minh hoa cách hoạt động của CNN *
2.3.2 Cau trúc:
Một mạng CNN cơ bản bao gồm các lớp sau:
¢ Lớp đầu vào (Input Layer:) Đây là lớp nhận dữ liệu đầu vào, chẳng hạn như
hình ảnh, và chuẩn bị dữ liệu cho các lớp tiếp theo Dữ liệu thường được biểu
diễn dưới dạng ma trận.
» Lớp tích chập (Convolutional Layer): Lớp này thực hiện phép tích chập
(convolution) giữa dữ liệu đầu vào và các bộ lọc (filters) để tạo ra các đặc
trưng (feature maps) Mỗi bộ lọc thường là một ma trận nhỏ trượt qua toàn bộ
dữ liệu đầu vào, áp dụng các phép nhân và cộng để trích xuất các đặc trưng
¢ Lớp kích hoạt (Activation Layer): Lớp này áp dụng một hàm kích hoạt,
chẳng hạn như Rectified Linear Unit (ReLU), để giới thiệu tính phi tuyến tính
vào mô hình Hàm kích hoạt giúp mạng học các mối quan hệ phi tuyến từ dữ
liệu.
» Lớp gop (Pooling Layer): Lớp này giảm kích thước của các đặc trưng (feature
maps) bang cách chọn các giá trị đại diện trong các vùng con của đặc trưng.
*https://www.researchgate.net/figure/A-vanilla-Convolutional-Neural-Network-CNN-represenfation_fig2_ 339447623 (Truy cập vào ngày: 04/02/2024)
15
Trang 27CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Phổ biến nhất là gộp cực đại (Max Pooling) và gộp trung bình (Average
Pool-ing) Điều này giúp giảm số lượng tham số và tính toán, cũng như giảm nguy
cơ overfitting.
- Lớp làm phẳng (Flatten Layer): Lớp này chuyển đổi các đặc trưng đa chiều
(multi-dimensional feature maps) thành một vector một chiều để chuẩn bị cho
các lớp kết nối đầy đủ (lớp dày đặc)
° Lớp kết nối đầy đủ (Fully Connected Layer hoặc Dense Layer): Lớp này
kết nối tất cả các nơ-ron trong lớp trước với mỗi nơ-ron trong lớp này Đây là
lớp thường được sử dụng để thực hiện các phép toán cuối cùng và đưa ra dự
đoán.
° Lớp đầu ra (Output Layer): Lớp này tạo ra các dự đoán cuối cùng của mạng.
Nếu đó là bài toán phân loại, lớp này thường sử dụng hàm kích hoạt Softmax
để tạo ra xác suất cho từng lớp Nếu là bài toán hồi quy, lớp này có thể sử dụngcác hàm kích hoạt khác tùy thuộc vào yêu cầu cụ thể
2.3.3 Các hoạt động chính:
» Tích chap (Convolution): Là phép toán toán hoc cơ bản trong CNN, thực
hiện bằng cách di chuyển bộ lọc (kernel) trên dữ liệu đầu vào và tính toán tổngtích sản giữa các giá trị tương ứng Kích thước và số lượng bộ lọc quyết địnhmức độ phức tạp của các đặc trưng được trích xuất
Mục đích: Phát hiện các đặc trưng cục bộ trong dữ liệu, chẳng hạn như các
cạnh, góc, và các chi tiết khác trong hình ảnh
* Kích hoạt (Activation): Giúp giới hạn giá trị đầu ra của nơ-ron, giới thiệu
tính phi tuyến vào mô hình và cho phép mô hình học được các hàm phi tuyến
phức tạp Hàm kích hoạt phổ biến bao gồm ReLU, sigmoid, tanh, v.v
Mục đích: Giúp mang học các mối quan hệ phi tuyến trong dif liệu và tăng
khả năng biểu diễn của mạng.
« Gộp (Pooling): Giảm kích thước của dữ liệu, giúp giảm thiểu số lượng tham
số và kiểm soát độ phức tạp của mô hình, đồng thời tăng cường tính ổn định
16
Trang 28CHƯƠNG 2 CƠ SỞ LÝ THUYET
của mô hình Các phương pháp gộp phổ biến bao gồm Max Pooling, Average
Pooling, Global Pooling, v.v.
Mục đích: Giảm số lượng tham số và tính toán trong mạng, cũng như giảm nguy cơ overfitting và tăng khả năng chịu đựng của mạng với các biến đối của
Kết nối day du (Fully Connected Layers): Các lớp này kết nối tat cả các
nơ-ron từ lớp trước với mỗi nơ-ron trong lớp hiện tại và thực hiện các phép tính
tổng trọng số cộng với bias
Mục đích: Tạo ra sự kết hợp toàn diện của các đặc trưng đã trích xuất để đưa
ra dự đoán cuối cùng.
Dự đoán (Prediction): Lớp đầu ra (output layer) tạo ra các dự đoán cuối
cùng của mạng Trong các bài toán phân loại, thường sử dụng hàm kích hoạt
Softmax để đưa ra xác suất cho từng lớp Trong các bài toán hồi quy, có thể sử
dụng hàm kích hoạt tuyến tính hoặc các hàm kích hoạt khác.
Mục đích: Dua ra kết quả cuối cùng dựa trên các đặc trưng đã được học
Hiệu quả trong việc xử lý các dữ liệu dạng lưới (Grid-like data) như ảnh, video.
Có thể áp dụng cho các nhiệm vụ đa dạng như phân loại ảnh, nhận diện đối
tượng, phân đoạn ảnh, v.v.
17
Trang 29CHƯƠNG 2 CƠ SỞ LÝ THUYET
* Có khả năng duy trì hiệu suất cao ngay cả khi dữ liệu đầu vào có chứa nhiễu
* Hoạt động tốt với các mô hình học sâu và có thé tận dụng lợi thế của các tiến
bộ trong phần cứng tính toán, chẳng hạn như GPU
2.3.5 Nhược điểm:
« Việc huấn luyện và triển khai CNN yêu cầu tài nguyên phần cứng mạnh mẽ,
đặc biệt là khi làm việc với các mạng lớn và phức tạp.
¢ Hiệu suất của CNN phụ thuộc mạnh mẽ vào việc lựa chọn các siêu tham số
(Hyperparameters) như kích thước bộ lọc, số lượng lớp, learning rate, v.v.
* Thường yêu cầu một lượng dif liệu lớn để đạt được hiệu suất tốt.
2.3.6 Ứng dụng:
Nhờ khả năng mạnh mẽ trong việc xử lý và phân tích dữ liệu không gian, CNN đang
ngày càng được ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau, từ y tế, giao
thông, an ninh, đến giải trí và công nghiệp:
¢ Phân loại ảnh thành các lớp (Class) tương ứng, ví dụ như phân loại ảnh mèo,
ảnh chó, ảnh hoa, v.v.
» Xác định vị trí và lớp của các đối tượng trong ảnh, ví dụ như phát hiện người
đi bộ, ô tô, biển báo giao thông, v.v.
¢ Gan nhãn từng điểm ảnh trong ảnh vào lớp tương ứng, ví dụ như phân đoạn
ảnh y tê, anh ban do, v.v.
¢ Phân tích hình ảnh y tế như X-quang, MRI, CT scan để hỗ trợ chẩn đoán bệnh
lý.
* Phân tích ảnh vệ tinh để theo dõi biến đổi khí hậu, quản lý tài nguyên thiên
nhiên, v.v.
« Phát triển ứng dụng AR/VR, nhận diện các đối tượng trong môi trường thực
để tương tác với các yếu tố ảo.
18
Trang 30CHƯƠNG 2 CƠ SỞ LÝ THUYET
2.3.7 Pre-Trained Models:
2.3.7.1 ResNet
Residual Network (ResNet) là một kiến trúc mang nơ-ron được He et al dé xuất
năm 2015, với mục dich giải quyết vấn dé "su thoái hóa hiệu suất" (performancedegradation) khi độ sâu của mạng nơ-ron tăng lên ResNet sử dụng một kiến trúc
"nhảy cóc" (skip connection) để kết nối các lớp đầu vào với các lớp đầu ra của các
khối mạng con (residual block).
Mỗi khối mạng con trong ResNet bao gồm hai lớp tích chập (convolutional layer) và một hàm kích hoạt (activation function), được kết nối bởi một "phép cộng" (addition)
giữa đầu vào và đầu ra của khối [1 I], hình 2.5
wou yo}eg
AUO2 / X7
2.3.7.2 ResNet152:
ResNet152 (Residual Network 152) là một mô hình mạng nơ-ron sâu được sử dụng
rộng rãi trong lĩnh vực học sâu, đặc biệt là cho các bài toán về nhận dạng và phân
loại hình ảnh ResNet152 thuộc họ mô hình Residual Networks (ResNet), được phát triển bởi các nhà nghiên cứu của Microsoft Research [11], hình 2.6.
Shttps://phamdinhkhanh github.io/2020/12/19/Resnet.html (Truy cập vào ngày: 10/04/2024)
19
Trang 31CHƯƠNG 2 CƠ SỞ LÝ THUYET
ResNet50 (Residual Network 50) là một mang no-ron tích chập (CNN) có tổng cộng
50 lớp, nổi tiếng trong lĩnh vực học sâu và thị giác máy tính Sử dụng các khối mạng
con 1x1x1 và 3x3x3 (kích thước bộ lọc 1x1x1 cho một lớp) xen kế nhau Được phát
triển bởi các nhà nghiên cứu tại Microsoft Research và giới thiệu lần đầu tiên trong
bài báo "Deep Residual Learning for Image Recognition" năm 2015 [11], hình 2.7.
Shttps://www.kaggle.com/datasets/pytorch/resnet152 Truy cập vào ngày (10/04/2024)
20
Trang 32CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Stage 1 Stage 2 Slage3 Stage4 Stage 5
Hình 2.7 Hình minh họa ResNet50 Architecture 7.
2.3.7.4 DenseNet169:
DenseNet169 (Dense Convolutional Network (DensNet)) là một kiến trúc mạng nơron với độ sâu 169 lớp, sử dụng các khối mạng con 3x3x3, là biến thể của kiến trúcDenseNet với mục đích cải thiện hiệu suất học tập của ResNet bằng cách kết nối trựctiếp các lớp đầu ra của mỗi khối mạng con với đầu vào của các khối mạng con tiếp
theo Áp dụng kỹ thuật "growth rate" để điều chỉnh số lượng kênh đầu ra của mỗi
Feature Extraction Classification
Hình 2.8 Hình minh hoa DenseNet169 Architecture Š
Thttps://medium.com/@arashserej/resnet-50-83b3ff33be7d (truy cập vào ngày: 10/04/2024)
Shttps://www.linkedin.com/pulse/densenet-169-passline-mary-favqc/ (Truy cập vào ngày
(10/04/2024)
21
Trang 33CHƯƠNG 2 CƠ SỞ LÝ THUYET
2.3.8 Ưu và nhược điểm của các Pre-Trained Models
2.3.8.1 ResNet
Ưu điểm:
* ResNet có thể được mở rộng ra các độ sâu rất lớn mà không làm giảm hiệu
suất hoặc gây khó khăn trong quá trình huấn luyện Điều này giúp tăng khả
năng biểu diễn và học hỏi của mạng.
» Kiến trúc ResNet rất linh hoạt, có thể được điều chỉnh cho phù hợp với nhiều
loại dữ liệu và bài toán khác nhau Nó đã trở thành nền tảng cho nhiều kiếntrúc mạng tiên tiến khác, chẳng hạn như ResNeXt, DenseNet, và các biến thể
khác.
« Cho phép gradient lan truyền trực tiếp đến các lớp ở đầu mạng nên giảm hiện
tượng vanishing gradient.
Nhược điểm:
° Mặc dù ResNet giúp giải quyết van dé gradient mat dần, nhưng các mạng rat
sâu đòi hỏi nhiều tài nguyên tính toán và bộ nhớ, làm tăng chi phí và thời gian huấn luyện.
» Việc thiết kế và điều chỉnh các tham số của ResNet có thể phức tạp và tốn thời
gian Người dùng cần phải tinh chỉnh các siêu tham số (hyperparameters) vàcau trúc của các khối residual một cách cẩn thận để đạt được hiệu suất tốt nhất
« Có thể dé dàng dẫn đến overfitting, đặc biệt là khi dữ liệu huấn luyện không
đủ lớn hoặc không đủ đa dạng.
2.3.8.2 ResNet152
Ưu điểm:
* ResNet152 đã chứng tỏ hiệu suất rất tốt trên nhiều bộ dữ liệu và bài toán khác
nhau, đặc biệt là trong các cuộc thi như ImageNet, nơi nó thường đạt được độ
chính xác cao hơn so với các mô hình nông hơn.
22
Trang 34CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
* ResNet152 có thể duy trì gradient qua nhiều lớp, giúp việc huấn luyện các
mạng rất sâu trở nên khả thi.
* ResNet152 có thể được sử dụng trong nhiều bài toán khác nhau, từ phân loại
hình ảnh đến nhận dạng đối tượng, phân đoạn hình ảnh và nhiều ứng dụng
khác trong thị giác máy tính.
Nhược điểm:
« Gây khó khăn cho việc triển khai trên các thiết bị có tài nguyên hạn chế Do
ResNet152 yêu cầu nhiều tài nguyên tính toán và bộ nhớ hơn do số lượng lớp
lớn, làm tăng chi phí và thời gian huấn luyện.
«Việc thiết kế và tinh chỉnh một mô hình sâu như ResNet152 có thể phức tạp và
tốn nhiều thời gian Người dùng cần phải có kiến thức sâu về cau trúc mạng
và các siêu tham số để đạt hiệu suất tốt nhất
2.3.8.3 ResNet50
Ưu điểm:
« ResNet50 có khả năng đạt hiệu suất cao trong nhiều bài toán nhận dang và
phân loại hình ảnh.
«Với 50 lớp, ResNet50 có khả năng học và biểu diễn các đặc trưng phức tạp của
dữ liệu, giúp cải thiện độ chính xác trong các bài toán phân loại và nhận dạng.
* So với các biến thể sâu hơn như ResNet101 hay ResNet152, ResNet50 yêu cầu
ít tài nguyên tính toán và bộ nhớ hơn, làm cho nó phù hợp với nhiều ứng dụng
hơn, bao gồm cả những ứng dụng trong các môi trường tài nguyên hạn chế
Nhược điểm:
¢ ResNet50 phức tạp hơn so với các mô hình nông hơn như VGG16 hay AlexNet,
đòi hỏi nhiều thời gian và công sức hơn trong việc huan luyện và điều chỉnh.
° ResNet50 cũng gặp khó khăn trong việc giải thích và hiểu rõ lý do tại sao nó
đưa ra các quyết định cụ thể, làm giảm tính minh bạch của mô hình
23
Trang 35CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
° Mặc dù ResNet50 yêu cau ít tài nguyên hơn so với các mô hình sâu hơn, nó
vẫn đòi hỏi một lượng tài nguyên đáng kể.
2.3.8.4 DenseNet169
on
Uu diém:
* DenseNet169 cho phép tái sử dung các đặc trưng đã học từ các lớp trước đó.
Điều này không chỉ giúp giảm số lượng tham số cần thiết mà còn tăng hiệu
quả của việc học đặc trưng.
* DenseNet169 thường đạt hiệu suất cao hơn trong các bài toán nhận dạng hình
ảnh và các tác vụ thị giác máy tính khác.
* DenseNet169 thường có khả năng tổng quát hóa tốt hơn, hoạt động tốt trên cả
tập huấn luyện và tập kiểm tra.
* DenseNet169 dé huấn luyện hơn và thường yêu cầu ít epochs hơn để đạt được
hiệu suất cao so với các mô hình truyền thống.
Nhược điểm:
* DenseNet169 có thể phức tap, đòi hỏi kiến thức sâu về mạng nơ-ron và các
siêu tham số để đạt hiệu suất tốt nhất
* DenseNet169 khó giải thích và hiểu rõ lý do tại sao nó đưa ra các quyết định
cụ thể, ảnh hưởng đến tính minh bạch của mô hình Điều này đặc biệt quantrọng trong các ứng dụng yêu cầu tính giải thích cao như y tế và pháp luật
* DenseNet169 có thể gặp khó khăn khi triển khai trong các hệ thống thời gian
thực hoặc trên các thiết bị nhúng, đòi hỏi các biện pháp tối ưu hóa đặc biệt đểđảm bảo hiệu suất hoạt động
2.4 Mã hóa đồng cấu (HE)
Mã hóa đồng cấu (HE) là việc chuyển đổi dữ liệu thành văn bản mã hóa có thể được
phân tích và xử lý như thể nó vẫn ở dạng ban đầu Mã hóa đồng cấu cho phép thực
24
Trang 36CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
hiện các phép toán phức tạp trên dữ liệu được mã hóa mà không ảnh hưởng đến mã
hóa [13] và [14].
Học tập liên kết với mã hóa đồng cấu cho phép nhiều bên cùng đào tạo các mô hình
trí tuệ nhân tạo về bệnh lý và X quang một cách an toàn, đạt được hiệu suất tiên tiềnnhất với sự đảm bảo quyén riêng tư [15] Hình 2.9
© Phân tích dữ liệu y tế: Các tổ chức y tế có thể phân tích dữ liệu bệnh nhân
mã hóa để tìm ra xu hướng, mô hình và thông tin có giá trị mà không vi phạm quyền riêng tư của bệnh nhân
© Nghiên cứu y học: Dữ liệu y tế từ nhiều nguồn có thể được kết hợp và
phân tích mà vẫn bảo vệ được thông tin nhạy cảm của từng cá nhân.
https://developer.nvidia.com/blog/federated-learning-with-homomorphic-encryption/ Truy cập
ngày (11/04/2024)
25
Trang 37CHƯƠNG 2 CƠ SỞ LÝ THUYET
¢ Bao mật dữ liệu đám mây:
© Lưu trữ an toàn: Homomorphic encryption cho phép dữ liệu được mã hóa
lưu trữ trên các dịch vụ đám mây mà không cần lo ngại về bảo mật Cácphép toán có thể được thực hiện trên dữ liệu mã hóa mà không cần giải
mã, đảm bảo tính bảo mật và riêng tư.
© Tính toán đám mây: Người dùng có thể gửi dữ liệu mã hóa lên đám mây,
thực hiện các phép toán cần thiết, và nhận kết quả mã hóa về để giải mã
mà không tiết lộ dữ liệu ban đầu cho nhà cung cấp dịch vụ đám mây
¢ Bao mật trong IoT (Internet of Things):
© Phân tích dữ liệu IoT: Dữ liệu từ các thiết bị IoT có thể được mã hóa va
phân tích mà không làm lộ thông tin nhạy cảm, bảo vệ sự riêng tư của
người dùng.
© Giao tiếp an toàn: Các thiết bị IoT có thể trao đổi thông tin mã hóa và
thực hiện các phép toán trên dữ liệu mã hóa, đảm bảo an toàn trong quá
trình giao tiếp.
2.5 Hàm tổng hợp (Aggregation)
Quá trình "Aggregation" (Tổng hợp) đóng vai trò quan trọng trong việc kết hợp các
mô hình học máy cục bộ từ nhiều thiết bị khác nhau để tạo ra một mô hình toàn cầu