1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khóa luận tốt nghiệp Mạng máy tính và truyền thông dữ liệu: Tăng cường bảo mật và tự động hóa cho hệ thống chăm sóc sức khỏe thông minh dựa trên IoT và học liên kết

75 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tăng Cường Bảo Mật Và Tự Động Hóa Cho Hệ Thống Chăm Sóc Sức Khỏe Thông Minh Dựa Trên IoT Và Học Liên Kết
Tác giả Nguyen Khanh Duy, Huynh Phu Loi
Người hướng dẫn PGS.TS Lê Trung Quân, ThS. Nguyễn Khánh Thuật
Trường học Đại Học Quốc Gia Thành Phố Hồ Chí Minh
Chuyên ngành Mạng Máy Tính Và Truyền Thông
Thể loại khóa luận tốt nghiệp
Năm xuất bản 2024
Thành phố Thành Phố Hồ Chí Minh
Định dạng
Số trang 75
Dung lượng 76,16 MB

Nội dung

Các biện pháp bảo mật như mã hóa dữ liệu, phân quyền truy cập, và kỹ thuật mã hóa được áp dụng để đảm bảo tính riêng tư và an toàn cho đữ liệu y tế trong quá trình truyền tải và xử lý..

Trang 1

ĐẠI HỌC QUOC GIA THÀNH PHO HO CHÍ MINH

TRUONG DAI HOC CONG NGHE THONG TIN KHOA MẠNG MAY TÍNH VÀ TRUYEN THONG

NGUYEN KHANH DUY - 20521240

HUYNH PHU LỢI - 20521555

KHOÁ LUẬN TỐT NGHIỆP

TĂNG CƯỜNG BẢO MẬT VÀ TỰ ĐỘNG HÓA CHO HỆ

ENHANCING SECURITY AND AUTOMATING FOR SMART

EHEALTHCARE SYSTEM BASED ON IOT AND FEDERATED

LEARNING

CU NHÂN NGANH MẠNG MAY TÍNH VA TRUYEN THONG DU LIEU

GIANG VIEN HUGNG DAN

PGS.TS LE TRUNG QUAN

ThS NGUYEN KHANH THUAT

TP HO CHÍ MINH, 2024

Trang 2

LỜI CẢM ƠN

Trong suốt quá trình học tập và làm khóa luận tốt nghiệp chúng em luôn được

sự quan tâm, hướng dẫn và giúp đỡ tận tình của các thay, cô trong Khoa Mang MáyTính Và Truyền Thông đặc biệt là sự động viên và giúp đỡ của bạn bè đồng nghiệp

Lời đầu tiên chúng em xin được bày tỏ lòng biết ơn sâu sắc đến Ban giám hiệu

Trường Đại Học Công Nghệ Thông Tin, và phòng thực hành E3.1 đã tận tình giúp

đỡ chúng em suốt thời gian thực hiện đồ án

Đặc biệt chúng em xin bày tỏ lòng biết ơn chan thành sâu sắc tới thầy PGS.TS Lê

Trung Quân, thầy ThS Nguyễn Khánh Thuật và các thầy ở Phòng thí nghiệm thực

hành mang máy tính và truyền thông E3.1 đã trực tiếp giúp đố, hướng dẫn chúng em hoàn thành khóa luận tốt nghiệp này.

Tuy nhiên trong quá trình thực hiện khóa luận tốt nghiệp, do kiến thức còn hạn

chế nên chúng em còn nhiều thiếu sót khi tìm hiểu, đánh giá về dé tài Rất mongnhận được sự quan tâm, góp ý của các thầy/ cô giảng viên để dé tài của chúng emđược đầy đủ và hoàn chỉnh hơn

Chúng em xin chân thành cảm ơn!

Nhóm tác giả

li

Trang 3

TOM TAT

Trong thời đại số hóa ngày nay, hệ thống chăm sóc sức khỏe thông minh đã trởthành một xu hướng quan trọng, mang lại nhiều lợi ích đáng kể cho cả bệnh nhân

và nhà cung cấp dịch vụ y tế Kết hợp giữa Internet of Things (IoT) và Federated

Learning (FL), hai công nghệ tiên tiến, hứa hẹn mở ra một tương lai mới đầy tiềm

năng cho lĩnh vực chăm sóc sức khỏe.

Trong lĩnh vực y tế, thông tin bệnh nhân là dữ liệu nhạy cảm và cần được bảo vệmột cách nghiêm ngặt Hệ thống IoT thu thập dữ liệu từ các thiết bị y tế, như cảmbiến sức khỏe và thiết bị theo dõi, và truyền dữ liệu này đến các nút cục bộ cho việc

xử lý và huấn luyện mô hình FL Các biện pháp bảo mật như mã hóa dữ liệu, phân quyền truy cập, và kỹ thuật mã hóa được áp dụng để đảm bảo tính riêng tư và an toàn cho đữ liệu y tế trong quá trình truyền tải và xử lý.

Áp dụng tự động hóa vào quy trình giúp làm giảm thời gian và công sức của

nhân viên y tế, đồng thời tăng cường độ chính xác và hiệu suất Hệ thống có thể tựđộng phát hiện và báo cáo các biểu hiện bất thường trong sức khỏe của bệnh nhândựa trên dữ liệu được thu thập từ các thiết bị IoT FL giúp cập nhật mô hình học máy

trên dữ liệu phân tán từ nhiều nguồn khác nhau một cách tự động, đồng nhất và bảo

mật.

Việc tích hợp IơT va FL trong hệ thông chăm sóc sức khỏe thông minh không chi

mang lại lợi ích về tự động hóa và tăng cường hiệu suất mà còn đảm bảo tính riêng

tư và an toàn của dữ liệu y tế, góp phần nâng cao chất lượng phục vụ và quản lý sức

khỏe cho người dùng.

1H

Trang 4

MỤC LỤC

Thông tin hội đồng bảo vệ khóa luận

Lời cảm ơn

Tóm tắt

Mục lục

Danh mục các bảng

Danh mục các hình vẽ va đồ thị

Danh mục từ viết tắt

Chương1 Mở dau

1.1

1.2

1.3

1.4

1.5

1.6

Các nghiên cứu liên quan

-Mục tiêu, đối tượng và phạm vi nghiên cứu

-1.3.1 Mục tiêunghiên cỨu

1.3.2 Đối tượng nghiêncứu

-143.3 Phạmvinghincứu

Phương pháp nghiên cứu

Các đóng góp chính của để

tài -Câu trúc Khoá luận tốt

nghiệp -Chương 2 Co sở lý thuyết 2.2 2.1.2 Cách Federated Learning hoạtđộng

213 Nhượcđiểểm Ặ Ặố Học sâu (Deep Learning)

-2.2.1 Cách thức hoạt động của học sâu

2.2.2 Ưu và nhược điểm của học sâu

1V

ii

iii

iv

Vili

ix

xi

NA YN DA Wun +> Ff

‘eo

Trang 5

2.3.7 Pre-Trained Models: 19

2.3.7.1 ResNet 0 eee ee ee 19 2.3.7.2 ANGSNcH5 x6 ^ NA www weet 19 2.3.7.3 ResNet5U: 0.0.2 00 0000 20 2.3.7.4 DenseNetl6ó9: 21

2.3.8 Ưu và nhược điểm của các Pre-Trained Models 22

2.3.8.1 ResNet 2 ee ee 22

2.3.8.2 ResNetI52 0.020000 2 0 22 2.3.8.3 ResNet5O 0.00002 eee ee 23

2.5.5 FedlrimmedAvg Ặ.Ặ ee eee 27

Chương 3 Phương pháp thực hiện 28

3.1 Thiết kế kiến trúc hệ thống tổng quan 28

Trang 6

MỤC LỤC

3.1.1 Xác định mục tiêu chính, mô hình hệ thống và đối tượng hệ

thống sẽ phục

vụ -3.1.1.1 Mục tiêuchính

3.1.1.2 Môhìnhhệthống

3.1.1.3 Flowchart cuahéthéng

3.1.1.4 Flowchart Add Client

3.1.2 Các công nghệ và nền tang mà hệ thống sẽ sử dung

3.1.3 Đối tượng mà ứng dụng phục vụ

3.14 Ứng dụng

hệthống -3.2 Triển khai mô hình Deep Learning & Federated Learning .

3.2.1 Bộdữliệu Ặ.ẶẶẶ ee ee ee 3.2.2 Triển khai mô hình Học sâu

3.2.2.1 Triển khai môhìnhhCNN

3.2.2.2 Triển khai mô hình các mô hình pre-trained

3.3 Triển khai mô hình Học liên kết

-3.4 Tăng cường bảo mật dif liệu bằng phương pháp Homomorphic En-CTYPUON QC Q Q Q HQ HQ va Chương 4 Thực nghiệm, đánh giá và thảo luận 4.1 So sánh, đánh giá giữa mô hình học tập trung và mô hình học liên kết 4.2 Thực nghiệm so sánh sự thay đổi độ chính xác khi thay đổi tỉ lệ dataset giữa 2 client 2 2.2 0 2 eee ee eee 4.3 So sánh hiệu suất và thời gian huấn luyện giữa các hàm tổng hợp 4.4 So sánh kết quả của các lần train trên nhiều model khác nhau giữa FL&FL+HE

Chương 5 Kết luận và hướng phát triển 51 Kétluan nu va 52 Hạnchế Ống ee 5.3 Hướng pháttriển

Tài liệu tham khảo

VI

45

50

53 53

54 57

58

60 60 60 60

64

Trang 7

MỤC LỤC

Phụ lục A Công bố khoa học

vil

64

Trang 8

3.2

4.1

4.2

4.3

4.4

4.5

4.6

DANH MUC CAC BANG

Phân bố các trường hợp lành tính & ác tinh trong tập dữ liệu 45

Kiến trúc và tham số của mô hnhCNN 47

Kết quả thực nghiệm chạy trên mô hình tập trung 53

Kết quả thực nghiệm chạy trên mô hình học liên kết 53

Kết quả huấn luyện mô hình CNN khi thay đổi tỷ lệ dif liệu giữa hai Kết quả huấn luyện mô hình ResNet152 khi thay đổi tỷ lệ dữ liệu giữa hai clent Q Q ee ee 56 Kết quả huấn luyện trên các hàm tổng hợp khác nhau 57

Kết quả so sánh giữa khi sử dụng FL và FL+HE 58

VII

Trang 9

DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ

1.1 FedMLLIbrary 0000 eee eee 2

2.1 Hình minh họa cách hoạt động của Federated Learning 9

2.2 Cơ chế của Federated Learning - 11

2.3 Deep Learning Archiecture 12

2.4 Hình minh họa cách hoạt động củaCNN 15

2.5 Hình minh họa ResNet Architecture 19

2.6 Hình minh họa ResNetl52 Architecture 20

2.7 Hình minh họa ResNet50 Architecture 21

2.8 Hình minh họa DensNet169 Architectue 21

2.9 Hình minh họa mã hóa đồngcấu 25

3.1 MainnSystenModel 29

3.2 Các thành phần trongFLServer 30

3.3 Các thành phan trong FL Client 31

3.4 Flowchart của quá trình tran -.- 32

3.5 Flowchart của quá trình add clien - 34

3.6 Màn hình đăng nhập của hệ thống - 37

3.7 Dashboard Q Q Q ee ee 37 3.8 AddClient Ặ 2 Q Q Q Q Q Q H ee 38

3.9 ManageClien Q Q Q Q Q Q Q H ee ee 38 3.10 Training Model Ặ.ẶẶ ee 39 3.11 GetResult 2 Q Q Q Q Q H Q Q ee Vo 40 3.12 Mongoonl Ặ Ặ Ặ Q HQ HH 40

3.14 server-returntoken 2 2 ee ee 41

1X

Trang 10

3.25 Luéng dữ liệu của mô hìnhFL 50 3.26 Luéng dữ liệu của mô hình FL kết hợp với HE 52

Trang 11

DANH MỤC TU VIET TAT

AIoT Artificial Intelligence of Things

API Aplication Programing Interface

CNN Convolutional Neural Network

DensNet Dense Convolutional Network

FedAvg Federated Averaging

FedAvgM Federated Averaging with Momentum

FedOpt — Federated Optimization

FHE Fully Homomorphic Encryption

FL Federated Learning

HE Homomorphic Encryption

IoMT Internet of Medical Things

Tol Internet of Things

ML Machine Learning

MRI Magnetic Resonance Imaging

NN Neural Networks

ReLU Rectified Linear Unit

ResNet Residual Network

XI

Trang 12

Chương 1 MỞ ĐẦU

1.1 Lý do chọn dé tài

Học liên kết (Federated Learning (FL)) và Internet vạn vật (Internet of Things (IoT))hiện đang là các lĩnh vực đầy tiềm năng và cần thiết trong thời đại 4.0 ngày nay, việc

nghiên cứu về nó mang lại nhiều thành tựu quan trọng cho đời sống hàng ngày nói

chung và ở lĩnh vực y tế nói riêng vì [1]:

» Dữ liệu y tế là thông tin nhạy cảm và đòi hỏi mức độ bảo mật cao nhất để đảm

bảo tính riêng tư và tuân thủ các quy định pháp luật Kết hợp giữa lol và FL

giúp giảm thiểu rủi ro liên quan đến việc truyền tải và lưu trữ dữ liệu y tế, từ

đó nâng cao mức độ bảo mật và tin cậy của hệ thống [2].

* Tự động hóa các quy trình trong chăm sóc sức khỏe giúp tối ưu hóa công sức

và thời gian của các nhân viên y tế, từ đó tăng cường hiệu quả và chất lượng

phục vụ IoT cung cấp dữ liệu liên tục về sức khỏe của bệnh nhân, trong khi

FL cho phép cập nhật mô hình học máy một cách tự động và bảo mật trên dữ

liệu phân tán [3].

» Kết hợp giữa IoT và FL cho phép hệ thống chăm sóc sức khỏe thông minh phát

hiện và dự đoán các van đề sức khỏe sớm hơn, từ đó giúp cung cấp chăm sóc

cá nhân hóa và phòng ngừa bệnh tốt hơn Tính toàn diện của dữ liệu từ IoT va

tính bảo mật của FL làm cho quá trình này trở nên hiệu quả và an toàn hơn [4].

1.2 Các nghiên cứu liên quan

Khi Internet vạn vật và Trí tuệ nhân tạo kết hợp với nhau (Artificial Intelligence of Things (AIoT)) đã tạo ra một loạt ứng dụng trong moi mặt của đời sống Sự kết hợp

này dẫn đến sự phát triển mạnh mẽ của các ứng dụng nhằm mục đích hỗ trợ con

người trong cuộc sống hàng ngày Trong lĩnh vực y tế, sự kết hợp giữa AloT và phân

tích hình ảnh bằng Machine Learning (ML) đang mang lại những cải tiến đáng kể

trong việc chăm sóc sức khỏe và điều trị bệnh [5], hình 1.1 Với AIoT, các thiết bị y

tế như máy đo huyết áp thông minh, điện tâm đồ di động và cảm biến theo dõi sứckhỏe đã trở nên thông minh hơn bằng cách kết nối va chia sẻ dữ liệu trực tuyén[6]

1

Trang 13

CHUONG 1 MỞ ĐẦU

Điều này giúp bác sĩ và nhà điều dưỡng có thể theo dõi sức khỏe của bệnh nhân từ

xa và dua ra các phản ứng kip thời Trong khi đó, khả năng phân tích hình anh của

ML đã cung cấp một công cụ mạnh mẽ trong việc chẩn đoán bệnh và theo dõi tiếntriển của bệnh Các hệ thống phân tích hình ảnh có thể nhận diện các dấu hiệu của

bệnh từ hình ảnh chụp từ em-rai (Magnetic Resonance Imaging (MRI)), CT scan,

hoặc cả hình ảnh chụp bề mặt da Điều này giúp giảm thời gian và chi phí cho quátrình chẩn đoán, cũng như tăng khả năng phát hiện sớm các bệnh lý Sự phản hồi

nhanh của hệ thống AIoI và ML cũng là yếu tố quan trọng trong việc cung cấp dịch

vụ y tế hiệu quả Từ việc phát hiện các biểu hiện bat thường trong dữ liệu sức khỏeđến việc tự động gợi ý liệu pháp điều trị, các hệ thống này giúp cải thiện quy trìnhchăm sóc và giảm thiểu nguy cơ sai sót Do đó, nhiều ứng dụng chăm sóc sức khỏe

dựa trên Internet of Medical Things (IoMT) được triển khai và sử dụng trong cuộc sống hàng ngày [7].

Mobile, loT (Ti So) Standalone

FedML-Mobile FedML-loT

j H { H H H H {

| [Android NVIDIA loTs

i iOS RaspBerry Pi FedAvg |{ FedOpt || FedNova | [FedNAS |

H

H i

MPI || MOTT | Other Backend | PyTorch | Mobile Training | '

Distributed Communication Training Engine '

Hình 1.1 Hình minh họa thu viện FedML.!

'He, C., Li, S., So, J., Zeng, X., Zhang, M., Wang, H., & Avestimehr, S (2020) Fedml: A

research library and benchmark for federated machine learning arXiv preprint arXiv:2007.13518.

Trang 14

CHUONG 1 MỞ ĐẦU

Theo truyền thống, các mô hình học máy (ML) sử dung quá trình tổng hợp vàhọc tập dữ liệu tập trung, điều này là không thực tế trong khuôn khổ chăm sóc sứckhỏe do các vấn dé về quyền riêng tư và bảo mật dữ liệu ngày càng gia tăng (do dữ

liệu về y tế và sức khỏe bệnh nhân là riêng tư) Học tập Liên kết (FL) đã được coi

là một mô hình tập thể phân tán đang phát triển, phù hợp nhất cho khuôn khổ chăm

sóc sức khỏe hiện đại, quản lý các bên liên quan khác nhau (ví dụ: bệnh nhân, bệnh

viện, phòng thí nghiệm, v.v.) để thực hiện đào tạo các mô hình mà không cần traođổi thực tế của dữ liệu y tế nhạy cảm Tuy nhiên, các lo ngại về đạo đức và quy định

về quyển riêng tư ngăn chặn việc chia sẻ tự do của dif liệu y tế Các kỹ thuật mã hóa

như mã hóa toàn diện (Fully Homomorphic Encryption (FHE)) cho phép đánh giá

trên dữ liệu đã được mã hóa [8] Sử dụng FHE, các mô hình học máy như học sâu

(Deep Learning - DL), đã được triển khai cho các ứng dụng bảo vệ quyền riêng tư

sử dụng dữ liệu y tế [9] Hình 1.2

naecán Qq

oa@ tỳ

Public & partial private key

- BÙ results

wae private keys 4 ae 4°

Cloud server

ee parameters Local parameters

User 1 User 2 User 3 User 4

Hình 1.2 Hình minh hoa phương pháp bảo mật với mô hình học liên kết.”

?Park, J., & Lim, H (2022) Privacy-preserving federated learning using homomorphic

encryp-tion Applied Sciences, 12(2), 734.

Trang 15

CHUONG 1 MỞ ĐẦU

Tự động hóa là một phan quan trong của FL, cho phép quy trình huấn luyện mô

hình diễn ra một cách tự động và đồng nhất trên nhiều nút phân tán Điều này không chỉ giúp tiết kiệm thời gian và công sức mà còn tăng cường hiệu suất và đảm bảo tính nhất quán của mô hình trên toàn hệ thống [10].

1.3 Mục tiêu, đối tượng và phạm vi nghiên cứu

1.3.1 Mục tiêu nghiên cứu

1) Xây Mô hình Convolutional Neural Network (CNN) trong việc huấn luyện và dựđoán trên các tập dataset về y tế:

« Xây dựng và tối ưu hóa mô hình CNN cho việc phân loại và dự đoán trên các

tập dataset chứa dữ liệu y tế.

* Nghiên cứu về cách sử dụng CNN để chẩn đoán bệnh, dự đoán kết quả điều

trị, hoặc phân loại các biểu hiện lâm sàng từ dữ liệu hình ảnh, dữ liệu y lệnh

hoặc dữ liệu văn bản trong lĩnh vực y tế

2) Mô hình FL để tăng tính bảo mật của dữ liệu và mô hình học máy.

¢ Phát triển và triển khai mô hình học máy phân tán dựa trên FL trong lĩnh vực

y tế

* Nghiên cứu cách tích hợp FL vào hệ thống chăm sóc sức khỏe thông minh để

tăng tính bảo mật của dữ liệu y tế và mô hình học máy, đồng thời giữ cho dữ

liệu tại chỗ mà không cần phải truyền dif liệu qua mang.

3) Homomorphic Encryption (HE) để thực hiện tính toán trên dữ liệu được mã hóa

mà không cần phải giải mã nó trước

¢ Nghiên cứu va phát triển các phương pháp và công nghệ HE để thực hiện các

tính toán trên dữ liệu y tế được mã hóa mà không cần giải mã trước

¢ Áp dụng HE vào các quy trình tính toán trong lĩnh vực y tế như phân tích dữ

liệu, huấn luyện mô hình học máy và dự đoán kết quả bệnh lý

4) Tự động hóa và đơn giản hóa quy trình làm việc cũng như triển khai máy học.

4

Trang 16

CHUONG 1 MỞ ĐẦU

¢ Nghiên cứu và phát triển các công cụ và quy trình để tự động hóa và đơn giản

hóa quy trình huấn luyện, triển khai và quản lý mô hình học máy trong môi trường y tế.

¢ Áp dung tự động hóa vào hệ thống chăm sóc sức khỏe để tối ưu hóa quy trình

làm việc của nhân viên y tế, cải thiện hiệu suất và tính linh hoạt của hệ thống

1.3.2 Đối tượng nghiên cứu

Hệ thống chăm sóc sức khỏe thông minh:

* Các thiết bị IoT y tế

» Hệ thống phần mềm quan lý dữ liệu y tế và sức khỏe.

s Các dịch vụ cham sóc sức khỏe từ xa.

Công nghệ IoT (Internet of Things):

* Các cảm biến và thiết bị IoT được sử dụng trong y tế

« Các Giao thức truyền thông giữa các thiết bị IơT

« Các phương thức thu thập và xử lý dữ liệu từ thiết bị IoT

Học liên kết (Federated Learning):

* Các thuật toán học liên kết áp dụng trong y tế

«Bảo mật và quyền riêng tư trong học liên kết

Bảo mật và quyển riêng tư trong hệ thống IoT y tế:

« Phương pháp mã hóa và bảo vệ dif liệu y tế.

* Các lỗ hổng và mối đe doa bao mật đối với hệ thống IoT y tế

Tự động hóa các quy trình trong chăm sóc sức khỏe:

* Tự động hóa trong việc huấn luyện các tập dataset

* Tự động hóa trong việc thêm các client vào hệ thống.

5

Trang 17

CHƯƠNG I MỞ ĐẦU

Các tập dataset: The Pima Indians diabetes, Chest-xray, Parkinson’s Drawings,

In-dicators of Heart Disease, The Lung Image Database Consortium (LIDC) va Image

Database Resource Initiative (DRI).

1.3.3 Pham vi nghiên cứu

° Nghiên cứu về cách tích hợp IoT va FL để xây dựng hệ thống chăm sóc sức

khỏe thông minh có khả nang tự động hóa và bao mật cao.

* Khao sát cách sử dụng công nghệ tự động hóa để cải thiện hiệu suất và hiệu

quả trong việc cung câp dịch vụ chăm sóc sức khỏe.

* Nghiên cứu về các vấn dé bảo mật đặc biệt liên quan đến dữ liệu y tế nhạy

cam.

* Nghiên cứu về cách FL có thể được áp dung trong lĩnh vực chăm sóc sức khỏe

để tạo mô hình dự đoán hoặc phân loại trên dữ liệu phân tán từ nhiều nguồnkhác nhau mà không cần truyền dữ liệu đến một trung tâm tập trung

1.4 Phuong pháp nghiên cứu

Nội dung 1: Thiết kế kiến trúc tổng quan:

» Xác định mục tiêu chính của hệ thống và đối tượng mà hệ thống sẽ phục vụ

* Nêu rõ các công nghệ và nền tang mà hệ thống sẽ sử dụng

Nôi dung 2: Triển khai mô hình Federated Learning và CNN:

« Giải thích cách mô hình Federated Learning hoạt động trong việc huấn luyện

mô hình trên dữ liệu phân tán từ nhiều nguồn

« Nêu rõ ưu điểm như bảo vệ quyền riêng tư, giảm lượng dif liệu di chuyển.

* Mô tả kiến trúc cơ bản của mạng nơ-ron tích chập và cách nó thực hiện quá

trình học từ dữ liệu hình anh.

» Nêu rõ sức mạnh của CNN trong việc phân loại và xử lý hình ảnh.

Trang 18

CHƯƠNG I MỞ ĐẦU

Nội dung 3: Bảo mật dữ liệu khi truyền bằng Homomorphic Encryption:

¢ Mô tả cách Homomorphic Encryption đóng vai trò trong việc bảo vệ dữ liệu

trước những mối đe dọa mạng

Nội dung 4: So sánh các hàm tổng hợp khác của Federated Learning:

* Mô tả cách các hàm tổng hợp trong Federated Learning chịu trách nhiệm gom

nhóm và tổng hợp thông tin từ các thiết bị người dùng phân tán.

* Nêu rõ tầm quan trong của các hàm tổng hợp trong quá trình đào tao mô hình

1.5 Các đóng góp chính của đề tài

* Tăng cường bảo mật cho dữ liệu y tế.

¢ Tự Động Hóa Quy Trinh Chăm Sóc Sức Khỏe

¢ Ap Dung Federated Learning trong Hệ Thống Chăm Sóc Sức Khỏe

* Ung Dung Homomorphic Encryption (TenSeal) để bảo vệ dữ liệu

1.6 Cấu trúc Khoá luận tốt nghiệp

Khóa luận với đề tài “TĂNG CƯỜNG BẢO MẬT VÀ TỰ ĐỘNG HÓA CHO HỆTHONG CHAM SOC SỨC KHỎE THONG MINH DUA TREN IOT VÀ HỌC

LIEN KET” được trình bay bao gồm 5 chương Nội dung tóm tat từng chương được

trình bày như sau:

* Chương 1: Mở đầu Lý do chọn dé tài, các công trình nghiên cứu liên quan

& phương pháp thực hiện cho đề tài

* Chương 2: Cơ sở lý thuyết Nêu định nghĩa và các công nghệ sử dụng trong

đề tài

* Chương 3: Phương pháp thực hiện Thiết kế kiến trúc và triển khai ứng

dụng

Trang 19

CHƯƠNG 1 MỞ ĐẦU

« Chương 4: Thực nghiệm và đánh giá Tiến hành chạy thử nghiệm và tổng

hợp các kết quả đạt được

* Chương 5: Kết luận và hướng phát triển Kết luận dựa trên các đánh giá ở

chương 4, đề xuất ý kiến và các công việc trong tương lai

Trang 20

Chương 2 CƠ SỞ LÝ THUYET

Federated Learning (FL) là một phương pháp máy học cho phép huấn luyện môhình trên dữ liệu phân tán ma không cần chuyển dif liệu về một mô hình tập trung.Thay vì gửi dữ liệu về trung tâm để huấn luyện mô hình, thiết bị hoặc nguồn dữ liệu

tại các điểm cuối (như thiết bị di động, cảm biến IơT) thực hiện việc huấn luyện mô hình trên dữ liệu của chính mình Sau đó, các tham số được cập nhật và kết hợp

để tao ra một mô hình toàn cầu Khi kết hợp với AIoT (Artificial Intelligence of

Things), FL trở thành một công cụ mạnh mẽ cho các lĩnh vực chăm sóc sức khỏe

thông minh.

2.1 Federated Learning

Federated Learning (thường được gọi là hoc liên kết) là một phương pháp phi tậptrung để dao tạo các mô hình học máy Nó không yêu cầu trao đổi dữ liệu từ các

thiết bị khách hàng (client) đến các máy chủ toàn cầu Thay vào đó, đữ liệu nguyên

gốc trên các thiết bị biên được sử dụng để đào tạo mô hình cục bộ, từ đó nâng cao

quyên riêng tư dữ liệu Cuối cùng, mô hình được hình thành bằng cách tổng hợp các

ban cập nhật cục bộ Được minh họa trong hình 2.1.

FL Clients

Ela Bees Local Training x

Private Data Local Model

lÌm seo Local Training

Private Data Local Model

[=Ð

ED | a

[=Ð

Hình 2.1 Hình minh họa cách hoạt động của Federated Learning.!

‘https://nvflare.readthedocs.io/en/main/fl_introduction.html (Truy cập ngày: 10/05/2024)

Trang 21

CHƯƠNG 2 CƠ SỞ LÝ THUYET

2.1.1 Federated Learning quan trọng bởi những lí do sau:

* Quyên riêng tư: Khác với các phương pháp truyền thống, trong đó dữ liệu được

gửi đến máy chủ tập trung để đào tạo, Federated Learning cho phép đào tạocục bộ trên thiết bị biên, ngăn chặn lỗ hổng dữ liệu tiềm năng

¢ An toàn, bao mật dữ liệu: Chi các bản cập nhật mô hình được mã hóa được

chia sẻ với máy chủ tập trung, đảm bảo bảo mật dữ liệu Ngoài ra, các kỹ thuật

tổng hợp an toàn như Secure Aggregation Principle cho phép giải mã chỉ các

kết quả được tổng hợp

* Truy cập vào dữ liệu không đồng nhất: Federated learning đảm bảo truy cập

vào dữ liệu được phân tán trên nhiều thiết bi, địa điểm và tổ chức Nó cho phép

đào tạo các mô hình trên dt liệu nhạy cảm, chẳng hạn như đữ liệu tài chính

hoặc chăm sóc sức khỏe trong khi vẫn duy trì bảo mật và quyển riêng tư Và

nhờ sự đa dạng dif liệu lớn hơn, các mô hình có thể mang tính tổng quát hơn.

2.1.2 Cách Federated Learning hoạt động

¢ Một mô hình cơ bản được lưu trữ trên máy chủ tập trung Các bản sao của mô

hình này được chia sẻ với các thiết bị khách hàng, sau đó các thiết bị này sẽ

đào tạo các mô hình dựa trên các dữ liệu cục bộ mà chúng tạo ra Theo thời

gian, các mô hình trên các thiết bị riêng lẻ trở nên cá nhân hóa và cung cấp trảinghiệm người dùng tốt hơn

To giai đoạn tiếp theo, các bản cập nhật (tham số mô hình) được đào tạo cục bộ

được chia sẻ với mô hình chính nằm ở máy chủ tập trung bằng cách sử dụng

các kỹ thuật tổng hợp an toàn (secure aggregation techniques) Mô hình này

kết hợp và trung bình hóa các đầu vào khác nhau để tạo ra các bài học mới

Vì dữ liệu được thu thập từ các nguồn đa dạng, nên có phạm vi lớn hơn và mô

hình trở nên tổng quát hơn.

« Khi mô hình trung tâm đã được đào tạo lại trên các tham số mới, nó lại được

chia sẻ với các thiết bị khách hàng cho lần lặp tiếp theo Với mỗi chu kỳ, các

10

Trang 22

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT

mô hình thu thập một lượng thông tin đa dạng và tiếp tục cải thiện mà khôngtạo ra các lỗ hổng về quyền riêng tư Được minh hoa ở hình 2.2

‘Step 1: Server sharing initial Learnings (L1)

Step 2 : Updating local models and generating se Ss

new learnings using private data eo 0! )

Step 1: Server sharing initial Learning(L1)

Hình 2.2 Cơ chế của Federated Learning.”

2.13 Nhược điểm

Mặc dù học phân tán mang đến nhiều lợi ích, nó cũng đi kèm với một số thách thức

đáng kể:

* Quan lý đồng bộ: Việc đảm bảo sự đồng bộ giữa các mô hình va dữ liệu phân

tán trên nhiều thiết bị hoặc máy tính có thể trở nên phức tạp, đặc biệt khi cầntruyền tải dữ liệu và trọng số giữa chúng Điều này có thể dẫn đến tình trạng

tac nghẽn và giảm hiệu suất.

» Giao tiếp: Việc giao tiếp liên tục giữa các nút phân tán có thể tạo ra chi phí

mạng va độ trễ đáng kể, nhất là khi mô hình và dif liệu có kích thước lớn Việc

này có thể ảnh hưởng đến hiệu suất tổng thể của hệ thống và trải nghiệm người

dùng.

*https://vinbigdata.com/kham-pha/federated-learning-trong-thi-giac-may-tinh-huong-dan-chi-tiet-tung-buoc.html (Truy cap ngay: 20/01/2024)

II

Trang 23

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT

« Bảo mật: Bảo mật dữ liệu mô hình là một trong các van dé quan trọng cần

được quan tâm khi quản lý nhiều nút và thiết bị phân tán Nguy cơ vi phạm dữ

liệu và tấn công mạng có thể cao hơn trong môi trường phân tán.

« Chi phí: Việc quản lý và duy trì cơ sở hạ tầng mạng và hệ thống phân tán phức

tạp có thể dẫn đến chi phí triển khai và vận hành cao hơn so với các mô hìnhhọc tập truyền thống

Nhìn chung, học phân tán mang đến nhiều tiềm năng cho việc cải thiện hiệu suất vàkhả năng mở rộng của các mô hình học máy Tuy nhiên, cần phải giải quyết nhữngthách thức về đồng bộ, giao tiếp, bảo mật và chi phí để đảm bảo triển khai thànhcông các hệ thống học phân tán

2.2 Học sau (Deep Learning)

Học sâu (Deep Learning) là một nhánh con của hoc máy (Machine Learning) sử

dụng các mạng nơ-ron nhân tao (Convolutional Neural Networks - CNN) có cấu trúc sâu để học hỏi từ dữ liệu hình ảnh Mạng nơ-ron nhân tạo được lấy cảm hứng

từ cấu trúc và hoạt động của não bộ con người, bao gồm nhiều lớp nơ-ron được kết

nối với nhau bằng các khớp nối (Synapse), hình 2.3

Artificial

Intelligence

Machine Learning

Data

Science

Deep

Learning

Hình 2.3 Kiến trúc Deep Learning.”

3https:/www.geeksforgeeks.org/introduction-deep-learning/ (Truy cập ngày: 20/01/2024)

12

Trang 24

CHƯƠNG 2 CƠ SỞ LÝ THUYET

2.2.1 Cách thức hoạt động của học sâu

° Một mạng nơ-ron bao gồm nhiều lớp khác nhau, càng nhiều lớp thì mạng sé

càng “sâu” Trong mỗi lớp là các nút mạng và được liên kết với các lớp khác

bên cạnh.

* Mỗi kết nối giữa các nút sẽ có một trọng số tương ứng, trọng số càng cao thì

mức độ ảnh hưởng của kết nỗi này đến mạng no-ron sẽ càng lớn

° Mỗi nơ-ron có một chức năng kích hoạt, về cơ bản sẽ chịu trách nhiệm "chuẩn

hóa” dau ra từ nơ-ron này.

* Dữ liệu được người dùng nhập vào mang thần kinh di qua tat cả các lớp va trả

về kết quả ở lớp cuối cùng, được gọi là lớp đầu ra

« Trong quá trình đào tạo mô hình mạng nơ-ron, các trọng số sẽ được thay đổi

và nhiệm vụ của mô hình là tìm tập giá trị của các trọng số sao cho phán đoán

đúng nhất

2.2.2 Ưu và nhược điểm của học sâu.

2.2.2.1 Ưu điểm:

« Cấu trúc Neural Networks (NN) dễ dàng thay đổi linh hoạt để phù hợp với

nhiều thuật toán và bài toán khác nhau.

* Có khả năng giải nhiều van đề phức tạp với độ chính xác cao

* Có khả năng thực hiện tính toán song song với hiệu năng tốt và xử lý lượng dữ

liệu lớn.

2.2.2.2 Nhược điểm:

* Deep Learning thường doi hỏi một lượng lớn tài nguyên tính toán và bộ nhớ,

đặc biệt khi làm việc với các mô hình lớn và phức tạp Việc huấn luyện các

mô hình này đòi hỏi phần cứng mạnh mẽ như GPU hoặc TPU, dẫn đến chi phí

cao.

13

Trang 25

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT

* Quá trình huấn luyện các mô hình deep learning có thể mất rất nhiều thời gian,

đặc biệt với các bộ dữ liệu lớn và các mô hình phức tạp Điều này có thể làm

chậm quá trình phát triển và triển khai các ứng dụng.

2.2.3 Ứng dụng

* Học sâu có các đóng góp đáng kể cho lĩnh vực y tế, trong đó các mô hình phổ

biến bao gồm mô hình dự đoán bệnh, chẩn đoán ung thư, phân tích kết quả

chụp MRI, X-quang

* Doanh nghiệp có thé ứng dung Deep Learning để hiểu và phán đoán cảm xúc

của khách hàng dựa trên các đánh giá, bình luận, feedback từ đó đưa ra các

chiến lược kinh doanh, marketing phù hợp với từng phân khúc khách hàng.

s Nhận dạng hình ảnh (Image Recognition): Các mô hình deep learning như

CNN (Convolutional Neural Networks) được sử dung để nhận dạng và phân loại hình ảnh trong các ứng dụng như phân loại đối tượng, nhận diện khuôn

vực học sâu (Deep Learning) cho các nhiệm vụ xử lý ảnh (Image Processing) và

nhận dạng hình ảnh (Computer Vision) CNN được lấy cảm hứng từ cấu trúc thịgiác của sinh vật học, với khả năng trích xuất các đặc trưng (Feature) từ dữ liệu hình

ảnh một cách hiệu quả, hình 2.4.

14

Trang 26

CHƯƠNG 2 CƠ SỞ LÝ THUYET

Input n1 channels n1 channels n2 channels n2 channels

n3units Output

Hình 2.4 Hình minh hoa cách hoạt động của CNN *

2.3.2 Cau trúc:

Một mạng CNN cơ bản bao gồm các lớp sau:

¢ Lớp đầu vào (Input Layer:) Đây là lớp nhận dữ liệu đầu vào, chẳng hạn như

hình ảnh, và chuẩn bị dữ liệu cho các lớp tiếp theo Dữ liệu thường được biểu

diễn dưới dạng ma trận.

» Lớp tích chập (Convolutional Layer): Lớp này thực hiện phép tích chập

(convolution) giữa dữ liệu đầu vào và các bộ lọc (filters) để tạo ra các đặc

trưng (feature maps) Mỗi bộ lọc thường là một ma trận nhỏ trượt qua toàn bộ

dữ liệu đầu vào, áp dụng các phép nhân và cộng để trích xuất các đặc trưng

¢ Lớp kích hoạt (Activation Layer): Lớp này áp dụng một hàm kích hoạt,

chẳng hạn như Rectified Linear Unit (ReLU), để giới thiệu tính phi tuyến tính

vào mô hình Hàm kích hoạt giúp mạng học các mối quan hệ phi tuyến từ dữ

liệu.

» Lớp gop (Pooling Layer): Lớp này giảm kích thước của các đặc trưng (feature

maps) bang cách chọn các giá trị đại diện trong các vùng con của đặc trưng.

*https://www.researchgate.net/figure/A-vanilla-Convolutional-Neural-Network-CNN-represenfation_fig2_ 339447623 (Truy cập vào ngày: 04/02/2024)

15

Trang 27

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT

Phổ biến nhất là gộp cực đại (Max Pooling) và gộp trung bình (Average

Pool-ing) Điều này giúp giảm số lượng tham số và tính toán, cũng như giảm nguy

cơ overfitting.

- Lớp làm phẳng (Flatten Layer): Lớp này chuyển đổi các đặc trưng đa chiều

(multi-dimensional feature maps) thành một vector một chiều để chuẩn bị cho

các lớp kết nối đầy đủ (lớp dày đặc)

° Lớp kết nối đầy đủ (Fully Connected Layer hoặc Dense Layer): Lớp này

kết nối tất cả các nơ-ron trong lớp trước với mỗi nơ-ron trong lớp này Đây là

lớp thường được sử dụng để thực hiện các phép toán cuối cùng và đưa ra dự

đoán.

° Lớp đầu ra (Output Layer): Lớp này tạo ra các dự đoán cuối cùng của mạng.

Nếu đó là bài toán phân loại, lớp này thường sử dụng hàm kích hoạt Softmax

để tạo ra xác suất cho từng lớp Nếu là bài toán hồi quy, lớp này có thể sử dụngcác hàm kích hoạt khác tùy thuộc vào yêu cầu cụ thể

2.3.3 Các hoạt động chính:

» Tích chap (Convolution): Là phép toán toán hoc cơ bản trong CNN, thực

hiện bằng cách di chuyển bộ lọc (kernel) trên dữ liệu đầu vào và tính toán tổngtích sản giữa các giá trị tương ứng Kích thước và số lượng bộ lọc quyết địnhmức độ phức tạp của các đặc trưng được trích xuất

Mục đích: Phát hiện các đặc trưng cục bộ trong dữ liệu, chẳng hạn như các

cạnh, góc, và các chi tiết khác trong hình ảnh

* Kích hoạt (Activation): Giúp giới hạn giá trị đầu ra của nơ-ron, giới thiệu

tính phi tuyến vào mô hình và cho phép mô hình học được các hàm phi tuyến

phức tạp Hàm kích hoạt phổ biến bao gồm ReLU, sigmoid, tanh, v.v

Mục đích: Giúp mang học các mối quan hệ phi tuyến trong dif liệu và tăng

khả năng biểu diễn của mạng.

« Gộp (Pooling): Giảm kích thước của dữ liệu, giúp giảm thiểu số lượng tham

số và kiểm soát độ phức tạp của mô hình, đồng thời tăng cường tính ổn định

16

Trang 28

CHƯƠNG 2 CƠ SỞ LÝ THUYET

của mô hình Các phương pháp gộp phổ biến bao gồm Max Pooling, Average

Pooling, Global Pooling, v.v.

Mục đích: Giảm số lượng tham số và tính toán trong mạng, cũng như giảm nguy cơ overfitting và tăng khả năng chịu đựng của mạng với các biến đối của

Kết nối day du (Fully Connected Layers): Các lớp này kết nối tat cả các

nơ-ron từ lớp trước với mỗi nơ-ron trong lớp hiện tại và thực hiện các phép tính

tổng trọng số cộng với bias

Mục đích: Tạo ra sự kết hợp toàn diện của các đặc trưng đã trích xuất để đưa

ra dự đoán cuối cùng.

Dự đoán (Prediction): Lớp đầu ra (output layer) tạo ra các dự đoán cuối

cùng của mạng Trong các bài toán phân loại, thường sử dụng hàm kích hoạt

Softmax để đưa ra xác suất cho từng lớp Trong các bài toán hồi quy, có thể sử

dụng hàm kích hoạt tuyến tính hoặc các hàm kích hoạt khác.

Mục đích: Dua ra kết quả cuối cùng dựa trên các đặc trưng đã được học

Hiệu quả trong việc xử lý các dữ liệu dạng lưới (Grid-like data) như ảnh, video.

Có thể áp dụng cho các nhiệm vụ đa dạng như phân loại ảnh, nhận diện đối

tượng, phân đoạn ảnh, v.v.

17

Trang 29

CHƯƠNG 2 CƠ SỞ LÝ THUYET

* Có khả năng duy trì hiệu suất cao ngay cả khi dữ liệu đầu vào có chứa nhiễu

* Hoạt động tốt với các mô hình học sâu và có thé tận dụng lợi thế của các tiến

bộ trong phần cứng tính toán, chẳng hạn như GPU

2.3.5 Nhược điểm:

« Việc huấn luyện và triển khai CNN yêu cầu tài nguyên phần cứng mạnh mẽ,

đặc biệt là khi làm việc với các mạng lớn và phức tạp.

¢ Hiệu suất của CNN phụ thuộc mạnh mẽ vào việc lựa chọn các siêu tham số

(Hyperparameters) như kích thước bộ lọc, số lượng lớp, learning rate, v.v.

* Thường yêu cầu một lượng dif liệu lớn để đạt được hiệu suất tốt.

2.3.6 Ứng dụng:

Nhờ khả năng mạnh mẽ trong việc xử lý và phân tích dữ liệu không gian, CNN đang

ngày càng được ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau, từ y tế, giao

thông, an ninh, đến giải trí và công nghiệp:

¢ Phân loại ảnh thành các lớp (Class) tương ứng, ví dụ như phân loại ảnh mèo,

ảnh chó, ảnh hoa, v.v.

» Xác định vị trí và lớp của các đối tượng trong ảnh, ví dụ như phát hiện người

đi bộ, ô tô, biển báo giao thông, v.v.

¢ Gan nhãn từng điểm ảnh trong ảnh vào lớp tương ứng, ví dụ như phân đoạn

ảnh y tê, anh ban do, v.v.

¢ Phân tích hình ảnh y tế như X-quang, MRI, CT scan để hỗ trợ chẩn đoán bệnh

lý.

* Phân tích ảnh vệ tinh để theo dõi biến đổi khí hậu, quản lý tài nguyên thiên

nhiên, v.v.

« Phát triển ứng dụng AR/VR, nhận diện các đối tượng trong môi trường thực

để tương tác với các yếu tố ảo.

18

Trang 30

CHƯƠNG 2 CƠ SỞ LÝ THUYET

2.3.7 Pre-Trained Models:

2.3.7.1 ResNet

Residual Network (ResNet) là một kiến trúc mang nơ-ron được He et al dé xuất

năm 2015, với mục dich giải quyết vấn dé "su thoái hóa hiệu suất" (performancedegradation) khi độ sâu của mạng nơ-ron tăng lên ResNet sử dụng một kiến trúc

"nhảy cóc" (skip connection) để kết nối các lớp đầu vào với các lớp đầu ra của các

khối mạng con (residual block).

Mỗi khối mạng con trong ResNet bao gồm hai lớp tích chập (convolutional layer) và một hàm kích hoạt (activation function), được kết nối bởi một "phép cộng" (addition)

giữa đầu vào và đầu ra của khối [1 I], hình 2.5

wou yo}eg

AUO2 / X7

2.3.7.2 ResNet152:

ResNet152 (Residual Network 152) là một mô hình mạng nơ-ron sâu được sử dụng

rộng rãi trong lĩnh vực học sâu, đặc biệt là cho các bài toán về nhận dạng và phân

loại hình ảnh ResNet152 thuộc họ mô hình Residual Networks (ResNet), được phát triển bởi các nhà nghiên cứu của Microsoft Research [11], hình 2.6.

Shttps://phamdinhkhanh github.io/2020/12/19/Resnet.html (Truy cập vào ngày: 10/04/2024)

19

Trang 31

CHƯƠNG 2 CƠ SỞ LÝ THUYET

ResNet50 (Residual Network 50) là một mang no-ron tích chập (CNN) có tổng cộng

50 lớp, nổi tiếng trong lĩnh vực học sâu và thị giác máy tính Sử dụng các khối mạng

con 1x1x1 và 3x3x3 (kích thước bộ lọc 1x1x1 cho một lớp) xen kế nhau Được phát

triển bởi các nhà nghiên cứu tại Microsoft Research và giới thiệu lần đầu tiên trong

bài báo "Deep Residual Learning for Image Recognition" năm 2015 [11], hình 2.7.

Shttps://www.kaggle.com/datasets/pytorch/resnet152 Truy cập vào ngày (10/04/2024)

20

Trang 32

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT

Stage 1 Stage 2 Slage3 Stage4 Stage 5

Hình 2.7 Hình minh họa ResNet50 Architecture 7.

2.3.7.4 DenseNet169:

DenseNet169 (Dense Convolutional Network (DensNet)) là một kiến trúc mạng nơron với độ sâu 169 lớp, sử dụng các khối mạng con 3x3x3, là biến thể của kiến trúcDenseNet với mục đích cải thiện hiệu suất học tập của ResNet bằng cách kết nối trựctiếp các lớp đầu ra của mỗi khối mạng con với đầu vào của các khối mạng con tiếp

theo Áp dụng kỹ thuật "growth rate" để điều chỉnh số lượng kênh đầu ra của mỗi

Feature Extraction Classification

Hình 2.8 Hình minh hoa DenseNet169 Architecture Š

Thttps://medium.com/@arashserej/resnet-50-83b3ff33be7d (truy cập vào ngày: 10/04/2024)

Shttps://www.linkedin.com/pulse/densenet-169-passline-mary-favqc/ (Truy cập vào ngày

(10/04/2024)

21

Trang 33

CHƯƠNG 2 CƠ SỞ LÝ THUYET

2.3.8 Ưu và nhược điểm của các Pre-Trained Models

2.3.8.1 ResNet

Ưu điểm:

* ResNet có thể được mở rộng ra các độ sâu rất lớn mà không làm giảm hiệu

suất hoặc gây khó khăn trong quá trình huấn luyện Điều này giúp tăng khả

năng biểu diễn và học hỏi của mạng.

» Kiến trúc ResNet rất linh hoạt, có thể được điều chỉnh cho phù hợp với nhiều

loại dữ liệu và bài toán khác nhau Nó đã trở thành nền tảng cho nhiều kiếntrúc mạng tiên tiến khác, chẳng hạn như ResNeXt, DenseNet, và các biến thể

khác.

« Cho phép gradient lan truyền trực tiếp đến các lớp ở đầu mạng nên giảm hiện

tượng vanishing gradient.

Nhược điểm:

° Mặc dù ResNet giúp giải quyết van dé gradient mat dần, nhưng các mạng rat

sâu đòi hỏi nhiều tài nguyên tính toán và bộ nhớ, làm tăng chi phí và thời gian huấn luyện.

» Việc thiết kế và điều chỉnh các tham số của ResNet có thể phức tạp và tốn thời

gian Người dùng cần phải tinh chỉnh các siêu tham số (hyperparameters) vàcau trúc của các khối residual một cách cẩn thận để đạt được hiệu suất tốt nhất

« Có thể dé dàng dẫn đến overfitting, đặc biệt là khi dữ liệu huấn luyện không

đủ lớn hoặc không đủ đa dạng.

2.3.8.2 ResNet152

Ưu điểm:

* ResNet152 đã chứng tỏ hiệu suất rất tốt trên nhiều bộ dữ liệu và bài toán khác

nhau, đặc biệt là trong các cuộc thi như ImageNet, nơi nó thường đạt được độ

chính xác cao hơn so với các mô hình nông hơn.

22

Trang 34

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT

* ResNet152 có thể duy trì gradient qua nhiều lớp, giúp việc huấn luyện các

mạng rất sâu trở nên khả thi.

* ResNet152 có thể được sử dụng trong nhiều bài toán khác nhau, từ phân loại

hình ảnh đến nhận dạng đối tượng, phân đoạn hình ảnh và nhiều ứng dụng

khác trong thị giác máy tính.

Nhược điểm:

« Gây khó khăn cho việc triển khai trên các thiết bị có tài nguyên hạn chế Do

ResNet152 yêu cầu nhiều tài nguyên tính toán và bộ nhớ hơn do số lượng lớp

lớn, làm tăng chi phí và thời gian huấn luyện.

«Việc thiết kế và tinh chỉnh một mô hình sâu như ResNet152 có thể phức tạp và

tốn nhiều thời gian Người dùng cần phải có kiến thức sâu về cau trúc mạng

và các siêu tham số để đạt hiệu suất tốt nhất

2.3.8.3 ResNet50

Ưu điểm:

« ResNet50 có khả năng đạt hiệu suất cao trong nhiều bài toán nhận dang và

phân loại hình ảnh.

«Với 50 lớp, ResNet50 có khả năng học và biểu diễn các đặc trưng phức tạp của

dữ liệu, giúp cải thiện độ chính xác trong các bài toán phân loại và nhận dạng.

* So với các biến thể sâu hơn như ResNet101 hay ResNet152, ResNet50 yêu cầu

ít tài nguyên tính toán và bộ nhớ hơn, làm cho nó phù hợp với nhiều ứng dụng

hơn, bao gồm cả những ứng dụng trong các môi trường tài nguyên hạn chế

Nhược điểm:

¢ ResNet50 phức tạp hơn so với các mô hình nông hơn như VGG16 hay AlexNet,

đòi hỏi nhiều thời gian và công sức hơn trong việc huan luyện và điều chỉnh.

° ResNet50 cũng gặp khó khăn trong việc giải thích và hiểu rõ lý do tại sao nó

đưa ra các quyết định cụ thể, làm giảm tính minh bạch của mô hình

23

Trang 35

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT

° Mặc dù ResNet50 yêu cau ít tài nguyên hơn so với các mô hình sâu hơn, nó

vẫn đòi hỏi một lượng tài nguyên đáng kể.

2.3.8.4 DenseNet169

on

Uu diém:

* DenseNet169 cho phép tái sử dung các đặc trưng đã học từ các lớp trước đó.

Điều này không chỉ giúp giảm số lượng tham số cần thiết mà còn tăng hiệu

quả của việc học đặc trưng.

* DenseNet169 thường đạt hiệu suất cao hơn trong các bài toán nhận dạng hình

ảnh và các tác vụ thị giác máy tính khác.

* DenseNet169 thường có khả năng tổng quát hóa tốt hơn, hoạt động tốt trên cả

tập huấn luyện và tập kiểm tra.

* DenseNet169 dé huấn luyện hơn và thường yêu cầu ít epochs hơn để đạt được

hiệu suất cao so với các mô hình truyền thống.

Nhược điểm:

* DenseNet169 có thể phức tap, đòi hỏi kiến thức sâu về mạng nơ-ron và các

siêu tham số để đạt hiệu suất tốt nhất

* DenseNet169 khó giải thích và hiểu rõ lý do tại sao nó đưa ra các quyết định

cụ thể, ảnh hưởng đến tính minh bạch của mô hình Điều này đặc biệt quantrọng trong các ứng dụng yêu cầu tính giải thích cao như y tế và pháp luật

* DenseNet169 có thể gặp khó khăn khi triển khai trong các hệ thống thời gian

thực hoặc trên các thiết bị nhúng, đòi hỏi các biện pháp tối ưu hóa đặc biệt đểđảm bảo hiệu suất hoạt động

2.4 Mã hóa đồng cấu (HE)

Mã hóa đồng cấu (HE) là việc chuyển đổi dữ liệu thành văn bản mã hóa có thể được

phân tích và xử lý như thể nó vẫn ở dạng ban đầu Mã hóa đồng cấu cho phép thực

24

Trang 36

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT

hiện các phép toán phức tạp trên dữ liệu được mã hóa mà không ảnh hưởng đến mã

hóa [13] và [14].

Học tập liên kết với mã hóa đồng cấu cho phép nhiều bên cùng đào tạo các mô hình

trí tuệ nhân tạo về bệnh lý và X quang một cách an toàn, đạt được hiệu suất tiên tiềnnhất với sự đảm bảo quyén riêng tư [15] Hình 2.9

© Phân tích dữ liệu y tế: Các tổ chức y tế có thể phân tích dữ liệu bệnh nhân

mã hóa để tìm ra xu hướng, mô hình và thông tin có giá trị mà không vi phạm quyền riêng tư của bệnh nhân

© Nghiên cứu y học: Dữ liệu y tế từ nhiều nguồn có thể được kết hợp và

phân tích mà vẫn bảo vệ được thông tin nhạy cảm của từng cá nhân.

https://developer.nvidia.com/blog/federated-learning-with-homomorphic-encryption/ Truy cập

ngày (11/04/2024)

25

Trang 37

CHƯƠNG 2 CƠ SỞ LÝ THUYET

¢ Bao mật dữ liệu đám mây:

© Lưu trữ an toàn: Homomorphic encryption cho phép dữ liệu được mã hóa

lưu trữ trên các dịch vụ đám mây mà không cần lo ngại về bảo mật Cácphép toán có thể được thực hiện trên dữ liệu mã hóa mà không cần giải

mã, đảm bảo tính bảo mật và riêng tư.

© Tính toán đám mây: Người dùng có thể gửi dữ liệu mã hóa lên đám mây,

thực hiện các phép toán cần thiết, và nhận kết quả mã hóa về để giải mã

mà không tiết lộ dữ liệu ban đầu cho nhà cung cấp dịch vụ đám mây

¢ Bao mật trong IoT (Internet of Things):

© Phân tích dữ liệu IoT: Dữ liệu từ các thiết bị IoT có thể được mã hóa va

phân tích mà không làm lộ thông tin nhạy cảm, bảo vệ sự riêng tư của

người dùng.

© Giao tiếp an toàn: Các thiết bị IoT có thể trao đổi thông tin mã hóa và

thực hiện các phép toán trên dữ liệu mã hóa, đảm bảo an toàn trong quá

trình giao tiếp.

2.5 Hàm tổng hợp (Aggregation)

Quá trình "Aggregation" (Tổng hợp) đóng vai trò quan trọng trong việc kết hợp các

mô hình học máy cục bộ từ nhiều thiết bị khác nhau để tạo ra một mô hình toàn cầu

Ngày đăng: 08/12/2024, 15:07

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN