1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khóa luận tốt nghiệp Truyền thông và mạng máy tính: Xây dựng hệ thống nhận diện gương mặt dựa trên nền tảng Blockchain và Federated Learning

115 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây dựng hệ thống nhận diện gương mặt dựa trên nền tảng Blockchain và Federated Learning
Tác giả Ngo Phuc Thinh, Nguyen Tran Minh Thien
Người hướng dẫn ThS Nguyen Khanh Thuat
Trường học Trường Đại học Công nghệ Thông tin
Chuyên ngành Mạng máy tính và Truyền thông Du liệu
Thể loại Khóa luận tốt nghiệp
Năm xuất bản 2022
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 115
Dung lượng 65,26 MB

Nội dung

Hiéu được vấn dé trên, nhóm tác giả dé xuất phát triển một hệ thống nhận diện gương mặt trên các công nghệ blockchain chuỗi khối va federated learning học cộng tác dé có thể bảo vệ hình

Trang 1

ĐẠI HỌC QUOC GIA TP HO CHÍ MINH TRUONG DAI HOC CONG NGHE THONG TIN KHOA MANG MAY TINH VA TRUYEN THONG

NGO PHUC THINH NGUYEN TRAN MINH THIEN

KHOA LUAN TOT NGHIEP

XAY DUNG HE THONG NHAN DIEN GUONG MAT

DUA TREN NEN TANG BLOCKCHAIN VA

FEDERATED LEARNING

BUILDING A FACE RECOGNITION SYSTEM BASED ON

BLOCKCHAIN AND FEDERATED LEARNING

KY SƯ NGÀNH MẠNG MAY TÍNH VA TRUYEN THONG DU LIEU

TP HO CHi MINH, 2022

Trang 2

ĐẠI HỌC QUOC GIA TP HO CHÍ MINH

TRUONG DAI HOC CONG NGHE THONG TIN

KHOA MANG MAY TINH VA TRUYEN THONG

NGO PHÚC THỊNH - 18521439 NGUYEN TRAN MINH THIỆN - 18521428

KHOA LUAN TOT NGHIEP XÂY DỰNG HE THONG NHAN DIỆN GƯƠNG MAT

DUA TREN NEN TANG BLOCKCHAIN VA

FEDERATED LEARNING

BUILDING A FACE RECOGNITION SYSTEM BASED ON

BLOCKCHAIN AND FEDERATED LEARNING

KY SƯ NGANH MẠNG MAY TÍNH VÀ TRUYEN THONG DU LIEU

GIANG VIEN HUONG DAN

ThS NGUYEN KHANH THUAT

TP HO CHÍ MINH, 2022

Trang 3

THONG TIN HOI DONG CHAM KHÓA LUẬN TOT NGHIỆP

Hội đồng cham khóa luận tốt nghiệp, thành lập theo Quyết định số

Ti8ầy của Hiệu trưởng Trường Đại học Công nghệ Thông tin.

Trang 4

trình thực hiện khóa luận mà còn là hành trang cho chặng đường phía trước.

Ngoài ra, chúng em cũng xin cảm ơn Ban lãnh đạo Trường Đại học Công nghệ Thông tin

cũng như các phòng ban của trường đã tạo điều kiện, cơ sở vật chất để chúng em có cơ

hội và môi trường học tập và rèn luyện.

Do kiến thức và khả năng lý luận còn nhiều hạn chế nên khóa luận vẫn còn những thiếu

sót nhất định Em rất mong nhận được những đóng góp của các thầy cô, anh chị và bạn

bè để khóa luận tốt nghiệp của chúng em được hoàn thiện hơn.

Cuối cùng, em xin kính chúc các thay cô giáo Ban lãnh đạo và các phòng ban chức năng

Trường Đại học Công nghệ Thông tin déi dào sức khỏe và thành công trong sự nghiệp.

Chúng em xin chân thành cảm ơn

Trang 5

MỤC LỤC

Chương 1 TONG QUAN e2tttitetrtrrrrretrrerrrrrrrre.Z

LiL Dat Van dé ẽẽ Ô

va ÔỎ

1⁄2⁄2 VG ứng dụng eeeeserrrerrrrrrrrrrrrro.Ö 1.3 Đối tượng nghiên cứu -eeeeeerererrrrrrrrrrrrrrrrrrreeereoeT

1.4 Phạm vi nghiên cứu -+-+e+eeeeertetrtrtrtrtrtrtrrrrrrrrrrrrrrrrrroou

1.5 Các công trình liên quan -c -ccceeeeeeeeeeeeeeerrrrsrseersoer Í

Chương 2 CƠ SỞ LÝ THUYẾT s+-esertereetrerrrrrrerrrrrerrererereÐ

2.1 Blockchain -hhtrHHHHHHHiirroD 2.1.1 Khái niệm Blockchain e ssc55sxveeecxvveeeerkrteererkrrsererkerrsrrrkrsee D

2.1.2 Kiến trúc blockchain eeeeeeeseeeierareu 2.1.3 Tông quan về thực hiện giao dich (Transaction) LO

2.1.4 Smart COnTaC( eeeeeeeeeeeerrrrrreroaeuer LD 2.1.5 Ethereum eceeeeiiiiiiiiiiiiiiiiriiearrruue LO

Trang 6

2.2.3 Phân loại Federated Learning -s«cceseeeeeeketrrierirrierike 26

2.2.4 Thuật tốn HH he 29

2.2.4.1 Federated Averaging (FedAv ) «-ceeeeririiiiirirree 29 2.2.4.2 Federated Stochastic Variance Reduced Gradient (FSVRG) 30 2.2.4.3, CO-OP,G HH HH HH HH hinh 32

2.2.5 _ Các biến thé của Federated Learning - c-eeciceeccceerrree 33

2.2.6 6® 1i s0 34

2.2.7 Ưu điểm và nhược điỂm -:++ceeceevvvvEEEEtrttreessevverrrrrrrrrree 35

2.2.8 _ Thách thức -cccccrittrriitEriirtiiiiiiiriiiieree 37

2.3 Nhận diện khuơn mặt (Face RecÒTnIfIOT)) -s-5-<sceserssesrresrrrrreee 38

Chương 3 CÀI ĐẶT HỆ THỐNG -2-:.2cttteetttretEtieetErrerrrrrerrrirrerre 40

3.1 Phnmẻm 4 AC 40

3.1.2 Cơng nghệ Web 3 ceriHhHHHH hy 42

3.1.2.1 Khái niệm . +.xrrrritrrirtrriirtriieriiriiiriiirirrree 42

3.1.2.2 Ưu điểm và nhược điỀm ::cecccettrtecvvEEEEtrieesvtrtrrrriseeerte 43

3.1.2.3 So sánh giữa Web 3.0 và Web 2.Ơ cekieiiike 45

3.1.3 Metamask HH này 46

3.1.4 — ReactJS HH HH ườ, 47 3.1.5 MongoDB ch HH ườt 48

3.1.6 FIT€SẨOF€ Ă HH he 49

3.2 PHAM CUM 7n ỒD 50

3.2.1 _ Je(son Namo eecsecssecssessessesseesseesseeseesseesseeneessseeaeenseeseeeaeenseeaseeaeenneesseeasenseenseeaeensees 50

3.2.1.1 Giới thiệu ceehHHnHHHnHỶH Hà HH HH 50

Trang 7

3.2.1.2 Ưu điểm và nhược điểm -++++++tttttreeeeeeseeveeevveeevre 52

3.2.2 Camera Raspberry Pi V2 «cchHhnHH nàng Hy 53

Chương 4 TRIỂN KHAI ỨNG DUNG ecssssssssssesssssesssnsesssnesssssesssnesssnsesnsnsesnseesneneesnenen 54

A.L Kiém tric hé th6ng wesscssssssssssssssssssssssssssssssessssssssssesssssssseessssssssssessasssseeeseassseeeeseen 54

4.2.1 _ Quy trình nhận diện gương mmặt -c-<eccrerssrreerrrserrxee 70

4.2.2 Dataset TH pti ect — : cookie 75 4.2.3 Thuật toán nhận điỆn ¿- 5c +5++x‡csecs+tvrersttersersrtsrsersrssrsersrrse 76

4.3 Hoạt động của hệ thong Pers vvoussussuseussusecuecsssvssuvsuvsuvssessesonssessossuvenusausniecueassaeeeas 77

Chương 5 DANH GIÁ HỆ THỐNG .-.e22ticcetteeEEtrerttrirerrrrrerrrireerre 89

SL ch 4.,,.,,H,,.HH., 89

"th 895.1.2 — Nhược điểm cciiceecELEEEEiieEEEEEEEEiiEEEEEErrrireekrrrrred 89

5.2 Đánh giá -«-ccLt+ HH HH HH HH ườn 90

5.2.1 _ Đánh giá smart COTIẦTACfS .cccc+cceceEEEEtsrktetrertserkerrkrrrree 90

5.2.2 Đánh giá hệ thống nhận điiỆn ‹ sc-s+c+xserseesreersrssrsersresrsersrree 94

Chương 6 KET LUẬN VÀ HƯỚNG PHÁT TRIỂN -. -eserccetre 98

INN (9o ioãŸôÝŸẳẲáÁẮÝ 98

Trang 8

6.2 Hướng phát triển

Trang 9

DANH MỤC HÌNH ẢNH

Hình 2.1 Hình ảnh minh hoa mô tả kiến trúc blockchain -:-ccccecceere 7

Hình 2.2 Hình ảnh mô tả luồng thực hiện franSaCfION c c-+c<cceecsereererexee 10

Hình 2.3 Hình ảnh minh hoạ šŠn o0 NỚ""" 13

Hình 2.4 Hình ảnh minh họa FL theo chiều ngang, chiều doc và chuyên giao 26

Hình 2.5 Hình anh minh họa giải thuật Federated Averagng -« -««- 30

Hình 2.6 Hình ảnh minh họa về giải thuật Federated Stochastic Variance Reduced €6r1o nh 31

Hình 2.7 Hình ảnh minh họa về giải thuật CO — OP c-+ccerieeriirirrrirerrrrre 33 Hình 3.1 Hình ảnh minh họa về Docker -:ciccccccceeevevvvvvvvvvvvvvEvEEEEEEEEEEEEErrrrrrrre 40 Hình 3.2 Hình ảnh minh họa về Web 3.0 csssssssssssssssssssssssssssssssssssssssssssssesessesessseeseseeee 42 Hình 3.3 Hình ảnh minh hoa về Metaimask cccccccccriiirirrevvveerrrrrrrrrirreeeeerrrrre 46 Hình 3.4 Hình ảnh minh họa về ReactJS c-e++eeceerrreecvrrrcrrrrrrrrrerrrree 47 Hình 3.5 Hình ảnh minh hoa về MongoDB -ccccccrrrreeevevrrrrressevrrrrre 48 Hình 3.6 Hình ảnh minh họa vn 49

Hình 3.7 Hình ảnh minh họa về Jetson Nano cccececeevevvvvvvvvvvvvvvvvvEvEvrrrrrrrrre 50 Hình 3.8 Hình ảnh minh họa về các chỉ tết của Jetson Nano -:-.-c::c + 51

Hình 3.9 Hình ảnh minh hoa Raspberry Pi V2 -ce sestseekkikkirriieiiriee 53 Hình 4.1 Hình ảnh minh hoa Sơ đồ mô tả sơ lược hệ thống 54

Hình 4.2 Hình ảnh mô tả blockchain giả lập dùng trong hệ thống 57

Hình 4.3 Hình anh mô tả các blocks được lưu lại trên Ganache - 57

Hình 4.4 Hình anh mô tả kiểm tra giao dịch trên Ganache như trên Etherscan 58

Hình 4.5 Hình ảnh mô tả cách kết nối với Ganache -. .ereer 58 Hình 4.6 Hình ảnh minh họa giao diện Web3 đối với người dùng 59

Hình 4.7 Hình anh minh họa giao diện Web3 đối với công ty 60

Hình 4.8 Hình ảnh minh họa code Smart COTFAC -5-cc5sccs+cssccssssrseesrssrsersesss 60

Hình 4.9 Hình anh minh họa code KyCCOnITACT 5s SetiekeiEiirriririiriee 61

Hình 4.10 Hình ảnh minh họa code Crowdsale -. cccccccsscssesexsersersersersersee 62

Trang 10

Hình 4.11 Hình ảnh minh họa code MIBTAtIOTIS c5cccccssccekeekrerrerrerrrrkee 62 Hình 4.12 Hình anh minh họa code My TOKeN 55c cesccekeererrrerererserreee 63 Hình 4.13 Hình anh minh họa code My TokenSale -‹ ‹e c«exesexeersexxeee 63 Hình 4.14 Hình ảnh minh họa thêm thư viện OpenZeppelin -« 64

Hình 4.15 Hình ảnh minh họa về giao diện 'TSCaH -ccc«ccrserierrrrrrirerirrriee 65

Hình 4.16 Hình ảnh minh họa cách hoạt động trong hệ thống ¬" ÔỎ 66

Hình 4.17 Hình anh mô tả cấu trúc OTP trong dataset -s ss-.-e5 67

Hình 4.18 Hình ảnh minh họa trích xuất OTP và tìm gương mặt đó trong database

— Ô.ÔỎ 68

Hình 4.19 Hình ảnh minh về database FirestOre -s++cestrccetrrerzrrre 69Hình 4.20 Hình ảnh minh họa về database MySQL ccceeekieierre 69Hình 4.21 Hình ảnh minh họa về database MongoDB -. ss:.- 70

Hình 4.22 Hình ảnh minh họa chạy file 01_ face_ dataS€f.DV c-<ce-c«ee 70

Hình 4.23 Hình ảnh minh họa kết quả tạO afAS€( c«ccxestkekieeirkriirierie 71

Hình 4.24 Hình ảnh minh họa chạy file 01_ face_ đataSe{.DY e- cceeceeseersee 71

Hình 4.25 Hình ảnh mô tả quá trình thu thập thông tin -c-s<c-cs« 71

Hình 4.26 Hình ảnh minh họa chon tài khoản đăng nhập -s-<-s«+ 72

Hình 4.27 Hình ảnh minh họa kết quả nhận OTP thành công 73

Hình 4.28 Hình anh minh họa file trainer.y1m] secccseesrxeeretsererkerrrkerrrke 73 Hình 4.29 Hình ảnh minh họa file trainer.yml do người dùng tải lên 73

Hình 4.30 Hình ảnh minh họa nhận diện trên Jetson Nano . - 74

Hình 4.31 Hình ảnh minh họa về tập dataset lấy từ camera 75

Hình 4.32 Hình ảnh minh hoa tập dữ liệu của người dùng -««e «e 75

Hình 4.33 Hình ảnh mô tả quá trình nhận diện - -©cescrsr+eerxeeersrreee 76

Hình 4.34 Hình ảnh mô tả hệ thong nhận điiỆn -s-cs-sccsccsceeeseesreerseesrssrsrrsses 77Hình 4.35 Hình ảnh mô tả quá trình kết nối với metamaks - - 78Hình 4.36 Hình ảnh minh họa mô ta giao diện người khi người dùng kết nối 78

Hình 4.37 Hình ảnh minh họa mô tả giao diện phía công fy -s¿ 79

Hình 4.38 Hình ảnh minh họa mô tả thông báo sau khi KYC cho người dùng 79

Trang 11

Hình 4.39 Hình ảnh minh họa mô ta database phía FlresfOre - 79

Hình 4.40 Hình ảnh minh họa mô tả người dùng nhập chính xác OTP và nhận token

Hình 4.43 Hình ảnh minh hoa mô tả module người dùng tải về dé huấn luyện dữ

083i ác 82 Hình 4.44 Hình anh minh hoa mô tả quá trình nhập OTP và chụp hình gương mat82

Hình 4.45 Hình ảnh minh họa mô tả quá trình huấn luyện - 83

Hình 4.46 Hình ảnh minh họa mô tả quá trình xác thực tài khoản email 83 Hình 4.47 Hình ảnh minh họa mô tả quá trình tự động gửi file lên phía trụ sở công

Hình 4.48 Hình anh minh hoa mô ta database MySQL ở phía công ty 84

Hình 4.49 Hình ảnh minh hoa mô tả quá trình nhận diện thực tế Ở công ty 85

Hình 4.50 Hình ảnh minh họa mô tả quá trình công ty gửi token cho người dùng đã nhận diện thành CONG ceecssecseecsescseeesseecseecsessseesseesseesseesseeesseesssessaeesssessaeeeseessaeseaeeeseesaeerseeses 86 Hình 4.51 Hình ảnh minh họa mô tả người dùng nhận được token và trạng thái thay

„1 87

Hình 4.53 Hình ảnh minh họa mô tả trạng thái được trở VỀ ÍT©€ ccccrrirrceeecee 88

Hình 5.1 Hình ảnh mô tả bảng đơn vi của Ether€um -« ‹«-‹sscse+ssexeeresxeee 90

Hình 5.2 Hình anh mô tả phí gas người dùng phải trả dé sở hữu token công ty 21

Hình 5.3 Hình ảnh mô tả phí gas thực tế tại điểm hiện tại theo zapper.fi 92

Hình 5.4 Hình anh mô tả phí gas phía công ty cần dé có thé thêm người dùng vào

Hình 5.5 Hình anh mô tả đánh giá kết quá nhận diện phía trụ sở - 94

Trang 12

Hình 5.6 Hình anh mô tả code cấu hình độ phân giải -: cccceerrrcceHình 5.7 Hình ảnh tùy chỉnh thông số và chạy trên thiết bị mạnh hơn

Trang 13

DANH MỤC BANG

Bang 3.1 Bang so sánh giữa Web 3.0 và Web 2.0 [12]

Bang 5.1 Bảng thông số các Smart Contract

. -Bảng 5.2 . -Bảng so sánh giữa nhận diện trên Jetson Nano và PC

Trang 14

DANH MỤC TỪ VIET TATChữ viết tắt Y nghĩa

EL Federated Learning

API Application Programming Interface WASM WebAssembly

NFT Non-Fungible Token

KYC Know Your Customer

EVM Ethereum Virtual Machine

ICO Initial Coin Offering

FPS Frames per second

CV Curriculum Vitae

Trang 15

TOM TAT KHÓA LUẬN

Blockchain, Federated Learning và nhận diện gương mặt là những công nghệ

được sử dụng rộng rãi ở khắp nơi trên thế giới Mỗi công nghệ có ưu và nhược điểm

khác nhau, mục đích sử dụng khác nhau Tuy nhiên, ở khóa luận này chúng tôi đã

kết hop các công nghệ này đề xây dựng lên một hệ thong hoàn chỉnh giúp nhà tuyển

dụng và người ứng tuyển dễ dàng kết nối với nhau hơn Hệ thống sẽ giúp giải quyếtcác vấn đề như viết kinh nghiệm trong CV không đúng thực tế, đữ liệu của gương

mặt bị đánh cắp

Thông qua hệ thống này, thông tin trạng thái việc làm của người dùng sẽđược công khai minh bạch, hợp lệ bằng cơ chế giữ số lượng token nhất định của

công ty Kinh nghiệm và thời gian làm việc sẽ được lưu trữ vĩnh viễn trên

blockchain giúp các nhà tuyển dụng sau này dé dàng trong việc kiểm tra tính trungthực của ứng viên Hệ thống còn đảm bảo việc dữ liệu gương mặt hoàn toàn đượcbảo mật trên thiết bị người dùng, không cần phải gửi đến công ty băng phương pháp

Federated Learning của Google.

Với mục tiêu đảm bảo sự bảo mật tối da cho cả phía người dùng và công ty

Hệ thống sẽ có những tính năng đảm bảo sự an toàn như xác thực otp, email, địa chỉví Bên cạnh đó, hệ thống còn sử dụng các phần mềm của bên thứ ba như

metamask, ganache và áp dụng những công nghệ của google cloud như google

drive API, firestore dé tạo ra một hệ sinh thái hoàn chỉnh giúp nhà tuyên dung và

người dùng kết nôi với nhau một cách an toàn nhât.

Trang 16

Chương 1 TONG QUAN

1.1 Đặt vấn đề

Hệ thống nhận diện gương mặt không phải là một đề tài gì mới đối với các

công ty, trường học, cơ quan Tuy nhiên, làm sao để có một hệ thống có được

tính cá nhân hóa — bảo vệ được thông tin người dùng lại là một thách thức cực kì lớn.

Hình ảnh gương mặt đôi khi đối với người dùng phô thông ở thời điểm hiện tại có thể không mấy quan trọng khi nếu bị rò ri nhưng nếu các hệ thống nhận diện

ngày càng áp dụng rộng rãi thì nó là một van dé đáng quan tam Giả sử người dùng

sử dụng một chiếc điện thoại thông minh (smartphone) có khả năng mở khóa bằng

gương mặt và bị đánh cắp — nếu kẻ đánh cấp đã có hình ảnh gương mặt của người dùng thì kẻ đánh cắp có thể giả mạo người dùng một cách dễ dàng chiếm quyền

truy cập vào điện thoại bằng nhiều cách khác nhau như in ra tắm hình dé mở khóa

2D hoặc cao cấp hơn nữa là dùng công nghệ cao như của deep fake để tạo ra một mặt nạ để giả mạo Đối với những ứng dụng có yêu cầu độ bảo mật cao hơn như

smart home, smart car thì việc chiếm quyền các thiết bị mở khóa bằng gương

mặt sẽ trở nên đáng lo ngại.

Hiéu được vấn dé trên, nhóm tác giả dé xuất phát triển một hệ thống nhận diện gương mặt trên các công nghệ blockchain (chuỗi khối) va federated learning

(học cộng tác) dé có thể bảo vệ hình ảnh dữ liệu thô của người dùng một cách an

toàn nhất Trong đó, blockchain đóng vai trò trong việc định danh người dùng duy

nhất:

- _ Tránh các tình huống giả mạo đồng thời giúp các công ty dé dang hơn trong

việc tuyển nhân sự thông qua cơ chế tokenomic và federated learning giúp người

dùng có thé huấn luyện (training) hình ảnh gương mặt trên chính thiết bị của mình.

- Tránh lưu hình ảnh dữ liệu thô trên các hệ thống nhận diện phòng trường

hợp hệ thống bị tan công.

Trang 17

1.2 Mục tiêu

1.2.1 Về lý thuyết

- Tìm hiểu lịch sử hình thành và phát triển của công nghệ chuỗi khối — Blockchain Hiểu được kiến trúc và hoạt động cơ bản của nền tảng Blockchain, các

cơ chế đồng thuận trong Blockchain.

- Tìm hiểu về kỹ thuật học liên kết — Federated learning (FL) về cách thức hoạt động dé xây dựng một hệ thống điểm danh nhận diện gương mặt.

1.2.2 Về ứng dụng

- Xây dựng và triển khai ứng dụng nhận diện gương mặt dựa trên một nền tảng Blockchain (cụ thé là Ethereum) và kỹ thuật Federated learning dé đáp ứng nhu cầu

hiện tai.

- Hệ thống được phát triển trên nền tang công nghệ phát triển ứng dụng web3

mới nhất, cùng với các thiết bị nhúng dé thiết kế và phát triển hệ thống điểm danh

bằng việc nhận diện gương mặt.

- Người dùng không cần cung cấp dữ liệu gương mặt tập trung về một điểm duy nhất thay vì kỹ thuật học liên kết cho phép huấn luyện mô hình ngay trên thiết

bị thông minh (máy tính cá nhân), đảm bảo được độ bảo mật của dữ liệu gương mặt

người dùng.

- Bang công nghệ Blockchain đảm bảo thông tin của người dùng là minh bạch,

TỐ ràng.

1.3 Đối tượng nghiên cứu

Đối tượng nghiên cứu của dé tài nghiên cứu này công nghệ chuỗi khối —

Blockchain, cụ thé là Ethereum cùng với phương pháp học liên kết — Federated learning và các công nghệ phát triển ứng dụng web Tận các đặc trưng của

Blockchain và Federated learning áp dụng vào công nghệ nhận diện gương mặt.

Trang 18

1.5 Các công trình liên quan

- _ Tích hợp Federated Learning và Blockchain tạo một mô hình mới, được gọi

là FLchain, có khả năng biến các mạng điện toán biên di động (Mobile edgecomputing — MEC) thông minh thành các hệ thống phi tập trung, an toàn và nângcao quyền riêng tu [1]

- Đề xuất kiến trúc chuỗi khối FL (BlockFL), trong đó mạng blockchain chophép trao đổi cục bộ của thiết bị cập nhật mô hình trong khi xác minh và cung cấpphần thưởng tương ứng với số lượng mẫu dữ liệu đã đóng góp cho quá trình huấnluyện mô hình Giải quyết các vấn đề về cơ chế trao đổi và phần thưởng riêng tư,

bằng cách tận dụng blockchain thay vì một thực thê trung tâm [2]

Đề xuất khuôn khổ PrivacyFace cải thiện phần lớn tính năng nhận dạng khuôn mặthọc tập liên kết thông qua giao tiếp thông tin phụ trợ và quyền riêng tư giữa cáckhách hàng Khuôn khổ PrivacyFace được đề xuất được chứng minh về mặt toán

học là có tính riêng tư khác biệt, giới thiệu chi phí nhẹ cũng như mang lại các mức

tăng hiệu suất nôi bật [3]

Trang 19

Chương 2 CƠ SỞ LÝ THUYET

Blockchain 2.1.1 Khai niệm Blockchain

Công nghệ chuỗi khối là một giao thức mới mang tính cách mang dé chia sẻ

và cập nhật thông tin băng cách liên kêt các sô cái hoặc cơ sở dữ liệu trong một

mạng truy cập mở, ngang hàng, phi tập trung Blockchain được thiết kế dé đảm bảo

dữ liệu được lưu trữ và cập nhật một cách an toàn, chống giả mạo và không thé thay

đôi [4]

> Ưuđiểm:

Công nghệ Blockchain là hệ thống phi tập trung, các giao dịch củaBlockchain có băng chứng xác thực và ủy quyền riêng để thực thi các ràngbuộc Và nó có nghĩa là các giao dịch có thê được xác minh và xử lý độc lập

Mỗi hành động được ghi lại vào Blockchain và dữ liệu của các bản ghi có

sẵn cho mọi người tham gia vào Blockchain này và không thê thay đổi hoặcxóa Kết quả ghi lại này cho thấy tính minh bạch, bất biến và đáng tin cậy

của Blockchain.

Sự tin cậy của Blockchain dựa trên sự tin tưởng của hai hoặc nhiều người

tham gia, những người không biết nhau

Sự bất biến đạt được khi các giao dịch được đồng ý và chia sẻ trên toàn bộ

Blockchain Khi giao dịch được kết nối với Blockchain, bạn sẽ không thểthay đổi hoặc xóa giao dịch đó

Tính minh bạch của Blockchain đạt được trên quá trình sao chép giao dịch.

mỗi giao dịch được sao chép vào một trong hai máy tính trong mang

Blockchain Mọi người tham gia đều có thé xem tat cả các giao dịch, cũng cónghĩa là mỗi hành động đều được hiển thị cho những người tham gia

Blockchain.

Trang 20

e Tính bảo mật cao của công nghệ Blockchain đạt được khi từng cá nhân vào

mạng mỗi người tham gia vào Blockchain được cung cấp một danh tính duy

nhất được liên kết với tài khoản của người dùng

e Viéc sử dụng công nghệ Blockchain giúp giảm thời gian xử lý và khởi tạo

xuống nhiều lần — từ khoảng 3 ngày xuống còn vài phút hoặc thậm chí vài

giây.

> Nhược điểm:

e Nhược điểm chính của Blockchain là tiêu thụ năng lượng cao Việc tiêu thụ

điện năng là cần thiết dé ghi số cái theo thời gian thực

e Việc xác minh chữ ký là thách thức của Blockchain, vì mỗi giao dịch phải

được ký bằng sơ đồ mật mã, sức mạnh tính toán lớn là cần thiết cho quá trìnhtính toán đến dấu

e_ Một van đề khác của Blockchain là sự cân bằng giữa số lượng nút va chi phí

thuận lợi cho người dùng Có những nút bị thiếu để Blockchain hoạt động

chính xác và mạnh mẽ Trong trường hợp này, chi phí cao hơn, vì các nút

nhận được phần thưởng cao hơn; nhưng các giao dịch hoàn thành chậm hơn,

vì các nút không hoạt động cao độ.

e_ Chi phí cao là một bat lợi lớn của Blockchain Chi phí trung bình của giao

dịch là từ 75 đến 160 đô la và phần lớn trong số đó bao gồm mức tiêu thụ

năng lượng.

Trang 21

2.1.2 Kiến trúc blockchain

h Network Participant/Nodes ị Blockchain

i |i Application Layer (Business Logic)

Digital asset

transactions Smart contracts

_— Distributed Computing Layer

e© Infrastructure layer: Lớp cơ sở hạ tầng bao gồm tat cả các thành phan

phần cứng cần thiết để chạy blockchain, chăng hạn như các nút (node),

bộ nhớ và cơ sở mạng Các nút là những người tham gia mạng Một mạng

lưới blockchain điển hình có ba loại nút khác nhau: đơn giản (còn đượcgọi là nút sáng), đầy đủ và khai thác Một nút đơn giản trong mạng có thểchỉ gửi và nhận các giao dịch và không lưu trữ bản sao của số cái, khôngxác thực giao dịch, trong khi một nút đầy đủ thì có Nút khai thác (cònđược gọi là trình tạo khối) là một nút đầy đủ có khả năng khai thác, tức làquá trình tạo một khối mới Thành phần lưu trữ lưu trữ số cái của các bản

ghi giao dịch.

1 https://www.mdpi.com/2073-8994/1 1/10/1198

Trang 22

e Platform layer: Lớp nền tang tạo điều kiện cho Remote Procedure Calls

(RPC), web Application Programming Interface (API) va

Representational State Transfer (REST) API dé giao tiếp giữa những

người tham gia mang.

e Distributed computing layer: Lớp điện toán phân tan đảm bảo quyền

truy cập cục bộ vào dữ liệu, khả năng chịu lỗi, tính bất biến, quyền riêng

tư, tính xác thực và bảo mật cho dữ liệu giao dịch Tính bắt biến là thuộctính của chuỗi khối không cho phép sửa đổi các bản ghi giao dịch khi đãđược cập nhật trên số cái Mạng blockchain sử dụng giao thức đồng thuận

đề đạt được thỏa thuận về thứ tự của các giao dịch trong mạng, cập nhật

số cái và lựa chọn công cụ khai thác cho thế hệ khối tiếp theo Ngoài ra,

lớp này chịu trách nhiệm xác thực người dùng bằng cách sử dụng kỹ

thuật mã hóa và bao mật dữ liệu thông qua kỹ thuật băm.

e Application layer: Lớp ứng dụng là logic nghiệp vụ cho các giao dịch tài

sản kỹ thuật số và thực hiện các hợp đồng thông minh Một ứng dụngđược phát triển trên mạng blockchain có thể được khách hàng truy cậpbang cách sử dụng lớp nền tảng Các lớp của kiến trúc blockchain có cácđặc điểm sau:

o Phi tập trung — Decentralization: Các giao dịch trong blockchain

được xử lý và xác thực bởi sự đồng thuận của hầu hết các nút mạng.Chúng được sao chép trên các nút trong một sô cái Điều này giúp loại

bỏ sự cần thiết của một bên trung gian để chia sẻ và duy trì dữ liệu

giao dịch.

o Tính bat biến —- Immutability: Các giao dịch trong blockchain được

lưu trữ thành các khối Mỗi khối trong chuỗi được liên kết với khối

trước đó bang cách sử dụng hàm băm mật mã Bat kỳ nỗ lực nào dé

sửa đổi nội dung của một khối sẽ ảnh hưởng đến các khối tiếp theo

trong chuỗi Do đó, kẻ tấn công độc hại cần phải thay đổi tất cả các

Trang 23

khối kế tiếp trong chuỗi dé sửa đổi một khối cụ thé, điều này rất khó

về mặt tính toán vì các khối chuỗi được sao chép qua nhiều nút

Tính minh bạch — Transparency: Số cái chỉ được cập nhật khi hầuhết các nút đạt được sự đồng thuận Các thay đôi trong mạng đượchiển thị công khai đảm bảo tính minh bạch và bảo mật

Truy xuất nguồn sốc — Traceability: Ban chat phân tán và minhbạch của blockchain giúp việc theo dõi bất kỳ sự kiện giao dịch nào

trở nên dễ dàng hơn Mỗi bản cập nhật trong trạng thái của nội dung

có thể được truy ngược về nguồn gốc của nó Điều này giúp làm cho

mạng an toàn, hiệu quả và minh bạch hơn.

Tinh đáng tin cậy — Trustless: Blockchain cho phép giao dịch tài san

giữa các bên không xác định, những người không tin tưởng lẫn nhau.

Bằng cách phân phối số cái trên một số nút trong mạng và cập nhật sốcái này thông qua một sự đồng thuận đảm bảo tính hợp lệ của các giao

dịch trong một môi trường không đáng tin cậy.

Trang 24

2.1.3 Tổng quan về thực hiện giao dịch (Transaction)

| | Private key Public "|

pees Pool of valid

"ante tacts

User

Validator nodes

=

Block Generator Nodes

Hash of Hashof | Hash of _ Hashof |

previous block previous block previous block T i previous block | Hash of block 0

NUƯƯỚNGGGGINGGG one iat

f f 1 Ƒ

Block hash Block hash Block hash loa * Block hash Block hash

Block n+2 Block n~1 Block n Block 1 Genesis block

Hình 2.2 Hình anh mô tả luồng thực hiện transaction?

> Luông thực hiện giao dịch trong mang blockchain sử dụng các thành phan sau:

e Transaction: Một quy trình thay đổi trạng thái của số cái blockchain Tùy

thuộc vào ứng dụng, giao dịch có thể là chuyển giao giá trị tài chính hoặc

thực hiện hợp đồng thông minh.

¢ Block: Nó bao gồm một tiêu đề khối và dit liệu khối Tiêu đề bao gồm thông

tin siêu dữ liệu khối như ham băm Merkle root, ham băm khối trước đó, thờigian và phiên bản của khối, trong khi dir liệu bao gồm tập hợp các giao dịch

hợp lệ.

e_ Merkle tree root hash: Tất cả các giao dich trong khối được băm riêng lẻ

băng cách sử dụng thuật toán băm Các giá trị băm sau đó được kết hợp theo

từng cặp và được băm lại cho đến khi thu được một giá trị băm duy nhất Giá

trị này được gọi là giá tri băm Merkle root.

? https://www.mdpi.com/2073-8994/1 1/10/1198

10

Trang 25

e Block hash: Nó là mã định danh duy nhất của một khối cụ thé va được lấy

bang cách băm tiêu đề khối hai lần

e Previous block hash: Nó là hàm băm của khối đứng trước khối hiện tại

trong chuỗi Khối trước được gọi là khối cha của khối hiện tại Việc sử dụnggiá trị băm khối trước đó trong tiêu đề khối là để đảm bảo tính bất biến của

số cái blockchain

e Timestamp: Nó cho biết thời gian khối được tạo

e Block version: Nó chi ra phiên ban của các giao thức blockchain được sử

dụng.

e_ Mining: Là quá trình thêm các giao dịch hợp lệ vào một khối và phát khối đó

lên mạng.

e Genesis Block: Đây là khối đầu tiên trong số cái Tất cả các khối sau trong

chuỗi được liên kết với khối gốc Khối nguồn gốc thường bao gồm cấu hìnhcho các đặc tính mạng, giao thức đồng thuận được sử dụng, quyền kiểm soáttruy cập, hàm băm, khoảng thời gian tạo khối và kích thước khối

> Quy trình thực thi bao gồm các bước sau:

e Transaction proposal: Người dùng đầu tiên băm dữ liệu giao dịch bằng

cách sử dụng hàm băm dé xác minh tính toàn vẹn của dữ liệu sau này Sau

đó, dữ liệu đã băm được mã hóa bằng khóa riêng của người dùng để cungcấp xác thực người dùng và đầu ra được mã hóa được gọi là chữ ký số củagiao dịch đó Dữ liệu giao dịch và chữ ký được truyền vào mạng

e Transaction and block validation: Xác thực giao dịch và khối: Mỗi nút đầy

đủ trong mạng xác thực giao dịch bang cách thực hiện hai tác vu: xác thựcngười dùng bằng cách giải mã chữ ký số bằng khóa công khai của người

dùng đề xuất và tính toàn vẹn đữ liệu bằng cách băm giao dịch dữ liệu và so

sánh nó với chữ ký được giải mã Giao dịch hợp lệ được phát tới các trình

tạo khối (thợ đào) trong mạng Một người khai thác được chọn (dựa trên sự

đồng thuận) sẽ xác minh các giao dịch hợp lệ và nhóm chúng thành một khốitheo cách mà kích thước khối không vượt quá ngưỡng được xác định trước

11

Trang 26

Người khai thác tính toán giá trị băm Merkle root Hàm băm tóm tắt của tất

cả các giao dịch do Merkle root cung cấp một quy trình hiệu quả để xác minhmột giao dịch trong một khối Dé xác minh xem một giao dịch có được baogồm trong một khối hay không, một nút chỉ yêu cầu các giá trị băm củađường dẫn Merkle kết nối giao dịch với Merkle root Do đó, một nút khôngduy trì toàn bộ bản sao của sô cái có thé xác minh giao dịch bằng cách yêu

cầu đường dẫn mà không cần nhận toàn bộ khối, giảm chỉ phí giao tiếp Để

xác minh một giao dịch trong một khối, bao gồm n giao dịch, một nút chỉyêu cầu giá trị băm logon sử dung Merkle root so với n giá trị băm nếu

Merkle root không được sử dụng Sau khi tính toán giá tri băm Merkle root,

băm khối được tạo Người khai thác truyền khối tới mạng Các nút xác thựcxác minh tính hợp lệ của khối bằng cách kiểm tra tính đúng đắn của nhữngđiều sau: băm khối, dau thời gian của khối lớn hơn dau thời gian của khốitrước đó, giá trị block height và kích thước khối, giá trị băm của khối trước

đó và tính hợp lệ của tất cả các giao dịch trong khối Mỗi nút xác thực gắn

khối hợp lệ vào bản sao số cái của chính nó.

2.1.4 Smart Contract

Smart Contract là một chương trình máy tính có các thuộc tính tự xác minh,

tự thực thi, chống giả mạo Nó cho phép thực thi mã mà không cần bên thứ ba Hợpđồng thông minh bao gồm giá trị, địa chỉ, chức năng và trạng thái Nó nhận giao

dịch làm đầu vào, thực thi mã tương ứng và kích hoạt các sự kiện đầu ra Tùy thuộcvào các trạng thái thực hiện logic chức năng là những thay đôi [6]

Tầm quan trọng của việc tích hợp hợp đồng thông minh của công nghệblockchain trở thành một lĩnh vực trọng tâm dé phát triển vì nó cung cấp cho giaodịch ngang hàng và cơ sở dữ liệu có thé được duy trì công khai một cách an toàntrong một môi trường đáng tin cậy Hợp đồng thông minh có thê theo dõi và không

thé thay đổi Tất cả thông tin giao dịch đều có trong hợp đồng thông minh và nó

thực thi tự động.

12

Trang 27

Về bản chất, Smart Contract chỉ là một đoạn mã chạy trên một hệ thống phân

tán (blockchain), cho phép tạo ra các giao thức Permissionless (tức là không cần

trao quyền) Điều đó có nghĩa là:

e Hai bên trong hợp đồng có thé đưa ra các cam kết thông qua blockchain mà

không cần biết về danh tính hay sự tin cậy lẫn nhau

e_ Các bên trong hợp đồng có thé đảm bảo rằng nếu các điều kiện của hợp đồng

không được thỏa mãn, hợp đồng sẽ không được thực thi

e Ngoài ra, hợp đồng thông minh giúp loại bỏ vai trò của các bên trung gian

Hợp đồng được ký trực tiếp giữa người bán - người mua giúp giảm đáng kê

chi phí hoạt động.

Traditional Contracts

Smart Contracts

Mỗi blockchain có một phương pháp triển khai hợp đồng thông minh khác

nhau, ví dụ trên Cosmos có WASM, Polkadot có ink! Trong đó nỗi bật nhất vẫn là

Smart Contract chạy trên máy ảo của Ethereum (Ethereum Virtual Machine EVM).

-Trên Ethereum, các Smart Contract chịu trách nhiệm thực thi và quan lý các

hoạt động diễn ra trên blockchain khi những người dùng (address) tương tác với

3 https:/coin98.net/smart-contract-la-gi

13

Trang 28

nhau Bat kỳ địa chỉ nào không phải là smart contract đều được gọi là Tài khoản độc

lập (Externally Owned Account - EOA) Do đó, smart contract sẽ do máy tính kiểm

soát và EOA do người dùng kiểm soát

Smart Contract Ethereum bao gồm một mã hợp đồng và hai khóa công khai:

e Khóa công khai thứ nhất là khóa do người tạo hợp đồng cung cấp

e Khoa còn lại đại diện cho chính hợp đồng, khóa này có vai trò như một mã

định danh kỹ thuật số duy nhất cho mỗi Smart Contract

Smart Contract được triển khai thông qua giao dịch blockchain và chúng chỉ

được kích hoạt khi một Tài khoản độc lập (EOA) hoặc các Smart Contract khác gọi

chúng Tuy nhiên, kích hoạt đầu tiên luôn từ phía EOA (người dùng)

> Ưu điểm

Hợp đồng thông minh là một bộ mã có thê lập trình, có khả năng tùy chỉnhcao và có thé được thiết kế theo nhiều cách khác nhau đề có thé cung cấp nhiều loại

dịch vụ và giải pháp.

Ngoài ra, hợp đồng thông minh là các chương trình phi tập trung và tự thực

hiện (self-executing), chúng giúp tăng tính minh bạch và giảm chi phí hoạt động.

Nếu được triển khai đúng cách, chúng cũng có thé tăng hiệu quả vận hành và giảm

chi phí hành chính.

> Nhược điểm

Smart Contract dựa trên hệ thống blockchain nên không thé sửa đôi và can

thiệp Một khi Smart Contract được viết ra, nễu muốn thay đôi thì chỉ có cách viếtlại một hợp đồng mới Tính chất không thé thay đổi là một ưu điểm lớn, tuy nhiêntrong một số trường hợp có thể là nhược điểm

> Ứng dụng của Smart Contract

Về cơ bản, hầu hết các ứng dụng được cung cấp bởi các hệ thống tập trungđều có thé được thiết kế tương tự và cung cấp bởi các Smart Contract trên

blockchain.

14

Trang 29

Smart Contract cho phép các nhà phát triển có thể thiết kế ra nhiều trường

hợp sử dụng khác nhau Ví dụ: Ví tiền điện tử để lưu trữ Coin & Token, các sàn

giao dịch phi tập trung (DEX), trò chơi (gaming), NFT Và ở khóa luận này smart

contract được sử dụng trong trường hợp ràng buộc người dùng công ty với một

lượng token có định thé diện cho trạng thái việc làm của chính mình

2.1.5 Ethereum

Ethereum viết tắt ETH là một nền tảng phần mềm mã nguồn mở, phi tậptrung và dựa trên các chuỗi khối Đây là một nền tảng cho phép người dùng sử dụngHợp đồng thông minh (Smart Contract) và Ung dung phi tập trung (dApp) dé giúp

các giao dịch được thực hiện nhanh chóng hơn, ngăn ngừa những hành vi lừa đảo.

Ethereum có nhiêu khả nang hơn so với Bitcoin và các loại tiên điện tử khác,

có thê triên khai các mã của riêng mình và tương tác với các ứng dụng do người khác tạo Ethereum có thê khởi chạy tât cả các loại chương trình phức tạp nhờ vào

tính linh hoạt của nó.

Ethereum như một nền tảng phần mềm mở hoạt động trên công nghệBlockchain, được lưu trữ ở nhiều máy tính trên khắp thế giới Ưu điểm này giúp

Ethereum trở nên phi tập trung.

Mỗi máy tính có một bản sao của chuỗi khối và phải có sự thống nhất rộng

rãi trước khi có thé thực hiện bat kỳ thay đổi nào đối với mạng

Chuỗi khối Ethereum tương tự như Bitcoin khi cùng có bản ghi lịch sử giaodịch Tuy nhiên, Ethereum cũng cho phép các nhà phát triển xây dựng và triển khai

các ứng dụng phi tập trung Chúng được lưu trữ trên Blockchain cùng với các bản ghi của các giao dịch.

Một số thông tin cơ bản về ETH:

e Tên: Ethereum.

e Ky hiệu: ETH.

e Blockchain: Ethereum.

15

Trang 30

e Tiêu chuẩn: ERC-20.

Mỗi nút Ethereum trong mạng chạy một EVM và thực hiện các hướng dẫn

giống nhau EVM đã được lập trình trong C++, Go, Haskell, Java, Python, Ruby,Rust và WebAssembly (hiện đang được phát triển)

EVM tất cần thiết cho giao thức Ethereum và là công cụ hỗ trợ cho công cụ

đồng thuận của hệ thống Ethereum Nó cho phép bat cứ ai thực hiện mã trong một

hệ sinh thái không tin tưởng mà tại đó kết quả hoạt động có thé được đảm bảo vàhoàn toàn xác định thực hiện các hợp đồng thông minh

Đối với mọi chi thị được trién khai trên EVM, người ta cho ra một chi phíthực hiện có tên là Gas Khi người dùng muốn đào ether, họ dự trữ một số ether dé

san sàng chi trả phí Gas này.

Bằng cách sử dụng phí giao dịch Gas, có hai vấn đề chính được giải quyết:Trình xác nhận đảm bảo đã nhận được số tiền trả trước ban đầu, ngay cả khi việckhai thác không thành công Các thợ đào có thể sử dụng năng lực khai thác dướimức số tiền đã trả trước đó Thay vì lặp đi lặp lại vô thời hạn, việc khai thác sẽ cứ

tiếp diễn cho đến khi hết phí Gas

Khi một giao dịch được gửi đến mạng lưới, thợ đào có thể thực hiện giao

dịch, thực thi mã liên quan Trình xác nhận sẽ đảm bảo rằng:

e Tất cả thông tin về giao dịch là hợp lệ

e Nguoi thanh toán có đủ tiền dé chi trả cho việc thực hiện giao dịch

e EVM không gặp phải bat kì trường hợp ngoại lệ nào trong quá trình thực thi

16

Trang 31

Ethereum có thé cho phép chúng ta tạo ra các nền kinh tế chia sẻ dữ liệu, các

sự kiện gọi vốn cộng đồng ngang hàng, hợp đồng thông minh, thị trường cho thuê

không gian 6 cứng chưa được sử dụng trên máy tính xách tay của ban, Uber hoặc

Facebook bị phân tán (các sản pham không có công ty), v.v Về cơ bản, Ethereumgiống như internet vào năm 1994, vậy nên không ai biết tương lai sẽ xảy ra những

điều gì

Nhờ vào tính năng nổi trội này nhóm chúng tôi đã có để xây dựng một ứngphi tập trung về nhận diện gương mặt nằm hoàn toàn trên các EVMs của Ethereummột cách dé dang mà không cần quá lo lắng về độ bảo mật khi xây dựng lại hoàn

toàn một hệ thông blockchain riêng

> Lợi ích của Máy ảo Ethereum

EVM cho phép mọi người tạo DApp của riêng họ Có vô số trường hợp sửdụng tiềm năng cho loại phần mềm này và công nghệ không bị giới hạn cho một

nhóm người nhât định hoặc những người có nhiêu tiên hoặc nhiêu môi quan hệ.

Có rất nhiều lợi ích tiềm năng của hop đồng thông minh Một ví dụ gan đây

sẽ là các mã thông báo không thé thay thé (NFT) Bằng cách tạo NET, bất kỳ aicũng có thể tạo ấn phẩm nghệ thuật kỹ thuật số và bán nó trên thị trường phi tậptrung Điều này dân chủ hóa việc tiếp cận thị trường nghệ thuật theo cách ảo, điều

mà trước đây không thể thực hiện được

> Nhược điểm của Máy ảo Ethereum

Mạng EVM không hoàn toàn phi tập trung Phần lớn các nút Ethereum đượclưu trữ trên các máy chủ đám mây tập trung như Amazon Web Services Nếu chủ sởhữu của các dịch vụ như vậy quyết định rằng họ không thích Ethereum vì một lý do

nào đó, các nút có thé dé dàng bi đóng cửa, làm hỏng hoặc phá hủy mạng

EVM yêu cầu một số kiến thức kỹ thuật Những người không biết cách viết

mã không thé làm được gì nhiều với EVM Các giao diện thân thiện với người dùnghon van đang trong quá trình phát triển NET lại là một ví dụ điển hình — có những

17

Trang 32

chương trình có giao diện người dùng đồ họa (GUI) cho phép hầu hết mọi người tạo

NET và sử dụng các thị trường liên quan.

Phi gas cao trong thời gian mạng bi tắc nghẽn Đây có thé là một nhược điểm lớn

đối với người dùng Ethereum Mặc dù những người gửi các giao dịch lớn có thé

không bị ảnh hưởng nhiều, nhưng mọi người cô gắng gửi các giao dịch nhỏ hơn cóthể không thể sử dụng mạng trong một thời gian Đặc biệt, điều này tao ra vấn đề

cho các ứng dụng phi tập trung Khi nhiều người dùng tương tác với các hợp đồng

thông minh của DApps và tạo nhiều giao dịch, mọi thứ có thé chậm lại hoặc thậm

chí ngừng hoạt động khi phí gas tăng quá cao.

2.1.7 Token

Token là một loại tiền điện tử (tiền mã hóa) được tạo ra và hoạt động dựa trênmột nền tảng blockchain có sẵn mà ở đây blockchain đó là của Ethereum Ở khóaluận này, mỗi token sẽ đại diện cho một trạng thái của người dùng đó đối với công

ty.

ERC-20 định nghĩa một danh sách chung các quy tắc cho các mã thông báoEthereum để tuân theo hệ sinh thái Ethereum lớn hơn, cho phép các nhà phát triển

dự đoán chính xác sự tương tác giữa các chuỗi Các quy tắc này bao gồm cách các

mã thông báo được chuyên giữa các địa chỉ và cách truy cập dữ liệu trong mỗi mã

thông báo.

Phần lớn các mã thông báo được phát hành trên blockchain Ethereum phảituân theo chuân ERC-20 Từ năm 2018, tổng cộng 103621 mã thông báo tươngthích ERC-20 được tìm thấy trên mạng chính Ethereum

Tuy nhiên ERC-20 còn một số khuyết điểm như hau hết các token đều có thé

thay thế được, nghĩa là mọi token đều giống với những token khác Vì vậy một tiêu

chuẩn mới mang tên ERC-721 được ra đời ERC-721 dé xuất một tiêu chuẩn token

không thé thay thế: mỗi token đều là duy nhất Một trong những triển khai nỗi tiếng

nhất của chuẩn này là trò CryptoKitties, tạo ra những chú mèo đặc trưng, thu thập

được Trò chơi Cryptocup World Cup cũng dùng tính năng này Trong năm 2021,

18

Trang 33

token ERC-721 đã xây dựng nên một nền công nghiệp đặc biệt với NFT va

2.1.8 ICO

ICO (Initial Coin Offering) là một hình thức kêu gọi vốn đầu tư kha phô biếntrong các dự án cryptocurrency Mỗi đợt ICO các nhà phát triển đồng coin đó sẽ tạomột sự kiện và trong dự án crypto đó sẽ bán một phần các Token của nó cho các

nhà đầu tư yêu thích dé đổi lấy tiền nhằm tài trợ cho dự án cryptocurrency đó hoạt

động và phát triển trong tương lai Tuy nhiên, ở khóa luận này ICO không nhăm

mục đích gọi vốn vì các token của công ty in ra hầu như không có giá trị về mặt

kinh tế, nó chỉ có giá trị về mặt ý nghĩa định danh ở chính công ty đó mà thôi

2.1.9 Crowdsale

Crowdsale là những đợt mở bán Token của một đồng tiền điện tử nào đó

trong giai đoạn ICO Token được phát hành tương tự như cổ phiếu và thường laytên chính là tên của đồng tiền điện tử đó khi bán cho các nhà đầu tư Một đồng tiền

điện tử ra đời có thê mở nhiêu một hoặc nhiêu đợt Crowdsale.

19

Trang 34

2.2 Federated Learning

2.2.1 Các định nghĩa

Federated Learning (FL) là một phương pháp học máy phân tán cho phép

đào tạo trên một kho dữ liệu phân quyền lớn năm trên các thiết bị như điện thoại di

động [7].

Học liên kết (còn được gọi là học cộng tác) là một kỹ thuật máy học đào tạo

một thuật toán trên nhiều thiết bị biên hoặc máy chủ phi tập trung giữ các mẫu dữ

liệu cục bộ mà không cần trao đổi chúng Cách tiếp cận này trái ngược với các kỹthuật học máy tập trung truyền thống trong đó tất cả các bộ dữ liệu cục bộ được tảilên một máy chủ, cũng như các cách tiếp cận phi tập trung cổ điển hơn thường giảđịnh rằng các mẫu dir liệu cục bộ được phân phối giống hệt nhau

Học liên kết cho phép nhiều tác nhân xây dựng một mô hình học máy mạnh

mẽ, chung mà không cần chia sẻ dit liệu, do đó cho phép giải quyết các van đề quantrọng như quyền riêng tư của dữ liệu, bảo mật dir liệu, quyền truy cập dir liệu và

quyền truy cập vào dữ liệu không đồng nhất Các ứng dụng của nó được trải rộng

trên một số ngành công nghiệp bao gồm quốc phòng, viễn thông, loT và được phẩm.

Học liên kết nhăm mục đích đào tạo một thuật toán học máy, ví dụ như mạng

nơron sâu, trên nhiều bộ dữ liệu cục bộ chứa trong các nút cục bộ mà không cần

trao đổi rõ rang các mẫu dữ liệu Nguyên tắc chung bao gồm dao tạo các mô hìnhcục bộ trên các mẫu dữ liệu cục bộ và trao đổi các tham số (ví dụ: trọng số và độ

lệch của mạng nơ-ron sâu) giữa các nút cục bộ này ở một số tần suất để tạo ra một

mô hình toàn cục được chia sẻ bởi tât cả các nút.

Sự khác biệt chính giữa học liên kết và học phân tán nằm ở các giả định

được thực hiện trên các thuộc tính của bộ dữ liệu cục bộ vì học phân tán ban đầunhằm mục đích song song hóa sức mạnh tính toán trong đó học liên kết ban đầunhằm đào tạo trên các bộ dữ liệu không đồng nhất Trong khi học phân tán cũngnhằm mục đích đào tạo một mô hình duy nhất trên nhiều máy chủ, một giả định cơ

20

Trang 35

bản phổ biến là các bộ dit liệu cục bộ là độc lập và được phân phối giống hệt nhau

và gần như có cùng kích thước Không có giả thuyết nào trong số những giả thuyết

này được đưa ra cho việc học liên kết; thay vào đó, các tập dữ liệu thường không

đồng nhất và kích thước của chúng có thé trải dai theo một số cấp độ Hơn nữa, cáckhách hàng tham gia vào quá trình học liên kết có thể không đáng tin cậy vì họ gặpnhiều thất bại hoặc bỏ học hơn vì họ thường dựa vào phương tiện truyền thông kémmạnh mẽ hơn (tức là Wi-Fi) và các hệ thống chạy bằng pin (tức là điện thoại thôngminh và thiết bị IoT) so với học phân tán trong đó các nút thường là trung tâm dữ

liệu có khả năng tính toán mạnh mẽ và được két nôi với nhau băng mạng nhanh.

> Centralized federated learning

Một máy chủ trung tâm được sử dung dé sap xếp các bước khác nhau củathuật toán và điều phối tất cả các nút tham gia trong quá trình học tập Máy chủ chịutrách nhiệm về việc lựa chọn các nút khi bắt đầu quá trình đào tạo và tổng hợp cácbản cập nhật mô hình đã nhận Vì tất cả các nút được chọn phải gửi cập nhật cho

một thực thé duy nhất, máy chủ có thé trở thành nút cổ chai của hệ thống

> Decentralized federated learning

Các nút có thé tự điều phối dé có được mô hình toàn cau Thiết lập này ngănchặn các lỗi đơn lẻ vì các bản cập nhật mô hình chỉ được trao đôi giữa các nút đượckết nối với nhau mà không có sự điều phối của máy chủ trung tâm Tuy nhiên, cautrúc liên kết mạng cụ thể có thể ảnh hưởng đến hiệu suất của quá trình học tập [8]

> Heterogeneous federated learning

Federated Learning mới có tên HeteroFL đã được phát triển dé giải quyết cácclient không đồng nhất được trang bị các khả năng tính toán và giao tiếp rất khácnhau Kỹ thuật HeteroFL có thé cho phép đào tạo các mô hình cục bộ không đồngnhất với độ phức tạp tính toán thay đổi động và non-iid data trong khi vẫn tạo ra

một mô hình suy luận toàn cục chính xác.

21

Trang 36

2.2.2 Đặc điểm

FL có liên quan nhiều đến việc học phân tán Hệ thống phân tán truyền thống

được tạo thành từ tính toán phân tán, lưu trữ phân tán Bản cập nhật mô hình FL

được đề xuất đầu tiên cho các ứng dụng khách Android ở một mức độ nào đó tương

tự như tính toán phân tán Mặc dù FL rat chú trọng đến việc bảo vệ quyền riêng tu,các nghiên cứu mới nhất về học máy phân tán cũng rất chú ý đến hệ thống phân tánbảo vệ quyền riêng tư Xử lý phân tán là kết nối nhiều máy tính ở các vị trí khácnhau thông qua mạng truyền thông dưới sự điều khiển của máy chủ trung tâm, dé

mỗi máy tính đảm nhận các phần việc khác nhau của cùng một nhiệm vụ dé hoàn

thành nó Do đó, quá trình xử lý phân tán chủ yếu nhằm mục đích tăng tốc giai đoạn

xử lý, trong khi FL tập trung vào việc xây dựng một mô hình cộng tác mà không bị

ro ri quyên riêng tu.

> Iterative learning

Hoc lién két dua trén mét quy trình lặp di lặp lại được chia thành một tậphợp nguyên tử của các tương tác client-server được gọi là vòng học liên kết Mỗivòng của quá trình này bao gồm truyền trạng thái mô hình toàn cầu hiện tại tới cácnút tham gia, đào tạo mô hình cục bộ trên các nút cục bộ này để tạo ra một tập hợpcác bản cập nhật mô hình tiềm năng tại mỗi nút, sau đó tổng hợp và xử lý các bản

cập nhật cục bộ này thành một bản cập nhật toàn cầu duy nhất và áp dụng nó vào

mô hình toàn câu.

Một vòng liên kết được tạo bởi một lần lặp lại quá trình học tập, quy trìnhhọc tập có thể được tóm tắt như sau:

e Khởi tạo: theo đầu vào của máy chủ, một mô hình học máy được chọn để

dao tạo trên các nút cục bộ và khởi tao Sau đó, các nút được kích hoạt và

chờ máy chủ trung tâm đưa ra các nhiệm vụ tính toán.

e Lựa chọn máy khách: một phần nhỏ các nút cục bộ được chọn dé bắt

đầu đào tạo về dit liệu cục bộ Các nút đã chọn có được mô hình thống kêhiện tại trong khi các nút khác chờ vòng liên kết tiếp theo

22

Trang 37

e Cấu hình: máy chủ trung tâm ra lệnh cho các nút được chọn phải trải qua

quá trình đào tạo mô hình trên dữ liệu cục bộ của chúng theo cách được chỉ định trước

e Báo cáo: mỗi nút được chọn gửi mô hình cục bộ của nó đến máy chủ để

tổng hợp Máy chủ trung tâm tông hợp các mô hình đã nhận và gửi lại các

bản cập nhật mô hình cho các nút Nó cũng xử lý các lỗi cho các nút bị

ngắt kết nối hoặc các ban cập nhật mô hình bị mat Vòng liên kết tiếptheo được bắt đầu quay trở lại giai đoạn lựa chọn khách hàng

e Kết thúc: sau khi đáp ứng tiêu chí kết thúc được xác định trước, máy chủ

trung tâm sẽ tổng hợp các bản cập nhật và hoàn thiện mô hình chung

> Universality for cross-organizational scenarios

Vé co ban, FL do Google dé xuất là một công nghệ học máy phân tán được

mã hóa, cho phép người tham gia xây dựng một mô hình đào tạo chung nhưng duy

tri dit liệu cơ bản cục bộ Sau đó, khái niệm ban đầu về FL được mở rộng dé chỉ tat

cả các kỹ thuật học máy cộng tác phi tập trung bảo vệ quyền riêng tư Do đó, FL có

thé xử lý không chỉ dữ liệu được phân vùng theo chiều ngang theo các mẫu mà còn

cả dữ liệu được phân vùng theo chiều doc theo các tính năng trong cài đặt học tậpcộng tác FL có thể được mở rộng dé đưa các doanh nghiệp liên tô chức vào khuônkhổ liên bang

Ví dụ: ngân hàng có dữ liệu về sức mua của khách hàng có thê hợp tác vớinền tảng kinh doanh điện tử có dữ liệu về tính năng sản phẩm, để giới thiệu sảnphẩm Do đó, xây dựng một cách thông minh mô hình chung cho nhiều thực thẻ,nhiều nguồn dữ liệu, các kích thước tinh năng khác nhau Điều này cho phép tat cảnhận ra giá trị đồng sáng tạo trong khu vực và đa nền tảng trên cơ sở bảo vệ quyền

riêng tư của dt liệu [7].

> Massively Non-Identically Independent Distribution (Non-IID)

Trong FL, dữ liệu được phổ biến rộng rãi trong hang chục nghìn thiết bi diđộng hoặc nút cạnh Dữ liệu có sẵn trong mỗi nút không được nhiều hơn tổng sốnút Trong khi ở trong hệ thống phân tán, mục đích chính là tăng mức độ song song

23

Trang 38

dé giảm bớt áp lực tính toán hoặc lưu trữ trong máy chủ trung tâm Số lượng các nút

trong hệ thống phân tán không thể đạt cùng mức độ như FL Ngày nay, thế giới đã

bước vào kỷ nguyên của các thiết bị đeo được sử dụng rộng rãi để theo dõi sức

khỏe Mỗi thiết bị chỉ tạo ra một số dữ liệu và nó không thé được so sánh với tổng

số thiết bị Rõ ràng, trong trường hop nay, FL phù hợp hon để cải tiến mô hình.Ngược lại với hệ thống phân tán, hoạt động chủ yếu trên phân phối dữ liệu cân bằng

và IID, FL tập trung vào dữ liệu không cân bang và không phải IID vì sự khôngđồng nhất giữa các tài nguyên thiết bị [7]

> Decentralized technology

Decentralization — phi tập trung, theo nghĩa kỹ thuật chat chẽ, không có

nghĩa là phân quyền hoàn toan, nhưng không có trung tâm Phi tập trung chỉ dé làm

loãng nhận thức của nút trung tâm Không có trung tâm để xác định từng kháchhàng và mỗi khách hàng sẽ ảnh hưởng đến mô hình trung tâm Ảnh hưởng giữa cácnút sẽ tạo ra một mối quan hệ phi tuyến tính thông qua mạng được hình thành bởi

máy khách Máy chủ tham số, một công nghệ phân tán và tập trung điển hình, chủ

yếu sử dụng máy chủ trung tâm đang chiếm ưu thế trong việc điều phối tài nguyên

phân phối dữ liệu và tính toán để có được một mô hình cộng tác hiệu quả.

Loại phương pháp xử lý dir liệu tập trung này dẫn đến chi phí liên lạc gấp

đôi Bởi vì nếu một số tập dữ liệu năm rải rác trong các cơ sở dữ liệu khác nhau

được thu thập dé dao tạo, thì những dữ liệu này nên được sao chép và sau đó truyềnđến máy chủ trung tâm lúc đầu Và sau đó máy chủ trung tâm sẽ phân bổ dữ liệu

cho từng máy khách phân tán dé tính toán phân tán Nó b6 sung các bài kiểm tra

nghiêm ngặt bổ sung cho hệ thống về khả năng tính toán, lưu trữ và băng thông Đối với các trường hợp trong FL, mỗi khách hàng hoàn toàn tự chủ, dữ liệu không được

phân bé bởi trung tâm và quá trình đào tạo không bị chi phối bởi máy chủ Do đó,

FL là một công nghệ tích hợp dé kết hợp các mô hình học máy và tổng hợp dữ liệu

thông qua cộng tác phi tập trung [7].

> Equality of status for each node

24

Trang 39

Trong khuôn khổ hợp tác này, tất cả các bên đều có vị thế bình đẳng và

quyền thống trị nhất định dé đạt được sự thuận tiện chung Về mặt bình đăng, bat ky

ai sở hữu khối lượng lớn dtr liệu có vi trí thống tri trong dao tạo cộng tác phân tántruyền thống Do đó, sự phát triển của học tập hợp tác trong lĩnh vực công nghiệp

có thé bị ảnh hưởng bat lợi bởi sự ưu tiên của các tô chức với số lượng lớn dữ liệuhoặc hình ảnh với các loại nhãn Đối với đào tạo chung trong mạng học tập sâu,

những cơ sở có dữ liệu lớn có thể thao túng mô hình dự đoán, do đó các tổ chức vừa

và nhỏ không có động lực trong việc dao tạo chung Tuy nhiên, ở FL, vi trí của

những khách hàng có tập dữ liệu nhỏ này sẽ được dé cao do sự bình dang giữa các

bên.

Tóm lại, FL là một công nghệ phi tập trung cho phép các khách hàng hoặc tổ

chức phân tán tự đào tạo một mô hình cộng tác, đồng thời giữ cho dữ liệu được bảnđịa hóa Phương pháp này có thể hỗ trợ các tô chức doanh nghiệp chia sẻ các môhình cộng tác mà không cần chia sẻ bất kỳ dữ liệu thô nào [7]

25

Trang 40

2.2.3 Phân loại Federated Learning

om

Training data

Sample characteristics Sample characteristics

>

Federal Transfer Learning

Hinh 2.4 Hinh anh minh hoa FL theo chiéu ngang, chiéu doc va chuyén giao*

Theo sự phân bổ nguồn dữ liệu của các bên tham gia, FL thường có thé đượcchia thành ba loại, cụ thê là FL theo chiều ngang, chiều dọc và chuyền giao [9]

> Horizontal Federated Learning

Khi đặc điểm người dùng của hai tập dữ liệu chồng chéo nhiều hon và ngườidùng chồng chéo ít hơn, tập dữ liệu được chia theo chiều ngang dọc theo thứnguyên người dùng, phan dữ liệu có chứa đặc điểm người dùng giống nhau nhưngkhông cùng người dùng được lấy ra

Học liên kết ngang có thể liên quan đến học máy phân tán Trường hợp khác

biệt là dữ liệu được sử dụng là dữ liệu thiết bị cục bộ thay vì phân vùng dữ liệu

phân tán do máy chủ sở hữu Mỗi máy trong Học liên kết nhận được mô hình chungban đầu từ máy chủ, sau đó việc đào tạo được thực hiện trên dữ liệu cục bộ của mỗi

thiết bị (theo sau là các thông số mô hình của mô hình cục bộ) được chia sẻ với máychủ đề thực hiện bất kỳ cập nhật nào được yêu cầu trong mô hình chung Máy chủ

* https:/www.mdpi.com/1424-8220/20/21/6230

26

Ngày đăng: 03/11/2024, 18:30

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN