Hiéu được vấn dé trên, nhóm tác giả dé xuất phát triển một hệ thống nhận diện gương mặt trên các công nghệ blockchain chuỗi khối va federated learning học cộng tác dé có thể bảo vệ hình
Trang 1ĐẠI HỌC QUOC GIA TP HO CHÍ MINH TRUONG DAI HOC CONG NGHE THONG TIN KHOA MANG MAY TINH VA TRUYEN THONG
NGO PHUC THINH NGUYEN TRAN MINH THIEN
KHOA LUAN TOT NGHIEP
XAY DUNG HE THONG NHAN DIEN GUONG MAT
DUA TREN NEN TANG BLOCKCHAIN VA
FEDERATED LEARNING
BUILDING A FACE RECOGNITION SYSTEM BASED ON
BLOCKCHAIN AND FEDERATED LEARNING
KY SƯ NGÀNH MẠNG MAY TÍNH VA TRUYEN THONG DU LIEU
TP HO CHi MINH, 2022
Trang 2ĐẠI HỌC QUOC GIA TP HO CHÍ MINH
TRUONG DAI HOC CONG NGHE THONG TIN
KHOA MANG MAY TINH VA TRUYEN THONG
NGO PHÚC THỊNH - 18521439 NGUYEN TRAN MINH THIỆN - 18521428
KHOA LUAN TOT NGHIEP XÂY DỰNG HE THONG NHAN DIỆN GƯƠNG MAT
DUA TREN NEN TANG BLOCKCHAIN VA
FEDERATED LEARNING
BUILDING A FACE RECOGNITION SYSTEM BASED ON
BLOCKCHAIN AND FEDERATED LEARNING
KY SƯ NGANH MẠNG MAY TÍNH VÀ TRUYEN THONG DU LIEU
GIANG VIEN HUONG DAN
ThS NGUYEN KHANH THUAT
TP HO CHÍ MINH, 2022
Trang 3THONG TIN HOI DONG CHAM KHÓA LUẬN TOT NGHIỆP
Hội đồng cham khóa luận tốt nghiệp, thành lập theo Quyết định số
Ti8ầy của Hiệu trưởng Trường Đại học Công nghệ Thông tin.
Trang 4trình thực hiện khóa luận mà còn là hành trang cho chặng đường phía trước.
Ngoài ra, chúng em cũng xin cảm ơn Ban lãnh đạo Trường Đại học Công nghệ Thông tin
cũng như các phòng ban của trường đã tạo điều kiện, cơ sở vật chất để chúng em có cơ
hội và môi trường học tập và rèn luyện.
Do kiến thức và khả năng lý luận còn nhiều hạn chế nên khóa luận vẫn còn những thiếu
sót nhất định Em rất mong nhận được những đóng góp của các thầy cô, anh chị và bạn
bè để khóa luận tốt nghiệp của chúng em được hoàn thiện hơn.
Cuối cùng, em xin kính chúc các thay cô giáo Ban lãnh đạo và các phòng ban chức năng
Trường Đại học Công nghệ Thông tin déi dào sức khỏe và thành công trong sự nghiệp.
Chúng em xin chân thành cảm ơn
Trang 5MỤC LỤC
Chương 1 TONG QUAN e2tttitetrtrrrrretrrerrrrrrrre.Z
LiL Dat Van dé ẽẽ Ô
va ÔỎ
1⁄2⁄2 VG ứng dụng eeeeserrrerrrrrrrrrrrrro.Ö 1.3 Đối tượng nghiên cứu -eeeeeerererrrrrrrrrrrrrrrrrrreeereoeT
1.4 Phạm vi nghiên cứu -+-+e+eeeeertetrtrtrtrtrtrtrrrrrrrrrrrrrrrrrroou
1.5 Các công trình liên quan -c -ccceeeeeeeeeeeeeeerrrrsrseersoer Í
Chương 2 CƠ SỞ LÝ THUYẾT s+-esertereetrerrrrrrerrrrrerrererereÐ
2.1 Blockchain -hhtrHHHHHHHiirroD 2.1.1 Khái niệm Blockchain e ssc55sxveeecxvveeeerkrteererkrrsererkerrsrrrkrsee D
2.1.2 Kiến trúc blockchain eeeeeeeseeeierareu 2.1.3 Tông quan về thực hiện giao dich (Transaction) LO
2.1.4 Smart COnTaC( eeeeeeeeeeeerrrrrreroaeuer LD 2.1.5 Ethereum eceeeeiiiiiiiiiiiiiiiiriiearrruue LO
Trang 62.2.3 Phân loại Federated Learning -s«cceseeeeeeketrrierirrierike 26
2.2.4 Thuật tốn HH he 29
2.2.4.1 Federated Averaging (FedAv ) «-ceeeeririiiiirirree 29 2.2.4.2 Federated Stochastic Variance Reduced Gradient (FSVRG) 30 2.2.4.3, CO-OP,G HH HH HH HH hinh 32
2.2.5 _ Các biến thé của Federated Learning - c-eeciceeccceerrree 33
2.2.6 6® 1i s0 34
2.2.7 Ưu điểm và nhược điỂm -:++ceeceevvvvEEEEtrttreessevverrrrrrrrrree 35
2.2.8 _ Thách thức -cccccrittrriitEriirtiiiiiiiriiiieree 37
2.3 Nhận diện khuơn mặt (Face RecÒTnIfIOT)) -s-5-<sceserssesrresrrrrreee 38
Chương 3 CÀI ĐẶT HỆ THỐNG -2-:.2cttteetttretEtieetErrerrrrrerrrirrerre 40
3.1 Phnmẻm 4 AC 40
3.1.2 Cơng nghệ Web 3 ceriHhHHHH hy 42
3.1.2.1 Khái niệm . +.xrrrritrrirtrriirtriieriiriiiriiirirrree 42
3.1.2.2 Ưu điểm và nhược điỀm ::cecccettrtecvvEEEEtrieesvtrtrrrriseeerte 43
3.1.2.3 So sánh giữa Web 3.0 và Web 2.Ơ cekieiiike 45
3.1.3 Metamask HH này 46
3.1.4 — ReactJS HH HH ườ, 47 3.1.5 MongoDB ch HH ườt 48
3.1.6 FIT€SẨOF€ Ă HH he 49
3.2 PHAM CUM 7n ỒD 50
3.2.1 _ Je(son Namo eecsecssecssessessesseesseesseeseesseesseeneessseeaeenseeseeeaeenseeaseeaeenneesseeasenseenseeaeensees 50
3.2.1.1 Giới thiệu ceehHHnHHHnHỶH Hà HH HH 50
Trang 73.2.1.2 Ưu điểm và nhược điểm -++++++tttttreeeeeeseeveeevveeevre 52
3.2.2 Camera Raspberry Pi V2 «cchHhnHH nàng Hy 53
Chương 4 TRIỂN KHAI ỨNG DUNG ecssssssssssesssssesssnsesssnesssssesssnesssnsesnsnsesnseesneneesnenen 54
A.L Kiém tric hé th6ng wesscssssssssssssssssssssssssssssssessssssssssesssssssseessssssssssessasssseeeseassseeeeseen 54
4.2.1 _ Quy trình nhận diện gương mmặt -c-<eccrerssrreerrrserrxee 70
4.2.2 Dataset TH pti ect — : cookie 75 4.2.3 Thuật toán nhận điỆn ¿- 5c +5++x‡csecs+tvrersttersersrtsrsersrssrsersrrse 76
4.3 Hoạt động của hệ thong Pers vvoussussuseussusecuecsssvssuvsuvsuvssessesonssessossuvenusausniecueassaeeeas 77
Chương 5 DANH GIÁ HỆ THỐNG .-.e22ticcetteeEEtrerttrirerrrrrerrrireerre 89
SL ch 4.,,.,,H,,.HH., 89
"th 895.1.2 — Nhược điểm cciiceecELEEEEiieEEEEEEEEiiEEEEEErrrireekrrrrred 89
5.2 Đánh giá -«-ccLt+ HH HH HH HH ườn 90
5.2.1 _ Đánh giá smart COTIẦTACfS .cccc+cceceEEEEtsrktetrertserkerrkrrrree 90
5.2.2 Đánh giá hệ thống nhận điiỆn ‹ sc-s+c+xserseesreersrssrsersresrsersrree 94
Chương 6 KET LUẬN VÀ HƯỚNG PHÁT TRIỂN -. -eserccetre 98
INN (9o ioãŸôÝŸẳẲáÁẮÝ 98
Trang 86.2 Hướng phát triển
Trang 9DANH MỤC HÌNH ẢNH
Hình 2.1 Hình ảnh minh hoa mô tả kiến trúc blockchain -:-ccccecceere 7
Hình 2.2 Hình ảnh mô tả luồng thực hiện franSaCfION c c-+c<cceecsereererexee 10
Hình 2.3 Hình ảnh minh hoạ šŠn o0 NỚ""" 13
Hình 2.4 Hình ảnh minh họa FL theo chiều ngang, chiều doc và chuyên giao 26
Hình 2.5 Hình anh minh họa giải thuật Federated Averagng -« -««- 30
Hình 2.6 Hình ảnh minh họa về giải thuật Federated Stochastic Variance Reduced €6r1o nh 31
Hình 2.7 Hình ảnh minh họa về giải thuật CO — OP c-+ccerieeriirirrrirerrrrre 33 Hình 3.1 Hình ảnh minh họa về Docker -:ciccccccceeevevvvvvvvvvvvvvEvEEEEEEEEEEEEErrrrrrrre 40 Hình 3.2 Hình ảnh minh họa về Web 3.0 csssssssssssssssssssssssssssssssssssssssssssssesessesessseeseseeee 42 Hình 3.3 Hình ảnh minh hoa về Metaimask cccccccccriiirirrevvveerrrrrrrrrirreeeeerrrrre 46 Hình 3.4 Hình ảnh minh họa về ReactJS c-e++eeceerrreecvrrrcrrrrrrrrrerrrree 47 Hình 3.5 Hình ảnh minh hoa về MongoDB -ccccccrrrreeevevrrrrressevrrrrre 48 Hình 3.6 Hình ảnh minh họa vn 49
Hình 3.7 Hình ảnh minh họa về Jetson Nano cccececeevevvvvvvvvvvvvvvvvvEvEvrrrrrrrrre 50 Hình 3.8 Hình ảnh minh họa về các chỉ tết của Jetson Nano -:-.-c::c + 51
Hình 3.9 Hình ảnh minh hoa Raspberry Pi V2 -ce sestseekkikkirriieiiriee 53 Hình 4.1 Hình ảnh minh hoa Sơ đồ mô tả sơ lược hệ thống 54
Hình 4.2 Hình ảnh mô tả blockchain giả lập dùng trong hệ thống 57
Hình 4.3 Hình anh mô tả các blocks được lưu lại trên Ganache - 57
Hình 4.4 Hình anh mô tả kiểm tra giao dịch trên Ganache như trên Etherscan 58
Hình 4.5 Hình ảnh mô tả cách kết nối với Ganache -. .ereer 58 Hình 4.6 Hình ảnh minh họa giao diện Web3 đối với người dùng 59
Hình 4.7 Hình anh minh họa giao diện Web3 đối với công ty 60
Hình 4.8 Hình ảnh minh họa code Smart COTFAC -5-cc5sccs+cssccssssrseesrssrsersesss 60
Hình 4.9 Hình anh minh họa code KyCCOnITACT 5s SetiekeiEiirriririiriee 61
Hình 4.10 Hình ảnh minh họa code Crowdsale -. cccccccsscssesexsersersersersersee 62
Trang 10Hình 4.11 Hình ảnh minh họa code MIBTAtIOTIS c5cccccssccekeekrerrerrerrrrkee 62 Hình 4.12 Hình anh minh họa code My TOKeN 55c cesccekeererrrerererserreee 63 Hình 4.13 Hình anh minh họa code My TokenSale -‹ ‹e c«exesexeersexxeee 63 Hình 4.14 Hình ảnh minh họa thêm thư viện OpenZeppelin -« 64
Hình 4.15 Hình ảnh minh họa về giao diện 'TSCaH -ccc«ccrserierrrrrrirerirrriee 65
Hình 4.16 Hình ảnh minh họa cách hoạt động trong hệ thống ¬" ÔỎ 66
Hình 4.17 Hình anh mô tả cấu trúc OTP trong dataset -s ss-.-e5 67
Hình 4.18 Hình ảnh minh họa trích xuất OTP và tìm gương mặt đó trong database
— Ô.ÔỎ 68
Hình 4.19 Hình ảnh minh về database FirestOre -s++cestrccetrrerzrrre 69Hình 4.20 Hình ảnh minh họa về database MySQL ccceeekieierre 69Hình 4.21 Hình ảnh minh họa về database MongoDB -. ss:.- 70
Hình 4.22 Hình ảnh minh họa chạy file 01_ face_ dataS€f.DV c-<ce-c«ee 70
Hình 4.23 Hình ảnh minh họa kết quả tạO afAS€( c«ccxestkekieeirkriirierie 71
Hình 4.24 Hình ảnh minh họa chạy file 01_ face_ đataSe{.DY e- cceeceeseersee 71
Hình 4.25 Hình ảnh mô tả quá trình thu thập thông tin -c-s<c-cs« 71
Hình 4.26 Hình ảnh minh họa chon tài khoản đăng nhập -s-<-s«+ 72
Hình 4.27 Hình ảnh minh họa kết quả nhận OTP thành công 73
Hình 4.28 Hình anh minh họa file trainer.y1m] secccseesrxeeretsererkerrrkerrrke 73 Hình 4.29 Hình ảnh minh họa file trainer.yml do người dùng tải lên 73
Hình 4.30 Hình ảnh minh họa nhận diện trên Jetson Nano . - 74
Hình 4.31 Hình ảnh minh họa về tập dataset lấy từ camera 75
Hình 4.32 Hình ảnh minh hoa tập dữ liệu của người dùng -««e «e 75
Hình 4.33 Hình ảnh mô tả quá trình nhận diện - -©cescrsr+eerxeeersrreee 76
Hình 4.34 Hình ảnh mô tả hệ thong nhận điiỆn -s-cs-sccsccsceeeseesreerseesrssrsrrsses 77Hình 4.35 Hình ảnh mô tả quá trình kết nối với metamaks - - 78Hình 4.36 Hình ảnh minh họa mô ta giao diện người khi người dùng kết nối 78
Hình 4.37 Hình ảnh minh họa mô tả giao diện phía công fy -s¿ 79
Hình 4.38 Hình ảnh minh họa mô tả thông báo sau khi KYC cho người dùng 79
Trang 11Hình 4.39 Hình ảnh minh họa mô ta database phía FlresfOre - 79
Hình 4.40 Hình ảnh minh họa mô tả người dùng nhập chính xác OTP và nhận token
Hình 4.43 Hình ảnh minh hoa mô tả module người dùng tải về dé huấn luyện dữ
083i ác 82 Hình 4.44 Hình anh minh hoa mô tả quá trình nhập OTP và chụp hình gương mat82
Hình 4.45 Hình ảnh minh họa mô tả quá trình huấn luyện - 83
Hình 4.46 Hình ảnh minh họa mô tả quá trình xác thực tài khoản email 83 Hình 4.47 Hình ảnh minh họa mô tả quá trình tự động gửi file lên phía trụ sở công
Hình 4.48 Hình anh minh hoa mô ta database MySQL ở phía công ty 84
Hình 4.49 Hình ảnh minh hoa mô tả quá trình nhận diện thực tế Ở công ty 85
Hình 4.50 Hình ảnh minh họa mô tả quá trình công ty gửi token cho người dùng đã nhận diện thành CONG ceecssecseecsescseeesseecseecsessseesseesseesseesseeesseesssessaeesssessaeeeseessaeseaeeeseesaeerseeses 86 Hình 4.51 Hình ảnh minh họa mô tả người dùng nhận được token và trạng thái thay
„1 87
Hình 4.53 Hình ảnh minh họa mô tả trạng thái được trở VỀ ÍT©€ ccccrrirrceeecee 88
Hình 5.1 Hình ảnh mô tả bảng đơn vi của Ether€um -« ‹«-‹sscse+ssexeeresxeee 90
Hình 5.2 Hình anh mô tả phí gas người dùng phải trả dé sở hữu token công ty 21
Hình 5.3 Hình ảnh mô tả phí gas thực tế tại điểm hiện tại theo zapper.fi 92
Hình 5.4 Hình anh mô tả phí gas phía công ty cần dé có thé thêm người dùng vào
Hình 5.5 Hình anh mô tả đánh giá kết quá nhận diện phía trụ sở - 94
Trang 12Hình 5.6 Hình anh mô tả code cấu hình độ phân giải -: cccceerrrcceHình 5.7 Hình ảnh tùy chỉnh thông số và chạy trên thiết bị mạnh hơn
Trang 13DANH MỤC BANG
Bang 3.1 Bang so sánh giữa Web 3.0 và Web 2.0 [12]
Bang 5.1 Bảng thông số các Smart Contract
. -Bảng 5.2 . -Bảng so sánh giữa nhận diện trên Jetson Nano và PC
Trang 14DANH MỤC TỪ VIET TATChữ viết tắt Y nghĩa
EL Federated Learning
API Application Programming Interface WASM WebAssembly
NFT Non-Fungible Token
KYC Know Your Customer
EVM Ethereum Virtual Machine
ICO Initial Coin Offering
FPS Frames per second
CV Curriculum Vitae
Trang 15TOM TAT KHÓA LUẬN
Blockchain, Federated Learning và nhận diện gương mặt là những công nghệ
được sử dụng rộng rãi ở khắp nơi trên thế giới Mỗi công nghệ có ưu và nhược điểm
khác nhau, mục đích sử dụng khác nhau Tuy nhiên, ở khóa luận này chúng tôi đã
kết hop các công nghệ này đề xây dựng lên một hệ thong hoàn chỉnh giúp nhà tuyển
dụng và người ứng tuyển dễ dàng kết nối với nhau hơn Hệ thống sẽ giúp giải quyếtcác vấn đề như viết kinh nghiệm trong CV không đúng thực tế, đữ liệu của gương
mặt bị đánh cắp
Thông qua hệ thống này, thông tin trạng thái việc làm của người dùng sẽđược công khai minh bạch, hợp lệ bằng cơ chế giữ số lượng token nhất định của
công ty Kinh nghiệm và thời gian làm việc sẽ được lưu trữ vĩnh viễn trên
blockchain giúp các nhà tuyển dụng sau này dé dàng trong việc kiểm tra tính trungthực của ứng viên Hệ thống còn đảm bảo việc dữ liệu gương mặt hoàn toàn đượcbảo mật trên thiết bị người dùng, không cần phải gửi đến công ty băng phương pháp
Federated Learning của Google.
Với mục tiêu đảm bảo sự bảo mật tối da cho cả phía người dùng và công ty
Hệ thống sẽ có những tính năng đảm bảo sự an toàn như xác thực otp, email, địa chỉví Bên cạnh đó, hệ thống còn sử dụng các phần mềm của bên thứ ba như
metamask, ganache và áp dụng những công nghệ của google cloud như google
drive API, firestore dé tạo ra một hệ sinh thái hoàn chỉnh giúp nhà tuyên dung và
người dùng kết nôi với nhau một cách an toàn nhât.
Trang 16Chương 1 TONG QUAN
1.1 Đặt vấn đề
Hệ thống nhận diện gương mặt không phải là một đề tài gì mới đối với các
công ty, trường học, cơ quan Tuy nhiên, làm sao để có một hệ thống có được
tính cá nhân hóa — bảo vệ được thông tin người dùng lại là một thách thức cực kì lớn.
Hình ảnh gương mặt đôi khi đối với người dùng phô thông ở thời điểm hiện tại có thể không mấy quan trọng khi nếu bị rò ri nhưng nếu các hệ thống nhận diện
ngày càng áp dụng rộng rãi thì nó là một van dé đáng quan tam Giả sử người dùng
sử dụng một chiếc điện thoại thông minh (smartphone) có khả năng mở khóa bằng
gương mặt và bị đánh cắp — nếu kẻ đánh cấp đã có hình ảnh gương mặt của người dùng thì kẻ đánh cắp có thể giả mạo người dùng một cách dễ dàng chiếm quyền
truy cập vào điện thoại bằng nhiều cách khác nhau như in ra tắm hình dé mở khóa
2D hoặc cao cấp hơn nữa là dùng công nghệ cao như của deep fake để tạo ra một mặt nạ để giả mạo Đối với những ứng dụng có yêu cầu độ bảo mật cao hơn như
smart home, smart car thì việc chiếm quyền các thiết bị mở khóa bằng gương
mặt sẽ trở nên đáng lo ngại.
Hiéu được vấn dé trên, nhóm tác giả dé xuất phát triển một hệ thống nhận diện gương mặt trên các công nghệ blockchain (chuỗi khối) va federated learning
(học cộng tác) dé có thể bảo vệ hình ảnh dữ liệu thô của người dùng một cách an
toàn nhất Trong đó, blockchain đóng vai trò trong việc định danh người dùng duy
nhất:
- _ Tránh các tình huống giả mạo đồng thời giúp các công ty dé dang hơn trong
việc tuyển nhân sự thông qua cơ chế tokenomic và federated learning giúp người
dùng có thé huấn luyện (training) hình ảnh gương mặt trên chính thiết bị của mình.
- Tránh lưu hình ảnh dữ liệu thô trên các hệ thống nhận diện phòng trường
hợp hệ thống bị tan công.
Trang 171.2 Mục tiêu
1.2.1 Về lý thuyết
- Tìm hiểu lịch sử hình thành và phát triển của công nghệ chuỗi khối — Blockchain Hiểu được kiến trúc và hoạt động cơ bản của nền tảng Blockchain, các
cơ chế đồng thuận trong Blockchain.
- Tìm hiểu về kỹ thuật học liên kết — Federated learning (FL) về cách thức hoạt động dé xây dựng một hệ thống điểm danh nhận diện gương mặt.
1.2.2 Về ứng dụng
- Xây dựng và triển khai ứng dụng nhận diện gương mặt dựa trên một nền tảng Blockchain (cụ thé là Ethereum) và kỹ thuật Federated learning dé đáp ứng nhu cầu
hiện tai.
- Hệ thống được phát triển trên nền tang công nghệ phát triển ứng dụng web3
mới nhất, cùng với các thiết bị nhúng dé thiết kế và phát triển hệ thống điểm danh
bằng việc nhận diện gương mặt.
- Người dùng không cần cung cấp dữ liệu gương mặt tập trung về một điểm duy nhất thay vì kỹ thuật học liên kết cho phép huấn luyện mô hình ngay trên thiết
bị thông minh (máy tính cá nhân), đảm bảo được độ bảo mật của dữ liệu gương mặt
người dùng.
- Bang công nghệ Blockchain đảm bảo thông tin của người dùng là minh bạch,
TỐ ràng.
1.3 Đối tượng nghiên cứu
Đối tượng nghiên cứu của dé tài nghiên cứu này công nghệ chuỗi khối —
Blockchain, cụ thé là Ethereum cùng với phương pháp học liên kết — Federated learning và các công nghệ phát triển ứng dụng web Tận các đặc trưng của
Blockchain và Federated learning áp dụng vào công nghệ nhận diện gương mặt.
Trang 181.5 Các công trình liên quan
- _ Tích hợp Federated Learning và Blockchain tạo một mô hình mới, được gọi
là FLchain, có khả năng biến các mạng điện toán biên di động (Mobile edgecomputing — MEC) thông minh thành các hệ thống phi tập trung, an toàn và nângcao quyền riêng tu [1]
- Đề xuất kiến trúc chuỗi khối FL (BlockFL), trong đó mạng blockchain chophép trao đổi cục bộ của thiết bị cập nhật mô hình trong khi xác minh và cung cấpphần thưởng tương ứng với số lượng mẫu dữ liệu đã đóng góp cho quá trình huấnluyện mô hình Giải quyết các vấn đề về cơ chế trao đổi và phần thưởng riêng tư,
bằng cách tận dụng blockchain thay vì một thực thê trung tâm [2]
Đề xuất khuôn khổ PrivacyFace cải thiện phần lớn tính năng nhận dạng khuôn mặthọc tập liên kết thông qua giao tiếp thông tin phụ trợ và quyền riêng tư giữa cáckhách hàng Khuôn khổ PrivacyFace được đề xuất được chứng minh về mặt toán
học là có tính riêng tư khác biệt, giới thiệu chi phí nhẹ cũng như mang lại các mức
tăng hiệu suất nôi bật [3]
Trang 19Chương 2 CƠ SỞ LÝ THUYET
Blockchain 2.1.1 Khai niệm Blockchain
Công nghệ chuỗi khối là một giao thức mới mang tính cách mang dé chia sẻ
và cập nhật thông tin băng cách liên kêt các sô cái hoặc cơ sở dữ liệu trong một
mạng truy cập mở, ngang hàng, phi tập trung Blockchain được thiết kế dé đảm bảo
dữ liệu được lưu trữ và cập nhật một cách an toàn, chống giả mạo và không thé thay
đôi [4]
> Ưuđiểm:
Công nghệ Blockchain là hệ thống phi tập trung, các giao dịch củaBlockchain có băng chứng xác thực và ủy quyền riêng để thực thi các ràngbuộc Và nó có nghĩa là các giao dịch có thê được xác minh và xử lý độc lập
Mỗi hành động được ghi lại vào Blockchain và dữ liệu của các bản ghi có
sẵn cho mọi người tham gia vào Blockchain này và không thê thay đổi hoặcxóa Kết quả ghi lại này cho thấy tính minh bạch, bất biến và đáng tin cậy
của Blockchain.
Sự tin cậy của Blockchain dựa trên sự tin tưởng của hai hoặc nhiều người
tham gia, những người không biết nhau
Sự bất biến đạt được khi các giao dịch được đồng ý và chia sẻ trên toàn bộ
Blockchain Khi giao dịch được kết nối với Blockchain, bạn sẽ không thểthay đổi hoặc xóa giao dịch đó
Tính minh bạch của Blockchain đạt được trên quá trình sao chép giao dịch.
mỗi giao dịch được sao chép vào một trong hai máy tính trong mang
Blockchain Mọi người tham gia đều có thé xem tat cả các giao dịch, cũng cónghĩa là mỗi hành động đều được hiển thị cho những người tham gia
Blockchain.
Trang 20e Tính bảo mật cao của công nghệ Blockchain đạt được khi từng cá nhân vào
mạng mỗi người tham gia vào Blockchain được cung cấp một danh tính duy
nhất được liên kết với tài khoản của người dùng
e Viéc sử dụng công nghệ Blockchain giúp giảm thời gian xử lý và khởi tạo
xuống nhiều lần — từ khoảng 3 ngày xuống còn vài phút hoặc thậm chí vài
giây.
> Nhược điểm:
e Nhược điểm chính của Blockchain là tiêu thụ năng lượng cao Việc tiêu thụ
điện năng là cần thiết dé ghi số cái theo thời gian thực
e Việc xác minh chữ ký là thách thức của Blockchain, vì mỗi giao dịch phải
được ký bằng sơ đồ mật mã, sức mạnh tính toán lớn là cần thiết cho quá trìnhtính toán đến dấu
e_ Một van đề khác của Blockchain là sự cân bằng giữa số lượng nút va chi phí
thuận lợi cho người dùng Có những nút bị thiếu để Blockchain hoạt động
chính xác và mạnh mẽ Trong trường hợp này, chi phí cao hơn, vì các nút
nhận được phần thưởng cao hơn; nhưng các giao dịch hoàn thành chậm hơn,
vì các nút không hoạt động cao độ.
e_ Chi phí cao là một bat lợi lớn của Blockchain Chi phí trung bình của giao
dịch là từ 75 đến 160 đô la và phần lớn trong số đó bao gồm mức tiêu thụ
năng lượng.
Trang 212.1.2 Kiến trúc blockchain
h Network Participant/Nodes ị Blockchain
i |i Application Layer (Business Logic)
Digital asset
transactions Smart contracts
_— Distributed Computing Layer
e© Infrastructure layer: Lớp cơ sở hạ tầng bao gồm tat cả các thành phan
phần cứng cần thiết để chạy blockchain, chăng hạn như các nút (node),
bộ nhớ và cơ sở mạng Các nút là những người tham gia mạng Một mạng
lưới blockchain điển hình có ba loại nút khác nhau: đơn giản (còn đượcgọi là nút sáng), đầy đủ và khai thác Một nút đơn giản trong mạng có thểchỉ gửi và nhận các giao dịch và không lưu trữ bản sao của số cái, khôngxác thực giao dịch, trong khi một nút đầy đủ thì có Nút khai thác (cònđược gọi là trình tạo khối) là một nút đầy đủ có khả năng khai thác, tức làquá trình tạo một khối mới Thành phần lưu trữ lưu trữ số cái của các bản
ghi giao dịch.
1 https://www.mdpi.com/2073-8994/1 1/10/1198
Trang 22e Platform layer: Lớp nền tang tạo điều kiện cho Remote Procedure Calls
(RPC), web Application Programming Interface (API) va
Representational State Transfer (REST) API dé giao tiếp giữa những
người tham gia mang.
e Distributed computing layer: Lớp điện toán phân tan đảm bảo quyền
truy cập cục bộ vào dữ liệu, khả năng chịu lỗi, tính bất biến, quyền riêng
tư, tính xác thực và bảo mật cho dữ liệu giao dịch Tính bắt biến là thuộctính của chuỗi khối không cho phép sửa đổi các bản ghi giao dịch khi đãđược cập nhật trên số cái Mạng blockchain sử dụng giao thức đồng thuận
đề đạt được thỏa thuận về thứ tự của các giao dịch trong mạng, cập nhật
số cái và lựa chọn công cụ khai thác cho thế hệ khối tiếp theo Ngoài ra,
lớp này chịu trách nhiệm xác thực người dùng bằng cách sử dụng kỹ
thuật mã hóa và bao mật dữ liệu thông qua kỹ thuật băm.
e Application layer: Lớp ứng dụng là logic nghiệp vụ cho các giao dịch tài
sản kỹ thuật số và thực hiện các hợp đồng thông minh Một ứng dụngđược phát triển trên mạng blockchain có thể được khách hàng truy cậpbang cách sử dụng lớp nền tảng Các lớp của kiến trúc blockchain có cácđặc điểm sau:
o Phi tập trung — Decentralization: Các giao dịch trong blockchain
được xử lý và xác thực bởi sự đồng thuận của hầu hết các nút mạng.Chúng được sao chép trên các nút trong một sô cái Điều này giúp loại
bỏ sự cần thiết của một bên trung gian để chia sẻ và duy trì dữ liệu
giao dịch.
o Tính bat biến —- Immutability: Các giao dịch trong blockchain được
lưu trữ thành các khối Mỗi khối trong chuỗi được liên kết với khối
trước đó bang cách sử dụng hàm băm mật mã Bat kỳ nỗ lực nào dé
sửa đổi nội dung của một khối sẽ ảnh hưởng đến các khối tiếp theo
trong chuỗi Do đó, kẻ tấn công độc hại cần phải thay đổi tất cả các
Trang 23khối kế tiếp trong chuỗi dé sửa đổi một khối cụ thé, điều này rất khó
về mặt tính toán vì các khối chuỗi được sao chép qua nhiều nút
Tính minh bạch — Transparency: Số cái chỉ được cập nhật khi hầuhết các nút đạt được sự đồng thuận Các thay đôi trong mạng đượchiển thị công khai đảm bảo tính minh bạch và bảo mật
Truy xuất nguồn sốc — Traceability: Ban chat phân tán và minhbạch của blockchain giúp việc theo dõi bất kỳ sự kiện giao dịch nào
trở nên dễ dàng hơn Mỗi bản cập nhật trong trạng thái của nội dung
có thể được truy ngược về nguồn gốc của nó Điều này giúp làm cho
mạng an toàn, hiệu quả và minh bạch hơn.
Tinh đáng tin cậy — Trustless: Blockchain cho phép giao dịch tài san
giữa các bên không xác định, những người không tin tưởng lẫn nhau.
Bằng cách phân phối số cái trên một số nút trong mạng và cập nhật sốcái này thông qua một sự đồng thuận đảm bảo tính hợp lệ của các giao
dịch trong một môi trường không đáng tin cậy.
Trang 242.1.3 Tổng quan về thực hiện giao dịch (Transaction)
| | Private key Public "|
pees Pool of valid
"ante tacts
User
Validator nodes
=
Block Generator Nodes
Hash of Hashof | Hash of _ Hashof |
previous block previous block previous block T i previous block | Hash of block 0
NUƯƯỚNGGGGINGGG one iat
f f 1 Ƒ
Block hash Block hash Block hash loa * Block hash Block hash
Block n+2 Block n~1 Block n Block 1 Genesis block
Hình 2.2 Hình anh mô tả luồng thực hiện transaction?
> Luông thực hiện giao dịch trong mang blockchain sử dụng các thành phan sau:
e Transaction: Một quy trình thay đổi trạng thái của số cái blockchain Tùy
thuộc vào ứng dụng, giao dịch có thể là chuyển giao giá trị tài chính hoặc
thực hiện hợp đồng thông minh.
¢ Block: Nó bao gồm một tiêu đề khối và dit liệu khối Tiêu đề bao gồm thông
tin siêu dữ liệu khối như ham băm Merkle root, ham băm khối trước đó, thờigian và phiên bản của khối, trong khi dir liệu bao gồm tập hợp các giao dịch
hợp lệ.
e_ Merkle tree root hash: Tất cả các giao dich trong khối được băm riêng lẻ
băng cách sử dụng thuật toán băm Các giá trị băm sau đó được kết hợp theo
từng cặp và được băm lại cho đến khi thu được một giá trị băm duy nhất Giá
trị này được gọi là giá tri băm Merkle root.
? https://www.mdpi.com/2073-8994/1 1/10/1198
10
Trang 25e Block hash: Nó là mã định danh duy nhất của một khối cụ thé va được lấy
bang cách băm tiêu đề khối hai lần
e Previous block hash: Nó là hàm băm của khối đứng trước khối hiện tại
trong chuỗi Khối trước được gọi là khối cha của khối hiện tại Việc sử dụnggiá trị băm khối trước đó trong tiêu đề khối là để đảm bảo tính bất biến của
số cái blockchain
e Timestamp: Nó cho biết thời gian khối được tạo
e Block version: Nó chi ra phiên ban của các giao thức blockchain được sử
dụng.
e_ Mining: Là quá trình thêm các giao dịch hợp lệ vào một khối và phát khối đó
lên mạng.
e Genesis Block: Đây là khối đầu tiên trong số cái Tất cả các khối sau trong
chuỗi được liên kết với khối gốc Khối nguồn gốc thường bao gồm cấu hìnhcho các đặc tính mạng, giao thức đồng thuận được sử dụng, quyền kiểm soáttruy cập, hàm băm, khoảng thời gian tạo khối và kích thước khối
> Quy trình thực thi bao gồm các bước sau:
e Transaction proposal: Người dùng đầu tiên băm dữ liệu giao dịch bằng
cách sử dụng hàm băm dé xác minh tính toàn vẹn của dữ liệu sau này Sau
đó, dữ liệu đã băm được mã hóa bằng khóa riêng của người dùng để cungcấp xác thực người dùng và đầu ra được mã hóa được gọi là chữ ký số củagiao dịch đó Dữ liệu giao dịch và chữ ký được truyền vào mạng
e Transaction and block validation: Xác thực giao dịch và khối: Mỗi nút đầy
đủ trong mạng xác thực giao dịch bang cách thực hiện hai tác vu: xác thựcngười dùng bằng cách giải mã chữ ký số bằng khóa công khai của người
dùng đề xuất và tính toàn vẹn đữ liệu bằng cách băm giao dịch dữ liệu và so
sánh nó với chữ ký được giải mã Giao dịch hợp lệ được phát tới các trình
tạo khối (thợ đào) trong mạng Một người khai thác được chọn (dựa trên sự
đồng thuận) sẽ xác minh các giao dịch hợp lệ và nhóm chúng thành một khốitheo cách mà kích thước khối không vượt quá ngưỡng được xác định trước
11
Trang 26Người khai thác tính toán giá trị băm Merkle root Hàm băm tóm tắt của tất
cả các giao dịch do Merkle root cung cấp một quy trình hiệu quả để xác minhmột giao dịch trong một khối Dé xác minh xem một giao dịch có được baogồm trong một khối hay không, một nút chỉ yêu cầu các giá trị băm củađường dẫn Merkle kết nối giao dịch với Merkle root Do đó, một nút khôngduy trì toàn bộ bản sao của sô cái có thé xác minh giao dịch bằng cách yêu
cầu đường dẫn mà không cần nhận toàn bộ khối, giảm chỉ phí giao tiếp Để
xác minh một giao dịch trong một khối, bao gồm n giao dịch, một nút chỉyêu cầu giá trị băm logon sử dung Merkle root so với n giá trị băm nếu
Merkle root không được sử dụng Sau khi tính toán giá tri băm Merkle root,
băm khối được tạo Người khai thác truyền khối tới mạng Các nút xác thựcxác minh tính hợp lệ của khối bằng cách kiểm tra tính đúng đắn của nhữngđiều sau: băm khối, dau thời gian của khối lớn hơn dau thời gian của khốitrước đó, giá trị block height và kích thước khối, giá trị băm của khối trước
đó và tính hợp lệ của tất cả các giao dịch trong khối Mỗi nút xác thực gắn
khối hợp lệ vào bản sao số cái của chính nó.
2.1.4 Smart Contract
Smart Contract là một chương trình máy tính có các thuộc tính tự xác minh,
tự thực thi, chống giả mạo Nó cho phép thực thi mã mà không cần bên thứ ba Hợpđồng thông minh bao gồm giá trị, địa chỉ, chức năng và trạng thái Nó nhận giao
dịch làm đầu vào, thực thi mã tương ứng và kích hoạt các sự kiện đầu ra Tùy thuộcvào các trạng thái thực hiện logic chức năng là những thay đôi [6]
Tầm quan trọng của việc tích hợp hợp đồng thông minh của công nghệblockchain trở thành một lĩnh vực trọng tâm dé phát triển vì nó cung cấp cho giaodịch ngang hàng và cơ sở dữ liệu có thé được duy trì công khai một cách an toàntrong một môi trường đáng tin cậy Hợp đồng thông minh có thê theo dõi và không
thé thay đổi Tất cả thông tin giao dịch đều có trong hợp đồng thông minh và nó
thực thi tự động.
12
Trang 27Về bản chất, Smart Contract chỉ là một đoạn mã chạy trên một hệ thống phân
tán (blockchain), cho phép tạo ra các giao thức Permissionless (tức là không cần
trao quyền) Điều đó có nghĩa là:
e Hai bên trong hợp đồng có thé đưa ra các cam kết thông qua blockchain mà
không cần biết về danh tính hay sự tin cậy lẫn nhau
e_ Các bên trong hợp đồng có thé đảm bảo rằng nếu các điều kiện của hợp đồng
không được thỏa mãn, hợp đồng sẽ không được thực thi
e Ngoài ra, hợp đồng thông minh giúp loại bỏ vai trò của các bên trung gian
Hợp đồng được ký trực tiếp giữa người bán - người mua giúp giảm đáng kê
chi phí hoạt động.
Traditional Contracts
Smart Contracts
Mỗi blockchain có một phương pháp triển khai hợp đồng thông minh khác
nhau, ví dụ trên Cosmos có WASM, Polkadot có ink! Trong đó nỗi bật nhất vẫn là
Smart Contract chạy trên máy ảo của Ethereum (Ethereum Virtual Machine EVM).
-Trên Ethereum, các Smart Contract chịu trách nhiệm thực thi và quan lý các
hoạt động diễn ra trên blockchain khi những người dùng (address) tương tác với
3 https:/coin98.net/smart-contract-la-gi
13
Trang 28nhau Bat kỳ địa chỉ nào không phải là smart contract đều được gọi là Tài khoản độc
lập (Externally Owned Account - EOA) Do đó, smart contract sẽ do máy tính kiểm
soát và EOA do người dùng kiểm soát
Smart Contract Ethereum bao gồm một mã hợp đồng và hai khóa công khai:
e Khóa công khai thứ nhất là khóa do người tạo hợp đồng cung cấp
e Khoa còn lại đại diện cho chính hợp đồng, khóa này có vai trò như một mã
định danh kỹ thuật số duy nhất cho mỗi Smart Contract
Smart Contract được triển khai thông qua giao dịch blockchain và chúng chỉ
được kích hoạt khi một Tài khoản độc lập (EOA) hoặc các Smart Contract khác gọi
chúng Tuy nhiên, kích hoạt đầu tiên luôn từ phía EOA (người dùng)
> Ưu điểm
Hợp đồng thông minh là một bộ mã có thê lập trình, có khả năng tùy chỉnhcao và có thé được thiết kế theo nhiều cách khác nhau đề có thé cung cấp nhiều loại
dịch vụ và giải pháp.
Ngoài ra, hợp đồng thông minh là các chương trình phi tập trung và tự thực
hiện (self-executing), chúng giúp tăng tính minh bạch và giảm chi phí hoạt động.
Nếu được triển khai đúng cách, chúng cũng có thé tăng hiệu quả vận hành và giảm
chi phí hành chính.
> Nhược điểm
Smart Contract dựa trên hệ thống blockchain nên không thé sửa đôi và can
thiệp Một khi Smart Contract được viết ra, nễu muốn thay đôi thì chỉ có cách viếtlại một hợp đồng mới Tính chất không thé thay đổi là một ưu điểm lớn, tuy nhiêntrong một số trường hợp có thể là nhược điểm
> Ứng dụng của Smart Contract
Về cơ bản, hầu hết các ứng dụng được cung cấp bởi các hệ thống tập trungđều có thé được thiết kế tương tự và cung cấp bởi các Smart Contract trên
blockchain.
14
Trang 29Smart Contract cho phép các nhà phát triển có thể thiết kế ra nhiều trường
hợp sử dụng khác nhau Ví dụ: Ví tiền điện tử để lưu trữ Coin & Token, các sàn
giao dịch phi tập trung (DEX), trò chơi (gaming), NFT Và ở khóa luận này smart
contract được sử dụng trong trường hợp ràng buộc người dùng công ty với một
lượng token có định thé diện cho trạng thái việc làm của chính mình
2.1.5 Ethereum
Ethereum viết tắt ETH là một nền tảng phần mềm mã nguồn mở, phi tậptrung và dựa trên các chuỗi khối Đây là một nền tảng cho phép người dùng sử dụngHợp đồng thông minh (Smart Contract) và Ung dung phi tập trung (dApp) dé giúp
các giao dịch được thực hiện nhanh chóng hơn, ngăn ngừa những hành vi lừa đảo.
Ethereum có nhiêu khả nang hơn so với Bitcoin và các loại tiên điện tử khác,
có thê triên khai các mã của riêng mình và tương tác với các ứng dụng do người khác tạo Ethereum có thê khởi chạy tât cả các loại chương trình phức tạp nhờ vào
tính linh hoạt của nó.
Ethereum như một nền tảng phần mềm mở hoạt động trên công nghệBlockchain, được lưu trữ ở nhiều máy tính trên khắp thế giới Ưu điểm này giúp
Ethereum trở nên phi tập trung.
Mỗi máy tính có một bản sao của chuỗi khối và phải có sự thống nhất rộng
rãi trước khi có thé thực hiện bat kỳ thay đổi nào đối với mạng
Chuỗi khối Ethereum tương tự như Bitcoin khi cùng có bản ghi lịch sử giaodịch Tuy nhiên, Ethereum cũng cho phép các nhà phát triển xây dựng và triển khai
các ứng dụng phi tập trung Chúng được lưu trữ trên Blockchain cùng với các bản ghi của các giao dịch.
Một số thông tin cơ bản về ETH:
e Tên: Ethereum.
e Ky hiệu: ETH.
e Blockchain: Ethereum.
15
Trang 30e Tiêu chuẩn: ERC-20.
Mỗi nút Ethereum trong mạng chạy một EVM và thực hiện các hướng dẫn
giống nhau EVM đã được lập trình trong C++, Go, Haskell, Java, Python, Ruby,Rust và WebAssembly (hiện đang được phát triển)
EVM tất cần thiết cho giao thức Ethereum và là công cụ hỗ trợ cho công cụ
đồng thuận của hệ thống Ethereum Nó cho phép bat cứ ai thực hiện mã trong một
hệ sinh thái không tin tưởng mà tại đó kết quả hoạt động có thé được đảm bảo vàhoàn toàn xác định thực hiện các hợp đồng thông minh
Đối với mọi chi thị được trién khai trên EVM, người ta cho ra một chi phíthực hiện có tên là Gas Khi người dùng muốn đào ether, họ dự trữ một số ether dé
san sàng chi trả phí Gas này.
Bằng cách sử dụng phí giao dịch Gas, có hai vấn đề chính được giải quyết:Trình xác nhận đảm bảo đã nhận được số tiền trả trước ban đầu, ngay cả khi việckhai thác không thành công Các thợ đào có thể sử dụng năng lực khai thác dướimức số tiền đã trả trước đó Thay vì lặp đi lặp lại vô thời hạn, việc khai thác sẽ cứ
tiếp diễn cho đến khi hết phí Gas
Khi một giao dịch được gửi đến mạng lưới, thợ đào có thể thực hiện giao
dịch, thực thi mã liên quan Trình xác nhận sẽ đảm bảo rằng:
e Tất cả thông tin về giao dịch là hợp lệ
e Nguoi thanh toán có đủ tiền dé chi trả cho việc thực hiện giao dịch
e EVM không gặp phải bat kì trường hợp ngoại lệ nào trong quá trình thực thi
16
Trang 31Ethereum có thé cho phép chúng ta tạo ra các nền kinh tế chia sẻ dữ liệu, các
sự kiện gọi vốn cộng đồng ngang hàng, hợp đồng thông minh, thị trường cho thuê
không gian 6 cứng chưa được sử dụng trên máy tính xách tay của ban, Uber hoặc
Facebook bị phân tán (các sản pham không có công ty), v.v Về cơ bản, Ethereumgiống như internet vào năm 1994, vậy nên không ai biết tương lai sẽ xảy ra những
điều gì
Nhờ vào tính năng nổi trội này nhóm chúng tôi đã có để xây dựng một ứngphi tập trung về nhận diện gương mặt nằm hoàn toàn trên các EVMs của Ethereummột cách dé dang mà không cần quá lo lắng về độ bảo mật khi xây dựng lại hoàn
toàn một hệ thông blockchain riêng
> Lợi ích của Máy ảo Ethereum
EVM cho phép mọi người tạo DApp của riêng họ Có vô số trường hợp sửdụng tiềm năng cho loại phần mềm này và công nghệ không bị giới hạn cho một
nhóm người nhât định hoặc những người có nhiêu tiên hoặc nhiêu môi quan hệ.
Có rất nhiều lợi ích tiềm năng của hop đồng thông minh Một ví dụ gan đây
sẽ là các mã thông báo không thé thay thé (NFT) Bằng cách tạo NET, bất kỳ aicũng có thể tạo ấn phẩm nghệ thuật kỹ thuật số và bán nó trên thị trường phi tậptrung Điều này dân chủ hóa việc tiếp cận thị trường nghệ thuật theo cách ảo, điều
mà trước đây không thể thực hiện được
> Nhược điểm của Máy ảo Ethereum
Mạng EVM không hoàn toàn phi tập trung Phần lớn các nút Ethereum đượclưu trữ trên các máy chủ đám mây tập trung như Amazon Web Services Nếu chủ sởhữu của các dịch vụ như vậy quyết định rằng họ không thích Ethereum vì một lý do
nào đó, các nút có thé dé dàng bi đóng cửa, làm hỏng hoặc phá hủy mạng
EVM yêu cầu một số kiến thức kỹ thuật Những người không biết cách viết
mã không thé làm được gì nhiều với EVM Các giao diện thân thiện với người dùnghon van đang trong quá trình phát triển NET lại là một ví dụ điển hình — có những
17
Trang 32chương trình có giao diện người dùng đồ họa (GUI) cho phép hầu hết mọi người tạo
NET và sử dụng các thị trường liên quan.
Phi gas cao trong thời gian mạng bi tắc nghẽn Đây có thé là một nhược điểm lớn
đối với người dùng Ethereum Mặc dù những người gửi các giao dịch lớn có thé
không bị ảnh hưởng nhiều, nhưng mọi người cô gắng gửi các giao dịch nhỏ hơn cóthể không thể sử dụng mạng trong một thời gian Đặc biệt, điều này tao ra vấn đề
cho các ứng dụng phi tập trung Khi nhiều người dùng tương tác với các hợp đồng
thông minh của DApps và tạo nhiều giao dịch, mọi thứ có thé chậm lại hoặc thậm
chí ngừng hoạt động khi phí gas tăng quá cao.
2.1.7 Token
Token là một loại tiền điện tử (tiền mã hóa) được tạo ra và hoạt động dựa trênmột nền tảng blockchain có sẵn mà ở đây blockchain đó là của Ethereum Ở khóaluận này, mỗi token sẽ đại diện cho một trạng thái của người dùng đó đối với công
ty.
ERC-20 định nghĩa một danh sách chung các quy tắc cho các mã thông báoEthereum để tuân theo hệ sinh thái Ethereum lớn hơn, cho phép các nhà phát triển
dự đoán chính xác sự tương tác giữa các chuỗi Các quy tắc này bao gồm cách các
mã thông báo được chuyên giữa các địa chỉ và cách truy cập dữ liệu trong mỗi mã
thông báo.
Phần lớn các mã thông báo được phát hành trên blockchain Ethereum phảituân theo chuân ERC-20 Từ năm 2018, tổng cộng 103621 mã thông báo tươngthích ERC-20 được tìm thấy trên mạng chính Ethereum
Tuy nhiên ERC-20 còn một số khuyết điểm như hau hết các token đều có thé
thay thế được, nghĩa là mọi token đều giống với những token khác Vì vậy một tiêu
chuẩn mới mang tên ERC-721 được ra đời ERC-721 dé xuất một tiêu chuẩn token
không thé thay thế: mỗi token đều là duy nhất Một trong những triển khai nỗi tiếng
nhất của chuẩn này là trò CryptoKitties, tạo ra những chú mèo đặc trưng, thu thập
được Trò chơi Cryptocup World Cup cũng dùng tính năng này Trong năm 2021,
18
Trang 33token ERC-721 đã xây dựng nên một nền công nghiệp đặc biệt với NFT va
2.1.8 ICO
ICO (Initial Coin Offering) là một hình thức kêu gọi vốn đầu tư kha phô biếntrong các dự án cryptocurrency Mỗi đợt ICO các nhà phát triển đồng coin đó sẽ tạomột sự kiện và trong dự án crypto đó sẽ bán một phần các Token của nó cho các
nhà đầu tư yêu thích dé đổi lấy tiền nhằm tài trợ cho dự án cryptocurrency đó hoạt
động và phát triển trong tương lai Tuy nhiên, ở khóa luận này ICO không nhăm
mục đích gọi vốn vì các token của công ty in ra hầu như không có giá trị về mặt
kinh tế, nó chỉ có giá trị về mặt ý nghĩa định danh ở chính công ty đó mà thôi
2.1.9 Crowdsale
Crowdsale là những đợt mở bán Token của một đồng tiền điện tử nào đó
trong giai đoạn ICO Token được phát hành tương tự như cổ phiếu và thường laytên chính là tên của đồng tiền điện tử đó khi bán cho các nhà đầu tư Một đồng tiền
điện tử ra đời có thê mở nhiêu một hoặc nhiêu đợt Crowdsale.
19
Trang 342.2 Federated Learning
2.2.1 Các định nghĩa
Federated Learning (FL) là một phương pháp học máy phân tán cho phép
đào tạo trên một kho dữ liệu phân quyền lớn năm trên các thiết bị như điện thoại di
động [7].
Học liên kết (còn được gọi là học cộng tác) là một kỹ thuật máy học đào tạo
một thuật toán trên nhiều thiết bị biên hoặc máy chủ phi tập trung giữ các mẫu dữ
liệu cục bộ mà không cần trao đổi chúng Cách tiếp cận này trái ngược với các kỹthuật học máy tập trung truyền thống trong đó tất cả các bộ dữ liệu cục bộ được tảilên một máy chủ, cũng như các cách tiếp cận phi tập trung cổ điển hơn thường giảđịnh rằng các mẫu dir liệu cục bộ được phân phối giống hệt nhau
Học liên kết cho phép nhiều tác nhân xây dựng một mô hình học máy mạnh
mẽ, chung mà không cần chia sẻ dit liệu, do đó cho phép giải quyết các van đề quantrọng như quyền riêng tư của dữ liệu, bảo mật dir liệu, quyền truy cập dir liệu và
quyền truy cập vào dữ liệu không đồng nhất Các ứng dụng của nó được trải rộng
trên một số ngành công nghiệp bao gồm quốc phòng, viễn thông, loT và được phẩm.
Học liên kết nhăm mục đích đào tạo một thuật toán học máy, ví dụ như mạng
nơron sâu, trên nhiều bộ dữ liệu cục bộ chứa trong các nút cục bộ mà không cần
trao đổi rõ rang các mẫu dữ liệu Nguyên tắc chung bao gồm dao tạo các mô hìnhcục bộ trên các mẫu dữ liệu cục bộ và trao đổi các tham số (ví dụ: trọng số và độ
lệch của mạng nơ-ron sâu) giữa các nút cục bộ này ở một số tần suất để tạo ra một
mô hình toàn cục được chia sẻ bởi tât cả các nút.
Sự khác biệt chính giữa học liên kết và học phân tán nằm ở các giả định
được thực hiện trên các thuộc tính của bộ dữ liệu cục bộ vì học phân tán ban đầunhằm mục đích song song hóa sức mạnh tính toán trong đó học liên kết ban đầunhằm đào tạo trên các bộ dữ liệu không đồng nhất Trong khi học phân tán cũngnhằm mục đích đào tạo một mô hình duy nhất trên nhiều máy chủ, một giả định cơ
20
Trang 35bản phổ biến là các bộ dit liệu cục bộ là độc lập và được phân phối giống hệt nhau
và gần như có cùng kích thước Không có giả thuyết nào trong số những giả thuyết
này được đưa ra cho việc học liên kết; thay vào đó, các tập dữ liệu thường không
đồng nhất và kích thước của chúng có thé trải dai theo một số cấp độ Hơn nữa, cáckhách hàng tham gia vào quá trình học liên kết có thể không đáng tin cậy vì họ gặpnhiều thất bại hoặc bỏ học hơn vì họ thường dựa vào phương tiện truyền thông kémmạnh mẽ hơn (tức là Wi-Fi) và các hệ thống chạy bằng pin (tức là điện thoại thôngminh và thiết bị IoT) so với học phân tán trong đó các nút thường là trung tâm dữ
liệu có khả năng tính toán mạnh mẽ và được két nôi với nhau băng mạng nhanh.
> Centralized federated learning
Một máy chủ trung tâm được sử dung dé sap xếp các bước khác nhau củathuật toán và điều phối tất cả các nút tham gia trong quá trình học tập Máy chủ chịutrách nhiệm về việc lựa chọn các nút khi bắt đầu quá trình đào tạo và tổng hợp cácbản cập nhật mô hình đã nhận Vì tất cả các nút được chọn phải gửi cập nhật cho
một thực thé duy nhất, máy chủ có thé trở thành nút cổ chai của hệ thống
> Decentralized federated learning
Các nút có thé tự điều phối dé có được mô hình toàn cau Thiết lập này ngănchặn các lỗi đơn lẻ vì các bản cập nhật mô hình chỉ được trao đôi giữa các nút đượckết nối với nhau mà không có sự điều phối của máy chủ trung tâm Tuy nhiên, cautrúc liên kết mạng cụ thể có thể ảnh hưởng đến hiệu suất của quá trình học tập [8]
> Heterogeneous federated learning
Federated Learning mới có tên HeteroFL đã được phát triển dé giải quyết cácclient không đồng nhất được trang bị các khả năng tính toán và giao tiếp rất khácnhau Kỹ thuật HeteroFL có thé cho phép đào tạo các mô hình cục bộ không đồngnhất với độ phức tạp tính toán thay đổi động và non-iid data trong khi vẫn tạo ra
một mô hình suy luận toàn cục chính xác.
21
Trang 362.2.2 Đặc điểm
FL có liên quan nhiều đến việc học phân tán Hệ thống phân tán truyền thống
được tạo thành từ tính toán phân tán, lưu trữ phân tán Bản cập nhật mô hình FL
được đề xuất đầu tiên cho các ứng dụng khách Android ở một mức độ nào đó tương
tự như tính toán phân tán Mặc dù FL rat chú trọng đến việc bảo vệ quyền riêng tu,các nghiên cứu mới nhất về học máy phân tán cũng rất chú ý đến hệ thống phân tánbảo vệ quyền riêng tư Xử lý phân tán là kết nối nhiều máy tính ở các vị trí khácnhau thông qua mạng truyền thông dưới sự điều khiển của máy chủ trung tâm, dé
mỗi máy tính đảm nhận các phần việc khác nhau của cùng một nhiệm vụ dé hoàn
thành nó Do đó, quá trình xử lý phân tán chủ yếu nhằm mục đích tăng tốc giai đoạn
xử lý, trong khi FL tập trung vào việc xây dựng một mô hình cộng tác mà không bị
ro ri quyên riêng tu.
> Iterative learning
Hoc lién két dua trén mét quy trình lặp di lặp lại được chia thành một tậphợp nguyên tử của các tương tác client-server được gọi là vòng học liên kết Mỗivòng của quá trình này bao gồm truyền trạng thái mô hình toàn cầu hiện tại tới cácnút tham gia, đào tạo mô hình cục bộ trên các nút cục bộ này để tạo ra một tập hợpcác bản cập nhật mô hình tiềm năng tại mỗi nút, sau đó tổng hợp và xử lý các bản
cập nhật cục bộ này thành một bản cập nhật toàn cầu duy nhất và áp dụng nó vào
mô hình toàn câu.
Một vòng liên kết được tạo bởi một lần lặp lại quá trình học tập, quy trìnhhọc tập có thể được tóm tắt như sau:
e Khởi tạo: theo đầu vào của máy chủ, một mô hình học máy được chọn để
dao tạo trên các nút cục bộ và khởi tao Sau đó, các nút được kích hoạt và
chờ máy chủ trung tâm đưa ra các nhiệm vụ tính toán.
e Lựa chọn máy khách: một phần nhỏ các nút cục bộ được chọn dé bắt
đầu đào tạo về dit liệu cục bộ Các nút đã chọn có được mô hình thống kêhiện tại trong khi các nút khác chờ vòng liên kết tiếp theo
22
Trang 37e Cấu hình: máy chủ trung tâm ra lệnh cho các nút được chọn phải trải qua
quá trình đào tạo mô hình trên dữ liệu cục bộ của chúng theo cách được chỉ định trước
e Báo cáo: mỗi nút được chọn gửi mô hình cục bộ của nó đến máy chủ để
tổng hợp Máy chủ trung tâm tông hợp các mô hình đã nhận và gửi lại các
bản cập nhật mô hình cho các nút Nó cũng xử lý các lỗi cho các nút bị
ngắt kết nối hoặc các ban cập nhật mô hình bị mat Vòng liên kết tiếptheo được bắt đầu quay trở lại giai đoạn lựa chọn khách hàng
e Kết thúc: sau khi đáp ứng tiêu chí kết thúc được xác định trước, máy chủ
trung tâm sẽ tổng hợp các bản cập nhật và hoàn thiện mô hình chung
> Universality for cross-organizational scenarios
Vé co ban, FL do Google dé xuất là một công nghệ học máy phân tán được
mã hóa, cho phép người tham gia xây dựng một mô hình đào tạo chung nhưng duy
tri dit liệu cơ bản cục bộ Sau đó, khái niệm ban đầu về FL được mở rộng dé chỉ tat
cả các kỹ thuật học máy cộng tác phi tập trung bảo vệ quyền riêng tư Do đó, FL có
thé xử lý không chỉ dữ liệu được phân vùng theo chiều ngang theo các mẫu mà còn
cả dữ liệu được phân vùng theo chiều doc theo các tính năng trong cài đặt học tậpcộng tác FL có thể được mở rộng dé đưa các doanh nghiệp liên tô chức vào khuônkhổ liên bang
Ví dụ: ngân hàng có dữ liệu về sức mua của khách hàng có thê hợp tác vớinền tảng kinh doanh điện tử có dữ liệu về tính năng sản phẩm, để giới thiệu sảnphẩm Do đó, xây dựng một cách thông minh mô hình chung cho nhiều thực thẻ,nhiều nguồn dữ liệu, các kích thước tinh năng khác nhau Điều này cho phép tat cảnhận ra giá trị đồng sáng tạo trong khu vực và đa nền tảng trên cơ sở bảo vệ quyền
riêng tư của dt liệu [7].
> Massively Non-Identically Independent Distribution (Non-IID)
Trong FL, dữ liệu được phổ biến rộng rãi trong hang chục nghìn thiết bi diđộng hoặc nút cạnh Dữ liệu có sẵn trong mỗi nút không được nhiều hơn tổng sốnút Trong khi ở trong hệ thống phân tán, mục đích chính là tăng mức độ song song
23
Trang 38dé giảm bớt áp lực tính toán hoặc lưu trữ trong máy chủ trung tâm Số lượng các nút
trong hệ thống phân tán không thể đạt cùng mức độ như FL Ngày nay, thế giới đã
bước vào kỷ nguyên của các thiết bị đeo được sử dụng rộng rãi để theo dõi sức
khỏe Mỗi thiết bị chỉ tạo ra một số dữ liệu và nó không thé được so sánh với tổng
số thiết bị Rõ ràng, trong trường hop nay, FL phù hợp hon để cải tiến mô hình.Ngược lại với hệ thống phân tán, hoạt động chủ yếu trên phân phối dữ liệu cân bằng
và IID, FL tập trung vào dữ liệu không cân bang và không phải IID vì sự khôngđồng nhất giữa các tài nguyên thiết bị [7]
> Decentralized technology
Decentralization — phi tập trung, theo nghĩa kỹ thuật chat chẽ, không có
nghĩa là phân quyền hoàn toan, nhưng không có trung tâm Phi tập trung chỉ dé làm
loãng nhận thức của nút trung tâm Không có trung tâm để xác định từng kháchhàng và mỗi khách hàng sẽ ảnh hưởng đến mô hình trung tâm Ảnh hưởng giữa cácnút sẽ tạo ra một mối quan hệ phi tuyến tính thông qua mạng được hình thành bởi
máy khách Máy chủ tham số, một công nghệ phân tán và tập trung điển hình, chủ
yếu sử dụng máy chủ trung tâm đang chiếm ưu thế trong việc điều phối tài nguyên
phân phối dữ liệu và tính toán để có được một mô hình cộng tác hiệu quả.
Loại phương pháp xử lý dir liệu tập trung này dẫn đến chi phí liên lạc gấp
đôi Bởi vì nếu một số tập dữ liệu năm rải rác trong các cơ sở dữ liệu khác nhau
được thu thập dé dao tạo, thì những dữ liệu này nên được sao chép và sau đó truyềnđến máy chủ trung tâm lúc đầu Và sau đó máy chủ trung tâm sẽ phân bổ dữ liệu
cho từng máy khách phân tán dé tính toán phân tán Nó b6 sung các bài kiểm tra
nghiêm ngặt bổ sung cho hệ thống về khả năng tính toán, lưu trữ và băng thông Đối với các trường hợp trong FL, mỗi khách hàng hoàn toàn tự chủ, dữ liệu không được
phân bé bởi trung tâm và quá trình đào tạo không bị chi phối bởi máy chủ Do đó,
FL là một công nghệ tích hợp dé kết hợp các mô hình học máy và tổng hợp dữ liệu
thông qua cộng tác phi tập trung [7].
> Equality of status for each node
24
Trang 39Trong khuôn khổ hợp tác này, tất cả các bên đều có vị thế bình đẳng và
quyền thống trị nhất định dé đạt được sự thuận tiện chung Về mặt bình đăng, bat ky
ai sở hữu khối lượng lớn dtr liệu có vi trí thống tri trong dao tạo cộng tác phân tántruyền thống Do đó, sự phát triển của học tập hợp tác trong lĩnh vực công nghiệp
có thé bị ảnh hưởng bat lợi bởi sự ưu tiên của các tô chức với số lượng lớn dữ liệuhoặc hình ảnh với các loại nhãn Đối với đào tạo chung trong mạng học tập sâu,
những cơ sở có dữ liệu lớn có thể thao túng mô hình dự đoán, do đó các tổ chức vừa
và nhỏ không có động lực trong việc dao tạo chung Tuy nhiên, ở FL, vi trí của
những khách hàng có tập dữ liệu nhỏ này sẽ được dé cao do sự bình dang giữa các
bên.
Tóm lại, FL là một công nghệ phi tập trung cho phép các khách hàng hoặc tổ
chức phân tán tự đào tạo một mô hình cộng tác, đồng thời giữ cho dữ liệu được bảnđịa hóa Phương pháp này có thể hỗ trợ các tô chức doanh nghiệp chia sẻ các môhình cộng tác mà không cần chia sẻ bất kỳ dữ liệu thô nào [7]
25
Trang 402.2.3 Phân loại Federated Learning
om
Training data
Sample characteristics Sample characteristics
>
Federal Transfer Learning
Hinh 2.4 Hinh anh minh hoa FL theo chiéu ngang, chiéu doc va chuyén giao*
Theo sự phân bổ nguồn dữ liệu của các bên tham gia, FL thường có thé đượcchia thành ba loại, cụ thê là FL theo chiều ngang, chiều dọc và chuyền giao [9]
> Horizontal Federated Learning
Khi đặc điểm người dùng của hai tập dữ liệu chồng chéo nhiều hon và ngườidùng chồng chéo ít hơn, tập dữ liệu được chia theo chiều ngang dọc theo thứnguyên người dùng, phan dữ liệu có chứa đặc điểm người dùng giống nhau nhưngkhông cùng người dùng được lấy ra
Học liên kết ngang có thể liên quan đến học máy phân tán Trường hợp khác
biệt là dữ liệu được sử dụng là dữ liệu thiết bị cục bộ thay vì phân vùng dữ liệu
phân tán do máy chủ sở hữu Mỗi máy trong Học liên kết nhận được mô hình chungban đầu từ máy chủ, sau đó việc đào tạo được thực hiện trên dữ liệu cục bộ của mỗi
thiết bị (theo sau là các thông số mô hình của mô hình cục bộ) được chia sẻ với máychủ đề thực hiện bất kỳ cập nhật nào được yêu cầu trong mô hình chung Máy chủ
* https:/www.mdpi.com/1424-8220/20/21/6230
26