Phương pháp hiện tại của việc thu thập dữ liệu chất lượng nước và việc sử dụng chúng để đưa ra quyết định trên hầu hết các trang trại không hiệu quả và không tận dụng đầy đủ các công ngh
Trang 1DAI HỌC QUOC GIA HO CHÍ MINH
TRƯỜNG DAI HỌC CÔNG NGHỆ THONG TIN
KHOA MẠNG MÁY TÍNH VÀ TRUYÊN THÔNG
ĐỖ PHI SƠN - 20521839
PHAM ĐÌNH CÔNG - 20521144
KHOÁ LUẬN TỐT NGHIỆP
PHÁT TRIÊN HỆ THÔNG GIÁM SÁT CHAT LƯỢNG NƯỚC CHO AO NUOI TÔM DUA TREN INTERNET OF THINGS VA HOC SAU
DEVELOPMENT OF WATER QUALITY MONITORING SYSTEMS FOR SHRIMP CULTURE BASED ON INTERNET OF THINGS AND DEEP LEARNING
GIANG VIEN HUGNG DAN:
ThS Nguyễn Khánh Thuật
TP.Hồ Chí Minh - 2024
Trang 2THONG TIN HỘI DONG CHAM KHÓA LUẬN TỐT
NGHIỆP
Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số NAY của Hiệu trưởng Trường Dai học Công nghệ Thong tin.
Trang 3LỜI CẢM ƠN
Trong quá trình nghiên cứu và hoàn thành đồ án, nhóm đã được thầy Nguyễn Khánh Thuật định hướng, giúp đỡ và cho ý kiến đóng góp trong suốt thời gian
lên ý tưởng và thực hiện bài khoá luận này Bên cạnh đó các anh/chị/bạn đang
công tác tại Phòng thí nghiệm Mạng máy tính và truyền thông đã quan tâm,giúp đỡ và tạo điều kiện hết mức cho nhóm trong khoảng thời gian này
Bên cạnh đó, nhóm chúng tôi vô cùng biết ơn gia đình và bạn bè đã là nguồn
động viên to lớn về mặt tỉnh thần, cũng như đưa ra rất nhiều ý kiến mang tính
xây dựng cho ý tưởng của nhóm trong suốt quá trình làm khoá luận.
Nhóm cũng chân thành cam ơn các quý thầy cô trường Dai học Công nghệThông tin - DHQG TP.HCM, đặc biệt là các thầy cô thuộc khoa Mang máytính và truyền thông đã giúp đỡ nhóm hết mình
Nhóm thực hiện.
Trang 4MỤC LỤC
CHƯƠNG 1 TONG QUAN ĐỀ TÀI
11 Lý do chọn đề tài cv
1.2 Phuong pháp nghiên cđỨu Ặ So.
1.3 Mục tiêu nghiên ctu Qua
1.4 Phạm vi và đối tượng nghiên
cứu -1.5 Cấu trúc khoá luận tốt
nghiệp -CHƯƠNG 2 CƠ SỞ LÝ THUYẾT 21 JoT - Internet of Things 00.
2.1.1 Tổng quanvèloT
2.1.2 Các thành phần chính sử dụng trong loT
2.1.3 Điểm tốt và hạn chế của loT
2.2 Học sâu a Gl Mie Ae 7) ỐỐ.Ố5b ee 2.2.1 Học sâu va mang nơ-ron nhân tao
2.2.2 Mạng no-ron tái phét 2 008.
2.2.3 Long short-term Memory (LSTM)
2.2.4 Tối ưu hoá AdaBelief
2.3 Kiến trúc loT cận biên 2 ee 2.3.1 Tổng quan 0.0 0.000 ee 2.3.2 Các lớp kiến trúc IoT cận biên
2.3.3 Kubernetes Q Q Q ee 2.4 Một số công trình nghiên cứu liên quan
CHƯƠNG 3 THIẾT KE HỆ THONG 3.1 Kiến trúc tổng quất ee 3.2 Device LAyeT Quy va 3.2.1 Các thông số cần đo đạc
3.2.2 Bộ công cụ Libelium Smart Water
3.2.3 Turbidity Sensor 2 0.0.0.0 eee ee
11 12 13 13 14 16 22 24 24 25 26 28
Trang 54.11 Cài đặt môi trường o
4.1.2 Triển khai trong phòng thí nghiệm
4.1.3 Trực quan dữ liệu trên giao diện người dùng
50
59 59
58
62 62
62
64
Trang 6ML DL IoT K3s
SGD RNN
MAE RMSE
MSPE
ANN LSTM MLP Bi-LSTM
MQTT
AMQP
PROFINET GAN
EMA
DANH MUC CAC KY HIEU, CAC CHU VIET TAT
Machine Learning Deep Learning
Internet of Things
Lightweight Kubernetes
Stochastic Gradient Descent
Recurrent Neural Network
Mean Absolute Error Root Mean Square Error Mean Squared Prediction Er-
ror
Artificial Neuron Network
Long Short-Term Memory Multi-layer Perceptron
Bidirectional Long Short-Term Memory
Message Queueing Telemetry
Transport Advanced Message Queuing
Protocol Process Field Network
Generative Adversarial work
Net-Exponential moving average
Trang 7DANH MỤC TỪ TẠM DỊCH
Giảm dần độ dốc ngẫu nhiên Stochastic Gradient Descent
Ham thich nghi Fitness function
Hoc sâu Deep learning
Hoc may Machine learning
Giảm dan độ dốc ngẫu nhiên Stochastic gradient descent
Lớp an Hidden Layer
Lớp kết nối đầy đủ Eully Connected Layer
Tan công đầu độc mô hình Model poisoning attacks
Đường dan lớp Class path
Oxy hoà tan Dissolved Ôxygen
Đơn vị tái phát Recurrent Units
Mang no-ron tai phai Recurrent neural network
Mang no-ron nhân tao A Bộ nhớ dài-ngắn han
Long short-term memory
Chuẩn hoá hàng loạt Batch normalization
Mang nơ-ron đối khang Generative Adversarial
Net-work Đường trung bình động luy Exponential moving average
thừa
Trang 8Hình 1.1
Hình 1.2
Hình 2.1
Hình 2.2
Hình 2.3
Hình 2.4
Hình 2.5
Hình 2.6
Hình 2.7
Hình 2.8
Hình 2.9
Hình 2.10
Hình 2.11
Hình 2.12
Hình 2.13
Hình 2.14
Hình 2.15
Hình 2.16
Hình 2.17
Hình 3.1
Hình 3.2
Hình 3.3
Hình 3.4
Hình 3.5
Hình 3.6
Hình 3.7
Hình 3.8
Hình 3.9
DANH MỤC HÌNH VẼ
Thông số chất lượng nước quy định cho tôm st [4] 3
Thang đo trực quan pH trong ao tôm [25] 5
Các khía cạnh khác nhau của IoT [3] 9
Sự phát triển của loT[16]} 10
Cách thức hoạt động của lot [36]} 11
Mô hình mạng nơ-ron nhân tao tổng quát [24] 13
Minh hoa mạng nơ-ron tái phát [26]} 14
Mô hình LSTM [26] 17
Mô hình đề xuất LSTM [34| 18
Cấu trúc Stacked LSTM |B} - 19
Cấu trúc Bidirectional LSTM [29}_ 20
Cấu trúc Autoencoder |29| 21
Cấu trúc Bidirectional LSTM Autoencoder [29, 27] 22
Adam và AdaBelief|39} 23
Tong quan các lớp kiến trúc IoT cận biên [32] 25
Các lớp cụ thể của kiến trúc loT cận biên [33] 25
kiến trúc của Kubernetes [lB] 26
Sử dụng thuật toán ANN 3ï] 31
Sử dụng các mô hình học máy [l4| 31
Hệ thống đề xuất 34
Mô hình kết nối Meshlium với PC [1§} 37
Mô hình kết nối Turbidity sensor với Arduino và Wemos [1] 38 Mô hình K3s Cluster sử dung OrangePl 39
Tao thành công 1 Cluster với 3node 39
Các pod đang chạy trên hệ thống 39
Triển khai K3s Dashboard 40
K3s Dashboard 0.0 000002000000 40 Hai mô hình Single LSTM va Stacked LSTM [37] 41
ĩ
Trang 9Hình 3.10 Mô hình BiLSTM Autoencodoer 42
Hình 3.11 Tổng quan về bộ dữ liệu - 43
Hình 3.12 Tương quan giữa các thuộc tinh 44
Hình 4.1 Mô hình phần cứng triển khai trên phòng thí nghiệm E3.1 49 Hình 4.2 Hệ thống triển khai trên phòng thí nghiệm E3.1 50
Hình 43 Streamlit- Python so 50
Hình 44 Biểu đồpH- DO Ặ Ốc 51Hình 45 Biểu đồ Temperature - Turbidiy 52
Hình 46 Biểu đồ Salinity - Alkalinity 52
Hình 47 Mobile Dashboard 0.0 53 Hình 48 Mobile Dashboard 00 54
Trang 10DANH MỤC BANG BIEU
Bảng 2.1 Cảm biến chất lượng nước được dùng và các thông số do
Bảng 3.1 Cac thông số đo dac 2 0 cốc
Bảng 3.2 Don vị và chuyển
đổi -Bảng 4.1 Thời gian truy xuất dữ liệu dựa theo số bản ghi (giây) Bảng 4.2 Thời gian dự đoán dữ liệu dựa theo số giá trị muốn dự đoán
2
Bảng 4.3 Bảng đánh giá với kịch bản thuật toán tối wu Adam (epochs
Bảng 4.4 Bảng đánh giá với kịch bản thuật toán tối ưu Adam (epoch
Trang 11TÓM TẮT KHOÁ LUẬN
Nhu cầu về việc kết hợp giữa IoT và học sâu đã và đang trở nên phổ biến và
có tính ứng dụng cao trong thực tế Trong rất nhiều lĩnh vực trong đời sống, xã
hội và đặc biệt là ngành sản xuất sản phẩm nông - lâm - ngư nghiệp.
Với mục tiêu quản lý chặt chẽ chất lượng nước mà cụ thể là các thông số chất lượng nước trong các ao tôm trong khoảng giá trị an toàn để hướng đến mục tiêu tạo ra môi trường lý tưởng để sản xuất tôm khỏe mạnh Phương pháp hiện tại của việc thu thập dữ liệu chất lượng nước và việc sử dụng chúng để đưa ra
quyết định trên hầu hết các trang trại không hiệu quả và không tận dụng đầy
đủ các công nghệ mới nhất Nhóm hướng đến việc nghiên cứu sử dụng các cảm
biến trong Libelium Smart Water để liên tục giám sát các biến số chất lượng
nước trong ao tôm, kết hợp cùng mô hình học sâu phù hợp dự đoán các yếu tốảnh hưởng ao tôm trong thời gian ngắn nhất sẽ cho kết quả là một hệ thống
sử dụng ứng dụng IoT hiện đại kết hợp cùng mô hình học sâu cụ thể là LSTM.
Sau cùng là phần đánh giá và nhìn nhận kết quả đã đạt được và đề xuất những
cách có thể phát triển khoá luận này trong tương lai.
Trang 12CHƯƠNG 1 TONG QUAN DE TÀI
Thuỷ sản thông minh là một công nghệ để xác định và cảnh báo người dùng
về chất lượng nước để nuôi các loài hải sản bằng việc ứng dụng IoT, AI, giúp
cho người nuôi trồng thuỷ sản kịp thời xử lý nguồn nước nuôi trồng khi nhậnđược cảnh báo từ đầu cuối Đặc biệt ngành tôm đại diện cho các hệ thống nuôithâm canh có khả năng mang lại sản lượng protein cao cho nhu cầu tiêu thụ Aotôm là một hệ thống phức tạp day sự biến động liên tục Sản lượng phụ thuộcvào sự kết hợp phức tạp của điều kiện khởi đầu (chất lượng nước, môi trường tự
nhiên, giống tôm, ), phương pháp quan lý và các yếu tố môi trường khác Vì
thế mà ở các ao tôm khác nhau thì sẽ có sự khác biệt nhau dù ở cùng một vị tríđịa lý Nên việc thu thập dit liệu được coi là rất quan trọng trong ngành công
nghiệp này Thực trạng hiện nay tại các trang trại nuôi tôm, việc thu thập dữliệu được thực hiện thủ công, đòi hỏi công sức lao động và có chi phí tương đốicao và khó quản lý đối với quy mô lớn (khoảng cách thời gian dài giữa lấy mẫu
và phát hiện bất thường) Với lý do này, việc kết hợp sử dụng các công nghệ
tiên tiến trong hệ thống quản lý chất lượng nước xử lý dữ liệu được thu thập,
tạo ra các quyết định có cơ sở dựa trên thông tin đa dạng và phức tạp là điềutối cần thiết
Uu điểm lớn của IoT' trong thuỷ sản thông minh bao gồm kha năng thu thập
dữ liệu liên tục, giảm công sức lao động va chi phí, phát hiện tình trạng nguy
hiểm một cách nhanh chóng, quyết định chính xác hơn dựa trên di liệu thông
minh, tăng hiệu quả sản xuất và chất lượng thủy sản, điều khiển tự động, giảm
2
Trang 13rủi ro và thiệt hại, cũng như quản lý quy mô lớn và từ xa.
Trong khi các mô hình học máy truyền thống cải thiện nhờ dữ liệu mới, chúng
thường yêu cầu sự can thiệp liên tục của con người để giải quyết những điểm
thiếu chính xác trong dự đoán Ngược lại, các mô hình học sâu hoạt động với
mức độ tự chủ, tận dung mạng nơ-ron nhân tạo để đánh giá và tinh chỉnh các
dự đoán một cách độc lập Khả năng tự học này giảm thiểu nhu cầu can thiệp liên tục của con người Vì thế, học sâu dần trở nên phổ biến trong việc đưa ra
dự báo một cách liên tục để cảnh báo kịp thời Trong bối cảnh giám sát chất
lượng nước trong ao nuôi tôm, các mô hình học sâu mang lại giải pháp hiệu quả
và phù hợp hơn.
So với các loại mô hình khác, mô hình LSTM trong việc xử lý chuỗi thời
gian là điểm nổi bật, là sự lựa chọn lý tưởng để theo dõi và dự báo chất lượng
nước theo thời gian trong ao nuôi tôm Khả năng của LSTM trong việc giữ lại
thông tin quan trọng qua nhiều khoảng thời gian, đồng thời vượt qua vấn đề
Hình 1.1: Thông s6 chất lượng nước quy định cho tôm st [4]
Giám sát chất lượng nước nuôi tôm dựa trên một số các yêu tố ảnh hưởng
3
Trang 14trên Sau đó sẽ cảnh báo người dùng về tình trạng chất lượng nước trong ao
nuôi Để thực hiện việc này, chúng tôi tiến hành thu thập các thông số của
ao nuôi, từ đó, chúng tôi huấn luyện mô hình học sâu trên dữ liệu này để
đưa ra các dự đoán tương lai về các thông số này Nhờ đó mà người dùng
có thể có cái nhìn nhanh nhất về tương lai, từ đó đưa ra cách phản ứng kịp
thời.
Tom sti (Penaeus monodon Fabricus) thường được nuôi thâm canh và quảng
canh ở Việt Nam Đặc biệt tôm sú chiếm 84% diện tích nuôi và 36% san
lượng tổng cộng Việt Nam là quốc gia xuất khẩu lớn nhất thế giới [7].
Trong khoá luận này hướng đến các yếu tố chất lượng nước nuôi tôm ở điều kiện địa lý miền Nam Việt Nam (từ Ham Tan cho đến gần mũi Cà Mau và
từ mũi Cà Mau đến Hà Tiên), với đặc điểm thuỷ triều từ bán nhật triều
không đều độ lớn triều khoảng 3.0 2.0m cho đến nhật triều không đều
-độ lớn triều trên dưới 1m |22|
Các yếu tô vật lý phải phù hợp và ổn định vì có ảnh hưởng rất lớn đến hoạt
động sống của tôm Nhiệt độ nước tác động trực tiếp vì thân nhiệt của tôm
thay đổi theo môi trường nước, nếu nhiệt độ cao và biến động từ 3 - 5 độ
C thì gây ra hiện tượng sốc nhiệt khiến tôm chết hàng loạt Độ mặn cũngảnh hưởng đến sức khoẻ của tôm nếu quá cao hoặc quá thấp dẫn đến suygiảm sức đề kháng dễ mắc phải các bệnh, đồng thời tác động lớn đến quá
trình sinh trưởng và phát triển Nước trong ao tôm trong hay đục giúp có
cái nhìn về tình trạng dinh dưỡng, quá trong thì ao tôm đang cần bổ sung
dinh dưỡng, càng đục thì ao tôm càng dư dinh dưỡng có nguy cơ hình thành
các mầm bệnh tiềm ẩn [25]
Ngoài ra các yếu tố hoá học cần phải được chú ý đến Hàm lượng Oxy hoà
tan trong ao tôm luôn giữ ở mức ổn định, không đáp ứng đủ hàm lượng
sẽ khiến cho tôm hôn mê và chết hàng loạt Sự thích hợp va dao động của
độ pH cho tôm sinh trưởng và phát triển duy trì ở mức ổn định là tối cần
thiết, cao hoặc thấp đều sinh ra các loại khí gây hại đến tôm [25]
Trang 15Sinh ra khí HzS
Sinh ra khí NHs
Hình 1.2: Thang do trực quan pH trong ao tôm [25]
2 Cải thiện hiệu suất hệ thống: Bằng cách phát triển và kết hợp IoT cùng
phương pháp học sâu cụ thể là LSTM sẽ nâng cao hiệu suất, độ chính xác
của hệ thống trong việc đo đạc và cảnh báo đến người dùng Có sự đánh
giá giữa single LSTM và stacked LSTM cũng như BLSTM Autoencoder với
phương pháp tối ưu hoá trong hoc sâu như Adam và AdaBelief
3 Khoảng cách nghiên cứu và đóng góp: Mac dù thuỷ sản thông minh
đã nhận được nhiều sự chú ý từ khi ra mắt, những thách thức về vấn đề
tan dụng có hiệu quả công nghệ IoT và việc tích hợp mô hình học sâu dự
đoán vẫn chưa được nghiên cứu bài bản Bài khoá luận này có mục đích bổ
sung kiến thức về sự kết hợp giữa IoT và mô hình học sâu trong giám sát
chất lượng nước cho ao nuôi tôm và cung cấp những hiểu biết thực tế về việc triển khai hệ thống giám sát chất lượng nước cho ao nuôi tôm.
Vì lẽ đó, nhóm muốn thực hiện đề tài này với mục tiêu kết hợp giữa IoT' va
học sâu trong lĩnh vực nuôi trồng thuỷ sản cụ thể là đảm bảo chất lượng nước
phù hợp trong ao nuôi tôm.
1.2 Phương pháp nghiên cứu
Cách tiếp cận của nhóm là tìm hiểu bộ công cụ Libelium Smart Water và tiến
hành thu thập dữ liệu gửi lên Meshlium, đồng thời thiết lập thêm vào các thiết
bị nhúng khác để thu thập các thuộc tính còn thiếu Tiếp đó, tìm hiểu mô hình học sâu để áp dụng phù hợp, nhóm đề xuất kiến trúc LSTM cho bài toán dự
Trang 16báo sự đảm bảo chất lượng nước trong ao tôm Tiếp đó, tiến hành xây dựng cácdịch vụ cận biên bằng công nghệ K3S giúp tăng hiệu suất của hệ thống Đồng
thời, nhăm tiếp cận với người dùng một cách trực quan, dễ quản lý, có thể điều
chỉnh các thông số phù hợp với từng giai đoạn sinh trưởng của ao tôm, nhómxây dựng các giao diện như Dashboard Web, App Mobile Cuối cùng, nhóm sẽ
tiến hành thực nghiệm, nhận xét và đề xuất hướng phát triển phù hợp của đề
tài nếu có.
1.3 Mục tiêu nghiên cứu
Bao gồm bốn mục tiêu chính sau đây:
1 Tìm hiểu bộ công cụ Libelium Smart Water và các cảm biến liên quan để
tiến hành thu thập dữ liệu, tối ưu dữ liệu thu thập được từ cảm biến.
2 Xây dựng mô hình IoT gồm 3 lớp, trong đó các dịch vụ cận biên được triển
khai bằng công nghệ K3s
3 Xây dựng mô hình học sâu để tiến hành dự đoán dữ liệu tương lai dựa trên
dit liệu thu thập được từ cảm biến.
4 Thiết kế giao diện người dùng (Dashboard, App Mobile) để người dùng có
thể theo dõi và nắm được thông tin về các dữ liệu trong ao tôm.
1.4 Phạm vi và đối tượng nghiên cứu
Đối tượng nghiên cứu: Bộ phần cứng Libelium Smart Water; Học sâu (Single
LSTM, Stacked LSTM và Bi-LSTM); Kiến trúc cận biên sử dụng K38.
Phạm vi nghiên cứu: Hệ thống xử lý thông tin về chất lượng nước của môi
trường sống tôm có độ trễ thấp, sử dụng thuật toán Deep Learning để đưa ra
dự đoán một cách tối ưu nhất có thể và đưa ra cảnh báo cho người nuôi trồng.
1.5 Cau trúc khoá luận tốt nghiệp
Được thể hiện trong 5 chương:
Trang 17e Chương 1: TONG QUAN DE TÀI
Khái quát về đề tài khoá luận mà chúng tôi thực hiện
e Chương 2: CƠ SỞ LÝ THUYET
Cung cấp cơ sở lý thuyết, định nghĩa và những kiến thức liên quan đến cáckhái niệm cần dùng trong bài nghiên cứu Đồng thời trình bày sơ lược vềnhững bài báo nghiên cứu liên quan.
e Chương 3: THIẾT KE HỆ THONG
Đây là phần trọng tâm của bài Bao gồm đề xuất mô hình và giải thíchphương pháp thực hiện.
e Chương 4: THỰC NGHIEM VÀ DANH GIÁ
Trình bày cách thực hiện theo phương pháp được đề xuất ở chương trước,
mô tả kết quả và đưa ra đánh giá dựa trên những gì đã thực hiện
e Chương 5: KET LUẬN VÀ HƯỚNG PHÁT TRIEN
Nhìn nhận kết quả thực hiện được, cũng như cung cấp hướng phát triển
cho các bài nghiên cứu tiếp theo
Trang 18CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Tĩm tắt chương
Đây là phần nhĩm chúng tơi sẽ giải thích các khái niệm cần thiết của khố
luận Đầu tiên là giới thiệu tổng quan về học liên kết, cách hoạt động và những
khái niệm cần dùng cho bài khố luận này.
2.1 IoT - Internet of Things
2.1.1 Tổng quan vé IoT
Internet of Things (IoT) là một mơi trường trong đĩ các đối tượng, động vật,
hoặc con người được trang bị các định danh duy nhất và khả năng truyền dữliệu qua mạng mà khơng cần sự tương tác giữa con người với con người hoặc
con người với máy tính lòT phát triển từ sự hội tụ của các cơng nghệ khơng
dây, hệ thống cơ điện tử nhỏ (MEMS), và cơng nghệ Internet
Hình 2.1 minh hoạ khái niệm về IoT Cho thấy IoT khơng chỉ là kết nối các thiết bị với Internet; đĩ là việc tạo ra một thế giới trong đĩ mọi thứ đều được
kết nối với mọi thứ khác
Trang 19— THINGS mm
Anywhere Any Business
Hinh 2.1: Các khía cạnh khác nhau của IoT [3]
Lần đầu tiên, từ khoá "Internet of Things" được Kevin Ashton - Giám đốcđiều hành Auto-ID Labs của MIT vào năm 1999 [3] Theo đó, ho đã nhận ra là
hiệu quả trong việc thu thập dữ liệu rất quan trọng và đề xuất rằng nếu máy
tính có khả năng tự học và hiểu mọi thứ mà không cần sự hỗ trợ của con người, chúng ta sẽ có khả năng theo đõi và đếm mọi thứ một cách hiệu quả, giảm thiểu
lãng phí, mat mát, và chi phí Đề xuất này đã được hiện thực hoá và trở nên
ngày càng phát triển với các ứng dụng mang lại hiệu quả đáng kể trong các lĩnh
vực tiếp thị, tài chính, sức khoẻ, giáo dục và nhiều hơn nữa Đặc biệt việc kết
hợp với thời đại công nghệ trí tuệ nhân tạo đang là nhân tố quan trọng và đầy
triển vọng, trí tuệ nhân tạo cung cấp khả năng phân tích và đưa ra quyết định dựa trên dit liệu một cách tự động, giúp máy tính và thiết bị IoT hiểu biết sâu
sắc hơn về ngữ cảnh và nhu cầu của người dùng
Trang 201989 2008 2009 2022
The first loT device is The number of connected The original Fitbit World Economic Forum created devices overtakes the activity tracker is names loT as one of the.
number of people in the released three most impactful
world and lợT is 'born" technological advancements
is used at Cambridge #/ taunched 7
2020
The number of loT device connections increased more than 50% of the active
Hình 2.2: Sự phat triển của IoT [16]
IoT tỏ ra là lựa chọn ưu việt khi nói đến việc thu thập dữ liệu, với khả năng
tự động hóa cao và khả năng tích hợp linh hoạt với nhiều loại thiết bị và hệ
thống khác nhau Dữ liệu có thể được thu thập một cách liên tục từ các cảm
biến và thiết bị kết nối, mang lại khả năng phan hồi ngay lập tức và quản lý
hiệu quả nguồn lực Trái ngược với đó, các phương pháp truyền thống thường
yêu cầu sự can thiệp lớn từ con người trong quá trình thu thập dữ liệu Quy
trình thủ công này có thể chậm trễ và không linh hoạt, gây ra độ trễ trong việc
cung cấp thông tin và phản hồi
IoT cũng mang lại ưu điểm về mặt tiết kiệm năng lượng và quản lý thôngminh Thiết bị IoT có thể được thiết kế để tiết kiệm năng lượng và tự động tối
ưu hóa nguồn lực, điều này giúp giảm thiểu lãng phí và chi phí liên quan đến
bảo trì Một điểm đáng chú ý khác là khả năng mở rộng và linh hoạt của IoT,
khi dễ dàng tích hợp các thiết bị mới và mở rộng hệ thống Trong khi đó, các
phương pháp truyền thống có thể gặp khó khăn khi muốn mở rộng hệ thống hoặc thay đổi cấu trúc.
10
Trang 21Hình 2.3: Cách thúc hoạt động của lot [36]
Mô tả về cách hoạt động của IoT theo một nguyên tắc đơn giản: Các thiết
bị IoT được trang bị cảm biến giúp cam nhận môi trường xung quanh Nhữngcảm biến này liên tục phát ra dữ liệu về môi trường và thông tin về hoạt độngcủa các thiết bị (điện thoại, 6 tô ) Nền tảng IoT bao gồm các máy chủ đámmây và cơ sở dữ liệu lớn Nền tảng IoT xử lý dữ liệu, tích hợp và điều chế thông
tin Hơn nữa, nó phân tích kỹ lưỡng dữ liệu để thu thập các chỉ tiết quan trọng.
Cuối cùng, sẽ gửi lại các hướng dẫn dựa trên dữ liệu được cung cấp Cuối cùng,
việc tổng hợp dữ liệu được chia sẻ với các thiết bị khác để cải thiện hiệu suất
trong tương lai.
2.1.2 Các thành phan chính sử dung trong IoT
IoT bao gồm 4 thành phan quan trọng mô tả hoạt động của hầu hết các hệthống IoT [36]:
e Cảm bién/Thiét bị: Những thiết bị này kết nối với môi trường vật lý bên
ngoài Chúng thu thập dữ liệu từ những thay đổi bên ngoài và lưu trữ thông
tin này Cảm biến cảm nhận sự thay đổi trong môi trường xung quanh vàghi chép lại những thay đổi đó
e Kết nối: Là sự liên kết giữa tất cả các thiết bị IoT trong bất kỳ hệ sinh
thái IoT nào, bao gồm cảm biến, router, cổng, ứng dụng người dùng và nền
11
Trang 22tảng Giúp kiểm soát toàn bộ hệ thống IoT va do đó nó quan trọng để chon
lựa con đường kết nối đúng đắn Wifi, Bluetooth, Zigbee, mạng di động như
LTE hoặc 5G đều cung cấp kết nối để truyền dữ liệu lớn.
e Xử lý dữ liệu: Khi toàn bộ dữ liệu được truyền đến nền tảng, các chức
năng được thực hiện trên dữ liệu này để xử lý và gửi lại kết quả Việc xử lý này phải diễn ra một cách nhanh chóng để cung cấp kết quả tốt hơn Đây
được xem là yếu tố quan trọng nhất
e Giao diện người dùng: Tiếp xúc trực tiếp với người dùng và cung cấp
đầu ra mà người dùng thấy trên các thiết bị giám sát của họ Mỗi thiết bịIoT có một giao diện khác nhau vì mỗi thiết bị có một nhiệm vụ hoặc mục
đích khác nhau để thực hiện.
Các thành phần này tương tác chặt chẽ và hiệu quả giữa các thành phần nàytạo nên một hệ thống IoT' day đủ chức năng, mang lại lợi ích và tiện ích đối vớingười dùng cuối trong nhiều lĩnh vực khác nhau
2.1.3 Điểm tốt va hạn chế của IoT
Trong ngữ cảnh của ngành thuỷ san thông minh, Internet of Things (IoT)
mang lại nhiều lợi ích quan trọng Công nghệ này cung cấp sự tối ưu hóa quytrình nuôi trồng, giúp nông dân và nhà quản lý ao nuôi có khả năng theo dõi và
kiểm soát các yếu tô quan trọng như chất lượng nước, nhiệt độ, và môi trường
tự nhiên Điều này giúp cải thiện hiệu suất nuôi trồng, giảm lãng phí tài nguyên,
và tăng cường khả năng ra quyết định dựa trên dữ liệu thời gian thực Hệ thống
IoT cũng hỗ trợ trong việc theo dõi sức khỏe của các loài thuỷ sản, phát hiện
sớm các vấn đề y tế và giảm rủi ro mất mát do bệnh dịch
Tuy nhiên, cùng với những tiến bộ lớn, IoT cũng mang theo những tháchthức An ninh thông tin và rủi ro bảo mật là mối quan ngại hàng đầu, khi dữ
liệu cá nhân và thông tin nhạy cảm có thể bị đe dọa Quyền riêng tư cũng là
một vấn đề lớn, đặc biệt khi thông tin cá nhân được thu thập mà không có sự
đồng ý rõ ràng từ người dùng Sự phụ thuộc vào công nghệ và khả năng xảy ra
sự cố hệ thống là những rủi ro khó tránh khỏi Chi phí đầu tư ban đầu và độphức tạp của việc tương thích giữa các thiết bị làm tăng gánh nặng về tài chính
12
Trang 23và quản lý Ngoài ra, lo ngại về mất việc làm và thiếu quy định pháp lý đầy đủcũng là những van đề cần lưu ý.
2.2 Học sâu
2.2.1 Học sâu va mang no-ron nhân tạo
Kiến trúc của mạng nơ-ron nhân tạo được lấy cảm hứng từ sự ngưỡng mộ vềkiến trúc của bộ não con người tính toán các quy trình phức tap [24] Mau chốtcủa ý tưởng này là tạo ra cấu trúc mới cho hệ thống xử lý thông tin Kiến trúc
tiêu chuẩn của một mạng nơ-ron gồm các bộ xử lý đơn giản liên kết lại, tên gọi
khác là nơ-ron, được sắp xếp theo lớp Kiến trúc này được minh hoạ ở Hình 2.4
Output Layer
Summing function
Lp C>—— Vo }
3 tlhe
Input Synaptic signals Weights
Hình 2.4: Mô hình mang no-ron nhân tạo tổng quát [24]
Lớp đầu vào nhận một tập hợp các tín hiệu, được biểu diễn bởi x, x1, ,
zp Mỗi tín hiệu này được nhân với một trong số, được biểu diễn bởi wo, wi,
, wp Tích của những phép nhân này sau đó được tổng hợp lại và một giá trị độ lệch được cộng thêm Tổng được chuyển qua một hàm tổng hợp, trong trường hợp này là một hàm ngưỡng Nếu tổng lớn hơn ngưỡng, nơ-ron sẽ đưa ra đầu ra
là 1 Ngược lại, nó sẽ đưa ra đầu ra là 0
Mạng nơ-ron nhân tạo có thể được ứng dụng để xử lý yêu cầu trong đa lĩnh
vực Chúng đặc biệt phù hợp với các yêu cầu liên quan đến nhận dạng mẫu hoặc
học từ dữ liệu Một số nơ-ron có thé ảnh hưởng đến môi trường bằng cách kích
13
Trang 24hoạt các hành động Tuy vào vấn đề và cách các nơ-ron được kết nối, các hành
vi của mạng có thể là một chuỗi các giai đoạn tính toán dài, trong đó mỗi giai đoạn sẽ biến đổi (thường là phi tuyến tính) việc kích hoạt tổng hợp của mạng.
Mặt khác, học sâu [19] được hình thành từ nhiều lớp nơ-ron ẩn có khả năng
xử lý nhiều tác vụ phức tạp hơn trên một lượng lớn dit liệu Học sâu xác định
các mẫu trong dữ liệu thế giới thực như âm thanh, văn bản, hình ảnh và chuỗi
thời gian, sử dụng mô hình đã được huấn luyện để cải thiện độ chính xác của các
dự đoán của chúng Công nghệ học sâu sử dụng nhiều lớp để thể hiện sự trừu
tượng của đữ liệu nhằm tạo nên các mô hình tính toán Do số lượng tham số lớn
nên công nghệ này sẽ tốn chi phí thời gian để đào tạo một một hình nhưng dem
lại hiệu suất trong quá trình thử nghiệm so với các thuật toán học máy khác.
2.2.2 Mạng nơ-ron tát phát
RNN là một loại mạng nơ-ron kết hợp dữ liệu đầu vào có độ dài thay đổi với trạng thái an phụ thuộc vào các bước thời gian trước đó để tạo ra dữ liệu đầu
ra, đồng thời còn là một biến thể của MLP và được thiết kế để xử lý dữ liệu
tuần tự Kiến trúc của RNN theo Hình 2.5 bao gồm đầu vào X là một chuỗi
giá trị, trạng thái an giúp mang có khả năng lưu trữ thông tin, các trọng số và
siêu tham số tương ứng cho từng bước thời gian (/ — 1, t, t+ 1) Đặc điểm độc đáo của RNN là đầu ra của lớp an với thông tin hiện tại được chuyển đến lớp
an của bước thời gian tiếp theo, tạo ra một vòng lặp giúp duy trì thông tin từ bước trước đó để giữ cho mô hình có khả năng học và trừu tượng hóa dữ liệu
Trang 25Có thể mô hình hoá với trạng thái 5%; của lớp an tại thời điểm t và đầu ra y; tại thời điểm t:
Lớp ẩn được xem như trái tìm của mạng nơ-ron tái phát là nơi xử lý thông
tin và lưu trữ trong bộ nhớ nó bao gồm một hoặc nhiều đơn vị tái phát [34]
Mỗi đơn vị tái phát chứa:
- Trọng số (U, V, W): Chúng kiểm soát cách thông tin chuyển động trong
đơn vị và giữa các đơn vị với nhau Được khởi tạo ngẫu nhiên và học ngẫu nhiên
bằng thuật toán lan truyền ngược với độ dốc giảm dần ngẫu nhiên
- Hàm kích hoạt (tanh): Làm biến đổi các giá trị đầu vào để tạo ra giá trị đầu
ra bằng cách áp dụng một phép biến đổi phi tuyến tính, giúp mạng tìm hiểu các
mẫu phức tạp.
- Trang thái an (h): Dong vai trò là bộ nhớ của đơn vị, lưu trữ thông tin từ
các bước thời gian trước đó.
2.2.2.2 ReLU
Ham Rectified Linear Unit là một hàm kích hoạt thường được đặt sau lớp
tích chập Hàm ReLU thực hiện một phép so sánh đơn giản: nếu dữ liệu đầu vào
có giá trị lớn hơn 0 thì đầu ra sẽ được giữ nguyên bằng giá trị đầu vào; ngượclại, nếu đầu vào ở trường hợp ngược lại, giá trị đầu ra sẽ là 0
ReLU giúp loại bỏ các giá trị âm và tăng tính phi tuyến của mô hình Bằng
cách áp dụng ham ReLu, mạng nơ-ron có thể học được các đặc trưng phức tạp
hơn và khái quát tốt hơn Mục đích sử dụng hàm ReLU là kích hoạt dau ra củacác lớp tích chập, cải thiện khả năng học tập của mô hình và tạo tính phi tuyến
tính cho mô hình.
15
Trang 262.2.2.8 Gradient Vanishing
Mô hình RNN thuần tuý gặp khó khăn trong việc hoc dit liệu đầu vào va dau
ra có mối liên hệ xa vì thuật toán lan truyền ngược không hoạt động hiệu quả
do van đề gradient vanishing Vẫn đề này trở nên nghiêm trọng khi dữ liệu đầuvào trở nên dài hơn, khiến cho mô hình khó khăn trong việc duy trì và truyền
tải thông tin qua các bước thời gian dài [26]
Giả sử rằng đầu vào tại thời điểm ¿ là y và dit liệu quan sát thực tế tương ứng được biểu thị bằng % Hàm mat mát (loss function) được dùng là trung
bình bình phương sai số giữa y% và %, Li = MSE(w,) Quá trình lan truyềnngược được áp dụng từ bên phải của đồ thị tính toán, và mục tiêu là tính toángradient của ham mat mát L; đối với mỗi trạng thái trong mô hình RNN Điều
kiện này được sử dung để cập nhật trong số nhằm giảm thiểu giá trị của Ly, và
vì hàm đó có thể lay vi phân theo ¿, nên gradient của L; có thể được biểu diễn
dưới dạng gradient đối với mỗi trạng thái của
Nếu a = Vs;, gradient cho trạng thái an ban đầu sọ của đầu ra y tại thời điểm t:
9M — Oo y Day
Öso —— Øay Oso
Do đó, Đặt giảm xuống 0 khi £ tăng và van dé gradient vanishing được tạo ra.
2.2.3 Long short-term Memory (LSTM)
Dé giải quyết van dé gradient vanishing, LSTM được phát minh ra và Ap dụng rộng rãi để phân tích dữ liệu chuỗi thời gian Với cấu trúc được cải tiến va
phức tạp hơn so với RNN, LSTM cung cấp ô nhớ (memory cell) và trạng thái
an theo bước thời gian, như trong hình 2.6.
16
Trang 27Quy trình cu thể LSTM tai thời điểm t với đầu ra h¿, cổng dau ra ø¿, 6 nhớ
(memery cell) Œ,, nội dung 6 nhớ mới (new memory content) C;, 6 nhớ dài hạn
(long-term memory) Œ¿_¡, cổng quên (forget gate) ƒ, và cổng đầu vào (input
gate) iz:
e Quyết định thong tin nào sẽ bị loại khỏi trạng thai Œ¿_¡ trong cổng quên
le ơ(W?z; + Urph¿ 1 + bự)
e Xác định thông tin nào của đầu vào 2; sẽ được lưu trữ vào trạng thái 6 Œ;
ở cổng vào, nơi mà thông tin đầu vào i; và trạng thái ô Œ; sẽ được cập nhật
— ơ(W;+; +U;h¿_—1 + b;)
C; = tanh (Wez¿ + Uc + hạn + + be)
e Cập nhật trạng thái 6 của bước thời gian hiện tai C;, kết hop voi Cr và Œ;_—¡
Œ, = fir tie
e Xác nhận kết quả ở dau ra h¿ nơi o; và C; được dùng
On = ơ(W%z; + Ught-1 + bo)
hy = ö¿ tanh (C;)
Với thiết kế tinh tế của cấu trúc LSTM, có trạng thai 6 nhớ được điều chỉnh
bởi ba cổng, giải quyết vấn đề gradient vanishing của RNN Do đó, LSTM hoạt
17
Trang 28động tốt hơn trong trích xuất thông tin trước đó cũng như dự đoán tương laiđối với các vấn đề phụ thuộc lâu dài của dữ liệu chuỗi.
Trong mô hình LSTM, kích thước của dữ liệu đầu vào được quyết định theo
số lượng các yếu tố ảnh hưởng Lớp LSTM được nhúng vào để ghi nhớ và trích
xuất thông tin chứa từ dữ liệu đầu vào, thường sử dụng trình tói ưu hoá Adam
để cập nhật trong số và độ lệch, đồng thời MSE được đặt làm hàm thích nghỉ.
Đầu ra cuối được cung cấp bởi lớp kết nối đầy đủ Kiến trúc LSTM cơ bản được
mô tả như trong Hình 2.7
Trang 29Stacked LSTM là sự mở rộng của mô hình LSTM cơ bản, thêm vào đó là
nhiều lớp LSTM ẩn với mỗi lớp chứa nhiều ô nhớ Một lớp LSTM ở phía trên
cung cấp một đầu ra chuỗi thay vì đầu ra giá trị duy nhất cho lớp LSTM ở bêndưới Việc có nhiều lớp LSTM giúp mô hình trở nên sâu hơn, chính xác hơn và
phù hợp với mô tả là "kỹ thuật học sau".
Với việc LSTM hoạt động trên chuỗi dữ liệu thì thêm lớp LSTM sẽ tăng cường
các cấp độ của quan sát đầu vào theo thời gian Stacked LSTM hiện nay là một
kỹ thuật ổn định cho các vấn đề dự đoán chuỗi phức tạp.
19
Trang 302.2.8.2 Bi-LSTM Autoencoder
Bi-LSTM là một kiến trúc LSTM mở rộng, cho phép mang thực hiện hoc ở ca
hai hướng: hướng chuyển tiếp (forward) và hướng ngược lại (backward) - từ quá
khứ đến hiện tai va từ hiện tại đến tương lai Mỗi lớp LSTM trong Bi-LSTM bao
gồm một chuỗi các ô LSTM, và dữ liệu đầu vào được xử lý theo chiều chuyển
tiếp và chiều ngược lại Bi-LSTM có thêm một LSTM layer xử lý dữ liệu theo
chiều ngược lại, tạo ra sự đối xứng trong việc xử lý dữ liệu Câu trúc Bi-LSTM
thể hiện ở Hình 2.9
Trong quá trình huấn luyện, mạng Bi-LSTM được huấn luyện tương đương
với việc huấn luyện hai mạng LSTM riêng biệt theo chiều chuyển tiếp và chiều
ngược lại của dữ liệu Mô hình này cung cấp thêm thông tin ngữ cảnh cho mạng,
giúp nó học nhanh chóng và tổng quát hóa tốt hơn về bài toán cụ thể Bi-LSTM
thường được sử dụng trong các ứng dụng yêu cầu mô hình học được các mối
quan hệ và đặc trưng phức tạp trong dit liệu chuỗi thời gian.
Forward |
Backward
Y tưởng cơ bản của Autoencoder là tạo ra một biểu diễn nén của dữ liệu dau
vào có thể được dùng để tái tạo lại dữ liệu gốc với sự mất mát thông tin tối
thiểu Một Autoencoder thông thường bao gồm một lớp đầu vào, một lớp đầu
ra và nhiều lớp an Chi tiết hơn, mô hình Autoencoder đơn giản thường bao
gồm các phần như encoder, decoder và lỗi tái thiết (reconstruction error) giữa
dữ liệu đầu vào và đầu ra, minh hoạ thể hiện ở Hình 2.10
20
Trang 31Hình 2.10: Cau trúc Autoencoder [29]
e Lớp mã hoá (encoding): Lớp này thực hiện ánh xạ dữ liệu dau vào z, là một
vector chiều cao x € RTM, tới biểu diễn lớp thắt cổ chai (bottleneck layer)
chiều thấp (h) Biểu thức với w; là ma trận trọng số, b; là bias, ƒ¡ là một
hàm kích hoạt.
p= filwix + b;)
e Lớp giải mã (decoding): Sử dụng biểu dién an từ lớp mã hoá để tạo ra đầu
ra ê cố gắng tái tạo lại z Ở đây fy làm hàm kích hoạt của lớp giải mã, @
đại diện cho mẫu đầu vào tái thiết
t= fo(Wjh + b;)
e Mất mát tái thiết (Reconstruction Loss): Làm giảm thiểu sự khác biêt giữa
đầu ra và đầu vào, đo lường mức độ tái tạo được của mô hình
min,,,, J(z,£); where L(x — #) = +0", ly — #¡|
21
Trang 32Hình 2.11: Cau trúc Bidirectional LSTM Autoencoder [29, 27]
Mục tiêu của mô hình Bi-LSTM Autoencoder là hoc được một biểu diễn nén
của dữ liệu đầu vào trong giai đoạn mã hóa (encoding), sau đó tái tạo lai dữ
liệu chuỗi gốc trong giai đoạn giải ma (decoding) Mô hình này cố gắng tìm hiểu cách biểu diễn dữ liệu một cách hiệu quả để sau đó có thể sử dụng biểu diễn này để tái tạo lại dữ liệu gốc, giúp mô hình nắm bắt được các đặc điểm quan
trọng của chuỗi thời gian.
2.2.4 Tối uu hoá AdaBelief
Các phương pháp tối ưu hóa độ dốc bậc nhất được sử dụng trong việc huấnluyện mạng nơ-ron hiện đại Có hai nhánh chính: giảm dần độ dốc ngẫu nhiên(SGD) và các phương pháp tốc độ học thích ứng như Adagrad và Adam,v.v
Trong khi SGD sử dụng tốc độ hoc tổng quát cho tất cả các tham số, các phương
pháp thích ứng tính toán một tốc độ học riêng cho từng tham số.
So với SGD, các phương pháp thích ứng thường nhanh chóng hội tu trong
các giai đoạn đầu của quá trình huấn luyện, nhưng có hiệu suất tổng quát kém.
Các nghiên cứu gan đây trong tối ưu hoá độ dốc đã cố gắng kết hợp những ưu
điểm giữa SGD va Adam với nhau gần đây như AdaBound [21], AMSGrad [30], RAdam [20], Fromage [2], mỗi phương pháp cải tiến đều có những điểm cải tiến nhất định so với Adam ban đầu Tuy nhiên, dù những sửa đổi này đạt được độ
chính xác tốt hơn so hơn Adam thuần tuý, nhưng hiệu suất của chúng thườngkém hơn so với SGD trên các bộ dữ liệu quy mô lớn, đồng thời, cũng thường
22
Trang 33không ổn định khi huấn luyện mạng nơ-ron đối kháng.
Để giải quyết các van đề trên thì [39] đã đề xuất AdaBelief Dưới đây là điểm
nhấn mạnh các điều chỉnh được thực hiện trong AdaBelief so với Adam Trướchết nên chú ý đến các tham số:
- ƒ(0) € R,6 € R*, với f là hàm mat mác cần giảm thiểu, 6 là tham số trong R4
- IH(0) = argminzerl||LM1/2(z — g))||: phép chiếu của y lên tập F
- g: độ đốc ở thời điểm t
- mz: đường trung bình động luỹ thừa (EMA) của ø;
- ut, St: Ut là EMA của g2, s¿ là EMA của (gp — mt)?
-a,e: a là tốc độ học, mặc định là 107%, còn « là một số nhỏ, thường đặt ở 10”
- 61, 62: tham số làm mịn, mang giá trị thường là đị = 0,9, bp = 0.999
- địt, Bot: tham số quán tính (momentum parameters) cho m; và uy; tại bước thờigian t, thường được đặt là hang số
Algorithm 1: Adam Optimizer Algorithm 2: AdaBelief Optimizer
Initialize 6, my — 0, up <—0,t —O Initialize 69, mp <— 0, sạ — 0, # — 0 While @, not converged While Ø, not converged
tcCt+l tet+1
gi — Vofi(Or-1) a — Vaƒ,(Ú 1)
m, + Pym, + (1— i)@ my, — đạm, + + (L— ẩI)@:
ty C Bor + +(L— đa)g; 8, — z8 1+(1—a)(g—m¿)”+€
Bias Correction Bias Correction
Update Update
-Hành 2.12: Adam va AdaBelief [39]
Trong so sánh, AdaBelief sử dung một hướng cập nhật đó là vn với s; là
EMA của (ø — m¿)Ÿ thay cho Adam là a, AdaBelief đã tiến một bước lớn khi
quan sát ø; gần với dự đoán m; và một bước nhỏ khi quan sát sai lệch rất nhiều
so với dự đoán Những điều trên giúp cải thiện quá trình tối ưu hoá Ngoài ra
trong bước điều chỉnh độ lệch thêm ¢ trong quá trình điều chỉnh độ lệch để khớp
tốt hơn với giả định rằng s; có giới hạn dưới, với giới hạn dưới ít nhất là e
AdaBelief được thiết kế để giải quyết một số hạn chế hoặc điểm yếu trong
Adam, mang lại cải tiến trong việc thích ứng kích thước bước và điều chỉnh độ
lệch để tối ưu hóa hiệu suất trong quá trình huấn luyện.
23
Trang 342.3 Kiến trúc IoT cận biên
e Tăng tốc độ phản hồi: Dữ liệu được xử lý cục bộ có thể được phản hồi
nhanh hơn nhiều so với dữ liệu được gửi đến đám mây và sau đó được phản
hồi Điều này có thể quan trọng đối với các ứng dụng đòi hỏi thời gian phản hồi nhanh, chẳng hạn như điều khiển tự động hoặc giám sát môi trường.
e Giảm chỉ phi: Xử lý dữ liệu cục bộ có thể giúp giảm chi phí băng thông
và lưu trữ đám mây Diéu này có thể đặc biệt hữu ích đối với các ứng dụng
IoT có lượng dữ liệu lớn, chang hạn như giám sát video.
e Tăng cường bảo mật: Dữ liệu được xử lý cục bộ có thé được bảo vệ tốt
hơn khỏi các cuộc tấn công mạng so với dữ liệu được gửi đến đám mây
Điều này là do dữ liệu không cần phải rời khỏi mạng cục bộ.
Kiến trúc IoT cận biên có thể được áp dụng cho nhiều loại ứng dụng IoT,
bao gồm:
e Giám sát môi trường: Dữ liệu từ các cảm biến môi trường, chẳng han
như nhiệt độ, độ ẩm và chất lượng không khí, có thể được xử lý cục bộ để
phát hiện các van dé tiêm an.
e Điều khiển tự động: Dữ liệu từ các cảm biến và bộ điều khiển có thể
được xử lý cục bộ để điều khiển các thiết bị và hệ thống.
e Công nghiệp: Dữ liệu từ các thiết bị công nghiệp, chang hạn như máy
móc và thiết bị vận hành, có thể được xử lý cục bộ để tối ưu hóa hoạt động.
24
Trang 35Hình 2.13: Tổng quan các lớp kiến trúc IoT cận biên [32]
2.3.2 Các lớp kiến trúc IoT cận biên
Perception Layer
Transport Layer
Hình 2.14: Các lớp cu thể của kiến trúc IoT cận biên [33]
e Perception/Device Layer: Bao gồm các thiết bị cảm biến, camera, và
các thiết bị khác có khả năng thu thập dữ liệu và thực hiện các nhiệm vụ
trong môi trường IoT.
e Transport Layer: Chịu trách nhiệm vận chuyển dữ liệu giữa các thiết bị
IoT với nhau hoặc vận chuyển dữ liệu lên đến trung tam dữ liệu hoặc đám mây Các giao thức như MQTT, Modbus, AMQP, PROFINET có thể được
sử dụng ở tầng này
25
Trang 36e Edge Layer: Khi mạng IoT phát triển, độ trễ trỏ thành thách thức Lớp
biên giải quyết vấn đề này bằng cách cho phép xử lý và phân tích dit liệucàng gần nguồn càng tốt Dữ liệu được xử lý tại các nút biên trước khi đượcgửi lên tầng cao hơn
e Processing Layer: Chịu trách nhiệm phân tích dữ liệu để tạo ra cái nhìn
tổng quan, dự đoán và cảnh báo kịp thời Các mô hình học máy, học sâu,
trí tuệ nhân tạo có thể được triển khai ở lớp này để tiến hành phân tích và
dự đoán dữ liệu.
e Application Layer: Mô tả dữ liệu một cách trực quan thành các biểu đồ,
thông số, giúp người sử dụng có cái nhìn tổng quan về dữ liệu được thu
thập trong hệ thống IoT
2.3.3 Kubernetes
Kubernetes (K8s) là một nền tang quản lý container mã nguồn mở được sử
dụng để triển khai và quản lý các ứng dung container Nó có thể được sử dung
để triển khai các ứng dụng IoT trên các thiết bị biên, đặc biệt phù hợp triển khai
một cụm K8s đơn giản trên các thiết bị máy tính nhúng nhỏ gọn như Raspberry
PI, Orange PI.
Hình 2.15: kiến tric của Kubernetes [15]
Control Plane, hay còn được gọi là Master, đóng vai trò như trung tâm điều
26
Trang 37khiển hoặc bộ não của hệ thống Kubernetes Nhiệm vụ chính của Control Plane
là quản lý và điều khiển các Node (Worker), trong khi không triển khai các ứng
dụng trực tiếp trên server Master Control Plane bao gồm các thành phần sau:
e Kubernetes API Server: Là thành phần chịu trách nhiệm cho việc liên
lạc giữa các thành phần khác trong hệ thống Khi triển khai ứng dụng, các
yêu cầu được gửi đến Kubernetes API Server
e Scheduler: Dược sử dụng để lập lịch triển khai cho các ứng dụng Scheduler
quyết định Node nào sẽ chạy ứng dụng dựa trên các yếu tố như tài nguyênsan có và chiến lược phân phối công việc
e Controler Manager: Quản lý và giám sát các Worker (Node) Nó kiểm
tra tình trạng hoạt động của các Node và thực hiện các chức năng như nhân
bản ứng dụng để đảm bảo sự ồn định của hệ thống.
e Etcd: Day là cơ sở dữ liệu của Kubernetes, lưu trữ thông tin quan trong
và cấu hình của hệ thống Tất cả dữ liệu của Kubernetes được duy trì ổn
định trong Etcd.
Worker, hay còn gọi là Node, là những server chịu trách nhiệm thực hiện các
tác vụ cụ thể như triển khai ứng dụng Mỗi server Node bao gồm các thành
phần sau:
e Container runtime: Là thành phần chịu trách nhiệm chạy các ứng dụng
dưới dang Container Thông thường, Docker là một trong những container
runtime phổ biến được sử dụng trong môi trường Kubernetes.
e Kubelet: Là thành phần kết nối với Kubernetes API Server, đồng thời
quan lý các container trên Node No dam bảo rằng các container được triển
khai đúng cách và theo đúng cấu hình
e Kubernetes Service Proxy: Thành phần này đảm nhận vai trò trong
việc phân tải và định tuyến traffic giữa các ứng dụng trên Node Điều nay giúp cung cấp một môi trường mạng linh hoạt cho các dịch vụ chạy trên
Kubernetes.
27
Trang 38Khóa luận sử dụng một triển khai Kubernetes nhẹ, nhỏ gọn, được thiết kế để chạy trên các thiết bị có tài nguyên hạn chế (cụ thể là Orange PI, thiết bị máy
tính nhúng mà chúng tôi sử dụng)
2.4 Một số công trình nghiên cứu liên quan
Một số công trình về sử dụng các loại cẩm biến trong quản lý chất lượng nước
ở bảng dưới đây:
28