Khối Gateway và xử lý trung tâm

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu, thiết kế hệ thống giám sát và cảnh báo sức khỏe ứng dụng công nghệ iot (Trang 55)

6. Cấu trúc trình bày nội dung luận văn

3.3.2. Khối Gateway và xử lý trung tâm

Khối Gateway (GW) cĩ chức năng lưu trữ, giám sát, hiển thị và cảnh báo dữ liệu sức khỏe thu thập được. Việc cảnh báo được thực hiện bằng âm thanh bằng loa tại chỗ, tin nhắn SMS, gọi điện cho đội ngũ y bác sỹ hay người thân. Khối GW gồm Kit Heltec WiFi LoRa 32, module giao tiếp âm thanh DFR0299,

m a n h in h h ie n th i L C D 2 0 0 4 v a m o d u le S IM 8 0 0 L . C a c th ie t b i tr o n g k h o i G W

d u g c m o t a c h i tie t o Phu Luc A.

RING DTR SIM SOOL MIC+ MIC- SPKP SPKN SIM800L fWT-. BUSY DFPLAYER USB- USB+ i AD KEY_2 . ADKEY_1 1 IO_2 GND 2 IO_1 D FPLA YE R <TEXT>. . ESP 3.2 L O R A V I <TEXT>. . . . CONN-SIL^- <TEXT>■ ■ 22QR- <TEXT; 22QR- <TEXT; 220R- <TEXT; 220R- <TEXT> 100uF- <TEXT> 0.1 uF • <TEXT i k - • LED_- ■ !XT>- <TEXT> CONN-SIL4 <TEXT>■ ■ CONN-SIL3 -:TEXT> ■ ■ CONN-SIL2 -=:TEXT:=- ■ ■ _L2 42 44 45 46 19 _L£ 15 18 15

Hinh 3.10. So do nguyen ly khoi Gateway.

Hinh 3.11. So’ do mach in va hinh dang khoi Gateway thuc te.

T r o n g th ờ i g ia n g ầ n đ â y , n ề n tả n g m ã n g u ồ n m ở T h in g s b o a r d đ a n g đ ư ợ c

x e m n h ư m ộ t g iả i p h á p rấ t h iệ u q u ả đ ể th u th ậ p , x ử lý , trự c q u a n h ĩ a d ữ liệ u v à

q u ả n lý th iế t b ị c h o c á c ứ n g d ụ n g Io T n h ư m ơ t ả tr ê n Hình 3.12. T h in g s b o a r d c h o p h é p k ế t n ố i c á c th iế t b ị th ơ n g q u a c á c g ia o th ứ c Io T tiê u c h u ẩ n c ơ n g n g h iệ p

n h ư M Q T T ( M e s s a g e Q u e u in g T e le m e tr y T ra n s p o r t) , C o A P (C o n s tr a in e d

A p p lic a tio n P r o to c o l) v à H T T P ( H y p e r T e x t T ra n s f e r P ro to c o l). T h in g s b o a rd

c h o p h é p t íc h h ợ p c á c th iế t b ị đ ư ợ c k ế t n ố i v ớ i c á c h ệ th ố n g c ũ v à b ê n t h ứ b a

b ằ n g c á c g ia o th ứ c h iệ n cĩ. T h in g s b o a r d b a o g ồ m m ộ t số tín h n ă n g c ơ b ả n n h ư

sa u :

+ T h u th ậ p d ữ liệ u t ừ xa: T h in g s b o a r d h ỗ tr ợ th u th ậ p v à lư u tr ữ d ữ liệ u t ừ

x a th e o c á c h đ á n g t in cậy . D ữ liệ u đ ã th u th ậ p c ĩ th ể đ ư ợ c tru y c ậ p b ằ n g c á c h

s ử d ụ n g tr a n g w e b tù y c h ỉn h h o ặ c A P I p h ía m á y c h ủ ;

+ T rự c q u a n h ĩ a d ữ liệ u : T h in g s b o a r d c u n g c ấ p n h iề u tiệ n íc h đ ể h iể n th ị

trự c q u a n c á c d ữ liệ u th u th ậ p đ ư ợ c . T h in g s b o a r d c ũ n g c h o p h é p tạ o c á c tiệ n

íc h riê n g n h ư c á c tiệ n íc h G o o g le m a p , đ ồ th ị th ờ i g ia n th ự c , ...;

Hình 3.12. Nền tảng mã nguồn mở Thingsboard [127].

+ Q u ả n lý th iế t bị: T h in g s b o a r d c u n g c ấ p k h ả n ă n g đ ă n g k ý v à q u ả n lý

th iế t bị. N ĩ c h o p h é p th e o d õ i c á c th u ộ c tín h th iế t b ị p h ía m á y k h á c h v à c u n g

c ấ p p h ía m á y c h ủ . T h in g s b o a rd c ị n c u n g c ấ p A P I c h o c á c ứ n g d ụ n g p h ía m á y

c h ủ đ ể g ử i c á c lệ n h R P C (R e m o te P ro c e d u r e C a lls ) tớ i c á c th iế t b ị v à n g ư ợ c

+ Tạo các bảng điều khiển (Dashboard) để hiển thị dữ liệu và điều khiển thiết bị từ xa theo thời gian thực;

+ Quản lý các cảnh báo: Thingsboard cung cấp cơng cụ khởi tạo và quản lý các cảnh báo liên quan đến các thực thể trong hệ thống, đặc biệt là cho phép giám sát báo động theo thời gian thực và báo động cho việc phân cấp các thực thể liên quan.

3.4.2. Giao thức M Q TT

MQTT (Message Queuing Telemetry Transport) là giao thức tin nhắn dạng Publish-Subscribe. Giao thức này sử dụng băng thơng thấp, nên đây là một giao thức lý tưởng cho các ứng dụng IoT. Trong một hệ thống sử dụng giao thức MQTT, nhiều client kết nối tới một server (được gọi là MQTT Broker). Mỗi client sẽ đăng ký theo dõi các kênh thơng tin (topic) hoặc gửi dữ liệu lên kênh thơng tin đĩ. Quá trình đăng ký này gọi là “subscribe” và hành động một client gửi dữ liệu lên kênh thơng tin được gọi là “publish”. Mỗi khi kênh thơng tin đĩ được cập nhật dữ liệu (dữ liệu này cĩ thể đến từ client khác) thì những client nào đã đăng ký theo dõi kênh này sẽ nhận được dữ liệu cập nhật đĩ.

Hình 3.13. Kiến trúc MQTT Publish / Subscribe [11].

3.4.3. Các lưu đồ thuật tốn

Trong phần này, tác giả tiến hành xây dựng các thuật tốn để thu thập dữ liệu tại khối Sensor Node, xử lý dữ liệu tại GW, và đặc biệt là thuật tốn cảnh báo tình trạng sức khỏe bệnh nhân dựa vào tín hiệu SpO2.

A

3.4.3.1.Lưu đồ thuật tốn tại Sensor Node

Hình 3.14. Lưu đồ thuật tốn tại Sensor Node.

A

A

3.4.3.3.Lưu đo thuật tốn cảnh báo SpO2

Hình 3.16. Lưu đồ thuật tốn cảnh báo SpO2.

3.5. Kết luận chương

Trong chương này, tác giả đã tiến hành xây dựng hệ thống giám sát và thu thập dữ liệu sức khỏe ứng dụng cơng nghệ LoRa và giao thức Websocket. Các dữ liệu sinh tồn bao gồm nhịp tim, SpO2, điện tim đồ ECG và một số thuật tốn giám sát cảnh báo được tích hợp vào hệ thống đề xuất. Chương này là nền tảng cho việc áp dụng các mơ hình học máy ở chương tiếp theo.

CHƯƠNG 4. HỌC MÁY VÀ ỨNG DỤNG TRONG LĨNH VỰC CHĂM SĨC SỨC KHỎE

4.1. Giới thiệu chương

Trong Chương 3, một hệ thống thu thập dữ liệu sức khỏe từ xa đã được đề xuất. Để các dữ liệu này trở nên cĩ ý nghĩa và gĩp phần vào cơng tác chăm sĩc sức khỏe, việc phân tích dữ liệu là một trong những yêu cầu hết sức quan trọng. Chương này sẽ giới thiệu về các thuật tốn học máy ML (Machine Learning) điển hình được áp dụng trong lĩnh vực chăm sĩc sức khỏe, các mơ hình dự đốn và các phương pháp đánh giá mơ hình. Đồng thời, chương này cũng nghiên cứu khả năng tích hợp các thuật tốn ML vào hệ thống giám sát và cảnh báo sức khỏe đề xuất ở Chương 3.

4.2. Tổng quan về học máy và ứng dụng trong lĩnh vực CSSK

4.2.1. Tổng quan về học máy

4.2.1.1. Định nghĩa

Học máy ML (Machine Learning) là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống học tự động từ dữ liệu để giải quyết các vấn đề cụ thể. ML cĩ liên quan đến thống kê vì cả hai lĩnh vực đều nghiên cứu việc phân tích dữ liệu. Khác với thống kê, ML tập trung vào sự phức tạp của các giải thuật trong việc thực thi tính tốn. ML hiện nay được áp dụng rộng rãi như máy truy tìm dữ liệu, chẩn đốn y khoa, nhận dạng tiếng nĩi và chữ viết, ... [26].

4.21.2. M ột số phương thức của học máy

Học cĩ giám sát (Supervised learning): Thuật tốn dự đốn đầu ra của một dữ liệu mới (new input) dựa trên các cặp (input, outcome) đã biết từ trước. Cặp dữ liệu này cịn được gọi là (data, label), tức (dữ liệu, nhãn). Supervised learning là nhĩm phổ biến nhất trong các thuật tốn Machine Learning. Học cĩ giám sát được chia thành hai loại chính:

+ Classification (phân lớp): Là quá trình phân lớp một đối tượng dữ liệu vào một hay nhiều lớp đã cho trước nhờ một mơ hình phân lớp (model). Mơ hình này được xây dựng dựa trên một tập dữ liệu được xây dựng trước đĩ cĩ gán nhãn (hay cịn gọi là tập huấn luyện). Quá trình phân lớp là quá trình gán nhãn cho đối tượng dữ liệu.

Hình 4.1. Ví dụ về mơ hình phân lớp [14].

Cĩ nhiều bài tốn phân lớp như phân lớp nhị phân, phân lớp đa lớp, phân lớp đa trị. Trong đĩ phân lớp nhị phân là một loại phân lớp đặc biệt của phân lớp đa lớp. Ứng dụng của bài tốn phân lớp được sử dụng rất nhiều và rộng rãi như nhận dạng khuơn mặt/chữ viết/giọng nĩi, phát hiện thư rác, ...

+ Regression (hồi quy): Nếu khơng được chia thành các nhĩm mà là một giá trị thực cụ thể. Đầu ra của một điểm dữ liệu sẽ bằng chính đầu ra của điểm dữ liệu đã biết.

Học khơng giám sát: là một k ĩ thuật của máy học nhằm tìm ra một mơ hình hay cấu trúc bị ẩn bởi tập dữ liệu khơng được gán nhãn cho trước. Học khơng giám sát khác với Học cĩ giám sát là khơng thể xác định trước output từ tập dữ liệu huấn luyện được. Tùy thuộc vào tập huấn luyện mà kết quả output sẽ khác nhau. Trái ngược với Học cĩ giám sát, tập dữ liệu huấn luyện của Học khơng giám sát khơng do con người gán nhãn, máy tính sẽ phải tự học hồn tồn. Ứng dụng phổ biến của học khơng giám sát là bài tốn phân cụm.

Học bán giám sát: Các bài tốn khi cĩ một số lượng lớn dữ liệu nhưng chỉ một phần trong chúng được dán nhãn. Những bài tốn này nằm giữa phương thức học giám sát và học khơng giám sát.

4.2.2. Ứng dụng học máy trong lĩnh vực chăm sĩc sức khỏe

Các ứng dụng của học máy ngày càng trở nên phổ biến trong lĩnh vực chăm sĩc sức khỏe. Theo dự đốn, các ứng dụng dựa trên học máy được nhúng với dữ liệu bệnh nhân theo thời gian thực sẽ luơn cĩ sẵn từ các hệ thống chăm sĩc sức khỏe khác nhau ở nhiều quốc gia, do đĩ làm tăng hiệu quả của các lựa chọn điều trị mới. Dưới đây là một số ứng dụng hàng đầu của học máy trong lĩnh vực chăm sĩc sức khỏe [47]:

+ Xác định và chẩn đốn bệnh: Một trong những ứng dụng ML chính trong lĩnh vực chăm sĩc sức khỏe là xác định và chẩn đốn bệnh, nhất là các bệnh được coi là khĩ chẩn đốn;

+ Khám phá và sản xuất thuốc: Một trong những ứng dụng lâm sàng đầu tiên của học máy nằm trong quy trình khám phá thuốc ở giai đoạn đầu. Hiện tại, các kỹ thuật học máy theo kiểu học khơng giám sát cĩ thể xác định các mẫu trong dữ liệu mà khơng cung cấp bất kỳ dự đốn nào. Dự án Hanover do Microsoft phát triển đang sử dụng các cơng nghệ dựa trên ML để điều trị ung thư và cá thể hĩa việc kết hợp thuốc cho bệnh ung thư máu dịng tủy cấp;

+ Chẩn đốn hình ảnh: Học máy và học sâu đĩng vai trị quan trọng trong chẩn đốn hình ảnh. Sáng kiến InnerEye do Microsoft phát triển cĩ thể hoạt động dựa trên các cơng cụ chẩn đốn hình ảnh;

+ Y học cá thể: Các phương pháp điều trị cá thể khơng chỉ hiệu quả hơn nhờ sự kết hợp sức khỏe cá nhân với các phân tích dự đốn mà cịn để nghiên cứu thêm và đánh giá bệnh tốt hơn. Đặc biệt là các thiết bị đeo tích hợp các cảm biến sinh học cĩ khả năng đo lường sức khỏe sẽ gĩp phần thu thập được nhiều dữ liệu hơn;

+ Sửa đổi hành vi dựa trên học máy, hồ sơ sức khỏe thơng minh, thử nghiệm nghiên cứu lâm sàng, thu thập dữ liệu đám đơng hay dự đốn bùng phát dịch bệnh, ...

4.3. Ứng dụng một số thuật tốn ML trong hệ thống CSSK đề xuất

Phần này sẽ giới thiệu một số thuật tốn học máy điển hình được sử dụng trong giám sát sức khỏe, bao gồm: KNN (K-Nearest Neighbors), Decision Tree, Hồi quy Logistic, SVM (Support Vector Machine), Random Forest và Nạve Bayes. Đặc biệt, các thuật tốn này sẽ được áp dụng đối với các dữ liệu thực tế được thu thập từ hệ thống đề xuất trong Chương 3 nhằm đánh giá sơ bộ về tình trạng bệnh tim của bệnh nhân. Trên cơ sở đĩ, bệnh nhân sẽ tiếp tục được theo dõi và đánh giá bởi đội ngũ y bác sĩ chuyên khoa.

4.3.1. Thuật tốn K N N

KNN là một trong những thuật tốn học cĩ giám sát đơn giản nhất trong ML. Ý tưởng của KNN là tìm đầu ra (output) của dữ kiệu dựa trên thơng tin của những dữ liệu huấn luyện (training) gần nĩ nhất [9].

Quy trình làm việc của thuật tốn KNN:

+ Bước 1 : xác định tham số K= số láng giềng gần nhất.

+ Bước 2: tính khoảng cách đối tượng cần phân lớp với tất cả các đối tượng trong tập dữ liệu huấn luyện (training data).

+ Bước 3: sắp xếp khoảng cách theo thứ tự tăng dần và xác định K láng giềng gần nhất với đối tượng cần phân lớp.

+ Bước 4: lấy tất cả các lớp của K láng giềng gần nhất.

+ Bước 5: dựa vào phần lớn lớp của K để xác định lớp cho đối tượng cần phân lớp.

Cĩ nhiều loại khoảng cách khác nhau tùy thuộc vào bài tốn, nhưng khoảng cách được sử dụng nhiều nhất là khoảng cách Euclid:

4.3.2. Thuật tốn Decision Tree

Cây quyết định (Decision Tree) là thuật tốn thuộc loại học cĩ giám sát, một cơng cụ sử dụng mơ hình cấu trúc cây hoặc mơ hình cây phân cấp quyết định. Mục tiêu của cây quyết định là dự đốn bằng cách chia nhỏ cây thành các nhánh nhỏ hơn. Mỗi nhánh của cây quyết định thể hiện một khả năng cĩ thể xảy ra của cây quyết định [12], [43], [106]. Mục tiêu chính của cây quyết định là đưa ra được câu trả lời rõ ràng cho những trường hợp phức tạp, cĩ quá nhiều lựa chọn hay khơng chắc chắn. Cây quyết định được chia thành 2 loại chính:

+ Cây hồi quy (Regression Tree): ước lượng các hàm cĩ giá trị là số thực (ước tính giá một ngơi nhà hay khoảng thời gian một bệnh nhân nằm viện, ...);

+ Cây phân loại (Classiíỉcation Tree): Nếu biến phụ thuộc nhận giá trị phân loại, tức giá trị biểu trưng (symbol) được sắp thứ tự (giới tính nam hay nữ, kết quả của một trận đấu là thắng hay thua), ... Khi đĩ các thuộc tính cĩ giá trị rời rạc.

Với tiêu chí xây dựng cây quyết định ngày càng đơn giản, cho độ chính xác phân lớp cao, chi phí thấp, ... cĩ rất nhiều tác giả đã cho ra đời các thuật tốn ngày càng tối ưu hơn. Một số thuật tốn cây quyết định phổ biến như: ID3 (Interactive Dichotomizer 3), CART (Classiíỉcation And Regression Tree), C4.5, C5.0, . C ĩ 3 loại nút trong cây quyết định: Nút gốc (nút quyết định); Nút trong (nút thay đổi cĩ định hướng) và Nút lá (nút kết quả).

4.3.3. Thuật tốn H ồi quy Logistic

Hồi quy Logistic là một thuật tốn phân lớp được sử dụng để dự báo biến nhị phân, cĩ thể xem đây là một trường hợp đặc biệt của hồi quy tuyến tính. Phân tích hồi quy Logistic là một kỹ thuật thống kê để xem xét mối liên hệ giữa biến độc lập (biến số hoặc biến phân loại) với biến phụ thuộc là biến nhị phân.

Trong hồi quy tuyến tính đơn, biến độc lập V và phụ thuộc y là biến số liên

y = a + fix + £ (4.2) Trong hồi quy logistic, biến phụ thuộc y chỉ cĩ 2 trạng thái 1 (ví dụ tử vong) và 0 (ví dụ sống). Muốn đổi ra biến số liên tục người ta tính xác suất của 2 trạng thái này [121]. Nếu gọi p là xác suất để một biến cố xảy ra (ví dụ: tử vong), thì 1- p là xác suất để biến cố khơng xảy ra (ví dụ: sống). Phương trình hồi quy logistic được phát biểu:

log ( ^ T " ) = a + fix + £ (4.3)

Trong đĩ, afi là hai thơng số cần ước tính từ dữ liệu, và £ là phần dư (residual).

4.3.4. Thuật tốn SVM

SVM là thuật tốn học máy cĩ giám sát sử dụng một ánh xạ phi tuyến để chuyển đổi dữ liệu (huấn luyện) gốc vào một khơng gian nhiều chiều hơn. Trong khơng gian mới này, SVM tìm kiếm siêu phẳng phân tách tối ưu tuyến tính mà cĩ thể phân tách được dữ liệu thuộc hai lớp khác nhau [6], [27], [72].

Hình 4.2. Siêu phẳng h phân chia dữ liệu học thành 2 lớp + và - với khoảng cách biên lớn nhất. Các điểm gần h nhất là các vector hỗ trợ (Support Vector - điểm được

khoanh trịn) [6].

Ý tưởng chính của thuật tốn này là cho trước một tập huấn luyện được biểu diễn trong khơng gian vector trong đĩ mỗi tài liệu là một điểm, phương

pháp này tìm ra một mặt phẳng h quyết định tốt nhất cĩ thể chia các điểm trên

khơng gian này thành hai lớp riêng biệt tương ứng là lớp + và lớp Chất lượng của siêu mặt phẳng này được quyết định bởi khoảng cách (gọi là biên) của điểm

d ữ liệ u g ầ n n h ấ t c ủ a m ỗ i lớ p đ ế n m ặ t p h ẳ n g n ày . K h o ả n g c á c h b iê n c à n g lớ n

th ì m ặ t p h ẳ n g q u y ế t đ ịn h c à n g tố t đ ồ n g th ờ i v iệ c p h â n lo ạ i c à n g c h ín h x á c . M ụ c

đ íc h th u ậ t to á n S V M l à tìm r a đ ư ợ c k h o ả n g c á c h b iê n lớ n n h ấ t đ ể tạ o r a k ế t q u ả

p h â n lớ p tố t.

4.3.5. Thuật tốn Random Forest

R a n d o m F o r e s t là th u ậ t to á n h ọ c m á y c ĩ g iá m s á t d ự a tr ê n k ỹ th u ậ t lắ p g h é p , k ế t h ợ p c á c c â y p h â n lớ p . R a n d o m F o r e s t x â y d ự n g c â y p h â n lớ p b ằ n g c á c h lự a c h ọ n n g ẫ u n h iê n m ộ t n h ĩ m n h ỏ c á c th u ộ c tín h tạ i m ỗ i n ú t c ủ a c â y đ ể p h â n c h ia c h o m ứ c tiế p th e o c ủ a c â y p h â n lớ p . N g o à i r a tậ p m ẫ u c ủ a m ỗ i c â y c ũ n g đ ư ợ c lự a c h ọ n n g ẫ u n h iê n b ằ n g p h ư ơ n g p h á p B o o ts tr a p ( c h ọ n m ẫ u cĩ

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu, thiết kế hệ thống giám sát và cảnh báo sức khỏe ứng dụng công nghệ iot (Trang 55)

Tải bản đầy đủ (PDF)

(134 trang)