Quá trình kiểm tra của mơ hình rừng ngẫu nhiên RF

Một phần của tài liệu (Luận văn thạc sĩ) Xây dựng mô hình phối hợp các mạng Nơrôn nhận dạng tín hiệu điện tim (ECG) (Trang 63 - 66)

Hình 3.12. Quá trình kiểm tra của mơ hình rừng ngẫu nhiên RF

y2 yM X Bộ số liệu học/ kiểm tra Cây 1 Cây 2 Cây M Khối tổng hợp kết quả (phương pháp bỏ phiếu) Kết quả học/ kiểm tra y1

3.3. Phối hợp mạng nơ-rơn nhận dạng tín hiệu điện tim bằng mơ hình cây quyết định định

3.3.1. Đề xuất mơ hình kết hợp

Hình 3.13 biểu diễn sơ đồ chung của mơ hình kết hợp sử dụng nhiều mơ hình nhận dạng đơn, trong đó, M  số mơ hình nhận dạng đơn, xin  tín hiệu điện tim ECG đầu vào, Pi  là các khối tiền xử lý và trích chọn đặc tính, Ci  các khối phân loại, z

kết quả nhận dạng cuối cùng tương ứng với tín hiệu đầu vào xin .

Hình 3.13. Sơ đồ chung của mơ hình kết hợp sử dụng nhiều mơ hình nhận dạng đơn Nhìn chung, các mơ hình nhận dạng cơ sở làm việc độc lập với tín hiệu điện tim đầu vào xin có thể từ các chuyển đạo khác nhau, các khối tiền xử lý và trích chọn đặc tính Pi dùng các phương pháp khác nhau. Như đã trình bày ở phần mở đầu, định hướng nghiên cứu của luận văn là sử dụng chung một phương pháp tiền xử lý và trích chọn đặc tính P1  P2  ...  PM  cho các mơ hình nhận dạng đơn Ci.

Nếu bài tốn nhận dạng K loại nhịp tim khác nhau, thì mỗi mơ hình nhận dạng đơn Ci (với i=1, 2,…, M) sẽ có M kết quả yi (với i=1, 2,…, M) biểu diễn dưới dạng véc-tơ (công thức 3.1), một véc-tơ yi lý tưởng khi có một giá trị bằng ‘1’ và tất cả các giá trị còn lại đều bằng ‘0’, nhưng thông thường các giá trị của chúng thường dao động trong khoảng [0, 1]. Trong luận văn, các kết quả đầu ra yi từ các mơ hình nhận dạng cơ sở được hợp lại thành một véc-tơ tổng Y (có kích thước M- K) như (3.2) và được tiếp

tục xử lý tại khối kết hợp kết quả để đưa ra kết luận cuối cùng là véc-tơ z (có kích thước K) tương ứng với mã của K loại nhịp tim khác nhau.

- Kết quả của mơ hình nhận dạng đơn Ci (với i=1, 2,…, M):

yi yi1 yi2 ... yiK (3.17) - Véc-tơ tổng hợp:

Y = [y1 y2 ... yM]

= [y11y12...y1K y21y22...y2K ... yM1yM2...yMK] (3.18) Một số giải pháp kết hợp kết quả thông dụng đã được nhiều nghiên cứu khác đề xuất: Biểu quyết theo đa số [11, 16], biểu quyết có trọng số [28, 34], tổng hợp theo xác suất điều kiện Bayes [28]… Nhìn chung các giải pháp này khá đơn giản, ổn định, hiệu

quả cao đối với các bài tốn sử dụng nhiều mơ hình nhận dạng đơn và cùng một thuật tốn, do đó khối lượng tính tốn lớn nên ở khâu kết hợp các tác giả thường lựu chọn các giải pháp kết hợp đơn giản, hay dùng nhất là giải pháp biểu quyết theo đa số.

Hình 3.14. Sơ đồ khối chung của hệ thống kết hợp song song nhiều mơ hình đơn Luận văn đề xuất sử dụng cây quyết định DT (Decision Tree). Như đã trình bày ở trên, lựa chọn cây quyết định DT là để cân bằng với sự phức tạp của mơ hình kết hơp, bởi vì các mơ hình nhận dạng phi tuyến cơ sở đã phức tạp do đó khối kết hợp kết quả nên là một mơ hình đơn giản hơn. Cây quyết định DT là một mơ hình kinh điển dùng để phân loại dữ liệu [34], tuy nó đơn giản hơn mạng nơ-rơn trí tuệ tạo nhưng vẫn có thể thực hiện việc so sánh từng bước phức tạp và có những phương pháp hiệu quả trong việc hình thành các thơng số của cây phỏng theo những tập dữ liệu được cho. Dưới sự đa dạng của các mơ hình cây quyết định, tác giả sẽ lựa chọn dùng mơ hình cây quyết định nhị phân (Binary Decision Tree) để tích hợp. Các kết quả tính tốn mơ phỏng sẽ được kiểm chứng trên các tập số liệu mẫu chuẩn của bộ CSDL MIT-BIH và MGH/MF được các nhóm nghiên cứu quốc tế thường dùng để tham chiếu, để đánh giả kết quả nhận dạng với các mơ hình nhân dạng đơn, và với các giải pháp kết hợp. Luận văn sử dụng thuật toán ID3 [35] để xây dựng cấu trúc cho cây quyết định DT, chi tiết sẽ được trình bày trong các mục kế tiếp.

Kết quả nhận dạng Z

ECG data Tiền xử lý

Trích chọn đặc tính

Vector đặc tính: x= [c0, ..., c15, RRlast, Rmean

Mơ hình nhận dạng C1 có kết quả: Y1 = [y11y12...y1K] Mơ hình nhận dạng C2 có kết quả: Y2 = [y21y22...y2K] Mơ hình nhận dạng CM có kết quả: YM = [yM1yM2...yMK] Ghép thành vector tổng Y

Y = [y1 y2 ... yM] = [y11 y12 ... y1K y21y22 ... yM1yM2...yMK]

3.3.2. Quy trình xây dựng cây quyết định cho khối tổng hợp kết quả

Quy trình xây dựng khối tổng hợp kết quả bằng cây quyết định DT (trong hình

3.14), như sau:

Bước 1: Phân chia bộ dữ liệu gốc thành hai phần:

- Bộ dữ liệu học xlearn, d learncó P mẫu; - Bộ dữ liệu kiểm tra xtest , dtestcó Q mẫu.

Bước 2: Xây dựng các mơ hình nhận dạng cơ sở Ci (với i=1, 2,…, M). Bước 3: Thiết lập bộ số liệu học cho cây quyết định DT, cụ thể:

- Đưa P mẫu xlearn, d learn vào M mơ hình nhận dạng cơ sở Ci (đã xây dựng ở bước 2) thì sẽ có M kết quả nhận dạng yi = [yi1yi2...yiK] (i=1, 2,…,M), K  số lớp nhận dạng;

- Sắp xếp M kết quả Yi thành một véc-tơ đầu vào tổng Ylearn có kích thước

M xK , chi tiết sắp xếp:

Ylearn = [y1 y2 ... yM]

= [y11 y12 ... y1K y21y22 ... y2K ... yM1 yM2...yMK]

Như vậy bộ số liệu học cho cây quyết định DT là (Ylearn, dlearn).

Bước 4: Xây dựng cây quyết định cho khối tổng hợp kết quả từ bộ số liệu học

Ylearn , dlearn , luận văn sử dụng thuật toán ID3 để xây dựng cấu trúc cho cây quyết

định DT, chi tiết sẽ được trình bày ở mục kế tiếp.

Bước 5: Áp các kết quả của bước 2 (các mơ hình đơn), bước 4 (cây quyết định)

để hoàn thành hệ thống nhận dạng có cấu trúc như trong hình 3.14. Kiểm tra sai số nhận dạng với bộ dữ liệu kiểm tra xtest ,dtest , đánh giá chất lượng mơ hình.

Hình 3.15. Sơ đồ nguyên lý quá trình tạo cây quyết định Bộ số liệu học Ylearn , dlearn 

Một phần của tài liệu (Luận văn thạc sĩ) Xây dựng mô hình phối hợp các mạng Nơrôn nhận dạng tín hiệu điện tim (ECG) (Trang 63 - 66)

Tải bản đầy đủ (PDF)

(94 trang)