Phân tích âm thanh phổi sử dụng phương pháp học máy - Một bước tiến mới trong kỹ thuật chẩn đoán bệnh hô hấp

6 4 0
Phân tích âm thanh phổi sử dụng phương pháp học máy - Một bước tiến mới trong kỹ thuật chẩn đoán bệnh hô hấp

Đang tải... (xem toàn văn)

Thông tin tài liệu

Bài viết Phân tích âm thanh phổi sử dụng phương pháp học máy - Một bước tiến mới trong kỹ thuật chẩn đoán bệnh hô hấp cung cấp tổng quan lý thuyết một cách có cấu trúc các hệ thống phân tích âm thanh phổi từ xử lý dữ liệu, cụ thể là xử lý tín hiệu âm thanh, trích xuất đặc trưng và tăng cường dữ liệu cho đến mô hình hóa dữ liệu thông qua các kiến trúc mạng nơ-ron và các cơ chế học. Mời các bạn cùng tham khảo!

Hội nghị Quốc gia lần thứ 25 Điện tử, Truyền thơng Cơng nghệ Thơng tin (REV-ECIT2022) Phân Tích Âm Thanh Phổi Sử Dụng Phương Pháp Học Máy - Một Bước Tiến Mới Trong Kỹ Thuật Chẩn Đoán Bệnh Hô Hấp Nguyễn Thị Kim Trúc∗ , Trần Thị Minh Dung∗ , Cao Nguyễn Khoa Nam† , Nguyễn Hữu Hoàng‡ , Nguyễn Văn Sĩ‡ , Lê Khắc Bảo‡ ∗ Khoa Điện, Trường Đại học Bách khoa Đà Nẵng, † Khoa Điện, Trường Đại học Sư phạm Kỹ thuật Đà Nẵng, ‡ Đại học Y Dược Thành phố Hồ Chí Minh Email: {ntktruc, ttmdung}@dut.udn.vn, caonam@gmail.com, drhuuhoang@gmail.com, {si.nguyen, lekhacbao}@ump.edu.vn Tóm tắt nội dung—Phân tích âm phổi sử dụng phương pháp tính mang lại lợi ích cho việc hỗ trợ chẩn đốn bệnh lý hơ hấp sử dụng máy tính, lưu trữ liệu theo dõi tình trạng sức khỏe cá nhân lĩnh vực chăm sóc sức khỏe Trong đó, hướng nghiên cứu phát loại âm bất thường phổi phân loại bệnh hô hấp thu hút nhiều quan tâm nhà nghiên cứu Bài báo tổng hợp hướng tiếp cận khác hệ thống phân tích âm phổi sử dụng phương pháp học máy phương pháp học sâu Chúng cung cấp tổng quan lý thuyết cách có cấu trúc hệ thống phân tích âm phổi từ xử lý liệu, cụ thể xử lý tín hiệu âm thanh, trích xuất đặc trưng tăng cường liệu mơ hình hóa liệu thông qua kiến trúc mạng nơ-ron chế học Bên cạnh đó, số thuận lợi thách thức việc ứng dụng thực tế hệ thống phân tích âm phổi giới thiệu cách ngắn gọn Keywords-học máy; học sâu; phân tích âm phổi; phân loại bệnh hô hấp; phân loại âm phổi I GIỚI THIỆU CHUNG Các bệnh hô hấp nguyên nhân dẫn đến tử vong cho người Theo Tổ chức Y tế Thế giới (WHO), năm bệnh hô hấp hàng đầu bao gồm hen suyễn, bệnh tắc nghẽn phổi mạn tính (chronic obstructive pulmonary disease - COPD), nhiễm trùng cấp tính đường hơ hấp (acute lower respiratory tract infections), ung thư phổi viêm phổi gây nhiều vấn đề nghiêm trọng đến sức khỏe người bảy triệu trường hợp tử vong năm toàn giới Thêm vào đó, theo [1] bệnh hơ hấp hàng đầu ngoại trừ ung thư phổi tăng đáng kể suốt đại dịch Covid-19 Triệu chứng ISBN 978-604-80-7468-5 bệnh hơ hấp có đặc điểm giống cao âm bất thường hít thở nhân tố quan trọng tìm thấy suốt q trình chẩn đốn [2] Bởi hậu nghiêm trọng bệnh hơ hấp, việc đưa phương pháp chẩn đoán sớm xác loại bệnh thực cấp thiết Các âm (tiếng) phổi xem thị liên quan sức khỏe hô hấp [3] Âm phổi chia làm hai loại bao gồm tiếng phổi bình thường tiếng phổi bất thường [2] Tiếng phổi bình thường nghe thấy phổi khơng có bất thường hay rối loạn Tiếng phổi bất thường âm đặc trưng xuất tiếng phổi bình thường Tiếng phổi bất thường chia thành hai loại liên tục tiếng khò khè (wheezes) không liên tục tiếng ran nổ (fine crackles), tiếng ran ẩm (coarse crackles), Các phương pháp thính chẩn truyền thống sử dụng ống nghe có đặc điểm sau: tiếng phổi đánh giá dựa vào kinh nghiệm bác sĩ, cung cấp việc giám sát cách liên tục yêu cầu cần có chun gia huấn luyện Ngồi ra, đặc điểm tiếng phổi nằm dải tần số thấp, nơi thính giác người có độ nhạy hạn chế dễ bị nhiễu [4] Các phương pháp tính tốn cho phân tích âm phổi (Computational lung sound analysis - CLSA) phát triển để tự động nhận dạng phân loại tiếng phổi bất thường nhằm hỗ trợ cho chẩn đoán bệnh hay tình trạng hơ hấp CLSA sử dụng thiết bị ghi âm số, kỹ thuật xử lý tín hiệu, thuật tốn học máy Chính vậy, hệ thống CLSA mang lại lợi ích cho việc chẩn đốn hỗ trợ máy tính, lưu trữ số giám sát chăm sóc sức khỏe [2] Các hệ thống CLSA có hai tác vụ nhận dạng/ 429 Hội nghị Quốc gia lần thứ 25 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2022) dụng đơn, đa ống nghe hay micrô điện tử Trong phần này, khái quát (i) kỹ thuật tiền xử lý tín hiệu, (ii) đặc trưng sử dụng hệ thống phân loại âm phổi (iii) phương pháp tăng cường liệu A Tiền xử lý tín hiệu Hình 1: Các bước xử lý hệ thống phân loại âm phổi điển hình phân loại chính: (i) phân loại tiếng phổi bất thường (adventitious lung sound classification - ALSC) phân loại bệnh hô hấp (respiratory disease classification - RDC) Phân loại tiếng phổi bất thường có nhiệm vụ: nhận dạng kiện bất thường tiếng phổi tiếng ran (crackles), tiếng khò khè (wheezes) hay loại tiếng phổi bất thường khác, nhận dạng tiếng phổi bình thường tiếng phổi bất thường [5]–[8] Phân loại bệnh hô hấp bao gồm loại khác phân loại hai nhóm gồm khỏe mạnh bệnh [4], hay phân loại ba nhóm gồm khỏe mạnh, bệnh mạn tính bệnh khơng mạn tính [5], [6], phân loại nhiều bệnh riêng biệt hen suyễn, bệnh tắc nghẽn phổi mạn tính, nhiễm trùng cấp tính đường hơ hấp dưới, ung thư phổi viêm phổi [9], [10] Các hệ thống đánh giá vài sở liệu không công khai tập liệu đa kênh [11] công khai sở liệu bệnh viện đại học Abdullah 2020 [12], HF_Lung_V1 [13] hay sở liệu truy cập mở phổ biến ICBHI 2017 [3] Trong báo này, tổng hợp cách hệ thống cho phân loại âm phổi minh họa Hình Âm phổi xử lý kỹ thuật xử lý tín hiệu tiền xử lý tín hiệu, trích xuất đặc trưng tăng cường liệu (xem Mục II) Các đặc trưng trích xuất đưa vào kiến trúc mạng nơ-ron xử lý với chế học khác để phân loại (xem Mục III) Như phần bổ sung báo này, báo tổng quan lý thuyết [2], [14] [5] cung cấp nhiều tham chiếu tài liệu tham khảo cho nội dung mô tả II XỬ LÝ DỮ LIỆU Các tín hiệu âm phổi ghi âm tín hiệu số Đặc điểm ghi âm phụ thuộc lớn vào thiết bị ghi âm sử ISBN 978-604-80-7468-5 Tín hiệu âm phổi thu cách sử dụng thiết bị ghi âm điều kiện khác nhau, chúng cần tiền xử lý để có đặc điểm Các bước tiền xử lý tín hiệu bao gồm: (i) lọc nhiễu, (ii) tái lấy mẫu tín hiệu, (iii) chuẩn hóa biên độ, (iv) phân đoạn điền đầy phân đoạn Tuy nhiên, có nhiều hệ thống phân loại âm phổi dùng phương pháp học sâu bỏ qua bước lọc nhiễu chuẩn hóa biên độ nhờ vào khả trích xuất đặc trưng bậc cao chuẩn hóa liệu kiến trúc mạng nơ-ron sâu (DNNs) [5], [15] Thêm vào có số hệ thống tách điền đầy thay đổi kích thước tín hiệu sau biến đổi sang dạng 2D kỹ thuật xử lý ảnh [16], thay xử lý với tín hiệu âm 1D 1) Lọc nhiễu: Thường áp dụng để loại bỏ thông tin không liên quan tiếng tim, nhiễu hay nhiễu gây thiết bị ghi âm Các lọc thông dải từ 15Hz đến 1800 Hz thường sử dụng hệ thống thông thường hệ thống sử dụng học sâu 2) Tái lấy mẫu: Tín hiệu âm phổi ghi âm với dải tần số lấy mẫu rộng [3] Vì tín hiệu phổi bất thường thường nằm dải kHz, tần số lấy mẫu kHz cao Để thuận tiện cho bước xử lý tần số lấy mẫu tất liệu thường phải giống 3) Chuẩn hóa biên độ: Thường sử dụng cho tín hiệu nhằm làm cho tín hiệu có giá trị nằm khoảng -1 đến Việc bù lại khác cường độ liệu thu thập từ nguồn khác mà đảm bảo giữ đặc điểm thống kê quan trọng âm hô hấp 4) Phân đoạn điền đầy phân đoạn: Các hệ thống phân loại tiếng phổi dựa học sâu sử dụng mơ hình mạng nơ-ron tích chập (Convolutional neural networks - CNNs) thường địi hỏi kích thước giống liệu đầu vào Thêm vào đó, tập liệu tiếng phổi có chu kỳ hơ hấp chiều dài đoạn ghi âm có độ dài khác Chính vậy, tín hiệu âm thường chia tách có khơng có trùng lặp (overlap) thành 430 Hội nghị Quốc gia lần thứ 25 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2022) phân đoạn với chiều dài cố định chúng cần điền đầy tín hiệu để đạt chiều dài Hiện nay, có nhiều phương pháp khác để thực điền đầy phân đoạn mẫu (zero padding [17]), điền đầy sử dụng mẫu ghi âm (sample padding) [5], hay điền đầy thông minh (smart padding) [18] Theo nghiên cứu [5], [18], hệ thống sử dụng sample padding smart padding có độ xác cao so với hệ thống sử dụng zero padding với thơng số cài đặt hệ thống B Trích xuất đặc trưng Trích xuất đặc trưng bước quan trọng thuật toán kỹ thuật nhận dạng mẫu (pattern recognition) phân loại Bước tăng cường thông tin cho việc phân loại Theo cách tiếp cận khác hệ thống phân loại âm phổi, phân chia theo hai hướng: (i) đặc trưng dành cho phân loại thông thường (conventional classifiers) (ii) đặc trưng biểu diễn 2D miền thời gian - tần số cho phương pháp học sâu 1) Đặc trưng dành cho phân loại thông thường: Báo cáo tổng quan [2] tổng hợp cách có hệ thống hệ thống phát phân loại tiếng phổi bất thường giới thiệu năm 1938 2016, hầu hết thuật toán dựa vào việc nhận dạng mẫu độ xác chúng phụ thuộc phần lớn vào đặc trưng trích xuất thủ cơng Cụ thể, phương pháp trích xuất đặc trưng sử dụng để tạo vector đặc trưng mà liệu nhóm phân bố gần không gian đặc trưng, đồng thời cực đại khoảng cách với liệu nhóm khác Tập hợp đặc trưng thủ công thường bao gồm đặc trưng trích xuất miền thời gian, miền tần số cepstral, đặc trưng spectral (cụ thể: tâm spectral, độ sáng, entropy, độ lệch kurtosis, flux), đặc trưng giai điệu (cụ thể: đỉnh sắc phổ), hệ số MFCCs - mel frequency cepstral coefficients, hệ số dự đoán tuyến tính (LPCs - linear prediction coefficients), hệ số cepstral dự đốn tuyến tính (LPCCs linear prediction cesptral coefficients) hay đặc trưng biến đổi wavelet rời rạc liên tục (DWT/CWT) Những đặc trưng tiếp tục khai thác số nghiên cứu gần đây) [8], [14], Bên cạnh đó, phương pháp việc lựa chọn đặc trưng áp dụng để loại bỏ ISBN 978-604-80-7468-5 đặc trưng không liên quan giữ lại đặc trưng có ý nghĩa trước đưa vào phân loại Nhờ hiệu suất phân loại cải thiện độ xác lẫn chi phí tính tốn 2) Biễu diễn 2D miền tần số - thời gian dành cho thuật toán học sâu: Hiện nay, loại biễu diễn 2D sử dụng spectrogram phép biến đổi Furier thời gian ngắn (short-time Furier transform - STFT), phép biến đổi số Q (constant - Q transform), phép biến đổi Stockwell (S-transform) scalogram phép biến đổi wavelet [5], [6], [18] Ngoài ra, lọc thiết kế - bắt chước theo hệ thống thính giác người - mel gammatone sử dụng nhằm tạo biểu diễn 2D mel spectrogram, gammatonegram hay MFCCs Các dải tần số lọc lựa chọn góp phần đáng kể việc giảm số lượng đặc trưng khung thời gian Bên cạnh phương pháp biến đổi này, phương pháp phân tích chế độ thực nghiệm - empirical mode decomposition (EMD) sử dụng để phân tích tín hiệu âm thành hàm chế độ nội - instrinsic mode functions (IMFs), chúng xử lý thêm sau để trở thành biễu diễn thị giác 2D tín hiệu [8], [9] Hiện nay, nhằm cung cấp thêm nhiều thông tin cho hệ thống phân loại âm phổi, nhiều đặc trưng thị giác 2D khai thác lúc Chúng nối với để tạo thành ma trận 2D [11] hay sử dụng đầu vào 2D cho hệ thống đa đầu vào DNNs [19], dùng làm liệu đầu vào cho hệ thống tổng hợp (ensemble) mơ hình DNNs sử dụng liệu đầu vào [15] C Phương pháp tăng cường liệu Các tập liệu âm phổi thường giới hạn số lượng bệnh nhân ghi âm Hơn nữa, nhóm liệu (ví dụ tiếng phổi bình thường, tiếng khị khè tiếng ran) tập liệu thường không cân Chính đặc điểm bất lợi làm cho việc đánh giá hiệu suất thuật toán bị thấp cao, khả tổng qt hóa mơ hình bị hạn chế Để khắc phục nhược điểm đó, phương pháp tăng cường liệu giải pháp phổ biến hiệu giới thiệu hệ thống phân loại âm phổi gần Phương pháp giúp cân liệu cho nhóm đặc biệt tăng cường tính đa dạng cho tập liệu dùng để huấn luyện mơ hình Chúng ta 431 Hội nghị Quốc gia lần thứ 25 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2022) chia kỹ thuật tăng cường liệu thành hai hướng chính: (i) miền thời gian, nghĩa tác động vào tín hiệu âm dạng tín hiệu 1D, (ii) miền thời gian - tần số, nghĩa tác động vào biểu diễn 2D tín hiệu 1) Miền thời gian: Các liệu cho tập huấn luyện tạo miền thời gian Cụ thể, phương pháp biến đổi thực tín hiệu âm kéo dài thời gian (time stretching) cách thay đổi tốc độ chiều dài tín hiệu mà khơng làm ảnh hưởng đến cao độ tín hiệu, dịch cao độ, dịch biên độ, điều chỉnh tốc độ, Ngoài ra, phương pháp smart padding [18] sử dụng cho mục đích tăng cường liệu 2) Miền thời gian - tần số: Các liệu cho tập huấn luyện tạo ta cách phổ biến sau Kỹ thuật xáo trộn chiều dài đường âm (Vocal tract length perturbation - VTLP), kỹ thuật phổ biến lĩnh vực nhận dạng giong nói (speech recognition) Nó áp dụng để tăng cường liệu cách tạo mẫu liệu 2D mel spectrogram thông qua việc làm thay đổi dải tần số lọc mel, nhờ khơng làm phá hủy thơng tin có ích liệu ban đầu [4], [5] Ngồi ra, tín hiệu âm chuyển đổi thành biểu diễn 2D nên xem ảnh 2D cho hệ thống thị giác máy tính, nên tăng cường liệu sử dụng phương pháp tương tự, cụ thể tăng cường liệu cách trộn liệu (mixup data augmentation), lật theo phương ngang phương thẳng đứng, xén ảnh ngẫu nhiên biến đổi màu sắc [5], [15], [18] Đặc biệt, dẫn xuất phương pháp mạng sáng tạo đối nghịch generative adversarial network (GAN) áp dụng cho spectrogram [7] Điều đáng lưu ý hạn chế tập liệu âm phổi nên vài kỹ thuật tăng cường liệu thường sử dụng kết hợp với nghiên cứu gần nhằm tạo tính đa dạng số lượng hữu hiệu liệu phục vụ cho việc huấn luyện mơ hình kiến trúc mạng III MƠ HÌNH HĨA DỮ LIỆU A Học máy Hai hướng sử dụng học máy hệ thống phân loại âm phổi: (i) phân loại thông thường dành cho đặc trưng trích xuất thủ cơng (ii) mạng nơ-ron sâu giới thiệu cụ thể sau: ISBN 978-604-80-7468-5 1) Bộ phân loại thông thường: Thường sử dụng kết hợp đặc trưng trích xuất thủ cơng hệ thống phân loại âm phổi Chúng tổng hợp [2] bao gồm thuật toán sau: Random forest (RF), Support vector machines (SVM), Multi-layer perceptrons (MLPs), k-nearest neighbors (k-NN), Gausian mixture models (GMMs), Decision tree, Bayes rulebased classifiers, Self organised map (SOM), Linear discriminant analysis (RF), K-mean clustering, Logistic regression 2) Kiến trúc học sâu: Thường sử dụng biểu diễn 2D giới thiệu Mục C làm liệu đầu vào Các kiến trúc mạng nơ-ron thực trích xuất đặc trưng bậc cao kết hợp với chức phân loại Một số kiến trúc mạng nơ-ron sử dụng sau: CNNs: tác vụ phân loại âm phổi bệnh hô hấp chủ yếu sử dụng kiến trúc mạng nơ-ron CNNs với đầu vào liệu 2D Mơ hình CNN thường khai thác cho đoạn âm phổi dài chu kỳ hít thở, tín hiệu âm chứa vài kiện âm bất thường Các mơ hình CNN sử dụng theo hai cách sau: • Mơ hình kiến trúc CNN tiêu chuẩn: nhiều kiến trúc khác CNNs báo cáo tập liệu hình ảnh lớn ImageNet - tái sử dụng cho hệ thống phân loại âm phổi, cụ thể VGGs, Resnets, AlexNets, InceptionNets, Googlenets hay Mobilenets Các mơ hình kiến trúc thường sử dụng cho hệ thống áp dụng học chuyển tiếp - transfer learning • Mơ hình kiến trúc CNN tùy biến: có số mơ hình kiến trúc CNN tự định nghĩa khai thác tập liệu âm phổi Bên cạnh đó, số mơ hình kiến trúc nhiều đầu vào CNN [19] hay sử dụng lớp pooling song song [20] sử dụng nhằm tận dụng hiệu biểu diễn đặc trưng khác Tuy nhiên, mơ hình kiến trúc thường cồng kềnh chi phí tính tốn cao Vì vậy, mơ hình kiến trúc CNN hiệu tài nguyên (resource - efficience CNNs) với mơ hình kiến trúc nhỏ CNN có trọng số nhẹ (lightweight CNNs) [9], lớp tích chập theo chiều sâu (depth-wise convolitional layers) hay lượng tử hóa trọng số mơ hình (weight quantization) [10] sử dụng Bên cạnh đó, CNNs 1D 432 Hội nghị Quốc gia lần thứ 25 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2022) sử dụng nghiên cứu [12] RNNs: Một số hệ thống phân loại âm phổi sử dụng phiên xuất khác mạng nơ-ron hồi qui mạng nơ-ron chứa đơn vị chức hồi quy có kiểm sốt (gated recurrent units GRUs), mạng nơ-ron có đơn vị nhớ ngắn hạn (long short-term memories - LSTMs) hay phiên hai chiều mở rộng chúng BiGRUs, BiLSTMs Mạng nơ-ron RNNs giải tác vụ liên quan đến phát hiện/phân loại kiện âm thâm phổi bất thường tác vụ phân loại âm phổi bất thường bệnh hơ hấp [7] Các thuật tốn lai: có vài hướng nghiên cứu sau • Mơ hình lai sử dụng mạng nơ-ron sâu: kết hợp mơ hình CNNs với phiên khác RNNs [12] hay chế đặc biệt tập hợp chuyên gia (mixture of experts - MoEs) [6] • Mơ hình học máy kết hợp: mơ hình phát triển thơng qua kết hợp học sâu hệ thống phân loại âm phổi thơng thường Ví dụ, đặc trưng thủ công đưa vào MLPs [11] Một hướng tiếp cận ngược lại khai thác, cụ thể phân loại thông thường sử dụng để phân loại cho đặc trưng huấn luyện từ kiến trúc CNNs (embedding) [20] • Ensembles: số hệ thống phân loại âm phổi sử dụng nhiều mơ hình khác phối hợp với gọi ensemble Nguyên tắc thuật toán ensemble cho phép dự đoán đầu phân loại kết hợp lại với nhằm cải thiện độ xác [6] Tuy nhiên, ứng dụng thực tế ensemble không lựa chọn thuật tốn địi hỏi nhu cầu tính tốn tài ngun tính tốn lớn B Cơ chế học Học chuyển tiếp - transfer learning: Học chuyển tiếp giải pháp hiệu việc cải thiện hiệu suất hệ thống phân loại âm đại Bởi hệ thống tiết kiệm thời gian sử dụng kiến thức huấn luyện hiệu từ tập liệu nguồn Cụ thể, cải thiện khả làm việc mơ hình thơng qua việc truyền kiến thức học từ số phần tất phần mơ hình DNNs huấn luyện trước tập ISBN 978-604-80-7468-5 liệu nguồn (ví dụ ImageNet, ICBHI 2017, Audio set) Khi sử dụng mơ hình cho tập liệu đích, có hai cách tiếp cận khác nhau: (i) kiến thức từ lớp mơ hình - phần biểu diễn mơ hình (representation part), khơng thay đổi suốt q trình huấn luyện tập liệu đích, ta nói trọng số phần biểu diễn mơ hình bị "đóng băng" Trong trường hợp này, học chuyển tiếp đóng vai trị trích xuất đặc trưng bậc cao [18], [19]; (ii) tất hay phần mơ hình huấn luyện hiệu chỉnh suốt trình huấn luyện tập liệu đích âm phổi [5] Trong nghiên cứu phân loại âm phổi gần sử dụng phương pháp học chuyển tiếp, mơ hình kiến trúc ResNets huấn luận tập liệu hình ảnh ImageNet sử dụng phổ biến Bên cạnh đó, phương pháp đồng hiệu chỉnh chuẩn hóa ngẫu nhiên phiên khác học chuyển tiếp khai thác cải thiện đáng kể hiệu suất hệ thống [5] Thêm vào đó, phương pháp chưng cất kiến thức (knowledge distillation), chế trò - thầy (student - teacher scheme) áp dụng cho phân loại bệnh hô hấp sử dụng [6] IV KẾT LUẬN Sự đời phương pháp học máy học sâu cải thiện hiệu suất hệ thống phân loại âm phổi đại sau (i) Các kiến trúc mạng nơ-ron sâu (DNNs) mạnh khai thác cách rộng rãi để trích xuất đặc trưng bậc cao (ii) Học chuyển tiếp (transfer learning) kỹ thuật hiệu việc giải hạn chế số lượng liệu tập liệu thông qua việc khai thác kiến thức học từ tập liệu hay khác lĩnh vực trước (iii) Kỹ thuật tăng cường liệu (data augmentation) ngày ứng dụng hệ thống phân loại âm nhằm cải thiện tính đa dạng số lượng liệu cân nhóm liệu tập liệu âm phổi Điều giúp giải tình trạng khớp (overfitting) kiến trúc mạng nơ-ron sâu Bài báo cung cấp nhìn đầy đủ nghiên cứu gần hệ thống phân loại âm phổi sử dụng phương pháp tính Có hai hướng tiếp cận quan trọng phân loại âm phổi bất thường bệnh hô hấp Chúng tơi tổng hợp phân loại cách có cấu trúc chủ đề từ xử lý liệu tiền xử lý tín hiệu âm 433 Hội nghị Quốc gia lần thứ 25 Điện tử, Truyền thông Cơng nghệ Thơng tin (REV-ECIT2022) thanh, trích xuất đặc trưng tăng cường liệu việc mô hình hóa liệu kiến trúc mạng nơ-ron chế học Song song với tiến gần khoa học kỹ thuật, thách thức đặt cho mơ hình phân loại âm phổi áp dụng chúng cho hệ thống chẩn đoán thực tế việc thiết lập lâm sàn gặp nhiều bất lợi nhiễu, chất lượng tín hiệu ko tốt Tuy nhiên, thấy việc kết hợp mạng nơ-ron sâu với phương pháp học chuyển tiếp tăng cường liệu mở nhiều đường đầy triển vọng cho hệ thống phân loại âm phổi TÀI LIỆU [1] M.T Barbosa et al., “The “big five” lung diseases in covid-19 pandemic–a google trends analysis,” Pulmonology, vol 27, no 1, pp 71–72, 2021 [2] R X A Pramono et al., “Automatic adventitious respiratory sound analysis: A systematic review,” PloS one, vol 12, no 5, p e0177926, 2017 [3] B M Rocha et al., “A respiratory sound database for the development of automated classification,” in Precision Medicine Powered by pHealth and Connected Health Springer, 2018, vol 66, pp 33–37 [4] M Aykanat et al., “Classification of lung sounds using convolutional neural networks,” EURASIP Journal on Image and Video Processing, vol 2017, no 1, pp 1–9, 2017 [5] T Nguyen and F Pernkopf, “Lung sound classification using co-tuning and stochastic normalization,” IEEE Transactions on Biomedical Engineering, 2022 [6] L Pham et al., “Cnn-moe based framework for classification of respiratory anomalies and lung disease detection,” IEEE journal of biomedical and health informatics, vol 25, no 8, pp 2938–2947, 2021 [7] K Kochetov and A Filchenkov, “Generative adversarial networks for respiratory sound augmentation,” in Proc of 2020 ICCRIS, 2020, pp 106–111 [8] S I Khan and R B Pachori, “Automated classification of lung sound signals based on empirical mode decomposition,” Expert Systems with Applications, vol 184, p 115456, 2021 [9] S B Shuvo et al., “A lightweight cnn model for detecting respiratory diseases from lung auscultation sounds using emd-cwt-based hybrid scalogram,” IEEE Journal of Biomedical and Health Informatics, 2020 ISBN 978-604-80-7468-5 [10] J Acharya and A Basu, “Deep neural network for respiratory sound classification in wearable devices enabled by patient specific model tuning,” IEEE trans on biomedical circuits and systems, vol 14, no 3, pp 535–544, 2020 [11] E Messner et al., “Multi-channel lung sound classification with convolutional recurrent neural networks,” Computers in Biology and Medicine, vol 122, p 103831, 2020 [12] M Fraiwan et al., “Recognition of pulmonary diseases from lung sounds using convolutional neural networks and long short-term memory,” Journal of Ambient Intelligence and Humanized Computing, pp 1–13, 2021 [13] F S Hsu et al., “Benchmarking of eight recurrent neural network variants for breath phase and adventitious sound detection on a self-developed openaccess lung sound database—hf_lung_v1,” PloS one, vol 16, no 7, p e0254134, 2021 [14] R X A Pramono et al., “Evaluation of features for classification of wheezes and normal respiratory sounds,” PloS one, vol 14, no 3, p e0213659, 2019 [15] L Pham et al., “Inception-based network and multi-spectrogram ensemble applied to predict respiratory anomalies and lung diseases,” in Proc 2021 EMBC IEEE, 2021, pp 253–256 [16] S Gupta et al., “Gammatonegram based triple classification of lung sounds using deep convolutional neural network with transfer learning,” Biomedical Signal Processing and Control, vol 70, p 102947, 2021 [17] S Y Jung et al., “Efficiently classifying lung sounds through depthwise separable cnn models with fused stft and mfcc features,” Diagnostics, vol 11, no 4, p 732, 2021 [18] S Gairola et al., “Respirenet: A deep neural network for accurately detecting abnormal lung sounds in limited data setting,” in Proc 2021 EMBC IEEE, 2021, pp 527–530 [19] T Nguyen and F Pernkopf, “Crackle detection in lung sounds using transfer learning and multiinput convolutional neural networks,” in Proc 2021 EMBC IEEE, 2021, pp 80–83 [20] F Demir et al., “Classification of lung sounds with cnn model using parallel pooling structure,” IEEE Access, vol 8, pp 105 376–105 383, 2020 434 ... DỮ LIỆU Các tín hiệu âm phổi ghi âm tín hiệu số Đặc điểm ghi âm phụ thuộc lớn vào thiết bị ghi âm sử ISBN 97 8-6 0 4-8 0-7 46 8-5 Tín hiệu âm phổi thu cách sử dụng thiết bị ghi âm điều kiện khác nhau,... đích âm phổi [5] Trong nghiên cứu phân loại âm phổi gần sử dụng phương pháp học chuyển tiếp, mơ hình kiến trúc ResNets huấn luận tập liệu hình ảnh ImageNet sử dụng phổ biến Bên cạnh đó, phương pháp. .. scheme) áp dụng cho phân loại bệnh hô hấp sử dụng [6] IV KẾT LUẬN Sự đời phương pháp học máy học sâu cải thiện hiệu suất hệ thống phân loại âm phổi đại sau (i) Các kiến trúc mạng nơ-ron sâu (DNNs)

Ngày đăng: 31/12/2022, 13:37

Tài liệu cùng người dùng

Tài liệu liên quan