1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)

66 50 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • LỜI CAM ĐOAN

  • LỜI CẢM ƠN

  • DANH MỤC CÁC THUẬT NGỮ VÀ CHỮ VIẾT TẮT

  • DANH MỤC CÁC BẢNG

  • DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ

  • MỞ ĐẦU

  • 1 TỔNG QUAN VỀ PHÁT HIỆN TIẾNG NGÁY

    • 1.1 Bài toán phát hiện tiếng ngáy 

      • 1.1.1 Các bệnh lý liên quan đến tiếng ngáy

      • 1.1.2 Phát biểu bài toán

      • 1.1.3 Ý nghĩa bài toán

    • 1.2 Các nghiên cứu liên quan

      • 1.2.1 Thiết bị phát hiện tiếng ngáy

      • 1.2.2 Mô hình học máy cổ điển trong phát hiện tiếng ngáy

      • 1.2.3 Mô hình học sâu phát hiện tiếng ngáy

      • 1.2.4 Đánh giá các nghiên cứu

    • 1.3 Kết luận chương

  • CHƯƠNG 2: PHƯƠNG PHÁP PHÁT HIỆN VÀ THEO DÕI TIẾNG NGÁY

    • 2.1 Phương pháp giải quyết bài toán

    • 2.2 Xử lý âm thanh

      • 2.2.1 Biến đổi Fourier (FT)

      • 2.2.2 Biến đổi Fourier thời gian ngắn (STFT)

      • 2.2.3 Phương pháp hệ số biểu diễn phổ của phổ (MFCC)

    • 2.3 Mô hình học nông

      • 2.3.1 Trích đặc trưng của âm thanh

      • 2.3.2 Mô hình học máy SVM

      • 2.3.3 Đánh giá mô hình học máy SVM

    • 2.4 Mô hình CNN cho phát hiện tiếng ngáy

      • 2.4.1 Kiến trúc mạng CNN

      • 2.4.2 Tích chập trong mạng neural

      • 2.4.3 Mô hình mạng CNN trong phát hiện tiếng ngáy

    • 2.5 Mô hình LSTM cho phát hiện tiếng ngáy

      • 2.5.1 Giới thiệu về mạng neural hồi quy

      • 2.5.2 Hồi quy trong mạng neural và mô hình LSTM

      • 2.5.3 Mô hình mạng LSTM trong phát hiện tiếng ngáy

    • 2.6 Mô hình CNN-LSTM cho phát hiện tiếng ngáy

    • 2.7 Kết luận chương

  • CHƯƠNG 3: THỬ NGHIỆM VÀ ĐÁNH GIÁ

    • 3.1 Thu thập dữ liệu

    • 3.2 Kết quả thử nghiệm

      • 3.2.1 Kết quả học nông SVM

      • 3.2.2 Kết quả của phương pháp CNN

      • 3.2.3 Kết quả của phương pháp LSTM

      • 3.2.4 Kết quả của phương pháp CNN-LSTM

    • 3.3 Phân tích và đánh giá

    • 3.4 Kết luận chương

  • KẾT LUẬN

  • DANH MỤC CÁC TÀI LIỆU THAM KHẢO

Nội dung

Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)Phát hiện tiếng ngáy dựa trên học sâu (Luận văn thạc sĩ)

1 HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - Bùi Thái Duy PHÁT HIỆN TIẾNG NGÁY DỰA TRÊN HỌC SÂU LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) HÀ NỘI- 2020 2 3 HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - Bùi Thái Duy PHÁT HIỆN TIẾNG NGÁY DỰA TRÊN HỌC SÂU CHUYÊN NGÀNH : HỆ THỐNG THÔNG TIN MÃ SỐ : 8.48.01.04 LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS PHẠM VĂN CƯỜNG HÀ NỘI- 2020 LỜI CAM ĐOAN Tôi Bùi Thái Duy, học viên lớp M18CQIS02 xin cam đoan báo cáo luận văn viết hướng dẫn thầy giáo PGS TS Phạm Văn Cường Trong toàn nội dung luận văn, điều trinh bày kết cá nhân kế thừa, tổng hợp từ nhiều nguồn tài liệu khác liệt kê danh mục tài liệu tham khảo rõ ràng Hà Nội, ngày tháng năm 2020 Học viên Bùi Thái Duy LỜI CẢM ƠN Lời đầu tiên, xin bày tỏ cảm ơn chân thành thầy giáo PGS.TS Phạm Văn Cường - Giáo viên hướng dẫn trực tiếp Thầy giúp tiếp cận kiến thức ứng dụng học máy học sâu cho tốn phát tiếng ngáy suốt q trình nghiên cứu hoàn thiện luận văn thạc sĩ kỹ thuật Tôi xin gửi lời cảm ơn tới thầy cô khoa Công nghệ Thông tin Học viện Bưu viễn thơng hướng dẫn, bảo tạo điều kiện cho học tập nghiên cứu trường suốt thời gian qua Xin gửi lời biết ơn đến gia đình, bạn học đồng nghiệp quan tâm, động viên, ủng hộ mặt tinh thần lẫn vật chất suốt thời gian thơi tham gia khóa học thực luận văn Học viên xin gửi lời cảm ơn hỗ trợ từ đề tài nghiên cứu độc lập cấp quốc gia “Nghiên cứu thiết kế, chế tạo hệ thống tự động trợ giúp theo dõi hô hấp vận động bất thường dựa tảng Internet vạn vật (IoT-Internet of Things) ” mã số ĐTĐLCN-16/18 Mặc dù cố gắng để hoàn thành luận văn chắn khơng thể tránh khỏi thiếu sót Kính mong nhận thông cảm bảo quý thầy cô Em xin trân trọng cảm ơn Hà Nội, ngày tháng năm 2020 Học viên thực luận văn Bùi Thái Duy MỤC LỤC DANH MỤC CÁC THUẬT NGỮ VÀ CHỮ VIẾT TẮT Viết tắt Tiếng Anh Tiếng Việt CNN Convolutional Neural network Mạng neural tích chập FFT Fast Fourier Transform Biến đổi Fourier nhanh FT Fourier transform Biến đổi Fourier LSTM Long short-term memory Mạng ghi nhớ hồi quy lâu MFCC Mel Frequency Cepstral Coefficients Recurrent Neural Network RNN Hệ số biểu diễn phổ phổ Mạng neural hồi quy STFT Short term fourier transform Phép biến đổi Fourier thời gian ngắn SVM Support Vector Machine Máy vector hỗ trợ DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ 10 MỞ ĐẦU Trong năm gần với phát triển khoa học kỹ thuật đặc biệt công nghệ thông tin mang lại nhiều hiệu khoa học hỗ trợ người sống Nhận dạng hoạt động người trình theo dõi phân tích hành vi người dùng nhằm nhận dạng/suy đoán hành động xảy Sự tiến công nghệ thúc đẩy cộng đồng nghiên cứu chuyển từ truyền, thu nhận xử lý liệu mức thấp sang nghiên cứu tích hợp thông tin mức cao, xử lý ngữ cảnh, nhận dạng suy diễn hoạt động Thêm vào đó, ngày có nhiều tốn thực tế cần giải pháp dựa vào nhận dạng hoạt động Ví dụ ứng dụng nhận dạng biển báo giao thông, nhận dạng âm người dùng Các ứng dụng giúp người sống hàng ngày cần công nghệ giám sát, phát hoạt động hỗ trợ người không tỉnh táo ngủ Hàng loạt ứng dụng nhà thông minh, theo dõi sức khỏe thời gian thực, phân tích chất lượng giấc ngủ phụ thuộc vào công nghệ nhận dạng hoạt động để cung cấp nhiều cách thức tương tác đa dạng, chủ động cung cấp dịch vụ, trợ giúp người dùng hồn thành cơng việc Bên cạnh tác động tới chất lượng giấc ngủ người ngáy có dấu hiệu chứng ngưng thở (OSA) sau ngủ, tỷ lệ mắc bệnh rối loạn giấc ngủ cao nhất, ảnh hưởng đến khoảng - 7% đàn ông trung niên 2-5% phụ nữ trung niên dân số nói chung OSA đặc trưng đợt lặp lặp lại khó khăn phần hồn tồn đường hơ hấp ngủ, gây trao đổi khí bị suy yếu rối loạn giấc ngủ Là tình trạng mãn tính gây tắc nghẽn đường hơ hấp ngủ, OSA dẫn đến tăng nguy mắc bệnh tim mạch mạch máu não Một phần thiếu điều trị thành cơng định vị vị trí tắc nghẽn rung Ngoài ra, tiếng ngáy cần xác định bốn nguồn rung động khác từ mẫu ngáy âm thanh: biểu mô, vách bên hầu họng, lưỡi màng Các đặc 52 CHƯƠNG 3: THỬ NGHIỆM VÀ ĐÁNH GIÁ Trong chương trình bày vấn đề: thu thập liệu tiếng ngày; thử nghiệm mơ hình CNN mơ hình hồi quy RNN phân tích âm qua đánh giá kiến trúc học sâu việc phát tiếng ngáy 3.1 Thu thập liệu Luận văn sử dụng liệu thử nghiệm từ người có tình trạng ngáy liệu tiếng ngáy thu thập Kaggle Quá trình gán nhãn cho tệp liệu gồm bạn tham gia, bạn gán nhãn bạn kiểm tra lại phần gán nhãn Hình 3.31 Một âm ngáy đánh nhãn Sau thực gán nhãn cho âm mẫu nhận chia thành tệp liệu khác biệt với gồm, tệp liệu huấn luyện tệp liệu kiểm thử theo tỉ lệ 90%, 10% Dữ liệu chia tệp đưa vào thực nghiệm cho kết trình bày phần 3.2 Tổng hợp tập liệu gán nhãn đầy đủ với lớp âm ngáy, không ngáy số lượng cụ thể thu sau trình gán nhãn âm ngáy mô tả bảng sau 53 Bảng 3.2 Thống kê liệu thực nghiệm Dữ liệu âm ngáy Thời gian ngáy Tổng thời gian Tỉ lệ tiếng ngáy/ tổng thời gian Ngáy 36 phút 40 phút 0.9 Ngáy 25 phút 30 phút 0.83 Dữ liệu Kaggle phút 16 phút Tổng cộng 69 phút 86 phút Với liệu thực nghiệm có đủ âm ngáy/ khơng ngáy từ người xuất tình trạng ngáy ngủ thêm vào có thêm liệu Kaggle lớp ngáy/ không ngáy thu thập trang mạng chia sẻ âm 3.2 Kết thử nghiệm Mơi trường thử nghiệm mơ hình học sâu tìm hiểu thơng qua Google Colab hay Colaboratory notebooks Google Colab cung cấp cho khả tính tốn mạnh với Tesla K80 GPU, thay phải code train model với máy tính, laptop cá nhân Google Colab hỗ trợ toàn diện thư viện python, phiên tensoflow, keras, PyTorch, Cv2 việc cài đặt mô hình 54 Hình 3.32 Mơi trường thực nghiệm Google Collab Trong mơi trường Collab Hình 3.2 ngơn ngữ sử dụng để cài đặt thực nghiệm ngôn ngữ lập trình python phân cấp để chạy phân vùng, kèm theo thích vùng Việc sử dụng Google Collab có đưa tùy chọn sử dụng CPU, GPU có sẵn Google Collab, kết nối tới tài nguyên máy tính Để đánh giá mơ hình luận văn sử dụng độ đo Precision Reall đó: TP: số âm tiếng ngáy mà mơ hình đốn tiếng ngáy FP: số âm tiếng ngáy mà mô hình đốn khơng phải tiếng ngáy FN: số âm khơng phải tiếng ngáy mà mơ hình dựa đoán tiếng ngáy Precision định nghĩa tỉ lệ số điểm TP số điểm phân loại chủ động mơ hình (TP+FP) với cơng thức (3.1) tính sau: (3.13) 55 Recall định nghĩa tỉ lệ số điểm TP số điểm thực mơ hình dự đốn (TP+FN) với cơng thức (3.2) tính sau: (3.14) Ngồi ra, hai độ đo khơng phải lúc tăng giảm tương ứng với nhau, có trường hợp Recall cao Precision thấp ngược lại, đánh giá tổng quát F-measure trung bình điều hịa độ với hệ số 0.5 (tầm quan trọng hệ số ngang nhau) tính với cơng thức (3.3) sau: (3.15) 3.2.1 Kết học nơng SVM Với mơ hình học nông SVM với tham số xác định chạy thực nghiệm tham số C gamma hai tham số quan trọng việc huấn luyện SVM C tham số toán khoảng cách mềm giúp đưa điểm liệu nằm khoảng hai siêu phẳng phân loại vào lớp chúng hay giúp kiếm soát lớp khác Khi C lớn mơ hình huấn luyện gần với với liệu tập đào tạo Điều đồng nghĩa với việc mơ hình bị vừa với liệu đào tạo tạo nên kết tốt với liệu dược đào tạo với liệu khác cần thực khơng có giá trị Vậy có quy luật rút ra: + C tăng, cho phép sai lệch giảm, thu khoảng cách tăng + C giảm, cho phép sai lệch tăng, thu khoảng cách giảm 56 Gamma tham số SVM mà tham số hàm kernel RBF Gamma ảnh hưởng tới mơ hình theo quy luật sau: + gamma tăng, cho phép sai lệch tăng, thu khoảng cách giảm + gamma giảm, cho phép sai lệch giảm, thu khoảng cách tăng Điều hoàn toàn trùng khớp với phần trình bày chương đặc điểm việc học máy cổ điển với SVM Dựa vào quy luật luận văn thử nghiệm với tham số C vào gamma có giá trị sau: clf = SVC(C=20.0, gamma=0.00001) Kết thực nghiệm SVM thu được: Bảng 3.3 Kết phương pháp học nông SVM SVM Acc (%) 0.724637681 Presion Recall F1 Tiếng ngáy 0.71559633 0.75 0.732394366 Không ngáy 0.734693878 0.699029126 0.71641791 Dựa bảng kết mơ hình SVM ta nhận thấy SVM tỉ lệ phát tiếng ngáy/ không ngáy gần Tỉ lệ xác khoảng gần 0.724 3.2.2 Kết phương pháp CNN Mơ hình học sâu với mạng mơ hình CNN lựa chọn phần 2.4 mơ hình mạng CNN phát tiếng ngáy 57 Kết thực nghiệm CNN thể sau Bảng 3.4 Kết mơ hình CNN CNN 0.768115942 Acc Presion Recall F1 Tiếng ngáy 0.689189189 0.980769231 0.80952381 Không ngáy 0.966101695 0.80952381 0.703703704 Mơ hình học CNN đánh giá mơ hình Hình 3.33 Thực nghiệm độ xác mơ hình CNN qua số lần epoch Thời gian mà mơ hình đào tạo hết tổng cộng 17 giây, kiểm tra độ xác đạt, 0.968 đạt điểm 0.12452 Dựa bảng kết mơ hình học sâu CNN, kết thực nghiệm, kết đo đánh giá mơ hình, kết huấn luyện mơ hình ta nhận thấy mơ hình mạng CNN có tỉ lệ xác vượt trội so với phương pháp học sâu với độ xác lên tới 0.768 Các độ đo độ xác phát âm ngáy 58 0.689 nhỏ nhiều so với việc phát âm khơng phải tiếng ngáy 0.9661 Điều chứng tỏ mơ hình mạng neural học sâu đưa kết tốt nhiều so với mơ hình phương pháp học máy bình thường mà phương phám học nông SVM Mạng CNN phát cho phát âm ngáy có kết cao phần mạng sử dụng mạng tích chập Cov1D thích hợp có đặc trưng thể tuyến tính theo thời gian đặc trưng qua lớp tích chập mơ hình thể rõ lớp 3.2.3 Kết phương pháp LSTM Mơ hình học sâu với mạng mơ hình LSTM lựa chọn phần 2.5 mơ hình mạng LSTM phát tiếng ngáy Kết thực nghiệm LSTM thể sau: Bảng 3.5 Kết mơ hình LSTM LSTM Acc (%) 0.753623188 Presion Recall F1 Tiếng ngáy 0.702290076 0.884615385 0.782978723 Khơng ngáy 0.842105263 0.621359223 0.715083799 Mơ hình học LSTM đánh giá mơ hình 59 Hình 3.34 Thực nghiệm độ xác mơ hình LSTM qua số lần epoch Thời gian mà mơ hình đào tạo hết tổng cộng 205 giây, kiểm tra độ xác đạt, 0.7635 đạt điểm : 0.466 Dựa bảng kết mô hình học sâu LSTM, kết thực nghiệm, kết đo đánh giá mơ hình, kết huấn luyện mơ hình ta nhận thấy mơ hình mạng LSTM có tỉ lệ xác vượt trội so với phương pháp học sâu với độ xác lên tới 0.7536 Các độ đo độ xác phát âm ngáy 0.7022 nhỏ nhiều so với việc phát âm khơng phải tiếng ngáy 0.8421 Điều chứng tỏ mơ hình mạng neural LSTM đưa kết tốt so với mơ hình phương pháp học máy bình thường mà phương phám học nông SVM không với mơ hình học sâu CNN Mạng LSTM phát cho phát âm ngáy có kết phần đặc điểm mơ hình mạng sử dụng liệu từ khứ để đoán kết dần cải thiện sau thời gian, nhận thấy rõ ràng Hình 3.4, mà độ xác mơ hình phát tiển từ từ khơng có bứt phá độ xác rõ ràng mạng CNN 60 3.2.4 Kết phương pháp CNN-LSTM Mơ hình học sâu với mạng mơ hình CNN-LSTM lựa chọn phần 2.6 mơ hình mạng CNN-LSTM phát tiếng ngáy Kết thực nghiệm CNN-LSTM thể sau: Bảng 3.6 Kết mơ hình CNN-LSTM CNN-LSTM Acc (%) 0.917874396 Presion Recall F1 Tiếng ngáy 0.871794872 0.980769231 0.923076923 Không ngáy 0.977777778 0.854368932 0.911917098 Mơ hình học CNN-LSTM đánh giá mơ hình Hình 3.35 Thực nghiệm độ xác mơ hình CNN-LSTM qua số lần epoch Dựa bảng kết mơ hình CNN-LSTM ta nhận thấy thời gian mà mơ hình đào tạo hết tổng cộng 52 giây, kiểm tra độ xác đạt, 0.9772 đạt điểm: 0.0489 61 Dựa bảng kết mô hình học sâu CNN-LSTM, kết thực nghiệm, kết đo đánh giá mơ hình, kết huấn luyện mơ hình ta nhận thấy mơ hình mạng CNN-LSTM có tỉ lệ xác vượt trội so với phương pháp học sâu với độ xác lên tới 0.9178 Các độ đo độ xác phát âm ngáy 0.8717 nhỏ so với việc phát âm khơng phải tiếng ngáy 0.9777 Điều chứng tỏ mơ hình mạng neural CNN -LSTM đưa kết tốt so với mơ hình phương pháp học máy bình thường mà phương phám học nông SVM không với mơ hình học sâu CNN, mạng học sâu LSTM Mạng CNN -LSTM phát cho phát âm ngáy có kết phần đặc điểm mơ hình mạng sử dụng liệu tích chập từ đặc trưng từ khứ để đoán kết dần cải thiện sau thời gian, nhận thấy rõ ràng Hình 3.5, mà độ xác mơ hình phát tiển từ từ có bứt phá độ xác rõ ràng, nhận thấy mơ hình đạt độ xác lớn từ epoch đầu qua lần sau tăng độ xác lên 3.3 Phân tích đánh giá Dựa vào kết đánh giá nhận thấy mạng học sâu cho kết phát âm ngáy tốt nhiều so với mạng học nông mà cụ thể SVM Độ xác, đánh giá qua độ đo nên phần kết thử nghiệm gồm Pression, Recall, F1-score thấy phương pháp có kết xếp từ thấp lên cao sau: Bảng 3.7 Độ xác mơ hình Mơ hình Độ xác 62 Mơ hình học nơng SVM 0.724637681 Mơ hình mạng CNN 0.768115942 Mơ hình mạng LSTM 0.753623188 Mơ hình mạng CNN-LSTM 0.917874396 Kết mơ hình thực nghiệm luận văn nhận thấy rằng, mơ hình mạng học sâu có kết tốt hẳn so với mơ hình mạng học nơng SVM, kết mơ hình mạng học sâu CNN-LSTM cho kết tốt nhất, nhờ có kết hợp ưu điểm mơ hình CNN LSTM điều có tương đồng với nghiên cứu phân lớp âm có liên quan Mơ hình CNN – LSTM khắc phục thiếu sót loại mơ hình sử dụng riêng rẽ mơ hình học sâu khác sở liệu chọn 3.4 Kết luận chương Trong chương trình bày vấn đề: thu thập liệu tiếng ngày; thử nghiệm mơ hình CNN mơ hình hồi quy RNN phân tích âm qua đánh giá kiến trúc học sâu việc phát tiếng ngáy Sau trình thử nghiệm với tập liệu cài đặt với mơ hình, phương pháp học máy khác thu kết tốt thuộc mơ hình mạng học sâu kết hợp CNN-LSTM với kết tốt nhiều so với phương pháp lại 63 KẾT LUẬN Nghiên cứu phát âm nói chung, tốn phát tiếng ngáy dựa học sâu nói riêng với tơi cơng nghệ mới, thời gian nghiên cứu cịn ngắn nên nhiều vấn đề chưa thực nắm bắt tốt Tuy nhiên, qua trình nghiên cứu, luận văn tìm hiểu sâu giai đoạn từ tiền xử lý liệu đến phướng pháp xử lý âm thanh, phương pháp học máy mà đặc biệt mơ hình học sâu với mạng neural, phương pháp học sâu để xây dựng mơ hình phân lớp liệu (mơ hình hình CNN, LSTM, CNN-LSTM) so sánh với mơ hình học nơng SVM Sử dụng mạng neural nói chung hay CNN, LSTM CNN-LSTM nói riêng học sâu hướng có kỹ thuật hiệu toán xử lý chuỗi trở thành xu nhà nghiên cứu Trong tương lai, luận văn phát triển nghiên cứu mơ hình khác, giải toán khác theo dõi, nhân diện âm thanh, phát triển thành ứng dụng y tế mà hỗ trợ cho nhiều người cộng đồng 64 DANH MỤC CÁC TÀI LIỆU THAM KHẢO [1] PGS.TS Lê Hữu Lập, Bài giảng Phương pháp nghiên cứu khoa học, Học viện Công nghệ BCVT [2] PGS.TS Từ Minh Phương, Giáo trình trí tuệ nhân tạo, Học viện Công nghệ BCVT [3] J Dennis, H D Tran, and H Li, “Spectrogram Image Feature for Sound Event Classification in Mismatched Conditions,” [4] Shawn Hershey, Sourish Chaudhuri, Daniel P W Ellis, Jort F Gemmeke, Aren Jansen, R Channing Moore, Manoj Plakal, Devin Platt, Rif A Saurous, Bryan Seybold, Malcolm Slaney, Ron J Weiss, Kevin Wilson, Cnn architectures for largescale audio classification , [5] Shahin Amiriparian, Maurice Gerczuk, Sandra Ottl, Nicholas Cummins, Michael Freitag, Sergey Pugachevskiy, Alice Baird, Björn Schulle, Snore Sound Classification Using Image-based Deep Spectrum Features , [6] Jonathan William DennisPublished, (2014), Sound Event Recognition in Unstructured Environments using Spectrogram Image Processing, [7] Zixing Zhang, ,Snore-GANs: Improving Automatic Snore Sound Classification with Synthesized Data [8] Alex Krizhevsky , Ilya Sutskever , Geoffrey E Hinton ImageNet Classification with Deep Convolutional Neural Networks, [9] Janott, Christoph & Schmitt, Maximilian & Zhang, Yue & Qian, Kun & Pandit, Vedhas & Zhang, Zixing & Heiser, Clemens & Hohenhorst, Winfried & Herzog, Michael & Hemmert, Werner & Schuller, Björn (2018) Snoring classified: The Munich-Passau Snore Sound Corpus [10] Van Dongen HP, Maislin G, Mullington JM, Dinges DF The cumulative cost of additional wakefulness: dose-response effects on neurobehavioral functions and sleep physiology from chronic sleep restriction and total sleep deprivation 65 [11] Thorpy MJ (1990), Classification of sleep disorders J Clin Neurophysiol [12] Shin, H., Cho, J Unconstrained snoring detection using a smartphone during ordinary sleep BioMed Eng OnLine 13, 116 (2014) [13] F Dalmasso, R Prota, Snoring: Analysis,Measurement, Clinical Implications and Applications, European Respiratory Journal [,14] Weng, Chih-Wen & Lin, Cheng Yuan & Jang, Jyh-Shing (2004) Music Instrument Identification Using MFCC: Erhu as an Example [15] Kang, Bingbing & Dang, Xin & Wei, Ran (2017) Snoring and apnea detection based on hybrid neural networks 57-60 10.1109/ICOT.2017.8336088 [16] Khan, Tareq Hasan (2019) A Deep Learning Model for Snoring Detection and Vibration Notification Using a Smart Wearable Gadget Electronics [17] Cavusoglu, Mustafa & Poets, Christian & Urschitz, Michael (2017) Acoustics of snoring and automatic snore sound detection in children Physiological Measurement [18] Zhang, Zixing & Han, Jing & Qian, Kun & Janott, Christoph & Guo, Yanan & Schuller, Björn (2020) Snore-GANs: Improving Automatic Snore Sound Classification With Synthesized Data IEEE Journal of Biomedical and Health Informatics 24 300-310 10.1109/JBHI.2019.2907286 [19] Kim, T., Kim, J & Lee, K (2018) Detection of sleep disordered breathing severity using acoustic biomarker and machine learning techniques BioMed Eng OnLine 17, 16 [20] Cavusoglu, M & Kamasak, Mustafa & Eroğul, O & Çiloglu, Tolga & Serinagaoglu Dogrusoz, Yesim & Akcam, T (2007) An efficient method for snore/nonsnore classification of sleep sounds Physiological measurement [21] Jason Brownlee (2017), Long Short-Term Memory Networks With Python [22] Yang, Yang & Zheng, Xiangwei & Yuan, Feng (2018) A Study on Automatic Sleep Stage Classification Based on CNN-LSTM ICCSE'18: 66 Proceedings of the 3rd International Conference on Crowd Science and Engineering 1-5 10.1145/3265689.3265693 [23] Adrien Ycart and Emmanouil Benetos “A study on LSTM networks for polyphonic music sequence modelling”, 18th International Society for Music Information Retrieval Conference, Suzhou, China, 2017 [24] Kons, Zvi & Toledo-Ronen, Orith (2013) Audio event classification using deep neural networks Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH 1482-1486 ... toán phát tiếng ngáy dựa học sâu nhằm phát âm tiếng ngáy từ phân tích chất lượng giấc ngủ Phát tiếng ngáy dựa học sâu sử dụng mơ hình mạng neural tích chập (CNN) để phát phân tích đặc trưng tiếng. .. thực hiện, kế thừa, cải tiến từ nghiên cứu trước Bài toán ? ?Phát tiếng ngáy dựa học sâu? ?? phát triển dựa nghiên cứu liên quan sau 1.2.1 Thiết bị phát tiếng ngáy Trước đây, nghiên cứu phát hiện, ... thơng qua phương pháp học sâu. để đưa thơng tin đầu sau xử lý âm thuộc lớp tiếng ngáy hay tiếng ngáy 15 1.1.3 Ý nghĩa toán Dựa vào kết luận văn ? ?Phát tiếng ngáy dựa học sâu? ?? có nhìn tổng quan

Ngày đăng: 30/07/2020, 20:24

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w