tiểu luận môn học xử lý tiếng nói

28 12 0
tiểu luận môn học xử lý tiếng nói

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ỦY BAN NHÂN DÂN TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC SÀI GỊN Trịnh Cơng Vinh MSV: 3117500067 Nhóm: 01 TIỂU LUẬN MƠN HỌC XỬ LÝ TIẾNG NĨI NGÀNH: KỸ THUẬT ĐIỆN TỬ - TRUYỀN THƠNG TRÌNH ĐỘ ĐÀO TẠO: ĐẠI HỌC TP HỒ CHÍ MINH, THÁNG NĂM 2021 ỦY BAN NHÂN DÂN TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC SÀI GÕN Trịnh Cơng Vinh MSV:3117500067 Nhóm: 01 TIỂU LUẬN MƠN HỌC XỬ LÝ TIẾNG NĨI Giảng viên chấm thi Ngày tháng năm 2021 Ngày GV chấm Điểm số Điểm chữ Ý kiến Ký tên (Họ Tên) Bùi Cơng Giao TP HỒ CHÍ MINH, THÁNG NĂM 2021 tháng năm 2021 GV chấm LỜI CAM ĐOAN Em xin cam đoan tiểu luận “Xử lý tiếng nói” cơng trình nghiên cứu em Em xin hồn tồn chịu trách nhiệm tính trung thực nội dung khác đề tài TP HCM, ngày…tháng…năm…… Tác giả đề tài Trịnh Công Vinh Câu 1: Hệ thống thính giác ngoại vi Các yếu tố vật lý hệ thống thính giác người (hệ thống thính giác ngoại vi) thể Hình 5.1 Hình 5.1: Hệ thống thính giác ngoại vi - Vành tai: thường gọi "tai" bao gồm vạt da với sụn có hình dạng cụ thể bêncủa người đứng đầu Loa tai tạo thành gọi "tai ngoài" với ống tai Loa tai tạo hình đặc biệt để định hướng sóng âm vào ống tai hướng phần cịn lại ngoại vi Nó đóng vai trị quan trọng đóng vai trị việc cung cấp dấu hiệu vị trí âm hai tai đơn âm khác biệt đáng kể độ lớn cảm nhận âm sắc âm tùy thuộc vào vị trí hướng nguồn - Ống Tai: ống rỗng liên kết màng nhĩ với loa tai Mặc dù sinh lý ống tai người khác đáng kể, kích thước ống tai điển hình cho cộng hưởng khoảng 2–5kHz nhấn mạnh đáng kể dải tần số - Màng Nhĩ: màng kéo dài qua phần cuối ống tai (nó cịn gọi màng nhĩ) Nó rung qua dải tần số nghe người truyền rung động qua ossicles đến ốc tai qua cửa sổ hình bầu dục - Xương ống (Malleus, Incus Stapes): ba xương nhỏ liên kết với màng nhĩ, gây rung động màng tym khuếch đại rung động trước truyền đến cửa sổ hình bầu dục ốc tai Chúng truyền âm truyền qua không khí, sóng chắn khiến màng nhĩ truyền rung động đến sóng áp suất âm truyền chất lỏng ốc tai - Cửa sổ Bầu dục: màng lối vào ốc tai Các ossicles rung cửa sổ hình bầu dục truyền lượng âm đến sở màng chất lỏng bên ốc tai - Màng (BM): xương phân chia hình xoắn ốc ốc tai Nó hoạt động máy phân tích phổ logarit, phân chia vật lý cô lập thành phần tần số rung động đầu vào đến vị trí vật lý khác dọc theo chiều dài Các tế bào thần kinh thính giác kết nối với các loại tế bào có lơng (trong ngồi) gắn vào màng đệm mem đáy Do đó, rung động màng đáy truyền tới trung tâm cao đường thần kinh thính giác thơng qua tế bào lông  Màng (BM): Màng đáy hẹp cứng đáy gần đỉnh rộng cứng Biên độ cực đại dao động dọc theo BM phụ thuộc vào tần số âm nghe Tần số cao có biên độ đỉnh gần sở, tần số thấp có biên độ đỉnh gần đỉnh Do đó, vật lý BM ốc tai coi tập hợp lọc thông dải Chuyển động BM truyền tới stereocilia Các stereocilia bó tóc gắn đỉnh tế bào lông Điều dẫn đến hoạt động tế bào thần kinh thính giác ngoại vi Phản ứng vật lý BM theo khoảng cách tần số minh họa Hình 5.4 5.5 Hình 5.2 cho thấy mặt cắt bên ốc tai lấy từ Grey’s giải phẫu học [7] Hình cho thấy màng đáy đường ngang Phía BM, bốn hàng tế bào lơng thính giác hiển thị Bốn hàng ngăn cách thành hàng tế bào thính giác gọi lông tế bào ba hàng tế bào lơng thính giác gọi tế bào lơng ngồi Những tế bào lông khác chế thính giác ốc tai để hoạt động dải động lớn khoảng 100dB Ốc tai người có khoảng 3.500 tế bào lơng bên 12.000 tế bào lơng ngồi lúc sinh [2]  Đường dẫn thính giác: HÌNH 5.2: Cơ quan Corti: Lấy từ Giải phẫu Grey 913 [7] (Cơng cộng Hình ảnh miền) Hình 5.3 cho thấy đường dẫn âm từ ốc tai đến mức cao trung tâm xử lý thính giác não Những điểm cần lưu ý điều sơ đồ đường thính giác theo hai hướng, tức từ ốc tai đến vỏ não thính giác từ vỏ thính giác đến ốc tai Việc lựa chọn 16bits để thể mẫu đĩa CD âm hiểu phần bối cảnh Với SNR bit cung cấp (2.46), SNR đĩa CD âm khoảng 16 × =96 dB, gần với dải động 100dBs thính giác người Những câu chuyện thính giác thảo luận phần sau chương nên xem xét bối cảnh kết nối tiến lùi Ngồi ra, chuỗi xử lý thính giác trái phải liên kết với Các liên kết cung cấp viện trợ để cân số trường hợp chế thơng qua địa hóa ba chiều giả định ban hành Câu 2: Bộ lọc thính giác: Giới thiệu Phân tích tần số phân tách tín hiệu âm yếu tố then chốt khả di chuyển nhiều ứng dụng thảo luận sách (đối với ví dụ: nén, nhận dạng giọng nói, mã hóa giọng nói, v.v.) Như nhiều phương pháp hiệu ứng dụng cố gắng bắt chước khía cạnh hệ thống âm người, đánh giá cách thức người (và động vật có vú) cảm nhận tần số âm điều cần thiết để loại bỏ hiểu ứng dụng Đối với ứng dụng phân tích giọng nói như nhiệm vụ nhận dạng, thường hiệu để cô lập mô tả đặc điểm bao quang phổ phần âm thời gian nhỏ Điều có tìm thấy phần lớn trường hợp ý nghĩa ngữ nghĩa lời nói khơng phụ thuộc chứa cao độ thành phần kích thích tín hiệu lời nói Các phương pháp đặc trưng cho vùng bao quang phổ ngắn hạn bao gồm Biến đổi Fourier Ngắn hạn (STFT-chúng triển khai thường xuyên nhấting windowed FFT) Mã hóa dự đốn tuyến tính (LPC) Trong lịch sử đạt đặc tính phân tích cách sử dụng ngân hàng chồng chéo lọc thông dải Cấu trúc tập hợp lọc thông dải (được gọi quan trọng ban nhạc) quan điểm đồng thuận phân tích tần số người / nghe- chế ing khám phá chi tiết chương Hình 5.3: Các đường dẫn âm liên kết tai trái tai phải với thính giác vỏ não (kết nối tiến lùi) Câu 3: Các dải quan trọng: Các dải tần quan trọng thính giác định nghĩa dải tần âm giai điệu che cản trở nhận thức giai điệu khác thông qua chế che giấu thính giác khác Các hiểu sử dụng dải quan trọng chìa khóa cho việc triển khai xử lý âm dựa tần số cảm nhận sử dụng ứng dụng nén băng thơng rộng (ví dụ: nén MP3) Để hiểu miền âm tần số tri giác, cần phải luận để hiểu gọi mô hình biến đổi tần số-vị trí Mơ hình giả thuyết tần số âm liên quan đến địa điểm cụ thể ốc tai người cụ thể vị trí dọc theo ghi nhớ brane (BM) Một sóng âm vào tai có đặc điểm rung truyền đến cửa sổ bầu dục thông qua rung động màng nhĩ ossicles (thể Hình 5.1 ) Sự rung động cửa sổ hình bầu dục sau gây rung động BM cuộn (cũng thể Hình 5.1 cuộn cấu trúc xoắn ốc) Đối với âm thuần, độ lớn dao động lớn BM đặt vị trí vật lý cụ thể dọc theo BM (vị trí xếp gọn gàng tần số âm) Như khoảng cách từ cửa sổ hình bầu dục tăng lên, chiều rộng BM tăng lên ngược lại độ cứng giảm Ảnh hưởng đặc điểm vật lý tần số cao có biên độ đỉnh dọc theo BM gần với cửa sổ hình bầu dục đinh ghim (và ngược lại, có cửa sổ hình bầu dục xa cửa sổ hình bầu dục hướng đỉnh BM cho tần số thấp hơn) Khi đến gần vị trí dịch chuyển cực đại sóng chậm lại, đạt đến đỉnh (tại vị trí cho) sau nhanh chóng phân hủy dọc theo chiều dài cịn lại BM Hình minh họa phản hồi đơn dọc theo BM cho âm tần số 200Hz thể Hình 5.4 Bốn đồ thị hình cho thấy dịch chuyển BM biên độ bốn thời điểm gần (với phản ứng biên độ hiển thị đường chấm) Đáp ứng biên độ dọc theo BM đến tám âm trung tâm tần số 25, 50, 100, 200, 400, 800 1600Hz hiển thị Khoảng cách từ cửa sổ hình bầu dục (mm) Hình 5.4: Đáp ứng dịch chuyển BM âm 200Hz ( trục x khoảng cách dọc theo BM trục y độ dời) Bốn đồ thị cho thấy dịch chuyển bốn thời điểm gần Tái với cho phép: Từ G Von Békésy Thử nghiệm thính giác McGraw-Hill loạt Tâm lý học McGraw-Hill, 1960 Bản quyền 1960, Acoustic Society of Châu Mỹ [19] Hình 5.5 Điều cho thấy giai điệu túy, biên độ tối đa rung động BM nằm vị trí cụ thể tương ứng với tần số Đối với giai điệu phức tạp hơn, thành phần hài mặt vật lý kích thích vị trí đặt dọc BM theo cấu trúc sóng hài (và độ lớn âm thanh) Cơ chế phân tách tần số vật lý này, đó, đại diện cho chuyển đổi tần số đến địa điểm tương tự ngân hàng lọc thông dải chồng chéo phân tách tần số tương tự từ góc độ xử lý tín hiệu Ngồi ra, minh họa Hình 5.4 5.5, dải thơng "bộ lọc BM" vật lý trước hết phi tuyến tính, thứ hai khơng đối xứng cuối có băng thông không đồng với băng thông tăng theo tần suất ngày tăng Các bang thông BM băng thơng chúng nằm trong- gọi "băng tần quan trọng" "băng thơng quan trọng" Nó có thành phần tần số tín hiệu âm đủ tách biệt chúng mã hóa riêng biệt hệ thống thính giác với bộ lọc thính giác Tuy nhiên, cần lưu ý nhận thức cao độ nhiều phức tạp “lý thuyết địa điểm” đơn giản (tức lý thuyết mà ception cao độ tương ứng với vị trí đặt BM) Hơn nữa, "Lý thuyết vị trí" đưa minh họa tốt cách HAS có dải biến đổi- độ rộng ảnh hưởng với tần số Nguyên tắc chung lưu vô số thử nghiệm phép đo thực nghiệm cố gắng tạo mơ hình băng thơng lọc thính giác nhưng hình dạng thực tế chúng (xem bên dưới) HÌNH 5.5: Biên độ dịch chuyển màng đáy tám tông màu sáng Tái với cho phép Người gửi: G Von Békésy Thử nghiệm Thính giác Bộ truyện McGraw-Hill Tâm lý học McGraw-Hill, 1960 Bản quyền Hiệp hội Âm Hoa Kỳ [19] Câu 4: Mơ hình dải quan trọng:  Đo băng thơng tới hạn Fletcher: Fletcher [4] cố gắng đo độ rộng dải quan trọng âm thử lọc cách sử dụng âm thử nghiệm tiếng ồn băng rộng đồng vị trí (như minh họa Hình 5.6) Ngưỡng cảm nhận giai điệu thử nghiệm đo diện nhiễu băng thông rộng Tiếng ồn băng thông đặt tập trung vào giai điệu thử nghiệm Băng thông thay đổi minh họa Hình 5.7 dẫn đến ngưỡng cảm nhận âm thử nghiệm cho băng thông nhiễu Các kết cho thấy băng thơng tiếng ồn băng rộng tăng lên, cường độ (ngưỡng cảm nhận) giai điệu đồng vị trí lên đến điểm định (của ∆ f) Quá thời điểm này, ngưỡng không tăng ổn định giá trị Tồn thí nghiệm lặp lại cho tần số âm khác cho kết Hình 5.8 Con số thực từ việc lặp lại thí nghiệm tương tự Schooneveldt Moore [6] vào năm 1987 Hình cho thấy rõ ràng ngưỡng tăng băng thông nhiễu tăng lên đến băng thông quan trọng 400Hz sau khơng đổi sau HÌNH 5.6: Thí nghiệm "băng thông quan trọng" nhiễu băng rộng Fletcher [4] HÌNH 5.7: Hình minh họa thí nghiệm Fletcher [4] HÌNH 5.10: Thang đo Mel hiển thị (5.4) tạo mã Danh sách 5.2 Listing 5.2: Mã Matlab để tạo thang đo Mel Hình 5.10  Đo hình dạng lọc thính giác Nhiều thí nghiệm khác tiến hành để thu hình dạng lọc thính giác [9, 11, 12, 13] Một nỗ lực ban đầu đáng kể để mơ tả đặc điểm đo hình dạng lọc thính giác thực Patterson [12] Mẫu- Son tiến hành số thử nghiệm cách sử dụng giai điệu thử nghiệm cố định mức cao nhiễu băng thông rộng thông thấp băng thơng thay đổi Tín hiệu mặt nạ chọn nhiễu băng rộng, dạng tín hiệu hình sin tín hiệu nhiễu băng hẹp tìm thấy để cung cấp cho đồ tạo tác thời gian (ví dụ, đập hình sin) [11] hình 5.11 cho thấy minh họa thí nghiệm với nhiễu thông thấp (lấy từ Patterson [12]) Đầu tiên, mục đích thử nghiệm để tìm ngưỡng phát âm kiểm tra (được hiển thị dạng đường thẳng đứng hình) Tiếng ồn thơng thấp sau thay đổi băng thơng (từ DC đến tần số cắt cho trước) Điều phản ánh tham số ∆ f hiển thị hình cho biết khoảng cách cạnh tiếng ồn giọng điệu Sử dụng gọi "mơ hình phổ cơng suất", khu vực chồng chéo nhiễu lọc (nghĩa tích hợp sản phẩm nhiễu chức lọc) có liên quan trực tiếp đến ngưỡng phát giai điệu thử nghiệm Mơ hình chồng chéo Patterson [12] xây dựng sau: Trong đó: P s cơng suất tín hiệu ngưỡng cảm nhận, K số, H (f ) hàm truyền phản ứng lọc thính giác N ( f ) phổ công suất che tiếng ồn băng rộng Rõ ràng, băng thông rộng tiếng ồn lọc tiếng ồn thông 11 thấp lý tưởng với mức cắt rõ nét tần số W (như mơ tả Hình 5.11) (5.5) đơn giản hóa thành: Trong đó: N0 giá trị hàm nhiễu thông thấp N ( f ) ngưỡng giới hạn Mức phổ tiếng ồn giữ không đổi 40dB tất thiết bị Patterson thử nghiệm ngưỡng giới hạn khác giá trị ngưỡng thử nghiệm giai điệu đo Kết thể Hình 5.11 5.12 cho thông thấp nhiễu thông cao, tương ứng Năm biểu đồ hiển thị hình Các biểu đồ hiển thị kết thử nghiệm ngưỡng cho tần số âm thử nghiệmcies {0,5, 1, 2, 8} kHz Bốn kết luận từ thí nghiệm là: • Các băng thơng lọc tăng lên theo tần số trung tâm âm thử • Các lọc khơng phải “Q không đổi”, tức là, tỷ lệ băng thông lọc thành tần số trung tâm số (nó tăng dần theo tần số) • Các lọc gần đối xứng • Tỷ lệ suy giảm váy lọc cao Một hàm đa thức bậc bảy trang bị cho đường cong phân biệt mặt phân tích Một biểu thức đơn giản dẫn xuất sử dụng để có định nghĩa đơn giản lọc thính giác đưa Cơng thức (5.7): f tần số trung tâm lọc α độ chọn lọc lọc, tức là, giá trị tăng chiều rộng lọc Hình 5.13 cho thấy đồ thị | H (f) |2 so với tần số giá trị khác α Hình cho thấy chất hình chng đối xứng lọc 1,29 α băng thông dB (BW) lọc Sử dụng phần tích hợp lọc 12 HÌNH 5.11: Kết thí nghiệm ngưỡng nhiễu dải tần thấp, dải rộng tiếng ồn Tái với cho phép Người gửi: RD Patterson Hình dạng lọc thính giác J Acoust Soc Am, trang 802-809, 1974 Bản quyền 1974, Hiệp hội âm Châu Mỹ [12] HÌNH 5.12: Kết thí nghiệm ngưỡng nhiễu dải cao, dải rộng tiếng ồn Tái với cho phép Người gửi: RD Patterson Hình dạng lọc thính giác J Acoust Soc Am., trang 802809, 1974 Bản quyền 1974, Hiệp hội âm Châu Mỹ [12] 13 HÌNH 5.13: Mơ hình lọc thính giác đối xứng Patterson đề xuất [12] (sử dụng ba giá trị α {20, 50, 80}) cho thấy băng thông lọc tăng α tăng (từ Công thức (5.7)) Được tạo từ Liệt kê 5.3 chức năng, đường cong kết trang bị gần xác với đường cong hiển thị Hình 5.11 5.12 Sự thay đổi băng thông dB (BW) với tần số gần phương trình (Patterson [12]) Listing 5.3: Mã Matlab để tạo Hình 5.13:  Thí nghiệm tiếng ồn có khía: Patterson [13] cơng nhận cố gắng có hình dạng lọc thính giác từ Cơng thức (5.6) đưa giả định khơng hợp lệ lọc thính giác tập trung tần số nghe (các tượng lọc thính giác khơng tập trung tần số nghe gọi “tắt trung tâm lắng nghe”) Để tạo hình dạng lọc thính giác mà khơng có giới hạn giả định, "thí nghiệm tiếng ồn có khía" sử dụng Đối với hình dạng cố định chức truyền lọc thính giác H (f) nhiễu thơng thấp từ đến f c - ∆ f nhiễu thông cao từ f c + ∆ f đến ∞ Phương trình (5.5) trở thành: K số, N mức tiếng ồn, tiếng ồn che có khía có chiều rộng 2∆ f có tâm f c Do P s đại diện cho khu vực giao lọc tiếng ồn 14 thính giác (tức là, vùng giao tơ bóng cho hai lọc thính giác minh họa Hình 5.14) Các thí nghiệm tiếng ồn có khía tạo để khắc phục giả định lọc thính giác phân tích tần số kiểm tra (âm kiểm tra phương pháp khác) Hình 5.14 minh họa lọc thính giác khơng âm kiểm tra, sau giao điểm lọc nhiễu khía (tức là, khu vực giao với phần cao thấp tiếng ồn) cho giá trị P s (5.9) gần khơng đổi Điều khơng trường hợp cho thí nghiệm thơng cao thơng thấp riêng biệt minh họa Hình 5.11 5.12 Sự khác biệt lớn băng thông hình dạng lọc kết cách sử dụng nhiễu có khía thử nghiệm so với phương pháp ngây thơ trước Hiệu ứng "nghe trung tâm" đáng kể [11] Kết việc sử dụng thí nghiệm nhiễu có khía dẫn đến việc cập nhật Phương trình (5.8) Patterson [13]: 15 HÌNH 5.14: Chứng minh thí nghiệm tiếng ồn có khía Trên cùng: Thơng thấp đơn thí nghiệm tiếng ồn (tương tự Hình 5.11) Giữa: Trong thí nghiệm vậy, lọc không tập trung xung quanh âm thử nghiệm, vùng bóng mờ giao diện lọc nhiễu khơng dẫn đến mơ hình xác Dưới cùng: Đối với "lắng nghe trung tâm", tổng hợp vùng tơ bóng xấp xỉ- gần không đổi Được vẽ lại với cho phép Người gửi: RD Patterson Thính giác lọc hình dạng có nguồn gốc từ kích thích nhiễu J Acoust Soc Am., trang 640-654, 1976 [13] tức là, thay đổi băng thông với tần số gần với mơ hình (5.8), với băng thơng thực tế tương đối lớn  Bộ lọc RoEx: Các thử nghiệm lọc khía cạnh Patterson [13] dẫn đến cập nhật đáng kể băng thơng lọc thính giác đo (nghĩa từ (5.8) đến (5.10)) Tuy nhiên thí nghiệm Moore Glasnery cho thấy mô hình lọc thính giác xấp xỉ Ro unded Ex ponential lọc (được định nghĩa lọc RoEx) Một lọc RoEx tham số xác định sau: Trong đó: • p tham số điều khiển • f tần số trung tâm lọc • f biến tần số độc lập • g = tần số chuẩn hóa = | f - f | / f Hình 5.15 cho thấy ba lọc RoEx f = {500, 1000 2000} Hz tính tốn từ Cơng thức (5.11) Để cải thiện độ xác mơ hình lọc RoEx để phù hợp với thử nghiệmdữ liệu tinh thần phiên linh hoạt với hai tham số kiểm soát used (RoEx (p, r)) định nghĩa sau: Các lọc RoEx thử nghiệm tiếng ồn có khía đối xứng gần có bất đối xứng đáng kể lọc thính giác tần số trung tâm tăng lên (hình dạng lọc ngày bị lệch tần số trung tâm tăng lên) Tính linh hoạt bổ sung tạo cho bất kỳ- mơ hình số liệu cách sử dụng lọc RoEx riêng biệt cho vùng lọc thấp tần số trung tâm  Băng thơng hình chữ nhật tương đương: ERBs Băng thơng hình chữ nhật tương đương định nghĩa băng thơng hình vng lọc đồng tâm với lọc thính giác thực tế có chiều cao tổng diện tích (tức hai có lượng nhau) Định nghĩa minh họa Hình 5.16 Định nghĩa ERB dạng khác lọc RoEx 16 HÌNH 5.15: Ba lọc RoEx với băng thơng hình chữ nhật tương đương HÌNH 5.16: Dây đeo hình chữ nhật tương đương (ERB) với số lượng lớn thí nghiệm tiếng ồn có khía tạo số lượng thang đo ERB Đầu tiên, Công thức (5.13) tạo từ khớp nối thí nghiệm tiếng ồn có khía Moore Glasberg [10]: Trong ERB (f) băng thơng ERB tần số f Điều cập nhật 1990 (của Glasberg Moore [5]) ưa chuộng (và đơn giản hơn) công thức:  Bộ lọc băng thông quan trọng băng tần quãng tám: Các mơ hình băng thơng quan trọng phức tạp so sánh với simmơ hình băng thông quan trọng dựa quãng tám plistic Các mơ hình giả định f l f u tần số tần số dải tới hạn tương ứng xác định mối quan hệ sau: 17 Trong đó: k = cho lọc dải octa k = 1/3 cho lọc dải octa thứ ba Với số thao tác thô sơ dẫn đến định nghĩa đơn giản băng thông trường hợp: Các băng tần qng tám: băng thơng = 707 × tần số trung tâm Các băng tần 1/3 Octave: băng thông = 232 × tần số trung tâm  So sánh mơ hình băng thơng quan trọng chức Tần suất: Kết luận cho phần mơ tả mơ hình băng thơng quan trọng, chúng so sánh đồ thị Mã M đưa Danh sách mã 5.4 5.5 cho số liệu so sánh sau Đầu tiên, Hình 5.17 cho thấy Vỏ tần số trung tâm băng thông lập bảng Bảng 5.1 Liên tục xấp xỉ với điểm liệu đưa Công thức (5.2) xác định Zwicker Terhardt [22] minh họa đồ thị Phương trình (5,8) (5.10) minh họa biểu đồ Điều cho thấy tỷ lệ độ tăng (tức là, độ dốc) hai mô hình gần Hình 5.18 cho thấy tần số trung tâm băng thông Bark Cùng với giá trị đồ thị lặp lại kết từ ERB công thức; Phương trình (5.13) Phương trình (5.14) Các biểu đồ cho thấy mơ hình trước hết giống mơ hình (chúng tơi- tiếng ồn có khía đối sánh lọc RoEx không đối xứng) cho thấy băng thông quan trọng giảm đáng kể xuống "đầu gối" thang đo Bark (tức là, khoảng 100Hz, băng thông thang Bark không đổi mức xấp xỉkhoảng 20Hz, băng thơng mơ hình ERB tiếp tục nhỏ tần số giảm) Từ nghiên cứu xem xét, Phương trình (5.14) cung cấp ước tính tốt cập nhật cho thay đổi băng thông quan trọng với tần số 18 Listing 5.4: Mã Matlab để tạo Hình 5.17: Listing 5.5: Mã Matlab để tạo Hình 5.18: 19 HÌNH 5.17: So sánh mơ hình băng thơng tới hạn HÌNH 5.18: So sánh mơ hình băng thơng tới hạn Câu 5: Mối quan hệ hình dạng lọc mặt nạ Các chức sử dụng để nén: Các đường cong mặt nạ liên quan đến dạng mặt nạ khác mơ tả Chương có váy tần số cao rộng đáng kể hẹp váy tần số thấp (và thực tế ngược lại với lọc thính giác khơng đối xứng đo Moore tác giả khác) Điều giải thích thực tế che đậy hiệu ứng tích lũy phản ứng nhiều thính giác lọc Hiệu ứng minh họa Hình 5.19 Ở tần số nghe nào, phản hồi lọc thính giác cục giao điểm với âm kiểm tra thúc 20 đẩy Như minh họa hình, điều dẫn đến phản ứng che phủ rộng tần số cao âm che Những đường cong mặt nạ bị lệch minh họa mơ hình che tần số thể Hình 7.10 7.11 Câu 6: Thuộc tính nơron thính giác: Để phân tích tồn hệ thống thính giác, điều quan trọng phải phân tích tính chất tế bào thần kinh thính giác đơn lẻ Các đặc điểm thính giác tế bào thần kinh cần phân tích là: • Sự thích nghi • Điều chỉnh • Đồng • Khơng tuyến tính (bao gồm che)  Sự thích nghi dây thần kinh thính giác: Như điểm chung với nhiều tế bào thần kinh cảm giác, tế bào thần kinh thính giác thể thích nghi- hành vi tation Một hành vi ví dụ dây thần kinh thính giác minh họa Hình 5.20 Hình 5.20 cho thấy kết loạt thí nghiệm để sản xuất gọi Biểu đồ ngưỡng sau kích thích (PSTH) PSTH tạo thơng qua việc áp dụng lặp lặp lại âm vào tai thời gian thực cho lần tăng đột biến đo Hình cho thấy tần suất tăng đột biến (như hàm thời gian) dạng biểu đồ Sự thích ứng thính giác nơron tóm tắt sau • Khi kích thích áp dụng đột ngột, tốc độ phản ứng tế bào thần kinh tăng vọt tăng nhanh chóng Xem vùng A Hình 5.20 21 HÌNH 5.19: Mơ hình kích thích âm 1kHz tạo nâng cấp thông qua đầu lọc thính giác chức trung tâm lọc tần số Hình cho thấy năm lọc thính giác (cho biết cách ban nhạc- chiều rộng lọc tăng lên theo tần số) phần hiển thị cách mẫu kích thích thu từ đầu lọc tần số 1KHz Tái với cho phép Từ: B Moore BR Glasberg Cơng thức đề xuất cho tính tốn băng thơng lọc thính giác mẫu kích thích J Acoust Soc Là (74): 750753, 1983 Bản quyền 1983, Acoustic Society of America [10] • Để có âm ổn định, tốc độ giảm theo cấp số nhân đến trạng thái ổn định Xem vùng B Hình 5.20 Khoảng 20ms sau âm báo áp dụng, tỷ lệ ổn định đạt Khoảng thời gian công nhận tương quan với hiệu ứng che thái dương trình bày chương • Sau đột ngột loại bỏ kích thích, tốc độ tăng đột biến âm giảm xuống tỷ lệ tự phát Xem vùng C Hình 5.20 • Do đó, kết luận tế bào thần kinh thính giác thường nhiều tài trợ cho thay đổi đầu vào ổn định 22 HÌNH 5.20: Sự thích nghi tế bào thần kinh thính giác Hình cho thấy BàiBiểu đồ thời gian kích thích (PSTH) cho tế bào thần kinh thính giác Tái với cho phép Của Christian J Sumner Alan R Palmer Thần kinh thính giác phản ứng sợi chồn hương Tạp chí Khoa học Thần kinh Châu Âu , 36 (4): 2428-2439, 2012 [17]  Đáp ứng tần số dây thần kinh thính giác: Hình 5.22 cho thấy đường cong điều chỉnh cho tế bào thần kinh thính giác ví dụ • Biểu đồ tạo cách áp dụng đợt bùng nổ âm 50ms sau 100ms • Mức âm tăng lên mức phóng điện tăng vọt lên lần mơi giây • Lặp lại cho tất tần số (trên trục x) • Các đường cong xác định chủ yếu chuyển động BM vị trí tế bào long điều kích hoạt tế bào thần kinh  Tính đồng dây thần kinh thính giác: Các gai thần kinh có xu hướng xảy đồng với kích thích áp dụng, tức chúng bị khóa pha Tuy nhiên, khóa pha khơng tồn 5kHz giảm dần 1kHz  Loại bỏ hai tông màu: Sự triệt tiêu hai giai điệu định nghĩa giai điệu tạo mức tăng đột biến trạng thái ổn định tốc độ phản hồi có tốc độ tăng đột biến giảm bị chặn âm báo khác [14] (minh họa Hình 5.21) • Một thời gian ngắn sau âm báo bắt đầu, phản hồi bị triệt tiêu mạnh tăng dần đến trạng thái ổn định • Sau loại bỏ âm báo mới, phản ứng tăng đột ngột đến mức cao trước giảm trạng thái ổn định trước • Các vùng bóng mờ Hình 5.22 cho thấy tần số âm triệt tiêu giai điệu có 23 HÌNH 5.21: Sự ức chế hai âm tế bào thần kinh thính giác Hình cho thấy kết dẫn Biểu đồ thời gian sau kích thích (PSTH) HÌNH 5.22: Đường cong điều chỉnh tế bào thần kinh vùng hai âm sắc cho phépsion Dịng cho thấy đường cong điều chỉnh tế bào thần kinh thính giác với tần số đặc trưng 8000Hz Hình cho thấy phần tự bóng mờ vùng thời gian triệt tiêu hai âm Tái với cho phép Từ RM Arthur, RR Pfeiffer N Suga Tính chất "sự ức chế hai âm" nơron thính giác Tạp chí Sinh lý học, 212 (3): 593-609 1971 [1] 24 Câu 7: Tổng kết • Sinh lý hệ thống thính giác người gọi ngoại vi bao gồm thành phần bên tai ngồi, tai tai • Phân tích dựa tần số người chia thành nhóm âm chồng chéo lọc tory gọi dải quan trọng • Các băng tần quan trọng có băng thơng tăng lên với tần số trung tâm thời hạn • Hình dạng lọc thính giác thu cách sử dụng thực nghiệm âm tâm lý- chẳng hạn người sử dụng lọc có khía • Các lọc thính giác gần đối xứng mơ tả sử dụng mơ lọc RoEx • Mặc dù lọc thính giác thường mơ hình hóa đối xứng, nhận thấy lọc bị lệch tần số thấp số lượng độ lệch tăng theo tần số trung tâm lọc 25

Ngày đăng: 10/01/2022, 18:33

Hình ảnh liên quan

Hình 5.1: Hệ thống thính giác ngoại vi. - tiểu luận môn học xử lý tiếng nói

Hình 5.1.

Hệ thống thính giác ngoại vi Xem tại trang 4 của tài liệu.
- Màng cơ bản (BM): là một xương phân chia hình xoắn ốc ốc tai. Nó hoạt động như một máy phân tích phổ logarit, phân chia vật lý và cô lập các thành phần tần  số rung động đầu vào đến các vị trí vật lý khác nhau dọc theo chiều dài của nó - tiểu luận môn học xử lý tiếng nói

ng.

cơ bản (BM): là một xương phân chia hình xoắn ốc ốc tai. Nó hoạt động như một máy phân tích phổ logarit, phân chia vật lý và cô lập các thành phần tần số rung động đầu vào đến các vị trí vật lý khác nhau dọc theo chiều dài của nó Xem tại trang 5 của tài liệu.
Hình 5.3: Các đường dẫn âm thanh liên kết tai trái và tai phải với thính giác vỏ não (kết nối tiến và lùi) - tiểu luận môn học xử lý tiếng nói

Hình 5.3.

Các đường dẫn âm thanh liên kết tai trái và tai phải với thính giác vỏ não (kết nối tiến và lùi) Xem tại trang 7 của tài liệu.
HÌNH 5.5: Biên độ dịch chuyển của màng đáy trong tám tông màu trong sáng. Tái bản với sự cho phép - tiểu luận môn học xử lý tiếng nói

HÌNH 5.5.

Biên độ dịch chuyển của màng đáy trong tám tông màu trong sáng. Tái bản với sự cho phép Xem tại trang 9 của tài liệu.
tương tự của Schooneveldt và Moore [6] vào năm 1987. Hình này cho thấy rõ ràng  ngưỡng  tăng  khi  băng  thông  nhiễu  tăng  lên  đến  băng  thông  quan  trọng  400Hz và sau đó không đổi sau đó - tiểu luận môn học xử lý tiếng nói

t.

ương tự của Schooneveldt và Moore [6] vào năm 1987. Hình này cho thấy rõ ràng ngưỡng tăng khi băng thông nhiễu tăng lên đến băng thông quan trọng 400Hz và sau đó không đổi sau đó Xem tại trang 10 của tài liệu.
kết quả như trong Hình 5.8. Con số này thực sự là từ việc lặp lại các thí nghiệm - tiểu luận môn học xử lý tiếng nói

k.

ết quả như trong Hình 5.8. Con số này thực sự là từ việc lặp lại các thí nghiệm Xem tại trang 10 của tài liệu.
HÌNH 5.8: Ngưỡng âm dẫn đến nhiễu băng rộng đồng vị trí (đối với tần số 2kHz âm thử). Tái bản với sự cho phép - tiểu luận môn học xử lý tiếng nói

HÌNH 5.8.

Ngưỡng âm dẫn đến nhiễu băng rộng đồng vị trí (đối với tần số 2kHz âm thử). Tái bản với sự cho phép Xem tại trang 11 của tài liệu.
(xem Bảng 5.1). Các giá trị này xác định tần số trung tâm và dải tần số (và do đó - tiểu luận môn học xử lý tiếng nói

xem.

Bảng 5.1). Các giá trị này xác định tần số trung tâm và dải tần số (và do đó Xem tại trang 11 của tài liệu.
HÌNH 5.9: So sánh các giá trị thang đo Bark từ Bảng 5.1 và (5.1). - tiểu luận môn học xử lý tiếng nói

HÌNH 5.9.

So sánh các giá trị thang đo Bark từ Bảng 5.1 và (5.1) Xem tại trang 13 của tài liệu.
HÌNH 5.10: Thang đo Mel như được hiển thị bởi (5.4) được tạo bởi mã trong Danh sách 5.2 Listing 5.2:  Mã Matlab để tạo thang đo Mel Hình 5.10  - tiểu luận môn học xử lý tiếng nói

HÌNH 5.10.

Thang đo Mel như được hiển thị bởi (5.4) được tạo bởi mã trong Danh sách 5.2 Listing 5.2: Mã Matlab để tạo thang đo Mel Hình 5.10 Xem tại trang 14 của tài liệu.
HÌNH 5.12: Kết quả thí nghiệm ngưỡng nhiễu đối với dải cao, dải rộng tiếng ồn. Tái bản với sự cho phép - tiểu luận môn học xử lý tiếng nói

HÌNH 5.12.

Kết quả thí nghiệm ngưỡng nhiễu đối với dải cao, dải rộng tiếng ồn. Tái bản với sự cho phép Xem tại trang 16 của tài liệu.
HÌNH 5.11: Kết quả thí nghiệm ngưỡng nhiễu đối với dải tần thấp, dải rộng tiếng ồn. Tái bản với sự cho phép - tiểu luận môn học xử lý tiếng nói

HÌNH 5.11.

Kết quả thí nghiệm ngưỡng nhiễu đối với dải tần thấp, dải rộng tiếng ồn. Tái bản với sự cho phép Xem tại trang 16 của tài liệu.
Listing 5.3: Mã Matlab để tạo Hình 5.13: - tiểu luận môn học xử lý tiếng nói

isting.

5.3: Mã Matlab để tạo Hình 5.13: Xem tại trang 17 của tài liệu.
HÌNH 5.13: Mô hình bộ lọc thính giác đối xứng do Patterson đề xuất [12] (sử dụng ba giá trị α {20,  50,  80})  cho  thấy  rằng  băng  thông  của  bộ  lọc  tăng  khi α tăng  (từ  Công  thức  (5.7)) - tiểu luận môn học xử lý tiếng nói

HÌNH 5.13.

Mô hình bộ lọc thính giác đối xứng do Patterson đề xuất [12] (sử dụng ba giá trị α {20, 50, 80}) cho thấy rằng băng thông của bộ lọc tăng khi α tăng (từ Công thức (5.7)) Xem tại trang 17 của tài liệu.
trong minh họa dưới cùng trong Hình 5.14). Các thí nghiệm về tiếng ồn có khía - tiểu luận môn học xử lý tiếng nói

trong.

minh họa dưới cùng trong Hình 5.14). Các thí nghiệm về tiếng ồn có khía Xem tại trang 18 của tài liệu.
HÌNH 5.15: Ba bộ lọc RoEx với băng thông hình chữ nhật tương đương. - tiểu luận môn học xử lý tiếng nói

HÌNH 5.15.

Ba bộ lọc RoEx với băng thông hình chữ nhật tương đương Xem tại trang 20 của tài liệu.
HÌNH 5.16: Dây đeo hình chữ nhật tương đương (ERB) - tiểu luận môn học xử lý tiếng nói

HÌNH 5.16.

Dây đeo hình chữ nhật tương đương (ERB) Xem tại trang 20 của tài liệu.
Listing 5.5: Mã Matlab để tạo Hình 5.18: - tiểu luận môn học xử lý tiếng nói

isting.

5.5: Mã Matlab để tạo Hình 5.18: Xem tại trang 22 của tài liệu.
Listing 5.4: Mã Matlab để tạo Hình 5.17: - tiểu luận môn học xử lý tiếng nói

isting.

5.4: Mã Matlab để tạo Hình 5.17: Xem tại trang 22 của tài liệu.
HÌNH 5.18: So sánh các mô hình băng thông tới hạn 2. - tiểu luận môn học xử lý tiếng nói

HÌNH 5.18.

So sánh các mô hình băng thông tới hạn 2 Xem tại trang 23 của tài liệu.
HÌNH 5.17: So sánh các mô hình băng thông tới hạn 1. - tiểu luận môn học xử lý tiếng nói

HÌNH 5.17.

So sánh các mô hình băng thông tới hạn 1 Xem tại trang 23 của tài liệu.
HÌNH 5.19: Mô hình kích thích của âm 1kHz có thể được tạo ra như thế nào được nâng cấp thông qua đầu ra của bộ lọc thính giác như một chức năng của trung tâm bộ lọc tần số - tiểu luận môn học xử lý tiếng nói

HÌNH 5.19.

Mô hình kích thích của âm 1kHz có thể được tạo ra như thế nào được nâng cấp thông qua đầu ra của bộ lọc thính giác như một chức năng của trung tâm bộ lọc tần số Xem tại trang 25 của tài liệu.
HÌNH 5.20: Sự thích nghi của một tế bào thần kinh thính giác. Hình này cho thấy một Bài- Biểu đồ thời gian kích thích (PSTH) cho một tế bào thần kinh thính giác - tiểu luận môn học xử lý tiếng nói

HÌNH 5.20.

Sự thích nghi của một tế bào thần kinh thính giác. Hình này cho thấy một Bài- Biểu đồ thời gian kích thích (PSTH) cho một tế bào thần kinh thính giác Xem tại trang 26 của tài liệu.
HÌNH 5.21: Sự ức chế hai âm của một tế bào thần kinh thính giác. Hình này cho thấy kết quả chỉ dẫn của Biểu đồ thời gian sau kích thích (PSTH)  - tiểu luận môn học xử lý tiếng nói

HÌNH 5.21.

Sự ức chế hai âm của một tế bào thần kinh thính giác. Hình này cho thấy kết quả chỉ dẫn của Biểu đồ thời gian sau kích thích (PSTH) Xem tại trang 27 của tài liệu.
HÌNH 5.22: Đường cong điều chỉnh của tế bào thần kinh và các vùng của hai âm sắc cho phép- sion - tiểu luận môn học xử lý tiếng nói

HÌNH 5.22.

Đường cong điều chỉnh của tế bào thần kinh và các vùng của hai âm sắc cho phép- sion Xem tại trang 27 của tài liệu.