Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 83 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
83
Dung lượng
2,12 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - ĐINH HUY CƯƠNG MƠ HÌNH HĨA Q TRÌNH TRUYỀN ÂM THANH TRONG PHỊNG THU SỬ DỤNG PHƯƠNG PHÁP NGUỒN ẢNH CHUYÊN NGÀNH: KỸ THUẬT VIỄN THÔNG LUẬN VĂN THẠC SĨ KỸ THUẬT KỸ THUẬT VIỄN THÔNG NGƯỜI HƯỚNG DẪN KHOA HỌC VƯƠNG HOÀNG NAM Hà Nội – 2017 LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu riêng tơi Các số liệu, kết nêu Luận văn trung thực chưa công bố cơng trình khác Tơi xin cam đoan giúp đỡ cho việc thực Luận văn cảm ơn thơng tin trích dẫn Luận văn rõ nguồn gốc Tác giả Luận văn Đinh Huy Cương MỤC LỤC LỜI CAM ĐOAN .0 MỤC LỤC DANH SÁCH CÁC TỪ VIẾT TẮT DANH SÁCH HÌNH VẼ CHƯƠNG : TỔNG QUAN CỦA MÔ HÌNH VÀ CƠ SỞ LÝ THUYẾT .7 1.1 Tổng quan mơ hình 1.2 Mục đích phần mềm Mơ Phỏng Phịng Thu Âm 1.3 Lý thuyết đáp ứng xung phòng thu 1.3.1 Tổng quan 1.3.2 Lý thuyết sóng 11 1.3.3 Lý thuyết tính tốn thời gian phản hồi RT60 bề mặt phịng thu 14 1.3.4 Mơ hình nguồn ảnh tính tốn đáp ứng xung phịng thu 16 1.3.4.1 Tổng quan .16 1.3.4.2 Tính tốn đáp ứng xung phương pháp nguồn ảnh 21 1.4 Tín hiệu âm vài đặc tính âm phịng thu 23 1.5 Phản xạ sóng âm .25 1.6 Kết luận chương 26 CHƯƠNG : CÁC PHƯƠNG PHÁP TÍNH TỐN XỬ LÝ KẾ THỪA DỮ LIỆU 27 2.1.Tổng quan phương pháp đo đáp ứng xung phòng thu .27 2.1.1 Phương pháp kiểm tra xung tuần hoàn 27 2.1.2 Phương pháp đo phổ trễ thời gian 28 2.1.3 Đo kích thích ngẫu nhiên 28 2.1.4 Đo kích thích tạp âm giả ngẫu nhiên 28 2.2 MLS ( maximum length sequence ) 29 2.2.1 Khái niệm 29 3.2.2 Thuộc tính tương quan MLS 31 2.2.3 Biến đổi Hadamard nhanh cho MLS 34 2.3 Lý thuyết HRTF ( Head – Related transfer Function) 37 2.3.1 Khái niệm 37 2.3.2 Đo HRTF 38 2.4 Các hệ thống công cụ để thực xây dựng phần mềm 42 2.4.1 Hệ thống nhận diện tiếng nói tự động (Automatic speech recognition systtôi) 42 2.4.2 Hệ thống xử lý âm ( Binaural pathway) 42 2.4.3 Hệ thống xử lý đơn kênh ( Monuaral pathway) 43 2.4.4 Bộ tính nhận diện lỗi âm (Missing feature speech recogniser) 44 2.4.5 Phân nhóm phương vị phổ biến (Grouping by common azimuth) 45 2.4.6 Yêu cầu phần cứng 45 2.5 Kết luận chương 46 CHƯƠNG : CHƯƠNG TRÌNH MƠ PHỎNG 47 3.1 MENU Chương trình : Main Menu 47 3.1.1 Mophong_setup: Nhập thông số theo hướng dẫn .49 3.1.2 Đọc liệu từ MAT file có sẵn 68 3.2 MENU mophong _setup : đọc liệu từ Text file 69 3.3 MENU : Các tiện ích hiển thị phòng thu 70 3.4 Kết luận chương 75 KẾT LUẬN CHUNG VÀ KIẾN NGHỊ 76 TÀI LIỆU THAM KHẢO 77 PHỤ LỤC 78 Phụ lục A : Các thông số mô .78 Phụ lục B: Các định dạng hỗ trợ 79 DANH SÁCH CÁC TỪ VIẾT TẮT Ký tự viết tắt Tiếng Anh Tiếng Việt DSP Digital Signal Srocessing Xử lý tín hiệu số ISM Image-Source Method Mơ hình nguồn ảnh ITD Interaural time difference Khác biệt thời gian nội ILD Interaural level difference Khác biệt mức độ nội Head Related Impulse Tương quan đáp ứng xung Response đầu người Head-related room impulse Tương quan đáp ứng xung response đầu người Head Related Transfer Hàm truyền đạt thính giác HRIR HRRIR HRTF Function Automatic speech Nhận diện giọng nói tự recognition động SNR Signal-to-noise ratio Tỷ số tín hiệu nhiễu RT Reverberation time Thời gian phản hồi IR Impulse response Đáp ứng xung ASR Chuỗi chiều dài tối đa MLS Maximum Length Sequence FFT Fast Fourier Tranform Biến đổi Fourier nhanh TF Tranfer Function Hàm truyền đạt DFT Descrete Fourier Tranform Biến đổi Fourier rời rạc FIR Finite impulse response Bộ lọc đáp ứng xung hữu hạn IIR Infinite impulse response Bộ lọc đáp ứng xung vơ hạn DANH SÁCH HÌNH VẼ Hình 1 Mơ hình tuyến tính âm phịng thu .9 Hình Mơ hình truyền âm 10 Hình Đáp ứng xung âm phòng miền thời gian 10 Hình Mơ hình nguồn ảnh 18 Hình Các bước thực mơ hình nguồn ảnh 19 Hình Đáp ứng xung phòng với thành phần cụ thể 20 Hình Mặt cắt ngang phương pháp nguồn ảnh mặt phẳng xy 21 Hình Cách tiếp nhận âm người .23 Hình Thực tạo tín hiệu MLS 4bit 30 Hình 2 Mơ hình đo MLS 33 Hình Hệ thống đơn giản đo HRTF .39 Hình Các hình dạng tai người 41 Hình Mơ hình phòng thu âm 58 Hình Mối quan hệ hệ số hấp thụ tần số âm 59 Hình 3 Mối quan hệ thời gian phan hồi (RT60) tần số (Hz) 60 Hình Đáp ứng xung theo Thời gian(giây) 62 Hình Suy hao lượng theo số mẫu 63 Hình Magnitude vs Frequency 65 Hình Hình ảnh chiều phòng thu nguồn âm với vị trí,cường độ sáng 66 Hình Hình ảnh chiều phịng thu nguồn âm với vị trí,cường độ sáng 67 Hình Menu lựa chọn Text file 69 Hình 10 Các tiện ích hiển thị phịng thu .70 Hình 11 Mơ hình cường độ âm 72 Hình 12 Hình ảnh chiều phịng thu 73 Hình 13 Hình ảnh chiều phòng thu 74 MỞ ĐẦU Trước yêu cầu đặt nghiên cứu âm ứng dụng vào thực tế, đáp ứng yêu cầu chất lượng âm phịng thu âm Đi với việc phục vụ yêu cầu thiết kế chọn lựa dụng cụ âm cách tốt Trong thời gian dài tìm hiểu nghiên cứu tơi nghiên cứu phát triển công cụ mô phịng thu âm dạng hình hộp chữ nhật Hiện phòng thu âm mini gia đình hay tổ chức có hình dạng kích thước đa dạng theo yêu cầu riêng người sử dụng cho hoạt động ca nhạc khác Không ứng dụng âm phòng thu sử dụng doanh nghiệp, cơng ty sản xuất âm nhạc, chương trình ca nhạc trở thành phổ biến buổi thuyết trình diễn phịng thu ngồi trời Tuy nhiên hạn chế nhiều mặt nên luận văn tập trung vào giải xây dựng chương trình mơ tín hiệu âm phịng thu âm hình hộp chữ nhật với bề mặt phản xạ âm Với sở liệu kế thừa từ “CIPIC HRTF Database” phát triển giáo sư Ralph Algazi phòng LAB CIPIC-University of California Davis Luận văn chia làm phần chính: Chương 1: Tổng quan mơ hình sở lý thuyết Chương luận văn, giới thiệu cách tổng quan phần mềm mô phỏng, phương pháp xây dựng chương trình, yêu cầu đặt với phần mềm Đồng thời nội dung chương trình bày lý thuyết âm bao gồm q trình lan truyền âm mơi trường phịng thu, lý thuyết đáp ứng xung, thuật toán xác định tín hiệu âm vài đặc tính âm Chương 2: Các phương pháp tính tốn xử lý kế thừa từ sở liệu Trong chương trình bày lý thuyết đưa từ cơng trình nghiên cứu nghiên cứu sinh phòng LAB giới Những lý thuyết áp dụng để xây dựng sở liệu phục vụ cho luận văn Chương Chương trình mơ Kết thu từ phần mềm thực thông qua bước nhập số liệu phòng thu âm, yêu cầu liên quan tới nguồn thu phát âm… Các biểu đồ thu lại hiển thị cho người dùng CHƯƠNG : TỔNG QUAN CỦA MƠ HÌNH VÀ CƠ SỞ LÝ THUYẾT 1.1 Tổng quan mơ hình Lý thuyết âm học ứng dụng nghiên cứu thời gian dài bác sĩ, kỹ sư, kiến trúc sư nhiều người khác Với hiểu biết đắn âm thanh, dự đốn hành vi âm bên phòng, cho phép tính tốn đáp ứng xung nguồn âm phát nguồn âm Đáp ứng xung tính tốn mơi trường có kích thước vật liệu xây dựng khác cách sử dụng lý thuyết kinh điển xử lý tín hiệu số Khả mơ tính chất âm phịng đặc biệt hữu ích cho kiến trúc sư Âm tòa nhà phịng thiết kế tính tốn, đặc tính âm khơng mong muốn sửa chữa trước bắt đầu xây dựng Kết việc mơ phịng âm áp dụng cách phổ biến tiến hành xây dựng phòng thu với thiết bị âm thiết bị video Các hiệu ứng thiết lập bên phòng họp, nhà hát, rạp chiếu phim phòng hòa nhạc phổ biến với đầu phát video hệ thống âm Các thiết lập hiệu ứng cho phép người dùng nghe âm âm nhạc thông qua thiết bị thể họ nghe bên phịng quy định Tuy nhiên, hiệu ứng tìm thấy hệ thống thường chung chung thực cách cân tần số mô loạt tiếng vang, với trễ thời gian lớn tiếng vang cho phòng lớn Một hệ thống đo lường mơ phịng âm có vơ số ứng dụng tiềm Nó sử dụng cho việc tăng cường âm lĩnh vực giải trí âm nhạc, truyền hình máy tính đa phương tiện Hệ thống điều chỉnh để đo lường phản ứng phòng thiết bị điện, âm loa phóng Sau phân tích, thiếu sót phản ứng đo bù lại cách áp dụng chức chuyển giao tính tốn để trước âm phát lại thơng qua loa phóng vào phịng Ngồi cịn có nhiều ứng dụng âm ảo Các phép đo tín hiệu đầu vào vị trí khác bên phịng cách giả đầu thu Microphone, thực tính tốn dựa hàm HRTF Sự mở rộng âm âm ba chiều tăng cường cách áp dụng phản ứng phòng đo kết hợp với HRTF cho kết tốt hơn… Chương trình phần mềm mô âm bên phịng lăng trụ hình chữ nhật đơn giản, xây dựng ngơn ngữ lập trình MATLAB Bằng cách sử dụng mơ hình nguồn - ảnh (image-source method) để tạo đáp ứng xung từ nguồn đẳng hướng tới hệ thống máy thu định hướng cảm biến nhất, cặp cảm biến… Thuật toán sử dụng bao gồm tính tốn hệ số hấp thụ âm phụ thuộc vào tần số Bằng cách này, chương trình cung cấp khả lựa chọn vật liệu khác cho sáu bề mặt phịng mô theo danh sách 20 tiêu chuẩn vật liệu xây dựng (cộng với phòng chống dội vang Anechoic) có bảng hệ số hấp thụ phụ thuộc tần số 1.2 Mục đích phần mềm Mơ Phỏng Phịng Thu Âm Mục tiêu cốt lõi phần mềm cung cấp công cụ phát tín hiệu phục vụ cho việc nghiên cứu giọng nói âm Phần mềm mơ phịng thu cách trực quan, tín hiệu âm biểu diễn dạng biểu đồ chuẩn để từ giúp cho sinh viên có cơng cụ để thực hành tập liên quan đến âm thanh, hiểu chất, hành vi tín hiệu…Bên cạnh phần mềm đáp ứng u cầu nhà nghiên cứu lấy phần mềm làm cơng cụ so sánh hữu ích tiến hành thực nghiệm xây dựng thuật toán xử lý tín hiệu Hình Hình ảnh chiều phịng thu nguồn âm với vị trí,cường độ sáng Sau tất biểu đồ, hình ảnh hiển thị bảng menu xuất yêu cầu lựa chọn để lưu liệu vào file data mà biểu diễn lại hình ảnh mơ Người sử dụng tạo thêm file khác ví dụ plot_*.mat 67 File gọi ta sử dụng menu “tiện ích phịng thu” “Main menu” liệu ta xây dựng trước cung cấp để vẽ hình ảnh, biểu đồ mà khơng cần nhập liệu đầu vào Sau kết thúc trình chương trình quay trở lai menu 3.1.2 Đọc liệu từ MAT file có sẵn Folder MAT_setup mở phép lựa chọn file setup_TEST (Đây file mà lưu trữ lại tất thông tin giá trị thông số mô thiết lập bước mơ trước đó) để load giá trị u cầu cho q trình mơ Chương trình sau thực cách 3.1.1.1 mophong_setup: Nhập thông số theo hướng dẫn Nhấn Cancel để quay lại menu 68 3.2 MENU mophong _setup : đọc liệu từ Text file Hình Menu lựa chọn Text file Các bảng menu xuất người sử dụng nên chọn filename.txt chứa folder Text_setups Định dạng Text file mô tả phần Phụ lục Chương trình cho phép thực bước mô 3.1.1.1 Nhấn cancel để quay lại Mophong_setup menu 69 3.3 MENU : Các tiện ích hiển thị phịng thu Hình 10 Các tiện ích hiển thị phịng thu Các lựa chọn vẽ biểu đồ phịng thu khơng gian chiều, đáp ứng xung, đáp ứng tần số thực bước trên,nhưng liệu chúng lấy từ plot_TEST.mat Menu Tiện ích mơ phòng thu thực tất chức hiển thị (2D,3D phòng thu,các đầu thu nguồn âm) vẽ biểu đồ đáp ứng xung đáp ứng tần số Nó thực chức sau: Hình ảnh mơ chiều phòng thu,nguồn âm đầu thu Vẽ đáp ứng xung tổn hao lượng (impulse respone or energy decay) Vẽ đáp ứng tần số sensor Hình ảnh chiều phịng thu nguồn âm Hình ảnh chiều phịng thu nguồn âm 70 Hình ảnh hiển thị 2D 3D khởi tạo bước 3.1 Thiết lập thông số mô (từ Text file) file data lưu trình mơ trước Các hình bên minh họa chức : 71 Hình 11 Mơ hình cường độ âm Hình ảnh phịng thu cường độ màu sắc khác mã hóa cho nguồn âm thể chi tiết hình ảnh Các màu mã hóa để thể cường độ âm khoảng 0dB tới -60dB 72 Hình 12 Hình ảnh chiều phịng thu Hình ảnh phòng thu cường độ âm nguồn âm mã hóa cột biểu diễn khơng gian chiều Các cột với cường độ màu sắc khác biểu thị cho nguồn âm, đầu thu ảnh Tại biểu đồ khơng gian phòng thu âm thu gọn lại khơng gian chiều mà từ thấy rõ tính chất âm phịng độ hấp thụ bề mặt 73 Hình 13 Hình ảnh chiều phịng thu Cường độ màu sắc mã hóa nguồn âm biểu diễn khơng gian chiều Các chức hình vẽ biểu diễn khơng gian chiều vài giây cho kịch âm thực phải hiển thị số lượng lớn hình ảnh.Việc hiển thị hình ảnh khơng gian chiều phức tạp lộn xộn so với chức khác lại có giá trị nhận xét việc xếp âm cách đơn giản biểu đạt việc hạn chế ảnh hưởng định hướng sensor Bên cạnh chức hiển thị chương trình cho phép đóng tất hình ảnh hiển thị Sau quay menu chương trình (Mophong_setup) 74 3.4 Kết luận chương Kết thúc chương hồn thành sau q trình mơ phỏng, bao gồm: cách nhập liệu thông số đầu vào, lựa chọn tham số phòng nguồn thu để thực mô Sau nhập liệu, thu kết q trình truyền âm phịng thu: biểu đồ đáp ứng xung, biểu đồ lượng, biểu đồ bề mặt phản xạ tần số khác Sau so sánh với lý thuyết đề cập chương 1, thấy kết hoàn toàn phù hợp Như với kết thu hiểu chất, hành vi âm truyền phòng thu đồng thời xây dựng thành công phần mềm mô lại trình Đây phần mềm hữu ích cho nghiên cứu học tập 75 KẾT LUẬN CHUNG VÀ KIẾN NGHỊ Chương trình “mơ hình hóa q trình truyền âm phịng thu sử dụng phương pháp nguồn ảnh“ hoàn thành đạt kết sau : Chương trình có khả xây dựng mơ hình phịng thu âm hình hộp chữ nhật.Các kích thước phịng thu, vị trí đặt nguồn thu phát âm tùy chọn theo yêu cầu người dùng Có khả vẽ biểu đồ đặc tính lan truyền âm tiếp nhận âm phát từ nguồn âm đẳng hướng tới sensor thu Bên cạnh biểu đồ thể chất tính hiệu : thời gian phản hồi âm, hệ số hấp thụ bề mặt phịng thu, phổ tần tín hiệu … Trong phạm vi luận văn tập trung vào xây dựng phần mềm mơ phịng thu hình hộp chữ nhật đưa số sở dự liệu thực hiện.Tuy nhiên nhiều vấn đề nghiên cứu luận văn mà chưa đề cập đến như: Quá trình lan truyền tiếp nhận âm môi trường khác : ngồi trời, dạng phịng thu khác nhau… Trường hợp nhiều nguồn âm phát tín hiệu nhiều sensor thu tín hiệu Mới sử dụng cho loại sensor thu đẳng hướng… Mặt khác luận văn số vấn đề chưa hợp lý hay chưa tối ưu file chương trình Do tơi mong nhận góp ý thầy để luận văn tơi hồn chỉnh Tôi xin chân thành cảm ơn! 76 TÀI LIỆU THAM KHẢO [1] Allen, J B and Berkley, D A., "Image method for efficiently simulating small-room acoustics", JASA 65(4), 943-950, 1979 [2] Lokki, T., "Physically-based auralization" PhD Thesis, Publications in Telecommunications Software and Multimedia Helsinki University of Technology, 2002 [3] Palomäki, K J., Brown, G J., and Wang, D L., “A Binaural Processor for Missing Data Speech Recognition in the Presence of Noise and Small-Room Reverberation”, Accepted for publication in Speech Communication, 2003 [4] Peterson, P M., "Simulating the response of multiple microphones to a single acoustic source in a reverberant room", JASA 80(5), 1527-1529, 1986 [5] Gardner, W G., and Martin, K D “HRTF measurtơients of a KTƠIAR dummy head microphone”, In Standards in Computer Generated Music, Haus, G and Pighi, I eds., IEEE CS Tech Com on Computer Generated Music, 1996 [6] Algazi, V R et al., “The CIPIC HRTF Database”, IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 2001 [7] Cooke, M P., Green, P D., Josifovski, L and Vizinho, A “Robust Automatic Speech Recognition with Missing and Unreliable Acoustic Data”, Speech Communication, 34, pp 267-285, 2001 [8] Douglas R Campbell1, Kalle J Palomäki2 and Guy J Brown “A MATLAB Simulation of “Shoebox” Room Acoustics for use in Research and Teaching” , 2001 77 PHỤ LỤC Phụ lục A : Các thông số mô Các thông số thiết lập mô bao gồm : Fs, tần số lấy mẫu (Hz) Humidity, Độ ẩm khơng khí Một đẳng thức (có giá trị 20