1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tách tín hiệu tiếng nói sử dụng phương pháp phân tích thành phần độc lập

108 28 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 108
Dung lượng 1,68 MB

Nội dung

Đại Học Quốc Gia TP Hồ Chí Minh TRƯỜNG ĐẠI HỌC BÁCH KHOA W X ĐÀO NGỌC MINH TÁCH TÍN HIỆU TIẾNG NÓI SỬ DỤNG PHƯƠNG PHÁP PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP Chuyên ngành : KỸ THUẬT VÔ TUYẾN VÀ ĐIỆN TỬ Mã số ngành : 2.07.01 LUẬN VĂN THẠC SĨ THÀNH PHỐ HỒ CHÍ MINH 07-2005 CÔNG TRÌNH ĐƯC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH *** - Caùn hướng dẫn khoa học : PGS-TSKH NGUYỄN KIM SÁCH Cán chấm nhận xét : PGS-TS VŨ ĐÌNH THÀNH Cán chấm nhận xét : TS PHAN HỒNG PHƯƠNG Luận văn thạc só bảo vệ HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày 22 tháng 07 năm 2005 Đại Học Quốc Gia Tp Hồ Chí Minh CỘNG HÒA Xà HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc Lập – Tự Do – Hạnh Phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: ĐÀO NGỌC MINH Phái: Nam Ngày, tháng, năm sinh: 23/06/1979 Nơi sinh: Bắc Ninh Chuyên ngành: KỸ THUẬT VÔ TUYẾN-ĐIỆN TỬ Mã số: 2.07.01 TÊN ĐỀ TÀI: TÁCH TÍN HIỆU TIẾNG NÓI SỬ DỤNG PHƯƠNG PHÁP PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP II-NHIỆM VỤ VÀ NỘI DUNG: Tách tín hiệu tiếng nói người nói đồng thời ghi microphone • Phương pháp phân tích thành phần độc lập • Ứng dụng phương pháp phân tích thành phần độc lập miền tần số vào tách tín hiệu tiếng nói • Thực mô Matlab III-NGÀY GIAO NHIỆM VỤ: IV-NGÀY HOÀN THÀNH NHIỆM VỤ: V-HỌ VÀ TÊN CÁN BỘ HƯỚNG DẪN: PGS-TSKH NGUYỄN KIM SÁCH CÁN BỘ HƯỚNG DẪN (Ký tên ghi rõ họ tên) BỘ MÔN QUẢN LÝ NGÀNH (Ký tên ghi rõ họ tên) Nội dung đề cương luận văn thạc só Hội Đồng Chuyên Ngành thông qua Ngày PHÒNG ĐÀO TẠO SĐH tháng năm KHOA QUẢN LÝ NGÀNH Lời cảm ơn Trước tiên, em xin chân thành bày tỏ lòng biết ơn sâu sắc đến thầy hướng dẫn, PGS-TSKH NGUYỄN KIM SÁCH, người trực tiếp hướng dẫn, tận tình bảo tạo điều kiện thuận lợi để em hoàn thành luận văn tốt nghiệp Em xin chân thành cảm ơn tất Phòng Sau Đại Học, Quý thầy cô cán Khoa Điện-Điện Tử – Trường Đại Học Bách Khoa TP.HCM hết lòng giảng dạy, truyền đạt kiến thức giúp đỡ em suốt thời gian học tập Trường Cuối cùng, xin gửi lời cảm ơn đến gia đình bạn bè động viên, giúp đỡ hỗ trợ suốt trình học tập thực luận văn tốt nghiệp Tác giả LỜI NÓI ĐẦU Trong nhiều ứng dụng, tín hiệu ta ghi trộn lẫn tín hiệu gốc với tác động thân tín hiệu gốc với độ trễ khác với nhiễu theo quy luật mà ta Chúng ta mong muốn tách tín hiệu bị lai tạp với này, để từ khôi phục lại tín hiệu gốc với độ xác cao Trong thời gian gần có nhiều nghiên cứu tập trung vào việc tách tín hiệu bị trộn lẫn này, gọi tách/giải chập nguồn mù (BSS/BSD: Blind Source Separation/ Deconvolution) BSS/BSD phương pháp tổng quát để ước lượng tín hiệu gốc từ tín hiệu ghi mà trộn lẫn tín hiệu gốc Trong BSS/BSD, ta biết tín hiệu ghi x(n ) = [x1 (n ) x M (n )] từ M cảm biến sinh hàm F tương tác R tín hiệu nguồn s (n ) = [s1 (n ) s R (n )] x( n) = F [s (n )] Nhiệm vụ BSS/BSD ước lượng tối ưu Fˆ −1 , nghịch đảo hàm tác động, để tìm (một cách gần đúng) tín hiệu gốc, nghóa sˆ(n ) = Fˆ −1 [x(n )] Hàm tương tác phụ thuộc vào cấu trúc vật lý chẳng hạn vị trí nguồn cảm biến, số lượng nguồn cảm biến, hàm truyền từ nguồn đến cảm biến BSS/BSD thu hút ý khoảng thập kỷ trở lại ứng dụng to lớn chúng nhiều lãnh vực như: xử lý tín hiệu, viễn thông, y khoa, địa chất, khí tượng… BSS/BSD dựa phương pháp ICA, gọi phân tích thành phần độc lập (Independent Component Analysis) ICA giới thiệu vào năm đầu thập niên 80 đề tài mạng neural Cho đến năm thập niên 90 có nhiều giải thuật đạt thành công lớn giới thiệu vài nhóm nghiên cứu nhanh chóng trở thành đề tài hấp dẫn với nhiều ứng dụng cụ thể Nhiều nghiên cứu ICA công bố suốt 20 năm qua nhiều báo hội thảo lónh vực xử lý tín hiệu, mạng neural nhân tạo, lý thuyết thông tin, nhiều lónh vực ứng dụng khác Nó kỹ thuật thống kê tính toán nhằm làm lộ hệ số chưa biết tập biến ngẫu nhiên, giá trị đo lường hay tín hiệu Trong liệu giả sử tổ hợp tuyến tính tín hiệu tổ hợp Một ví dụ điển hình microphone ghi tín hiệu tiếng nói nhiều người nói đồng thời Đây phương pháp nhận quan tâm lớn có phát triển mạnh mẽ thời gian gần Do đó, phần phân tích lý thuyết chủ yếu tập trung vào tìm hiểu ICA Một số phương pháp cho ICA đưa giới thiệu Và cuối ứng dụng phương pháp ICA vào tách tín hiệu tiếng nhiều người nói đồng thời ghi mảng microphone môi trường thực tế Phương pháp thực với giả sử độc lập thống kê nguồn ước lượng tín hiệu gốc tính độc lập Luận Văn gồm phần với nội dung khái quát sau: ™ Phần A: Lý thuyết tổng quan Phần gồm chương, giới thiệu tổng quan khái niệm toán học cần thiết phương pháp ICA Chương 1: Vector ngẫu nhiên độc lập Chương trình bày khái niệm xác suất thống kê kỳ vọng, moment, tương quan, hiệp biến, độc lập đặc trưng thống kê bậc cao Chương quan trọng ICA, ICA phương pháp dựa tính toán thống kê để tìm thành phần độc lập Chương 2: Gradient phương pháp tối ưu Trình bày vector ma trận gradient phương pháp tối ưu không ràng buộc có ràng buộc Để tìm thành phần độc lập phải có phương pháp tìm cực trị hàm đối tượng phương pháp thường dựa gradient Chương 3: Lý thuyết thông tin Trình bày khái niệm lý thuyết thông tin Trong có lượng tin tương hỗ negentropy hai đại lượng cho hai phương pháp ICA khác Chương 4: Phân tích thành phần whitening Whitening, phương pháp trắng hoá liệu, dựa phân tích thành phần mang ý nghóa quan trọng ICA phần nhiệm vụ ICA Chương 5: Phân tích thành phần độc lập Từ chương khái niệm ICA trình bày rõ ràng hơn, với ví dụ minh họa giúp người đọc hình dung ICA cách trực quan Chương 6: Các nguyên lý ước lượng ICA Chương trình bày khái niệm ICA cách trực quan Trong chương này, số nguyên lý ước lượng ICA khác trình bày như: cực đại tính phi gaussian, cực tiểu lượng tin tương hỗ, cumulant tensor ™ Phần B: Ứng dụng ICA vào tách tín hiệu tiếng nói ICA giải toán với giả sử mô hình tuyến tính mô hình thực tế tín hiệu tiếng nói ghi lại mà mô hình tổng chập miền thời gian nên ICA không áp dụng ICA áp dụng miền tần số miền mô hình tuyến tính Chương 7: Tách tín hiệu tiếng nói phương pháp ICA miền tần số Trình bày phương pháp phân tích STFT, phương pháp chéo hoá đồng thời ma trận xác định dương, giải vấn đề hoán vị ICA Chương 8: Kết Chương trình bày giải thuật cho tách tín hiệu tiếng nói ICA, sử dụng phần mềm Matlab để thực giải thuật đưa số kết ICA đề tài thời gian gân có phát triển mạnh mẽ Đã có nhiều nghiên cứu áp dụng nhiều lónh vực tiềm ứng dụng lớn Việc tiếp tục nghiên cứu ứng dụng mở hướng Trong khuôn khổ Luận Văn, cố gắng tìm hiểu, nghiên cứu, trình bày ICA ứng dụng thực tiễn, trực quan ICA, chắn Luận Văn không tránh khỏi sai sót, mong nhận góp ý q báu q Thầy Cô bạn Tôi xin chân thành cảm ơn! ABSTRACT Speech signal separation is one of the challenging areas of practical application Excellent solutions to these problems are always required for the spoken communication between man and machine in the real world The problem of speech separation arises in the presence of multiple speakers and that of enhancement pertains to reduce the effect of noise and other interfering signals In the read world applications these two problems are often occurring simultaneously and their solutions are urgently required in the development of full-fledged conversational interface The aims and scope of this thesis is also in the same context Recently, Blind Signal Separation (BSS) based on the Independent Component Analysis (ICA) has emerged as a potential engineering solution for speech separation problem Such algorithms word with the assumption of statistical independence of each sources and estimate original source as the independent or least dependent component This thesis also addresses development and application of ICA based algorithm for blind separation of convoluted mixture of speech, observed by a two element linear microphone array, under the over-determined situation The proposed ICA algorithm base on the joint diagonalization of time varying spectral matrices of the observation records The thesis is organized as follows: Section A is an introduction on ICA and some algorithms for ICA Section B is speech signal separation using frequency domain ICA 78 Hình 8.2 Dạng sóng tín hiệu thu phim trường Hình 8.3 Dạng sóng tín hiệu sau tách 79 Đáp ứng xung lọc tách Hình 8.4 W ( f ) (phần thực) Hình 8.5 W ( f ) (phần ảo) 80 Hình 8.6 Đáp ứng xung lọc tách w(n) Đáp ứng xung thu với khoảng cách microphone khác tương tự nhau, khác vị trí xung cực đại Điều thể có độ trễ lan truyền tín hiệu Ngoài có xung nhỏ hai bên xung cực đại thể tác động tín hiệu phản xạ Hình 8.7 Số lần hội tụ băng tần 81 Số lần hội tụ băng tần không giống (hình 8.7) Trong băng tần đầu băng tần gần cuối chưa đạt hội tụ sau 30 bước Do đó, băng tần việc tách tín hiệu chưa đạt hiệu tách cao Hình 8.8 Vị trí tần số xảy hoán vị Sự hoán vị xảy chủ yếu băng tần đầu (hình 8.8) Có thể nhận thấy băng tần xảy hoán vị nằm bên băng tần mà việc tách chưa đạt hội tụ sau 30 bước Đánh giá số tách hoán vị Các kết thu điều kiện phòng thu cách âm tương đối tốt, tiếng vọng lớn Để đánh giá hiệu phương pháp tách ta sử dụng phương pháp sau Tín hiệu tiếng nói người thu riêng biệt, sau trộn lại với theo đáp ứng xung phòng thu có sẵn (hình 8.9), với điều kiện tiếng vọng lớn, lấy từ http://sound.media.mit.edu/ica-bench Từ so sánh 82 kết tách thực với độ dài khung khác nhau, độ dài biến đổi FFT khác nhau, so sánh kết giữ hoán vị tìm hoán vị thực tế Hình 8.9 Đáp ứng xung phòng thu lấy từ http://sound.media.mit.edu/icabench Ta định nghóa số tách (WH )12 ( f )(WH ) 21 ( f ) r( f ) = (WH )11 ( f )(WH ) 22 ( f ) 1/ Trong (WH ) ij ( f ) thành phần thứ ij ma trận W ( f ) H ( f ) Chỉ số biểu diễn mức độ tách băng tần Với hiệu tách tốt, số gần không hay lớn (trong trường hợp nguồn ước lượng bị hoán vị) Khi r ( f ) vượt hoán vị xảy băng tần Hình 8.10 trình bày số tách băng tần r ( f ) vượt xén 83 Hình 8.10 Chỉ số tách Hình 8.11 Các băng tần xảy hoán vị So sánh hình 8.10 hình 8.11, ta nhận thấy giải thuật tìm hoán vị chưa hiệu Vẫn số băng tần có xảy hoán vị phương pháp giải hoán vị trình bày luận văn không phát Để đánh giá hiệu tách ta xét sai số xuyên âm E (cor (s, sˆ )) ma trận tương quan tín hiệu gốc s tín hiệu tách sˆ n ⎛ n ⎞ ⎞ n ⎛ n cij cij − 1⎟ + ∑ ⎜ ∑ − 1⎟ E (c ) = ∑ ⎜ ∑ ⎜ j =1 max k cik ⎟ i =1 ⎜ j =1 max k ckj ⎟ i =1 ⎝ ⎠ ⎝ ⎠ 84 Với kết tách lý tưởng, E không E nhỏ kết tách cao Bảng 8.2 đưa giá trị tham khảo sai số xuyên âm để so sánh với kết luận văn Đánh giá Rất tốt Tốt Kém Chỉ số E 0.2247 1.3773 3.5344 Bảng 8.2 Bảng tham khảo sai số xuyên âm E Thực tách nhiều lần liệu Trong lần tách ta thay đổi chiều dài khung liệu chiều dài biến đổi DFT, sau tính sai số xuyên âm E cho lần tách Kết sai số xuyên âm E trình bày bảng 8.3 Hàng thứ chiều dài khung liệu biến đổi STFT (tính theo ms) Cột thứ chiều dài biến đổi DFT DFT\chiều dài khung 50 100 150 200 250 300 500 512 1,4216 1,9119 1,9680 1,0135 1,1088 2,5641 1,9314 1024 2,7253 2,0326 1,7173 1,9432 1,0422 2,0389 1,9089 2048 1,4874 1,5592 1,7105 1,2339 2,0654 1,2183 1,3135 Bảng 8.3 Bảng sai số xuyên âm E So sánh kết sai số xuyên âm từ bảng 8.3 với bảng tham khảo sai số xuyên âm (bảng 8.2) nhận thấy phần lớn kết tách tốt (gần với giá trị 1,3773) 85 8.3 Kết luận Phương pháp tách cho kết tương đối tốt (đối chiếu sai số xuyên âm E tính với bảng tham khảo sai số xuyên âm), vài băng tần việc tách đạt hiệu chưa cao (chưa đạt hội tụ sau 30 bước) Phương pháp giải hoán vị không phát tất hoán vị xảy Kết tách tốt đạt chiều dài khung 250ms độ dài biến đổi FFT 1024 8.4 Hướng phát triển đề tài Phương pháp trình bày luận văn cho kết tương đối tốt tồn hai vấn đề chưa giải triệt để, số băng tần việc tách chưa có hiệu không phát tất hoán vị xảy Do đó, hướng nghiên cứu tập trung vào giải hai vấn đề Ngoài có số vấn đề luận văn không đưa giải quyết, ví dụ số nguồn nhiều số microphone, nguồn có di chuyển liên tục… Đây hướng mở rộng cho luận văn TÀI LIỆU THAM KHAÛO [1] H Saruwatari, T Kawamura, K Shikano, “Blind source separation for speech based on fast convergence algorithm with ICA and beamforming” Proc EUROSPEECH- 2001, 2603-2606, 2001 [2] T.W.Lee, “Independent component Analysis,” Norway, Kulewar Academic Press, 1998 [3] P.Comon, “Independent component analysis, a new concept?,”Signal Processing, Vol.36, pp.287-314,1994 [4] P Samaragadis, “Blind separation of convolved mixture in frequency domain,” Neural Computing Surveys, vol.2, pp-94-128, 1999 [5] A Hyvarinen, et al, “Independent component analysis,” John Wiley & Sons, Inc., 2001 [6] J.F Cardoso., et al., “Independent component analysis of the cosmic microwave background,” Proc ICA2003, 1111-1116, Nara, Japan, 2003 [7] J.F Cardoso, “On the performance of orthogonal source separation algorithms,” Proc of EUSIPCO-94, Edinburgh, 1994 [8] A Hyvärinen, “Survey on independent component analysis”, Neural Computing Surveys, 94-128, 1999 [9] A Hyvärinen, “Fast and robust fixed-point algorithms for independent component analysis,” IEEE Transactions on Neural Networks 10(3):626-634, 1999 [10] A Hyvärinen, Juha Karhunen, Erkki Oja “Independent component analysis,” John Wiley & Sons, 2001 [11] J.P.LeBlanc, P L DeLeon, “Speech Separation by Kurtosis Maximization,” IEEE Int.Conf on Acoustics, Speech and Signal Processing, Seattle, WA, May, 1998 [12] A Hyvärinen and E Oja, “A fast fixed-point algorithm for independent component analysis,” Neural Computation, 9(7):1483-1492, 1997 [13] E Bingham et al., “A fast fixed point algorithm for independent component analysis of complex valued signal,” Int J of Neural System, 10(1)1: 8, 2000 [14] N Mitianoudis, N Davies, “New fixed-point solution for convolved audio source separation,” Proc IEEE Workshop on Application of Signal Processing on Audio and Acoustics, New York, 2001.151 [15] R.K Prasad, H.Saruwatari, A Lee, K Shikano, “A fixed point ICA algorithm for convoluted speech separation,” Proc International Symposium on ICA &BSS, pp-579-584, Nara, Japan, 2003 [16] S.Kurita, H.Saruwatari, S.Kajita, K.Takeda, and F Itakura, “Evaluation of blind signal separation method using directivity pattern under reverberant condition,” Proc ICASSP2000, vol.5, pp.3140-3143, 2000 [17] R K Prasad, H Saruwatari, K Shikano, “Problems in blind separation of convolutive speech mixture by negenotropy maximization”, Proc IWAENC 2003, Kyoto, Japan, 287-290, 2003 [18] J.F Cardoso, “Eigenstructure of 4th order cumulants tensor with application to the blind source separation problem,” Proc ICASSP’89, 2109-2112, 1989 [19] J.F Cardoso, C.N.R.S, E.N.S.T, “Blind signal separation: statistical principles,” Proc of IEEE, vol.9, no.10, pp-2009-2025, Oct.1981 [20] S Araki et al., “The fundamental relation of frequency domain blind source separation for convolute mixtures of speech,” IEEE Trans Speech and Audio Processing, Vol 11, no.2, 109-116, 2003 [21] S Ikeda., S Murata, “A method of ICA in time-frequency domain”, Proc Workshop Indep Compon Anal Signal Sep., 365-367, 1999 [22] T Nishikawa, et al., “Blind source separation of acoustic signals based on multistage ICA combining frequency-domain ICA and time-domain ICA,” IEICE Trans Fundamentals, Vol.E86-A, pp.846-58, no.4, April, 2003 [23] E Bingham, “Advances in independent components analysis with applications to data mining,” Ph.D Thesis, Helsinky University of Technology, Finland, 2003 [24] H Sawada, R Mukai, S Araki, S.Makino, “A robust approach to the permutation problem of frequency-domain blind source separation,” IEEE International Conference on Acoustics, Speech, and Signal (ICASSP2003), 381384, 2003 [25] R Scott, et al., “Real-time time-frequency based blind source separation,” Proc Of ICA2001, Dec 9-13, San Diego, CA, 2001 [26] D.L Richards, “Statistical properties of speech signal,” Proc IEE, vol.111, no 5, pp 941-49, 1964 [27] S.Gazor and W Zhang, “Speech probability distribution,” IEEE Signal Processing Letters, vol.10, no.7, July 2003 [28] R K Prasad, H Saruwatari, K Shikano, “Probability distribution of the time-series of speech spectral component,” Journal of IEIEC Trans Fundamental, vol.E87-A, no.3, March 2004 [29] R Mukai, S Araki, and S Makino, “Separation and dereverberation performance of frequency domain blind source separation,” in Proceeding of ICA 2001Conference, San-Diego, USA, Dec 2001, pp 230–235 [30] L Parra and C Spence, “On line blind source separation of non stationary signals,” J VLSI Signal Proc Systems for Signal, Images and Video Tech., vol 26, no 8, pp 15–24, 2000 [31] L Parra and C Spence, “Convolutive blind source separation of nonstationary sources,” IEEE Trans On Speech and Audio Processing, vol 8, no 3, pp 320–327, May 2000 [32] D T Pham and J.-F Cardoso, “Blind separation of instantaneous mixtures of non stationary sources,” IEEE Trans Signal Processing, vol 49, no 9, pp 1837–1848, 2001 [33] H.-C Wu and J C Principe, “Simultaneous diagonalization in the frequency domain (SDIF) for source separation,” in Proceeding of ICA 1999 Conference, Aussois, France, Jan 1999, pp 245–250 [34] D T Pham, “Joint approximate diagonalization of positive definite matrices,” SIAM J on Matrix Anal And Appl., vol 22, no 4, pp 1136–1152, 2001 [35] P Smaragdis, “Blind separation of convolved mixtures in the frequency domain,” in InternationalWorkshop on Independence & Artificial Neural Networks, University of La Laguna, Tenerife, Spain, Feb 1998 [36] J Anemăuler and B Kollmeier, Amplitude modulation decorrelation for convolutive blind source separation,” in Proceeding of ICA 2000 Conference, Helsinki, Finland, June 2000, pp 215–220 [37] D.T Pham, C Servi`ere, and H Boumaraf, “Blind separation of convolutive audio mixtures using nonstationarity,” in Proceeding of ICA 2003 Conference, Nara, Japan, Apr 2003 [38] Ziehe, Laskov and Nolte,”A fast algorithm for joint diagonalization with application to blind source separation,” September 23, 2003 [39] Ziehe, Laskov, Muller and Nolte,”A linear least-squares algorithm for joint diagonalization”, Nara, Japan, Apr 2003 [40] R K Prasad, “Fixed-Point ICA based Speech Signal Separation and Enhancement with Generalized Gaussian Model”, Japan, Feb 2, 2005 PHỤ LỤC Định dạng file *.wav: File *.wav file lưu trữ liệu âm Microsoft đề xuất File *.wav có cấu trúc sau: Trong header file chứa thông tin tính chất file *.wav như: tần số lấy mẫu, số byte mã hoá mẫu, độ dài file, … Khi mẫu âm ghi byte giá trị số không dấu từ đến 255 nên ta chọn 128 mức zero làm tiêu chuẩn Khi mẫu âm ghi hai byte giá trị số có dấu từ -32768 đến 32767 Với âm Stereo hai kênh ghi xen kẽ, kênh trái trước kênh phải sau TÓM TẮT LÝ LỊCH TRÍCH NGANG Họ tên: ĐÀO NGỌC MINH Phái: Nam Ngày, tháng, năm sinh: 23/06/1979 Nơi sinh: Bắc Ninh Địa liên lạc: 718B/D67 Hùng Vương, Phường 13, Quận 6, Thành phố Hồ Chí Minh Quá trình đào tạo: Từ năm 1997-2002: học Đại học Trường Đại Học Bách Khoa -Đại Học Quốc Gia Tp.Hồ Chí Minh, khoa Điện-Điện Tử Từ năm 2003 đến nay: học Cao học Trường Đại Học Bách Khoa -Đại Học Quốc Gia Tp.Hồ Chí Minh, ngành Kỹ thuật Vô Tuyến Điện Tử Quá trình công tác: Từ năm 09/2002 đến nay: công tác Phòng Sản Xuất Chương trình, Đài Truyền hình Tp Hồ Chí Minh ... TÀI: TÁCH TÍN HIỆU TIẾNG NÓI SỬ DỤNG PHƯƠNG PHÁP PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP II-NHIỆM VỤ VÀ NỘI DUNG: Tách tín hiệu tiếng nói người nói đồng thời ghi microphone • Phương pháp phân tích thành phần. .. phân tích thành phần độc lập • Ứng dụng phương pháp phân tích thành phần độc lập miền tần số vào tách tín hiệu tiếng nói • Thực mô Matlab III-NGÀY GIAO NHIỆM VỤ: IV-NGÀY HOÀN THÀNH NHIỆM VỤ: V-HỌ... Chương 4: Phân tích thành phần whitening Whitening, phương pháp trắng hoá liệu, dựa phân tích thành phần mang ý nghóa quan trọng ICA phần nhiệm vụ ICA Chương 5: Phân tích thành phần độc lập Từ chương

Ngày đăng: 09/02/2021, 15:35

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w