Nghiên cứu phát triển một số giảI thuật xử lý mù tín hiệu và ứng dụng Nghiên cứu phát triển một số giảI thuật xử lý mù tín hiệu và ứng dụng Nghiên cứu phát triển một số giảI thuật xử lý mù tín hiệu và ứng dụng luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI ============= VƯƠNG HOÀNG NAM NGHIÊN CỨU, PHÁT TRIỂN MỘT SỐ GIẢI THUẬT XỬ LÝ MÙ TÍN HIỆU VÀ ỨNG DỤNG LUẬN ÁN TIẾN SỸ KỸ THUẬT VIỄN THÔNG Hà Nội -2012 ii BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI ============= NGHIÊN CỨU, PHÁT TRIỂN MỘT SỐ GIẢI THUẬT XỬ LÝ MÙ TÍN HIỆU VÀ ỨNG DỤNG LUẬN ÁN TIẾN SỸ KỸ THUẬT VIỄN THÔNG Người hướng dẫn khoa học: PGS.TS Nguyễn Quốc Trung PGS.TSKH Trần Hoài Linh Hà Nội -2012 iii Lời cam đoan Tác giả xin cam đoan cơng trình nghiên cứu riêng tác giả, khơng chép người Các số liệu kết nêu luận án hoàn toàn trung thực chưa công bố Tác giả iv Lời cảm ơn Tôi xin chân thành cảm ơn PGS.TS Nguyễn Quốc Trung PGS.TSKH Trần Hoài Linh người nhiệt tình hướng dẫn giúp đỡ tơi nhiều q trình nghiên cứu hoàn thành Luận án Cũng xin chân thành cảm ơn Viện Sau Đại học, Viện Điện tử -Viễn thông, Trường Đại học Bách Khoa Hà nội tạo điều kiện thuận lợi để tơi hồn thành nhiệm vụ nghiên cứu Tơi bày tỏ lịng biết ơn đến Ba mẹ, anh chị em, đồng nghiệp bạn bè người ủng hộ động viên giúp đỡ thời gian làm Luận án v MỤC LỤC DANH MỤC CÁC HÌNH VẼ DANH MỤC CÁC BẢNG KÝ HIỆU TOÁN HỌC CÁC TỪ VIẾT TẮT MỞ ĐẦU 1 Mục đích nghiên cứu Những giới hạn nghiên cứu luận án Phương pháp nghiên cứu Cấu trúc luận án Ý nghĩa khoa học thực tiễn CHƯƠNG CƠ SỞ LÝ THUYẾT BÀI TOÁN XỬ LÝ MÙ 1.1 Bài toán phân tách mù nguồn tin 1.2 Mô hình BSS tuyến tính 1.2.1 Giới thiệu 1.2.2 Phương pháp Phân tích thành phần độc lập 10 Phương pháp ICA sử dụng tính phi Gauss 12 Phương pháp ICA sử dụng thông tin hỗ tương 18 Phương pháp ICA sử dụng tính phi tương quan phi tuyến 19 Phương pháp ICA sử dụng thống kê bậc cao 20 1.2.3 Thuật toán FastICA 20 Quá trình tiền xử lý 20 Xấp xỉ hóa negentropy 22 Thuật toán FastICA 23 1.3 Mơ hình BSS trộn chập 26 1.3.1 Giới thiệu 26 1.3.2 Phương pháp TD-ICA 27 1.3.3 Phương pháp FD-ICA 28 1.3.4 Thuật toán Fast-ICA phức 32 1.4 Phương pháp đánh giá chất lượng phân tách 33 1.4.1 Đánh giá chất lượng phân tách mơ hình BSS tuyến tính 33 vi 1.4.2 Đánh giá chất lượng phân tách mơ hình BSS trộn chập 34 1.5 Kết luận 37 CHƯƠNG ỨNG DỤNG THUẬT TỐN FAST-ICA TRONG BSS TUYẾN TÍNH 38 2.1 Minh họa thuật toán FastICA 38 2.2 Ứng dụng FastICA để loại bỏ nhiễu tín hiệu điện tim ECG 41 2.4 Thuật toán IP-FastICA 46 2.5 Kết luận 53 CHƯƠNG PHÂN TÁCH MÙ ÂM THANH TRONG MIỀN THỜI GIAN 54 3.1 Giới thiệu 54 3.2 Quá trình sai số dự báo chuỗi tốt 54 3.3 Thuật toán đề xuất 57 3.3.1 Quá trình xác định IP 57 3.3.2 Q trình khơi phục tín hiệu 58 3.3.3 Thuật toán đề xuất 61 3.4 Các kết mô 62 3.5 Kết luận 65 CHƯƠNG PHÂN TÁCH MÙ ÂM THANH TRONG MIỀN TẦN SỐ 65 4.1 Giới thiệu 66 4.2 Phương pháp sử dụng hướng góc tới DOA 68 4.2.1 Một số khái niệm 68 4.2.2 Giải tốn bất định vị trí phương pháp DOA 72 4.2.3 Ưu, nhược điểm phương pháp DOA 77 4.3 Phương pháp sử dụng tính chất tương quan chéo 77 4.4 Phương pháp sử dụng tốn phân cơng việc 78 4.4.1 Giới thiệu phương pháp 78 4.4.2 Thủ tục kiểm tra 81 vii 4.4.3 Thuật toán Hungarian 82 4.5 Thuật toán đề xuất kết hợp DOA AP 84 4.6 Thuật toán ICA 86 4.7 Các kết mô 87 4.7.1 Kết mơ thuật tốn AP 87 4.7.2 Kết mô thuật toán DOAP 94 4.8 Kết luận 97 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI 98 TÀI LIỆU THAM KHẢO 101 CÁC CƠNG TRÌNH KHOA HỌC 110 viii DANH SÁCH CÁC HÌNH VẼ Hình 1-1 Mơ hình tốn BSS tổng qt Hình 1-2 Mơ hình giải tốn BSS Hình 1-3 Minh họa xử lý mù tốn cocktail Hình 1-4 Mơ hình đánh giá BSS tuyến tính Hình 1-5 Hàm mật độ xác suất phân bố Gauss Hình 1-6 Hàm mật độ phân bố Laplace Hình 1-7 Phân bố Hình 1-8 Minh họa định lý giới hạn trung tâm Hình 1-9 Sự phân bố chung thành phần độc lập s1 s2 Hình 1-10 Mật độ thành phần độc lập phân bố Hình 1-11 Sự phân bố chung x1 x2 Hình 1-12 Mật độ phân bố tín hiệu trộn Hình 1-13 Minh họa thu âm thực tế Hình 1-14 Minh họa TD-ICA với N =2 Hình 1-15 Sự phụ thuộc chất lượng FD-ICA độ rộng hàm cửa sổ Hình 1-16 Minh họa phương pháp FD-ICA Hình 1-17 Minh họa phương pháp đánh giá so sánh ảnh phổ Hình 2-1 Lưu đồ thuật tốn FastICA Hình 2-2 Tín hiệu nguồn ban đầu Hình 2-3 Tín hiệu trộn Hình 2-4 Những tín hiệu ước lượng theo phương pháp ICA Hình 2-5 Ảnh viễn thám băng Hình 2-6 Ba thành phần độc lập (IC1, IC2 IC3) Hình 2-7 (a)-ECG, (b)-nhiễu gián đoạn, (c)-nhiễu liên tục Hình 2-8 Tín hiệu ECG có nhiễu (SNR=5dB) ix Hình 2-9 Tín hiệu ECG loại bỏ nhiễu (trên) tín hiệu nhiễu (dưới) Hình 2-10 Mối liên hệ ρ M d = Hình 2-11 Kết mơ Hình 2-12 Ma trận đặc tính P kết mơ Hình 2-13 Ảnh gốc mơ Hình 2-14 Ảnh trộn mơ Hình 2-15 Ảnh khơi phục mơ Hình 3-1 Q trình xây dựng tín hiệu thu từ IP Hình 3-2 Minh họa lọc Wiener Hình 3-3 Kết thực nghiệm với hàm G3 Hình 3-4 Mơ thuật tốn với CSDL Dr.Te Won Lee Hình 3-5 Mơ thuật tốn với CSDL tác giả Shiro Ikeda Hình 4-1 Vị trí tọa độ micro nguồn âm Hình 4-2 Minh họa khoảng hở Hình 4-3 Minh họa mảng microphone ULA Hình 4-4 Minh họa vị trí micro nguồn Hình 4-5 Minh họa giản đồ phương hướng Hình 4-6 Minh họa giản đồ phương hướng bin tần số f1 f Hình 4-7 Minh họa khoảng cách KL bin tần số liền kề Hình 4-8 Minh họa ứng dụng AP tốn bất định vị trí với N = Hình 4-9 Minh họa tiêu chuẩn đánh giá độ tin cậy phương pháp DOA Hình 4-10 Mơ tách CSDL Dr.Te Won Lee thuật toán AP Hình 4-11 Cấu hình phịng thu âm dùng để mơ Hình 4-12 Các hàm đáp ứng xung phịng thu khơng độ vang Hình 4-13 Các tín hiệu nguồn ban đầu mơi trường thu khơng độ vang Hình 4-14 Các tín hiệu thu mơi trường thu khơng độ vang Hình 4-15 Các tín hiệu phân tách phương pháp sử dụng JADE-FastICA x Hình 4-16 Giá trị RT60 phịng thu có độ vang Hình 4-17 Hàm đáp ứng xung phịng thu có độ vang Hình 4-18 Các tín hiệu thu phịng thu có độ vang Hình 4-19 Kết phân tách tín hiệu phương pháp AP Hình 4-20 Kết phân tách tín hiệu phương pháp DOAP Hình 4-21 So sánh kết phân tách tín hiệu DOAP DOA+CC Hình 4-22 Cấu hình phịng thu thực nghiệm Dr.Sawada Hình 4-23 Các tín hiệu nguồn tín hiệu thu microphone Hình 4-24 Kết phân tách sử dụng phương pháp DOAP Hình 4-25 Kết phân tách sử dụng thuật toán Dr.Prasad DANH SÁCH CÁC BẢNG Bảng 2-1 So sánh sai số PI Bảng 2.2 So sánh PSNR Bảng 3-1 Kết so sánh Bảng 4-1.Quan hệ chất lượng phân tách độ rộng cửa sổ Bảng 4-2 So sánh thời gian tính tốn hai thuật toán Bảng 4-3 So sánh giá trị SIR trung bình hai thuật tốn 97 ta thấy kết thuật toán đề xuất DOAP tốt kết thu từ thuật toán Prasad Separated Signal #1 Amplitude 0.2 0.1 -0.1 -0.2 0.5 1.5 2.5 time 3.5 4.5 5.5 x 10 Separated Signal #2 Amplitude 0.2 0.1 -0.1 -0.2 0.5 1.5 2.5 time 3.5 4.5 5.5 x 10 Hình 4-25 Kết phân tách sử dụng thuật toán Prasad 4.8 Kết luận Chương bốn tập trung vào hai phương pháp giải tốn bất định vị trí FD-ICA phương pháp hướng góc tới nguồn âm (DOA) phương pháp tốn phân cơng việc (AP) Ưu điểm bật phương pháp DOA so phương pháp AP tính bền vững việc xác định bất định vị trí bin tần số dựa việc đánh giá ma trận tách bin tần số mà khơng ảnh hưởng đến bin tần số lân cận Trong việc xác định bất định vị trí bin tần số AP dựa kết xác định bin liền trước việc xác định sai bin ảnh hưởng tới bin Nhược điểm phương pháp DOA điều kiện giả thiết sóng phẳng mơi trường khơng có độ vang làm cho phương pháp trở nên khơng xác phịng thu âm phức tạp có độ vang lớn Do đó, sử dụng kết hợp hai phương pháp DOA AP (thuật toán DOAP) nhằm khắc phục nhược điểm DOA AP Việc kết hợp hai phương pháp nêu nhằm tận dụng hết ưu điểm hạn chế nhược điểm phương pháp Phương pháp xem bền vững xác phương pháp DOA làm hạn chế việc hiệu ứng xếp sai dây chuyền AP, AP làm tăng độ xác DOA tần số thấp cao Bên cạnh đó, phương pháp AP, chương bốn đưa số thủ tục bao gồm: thủ tục kiểm tra thủ tục khởi tạo giá trị ma trận ban đầu thuật tốn JADE qua làm giảm thời gian tính tốn nâng cao chất lượng phân tách so với phương pháp AP đề xuất trước 98 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI Mục đích luận án xây dựng, cải tiến số giải thuật phân tách mù nguồn tin nhằm nâng cao chất lượng phân tách Luận án đề xuất đưa số giải thuật hiệu cho toán BSS tuyến tính trộn chập Các kết mơ đưa nhằm chứng minh tính hiệu giải thuật Phần đóng góp luận án trình bày đây: 1) Phương pháp loại bỏ nhiễu cho tín hiệu điện tâm đồ sử dụng phương pháp ICA: Mơ hình đưa sử dụng thuật tốn FastICA tuyến tính để loại bỏ nhiễu tín hiệu ECG Điểm phương pháp sử dụng tín hiệu ECG kênh chuyển đạo thay sử dụng nhiều kênh chuyển đạo phương pháp loại nhiễu ECG sử dụng ICA trước Ưu điểm trội phương pháp sử dụng ICA so với phương pháp lọc nhiễu trước việc loại bỏ nhiễu đạt kết tốt tỷ số Tín hiệu/Tạp âm thấp 2) Một thuật tốn IP-FastICA tuyến tính sử dụng khái niệm sai số dự báo chuỗi tốt trường hợp nguồn tín hiệu ban đầu có tương quan phụ thuộc thời gian Kết mô nhiều trường hợp tín hiệu ban đầu có tương quan thời gian, việc phân tách mù tín hiệu thuật tốn cho kết tốt thuật toán ICA tuyến tính thơng dụng trước Các đặc tính (tính so với [9]) IP-FastICA trình bày luận án gồm có: • Đưa lựa chọn sử dụng mơ hình AR (1) để tính IP mơ hình AR với bậc p > làm tăng khối lượng thời gian tính tốn thuật tốn đáng kể không đảm bảo cải thiện kết phân tách so với AR (1) • Xây dựng bước thực thuật tốn IP-FastICA 3) Đối với TD-ICA, luận án phát triển thuật toán tác giả J.Thomas et al [48,49], ban đầu xây dựng cho ứng dụng tách mù ảnh vật lý học thiên thể làm công cụ để tách chập mù âm miền thời gian Trong phần này, luận án đưa mơ hình phân tách mù âm miền thời gian dựa khái niệm sai số dự báo chuỗi tốt 99 4) Đối với FD-ICA, thuật toán khác chủ yếu cách giải toán bất định vị trí bin tần số Trong luận án tập trung vào hai phương pháp giải tốn bất định vị trí phương pháp hướng góc tới nguồn âm (DOA) phương pháp toán phân công việc (AP) Ưu điểm bật phương pháp DOA so phương pháp AP tính bền vững việc xác định bất định vị trí bin tần số dựa việc đánh giá ma trận tách bin tần số mà khơng ảnh hưởng đến bin tần số lân cận Trong việc xác định bất định vị trí bin tần số AP dựa kết xác định bin liền trước việc xác định sai bin ảnh hưởng tới bin Nhược điểm phương pháp DOA điều kiện giả thiết sóng phẳng mơi trường khơng có độ vang (sẽ làm cho phương pháp trở nên khơng xác phịng thu âm phức tạp có độ vang lớn Ngồi ra, kể điều kiện giả định chấp nhận tồn thiếu xác việc đánh giá hướng góc tới bin tần số thấp khác pha tạo khoảng cách microphone nhỏ, bin tần số cao sai số không gian Một nhược điểm phương pháp việc đánh giá hướng góc tới trở nên khó khăn số nguồn âm lớn Do luận án đưa thuật toán hiệu sử dụng kết hợp hai phương pháp DOA AP (thuật toán DOAP) nhằm khắc phục nhược điểm DOA AP Trong phương pháp DOA việc xác định vị trí dựa DP ma trận tách thường thiếu xác bin tần số thấp tần số cao Trong phương pháp AP, việc xếp sai bin tần số làm ảnh hưởng đến việc xếp bin tần số Trong phương pháp đề xuất DOAP, ta sử dụng hai phương pháp DOA AP Việc kết hợp hai phương pháp nêu nhằm tận dụng hết ưu điểm hạn chế nhược điểm phương pháp Việc xếp trước tiên tiến hành DOA bin tần số mà độ tin cậy phương pháp cao Đối với bin tần số lại, việc xếp thực AP dựa khái niệm khoảng cách Kullback-Leibler đối xứng bin liền với giả thiết việc xếp trước DOA không thay đổi Phương pháp xem bền vững xác phương pháp DOA làm hạn chế việc hiệu ứng xếp sai dây chuyền AP, AP làm tăng độ xác DOA Bên cạnh đó, phương pháp AP, luận án đưa số thủ tục bao gồm: thủ tục kiểm tra thủ tục khởi tạo giá trị ma trận ban đầu thuật tốn JADE qua làm giảm thời gian tính toán nâng cao chất lượng phân tách so với phương pháp AP trước 100 Luận án tập trung nghiên cứu số khía cạnh toán phân tách mù nguồn tin xây dựng phát triển số thuật toán xử lý mù Các thuật toán nghiên cứu luận án không dùng cho âm mà cịn ứng dụng nhiều lĩnh vực Hướng phát triển khác thực luận án ứng dụng giải thuật mù vào lĩnh vực ảnh viễn thám (đề tài cấp Bộ, B2010-01-372), xử lý phân tích tín hiệu y sinh học (đề tài cấp Bộ trọng điểm, B2012-01-25) 101 TÀI LIỆU THAM KHẢO TIẾNG VIỆT [1] Nguyễn Quốc Trung, Xử lý tín hiệu lọc số, tập 1, NXB Khoa học kỹ thuật 2004 [2] “Một phương pháp phân tách mù nguồn tin sử dụng sai số dự báo tốt thuật tốn FastICA,” Tạp chí Khoa học & Công nghệ Trường Đại học Kỹ thuật, trang 1-6, Số 81, tháng 3/2011 [3] “Loại bỏ nhiễu tín hiệu điện tim ECG phương pháp phân tích thành phần độc lập,” Hội nghị tồn quốc điều khiển tự động hóa VCCA 2011, pp.813-817, ngày 25-26/ 11, 2011 [4] Võ Minh Sơn, Nguyễn Hữu Phương “Tách ảnh dùng biến đổi wavelet Phân tích thành phần độc lập,” Tạp chí Phát triển KH&CN, số 11, 9/2008 [5] Nghiên cứu ứng dụng xử lý tín hiệu mù vào phân tích ảnh viễn thám thu từ vệ tinh, Báo cáo tổng kết đề tài cấp Bộ mã số B2010-01-372, 7/2011 TIẾNG ANH [6] Aapo Hyvarinen, Juha Karhunen and Erkkl Oja, Independent Component Analysis, John Wiley and Sons Ltd, 2001 [7] A.Hyvarien, “Fast and robust fixed-point algorithms for independent component analysis,” IEEE Trans On Neural Networks, 10(3): 626-634, 1999 [8] Aapo Hyvarinen et al, “ Independent component analysis: Algorithms and Applications,” Neural Networks, 13(4-5):411-430, 2000 [9] Aapo Hyvarinen, “Independent component analysis for time dependent stochastic processes,” Proc.Int.Conf on Artificial Neural Networks ICANN’98 [10] A Cichocki, “Blind Signal Separation and Extraction: Recent Trends, Future Perspectives, and Applications”, Lecture Notes in Computer Science, Artificial intelligence and Soft Computing 3070, 30-37 (2004) 102 [11] A.Cichocki et al, "A blind extraction of temporally correlated but statistically dependent acoustic signals,” Neural Network for Signal Processing, X, 2000, Proceedings of the 2000 IEEE Signal Processing Society Workshop, vol.1, pp 455-464 [12] A.Belouchrani et al, “A blind source separation technique based on second order statistics,” IEEE Trans.on Signal Processing, 45(2): 434-444, 1997 [13] A.Kizilaya et al, “Estimation of the ARMA model parameters based on the equivalent MA Communications, approach,” The second Control and Signal IEE-EURASIP Int.Symp.on processing, ISCCSP’06 Marrakech,Marocco, 2006 [14] A.Ciaramella and R.Tagliaferri, “Separation of Convolved Mixtures in Frequency Domain ICA,” International Mathematical Forum no.16, pp.769795, 2006 [15] A.J.Bell and T.J Sejnowski, “ An information-maximization approach to blind separation and blind deconvolution,” Neural Computation (7):11291159,1995 [16] B.Gardner and K.Martin, Head Related Transfer Functions of a Dummy Head [17] C.Jutten and J.Herault, “Independent component analysis versus principal component analysis,” Signal Processing, vol.IV, pp 643-646, Elsevier, Amsterdam, 1988 [18] Ch.Servière and D.-T Pham, “ Permutation correction in the frequencydomain in blind separation of speech mixtures,” EURASIP Journal on Apllied Signal Processing , 2006 [19] C.Simon et al,” Blind source separation of convolutive mixtures by maximization of fourth order cumulants: the non-iid case,” Proceedings of The Thirty-Second Asilomar Conference on Signals, Systems & Computers, November 1998, vol.2 , pp.1584-1588 103 [20] D.Bertsekas, “The Auction Algorithm for Assignment and Other Network Flow Problems,” Interfaces 20 (1990), pp 133-149 [21] Dinh-Tuan Pham and Jean-Franỗois Cardoso, “Blind separation of instantaneous mixtures of non stationary sources,” IEEE Trans Signal Processing, pp 1837-1848, vol 49, no 9, 2001 [22] Don.H.Johnson and Sinan Sinanovic, “Symmetrizing the Kullback-Leibler Distance,” IEEE Transactions on Information Theory, 2001 [23] D.Schobben, K.Torkkola, and P.Smagradis, “ Evaluation of blind signal separation methods,” in Proc.Int.Symposium on ICA and BSS (ICA 99), Aussois, Jan.1999, pp 261-266 [24] E.Bingham and A.Hyvarinen,“A fast fixed-point algorithm for independent component analysis of complex-valued signals, ” International Journal of Neural Systems 10, pp.1-8, 2000 [25] Emmanuel Vincent et al., “Performance Measurement in Blind Audio Source Separation,” IEEE Trans on Audio,Speech and Language Processing, Vol.14,No.4, pp 1462-1469, July 2006 [26] F.Abrard et al,”Blind source separation in convolutive mixtures:a hybrid approach for colored sources,” IWANN 2001, LNCS2085, pp 802-809,2001 [27] G.Agrawal et al, “Reduction of artifacts in 12-channel ECG signals using FastICA algorithm,” Journal of Scientific & Industrial Research, vol.67, 2008, p.43-48 [28] http://sound.media.mit.edu/ica-bench/ [29] http://www.media.mit.edu/~westner [30] http://tsi.enst.fr/icacentral/Algos/prasad/Bss4Speech.zip [31] http://www.kecl.ntt.co.jp/icl/signal/sawada/demo/bss2to4/index.html [32] http://www.ism.ac.jp/~shiro/research/blindsep.html [33] http://bass-db.gforge.inria.fr/BASS-dB?show =browse&id=toolbox [34] http://media.paisley.ac.uk/campbell/Roomsim/ 104 [35] http://physionet.org/physiotools/ecgsyn/ [36] H.Sawada et al., “A robust and precise method for solving the permutation problem of frequency-domain blind source separation,” IEEE Trans Speech Audio Process, vol.12, no.5, pp.530-538, Sep.2004 [37] H Sawada et al, “A robust approach to the permutation problem of frequency domain blind source separation,” IEEE International Conference on Acoustic, Speech and Signal Processing (ICASSP 2003), vol.5, 2003 [38] H Saruwatari, S Kurita, K Takeda, F Itakura, T Nishikawa, and K Shikano, “Blind Source Separation Combining Independent Component Analysis and Beamforming," EURASIP Journal on Applied Signal Processing, Vol.2003, No.11, pp.1135 1146, 2003 [39] He Taigang et al, “Application of independent component analysis in removing artefacts from the ECG,” Neural Comput & Appl., 2006, pp.105116 [40] J.Benesty, S.Makino and J.Chen, Speech Enhancement Springer, 2005 [41] Jani Even, Norihiro Hagita, “Resolving FD-BSS permutation for arbitrary array in presence of spatial aliasing” ICASSP 2011, pp 13-16 [42] Jani Even et al., “Blind signal extraction based joint suppression of diffuse background noise and late reverberation,” 18th EUSIPCO 2010, Aalborg, Denmark, 23-27 August, 2010 [43] Jean-Franỗois Cardoso, “High-order contrasts for independent component analysis,” Neural Computation, vol 11, no 1, pp 157 192, Jan 1999 [44] Jean-Franỗois Cardoso, “Blind signal separation: statistical principles,” Proceedings of the IEEE, vol 90, n 8, pp 2009-2026, Oct 98, special issue on blind identification and estimation [45] Jean-Franỗois Cardoso and Antoine Souloumiac, “ Blind beamforming for non Gaussian signals,” IEE-Proceedings-F, vol.140, no 6, pp.362-370, 1993 105 [46] J.Munkres, "Algorithms for the Assignment and Transportation Problems," Journal of the Society of Industrial and Applied Mathematics, 5(1): 32-38, 1957 March [47] J.K.Tugait, “Identification and deconvolution of multichannel linear nonGaussian processes using higher order statistics and inverse filter criteria,” IEEE Transactions on Signal Processing, vol.45, No 3, March 1997 [48] Johan Thomas et al “Time Domain Fast Fixed Point Algorithms for Convolutive ICA,” IEEE Signal Processing Letters, Vol 13, No 4, April 2006 [49] J.Thomas, Y.Deville, S.Hoseini “Differential fast fixed-point algorithms for underdetermined instantaneous and covolutive partial blind source separation,” IEEE Transactions on Signal Processing, vol.55, no.7, July 2007 [50] K.Kokkinakis and A.K.Nandi, “ Multichannel blind deconvolution for source separation in convolutive mixtures of speech,” IEEE transactions on audio, speech and language processing, vol.14, no.1 , January 2006 [51] K.Torkkola, “Blind separation of convolved sources based on information maximization,” in Proc.IEEE Workshop on Neural Networks and Signal Processing (NNSP’96), pp 423-432, Kyoto, Japan, 1996 [52] Le Huy Phuong, Nguyen Van Du, and Nguyen Linh-Trung, "Implementation of time-frequency blind source separation in EEGLAB", in Proceedings of the 2nd International Conference on the Development of Biomedical Engineering in Vietnam, Hanoi, July 2007, Vietnam [53] L.Molgedey and H.G.Schuster, “Separation of a mixture of independent signals using time delayed correlations,” Physical Review Letter, 72(23): 3634-3637, 1994 [54] L.R.Rabiner and R.W.Schafer, Digital Processing of Speech Signals, PrenticeHall, Upper Saddle River, NJ, USA, 1983 [55] Lang Tong, “ Identification multichannel MA parameters using higher order statistics,” Elsevier, Signal processing 53 (1996), pp 195-209 106 [56] Monson H.Hayes, Statistical Digital Signal Processing and Modeling , John Wiley & Sons,Ltd, 1996 [57] M.Knaak,S.Araki and S Makino, “Geometrically Constrained Independent Component Analysis,”' IEEE Trans Speech and Audio Processing, vol 15, no 2, pp.715 726, 2007 [58] N Delfosse and P Loubaton, "Adaptive blind separation of convolutive mixtures," ICASSP’96:Proceedings of the Acoustics,Speech, and Signal Processing, 1996 IEEE International Conference, vol 5, pp.2940-2943 [59] N.Mitianoudis and M.E.Davies,”Audio source separation of convolutive mixtures,” IEEE Transactions on Speech Audio Process, vol.11, no.5, pp 489497, Sep.2003 [60] N.Mutara, S.Ikeda and A.Ziehe, “An approach to blind source separation based on temporal structure of speech signals,” Neurocomputing, 41, 2001, pp.1-24 [61] P.Smaragdis, “ Blind separation of convolved mixtures in frequency domain,” Neurocomputing, No.22, pp 21-34, 1998 [62] P.Smaragdis, Information theoretic approaches to Source Separation, Media Lab, M.I.T, Master thesis, 1997 [63] P.Common, “Independent Component Analysis - a new concept ?,” Signal Processing, 36(3): 287-314, 1994 [64] P.Tichavsky and Z.Koldovsky, “Optimal pairing of signal components separated by blind techniques,” IEEE Signal Processing Letters,Vol 11, No.2 pp 119122, 2004 [65] Peng Xie and S.L.Grant, “A fast and efficient frequency domain method forconvolutive blind source separation, ” Region IEEE Conference 2008 Kansas City MO, pp.1-4, April, 2008 107 [66] Peter Jancovic etal., “Underdetermined DOA estimation via independent component analysis and time-frequency masking,” Jounal of Electrical and Computer Engineering, article no.36, vol.2010, January 2010 [67] Rajkishore Prasad, Hiroshi Saruwatari, and Kiyohiro Shikano, “An fixed point ICA algorithm for convoluted speech signal separation,” Proceedings of Fourth International Symposium on ICA and BSSJournal of Signal Processing, pp.579-584, April 2003 [68] R.Jonker and A.Volgenant, “A Shortest Augmenting Path Algorithm for Dense and Sparse Linear Assignment Problems,” Computing 38, pp.325340,1987 [69] R.Lambert, “Difficulty measures and figures of merit for source separation,” in Proc.Int.Symposium on ICA and BSS (ICA 99), Aussois, Jan.1999, pp 133138 [70] S Araki, S Makino, R Mukai, T Nishikawa, and H Saruwatari, “The fundamental limitation of frequency domain blind source separation for convolutive mixtures of speech,” IEEE Transactions on Speech and Audio Processing, Vol.11, No.2, pp.109-116, March 2003 [71] S Araki, H Sawada, R Mukai, and S Makino, “DOA estimation for multiple sparse sources with arbitrarily arranged multiple sensors,” Journal of Signal Processing Systems, doi:10.1007/s11265-009-0413-9, pp 1-11, 2009 [72] S.Douglas et al., “Natural gradient multichannel blind deconvolution and speech separation using causal FIR filters,” IEEE Transactions on Speech and Audio Processing, vol.13, issue 1, pp 92-104, 2004 [73] S.I.Amari and A.Cichocki, Adaptive Blind Signal and Image Processing, John Wiley & Sons, 2002 [74] S Makino, H Sawada, R Mukai, and S Araki, “`Blind source separation of convolutive mixtures of speech in frequency domain,”' IEICE Trans Fundamentals, Vol.E88-A, No.7, pp.1640-1655, 2005 (invited) 108 [75] S.Makino, Te-Won Lee, and H Sawada, Blind Speech Separation, Springer, Sept 2007 [76] S Choi, A Cichocki, H._M Park and S.-Y Lee: "Blind source separation and independent component analysis: A review", Neural Information Processing Letters and Reviews, Vol 6, No.1, pp.1-57, January 2005 [77] S.Haykin, Adaptive Filter Theory, Prentice Hall, 4th edition [78] T.Yoshioka et al, “Dereverberation by using time-variant nature of speech production system,” EURASIP Journal on Advances in Signal Processing, vol.2007 [79] T Nishikawa, H Saruwatari, and K Shikano, "Blind Source Separation Based on Multi-Stage ICA Combining Frequency-Domain ICA and Time-Domain ICA," Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP2002), pp 2938-2941, May 2002 [80] T.W.Lee, M.Girolami and T.J.Sejnowski, “ Independent component analysis using extended infomax algorithm for mixed sub-gauss and super-gauss sources,” Neural Computing, 12(2), 2000 [81] T.W.Lee, A.J.Bell and R.Lambert, “Blind separation of delayed and convolved sources,” in Advances in Neural Information Processing Systems, volume 9, pp 758-764 MIT Press, 1997 [82] V.G.Reju, Separation of Speech Mixtures, Doctoral Dissertation, School of Electrical and Electronic Engineering, Nanyang Technological University, Singapore, 2009, http://www3.ntu.edu.sg/home/Reju/THESIS2009.pdf [83] “Blind Speech Separation in Convolutive Mixtures Using Non-Gaussianity Maximization and Inverse Filters,” In the proceedings of The Third International Conference on Communications and Electronics (ICCE), pp 190-194, Nha Trang August 2010 [84] “Blind Speech Separation in Convolutive Mixtures Using Negentropy Maximization,” Journal on Information Technologies & Communications, 109 Ministry of Information and Communications Volume E-1, No.3(7),pp 36-43, December 2010 [85] “A method of convolutive blind source separation in the frequency domain,” Journal of Science and Technology, pp 1-5, No 83B, May 2011 [86] “Assignment Problem-based Approach for Solving Permutation Ambiguity in Frequency Domain Convolutive Source Separation,” in the proceedings of The 2011 International Conferences on Advanced Technologies for Communications (ATC 2011),pp 291-294, Da Nang August 2011 [87] “Blind Speech Separation Combining DOA Estimation and Assignment Problem Approaches,” The 2nd International Symposium on Information and Communication Technology (SoICT 2011), pp.159-164, Ha Noi , October 2011 [88] “Blind Speech Separation in the Frequency Domain using Problem Approach,” Journal on Information Assignment Technologies & Communications, Ministry of Information and Communications , Volume E-1, No.4(8), pp.49-56, October 2011 [89] W.M.Mary et al, “Blind Source Separation using wavelets”, 2010 International Conference on Computational Intelligence and Computing Research [90] Y.Haneda, S.Makino and Y.Kaneda, “Common acoustical poles independent of sound directions and modeling of head-related transfer functions, ” J Acoust Soc Jpn (E), vol 15, no 4, pp 277-279, July 1994 110 CÁC CƠNG TRÌNH KHOA HỌC Các báo đăng [1] “Blind Speech Separation in Convolutive Mixtures Using Non-Gaussianity Maximization and Inverse Filters,” In the proceedings of The Third International Conference on Communications and Electronics (ICCE), pp 190-194, Nha Trang August 2010 (a short version) “Blind Speech Separation in Convolutive Mixtures Using Negentropy Maximization,” Journal on Information Technologies & Communications, Ministry of Information and Communications Volume E-1, No.3(7), pp 36-43, December 2010 (a long version) [2] “Một phương pháp phân tách mù nguồn tin sử dụng sai số dự báo tốt thuật tốn FastICA,” Tạp chí Khoa học & Cơng nghệ Trường Đại học Kỹ thuật ,trang 1-6, Số 81, tháng 3/2011 [3] “A method of convolutive blind source separation in the frequency domain,” Journal of Science and Technology, pp 1-5, No 83B, May 2011 “Assignment Problem-based Approach for Solving Permutation Ambiguity in Frequency Domain Convolutive Source Separation,” in the proceedings of The 2011 International Conferences on Advanced Technologies for Communications (ATC 2011),pp 291-294, Da Nang August 2011 (a modified version) [4] “Blind Speech Separation Combining DOA Estimation and Assignment Problem Approaches,” The 2nd International Symposium on Information and Communication Technology (SoICT 2011), pp.159-164, Ha Noi , October 2011 [5] “Blind Speech Separation in the Frequency Domain using Problem Approach,” Journal on Information Assignment Technologies & 111 Communications, Ministry of Information and Communications , Volume E-1, No.4(8), pp.49-56, October 2011 [6] “Loại bỏ nhiễu tín hiệu điện tim ECG phương pháp phân tích thành phần độc lập,” Hội nghị tồn quốc điều khiển tự động hóa VCCA 2011, pp.813-817, ngày 25-26/ 11, 2011 (là số cơng trình tiêu biểu hội thảo chọn đăng tạp chí "Tin học Điều khiển học" có mã số ISSN 1813-9663 Viện Khoa học Công nghệ Việt Nam) Các đề tài nghiên cứu Nghiên cứu ứng dụng xử lý tín hiệu mù vào phân tích ảnh viễn thám thu từ vệ tinh, Đề tài cấp Bộ mã số B2010-01-372, năm 2010-2011, nghiệm thu (Chủ nhiệm đề tài) Nghiên cứu xử lý tín hiệu mù phân tích ảnh chụp cộng hưởng từ chức FMRI ứng dụng hỗ trợ cho chẩn đoán y tế, Đề tài cấp Bộ trọng điểm, B2012-01-25, năm 2012- 2013, triển khai (Chủ nhiệm đề tài) ... tiêu nghiên cứu luận án Mục tiêu nghiên cứu phát triển số giải thuật phân tách mù nguồn tín hiệu ứng dụng Mục tiêu luận án nghiên cứu phát triển số giải thuật phân tách mù cho mơ hình tuyến tính... tính (ứng dụng xử lý tín hiệu y sinh học) mơ hình trộn chập (ứng dụng xử lý âm thanh) Các vấn đề cần giải luận án Luận án tập trung nghiên cứu phát triển số giải thuật phân tách mù nguồn tín hiệu. ..ii BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI ============= NGHIÊN CỨU, PHÁT TRIỂN MỘT SỐ GIẢI THUẬT XỬ LÝ MÙ TÍN HIỆU VÀ ỨNG DỤNG LUẬN ÁN TIẾN SỸ KỸ THUẬT VIỄN THÔNG Người