Ngày nay,cùng với sự phát triển của khoa học kĩ thuật thì việc liên lạc trao đổi thông tin của con người trở nên dễ dàng hơn bao giờ hết. Đặc biệt, việc liên lạc qua điện thoại đã trở nên phổ biến, chúng ta có thể nói chuyện với bất kì ai ở bất cứ nơi đâu.Nhưng trong một số trường hợp, chất lương cuộc hội thoại không như ta mong muốn. Ví dụ như ta đứng ở nhà ga, bến tàu, trên đường phố hoặc những nơi đông người thì việc nói chuyện qua điện thoại gặp khá nhiều khó khăn do ảnh hưởng của những tiếng ồn xung quanh.Vì vậy mục đích của đồ án này là: xử lý để loại bỏ tối đa tiếng ồn (nhiễu) xung quanh, giữ chất lượng tín hiệu tiếng nói mà ta muốn truyền đạt. Bộ lọc Kalman ( tên được đặt theo nhà nghiên cứu Rudolf (Rudy) E. Kálmán ) được chọn làm công cụ để giải quyết vấn đề trên. Để thực hiện mục đích nâng cao chất lượng tín hiệu tiếng nói sử dụng bộ lọc Kalman thì đồ án được cấu trúc theo các phần sau:Phần đầu, chúng ta sẽ tìm hiểu về tín hiệu tiếng nói cách hình thành tiếng nói và các mô hình phân tích tiếng nói, đặc biệt phần này sẽ đề cập đến việc nâng cao chất lượng tiếng nói cũng như các thuật toán được sử dụng hiện nayBộ lọc Kalman, phần này sẽ cho chúng ta thấy rõ hơn về bộ lọc Kalman, thuật toán, các phương trình của bộ lọc đồng thời cũng nêu ra ưu điểm và nhược điểm khi sử dụng bộ lọc KalmanPhần cuối sẽ thực hiện giảm nhiễu trong các cuộc hội thoại bằng thuật toán của bộ lọc Kalman. Đồng thời phân tích đánh giá kết quả thông qua phương pháp MOS
Lời cam đoan CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc LỜI CAM ĐOAN Kính gửi: Hội đồng bảo vệ đồ án tốt nghiệp Khoa Điện tử - Viễn thông Trường Đại học Bách Khoa Đà Nẵng Em tên : Nguyễn Đỗ Duy Hải Hiện học lớp 08DT3_ Khoa Điện tử - Viễn thông _Ttrường Đại Học Bách Khoa Đà Nẵng Em xin cam đoan nội dung đồ án chép đồ án công trình có từ trước Nếu vi phạm em xin chịu hình thức kỷ luật Khoa Sinh viên thực Nguyễn Đỗ Duy Hải Danh mục từ viết tắt DANH MỤC CÁC TỪ VIẾT TẮT Từ viết tắt Tiếng Anh ACR Absolute Category Rating AR Autoregressive AWRN Add White Gaussian Noise CCR Comparition Category Rating DCR Degradation Category Rating LP Linear Prediction MA Moving Average MOS Mean Opinion Scoring SS Spectral Subtraction SNR Signal Noise Ratio Mục lục MỤC LỤC Chương 1: Tín hiệu tiếng nói LỜI MỞ ĐẦU Ngày nay,cùng với phát triển khoa học kĩ thuật việc liên lạc trao đổi thông tin người trở nên dễ dàng hết Đặc biệt, việc liên lạc qua điện thoại trở nên phổ biến, nói chuyện với nơi đâu.Nhưng số trường hợp, chất lương hội thoại không ta mong muốn Ví dụ ta đứng nhà ga, bến tàu, đường phố nơi đông người việc nói chuyện qua điện thoại gặp nhiều khó khăn ảnh hưởng tiếng ồn xung quanh Vì mục đích đồ án là: xử lý để loại bỏ tối đa tiếng ồn (nhiễu) xung quanh, giữ chất lượng tín hiệu tiếng nói mà ta muốn truyền đạt Bộ lọc Kalman ( tên đặt theo nhà nghiên cứu Rudolf (Rudy) E Kálmán ) chọn làm công cụ để giải vấn đề Để thực mục đích nâng cao chất lượng tín hiệu tiếng nói sử dụng lọc Kalman đồ án cấu trúc theo phần sau: - Phần đầu, tìm hiểu tín hiệu tiếng nói cách hình thành tiếng nói mô hình phân tích tiếng nói, đặc biệt phần đề cập đến việc nâng cao chất lượng tiếng nói thuật toán sử dụng - Bộ lọc Kalman, phần cho thấy rõ lọc Kalman, thuật toán, phương trình lọc đồng thời nêu ưu điểm - nhược điểm sử dụng lọc Kalman Phần cuối thực giảm nhiễu hội thoại thuật toán lọc Kalman Đồng thời phân tích đánh giá kết thông qua phương pháp MOS Chương 1: Tín hiệu tiếng nói CHƯƠNG 1: TÍN HIỆU TIẾNG NÓI 1.1 Giới thiệu chương Nội dung chương trình bày sơ lượt tín hiệu tiếng nói, cách hình thành, mô hình phổ biến để biểu diễn, phân tích xử lý tín hiệu tiếng nói.Bên cạnh đó, chương khái quát mục đích nâng cao chất lượng tiếng nói phương pháp sử dụng để nâng cao chất lượng tín hiệu tiếng nói 1.2 Tín hiệu tiếng nói 1.2.1Tín hiệu Tín hiệu(signal) dùng để đại lượng vật lý mang tin tức Về mặt toán học, ta mô tả tín hiệu hàm theo biến thời gian, không gian hay biến độc lập khác Chẳng hạn như, hàm: x(t) = 20t2 mô tả tín hiệu biến thiên theo biến thời gian t Hay ví dụ khác, hàm: s(x,y) = 3x + 5xy + y2 mô tả tín hiệu hàm theo hai biến độc lập x y, x y biểu diễn cho hai tọa độ mặt phẳng Hai tín hiệu ví dụ lớp tín hiệu biểu diễn xác hàm theobiến độc lập Tuy nhiên, thực tế, mối quan hệ đại lượng vật lý biến độc lập thường phức tạp nên biểu diễn tín hiệu nhưtrong hai ví dụ vừa nêu trên.Lấy ví dụ tín hiệu tiếng nói - biến thiên áp suất không khí theothời gian Chẳng hạn ta phát âm từ "away", dạng sóng biểu diễn hình sau Chương 1: Tín hiệu tiếng nói Hình 1.1 Dạng sóng phát âm từ “away” 1.1.2Tín hiệu tiếng nói Mục đích tiếng nói truyền thông tin.Để xét trình thông tin tiếng nói, nên coi thông báo dạng trừu tượng óc người nói.Qua trình phức tạp tạo âm, thông tin thông báo chuyển trực tiếp thành tín hiệu âm học Thông tin thông báo biểu diễn số dạng khác trình tạo tiếng nói Chẳng hạn, thông tin thông báo lúc ban đầu đƣợc chuyển thành tập hợp tín hiệu thần kinh điều khiển chế phát âm (đó chuyển động lưỡi, môi, dây âm, v v ) Bộ máy phát âm chuyển động tương ứng với tín hiệu thần kinh để tạo dãy điệu bộ, mà kết cuối dạng sóng âm chứa thông tin thông báo gốc Tín hiệu tiếng nói thường thể dạng số, tức "số hóa", xử lý tiếng nói coi giao xử lý tín hiệu số vàxử lý ngôn ngữ tự nhiên Chương 1: Tín hiệu tiếng nói 1.1.3Biểu diễn tín hiệu tiếng nói 1.1.3.1 Biểu diễn dạng sóng theo thời gian Phần tín hiệu ứng với âm vô không tuần hoàn, ngẫu nhiên có biên độ hay lượng nhỏ nguyên âm.Ranh giới từ khoảng lặng(Silent) Ta cần phân biệt rõ khoảng lặng với âm vô Hình 1.2 Dạng sóng tín hiệu âm miền thời gian Âm lưu trữ theo định dạng thông dụng máy tính *.WAV với tần số lấy mẫu thường gặp là: 8000Hz, 10000Hz, 11025Hz, 16000Hz, 22050Hz, 32000Hz, 44100Hz Độ phân giải hay gọi số bít mẫu 16 bít sô kênh (Mono) (Stereo) Như vậy, liệu lưa trữ tín hiệu âm khác tuỳ theo máy thu thanh, thời điểm phát âm hay người phát âm, điều thể rõ nét hình vẽ sau: Chương 1: Tín hiệu tiếng nói Hình 1.3: Tín hiệu tiếng nói thu từ hai micro khác 1.1.3.2Biểu diễn phổ tín hiệu tiếng nói Dải tần số tín hiệu âm nằm khoảng tần số từ 0Hz đến 20KHz, nhiên phần lớn công suất nằm dải tần số từ 0,3KHz đến 3,4KHz Hình 1.4: Dạng sóng công suất phổ tín hiệu tiếng nói theo thời gian 1.1.3.3Biểu diễn ảnh phổ Để biểu diễn ảnh phổ(spectrogram) tín hiệu ta tiến hành chia tín hiệu thành khung(frame) ứng với độ dài cửa sổ thông thường khoảng 10ms.Tín hiệu khung đuợc lấy mẫu với tần số lấy mẫu Fs, tần số lấy mẫu 16000Hz ta có 16 mẫucho 1ms có 160 mẫu cho khung Các khung Chương 1: Tín hiệu tiếng nói chọn theo hai hàm cửa sổ thông dụng hamming hanning có độ chồng lấn hai biên khoảng 40%(4ms) Hình 1.5 Dạng sóng ảnh phổ tín hiệu tiếng nói: sạch, bị nhiễu tín hiệu cải thiện Ảnh phổ tạo cách vẽ phổ khung tín hiệu trục thẳng đứng, spectrogram thời gian tần số tương ứng với trục ngang dọc, biên độ phổ biểu diễn độ đậm nhạc màu sắc, ảnh phổ kết ghép nối khung phổ 1.2Nâng cao chất lượng tiếng nói (Speech enhancement) Nâng cao chất lượng tiếng nói liên quan đến việc cải thiện cảm nhận tiếng nói bị suy giảm chất lượng có mặt nhiễu tiếng nói Trong hầu hết ứng dụng, mục đích nâng cao chất lượng tiếng nói cải thiện chất lượng tính dễ nghe tiếng nói bị suy giảm nhiễu cách sử dụng công cụ xử lý tín hiệu Có nhiều yêu cầu đặt Speech enhancement nhiều trường hợp khác nhau, ví dụ thông tin thoại, hệ thống điện thoại tế bào chịu ảnh hưởng nhiễu từ ô tô, nhà hàng, truyền đến đích Chính Chương 1: Tín hiệu tiếng nói mà thuật toán nâng cao chất lượng tiếng nói sử dụng để cải thiện chất lượng tiếng nói điểm thu, mặt khác, sử dụng khối tiền xử lý hệ thống mã hoá tiếng nói dùng điện thoại tế bào chuẩn Khi nhận dạng tiếng nói, tiếng nói bị nhiễu tiền xử lý thuật toán nâng cao chất lượng trước nhận dạng.Trong thông tin liên lạc hàng không, kỹ thuật nâng cao tiếng nói cần sử dụng để cải thiện chất lượng tính dễ nghe tiếng nói phi công bị ảnh hưởng nhiễu buồng lái.Vìvậy mà việc nâng cao chất lượng tiếng nói cần thiết thông tin liên lạc quân Speech enhancementlà phần xử lý tiếng nói mà mục đích cải thiện tính dễ nghe tín hiệu tiếng nói.Cách tiếp cận phổ biến Speech enhancement loại bỏ nhiễu, cách dự đoán đặt điểm nhiễu, sau loại bỏ thành phần nhiễu giữ lại tín hiệu Nhưng vấn đề phương pháp tín hiệu có thành phần có đặt điểm tương tự nhiễu lại thành phần hữu ích ta loại bỏ nhiễu, vô hình chung ta loại bỏ thành phần làm méo dạng tín hiệu Do đó, phương pháp Speech enhancement phải cân việc loại bỏ nhiễu mức độ biến dạng tín hiệu tiếng nói Thông thường thuật toán xử lý tiếng nói chia làm ba loại chính: Thuật toán trừ phổ (spectral subtraction), phép phân tích không gian (sub-space analysis) thuật toán lọc (filtering algorithms): • Spectral subtraction (SS): hay gọi trừ phổ thuật toán giảm nhiễu đơn giản Nó dựa nguyên lý mô tả cập nhật nhiễu tín hiệu có nhiễu cách thu nhiễu diện tín hiệu Và nhiễu trừ với tín hiệu có nhiễu, kết tín hiệu sau xử lý thuật toán loại nhiễu xét phương diện lý tưởng tín hiệu SS lúc ban đầu đề xuất 10 Chương 2: Bộ lọc Kalman đệ quy để xác định hiệp phương sai ước lượng tuyến tính tối thiểu gọi lọc Kalman 2.4Ưu nhược điểm lọc Kalman 2.4.1Ưu điểm Phương pháp tránh ảnh hưởng thay đổi cấu trúc liệu vào kết Việc ước lượng đệ qui bắt đầu với mẫu ban đầu cập nhật ước lượng thông qua quan sát hết liệu Điều có nghĩa, ước lượng gần bị ảnh hưởng liệu khứ xa, chuỗi liệu bị cắt.Việc cắt giảm khắc phục thông qua ước tính với sai số chuẩn Bộ lọc Kalman, giống phương pháp đệ qui khác, sử dụng chuỗi liệu khứ với ưu điểm : cố gắng ước tính hệ số cách ngẫu nhiên thay cách xác định Bằng cách này, khắc phục việc ước lượng có thay đổi cấu trúc, cụ thể bị cắt giảm liệu Bộ lọc Kalman biết đến nhờ khả dự đoán trạng thái mô hình khứ, tương lai chưa biết xác hệ thống 2.4.2 Nhược điểm Trong khó khăn áp dụng lọc Kalman ta thấy trước hết cần xác định vecto trạng thái ban đầu phương sai để bắt đầu thuật toán đệ qui Ở chưa có cách xác định chung cho điều kiện ban đầu Ngoài ra, để phát triển lọc Kalman cần phải có kiến thức rộng xác suất thống kê, cụ thể điều kiện Gaussian biến ngẫu nhiên.Điều làm giới hạn nghiên cứu ứng dụng lọc 2.5 Kết luận chương Qua chương hiễu rõ lý thuyết ước lượng, từ hiểu mô hình toán học lọc Kalman hai trình hoạt động lọc Kalman trình ước lượng trình điều chỉnh 35 Chương 2: Bộ lọc Kalman CHƯƠNG 3: ÁP DỤNG BỘ LỌC KALMAN ĐỂ NÂNG CAO CHẤT LƯỢNG TÍN HIỆU TIẾNG NÓI 3.1 Giới thiệu chương Dựa vào lý thuyết trình bày chương 2, chương trình bày trình áp dụng lọc Kalman để giảm nhiễu file âm bị nhiễu Thực thuật toán giảm nhiễu mô Matlab.Đồng thời dựa phương pháp đánh giáMOSđể đánh giá chất lượng tín hiệu sau giảm nhiễu 3.2 Cơ sở liệu phương pháp đánh giá 3.2.1Cơ sở liệu Các mẫu tín hiệu tiếng nói bị nhiễu xây dựng để áp dụng cho thuật toán Speech Enhancement phục vụ nhu cầu nghiên cứu Những liệu đăng tải trang web http://ecs.utdallas.edu/loizou/speech/noizeus/ Cơ sở liệu ban đầu 30 câu thoại ghi âm phòng thí nghiệm theo chuẩn IEEE tín hiệu thoại sạch, sau mẫu thoại cộng nhiễu thực tế vào với mức SNR khác nhau.Mỗi câu thoại trung bình khoảng 2s Các loại nhiễu thực tế gồm nhiễu xe ,nhiễu nhà ga ,tàu lửa, tàu điện ngầm, nhiễu nhà hàng, nhiễu đường phố,đám đông Trong đề tài 36 Chương 2: Bộ lọc Kalman sử dụng hai mẫu câu thoại bị nhiễu xe nhiễu nhà hàng với mức SNR 0, 5, 10 15dB, tần số lấy mẫu 8KHz để phân tích đánh giá 3.2.2 Phương pháp đánh giá MOS Kỹ thuật đánh giá chất lượng thoại số lượng lớn người nghe, sử dụng phương pháp thống kê để tính điểm chất lượng.Điểm đánh giá bình quân nhiều người tính điểm Mean Opinion Scoring (MOS).Kỹ thuật thực tính điểm mô tả khuyến nghị P.800 ITU.Khuyến nghị P.830 thể phương pháp cụ thể để đánh giá chất lượng thoại cho mã hóa Cả hai khuyến nghị ITU mô tả : phương thức đánh giá, cách tính điểm theo phương thức đánh giá chủ quan, giá trị điểm, tính chất mẫu câu thoại sử dụng để đánh giá điều kiện khác mà việc khiểm tra chất lượng thực Phương thức đánh giá theo MOS thực theo kiểm tra hội thoại chiều hai chiều Người nghe nghe mẫu câu truyền qua hệ thống đánh giá chất lượng tổng thể mẫu dựa than điểm cho trước P.800 định nghĩa số hình thức đánh giá chất lượng thoại theo phương pháp chủ quan: • • Bài kiểm tra hội thoại (Conversation Opinion Test) Đánh giá phân loại tuyệt đối(Absolute Category Rating (ACR) Test) • Phương thức phân loại theo suy hao (Degradation Category Rating(DCR)) • Phương thức phân loại so sánh (Comparition Category Rating (CCR)) Mỗi phương thức có than điểm đánh giá.Ví dụ, phương thức đánh giá hội thoại ACR có thang điểm tương tự gọi điểm hội thoại điểm chất lượng nghe.Trong phương thức hội thoại, người nghe hỏi quan điểm họ kết nối sử dụng.ARC hỏi chủ thể chất lượng thoại.Thang điểm cho hai phương thức sau Điểm đánh giá Chất lượng thoại 37 Chương 2: Bộ lọc Kalman Rất tốt Tốt Chấp nhận Tồi Rất tồi Bảng 3.1: Bảng điểm đánh giá theo phương thức MOC hay dùng Đây thang điểm từ 1-5 thông thường sử dụng để tính MOS Ví dụ thứ hai điểm nỗ lực nghe phương thức ACR (ACR Listening Effort Score).Trong phương thức này, chủ thể yêu cầu đánh giá nỗ lực họ thực để hiểu ngữ nghĩa câu chuẩn sử dụng làm mẫu Thanh điểm cho sau: Điểm đánh giá Mức độ cố gắng cần thực để hiểu câu Không cần cố gắng Cần ý không cần cố gắng nhiều Cần tương đối tập trung Cần tập trung Không hiểu mẫu câu Bảng 3.2: Bảng điểm đánh giá theo phương thức ARC 3.3 Mô đánh giá kết 3.3.1 Mô Chương trình mô xây dựng phần mềm Matlab Thuật toán lọc Kalman giải thích theo hình sau: 38 Chương 2: Bộ lọc Kalman Received Signal Speech +Noise Finding parameters Prediction of parameters Updating of parameters Enhanced Sigal Hình 3.1: Sơ đồ giải thích thuật toán lọc Kalman 39 Chương 2: Bộ lọc Kalman Thực chạy chương trình với sở liệu trình bày phần 3.2 Ta kết dạng sóng sau • Tín hiệu thoại chưa có nhiễu: • Đối với nhiễu xe hơi: 40 Chương 2: Bộ lọc Kalman Hình 3.2: Dạng sóng câu thoại xe hơi(SNR=0dB) trước sau qua lọc Kalman Hình 3.3: Dạng sóng câu thoại xe hơi(SNR=5dB) trước sau qua lọc Kalman 41 Chương 2: Bộ lọc Kalman Hình 3.4 Dạng sóng câu thoại xe hơi(SNR=10dB)trước sau qua lọc Kalman Hình 3.5 Dạng sóng câu thoại xe hơi(SNR=15dB)trước sau qua lọc Kalman • Đối với nhiễu nhà hàng: 42 Chương 2: Bộ lọc Kalman Hình 3.6 Dạng sóng câu thoại nhà hàng(SNR=0dB)trước sau qua lọc Kalman Hình 3.7 Dạng sóng câu thoại nhà hàng(SNR=5dB)trước sau qua lọc Kalman 43 Chương 2: Bộ lọc Kalman Hình 3.8 Dạng sóng câu thoại nhà hàng(SNR=10dB)trước sau qua lọc Kalman Hình 3.9 Dạng sóng câu thoại nhà hàng(SNR=15dB)trước sau qua lọc Kalman Từ kết ta thấy phương pháp giảm nhiễu với thuật toán lọc Kalman cho kết tốt, tín hiệu sau lọc bị biến dạng Với mức SNR cao kết thu tốt 3.3.2 Đánh giá kết dựa phương pháp MOS 44 Chương 2: Bộ lọc Kalman Thu thập liệu đánh giá 10 tình nguyện viên Ban đầu 10 người nghe câu hội thoại sạch, chưa có nhiễu để làm đánh giá Sau họ nghe câu thoại sau loại nhiễu, cho điểm dựa vào bảng điểm đánh giá MOS nêu mục 3.2.2 Kết thu từ 10 tình nguyện viên sau: • Đối với nhiễu xe hơi: SNR 0dB 5dB 10dB 15dB STT 3 4 3 3 4 5 3 4 3 4 10 3 Trung 2.70.483046 3.40.516398 3.70.483048 4.60.516398 bình Bảng 3.3: Bảng đánh giá tình nguyện viên nhiễu xe 45 Chương 2: Bộ lọc Kalman • Đối với nhiễu nhà hàng SNR 0dB 5dB 10dB 15dB STT 3 3 3 3 4 4 4 3 3 4 3 10 3 4 Trung 2.60.516398 3.20.421637 3.50.527046 4.40.516398 bình Bảng 3.3: Bảng đánh giá tình nguyện viên nhiễu nhà hàng Từ hai bảng đánh giá trên, ta đưa đồ thị đánh giá cho hai loại nhiễu xe nhiễu nhà hàng sau qua lọc Kalman sau: Nhận xét: Dựa vào đồ ta kết luận - Khi tỉ số tín hiệu nhiễu (SNR) tăng điểm đánh giá MOC tăng, chứng tỏ phương pháp lọc Kalman hoạt động tốt SNR từ 5dB trở lên chất lượng câu thoại qua lọc Kalman cải thiện đáng - kể Điểm đánh giá trung bình MOC nhiễu xe nhiễu nhà hàng không khác xa nhau, điều cho thấy ảnh hưởng hai loại nhiễu gần 46 Chương 2: Bộ lọc Kalman 3.4Kết luận chương Qua chương ta thấy khả việc cải thiện chất lượng tiếng nói tốt Mức độ SNR tăng phương pháp làm việc hiệu SNR từ 5dB trở lên cho ta kết khả quan KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI Chất lượng tiếng nói bịsuy giảm tác động nhiễu môi trường xung quanh vấn đềquan trọng cần phải giải Việc tìm phương pháp để triệt nhiễu giảm nhiễu tiếng nói luôn đề tài gới khoa học quan tâm nhiều Trong dịch vụtruyền thông với phương tiện ngôn ngữ tiếng nói việc tăng cường, cải thiện chất lượng tiếng nói bịnhiễu cần thiết, giúp cho người nghe nghe rõ người nói muốn truyền đạt Đồ án thực vấn đề: - Tìm hiểu nghiên cứu vấn đề nâng cao chất lượng tiếng nói sử dụng - phương pháp lọc Kalman Xây dựng chương trình dựa vào thuật toán lọc Kalman để - lại bỏ nhiễu file âm bị nhiễu Dựa kết đạt được, tiến hành đánh giá chất lượng theo phương pháp MOC để thấy hiệu sử dụng lọc Kalman 47 Chương 2: Bộ lọc Kalman Tuy nhiên đồán chưa giải hết vấn đềtrong Speechenhancement nên hướng phát triển đềtài tương lai sẽlà: - Tìm hiểu, nghiên cứu xây dựng chương trình thực xử lý nhiễu tín hiệu tiếng nói dựa thuật toán khác Speech - enhancement Nghiên cứu thêm phương pháp đáng giá chất lượng tín hiệu sau xử lý cách khách quan Thực so sánh phương pháp với để tìm phương pháp tối ưu TÀI LIỆU THAM KHẢO [1] Giáo trình xác suất thống kê, Tống Đình Quỳ, NXB Giáo dục, Hà Nội, 1999 [2] Yun-Kyung Lee, Gyeo-Woon Jung, and Oh-Wook Kwon,Speech Enhancement by Kalman Filtering with a Particle FilterBased Preprocessor,2013 [3] Greg Welch and Gary Bishop,An Introduction to the Kalman Filter,2006 [4] Mariyadasu Mathe,Siva Prasad Nandyala,Siva Prasad Nandyala,Speech Enhancement Using Kalman Filter for white, random and color noise [5] Bárbara Valenciano Martínez,Speech enhancement using Kalman filtering,2008 [6] http://dea.brunel.ac.uk/cmsp/home_esfandiar/KalmanTime.htm [7] http://ecs.utdallas.edu/loizou/speech/noizeus/ 48 Chương 2: Bộ lọc Kalman PHỤ LỤC Toàn sở liệu mã nguồn chương trình thực lưu đĩa CD đính kèm 49 [...]... bản của ước lượng, từ đó sẽ hiểu được mô hình toán học của bộ lọc Kalman cũng như hai quá trình hoạt động của bộ lọc Kalman là quá trình ước lượng và quá trình điều chỉnh 35 Chương 2: Bộ lọc Kalman CHƯƠNG 3: ÁP DỤNG BỘ LỌC KALMAN ĐỂ NÂNG CAO CHẤT LƯỢNG TÍN HIỆU TIẾNG NÓI 3.1 Giới thiệu chương Dựa vào lý thuyết đã trình bày chương 1 và 2, chương này sẽ trình bày quá trình áp dụng bộ lọc Kalman để giảm... trọng để nâng cao chất lượng tiếng nói thuộc nhóm các phương pháp tham số mà tín hiệu tiếng nói được mô hình hóa như một quá trình tự hồi qui (autoregressive) được gắn trong nhiễu Gaussian Thuật toán nâng cao chất lượng tiếng nói loại này gồm hai bước : • Ước tính các hệ số AR (Autoregressive) và phương sai nhiễu (sử dụng phương pháp dự đoán tuyến tính) • Áp dụng bộ lọc Kalman bằng cách sử dụng các... của hệ thống Bộ lọc Kalman được ứng dụng rộng rãi trong kỹ thuật, phổ biến trong các ứng dụng định hướng, định vị và điều khiển các phương tiện di chuyển.Ngoài ra, bộ lọc Kalman còn được ứng dụng để phân tích dữ liệu trong các lĩnh vực xử lý tín hiệu và kinh tế 26 Chương 2: Bộ lọc Kalman Hình 2.3: Mô hình đo lường ước lượng của bộ lọc Kalman Hình 2.4: Tín hiệu trước và sau khi qua bộ lọc Kalman Hình... tiếng nói và cơ chế tạo tiếng nói, đồng thời cũng giới thiệu sơ lượt về phương pháp dự đoán tuyến tính 17 Chương 2: Bộ lọc Kalman CHƯƠNG 2: BỘ LỌC KALMAN 2.1 Giới thiệu chương Năm 1960 R.E Kalman xuất bản một bài báo nổi tiếng mô tả về một giải pháp đệ quy để giải quyết vấn đề bộ lọc tuyến tính dữ liệu rời rạc Kể từ đó, do có những ưu điểm lớn trong tính toán, bộ lọc Kalman là một chủ đề nhận được... động của mạch lọc Kalman Chúng ta có tín hiệu đo được, chúng ta có mô hình của tín hiệu đo được (đòi hỏi tuyến tính) và sau đó là áp dụng vào trong hệ thống phương trình của mạch lọc để ước lượng trạng thái quan tâm Thực ra tín hiệu đo là không khó, phương trình đã có sẵn, cái chung 27 Chương 2: Bộ lọc Kalman ta cần chính là mô hình hoá hệ thống Để có thể ứng dụng một cách hiểu quả mạch lọc Kalman thì... của nâng cao chất lượng tiếng nói là loại bỏ đến mức thấp nhất các thành phần nhiễu trong tín hiệu tiếng nói đã bị nhiễu bằng các phương pháp như: thuật toán trừ phổ (spectral subtraction), phép phân tích không gian con (sub-space 16 Chương 1: Tín hiệu tiếng nói analysis) hay các thuật toán lọc (filtering algorithms) Ngoài ra chương này cũng cho ta thấy được mô hình phân tích tiếng nói và cơ chế tạo tiếng. .. tạo thành các âm thanh khác nhau 12 Chương 1: Tín hiệu tiếng nói Hình 1.7: Các bộ phận tao tiếng nói Hình 1.8: Mô hình đơn giản của việc tạo tiếng nói 13 Chương 1: Tín hiệu tiếng nói Con người sử dụng ngôn ngữ gần như vô thức mà không cần chú ý đến việc làm thế nào để nảo xử lý những thông tin Có một số lượng lớn các cơ quan tham gia vào quá trình này.Lời nói xuất phát từ suy nghĩ, ý định giao tiếp trong... cách sử dụng các thông số đã ước tính để dự đoán tín hiệu sạch từ tín mẫu tín hiệu bị nhiễu 1.3Mô hình tiếng nói Các mô hình nghiên cứu tiếng nói cho chúng ta thấy cách thức con người tạo ra tiếng nói Ngày nay, có rất nhiều thiết bị tương tác với chúng ta qua ngôn ngữ của con người, và âm thanh chúng phát ra càng giống với con người càng tốt Do 11 Chương 1: Tín hiệu tiếng nói đó, nhiều công trình nghiên... mang lại ưu thế vượt trội cho việc ước lượng các thông số cơ bản của tiếng nói như độ cao, phổ… và mã hóa bit thấp để truyền dẫn và lưu trữ Điều quan trọng của phương pháp này là khả năng ước lượng các thông số một cách chính xác và mối liên hệ trong việc tính toán tín hiệu tiếng nói Ý tưởng cơ bản của việc phân tích dự đoán tuyến tính là một mẫu tín hiệu tiếng nói có thể xấp xỉ với một mẫu trước đó.Bằng... nghĩa một ước lượng tối ưu tuyến tính trung bình bình phương sai số Từ (2.43) ta được Kết hợp (2.40) và (2.44) (2.45) 2.3.2.7 Tóm tắt các phương trình của bộ lọc Kalman Trong phần này chúng ta sẽ tóm tắt các phương trình tổng quát của giải thuật lọc Kalman Giải thuật bao gồm 2 quá trình: quá trình ước lượng và quá trình điều chỉnh • Quá trình dự đoán 33 Chương 2: Bộ lọc Kalman Bộ lọc Kalman dựa vào