(LUẬN VĂN THẠC SĨ) Nhận dạng tiếng Việt sử dụng biến đổi Wavelet và mô hình Markov ẩn Luận văn ThS Kỹ thuật Điện tử Viễn thông 2 07 00

120 3 0
(LUẬN VĂN THẠC SĨ) Nhận dạng tiếng Việt sử dụng biến đổi Wavelet và mô hình Markov ẩn Luận văn ThS Kỹ thuật Điện tử Viễn thông 2 07 00

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phùng Trung Nghĩa NHẬN DẠNG TIẾNG VIỆT SỬ DỤNG BIẾN ĐỔI WAVELET VÀ MƠ HÌNH MARKOV ẨN LUẬN VĂN THẠC SĨ Hà Nội - 2006 ĐẠI HỌC QUỐC GIA HÀ NỘI TIEU LUAN MOI download : skknchat@gmail.com TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phùng Trung Nghĩa NHẬN DẠNG TIẾNG VIỆT SỬ DỤNG BIẾN ĐỔI WAVELET VÀ MƠ HÌNH MARKOV ẨN Ngành: Công nghệ Điện tử - Viễn thông Chuyên ngành: Kỹ thuật vô tuyến điện tử thông tin liên lạc Mã số:2.07.00 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: TS TRỊNH ANH VŨ Hà Nội - 2006 TIEU LUAN MOI download : skknchat@gmail.com MỤC LỤC Lời cam đoan Mục lục Danh mục ký hiệu, chữ viết tắt Danh mục bảng Danh mục hình vẽ, đồ thị MỞ ĐẦU 13 Chương TỔNG QUAN 17 1.1 Nhận dạng 17 1.2 Nhận dạng tiếng nói 18 1.2.1 Xử lý âm 18 1.2.2 Phân loại nhận dạng tiếng nói 19 1.2.2.1 Nhận dạng từ liên tục nhận dạng từ cách biệt 19 1.2.2.2 Nhận dạng phụ thuộc người nói độc lập người nói 20 1.2.3 Hệ thống nhận dạng tiếng nói tự động 21 1.2.4 Lý thuyết nhận dạng tiếng nói .23 1.2.4.1 Rút trích vector đặc trưng 23 1.2.4.2 Phân lớp .25 Chương XỬ LÝ TIẾNG NĨI - RÚT TRÍCH VECTOR ĐẶC TRƯNG 28 2.1 Xử lý tiếng nói 28 2.1.1 Lấy mẫu tín hiệu 28 2.1.2 Bộ lọc tín hiệu 29 2.1.3 Dị tìm điểm cuối (end-point detection) .30 2.2 Rút trích đặc trưng 31 2.2.1 Các bước rút trích đặc trưng 32 2.2.1.1 Làm rõ tín hiệu 33 2.2.1.2 Phân đoạn thành khung 33 2.2.1.3 Lấy cửa sổ 34 TIEU LUAN MOI download : skknchat@gmail.com 2.2.2 Các dạng đặc trưng tiếng nói 38 2.2.2.1 Biến đổi tín hiệu sang miền tần số 39 2.2.2.2 Đặc trưng lượng 41 2.2.2.3 Đặc trưng MFCC .42 2.2.2.4 Đặc trưng LPC 44 2.2.2.5 Đặc trưng tần số 47 Chương MƠ HÌNH MARKOV ẨN VÀ ỨNG DỤNG TRONG NHẬN DẠNG TIẾNG NÓI 55 3.1 Mơ hình Markov ẩn 55 3.2 Ứng dụng Mơ hình Markov vào nhận dạng tiếng nói .57 3.2.1 Thuật toán tiến .58 3.2.2 Thuật toán lùi 59 3.2.3 Phương pháp tìm chuỗi trạng thái tối ưu .60 3.2.4 Thuật toán Viterbi 61 3.2.5 Ước lượng Baum-Welch 63 Chương BIẾN ĐỔI WAVELET VÀ ỨNG DỤNG TRONG XỬ LÝ VÀ NHẬN DẠNG TIẾNG NÓI 65 4.1 Mục đích ứng dụng phân tich wavelet 65 4.1.1 Biến đổi Fourier .65 4.1.2 Biến đổi Fourier thời gian ngắn .65 4.1.3 Biến đối wavelet .66 4.2 Các loại biến đổi Wavelet 67 4.2.1 Biến đổi Wavelet liên tục CWT .67 4.2.2.Biến đổi Wavelet rời rạc DWT 70 4.2.3 Biến đổi Wavelet gói 72 4.3 Ứng dụng biến đổi Wavelet xử lý nhiễu nâng cao chất lượng tiếng nói 73 4.3.1 Phương pháp truyền thống Dohono Johnstone 73 4.3.2 Phương pháp khử nhiễu kết hợp kỹ thuật trừ phổ wavelet .75 TIEU LUAN MOI download : skknchat@gmail.com 4.4 Ứng dụng biến đổi Wavelet nhận dạng tiếng nói 79 4.4.1 Tổng quan 79 4.4.2 Nhận dạng tiếng nói dùng CWT 79 4.4.3 Nhận dạng tiếng nói dùng DWT 81 4.4.4 So sánh SCWT, FWT vector đặc trưng truyền thống 83 4.5 Rút trích đặc trưng tiếng Việt dùng biến đổi Wavelet 84 4.5.1 Trích formant dùng CWT 84 4.5.2 Trích chu kỳ Pitch dùng CWT .87 Chương KHẢO SÁT VỀ NGỮ ÂM TIẾNG VIỆT ỨNG DỤNG XÂY DỰNG HỆ THỐNG NHẬN DẠNG THANH ĐIỆU TIẾNG VIỆT 90 5.1 Một số đặc trưng ngữ âm tiếng Việt 90 5.1.1 Thanh điệu 90 5.1.2 Âm vị 90 5.1.3 Trường độ 91 5.2 Một số khảo sát điệu tiếng Việt .91 5.2.1 Tổng quan 91 5.2.2 Thanh 1(thanh ngang) 91 5.2.3 Thanh (thanh huyền) 92 5.2.4 Thanh (thanh ngã) 92 5.2.5 Thanh (thanh hỏi) .94 5.2.6 Thanh (thanh sắc) .95 5.2.7 Thanh (thanh nặng) 96 5.3 Giải pháp nhận dạng theo mơ hình âm vị .99 5.4 Xây dựng mơ hình nhận dạng điệu tiếng Việt 100 5.4.1 Khối tiền xử lý 100 5.4.2 Khối trích chu kỳ Pitch .101 5.4.3 Tạo vector đặc trưng V(F0) .101 5.4.4 Huấn luyện mơ hình 102 5.4.5 Nhận dạng 103 TIEU LUAN MOI download : skknchat@gmail.com 5.5 Các kết nhận dạng điệu 104 Chương XÂY DỰNG HỆ THỐNG NHẬN DẠNG TIẾNG VIỆT NGUYÊN TỪ RỜI RẠC HOÀN CHỈNH 106 6.1 Phương pháp sử dụng 106 6.1.1 Tổng quát 106 6.1.2 Tiền xử lý 106 6.1.3 Huấn luyện mẫu 106 6.1.4 Công đoạn nhận dạng 107 6.2 Cài đặt hệ thống nhận dạng tiếng Việt nguyên từ rời rạc hoàn chỉnh .108 6.2.1 Môi trường xây dựng 108 6.2.2 Bộ từ dùng cho huấn luyện nhận dạng 108 6.2.3 Tạo vector đặc trưng V(SCWT) 109 6.2.4 Phân lớp .109 6.2.5 Mơ hình HMM cho từ nhận dạng 109 6.2.6 Kết nhận dạng 110 KẾT LUẬN 112 Các kết đạt luận văn 112 Những vấn đề tồn biện pháp khắc phục 112 Các đề xuất .113 Hướng phát triển 113 Tài liệu tham khảo 115 TIEU LUAN MOI download : skknchat@gmail.com DANH MỤC CÁC TỪ VIẾT TẮT VIẾT TẮT AMDF TIẾNG ANH Average Magnitude TIẾNG VIỆT Hàm hiệu biên độ trung bình Difference Function ANN Affriciant Neural Network Mạng Neural nhân tạo ASR Automatic Speech Recognition Hệ thống nhận dạng tiếng nói tự động CLIP Center Clipping Pitch Detector Phương pháp trích chu kỳ pitch CLIP COR Autocorrelation coefficients Các hệ số tự tương quan CTR Cofficient to Thershold Ratio Tỷ lệ hệ số ngưỡng CWT Continuous Wavelet Transform Biến đổi Wavelet liên tục DP Dynamic Programming Phương pháp lập trình Dynamic DTW Dynamic Time Warping Phương pháp nhận dạng tiếng nói DTW DWT Discrete Wavelet Transform Biến đổi Wavelet rời rạc FCT Fast Cosine Transform Biến đổi Cosine nhanh FFT Fast Fourier Transform Biến đổi Fourier nhanh FIR Finite Impulse Response Bộ lọc đáp ứng xung hữu hạn FT Fourier Transform Biến đổi Fourier FWT Fast Wavelet Transform Biến đổi Wavelet nhanh GMM Gausian Mixture Model Phương pháp nhận dạng GMM HMM Hidden Markov Model Mơ hình Markov ẩn IDWT Inverse Discrete Wavelet Biến đổi wavelet rời rạc ngược Transform IIR Infinite Impulse Response Bộ lọc đáp ứng xung vô hạn JPEG Joint Photographic Experts Chuẩn nén ảnh JPEG Group LAR Log Area Ratio coefficients Vector đặc trưng tiếng nói miền Logarit LPC Linear Prediction Filter Hệ số tiên đoán tuyến tính Cofficient TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 LSP Line Spectrum Pairs Vector đặc trưng tiếng nói miền tần số LSP MFCC Mel Frequency Ceptral Hệ số tần số Ceptral thang Mel Cofficient MRA Multi-Resolution Analysis Phân tích đa phân giải PARCOR Partial Correlation Cofficients Hệ số tương quan thành phần PLP Perceptional Linear Prediction Hệ số tiên đốn tri giác tuyến tính SCWT Sampled Continuous Wavelet Biến đổi Wavelet liên tục rút gọn Transform SIFT Simplified Inverse Filter Phương pháp ước lượng lỗi SIFT Tracking STFT Short Time Fourier Transform Biến đổi Fourier thời gian ngắn SVM Support Vector Machine Phương pháp nhận dạng SVM VAD Voice Activity Detector Bộ phát tiếng nói VQ Vector Quantilization Phương pháp nhận dạng ước lượng vector VQ VUS Voice, Unvoice and Silence Kỹ thuật dị tìm điểm cuối theo mức lượng VUS WT Wavelet Transform Biến đổi Wavelet (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 DANH SÁCH BẢNG BIỂU Bảng 2.1 Phân chia FFT chuỗi tín hiệu 16 điểm 41 Bảng 5.1 Kết nhận dạng điệu 105 Bảng 6.1 Kết phân lớp điệu 110 Bảng 6.2 Kết nhận dạng tập liệu huấn luyện 110 Bảng 6.3 Kết nhận dạng tập liệu .111 (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 DANH SÁCH HÌNH VẼ Hình 1.1: Sơ đồ nhận dạng tổng quát .17 Hình 1.2: Các lĩnh vực xử lý tiếng nói 18 Hình 1.3: Ranh giới “cơ” “ấy” không rõ ràng 19 Hình 1.4: Người nói khác phát âm khác 21 Hình 1.5: Mơ hình nhận dạng bán độc lập người nói 21 Hình 1.6: Các thành phần hệ thống ASR .22 Hình 1.7: Các dạng cửa sổ thường dùng 24 Hình 1.8: Tổng quát trình rút trích vector đặc trưng 25 Hình 1.9: Các kỹ thuật nhận dạng tiếng nói xu hướng phát triển .25 Hình 1.10: HMM với trạng thái trọng số chuyển trạng thái 27 Hình 2.1: Ví dụ lấy mẫu tín hiệu f(t) miền thời gian 28 Hình 2.2: Minh họa hoạt động lọc FIR 30 Hình 2.3: Minh họa hoạt động lọc IIR .30 Hình 2.4: Dị tìm điểm cuối dựa vào mức lượng 31 Hình 2.5: Sơ đồ rút trích vector đặc trưng tổng quát .32 Hình 2.6: Sơ đồ rút trích đặc trưng chi tiết 32 Hình 2.7: Phân đoạn tiếng nói thành khung chồng lấp 34 Hình 2.8a Âm „a‟ cửa sổ chữ nhật 512 điểm (45ms trái) 64 điểm (5,6ms phải) .36 Hình 2.8b Âm „a‟ cửa sổ Hamming 512 điểm (45ms trái) 64 điểm (5,6ms phải) .36 Hình 2.8c Âm „a‟ cửa sổ Hanning 512 điểm (45ms trái) 64 điểm (5,6ms phải) .37 Hình 2.9: Sự khác biệt dạng cửa sổ tín hiệu 38 Hình 2.10: Đồ thị biểu diễn mối quan hệ Mel Hz 42 Hình 2.11: Các bước trích đặc trưng MFCC 43 (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 104 Hình 5.11: Sơ đồ khối hệ nhận dạng điệu tiếng Việt Tín hiệu tiếng nói sau qua tiền xử lý, trích tần số bản, tạo vector đặc trưng dựa vào vector V(F0) Các vector đặc trưng đưa qua nhận dạng (sử dụng thuật tốn Viterbi để tìm chuỗi trạng thái có xác suất lớn nhất) đầu kết nhận dạng Tuy nhiên, chia thành trường hợp, nên đến chưa phải kết cuối cùng, ta phải dựa vào luật sau để định: - 5a hay 5b định (thanh sắc) - 6a hay 6b định (thanh nặng) 5.5 Các kết nhận dạng điệu Sử dụng mơ Hình HMM trạng thái, bỏ phần bắt đầu 10%, nhận dạng mơ hình cho (mỗi sắc nặng chia thành trường hợp) , sau dùng luật định để đưa kết luận cho Tách riêng huấn luyện 100 mẫu, test 100 mẫu nhận dạng : Kết quả: Kết nhận dạng hệ thống nhận dạng điệu cài đặt phần mềm MATLAB 7.0.1 Tổng cộng 120 tiếng (mỗi 20 tiếng) (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 105 Đúng 114 tiếng (95 %); Sai tiếng (5 %) Ngang Huyền Ngã Hỏi Sắc Nặng Tỉ Ngang 20 Huyền 100 % 20 100 % Ngã 18 Hỏi 18 Sắc 1 90 % 18 Nặng 90 % 90 % 20 100 % Bảng 5.1 Kết nhận dạng điệu (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com lệ (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 106 Chương XÂY DỰNG HỆ THỐNG NHẬN DẠNG TIẾNG VIỆT NGUYÊN TỪ RỜI RẠC HOÀN CHỈNH 6.1 Phương pháp sử dụng 6.1.1 Tổng quát Trong chương 5, xây dựng hệ thống nhận dạng điệu tiếng Việt với độ xác 95 % Đó tỉ lệ cao so với nghiên cứu nhận dạng điệu tiếng Việt Tuy nhiên tỉ lệ chưa đủ để ứng dụng hệ nhận dạng tiếng Việt hoàn chỉnh Việc phân lớp điệu thành lớp cao thấp đạt độ xác 99.8 % cao Vì vậy, chúng tơi ứng dụng modul nhận dạng điệu vào việc phân lớp Nhờ nâng số lượng từ từ điển lên đáng kể mà giữ độ xác cao Hình 6.1 Mơ hình tổng qt;(a) cơng đoạn huấn luyện; (b) cơng đoạn nhận dạng 6.1.2 Tiền xử lý Tiếng nói xử lý giống hệ thống nhận dạng điệu (Xem 5.3.1) 6.1.3 Huấn luyện mẫu Hình 6.2: Công đoạn huấn luyện mẫu (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 107 Bộ liệu sau thu, tạo thành từ điển tương ứng với lớp điệu: cao thấp Trong từ điển cao gồm: sắc ngã, từ điển thấp gồm: ngang (thanh không dấu), huyền, ngã, hỏi, nặng, ngã Ở phân ngã hai từ điển, vì: - Theo tài liệu thống kê I S Bystrov M V Gordina (1976) tần số xuất ngã thấp (chỉ 7%) - Thanh ngã phân lớp vào lớp cao làm cho tỉ lệ nhận dạng bị giảm xuống ngược lại, biến đổi chạy dài từ vùng tần số thấp đến vùng tần số cao Do cách giải đưa ngã vào hai từ điển Tín hiệu tiếng nói sau qua bước tiền xử lý tiến hành rút trích đặc trưng Tất dãy liệu tín hiệu phân khung dùng SCWT phân tích thành vector đặc trưng Các vector đặc trưng dùng để huấn luyện Kết huấn luyện mơ hình HMM cho từ theo lớp từ điển Ứng với lớp từ điển, có mơ hình HMM Để sử dụng việc phân lớp, sử dụng đặc trưng F0 Theo khảo sát luận văn, điệu tiếng Việt chia làm hai lớp phân tách bỡi ngang Do đó, liệu đưa vào sau tiền xử lý, chúng tơi tách riêng từ ngang đem trích F0 Giá trị trung bình F0 ngang giá trị ngưỡng phân lớp Giá trị cộng thêm P trình phân lớp, (P phương sai F0) 6.1.4 Công đoạn nhận dạng Sau huấn luyện mẫu, ta có từ điển tương ứng với lớp Nếu mô hình HMM nhận dạng X tiếng, giả sử ta phân tiếng thành A lớp; tổng số từ vựng ta nhận dạng tăng lên khoảng ~ X*A tiếng (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 108 Hình 6.3: Cơng đoạn nhận dạng Bắt đầu cơng đoạn nhận dạng, tín hiệu tiếng nói đưa qua xác định lớp điệu Tại cơng việc trích pitch phân lớp tiến hành Sau xác định lớp, chương trình lấy từ vựng tương ứng lớp lên để tiến hành việc nhận dạng từ Như vậy, thay phải nhận dạng X*A từ (sẽ vượt khả mô hình HMM), cần nhận dạng A từ lớp thứ Xi Tóm lại, cơng đoạn nhận dạng chia làm hai bước: Bước 1: xác định lớp từ điển Bước 2: nhận dạng lớp từ điển xác định 6.2 Cài đặt hệ thống nhận dạng tiếng Việt nguyên từ rời rạc hoàn chỉnh 6.2.1 Môi trường xây dựng hệ thống Để tận dụng hỗ trợ MATLAB hàm toán học, ToolBox Signal Processing, Wavelet, Statistics (HMM) chọn môi trường cài đặt hệ thống MATLAB 7.01 6.2.2 Bộ từ dùng cho huấn luyện nhận dạng: Bài toán nhận dạng phục vụ cho việc điều khiển Robot tiếng nói bao gồm từ điều khiển (trái, phải, tiến, lùi, thẳng, dừng) để điều khiển robot chuyển động theo hướng (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 109 Dữ liệu dùng để huấn luyện thu với tần số lấy mẫu 16 KHz Bộ từ dùng để huấn luyện điển gồm từ thu từ 20 người nói khác với tổng số từ 120 từ Bộ từ dùng cho nhận dạng độc lập với từ dùng để huấn luyện với số lượng tương đương Trong đó: Lớp (nhóm cao) gồm có sắc, ngã: trái, tiến Lớp (nhóm thấp) gồm ngang, huyền, ngã, hỏi, nặng.: phải, lùi, dừng, thẳng 6.2.3 Tạo vector đặc trưng V(SCWT) Như 4.4.4 đề cập, MFCC SCWT cho kết tương đương MFCC có ưu điểm tính tốn nhanh Mặc dù với mong muốn đề xuất phương pháp nhận dạng tiếng Việt mới, sử dụng SCWT làm vector đặc trưng cho hệ thống nhận dạng Các hệ số SCWT khung tiếng nói đưa qua lọc thơng thấp hạ mẫu từ 16KHz xuống 100 Hz Phân tích Ceptral sử dụng để giảm số lượng hệ số SCWT xuống 12 hệ số Ceptral với độ tin cậy tập trung cao sử dụng làm vector đặc trưng cho hệ thống nhận dạng 6.2.4 Phân lớp Trích F0 theo giải thuật dùng CWT 4.5.2 Giá trị trung bình F0 ngang giá trị ngưỡng phân lớp Giá trị cộng thêm P trình phân lớp, (P phương sai F0) Theo khảo sát, giá trị phương sai tần số ngang: giọng nữ (8 – 16) Hz, giọng nam (20 – 24) Hz Do liệu tiếng nói từ điển giọng nam nên chọn P = 20 6.2.5 Mơ hình HMM cho từ nhận dạng Sử dụng mơ hình HMM trái phải trạng thái, mixture Mỗi từ đơn mô hình (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 110 Hình 6.4 Mơ hình ngơn ngữ hệ nhận dạng 6.2.6 Kết nhận dạng Bảng kết phân lớp điệu: Nhóm Nhóm cao Nhóm thấp Kết Nhóm cao 98 98% Nhóm thấp 99 99% Bảng 6.1 Kết phân lớp điệu Kết nhận dạng tiếng: Nhận dạng tập huấn luyện: Trái Trái Phải Phải Tiến Lùi Thẳng Dừng 20 Tỉ lệ 100 % 20 Tiến 100 % 20 Lùi 100 % 29 Thẳng 100 % 20 Dừng 100 % 20 100 % Bảng 6.2 Kết nhận dạng tập liệu huấn luyện - Số tiếng nhận dạng: 100, đạt kết quả: 100% (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 111 Nhận dạng tập liệu mới: Trái Phải Tiến Lùi Thẳng Dừng Tỉ Trái 19 Phải Tiến 1 95 % 19 95 % 19 Lùi 95 % 19 Thẳng 1 19 Dừng 95 % 95 % 20 100 % Bảng 6.3 Kết nhận dạng tập liệu - S ố tiếng sai: - Số tiếng đúng: 95 - Số tiếng nhận dạng: 100, đạt kết quả: 95% (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com lệ (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 112 KẾT LUẬN Các kết đạt luận văn Sau thời gian tìm hiểu nghiên cứu, hướng dẫn bảo tận tình thầy hướng dẫn, TS Trịnh Anh Vũ, thực mục tiêu luận văn đề ra: - Tìm hiểu, nghiên cứu tổng quan nhận dạng tiếng nói, xử lý tiếng nói, rút trích vector đặc trưng - Nghiên cứu biến đổi wavelet ứng dụng nhận dạng tiếng nói - Nghiên cứu mơ hình Markov ẩn HMM - Khảo sát đặc điểm ngữ âm tiếng Việt âm vị tiếng Việt, điệu tiếng Việt - Xây dựng hệ thống nhận dạng điệu tiếng Việt theo chu kỳ pitch dùng mơ hình HMM trái phải trạng thái - Xây dựng hệ thống nhận dạng tiếng Việt nguyên từ rời rạc có áp dụng phân lớp theo điệu, dùng vector đặc trưng SCWT mơ hình HMM trái phải trạng thái - Xây dựng tiền xử lý nâng cao chất lượng tiếng nói dùng kỹ thuật triệt nhiễu kết hợp kỹ thuật trừ phổ kỹ thuật triệt nhiễu wavelet Các thử nghiệm cài đặt thực môi trường MATLAB 7.0.1 hỗ trợ tốt MATLAB cho lập trình hệ thống xử lý tín hiệu với thư viện hàm tốn học Toolbox: Signal Processing, Wavelet, Statistics (HMM) Luận văn có cải tiến từ phương pháp nghiên cứu ứng dụng cho nhận dạng tiếng nói ngồi nước để đề xuất phương pháp nhận dạng điệu tiếng Việt từ rời rạc tiếng Việt hiệu Các kết thực nghiệm thu khả quan chứng tỏ phương pháp đề xuất phương pháp có triển vọng áp dụng cho hệ nhận dạng tiếng Việt (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 113 Những vấn đề tồn biện pháp khắc phục Luận văn số hạn chế cần khắc phục trình nghiên cứu tiếp theo: - Tốc độ thực thi không tối ưu so với số phương pháp nhận dạng không dùng Wavelet khối lượng tính tốn CWT lớn Vấn đề khơng phái quan trọng tốc độ vi xử lý dung lượng nhớ ngày cải thiện đủ đáp ứng cho hệ thống tính tốn lớn - Số lượng mẫu huấn luyện nhỏ nên độ xác chưa cao Biện pháp khắc phục xây dựng từ điển tiếng nói tiếng Việt đủ lớn dùng cho huấn luyện - Chưa áp dụng mơ hình nhận dạng âm vị nên số lượng từ nhận dạng giới hạn, không đáp ứng đầy đủ cho nhận dạng tất từ tiếng Việt Các đề xuất Với kết nghiên cứu đạt luận văn, có số đề xuất phương pháp nhận dạng điệu tiếng Việt nguyên từ tiếng Việt rời rạc: - Khối tiền xử lý: Áp dụng mơ hình triệt nhiễu kết hợp kỹ thuật trừ phổ wavelet - Nhận dạng điệu tiếng Việt dùng mô hình HMM trái phải trạng thái vector đặc trưng Mandarin cải tiến - Nhận dạng nguyên từ với từ N dùng N + mơ hình HMM trái phải trạng thái vector đặc trưng hệ số SCWT biến đổi qua miền Ceptral - Kết hợp việc nhận dạng từ rời rạc với phân lớp từ theo điệu kỹ thuật trích F0 dùng CWT Hướng phát triển Hướng phát triển tiếp tục hoàn thiện hệ thống nhận dạng theo phương pháp đề xuất Thử nghiệm huấn luyện hệ thống với từ điển mẫu lớn hơn, áp dụng mơ hình HMM cho âm vị thay từ rời rạc Khi hệ thống đạt độ xác cần thiết triển khai thực thi mơ hình điều khiển Robot tiếng nói tiếng Việt thời gian thực Do hiểu biết kiến thức có hạn, đặc biệt điều kiện thời gian eo hẹp, vừa học tập, nghiên cứu vừa tham gia công tác giảng dạy, luận văn (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 114 tránh khỏi thiếu sót Em mong nhận bảo thầy, góp ý bạn để tơi hồn thiện luận văn tiếp tục nghiên cứu sâu lĩnh vực nhận dạng tiếng Việt Xin chân thành cám ơn! (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 115 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Hồng Đình Chiến, Lê Tiến Thường (2005), “Nhận dạng tiếng Việt dùng mạng Neural kết hợp với trích đặc trưng LPC AMDF”, Hội thảo CNTT Quốc Gia [2] Hồng Đình Chiến, “Nhận dạng tiếng Việt dùng mạng Neural kết hợp với trích đặc trưng LPC AMDF”, Chun san Tạp chí BCVT [3] Hà Đình Dũng, Nguyễn Kim Quang (2003), “Xây dựng giảm nhiễu sử dụng phương pháp trừ phổ ứng dụng hệ thống nhận dạng tiếng nói”, Báo cáo hội thảo quốc gia CNTT, Thái Nguyên [4] Đỗ Xuân Đat, Võ Văn Tuấn (2003), Nghiên cứu đặc trưng tiếng Việt áp dụng vào nhận dạng tiếng nói, Luận văn tốt nghiệp Cử nhân CNTT, Đại học KHTN TP Hồ Chí Minh [5] Đặng Ngọc Đức, “Ứng dụng mạng neural nhận dạng tiếng nói mười chữ số tiếng Việt”, Chun san Tạp chí BCVT [6] Đặng Ngọc Đức, “Gán nhãn âm vị trình xây dựng CSDL tiếng Việt”, Chuyên san Tạp chí BCVT [7] Đặng Ngọc Đức, Lương Chi Mai, “Tăng cường độ xác mạng neural nhận dạng tiếng Việt”, Chun san Tạp chí BCVT [8] Nguyễn Hồng Hải, Hà Trần Đức, Nguyễn Việt Anh (2005), Công cụ phân tích wavelet ứng dụng MATLAB, NXB Khoa học kỹ thuật [9] Bùi Huy Hải (2004), Nén tín hiệu tiếng nói dùng biến đổi Wavelet, Luận văn thạc sỹ khoa học, ĐH Bách Khoa Hà Nội [10] Trịnh Văn Loan, Nguyễn Nam Hà, Phạm Việt Hà, “Xác đinh tham số đặc trưng nguyên âm không dấu tiếng Việt”, Chuyên san Tạp chí BCVT [11] Lương Chi Mai, Đặng Ngọc Đức (2005), “Hệ thống nhận dạng tiếng việt khơng dấu liên tục có từ vựng kích thước trung bình”, Hội thảo CNTT Quốc Gia, Hải Phịng (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 116 [12] Nguyễn Thị Thanh Mai, Ngơ Hồng Huy, Nguyễn Huy Hồng (2005), “Nhận dạng điệu tiếng Việt tiếng nói rời rạc phụ thuộc người nói”, Hội thảo CNTT Quốc Gia, Hải Phòng [13] Nguyễn Hồng Quang (2004), Nhận dạng tiếng nói tiếng Việt tìm hiểu ứng dụng, Luận văn tốt nghiệp Cử nhân CNTT, Đại học KHTN TP Hồ Chí Minh [14] Nguyễn Đình Thơng (2005), “Tài liệu hướng dẫn báo cáo phần Xử lý ảnh tín hiệu”, Hệ Cao học, Đại học Quốc gia Hà nội [15] Lê Tiến Thường, Hồng Đình Chiến, Trần Thanh Hùng (2004), “Phương pháp hiệu nhận dạng tiếng Việt ứng dụng phép biến đổi Wavelet”, Chuyên san Tạp chí BCVT [16] Lê Tiến Thường, Huỳnh Ngọc Phiên, “Phương pháp trích chu kỳ cao độ trung bình nhận dạng điệu tiếng Việt”, Chuyên san Tạp chí BCVT, 2005 [17] Lê Tiến Thường, Hồng Đình Chiến, “Biến đổi wavelets, subband coding số ứng dụng xử lý tín hiệu” [18] Nguyễn Quốc Trung (2002), Xử lý tín hiệu lọc số, tập 1,2 NHB KHKT [19] Nguyễn Quốc Trung (2002), Bài giảng mơn Xử lý tín hiệu nâng cao, Hệ cao học, ĐH Bách Khoa Hà Nội Tiếng Anh [20] Donoho, D L.(1995), “Denoising via soft thresholding'', IEEE Trans Information Theory, 41: pp 613-627 [21] Bob Dunn (29 April 2003), Speech Signal Processing and Speech Recognition [22] Christine Englund (2004), “Speech recognition in the JAS 39 Gripen aircraft adaptation to speech at different G-loads”, pp – [23] R Favero and R King, (1993) Wavelet parameterization for speech recognition, Preprint [24] Qiang Fu (2003), “A novel speech enhancement system based on wavelet denoising” (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 117 [25] Yi Hu, Student Member, IEEE, and Philipos C Loizou, Member, IEEE, (2003), “Speech Enhancement Based on Wavelet Thresholding the Multitaper Spectrum” [26] M Krishnan, C Neophytou, and G Prescott (1994) Wavelet transform speech recognition using vector quantization, dynamic time wraping and articicial neural networks Preprint [27] S.Manikandan (2006), “Speech enhancement based on wavelet denoising” [28] Lawrence Rabiner and Biing-Hwang Juang (1993), Fundamentals of Speech Recognition, Prentice Hall [29] Gibert Strang, Truong Nguyen (1996), Wavelet and Filter Banks, WeliesleyCambridge Press, The United States of America [30] H Talhami, T.Le-Tien, D.T Nguyen, (1997), “Simple algorithm for wavelet maxima modulus extraction in time-scale representation”, IEEE Electronic Letter, An Internaltional Publication, England, Vol.33 [31] Beng T TAN, Minyue Fu, Andrew Spray (2000), “The use of wavelet transforms in phoneme recognition” [32] Le Tien Thuong, Nguyen Huu Loc (1998), “An efficient algorithm for ridge extraction in time-scale and time-frequency representations” [33] Keiichi Tokuda, HMM-Based Speech Synthesis toward Human-like Talking Machines (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00 (LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00(LUAN.VAN.THAC.SI).Nhan.dang.tieng.Viet.su.dung.bien.doi.Wavelet.va.mo.hinh.Markov.an.Luan.van.ThS.Ky.thuat.Dien.tu.Vien.thong.2.07.00

Ngày đăng: 17/12/2023, 02:16

Tài liệu cùng người dùng

Tài liệu liên quan