1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu một số phương pháp tổng hợp tiếng nói

82 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 82
Dung lượng 1,15 MB

Nội dung

NGUYỄN ĐỨC THỌ ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP LUẬN VĂN THẠC SĨ KỸ THUẬT LUẬN VĂN THẠC SĨ KỸ THUẬT NGÀNH: KỸ THUẬT ĐIỆN TỬ LUẬN VĂN THẠC SĨ KỸ THUẬT NGHIÊN CỨU MỘT SỐ PHƢƠNG PHÁP TỔNG HỢP TIẾNG NÓI NGHIÊN CỨU MỘT SỐ PHƢƠNG PHÁP TỔNG HỢP TIẾNG NÓI KỸ THUẬT ĐIỆN TỬ TN 2013 Ngành: KỸ THUẬT ĐIỆN TỬ Học Viên: NGUYỄN ĐỨC THỌ Ngƣời HD Khoa học: PGS.TS LƢƠNG CHI MAI Ngành: KỸ THUẬT ĐIỆN TỬ Học Viên: NGUYỄN ĐỨC THỌ Ngƣời HD Khoa học: PGS.TS LƢƠNG CHI MAI THÁI NGUYÊN 2013 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên THÁI NGUYÊN – 2012 Tai ngay!!! Ban co the xoa dong chu nay!!! http://www.lrc-tnu.edu.vn TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP Độc lập - Tự - Hạnh phúc - LUẬN VĂN THẠC SĨ Ngày tháng năm sinh : Nguyễn Đức Thọ : Ngày 22 tháng 03 năm 1980 Nơi sinh : Chi lăng - Quế võ - Tỉnh Bắc Ninh Nơi công tác Cơ sở đào tạo : Trƣờng Cao đẳng nghề Cơ điện Xây dựng Bắc Ninh : Trƣờng Đại học Kỹ thuật Công nghiệp Thái Nguyên : Kỹ thuật điện tử : K13- KT ĐT Họ tên học viên Chuyên ngành Khóa học Ngày giao đề tài Ngày hồn thành đề tài : Ngày .Tháng Năm : Ngày .Tháng Năm TÊN ĐỀ TÀI: NGHIÊN CỨU MỘT SỐ PHƢƠNG PHÁP TỔNG HỢP TIẾNG NÓI Ngƣời hƣớng dẫn khoa học: PGS.TS Lương Chi Mai Viện công nghệ thông tin, viện khoa học công nghệ Việt Nam GIÁO VIÊN HƢỚNG DẪN HỌC VIÊN PGS.TS Lương Chi Mai Nguyễn Đức Thọ KHOA SAU ĐẠI HỌC BAN GIÁM HIỆU Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP LUẬN VĂN THẠC SĨ Tên đề tài: NGHIÊN CỨU MỘT SỐ PHƢƠNG PHÁP TỔNG HỢP TIẾNG NÓI Ngƣời hƣớng dẫn: PGS TS Lƣơng Chi Mai Học viên: Ngyễn Đức Thọ Chuyên ngành: Kỹ thuật điện tử Thái Nguyên 2013 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn LỜI CAM ĐOAN Tên là:Nguyễn Đức Thọ Học viên lớp Cao học khoá 13- Kỹ thuật điện tử - Trƣờng Đại học Kỹ thuật Công nghiệp Thái Nguyên Tôi xin cam đoan luận văn kết nghiên cứu riêng tôi, số liệu, kết nêu luận văn trung thực không chép ai, luận văn khơng giống hồn tồn luận văn cơng trình có trƣớc Thái Ngun, Ngày … tháng … năm 2013 Nguyễn Đức Thọ Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Lời cảm ơn Trƣớc hết, em xin đƣợc gửi lời biết ơn sâu sắc tới thầy cô giáo trƣờng Đại học kỹ thuật Công nghiệp Thái Nguyên, thầy giáo trực tiếp giảng dạy, tận tình hƣớng dẫn em kiến thức kinh nghiệm quý báu suốt thời gian học tập rèn luyện Em xin bày tỏ lời cảm ơn chân thành tới thầy cô giáo Khoa Điện điện tử Trƣờng Đại học kỹ thuật Công nghiệp Thái Nguyên, khoa sau Đại học Trƣờng Đại học kỹ thuật Công nghiệp Thái Nguyên tạo điều kiện thuận lợi cho em thời gian học tập Em xin bày tỏ lòng biết ơn chân thành, lời cảm ơn sâu sắc cô giáo PGS.TS Lƣơng Chi Mai trực tiếp hƣớng dẫn, định hƣớng cho em giải nhiều vấn đề luận văn Em muốn gửi lời cảm ơn tới tập thể lớp thạc sĩ kỹ thuật điện tử k13 tạo môi trƣờng thi đua học tập lành mạnh, tạo điều kiện cho phát triển thành viên lớp Cuối em xin đƣợc cảm ơn ngƣời thân, bạn bè quan tâm, động viên giúp đỡ em trình học tập, nghiên cứu hoàn thành luận văn Tác giả luận văn Nguyễn Đức Thọ Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn MỤC LỤC Lời cam đoan……………………………………………………………………… i Lời cảm ơn ……………………………………………………………………… ii Mục lục…………………………………………………………………………… Danh mục chữ viết tắt………………………………………………………… Danh mục bảng thuật ngữ Anh – Việt ……………………………………… Danh mục hình vẽ đồ thị……………………………………………………… Danh mục bảng biểu………………………………………………………… Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn NỘI DUNG Trang LỜI MỞ ĐẦU……………………………………………………………… Chƣơng Tổng quan tổng hợp tiếng nói…………………………… 12 1.1 Giới thiệu tổng hợp tiếng nói………………………………………… 12 1.1.1 khái niệm tổng hợp tiếng nói…………………………………… 12 1.1.2 Mơ hình tổng hợp tiếng nói…………………………… 12 1.1.2.1 Thành phần xử lý ngơn ngữ tự nhiên……………………………… 15 1.1.2.2 Thành phần xử tín hiệu số………………………………………… 18 1.2 Lịch sử phát triển ứng dụng tổng hợp tiếng nói…………………… 20 Chƣơng Các phƣơng pháp tổng hợp tiếng nói……………………… 25 2.1 Phƣơng pháp tổng hợp theo cấu âm…………………………………… 25 2.2 Phƣơng pháp tổng hợp theo formant…………………………………… 28 2.3 Phƣơng pháp Tổng hợp ghép nối………………………………………… 30 2.4 Phƣơng pháp tổng hợp theo ghép chuỗi………………………………… 31 2.5 Đánh giá chung phƣơng pháp tổng hợp tiếng nói…………………… 34 Chƣơng Chuẩn hoá văn thuật toán phân tích văn bản……… 38 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 3.1 Tổng quan……………………………………………………………… 38 3.2.Các vấn đề toán Chuẩn hóa văn tiếng Việt……………… 38 3.2.1.Bài tốn chuẩn hóa văn tiếng Anh……………………………… 38 3.2.2 Đặc điểm văn tiếng Việt………………………………………… 39 3.2.3.Sự tổ chức khơng có quy chuẩn token………………………… 39 3.2.3.1 Sự phức tạp NSW………………………………………………… 40 3.2.3.2 Xử lý NSW khác nhau…………………………………………… 41 3.2.3.3 Vấn đề phân loại NSW……………………………………………… 41 3.2.3.4.Vấn đề mở rộng NSW………………………………………………… 41 3.3.Giải pháp đề xuất………………………………………………………… 42 3.3.1 Phân loại từ chƣa chuẩn hóa cho tiếng Việt……………………… 42 3.3.2 Tổ chức gán thẻ cho NSW……………………………………………… 47 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 3.3.3.Chuẩn phân tách………………………………………………………… 49 3.3.4.Phát NSW………………………………………………………… 50 3.3.5.Phân loại NSW………………………………………………………… 50 3.3.6.Mở rộng cách đọc……………………………………………………… 52 3.4.Các kỹ thuật giải thuật ………………………………………………… 52 3.4.1.Tổng quan định…………………………………………… 53 3.4.2 Các bƣớc xây dựng định…………………………………… 54 3.4.2.1.Cắt tỉa cây.…………………………………………………………… 55 3.4.2.2.Độ đo thuộc tính……………………………………………………… 55 3.4.2.3.Rút luật phân lớp từ định…………………………………… 56 3.4.2.4.Hiện tƣợng “quá vừa” (overfitting) liệu huấn luyện……………… 56 3.4.2.5.Xử lí vừa liệu………………………………………………… 57 3.4.2.6.Áp dụng định……………………………………………… 58 3.4.3.Mơ hình ngơn ngữ chữ (Letter Language Modeling)…………… 60 3.4.4.Kỹ thuật làm trơn mơ hình Kneser-Ney cải tiến………………………… 60 3.5.Kết chƣơng……………………………………………………………… Chƣơng Cài đặt thử nghiêm modul chuẩn hóa văn cho tiếng Việt 61 62 4.1 Cài đặt thử nghiệm………………………………………………… 62 4.1.1.Cài đặt………………………………………………………………… 62 4.1.2.Thử nghiệm chƣơng trình…………………………………………… 69 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 4.1.2.1 Phƣơng pháp đánh giá kết quả…………………………………… 69 4.1.2.2.Bộ liệu thử nghiệm Training……………………………… 70 4.2 .Kết thử nghiệm…………………………………………………… 72 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 74 TÀI LIỆU THAM KHẢO………………………………………………… 75 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn CHƢƠNG CÀI ĐẶT THỬ NGHIỆM MODUL CHUẨN HÓA VĂN BẢN CHO TIẾNG VIỆT 4.1 Cài đặt thử nghiệm 4.1.1 Cài đặt - Chƣơng trình đƣợc cài đặt mội trƣờng Windows sử dụng ngơn ngữ lập trình, cơng cụ lập trình thƣ viện sau: o Ngơn ngữ lập trình Java o Bộ cơng cụ lập trình Netbeans IDE o Thƣ viện VietTalk: Sản phẩm TTS Viện Công nghệ thông tin o Thƣ viện Jsoup: lấy nội dung text từ trang web Chƣơng trình sử dụng hệ thống TTS iSOLAR thƣ viện VietTalk để đọc nội dung trang báo điện tử - Sau hình ảnh minh họa tất package có chương trình: Mơ đun chƣơng trình Tokenization bao gồm packages sau: Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Mô đun tokenization Các pakage bao gồm classifier, detector, disambiguator, expander, spliter đƣợc cài đặt đóng gói riêng biệt độc lập với Việc tạo thuận lợi cho công tác cải tiến thuật tốn, bảo trì code, khả mở rộng ứng dụng tƣơng lai mô đun classification, detector, spliter, disambiguation expansion Sau hình ảnh giao diện ứng dụng hoạt động Bên trái text area cho phép ta nhập văn đầu vào Còn bên phải kết thƣ đƣợc sau tiền xử lí Hệ thống xử dụng thêm màu xanh đỏ để tô đậm kết quả: o Màu đỏ: hệ thống khơng tự xử lí đƣợc o Màu xanh: kết đƣợc xử lí hệ thống Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Ứng dụng cho phép ngƣời dùng trực tiếp chỉnh sửa cách đọc từ Hình 4-1 Giao diện hệ thống Các phƣơng thức  public String match (String input, int type) Phƣơng thức kiểm tra xem chuỗi đầu vào input có thuộc kiểu type khơng Nếu thuộc kiểu type trả kiểu chuỗi đầu vào  public List expand (List tokens, String text, String type) Phƣơng thức khai triển đầu vào text thành dạng đọc đƣợc theo kiểu type biết Hàm trả phần tử Element thay vào vị trí thành phần Element danh sách tokens  public void replaceTokens (Element old, Element new) Hàm thao tác với đối tƣợng Document Hàm thay thành phần Element cũ old thành phần Element new Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Phƣơng thức public void match (Element sayas, String type) public String match (String input, int type) public List expand (List tokens, String text, String type) public List makeNewTokens (Document doc, String newText, Boolean createMtu, String origText,) public void replaceTokens (Element old, Element new) Đầu vào Là NSWs kiểu mà NSWs nhận Đầu Nếu NSWs thuộc kiểu type trả dạng đầy đủ Nếu type kiểu phù hợp trả thơng báo khơng tìm thấy kiểu tƣơng ứng Khai triển chuỗi Trả dạng đọc đầu vào input theo đƣợc chuỗi kiểu type cho trƣớc input Việc khai triển Trả danh sách thực diễn bao gồm dạng đọc hàm đƣợc NSW Tạo Tokens Trả danh sách mới, Token tokens dạng khai triển NSWs Trong origText dạng ban đầu NSWs newText dạng sau khai triển Thay thể thành phần old thành phần new Ý nghĩa Lần lƣợt thử NSWs với kiểu mà nhận Khai triển NSWs theo kiểu biết Khai triển NSWs Tạo token Thay thể tokens cũ tokens cấu trúc xml Bảng 4-1 Các phƣơng thức chƣơng trình * Các biểu thức quy Các biểu thức quy đƣợc định nghĩa riêng 13 lớp sau Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Các mơ đun biểu thức quy  DateEP Chứa biểu thức quy đại diện cho tập hợp chuỗi mơ tả ngày tháng năm Biểu thức quy đƣợc sử dụng: - Biểu thức biểu ngày: day = “(0)?[1-9]|[12][0-9]|3[01]” - Biểu diễn tháng: month = “0?[1-9]|1[0-2]” - Biểu diễn năm: year = “[0-9][0-9] [0-9][0-9]” - Biểu diễn giá trị phân ngày với tháng, tháng năm: operator = “/|\\.” - Biểu diễn tập cấu trúc ngày-tháng-năm: DayMonthYear = day + operator + month + operator + year Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - Biểu diễn tập cấu trúc ngày-tháng: DayMonth = day + operator + month - Biểu diễn tập cấu trúc tháng-năm: MonthYear = month + year  DurationEP Các biêu thức quy đƣợc sử dụng: - Biểu diễn giờ: hour = “0?[0-9]|1[0-9]|2[0-4]” - Biểu diễn phút giây: minute = “[0-5][0-9]” second = minute - Biểu diễn toán tử xuất cấu trúc - phút –giây: operator = “\\:|\\.” - Biểu diễn cấu trúc thời gian phút giây: HourMinuteSecond = hour + operator +minute + operator + second - Biểu diễn cấu trúc phút HourMinuter = hour + operator +minute  TelephoneEP Biểu thức quy biểu diễn tập hợp số điện thoại telephone = “[0+][0-9/\\-\\.]+”  NetEP text = “[A-Za-z0-9\\!\\#\\$\\%\\&\\*\\+\\-\\/\\=\\?\\_\\{\\|\\}]” Biểu diễn tập địa mail: email = text + \\ + text + “\\@” +text+ \\ + text Biểu diễn tập địa web: uri = http|fpt:// + text + \\ +text + “com|edu|net|info|de|org” + “/” +text  AbbrevEP Để nhận biết từ thuộc nhóm từ viết tắt ta dựa vào từ điển số đặc điểm đơn giản ví dụ: Các chữ từ đƣợc viết hoa, Từ có chữ viết hoa chữ chữ đứng đầu,… Vấn đề cần xử lí chữ số La Mã thƣờng xuyên có nhầm lẫn chúng từ viết tắt, chất chữ số chữ viết hoa (I, II, V, X,…) Các trƣờng hợp nhƣ cần đƣợc phân loại lại trƣớc khai triển dựa vào tiền tố chúng Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Hình 4-2: Từ điển viết tắt  Composite EP Biểu thức quy đƣợc sử dụng là: LettersDigitsAndHyphen = "([^-]*[A-Za-z0-9][^-]*)(-[^-]*[A-Za-z0-9][^-]*)+" Biểu thức đại diện cho nhóm cấu trúc có chứa dấu “-” Biểu thức sau đại diện cho cấu trúc gồm chữ số trộn lẫn: "(?:(?:[A-Za-z]+[0-9]+)|(?:[0-9]+[A-Za-z]+))[A-Za-z0-9]*" Với cấu trúc từ số đƣợc tách riêng Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 1.2.Thử nghiệm chƣơng trình 4.1.2.1.Phƣơng pháp đánh giá kết Trong trình thử nghiệm đánh giá kết quả, em sử dụng phƣơng pháp đánh giá thông qua độ đo gồm độ xác (Precision) độ bao phủ (Recall) Đây hai độ đo thông thƣờng đƣợc sử dụng đánh giá thuật toán nhận dạng mẫu (pattern recognition algorithm) Có thể coi phƣơng pháp đánh giá mở rộng độ xác (accuracy) – độ đo tính tốn số lƣợng kết xác trả so với yêu cầu Hình 4-3 Minh họa độ đo Độ xác (Precision): Độ đo xác đƣợc đo tỉ lệ số lƣợng nsw đƣợc phát xác số lƣợng nsw đƣợc tìm thấy chƣơng trình Mơ hình đánh giá đƣợc tính theo công thức sau: Độ bao phủ (Recall): Độ đo bao phủ đƣợc đo tỉ lệ số lƣợng nsw đƣợc tìm thấy xác số lƣợng nsw thực tế có văn Mơ hình tính tốn nhƣ sau: Độ đo cân (F-measure): Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Độ đo cân độ đo kết hợp độ xác độ đo cân Với ý nghĩa độ đo điều hòa hai độ đo Độ đo cân F-score đƣợc tính qua cơng thức: 4.1.2.2.Bộ liệu thử nghiệm Training Bao gồm 400 lấy từ wikipedia Số từ Số NSWs Tỷ lệ NSWs 703980 69425 9,86% Tỉ lệ NSWs tập traing STT Các chủ đề 10 11 12 13 14 15 16 17 Âm nhạc Du lịch Điện ảnh Game+ truyện tranh Kiến trúc Khoa học tự nhiên Giáo dục Quốc tế Quân Kinh tế Lịch sử Pháp luật Thể thao Tin học Sinh học-Y học Văn học Khác Tỷ lệ phần trăm (%) 12,5 2,75 3,75 7,75 3,5 5,25 10,75 9,75 3,25 10,5 2,75 6,75 4,5 3,75 Phân bố chủ đề tập training (2) Testing Tập test 1: 2000 câu rút từ tập training đƣợc gán nhãn tay Tập test 2: 2000 câu lấy từ trang tinngan.vn Viettel đƣợc gán nhãn tay Phân phối NSWs tập test Nhóm Phân phối Phân phối tập test tập test NUMBERS 27% 40,5% LETTERS 65% 58,3% Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn OTHERS 8% 1,2% Phân bố NSWs tập test Lớp nhỏ date:dmy date:dm date:my date:d date:m number:frac duration:hms duration:hm duration:y score mesuare number:float number:integer number:ordinal number:digits number:roman telephone address Phân phối lớp tập test 0,3% 1% 0,2% 0,2% 0,4% 0,8% 0 1,7% 0,4% 2% 0,7% 88% 3% 1,5% 0,3% 0,2% Phân phối tập test 14,38% 0,05% 1,5% 1,7% 0,3% 1,6% 1,5% 4,6% 3,5% 69,2% 1,2% 0,4% 0,04% 0,03% Bảng 4-2 Phân bố cụ thể loại thuộc kiểu NUMBERS Nhóm nhỏ currency specialChar net:email net:uri Phân phối nhóm nhỏ tập test 5% 95% 0 Phân phối nhóm nhỏ tập test 29,8% 68,4% 1,8% Bảng 4-3 Phân bố NSWs tập OTHERS Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 4.2.Kết thử nghiệm Kết thử nghiệm độ xác việc gán nhãn đƣợc đánh giá dựa công thức sau Accuracy of a subcategory = Subcategory date:dmy date:dm date:my date:d date:m number:frac duration:hms duration:hm duration:y score mesuare number:float number:integer number:ordinal number:digits number:roman telephone address Average Độ xác test 100% 100% 100% 100% 100% 100% Độ xác test 100% 100% 100% 100% 100% 100% 94% 100% 100% 100% 99,7% 100% 80% 100% 100% 98% 100% 100% 100% 71,4% 100% 100% 97,67% 87,5% 100% 100% 97,84% Độ xác nhóm NUMBERS Subcategory acronym Average Độ xác test 98,54% 98,54% Độ xác test2 99,5% 99,5% Độ xác nhóm LETTERS Subcategory Currency specialChar Độ chĩnh xác test 50% 100% Số hóa Trung tâm Học liệu – Đại học Thái Nguyên Độ xác test 90% 100% http://www.lrc-tnu.edu.vn net:email net:uri Average 100% 96,7% 75% Đánh giá kết Precision Recall F-score Độ xác nhóm OTHERS 98,55% 96,13% 97,32% Đánh giá theo độ đo Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn KẾT LUẬN VÀ HƢƠNG PHÁT TRIỂN Kết đạt đƣợc Qua thời gian nghiên cứu cài đặt, luận văn đóng góp đƣợc vấn đề sau: - Giúp ngƣời đọc hiểu đƣợc chi tiết thành phần hệ tổng hợp tiếng nói, - Giới thiệu đánh giá số phƣơng pháp tổng hợp tiếng nói nay, - Trình bày đƣợc cách phƣơng pháp nâng cao chất lƣợng tiếng nói tổng hợp, đặc biệt giới thiệu kỹ thuật phân tích ngơn điệu thƣờng sử dụng để cải tiến chất lƣợng tiếng nói, -Thử nghiệm đƣa đƣợc tập luật cho việc thay đổi biên độ, lƣợng, trƣờng độ tần số hệ tổng hợp tiếng Việt, cải thiện đáng kể chất lƣợng TTS Hƣớng phát triển Do thời gian làm luận văn có hạn nên chƣa thực đƣợc khía cạnh để nâng cao chất lƣợng tiếng nói tổng hợp Những định hƣớng đề tài là: - Tiếp tục nghiên cứu quy luật biến đổi điệu cụm từ, câu thay mức từ đơi nhƣ nay, - Cải tiến chất lƣợng phụ âm đầu, đặc biệt phụ âm m, n, nh, - Thử nghiệm mơ hình Xu [TLTK] việc hiệu chỉnh đƣờng F0, mơ hình áp dụng đƣợc cho tiếng Trung Quốc, - Xây dựng sở liệu tiếng nói lớn để ứng dụng mơ hình markov ẩn việc lựa chọn đơn vị tổng hợp ngữ cảnh khác Đây cách tiếp cận mang hứa hẹn đem lại tiếng nói có chất lƣợng cao Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn TÀI LIỆU THAM KHẢO Tiếng việt Ngơ Hồng Huy, Nguyễn Thị Thanh Mai, Bùi Quang Trung (2002), “Chuẩn hoá phân tích tiếng việt”, kỷ yếu Hội thảo quốc gia công nghệ thông tin, Nha Trang Nguyễn Thị Thanh Mai, Nghiên cứu phƣơng pháp nâng cao chất lƣợng tổng hợp tiếng việt thử nghiệm cho phần mềm VnVoice, Luận văn thạc sĩ, Trƣờng Đại học công nghệ, Đại học Quốc gia Hà Nội 3.Trịnh Anh Tuấn, Nghiên cứu đặc trƣng để phân tích tổng hợp tín hiệu âm tần, Luận án tiến sĩ, Học viện Cơng nghệ Bƣu viễn thơng Lƣu Hồng Việt, Hệ thống điều khiển nhúng, giảng Bộ môn điều khiển tự động, Trƣờng Đại học Bách khoa Hà nội Tiếng Anh [Abrantes et al 91] A.J ABRANTES, J.S MARQUES, I.M TRANSCOSO, "Hybrid Sinusoïdal Modeling of Speech without Voicing Decision", EUROSPEECH 91, pp 231-234 [Allen 85] J ALLEN, "A Perspective on Man-Machine Communication by Speech", Proceedings of the IEEE, vol 73, n°11, November 1985, pp 1541-1550 7.[Allen et al 87] J ALLEN, S HUNNICUT, D KLATT, From Text To Speech, The MITTALK System, Cambridge University Press, 1987, 213 pp [Bachenko & Fitzpatrick 90] J BACHENKO, E Fitzpatrick, "Acomputational grammar of discourse-neutral prosodic phrasing in English", Computational Linguistics, n°16, September 1990, pp 155-167 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn [Benello et al 88] J BENELLO, A.W MACKIE, J.A ANDERSON, "Syntactic category disambiguation with neural networks", Computer Speech and Language, 1989, n°3, pp.203-217 [Carlson et al 82] R CARLSON, B GRANSTRÖM, S HUNNICUT, "A multi-language Text-To-Speech module", ICASSP 82, Paris, vol 3, pp 1604-1607 [Coker 85] C.H COKER, "A Dictionary-Intensive Letter-to-Sound Program", J Ac Soc Am., suppl 1, n°78, 1985, S7 [Coker et al 90] C.H COKER, K.W CHURCH, M.Y LIBERMAN, "Morphology and rhyming : Two powerful alternatives to letter-to-sound rules for speech synthesis", Proc of the ESCA Workshop on Speech Synthesis, Autrans (France), 1990, pp 83-86 [Daelemans & van den Bosch 93] W DAELEMANS, A VAN DEN BOSCH, "TabTalk : Reusability in data-oriented grapheme-to-phoneme conversion", Proc Eurospeech 93, Berlin, pp 1459-1462 [Dutoit 93] T DUTOIT, H LEICH, "MBR-PSOLA : Text-To-Speech Synthesis based on an MBE Re-Synthesis of the Segments Database", Speech Communication, Elsevier Publisher, November 1993, vol 13, n°3-4 [Dutoit 96] T DUTOIT, An Introduction to Text-To-Speech Synthesis¸ Kluwer Academic Publishers, 1996, 326 pp [Flanagan 72] J.L FLANAGAN, Speech Analysis, Synthesis, and Perception, Springer Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Ngày đăng: 18/10/2023, 15:41

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w