1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tổng hợp nguyên âm tiếng việt

61 17 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 61
Dung lượng 1,16 MB

Nội dung

Luận văn thạc sỹ khoa học MỤC LỤC Trang Trang phụ bìa Lời cam đoan……………………………………………………………………… Danh mục hình vẽ………………………………………………………………4 Danh mục bảng………………………………………………………………….7 Danh mục từ việt tắt………………………………………………………… MỞ ĐẦU………………………………………………………………………… Chương – TỔNG QUAN VỀ NGUYÊN ÂM TIẾNG VIỆT……………………13 1.1 Cấu tạo âm tiết tiếng Việt …………………………………………………… 13 1.1.1 Âm ñầu ………………………………………………………………… 13 1.1.2 Âm đệm ………………………………………………………………… 14 1.1.3 Âm chính………………………………………………………………….14 1.1.4 Âm cuối………………………………………………………………… 17 1.1.5 Thanh ñiệu ……………………………………………………………… 18 1.2 Các tham số tiếng nói ngun âm tiếng Việt…………….19 Chương – TỔNG QUAN VỀ TỔNG HỢP TIẾNG NĨI ……………………… 23 2.1 Khái niệm tiếng nói………………………………… 23 2.2 Cơ chế tạo tiếng nói………………………………………………………… 23 2.3 Khái niệm tổng hợp tiếng nói…………………………………………… 26 2.3.1 Tổng hợp mức cao ………………………………………………………….27 2.3.2 Tổng hợp mức thấp ……………………………………………………… 29 2.4 Các phương pháp tổng hợp tiếng nói………………………………………… 31 2.4.1 Phương pháp tổng hợp tiếng nói cách mô máy cấu âm người………………………………………………………………………… 32 2.4.2 Phương pháp tổng hợp tiếng nói theo tần số formant…………………… 32 2.4.3 Phương pháp tổng hợp tiếng nói cách ghép nối………………… 35 Chương 3- MƠ HÌNH TỔNG HỢP TIẾNG NĨI DRM VÀ MƠ HÌNH CẤU ÂM….39 3.1 Mơ hình tổng hợp tiếng nói Distinctive region model (DRM) ……………… 39 Đo lường hệ thống ñiều khiển Luận văn thạc sỹ khoa học 3.2 Chương trình tổng hợp tiếng nói SMART ………………………………… 46 Chương 4: TỔNG HỢP CÁC NGUYÊN ÂM TIẾNG VIỆT…………………… .50 4.1 Đặc ñiểm nguyên âm tiếng Việt………………………………………… 50 4.2 Tổng hợp nguyên âm tiếng Việt sử dụng chương trình SMART………… 55 Chương 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN …………………………….60 5.1 Kết Luận 60 5.2 Hướng phát triển 60 TÀI LIỆU THAM KHẢO ……………………………………………………… 61 Đo lường hệ thống ñiều khiển Luận văn thạc sỹ khoa học LỜI CAM ĐOAN Tôi xin cam ñoan luận văn kết nghiên cứu riêng tôi, không chép Nội dung luận văn có tham khảo sử dụng tài liệu, thơng tin đăng tải tạp trí, sách, báo, giảng trang web theo danh mục tài liệu luận văn Nguyễn Thị Sim Đo lường hệ thống ñiều khiển Luận văn thạc sỹ khoa học DANH MỤC CÁC HÌNH VẼ Trang Hình 1.1: Biểu diễn tần số F1 – F2 hai nguyên âm /a/ /ă/ ñược phát âm ñộc lập…………………………………………………………………… .15 Hình 1.2: Thanh điệu ngun âm /a/ /ă/ phát âm độc lập…… 16 Hình 1.3: Biểu diễn tốc ñộ thay ñổi tần số F1 đoạn chuyển tiếp CV… 16 Hình 1.4: Đường cong mô tả giá trị tần số F0 ñiệu tiếng Việt 18 Hình 2.1: Cấu tạo máy cấu âm người………………………………….24 Hình 2.2: Mơ máy cấu âm người……………………………………25 Hình 2.3 Mơ hình tổng hợp tiếng nói…………………………………………… 27 Hình 2.4 Sự phụ thuộc ngơn điệu vào yếu tố…………………………… 29 Hình 2.5: Cấu trúc tổng hợp tiếng nói theo tần số formant nối tiếp 33 Hình 2.6 Cấu trúc tổng hợp tiếng nói theo tần số formant song song 34 Hình 3.1: (a) Tiết diện ống âm học đóng - mở; (b) Hình dáng hàm sensitivity ñối với tần số cộng hưởng thứ F1 (R Carré, Maria Mody, 1997) 39 Hình 3.2: (a) Hàm diện tích thiết diện ống âm học đóng – mở khơng A0(n); (b) hàm sensitivity S0F1(n) tương ứng với tần số formant F1; (c) hàm diện tích thiết diện ban đầu A0(n) (đường nét mảnh) hình dáng ống A1(n) (đường nét đậm) có theo thuật toán 41 Hình 3.3: Thay đổi hình dáng ống âm học đóng – mở để tăng (a) giảm (b) tần số formant F1; (c) thay ñổi tần số formant F1; (d) biểu diễn thay ñổi F1 mặt phẳng F1-F2: ñường nét liền: F1 tăng, ñường nét ñứt: F1 giảm 43 Hình 3.4: Thay đổi hình dáng ống âm học ñều ñóng – mở ñể tăng (a) giảm (b) tần số formant F2; (c) thay ñổi tần số formant F2; (d) biểu diễn Đo lường hệ thống ñiều khiển Luận văn thạc sỹ khoa học thay ñổi F2 mặt phẳng F1-F2: ñường nét liền: F2 tăng, ñường nét ñứt: F2 giảm…………………………………………………………………… 44 Hình 3.5: Các hàm sensibility (∆F) ống âm học đóng – mở ba tần số formant (F1, F2, F3) mơ hình DRM với vùng tương ứng với vị trí ñiểm qua không hàm sensibility 45 Hình 3.6: (a) Ống quản mơ hình DRM vùng phân biệt: R1 tương ứng với quản, R3, R4, R5, R6 tương ứng với lưỡi, R7 tương ứng với răng, R8 tương ứng với mơi; (b) Mơ hình DRM vùng phân biệt vị trí cấu âm nguyên âm phụ âm 46 Hình 3.7: Mơ hình phương pháp tổng hợp tiếng nói theo phương pháp mơ hình hóa máy cấu âm người 47 Hình 3.8: Quan hệ truyền đạt tín hiệu vị trí kết nối hai đoạn ống mơ hình mơ ống quản…………………………………………………….47 Hình 3.9: Điều khiển chương trình SMART mơ hình DRM 49 Hình 4.1: Độ dài trung bình nguyên âm tiếng Việt ngữ cảnh âm tiết có cấu trúc (C1)VC2, C1 phụ âm ñầu /b/, V nguyên âm /a, ă, ɤ, ɤ̆, ɔ, ɔ̆, ɛ, u, i/, C2 phụ âm cuối /p, t, k/ 53 Hình 4.2: Độ dài trung bình nguyên âm tiếng Việt ngữ cảnh âm tiết có cấu trúc (C1)V1V2, C1 phụ âm ñầu /b/, V1 nguyên âm /a, ă, ɤ, ɤ̆, ɔ, ɛ, u, i/,V2 bán nguyên âm cuối /w, j/ 54 Hình 4.3: So sánh độ dài trung bình ngun âm tiếng Việt hai ngữ cảnh: (C1)VC2 (C1)VV2, ñó C1 phụ âm ñầu /b/, V nguyên âm tiếng Việt /a, ă, ɤ, ɤ̆, ɔ, ɔ̆, ɛ, u, i/, C2 phụ âm cuối /p, t, k/, V2 bán nguyên âm cuối /w, j/ 55 Hình 4.4: Chương trình SMART tổng hợp nguyên âm tiếng Việt 56 Hình 4.5: Kết tổng hợp 02 nguyên âm /ai/ chương trình SMART 56 Hình 4.6: Tín hiệu tổng hợp tần số formant F1, F2, F3 hai nguyên âm /ai/ tổng hợp chương trình SMART 57 Đo lường hệ thống ñiều khiển Luận văn thạc sỹ khoa học Hình 4.7: Tín hiệu tổng hợp tần số formant F1, F2, F3 hai nguyên âm /au/ tổng hợp chương trình SMART 57 Hình 4.8: Tín hiệu tổng hợp tần số formant F1, F2, F3 hai nguyên âm /ui/ tổng hợp chương trình SMART .58 Hình 4.9: Tín hiệu tổng hợp tần số formant F1, F2, F3 nguyên âm /a/ bán nguyên âm /j/ tổng hợp chương trình SMART 58 Hình 4.10: Tín hiệu tổng hợp tần số formant F1, F2, F3 nguyên âm /ă/ bán nguyên âm /j/ tổng hợp chương trình SMART 59 Đo lường hệ thống ñiều khiển Luận văn thạc sỹ khoa học DANH MỤC CÁC BẢNG Bảng 1.1 Cấu trúc âm tiết tiếng Việt…………………………………………13 Bảng 1.2 Liệt kê âm vị 22 phụ âm ñầu tiếng Việt………………… .14 Bảng 1.3: Âm ñệm tiếng Việt………………………………………… .14 Bảng 1.4: Phân loại nguyên âm tiếng Việt………………………………… 15 Bảng 1.5: Các âm cuối tiếng Việt………………………………………… 17 Bảng 1.6: Vị trí cấu âm chế độ cấu âm nguyên âm cuối tiếng Việt……17 Bảng 1.7: Các ñiệu tiếng Việt……………………………………… 18 Bảng 1.8: Các tần số formant F1, F2, F3 số nguyên âm tiếng Việt………22 Bảng 4.1: Độ dài nguyên âm /a/ /ă/ ngữ cảnh âm tiết (C1)VC2 50 Bảng 4.2: Độ dài nguyên âm /a/ /ă/ ngữ cảnh âm tiết (C1)V1V2 51 Bảng 4.3: Độ dài cặp nguyên âm dài – ngắn /ɤ, ɤ̆/ /ɔ, ɔ̆/ ngữ cảnh âm tiết (C1)VC2 52 Bảng 4.4: Độ dài trung bình nguyên âm /ɤ/ /ɤ̆/ ngữ cảnh âm tiết có cấu trúc (C1)V1V2 52 Đo lường hệ thống ñiều khiển Luận văn thạc sỹ khoa học DANH MỤC CÁC TỪ VIẾT TẮT Formant: Là tần số cộng hưởng tuyến âm CV: Nguyên âm – Phụ âm TTS: Tổng hợp tiếng nói FE: Phần ñầu BE: Phần cuối NLP: Khối xử lý ngôn ngữ tự nhiên DSP: Khối xử lý tổng hợp tiếng nói CSDL: Cơ sở liệu Đo lường hệ thống ñiều khiển Luận văn thạc sỹ khoa học MỞ ĐẦU Kể từ xuất hiện, máy tính ngày chứng tỏ cơng cụ vơ hữu ích trợ giúp người xử lý thông tin Cùng với phát triển xã hội, khối lượng thơng tin mà máy tính cần xử lý tăng nhanh thời gian dành cho cơng việc lại giảm Vì vậy, việc tăng tốc độ xử lý thơng tin, có tốc ñộ trao ñổi thông tin người máy tính, trở thành yêu cầu cấp thiết Hiện tại, giao tiếp người - máy ñược thực thiết bị bàn phím, chuột, hình, với tốc độ tương đối chậm nên cần có phương pháp trao đổi thơng tin giúp người làm việc hiệu với máy tính Một hướng nghiên cứu sử dụng tiếng nói trao đổi thơng tin người - máy Những nghiên cứu liên quan trực tiếp tới kết chun ngành xử lý tiếng nói, có tổng hợp tiếng nói Tổng hợp tiếng nói lĩnh vực ñang ñược nghiên cứu rộng rãi giới cho kết tốt Có ba phương pháp dùng để tổng hợp tiếng nói ñó phương pháp tổng hợp tiếng nói cách mô máy phát âm, phương pháp tổng hợp tiếng nói theo tần số formant phương pháp tổng hợp tiếng nói cách ghép nối Phương pháp tổng hợp tiếng nói cách mơ máy phát âm cho chất lượng tiếng nói tốt địi hỏi nhiều tính tốn việc mơ xác máy phát âm phức tạp Phương pháp tổng hợp tiếng nói theo tần số formant khơng địi hỏi chi phí cao tính tốn cho chất lượng tiếng nói chưa tự nhiên Phương pháp tổng hợp tiếng nói ghép nối cho chất lượng tiếng nói tốt, chí phí tính tốn khơng cao số lượng từ vựng phải lớn Ở nước phát triển, nghiên cứu xử lý tiếng nói cho kết khả quan, làm tiền ñề cho việc giao tiếp người-máy tiếng nói Ở Việt Nam, nghiên cứu lĩnh vực ñược phát triển năm gần có số kết khả quan Đo lường hệ thống ñiều khiển Luận văn thạc sỹ khoa học Tổng hợp tiếng nói phương pháp mơ máy cấu âm cho tiếng nói có chất lượng tiếng nói tốt ñặc biệt ñối với nguyên âm Tuy nhiên cịn tồn vấn đề quan trọng là: mơ hình hình thành nên âm có sức thuyết phục khó để điều khiển nó, đặc biệt để trì tiếng nói liên tục có nhiều tượng cấu âm Để giảm bớt khó khăn này, chúng tơi đề xuất phương pháp ghép mơ hình tương tự vào mơ hình điều khiển âm DRM Với mục đích góp phần vào phát triển tổng hợp tiếng Việt, ñề tài nghiên cứu phương pháp tổng hợp ngun âm tiếng Việt mơ hình cấu âm mơ hình DRM Cơ sở khoa học thực tiễn đề tài: Có nhiều phương pháp tổng hợp tiếng nói, phương pháp mơ hình hóa máy cấu âm người cho chất lượng tiếng nói tốt, cho phép nghiên cứu q trình cấu âm người Đề tài nghiên cứu xây dựng cách tính tốn hình dáng ống quản (vocal tract) người dựa giá trị tần số formant F1, F2, F3 ño ñược từ tiếng nói để điều khiển hệ thống tổng hợp tiếng nói theo phương pháp mơ hình hóa máy cấu âm mơ hình DRM Lịch sử nghiên cứu: Có nhiều nghiên cứu, ứng dụng tiếng nói vào lĩnh vực truyền thơng Nhu cầu điều khiển máy móc, thiết bị tiếng nói ngày thiết đặc biệt ñối với thiết bị cầm tay như: ñiện thoại di ñộng, PC,….Tuy nhiên, Việt Nam, việc nghiên cứu tổng hợp ngun âm tiếng Việt mơ hình cấu âm mơ hình RDM cịn trung tâm ñào tạo trường ñại học Mục đích đề tài (Các kết cần đạt được) Nghiên cứu phương pháp tính tốn hình dáng ống quản (vocal tract) người dựa giá trị tần số formant F1, F2, F3 nguyên âm tiếng Việt Kết thử nghiệm số nguyên âm chương trình SMART Đo lường hệ thống ñiều khiển 10 Luận văn thạc sỹ khoa học Tiếng nói Nguồn khơng khí (phổi) Hệ thống dây quản Khoang miệng + mũi Các tham số ñiều khiển Hình3.7: Mơ hình phương pháp tổng hợp tiếng nói theo phương pháp mơ hình hóa máy cấu âm người Khi khơng khí từ phổi lên, phân dây quản rung, đóng vai trị van đóng mở, ngắt luồng khơng khí thành chuỗi xung liền Các khối xung đóng vai trị nguồn lượng (nguồn âm) cho phận cộng hưởng gồm khoang miệng khoang mũi Do chất lượng giai điệu tiếng nói người phụ thuộc nhiều vào đặc tính, chế độ rung dây quản Ống quản mơ hình mơ cấu âm thường chia thành nhiều ñoạn ngắn (từ 40 ñến 100 đoạn, theo u cầu độ xác) Quan hệ truyền ñạt kết nối hai ñoạn ống ñược biểu diễn hình 3.8 ñây Hình 3.8: Quan hệ truyền đạt tín hiệu vị trí kết nối hai đoạn ống mơ hình mơ ống quản Đo lường hệ thống ñiều khiển 47 Luận văn thạc sỹ khoa học Tại điểm nối đoạn ống mơ hình mơ ống quản, phương trình mơ tả mối quan hệ lưu lượng khí sau:  U k++1 (t ) = (1 + rk ).U k+ (t − τ k ) + rk U k−+1 (t )  − + − U k (t + τ k ) = − rk U k (t − τ k ) + (1 − rk ).U k +1 (t ) Trong rk hệ số phản xạ vị trí tiếp giáp thứ k rk = Ak +1 − Ak Ak +1 + Ak − ≤ rk ≤ Ưu điểm phương pháp tổng hợp tiếng nói theo mơ hình cấu âm khơng khả tạo tiếng nói tổng hợp với chất lượng tốt mà cịn khả thay đổi giọng nói cách thay đổi, điều chỉnh vài tham số mơ hình Chương trình tổng hợp tiếng nói SMART tổng hợp tiếng nói theo phương pháp mơ hình hóa máy phát âm người, ống quản ñược chia thành 36 ñoạn ñều nhau, ñoạn có kích thước 0,5 cm Thực tế để có hình dáng ống quản sử dụng cho mục đích tổng hợp tiếng nói, phương pháp trước thường sử dụng dùng thiết bị chụp X-quang ñể ghi lại hình dáng ống quản trình người tham gia phát âm nguyên âm phụ âm Sau người ta tiến hành ño ñạc kích thước ống quản, làm phép tính thống kê để có hình dáng ống quản phát âm nguyên âm, phụ âm Nhược điểm lớn phương pháp cần lượng CSDL lớn ảnh chụp X-quang phải tiến hành đo đạc kích thước ảnh chụp Ở ñây, phương án ñược đề xuất sử dụng mơ hình DRM điều khiển mơ hình ống quản phương pháp tổng hợp theo mơ hình cấu âm Như đề cập trên, mơ hình DRM với vùng phân biệt (R1 – R8) tạo hình dáng ống âm học (ở ống quản) Khi đó, để điều khiển chương trình tổng hợp tiếng nói SMART, cần 12 tham số (xem hình 3.9 đây), bao gồm: - Ps (năng lượng) - Q tham số ñiều khiển ñộ cứng dây quản Đo lường hệ thống ñiều khiển 48 Luận văn thạc sỹ khoa học - Ag0 tham số điều khiển độ đóng mở dây quản - R1 – R8 ñiều khiển hình dáng ống quản - Lưỡi gà cho phép không cho phép khoang mũi tham gia vào trình cấu âm Khoang mũi Lưỡi gà Phổi Thanh quản Khoang miệng Tiếng nói DRM Ps Q, Ag0 R1 – R8 12 tham số điều khiển Hình 3.9: Điều khiển chương trình SMART mơ hình DRM Đo lường hệ thống ñiều khiển 49 Luận văn thạc sỹ khoa học Chương 4: TỔNG HỢP CÁC NGUYÊN ÂM TIẾNG VIỆT 4.1 Đặc ñiểm nguyên âm tiếng Việt Như trình bày chương 2, ngun âm tiếng Việt chia làm nhóm chính, gồm nhóm nguyên âm dài (/a, o, e, u, ɛ, ɔ, ɤ, ɯ, i/), nhóm nguyên âm ngắn(/ă, ɔ̆, ɤ̆, ɛ̆/) Sự khác biệt nhóm ngun âm dài ngun âm ngắn ñộ dài nguyên âm ñược phát âm: Các ngun âm thuộc nhóm ngun âm dài ln có độ dài lớn nguyên âm thuộc nhóm nguyên âm ngắn Điều cần ý rằng, nguyên âm dài / a, ɔ, ɤ, ɛ/ có giá trị formant F1, F2 hoàn toàn giống với nguyên âm ngắn / ă, ɔ̆, ɤ̆, ɛ̆/ Như tổng hợp nguyên âm tiếng Việt, ba tham số cần quan tâm, là: Giá trị tần số formant F1, F2, ñộ dài nguyên âm cần tổng hợp Bảng 4.1 ñây so sánh kết ño ñộ dài nguyên âm /a/ (thuộc nhóm nguyên âm dài) nguyên âm /ă/ (thuộc nhóm nguyên âm ngắn) ngữ cảnh (C1)VC2, C1 phụ âm /b/, V = /a, ă/, C2 phụ âm cuối /p, t, k/ Kết so sánh ñã rằng, ngữ cảnh âm tiết có cấu trúc (C1)VC2, ngun âm /a/ ln có ñộ dài lớn so với nguyên âm /ă/ Trong âm tiết có cấu trúc VC2 C1VC2, độ dài trung bình nguyên âm /a/ tương ứng 134ms, 115ms, ngun âm /ă/, độ dài trung bình âm tiết VC2 74ms, âm tiết C1VC2 62ms Bảng 4.1: Độ dài nguyên âm /a/ /ă/ ngữ cảnh âm tiết (C1)VC2 Độ dài nguyên âm V (ms) Nguyên âm Trong âm tiết VC2 V /a/ Trong âm tiết C1VC2 [p] [t] [k] [p] [t] [k] 127 126 148 110 109 126 Đo lường hệ thống ñiều khiển 50 Luận văn thạc sỹ khoa học /ă/ 71 72 78 64 57 64 Khi xét ngữ cảnh âm tiết có cấu trúc (C1)V1V2, C1 phụ âm ñầu /b/, V1 nguyên âm /a/ /ă/, V2 bán nguyên âm cuối /w, j/, kết ño ñộ dài nguyên âm rằng: ngun âm /a/ ln có độ dài lớn so với nguyên âm /ă/ (xem bảng 4.2 đây) Một lần kết phân tích lại cho thấy, ngữ cảnh âm tiết có cấu trúc (C1)V1V2, ngun âm /a/ ln có độ dài lớn so với nguyên âm /ă/ Độ dài trung bình nguyên âm /a/ âm tiết V1V2 108ms, âm tiết C1V1V2 98ms, ñộ dài trung bình nguyên âm /ă/ âm tiết V1V2 55ms, âm tiết C1V1V2 53ms Bảng 4.2: Độ dài nguyên âm /a/ /ă/ ngữ cảnh âm tiết (C1)V1V2 Nguyên âm V1 Độ dài nguyên âm V1 (ms) Trong âm tiết V1V2 Trong âm tiết C1V1V2 [w] [j] [w] [j] /a/ 110 105 108 87 /ă/ 58 51 65 41 Bảng 4.3 ñây so sánh ñộ dài cặp nguyên âm dài – ngắn /ɤ, ɤ̆/, /ɔ, ɔ̆/ ngữ cảnh âm tiết có cấu trúc (C1)VC2 Trong trường hợp này, có số trường hợp nguyên âm ngắn /ɔ̆/ khơng kết hợp với phụ âm cuối /p, t/ (ñánh dấu x bảng) Một lần lại thấy rằng, ñộ dài hai nguyên âm dài /ɤ/ /ɔ/ dài so với ñộ dài tương ứng hai nguyên âm ngắn /ɤ̆/, /ɔ̆/ Thực tế kết đo cho thấy, độ dài trung bình nguyên âm /ɤ/ ngữ cảnh âm tiết VC2 C1VC2 116ms 94ms, độ dài trung bình nguyên âm /ɤ̆/ 71ms (trong ngữ cảnh VC2), 57ms (trong ngữ cảnh C1VC2) Đối với nguyên âm /ɔ/ độ dài trung bình ngữ cảnh VC2 C1VC2 có giá trị 117ms 103ms Đo lường hệ thống ñiều khiển 51 Luận văn thạc sỹ khoa học Bảng 4.3: Độ dài cặp nguyên âm dài – ngắn /ɤ, ɤ̆/ /ɔ, ɔ̆/ ngữ cảnh âm tiết (C1)VC2 Độ dài nguyên âm V (ms) Nguyên âm Trong âm tiết VC2 V Trong âm tiết C1VC2 [p] [t] [k] [p] [t] [k] /ɤ/ 116 113 119 97 83 102 /ɤ̆/ 69 67 77 56 56 60 /ɔ/ 114 112 125 102 103 105 /ɔ̆/ x x 79 x x 65 Bảng 4.4 mơ tả kết đo độ dài nguyên âm nguyên âm /ɤ/ /ɤ̆/ ngữ cảnh âm tiết có cấu trúc (C1)V1V2 Cần ý rằng, ngữ cảnh âm tiết có cấu trúc V1V2 C1V1V2, tiếng Việt khơng tồn số kết hợp nguyên âm bán nguyên âm cuối như: /ɤw, ɛj, ɛ̆j, ɔ̆w, ɔ̆j, ɔw/ Dễ dàng nhận thấy rằng, âm tiết có cấu trúc (C1)V1V2, ngun âm dài /ɤ/ có độ dài lớn so với nguyên âm ngắn /ɤ̆/ Độ dài trung bình nguyên âm ngắn /ɤ̆/ ngữ cảnh âm tiết V1V2 C1V1V2 61ms 51ms Bảng 4.4: Độ dài trung bình nguyên âm /ɤ/ /ɤ̆/ ngữ cảnh âm tiết có cấu trúc (C1)V1V2 Nguyên âm V1 Độ dài nguyên âm V1 (ms) Trong âm tiết V1V2 Trong âm tiết C1V1V2 [w] [j] [w] [j] /ɤ/ x 111 x 77 /ɤ̆/ 68 54 58 44 Đo lường hệ thống ñiều khiển 52 Luận văn thạc sỹ khoa học Hình 4.1 ñây biểu diễn kết so sánh ñộ dài trung bình nguyên âm dài, ngắn tiếng Việt ngữ cảnh âm tiết có cấu trúc (C1)VC2 Kết so sánh rõ ngữ cảnh âm tiết (C1)VC2, ngun âm ngắn ln có ñộ dài ngắn ñộ dài nguyên âm dài Hình 4.1: Độ dài trung bình nguyên âm tiếng Việt ngữ cảnh âm tiết có cấu trúc (C1)VC2, C1 phụ âm ñầu /b/, V nguyên âm /a, ă, ɤ, ɤ̆, ɔ, ɔ̆, ɛ, u, i/, C2 phụ âm cuối /p, t, k/ Hình 4.2 ñây biểu diễn kết so sánh ñộ dài trung bình nguyên âm dài ngắn tiếng Việt ngữ cảnh âm tiết có cấu trúc (C1)V1V2 Dễ dàng nhận thấy, ngữ cảnh âm tiết (C1)V1V2, nguyên âm dài có độ dài lớn so với độ dài nguyên âm ngắn Đo lường hệ thống ñiều khiển 53 Luận văn thạc sỹ khoa học Hình 4.2: Độ dài trung bình nguyên âm tiếng Việt ngữ cảnh âm tiết có cấu trúc (C1)V1V2, C1 phụ âm đầu /b/, V1 nguyên âm /a, ă, ɤ, ɤ̆, ɔ, ɛ, u, i/,V2 bán ngun âm cuối /w, j/ Hình 4.3 so sánh độ dài trung bình ngun âm phát âm ngữ cảnh âm tiết (C1)VC2 (C1)VV2 Kết so sánh cho thấy, ngữ cảnh khác (C1)VC2 (C1)VV2, nguyên âm tiếng Việt ñược phát âm với ñộ dài ổn ñịnh Đo lường hệ thống ñiều khiển 54 Luận văn thạc sỹ khoa học Hình 4.3: So sánh ñộ dài trung bình nguyên âm tiếng Việt hai ngữ cảnh: (C1)VC2 (C1)VV2, C1 phụ âm ñầu /b/, V nguyên âm tiếng Việt /a, ă, ɤ, ɤ̆, ɔ, ɔ̆, ɛ, u, i/, C2 phụ âm cuối /p, t, k/, V2 bán nguyên âm cuối /w, j/ 4.2 Tổng hợp nguyên âm tiếng Việt sử dụng chương trình SMART Như đề cập chương 3, để điều khiển mơ hình tổng hợp tiếng nói theo phương pháp mơ hình hóa máy cấu âm người, mơ hình tổng hợp DRM ñược sử dụng ñể ñiều khiển tạo hình dáng ống quản Như tổng số tham số để điều khiển chương trình SMART 12 tham số, đó: - 01 tham số (Ps) điều khiển lượng tiếng nói - 02 than số (Ag0 Q) điều khiển mơ hình dây quản - 08 tham số (R1, R2, …, R8) điều khiển hình dáng ống quản - 01 tham số (lưỡi gà) ñiều khiển việc kết nối ống mũi với ống quản Hình 4.4 biểu diễn chương trình mơ hệ thống tổng hợp tiếng nói SMART để tổng hợp nguyên âm tiếng Việt Đo lường hệ thống ñiều khiển 55 Luận văn thạc sỹ khoa học Hình 4.4: Chương trình SMART tổng hợp nguyên âm tiếng Việt Dưới ñây kết thử nghiệm chương trình SMART dùng để tổng hợp số ngun âm tiếng Việt: - Hình 4.5 4.6 biểu diễn kết tổng hợp 02 nguyên âm /ai/ tiếng Việt Hình 4.5: Kết tổng hợp 02 nguyên âm /ai/ chương trình SMART Đo lường hệ thống ñiều khiển 56 Luận văn thạc sỹ khoa học Hình 4.6: Tín hiệu tổng hợp tần số formant F1, F2, F3 hai nguyên âm /ai/ tổng hợp chương trình SMART - Hình 4.7 biểu diễn kết tổng hợp 02 nguyên âm /au/ tiếng Việt chương trình SMART Hình 4.7: Tín hiệu tổng hợp tần số formant F1, F2, F3 hai nguyên âm /au/ tổng hợp chương trình SMART Đo lường hệ thống ñiều khiển 57 Luận văn thạc sỹ khoa học Hình 4.8 biểu diễn kết tổng hợp 02 nguyên âm /ui/ tiếng Việt chương trình SMART Hình 4.8: Tín hiệu tổng hợp tần số formant F1, F2, F3 hai nguyên âm /ui/ tổng hợp chương trình SMART Hình 4.9 biểu diễn kết tổng hợp nguyên âm /a/ bán nguyên âm /j/ tiếng Việt chương trình SMART Hình 4.9: Tín hiệu tổng hợp tần số formant F1, F2, F3 nguyên âm /a/ bán nguyên âm /j/ tổng hợp chương trình SMART Đo lường hệ thống ñiều khiển 58 Luận văn thạc sỹ khoa học Hình 4.10 ñây biểu diễn kết tổng hợp nguyên âm /ă/ nguyên âm /i/ tiếng Việt chương trình SMART Hình 4.10: Tín hiệu tổng hợp tần số formant F1, F2, F3 nguyên âm /ă/ bán nguyên âm /j/ tổng hợp chương trình SMART Đo lường hệ thống ñiều khiển 59 Luận văn thạc sỹ khoa học Chương 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 5.1 Kết luận Trong thời gian dài nghiên cứu, tìm hiểu phương pháp tổng hợp ngun âm tiếng Việt mơ hình DRM mơ hình cấu âm hồn thành Là tác giả luận văn tơi xin có vài kết luận sau: + Sự ghép nối mơ hình âm mơ hình DRM đơn giản + Điều khiển tồn hệ thống cần số tham số (giữa 10 12) + Dễ dàng thay ñổi chất lượng âm + Dưới quan điểm mã hố, mã hố có hệ thống hình thành tiếng nói cần tốc ñộ truyền 3.2kbits + Dễ dàng nhận biết phiên ñược cài vào mã hố nhờ xử lý DSP + Giảm tốc độ truyền mã mà giữ chất lượng tiếng nói tốt + Có thể trì tiếng nói liên tục có tượng đồng cấu âm Tuy nhiên thời gian có hạn kinh nghiệm cịn hạn chế lên chi ñưa kết thử nghiêm với số nguyên âm Hướng phát triển Với kết này, tương lai phát triển tiếp ñề tài theo hướng nghiên cứu tổng hợp từ, câu dài, phụ âm bán nguyên âm Sử dụng chương trình SMART để tổng hợp nghiên cứu ñiệu tiếng Việt Đo lường hệ thống ñiều khiển 60 Luận văn thạc sỹ khoa học TÀI LIỆU THAM KHẢO [1] Ngô Huy Hồng, Bài giảng xử lý tiếng nói, Phịng nhận dạng viện công nghệ thông tin [2] Trịnh Văn Loan (1998) Các giảng xử lý tiếng nói, Đại học bách khoa Hà Nội [3] Nguyễn Hữu Quỳnh (2007), Ngữ pháp tiếng Việt, Nhà xuất từ ñiển Bách Khoa Hà Nội [4] Nguyễn Việt Sơn (2007), A speech coding method using an anthropomorphic and acoustic approach, Đại học Bách Khoa Hà Nội [5] Nguyễn Việt Sơn (2008), Production and perception of Vietnamese short vowels, Đại học Bách Khoa Hà Nội [6] Đoàn Thiện Thuật (1997) Ngữ âm tiếng Việt, Nhà xuất ñại học trung học chuyên nghiệp [7] Carré, R "From acoustic tube to speech production", Speech Communication 42, 227-24, 2004 [8] Carré, R "On the phonetic characteristics of an acoustictube: Vowel and consonant systems", (Submitted) [9] Eric Castelli, René Carré, “Production and perception of Vietnamese vowels”, International Research Center Hanoi University of Technology [10] Rene Carre, “From an acoustic tube to speech production”, Dept TSI, ENSTCNRS, 46 rue Barrault, 75634 Paris Cedex 13, France Accepted December 2003 Đo lường hệ thống ñiều khiển 61 ... trình tổng hợp tiếng nói SMART ………………………………… 46 Chương 4: TỔNG HỢP CÁC NGUYÊN ÂM TIẾNG VIỆT…………………… .50 4.1 Đặc ñiểm nguyên âm tiếng Việt? ??……………………………………… 50 4.2 Tổng hợp nguyên âm tiếng Việt. .. tổng hợp tiếng nói Chương 3: Mơ hình tổng hợp tiếng nói DRM mơ hình cấu âm Nghiên cứu mơ hình tổng hợp tiếng nói DRM chương trình tổng hợp tiếng nói SMART Chương 4: Tổng hợp nguyên âm tiếng Việt. .. quan nguyên âm tiếng Việt Nghiên cứu cấu tạo âm tiết tiếng Việt tham số tiếng nói nguyên âm tiếng Việt Chương 2: Tổng quan tổng hợp tiếng nói Nghiên cứu khái niệm, nguồn gốc, chế tạo tiếng nói

Ngày đăng: 28/02/2021, 10:12

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Ngô Huy Hoàng, Bài giảng xử lý tiếng nói, Phòng nhận dạng viện công nghệ thông tin Sách, tạp chí
Tiêu đề: Bài giảng xử lý tiếng nói
[2] Trịnh Văn Loan (1998) Các bài giảng xử lý tiếng nói, Đại học bách khoa Hà Nội Sách, tạp chí
Tiêu đề: Các bài giảng xử lý tiếng nói
[4] Nguyễn Việt Sơn (2007), A speech coding method using an anthropomorphic and acoustic approach, Đại học Bách Khoa Hà Nội Sách, tạp chí
Tiêu đề: A speech coding method using an anthropomorphic and acoustic approach
Tác giả: Nguyễn Việt Sơn
Năm: 2007
[5] Nguyễn Việt Sơn (2008), Production and perception of Vietnamese short vowels, Đại học Bách Khoa Hà Nội Sách, tạp chí
Tiêu đề: Production and perception of Vietnamese short vowels
Tác giả: Nguyễn Việt Sơn
Năm: 2008
[6] Đoàn Thiện Thuật (1997). Ngữ õm tiếng Việt, Nhà xuất bản ủại học và trung học chuyên nghiệp Sách, tạp chí
Tiêu đề: Ngữ õm tiếng Việt
Tác giả: Đoàn Thiện Thuật
Nhà XB: Nhà xuất bản ủại học và trung học chuyên nghiệp
Năm: 1997
[7] Carré, R. "From acoustic tube to speech production", Speech Communication 42, 227-24, 2004 Sách, tạp chí
Tiêu đề: From acoustic tube to speech production
[8] Carré, R. "On the phonetic characteristics of an acoustictube: Vowel and consonant systems", (Submitted) Sách, tạp chí
Tiêu đề: On the phonetic characteristics of an acoustictube: Vowel and consonant systems
[9] Eric Castelli, René Carré , “ Production and perception of Vietnamese vowels”, International Research Center Hanoi University of Technology Sách, tạp chí
Tiêu đề: Production and perception of Vietnamese vowels
[10] Rene Carre, “From an acoustic tube to speech production”, Dept. TSI, ENST- CNRS, 46 rue Barrault, 75634 Paris Cedex 13, France Accepted 4 December 2003 Sách, tạp chí
Tiêu đề: From an acoustic tube to speech production

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w