Biểu đồ phân cấp chức năng

Một phần của tài liệu đồng cấu âm trong tiếng việt (Trang 46 - 115)

2. Các khó khăn gặp phải

6.1. Biểu đồ phân cấp chức năng

Hình 8: Sơ đồ phân cấp chức năng của hệ thống.

6.2. Biểu đồ luồng dữ liệu mức khung cảnh

Hình 9: Biểu đồ luồng dữ liệu mức khung cảnh

Phát hiện quy luật đồng cấu âm

Nhập dữ liệu

Tìm kiếm

dữ liệu Phát hiện quy luật

Kiểm tra chi tiết quy luật

Hình10: Biểu đồ luồng dữ liệu mức đỉnh

7. Hướng dẫn sử dụng phần mềm 7.1 Cài đặt phần mềm

Với mục đích thử nghiệm, phục vụ cho nghiên cứu. Phần mềm cho một người

sử dụng với các chức năng quản trị CSDL và tính toán nhằm phát hiện quy luật. Vì vậy, sự lựa chọn cài đặt bằng ngôn ngữ Visual Basic 6.0 với công nghệ DAO được ưu tiên hàng đầu bởi tớnh dễ cài đặt mà vẫn đảm bảo các chức năng trên.

7.2 Hướng dẫn sử dụng phần mềm

Sử dụng phần mềm theo các chức năng của hệ thống bao gồm:

• Nhập dữ liệu: Vào menu Edit

• Tỡm kiếm dữ liệu: Menu Excute -> Search

• Phát hiện quy luật: Menu Excute -> Show Result

Chương V Phân tích sự biến đổi cao độ của âm tiết trong ngữ đoạn

1. Sự biến đổi hình dáng đường cong F0 của âm tiết. 1.1 Giới thiệu chung 1.1 Giới thiệu chung

Sự biến đổi cao độ (hình dáng đường cong F0) là yếu tố quan trọng nhất cần nghiên cứu trong tổng hợp tiếng nói. Khi các âm tiết đứng độc lập thì hình dáng đường cong F0 của các âm tiết phụ thuộc vào thanh điệu của âm tiết đó. Nhưng khi ở trong cừu thỡ hình dáng đường cong F0 của âm tiết lại bị tác động bởi nhiều yếu tố: vị trí của âm tiết trong ngữ đoạn (đầu, giữa, cuối), kiểu câu, thanh điệu của âm tiết khảo sát và của âm tiết liền trước, âm vị cuối của âm tiết liền trước và âm vị đầu tiên của âm tiết khảo sát. Tuy nhiên, ở đây ta không có tham vọng khảo sát hết các trường hợp, ngữ đoạn mà được giới hạn là “câu trần thuật”. Với các phụ ừm đầu hữu thanh thì phần cao độ của những phụ âm này tạm thời không xét đến vì tớnh không ổn định. Những khảo sát sơ bộ cho phép kết luận rằng hình dáng đường cong F0 của âm tiết trong ngữ đoạn phụ thuộc vào:

• Thanh điệu của âm tiết đứng liền trước

• Thanh điệu của âm tiết đang khảo sát

• Âm vị cuối cùng của âm tiết đứng liền trước

• Âm vị đầu tiên của âm tiết đang khảo sát

Để tạo thuận lợi cho việc viết các modun tổng hợp về sau, các âm tiết trong ngữ đoạn được đo bắt đầu và kết thúc tại thời điểm ứng với điểm cực tiểu địa phương của đường cong năng lượng tương ứng. Phần mềm được lựa chọn cho phân tích là phần mềm Praat với 512 ngữ đoạn được chọn lọc, bước đầu đã cho những kết quả tốt.

1.2. Tóm tắt kết quả phân tích.

• Đối với âm tiết mang thanh điệu không dấu

Hình dáng đường cong F0 của âm tiết phụ thuộc chủ yếu vào thanh điệu của âm tiết đứng liền trước nó như sau:

Độ lệch tớnh theo phần trăm như sau: Thanh điệu của âm tiết

đứng liền trước Công thức tớnh Giá trị (%) Không dấu (Begin-

End)/Begin 5-15 Sắc (Begin- End)/Begin 5-15 Ngã (Begin- End)/Begin 10-20 Huyền (Max-End)/Max 5-15 Nặng (Max-Begin)/Max 10-30 Hỏi (Max-Begin)/Max 10-20

Bảng 13: Độ lệch của đường cong F0 ứng với thanh không dấu

• Đối với âm tiết mang thanh điệu huyền

Hình dáng đường cong F0 của âm tiết như sau:

Độ lệch tớnh theo phần trăm như sau: Thanh điệu của âm tiết

đứng liền trước Công thức tớnh Giá trị (%) Không dấu (Begin-

End)/Begin 20-30 Huyền (Begin- End)/Begin 10-20 Hỏi (Begin- End)/Begin 0-10

Nặng (Begin-

End)/Begin 10-20

Sắc (Max-End)/Max 20-30

Ngã (Max-End)/Max 30-40

Bảng 14: Độ lệch của đường cong F0 ứng với thanh huyền

• Đối với âm tiết mang thanh điệu sắc

Hình dáng đường cong F0 của âm tiết như sau:

Độ lệch tớnh theo phần trăm như sau: Thanh điệu của âm tiết

đứng liền trước Công thức tớnh Giá trị (%) Không dấu (Begin-Min)/Begin 20-30 Ngã (Begin-Min)/Begin 20-30 Hỏi (Begin-End)/Begin 0-20 Sắc (Begin-End)/Begin 10-20 Huyền (End-Begin)/End 10-20

Bảng 15: Độ lệch của đường cong F0 ứng với thanh sắc

• Đối với âm tiết mang thanh điệu hỏi

Độ lệch tớnh theo phần trăm như sau: Thanh điệu của âm tiết

đứng liền trước

Công thức tớnh Giá trị (%) Không dấu (Begin-Min)/Begin 30-45 Huyền (Begin-End)/Begin 10-20 Sắc (Begin-End)/Begin 30-45

Bảng 16: Độ lệch của đường cong F0 ứng với thanh hỏi

• Đối với âm tiết mang thanh điệu nặng

Hình dáng đường cong F0 của âm tiết như sau:

Độ lệch tớnh theo phần trăm như sau: Thanh điệu của âm tiết

đứng liền trước

Công thức tớnh Giá trị (%) Không dấu (Begin-Min)/Begin 20-25 Huyền (Begin-End)/Begin 10-15 Sắc (Max-End)/Begin 10-20

Bảng 17: Độ lệch của đường cong F0 ứng với thanh nặng

1.3. Phân tích cụ thể

Các kết quả được trình bày có hình ảnh kèm theo. Hình ảnh trong cùng một cột là của cùng một người thu ừm. Cỏc hình ảnh thể hiện đường cong năng lượng và đường cong tần số cơ bản F0 của âm tiết đang khảo sát. Đường mầu vàng là đường năng lượng, đường mầu xanh là đường cong F0. Do hạn chế về mặt thời gian nờn cỏc kết quả được nêu ra ở đây chưa thể đủ mạnh để khẳng định nó là quy luật. Các kết quả được nêu ra theo thứ tự của thanh điệu âm tiết khảo sát (không dấu, sắc, huyền, nặng, hỏi). Riêng âm tiết có thanh điệu ngó thỡ qua khảo sát ta thấy xảy ra hiện tượng mất tín hiệu (đường cong F0 không thể hiện) cho nên tạm không xét đến trường hợp này.

Tương ứng với mỗi trường hợp (cùng thanh điệu của âm tiết đang khảo sát và cùng thanh điệu của âm tiết liền trước âm tiết đang khảo sát) đều có:

• Bảng thể hiện các giá trị cao độ tại các điểm (đầu âm tiết, cuối âm tiết, giá trị lớn nhất hay nhỏ nhất của cao độ âm tiết) được kí hiệu: Vị trí khảo sát Kí hiệu trong bảng

Bắt đầu Begin Kết thúc End Điểm lớn nhất Max Điểm nhỏ nhất Min

Bảng 18: Kí hiệu các điểm khảo sát trên đường cong F0 của âm tiết

• Hình ảnh đường cong F0 của âm tiết đang được khảo sát trong nhúm đó sau khi đã được bình thường hoá.

Các thanh điệu được kí hiệu như sau: Thanh

điệu Kí hiệu trong hình vẽ Không dấu Ton1

Huyền Ton2

Sắc Ton3

Hỏi Ton4

Nặng Ton5

Bảng 19: Kí hiệu các thanh điệu trên hình trong bảng phụ lục A ( Xem trong phần Phụ lục A trang 64 - 90)

2. Phân tích sự thay đổi giá trị trung bình cao độ của âm tiết (mean pitch) trong ngữ đoạn. tiết (mean pitch) trong ngữ đoạn.

2.1. Giới thiệu chung

Giá trị trung bình của cao độ thể hiện trọng từm của hình dáng đường cong F0 của âm tiết. Giá trị này trong ngữ đoạn bị biến đổi, phụ thuộc chủ yếu vào dấu thanh của âm tiết đứng liền trước, vị trí của âm tiết khảo sát trong cừu, kiểu cừu. Sự thay đổi giá trị này đối với các âm tiết trong cừu thể hiện ngữ điệu của cừu đó.

2.2. Tóm tắt kết quả

Khi ta cô lập để xét ảnh hưởng của thanh điệu âm tiết đứng liền trước âm tiết khảo sát bằng cách chỉ xét riêng các âm tiết đứng ở đầu cừu hoặc giữa cừu thì thấy giá trị cao độ trung bình của cùng một âm tiết chia thành hai nhúm.

Khi thanh điệu âm tiết đứng liền trước âm tiết khảo sát là: sắc, ngã, không dấu, zero (âm tiết đứng đầu cừu) thì giá trị cao độ trung bình của âm tiết khảo sát đạt giá trị lớn hơn so với nhúm thanh điệu: nặng, huyền, hỏi khoảng 20 đến 80 Hz.

Kết quả này chỉ đúng khi độ dài khoảng lặng giữa âm tiết đứng liền trước và âm tiết khảo sát là không đáng kể (coi như bằng không). Nếu tồn tại khoảng lặng giữa âm tiết đang khảo sát và âm tiết đứng liền trước thì âm tiết khảo sát có giá trị cao độ trung bình ngang bằng với âm tiết đứng đầu cừu.

2.3. Phân tích cụ thể

Trong phần phụ lục thể hiện số liệu thống kê của các kết quả nêu ở trên. Phần phụ lục này kí hiệu các thanh điệu theo bảng sau:

Thanh điệu Kí hiệu zero a nặng n không dấu o huyền h sắc s hỏi i ngã g

Bảng 20: Kí hiệu các thanh điệu trong bảng phụ lục B ( Xem trong phần Phụ lục B trang 91 - 100)

Chương VI Phân tích và tổng hợp đặc tính trường độ của tiếng Việt

1. Các kết quả nghiên cứu bằng phần mềm WaveSufer1.1. Tóm tắt kết quả. 1.1. Tóm tắt kết quả.

Trong phần này em trình bày các kết quả nghiên cứu về đặc tính trường độ của tiếng Việt phục vụ chủ yếu cho phát triển ứng dụng chuyển văn bản thành tiếng nói. Các kết quả thể hiện các giá trị tự nhiên cũng như các quy tắc biến đổi các giá trị đó để tổng hợp tiếng nói. Các kết quả nghiên cứu cho thấy:

• Độ dài tự nhiên của âm tiết là tổng độ dài tự nhiên của các âm vị cấu thành.

• Âm chính và âm cuối hữu thanh biến đổi độ dài để thể hiện dấu thanh cũng như thay đổi trường độ của âm tiết.

• Trong ngữ đoạn, âm tiết ở vị trí đầu và cuối được phát âm dài hơn so với khi nó ở giữa ngữ đoạn.

• Các khoảng nghỉ ứng với các dấu cách của âm tiết dài ra khi âm tiết trước là đóng hoặc âm tiết sau có phụ âm đầu là âm tắc vô thanh, hoặc dấu thanh hai âm tiết đó là “sắc” và “nặng” và ngắn lại khi tình huống âm tiết trước là mở hoặc âm tiết sau vắng mặt phụ âm đầu hoặc cỏc ừm kết thúc và bắt đầu của hai âm tiết xung quanh có vị trí cấu âm gần nhau.

• Các kết quả được trình bày ở đây chỉ áp dụng cho “câu trần thuật”. Tín hiệu tiếng nói của một ngữ đoạn gồm có hai phần: phần có tín hiệu ứng với các õm tiết và phần nghỉ ứng với các dấu nghỉ, dấu cách trên chữ viết, và nghỉ do nhấn mạnh hoặc lấy hơi. Do vậy nghiên cứu về trường độ tức là nghiên cứu về trường độ của các đoạn tín hiệu và trường độ của các đoạn nghỉ. Việc khảo sát trường độ cần được tiến hành theo hai mức là mức

dài các âm vị cấu thành nên âm tiết, sự thay đổi độ dài các âm vị để diễn tả thanh điệu của âm tiết. Mức ngữ đoạn nghiên cứu về quy luật thay đổi độ dài của âm tiết và độ dài của các khoảng nghỉ giữa các âm tiết để thể hiện ngữ điệu hoặc thay đổi tốc độ đọc.

1.2. Dữ liệu và công cụ sử dụng trong nghiên cứu

Việc nghiên cứu được thực hiện trên một kho dữ liệu nhỏ bao gồm:

• Khoảng 6000 âm tiết tiếng Việt được đọc rời rạc với tốc độ vừa phải trong điều kiện phòng làm việc, số hoá trực tiếp trên máy tớnh.

• Khoảng 3000 ngữ đoạn có nghĩa, dài không quá 20 âm tiết, gồm các thể loại cừu chớnh của tiếng Việt như cừu hỏi, cừu trần thuật, cừu cảm thán, cừu mệnh lệnh được lọc từ các tác phẩm văn thơ, tục ngữ phổ biến chứa khoảng 4000 âm tiết của tiếng Việt hay dùng nhất.

• Phần mềm WaveSufer được sử dụng để ghi, phừn tích, xác định các thông số của tiếng nói.

1.3. Trường độ của các phần tín hiệu

Tiếng Việt là một ngôn ngữ đơn âm tiết, ranh giới của âm tiết trùng với

ranh giới của hình vị, mỗi âm tiết là một hình vị và hầu hết các âm tiết đều có thể là một từ phát ừm rời rạc. Do vậy nghiên cứu phần tín hiệu tiếng nói chia thành 2 bước:

• Trường độ âm tiết ở trạng thái phát ừm riêng rẽ là tổng độ dài của các âm vị cấu thành.

• Trường độ âm tiết trong ngữ đoạn và sự thay đổi khi thay đổi tốc độ đọc. Nội dung phần này xác định sự thay đổi độ dài âm tiết và thành phần đóng vai trò chớnh để thay đổi độ dài.

1.3.1. Độ dài các âm vị trong âm tiết.

Mỗi một âm vị được giả thiết là có một độ dài tự nhiên và giá trị này sẽ biến thiên trong các ngữ cảnh khác nhau. Độ dài các âm vị cấu thành nên âm tiết được xác định bằng cách phừn tích các âm tiết và thống kê bằng đơn vị mili giừy (ms), chia làm 3 nhúm đó là giá trị ngắn nhất (min), giá trị dài nhất (max) và giá trị trung bình của tất cả các quan sát (avg). Giá trị trung bình được coi là độ dài tự nhiên của âm vị đó. Bảng sau thể hiện giá trị quan sát về độ dài của 23 ừm đầu, 1 ừm đệm, và 8 ừm cuối trong tình huống thanh điệu là không dấu.

Bảng 21: Trường độ của các âm vị

Các số liệu quan sát được sử dụng để dự đoán các tham số độ dài cho tổng hợp theo một trong các công thức sau:

DURs = rand(min, avg); DURl = rand(max, avg);

DURn = (rand(min,max) + avg)/2;

Trong đó DURs, DURl , DURn là các giá trị ở tình huống cầu ngắn, dài, và bình thường tương ứng. Hàm rand(x,y) là hàm lấy giá trị ngẫu nhiên trong khoảng (x,y).

Các công thức trên được sử dụng để tạo ra sự biến thiên của độ dài các âm vị cũng như âm tiết trong phạm vi hợp lý, tương tự người đọc.

Khi xét đến độ dài ừm chớnh, về nguyên tắc có thể có độ dài không hạn chế (ví dụ: phát ừm đối với ừm tiết khi viết chỉ có riêng ừm chớnh hoặc như ngừn dài khi hát). Nên việc xác định độ dài các loại ừm chớnh khác nhau như đối với các ừm đầu hoặc cuối là rất khó thực hiện (và cũng không có ý nghĩa). Các thử nghiệm trong tổng hợp cho thấy rằng trong âm tiết các ừm chớnh được dự đoán ban đầu với giá trị độ dài tự nhiên, sau đó được thay đổi với các giá trị tăng hoặc giảm theo các quy tắc trong bảng sau:

Bảng 22: Ảnh hưởng của thanh điệu và loại ừm cuối của âm tiết đến độ dài ừm chớnh.

• Giá trị phần trăm tăng lên hay giảm đi tớnh theo giá trị tự nhiên.

• Độ dài của nguyên âm ngắn được lấy bằng 2/3 độ dài của nguyên âm thường tương ứng.

• Các kết quả được làm trũn thành số nguyên, giá trị nhỏ nhất không bé hơn 50 ms, lớn nhất không lớn hơn 400ms.

• Giá trị tự nhiên được gán bằng 227 ms (là giá trị độ dài trung bình của các ừm chớnh trong 1348 âm tiết tiếng Việt không dấu).

• Trường hợp ừm chớnh dài ra thì ừm cuối hữu thanh được chọn theo dạng ngắn.

1.3.2. Thay đổi độ dài âm tiết.

Khi thay đổi độ dài âm tiết thì ta có thể thấy sự thay đổi diễn ra chủ yếu ở ừm chớnh và ừm cuối nếu ừm cuối là hữu thanh. Do vậy trong tổng hợp khi cần thay đổi độ dài thì ta chọn 80% giá trị cần thay đổi áp dụng cho ừm chớnh và 20 % giá trị thay đổi áp dụng cho ừm cuối hữu thanh. Trong trường hợp nếu ừm cuối vắng mặt, hoặc xuất hiện như một phụ ừm vô thanh thì áp dụng 100% cho ừm chớnh.

1.3.3.1 Thay đổi độ dài âm tiết do vị trí.

Vị trí của âm tiết trong ngữ đoạn là một trong những yếu tố ảnh hưởng đến độ dài của âm tiết. Các công bố trong tiếng Anh cũng như trong tiếng Việt là độ dài của âm tiết ở cuối ngữ đoạn dài ra. Việc kiểm nghiệm lại trong một số tình huống cho thấy những kết quả cụ thể hơn: khi âm tiết ở cuối ngữ đoạn thì giá trị độ dài tăng từ 25 đến 50% so với độ dài tự nhiên (độ dài của âm tiết khi ở giữa ngữ đoạn). Khi ở đầu ngữ đoạn thì tăng khoảng 5 đến 10 % so với độ dài tự nhiên.

1.3.3.2 Thay đổi độ dài âm tiết do tốc độ đọc.

Tốc độ đọc trung bình cho bộ tổng hợp được thiết đặt trước là 150 âm tiết/ 1 phút (được chủ ý làm chậm hơn người với mục đích tăng

Một phần của tài liệu đồng cấu âm trong tiếng việt (Trang 46 - 115)

Tải bản đầy đủ (DOC)

(115 trang)
w