Giải pháp và cơ sở khoa học

Một phần của tài liệu đồng cấu âm trong tiếng việt (Trang 39 - 115)

2. Các khó khăn gặp phải

4.2Giải pháp và cơ sở khoa học

Đương nhiên các ngoại lệ phải xảy ra với một số lượng nhỏ các phần tử trong tập các phần tử nghiên cứu. Chúng ta có thể hình dung qua hình vẽ sau:

Hình 5:Giải pháp và cơ sở khoa học

Ta nhận thấy việc dũ tỡm chi tiết từng phép đo cho tất cả các cặp cần so sánh (m, n) là không cần thiết. Ta có thể loại bỏ ngay việc so sánh chi tiết các cặp (m, n) bằng thuật toán so sánh các giá trị cực đại trong tập y(m), y(n) so sánh các giá trị cực tiểu và so sánh trung bình. Sau đó mới quay lại nghiên cứu chi tiết các phần tử (m, n), làm như vậy sẽ giảm đáng kể các bộ (m, n) cần phải nghiên cứu chi tiết.

Ngoại lệ m

5. Thuật toán cho phần mềm 5.1 Sơ đồ tổng quát

Hình 6: Sơ đồ tổng quát

Trong đó

Tên biến Ý nghĩa p Người thu õm

x Đối tượng nghiên cứu w Từ nghiên cứu

i Hướng nghiên cứu

à(max) Xác suất thống kê ước lượng ban đầu theo giá trị max à(min) Xác suất thống kê ước lượng ban đầu theo giá trị min à(ave) Theo giá trị trung bình

C(i) Các ràng buộc (ngoại lệ)

Bảng 4: Các tham số trong sơ đồ tổng quát

Input: x, p, w , i, µ(max) , µ(min) ,µ(ave)

DataBase

5.2 Sơ đồ khối của thuật toán

Hình 7: Sơ đồ khối của thuật toán

Trong sơ đồ trên ngoài các biến trong sơ đồ tổng quát cũn cú cỏc biến sau:

Input:

p,x,w,i,µ(max),µ(min),µ(ave)

Tìm DataBase(p,x, w)

Tính y(j) max(y(j)),

min(y(j)),ave(y(j)) với j=g(i)

Tính pmax(n,m), pmin(n,m), pave(m,n)

Bảng 5: Các tham số trong sơ đồ khối 5.3 Giải thuật tớnh cỏc tham số

Tỡm vùng { (m,n) } sử dụng thuật toán sắp xếp nhanh và giải thuật quay lui trong toán học cổ điển.

 Bước 1: Sắp xếp mảng các giá trị max((y(j)) theo thứ tự giảm dần áp dụng thuật toán sắp xếp nhanh quick sort.

 Bước 2: Đánh chỉ số của mảng trên theo cùng một giá trị w (từ nghiên cứu) được kí hiệu là j1, j2, j3 …jn là các chỉ số tương ứng với các giá trị của j, ghép lại thành xâu s(w) đối với mỗi từ khác nhau.

Thực hiện việc sắp xếp này với các từ khác nhau (Xem minh hoạ trong ví dụ sau).

 Bước 3:Tính p1 là tổng số từ thoả mãn max(y(m))>max(y(n)) tức là tổng số xâu chứa xâu mn trong tập cỏc xừu s(w). (adsbygoogle = window.adsbygoogle || []).push({});

 Bước 4:Tính p2 là tổng số từ có tính chất (m,n) tức là tổng số xâu chứa m,n trong tập cỏc xừu s(w).

 Bước 5: pmax(m,n)=p1/p2

 Bước 6: Vùng { (m,n) } cần tìm nếu thoả

• Hoặc pmax(m,n) > à(max)

• Hoặc pmax(m,n) < 1- à(max)

 Bước 7: Thu hẹp vùng (m, n) thêm hai lần nữa cho pave(m,n), pmin(m,n). Vùng (m,n) được thu hẹp lại chính là vùng { (m,n) } cần tìm.

5.4 Minh hoạ bằng ví dụ cụ thể cho giải pháp của bài toán 5.4.1 Phát biểu bài toán bằng ngôn ngữ tự nhiên 5.4.1 Phát biểu bài toán bằng ngôn ngữ tự nhiên

Nghiên cứu ảnh hưởng về thanh điệu của từ đứng trước tác động như thế nào đối với độ lớn F0 trung bình của từ không dấu đứng sau:

Tên biến Ý nghĩa

DataBase(p,x,y) Tạo tập các phần tử thoả mãn bộ (p,x,y) max(y(j)) Tính tập cỏc giỏ max cuả các bộ y(j) Min(y(j)) Tính tập các giá trị min

Ave(y(j)) Tập cỏc giỏ trịtrung bình

pmax(m,n) Tớnh sác xuất thống kê các bộ (m,n) thoả mãn max(y(m))>max(y(n))

pave(m,n) Thoả mãn ave(y(m))>ave(y(n)) pmin(m,n) Thoả mãn min(y(m))>min(y(n))

5.4.2 Chuyển bài toán sang ngôn ngữ toán học

Đối tượng nghiên cứu: Độ lớn F0 trung bình, x=MeanPitch.

Hướng nghiên cứu về ảnh hưởng của thanh điệu âm tiết đứng liền trước, i=PreTon.

 Bước1: Chọn dữ liệu đầu vào

• Người thu âm là 4 người (nữ, chuẩn giọng Bắc Bộ), có mã người thu âm là 1, 2, 3, 4.

• p=1, 2, 3, 4.

• Chọn tập dữ liệu từ nghiên cứu là w={ tụi, không, hai, đi, anh}

• Chọn à(max)=à(min)=à(ave)=90%.

 Bước2: Tìm DataBase(p, x, w) tất cả các bản ghi thoả mãn điều kiện sau trong CSDL

• Người thu âm có mã 1, 2, 3, 4

• Từ nghiờn cứu là: tụi, không ,hai, đi, anh.

• Lưu vào CSDL mới là DataBase(p, x, y) chỉ chứa 4 trường - Mã bản ghi trong CSDL cũ

- Từ nghiên cứu - Người nghiên cứu - Độ lớn F0 trung bình

Việc này bảo đảm việc truy xuất dữ liệu nhanh, nâng cao tốc độ tính toán khi tập CSDL nghiên cứu là lớn.

Do i=Position nên j=g(i)= {a, n, o, h, s, i, g} tương ứng với các thanh điệu: không có thanh điệu (khi từ nghiên cứu đứng đầu câu), thanh nặng, thanh không dấu, thanh huyền, thanh sắc, thanh hỏi, thanh ngã.

Một phần của DataBase(p, x, w) tìm được như sau: PI

D WID Sentence PreTon NameW MeanPitch (adsbygoogle = window.adsbygoogle || []).push({});

1 1 Tôi tên là Hương a tôi 254

1 2 tôi không uống trà. a tôi 245

1 3 Cô Êy bây giê là vợ tôi. n tôi 99

1 4 Anh cho tôi mét cốc nước cam. o tôi 245

1 5 tôi vào gọi nhà tôi. h tôi 216

1 6

Ông làm ơn chỉ cho chóng tôitrường

tiểu học Giảng võ được không ?

s

tôi 238

Bảng 6: Minh hoạ CSDL tỡm kiếm trong bước 2 của thuật toán

Trong CSDL DataBase(p, x, w) chỉ chứa 4 trường PID, WID, NameW,

theo dõi ta đưa thêm hai trường là Sentence, PreTon tương ứng với câu nghiên cứu và thanh điệu của từ đứng liền trước từ nghiên cứu với mục đích cho việc minh hoạ bài toán được rõ ràng.

 Bước3: Tìm y(j), max((y(j)), min((y(j)), ave((y(j)) Do i=Position, nên j=g(i)= {a, n, o, h, s, i, g}.

j y(j) max((y(j) ) min((y(j)) ave((y(j)) a 254,245 254 245 250 n 99 99 99 99 o 245 245 245 245 h 216 216 216 216 s 238 238 238 238

i Null Null null null g Null Null null null

Bảng 7: Minh hoạ bước 3 của thuật toán

 Bước 4: Tính pmax(m,n), pmin(m,n), pave(m,n) theo các bước trong mục 5.2.3 Trước hết ta tính pmax(m,n).

Bước 4.1: Sắp xếp mảng các giá trị max((y(j)) theo thứ tự giảm dần là 250, 245, 238, 216, 99.

Bước 4.2: Đánh chỉ số của mảng trên theo cùng một giá trị w (từ nghiên cứu là tôi) là 1,3,5,4,2 là các chỉ số tương ứng với các giá trị của j là a,o,s,h,n, ghép lại thành xâu s(tôi).

=”13524” vì ta quy ước trong bài toán các chỉ số của thanh điệu là a, n, o, h, s, i, g tương ứng với các chỉ số 1, 2, 3, 4, 5, 6, 7. Thực hiện việc sắp xếp này với các từ còn lại ta có kết quả sau:

tôi PreTon MaxPitch aoshn hai PreTon MaxPitch saoinh khôn

g PreTon MaxPitch saogihn đi PreTon MaxPitch ahgoni khôn

g PreTon MaxPitch saogihn

Thực hiện tương tự như vậy ta có bảng kết quả tổng hợp ví dụ như sau: Code Person Word CommentMax CommentMin CommentAver

10 1 tôi aoshn aoshn aoshn

11 2 đi naogih nagoih naogih

12 2 hai soaih soaih soaih

13 2 tôi asnh sanh sanh (adsbygoogle = window.adsbygoogle || []).push({});

14 2 không asgohni gsoahni sgaohni

15 2 hai soaih soaih soaih

16 2 tôi asnh sanh sanh

Bảng 9: Minh hoạ sắp xếp tổng hợp của thuật toán

 Bước 5: Tính p1 là tổng số từ thoả mãn max(y(m))>max(y(n)) tức là tổng số cỏc xừu chứa xâu mn trong tập cỏc xừu s(w).

 Bước 6: Tính p2 là tổng số từ có tính chất (m,n) tức là tổng số xâu chứa m,n trong tập cỏc xừu s(w).

 Bước 7: pmax(m,n)=p1/p2 StaID mn p1 p2 pmax(m,n) 10 oh 24 26 92 11 os 8 22 36 12 oi 22 22 100 13 og 2 11 18 14 nh 17 35 49 15 ns 2 31 6 16 ni 11 18 61 17 ng 1 11 9 18 hs 0 35 0 19 hi 11 22 50 20 hg 1 11 9 21 si 15 18 83 22 sg 5 7 71 23 ig 0 11 0 3 ao 16 26 62 4 an 32 35 91 5 ah 37 39 95

7 ai 22 22 100

8 ag 7 11 64

9 on 20 22 91

Bảng 10: Tớnh sác xuất thống kê theo giá trị max

Lặp lại bước 4 đến bước 7 cho các bộ mn ={ oh, oi, ns, ng, hs, hg, ig, an, ah , ai, on } để tính pmin(m, n) ta được kết quả sau vùng { (m, n)} được thu hẹp. StaID mn p1 p2 pmin(m,n) 10 an 14 22 64 11 ah 21 24 88 12 ai 15 19 79 13 on 16 19 84 3 oh 18 21 86 4 oi 18 19 95 5 ns 4 18 22 6 ng 1 10 10 7 hs 0 20 0 8 hg 1 10 10 9 ig 0 10 0

Bảng 11: Tớnh sác xuất thống kê theo giá trị min Lặp lại bước 4 đến bước 6 cho các bộ mn={ oi, ng, hs, hg, ig } để tính pave(m,n) ta được kết quả sau.

StaID mn p1 p2 pave(m,n) 3 oi 18 19 95 4 ng 1 10 10 5 hs 0 20 0 6 hg 1 10 10 7 ig 0 10 0

Bảng 12: Tớnh sác xuất thống kê theo giá trị trung bình Kết luận (m,n)= {oi, gn, sh, gh, gi}.

6. Phân tích và thiết kế

6.1. Biểu đồ phân cấp chức năng

Hình 8: Sơ đồ phân cấp chức năng của hệ thống.

6.2. Biểu đồ luồng dữ liệu mức khung cảnh

Hình 9: Biểu đồ luồng dữ liệu mức khung cảnh

Phát hiện quy luật đồng cấu âm

Nhập dữ liệu

Tìm kiếm

dữ liệu Phát hiện quy luật

Kiểm tra chi tiết quy luật

Hình10: Biểu đồ luồng dữ liệu mức đỉnh

7. Hướng dẫn sử dụng phần mềm 7.1 Cài đặt phần mềm

Với mục đích thử nghiệm, phục vụ cho nghiên cứu. Phần mềm cho một người

sử dụng với các chức năng quản trị CSDL và tính toán nhằm phát hiện quy luật. Vì vậy, sự lựa chọn cài đặt bằng ngôn ngữ Visual Basic 6.0 với công nghệ DAO được ưu tiên hàng đầu bởi tớnh dễ cài đặt mà vẫn đảm bảo các chức năng trên. (adsbygoogle = window.adsbygoogle || []).push({});

7.2 Hướng dẫn sử dụng phần mềm

Sử dụng phần mềm theo các chức năng của hệ thống bao gồm:

• Nhập dữ liệu: Vào menu Edit

• Tỡm kiếm dữ liệu: Menu Excute -> Search

• Phát hiện quy luật: Menu Excute -> Show Result

Chương V Phân tích sự biến đổi cao độ của âm tiết trong ngữ đoạn

1. Sự biến đổi hình dáng đường cong F0 của âm tiết. 1.1 Giới thiệu chung 1.1 Giới thiệu chung

Sự biến đổi cao độ (hình dáng đường cong F0) là yếu tố quan trọng nhất cần nghiên cứu trong tổng hợp tiếng nói. Khi các âm tiết đứng độc lập thì hình dáng đường cong F0 của các âm tiết phụ thuộc vào thanh điệu của âm tiết đó. Nhưng khi ở trong cừu thỡ hình dáng đường cong F0 của âm tiết lại bị tác động bởi nhiều yếu tố: vị trí của âm tiết trong ngữ đoạn (đầu, giữa, cuối), kiểu câu, thanh điệu của âm tiết khảo sát và của âm tiết liền trước, âm vị cuối của âm tiết liền trước và âm vị đầu tiên của âm tiết khảo sát. Tuy nhiên, ở đây ta không có tham vọng khảo sát hết các trường hợp, ngữ đoạn mà được giới hạn là “câu trần thuật”. Với các phụ ừm đầu hữu thanh thì phần cao độ của những phụ âm này tạm thời không xét đến vì tớnh không ổn định. Những khảo sát sơ bộ cho phép kết luận rằng hình dáng đường cong F0 của âm tiết trong ngữ đoạn phụ thuộc vào:

• Thanh điệu của âm tiết đứng liền trước

• Thanh điệu của âm tiết đang khảo sát

• Âm vị cuối cùng của âm tiết đứng liền trước

• Âm vị đầu tiên của âm tiết đang khảo sát

Để tạo thuận lợi cho việc viết các modun tổng hợp về sau, các âm tiết trong ngữ đoạn được đo bắt đầu và kết thúc tại thời điểm ứng với điểm cực tiểu địa phương của đường cong năng lượng tương ứng. Phần mềm được lựa chọn cho phân tích là phần mềm Praat với 512 ngữ đoạn được chọn lọc, bước đầu đã cho những kết quả tốt.

1.2. Tóm tắt kết quả phân tích.

• Đối với âm tiết mang thanh điệu không dấu

Hình dáng đường cong F0 của âm tiết phụ thuộc chủ yếu vào thanh điệu của âm tiết đứng liền trước nó như sau:

Độ lệch tớnh theo phần trăm như sau: Thanh điệu của âm tiết

đứng liền trước Công thức tớnh Giá trị (%) Không dấu (Begin-

End)/Begin 5-15 Sắc (Begin- End)/Begin 5-15 Ngã (Begin- End)/Begin 10-20 Huyền (Max-End)/Max 5-15 Nặng (Max-Begin)/Max 10-30 Hỏi (Max-Begin)/Max 10-20

Bảng 13: Độ lệch của đường cong F0 ứng với thanh không dấu

• Đối với âm tiết mang thanh điệu huyền

Hình dáng đường cong F0 của âm tiết như sau:

Độ lệch tớnh theo phần trăm như sau: Thanh điệu của âm tiết

đứng liền trước Công thức tớnh Giá trị (%) Không dấu (Begin-

End)/Begin 20-30 Huyền (Begin- End)/Begin 10-20 Hỏi (Begin- End)/Begin 0-10

Nặng (Begin-

End)/Begin 10-20

Sắc (Max-End)/Max 20-30

Ngã (Max-End)/Max 30-40

Bảng 14: Độ lệch của đường cong F0 ứng với thanh huyền (adsbygoogle = window.adsbygoogle || []).push({});

• Đối với âm tiết mang thanh điệu sắc

Hình dáng đường cong F0 của âm tiết như sau:

Độ lệch tớnh theo phần trăm như sau: Thanh điệu của âm tiết

đứng liền trước Công thức tớnh Giá trị (%) Không dấu (Begin-Min)/Begin 20-30 Ngã (Begin-Min)/Begin 20-30 Hỏi (Begin-End)/Begin 0-20 Sắc (Begin-End)/Begin 10-20 Huyền (End-Begin)/End 10-20

Bảng 15: Độ lệch của đường cong F0 ứng với thanh sắc

• Đối với âm tiết mang thanh điệu hỏi

Độ lệch tớnh theo phần trăm như sau: Thanh điệu của âm tiết

đứng liền trước

Công thức tớnh Giá trị (%) Không dấu (Begin-Min)/Begin 30-45 Huyền (Begin-End)/Begin 10-20 Sắc (Begin-End)/Begin 30-45

Bảng 16: Độ lệch của đường cong F0 ứng với thanh hỏi

• Đối với âm tiết mang thanh điệu nặng

Hình dáng đường cong F0 của âm tiết như sau:

Độ lệch tớnh theo phần trăm như sau: Thanh điệu của âm tiết

đứng liền trước

Công thức tớnh Giá trị (%) Không dấu (Begin-Min)/Begin 20-25 Huyền (Begin-End)/Begin 10-15 Sắc (Max-End)/Begin 10-20

Bảng 17: Độ lệch của đường cong F0 ứng với thanh nặng

1.3. Phân tích cụ thể

Các kết quả được trình bày có hình ảnh kèm theo. Hình ảnh trong cùng một cột là của cùng một người thu ừm. Cỏc hình ảnh thể hiện đường cong năng lượng và đường cong tần số cơ bản F0 của âm tiết đang khảo sát. Đường mầu vàng là đường năng lượng, đường mầu xanh là đường cong F0. Do hạn chế về mặt thời gian nờn cỏc kết quả được nêu ra ở đây chưa thể đủ mạnh để khẳng định nó là quy luật. Các kết quả được nêu ra theo thứ tự của thanh điệu âm tiết khảo sát (không dấu, sắc, huyền, nặng, hỏi). Riêng âm tiết có thanh điệu ngó thỡ qua khảo sát ta thấy xảy ra hiện tượng mất tín hiệu (đường cong F0 không thể hiện) cho nên tạm không xét đến trường hợp này.

Tương ứng với mỗi trường hợp (cùng thanh điệu của âm tiết đang khảo sát và cùng thanh điệu của âm tiết liền trước âm tiết đang khảo sát) đều có:

• Bảng thể hiện các giá trị cao độ tại các điểm (đầu âm tiết, cuối âm tiết, giá trị lớn nhất hay nhỏ nhất của cao độ âm tiết) được kí hiệu: Vị trí khảo sát Kí hiệu trong bảng

Bắt đầu Begin Kết thúc End Điểm lớn nhất Max Điểm nhỏ nhất Min

Bảng 18: Kí hiệu các điểm khảo sát trên đường cong F0 của âm tiết

• Hình ảnh đường cong F0 của âm tiết đang được khảo sát trong nhúm đó sau khi đã được bình thường hoá.

Các thanh điệu được kí hiệu như sau: Thanh

điệu Kí hiệu trong hình vẽ Không dấu Ton1

Huyền Ton2

Sắc Ton3

Hỏi Ton4

Nặng Ton5

Bảng 19: Kí hiệu các thanh điệu trên hình trong bảng phụ lục A ( Xem trong phần Phụ lục A trang 64 - 90) (adsbygoogle = window.adsbygoogle || []).push({});

2. Phân tích sự thay đổi giá trị trung bình cao độ của âm tiết (mean pitch) trong ngữ đoạn. tiết (mean pitch) trong ngữ đoạn.

2.1. Giới thiệu chung

Giá trị trung bình của cao độ thể hiện trọng từm của hình dáng đường cong F0 của âm tiết. Giá trị này trong ngữ đoạn bị biến đổi, phụ thuộc chủ yếu vào dấu thanh của âm tiết đứng liền trước, vị trí của âm tiết khảo sát trong cừu, kiểu cừu. Sự thay đổi giá trị này đối với các âm tiết trong cừu thể hiện ngữ điệu của cừu đó.

2.2. Tóm tắt kết quả

Khi ta cô lập để xét ảnh hưởng của thanh điệu âm tiết đứng liền trước âm tiết khảo sát bằng cách chỉ xét riêng các âm tiết đứng ở đầu cừu hoặc giữa cừu thì thấy giá trị cao độ trung bình của cùng một âm tiết chia thành hai nhúm.

Khi thanh điệu âm tiết đứng liền trước âm tiết khảo sát là: sắc, ngã, không dấu, zero (âm tiết đứng đầu cừu) thì giá trị cao độ trung bình của

Một phần của tài liệu đồng cấu âm trong tiếng việt (Trang 39 - 115)