Mô hình nghiên cứu chi tiết 34

Một phần của tài liệu đồng cấu âm trong tiếng việt (Trang 35 - 115)

2. Các khó khăn gặp phải

3.2 Mô hình nghiên cứu chi tiết 34

Tính toán các thông số đồng cấu âm

Hình 4: Mô hình nghiên cứu chi tiết

Minh hoạ cho sơ đồ trên:

 Bước 1:

Chọn các yếu tô nghiên cứu ví vụ như ảnh hưởng của thanh điệu từ đứng liền trước tác động đến độ lớn F0 trung bình như thế nào đối với từ mang thanh không dấu đứng ngay sau.

 Bước 2: Chọn CSDL của một người, được thu âm bởi một công cụ như phần mềm Praat

 Bước 3 Đo các thông số F0 trung bình

 Bước 4: Từ kết quả đầu ra của phần mềm cập nhật quy luật chung của nhân tố đang nghiên cứu là F0 trung bình và cập nhật ngoại lệ

 Bước 5: Lặp lại các bước từ 2 đến 4 với tập CSDL của người khác và công cụ khác

 Bước 6: Tìm quy luật chung tổng quát và quy luật chung của ngoại lệ

 Bước 7: Phân mảnh ngoại lệ để tìm ra các yếu tố ảnh hưởng tới quy luật chung. Bát đầu Chọn lựa yếu tố nghiên cứu CSDL 1 người,1 công cụ Tính toán các thông số bằng phần mềm Cập nhật ngoại lệ Phân mảnh ngoại lệ

Phân tích quy luật chung và quy luật của ngoại lệ tìm kết quả

Kết thúc

Cập nhật quy luật chung và quy luật ngoại lệ

 Bước 8: Lặp lại từ bước 1 cho đến bước 7 để tỡm cỏc quy luật của cỏc yờỳ tố ngoại lệ

 Bước 9: Phân tích tổng hợp kết quả chung tổng quát và kết quả của ngoại lệ để tìm ra quy luật tổng hợp chính xác.

Quy luật chung tổng quát ở đây có thể là:

Tác động của âm tiết mang thanh sắc luôn làm cho độ lớn F0 trung bình của âm tiết không dấu đứng ngay sau nó được tăng cường mạnh hơn so với tác động của âm tiết mang thanh huyền

Ngoại lệ có thể minh hoạ trong hai câu sau:

STT Sentence Word PreTon MeanPitch Tool 1 Em chào anh! anh H 245 Praat

2 Em đã cho anh anh S 240 Praat Bảng 2: Ví dụ về ngoại lệ

Ngoai lệ xảy ra là từ anh trong câu thứ nhất được tăng cường độ lớn F0 trung bình bởi cách lên giọng của một câu cảm thán ở cuối. Quy luật ngoại lệ ở đây là đối với câu cảm thán thì âm tiết đứng cuối câu thường được tăng cường độ lớn F0 trung bình bởi cách lên giọng ở cuối câu.

Yếu tố ngoại lệ là câu cảm thán.

5. Mô hình toán học của vấn đề và lựa chọn giải pháp. 4.1 Mô hình toán học của vấn đề

Bài toán đưa về khảo sát hàm số sau Y=F(x, w, i, j, k) trong đó

 x là các đối tượng nghiên cứu như cao độ trung bình của âm tiết, trường độ, năng lượng âm tiết…

 w là các từ nghiên cứu ví dụ như từ tôi, không, anh

 i là hướng nghiên cứu về ảnh hưởng của vị trí, thanh điệu âm tiết liền trước, liền sau, âm vị đầu tiên của từ liền sau, âm vị cuối cùng của từ liền trước.

 j là các giá trị tương ứng của i như sau

Nếu i=Position thì j ={b, m, e} tương ứng với đầu câu, giữa câu, cuối cừu…theo bảng sau:

i j

Position B m e

Đầu câu Giữa câu Cuối câu

PreTon a n o s h i g FloTon Không có Nặng Không dấu Sắc Huyền Hỏ i Ngã Init-Part 21 phụ âm đầu trong Tiếng Việt

Final-Part 6 phụ âm cuối và 2 bán nguyên âm

Bảng 3: Các giá trị tương ứng của i

 k là chỉ số các phần tử thoả mãn bộ (x , w , i, j) như trên

Trong bối cảnh của vấn đề ta cho x , w là không đổi chỉ khảo sát hàm 3 biến y=f(i, j, k)

Đây là tập tất cả các giá trị cần nghiên cứu theo một hướng của một đối tượng nghiên cứu ví dụ như nghiên cứu ảnh hưởng của vị trí từ trong câu (Position) đối với độ lớn F0 trung bình (MeanPitch)

Nếu ta phân hoạch tất cả giá trị trong tập f(i, j, k) thành các tập nhỏ hơn có cùng một giá trị j ta sẽ được các tập giá trị cần so sánh. Ở ví dụ trên nếu j=b ta sẽ được tập các giá trị của độ lớn F0 trung bình đối với các âm tiết đứng đầu cõu. Bài toán đặt ra là cần phải so sánh cỏc từp giá trị nay với nhau. Vì vậy không mất tớnh tổng quát, ta sắp xếp các tập giá trị này theo thứ tự giảm dần. Trường hợp tất cả giá trị của một tập này luôn lớn hơn tất cả các giá trị của một tập khác khi CSDL nghiên cứu lớn là điều ít khi xảy ra nếu không muốn nói là không thể vỡ tớnh phức tạp của các dữ liệu đầu vào. Qua một quá trình nghiên cứu em nhận thấy tất cả các giá trị của một tập hợp này lớn hơn một tập các giá trị kia nếu thoả món cỏc điều kiện ràng buộc khác nhau, trong ví dụ nêu trên ràng buộc có thể là “Không phải là đứng ở cuối câu cảm thán”.

Các ràng buộc này chính là các quy luật ngoại lệ trong sơ đồ nghiên cứu ở trên và ta đặt là C(i).

Nếu ta đặt tập các giá trị này là y(j), thì bài toán trở thành cần tìm m, n, C(i) Sao cho y(m)>y(n) nếu tất cả các bộ (x, j, k) thoả mãn điều kiện ràng buộc C(i) m, n là các giá trị thuộc tập các giá trị của j, trong ví dụ trên m, n có thể nhận các giá trị là {b, m, e}

4.2 Giải pháp và cơ sở khoa học

Đương nhiên các ngoại lệ phải xảy ra với một số lượng nhỏ các phần tử trong tập các phần tử nghiên cứu. Chúng ta có thể hình dung qua hình vẽ sau:

Hình 5:Giải pháp và cơ sở khoa học

Ta nhận thấy việc dũ tỡm chi tiết từng phép đo cho tất cả các cặp cần so sánh (m, n) là không cần thiết. Ta có thể loại bỏ ngay việc so sánh chi tiết các cặp (m, n) bằng thuật toán so sánh các giá trị cực đại trong tập y(m), y(n) so sánh các giá trị cực tiểu và so sánh trung bình. Sau đó mới quay lại nghiên cứu chi tiết các phần tử (m, n), làm như vậy sẽ giảm đáng kể các bộ (m, n) cần phải nghiên cứu chi tiết.

Ngoại lệ m

5. Thuật toán cho phần mềm 5.1 Sơ đồ tổng quát

Hình 6: Sơ đồ tổng quát

Trong đó

Tên biến Ý nghĩa p Người thu õm

x Đối tượng nghiên cứu w Từ nghiên cứu

i Hướng nghiên cứu

à(max) Xác suất thống kê ước lượng ban đầu theo giá trị max à(min) Xác suất thống kê ước lượng ban đầu theo giá trị min à(ave) Theo giá trị trung bình

C(i) Các ràng buộc (ngoại lệ)

Bảng 4: Các tham số trong sơ đồ tổng quát

Input: x, p, w , i, µ(max) , µ(min) ,µ(ave)

DataBase

5.2 Sơ đồ khối của thuật toán

Hình 7: Sơ đồ khối của thuật toán

Trong sơ đồ trên ngoài các biến trong sơ đồ tổng quát cũn cú cỏc biến sau:

Input:

p,x,w,i,µ(max),µ(min),µ(ave)

Tìm DataBase(p,x, w)

Tính y(j) max(y(j)),

min(y(j)),ave(y(j)) với j=g(i)

Tính pmax(n,m), pmin(n,m), pave(m,n)

Bảng 5: Các tham số trong sơ đồ khối 5.3 Giải thuật tớnh cỏc tham số

Tỡm vùng { (m,n) } sử dụng thuật toán sắp xếp nhanh và giải thuật quay lui trong toán học cổ điển.

 Bước 1: Sắp xếp mảng các giá trị max((y(j)) theo thứ tự giảm dần áp dụng thuật toán sắp xếp nhanh quick sort.

 Bước 2: Đánh chỉ số của mảng trên theo cùng một giá trị w (từ nghiên cứu) được kí hiệu là j1, j2, j3 …jn là các chỉ số tương ứng với các giá trị của j, ghép lại thành xâu s(w) đối với mỗi từ khác nhau.

Thực hiện việc sắp xếp này với các từ khác nhau (Xem minh hoạ trong ví dụ sau).

 Bước 3:Tính p1 là tổng số từ thoả mãn max(y(m))>max(y(n)) tức là tổng số xâu chứa xâu mn trong tập cỏc xừu s(w).

 Bước 4:Tính p2 là tổng số từ có tính chất (m,n) tức là tổng số xâu chứa m,n trong tập cỏc xừu s(w).

 Bước 5: pmax(m,n)=p1/p2

 Bước 6: Vùng { (m,n) } cần tìm nếu thoả

• Hoặc pmax(m,n) > à(max)

• Hoặc pmax(m,n) < 1- à(max)

 Bước 7: Thu hẹp vùng (m, n) thêm hai lần nữa cho pave(m,n), pmin(m,n). Vùng (m,n) được thu hẹp lại chính là vùng { (m,n) } cần tìm.

5.4 Minh hoạ bằng ví dụ cụ thể cho giải pháp của bài toán 5.4.1 Phát biểu bài toán bằng ngôn ngữ tự nhiên 5.4.1 Phát biểu bài toán bằng ngôn ngữ tự nhiên

Nghiên cứu ảnh hưởng về thanh điệu của từ đứng trước tác động như thế nào đối với độ lớn F0 trung bình của từ không dấu đứng sau:

Tên biến Ý nghĩa

DataBase(p,x,y) Tạo tập các phần tử thoả mãn bộ (p,x,y) max(y(j)) Tính tập cỏc giỏ max cuả các bộ y(j) Min(y(j)) Tính tập các giá trị min

Ave(y(j)) Tập cỏc giỏ trịtrung bình

pmax(m,n) Tớnh sác xuất thống kê các bộ (m,n) thoả mãn max(y(m))>max(y(n))

pave(m,n) Thoả mãn ave(y(m))>ave(y(n)) pmin(m,n) Thoả mãn min(y(m))>min(y(n))

5.4.2 Chuyển bài toán sang ngôn ngữ toán học

Đối tượng nghiên cứu: Độ lớn F0 trung bình, x=MeanPitch.

Hướng nghiên cứu về ảnh hưởng của thanh điệu âm tiết đứng liền trước, i=PreTon.

 Bước1: Chọn dữ liệu đầu vào

• Người thu âm là 4 người (nữ, chuẩn giọng Bắc Bộ), có mã người thu âm là 1, 2, 3, 4.

• p=1, 2, 3, 4.

• Chọn tập dữ liệu từ nghiên cứu là w={ tụi, không, hai, đi, anh}

• Chọn à(max)=à(min)=à(ave)=90%.

 Bước2: Tìm DataBase(p, x, w) tất cả các bản ghi thoả mãn điều kiện sau trong CSDL

• Người thu âm có mã 1, 2, 3, 4

• Từ nghiờn cứu là: tụi, không ,hai, đi, anh.

• Lưu vào CSDL mới là DataBase(p, x, y) chỉ chứa 4 trường - Mã bản ghi trong CSDL cũ

- Từ nghiên cứu - Người nghiên cứu - Độ lớn F0 trung bình

Việc này bảo đảm việc truy xuất dữ liệu nhanh, nâng cao tốc độ tính toán khi tập CSDL nghiên cứu là lớn.

Do i=Position nên j=g(i)= {a, n, o, h, s, i, g} tương ứng với các thanh điệu: không có thanh điệu (khi từ nghiên cứu đứng đầu câu), thanh nặng, thanh không dấu, thanh huyền, thanh sắc, thanh hỏi, thanh ngã.

Một phần của DataBase(p, x, w) tìm được như sau: PI

D WID Sentence PreTon NameW MeanPitch

1 1 Tôi tên là Hương a tôi 254

1 2 tôi không uống trà. a tôi 245

1 3 Cô Êy bây giê là vợ tôi. n tôi 99

1 4 Anh cho tôi mét cốc nước cam. o tôi 245

1 5 tôi vào gọi nhà tôi. h tôi 216

1 6

Ông làm ơn chỉ cho chóng tôitrường

tiểu học Giảng võ được không ?

s

tôi 238

Bảng 6: Minh hoạ CSDL tỡm kiếm trong bước 2 của thuật toán

Trong CSDL DataBase(p, x, w) chỉ chứa 4 trường PID, WID, NameW,

theo dõi ta đưa thêm hai trường là Sentence, PreTon tương ứng với câu nghiên cứu và thanh điệu của từ đứng liền trước từ nghiên cứu với mục đích cho việc minh hoạ bài toán được rõ ràng.

 Bước3: Tìm y(j), max((y(j)), min((y(j)), ave((y(j)) Do i=Position, nên j=g(i)= {a, n, o, h, s, i, g}.

j y(j) max((y(j) ) min((y(j)) ave((y(j)) a 254,245 254 245 250 n 99 99 99 99 o 245 245 245 245 h 216 216 216 216 s 238 238 238 238

i Null Null null null g Null Null null null

Bảng 7: Minh hoạ bước 3 của thuật toán

 Bước 4: Tính pmax(m,n), pmin(m,n), pave(m,n) theo các bước trong mục 5.2.3 Trước hết ta tính pmax(m,n).

Bước 4.1: Sắp xếp mảng các giá trị max((y(j)) theo thứ tự giảm dần là 250, 245, 238, 216, 99.

Bước 4.2: Đánh chỉ số của mảng trên theo cùng một giá trị w (từ nghiên cứu là tôi) là 1,3,5,4,2 là các chỉ số tương ứng với các giá trị của j là a,o,s,h,n, ghép lại thành xâu s(tôi).

=”13524” vì ta quy ước trong bài toán các chỉ số của thanh điệu là a, n, o, h, s, i, g tương ứng với các chỉ số 1, 2, 3, 4, 5, 6, 7. Thực hiện việc sắp xếp này với các từ còn lại ta có kết quả sau:

tôi PreTon MaxPitch aoshn hai PreTon MaxPitch saoinh khôn

g PreTon MaxPitch saogihn đi PreTon MaxPitch ahgoni khôn

g PreTon MaxPitch saogihn

Thực hiện tương tự như vậy ta có bảng kết quả tổng hợp ví dụ như sau: Code Person Word CommentMax CommentMin CommentAver

10 1 tôi aoshn aoshn aoshn

11 2 đi naogih nagoih naogih

12 2 hai soaih soaih soaih

13 2 tôi asnh sanh sanh

14 2 không asgohni gsoahni sgaohni

15 2 hai soaih soaih soaih

16 2 tôi asnh sanh sanh

Bảng 9: Minh hoạ sắp xếp tổng hợp của thuật toán

 Bước 5: Tính p1 là tổng số từ thoả mãn max(y(m))>max(y(n)) tức là tổng số cỏc xừu chứa xâu mn trong tập cỏc xừu s(w).

 Bước 6: Tính p2 là tổng số từ có tính chất (m,n) tức là tổng số xâu chứa m,n trong tập cỏc xừu s(w).

 Bước 7: pmax(m,n)=p1/p2 StaID mn p1 p2 pmax(m,n) 10 oh 24 26 92 11 os 8 22 36 12 oi 22 22 100 13 og 2 11 18 14 nh 17 35 49 15 ns 2 31 6 16 ni 11 18 61 17 ng 1 11 9 18 hs 0 35 0 19 hi 11 22 50 20 hg 1 11 9 21 si 15 18 83 22 sg 5 7 71 23 ig 0 11 0 3 ao 16 26 62 4 an 32 35 91 5 ah 37 39 95

7 ai 22 22 100

8 ag 7 11 64

9 on 20 22 91

Bảng 10: Tớnh sác xuất thống kê theo giá trị max

Lặp lại bước 4 đến bước 7 cho các bộ mn ={ oh, oi, ns, ng, hs, hg, ig, an, ah , ai, on } để tính pmin(m, n) ta được kết quả sau vùng { (m, n)} được thu hẹp. StaID mn p1 p2 pmin(m,n) 10 an 14 22 64 11 ah 21 24 88 12 ai 15 19 79 13 on 16 19 84 3 oh 18 21 86 4 oi 18 19 95 5 ns 4 18 22 6 ng 1 10 10 7 hs 0 20 0 8 hg 1 10 10 9 ig 0 10 0

Bảng 11: Tớnh sác xuất thống kê theo giá trị min Lặp lại bước 4 đến bước 6 cho các bộ mn={ oi, ng, hs, hg, ig } để tính pave(m,n) ta được kết quả sau.

StaID mn p1 p2 pave(m,n) 3 oi 18 19 95 4 ng 1 10 10 5 hs 0 20 0 6 hg 1 10 10 7 ig 0 10 0

Bảng 12: Tớnh sác xuất thống kê theo giá trị trung bình Kết luận (m,n)= {oi, gn, sh, gh, gi}.

6. Phân tích và thiết kế

6.1. Biểu đồ phân cấp chức năng

Hình 8: Sơ đồ phân cấp chức năng của hệ thống.

6.2. Biểu đồ luồng dữ liệu mức khung cảnh

Hình 9: Biểu đồ luồng dữ liệu mức khung cảnh

Phát hiện quy luật đồng cấu âm

Nhập dữ liệu

Tìm kiếm

dữ liệu Phát hiện quy luật

Kiểm tra chi tiết quy luật

Hình10: Biểu đồ luồng dữ liệu mức đỉnh

7. Hướng dẫn sử dụng phần mềm 7.1 Cài đặt phần mềm

Với mục đích thử nghiệm, phục vụ cho nghiên cứu. Phần mềm cho một người

sử dụng với các chức năng quản trị CSDL và tính toán nhằm phát hiện quy luật. Vì vậy, sự lựa chọn cài đặt bằng ngôn ngữ Visual Basic 6.0 với công nghệ DAO được ưu tiên hàng đầu bởi tớnh dễ cài đặt mà vẫn đảm bảo các chức năng trên.

7.2 Hướng dẫn sử dụng phần mềm

Sử dụng phần mềm theo các chức năng của hệ thống bao gồm:

• Nhập dữ liệu: Vào menu Edit

• Tỡm kiếm dữ liệu: Menu Excute -> Search

• Phát hiện quy luật: Menu Excute -> Show Result

Chương V Phân tích sự biến đổi cao độ của âm tiết trong ngữ đoạn

1. Sự biến đổi hình dáng đường cong F0 của âm tiết. 1.1 Giới thiệu chung 1.1 Giới thiệu chung

Sự biến đổi cao độ (hình dáng đường cong F0) là yếu tố quan trọng nhất cần nghiên cứu trong tổng hợp tiếng nói. Khi các âm tiết đứng độc lập thì hình dáng đường cong F0 của các âm tiết phụ thuộc vào thanh điệu của âm tiết đó. Nhưng khi ở trong cừu thỡ hình dáng đường cong F0 của âm tiết lại bị tác động bởi nhiều yếu tố: vị trí của âm tiết trong ngữ đoạn (đầu, giữa, cuối), kiểu câu, thanh điệu của âm tiết khảo sát và của âm tiết liền trước, âm vị cuối của âm tiết liền trước và âm vị đầu tiên của âm tiết khảo sát. Tuy nhiên, ở đây ta không có tham vọng khảo sát hết các trường hợp, ngữ đoạn mà được giới hạn là “câu trần thuật”. Với các phụ ừm đầu hữu thanh thì phần cao độ của những phụ âm này tạm thời không xét đến vì tớnh không ổn định. Những khảo sát sơ bộ cho phép kết luận rằng hình dáng đường cong F0 của âm tiết trong ngữ đoạn phụ thuộc vào:

• Thanh điệu của âm tiết đứng liền trước

• Thanh điệu của âm tiết đang khảo sát

• Âm vị cuối cùng của âm tiết đứng liền trước

• Âm vị đầu tiên của âm tiết đang khảo sát

Một phần của tài liệu đồng cấu âm trong tiếng việt (Trang 35 - 115)

Tải bản đầy đủ (DOC)

(115 trang)
w