Chuyển bài toán sang ngôn ngữ toán học

Một phần của tài liệu đồng cấu âm trong tiếng việt (Trang 43 - 46)

2. Các khó khăn gặp phải

5.4.2Chuyển bài toán sang ngôn ngữ toán học

Đối tượng nghiên cứu: Độ lớn F0 trung bình, x=MeanPitch.

Hướng nghiên cứu về ảnh hưởng của thanh điệu âm tiết đứng liền trước, i=PreTon.

 Bước1: Chọn dữ liệu đầu vào

• Người thu âm là 4 người (nữ, chuẩn giọng Bắc Bộ), có mã người thu âm là 1, 2, 3, 4.

• p=1, 2, 3, 4.

• Chọn tập dữ liệu từ nghiên cứu là w={ tụi, không, hai, đi, anh}

• Chọn à(max)=à(min)=à(ave)=90%.

 Bước2: Tìm DataBase(p, x, w) tất cả các bản ghi thoả mãn điều kiện sau trong CSDL

• Người thu âm có mã 1, 2, 3, 4

• Từ nghiờn cứu là: tụi, không ,hai, đi, anh.

• Lưu vào CSDL mới là DataBase(p, x, y) chỉ chứa 4 trường - Mã bản ghi trong CSDL cũ

- Từ nghiên cứu - Người nghiên cứu - Độ lớn F0 trung bình

Việc này bảo đảm việc truy xuất dữ liệu nhanh, nâng cao tốc độ tính toán khi tập CSDL nghiên cứu là lớn.

Do i=Position nên j=g(i)= {a, n, o, h, s, i, g} tương ứng với các thanh điệu: không có thanh điệu (khi từ nghiên cứu đứng đầu câu), thanh nặng, thanh không dấu, thanh huyền, thanh sắc, thanh hỏi, thanh ngã.

Một phần của DataBase(p, x, w) tìm được như sau: PI

D WID Sentence PreTon NameW MeanPitch

1 1 Tôi tên là Hương a tôi 254

1 2 tôi không uống trà. a tôi 245

1 3 Cô Êy bây giê là vợ tôi. n tôi 99

1 4 Anh cho tôi mét cốc nước cam. o tôi 245

1 5 tôi vào gọi nhà tôi. h tôi 216

1 6

Ông làm ơn chỉ cho chóng tôitrường

tiểu học Giảng võ được không ?

s

tôi 238

Bảng 6: Minh hoạ CSDL tỡm kiếm trong bước 2 của thuật toán

Trong CSDL DataBase(p, x, w) chỉ chứa 4 trường PID, WID, NameW,

theo dõi ta đưa thêm hai trường là Sentence, PreTon tương ứng với câu nghiên cứu và thanh điệu của từ đứng liền trước từ nghiên cứu với mục đích cho việc minh hoạ bài toán được rõ ràng.

 Bước3: Tìm y(j), max((y(j)), min((y(j)), ave((y(j)) Do i=Position, nên j=g(i)= {a, n, o, h, s, i, g}.

j y(j) max((y(j) ) min((y(j)) ave((y(j)) a 254,245 254 245 250 n 99 99 99 99 o 245 245 245 245 h 216 216 216 216 s 238 238 238 238 (adsbygoogle = window.adsbygoogle || []).push({});

i Null Null null null g Null Null null null

Bảng 7: Minh hoạ bước 3 của thuật toán

 Bước 4: Tính pmax(m,n), pmin(m,n), pave(m,n) theo các bước trong mục 5.2.3 Trước hết ta tính pmax(m,n).

Bước 4.1: Sắp xếp mảng các giá trị max((y(j)) theo thứ tự giảm dần là 250, 245, 238, 216, 99.

Bước 4.2: Đánh chỉ số của mảng trên theo cùng một giá trị w (từ nghiên cứu là tôi) là 1,3,5,4,2 là các chỉ số tương ứng với các giá trị của j là a,o,s,h,n, ghép lại thành xâu s(tôi).

=”13524” vì ta quy ước trong bài toán các chỉ số của thanh điệu là a, n, o, h, s, i, g tương ứng với các chỉ số 1, 2, 3, 4, 5, 6, 7. Thực hiện việc sắp xếp này với các từ còn lại ta có kết quả sau:

tôi PreTon MaxPitch aoshn hai PreTon MaxPitch saoinh khôn

g PreTon MaxPitch saogihn đi PreTon MaxPitch ahgoni khôn

g PreTon MaxPitch saogihn

Thực hiện tương tự như vậy ta có bảng kết quả tổng hợp ví dụ như sau: Code Person Word CommentMax CommentMin CommentAver

10 1 tôi aoshn aoshn aoshn

11 2 đi naogih nagoih naogih

12 2 hai soaih soaih soaih

13 2 tôi asnh sanh sanh

14 2 không asgohni gsoahni sgaohni

15 2 hai soaih soaih soaih

16 2 tôi asnh sanh sanh

Bảng 9: Minh hoạ sắp xếp tổng hợp của thuật toán

 Bước 5: Tính p1 là tổng số từ thoả mãn max(y(m))>max(y(n)) tức là tổng số cỏc xừu chứa xâu mn trong tập cỏc xừu s(w).

 Bước 6: Tính p2 là tổng số từ có tính chất (m,n) tức là tổng số xâu chứa m,n trong tập cỏc xừu s(w).

 Bước 7: pmax(m,n)=p1/p2 StaID mn p1 p2 pmax(m,n) 10 oh 24 26 92 11 os 8 22 36 12 oi 22 22 100 13 og 2 11 18 14 nh 17 35 49 15 ns 2 31 6 16 ni 11 18 61 17 ng 1 11 9 18 hs 0 35 0 19 hi 11 22 50 20 hg 1 11 9 21 si 15 18 83 22 sg 5 7 71 23 ig 0 11 0 3 ao 16 26 62 4 an 32 35 91 5 ah 37 39 95

7 ai 22 22 100

8 ag 7 11 64

9 on 20 22 91

Bảng 10: Tớnh sác xuất thống kê theo giá trị max

Lặp lại bước 4 đến bước 7 cho các bộ mn ={ oh, oi, ns, ng, hs, hg, ig, an, ah , ai, on } để tính pmin(m, n) ta được kết quả sau vùng { (m, n)} được thu hẹp. StaID mn p1 p2 pmin(m,n) 10 an 14 22 64 11 ah 21 24 88 12 ai 15 19 79 13 on 16 19 84 3 oh 18 21 86 4 oi 18 19 95 5 ns 4 18 22 6 ng 1 10 10 7 hs 0 20 0 8 hg 1 10 10 9 ig 0 10 0

Bảng 11: Tớnh sác xuất thống kê theo giá trị min Lặp lại bước 4 đến bước 6 cho các bộ mn={ oi, ng, hs, hg, ig } để tính pave(m,n) ta được kết quả sau.

StaID mn p1 p2 pave(m,n) 3 oi 18 19 95 4 ng 1 10 10 5 hs 0 20 0 6 hg 1 10 10 7 ig 0 10 0

Bảng 12: Tớnh sác xuất thống kê theo giá trị trung bình Kết luận (m,n)= {oi, gn, sh, gh, gi}. (adsbygoogle = window.adsbygoogle || []).push({});

6. Phân tích và thiết kế

Một phần của tài liệu đồng cấu âm trong tiếng việt (Trang 43 - 46)