Sự phân bố các âm vị trong VDSPEC

Một phần của tài liệu Nhận dạng tự động tiếng nói phát âm liên tục cho các phương ngữ chính của tiếng việt theo phương thức phát âm (Trang 63 - 64)

Tổ chức lưu trữ văn bản sao cho thuận lợi trong quá trình xây dựng cũng như khai thác về sau cũng đã được tính đến. Sau khi chuẩn hóa, mỗi đoạn văn bản (gọi là một câu) được phân biệt bởi một cặp thẻ bao gồm thẻ mở <s> và thẻ đóng </s>, xen giữa là nội dung văn bản ghi vào file văn bản theo chủ đề. Ví dụ, văn bản “Theo đại diện một ngân hàng thương mại cổ phần” sẽ được lưu thành “<s>Theo đại diện một ngân hàng thương mại cổ phần</s>”. Mỗi chủ đề được lưu thành một tập tin văn bản (định dạng UTF-8) với tên tập tin đặt theo định dạng “YY.txt” trong đó “YY” là mã tương ứng với các chủ đề (cb: “cơ bản”, ds: “đời sống”, kd: “kinh doanh”, ox: “ô tô xe máy”, pl: “pháp luật”). Trong mỗi tập

64

tin văn bản của chủ đề, các đoạn văn được được bắt đầu bởi một ký hiệu theo định dạng “YYZZZZ” ghi trên một dòng (liền trước dòng nội dung văn bản). Mã ZZZZ là số thứ tự đoạn văn thuộc chủ đề “YY”. Ví dụ “cb0001” là ký hiệu bắt đầu cho đoạn văn bản số 1 thuộc chủ đề “cb” (cơ bản). Dòng kế tiếp là nội dung văn bản bắt đầu bởi thẻ <s> và kết thúc bằng thẻ </s>. Việc phân chia các đoạn văn bản cũng cần có chọn lựa sao cho độ dài một đoạn không quá ngắn hoặc quá dài, thuận tiện cho việc đọc sau này, hạn chế các nhầm lẫn có thể xảy ra khi đọc. Trong bộ văn bản đã xây dựng, mỗi đoạn có độ dài tương ứng trung bình là 10 giây theo tốc độ nói bình thường.

2.6.3. Ghi âm

2.6.3.1. Thiết bị ghi âm

Quá trình ghi âm được thực hiện bằng máy tính có card âm thanh chất lượng cao. Micro dùng ghi âm là loại chuyên dụng phù hợp với ghi âm tiếng nói (Shure SM48). SM48 có đáp ứng tần số từ 55Hz đến 14000Hz, trở kháng đầu ra 270 Ohms, đạt -57.5 dBV/Pa (1.3 mV) ở tần số 1 kHz [7]. Đây là loại micro đơn hướng, hạn chế nhiễu nền và nguồn tạp âm xung quanh. Phòng ghi âm được lựa chọn riêng, nhiễu nền thấp theo kết quả tính tốn ở phần sau cho thấy. Hình 2.7 là đáp ứng tần số của SM48 [7].

Một phần của tài liệu Nhận dạng tự động tiếng nói phát âm liên tục cho các phương ngữ chính của tiếng việt theo phương thức phát âm (Trang 63 - 64)

Tải bản đầy đủ (PDF)

(141 trang)