Tính đường viền F0

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu nhận dạng ngôn ngữ nói tự động dựa trên tần số cơ bản (Trang 65 - 67)

a. Phân đoạn đường viền cao độ

Bước đầu tiên của giai đoạn tính đường viền F0 là phân đoạn đường viền cao độ vào các phân đoạn định hướng lên hoặc xuống. Trong bước này, tôi sử dụng một quy trình động được mô tả như sau:

Sự thay đổi đường viền cao độ là vị trí của đường viền cao độ mà tại đó tồn tại kết thúc tối đa cục bộ.

Bước 1: Tìm kiếm đường viền cao độ ngay từ đầu để tìm thay đổi đầu tiên về cao độ.

Bước 2: Vị trí bắt đầu của đoạn đầu tiên là vị trí phát hiện thay đổi.

Bước 3: Tiêu chí tìm vị trí kết thúc của một đoạn là vị trí phát hiện thay đổi. Nếu vị trí kết thúc của đoạn hiện tại được phát hiện, đi đến bước 4.

Bước 4: Lưu các tham số phân đoạn hiện tại (bao gồm vị trí bắt đầu, vị trí kết thúc). Thiết lập các tham số ban đầu của phân đoạn mới.

- Đặt vị trí bắt đầu của phân đoạn mới tương đương với vị trí kết thúc của đoạn liền kề.

- Đặt vị trí kết thúc của phân đoạn mới tương đương với vị trí kết thúc của phân đoạn liền kề. Lần lượt, đi đến bước 5.

Bước 5: Kiểm tra xem vị trí hiện tại có phải là kết thúc của đường viền cao độ. Nếu đúng, hãy đến bước 6, nếu không thì chuyển sang bước 3.

Bước 6: Thuật toán kết thúc

Hình 3.1 Ví dụ về kết quả từ quy trình động

b. Ước tính các phân đoạn cao độ theo dòng

Bước thứ hai của giai đoạn ước tính viền F0 là tính các phân đoạn cao độ xuất phát từ bước trước bằng một tập hợp các dòng thứ nhất. Thuật toán ước tính một phân đoạn cao độ theo dòng thứ nhất dựa trên phương pháp lỗi bình phương trung bình.

Giả sử chúng ta có một tập hợp các quan sát M (xi,yi), i = 1,2,… M. Bây giờ chúng tôi muốn ước tính tập hợp này bằng một dòng thứ nhất như trong phương trình (3.2.4)

f(x) = a0 + a1x (3.2.4)

Lỗi bình phương trung bình giữa yi và giá trị được tính với (3.2.4) như trong phương trình (3.2.5).

Đối với các quan sát M, sai số tổng là như trong phương trình (3.2.6). E =  ei2 =  { yi – [ a0 + a1 xi]}2 i = 1,2,…,M (3.2.6)

E là hàm của biến a0 và a1. Giá trị chính xác của các biến a0 và a1 đưa ra phương trình (3.2.6) tối thiểu. Giá trị của các biến a0 và a1 được xác định bằng cách giải phương trình (3.2.7) và (3.2.8).

(3.2.7) (3.2.8)

Mỗi phân đoạn cao độ bây giờ có thể được biểu thị bằng một cặp giá trị (a0i, a1i). Do đó, một đường bao cao độ được xấp xỉ bằng một tập hợp các dòng thứ nhất, được biểu thị bằng một tập hợp S của các cặp giá trị.

S = {(a0i,a1i)} , i=1,2,…,K (3.2.9) K- Số dòng thứ tự đầu tiên

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu nhận dạng ngôn ngữ nói tự động dựa trên tần số cơ bản (Trang 65 - 67)

Tải bản đầy đủ (PDF)

(77 trang)