Phương pháp nhận dạng dùng mô hình thống kê Khái quát phương pháp:

Một phần của tài liệu Đồ án tốt nghiệp đại học “nhận dạng giọng nói bằng mạng neural hồi quy” (Trang 38 - 39)

10) if ∆ El < b10 then IVD =

3.1.3. Phương pháp nhận dạng dùng mô hình thống kê Khái quát phương pháp:

Khái quát phương pháp:

- Theo phương pháp này khả thi là mô hình Markov ẩn (Hidden Markov Models - HMM). Mô hình này bao gồm tập các trạng thái liên kết với nhau bởi các chuyển mạch. Bắt đầu với trạng thái đầu và theo mỗi bước thời gian có một chuyển mạch tương ứng xảy ra và đưa hệ thống về một trạng thái mới có kèm theo một đầu ra tương ứng.

- Với mô hình này thì việc lựa chọn đầu vào nào và ra nào là không cố định, chỉ phụ thuộc vào khả năng xảy ra phân bố đối với chúng. Mô hình HMM ứng dụng rất đa dạng, trong nhận dạng tiếng nói thì trạng thái được hiểu là dữ liệu âm thanh, còn chuyển mạch phụ thuộc theo thời gian. Với mức độ âm tiết ta có thể mô tả như hình sau:

Thông thường HMM có các thành phần sau: {s}: tập các trạng thái.

{aij}: tập các khả năng xảy ra chuyển mạch.

{bi(u)}: tập hợp của các khả năng xảy ra, (bi là khả năng sinh ra u từ trang thái i).

Với a, b chỉ phụ thuộc vào trạng thái hiện tại không phụ thuộc trạng thái trước đó, chúng phải thoả mãn: aij ≥ 0, bi(u) ≥ 0, ∀ i, j, u

∑ = ∀

j

ij i

∑ = ∀

ij

i u i

b ( ) 1,

Một số thuật toán được nêu ra.

• Thuật toán Forward.

• Thuật toán Forwardbackward. Những hạn chế của HMM

• Trạng thái tiếp theo chỉ phụ thuộc trạng thái hiện tại, điều này ít phù hợp với nhận dạng tiếng nói.

• Không có sự liên quan giữa các frame gần nhau, nó chỉ kiểm tra một frame của tiếng nói tại một thời điểm, khi muôn sử dụng các frame liên quan nó phải tổng hợp các fram đó thành một frame đơn lẻ.

Một phần của tài liệu Đồ án tốt nghiệp đại học “nhận dạng giọng nói bằng mạng neural hồi quy” (Trang 38 - 39)

Tải bản đầy đủ (DOC)

(68 trang)
w