Thiết kế hệ thống nhận dạng tiếng nói trên KIT STM32F103ZET6

Một phần của tài liệu Ứng dụng neural network vào nhận dạng tiếng nói trên kit arm cortex m3 (Trang 60 - 62)

Phần này trình bày về vấn đề thiết kế hệ thống nhận dạng trên KIT ARM Cortex-M3 của hãng ST dựa trên các vấn đề về lý thuyết đã đề cập ở các chương trước. Hệ thống nhận dạng thực hiện tác vụ nhận dạng các từđơn. Do đó, giả sử chúng ta có R từ cần được nhận dạng và mỗi từ đó sẽ được mô hình hóa bằng một mạng ANN, sau đó qui trình nhận dạng sẽ được thực hiện như Hình 3.11. Vì vậy, chúng ta phải tiến hành theo các bước sau: [4]

− Trích chọn đặc trưng: mỗi một khung phổ tín hiệu tiếng nói trong miền thời gian sẽ được phân tích một vector đặc trưng, nó sẽ được sử dụng để huấn luyện mô hình ANN.

− Lượng tử hóa vector: kết quả của việc trích chọn đặc trưng tiếng nói là một dãy các vector đặc trưng của chuỗi các đặc trưng phổ tín hiệu tiếng nói. Do

đó, chúng ta có thể ánh xạ các vector này thành một tập các vector rời rạc nhằm mục đích làm giảm số lượng tính toán cho việc huấn luyện hay nhận dạng trên mô hình.

Hình 3. 11. Sơ đồ khối mô hình huấn luyện và nhận dạng từđơn

− Huấn luyện ANN: với mỗi một từ trong bộ từ vựng chúng ta phải xây dựng một mô hình ANN. Chúng ta phải ước tính được các thông số của mô hình

để xác lập khả năng lớn nhất của tập vector huấn luyện của mỗi từ.

− Nhận dạng bằng mô hình ANN: mỗi từ trong bộ từ vựng được nói sẽ được nhận dạng theo qui trình như trong Hình 3.11, chuỗi quan sát thu được thông qua phân tích đặc trưng và bộ vector đã được lượng tử hóa. Tiếp theo

tính toán khả năng cho tất cả các mô hình và sau đó là lượng chọn từ mà nó có khả năng cao nhất.

Một phần của tài liệu Ứng dụng neural network vào nhận dạng tiếng nói trên kit arm cortex m3 (Trang 60 - 62)

Tải bản đầy đủ (PDF)

(78 trang)