Các modul thi hành mạng neuron

Một phần của tài liệu ĐỒ ÁN TỐT NGHIỆP Đề tài “Lý thuyết mạng Neuron và ứng dụng trong nhận dạng tiếng nói” (Trang 95 - 96)

PHÂN TÍCH BÀI TOÁN

6.2.3Các modul thi hành mạng neuron

Các hoạt động trên mạng neuron rất phức tạp và được phân thành hai kiểu, cũng tương ứng với hai giai đoạn của thuật toán back-propagation là “giai đoạn tiến” và “giai đoạn lùi”. Tuy nhiên cả hai giai đoạn này đều cùng được thực thi trên một nền mạng neuron, chính vì thế mà rất cần đến các thủ tục thư viện cơ sở cũng như các công cụ chuyên trách.

Modul các thủ tục cơ sở

Các thủ tục trong modul này chủ yếu thực hiện các nhiệm vụ sau:

* Cài đặt các thao tác cơ bản trên một Unit trong cả hai giai đoạn tiến và lùi.

* Thực hiện khởi đầu, thi hành và kết thúc cho các giai đoạn tiến và lùi theo thuật toán back-propagation.

Tính chất phức tạp đặc biệt trong việc cài đặt modul này là nằm ở một số lượng lớn các công thức phi tuyến và đệ quy, cùng với quá trình tính toán luôn liên quan đến nhiều neuron dẫn đến cần phải thực hiện nhiều vòng lặp.

Modul công cụ cho phép thực hiện hoàn chỉnh một quá trình học Back-propagation

Khi đã được cung cấp các thủ tục cho hai giai đoạn tính toán cơ sở (tiến và lùi) thì công việc tiếp theo của một quá trình tích luỹ hoàn chỉnh là áp dụng các thủ tục đó lần lượt cho tất cả các vector đặc trưng trong tất cả các file tham số, điều này cần đến một số vòng lặp lồng nhau. Cần nhấn mạnh rằng đầu vào của một quá trình tích luỹ là một tập hợp các file tham số chứa các vector đặc trưng là kết quả của toàn bộ quá trình xử lý tín hiệu tiếng nói bằng phương pháp filter bank. Ngoài ra quá trình này còn sử dụng các file tham số chứa các thông số xác định các giá trị đích cho các file âm thanh.

Có ba vòng lặp chính tương ứng với các Thời kỳ (Epoch), các mẫu tích luỹ (sample) và các vector đặc trưng (feature). (Cần chú ý phân biệt hai thuật

ngữ: “mẫu tích luỹ” là một file tham số chứa các vector feature tương ứng với một file âm thanh, còn “mẫu tín hiệu tiếng nói” chỉ là một số nguyên biểu thị một giá trị lấy mẫu của tín hiệu trong file âm thanh) .Điều quan trọng ở đây là cần sắp xếp lại thứ tự một cách ngẫu nhiên các mẫu tích luỹ sau mỗi Thời kỳ; đồng thời cho phép khả năng lựa chọn việc cập nhật các trọng số kết nối của mạng theo từng neuron, từng mẫu hay sau mỗi Thời kỳ.

Modul công cụ cho phép thực hiện hoàn chỉnh

một quá trình đánh giá tính năng nhận dạng

Một quá trình nhận dạng thực chất chỉ là một “giai đoạn tiến” của thuật toán back-propagation nhưng thay vì đối chiếu với các tham số đích để tính các tín hiệu lỗi, tại mức đầu ra chúng ta áp dụng một số quy tắc quyết định để có thể biết được một frame là thuộc nguyên âm nào. Quy tắc quyết định có thể chỉ đơn giản là chọn đầu ra có giá trị lớn nhất.

Một phần của tài liệu ĐỒ ÁN TỐT NGHIỆP Đề tài “Lý thuyết mạng Neuron và ứng dụng trong nhận dạng tiếng nói” (Trang 95 - 96)