Các modul xử lý tín hiệu tiếng nó

Một phần của tài liệu Mạng nơ ron (Trang 74 - 75)

Chiến l−ợc thiết kế phần mềm

6.2.1 Các modul xử lý tín hiệu tiếng nó

Nh− đã trình bày ở trên, phạm vi chức năng này có thể đ−ợc chia thành hai khối chức năng con. T−ơng ứng với mỗi khối này, ta có thể xây dựng một modul nh− sau:

Modul các thủ tục xử lý tín hiệu cơ sở

Bất kỳ một ai đã từng nghiên cứu về Lý thuyết xử lý tiếng nói đều biết đến những phép xử lý đ−ợc coi là không thể thiếu đ−ợc trong mọi ứng dụng liên quan đến tiếng nói nh−:

• Cửa số lọc Hamming. • Tính năng l−ợng tín hiệu. • Loại bỏ thành phần một chiều. • Một số kiểu tính FFT.

Nh− vậy, một modul đ−ợc xây dựng nh− một th− viện các thủ tục đảm nhiệm những nhiệm vụ trên là cần thiết và nó có thể nằm ở cấp độ thứ hai (của sơ đồ theo cấu trúc ch−ơng trình).

Modul các thủ tục cài đặt và thực hiện quá trình xử lý filter bank

Xử lý filter bank là một quá trình mà ta đ−a liên tiếp các mẫu tín hiệu tiếng nói (mỗi mẫu là một số nguyên) vào vài rồi sau đó lại lấy lần l−ợt các vector đặc tr−ng của các frame (t−ơng ứng với một số l−ợng nhất định các mẫu tín hiệu) ra theo cùng trình tự thời gian. Mặt khác mỗi filter bank bao gồm nhiều nhánh xử lý, mỗi nhánh có một bộ lọc thông dải và một vài bộ lọc phụ trợ khác. Cũng cần nhấn mạnh rằng, trong mỗi lần xử lý thì filter bank làm việc với một frame. Từ các quan điểm trên ta thấy rằng nhiệm vụ của một modul th− viện cần xây dựng là:

• Cài đặt các thao tác cho dãy các bộ lọc thông dải (thực hiện trên một frame).

• Cài đặt thao tác phục vụ cho việc quản lý chuỗi đầu vào các mẫu tín hiệu tiếng nói (bao gổm cả việc tạo các frame) và chuỗi đầu ra các vector đặc tr−ng (vector feature).

Modul công cụ cho phép thực hiện hoàn chỉnh một quá trình xử lý Filter Bank

Nh− sẽ trình bày ở d−ới, có các modul th− viện chuyên trách việc giao tiếp với các file âm thanh và các file tham số. Nhiệm của modul trong phần này chỉ là sử dụng các thủ tục th− viện đã xây dựng để tạo nên một thao tác chung hoàn chỉnh cho Filter Bank từ đầu vào là các file âm thanh tới đầu ra là các file tham số (l−u giữ các vector đặc tr−ng).

Một phần của tài liệu Mạng nơ ron (Trang 74 - 75)