Rút trích vector đặc trưng bằng giải thuật FFT

Một phần của tài liệu nghiên cứu sử dụng giọng nói trong xác thực và mã hóa dữ liệu trên thiết bị di động và xây dựng hệ thống demo trên android (Trang 77)

Kết quả thu được từ việc rút trích vector đặc trưng bằng giải thuật FFT phụ thuộc vào số lỗi tối đa mà giải thuật Reed-Solomon có thể sửa được và số chiều của vector đặc trưng. Bên cạnh giải thuật rút trích chính là FFT thì một số kỹ thuật tiền xử lý khác cũng được áp dụng vào đó là khử nhiễu bằng cách lọc tín hiệu có tần số thấp, khử khoảng lặng, chuẩn hóa mẫu tín hiệu giọng nói (đã được trình bày ở phần 4.2.2.2).

5.1.2.1 Vector đặc trưng có 32 chiều

Với vector đặc trưng FFT có 32 chiều, số lỗi tối đa mà giải thuật Reed- Solomon có thể sửa từ 3 đến 8 thì tỉ lệ lỗi của hệ thống được thống kê ở Bảng 5.1-2.

Bảng 5.1-2 FAR và FRR của giải thuật FFT với vector đặc trưng 32 chiều

Threshold FAR (%) FRR (%) 3 6.9 42.1 4 12.2 29.3 5 21. 3 21 6 32. 7 14. 56 7 44. 22 10. 84 8 54 7

Hình 5.1-3 Đường cong FAR và FRR của giải thuật FFT-32

Phương pháp chuẩn hóa vector đặc trưng sau khi rút trích như trình bày ở phần 4.2.3 cho ra kết quả như biểu đồ Hình 5.1-4

5.1.2.2 Vector đặc trưng có 64 chiều

Với vector đặc trưng FFT có 64 chiều, số lỗi tối đa mà giải thuật Reed- Solomon có thể sửa từ 10 đến 15 thì tỉ lệ lỗi của hệ thống được thống kê ở Bảng 5.1-3.

Bảng 5.1-3 FAR và FRR của giải thuật FFT với vector đặc trưng 64 chiều

Threshold FAR (%) FRR (%) 10 5.8 32.5 11 9.1 26.35 12 13.6 21.5 13 18.6 17.1 14 23.9 13.3 15 29.3 11.2

Hình 5.1-5 Đường cong FAR và FRR của giải thuật FFT-64

Sự phân bố các giá trị vector đặc trưng vào 20 giá trị của miền ánh xạ như Hình 5.1-6

Hình 5.1-6 Sự phân bố của các thành phần vector vào 20 khoảng

5.1.2.3 Vector đặc trưng có 128 chiều

Với vector đặc trưng FFT có 128 chiều, số lỗi tối đa mà giải thuật Reed- Solomon có thể sửa từ 28 đến 33 thì tỉ lệ lỗi của hệ thống được thống kê ở Bảng 5.1-4.

Bảng 5.1-4 FAR và FRR của giải thuật FFT với vector đặc trưng 128 chiều

Threshold FAR (%) FRR (%) 28 9.7 24.1 29 11.8 21.6 30 14 19.3 31 16.4 16.7 32 19.1 16.8 33 21.9 13.9

Hình 5.1-7 Đường cong FAR và FRR của giải thuật FFT-128

Sự phân bố các giá trị vector đặc trưng vào 20 giá trị của miền ánh xạ như Hình 5.1-8

Hình 5.1-8 Sự phân bố của các thành phần vector vào 20 khoảng

Một phần của tài liệu nghiên cứu sử dụng giọng nói trong xác thực và mã hóa dữ liệu trên thiết bị di động và xây dựng hệ thống demo trên android (Trang 77)

Tải bản đầy đủ (PDF)

(93 trang)