Nhân dạng người nói

Một phần của tài liệu XÂY DỰNG CÔNG CỤKHẢO SÁT ẢNH HƯỞNG CỦA CÁC THAM SỐCƠBẢN ĐẾN CHẤT LƯỢNG TIẾNG NÓI BỘ TỔNG HỢP TIẾNG VIỆT DÙNG TD-PSOLA (Trang 25 - 26)

Trong thế giới ngày nay tồn tại nhiều hệ thống yêu cầu độ an toàn bảo mật cao. Từ đó nảy sinh ra yêu cầu phải nhận dạng được người nói bằng những đặc điểm riêng biệt mà không ai có thể sao chép được. Bên cạnh các cách thức nhận dạng qua chữ ký, ảnh chân dung, chữ viết..., ngày nay người ta còn dùng tiếng nói để nhận dạng bởi vì tiếng nói có những đặc tính riêng biệt với từng người. Tại một số công ty đã xuất hiện những hệ thống kiểm tra người qua cửa bằng nhận dạng tiếng nói hoặc nhận dạng mỗi người qua thẻ nhận dạng mà những thông tin lưu trữ trên thẻ chính là đặc điểm về tiếng nói của người đó.

Nguyên tắc của nhận dạng người nói là sử dụng những từ khoá đã được xác định từ trước mà những từ khoá này đặc trưng cho từng người một. Có hai yếu tố để khẳng định sự khác nhau trong tiếng nói của mỗi người:

• Các đặc tính cơ quan phát âm khác nhau như: độ dài của tuyến âm, tần số cộng hưởng của dây thanh, các tần số formant, dải thông, sự biến đổi của đường bao phổ... Đó là tập hợp những đặc tính có liên quan đến tính độc lập của nội dung âm vị của từ ngữ.

• Sự khác nhau trong cách phát âm của từng người: tốc độ và chiều dài từ luôn luôn khác nhau.

Trong tất cả các đặc tính trên đường bao phổ và tần số cơ bản là hai đặc tính quan trọng nhất. Đường bao phổ được miêu tả bằng những giá trị trung bình của các bộ lọc thông dải, của các tần số formant, của các hệ số tiên đoán tuyến tính, của hệ số cepstre và các tham số khác.

CHƯƠNG 2: TNG HP TING NÓI

Một phần của tài liệu XÂY DỰNG CÔNG CỤKHẢO SÁT ẢNH HƯỞNG CỦA CÁC THAM SỐCƠBẢN ĐẾN CHẤT LƯỢNG TIẾNG NÓI BỘ TỔNG HỢP TIẾNG VIỆT DÙNG TD-PSOLA (Trang 25 - 26)