1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu kỹ thuật nhận dạng người nói dựa trên từ khoá tiếng Việt190

156 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 156
Dung lượng 4 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI _ _ NGÔ MINH DŨNG NGHIÊN CỨU KỸ THUẬT NHẬN DẠNG NGƯỜI NÓI DỰA TRÊN TỪ KHÓA TIẾNG VIỆT LUẬN ÁN TIẾN SỸ KỸ THUẬT HÀ NỘI - 2010 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI _ _ Ngô Minh Dũng NGHIÊN CỨU KỸ THUẬT NHẬN DẠNG NGƯỜI NÓI PHỤ THUỘC TỪ KHÓA TIẾNG VIỆT Chuyên ngành : Công nghệ phần mềm Mã số : 62.48.10.01 LUẬN ÁN TIẾN SỸ KỸ THUẬT Hướng dẫn khoa học: PGS TS Đặng Văn Chuyết PGS TS Vũ Kim Bảng HÀ NỘI - 2010 LỜI CẢM ƠN X in bày tỏ lòng biết ơn chân thành sâu sắc tới thầy hướng dẫn khoa học Đặng Văn Chuyết Vũ Kim Bảng, thầy cô Nguyễn Thúc Hải, Trịnh Văn Loan, Nguyễn Thị Hoàng Lan, Quách Tuấn Ngọc (khoa Công nghệ thông tin – Đại học Bách khoa Hà Nội), Lương Chi Mai (Viện Công nghệ Thông tin ), Lê Khánh Hùng (Viện Công nghệ ứng dụng) thầy phản biện độc lập tận tình hướng dẫn đóng góp nhiều ý kiến quý báu cho luận án Xin chân thành cảm ơn đồng nghiệp cơng tác phịng Giám định Kỹ thuật pháp lý (Viện Khoa học Hình sự) trung tâm Ngữ âm thực nghiệm (Viện Ngôn ngữ học) nhiệt tình giúp đỡ hợp tác nhiều nghiên cứu, thực nghiệm, thu mẫu… để tác giả hồn thành luận án Xin cảm ơn nhiều anh , chị làm việc Viện Đào tạo Sau đại học Đại học Bách khoa Hà Nội, vụ Giáo dục đại học nhiệt tình giúp đỡ, tạo điều kiện giúp tác giả thực thành công luận án Lời cảm ơn đặc biệt xin dành cho người vợ hai c on trai yêu quý tác giả, người bên cạnh động viên kích lệ tác giả , nguồn lực lớn nhấ t giúp tác giả hoàn thành luận án Xin cảm ơn tất ! Tác giả luận án LỜi CAM ĐOAN Tôi xin cam đoan công trình nghiên cứu riêng tơi Các số liệu, kết nêu luận án trung thực chưa công bố công trình khác Tác giả luận án Ngơ Minh Dũng Mục lục Trang Mở đầu Chương 1: Tổng quan nhận dạng người nói 1.1 Cơ sở khoa học nhận dạng người nói 1.2 Thơng tin đặc trưng giọng nói người 1.3 Các phương pháp nhận dạng người nói giới 1.3.1 Nhận dạng người nói quan thính giác người 1.3.2 Nhận dạng người nói phương pháp thủ công 1.3.3 Nhận dạng người nói tự động 1.4 Nguyên lý làm việc hệ nhận dạng người nói 1.4.1 Cấu trúc hệ nhận dạng người nói 1.4.2 Trích chọn đặc trưng 10 1.4.3 Nhận dạng người nói mơ hình Markov ẩn 12 1.4.4 Nhận dạng người nói mơ hình hỗn hợp Gauss 15 1.4.5 Nhận dạng người nói mạng Nơron nhân tạo 16 1.4.6 Một số thuật toán đối sánh mẫu dùng nhận dạng người nói 18 1.4.7 Quyết định nhận dạng 19 1.5 Các nguyên nhân gây lỗi nhận dạng người nói 20 1.5.1 Tính khơng ổn định thân người nói 20 1.5.2 Cải trang tiếng nói giả giọng nói người khác 21 1.5.3 Các tác nhân kỹ thuật gây sai số cho nhận dạng người nói 21 1.6 Sơ lược tình hình nghiên cứu nhận dạng người nói 22 1.6.1 Nghiên cứu nhận dạng người nói phương pháp thủ cơng 22 1.6.2 Nghiên cứu nhận dạng người nói phương pháp tự động 23 1.7 Giám định pháp lý nhận dạng người nói vấn đề tiếng Việt 24 1.7.1 Phương pháp kinh điển giám định pháp lý nhận dạng người nói 25 1.7.2 Phương pháp tự động giám định pháp lý nhận dạng người nói 26 1.7.3 Các vấn đề tồn giám định nhận dạng người nói tiếng Việt 26 Chương : Giám định nhận dạng người nói tiếng Việt theo phương pháp nghe-phân tích phổ âm 2.1 Ngữ âm tiếng Việt với nhận dạng người nói 2.1.1 Một số đặc trưng ngữ âm tiếng Việt i 29 29 29 2.1.2 Đặc trưng ngữ âm tiếng Việt với nhận dạng người nói 29 2.2 Các tham số tiếng nói nhận dạng người nói 32 2.3 Formants âm tiết tiếng Việt 35 2.3.1 Một số đặc điểm cấu trúc formant âm tiết tiếng Việt 35 2.3.2 Đánh giá phương pháp xác định formants 36 2.3.3 Cơ sở liệu âm tiết người nói tiếng Việt 41 2.3.4 Phạm vi thay đổi formant âm tiết tiếng Việt 42 2.4 Phạm vi thay đổi trung bình tần số 44 2.5 Phổ trung bình thời gian dài 46 2.6 Quy trình giám định nhận dạng người nói tiếng Việt 48 Chương : Xác suất nhận dạng người nói âm tiết tiếng Việt 51 3.1 Cơ sở đánh giá khả nhận dạng người nói âm tiết 51 3.2 Kiểm định giả thiết thống kê phạm vi biến đối tương đối formant âm tiết 52 3.3 Xác suất nhận dạng người nói âm tiết tiếng Việt 54 3.4 Một số nhận xét từ phân tích xác suất nhận dạng người nói 59 3.4.1 Số lượng âm tiết đồng 59 3.4.2 Xác suất trung bình nhận dạng người nói formant 60 3.4.3 Khả phân biệt người nói âm tiết tiếng Việt 62 3.5 Kiểm nghiệm khả nhận dạng người nói âm tiết tiếng Việt 64 3.5.1 Hệ nhận dạng người nói phụ thuộc từ khóa sở 65 3.5.2 Khảo sát độ xác nhận dạng hệ nhận dạng người nói sở với âm tiết khác 68 3.6 Ý nghĩa thực tiễn việc xác định khả phân biệt người nói âm tiết tiếng Việt Chương : Giám định tự động nhận dạng người nói tiếng Việt 72 74 4.1 Các vấn đề tồn giám định tự động nhận dạng người nói tiếng Việt 74 4.2 Mơ hình âm tiêt mơ hình âm vị nhận dạng người nói 75 4.2.1 Hệ nhận dạng người nói dựa mơ hình âm tiết 75 4.2.2 Hệ nhận dạng người nói dựa mơ hình âm vị 4.2.3 So sánh hệ nhận dạng người nói dựa mơ hình âm tiết âm vị 77 ii 81 4.3 Chuẩn hóa điều kiện ghi âm giám định tự động nhận dạng người nói 84 4.3.1 Giám định tự động nhận dạng người nói điều kiện ghi âm khác 84 4.3.2 Cơ sở phương pháp chuẩn hóa theo phổ trung bình 87 4.3.3 Xây dựng tập liệu khảo sát người nói điều kiện ghi khác 91 4.3.4 Hệ nhận dạng người nói sở để khảo sát 93 4.3.5 Đánh giá phương pháp chuẩn hóa theo phổ trung bình 95 4.4 Sơ đồ khối quy trình giám định nhận dạng người nói tổng quát 99 Kết luận kiến nghị 102 Danh mục cơng trình khoa học công bố 104 Tài liệu tham khảo 105 Phụ lục 111 iii Giải thích ký hiệu chữ viết tắt ANN (Artificial Neuron Network ) : Mạng Nơron nhân tạo B1, B2, B3, B4: Bề rộng formant bậc 1, 2, 3, CMS (Ceptral Mean Subtraction) : Trừ trung bình ceptrum CSDL : Cơ sở liệu DET (Detection Error Tradeoff) : đường quan hệ sai số chấp nhận sai số từ chối DFT (Discrete Fourier Transform) : Biến đổi Fuarie rời rạc DTW (Dynamic Time Warping): Thuật tốn gói thời gian động EER (Equal Error Rate) : sai số cân FA (Fault Accept): sai số chấp nhận FR.(Fault Reject): sai số từ chối F0 (Fundamental Frequency): Tần số âm F1, F2, F3, F4 : Giá trị formant bậc 1, 2, 3, GMM (Gaussian Mixing Model) : Mơ hình hỗn hợp Gauss HMM (Hidden Markov Models ) : Mơ hình Markov ẩn IDFT (Inverse Discrete Fourier Transform) : Biến đổi ngược Fuarie rời rạc LR (Likelihood Rate ) : Tỷ số likelihood LLR (Log Likelihood Rate ) : Logarit tỷ số likelihood LPC (Linear Predictive Coding ) : Mã hóa dự đốn tuyến tính LPCC (Linear Predictive Ceptral Coefficients) : Các hệ số ceptrum dự đốn tuyến tính LTA (Long Term Average spectrum): Phổ trung bình thời gian dài MFCC (Mel-Frequency Ceptral Coefficients) : Các hệ số ceptrum tần số Mel ML (Maximum Lilikehood ) : likelihood cực đại MS : Phương pháp chuẩn hóa trung bình phổ NDNN : Nhận dạng người nói NDTN : Nhận dạng tiếng nói RASTA (RelAtive SpecTrA) : Phổ tương thích VQ (Vector Quantization) : Lượng tử vector iv Danh mục bảng Bảng 2.1: P hạm vi biến đổi trung bình formants âm tiết 43 Bảng 2.2 : Phạm vi thay đổi tần số trung bình 45 Bảng 2.3 : Kết khảo sát độ ổn đinh phổ LTA 46 Bảng : Xác suất nhận dạng người nói âm tiết khảo sá t 56 Bảng : Kết khảo sát số phương pháp chuẩn hóa 96 v Danh mục hình Hình 1.1: Cấu tạo quan phát âm người Hình 1.2 Phân loại thơng tin đặc trưng người nói Hình 1.3: Nhận dạng người nói hai người phương pháp thủ cơng Hình 1.4: Cấu trúc hệ nhận dạng người nói 10 Hình 1.5: Phân tích phổ thời gian ngắn 11 Hình 1.6 : Sơ đồ khối xác định hệ số MFCC 12 Hình 1.7: Sơ đồ mơ hình HMM trạng thái dịch chuyển từ trái sang 13 phải Hình 1.8 : Mơ hình Nơron 17 Hình 1.9 : Phân lớp nhận dạng người nói sử dụng ANN 18 Hình 2.1: Hệ thống phân tích phổ tín hiệu tiếng nói CSL 33 Hình 2.2: Giá trị formant khúc đoạn 20ms hai mẫu 37 tiếng nói Hình 2.3: Xác định giá trị (Fi) bề rộng (Bi) formant 38 số khúc đoạn cho âm vị /a/ âm tiết “bách” Hình 2.4: Tín hiệu tiếng nói phổ ba chiều hai người phát âm 39 cụm từ “đại học bách khoa” Hình 3.1: Minh họa quan hệ hai hàm phân bố chuẩn 53 Hình 3.2: Minh họa mối quan hệ hàm phân bố xác suất khả 54 phân biệt người nói formant âm tiết Hình 3.3 : Xác suất nhận dạng người nói theo số âm tiết đồng 59 Hình 3.4: Xác suất trung bình nhận dạng người nói formant 60 âm tiết tiếng Việt vi 197.3278 214.3165 186.8584 276.1845 306.3969 262.6789 233.0324 278.6228 216.6443 200.0498 Số liệu F0 trung bình giây 15 giọng nam 228.052 246.3705 47.25928 36.63374 228.4748 40.28015 mean (μ) Std(σ) 187.8041 129.069 116.911 171.1555 181.2685 157.2416 32.11389 90.47421 91.89134 113.4227 191.7827 171.7893 131.872 46.99809 210.2654 99.5512 164.3859 163.8927 122.5628 94.3369 99.4954 104.0976 125.2545 172.5334 144.3928 126.8823 43.58189 38.01026 165.7123 104.9166 212.3925 110.8514 133.4248 145.4595 44.37478 98.2546 204.1306 155.2244 140.9586 194.2554 111.4986 143.211 197.7514 105.4227 175.6991 139.2736 166.0077 39.1196 39.22259 106.2251 97.21439 133.5115 136.1272 171.4618 128.908 29.16819 105.2503 113.5694 192.5957 132.9859 141.124 137.1051 34.20886 119.4103 128.7038 108.2544 191.8223 149.6306 142.6318 117.1139 195.1924 171.6678 140.5171 133.2154 159.7735 26.55624 31.27138 110.6326 105.1263 182.9168 140.4993 101.1121 128.0574 34.35064 179.8574 115.1127 115.1169 106.5136 100.6811 91.14514 122.2822 193.2142 191.4172 99.65427 141.871 121.128 40.90813 41.25009 104.7482 101.8441 104.2441 137.9149 202.1723 130.1847 42.91006 139.4248 37.60298 Số liệu F0 trung bình giây 20 giọng nữ mean (μ) Std(σ) 195.2456 178.6706 215.0063 187.4751 213.2572 197.931 15.92135 227.2568 243.0487 231.2968 237.3508 162.2548 220.2416 32.96509 176.4999 234.5623 231.4129 188.3694 289.5472 295.3321 211.8725 206.6957 234.4378 258.2629 228.754 236.6445 41.08123 42.25915 222.8638 226.7839 189.3324 241.9024 289.9819 229.9799 252.5 304.2564 226.52 253.7399 236.2396 251.3325 37.50434 31.44134 188.2495 160.922 236.3786 171.1381 281.0535 148.692 265.1275 181.777 217.9348 227.5828 237.7488 178.0224 36.97817 30.292 221.6897 225.3448 154.4875 199.7449 213.6099 202.9753 28.83236 210.4361 197.7122 249.1503 243.5342 247.7864 282.076 202.1744 204.7019 199.0689 239.8012 221.7232 233.5651 24.77048 33.94883 175.3698 169.6897 274.3102 198.3654 226.9844 208.9439 42.9483 189.4388 185.1877 228.5299 164.0469 185.0308 215.496 237.9796 187.3455 199.6416 197.5941 208.1242 189.934 23.78096 18.78472 213.856 195.5667 279.7057 215.3044 267.274 234.3414 36.83755 205.0935 239.956 181.8856 177.2721 236.9265 208.2268 29.54779 206.1737 229.6795 222.066 261.3166 176.9411 252.3781 225.0388 189.4235 150.722 280.2025 196.1883 242.6 31.77797 34.8373 187.4614 196.2013 243.5856 221.3808 184.1477 206.5553 25.32251 203.6007 262.3753 250.8584 264.6917 211.0525 238.5157 29.06927 218.9304 31.44504 Số liệu F0 trung bình giây 15 giọng nam 131 mean (μ) Std(σ) 178.4139 99.06926 135.5225 100.621 128.0175 108.3186 162.5977 163.0153 172.2051 146.8798 155.3513 123.5808 22.4096 29.40588 157.6991 139.728 116.4347 104.4702 118.9918 127.4647 21.13472 109.0086 124.2842 139.3088 110.1624 90.09174 159.2944 98.89273 116.394 164.7694 126.7535 120.4142 127.3777 30.97216 19.01079 93.34187 193.9241 147.4632 148.0065 166.0884 105.9237 136.0505 168.0887 111.2209 166.9141 130.833 156.5714 28.88314 32.6856 100.9138 99.98779 106.4498 119.2479 127.5035 163.7063 129.3208 113.038 163.746 134.0678 125.5868 126.0096 24.74229 24.37774 113.4398 102.8417 142.8972 111.2582 154.501 124.9876 22.38351 122.2686 105.101 201.4134 99.86997 135.5002 174.6855 165.9135 133.4743 133.4912 106.6732 151.7174 123.9608 32.14672 31.2187 152.8788 120.8727 95.64705 128.3963 162.7046 132.0999 26.63168 109.357 99.51079 101.1879 106.9363 99.8495 99.03185 164.2321 144.8106 108.1249 151.6292 116.5503 120.3838 26.97778 25.71658 130.8593 26.57979 Số liệu F0 trung bình giây 20 giọng nữ mean (μ) Std(σ) 185.4833 215.894 169.7371 206.5914 182.7553 219.732 178.1013 225.4832 181.2686 177.669 179.4691 209.0739 6.057872 18.85341 193.2674 196.7009 246.1151 201.2788 222.7159 212.0156 22.24066 222.8342 178.9509 251.0323 196.3609 219.5234 213.7403 27.47354 211.7206 215.4447 207.319 229.8073 246.4846 218.4809 255.025 258.6179 215.194 277.8452 227.1486 240.0392 21.93811 27.15147 206.1332 224.5597 238.8955 251.8711 207.0381 225.6995 19.94664 152.8759 210.6052 162.5812 214.0775 141.2574 146.7631 172.6881 189.7576 216.2037 202.9294 169.1213 192.8266 28.7774 27.39074 230.4275 236.6928 235.3971 221.381 237.8874 232.3572 6.76058 187.8266 192.0299 231.3575 185.8102 267.9722 233.1636 194.4668 217.2101 227.8111 215.6352 221.8868 208.7698 32.25139 19.4987 179.9669 217.1034 175.7793 226.0806 189.6596 197.718 22.59191 202.7805 203.1632 179.6313 214.1455 204.7212 265.7205 205.1433 204.5392 216.3655 227.1829 201.7284 222.9503 13.45597 25.76444 224.5774 227.9582 172.7913 194.1129 234.5573 210.7994 26.32369 204.112 219.8453 168.0941 213.7869 143.1859 189.8048 32.88977 218.1955 185.5868 248.2507 192.2773 249.8543 236.278 179.9523 216.9531 238.1721 174.9403 226.885 201.2071 29.11043 24.9579 199.5287 259.7515 248.3498 289.8374 200.4999 239.5935 39.18217 211.1417 23.63084 Số liệu F0 trung bình giây 15 giọng nam mean (μ) Std(σ) 151.6518 128.7463 121.6167 154.4678 163.5948 144.0155 17.92882 112.3654 135.2471 109.1738 143.2561 118.6089 110.6129 122.2614 110.3654 139.5358 121.3451 120.3891 124.1653 11.86839 14.74214 119.3644 132.3433 107.6581 105.3658 142.2587 121.3981 15.85024 125.3658 129.2124 151.3297 139.0908 120.4158 133.0829 12.28849 132 121.2568 150.2546 135.2897 139.3657 147.3658 122.3658 129.2479 135.6987 132.5471 141.877 133.1415 137.9124 9.535521 10.20732 118.3698 122.3658 121.1283 122.8548 135.3698 124.0177 6.580248 105.3654 107.7678 125.3698 120.3654 132.3698 135.7524 112.3654 105.6953 127.3644 146.776 120.567 123.2714 11.25758 17.7902 126.3547 118.3214 156.3216 117.6985 128.7252 146.3255 142.3652 126.8006 126.8167 123.3658 136.1167 126.5024 13.07386 11.69742 140.3258 115.3214 124.3658 110.8007 127.3548 108.3654 121.9765 126.3548 141.3247 102.7186 131.0695 112.7122 9.114131 8.879022 112.6348 108.2347 105.2525 132.2415 135.2147 118.7156 13.99331 127.1385 12.32045 Số liệu F0 trung bình giây 20 giọng nữ mean (μ) Std(σ) 203.8462 195.654 200.8481 207.3658 199.2142 201.3857 4.462965 225.2144 227.0439 231.3222 225.3214 198.3322 221.4468 13.15621 212.4008 220.6058 216.1743 201.6555 246.3224 226.5894 221.2054 218.3544 231.2255 230.5877 225.4657 219.5586 13.6322 11.11464 232.681 227.8436 254.3147 267.3212 226.3547 241.703 18.19614 223.2544 213.3666 240.3211 179.6478 219.5454 212.3658 244.021 225.3574 250.3255 225.6715 235.4935 211.2818 13.4178 18.78444 176.3633 169.0845 165.3333 191.1659 205.3657 181.4625 16.61992 210.3654 198.2211 179.5666 185.3666 185.3121 191.7664 12.44022 218.9062 169.0439 230.3611 210.3656 208.9989 225.6911 219.1672 213.719 231.3698 224.5887 221.7606 208.6817 9.274156 23.13934 182.4284 176.5197 204.2877 208.7147 203.6545 195.121 14.56663 178.1672 182.5025 214.9323 177.835 174.0215 202.6739 223.8198 203.0919 187.763 194.729 195.7408 192.1664 22.36599 11.56635 201.1316 192.731 249.7772 202.4938 224.9111 214.2089 23.17976 208.5699 220.4409 233.6842 225.5688 221.3699 199.6996 216.3455 208.6899 251.3687 254.5645 226.2676 221.7927 16.73854 20.9157 240.0151 256.3699 237.3616 218.6447 261.9893 242.8761 17.12567 203.9599 244.5555 211.3127 271.2379 233.9152 243.3828 238.4315 258.3211 192.2594 201.3663 215.9757 243.7727 19.7147 26.29192 215.3964 16.33517 Số liệu F0 trung bình giây 15 giọng nam mean (μ) Std(σ) 150.1353 122.4783 142.5544 118.9994 132.5622 129.2837 168.37 133.265 147.2353 139.3963 148.1714 128.6845 13.11405 8.191453 135.6924 141.8235 159.3233 121.2916 115.2778 134.6817 17.42872 118.1707 131.0199 126.3633 114.2565 140.8361 126.1293 10.54236 143.2521 137.3624 151.2379 143.6798 151.2588 139.9975 140.4817 127.9555 135.5422 131.2216 144.3545 136.0434 6.872427 6.410021 153.2597 136.5566 120.3612 134.3417 138.9898 136.7018 11.74739 120.7372 137.5699 121.1421 124.1161 120.3611 125.7513 121.6263 131.6532 134.0161 126.0908 123.5766 129.0363 5.854812 5.553065 109.9232 119.1617 128.9647 104.6384 145.3082 121.5992 16.17335 128.8818 154.7584 122.2889 140.9415 135.1144 136.397 12.39913 133 120.6878 146.3652 114.2774 163.2512 145.6589 145.3656 115.2346 140.8966 150.3556 139.9115 129.2429 147.158 17.3826 9.414748 117.6278 109.6927 132.2399 125.0913 115.3636 120.0031 8.79061 114.8875 120.2778 108.3411 130.9191 133.8626 121.6576 10.72151 132.2292 10.70642 Số liệu F0 trung bình giây 20 giọng nữ mean (μ) Std(σ) 193.6539 240.3897 185.8713 238.7476 190.8057 240.2589 196.9975 246.7269 189.2535 217.1738 191.3164 236.6594 4.239816 11.31677 201.7808 205.3656 234.0063 210.1452 219.6642 214.1924 12.95059 231.6361 244.315 211.7383 239.2357 237.9189 267.0304 229.2721 271.1415 242.1171 245.7845 230.5365 253.5014 11.67037 14.50566 212.0917 228.305 208.5681 223.5477 237.8092 222.0644 11.94414 233.6364 167.5451 196.7143 160.6302 232.5406 157.0666 229.4441 181.6076 240.1415 195.0974 226.4954 172.3894 17.09798 15.78893 230.3501 217.0521 196.6254 202.9764 201.3748 209.6758 13.83779 207.9609 184.2579 218.843 229.2985 198.549 246.0033 208.2088 232.9537 219.8013 244.8017 210.6726 227.463 8.810448 25.22188 198.847 192.4065 222.6736 227.499 221.9834 212.6819 15.87763 194.2023 173.3773 234.2763 168.9432 209.2244 192.5402 243.9636 192.9373 204.6616 184.9925 217.2656 182.5581 20.96177 10.98803 191.075 183.0944 237.2884 192.3691 213.6656 203.4985 22.02078 215.3985 228.1412 219.4528 205.5282 218.5897 217.4221 8.153916 209.4189 228.0143 214.2904 243.5514 189.7146 225.4935 198.2554 207.7125 241.8363 248.8899 210.7031 230.7323 19.86991 16.26938 209.3623 225.3211 215.3776 226.5099 196.3699 214.5882 12.42138 234.5698 235.3614 231.2137 245.405 261.2553 241.561 12.21701 216.2989 14.30821 Số liệu F0 trung bình giây 15 giọng nam mean (μ) Std(σ) 150.2128 134.6036 156.6673 130.7804 145.6858 142.0828 155.2471 146.4582 161.8116 153.1965 153.9249 141.4243 6.187318 9.002407 105.2589 140.4053 157.7301 120.0787 114.1251 127.5196 21.26637 116.989 130.2415 129.7097 126.3642 125.0997 105.2468 110.2128 121.2489 139.4278 125.3582 124.2878 121.6919 11.2988 9.73403 123.6262 132.1854 138.5975 154.2587 116.7872 133.091 14.4448 115.2856 119.5298 135.191 111.8723 109.5546 119.1575 120.9075 105.7879 137.5999 132.6759 123.7077 117.8047 12.28763 10.06922 151.1893 136.4036 138.2007 144.6869 138.5738 141.8108 6.102819 120 8055 127.593 130 9588 107.4554 141 7323 121.0661 108 9514 139.5321 159 6937 133.7633 132 4283 125.882 19 4832 12.39053 119.4809 160.8554 113.1346 179.4131 144.2023 159.7568 114.0823 154.8454 150.5566 145.7899 128.2913 160.1321 17.73519 12.30922 129.273 126.2614 112.1243 132.1853 118.1274 119.0669 137.4753 143.8801 126.7846 142.3692 124.7569 132.7526 9.871636 10.56003 132.6337 12.18288 134 Số liệu F0 trung bình 10 giây 20 giọng nữ mean (μ) Std(σ) 195.3884 183.3311 185.0815 191.0876 183.5759 187.6929 5.327729 247.6014 195.7274 235.5578 199.2047 225.3678 226.9861 254.1287 203.8408 223.689 213.0743 237.2689 207.7666 13.41634 12.56207 238.5852 236.9856 218.0904 232.0587 245.0564 234.8462 236.1503 263.0073 249.3806 238.411 237.4526 241.0617 12.02048 12.49936 218.4544 226.6273 235.1542 190.8129 221.7319 225.5643 230.2541 222.5608 244.9435 232.9373 230.1076 219.7005 10.62476 16.58504 172.5715 189.5486 161.7786 187.0558 200.9503 182.381 15.31937 223.4396 214.1997 249.6099 225.4083 190.7267 204.5054 196.8871 214.4551 195.3336 226.3953 211.1994 216.9928 25.00445 9.074762 165.8321 222.4195 238.6232 225.9651 237.4576 218.0595 30.03483 204.8124 188.3762 182.7862 227.248 229.3538 229.5192 234.324 236.6447 228.6429 198.5218 215.9839 216.062 21.80743 21.23694 178.5787 165.5644 198.3165 198.7254 203.4918 188.9353 16.1957 185.3428 221.8605 177.6016 234.9854 230.1697 226.0364 186.598 211.6941 207.2556 225.1474 197.3935 223.9447 21.36015 8.398533 188.477 207.8616 184.0232 192.3077 234.5812 201.4501 20.58129 248.5356 248.4224 243.533 213.9438 261.3344 243.1539 17.61122 207.2687 241.6069 218.5615 242.4222 208.9163 261.2714 219.7146 252.7672 190.4788 269.093 208.988 253.4321 11.75014 11.9186 216.9514 15.66646 Số liệu F0 trung bình 10 giây 15 giọng nam mean (μ) Std(σ) 164.7834 151.9673 141.3152 150.5897 156.9573 153.1226 8.62908 138.6417 120.8546 134.7038 136.1931 146.3453 142.7432 150.852 116.4763 157.7924 110.7013 145.667 125.3937 9.272479 13.54274 120.4987 133.601 128.8527 113.5192 143.6106 128.0164 11.63777 126.3343 122.5733 102.0894 117.6114 121.5975 118.0412 9.442009 127.3349 111.827 136.151 131.1353 142.7555 106.268 135.8135 117.2803 120.2909 133.4719 132.4692 119.9965 8.735264 11.919 123.1157 115.2285 122.7322 108.9615 126.2549 119.2586 7.03852 146.6536 124.4297 132.3115 134.8875 134.0547 140.5513 140.3463 112.2199 134.4165 134.2553 137.5565 129.2688 5.919734 11.15583 123.7652 104.2317 117.4341 135.3462 129.7504 122.1055 12.01881 123.0654 156.0297 116.5287 174.0307 148.5284 154.9641 117.5047 158.5468 155.0733 141.4162 132.1401 156.9975 18.26725 11.62301 133.837 128.2197 159.5959 139.5637 138.0981 139.8629 11.87928 133.0982 10.93312 Số liệu F0 trung bình 15 giây 20 giọng nữ mean (μ) Std(σ) 187.5729 255.0294 175.9979 256.758 177.6783 232.1288 183.4441 261.7526 176.2329 230.3996 180.1852 247.2137 5.11462 14.78026 176.1546 245.7428 191.2365 224.6331 217.9066 252.4081 195.6872 243.2348 204.5513 256.862 197.1073 244.5762 15.52034 12.3811 135 227.5062 225.0081 222.7763 242.2088 225.4524 228.3839 252.487 237.1618 228.8745 252.2918 231.4193 237.0109 11.99938 10.94351 217.5622 183.1803 216.5418 213.6583 223.6198 210.9125 15.92164 177.7486 214.502 195.2351 239.6255 166.632 183.0976 192.6675 189.0116 206.9788 187.5202 187.8524 202.7514 15.77895 24.00427 220.6257 181.752 232.1706 213.5228 210.6406 229.0783 220.8887 216.9265 233.1872 227.9593 223.5026 213.8478 9.347005 19.17569 210.9568 180.8412 188.2697 218.1581 231.6473 220.3384 241.3537 227.1789 235.5022 217.5799 221.546 212.8193 21.84376 18.2791 183.936 170.5313 204.2659 204.6872 209.5965 194.6034 16.68157 177.929 228.5163 170.4975 258.484 220.9629 232.8175 179.1341 218.0449 198.9654 231.9018 189.4978 233.9529 20.50575 14.91553 180.9379 199.5472 176.6623 184.6154 257.101 199.7728 33.18572 255.9917 198.9779 255.8751 209.819 250.839 200.5596 220.3622 210.926 269.1744 182.8597 250.4485 200.6285 18.13956 11.28014 248.8551 249.6949 269.1096 260.3502 277.1657 261.0351 12.27616 217.0342 16.1037 Số liệu F0 trung bình 15 giây 15 giọng nam mean (μ) Std(σ) 158.1921 145.8886 135.6626 144.5661 150.679 146.9977 8.283917 142.801 116.0204 138.7449 130.7454 150.7356 128.4689 155.3775 111.8172 162.5262 106.2733 150.037 118.665 9.550654 10.60063 124.1137 137.609 132.7182 116.9248 136.4301 129.5591 8.821431 121.2809 131.155 117.6703 140.2355 98.00582 135.6177 112.907 139.8879 116.7336 123.8996 113.3195 134.1591 9.064329 6.821868 107.354 126.8092 125.8899 118.6853 102.0172 126.4142 112.5891 112.2304 128.133 130.0425 115.1966 122.8363 11.44224 7.249675 140.7875 128.1626 118.8146 127.019 138.9341 100.0625 128.6925 144.7678 112.7367 134.7324 115.5865 129.9323 129.0399 138.283 124.5603 132.0543 133.1468 117.2213 5.682945 11.49051 11.53806 126.7573 149.7885 120.0245 167.0694 152.9842 148.7655 121.0299 152.2049 139.566 135.7596 132.0724 150.7176 14.04277 11.15809 137.1457 128.4836 148.078 123.091 125.3214 148.4242 145.8475 133.9811 134.5058 132.5742 138.1797 133.3108 9.174369 9.449258 131.1649 9.624716 Phụ lục Khoảng cách Ơ clid trung bình phổ LTA 136 Số liệu khảo sát 50 ngƣời 1.274794 1.847616 4.047085 6.305668 6.54851 0.818537 2.383812 20.29244 1.990798 16.48179 2.410577 5.596148 13.27479 5.157354 4.847616 2.881163 6.408482 13.94425 7.568093 3.907977 6.766537 5.774319 6.490272 8.933852 7.167315 3.229932 3.549966 5.450117 4.229572 6.785992 1.735603 7.581012 4.073477 3.992296 13.66148 9.933852 1.272374 12.01167 4.536965 5.571985 6.879661 1.362724 4.766537 7.661479 11.23735 9.29572 6.785992 8.987315 5.34272 9.992655 Trung bình Độ lệch chuẩn 6.460965 4.12534 Trung bình Độ lệch chuẩn 23.26107 10.86895 Số liệu khảo sát 50 cặp ngƣời nói khác 17.2649 19.47097 14.10986 12.67969 27.80047 19.9423 29.56259 16.26077 12.4672 14.88959 16.32663 38.76698 55.8108 24.6347 40.22237 23.26848 19.66994 32.61661 37.27144 16.8772 23.64581 20.05043 17.59922 26.59922 15.2179 16.21305 15.61899 15.88655 6.180018 29.97276 14.59922 29.04708 14.38911 29.79377 26.57588 27.18903 11.52696 11.32385 52.91974 48.98093 30.01167 14.71206 29.84825 16.79767 35.08366 19.65922 18.98592 26.26848 11.22179 17.22179 Phụ lục Tiêu chuẩn phù hợp χ tính cho formant âm tiết khảo sát Formant Âm tiết Mỗi ngƣời nói Nhiều ngƣời nói Bậc tự Mean (μ) Std (σ) χ2 Bậc tự Mean (μ) Std (σ) χ2 F1 F2 11 17.9501 14.82457 9.314166 5.568326 0.627291 0.315985 13 23.26065 18.67224 6.260877 5.76229 0.515475 0.395858 F3 5.286523 3.478936 5.682924 7.987424 2.708862 0.369607 F4 4.166399 1.876171 0.314398 6.5671 1.566919 0.460935 B1 27.82811 10.12127 0.521149 35.81791 8.667995 0.458207 B2 30.63011 9.403847 0.432633 38.52808 9.451077 0.410397 B3 24.58655 9.090088 0.568571 35.21656 8.044394 2.472455 Một 137 B4 26.6224 8.993897 0.53196 35.7962 8.263452 1.251626 F1 19.33155 15.66877 0.880241 34.36615 12.11694 0.651064 F2 8.944113 5.73721 0.687417 10 15.78904 4.672838 0.341582 F3 10 6.78425 3.799702 0.472357 11.54551 2.319015 0.435644 F4 5.760888 2.778812 0.226861 9.920932 2.215962 0.211464 B1 20.92362 13.26155 1.161049 36.81054 8.533254 0.36309 B2 19.48114 8.803712 0.981399 29.99892 7.304132 0.315698 B3 20.80958 7.230174 1.001739 12 29.92199 6.862753 0.460852 B4 21.91961 8.047389 1.93503 33.41295 9.489862 0.748932 F1 16.84412 13.28778 1.078976 28.20883 10.72104 0.712099 F2 9.939135 7.007504 0.933628 10 16.64722 5.000514 0.281923 F3 11 7.414893 4.771514 0.317315 12.32859 2.940745 0.10789 F4 12 6.455384 3.636175 0.230548 10.8633 2.255098 0.182183 B1 24.22186 10.76937 0.475202 43.25338 12.88646 0.748319 B2 22.26188 8.766056 0.512623 34.53663 10.02471 0.556671 B3 26.48422 10.71084 0.460921 40.34199 11.35878 0.382519 B4 24.20648 8.624464 0.552184 33.22506 9.317574 0.383782 F1 10 12.91273 7.868876 1.702167 18.78603 5.939444 1.294313 F2 11 12.25757 5.233404 1.250465 11 16.36519 4.316484 0.190985 F3 5.350062 3.89537 8.241189 7.517221 2.888129 0.327881 F4 4.548431 2.184025 0.532162 6.625033 1.81738 0.396007 B1 25.91875 11.68347 0.449936 35.44452 10.23631 0.652096 B2 25.94804 8.271765 0.487105 36.06404 7.779069 0.536046 B3 22.67907 8.255213 1.60628 10 35.40449 7.859169 1.47806 B4 22.77977 7.868236 3.223686 30.71067 6.182796 0.22695 F1 20.14225 12.42278 0.525001 41.5748 12.23336 0.511772 F2 9.118747 4.69515 0.634295 10 15.31618 5.048459 0.379536 F3 11 7.86415 4.410163 0.410526 15.25533 3.170555 0.195135 F4 6.044486 3.097437 0.311856 10.68508 2.23144 0.325272 B1 22.05818 10.18413 0.630285 38.3241 11.83133 0.893155 B2 22.01442 8.507612 0.615878 34.06108 8.564141 0.308477 B3 B4 77 24 03576 21.91097 97.929202 568949 209506 1.012896 10 33 40202 29.9538 831447 7.200783 541727 0.500059 Sáu F1 18.03966 12.24796 0.535827 35.1634 11.2071 0.436195 F2 7.966393 4.980337 1.390624 11 14.0208 5.067117 0.291931 F3 6.993767 4.108348 0.225863 12.6595 3.09786 0.321557 F4 5.761707 2.817204 0.325426 9.701535 1.74025 0.309643 B1 24.268 12.82678 0.6141 35.62456 9.595729 0.610591 Hai Ba Bốn Năm 138 B2 22.88318 8.126924 0.91029 33.52585 8.42309 0.380623 B3 23.26433 7.614027 0.406428 35.90977 9.246047 0.478555 B4 21.13955 8.731053 1.154642 29.44178 7.832278 0.526635 F1 16.41526 9.543416 0.794701 23.75928 7.375034 0.395262 F2 12.02395 10.51404 1.574992 24.2235 9.75156 0.686546 F3 5.187433 2.659301 0.979103 7.979415 2.250438 0.163319 F4 6.126581 3.421678 0.479495 9.576697 1.737375 0.4477 B1 31.62867 11.75196 0.572274 45.51589 10.23741 0.790082 B2 24.9164 9.469178 1.085839 38.09303 9.547116 0.415005 B3 10 25.57205 8.345659 1.030549 38.22047 9.15558 0.320817 B4 25.55436 10.542 0.638991 34.79265 8.212452 0.311056 F1 15.4946 9.997558 0.507832 25.5202 9.076262 0.462742 F2 11.08988 4.126578 0.247643 15.69021 3.703409 0.284801 F3 8.173264 4.742311 0.580995 11 12.56083 3.755646 0.239987 F4 5.656729 2.532179 0.281227 8.03445 1.835514 0.22651 B1 18.92299 9.068537 0.500064 34.8094 8.958541 0.529974 B2 19.7387 6.892898 0.626297 30.62925 7.347221 0.482829 B3 11 20.31961 7.134925 2.06981 33.47464 8.220367 1.003762 B4 19.77422 6.032802 0.346159 27.23197 7.082579 0.239091 F1 14.62039 13.51936 1.434177 26.09555 8.983344 0.546828 F2 10 8.599817 4.510858 0.331841 10 13.56424 4.283359 0.644735 F3 7.926851 7.299263 1.459133 14 14.98342 5.513093 0.273056 F4 4.631908 2.9482 0.602443 7.833195 2.4287 0.486874 B1 22.88852 10.48213 0.792608 42.4594 10.31883 0.674833 B2 27.10011 11.9151 0.557911 43.52182 10.08194 0.591092 B3 24.7774 9.134988 0.791109 44.20224 10.4038 0.628056 B4 24.79317 9.337956 0.440051 36.9098 11.17876 0.525203 F1 18.71854 12.45693 0.666792 27.13932 9.646855 0.740986 F2 6.805872 5.216581 22.51776 10 12.05765 4.207212 10.34485 F3 3.912111 1.769209 0.290604 7.395693 1.62895 0.091266 F4 4.619786 1.845995 0.448846 8.010242 1.443006 0.247226 B1 B2 6 43 30995 28.08235 23 36082 11.15073 600547 0.637438 60 56009 42.75468 20 10888 10.2299 699092 0.848657 B3 B4 24.18974 22.30286 7.887185 8.396407 1.329331 0.541399 6 36.29405 31.0154 8.311578 8.776741 0.920594 0.673809 F1 15.77404 10.12944 0.50009 10 22.58135 7.579312 0.670522 F2 11.01026 6.450706 0.860973 10 16.86503 5.559808 0.390969 F3 5.636237 3.804916 0.904073 10 8.838864 2.906078 0.174909 Bảy Tám Chín Khơng Có 139 F4 5.141501 2.898846 0.364506 8.204014 1.788475 0.103345 B1 23.70618 9.446561 0.588059 38.8782 9.545515 0.526239 B2 19.47601 7.59909 1.050726 12 26.50781 5.432812 0.308101 B3 22.53785 9.291851 1.311318 32.73656 7.466617 3.90283 B4 21.44107 8.275193 0.738384 31.40333 6.755992 0.58475 F1 11.58546 6.992637 0.794247 11 16.40136 5.657193 0.495661 F2 11 12.22935 4.507076 0.448093 11 18.71468 5.343973 0.31219 F3 5.745529 4.379635 1.261167 10.05977 3.924979 0.52024 F4 4.740436 2.236994 0.381171 7.758488 1.57143 0.343479 B1 24.25225 11.9637 0.632795 38.92492 10.22129 0.515977 B2 20.82899 8.311444 0.768976 10 29.49426 7.099606 0.489896 B3 20.96318 7.941463 1.489333 34.12957 7.858865 0.433947 B4 22.91254 8.183885 1.026364 33.36305 8.639032 0.651584 F1 14.24943 9.839962 0.598067 25.28443 9.22484 0.37918 F2 8.383783 5.580692 0.994204 10 14.07514 4.291429 0.249545 F3 6.33294 3.57463 0.445196 10.63946 2.303573 0.343005 F4 5.746154 2.966337 0.246018 9.222689 2.444305 0.158388 B1 24.28203 9.314578 0.671425 35.64692 11.47013 0.523937 B2 21.82469 8.967023 0.605925 31.86199 8.43947 1.344987 B3 22.41424 8.608496 0.631612 35.58483 7.665796 0.531431 B4 22.69415 8.290922 0.622122 32.96255 8.170077 0.460862 F1 10 10.95518 6.699833 1.106891 19.26727 6.087544 0.534518 F2 11 10.4517 5.866151 1.889205 15.47774 3.952188 0.450593 F3 8.192978 5.709016 0.76444 12 13.64954 4.304203 0.298131 F4 4.917275 2.409462 0.965974 8.529998 1.707078 0.523737 B1 24.81233 11.74264 0.52001 38.66183 11.81209 0.572112 B2 18.5462 6.295249 1.040493 29.63066 6.012157 0.37199 B3 23.52966 9.355089 0.640307 35.72782 9.28863 0.698436 B4 23.32775 7.670029 3.064716 32.22272 8.134816 0.55929 F1 12.59577 8.000936 1.346156 22.34316 8.680183 0.992822 F2 9.429468 9.532978 1.558331 12 17.48414 7.605441 0.610605 F4 5.262059 2.597185 0.271304 9.119042 2.240733 0.201341 B1 B2 25.30832 20.64199 12.26086 7.381701 0.734507 0.891321 37.22789 31.29169 11.82525 8.68441 0.561216 1.307863 B3 11 22.79251 6.840749 0.617831 34.34606 7.620284 0.486106 B4 23.15439 8.772836 0.955556 35.57658 9.592451 0.528375 F1 10 16.56456 7.67721 0.837648 10 24.92577 6.566407 0.310937 F2 9.673379 4.036753 0.274362 12 14.4936 4.791919 0.350952 Tôi Đã Luôn Sợ Hết 140 F3 7.447274 5.751145 0.88572 11 12.77721 5.360458 0.419058 F4 5.353637 2.56349 0.633086 8.023261 2.258647 0.185091 B1 24.33941 9.100321 1.126987 35.80866 8.941851 0.54095 B2 29.07647 10.4687 0.47694 39.54248 8.831846 0.73895 B3 26.1074 9.721381 0.607037 38.51642 9.754849 0.617697 B4 24.18278 8.249222 0.680108 34.87184 9.573247 0.633281 F1 10 9.934958 6.348097 0.575591 12 15.06694 4.943586 0.290179 F2 10 7.362364 3.80268 0.321373 11.47873 3.238729 0.233547 F3 5.223848 4.040072 1.61331 10 9.51022 3.441391 0.505321 F4 4.709216 2.458989 0.465922 7.550611 1.613776 0.539389 B1 31.19203 13.32742 0.466555 48.18865 11.49138 0.641699 B2 30.21138 11.9972 0.857124 42.68909 9.815465 0.858236 B3 24.20613 8.129355 1.318871 42.86467 9.304616 0.620377 B4 21.12992 7.535034 1.599522 11 30.60306 6.430094 0.326381 Tiền Phụ lục Trung bình độ xác nhận dạng người nói phụ thuộc từ khóa tiếng Việt (theo số trạng thái mơ hình HMM (ST) số đặc trưng MFCC) ST4 ST5 ST6 ST7 ST8 13 15 17 19 Số hệ số MFCC 21 23 25 47.2 52.4 54.4 55.5 56.2 50 54.8 57.2 57.3 58.8 52.9 56.7 59.3 59.8 60.4 55.6 58.4 60.3 61.6 61.2 56.9 60.1 60.6 61.2 61.3 57 59.7 60.7 61.6 61.3 57.3 60.7 61.4 61.8 61.5 27 29 31 33 57.7 61.8 62.1 61.5 60.5 58.4 61.5 61.4 61.1 60.3 58.4 61.4 61.4 59.9 59 58.1 60.9 61.1 61.1 58.4 Phụ lục Kết khảo sát so sánh khả phân biệt người nói âm tiết với số trạng thái HMM (Biểu diễn hình 4.3) Âm tiết Một Hai Ba Bốn Năm 13 15 17 19 Số hệ số MFCC 21 23 25 27 29 31 33 37 72 68 42 70 41 70 66 46 73 43 70 72 49 76 44 71 70 52 82 42 73 69 52 81 46 70 74 50 81 44 67 75 55 81 45 64 73 54 79 47 71 71 49 72 141 43 74 68 54 82 45 73 72 53 82 Sáu 56 Bảy 34 67 Tám 59 Chín 48 Khơng 63 Có 55 Tơi 62 Đã 64 Ln 46 Sợ 36 Hết 64 Tiền T Bình 55.47 54 42 67 64 49 61 54 67 66 46 41 67 57.3 53 58 45 46 71 74 68 73 53 51 62 63 56 57 69 71 66 67 49 50 43 45 71 73 59.76 61.6 57 49 73 75 51 58 52 72 69 51 44 72 61.2 59 59 48 48 73 75 74 75 53 57 59 58 55 53 72 71 68 69 50 50 44 42 71 69 61.59 61.82 60 49 73 77 55 58 51 70 68 50 42 71 61.5 60 47 74 76 54 58 48 67 69 51 41 71 61.1 62 55 45 48 74 75 73 70 50 60 55 67 45 55 67 67 67 66 52 53 42 39 72 74 59.94 61.118 Phụ lục Kết khảo sát độ xác nhận dạng người nói phụ thuộc độ dài từ khóa theo mơ hình đơn vị âm tiết âm vị (Biểu diễn hình 4.3) Độ dài từ khóa Âm vị 63 80 87 92 96 96 96 96 96 Âm tiết 64 75 83 87 91 90 91 91 91 Phụ lục Kết khảo sát đánh giá so sánh số phương pháp chuẩn hóa mục 4.3.5 Phụ lục 9A Các sai số hệ nhận dạng người nói điều kiện đối sánh Sai số Ngƣỡng chấp nhận (%) Sai số từ chối (%) Sai số Ngƣỡng chấp nhận (%) Sai số từ chối (%) -2.0 -1.9 52.4 47.8 1 -1 -0.9 9.5 7.1 -1.8 -1.7 -1.6 -1.5 -1.4 -1.3 -1.2 43.2 38.5 33.7 29 24.2 20 15.8 2 2 3 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 5.2 3.5 2.1 1.1 0.6 0.3 0.1 11 15 18 24 33 42 54 142 -1.1 12.5 Phụ lục 9B Các sai số hệ nhận dạng người nói khác điều kiện đối sánh khơng chuẩn hóa Sai số Ngƣỡng chấp nhận (%) -26 -25 -24 -23 -22 -21 -20 81.1 78.3 74.4 68.1 63.2 56.6 49.5 Sai số từ chối (%) Sai số Sai số Ngƣỡng chấp nhận từ chối (%) (%) 12 14 17 24 28 33 35 -19 -18 -17 -16 -15 -14 41.1 34.2 27.7 21.2 15.1 11.3 42 48 58 67 74 84 Phụ lục 9C Các sai số hệ nhận dạng người nói khác điều kiện đối sánh chuẩn hóa phương pháp HNORM Chuẩn hóa điểm số đối sánh theo cơng thức: Với: Score(X,S): điểm số đối sánh (LLR) tiếng nói cần định danh (X) với mơ hình ngƣời nói (S) ; ScoreNorm(X,S): điểm số đối sánh đƣợc chuẩn hóa Score(X,S); μ σ : lần lƣợt trị trung bình độ lệch chuẩn điểm số đối sánh tập ngƣời nói giả mạo Sai số Ngƣỡng chấp nhận (%) Sai số từ chối (%) Sai số Ngƣỡng chấp nhận (%) Sai số từ chối (%) -0.4 67.5 23.3 36 -0.2 0.2 0.4 0.6 52.9 48.7 41.7 35.1 30.6 12 14 17 21 25 1.2 1.4 1.6 1.8 20.6 18.3 16.7 14.2 13.2 42 47 51 58 66 0.8 25.3 32 Phụ lục 9D Các sai số hệ nhận dạng người nói khác điều kiện đối sánh chuẩn hóa phương pháp CMS RASTA 143 Ký hiệu số frame có mẫu tiếng nói T ; Ký hiệu hệ số ceptre x ; Ký hiệu hệ số ceptre sau chuẩn hóa y Phƣơng pháp CMS biểu diễn phƣơng trình sai phân tuyến tính: Phƣơng pháp RASTA biểu diễn phƣơng trình sai phân tuyến tính: Ngƣỡng -3.3 -3.2 -3.1 -3 -2.9 -2.8 -2.7 -2.6 -2.5 Sai số chấp Sai số từ Sai số chấp Sai số từ Ngƣỡng nhận (%) chối (%) nhận (%) chối (%) 48.1 44.2 40.3 36.5 32.5 28.6 24.7 21.1 17.6 2 5 10 -2.4 -2.3 -2.2 -2.1 -2 -1.9 -1.8 -1.7 -1.6 14.3 11.3 8.6 6.3 4.7 3.2 2.2 1.4 0.9 12 16 20 23 26 30 39 44 47 Phụ lục 9E Các sai số hệ nhận dạng người nói khác điều kiện đối sánh chuẩn hóa đồng thời phương pháp CMS, RASTA, HNORM Ngƣỡng Sai số chấp Sai số từ nhận (%) chối (%) 0.6 0.7 0.8 0.9 37.4 31.5 27.1 23.2 20.1 4 1.2 13.1 11 Ngƣỡng 1.3 1.4 1.5 1.6 1.7 Sai số chấp Sai số từ nhận (%) chối (%) 10.3 7.6 6.1 4.3 3.4 14 18 21 24 28 Phụ lục 9F Các sai số hệ nhận dạng người nói khác điều kiện đối sánh chuẩn hóa đồng thời phương pháp MS, RASTA 144 Ngƣỡng -3.2 -3.1 -3.0 -2.9 -2.8 -2.7 -2.6 -2.5 -2.4 -2.3 Sai số chấp Sai số từ Sai số chấp Sai số từ Ngƣỡng nhận (%) chối (%) nhận (%) chối (%) 57.5 53.3 0 49.3 44.9 40.2 35.6 30.9 26.6 22.2 18.0 -2.2 -2.1 -2.0 -1.9 -1.8 -1.7 -1.6 -1.5 -1.4 -1.3 145 14.1 10.9 11 7.8 14 5.1 3.6 19 24 2.4 28 1.5 32 0.6 42 49 0.4 61 ... hình nghiên cứu nhận dạng người nói 22 1.6.1 Nghiên cứu nhận dạng người nói phương pháp thủ cơng 22 1.6.2 Nghiên cứu nhận dạng người nói phương pháp tự động 23 1.7 Giám định pháp lý nhận dạng người. .. khoa học nhận dạng người nói 1.2 Thơng tin đặc trưng giọng nói người 1.3 Các phương pháp nhận dạng người nói giới 1.3.1 Nhận dạng người nói quan thính giác người 1.3.2 Nhận dạng người nói phương... định tự động nhận dạng người nói tiếng Việt 74 4.2 Mơ hình âm tiêt mơ hình âm vị nhận dạng người nói 75 4.2.1 Hệ nhận dạng người nói dựa mơ hình âm tiết 75 4.2.2 Hệ nhận dạng người nói dựa mơ hình

Ngày đăng: 11/03/2022, 20:44

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN