Nghiên cứu kỹ thuật nhận dạng người nói dựa trên từ khoá tiếng Việt Nghiên cứu kỹ thuật nhận dạng người nói dựa trên từ khoá tiếng Việt Nghiên cứu kỹ thuật nhận dạng người nói dựa trên từ khoá tiếng Việt luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI _ _ NGÔ MINH DŨNG NGHIÊN CỨU KỸ THUẬT NHẬN DẠNG NGƯỜI NÓI DỰA TRÊN TỪ KHÓA TIẾNG VIỆT LUẬN ÁN TIẾN SỸ KỸ THUẬT HÀ NỘI - 2010 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI _ _ Ngô Minh Dũng NGHIÊN CỨU KỸ THUẬT NHẬN DẠNG NGƯỜI NÓI PHỤ THUỘC TỪ KHÓA TIẾNG VIỆT Chuyên ngành : Công nghệ phần mềm Mã số : 62.48.10.01 LUẬN ÁN TIẾN SỸ KỸ THUẬT Hướng dẫn khoa học: PGS TS Đặng Văn Chuyết PGS TS Vũ Kim Bảng HÀ NỘI - 2010 LỜI CẢM ƠN Xin bày tỏ lòng biết ơn chân thành sâu sắc tới thầy hướng dẫn khoa học Đặng Văn Chuyết Vũ Kim Bảng, thầy cô Nguyễn Thúc Hải, Trịnh Văn Loan, Nguyễn Thị Hoàng Lan, Quách Tuấn Ngọc (khoa Công nghệ thông tin – Đại học Bách khoa Hà Nội), Lương Chi Mai (Viện Công nghệ Thông tin), Lê Khánh Hùng (Viện Công nghệ ứng dụng) thầy phản biện độc lập tận tình hướng dẫn đóng góp nhiều ý kiến quý báu cho luận án Xin chân thành cảm ơn đồng nghiệp cơng tác phịng Giám định Kỹ thuật pháp lý (Viện Khoa học Hình sự) trung tâm Ngữ âm thực nghiệm (Viện Ngơn ngữ học) nhiệt tình giúp đỡ hợp tác nhiều nghiên cứu, thực nghiệm, thu mẫu… để tác giả hồn thành luận án Xin cảm ơn nhiều anh, chị làm việc Viện Đào tạo Sau đại học Đại học Bách khoa Hà Nội, vụ Giáo dục đại học nhiệt tình giúp đỡ, tạo điều kiện giúp tác giả thực thành công luận án Lời cảm ơn đặc biệt xin dành cho người vợ hai trai yêu quý tác giả, người ln bên cạnh động viên kích lệ tác giả, nguồn lực lớn giúp tác giả hoàn thành luận án Xin cảm ơn tất ! Tác giả luận án LỜi CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu riêng tơi Các số liệu, kết nêu luận án trung thực chưa công bố cơng trình khác Tác giả luận án Ngơ Minh Dũng Mục lục Trang Mở đầu Chương 1: Tổng quan nhận dạng người nói 1.1 Cơ sở khoa học nhận dạng người nói 1.2 Thơng tin đặc trưng giọng nói người 1.3 Các phương pháp nhận dạng người nói giới 1.3.1 Nhận dạng người nói quan thính giác người 1.3.2 Nhận dạng người nói phương pháp thủ cơng 1.3.3 Nhận dạng người nói tự động 1.4 Nguyên lý làm việc hệ nhận dạng người nói 1.4.1 Cấu trúc hệ nhận dạng người nói 1.4.2 Trích chọn đặc trưng 10 1.4.3 Nhận dạng người nói mơ hình Markov ẩn 12 1.4.4 Nhận dạng người nói mơ hình hỗn hợp Gauss 15 1.4.5 Nhận dạng người nói mạng Nơron nhân tạo 16 1.4.6 Một số thuật toán đối sánh mẫu dùng nhận dạng người nói 18 1.4.7 Quyết định nhận dạng 19 1.5 Các nguyên nhân gây lỗi nhận dạng người nói 20 1.5.1 Tính khơng ổn định thân người nói 20 1.5.2 Cải trang tiếng nói giả giọng nói người khác 21 1.5.3 Các tác nhân kỹ thuật gây sai số cho nhận dạng người nói 21 1.6 Sơ lược tình hình nghiên cứu nhận dạng người nói 22 1.6.1 Nghiên cứu nhận dạng người nói phương pháp thủ công 22 1.6.2 Nghiên cứu nhận dạng người nói phương pháp tự động 23 1.7 Giám định pháp lý nhận dạng người nói vấn đề tiếng Việt 24 1.7.1 Phương pháp kinh điển giám định pháp lý nhận dạng người nói 25 1.7.2 Phương pháp tự động giám định pháp lý nhận dạng người nói 26 1.7.3 Các vấn đề tồn giám định nhận dạng người nói tiếng Việt 26 Chương : Giám định nhận dạng người nói tiếng Việt theo phương pháp nghe-phân tích phổ âm 29 2.1 Ngữ âm tiếng Việt với nhận dạng người nói 2.1.1 Một số đặc trưng ngữ âm tiếng Việt i 29 29 2.1.2 Đặc trưng ngữ âm tiếng Việt với nhận dạng người nói 29 2.2 Các tham số tiếng nói nhận dạng người nói 32 2.3 Formants âm tiết tiếng Việt 35 2.3.1 Một số đặc điểm cấu trúc formant âm tiết tiếng Việt 35 2.3.2 Đánh giá phương pháp xác định formants 36 2.3.3 Cơ sở liệu âm tiết người nói tiếng Việt 41 2.3.4 Phạm vi thay đổi formant âm tiết tiếng Việt 42 2.4 Phạm vi thay đổi trung bình tần số 44 2.5 Phổ trung bình thời gian dài 46 2.6 Quy trình giám định nhận dạng người nói tiếng Việt 48 Chương : Xác suất nhận dạng người nói âm tiết tiếng Việt 51 3.1 Cơ sở đánh giá khả nhận dạng người nói âm tiết 51 3.2 Kiểm định giả thiết thống kê phạm vi biến đối tương đối formant âm tiết 52 3.3 Xác suất nhận dạng người nói âm tiết tiếng Việt 54 3.4 Một số nhận xét từ phân tích xác suất nhận dạng người nói 59 3.4.1 Số lượng âm tiết đồng 59 3.4.2 Xác suất trung bình nhận dạng người nói formant 60 3.4.3 Khả phân biệt người nói âm tiết tiếng Việt 62 3.5 Kiểm nghiệm khả nhận dạng người nói âm tiết tiếng Việt 64 3.5.1 Hệ nhận dạng người nói phụ thuộc từ khóa sở 65 3.5.2 Khảo sát độ xác nhận dạng hệ nhận dạng người nói sở với âm tiết khác 68 3.6 Ý nghĩa thực tiễn việc xác định khả phân biệt người nói âm tiết tiếng Việt Chương : Giám định tự động nhận dạng người nói tiếng Việt 72 74 4.1 Các vấn đề tồn giám định tự động nhận dạng người nói tiếng Việt 74 4.2 Mơ hình âm tiêt mơ hình âm vị nhận dạng người nói 75 4.2.1 Hệ nhận dạng người nói dựa mơ hình âm tiết 75 4.2.2 Hệ nhận dạng người nói dựa mơ hình âm vị 4.2.3 So sánh hệ nhận dạng người nói dựa mơ hình âm tiết âm vị 77 ii 81 4.3 Chuẩn hóa điều kiện ghi âm giám định tự động nhận dạng người nói 84 4.3.1 Giám định tự động nhận dạng người nói điều kiện ghi âm khác 84 4.3.2 Cơ sở phương pháp chuẩn hóa theo phổ trung bình 87 4.3.3 Xây dựng tập liệu khảo sát người nói điều kiện ghi khác 91 4.3.4 Hệ nhận dạng người nói sở để khảo sát 93 4.3.5 Đánh giá phương pháp chuẩn hóa theo phổ trung bình 95 4.4 Sơ đồ khối quy trình giám định nhận dạng người nói tổng qt 99 Kết luận kiến nghị 102 Danh mục cơng trình khoa học công bố 104 Tài liệu tham khảo 105 Phụ lục 111 iii Giải thích ký hiệu chữ viết tắt ANN (Artificial Neuron Network ) : Mạng Nơron nhân tạo B1, B2, B3, B4: Bề rộng formant bậc 1, 2, 3, CMS (Ceptral Mean Subtraction) : Trừ trung bình ceptrum CSDL : Cơ sở liệu DET (Detection Error Tradeoff) : đường quan hệ sai số chấp nhận sai số từ chối DFT (Discrete Fourier Transform) : Biến đổi Fuarie rời rạc DTW (Dynamic Time Warping): Thuật tốn gói thời gian động EER (Equal Error Rate) : sai số cân FA (Fault Accept): sai số chấp nhận FR.(Fault Reject): sai số từ chối F0 (Fundamental Frequency): Tần số âm F1, F2, F3, F4 : Giá trị formant bậc 1, 2, 3, GMM (Gaussian Mixing Model) : Mô hình hỗn hợp Gauss HMM (Hidden Markov Models ) : Mơ hình Markov ẩn IDFT (Inverse Discrete Fourier Transform) : Biến đổi ngược Fuarie rời rạc LR (Likelihood Rate ) : Tỷ số likelihood LLR (Log Likelihood Rate ) : Logarit tỷ số likelihood LPC (Linear Predictive Coding ) : Mã hóa dự đốn tuyến tính LPCC (Linear Predictive Ceptral Coefficients) : Các hệ số ceptrum dự đốn tuyến tính LTA (Long Term Average spectrum): Phổ trung bình thời gian dài MFCC (Mel-Frequency Ceptral Coefficients) : Các hệ số ceptrum tần số Mel ML (Maximum Lilikehood ) : likelihood cực đại MS : Phương pháp chuẩn hóa trung bình phổ NDNN : Nhận dạng người nói NDTN : Nhận dạng tiếng nói RASTA (RelAtive SpecTrA) : Phổ tương thích VQ (Vector Quantization) : Lượng tử vector iv Danh mục bảng Bảng 2.1: Phạm vi biến đổi trung bình formants âm tiết 43 Bảng 2.2 : Phạm vi thay đổi tần số trung bình 45 Bảng 2.3 : Kết khảo sát độ ổn đinh phổ LTA 46 Bảng : Xác suất nhận dạng người nói âm tiết khảo sát 56 Bảng : Kết khảo sát số phương pháp chuẩn hóa 96 v Danh mục hình Hình 1.1: Cấu tạo quan phát âm người Hình 1.2 Phân loại thơng tin đặc trưng người nói Hình 1.3: Nhận dạng người nói hai người phương pháp thủ cơng Hình 1.4: Cấu trúc hệ nhận dạng người nói 10 Hình 1.5: Phân tích phổ thời gian ngắn 11 Hình 1.6 : Sơ đồ khối xác định hệ số MFCC 12 Hình 1.7: Sơ đồ mơ hình HMM trạng thái dịch chuyển từ trái sang 13 phải Hình 1.8 : Mơ hình Nơron 17 Hình 1.9 : Phân lớp nhận dạng người nói sử dụng ANN 18 Hình 2.1: Hệ thống phân tích phổ tín hiệu tiếng nói CSL 33 Hình 2.2: Giá trị formant khúc đoạn 20ms hai mẫu 37 tiếng nói Hình 2.3: Xác định giá trị (Fi) bề rộng (Bi) formant 38 số khúc đoạn cho âm vị /a/ âm tiết “bách” Hình 2.4: Tín hiệu tiếng nói phổ ba chiều hai người phát âm 39 cụm từ “đại học bách khoa” Hình 3.1: Minh họa quan hệ hai hàm phân bố chuẩn 53 Hình 3.2: Minh họa mối quan hệ hàm phân bố xác suất khả 54 phân biệt người nói formant âm tiết Hình 3.3 : Xác suất nhận dạng người nói theo số âm tiết đồng 59 Hình 3.4: Xác suất trung bình nhận dạng người nói formant 60 âm tiết tiếng Việt vi 197.3278 186.8584 306.3969 233.0324 216.6443 228.052 47.25928 214.3165 276.1845 262.6789 278.6228 200.0498 246.3705 36.63374 228.4748 40.28015 Số liệu F0 trung bình giây 15 giọng nam 187.8041 129.069 116.911 171.1555 181.2685 90.47421 91.89134 113.4227 191.7827 210.2654 164.3859 122.5628 99.4954 99.5512 165.7123 163.8927 104.9166 94.3369 212.3925 98.2546 204.1306 155.2244 140.9586 106.2251 mean (μ) Std(σ) 157.2416 32.11389 171.7893 131.872 46.99809 125.2545 144.3928 43.58189 104.0976 110.8514 172.5334 133.4248 126.8823 145.4595 38.01026 44.37478 194.2554 111.4986 143.211 197.7514 105.4227 175.6991 139.2736 166.0077 39.1196 39.22259 97.21439 133.5115 136.1272 171.4618 128.908 29.16819 105.2503 113.5694 192.5957 132.9859 141.124 137.1051 34.20886 119.4103 108.2544 149.6306 117.1139 171.6678 133.2154 26.55624 128.7038 191.8223 142.6318 195.1924 140.5171 159.7735 31.27138 110.6326 105.1263 182.9168 140.4993 101.1121 128.0574 34.35064 179.8574 115.1169 100.6811 122.2822 191.4172 141.871 40.90813 115.1127 106.5136 91.14514 193.2142 99.65427 121.128 41.25009 104.7482 101.8441 104.2441 137.9149 202.1723 130.1847 42.91006 139.4248 37.60298 Số liệu F0 trung bình giây 20 giọng nữ mean (μ) Std(σ) 195.2456 178.6706 215.0063 187.4751 213.2572 197.931 15.92135 227.2568 243.0487 231.2968 237.3508 162.2548 220.2416 32.96509 176.4999 234.5623 231.4129 188.3694 289.5472 295.3321 211.8725 206.6957 234.4378 258.2629 228.754 236.6445 41.08123 42.25915 222.8638 226.7839 189.3324 241.9024 289.9819 229.9799 252.5 304.2564 226.52 253.7399 236.2396 251.3325 37.50434 31.44134 188.2495 236.3786 281.0535 265.1275 217.9348 237.7488 36.97817 160.922 171.1381 148.692 181.777 227.5828 178.0224 30.292 221.6897 225.3448 154.4875 199.7449 213.6099 202.9753 28.83236 210.4361 249.1503 247.7864 202.1744 199.0689 221.7232 24.77048 197.7122 243.5342 282.076 204.7019 239.8012 233.5651 33.94883 175.3698 169.6897 274.3102 198.3654 226.9844 208.9439 42.9483 189.4388 185.1877 228.5299 164.0469 185.0308 215.496 237.9796 187.3455 199.6416 197.5941 208.1242 189.934 23.78096 18.78472 213.856 195.5667 279.7057 215.3044 267.274 234.3414 36.83755 205.0935 239.956 181.8856 177.2721 236.9265 208.2268 29.54779 206.1737 222.066 176.9411 225.0388 150.722 196.1883 31.77797 229.6795 261.3166 252.3781 189.4235 280.2025 242.6 34.8373 187.4614 196.2013 243.5856 221.3808 184.1477 206.5553 25.32251 203.6007 262.3753 250.8584 264.6917 211.0525 238.5157 29.06927 218.9304 31.44504 Số liệu F0 trung bình giây 15 giọng nam 131 mean (μ) Std(σ) 178.4139 135.5225 128.0175 162.5977 172.2051 155.3513 22.4096 99.06926 157.6991 100.621 139.728 108.3186 116.4347 163.0153 104.4702 146.8798 118.9918 123.5808 127.4647 29.40588 21.13472 109.0086 139.3088 90.09174 98.89273 164.7694 120.4142 30.97216 124.2842 110.1624 159.2944 116.394 126.7535 127.3777 19.01079 93.34187 147.4632 166.0884 136.0505 111.2209 130.833 28.88314 193.9241 148.0065 105.9237 168.0887 166.9141 156.5714 32.6856 100.9138 106.4498 127.5035 129.3208 163.746 125.5868 24.74229 99.98779 119.2479 163.7063 113.038 134.0678 126.0096 24.37774 113.4398 102.8417 142.8972 111.2582 154.501 124.9876 22.38351 122.2686 105.101 201.4134 99.86997 135.5002 174.6855 165.9135 133.4743 133.4912 106.6732 151.7174 123.9608 32.14672 31.2187 152.8788 120.8727 95.64705 128.3963 162.7046 132.0999 26.63168 109.357 101.1879 99.8495 164.2321 108.1249 116.5503 26.97778 99.51079 106.9363 99.03185 144.8106 151.6292 120.3838 25.71658 130.8593 26.57979 Số liệu F0 trung bình giây 20 giọng nữ mean (μ) Std(σ) 185.4833 169.7371 182.7553 178.1013 181.2686 179.4691 6.057872 215.894 206.5914 219.732 225.4832 177.669 209.0739 18.85341 193.2674 196.7009 246.1151 201.2788 222.7159 212.0156 22.24066 222.8342 178.9509 251.0323 196.3609 219.5234 213.7403 27.47354 211.7206 207.319 246.4846 255.025 215.194 227.1486 21.93811 215.4447 229.8073 218.4809 258.6179 277.8452 240.0392 27.15147 206.1332 224.5597 238.8955 251.8711 207.0381 225.6995 19.94664 152.8759 210.6052 162.5812 214.0775 141.2574 146.7631 172.6881 189.7576 216.2037 202.9294 169.1213 192.8266 28.7774 27.39074 230.4275 236.6928 235.3971 221.381 237.8874 232.3572 6.76058 187.8266 231.3575 267.9722 194.4668 227.8111 221.8868 32.25139 192.0299 185.8102 233.1636 217.2101 215.6352 208.7698 19.4987 179.9669 217.1034 175.7793 226.0806 189.6596 197.718 22.59191 202.7805 179.6313 204.7212 205.1433 216.3655 201.7284 13.45597 203.1632 214.1455 265.7205 204.5392 227.1829 222.9503 25.76444 224.5774 227.9582 172.7913 194.1129 234.5573 210.7994 26.32369 204.112 219.8453 168.0941 213.7869 143.1859 189.8048 32.88977 218.1955 185.5868 248.2507 192.2773 249.8543 236.278 179.9523 216.9531 238.1721 174.9403 226.885 201.2071 29.11043 24.9579 199.5287 259.7515 248.3498 289.8374 200.4999 239.5935 39.18217 211.1417 23.63084 Số liệu F0 trung bình giây 15 giọng nam mean (μ) Std(σ) 151.6518 128.7463 121.6167 154.4678 163.5948 144.0155 17.92882 112.3654 109.1738 118.6089 122.2614 139.5358 120.3891 11.86839 135.2471 143.2561 110.6129 110.3654 121.3451 124.1653 14.74214 119.3644 132.3433 107.6581 105.3658 142.2587 121.3981 15.85024 125.3658 129.2124 151.3297 139.0908 120.4158 133.0829 12.28849 132 121.2568 135.2897 147.3658 129.2479 132.5471 133.1415 9.535521 150.2546 118.3698 139.3657 122.3658 122.3658 121.1283 135.6987 122.8548 141.877 135.3698 137.9124 124.0177 10.20732 6.580248 105.3654 125.3698 132.3698 112.3654 127.3644 120.567 11.25758 107.7678 120.3654 135.7524 105.6953 146.776 123.2714 17.7902 126.3547 156.3216 128.7252 142.3652 126.8167 136.1167 13.07386 118.3214 117.6985 146.3255 126.8006 123.3658 126.5024 11.69742 140.3258 124.3658 127.3548 121.9765 141.3247 131.0695 9.114131 115.3214 110.8007 108.3654 126.3548 102.7186 112.7122 8.879022 112.6348 108.2347 105.2525 132.2415 135.2147 118.7156 13.99331 127.1385 12.32045 Số liệu F0 trung bình giây 20 giọng nữ mean (μ) Std(σ) 203.8462 195.654 200.8481 207.3658 199.2142 201.3857 4.462965 225.2144 227.0439 231.3222 225.3214 198.3322 221.4468 13.15621 212.4008 216.1743 246.3224 221.2054 231.2255 225.4657 13.6322 220.6058 201.6555 226.5894 218.3544 230.5877 219.5586 11.11464 232.681 223.2544 227.8436 240.3211 254.3147 219.5454 267.3212 244.021 226.3547 250.3255 241.703 235.4935 18.19614 13.4178 213.3666 179.6478 212.3658 225.3574 225.6715 211.2818 18.78444 176.3633 169.0845 165.3333 191.1659 205.3657 181.4625 16.61992 210.3654 198.2211 179.5666 185.3666 185.3121 191.7664 12.44022 218.9062 230.3611 208.9989 219.1672 231.3698 221.7606 9.274156 169.0439 210.3656 225.6911 213.719 224.5887 208.6817 23.13934 182.4284 176.5197 204.2877 208.7147 203.6545 195.121 14.56663 178.1672 182.5025 214.9323 177.835 174.0215 202.6739 223.8198 203.0919 187.763 194.729 195.7408 192.1664 22.36599 11.56635 201.1316 192.731 249.7772 202.4938 224.9111 214.2089 23.17976 208.5699 233.6842 221.3699 216.3455 251.3687 226.2676 16.73854 220.4409 225.5688 199.6996 208.6899 254.5645 221.7927 20.9157 240.0151 256.3699 237.3616 218.6447 261.9893 242.8761 17.12567 203.9599 211.3127 233.9152 238.4315 192.2594 215.9757 19.7147 244.5555 271.2379 243.3828 258.3211 201.3663 243.7727 26.29192 215.3964 16.33517 Số liệu F0 trung bình giây 15 giọng nam mean (μ) Std(σ) 150.1353 122.4783 142.5544 118.9994 132.5622 129.2837 168.37 133.265 147.2353 139.3963 148.1714 128.6845 13.11405 8.191453 135.6924 141.8235 159.3233 121.2916 115.2778 134.6817 17.42872 118.1707 131.0199 126.3633 114.2565 140.8361 126.1293 10.54236 143.2521 151.2379 151.2588 140.4817 135.5422 144.3545 6.872427 137.3624 143.6798 139.9975 127.9555 131.2216 136.0434 6.410021 153.2597 136.5566 120.3612 134.3417 138.9898 136.7018 11.74739 120.7372 121.1421 120.3611 121.6263 134.0161 123.5766 5.854812 137.5699 124.1161 125.7513 131.6532 126.0908 129.0363 5.553065 109.9232 119.1617 128.9647 104.6384 145.3082 121.5992 16.17335 128.8818 154.7584 122.2889 140.9415 135.1144 136.397 12.39913 133 120.6878 114.2774 145.6589 115.2346 150.3556 129.2429 17.3826 146.3652 117.6278 163.2512 109.6927 145.3656 132.2399 140.8966 125.0913 139.9115 115.3636 147.158 120.0031 9.414748 8.79061 114.8875 120.2778 108.3411 130.9191 133.8626 121.6576 10.72151 132.2292 10.70642 Số liệu F0 trung bình giây 20 giọng nữ mean (μ) Std(σ) 193.6539 185.8713 190.8057 196.9975 189.2535 191.3164 4.239816 240.3897 238.7476 240.2589 246.7269 217.1738 236.6594 11.31677 201.7808 205.3656 234.0063 210.1452 219.6642 214.1924 12.95059 231.6361 211.7383 237.9189 229.2721 242.1171 230.5365 11.67037 244.315 239.2357 267.0304 271.1415 245.7845 253.5014 14.50566 212.0917 228.305 208.5681 223.5477 237.8092 222.0644 11.94414 233.6364 196.7143 232.5406 229.4441 240.1415 226.4954 17.09798 167.5451 230.3501 160.6302 217.0521 157.0666 196.6254 181.6076 202.9764 195.0974 201.3748 172.3894 209.6758 15.78893 13.83779 207.9609 184.2579 218.843 229.2985 198.549 246.0033 208.2088 232.9537 219.8013 244.8017 210.6726 227.463 8.810448 25.22188 198.847 192.4065 222.6736 227.499 221.9834 212.6819 15.87763 194.2023 234.2763 209.2244 243.9636 204.6616 217.2656 20.96177 173.3773 168.9432 192.5402 192.9373 184.9925 182.5581 10.98803 191.075 183.0944 237.2884 192.3691 213.6656 203.4985 22.02078 215.3985 228.1412 219.4528 205.5282 218.5897 217.4221 8.153916 209.4189 214.2904 189.7146 198.2554 241.8363 210.7031 19.86991 228.0143 209.3623 243.5514 225.3211 225.4935 215.3776 207.7125 226.5099 248.8899 196.3699 230.7323 214.5882 16.26938 12.42138 234.5698 235.3614 231.2137 245.405 261.2553 241.561 12.21701 216.2989 14.30821 Số liệu F0 trung bình giây 15 giọng nam mean (μ) Std(σ) 150.2128 156.6673 145.6858 155.2471 161.8116 153.9249 6.187318 134.6036 130.7804 142.0828 146.4582 153.1965 141.4243 9.002407 105.2589 140.4053 157.7301 120.0787 114.1251 127.5196 21.26637 116.989 129.7097 125.0997 110.2128 139.4278 124.2878 11.2988 130.2415 123.6262 126.3642 132.1854 105.2468 138.5975 121.2489 154.2587 125.3582 116.7872 121.6919 133.091 9.73403 14.4448 115.2856 135.191 109.5546 120.9075 137.5999 123.7077 12.28763 119.5298 111.8723 119.1575 105.7879 132.6759 117.8047 10.06922 151.1893 136.4036 138.2007 144.6869 138.5738 141.8108 6.102819 120.8055 130.9588 141.7323 108.9514 159.6937 132.4283 19.4832 127.593 107.4554 121.0661 139.5321 133.7633 125.882 12.39053 119.4809 160.8554 113.1346 179.4131 144.2023 159.7568 114.0823 154.8454 150.5566 145.7899 128.2913 160.1321 17.73519 12.30922 129.273 126.2614 112.1243 132.1853 118.1274 119.0669 137.4753 143.8801 126.7846 142.3692 124.7569 132.7526 9.871636 10.56003 132.6337 12.18288 134 Số liệu F0 trung bình 10 giây 20 giọng nữ mean (μ) Std(σ) 195.3884 183.3311 185.0815 191.0876 183.5759 187.6929 5.327729 247.6014 235.5578 225.3678 254.1287 223.689 237.2689 13.41634 195.7274 199.2047 226.9861 203.8408 213.0743 207.7666 12.56207 238.5852 218.0904 245.0564 236.1503 249.3806 237.4526 12.02048 236.9856 218.4544 232.0587 235.1542 234.8462 221.7319 263.0073 230.2541 238.411 244.9435 241.0617 230.1076 12.49936 10.62476 226.6273 190.8129 225.5643 222.5608 232.9373 219.7005 16.58504 172.5715 223.4396 189.5486 249.6099 161.7786 190.7267 187.0558 196.8871 200.9503 195.3336 182.381 211.1994 15.31937 25.00445 214.1997 225.4083 204.5054 214.4551 226.3953 216.9928 9.074762 165.8321 222.4195 238.6232 225.9651 237.4576 218.0595 30.03483 204.8124 182.7862 229.3538 234.324 228.6429 215.9839 21.80743 188.3762 178.5787 227.248 165.5644 229.5192 198.3165 236.6447 198.7254 198.5218 203.4918 216.062 188.9353 21.23694 16.1957 185.3428 177.6016 230.1697 186.598 207.2556 197.3935 21.36015 221.8605 234.9854 226.0364 211.6941 225.1474 223.9447 8.398533 188.477 207.8616 184.0232 192.3077 234.5812 201.4501 20.58129 248.5356 248.4224 243.533 213.9438 261.3344 243.1539 17.61122 207.2687 218.5615 208.9163 219.7146 190.4788 208.988 11.75014 241.6069 242.4222 261.2714 252.7672 269.093 253.4321 11.9186 216.9514 15.66646 Số liệu F0 trung bình 10 giây 15 giọng nam mean (μ) Std(σ) 164.7834 151.9673 141.3152 150.5897 156.9573 153.1226 8.62908 138.6417 134.7038 146.3453 150.852 157.7924 145.667 9.272479 120.8546 136.1931 142.7432 116.4763 110.7013 125.3937 13.54274 120.4987 133.601 128.8527 113.5192 143.6106 128.0164 11.63777 126.3343 122.5733 102.0894 117.6114 121.5975 118.0412 9.442009 127.3349 136.151 142.7555 135.8135 120.2909 132.4692 8.735264 111.827 131.1353 106.268 117.2803 133.4719 119.9965 11.919 123.1157 115.2285 122.7322 108.9615 126.2549 119.2586 7.03852 146.6536 124.4297 132.3115 134.8875 134.0547 140.5513 140.3463 112.2199 134.4165 134.2553 137.5565 129.2688 5.919734 11.15583 123.7652 104.2317 117.4341 135.3462 129.7504 122.1055 12.01881 123.0654 116.5287 148.5284 117.5047 155.0733 132.1401 18.26725 156.0297 174.0307 154.9641 158.5468 141.4162 156.9975 11.62301 133.1512 155.8716 121.6712 141.5995 130.5881 136.5763 12.916 133.837 128.2197 159.5959 139.5637 138.0981 139.8629 11.87928 133.0982 10.93312 Số liệu F0 trung bình 15 giây 20 giọng nữ mean (μ) Std(σ) 187.5729 255.0294 175.9979 256.758 177.6783 232.1288 183.4441 261.7526 176.2329 230.3996 180.1852 247.2137 5.11462 14.78026 176.1546 191.2365 217.9066 195.6872 204.5513 197.1073 15.52034 245.7428 224.6331 252.4081 243.2348 256.862 244.5762 12.3811 135 227.5062 222.7763 225.4524 252.487 228.8745 231.4193 11.99938 225.0081 217.5622 242.2088 183.1803 228.3839 216.5418 237.1618 213.6583 252.2918 223.6198 237.0109 210.9125 10.94351 15.92164 177.7486 195.2351 166.632 192.6675 206.9788 187.8524 15.77895 214.502 239.6255 183.0976 189.0116 187.5202 202.7514 24.00427 220.6257 232.1706 210.6406 220.8887 233.1872 223.5026 9.347005 181.752 213.5228 229.0783 216.9265 227.9593 213.8478 19.17569 210.9568 188.2697 231.6473 241.3537 235.5022 221.546 21.84376 180.8412 218.1581 220.3384 227.1789 217.5799 212.8193 18.2791 183.936 170.5313 204.2659 204.6872 209.5965 194.6034 16.68157 177.929 228.5163 170.4975 258.484 220.9629 232.8175 179.1341 218.0449 198.9654 231.9018 189.4978 233.9529 20.50575 14.91553 180.9379 199.5472 176.6623 184.6154 257.101 199.7728 33.18572 255.9917 255.8751 250.839 220.3622 269.1744 250.4485 18.13956 198.9779 209.819 200.5596 210.926 182.8597 200.6285 11.28014 248.8551 249.6949 269.1096 260.3502 277.1657 261.0351 12.27616 217.0342 16.1037 Số liệu F0 trung bình 15 giây 15 giọng nam mean (μ) Std(σ) 158.1921 145.8886 135.6626 144.5661 150.679 146.9977 8.283917 142.801 116.0204 138.7449 130.7454 150.7356 128.4689 155.3775 111.8172 162.5262 106.2733 150.037 118.665 9.550654 10.60063 124.1137 137.609 132.7182 116.9248 136.4301 129.5591 8.821431 121.2809 117.6703 98.00582 112.907 116.7336 113.3195 9.064329 131.155 140.2355 135.6177 139.8879 123.8996 134.1591 6.821868 107.354 125.8899 102.0172 112.5891 128.133 115.1966 11.44224 126.8092 118.6853 126.4142 112.2304 130.0425 122.8363 7.249675 140.7875 127.019 128.6925 134.7324 129.0399 132.0543 5.682945 128.1626 118.8146 138.9341 100.0625 144.7678 112.7367 115.5865 129.9323 138.283 124.5603 133.1468 117.2213 11.49051 11.53806 126.7573 149.7885 120.0245 167.0694 152.9842 148.7655 121.0299 152.2049 139.566 135.7596 132.0724 150.7176 14.04277 11.15809 137.1457 148.078 125.3214 145.8475 134.5058 138.1797 9.174369 128.4836 123.091 148.4242 133.9811 132.5742 133.3108 9.449258 131.1649 9.624716 Phụ lục Khoảng cách Ơ clid trung bình phổ LTA 136 Số liệu khảo sát 50 ngƣời 1.274794 1.847616 4.047085 6.305668 6.54851 0.818537 2.383812 20.29244 1.990798 16.48179 2.410577 13.27479 4.847616 6.408482 7.568093 5.596148 5.157354 2.881163 13.94425 3.907977 6.766537 5.774319 6.490272 8.933852 7.167315 3.229932 3.549966 5.450117 4.229572 6.785992 1.735603 7.581012 4.073477 3.992296 13.66148 9.933852 1.272374 12.01167 4.536965 5.571985 6.879661 1.362724 4.766537 7.661479 11.23735 9.29572 6.785992 8.987315 5.34272 9.992655 Trung bình Độ lệch chuẩn 6.460965 4.12534 Trung bình Độ lệch chuẩn 23.26107 10.86895 Số liệu khảo sát 50 cặp ngƣời nói khác 17.2649 19.47097 27.80047 29.56259 12.4672 14.10986 12.67969 19.9423 16.26077 14.88959 16.32663 55.8108 38.76698 24.6347 40.22237 23.26848 19.66994 32.61661 37.27144 16.8772 23.64581 20.05043 17.59922 26.59922 15.2179 16.21305 15.88655 29.97276 29.04708 29.79377 15.61899 6.180018 14.59922 14.38911 26.57588 27.18903 11.32385 48.98093 14.71206 16.79767 11.52696 52.91974 30.01167 29.84825 35.08366 19.65922 18.98592 26.26848 11.22179 17.22179 Phụ lục Tiêu chuẩn phù hợp χ2 tính cho formant âm tiết khảo sát Formant Âm tiết Mỗi ngƣời nói Nhiều ngƣời nói Bậc tự Mean (μ) Std (σ) χ2 Bậc tự Mean (μ) Std (σ) χ2 F1 17.9501 9.314166 0.627291 23.26065 6.260877 0.515475 F2 11 14.82457 5.568326 0.315985 13 18.67224 5.76229 0.395858 F3 5.286523 3.478936 5.682924 7.987424 2.708862 0.369607 F4 4.166399 1.876171 0.314398 6.5671 1.566919 0.460935 B1 27.82811 10.12127 0.521149 35.81791 8.667995 0.458207 B2 30.63011 9.403847 0.432633 38.52808 9.451077 0.410397 B3 24.58655 9.090088 0.568571 35.21656 8.044394 2.472455 Một 137 B4 26.6224 8.993897 0.53196 35.7962 8.263452 1.251626 F1 19.33155 15.66877 0.880241 34.36615 12.11694 0.651064 F2 8.944113 5.73721 0.687417 10 15.78904 4.672838 0.341582 F3 10 6.78425 3.799702 0.472357 11.54551 2.319015 0.435644 F4 5.760888 2.778812 0.226861 9.920932 2.215962 0.211464 B1 20.92362 13.26155 1.161049 36.81054 8.533254 0.36309 B2 19.48114 8.803712 0.981399 29.99892 7.304132 0.315698 B3 20.80958 7.230174 1.001739 12 29.92199 6.862753 0.460852 B4 21.91961 8.047389 1.93503 33.41295 9.489862 0.748932 F1 16.84412 13.28778 1.078976 28.20883 10.72104 0.712099 F2 9.939135 7.007504 0.933628 10 16.64722 5.000514 0.281923 F3 11 7.414893 4.771514 0.317315 12.32859 2.940745 0.10789 F4 12 6.455384 3.636175 0.230548 10.8633 2.255098 0.182183 B1 24.22186 10.76937 0.475202 43.25338 12.88646 0.748319 B2 22.26188 8.766056 0.512623 34.53663 10.02471 0.556671 B3 26.48422 10.71084 0.460921 40.34199 11.35878 0.382519 B4 24.20648 8.624464 0.552184 33.22506 9.317574 0.383782 F1 10 12.91273 7.868876 1.702167 18.78603 5.939444 1.294313 F2 11 12.25757 5.233404 1.250465 11 16.36519 4.316484 0.190985 F3 5.350062 3.89537 8.241189 7.517221 2.888129 0.327881 F4 4.548431 2.184025 0.532162 6.625033 1.81738 0.396007 B1 25.91875 11.68347 0.449936 35.44452 10.23631 0.652096 B2 25.94804 8.271765 0.487105 36.06404 7.779069 0.536046 B3 22.67907 8.255213 1.60628 10 35.40449 7.859169 1.47806 B4 22.77977 7.868236 3.223686 30.71067 6.182796 0.22695 F1 20.14225 12.42278 0.525001 41.5748 12.23336 0.511772 F2 9.118747 4.69515 0.634295 10 15.31618 5.048459 0.379536 F3 11 7.86415 4.410163 0.410526 15.25533 3.170555 0.195135 F4 6.044486 3.097437 0.311856 10.68508 2.23144 0.325272 B1 22.05818 10.18413 0.630285 38.3241 11.83133 0.893155 B2 22.01442 8.507612 0.615878 34.06108 8.564141 0.308477 B3 24.03576 9.568949 1.209506 33.40202 7.831447 0.541727 B4 21.91097 7.929202 1.012896 10 29.9538 7.200783 0.500059 F1 18.03966 12.24796 0.535827 35.1634 11.2071 0.436195 F2 7.966393 4.980337 1.390624 11 14.0208 5.067117 0.291931 F3 6.993767 4.108348 0.225863 12.6595 3.09786 0.321557 F4 5.761707 2.817204 0.325426 9.701535 1.74025 0.309643 B1 24.268 12.82678 0.6141 35.62456 9.595729 0.610591 Hai Ba Bốn Năm Sáu 138 B2 22.88318 8.126924 0.91029 33.52585 8.42309 0.380623 B3 23.26433 7.614027 0.406428 35.90977 9.246047 0.478555 B4 21.13955 8.731053 1.154642 29.44178 7.832278 0.526635 F1 16.41526 9.543416 0.794701 23.75928 7.375034 0.395262 F2 12.02395 10.51404 1.574992 24.2235 9.75156 0.686546 F3 5.187433 2.659301 0.979103 7.979415 2.250438 0.163319 F4 6.126581 3.421678 0.479495 9.576697 1.737375 0.4477 B1 31.62867 11.75196 0.572274 45.51589 10.23741 0.790082 B2 24.9164 9.469178 1.085839 38.09303 9.547116 0.415005 B3 10 25.57205 8.345659 1.030549 38.22047 9.15558 0.320817 B4 25.55436 10.542 0.638991 34.79265 8.212452 0.311056 F1 15.4946 9.997558 0.507832 25.5202 9.076262 0.462742 F2 11.08988 4.126578 0.247643 15.69021 3.703409 0.284801 F3 8.173264 4.742311 0.580995 11 12.56083 3.755646 0.239987 F4 5.656729 2.532179 0.281227 8.03445 1.835514 0.22651 B1 18.92299 9.068537 0.500064 34.8094 8.958541 0.529974 B2 19.7387 6.892898 0.626297 30.62925 7.347221 0.482829 B3 11 20.31961 7.134925 2.06981 33.47464 8.220367 1.003762 B4 19.77422 6.032802 0.346159 27.23197 7.082579 0.239091 F1 14.62039 13.51936 1.434177 26.09555 8.983344 0.546828 F2 10 8.599817 4.510858 0.331841 10 13.56424 4.283359 0.644735 F3 7.926851 7.299263 1.459133 14 14.98342 5.513093 0.273056 F4 4.631908 2.9482 0.602443 7.833195 2.4287 0.486874 B1 22.88852 10.48213 0.792608 42.4594 10.31883 0.674833 B2 27.10011 11.9151 0.557911 43.52182 10.08194 0.591092 B3 24.7774 9.134988 0.791109 44.20224 10.4038 0.628056 B4 24.79317 9.337956 0.440051 36.9098 11.17876 0.525203 F1 18.71854 12.45693 0.666792 27.13932 9.646855 0.740986 F2 6.805872 5.216581 22.51776 10 12.05765 4.207212 10.34485 F3 3.912111 1.769209 0.290604 7.395693 1.62895 0.091266 F4 4.619786 1.845995 0.448846 8.010242 1.443006 0.247226 B1 43.30995 23.36082 0.600547 60.56009 20.10888 0.699092 B2 28.08235 11.15073 0.637438 42.75468 10.2299 0.848657 B3 24.18974 7.887185 1.329331 36.29405 8.311578 0.920594 B4 22.30286 8.396407 0.541399 31.0154 8.776741 0.673809 F1 15.77404 10.12944 0.50009 10 22.58135 7.579312 0.670522 F2 11.01026 6.450706 0.860973 10 16.86503 5.559808 0.390969 F3 5.636237 3.804916 0.904073 10 8.838864 2.906078 0.174909 Bảy Tám Chín Khơng Có 139 F4 5.141501 2.898846 0.364506 8.204014 1.788475 0.103345 B1 23.70618 9.446561 0.588059 38.8782 9.545515 0.526239 B2 19.47601 7.59909 1.050726 12 26.50781 5.432812 0.308101 B3 22.53785 9.291851 1.311318 32.73656 7.466617 3.90283 B4 21.44107 8.275193 0.738384 31.40333 6.755992 0.58475 F1 11.58546 6.992637 0.794247 11 16.40136 5.657193 0.495661 F2 11 12.22935 4.507076 0.448093 11 18.71468 5.343973 0.31219 F3 5.745529 4.379635 1.261167 10.05977 3.924979 0.52024 F4 4.740436 2.236994 0.381171 7.758488 1.57143 0.343479 B1 24.25225 11.9637 0.632795 38.92492 10.22129 0.515977 B2 20.82899 8.311444 0.768976 10 29.49426 7.099606 0.489896 B3 20.96318 7.941463 1.489333 34.12957 7.858865 0.433947 B4 22.91254 8.183885 1.026364 33.36305 8.639032 0.651584 F1 14.24943 9.839962 0.598067 25.28443 9.22484 0.37918 F2 8.383783 5.580692 0.994204 10 14.07514 4.291429 0.249545 F3 6.33294 3.57463 0.445196 10.63946 2.303573 0.343005 F4 5.746154 2.966337 0.246018 9.222689 2.444305 0.158388 B1 24.28203 9.314578 0.671425 35.64692 11.47013 0.523937 B2 21.82469 8.967023 0.605925 31.86199 8.43947 1.344987 B3 22.41424 8.608496 0.631612 35.58483 7.665796 0.531431 B4 22.69415 8.290922 0.622122 32.96255 8.170077 0.460862 F1 10 10.95518 6.699833 1.106891 19.26727 6.087544 0.534518 F2 11 10.4517 5.866151 1.889205 15.47774 3.952188 0.450593 F3 8.192978 5.709016 0.76444 12 13.64954 4.304203 0.298131 F4 4.917275 2.409462 0.965974 8.529998 1.707078 0.523737 B1 24.81233 11.74264 0.52001 38.66183 11.81209 0.572112 B2 18.5462 6.295249 1.040493 29.63066 6.012157 0.37199 B3 23.52966 9.355089 0.640307 35.72782 9.28863 0.698436 B4 23.32775 7.670029 3.064716 32.22272 8.134816 0.55929 F1 12.59577 8.000936 1.346156 22.34316 8.680183 0.992822 F2 9.429468 9.532978 1.558331 12 17.48414 7.605441 0.610605 F3 4.166385 2.290469 0.605729 7.190362 2.045584 0.165706 F4 5.262059 2.597185 0.271304 9.119042 2.240733 0.201341 B1 25.30832 12.26086 0.734507 37.22789 11.82525 0.561216 B2 20.64199 7.381701 0.891321 31.29169 8.68441 1.307863 B3 11 22.79251 6.840749 0.617831 34.34606 7.620284 0.486106 B4 23.15439 8.772836 0.955556 35.57658 9.592451 0.528375 F1 10 16.56456 7.67721 0.837648 10 24.92577 6.566407 0.310937 F2 9.673379 4.036753 0.274362 12 14.4936 4.791919 0.350952 Tôi Đã Luôn Sợ Hết 140 F3 7.447274 5.751145 0.88572 11 12.77721 5.360458 0.419058 F4 5.353637 2.56349 0.633086 8.023261 2.258647 0.185091 B1 24.33941 9.100321 1.126987 35.80866 8.941851 0.54095 B2 29.07647 10.4687 0.47694 39.54248 8.831846 0.73895 B3 26.1074 9.721381 0.607037 38.51642 9.754849 0.617697 B4 24.18278 8.249222 0.680108 34.87184 9.573247 0.633281 F1 10 9.934958 6.348097 0.575591 12 15.06694 4.943586 0.290179 F2 10 7.362364 3.80268 0.321373 11.47873 3.238729 0.233547 F3 5.223848 4.040072 1.61331 10 9.51022 3.441391 0.505321 F4 4.709216 2.458989 0.465922 7.550611 1.613776 0.539389 B1 31.19203 13.32742 0.466555 48.18865 11.49138 0.641699 B2 30.21138 11.9972 0.857124 42.68909 9.815465 0.858236 B3 24.20613 8.129355 1.318871 42.86467 9.304616 0.620377 B4 21.12992 7.535034 1.599522 11 30.60306 6.430094 0.326381 Tiền Phụ lục Trung bình độ xác nhận dạng người nói phụ thuộc từ khóa tiếng Việt (theo số trạng thái mơ hình HMM (ST) số đặc trưng MFCC) ST4 ST5 ST6 ST7 ST8 13 15 17 19 47.2 52.4 54.4 55.5 56.2 50 54.8 57.2 57.3 58.8 52.9 56.7 59.3 59.8 60.4 55.6 58.4 60.3 61.6 61.2 Số hệ số MFCC 21 23 25 56.9 60.1 60.6 61.2 61.3 57 59.7 60.7 61.6 61.3 57.3 60.7 61.4 61.8 61.5 27 29 31 33 57.7 61.8 62.1 61.5 60.5 58.4 61.5 61.4 61.1 60.3 58.4 61.4 61.4 59.9 59 58.1 60.9 61.1 61.1 58.4 Phụ lục Kết khảo sát so sánh khả phân biệt người nói âm tiết với số trạng thái HMM (Biểu diễn hình 4.3) Âm tiết Một Hai Ba Bốn Năm 13 15 17 19 Số hệ số MFCC 21 23 25 37 72 68 42 70 41 70 66 46 73 43 70 72 49 76 44 71 70 52 82 42 73 69 52 81 141 43 74 68 54 82 45 73 72 53 82 27 29 31 33 46 70 74 50 81 44 67 75 55 81 45 64 73 54 79 47 71 71 49 72 Sáu Bảy Tám Chín Khơng Có Tơi Đã Ln Sợ Hết Tiền T Bình 56 34 67 59 48 63 55 62 64 46 36 64 55.47 54 42 67 64 49 61 54 67 66 46 41 67 57.3 53 45 71 68 53 62 56 69 66 49 43 71 59.76 58 46 74 73 51 63 57 71 67 50 45 73 61.6 57 49 73 75 51 58 52 72 69 51 44 72 61.2 59 59 48 48 73 75 74 75 53 57 59 58 55 53 72 71 68 69 50 50 44 42 71 69 61.59 61.82 60 49 73 77 55 58 51 70 68 50 42 71 61.5 60 47 74 76 54 58 48 67 69 51 41 71 61.1 62 55 45 48 74 75 73 70 50 60 55 67 45 55 67 67 67 66 52 53 42 39 72 74 59.94 61.118 Phụ lục Kết khảo sát độ xác nhận dạng người nói phụ thuộc độ dài từ khóa theo mơ hình đơn vị âm tiết âm vị (Biểu diễn hình 4.3) Độ dài từ khóa Âm vị 63 80 87 92 96 96 96 96 96 Âm tiết 64 75 83 87 91 90 91 91 91 Phụ lục Kết khảo sát đánh giá so sánh số phương pháp chuẩn hóa mục 4.3.5 Phụ lục 9A Các sai số hệ nhận dạng người nói điều kiện đối sánh Ngƣỡng Sai số chấp nhận (%) Sai số từ chối (%) -2.0 -1.9 -1.8 -1.7 -1.6 -1.5 -1.4 -1.3 -1.2 52.4 47.8 43.2 38.5 33.7 29 24.2 20 15.8 1 2 2 3 Sai số Ngƣỡng chấp nhận (%) -1 -0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 142 9.5 7.1 5.2 3.5 2.1 1.1 0.6 0.3 0.1 Sai số từ chối (%) 11 15 18 24 33 42 54 -1.1 12.5 Phụ lục 9B Các sai số hệ nhận dạng người nói khác điều kiện đối sánh khơng chuẩn hóa Sai số Ngƣỡng chấp nhận (%) -26 -25 -24 -23 -22 -21 -20 81.1 78.3 74.4 68.1 63.2 56.6 49.5 Sai số từ chối (%) Sai số Ngƣỡng chấp nhận (%) 12 14 17 24 28 33 35 -19 -18 -17 -16 -15 -14 Sai số từ chối (%) 41.1 34.2 27.7 21.2 15.1 11.3 42 48 58 67 74 84 Phụ lục 9C Các sai số hệ nhận dạng người nói khác điều kiện đối sánh chuẩn hóa phương pháp HNORM Chuẩn hóa điểm số đối sánh theo công thức: Với: Score(X,S): điểm số đối sánh (LLR) tiếng nói cần định danh (X) với mơ hình ngƣời nói (S) ; ScoreNorm(X,S): điểm số đối sánh đƣợc chuẩn hóa Score(X,S); μ σ : lần lƣợt trị trung bình độ lệch chuẩn điểm số đối sánh tập ngƣời nói giả mạo Sai số Ngƣỡng chấp nhận (%) Sai số từ chối (%) Sai số Ngƣỡng chấp nhận (%) Sai số từ chối (%) -0.4 67.5 23.3 36 -0.2 0.2 0.4 0.6 0.8 52.9 48.7 41.7 35.1 30.6 25.3 12 14 17 21 25 32 1.2 1.4 1.6 1.8 20.6 18.3 16.7 14.2 13.2 42 47 51 58 66 Phụ lục 9D Các sai số hệ nhận dạng người nói khác điều kiện đối sánh chuẩn hóa phương pháp CMS RASTA 143 Ký hiệu số frame có mẫu tiếng nói T ; Ký hiệu hệ số ceptre x ; Ký hiệu hệ số ceptre sau chuẩn hóa y Phƣơng pháp CMS biểu diễn phƣơng trình sai phân tuyến tính: Phƣơng pháp RASTA biểu diễn phƣơng trình sai phân tuyến tính: Ngƣỡng -3.3 -3.2 -3.1 -3 -2.9 -2.8 -2.7 -2.6 -2.5 Sai số chấp Sai số từ Sai số chấp Sai số từ Ngƣỡng nhận (%) chối (%) nhận (%) chối (%) 48.1 44.2 40.3 36.5 32.5 28.6 24.7 21.1 17.6 2 5 10 -2.4 -2.3 -2.2 -2.1 -2 -1.9 -1.8 -1.7 -1.6 14.3 11.3 8.6 6.3 4.7 3.2 2.2 1.4 0.9 12 16 20 23 26 30 39 44 47 Phụ lục 9E Các sai số hệ nhận dạng người nói khác điều kiện đối sánh chuẩn hóa đồng thời phương pháp CMS, RASTA, HNORM Ngƣỡng 0.6 0.7 0.8 0.9 1.1 1.2 Sai số chấp Sai số từ nhận (%) chối (%) 37.4 31.5 27.1 23.2 20.1 16.1 13.1 Ngƣỡng 4 11 1.3 1.4 1.5 1.6 1.7 1.8 Sai số chấp Sai số từ nhận (%) chối (%) 10.3 7.6 6.1 4.3 3.4 2.2 14 18 21 24 28 35 Phụ lục 9F Các sai số hệ nhận dạng người nói khác điều kiện đối sánh chuẩn hóa đồng thời phương pháp MS, RASTA 144 Ngƣỡng -3.2 -3.1 -3.0 -2.9 -2.8 -2.7 -2.6 -2.5 -2.4 -2.3 Sai số chấp Sai số từ Sai số chấp Sai số từ Ngƣỡng nhận (%) chối (%) nhận (%) chối (%) 57.5 53.3 49.3 44.9 40.2 35.6 30.9 26.6 22.2 18.0 -2.2 -2.1 -2.0 -1.9 -1.8 -1.7 -1.6 -1.5 -1.4 -1.3 145 14.1 10.9 11 7.8 14 5.1 19 3.6 24 2.4 28 1.5 32 0.6 42 49 0.4 61 ... hình nghiên cứu nhận dạng người nói 22 1.6.1 Nghiên cứu nhận dạng người nói phương pháp thủ công 22 1.6.2 Nghiên cứu nhận dạng người nói phương pháp tự động 23 1.7 Giám định pháp lý nhận dạng người. .. định tự động nhận dạng người nói tiếng Việt 74 4.2 Mơ hình âm tiêt mơ hình âm vị nhận dạng người nói 75 4.2.1 Hệ nhận dạng người nói dựa mơ hình âm tiết 75 4.2.2 Hệ nhận dạng người nói dựa mơ hình... biệt người nói âm tiết tiếng Việt 62 3.5 Kiểm nghiệm khả nhận dạng người nói âm tiết tiếng Việt 64 3.5.1 Hệ nhận dạng người nói phụ thuộc từ khóa sở 65 3.5.2 Khảo sát độ xác nhận dạng hệ nhận dạng