1. Trang chủ
  2. » Luận Văn - Báo Cáo

Cảm biến âm thanh thông minh độc lập644

163 12 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 163
Dung lượng 2,33 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - Nguyễn Công Phương CẢM BIẾN ÂM THANH THÔNG MINH ĐỘC LẬP LUẬN ÁN TIẾN SĨ KỸ THUẬT Hà Nội – 2008 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - Nguyễn Công Phương CẢM BIẾN ÂM THANH THÔNG MINH ĐỘC LẬP Chuyên ngành: Mã số: Đo lường 62.52.62.01 LUẬN ÁN TIẾN SĨ KỸ THUẬT NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS PHẠM THỊ NGỌC YẾN TS ERIC CASTELLI NGƯỜI PHẢN BIỆN TSKH NGUYỄN ANH TUẤN PGS TS ĐỖ HUY GIÁC PGS TS NGUYỄN HOÀNG PHƯƠNG Hà Nội – 2008 i LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu riêng tơi Các số liệu kết nghiên cứu trung thực chưa cơng bố cơng trình khác Nguyễn Công Phương ii LỜI CẢM ƠN Tôi xin cảm ơn Phó giáo sư Tiến sĩ Phạm Thị Ngọc Yến Tiến sĩ Castelli Eric đồng ý hướng dẫn làm luận án Tôi xin bày tỏ lòng biết ơn sâu sắc tới hai giáo viên hướng dẫn luận án tơi hướng dẫn có tính định hướng chi tiết, lời động viên, giúp đỡ nhiệt tình họ q trình tơi thực luận án, góp ý sửa chữa q trình tơi viết luận án Tơi muốn nói lời cám ơn với thầy cô đồng nghiệp Bộ môn Kỹ thuật đo Tin học công nghiệp, khoa Điện trường Đại học Bách khoa Hà Nội, người tạo điều kiện thuận lợi góp ý quý báu thời gian làm luận án Tôi mong muốn nói lịng biết ơn tơi Trung tâm Nghiên cứu Quốc tế MICA nói chung GS TS Nguyễn Trọng Giảng, giám đốc Trung tâm, nói riêng Mối quan hệ thân ấm áp Trung tâm, giúp đỡ mặt phương tiện thiết bị buổi thảo luận (trong phịng hội thảo ngồi hành lang) nâng đỡ tơi nhiều thực luận án Tôi xin gửi lời cám ơn tơi đến Nhóm GEOD, thuộc Phịng thí nghiệm CLIPS/IMAG, Grenoble, Pháp, đặc biệt l TS JeanFranỗois Sộrignat, TS Laurent Besacier, TS Michel Vacher, TS Dan Istrate, nhiệt tình giúp đỡ hướng dẫn Tôi xin dành lời cám ơn chân thành cho cán Trung tâm Sau đại học Trường Đại học Bách khoa Hà Nội giúp đỡ họ thời gian làm luận án iii Cám ơn gia đình tơi, đặc biệt em trai tơi, giúp đỡ động viên tơi hồn thành luận án iv MỤC LỤC Danh mục chữ viết tắt vi Danh mục thuật ngữ Anh – Việt ix Danh mục bảng x Danh mục hình vẽ, đồ thị xii MỞ ĐẦU xiv CHƯƠNG – TỔNG QUAN 1.1 Giới thiệu 1.2 Dự án RESIDE-HIS 12 1.3 Vị trí luận án lĩnh vực phịng thơng minh y học từ xa 14 1.4 Mục tiêu nghiên cứu nhiệm vụ nghiên cứu luận án .15 CHƯƠNG – PHÂN LOẠI TIẾNG NÓI/TIẾNG ĐỘNG 18 2.1 Phân loại 19 2.2 Phân loại tiếng nói/tiếng động 20 2.3 Cơ sở liệu 24 2.4 Phương pháp xây dựng .25 2.5 Bộ đặc trưng phân biệt .26 2.6 Mơ hình phân loại 45 2.7 Giảm số lượng đặc trưng phân loại 62 2.8 Bộ phân loại tiếng nói/tiếng động 63 2.9 Kết luận 66 CHƯƠNG – PHÂN LOẠI TIẾNG NÓI/TIẾNG KÊU-RÊN 68 3.1 Cơ sở liệu 69 3.2 Sự cần thiết phân loại tiếng nói/tiếng kêu-rên 70 v 3.3 Phân loại tiếng nói/tiếng kêu-rên .71 3.4 Bộ đặc trưng phân biệt .71 3.5 Mơ hình phân loại 78 3.6 Giảm bớt đặc trưng phân biệt 82 3.7 Bộ phân loại tiếng nói/tiếng kêu-rên 83 3.8 Kết luận 85 CHƯƠNG – ONTOLOGY PHÂN TÍCH ÂM THANH 87 4.1 Định nghĩa ontology 88 4.2 Kỹ thuật ontology .90 4.3 Ontology đối tượng 94 4.4 Ontology chuyên ngành .98 4.5 Cơ sở liệu 108 4.6 Bộ phân loại dùng ontology .109 4.7 Kết luận 114 KẾT LUẬN VÀ KIẾN NGHỊ .116 DANH MỤC CƠNG TRÌNH CỦA TÁC GIẢ 118 TÀI LIỆU THAM KHẢO 120 PHỤ LỤC 134 PL.1 Thông số cấu trúc mơ hình 134 PL.2 Thử nghiệm hệ thống 142 vi Danh mục chữ viết tắt Tiếng Anh/Pháp Tiếng Việt ANN Artificial Neuron Network Mạng nơron nhân tạo BER Band Energy Ratio Tỉ số lượng dải CHIL Computers in the Human Máy tính vòng tương tác Interaction Loop với người DT Decision Tree Cây định DCT Discrete Cosine Transform Biến đổi cos rời rạc DVD Digital Versatile Disk đtg đồng tác giả ECG/EKG Electrocardiogram Điện tim đồ EEG Electroencephalogram Điện não đồ EMG Electromyogram Điện đồ FA False Alarm Báo động sai FAME Facilitating Agent for Cơ quan trợ giúp trao đổi đa Multicultural Exchange văn hoá FDR Fisher Discriminant Ratio Tỉ số phân biệt Fisher FFT Fast Fourier Transform Biến đổi Fourier nhanh FXPAL Fuji – Xerox Palo Alto Phịng thí nghiệm Palo Alto Laboratory Fuji – Xerox GMM Gaussian Mixture Model Mơ hình hỗn hợp Gauss GO Gene Ontology Ontology gien GPRS General Radio Packet Service Dịch vụ gói rađiơ tổng vii GPS Global Positioning System Hệ thống định vị tồn cầu HMM Hidden Markov Model Mơ hình Markov ẩn HZCRR High ZCR Ratio Tỉ số ZCR cao ICA Independent Component Phân tích thành phần độc lập Analysis ICSI IDIAP International Computer Viện khoa học máy tính quốc Science Institute tế Institut Dalle Molle pour Viện Dalle Molle trí tuệ l’Intelligence Artificielle nhân tạo cảm thụ Perceptive IFFT Inverse FFT FFT ngược kNN k-Nearest Neighbors k-hàng xóm gần KWS Keyword spotting Dị từ khố LDA Linear Discriminant Analysis Phân tích phân biệt tuyến tính LSP/LSF Linear Spectral Pairs/Line Cặp phổ tuyến tính/Tần phổ Spectral Frequencies đường MD Missed Detection Dò nhầm MICA Multimedia, Information and Thông tin Đa phương tiện, Communication Applications Truyền thông Ứng dụng Mel Frequency Cepstral Hệ số cepster tần số Mel MFCC Coefficients MPEG Motion Picture Experts Group Nhóm chuyên gia ảnh động PAL Phase Alternating Line Đường đổi pha NIST National Institut for Standards Viện tiêu chuẩn công nghệ and Technology quốc gia PC Personel Computer Máy tính cá nhân PCA Principal Component Analysis Phân tích thành phần viii PCG Phonocardiogram Âm tim đồ PDA Personal Digital Assistant Máy trợ giúp số cá nhân PLP Perceptual Linear Prediction Dự đốn tuyến tính cảm thụ RESIDE- REconnaissance de Situations Nhận biết tình khẩn -HIS de DEtresse en Habitat cấp nhà thông minh Intelligent Santé ROC Receiver Operating Characteristics SNR Signal to Noise Ratio Tỉ số tín hiệu/nhiễu SVM Support Vector Machine Máy véctơ trợ giúp WLAN Wireless Local Area Network Mạng không dây địa phương WWBAN Wearable Wireless Mạng không dây địa phương Body/Personal Area Network gắn theo người Zero-crossing rate Tần số cắt không ZCR 131 "Progress in Meeting Recognition: The ICSI-SRI-UW Spring 2004 Evaluation System", NIST RT04 Workshop 102 Swets, J A (1988), “Measuring the accuracy of diagnostic systems”, Science, vol 240, pp 1285 – 1293 103 Taghva, K., Borsack, J., Coombs, J., Condit, A., Lumos S., Nartker T (2003), “Ontology-based Conference on classification Information of email”, Technology: International Computers and Communications, pp 194 – 198 104 Tax, D M J., Exploratory Data Analysis, Exercises for Computer Service Praktikum AP3501 (old TN3571-P), www.ph.tn.tudelft.nl/~csp/da/DA.pdf (truy cập 12/2007) 105 Thenkabail, P S (2002), "Optimal Hyperspectral Narrowbands for Discriminating Agricultural Crops", Remote Sensing Reviews Vol 20(4) pp 257 – 291 106 Vapnik, V N (1998), Statistical Learning Theory, Wiley, N.Y., 1998 107 Varshney, U., Sneha, S (2006), “Patient Monitoring Using Ad Hoc Wireless Networks: Reliability and Power Management”, IEEE Communications Magazine, pp 49 – 55 108 Venkatesh, S., Nettesheim, T (2006), Great Lakes Binational Toxics Strategy – 2006 Progress Report, pp 69 – 72 109 Viện Ngôn ngữ học, Trung tâm Khoa học Xã hội Nhân văn (1998), Từ điển Anh – Việt, NXB Tp Hồ Chí Minh 110 Wallace, M., Avrithis, Y., Stamou, G., Kollias, S (2005), “KnowledgeBased Multimedia Content Indexing and Retrieval”, Multimedia Content and the Semantic Web – Methods, Standards and Tools, Wiley, pp 299 – 338 132 111 Walters, W H (1999), "Climate Indices for Use in Social and Behavioral Research", IASSIST Quaterly, 1999 Spring, Vol 23(1), pp 14 – 22 112 Wang, L., Fu, X (2005), Data Mining with Computational Intelligence, Springer 2005, pp 75 113 Wang, X C (2002), "Feature Extraction and Dimensionality Reduction in Pattern Recognition and Their Application in Speech Recognition" Ph D Dissertation, Griffith University, Australia 114 Wegmann, S., Zhan, P., Gillick, L (1999), "Progress in Broadcast News Transcription at Dragon Systems” Proc ICASSP’99, volume I, pp 33 – 36, Phoenix, AZ, USA 115 Whitten, P S (2001), "The state of telecommunication technologies to enhance older adults’ access to health services", Human factors interventions for the health care of older adults, Mahwah, NJ: Lawrence Erlbaum, pp 121 – 146 116 Widrow, B., Stearns, S D (1985), Adaptive signal processing, PrenticeHall, Inc., Upper Saddle River, NJ 117 Williams, G., Ellis, D (1999), “Speech/music discrimination based on posterior probability features”, Proc European Conf on Speech Commun and Technology, Budapest, Hungary), pp 687 – 690 118 Witten, I., Frank, E (2005), Data Mining: Practical Machine Learning Tools and Techniques, Morgan Kauffman USA, pp 150 119 Wittson, C.L., Affleck, D.C., & Johnson, V (1961) "Two-way Television Group Therapy", Mental Hospital, 12, pp – 23 120 Woodland, P C., Hain, T., Johnson, S E., Niesler, T R., Tuerk, A., S.J Young, S J (1998), “Experiments in broadcast news transcription”, ICASSP 1998, pp 902 – 912 133 121 WordNet http://wordnet.princeton.edu/ (truy cập 12/2007) 122 Wu, S H, Tsai, T H., Hsu, W L (2003), “Text Categorization Using Automatically Acquired Domain Ontology”, Proceedings of the Sixth International Workshop on Information Retrieval with Asian Languages (IRAL-03), Sapporo, Japan, pp 138 – 145 123 Zhang, T., Kuo, J (1998), “Hierarchical system for content-based audio classification and retrieval”, Proc ICASSP, pp 398 – 409 PHỤ LỤC PL.1 Thông số cấu trúc mơ hình Cấu trúc ANN (đã nói mục 2.8.1) minh hoạ hình PL.1 Các thông số ANN liệt kê bảng PL.1, 2, Cấu trúc DT (đã nói mục 3.7.1) minh hoạ hình PL.2 Hình PL.1 – Cấu trúc ANN 135 N1 N2 N3 N4 I1 1.9138 0.2854 -1.5835 1.9261 I2 -0.8119 0.4448 0.4989 I3 2.2411 -0.3136 I4 1.3308 I5 N5 N6 N7 1.7634 0.9513 1.2975 0.7079 0.0714 0.4322 0.8058 -0.4175 1.5121 -0.2612 -0.4288 -2.6517 0.6622 0.6120 -1.4277 0.1580 1.2969 0.4259 -1.3867 0.4418 -0.0806 0.2885 0.1943 -0.0479 -0.7194 I6 1.3030 0.5301 -0.3535 -1.1550 -0.6751 1.8262 -1.4673 I7 -0.1814 -0.1996 1.5405 1.7260 1.3152 -0.2813 1.4640 I8 -0.1829 0.6649 0.9213 -0.2684 0.4271 1.0753 1.1543 I9 -0.5609 0.5580 -0.0476 -1.4539 0.2320 -0.0278 -0.9109 I10 1.5305 1.0468 0.8093 -1.1095 0.2094 0.9710 0.0245 I11 -1.2658 -0.8512 -1.3119 0.3393 -3.9489 0.0608 -0.5621 I12 1.2340 0.6245 0.0580 0.0417 0.0205 -2.2464 -1.5487 I13 -0.0057 0.0005 -0.0615 0.2609 0.8901 -2.3039 0.3037 I14 0.3627 -0.5658 -0.4158 -0.6976 -2.0875 2.1404 -0.4257 Bảng PL.1 – Thông số ANN, w1 I: đầu vào; N: nơron 136 N8 N9 N10 N11 N12 N13 N14 I1 -2.1000 0.3854 -0.0929 1.8976 1.2713 0.9380 -0.0900 I2 1.0644 -1.3023 -0.1412 1.5275 -0.1506 -0.1128 1.6015 I3 -0.5243 -4.4927 2.2068 1.1722 -0.1688 -0.2467 -0.6546 I4 -1.5790 5.9798 0.7986 0.4574 -0.5702 0.3299 -0.8870 I5 1.4230 -3.6687 1.7080 0.2723 0.5234 0.6459 -0.9534 I6 1.7398 1.8079 0.6939 -0.3172 -4.2537 0.8847 -1.0112 I7 1.6199 1.7314 -0.6374 -0.0663 3.0236 0.8278 -0.2012 I8 0.1064 3.8275 -0.0749 -0.1929 4.8653 1.7469 0.1837 I9 0.8205 1.8280 -0.2786 -0.9238 -0.4787 -0.1889 0.8217 I10 0.3600 6.0724 -2.6655 1.2935 -1.0430 1.8656 -0.0132 I11 -0.2864 -1.3950 -0.7207 -0.8484 -0.0211 -1.9611 1.0409 I12 -3.9454 0.3340 -1.9593 0.9873 1.5744 0.7508 1.1697 I13 1.5356 -1.2873 0.7899 -0.2725 -0.1631 0.1407 -1.0338 I14 0.0474 2.9592 0.1730 -0.0499 -1.1602 -0.0981 0.0863 Bảng PL.1 – Thông số ANN, w1 (tiếp) 137 N15 N16 N17 N18 N19 N20 N21 I1 1.0133 -0.9699 4.7608 1.1539 0.5718 -2.0632 0.7030 I2 -0.1960 0.7346 -4.0054 -2.0148 -4.4274 1.9328 -0.7586 I3 2.1962 -2.5271 -0.1558 0.2932 -3.4185 0.6228 -0.0969 I4 -2.3511 0.4447 -0.7269 -1.9481 -0.1085 0.7749 -0.9207 I5 3.2375 0.9296 1.1199 0.9779 2.5229 -0.8509 0.4116 I6 -2.2011 -0.3721 -1.3778 -0.8313 -1.7046 -0.5152 0.0747 I7 -0.2394 1.1293 2.8111 1.6839 -0.4889 -0.3057 0.0059 I8 -0.9199 1.2556 4.8682 -0.4573 0.6745 0.5619 -0.4054 I9 -1.0932 0.7944 -0.7460 -1.7073 0.5589 -0.2157 0.0042 I10 -1.1487 -1.4485 -0.5812 0.3544 -0.8342 0.8228 -0.3404 I11 0.2195 0.1572 0.0028 -0.1822 -0.3402 3.9539 -0.8022 I12 -1.6206 -0.7270 2.1405 -0.6685 1.9718 -0.7099 1.4339 I13 0.7711 0.4297 -0.2573 -0.1416 -0.0127 0.0766 0.0073 I14 -0.3109 -0.2066 -1.8846 0.9032 0.0456 2.4085 -1.1799 Bảng PL.1 – Thông số ANN, w1 (tiếp) 138 N29 N30 N31 N32 N33 N34 N35 I1 -0.0844 -0.5707 1.7624 -1.0869 0.0970 0.0199 0.6840 I2 0.6055 -0.2088 1.4155 2.0762 0.2150 -1.4939 -0.1085 I3 -0.0104 2.5639 0.4593 0.3876 0.0809 1.1021 -3.6032 I4 0.2178 -1.4085 -0.9186 -0.0886 0.0274 0.7354 0.6469 I5 -1.2599 1.4611 -0.6715 -0.7352 0.5583 -0.5457 0.8018 I6 -0.8542 -0.3030 -0.5657 0.7230 -0.8317 1.6046 0.2016 I7 1.7879 1.3647 0.9133 -1.8118 -0.0319 -0.5990 0.2400 I8 1.0147 -0.0630 -0.2554 -0.6694 -0.4474 -1.3419 0.3838 I9 -0.4889 -1.2603 0.3748 1.0163 0.6233 -0.6205 0.6993 I10 -0.0634 0.6959 0.9947 0.2733 -1.3743 -0.0410 -0.9734 I11 -1.8040 1.2771 0.4155 0.3621 -1.0807 -1.9083 1.0920 I12 -1.0165 1.2171 -0.8243 -0.4759 -1.0415 -2.2994 -0.5051 I13 0.7511 -0.8536 -0.1021 0.2673 0.1584 1.3192 -0.4126 I14 -1.5862 0.4945 0.7932 -0.1415 -0.5013 0.0766 0.2256 Bảng PL.1 – Thông số ANN, w1 (tiếp) 139 N22 N23 N24 N25 N26 N27 N28 I1 -2.7654 -2.0573 -1.8876 -1.1699 1.3757 -2.8553 1.6677 I2 2.7502 0.3535 0.0258 0.3165 -3.5378 4.4415 0.7291 I3 3.2113 2.2325 1.0179 -0.5893 0.0425 0.1390 -0.6979 I4 -1.1944 -0.8463 1.6601 1.0843 -3.1904 2.8194 0.6660 I5 1.0721 1.9063 4.7608 1.2843 -0.1863 -0.0409 -0.6160 I6 0.0287 -0.7650 -0.3535 1.1451 0.7828 1.7796 0.0925 I7 -5.6029 -0.5134 -0.9153 -1.0562 -1.1637 2.2010 -1.9260 I8 -1.0925 -2.0964 -1.7430 -0.0981 -2.5231 0.2973 0.3780 I9 0.9614 -1.0261 2.3764 0.7971 1.6019 -0.4854 2.0628 I10 -3.7067 -3.8990 0.8964 1.9792 -0.1723 -2.0984 0.2448 I11 0.1580 0.1185 5.9593 2.1585 -0.4694 -2.2428 0.3335 I12 -0.3258 -0.2007 -0.1430 0.6573 2.7361 -1.9874 0.6101 I13 0.5597 1.5240 -1.5520 -0.3765 -2.1610 0.8627 -0.3093 I14 -2.9696 -0.7128 3.6675 3.1251 -0.0050 -0.8690 -0.0890 Bảng PL.1 – Thông số ANN, w1 (tiếp) 0,9177 Bảng PL.4 – Thông số ANN, b2 140 -0,2319 -0,0978 0,2811 -0,2818 -2,0430 5,1319 0,2850 10 11 12 13 14 -2,9805 2,5026 -2,2296 -0,9568 -1,4529 -1,6179 -0,9404 15 16 17 18 19 20 21 -1,5987 2,4503 -1,0898 -0,1421 3,3837 1,0367 1,3764 22 23 24 25 26 27 28 -2,5477 2,5057 -0,8402 -2,9958 1,9038 -5,7386 0,3620 29 30 31 32 33 34 35 -4,1295 1,1948 0,2716 1,4949 4,7564 -2,6212 -0,5924 Bảng PL.2 – Thông số ANN, b1 -0,0369 0,0168 0,0029 -0,0077 -0,0819 0,1745 0,0180 10 11 12 13 14 0,0651 0,0338 -0,0832 0,0223 0,0901 0,0174 -0,1167 15 16 17 18 19 20 21 -0,0336 0,0015 0,0714 -0,1237 -0,0195 -0,1667 0,3002 22 23 24 25 26 27 28 0,0546 0,1318 -0,0207 -0,1045 -0,0467 0,0874 0,0659 29 30 31 32 33 34 35 -0,2397 0,0078 0,1651 -0,0832 0,0830 0,0583 0,0094 Bảng PL.3 – Thông số ANN, w2 Hình PL.2 – Cấu trúc DT 141 142 PL.2 Thử nghiệm hệ thống Các chương trước đề xuất phân loại âm Việc kiểm nghiệm hoạt động chúng thực cách riêng rẽ, mơ máy tính ngơn ngữ lập trình Matlab Phần phụ lục trình bày việc kiểm nghiệm kết hợp phân loại thành hệ thống khả hoạt động hệ thống thiết bị thực Để phục vụ trình kiểm nghiệm này, nhiệm vụ sau đề thực hiện: kết hợp thuật toán thu thập âm với thuật toán phân loại tiếng động chạy thử nghiệm; xây dựng thuật tốn đề xuất luận án ngơn ngữ lập trình LabWindows/CVI [74] cài đặt hệ thống lên thiết bị; chạy thử nghiệm thiết bị PL.2.1 Kết hợp thuật toán thu thập số liệu với thuật toán phân l oại tiếng động Hệ thống phân tích âm diễn giải phần đầu chương minh hoạ hình 2.1 Trong hệ thống này, Istrate [48] cài đặt thuật toán thu thập âm lên thiết bị thực mô thuật tốn phân loại tiếng động máy tính Tuy nhiên hai thuật toán cài đặt cách riêng rẽ chưa kết hợp với Vì phần đặt nhiệm vụ thử nghiệm việc gộp hai thuật toán thuật toán phân loại (trình bày chương chương 3) vào hệ thống phân tích âm (hình 2.1) cài đặt hệ thống lên cảm biến Để kết hợp hai thuật tốn Istrate, có ba giải pháp xem xét Cách thứ viết thuật toán thu thập liệu dạng chương trình nhúng vào thuật toán phân loại âm Cách thứ hai viết thuật toán phân loại âm dạng chương trình nhúng vào thuật tốn thu thập số 143 liệu Cách thứ ba viết hai thuật tốn dạng hai chương trình con, sau nhúng vào chương trình Chương trình thu thập số liệu chương trình địi hỏi phải chạy thời gian thực Nếu viết dạng chương trình thời gian vào liệu chương trình Ngồi chạy, nghĩa thu thập số liệu chương trình khác phải tạm dừng Điều đồng nghĩa với việc thêm thời gian tính tốn Vì cách thứ cách thứ ba bị loại bỏ, cách thứ hai chọn Cách có hai ưu điểm Thứ đợi thu thập số liệu chương trình tiến hành xử lý số liệu thu từ vịng thu trước, tiết kiệm thời gian Thứ hai, thuật toán phân loại viết dạng chương trình nhúng vào chương trình thu thập số liệu PL.2.2 Xây dựng thuật tốn mơi trường LabWindows/CVI Như đề cập đến chương 1, cảm biến âm mà chúng tơi tham gia xây dựng gồm có micrơ (chuyển đổi tín hiệu), vỉ thu thập số liệu (thu thập tín hiệu) máy tính PC (xử lý tín hiệu) Vỉ thu thập số liệu đa kênh PCI 6035E [73] hãng National Instruments sử dụng để lấy tín hiệu từ micrơ Nó có chức chuyển đổi tín hiệu tương tự thành tí n hiệu số Hoạt động vỉ cần lập trình ngơn ngữ lập trình LabWindows/CVI Ngơn ngữ National Instruments phát triển cho vỉ thu thập liệu hãng Nó ngơn ngữ C viết riêng cho việc thu thập số liệu Vì thuật tốn phân loại (đã đề xuất luận án) viết lại LabWindows/CVI Như trình bày mục PL.2.1, thuật tốn dạng chương trình nhúng vào chương trình thu thập số liệu Trong trình lập trình, hai thư viện hàm C cho phân loại tiếng nói/tiếng động cho phân loại tiếng nói/tiếng kêu-rên xây 144 dựng từ hàm Matlab Chúng dùng nghiên cứu thử nghiệm khác xử lý âm PL.2.3 Thử nghiệm hệ thống phân tích âm Vỉ thu thập số liệu Cáp âm Máy tính Máy tính Hình PL.3 – Hệ thống thử nghiệm Sau kết hợp cài đặt thành công thuật tốn, chúng tơi thiết lập hệ thống thử nghiệm Sơ đồ khối hệ thống thiết bị phần thử nghiệm minh hoạ hình PL.3 Nó gồm có hai máy tính Máy tính thứ có nhiệm vụ phát âm cần phân loại Máy tính thứ hai, có cài đặt vỉ thu thập số liệu, kiểm nghiệm khả cài đặt thuật tốn lên thiết bị Hai máy tính nối với cáp âm thanh, thông qua đầu âm máy đầu vào vỉ thu thập số liệu máy Ở cáp âm đóng vai trị micrơ Máy tính dùng vi xử lý Pentium IV 2,4 GHz, 512 M RAM, hệ điều hành Windows XP2 Có thể thấy hệ thống không bị ảnh hưởng nhiễu môi trường Quá trình thử nghiệm sử dụng sở liệu tiếng động, tiếng nói tiếng kêu-rên trình bày sử dụng chương trước Cụ thể tín hiệu dùng cho thử nghiệm gồm có 4740 tín hiệu tiếng động, 2375 tín hiệu tiếng nói, 485 tín hiệu tiếng kêu-rên Các kết trình bày bảng PL.5 dạng số lượng tín hiệu tỉ lệ phần trăm 145 Đầu Đầu vào Tiếng động Tiếng nói Tiếng kêu-rên 4475 (94,41%) 176 (3,71%) 89 (1,88 %) Tiếng nói (2375) 87 (3,66 %) 2206 (92,88 %) 82 (3,45 %) Tiếng kêu-rên (485) 12 (2,47 %) 25 (5,15 %) 448 (92,37 %) Tiếng động (4740) Bảng PL.5 – Khả phân loại hệ thống thử nghiệm Căn vào kết thu được, kết luận việc hợp thuật toán vào hệ thống việc cài đặt hệ thống lên thiết bị thực thành công ... bị cảm/ ốm (tình thứ ba) nguy lớn tình trạng sức khoẻ, dẫn đến tử vong 1.1.1 Cảm biến âm thông minh độc lập Cảm biến âm thông minh độc lập minh hoạ hình 1.1 Nó gồm có microphone để thu âm thanh, ... thơng minh" (smartroom) Một phịng thơng minh hệ thống tin học quản lý (các) không gian sống sinh hoạt thông qua loại cảm biến khác nhau, ví dụ micrơ, máy quay phim, cảm biến di chuyển, cảm biến. .. định) có thêm tính từ "độc lập" Người quan sát Bộ lọc Vỉ thu thập số liệu Khuyếch đại Hệ thống phân tích âm Máy tính Hình 1.1 – Cảm biến âm thơng minh độc lập Phần cứng cảm biến xây dựng từ sản

Ngày đăng: 12/03/2022, 02:57

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w