Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 22 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
22
Dung lượng
4,63 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ PHẠM MINH DƯƠNG TỔNG HỢP TIẾNG NÓI TRÊN THIẾT BỊ GIÁM SÁT HÀNH TRÌNH NGÀNH: KỸ THUẬT ĐIỆN TỬ - 60520203 S K C0 5 Tp Hồ Chí Minh, tháng 10/2015 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC SƢ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ PHẠM MINH DƢƠNG TỔNG HỢP TIẾNG NÓI TRÊN THIẾT BỊ GIÁM SÁT HÀNH TRÌNH NGÀNH: KỸ THUẬT ĐIỆN TỬ - 60520203 Hƣớng dẫn khoa học: PGS.TS TRẦN THU HÀ TP Hồ Chí Minh, tháng 10 năm 2015 LÝ LỊCH KHOA HỌC I LÝ LỊCH SƠ LƢỢC Họ tên: Phạm Minh Dƣơng Giới tính: Nam Ngày, tháng, năm sinh: 26/02/1983 Nơi sinh: Tây Ninh Quê quán: Hòa Thành, Tây Ninh Dân tộc: Kinh Địa liên lạc: 261/12/13 Đình Phong Phú, Tổ 6, Khu phố 3, Phƣờng Tăng Nhơn Phú B, Quận 9, Tp.HCM II Điện thoại quan: Di động: 0913 531 247 Email: duong.phamminh@icdrec.edu.vn Fax: QUÁ TRÌNH ĐÀO TẠO Hệ đào tạo: Chính quy Thời gian đào tạo: Từ 2003 đến 2008 Nơi học: Trƣờng Đại học Bách Khoa Tp.HCM Ngành học: Điện tử - Viễn thông Tên đồ án tốt nghiệp: Nghiên cứu thiết kế số ngoại vi giao tiếp kit ARM Evaluator – 7T Ngày bảo vệ đồ án tốt nghiệp: 01/2008 Ngƣời hƣớng dẫn: TS Nguyễn Nhƣ Anh III QUÁ TRÌNH CÔNG TÁC CHUYÊN MÔN KỂ TỪ KHI TỐT NGHIỆP ĐẠI HỌC Thời gian Nơi công tác Công việc đảm nhiệm 2008 đến Trung tâm Nghiên cứu Đào tạo Nhân viên thiết kế phần Thiết kế Vi mạch cứng lập trình ứng dụng 2012 đến Công ty Cổ Phần Công Nghệ Thiết kế phần cứng lập Định Vị Sài Gòn Track trình thiết bị giám sát hành trình (Hỗ trợ kỷ thuật) i LỜI CAM ĐOAN Tôi cam đoan công trình nghiên cứu Các số liệu, kết nêu luận văn trung thực chƣa đƣợc công bố công trình khác Tp Hồ Chí Minh, ngày 18 tháng 10 năm 2015 (Ký tên ghi rõ họ tên) Phạm Minh Dƣơng ii LỜI CẢM TẠ Xin chân thành gửi lời cảm ơn đến PGS.TS Trần Thu Hà Ban lãnh đạo Trung tâm Nghiên cứu Đào tạo Thiết kế Vi mạch (ICDREC) tận tình hƣớng dẫn tạo điều kiện cho em hoàn thành tốt luận văn Xin chân thành gửi lời cảm ơn đến toàn thể quý thầy cô Trƣờng Đại học Sƣ phạm Kỷ thuật TP Hồ Chí Minh giảng dạy, hƣớng dẫn, truyền đạt kiến thức, kinh nghiệm quý báu tạo điều kiện học tập tốt cho em Xin cảm ơn đến đồng nghiệp, bạn bè chia sẽ, học hỏi kinh nghiệm suốt thời gian qua Cảm ơn ba mẹ, anh chị em, vợ bạn bè động viên suốt thời gian học Xin kính chúc sức khỏe chân thành cảm ơn HỌC VIÊN Phạm Minh Dƣơng LỜI CẢM TẠ iii TÓM TẮT LUẬN VĂN Trong đề tài này, ta thiết kế thi công thiết bị giám sát hành trình (TBGSHT) có tổng hợp tiếng nói phƣơng pháp ghép nối để giúp cho ngƣời sử dụng giám sát, quản lý phƣơng tiện cách trực quan Đồng thời, ngƣời sử dụng truyền thông tin xuống lái xe để phát thông báo rao trạm xe buýt tùy vào ứng dụng cụ thể Tổng hợp tiếng nói phƣơng pháp ghép nối lựa chọn đơn vị từ, cụm từ câu làm cho tiếng nói sau tổng hợp đạt đƣợc chất lƣợng mức độ tự nhiên mức độ dễ nghe Văn đầu vào dạng chữ hoa, chữ thƣờng, số, từ viết tắt, tên địa danh tiếng nƣớc ngoài, văn phải đƣợc chuẩn hóa thành dạng chuẩn chữ hoa tiến hành tổng hợp ghép nối Văn đƣợc truyền xuống TBGSHT tin nhắn SMS máy chủ qua giao thức TCP/IP Sau nhận văn đầu vào, TBGSHT chuẩn hóa văn thực việc ghép nối đơn vị âm ngữ cảnh thích hợp, sau phát tiếng nói đầu hệ thống Ngoài ra, TBGSHT có đầy đủ tính theo quy chuẩn QCVN 31:2014/BGTVT Bộ Giao thông vận tải iv ABSTRACT In this thesis, I have designed and test-fabricated the tracking surveillance device with speech synthesis by pairing method that the users can monitor and manage their vehicles intuitively As the same time, users can transmit the information to the driver or speak with the bus station depending on the specific application The speech by the unit selection synthetic method with words, phrases or sentences made speech after synthesis achieved at high quantity of natural level and listening easy level The input text is uppercase, lowercase, number, acronym, or the name of the foreign language places, therefore, this text must be standardized into uppercase and then processing the pairing synthesis The text is transmitted to the tracking surveillance device by Short Message Service (SMS) or Server via TCP/IP protocol After receiving the input text, the tracking surveillance device standardizes it and performs the pairing audio unit appropriate context, and then, the corresponding voice is generated at the output of the system Besides, the tracking surveillance device also has fully compliant features of QCVN 31:2014/BGTVT of the Ministry of Transport v Mục lục NỘI DUNG LÝ LỊCH KHOA HỌC i LỜI CAM ĐOAN ii LỜI CẢM TẠ iii TÓM TẮT LUẬN VĂN iv ABSTRACT v NỘI DUNG vi DANH SÁCH HÌNH ix DANH SÁCH BẢNG x DANH SÁCH TỪ VIẾT TẮT xi Chƣơng GIỚI THIỆU ĐỀ TÀI .1 1.1 Tổng quan hƣớng nghiên cứu 1.2 Tình hình nghiên cứu nƣớc nƣớc 1.3 Tính cấp thiết đề tài 1.4 Mục tiêu nghiên cứu 1.5 Nhiệm vụ nghiên cứu 1.6 Phƣơng pháp nghiên cứu Chƣơng CƠ SỞ LÝ THUYẾT .7 2.1 Sơ đồ khối tổng quát hệ thống thiết bị giám sát hành trình 2.2 Kiến trúc tổng quát khối tổng hợp tiếng nói .9 2.3 Bộ tổ chức liệu 10 2.3.1 Xây dựng liệu âm 10 2.3.2 Phân đoạn tập câu thu âm 11 2.4 Bộ tổng hợp 11 2.4.1 Chuẩn hóa văn 11 2.4.1.1 Từ viết tắt 12 2.4.1.2 Số 12 2.4.1.3 Từ nước 12 2.4.1.4 Từ viết sai tả 12 2.4.1.5 Các ký hiệu đặc biệt 13 2.4.2 Tổng hợp ghép nối – Lựa chọn đơn vị (Unit Selection) 13 2.4.2.1 Khái niệm 13 vi Mục lục 2.4.2.2 Mô hình Unit Selection 14 a Giải thuật SHA-1 15 b Thuật toán tìm kiếm Unit Selection 19 2.4.2.3 Định nghĩa Unit 21 2.5 Bộ từ viết tắt 21 2.6 Bộ phiên âm tiếng nƣớc 23 2.6.1 Đặt vấn đề 23 2.6.2 Phƣơng pháp thủ công 23 2.6.3 Phƣơng pháp chuỗi kết nối mô hình Joint Sequence 23 Chƣơng THIẾT KẾ PHẦN CỨNG VÀ CHƢƠNG TRÌNH TỔNG HỢP TIẾNG NÓI 26 3.1 Thiết kế phần cứng 26 3.1.1 Khối MPU 26 3.1.2 Khối SDRAM, NAND Flash 27 3.1.3 Khối GSM 27 3.1.4 Khối GPS 28 3.1.5 Khối LED trạng thái Buzzer 29 3.1.6 Khối SD Card 29 3.1.7 Khối Accessory Port 30 3.1.8 Khối RS232 Interface 30 3.1.9 Khối RS485 Interface 30 3.1.10 Khối Audio 31 3.1.11 Khối Power Supply 32 3.2 Sơ đồ nguyên lý TBGSHT 32 3.2.1 Sơ đồ nguyên lý mạch MCU 33 3.2.2 Sơ đồ nguyên lý mạch INTERFACE 35 3.2.3 Mặt trƣớc sau board mạch thiết kế 41 3.3 Chƣơng trình tổng hợp tiếng nói TBGSHT 42 3.3.1 Chƣơng trình tổng hợp tiếng nói 42 3.3.1.1 Lưu đồ giải thuật tổng hợp tiếng nói 42 3.3.1.2 Lưu đồ giải thuật chuẩn hóa văn 43 3.3.1.3 Lưu đồ giải thuật tổng hợp ghép nối câu 45 3.3.2 Chƣơng trình TBGSHT xe ô tô 46 Chƣơng ĐẶC TẢ KỸ THUẬT CỦA THIẾT BỊ GIÁM SÁT HÀNH TRÌNH 47 vii Mục lục 4.1 Tính TBGSHT theo QCVN 31:2014/BGTVT 47 4.2 Đặc tính kỷ thuật tín hiệu kết nối TBGSHT 48 4.3 Hƣớng dẫn cài đặt trình khởi động thiết bị 49 4.4 Cấu hình TBGSHT tin nhắn SMS Terminal 50 4.4.1 Mã lệnh cấu hình cho TBGSHT 50 4.4.2 Một số ví dụ thay đổi cấu hình TBGSHT 55 4.5 Giao thức truyền/nhận liệu TBGSHT server 57 4.5.1 Cấu trúc Dữ liệu hành trình 58 4.5.2 Cấu trúc liệu gởi đầu ngày 61 4.6 Kết nối phần mềm phân tích liệu 63 4.6.1 Mã liệu loại liệu: 63 4.6.2 Nội dung loại liệu 63 4.7 4.6.2.1 Thông tin thiết bị: (Loại liệu 1) 63 4.6.2.2 Thông tin thời gian làm việc lái xe: (Loại liệu 2) 65 4.6.2.3 Thông tin số lần thời gian dừng, đỗ xe: (Loại liệu 3) 65 4.6.2.4 Thông tin hành trình xe chạy: (Loại liệu 4) 66 4.6.2.5 Thông tin tốc độ giây xe: (Loại liệu 5) 66 Truyền nhận văn tổng hợp tiếng nói 67 4.7.1 Truyền TCP/IP 67 4.7.2 Truyền tin nhắn SMS 69 Chƣơng KẾT LUẬN 70 5.1 Đánh giá kết 70 5.2 Hƣớng phát triển đề tài 73 TÀI LIỆU THAM KHẢO 76 PHỤ LỤC 77 Phụ lục Các tính thiết bị giám sát hành trình 77 Phụ lục Tóm tắt sở liệu hệ thống tổng hợp tiếng nói 78 Phụ lục Bảng mã UTF-8 ký tự tiếng Việt 79 Phụ lục Bảng mã Unicode byte cố định 81 viii Mục lục DANH SÁCH HÌNH Hình 1.1: Sơ đồ hoạt động tổng quan TBGHST Hình 2.1: Sơ đồ khối TBGSHT có tích hợp TTS Hình 2.2: Kiến trúc tổng quát hệ thống tổng hợp tiếng nói Hình 2.3: Xử lý SHA-1 khối đơn 512-bit 17 Hình 2.4: Hàm nén giải thuật SHA-1 18 Hình 2.5: Cơ chế lựa chọn đơn vị 21 Hình 3.1: Sơ đồ khối chức module M95 28 Hình 3.2: Sơ đồ khối chức module L70 29 Hình 3.3: Sơ đồ khối giao tiếp với SD card 30 Hình 3.4: Sơ đồ chuyển đổi giao diện RS485 31 Hình 3.5: Sơ đồ chân SP3485EN transceiver 31 Hình 3.6: Sơ đồ giải mã âm VS1003 32 Hình 3.7: Sơ đồ điều chỉnh nguồn cấp cho board mạch 32 Hình 3.8: Mặt trước board mạch TBGSHT 41 Hình 3.9: Mặt sau board mạch TBGSHT 41 Hình 3.10: Lưu đồ giải thuật tổng hợp tiếng nói 43 Hình 3.11: Lưu đồ giải thuật chuẩn hóa văn 44 Hình 3.12: Lưu đồ giải thuật tổng hợp ghép nối câu 45 Hình 3.13: Lưu đồ giải thuật TBGSHT xe ô tô 46 Hình 5.1: Bản đồ số giám sát TBGSHT 72 Hình 5.2: Văn tổng hợp truyền SMS TCP/IP 72 ix Mục lục DANH SÁCH BẢNG Bảng 2.1: Bộ liệu thu âm 11 Bảng 2.2: Ví dụ kết phân đoạn theo cụm từ 11 Bảng 2.3: Kết tìm kiếm cụm từ để ghép nối tệp tin âm 21 Bảng 2.4: Mô tả tên tập tin số từ viết tắt 22 Bảng 2.5: Mô tả tên tệp tin số từ tiếng nước 24 Bảng 3.1: Các trạng thái tín hiệu từ xe 30 Bảng 4.1: Đặc tính kỹ thuật 48 Bảng 4.2: Các tín hiệu kết nối với TBGSHT 48 Bảng 4.3: Mã lệnh cấu hình cho TBGSHT qua cấu trúc tin nhắn 50 Bảng 4.4: Mô tả ý nghĩa trường thông điệp gởi định kỳ 58 Bảng 4.5: Mô tả trạng thái bit Mã_trạng_thái_1 60 Bảng 4.6: Mô tả trạng thái bit Mã_trạng_thái_2 61 Bảng 4.7: Mô tả ý nghĩa trường tin đầu ngày 61 Bảng 4.8: Mã loại liệu 63 Bảng 4.9: Loại liệu thông tin thiết bị 63 Bảng 5.1: Mô tả sở liệu tổng hợp tiếng nói 71 Bảng 5.2: Đánh giá số ví dụ mức độ tổng hợp tiếng nói 72 x Mục lục DANH SÁCH TỪ VIẾT TẮT BGTVT: FTP: GMT: GPRS: GPS: GSM: HTTP: MPU: RFID: SDRAM: SHA-1: SMS: TBGSHT: TCP/IP: TTS: UTF-8: Bộ Giao thông vận tải File Transfer Protocol Greenwich Mean Time General Packet Radio Service Global Positioning System Global System for Mobile The Hypertext Transfer Protocol Microprocessor Unit Radio Frequency Identification Synchronous Dynamic Random Access Memory Secure Hashing Algorithm Short Message Service Thiết bị giám sát hành trình Transmission Control Protocol/Internet Protocol Text to Speech 8-bit Unicode Transformation Format xi Chương 1: Giới thiệu đề tài Chƣơng GIỚI THIỆU ĐỀ TÀI 1.1 Tổng quan hƣớng nghiên cứu Hiện thiết bị giám sát hành trình (TBGSHT) nƣớc ta phát triển nhanh, từ Nghị định 08 Bộ Giao thông vận tải số: 08/2011/TTBGTVT ban hành Ngoài tính mà Nghị định đƣa ra, TBGSHT có thêm số tính mở rộng để đáp ứng nhu cầu sử dụng khách hàng, đặc biệt tính đƣợc tích hợp với TBGSHT nhằm tăng tính tiện ích giảm chi phí cho ngƣời sử dụng Chẳng hạn tính là: Máy tính cƣớc taxi, Thông báo thông tin từ trung tâm điều hành, Rao trạm xe buýt, Thanh toán tiền tự động RFID, v.v Đề tài hƣớng tới phần đọc thông báo, đọc địa khách hàng đăng ký taxi, rao trạm xe buýt Các thông tin đƣợc truyền từ trung tâm điều hành dƣới dạng văn để TBGSHT thực việc “Tổng hợp tiếng nói thiết bị giám sát hành trình” phát thông báo mà thiết bị thị trƣờng dừng lại mức thu âm phát theo tuyến đƣờng cố định chƣa thể làm đƣợc Để đáp ứng đƣợc tính theo Nghị định yêu cầu đề tài đặt ra, TBGSHT phải đƣợc thiết kế hợp lý phần cứng phần mềm Hình 1.1 mô tả sơ đồ hoạt động tổng quan TBGSHT có tích hợp thuật toán tổng hợp tiếng nói (TTS) Trong hình 1.1, TBGSHT có hai chức cần xử lý: chức thứ TBGSHT phải thực đầy đủ tính theo Nghị định Bộ Giao thông vận tải quy định, chức thứ hai tổng hợp tiếng nói Trong chức thứ nhất, TBGSHT thực việc thu thập liệu từ vệ tinh nhƣ: thời gian, vận tốc di chuyển, tọa độ, v.v thu thập tín hiệu từ xe nhƣ: tín Chương 1: Giới thiệu đề tài hiệu cửa, động cơ, máy điều hòa, v.v sau TBGSHT xử lý thông tin để truyền đến trung tâm giám sát qua GPRS Trong chức thứ hai, TBGSHT nhận văn từ SMS từ máy chủ qua giao thức TCP/IP để tổng hợp tiếng nói Văn cần tổng hợp đƣợc lƣu vào nhớ thiết bị, sau văn đƣợc chuẩn hóa đƣa vào sở liệu để so sánh, tổng hợp phát âm Vệ tinh Vệ tinh Tín hiệu GPS Tín hiệu GPS GPRS SM TC S P/ IP TBGSHT iệu t l ấ u x Truy internet qua Máy chủ (Server) Hình 1.1: Sơ đồ hoạt động tổng quan TBGHST 1.2 Tình hình nghiên cứu nƣớc nƣớc Đối với nƣớc phát triển phƣơng Tây TBGSHT xe ô tô xuất từ sớm, đƣợc tích hợp vào xe có chức nhƣ: giám sát lƣu lƣợng xe đƣờng, hƣớng dẫn đƣờng (Navigator), thông báo ùn tắt xe đƣờng Chương 1: Giới thiệu đề tài Với nƣớc ta, TBGSHT bắt đầu xuất từ cuối năm 2009 hai công ty điện tử sản xuất Việt Nam nhƣ Công ty điện tử Bình Anh (tại Hà Nội) Công ty TNHH TM điện tử Vinh Hiển (tại TP.HCM) Trong thời gian đồng thời xuất số sản phẩm TBGSHT từ Trung Quốc, Đài Loan, Mỷ, v.v Từ Nghị định ban hành Bộ Giao thông vận tải (số 08/2011/TTBGTVT) trình phát triển TBGSHT nƣớc ta nhanh Đến thời điểm có 50 đơn vị cung cấp TBGSHT hợp quy thiết bị Ngoài tính đáp ứng theo Nghị định ban hành, TBGSHT hỗ trợ thêm số tính mở rộng để phục vụ theo yêu cầu khách hàng Trên thị trƣờng việc rao trạm cho xe buýt đƣợc đƣa vào sử dụng, nhƣng không sử dụng thuật toán tổng hợp tiếng nói mà thu âm theo trạm đoạn đƣờng cố định Do đó, việc sử dụng bị hạn chế không linh hoạt Với phƣơng pháp tổng hợp tiếng nói Formant tác giả Phan Thanh Tài [5] sử dụng mô hình Klatt mô hình nối tiếp mô hình song song để tổng hợp nguyên âm phụ âm, đề tài hạn chế mức độ tự nhiên mức độ dễ nghe Đối với phƣơng pháp Tổng hợp tiếng nói phƣơng pháp ghép nối tác giả Võ Văn Nguyên [7] sử dụng giải thuật TD_PSOLA cách ghép nối diphone số hạn chế nhƣ sau: tổng hợp câu đơn giản, chƣa có tổng hợp tên riêng, địa danh tiếng nƣớc thƣờng gặp, tổng hợp diphone có dấu cho hiệu chƣa cao Cả hai đề tài dừng lại mức mô Matlab mà chƣa đƣợc ứng dụng vào thiết bị sản phẩm thực tế 1.3 Tính cấp thiết đề tài Với tình hình ùn tắt giao thông nhƣ vấn đề giải cho lƣu lƣợng xe lƣu thông cách hợp lý lo lắng nƣớc ta Do đó, xe vận tải phải đƣợc lắp đặt TBGSHT đồng thời phải đƣợc quản lý quan Chương 1: Giới thiệu đề tài chức để kiểm soát lƣu lƣợng xe đƣờng đƣa hƣớng giải kịp thời Ngoài tính Nghị định đƣa ra, TBGSHT phải đƣợc bổ sung tính rao trạm xe buýt, hƣớng dẫn lái xe lƣu thông âm xảy kẹt xe, đồng thời giới thiệu địa danh cho khách du lịch, v.v Trƣớc tình hình này, việc thiết kế thi công thiết bị giám sát hành trình có tích hợp giải thuật tổng hợp tiếng nói phƣơng pháp ghép nối với tên đề tài “Tổng hợp tiếng nói thiết bị giám sát hành trình” cần thiết thời điểm Về việc tích hợp thêm thuật toán tổng hợp tiếng nói vào TBGSHT giúp cho TBGSHT linh hoạt việc sử dụng nhƣ: đọc thông báo từ trung tâm điều hành, rao trạm xe buýt, đọc tin nhắn, v.v 1.4 Mục tiêu nghiên cứu Nghiên cứu hệ thống tổng hợp tiếng nói tiếng Việt phƣơng pháp ghép nối dựa đơn vị ngữ âm sở [2, 6, 8] Mô hệ thống tổng hợp tiếng nói máy tính có hệ điều hành Linux, so sánh hệ thống với hệ thống tổng hợp tiếng nói phƣơng pháp khác [4] Ứng dụng hệ thống tổng hợp tiếng nói tiếng Việt vào thiết bị giám sát hành trình xe ô tô để đọc văn thông báo đƣợc gửi từ trung tâm điều khiển, rao trạm xe buýt 1.5 Nhiệm vụ nghiên cứu Trong chuyên đề 1: “Thiết kế thi công thiết bị giám sát hành trình xe ô tô có tích hợp thuật toán tổng hợp tiếng nói (Text To Speech) phƣơng pháp ghép nối” phần trƣớc đề tài, ta thực việc khảo sát tìm hiểu thuật toán tổng hợp tiếng nói phƣơng pháp ghép nối với nhiệm vụ nhƣ sau: Chương 1: Giới thiệu đề tài - Thực chuẩn hóa văn đầu vào, phân cụm, ghép nối đơn vị ngữ âm thành tiếng nói tổng hợp - Tổ chức liệu thực quản lý phân đoạn kho ngữ liệu âm thành đơn vị sở (âm tiết, từ, cụm từ v.v) - Tìm hiểu thuật toán chuyển đổi từ nƣớc sang cách đọc tiếng Việt gần Trong chuyên đề 2: “Tổng hợp tiếng nói thiết bị giám sát hành trình” phần trƣớc đề tài, ta thực nhiệm vụ sau: - Bổ sung, điều chỉnh sở liệu phù với thiết bị giám sát hành trình xe ô tô - Chuẩn hóa văn đầu vào với từ viết tắt, số, từ nƣớc ký hiệu đặc biệt - Cải cách phƣơng pháp lựa chọn ghép nối cho tốc độ xử lý tổng hợp tiếng nói thiết bị giám sát hành trình đƣợc nâng cao - Mô thuật toán tổng hợp tiếng nói phƣơng pháp ghép nối máy tính có hệ điều hành Linux - So sánh với hệ thống tổng hợp tiếng nói trƣớc - Vẽ sơ đồ mạch cho TBGSHT có tích hợp TTS - Mô tổng hợp tiếng nói thiết bị giám sát hành trình Trong phần luận văn, ta thực nhiệm vụ nhƣ sau: - Viết chƣơng trình cho TBGSHT đáp ứng đầy đủ tính theo Nghị định Bộ Giao thông vận tải - Tích hợp hệ thống tổng hợp tiếng nói tiếng Việt vào TBGSHT để đọc thông báo đƣợc gửi từ trung tâm điều khiển, rao trạm xe buýt - Kiểm tra, hoàn thiện thiết bị - So sánh kết tổng hợp tiếng nói tiếng Việt thiết bị với máy tính Chương 1: Giới thiệu đề tài 1.6 Phƣơng pháp nghiên cứu Qua tình hình nghiên cứu tổng hợp tiếng nói nƣớc, thấy TBGSHT nƣớc ta phát triển mạnh (nƣớc ta có 50 đơn vị cung cấp TBGSHT), TBGSHT có tích hợp thuật toán tổng hợp tiếng nói, có phạm vi ứng dụng lớn xã hội Các nghiên cứu giới TTS hƣớng đến việc giải hai yêu cầu chất lƣợng tiếng nói đƣợc tổng hợp, mức độ tự nhiên mức độ dễ nghe [3, 6] Cần khẳng định chất lƣợng hệ thống TTS cho tiếng Việt hạn chế, xét theo hai tiêu chí Các nguyên nhân dẫn đến hạn chế bao gồm: Đối với hệ thống TTS dựa phƣơng pháp kết nối, đơn vị tiếng nói sở đƣợc thu âm cách rời rạc ngôn điệu lời nói cần đƣợc đặt phạm vi cụm từ câu chí đoạn văn Với hệ thống TTS dựa formant, chất phƣơng pháp tạo tiếng nói tổng hợp từ tham số nên khó thỏa mãn tiêu chí “tự nhiên” Phƣơng pháp thích hợp cho ứng dụng chạy môi trƣờng có tài nguyên hạn chế nhớ nhƣ dung lƣợng lƣu trữ Ngoài ra, điểm hạn chế hệ thống TTS cho tiếng Việt khả xử lý từ nƣớc Số lƣợng từ nƣớc đọc đƣợc hoàn toàn không Do việc đầu tƣ nghiên cứu cho toán TTS tiếng Việt thực cần thiết để bƣớc vƣợt qua hạn chế Trong khuôn khổ đề tài, ta chọn phƣơng pháp “Tổng hợp tiếng nói tiếng Việt phương pháp ghép nối dựa đơn vị ngữ âm sở” Trong đơn vị ngữ âm sở câu, cụm từ từ để giúp cho việc tổng hợp tiếng nói có chất lƣợng tốt Đây lý ta chọn đề tài “Tổng hợp tiếng nói thiết bị giám sát hành trình” Chương 2: Cơ sở lý thuyết Chƣơng CƠ SỞ LÝ THUYẾT 2.1 Sơ đồ khối tổng quát hệ thống thiết bị giám sát hành trình Hình 2.1 mô tả toàn sơ đồ khối TBGSHT có tích hợp thuật toán tổng hợp tiếng nói phƣơng pháp ghép nối Earphone SIM Holder Microphone GSM Accessory Port GPS IC Temperature Sensor LED Status MPU RS232 Interface Buzzer RS485 Interface SDRAM, NANDFLASH TTS database SD Card Audio DC DC in in Supply Supply Power protection Regulator Power Supply Hình 2.1: Sơ đồ khối TBGSHT có tích hợp TTS Chương 2: Cơ sở lý thuyết Mô tả sơ lƣợc khối chức TBGSHT: - Khối MPU: Vi xử lý AT91SAM9260, tốc độ 180 MHz - Khối SDRAM, NAND FLASH: 64 MB SDRAM 256 MB NAND Flash - Khối Power Supply: hỗ trợ nguồn cấp DC từ 8V – 36V, cung cấp nguồn cho khối chức hoạt động - Khối GSM: giao tiếp với MPU để truyền nhận liệu lên trung tâm điều khiển qua giao thức TCP/IP, giao thức HTTP giao thức FTP - Khối GPS: phân tích thành phần liệu đƣợc nhận từ module GPS, ta có đƣợc thông số nhƣ: kinh độ, vĩ độ, vận tốc di chuyển, hƣớng di chuyển, thời gian thực, v.v - Khối LED trạng thái Buzzer: hiển thị thông báo trạng thái TBGSHT - Khối SD Card: lƣu trữ sở liệu âm thông tin hoạt động TBGSHT - Khối Accessory Port: khối dùng để giao tiếp với tín hiệu xe nhƣ: khóa xe, cửa xe, máy điều hòa, vận tốc xe, nhiên liệu, nút nhấn SOS - Khối IC Temperature Sensor: dùng IC số để cảm biến nhiệt độ xe, ứng dụng có nhiệt độ từ đến 100 độ C - Khối RS232 Interface: giao tiếp với phần mềm phân tích liệu TBGSHT Tổng cục Đƣờng Việt Nam theo QCVN 31:2014/BGTVT Bộ Giao thông vận tải - Khối RS485 Interface: dùng để mở rộng giao tiếp với ngoại vi khác nhƣ Camera, RFID, số ngoại vi theo yêu cầu khách hàng - Khối TTS database: lƣu trữ thƣ viện âm để ứng dụng đọc văn - Khối Audio: giải mã phát âm cho ứng dụng TTS S K L 0 [...]... chọn ghép nối sao cho tốc độ xử lý tổng hợp tiếng nói trên thiết bị giám sát hành trình đƣợc nâng cao - Mô phỏng thuật toán tổng hợp tiếng nói bằng phƣơng pháp ghép nối trên máy tính có hệ điều hành Linux - So sánh với các hệ thống tổng hợp tiếng nói trƣớc đây - Vẽ sơ đồ mạch cho TBGSHT có tích hợp bộ TTS - Mô phỏng tổng hợp tiếng nói trên thiết bị giám sát hành trình Trong phần luận văn, ta sẽ thực... thống tổng hợp tiếng nói trên máy tính có hệ điều hành Linux, so sánh hệ thống với các hệ thống tổng hợp tiếng nói bằng các phƣơng pháp khác [4] Ứng dụng hệ thống tổng hợp tiếng nói tiếng Việt vào thiết bị giám sát hành trình xe ô tô để đọc văn bản thông báo đƣợc gửi từ trung tâm điều khiển, hoặc rao trạm xe buýt 1.5 Nhiệm vụ nghiên cứu Trong chuyên đề 1: Thiết kế và thi công thiết bị giám sát hành trình. .. tài Tổng hợp tiếng nói trên thiết bị giám sát hành trình là rất cần thiết trong thời điểm hiện nay Về việc tích hợp thêm thuật toán tổng hợp tiếng nói vào TBGSHT sẽ giúp cho TBGSHT linh hoạt hơn trong việc sử dụng nhƣ: đọc thông báo từ trung tâm điều hành, rao trạm xe buýt, đọc tin nhắn, v.v 1.4 Mục tiêu nghiên cứu Nghiên cứu hệ thống tổng hợp tiếng nói tiếng Việt bằng phƣơng pháp ghép nối dựa trên. .. TTS tiếng Việt là thực sự cần thiết để có thể từng bƣớc vƣợt qua những hạn chế này Trong khuôn khổ đề tài, ta chọn phƣơng pháp Tổng hợp tiếng nói tiếng Việt bằng phương pháp ghép nối dựa trên các đơn vị ngữ âm cơ sở” Trong đó các đơn vị ngữ âm cơ sở là câu, cụm từ hoặc từ để giúp cho việc tổng hợp tiếng nói có chất lƣợng tốt hơn Đây là lý do ta chọn đề tài Tổng hợp tiếng nói trên thiết bị giám sát hành. .. đoạn kho ngữ liệu âm thanh thành các đơn vị cơ sở (âm tiết, từ, cụm từ v.v) - Tìm hiểu thuật toán chuyển đổi một từ nƣớc ngoài bất kỳ sang cách đọc tiếng Việt gần đúng nhất có thể Trong chuyên đề 2: Tổng hợp tiếng nói trên thiết bị giám sát hành trình ở phần trƣớc của đề tài, ta đã thực hiện các nhiệm vụ sau: - Bổ sung, điều chỉnh cơ sở dữ liệu phù với thiết bị giám sát hành trình xe ô tô - Chuẩn hóa... hiện các nhiệm vụ nhƣ sau: - Viết chƣơng trình cho TBGSHT đáp ứng đầy đủ các tính năng theo Nghị định của Bộ Giao thông vận tải - Tích hợp hệ thống tổng hợp tiếng nói tiếng Việt vào TBGSHT để đọc thông báo đƣợc gửi từ trung tâm điều khiển, hoặc rao trạm xe buýt - Kiểm tra, hoàn thiện thiết bị - So sánh kết quả tổng hợp tiếng nói tiếng Việt trên thiết bị với trên máy tính 5 Chương 1: Giới thiệu đề tài... thực hiện việc Tổng hợp tiếng nói trên thiết bị giám sát hành trình và phát ra thông báo mà các thiết bị trên thị trƣờng hiện nay chỉ dừng lại ở mức thu âm và phát theo các tuyến đƣờng cố định hoặc chƣa thể làm đƣợc Để có thể đáp ứng đƣợc các tính năng theo Nghị định và yêu cầu đề tài đặt ra, thì TBGSHT phải đƣợc thiết kế hợp lý cả về phần cứng và phần mềm Hình 1.1 mô tả sơ đồ hoạt động tổng quan của... toán tổng hợp tiếng nói mà chỉ thu âm theo các trạm và đoạn đƣờng cố định Do đó, việc sử dụng sẽ bị hạn chế và không linh hoạt Với phƣơng pháp tổng hợp tiếng nói Formant của tác giả Phan Thanh Tài [5] sử dụng mô hình Klatt là mô hình nối tiếp và mô hình song song để tổng hợp các nguyên âm và phụ âm, đề tài này còn hạn chế về mức độ tự nhiên và mức độ dễ nghe Đối với phƣơng pháp Tổng hợp tiếng nói bằng... nghiên cứu về tổng hợp tiếng nói trong và ngoài nƣớc, có thể thấy TBGSHT nƣớc ta hiện nay đang phát triển mạnh (nƣớc ta có trên 50 đơn vị cung cấp TBGSHT), nhất là một TBGSHT có tích hợp thuật toán tổng hợp tiếng nói, vì nó có phạm vi ứng dụng rất lớn trong xã hội Các nghiên cứu trên thế giới về TTS vẫn đang hƣớng đến việc giải quyết hai yêu cầu cơ bản về chất lƣợng của tiếng nói đƣợc tổng hợp, đó là... trình xe ô tô có tích hợp thuật toán tổng hợp tiếng nói (Text To Speech) bằng phƣơng pháp ghép nối” ở phần trƣớc của đề tài, ta đã thực hiện việc khảo sát và tìm hiểu thuật toán tổng hợp tiếng nói bằng phƣơng pháp ghép nối với các nhiệm vụ nhƣ sau: 4 Chương 1: Giới thiệu đề tài - Thực hiện chuẩn hóa văn bản đầu vào, phân cụm, và ghép nối các đơn vị ngữ âm thành tiếng nói tổng hợp - Tổ chức dữ liệu