1. Trang chủ
  2. » Luận Văn - Báo Cáo

NHẬN DẠNG và CHUYỂN đổi một số CHỮ từ TIẾNG nói TIẾNG VIỆT SANG văn bản

74 34 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 74
Dung lượng 2,27 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN ĐẠI HỌC MỞ HÀ NỘI LUẬN VĂN THẠC SỸ Chuyên ngành: Công nghệ Thông tin Mã ngành: 60480201 Đề tài: NHẬN DẠNG VÀ CHUYỂN ĐỔI MỘT SỐ CHỮ TỪ TIẾNG NÓI TIẾNG VIỆT SANG VĂN BẢN HỌC VIÊN THỰC HIỆN: HOÀNG MINH SƠN HƯỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN QUANG HOAN HÀ NỘI - 2015 DANH MỤC VIẾT TẮT Chữ viết tắt CNTT RIFF AMDF LPC LFCC MFCC VQ PE Nội dung Công nghệ thơng tin Resource Interchange File Format Trích rút theo tần số Pitch Linear Predictive Coding Linear Frequency Cepstrum Coefficient Mel-frequency Cepstral Coefficient Vector Quantization Perceptron LỜI CẢM ƠN Trước hết, em xin gửi lời cảm ơn sâu sắc đến PGS.TS Nguyễn Quang Hoan, người giúp đỡ em nhiều kiến thức tài liệu kỹ thuật phục vụ cho công tác nghiên cứu Em xin chân thành cảm ơn thầy, cô giáo giảng dạy Viện Đại học Mở - Hà Nội tạo điều kiện giúp đỡ em hoàn thành đề tài tốt nghiệp Xin cảm ơn tất bạn bè nhiệt tình giúp đỡ, động viên góp ý cho luận văn Mặc dù nỗ lực cố gắng để hoàn thành luận văn tốt nghiệp này, song chắn khơng thể tránh khỏi sai sót Vì em mong bảo thầy giáo để luận văn hồn thiện LỜI CAM ĐOAN Em xin cam đoan cơng trình nghiên cứu em chưa cơng bố cơng trình chưa đăng tài liệu, tạp chí, hội nghị khác Những kết nghiên cứu luận văn trung thực Hà Nội tháng 10 năm 201506 Tác giả luận văn Hoàng Minh Sơn MỤC LỤC MỤC LỤC DANH MỤC BẢNG DANH MỤC HÌNH .8 ĐẶT VẤN ĐỀ Chương TỔNG QUAN VỀ TIẾNG NÓI, TIẾNG VIỆT 1.1 Tiếng nói 1.1.1 Các đặc trưng tiếng nói 1.1.2 Quá trình phát âm máy phát âm 1.2 Tiếng Việt, ngữ âm tiếng Việt 1.2.1 Khái niệm 1.2.2 Cấu trúc âm tiết tiếng Việt 1.3 Kết luận .9 Chương 10 PHÂN TÍCH DỮ LIỆU TIẾNG NÓI 10 2.1 Cấu trúc tệp âm 10 2.2 Các kỹ thuật tiền xử lý 14 2.2.1 Các đơn vị .14 2.2.2 Chuẩn hóa biên độ 16 2.2.3 Làm rõ tín hiệu 17 2.2.4 Phân khung liệu tiếng nói 17 2.2.5 Năng lượng trung bình thời gian ngắn tiếng nói 17 2.2.6 Tần số cắt khơng trung bình thời gian ngắn .18 2.2.7 Xác định tần số tiếng nói 20 2.3 Các kỹ thuật trích rút đặc trưng tiếng nói 23 2.3.1 Xác định phần hữu 23 2.3.2 Xác định vị trí cắt vần phụ âm .24 2.3.4 Phương pháp trích chọn đặc trưng LPC 26 2.4 Kết luận 28 Chương 30 TỔNG QUAN VỀ MẠNG NƠRON 30 3.1 Mạng nơron .30 3.1.1 Quá trình phát triển nghiên cứu mạng nơron .30 3.1.2 Các mạng nơron truyền thẳng 31 3.1.2.1 Mạng truyền thẳng lớp .31 3.1.2.2 Mạng nơron truyền thẳng nhiều lớp 33 3.1.2.3 Một số mạng nơron truyền thẳng 34 3.2 Cấu trúc mạng nơron .35 3.2.1 Mơ hình tổng qt mạng nơron nhân tạo 35 3.2.2 Phần động học tuyến tính 36 3.3 Các luật học mạng nơron 38 3.4 Mạng nơron lan truyền ngược 40 3.4 Mạng nơron Kohonen 45 3.4.1 Cấu trúc mạng nơron Kohonen 47 3.4.2 Chuẩn hóa liệu đầu vào .48 3.4.3 Tính tốn liệu đầu nơron 49 3.4.4 Ánh xạ lưỡng cực .49 3.4.5 Chọn nơron thắng .50 3.4.6 Quá trình học mạng Kohonen 50 3.4.7 Tỉ lệ (tốc độ) học 53 3.4.8 Điều chỉnh trọng số (cập nhật trọng số) .53 3.4.9 Tính tốn sai số 53 3.5 Kết luận chương 53 Chương 55 ỨNG DỤNG CHƯƠNG TRÌNH NHẬN DẠNG VÀ CHUYỂN ĐỔI 55 TIẾNG NÓI TIẾNG VIỆT SANG VĂN BẢN 55 4.1 Mô tả hệ thống nhận dạng .55 4.2 Mô tả mạng nơron nhận dạng 55 4.3 Phương pháp nhận dạng 56 4.4 Xây dựng thuật toán công cụ Matlab .56 4.4.1 Trích chọn đặc trưng phương pháp LPC 58 4.4.2 Trích chọn đặc trưng phương pháp MFCC 58 4.5 Kết luận chương 58 Chương 59 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 59 DANH MỤC BẢNG Bảng 1.1: Các phụ âm Bảng 1.2: Bảng vần đơn .7 Bảng 1.3: Vần kép loại Bảng 1.4: Vần kép loại Bảng 1.5: Vần kép loại Bảng 1.6: Bảng vần loại Bảng 2.1: Bảng thông tin định dạng âm 13 Bảng 2.2: Bảng thông tin liệu 13 Bảng 3.1 Một số hàm H(s) thường dùng cho mơ hình nơron nhân tạo .37 Bảng 3.2 Một số hàm phi tuyến thường sử dụng mơ hình nơron 37 DANH MỤC HÌNH Hình 1.1: Quá trình phát âm .4 Hình 2.1: Sơ đồ mơ tả cấu trúc trường thông tin Wave .11 Hình 2.2: Mơ tả cấu trúc trường liệu Wave 14 Hình 2.3: Sơ đồ khối thuật tốn chuẩn hóa 16 Hình 2.4: Lưu đồ thuật toán xác định độ lớn lượng thời gian ngắn 18 Hình 2.5: Lưu đồ thuật tốn xác định tỷ lệ Zezo-crossing .20 Hình 2.6: Sơ đồ thuật tốn tính tần số 22 Hình 2.7: Sơ đồ khối thuật toán xác định phần hữu .24 Hình 2.8: Thuật tốn tách phụ âm vần .25 Hình 2.9: Sơ đồ thuật tốn trích rút đặc trưng LPC .28 Hình 3.1: Mơ hình lớp mạng nơron truyền thẳng .32 Hình 3.2: Mạng nơron truyền thẳng nhiều lớp .33 Hình 3.3: Mạng perceptron lớp với hàm truyền hardlimit 34 Hình 3.4: Nơron nhân tạo .36 Hình 3.5: Phân loại mạng nơron .38 Hình 3.6: Sơ đồ khối luật học mạng nơron .39 Hình 3.7: Mạng lớp lan truyền ngược 40 Hình 3.8: Một dạng nơron Kohonen 48 Hình 3.9: Sơ đồ khối biểu diễn huấn luyện mạng nơron Kohonen 52 Hình 4.1: Sơ đồ khối mơ tả hệ thống nhận dạng tiếng nói .55 Hình 4.2: Quá trình tìm tham số tối ưu cho mạng nơron .57 Hình 4.3: Mạng nơron với đặc trưng LPC .58 Hình 4.4: Mạng nơron với đặc trưng MFCC 58 ĐẶT VẤN ĐỀ Ngày nay, thiết bị di động ngày phát triển mạnh mẽ, xu hướng tương lai, người sử dụng thiết bị di động phần tất yếu sống Điện thoại, máy tính bảng, đồng hồ thông minh đem lại trải nghiệm cho người sử dụng, số đó, ứng dụng nhận dạng tiếng nói sử dụng nhiều thiết bị đó, nhiên, phần mềm cho người Việt cịn q Từ suy nghĩ đó, em nghiên cứu phương pháp xử lý tiếng nói chọn phương pháp phân tích, xử lý tiếng nói áp dụng chương trình Nhận dạng chuyển đổi tiếng nói tiếng Việt sang văn Hướng giải nhận dạng chuyển đổi tiếng nói tiếng Việt sang văn từ số đếm, chữ tiếng Việt, đoạn văn áp dụng chức nhận diện giọng nói Google hỗ trợ tảng Android tảng Web PHẠM VI ĐỀ TÀI • Tìm hiểu lập trình di động, lập trình ứng dụng hệ điều hành Android • Tìm hiểu âm thanh, cách xử lý âm thanh, biện pháp thu âm… • Thử nghiệm, nghiên cứu đặc trưng tiếng Việt nhận dạng chuyển đổi Bắt đầu Đã số chu kỳ xác định? Khởi tạo ngẫu nhiên ma trận trọng số S Tính tốn sai số Kiểm tra sai số xem có mức chấp nhận không? Gán ma trận trọng số thành ma trận trọng số tốt Đ S Nếu có ma trận trọng số tốt ma trận trọng số tốt nhất? Đ S Thực huấn luyện, điều chỉnh trọng số dựa vào nơron thắng S Đ Tính tốn lại tỉ lệ sai số, ghi lại giá trị cải thiện Đ S Ma trận trọng số tốt chưa? Đ Cải thiện tỉ lệ sai số tầm thường? Dừng Hình 3.9: Sơ đồ khối biểu diễn huấn luyện mạng nơron Kohonen 52 3.4.7 Tỉ lệ (tốc độ) học Tham số học số nhỏ 1, ký hiệu α Thông thường, đặt cho tham số học giá trị từ 0.4 đến 0.5, tỉ lệ học lớn trình huấn luyện nhanh Tuy nhiên, việc đặt cho tỉ lệ học giá trị lớn làm cho mạng không hội tụ Điều làm thay đổi vector trọng số lớn gây ảnh hưởng tới việc phân loại mẫu nên ta cần chọn tỉ lệ học vừa đủ, sử dụng để điều chỉnh trọng số nơron Trong phần tiếp theo, xem trọng số điều chỉnh sử dụng tham số học 3.4.8 Điều chỉnh trọng số (cập nhật trọng số) Một công đoạn xuất liệu huấn luyện đưa vào mạng nơron Kohonen, trọng số điều chỉnh dựa kết liệu huấn luyện Sự điều chỉnh trọng số làm cho mạng có thuận lợi sau đưa trở lại mạng Ma trận trọng số cuối sử dụng ma trận tốt xác định từ chu kỳ Bây giờ, xem xét trọng số thay đổi Phương pháp cho việc tính tốn thay đổi trọng số sử dụng phương trình sau: wt +1 = wt + α ( x − wt ) (3.52) Biến x vector huấn luyện đưa vào mạng Biến w t trọng số nơron thắng, biến wt+1 trọng số mới, α hệ số học 3.4.9 Tính tốn sai số Khi mạng huấn luyện khơng giám sát có sai số, khác kết mong đợi kết thực tế mạng nơron Sai số mà tính tốn mà khơng kết mong đợi kết thực tế ej = ||x-wj|| Mục đích mạng nơron Kohonen phân loại liệu đầu vào vào tập khác nhau, sai số mạng nơron Kohonen phải đo lường Sai số tính tốn trình huấn luyện mạng 3.5 Kết luận chương Mạng nơron kết nối với theo nhiều lớp Mạng lớp liên kết cho khả xấp xỉ phần mặt phẳng tín hiệu vào Mạng hai lớp liên kết cho 53 khả xấp xỉ vùng lồi tín hiệu vào Trong mạng ba lớp liên kết cho khả xấp xỉ vùng tuỳ ý tín hiệu vào Mạng nơron có số ưu điểm so với máy tính truyền thống Cấu trúc song song mạng nơron lý tưởng cho ứng dụng đòi hỏi tốc độ nhanh theo thời gian thực Khả huấn luyện mạng nơron khai thác để phát triển hệ học thích nghi, mạng nơron liên tục học mơ hình động học Mặt khác với khả tổng qt hố mạng nơron, áp dụng để điều khiển nhiều tham số phức tạp đồng thời, dự báo lỗi hệ thống tránh cố đáng tiếc mà hệ thống gây Phần trình bày số sở mạng nơron khả nảng ứng dụng cơng cụ Ngồi ra, tìm hiểu mạng nơron Kohonen Mạng nơron Kohonen khác với mạng lan truyền ngược vài điểm Mạng nơron Kohonen luyện không giám sát Sự huấn luyện mạng nơron Kohonen khác đáng kể so với thuật toán lan truyền ngược 54 Chương ỨNG DỤNG CHƯƠNG TRÌNH NHẬN DẠNG VÀ CHUYỂN ĐỔI TIẾNG NÓI TIẾNG VIỆT SANG VĂN BẢN 4.1 Mô tả hệ thống nhận dạng Những chức hệ thống nhận dạng tiếng nói thể sơ đồ sau: Quản lý mẫu Phân tích mẫu Huấn luyện mạng Quản lý mẫu Hình 4.1: Sơ đồ khối mô tả hệ thống nhận dạng tiếng nói 4.2 Mơ tả mạng nơron nhận dạng - Phương án lựa chọn số nút lớp mạng: theo kinh nghiệm chuyên gia mạng nơron tốn phân lớp có sử dụng mạng lan truyền ngược hướng, sử dụng lớp tính toán lớp mạng Kohonen làm lớp ẩn Ta xác định số nơron cho lớp + Số nơron lớp vào số chiều vector vào, ta chọn 12 hệ số cepstral đặc trưng mẫu, mẫu xử lý L khung tiếng nói, số nơ ron lớp vào 12*L, ví dụ sử dụng frames/mẫu số nơron lớp vào 60 + Số nơron lớp Kohonen số giá trị tập trả lời Ví dụ cần nhận dạng 10 từ từ mô tả vector vào 60 thành phần, lớp ẩn cần lưu trữ lời giải 600, cần số nơ ron lớp ẩn 625 nơron (ma trận nơron kích thước 25x25) + Số nơron lớp số lượng kết đầu ra, sử dụng phương pháp mã hoá số bit biểu diễn số lượng kết quả, ví dụ cần nhận dạng 128 từ cần nơron lớp ra, nơron cho phép mã hoá 27 = 128 giá trị - Phương pháp học cạnh tranh lớp ẩn q trình học có đạo lớp mạng theo bước sau: + Khởi tạo trọng số: thành phần ma trận trọng số khởi tạo giá trị ngẫu nhiên + Đọc tín hiệu vào cho mạng: liệu file mẫu chứa thông tin mẫu học cho kết gồm thành phần: mảng chiều chứa vector tín hiệu vào mảng chiều chứa ma trận trọng số liên kết ban đầu lớp Kohonen 55 + Hiệu chỉnh ma trận trọng số lớp Kohonen: hiệu chỉnh trọng số liên kết nơ ron lớp ẩn Kohonen cho mạng học mẫu tốt Từ mảng chiều chứa vector tín hiệu vào, mảng hai chiều chứa ma trận trọng số liên kết lớp ẩn số học amin, amax, tmax chức phải xác định mảng hai chiều chứa ma trận trọng số liên kết lớp ẩn theo công thức: HidWeight = HidWeight + rate(t)topo(Winner, i)(InVec(j) - HidWeight + Hiệu chỉnh ma trận trọng số lớp ra: hiệu chỉnh trọng số liên kết nơron lớp để tạo bảng tra cứu Từ mảng chiều chứa vector tín hiệu mảng hai chiều chứa ma trận trọng số liên kết lớp chức phải xác định mảng hai chiều chứa ma trận trọng số liên kết lớp cách hiệu chỉnh ma trận trọng số liên kết lớp theo công thức: OutWeight =OutVec(k) 4.3 Phương pháp nhận dạng - Đầu vào: file wave chứa liệu tín hiệu tiếng nói cần nhận dạng file dat chứa thông tin trọng số liên kết nơron lớp ẩn lớp Ngoài đầu vào nguồn âm từ micro thông qua sound card để làm, lúc liệu tiếng nói đọc buffer liệu - Đầu ra: kết cần nhận dạng - Quá trình nhận dạng tiếng nói thực qua bước: + Đọc tín hiệu vào: đọc liệu từ file wav từ buffer liệu âm + Xử lý tín hiệu giống chức phân tích LPC + Đọc ma trận trọng số liên kết lớp ẩn lớp mạng + Xác định nơron trung tâm + Tra cứu kết quả: tra cứu đồ topo mạng nơron để đưa giá trị cần nhận dạng 4.4 Xây dựng thuật toán công cụ Matlab Mạng nơron xây dựng với lớp ẩn hai hàm ẩn tương ứng hàm logsig hàm pureline Mạng có 10 đầu ứng với 10 từ Các tham số lựa chọn : + Số bậc LPC : + Các hệ số MFCC : 13 56 Việc cần làm, lựa chọn số nút ẩn tối ưu cho mơ hình mạng nơron Bắt đầu Trích đặc trưng tín hiệu mẫu để xây dựng liệu vector đặc trưng Khởi tạo mạng nơron M=100 Huấn luyện mạng với liệu mẫu Khởi tạo lại mạng nơron Số nút ẩn M Tính sai số học sai số kiểm tra M=M+10 M>350 S Đ Kết thúc Hình 4.2: Quá trình tìm tham số tối ưu cho mạng nơron Các hàm chính: + Hàm get_data.m gọi hàm con: data_lpc (hoặc data_mfcc) hàm matrix_lpc (hoặc matrix_mfcc) để thực trích đặc trưng tất mẫu liệu học xếp thành ma trận vector đặc trưng tương ứng với từ điều khiển + Hàm nr_train_all.m: đưa liệu vào huấn luyện cho mạng nơron Mạng sau huấn luyện lưu lại dạng file mat + Hàm nr_test.m: Sẽ load mạng nơron từ file mat đưa liệu qua mạng nơron huấn luyện để kiểm tra Các kết thu ứng với phương pháp trích đặc trưng 57 4.4.1 Trích chọn đặc trưng phương pháp LPC 77 76 75 74 73 72 71 70 69 % Sai s? h?c Sai s? ki?m tra Sè nót Èn 100 160 180 200 220 240 260 280 300 350 Hình 4.3: Mạng nơron với đặc trưng LPC Kết nhận dạng đạt : 91% 4.4.2 Trích chọn đặc trưng phương pháp MFCC 77 76 75 74 73 72 71 70 69 % Sai s? h?c Sai s? ki?m tra Sè nót Èn 100 160 180 200 220 240 260 280 300 350 Hình 4.4: Mạng nơron với đặc trưng MFCC Kết nhận dạng đạt : 94% 4.5 Kết luận chương Như vậy, qua trình thử nghiệm mơ phương pháp trích đặc trưng, em thấy lựa chọn mơ hình nơron với 250 nút ẩn, hàm truyền hàm logsigmoid hàm purelin Cùng với phương pháp trích đặc trưng MFCC 13 hệ số từ kết thu thấy phương pháp nhận dạng mạng nơron cho kết khả quan nhận dạng tới 94% 58 Chương KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI Mạng noron cơng cụ mạnh để giải tốn thực tế, ứng dụng nhiều lĩnh vực tin học, viễn thông ứng dụng đo lường, điều khiển… Trong luận văn trình bày tổng quan mạng Noron đưa tốn cụ thể ứng dụng để giải thành công Sau số kết đạt luận văn hạn chế, cuối hướng phát triển Kết đạt Nghiên cứu lý thuyết mạng nơron ứng dụng mạng nơron Nghiên âm thanh, tiếng nói, tiếng Việt Giải tốn nhận dạng chuyển đổi tiếng nói tiếng Việt sang văn phương pháp ứng dụng mạng nơron Hạn chế Chưa thể nhận dạng giọng nói người Thuật tốn trích chọn đặc trưng cịn hạn chế Chưa đưa nghiêm cứu nhiều thuật tốn trích đặc trưng tiếng nói để làm đầu vào cho mạng nơron Hướng phát triển Sẽ tiền xử lý tiếng nói trước đưa vào huấn luyện nhận dạng Nghiên cứu thêm số thuật toán để trích đặc trưng tốt tiếng nói Nghiên cứu thêm hệ mờ, mơ hình Marko ẩn, để kết hợp với mạng noron tạo thành công cụ mạnh phục vụ giải nhiều toán thực tế với độ tin cao 59 TÀI LIỆU THAM KHẢO A Tiếng Việt Bùi Cơng Cường, Nguyễn Dỗn Phước (2006), Hệ mờ mạng nơron ứng dụng, NXB Khoa học kỹ thuật PGS.TS Nguyễn Quang Hoan (2005), Nghiên cứu kết hợp phương pháp đại với giải thuật di truyền cho nhận dạng tiếng nói, tr 48-58 PGS.TS Nguyễn Quang Hoan, Bùi Đức Hùng, Phạm Đình Thế (2006) Hệ thống điều khiển cấu chấp hành tiếng Việt sở mạng nơron kết hợp với giải thuật di truyền, tr 372-377 PGS.TSKH Trần Hoài Linh (2014), Mạng Nơron ứng dụng xử lý tín hiệu, NXB Bách Khoa - Hà Nội B Tiếng Anh Kevin Gurney (2009), Neural networks, Vanhoucke Lauren Darcey, Shane Conder, Android Application Development in 24 hours, Material Robert Mcmillan, bussines, How Google retooled Android with help you’re your brain, Department of Psychology C Internet http://ebook.edu.vn http://android.vn http://vi.wikipedia.org/wiki/Mạng_nơ-ron http://vi wikipedia.org/wiki/Nhận_dạng_tiếng_nói http://www.mevietnam.org/NgonNgu/DXK/dxk-cautrucamtiet.html 60 PHỤ LỤC CODE ACTIVITY_MAIN 62 PHỤ LỤC CODE MAINACTIVITY package s2t.ungdung; import java.util.ArrayList; import java.util.List; import android.app.Activity; import android.app.SearchManager; import android.content.Intent; import android.content.pm.PackageManager; import android.content.pm.ResolveInfo; import android.os.Bundle; import android.speech.RecognizerIntent; import android.util.Log; import android.view.View; import android.widget.AdapterView; import android.widget.ArrayAdapter; import android.widget.Button; import android.widget.EditText; import android.widget.ListView; import android.widget.Spinner; import android.widget.Toast; public class MainActivity extends Activity { private static final int VOICE_RECOGNITION_REQUEST_CODE = 1001; private EditText metTextHint; private ListView mlvTextMatches; private Spinner msTextMatches; private Button mbtSpeak; @Override public void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); 63 setContentView(R.layout.activity_main); mlvTextMatches = (ListView) findViewById(R.id.lvTextMatches); msTextMatches = (Spinner) findViewById(R.id.sNoOfMatches); mbtSpeak = (Button) findViewById(R.id.btSpeak); checkVoiceRecognition(); } public void checkVoiceRecognition() { Log.v("", "checkVoiceRecognition checkVoiceRecognition"); // Kiem tra thiet bi cho phep nhan dang giong noi hay ko PackageManager pm = getPackageManager(); List activities = pm.queryIntentActivities(new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH), 0); if (activities.size() == 0) { mbtSpeak.setEnabled(false); Toast.makeText(this, "Voice recognizer not present", Toast.LENGTH_SHORT).show(); } } // Gui tap tin am public void speak(View view) { Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); // xac nhan ung dung muon gui yeu cau intent.putExtra(RecognizerIntent.EXTRA_CALLING_PACKAGE, getClass().getPackage().getName()); // goi y nhung dieu nguoi dung muon noi intent.putExtra(RecognizerIntent.EXTRA_PROMPT, metTextHint.getText().toString()); // goi y nhan dang nhung gi nguoi dung se noi 64 intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL, RecognizerIntent.LANGUAGE_MODEL_WEB_SEARCH); // Kiem tra item muon hien thi da chon tron spinner if (msTextMatches.getSelectedItemPosition() == AdapterView.INVALID_POSITION) { Toast.makeText(this, "Please select No of Matches from spinner", Toast.LENGTH_SHORT).show(); return; } int noOfMatches = Integer.parseInt(msTextMatches.getSelectedItem().toString()); // Xac dinh ban muon bao nhieu ket qua gan dung duoc tra ve intent.putExtra(RecognizerIntent.EXTRA_MAX_RESULTS, noOfMatches); // Gui yeu cau di startActivityForResult(intent, VOICE_RECOGNITION_REQUEST_CODE); } // Su kien nhan lai ket qua @Override protected void onActivityResult(int requestCode, int resultCode, Intent data) { if (requestCode == VOICE_RECOGNITION_REQUEST_CODE) // Truong hop co gia tri tra ve if(resultCode == RESULT_OK) { ArrayList textMatchList = data.getStringArrayListExtra(RecognizerIntent.EXTRA_RESULTS); if (!textMatchList.isEmpty()) { // kiem tra neu co chua tu khoa 'search' thi se bat dau tim kiem tren web if (textMatchList.get(0).contains("search")) { String searchQuery = textMatchList.get(0).replace("search", " "); 65 Intent search = new Intent(Intent.ACTION_WEB_SEARCH); search.putExtra(SearchManager.QUERY, searchQuery); startActivity(search); } else { // Hien thi ket qua mlvTextMatches.setAdapter(new ArrayAdapter(this, android.R.layout.simple_list_item_1, textMatchList)); } } // Cac truong hop loi } else if (resultCode == RecognizerIntent.RESULT_AUDIO_ERROR){ showToastMessage("Audio Error"); } else if (resultCode == RecognizerIntent.RESULT_CLIENT_ERROR){ showToastMessage("Client Error"); } else if (resultCode == RecognizerIntent.RESULT_NETWORK_ERROR){ showToastMessage("Network Error"); } else if (resultCode == RecognizerIntent.RESULT_NO_MATCH){ showToastMessage("No Match"); } else if (resultCode == RecognizerIntent.RESULT_SERVER_ERROR){ showToastMessage("Server Error"); } super.onActivityResult(requestCode, resultCode, data); } void showToastMessage(String message){ Toast.makeText(this, message, Toast.LENGTH_SHORT).show(); } } 66 ... lý tiếng nói chọn phương pháp phân tích, xử lý tiếng nói áp dụng chương trình Nhận dạng chuyển đổi tiếng nói tiếng Việt sang văn Hướng giải nhận dạng chuyển đổi tiếng nói tiếng Việt sang văn từ. .. nghiên cứu đặc trưng tiếng Việt nhận dạng chuyển đổi Chương TỔNG QUAN VỀ TIẾNG NÓI, TIẾNG VIỆT 1.1 Tiếng nói Tiếng nói loại sóng âm, nói tiếng nói truyền mang theo thơng tin dạng dao động phương... định tần số cắt không cách đưa ước lượng thô tần số tiếng nói chưa có phát biểu mang ý nghĩa vật lý tần số tiếng nói Nhưng sở quan trọng để nhận dạng tiếng nói việc nhận dạng điệu tiếng Việt 21

Ngày đăng: 06/07/2020, 20:54

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Bùi Công Cường, Nguyễn Doãn Phước (2006), Hệ mờ mạng nơron và ứng dụng, NXB Khoa học kỹ thuật Khác
2. PGS.TS. Nguyễn Quang Hoan (2005), Nghiên cứu kết hợp các phương pháp hiện đại với giải thuật di truyền cho nhận dạng tiếng nói, tr. 48-58 Khác
3. PGS.TS. Nguyễn Quang Hoan, Bùi Đức Hùng, Phạm Đình Thế (2006) Hệ thống điều khiển cơ cấu chấp hành bằng tiếng Việt trên cơ sở mạng nơron kết hợp với giải thuật di truyền, tr. 372-377 Khác
1. Kevin Gurney (2009), Neural networks, Vanhoucke Khác
2. Lauren Darcey, Shane Conder, Android Application Development in 24 hours, Material Khác
3. Robert Mcmillan, bussines, How Google retooled Android with help you’re your brain, Department of Psychology.C. Internet Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w