1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xử lý âm thanh trong Android OS

77 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 77
Dung lượng 1,47 MB

Nội dung

Xử lý âm thanh trong Android OS Xử lý âm thanh trong Android OS Xử lý âm thanh trong Android OS luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI HỒNG ĐỨC TUẤN Hồng Đức Tuấn KỸ THUẬT MÁY TÍNH VÀ TRUYỀN THƠNG XỬ LÝ ÂM THANH TRONG ANDROID OS LUẬN VĂN THẠC SĨ KỸ THUẬT KỸ THUẬT MÁY TÍNH VÀ TRUYỀN THƠNG CH2011B HàNội – 2013 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Hoàng Đức Tuấn XỬ LÝ ÂM THANH TRONG ANDROID OS Chuyên ngành : Kỹ thuật máy tính truyền thông LUẬN VĂN THẠC SĨ KỸ THUẬT KỸ THUẬT MÁY TÍNH VÀ TRUYỀN THƠNG NGƯỜI HƯỚNG DẪN KHOA HỌC TS NGUYỄN KIM KHÁNH Hà Nội – 2013 LỜI CẢM ƠN Để hồn thành luận văn này, tơi xin gửi lời cảm ơn chân thành tới tập thể thầy giáo, cô giáo trường Đại học Bách Khoa Hà Nội, viện Công nghệ thông tin Truyền thông đào tạo cho kiến thức, kinh nghiệm qúy báu suốt thời gian học tập rèn luyện Xin gửi lời cảm ơn tới thầy giáo, Ts Nguyễn Kim Khánh - Giảng viên môn Kĩ thuật máy tính, viện Cơng nghệ thơng tin Truyền thơng, trường Đại học Bách Khoa Hà Nội tận tình hướng dẫn tơi q trình làm luận văn Cuối lời cảm ơn chân thành tới gia đình, bạn bè, đồng nghiệp động viên, góp ý tạo điều kiên tốt để tơi hoàn thành luận văn Tuy nhiên, thời gian trình độ có hạn nên luận văn chắn khơng tránh khỏi thiếu sót, tơi mong đóng góp ý kiến thầy, toàn thể bạn Xin chân thành cảm ơn Hà Nội ngày 10 tháng 03 năm 2013 Tác giả Hoàng Đức Tuấn MỤC LỤC LỜI CẢM ƠN MỤC LỤC LỜI CAM ĐOAN DANH MỤC TỪ VIẾT TẮT, THUẬT NGỮ .5 DANH MỤC HÌNH VẼ .6 MỞ ĐẦU .7 Lý chọn đề tài Lịch sử nghiên cứu Mục đích, đối tượng phạm vi nghiên cứu Tóm tắt luận điểm đóng góp luận văn .8 Phương pháp nghiên cứu NỘI DUNG CHƯƠNG1 TỔNG QUAN VỀ ANDROID VÀ MODULE XỬ LÝ ÂM THANH TRONG ANDROID 1.1 Tổng quan hệ điều hành Android 1.1.1 Tìm hiểu Android OS .9 1.1.2 Kiến trúc Android OS .13 1.1.3 Tổng quan ứng dụng Android .15 1.1.4 Chu kì ứng dụng Android 15 1.2 Module xử lý âm Android 17 1.2.1 Tổng quan OpenCore MutilMedia Framework 17 1.2.2 OpenCore xử lý âm tiếng nói Android .20 CHƯƠNG XỬ LÝ ÂM THANH VÀ TIẾNG NÓI TRONG ANDROID 25 2.1 Các tiến trình xử lý âm tiếng nói Android .25 2.2 Quản lý nâng cao xử lý âm thanh, tiếng nói Adroid 29 CHƯƠNG XÂY DỰNG CHƯƠNG TRÌNH NHẬN DẠNG TIẾNG NÓI TRÊN ANDROID 35 3.1 Cơ sở lý thuyết công nghệ áp dụng .35 3.1.1 Tổng quan nhận dạng tiếng nói 35 3.1.2 Phát tiếng nói tiền xử lý trích chọn đặc trưng 35 3.1.3 Lượng tử vector 41 3.1.4 Mơ hình Markov ẩn nhận dạng tiếng nói 46 3.1.5 Các loại HMM 51 3.2 Xây dựng chương trình nhận dạng tiếng nói 54 3.2.1.Lưu trữ âm vào file pcm file wav 54 3.2.2 Lấy liệu âm từ micro phát từ 59 3.2.3 Khối trích chọn đặc trưng MFCC 62 3.2.4 Tổ chức hệ thống nhận dạng 63 3.2.5.Lưu trữ vào load liệu sở liệu SQLite 67 4.1 Các kết đạt 71 4.2 Đánh giá định hướng 72 KẾT LUẬN 74 Tài liệu tham khảo .75 LỜI CAM ĐOAN Tôi xin cam đoan đề tài nghiên cứu tơi hồn tồn tơi tự làm hướng dẫn thầy giáo Ts Nguyễn Kim Khánh, Viện công nghệ thông tin truyền thông-Đại học Bách Khoa Hà Nội Những kết nghiên cứu, thử nghiệm thực thiết bị thử nghiệm Các số liệu, kết trình bày luận văn hoàn toàn trung thực chưa cơng bố cơng trình Các tài liệu tham khảo sử dụng luận văn dẫn nguồn (có bảng thống kê tài liệu tham khảo) đồng ý trực tiếp tác giả Nếu xảy điều không lời cam đoan trên, tơi xin chịu hồn tồn trách nhiệm trước Viện Nhà trường Hà Nội, ngày 10 tháng 03năm 2013 Tác giả Hoàng Đức Tuấn DANH MỤC TỪ VIẾT TẮT, THUẬT NGỮ Số thứ tự Từ viết tắt Ý nghĩa OS Operating System (hệ điều hành) SDK Software Devepment Kit API Application Programming Interface Android OS Hệ điều hành Android Packet Đơn vị đóng gói liệu để truyền OHA Open Handset Alliance OMX OpenMaX MFCC Mel-frequency cepstral coefficients FTT Fast Fourier Tranform 10 DFT Discrete Fourier Tranform 11 DCT Discrete Cosin Tranform 12 HMM Hidden Markov Model 13 VQ Vector Quantization 14 PCM Pulse Code Modulation 15 WAV Wave 16 ID Identification 17 LPC Linear Predict Code 18 ANN Artificial Neural Network DANH MỤC HÌNH VẼ Hình Giới thiệu hệ điều hành Android .9 Hình Kiến trúc Android OS 13 Hình Sơ đồ trạng thái Activity 16 Hình Sơ đồ tổng quan OpenCore Multimedia Framework 19 Hình OpenCore mã hóa âm cho Android .20 Hình Mơ hình thiết kế OpenCore mã hóa âm cho Android 21 Hình Kết hiệu mã hóa âm xử lý AMR9E 23 Hình Sơ đồ trạng thái tiến trình lưu trữ âm Android 25 Hình Sơ đồ trạng thái tiến trình phát âm Android 27 Hình 10 Quá trình tính tốn hệ số MFCC 38 Hình 11 Sơ đồ chi tiết tính tốn hệ số MFCC .38 Hình 12 Các băng lọc tam giác theo tần số Mel 40 Hình 13 Sơ đồ khối cấu trúc VQ huấn luyện phân lớp 43 Hình 14 Lưu đồ giải thuật LBG 44 Hình 15 Lưu đồ giải thuật Binary Split .46 Hình 16 Minh họa mơ hình Markov 47 Hình 17 Mơ hình tính tốn kết thí nghiệm thả đồng xu 49 Hình 18 Minh họa kiểu HMM 52 Hình 19 Mơ hình Bakis trạng thái 53 Hình 20 Minh họa ghi âm 56 Hình 21 Chuyển đổi dạng pcm sang wav 57 Hình 22 Quá trình xử lý âm từ micro .59 Hình 23 Giải thuật phát điểm đầu cuối từ phát âm .61 Hình 24 Bộ đệm vịng để lưu liệu âm từ micro 62 Hình 25 Huấn luyện ban đầu cho chương trình nhận dạng tiếng nói 66 Hình 26 Huấn luyện bổ sung từ cho chương trình nhận dạng tiếng nói 67 Hình 27 Bảng lưu trữ đặc trưng MFCC sở liệu .68 Hình 28 Bảng lưu trữ HMM huấn luyện .70 Hình 29 Bảng Cluster- lưu cụm có nhờ clustering .70 Hình 30 Một số hình ảnh chương trình nhận dạng 72 MỞ ĐẦU Lý chọn đề tài Ngày với phát triển mạnh mẽ tồn diện cơng nghệ thơng tin nói chung, thiết bị thông minh sử dụng hệ điều hành Android ngày phát triển.Bên cạnh cạnh tranh không ngừng nhà sản xuất thiết bị phần cứng phần mềm nhằm đưa sản phẩm tối ưu tiện ích Dựa xu đó, kết hợp cơng nghệ xử lý âm Android lý thuyết xử lý tiếng nói, luận văn nghiên cứu xây dựng ứng dụng xử lý âm tiếng nói hệ điều hành Android, giúp người dùng đặc biệt người Việt tương tác với thiết bị thông minh theo cách tiện lợi thân thiện Lịch sử nghiên cứu Luận văn thực hướng dẫn thầy giáo Ts Nguyễn Kim Khánh, Viện Công nghệ thông Truyền thông-Đại học Bách Khoa Hà Nội.Luận văn phát triển tảng nghiên cứu tác giả hệ điều hành Android từ đồ án tốt nghiệp đại học trường Đại học Bách Khoa Hà Nội tháng năm 2011.Trong trình nghiên cứu hướng dẫn, xem xét điều chỉnh, báo cáo theo lịch đặn tuần/ lần với giáo viên hướng dẫn.Luận văn bắt đầu nghiên cứu từ tháng 10/2012 hoàn thành vào tháng 03/2013 Mục đích, đối tượng phạm vi nghiên cứu Mục đích luận văn tìm hiểu kiến trúc hệ điều hành Android, chu kì ứng dụng Android,module xử lý âm Android: OpenCore MultiMedia Framework xử lý âm thanh,tìm hiểu tiến trình xử lý, quản lý nâng cao xử lý âm Android.Nghiên cứu cơng nghệ nhận dạng tiếng nói mơ hình nhận dạng tiếng nói từ xây dựng chương trình nhận dạng tiếng nói hệ điều hành Android,triển khai, đánh giá nghiệm thu thiết bị di động chạy Android Đối tượng, phạm vi nghiên cứu luận văn hệ điều hành Android phương pháp xử lý tiếng nói Tóm tắt luận điểm đóng góp luận văn Mục tiêu luận văn nghiên cứu xử lý âm tiếng nói hệ điều hành Android, nghiên cứu lý thuyết xử lý tín hiệu tiếng nói, từ xây dựng chương trình nhận dạng tiếng Việt điện thoại Android phục vụ cho nhiều mục đích xử lý âm tiếng nói di động Nội dung luận văn gồm: Chương I: Tổng quan Android module xử lý âm Android Chương tập trung đề cập đến tảng công nghệ phát triển ứng dụng cho luận văn: - Giới thiệu môi trường lập trình ứng dụng cho Android - Tìm hiểu module xử lý âm hệ điều hành Android Chương II: Xử lý âm tiếng nói Android Chương tập trung tìm hiểu tiến trình xử lý âm android đồng thời quản lý nâng cao xử lý âm Android - Tìm hiểu tiến trình xử lý âm tiếng nói android - Nghiên cứu quản lý nâng cao xử lý âm Ándroid Chương III: Xây dựng chương trình nhận dạng tiếng nói Android Nghiên cứu lý thuyết xử lý tiếng nói Xây dựng giải thuật, cài đặt chương trình để phát triển ứng dụng nhận dạng tiếng nói Android Chương IV: Kết đánh giá.Chương tập trung vào đánh giá kết đạt được, đưa phương hướng phát triển cho hệ thống sau luận văn kết luận - Phương pháp nghiên cứu - Luận văn phát triển từ nghiên cứu tác giả hệ điều hành Android từ đồ án tốt nghiệp đại học - Về lý thuyết, công nghệ: Nghiên cứu hệ điều hành Android, xử lý âm Android, lý thuyết xử lý tiếng nói mơ hình xử lý tiếng nói thơng qua tài liệu tác giả nước, website báo cần thiết để phát triển luận văn - Về thực hành: Kết quả, chương trình luận văn cài đặt thử nghiệm thiết bị di động chạy hệ điều hành Android Samsung,LG,Sky Hình 23 Giải thuật phát điểm đầu cuối từ phát âm Sau phát đầu cuối trích xuất từ xác định từ đệm Bộ đệm dạng vòng, biết điểm bắt đầu kết thúc đọc phần liệu 61 Hình 24 Bộ đệm vịng để lưu liệu âm từ micro 3.2.3 Khối trích chọn đặc trưng MFCC Được cài đặt lớp MFCC gói extractFeature Khởi tạo để thực trích chọn đặc trưng : public MFCC(int nnumberOfParameters, double dsamplingFrequency, int nnumberofFilters, int nFFTLength, boolean oisLifteringEnabled, int nlifteringCoefficient, boolean oisZeroThCepstralCoefficientCalculated) { + nnumberOfParameters : số hệ số MFCC cần tính ( từ 12-18 ) 12 hệ số đầu ( trừ hệ số ) chứa hầu hết thông tin nên chọn 12, để đảm bảo hiệu + dsamplingFrequency : tần số lấy mẫu tiếng nói, chọn 8000Hz + nnumberofFilters : số lọc tính MFCC + nFFTLength : độ dài mảng đưa vào tính FFT, độ dài cửa số âm đưa vào để tính MFCC, phải lũy thừa 62 + oisLifteringEnabled : lifter lọc miền cepstral nói phần lý thuyết Đây cờ cho phép tính cepstral có trọng số đề tài tơi có dùng để tăng xác + nlifteringCoefficient : số hệ số việc lọc miền cepstral + oisZeroThCepstralCoefficientCalculated: Có tính hệ số MFCC hay khơng, hệ số khơng quan trọng nên bỏ qua Các thao tác tính MFCC lập trình theo hình Tính hệ số MFCC từ sổ liệu âm Kết trả mảng double Public class MFCC { … public double[] getParameters(double[] fspeechFrame) { … } 3.2.4 Tổ chức hệ thống nhận dạng +Cách : Lưu từ vào file , từ khoảng file đánh tên file sau: ví dụ với số gồm file 01,02,03,04,05 Dùng vòng lặp để đọc file huấn luyện cho HMM số Các từ tự cắt sẵn máy tính q trình huấn luyện khơng cần phát đầu cuối từ , có bất lợi : trước hết khơng tự động phải làm tay 63 máy tính , thứ việc cắt tay khác biệt với hàm phát đầu cuối gây thiếu xác nhận dạng từ đọc vào Hoặc file âm số chưa cắt từ nhận dạng dùng hàm phát đầu cuối để lấy từ cần huấn luyện , tốn nhiều thời gian mà mang tính thủ cơng cần tạo sẵn file âm riêng từ + Cách ghi âm file toàn số tiến hành đọc file huấn luyện Chẳng hạn ta ghi âm file đọc số từ -> với số lần tùy ý Sẽ cần thứ tự từ chuỗi âm Sau tạo hàm đọc file lấy tất từ huấn luyện cho tất HMM ( cho nhận dạng số ) Sẽ dựa vào chuỗi thứ tự để xác định từ huấn luyện cho HMM Cách có ưu điểm tính tự động cao , cần ghi âm lần tất cho chương trình tự động huấn luyện xong Tuy nhiên , cần từ nhận xác định đầu cuối không , đoạn nhiễu bị xác định nhầm thành từ làm sai tồn phần phía sau , phải huấn luyện lại tất Hơn ghi âm đoạn dài xác suất bị nhiễu sai lại cao Theo cách nên để từ theo thứ tự nhanh đọc hết liệu từ đọc rời rạc Trong trường số lượng từ nhỏ huấn luyện số , số lượng từ lớn ( tầm vài chục ) cách rõ ràng không khả thi dễ sai lẫn + Cách huấn luyện cho từ với với chuỗi âm từ Ví dụ với số huấn luyện file âm đọc số nhiều lần Cách cân tự động hóa khả sai lệch Độ linh hoạt mở rộng cao huấn luyện cho từ Chỉ cần cho đầu vào chuỗi âm sóng âm từ đó, số lần ( để kiểm tra việc phát từ có phát số lượng – cần ) tên từ huấn luyện HMM , thêm vào danh sách HMM có 64 Lưu trữ liệu cho nhận dạng tiếng nói : lưu HMM huấn luyện để sau cần load từ sở liệu dùng khơng phải huấn luyện lại Ngoài , nhu cầu huấn luyện thêm, huấn luyện lại ( nhiều ) từ , nên cần lưu trữ thêm liệu trung gian, hệ số MFCC tính Do huấn luyện thêm từ khơng phải tính hết MFCC -> giảm nhiều thời gian 65 Hình 25 Huấn luyện ban đầu cho chương trình nhận dạng tiếng nói 66 Hình 26 Huấn luyện bổ sung từ cho chương trình nhận dạng tiếng nói 3.2.5.Lưu trữ vào load liệu sở liệu SQLite Dữ liệu android nhiều hệ điều hành di đông iOS sử dụng SQLite, giống SQL đơn giản cho phép luồng liệu truy cập lúc Do cần ý khơng cho hay nhiều luồng truy cập vào DataBase thời điểm 67 a.Lưu trữ đặc trưng MFCC Bước trích trọn đặc trưng MFCC tiếng nói nhiều thời gian Các đặc trưng cần dùng đến huấn luyện thêm từ Do việc lưu trữ lại giúp tiết kiệm thời gian, tăng tốc độ huấn luyện thêm từ Bảng đặc trưng ( hình , đặt tên “mfcc_table” ) gồm trường : + Tên từ tiếng nói: từ cần nhận dạng + Số thứ tự lần phát âm : từ phát âm nhiều lần, lần phát âm gồm nhiều dòng lưu đặc trưng Ví dụ từ “0”, lần phát âm thứ gồm tất dịng có trường thứ “0” trường thứ hai “1” (hình dưới) + Các đặc trưng MFCC : 12 đặc trưng mfcc1, mfcc2, … đạo hàm: d1,d2,… , tổng cộng 24 cột Bảng MFCC sau ( trường rowid coi khơng có, SQLite tự đưa vào ): Hình 27 Bảng lưu trữ đặc trưng MFCC sở liệu 68 b.Lưu trữ HMM ( Hidden Markov Model) huấn luyện Ta lưu trữ Hmm huấn luyện vào sở liệu , load từ sở liệu để nhận dạng mà huấn luyện lại Khi thực huấn luyện lại ( thay thêm từ ) liệu cũ bị xóa thay liệu Dưới bảng lưu Hmm Mỗi HMM gồm có phần : + Xác suất ban đầu + Xác suất chuyển trạng thái + Xác suất quan sát Bảng tạo động trình lưu nên linh hoạt, phụ thuộc vào tham số HMM ( số trạng thái HMM, số quan sát trạng thái ) Giả sử HMM có n trạng thái Các cột gồm : hmmId từ tương ứng với hmm đó, cột thứ attribute_name : a để xác suất chuyển trạng thái, opdf để xác suất quan sát Tiếp theo gồm n cột giá trị double Ứng với hmm lưu, n dịng đầu cột attribute_name có giá trị a , lưu tồn xác suất chuyển trạng thái aij ( i : dịng thứ i hmm , j : cột thứ j sau cột attribute_name) Còn m dòng (m số kiện quan sát - số phân vùng bước clustering) lưu xác suất quan sát Pij ( P ma trận { n x m } , i : cột thứ i sau cột attribute, j : dòng thứ j mà attribute_name = "opdf" hmm ) 69 Hình 28 Bảng lưu trữ HMM huấn luyện c.Lưu trữ phân vùng (cluster) vào SQLite Lưu Cluster : Các vector MFCC lấy 12 hệ số , sau thực phân vùng để cluster (Hiện để 18 vùng) Mỗi vùng đại diện vector 12 thành phần double, centroid cluster Và lưu vào bảng đơn giản sau : Hình 29 Bảng Cluster- lưu cụm có nhờ clustering 70 CHƯƠNG KẾT QUẢ VÀ ĐÁNH GIÁ 4.1 Các kết đạt - Luận văn nghiên cứu làm rõ module xử lý âm hệ điều hành Android, tiến trình xử lý, quản lý nâng cao xử lý âm Android - Nghiên cứu lý thuyết mơ hình xử lý tiếng nói từ đưa bước xử lý giai đoạn mơ hình - Xây dựng giải thuật xử lý tiếng nói phát từ, trích chọn đặc trưng, phân tích tổ chức huấn luyện, lưu trữ từ phát từ hồn thành chương trình nhận dạng tiếng nói hệ điều hành Android - Chương trình nhận dạng tiếng nói cài đặt sử dụng ngôn ngữ Java tảng Android SDK tích hợp cơng cụ Esclipse - Chương trình nhận dạng nhận dạng số tiếng việt đọc vào từ 0-9 tiến tới quay số sau kết thúc đọc - Kết nhận dạng mở hướng nghiên cứu xây dựng ứng dụng khác thông qua việc nhận dạng xử lý tiếng Việt hệ điều hành Android Một số hình ảnh chương trình cài đặt thử nghiệm: 71 Hình 30 Một số hình ảnh chương trình nhận dạng 4.2 Đánh giá định hướng  Đánh giá: - Luận văn mở nghiên cứu vấn đề xử lý âm hệ điều hành Android, tiến trình xử lý âm thanh, quản lý nâng cao xử lý âm Android Tìm hiểu lý thuyết nhận dạng tiếng nói, tập trung chủ yếu vào mơ hình nhận dạng dựa xác suất thống kê mơ hình markov ẩn - Cài đặt thuật tốn xử lý tín hiệu tiếng nói, trích trọn đặc trưng mơ hình nhận dạng xây dựng thành ứng dụng nhận dạng tiếng nói hệ điều hành Android - Tuy nhiên nhiều hạn chế, việc sở liệu nhận dạng chưa đồng cho nhiều người mà cho người Trong mơi trường có nhiều nhiễu bị ảnh hưởng lớn hệ thống xử lý âm điện thoại khơng tốt , gây nhiều sai nhiễu Hiệu chương trình vấn đề lớn cần cải thiện  Định hướng cải thiện phát triển: 72 - Nghiên cứu sâu phần cứng encode decode âm Android từ đưa phương pháp nâng cao chất lượng âm điện thoại - Trích chọn đặc trưng kết hợp MFCC LPC (dự đoán truyến tính), tức có hệ thống dựa trích chọn đặc trưng MFCC LPC để tăng độ tin cậy - Nghiên cứu phương pháp lọc nhiễu để cải thiện chất lượng âm tăng tính xác, mở rộng tập liệu dành cho nhiều người sử dụng - Kết hợp mơ hình markov ẩn mạng nơ ron Mạng ANN có ưu điểm bật khả phân lớp Tuy nhiên nhược điểm khơng thích hợp với tín hiệu tiếng nói dài, biến thiên theo thời gian Để khắc phục nhược điểm số mạng ANN đề xuất bao gồm mạng ANN thời gian trễ, mạng ANN hồi quy Hệ thống nhận dạng lai ghép giữ mạng nơ ron mơ hình Markov ẩn với mục đích để tận dụng hai ưu điểm hai phương pháp nhận dạng : khả phân lớp mạng nơ ron khả mơ hình hóa thơng tin thời gian mơ hình Markov ẩn 73 KẾT LUẬN Với mục tiêu ban đầu đề nghiên cứu xử lý âm hệ điều hành Android lý thuyết xử lý tiếng nói để xây dựng ứng dụng xử lý tiếng nói mà cụ thể tiếng Việt tạo tiện lợi thao tác người dùng điện thoại thay cho xử lý truyền thống, đạt kết định rút nhiều kinh nghiệm cho thân sau hoàn thành luận văn này: • Về lý thuyết : Nghiên cứu hệ điều hành Android, nghiên cứu module xử lý âm Android, OpenCore xử lý âm Android, xử lý, quản lý nâng cao xử lý âm Android Nghiên cứu lý thuyết xử lý tiếng nói, mơ hình xử lý tiếng nói, nghiên cứu mơ hình Markov ẩn xử lý tiếng nói • Về thực hành kết quả: Xây dựng giải thuật mơ hình xử lý tiếng nói, cài đặt thuật tốn, xây dựng chương trình xử lý nhận dạng tiếng nói sử dụng ngơn ngữ Java cơng cụ Eclipse có tích hợp Android SDK Kết chương trình nhận dạng số từ 0-9 hướng tới việc quay số giọng nói, chương trình cài đặt thử nghiệm số điện thoại chạy Android Trong q trình làm, tơi gặp khơng khó khăn giai đoạn phần việc định, từ việc tiếp cận dung hòa vấn đề xử lý âm tiếng việt Android đến việc giải vấn đề đặt ra.Nhưng trợ giúp tất người tơi dần hồn thành luận văn mình, đúc rút nhiều kinh nghiệm phục vụ cho công việc sau Một lần nữa, cho phép gửi lời cảm ơn chân thành sâu sắc tới cá nhân tập thể tận tình giúp đỡ tơi hồn thành luận văn mình: thầy giáo hướng dẫn TS Nguyễn Kim Khánh, công ty VTC Intecom, tập thể thầy cô giáo môn Kỹ thuật máy tính, viện Cơng nghệ thơng tin truyền thơng, trường Đại học Bách Khoa Hà Nội giúp đỡ để tơi hồn thành luận văn Xin chân thành cảm ơn! 74 Tài liệu tham khảo [1] Ed Burnette : Hello, Android [2] Frank Ableson, Charlie Collins Robi Sen : Unlocking Android [3] Reto Meier: Professional Android Application Development [4] Fundamentals of Speech recognition – Lawrence Rabiner , Biing Hwang Juang Prentice-Hall International, Inc 1993 [5] “A tutorial on Hidden Markov Models and Selected Application in Speech Recognition”, IEEE, 1989 [6]Mạng nơ ron mơ hình markov ẩn nhận dạng tiếng Việt – Dự thảo luận án tiến sĩ Toán-Tin học , Đặng Ngọc Đức, khoa Toán – tin – Trường ĐH Quốc gia Hà Nội [7]Speech Processing in Embeded Systems, priyabrata Sinha Springer [8] Website : http://developer.android.com 75 ... hành Android Chương II: Xử lý âm tiếng nói Android Chương tập trung tìm hiểu tiến trình xử lý âm android đồng thời quản lý nâng cao xử lý âm Android - Tìm hiểu tiến trình xử lý âm tiếng nói android. .. trúc hệ điều hành Android, chu kì ứng dụng Android, module xử lý âm Android: OpenCore MultiMedia Framework xử lý âm thanh, tìm hiểu tiến trình xử lý, quản lý nâng cao xử lý âm Android. Nghiên cứu... tiếng nói Android .20 CHƯƠNG XỬ LÝ ÂM THANH VÀ TIẾNG NÓI TRONG ANDROID 25 2.1 Các tiến trình xử lý âm tiếng nói Android .25 2.2 Quản lý nâng cao xử lý âm thanh, tiếng nói Adroid 29

Ngày đăng: 01/05/2021, 09:33

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w