1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nhận dạng tự động các phương ngữ chính của tiếng việt nói

88 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 88
Dung lượng 1,65 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI  - NGUYỄN THU HUYỀN NHẬN DẠNG TỰ ĐỘNG CÁC PHƯƠNG NGỮ CHÍNH CỦA TIẾNG VIỆT NĨI Chun ngành: Cơng nghệ thơng tin LUẬN VĂN THẠC SĨ KỸ THUẬT CƠNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TS NGUYỄN HỒNG QUANG HÀ NỘI – 2014 LỜI CAM ĐOAN Tôi Nguyễn Thu Huyền, học viên lớp Cao học CNTT 2012 – 2014 Trƣờng Đại học Bách khoa Hà Nội – cam kết Luận văn tốt nghiệp cơng trình nghiên cứu thân dƣới hƣớng dẫn TS Nguyễn Hồng Quang - Viện Công nghệ Thông tin Truyền thông – Đại học Bách khoa Hà Nội Các kết luận văn tốt nghiệp trung thực, khơng chép tồn văn cơng trình khác Hà Nội, ngày 22 tháng năm 2014 Học viên: Nguyễn Thu Huyền Lớp:12ACNTT-HY LỜI CẢM ƠN Tơi xin bày tỏ lịng biết ơn sâu sắc tới Thầy giáo, TS Nguyễn Hồng Quang –Bộ môn Kỹ thuật máy tính – Viện Cơng nghệ Thơng tin Truyền thông – Đại học Bách khoa Hà Nội, ngƣời Thầy kính mến hết lịng giúp đỡ, dạy bảo, động viên tạo điều kiện thuận lợi cho tơi suốt q trình học tập hồn thành luận văn tốt nghiệp Tôi xin chân thành cảm ơn tập thể thầy, cô giáo trƣờng Đại học Bách khoa Hà Nội nói chung Viện Cơng nghệ Thơng tin Truyền thơng nói riêng tận tình giảng dạy truyền đạt cho kiến thức, kinh nghiệm quý báu suốt năm học vừa qua Tôi xin cảm ơn giảng viên đồng nghiệp trƣờng Đại học Sƣ phạm Kỹ thuật Hƣng Yên tạo điều kiện thời gian để tơi học tập hồn thành luận văn Cuối tơi xin chân thành cảm ơn gia đình, bạn bè ủng hộ động viên lúc khó khăn MỤC LỤC MỞ ĐẦU 10 Lý chọn đề tài 10 Đối tƣợng nghiên cứu 11 Phƣơng pháp nghiên cứu 11 Nhiệm vụ nghiên cứu 11 CHƢƠNG 1: CƠ SỞ LÝ THUYẾT 12 1.1 Tổng quan phƣơng ngữ 12 1.2 Đặc điểm ngữ âm phƣơng ngữ ba vùng lãnh thổ Việt Nam 13 1.2.1 Những đặc điểm ngữ âm phƣơng ngữ Bắc 13 1.2.2 Những đặc điểm ngữ âm phƣơng ngữ Trung 13 1.2.3 Những đặc điểm ngữ âm phƣơng ngữ Nam 14 1.2.4 Phân biệt ngữ âm phƣơng ngữ ba vùng lãnh thổ Việt Nam 15 1.2.5 Phân biệt đại từ phƣơng ngữ 16 1.3 Một số phƣơng pháp nhận dạng phƣơng ngữ… 16 1.3.1 Mơ hình nhận dạng Gaussian Mixture Model (GMM ) 16 1.3.2 Phƣơng pháp lƣợng tử hoá vectơ 18 1.3.3 Mô hình phổ quát (UBM) 19 1.3.4 Phƣơng pháp nhận dạng tổng quát 20 1.3.5 Sơ đồ hệ thống nhận dạng tự động phƣơng ngữ 21 1.4 Các công cụ sử dụng đề tài 22 1.4.1.Phần mềm VMware Workstation 22 1.4.2 Hệ điều hành Centos-Linux 22 1.4.3 Bộ công cụ nhận dạng Alize [20] 23 1.4.4 Bộ công cụ Spro … 24 1.5 Ngơn ngữ lập trình python 24 CHƢƠNG TRIỂN KHAI HỆ THỐNG NHẬN DẠNG TỰ ĐỘNG CÁC PHƢƠNG NGỮ CHÍNH CỦA TIẾNG VIỆT NĨI 25 2.1 Sơ đồ tổng quan hệ thống nhận dạng tự động phƣơng ngữ tiếng Việt nói 25 2.1.1 Sơ đồ huấn luyện (trainning) nhận dạng tự động phƣơng ngữ tiếng Việt nói 26 2.1.2 Sơ đồ thử nghiệm nhận dạng tự động phƣơng ngữ tiếng Việt nói 27 2.2 Xây dựng sở liệu 27 2.2.1 Phƣơng pháp thu âm 27 2.2.2 Đặc điểm sở liệu tiếng nói 29 2.2.3 Sử dụng sở liệu tiếng nói tốn nhận dạng phƣơng ngữ 31 2.3 Phƣơng pháp xây dựng hệ thống nhận dạng tự động phƣơng ngữ tiếng Việt nói 33 2.3.1 Sơ đồ tổng quan nhận dạng tự động phƣơng ngữ tiếng Việt nói sử dụng cơng cụ ALIZE, Spro 33 2.3.2 Các bƣớc nhận dạng tự động phƣơng ngữ tiếng Việt nói sử dụng ALIZE 34 2.4 Các thử nghiệm đánh giá kết nhận dạng phƣơng ngữ tiếng Việt nói 41 2.4.1 Thử nghiệm 41 2.4.2 Thử nghiệm 55 CHƢƠNG 3: KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 65 3.1 Những vấn đề giải luận văn 65 3.2 Hƣớng phát triển đề tài 66 TÀI LIỆU THAM KHẢO 67 A Cài đặt CSDL chƣơng trình 69 A1 Thống kê chi tiết thu âm liệu 69 A2 Hƣớng dẫn cài đặt hệ điều hành Centos 72 A3 Cài đặt công cụ Alize hệ điều hành Centos-Linux 76 B Mã nguồn chƣơng trình 77 B1 Chƣơng trình tính tham số MFCC 77 B2 Chƣơng trình tạo file ndx 78 B3 Chƣơng trình tính tỷ lệ nhận dạng 78 C Cấu trúc gói thƣ viện LIA-RAL 80 DANH MỤC KÝ HIỆU, CHỮ VIẾT TẮT Chữ viết tắt Chữ viết tiếng Anh Nghĩa tiếng Việt ASR Automatic Speech Recognition Nhận dạng tiếng nói tự động EM Expectation – Maximization Thuật toán cực đại kỳ vọng GMM Gaussian Mixture Model Mơ hình hỗn hợp Gauss HMM Hidden Markov Model Mơ hình Markov ẩn MFCC Mel - Frequency Cepstral Hệ số Cepstral theo thang đo Coefficients tần số Mel UBM Universal Background Model Mơ hình phổ qt VQ Vector Quantization Lƣợng tử hoá Vectơ WER Word Error Rate Tỷ lệ lỗi nhận dạng từ DANH MỤC HÌNH Hình 1.1 Hàm mật độ Gauss 17 Hình 1.2 Mơ hình GMM 18 Hình 1.3 Mơ hình phổ quát 19 Hình 1.4 Sơ đồ hệ thống nhận dạng tổng quát 20 Hình 1.5 Mơ hình xác định phƣơng ngữ 21 Hình 2.1 Các bƣớc thực nhận dạng tự động phƣơng ngữ tiếng Việt nói 25 Hình 2.2 Sơ đồ huấn luyện nhận dạng tự động phƣơng ngữ tiếng Việt nói: 26 Hình 2.3 Sơ đồ thử nghiệm (test) nhận dạng tự động phƣơng ngữ: 27 Hình 2.4 Hình dạng âm đƣợc hiển thị phần mềm Cool Edit 28 Hình 2.5 Sơ đồ bƣớc thực nhận dạng phƣơng ngữ 33 DANH MỤC BIỂU ĐỒ Biểu đồ 2.1 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập A_gioitinhNam 42 Biểu đồ 2.2 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập B_gioitinhNam 43 Biểu đồ 2.3 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập C_GioitinhNam 44 Biểu đồ 2.4 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập D_ GioitinhNam 45 Biểu đồ 2.5 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập A_GioitinhNu 46 Biểu đồ 2.6 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập B_gioitinhNu 47 Biểu đồ 2.7 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập C_gioitinhNu 48 Biểu đồ 2.8 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập D_gioitinhNu 49 Biểu đồ 2.9 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập A_ giới tính Nam giới tính Nữ 51 Biểu đồ 2.10 So sánh tỷ lệ nhận dạng tập B_ giới tính Nam giới tính Nữ 52 Biểu đồ 2.11 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập C_ giới tính Nam giới tính Nữ 53 Biểu đồ 2.12 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập D_ giới tính Nam giới tính Nữ 54 Biểu đồ 2.13 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập A_khonggioitinh 56 Biểu đồ 2.14 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập B_khonggioitinh 57 Biểu đồ 2.15 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập A_giơitinhNam 59 Biểu đồ 2.16 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập B_gioitinhNam 60 Biểu đồ 2.17 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập AgioitinhNu 62 Biểu đồ 2.18 So sánh tỷ lệ nhận dạng theo phƣơng ngữ tập BgioitinhNu 63 DANH MỤC BẢNG Bảng 1.1 Phân biệt ngữ âm phƣơng ngữ ba vùng lãnh thổ Việt Nam 15 Bảng 1.2 Phân biệt đại từ phƣơng ngữ 16 Bảng 2.1 Tổng hợp liệu thu âm 28 Bảng 2.2 Tổng hợp liệu sử dụng dùng để huấn luyện thử nghiệm: 29 Bảng 2.3 Thống kê liệu thu âm Miền Bắc (CSDL_Bac) 29 Bảng 2.4 Thống kê liệu thu âm Miền Trung (CSDL_Trung) 30 Bảng 2.5 Thống kê liệu thu âm Miền Bắc (CSDL_Nam) 30 Bảng 2.6 Liệt kê cách đặt tên liệu thử nghiệm 31 Bảng 2.7 Liệt kê cách đặt tên liệu thử nghiệm 32 Bảng 2.8: Tổng hợp số liệu thử nghiệm với tập A_gioitinhNam 41 Bảng 2.9 Tỷ lệ nhận phƣơng ngữ tập A_gioitinhNam 41 Bảng 2.10 Tổng hợp số liệu thử nghiệm với test1 - tập B_gioitinhNam 42 Bảng 2.11 Tỷ lệ nhận giọng nói Tập B_gioitinhNam 43 Bảng 2.12: Tổng hợp số liệu thử nghiệm với test1 - Tập C_ gioitinhNam 44 Bảng 2.13 Tỷ lệ nhận giọng nói Tập C_gioitinhNam 44 Bảng 2.14 Tổng hợp số liệu thử nghiệm với test1 - Tập D_GioitinhNam 45 Bảng 2.15 Tỷ lệ nhận giọng nói Tập D_GioitinhNam 45 Bảng 2.16 Tổng hợp số liệu thử nghiệm với test - Tập A_GioitinhNu 46 Bảng 2.17 Tỷ lệ nhận giọng nói tập A_GioitinhNu 46 Bảng 2.18 Tổng hợp số liệu thử nghiệm với test - Tập B_ giới tính Nữ 47 Bảng 2.19 Tỷ lệ nhận giọng nói tập B_ giới tính Nữ 47 Bảng 2.20 Tổng hợp số liệu thử nghiệm với test2 - tập C_gioitinhNu 48 Bảng 2.21 Tỷ lệ nhận giọng nói tập C_ gioitinhNu 48 Bảng 2.22 Tổng hợp số liệu thử nghiệm với test - Tập D_gioitinhNu 49 Bảng 2.23 Tỷ lệ nhận giọng nói tập D_ gioitinhNu 49 Bảng 2.24 Tổng hợp số liệu thử nghiệm test3 tập A_ giới tínhNam giớitínhNữ 50 Bảng 2.25 Tỷ lệ nhận giọng nói Tập A_ giới tính Nam giới tính Nữ 50 Bảng 2.26 Tổng hợp số liệu thử nghiệm test3 tập B_ giới tính Nam giới tính Nữ 51 Bảng 2.27 Tỷ lệ nhận giọng nói Tập B_ giới tính Nam giới tính Nữ 51 Bảng 2.28 Tổng hợp số liệu thử nghiệm test tập C_ giới tính Nam giới tính Nữ 52 Bảng 2.29 Tỷ lệ nhận giọng nói Tập C_ giới tính Nam giới tính Nữ 52 Bảng 2.30 Tổng hợp số liệu thử nghiệm với test - Tập D_ giới tính Nam Nữ 53 Bảng 2.31 Tỷ lệ nhận giọng nói Tập D_ giới tính Nam giới tính Nữ 53 Bảng 2.32 Tổng hợp liệu với thử nghiệm 2- Tập A_ khonggioitinh 55 Bảng 2.33 Ma trận kết nhận dạng phƣơng ngữ Tập A_ khonggioitinh 55 Bảng 2.34: Tổng hợp liệu với thử nghiệm 2- Tập B_ khonggioitinh 56 Bảng 2.35 Ma trận kết nhận dạng phƣơng ngữ tập B_ khonggioitinh 57 Bảng 2.36 Tỷ lệ nhận dạng phƣơng ngữ tiếng việt nói với test1 58 Bảng 2.37 Tổng hợp liệu với test 2- Tập A_ gioitinhNam 58 Bảng 2.38 Tỷ lệ nhận phƣơng ngữ tập A_ gioitinhNam 58 Bảng 2.39 Tổng hợp liệu với test 2- Tập B_ gioitinhNam 59 Bảng 2.40 Tỷ lệ nhận phƣơng ngữ tập B_ gioitinhNam 60 Bảng 2.41 Tỷ lệ nhận dạng phƣơng ngữ tiếng Việt nói với test2 61 Bảng 2.42 Tổng hợp liệu với test 3- Tập A_ gioitinhNu 61 Bảng 2.43 Tỷ lệ nhận phƣơng ngữ tập A_gioitinhNu 61 Bảng 2.44 Tổng hợp liệu với test 3- Tập B_ gioitinhNu 62 Bảng 2.45 Tỷ lệ nhận phƣơng ngữ tập B_ gioitinhNu 62 Bảng 2.46 Tỷ lệ nhận dạng phƣơng ngữ tiếng Việt nói với test3 63 Nếu bạn muốn thay đổi lại cấu hình cho máy ảo, bạn click vào Edit virtual machine setfilegs Nếu bạn chắn với cấu hình này, bạn click vào Power on this virtual machine để bắt đầu cài đặt Việc giống nhƣ bạn cho đĩa vào máy thật ấn nút khởi động để bắt đầu cài PHẦN HAI: THỰC HIỆN CÀI ĐẶT CENTOS Dƣới hình bạn khởi động để cài CENTOS Dùng phím lên, phím xuống để chọnInstall or upgrade an exisfileg system Mục dùng để kiểm tra xem đĩa cài có bị lỗi hay khơng, để tiết kiệm thời gian, bạn chọn Skip ấn Enter để bắt đầu cài Chọn Next Lựa chọn ngôn ngữ hiển thị hệ điều hành Sau chọn Next Lựa chọn ngơn ngữ cho bàn phím, sau chọn Next Tại bạn phải lựa chọn kiểu thiết bị đƣợc cài lên, hƣớng dẫn sử dụng “Basic Storage Devices” Chế độ đƣợc khuyến cáo bạn chƣa biết nhiều hệ thống phần cứng Sau chọn Next Màn hình cảnh báo “Dữ liệu tồn HDD bị xóa sau cài hệ điều hành Nếu bạn có liệu máy thật, bạn cần lƣu trƣớc Sau chọn “Yes, Discard any data” Lựa chọn tên cho máy sau cài xong Sau đặt tên xong, nên chọn vào mục “Configure Network” để thiết lập IP Address cho card mạng Bởi vì, từ CENTOS 6.0 trở đi, mặc định card mạng không khởi động bật máy Nếu bạn khơng cấu hình trƣớc cài, bạn phải sử dụng dòng lệnh để khai báo lại sau cài xong CENTOS Ở chọn cách thiết lập ln để sau cài tơi kết nối đƣợc với CENTOS Sau chọn có cửa sổ dƣới, click vào System eth0, chọn tiếp vào Edit Vì lúc khai báo cấu hình phần cứng cho máy ảo, sử dụng card mạng Nếu bạn có nhiều card mạng, chọn card mạng mà bạn giao tiếp với hệ thống bạn, điều tùy vào trƣờng hợp thực tế Tại tab “Wired” Tích vào mục “Connect automatically” , mục cho phép card mạng đƣợc bât hệ điều hành khởi động (mặc định khơng tích) Sau chuyển sang tab “IPv4 Setfilegs” để thiết lập địa IP cho máy Đối với hệ thống cụ thể bạn đặt ip cho phù hợp Ở sử dụng địa dải mạng 73 192.168.1.0/24 Tại tab “Method” chọn chế độ đặt IP tĩnh “Manual” Nếu bạn muốn để IP động bạn chọnAutomatically Sau chọn ATrong hƣớng dẫn tơi đặt phù hợp với hệ thống tôi, cho máy ảo giao tiếp với internet IP add: 192.168.1.221  Subnetmas: 24 (tƣơng đƣơng với 255.255.255.0)  Gateway: 192.168.1.1 (Địa modem mạng tôi)  DNS: 8.8.8.8 (sử dụng DNS google) Sau thiết lập xong IP address, chọn Apply để hoàn tất.DD để đặt IP Address Chọn Close để kết thúc việc thiết lập IP address Màn hình quay trở lại bƣớc đặt tên cho máy ảo Click tiếp vào Next để thực bƣớc Lựa chọn hệ cho máy ảo, VN chọn Asia/Ho Chi Minh Sau chọn Next Đặt password cho tài khoản root máy ảo (tài khoản có quyền quản trị cao linux) Sau đặt xong, chọn Next Tại bƣớc này, bạn cần thao tác để phân vùng cho thƣ mục CENTOS (Cấu trúc hệ thống file CENTOS theo dạng thƣ mục không phân vùng theo ổ đĩa windows) Nếu bạn không muốn thao tác nhiều, bạn lựa chọn “Replace Exifilegs Linux System(s)” “Use All Space” Với lựa chon hệ thống tự sinh phân vùng dựa vào phần cứng mà bạn có Trong hƣớng dẫn tơi lựa chọn chế độ Create Custom Layout để phân vùng tay cho bạn hiểu thêm Sau chọn Next Cần xác định dung lƣợng cho phân vùng (thƣ mục) swap root (/) CENTOS Các phân vùng lại (home, etc, media ) tự sinh sau tạo phân vùng root Phân vùng SWAP dùng cho RAM chạy ứng dụng chƣơng trình Nếu máy bạn dƣới 2GB RAM dung lƣợng phân vùng SWAP tối thiểu phải gấp đôi RAM (đây khuyến cáo, chạy tạm đƣợc) Ví dụ tơi 1GB RAM phân vùng SWAP 20GB Click vào “Free” , sau chọn Create 74 Nếu bạn tiếp xúc không cần chế quản lý ổ đĩa bạn chọn “Standard Pation” Sau chọn Create (Các lựa chọn RAID, LVM … đƣợc giải thích viết khác bạn tự tìm hiểu).Tại mục “File System Type” chọn SWAP Tại mục Size, nhập dung lƣợng cho SWAP, chọn 2048Mb = 2GB Sau chọn OK Phân vùng quan trọng cần tạo phân vùng cho thƣ mục root ( / ) Thƣ mục root chứa tất thƣc mục cịn lại CENTOS (bạn nên tìm hiểu thêm phân vùng lại CENTOS phân vùng root internet) Vì HDD ban đầu tơi có 20GB, tơi chia 2GB cho phân vùng SWAP, 18GB cịn lại tơi dùng cho phân vùng root Chọn vào Free, sau chọn Create Chế độ cho phân vùng root Standard Tại mục “Mount Point” bạn chọn / (dấu gạch chéo ký hiệu phân vùng root) Trong mục “Addition Size Options” bạn chọn mục ” Fill to maximum allowable size” sau ấn OK (Lựa chọn có nghĩa phân vùng root chiếm tồn dung lƣợng cịn trống , 18GB 2GB chia cho SWAP) Sau thiết lập xong cho phân vùng, hệ thống hỏi bạn có chắn lƣu thay đổi khơng, sau thực hiện, liễu cũ có phân vùng bị Trong trƣờng hợp cài nên lƣu Chọn Write changes to disk Chọn “Format” để thực thiết lập phân vùng Sau thiết lập xong, phân vùng hiển thị nhƣ hình dƣới Nếu ổn click vào Next Hình dƣới cho phép bạn lựa chọn thứ tự khởi động hệ điều hành nhƣ bạn cài nhiều hệ điều hành lên máy tính Trong trƣờng hợp đa số thực tế ta cài hệ điều hành Do ta để mặc định chọn Next Tại bƣớc này, bạn lựa chọn kiểu server (server cho web, server cho database, …hoặc dạng desktop) Trong trƣờng hợp tơi chọn chế độ Basic Server với chế độ bạn thực hành tùy biến CENTOS đƣợc tốt (Các chế độ lại mời bạn tự tìm hiểu thêm) Sau chọn next Bắt đầu trình cài đặt CENTOS, tùy vào cấu hình máy thật, viêc cài đặt diễn nhanh hay chậm Sau cài đặt xong, bạn cần khởi động lại, chọn “Reboot” Sau 75 khởi động lại, bạn có giao diện đăng nhập dịng lệnh CENTOS, đăng nhập accout root mật bạn nhập vào trƣớcKết thúc việc cài đặt Trƣớc thực hành cấu hình dịch vụ khác, bạn cần phải đăng nhập thử, tắt firewall mặc định, kiểm tra lại IP … A3 Cài đặt công cụ Alize hệ điều hành Centos-Linux Bƣớc 1: lệnh su cho he thong may Bƣớc 2: yum install gcc-c++ Bƣớc 3: tim den dung thu muc chay cau lenh [root@localhost Sphinx]# tar -zxvf spro-4.0.1.tar.gz [root@localhost spro-4.0]# / configure [root@localhost spro-4.0]# make [root@localhost spro-4.0]# make install [root@localhost bin]# echo $PATH /usr/local/bin:/usr/bin:/bin:/usr/local/sbin:/usr/sbin:/sbin:/home/huyen/bin [root@localhost PACK_LIA_RAL]# tar -zxvf LIA_RAL.tar.gz [root@localhost ALize]# ls [root@localhost ALize]# cd PACK_LIA_RAL/ [root@localhost PACK_LIA_RAL]# tar -zxvf LIA_RAL.tar.gz [root@localhost PACK_LIA_RAL]# exit exit [huyen@localhost PACK_LIA_RAL]$ sh install.sh [huyen@localhost PACK_LIA_RAL]$ make [huyen@localhost PACK_LIA_RAL]$ make install [huyen@localhost PACK_LIA_RAL]$ ls [huyen@localhost PACK_LIA_RAL]$ ls bin/ [huyen@localhost PACK_LIA_RAL]$ bin/NormFeat [huyen@localhost PACK_LIA_RAL]$ ls [huyen@localhost PACK_LIA_RAL]$ cd bin/ [huyen@localhost bin]$ ls [huyen@localhost bin]$ pwd [huyen@localhost PACK_LIA_RAL]$ make install 76 [huyen@localhost ~]$ vi bash_profile [huyen@localhost ~]$ bash_profile me/huyen/install/ALize/PACK_LIA_RAL/bin B Mã nguồn chƣơng trình B1 Chƣơng trình tính tham số MFCC # Chuong trinh file tham so mfcc cua cac file wav # Dau vao: # + File chua danh sach cac file can fileh # + Vi du: TestAlize/lst/lst_all.lst # + Dinh dang file lst_all.lst: # CSDL_Bac/22ds0005 # CSDL_Bac/22ds0162 # + Nhan xet: File wav nam thu muc TestAlize/input # Vi du: TestAlize/input/CSDL_Bac/22ds0005.wav # Dau ra: TestAlize/prm/CSDL_Bac/22ds0005.prm # Cau lenh thuc hien: # + Dung o thu muc TestAlize # + sfbcep -F PCM16 -f 16000 -p 19 -e -D -A input/CSDL_Bac/03ds0201.wav prm/CSDL_Bac/03ds0201.prm import sys import os fileLst = sys.argv[1] print "File danh sach: ", fileLst with open(fileLst, 'r') as f: for line in f: line = line.rstrip() print line #cmd = "sfbcep -F PCM16 -f 16000 -p 19 -e -D -A " + "input/" + line + ".wav" + " prm/" + line + ".prm" 77 cmd = "sfbcep -F PCM16 -f 16000 -p 19 -e -D -A " + "/home/huyen/TestAlize/input/" + line + ".wav" + " /home/huyen/TestAlize/prm/" + line + ".prm" print cmd os.system(cmd) B2 Chƣơng trình tạo file ndx #!/usr/bin/python import sys #for n in sys.argv[1:]: # print(n) #print out the filename we are currently processing # input = open(n, "r") fileLst = "/home/huyen/TestAlize/lst/AllAnam.lst" # thay vao AllBnam, C, D fileGmms = " CSDLABac_Nam_gmm CSDLATrung_Nam_gmm CSDLANam_Nam_gmm" outputFile = open('/home/huyen/TestAlize/ndx/testSpeakerANam.ndx','w') test = open(fileLst,'r') for line in test: line = line.replace('\n','') outputFile.write(line) outputFile.write(fileGmms) outputFile.write('\n') outputFile.close() test.close() B3 Chƣơng trình tính tỷ lệ nhận dạng #!/usr/bin/python import os, sys, math # chuong trinh fileh ket qua # Dau vao: la file ket qua chay chuong trinh Alize # Dau ra: la fie ket qua voi noi dung file la mot ma tran 3x3 tuong ung voi giong Bac, Trung, Nam # Vi du: KQ_03_12_05 78 # khoi tao ma tran voi i la hang va j la cot va cac gia tri ban dau la # matrix = [ # [0,0,0], # [0,0,0], # [0,0,0], maTranKetQua = [[0 for x in xrange(3)] for x in xrange(3)] # Hang i la cac giong theo vung mien dang test: Bac, Trung, Nam # Cot j la cac giong theo vung mien da duoc huan luyen: Bac, Trung, Nam # Mo file res f= open("/home/huyen/TestAlize/Res/ResNamNu/D_NamNu16.res","r") lines=f.readlines() i=0 listEmotion = ["B", "T", "N"] while i

Ngày đăng: 19/02/2022, 17:17

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN