Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
1,18 MB
Nội dung
ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOA - LÊ TÙNG DƢƠNG XÂY DỰNG NỂN TẢNG THU THẬP VÀ XỬ LÝ DỮ LIỆU TIẾNG NÓI C C R UT.L D Chun ngành: Khoa Học Máy Tính Mã số: 8480101 TĨM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Đà Nẵng – Năm 2020 Cơng trình đƣợc hồn thành TRƢỜNG ĐẠI HỌC BÁCH KHOA ĐÀ NẴNG Ngƣời hƣớng dẫn khoa học: TS NINH KHÁNH DUY Phản biện 1: TS Huỳnh Hữu Hưng Phản biện 2: TS Lâm Tùng Giang C C R UT.L Luận văn bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ ngành Khoa học máy tính họp Trường Đại học Bách khoa vào ngày 19 tháng năm 2020 D Có thể tìm hiểu luận văn tại: Trung tâm Học liệu, Đại học Đà Nẵng Trường Đại học Bách khoa Thư viện Khoa CNTT, Trường Đại học Bách khoa – ĐHĐN MỞ ĐẦU Tính cấp thiết đề tài Với xu phát triển xã hội ngày nay, việc ứng dụng công nghệ thông tin phục vụ đời sống ngày phổ biến Hiện nay, hệ thống phần mềm có khả mô giao tiếp người với máy thông qua việc nhận dạng tổng hợp tiếng nói Nghiên cứu nhận dạng tổng hợp tiếng nói nước giới thực nhiều năm qua có thành cơng định Ở Việt Nam việc xử lý tiếng Việt có nhiều cơng trình nghiên cứu thử nghiệm, nhiên, kết hạn chế, C C R UT.L cần có nhiều nghiên cứu vấn đề Ngồi ra, đất nước Việt Nam có nhiều vùng miền, vùng D miền lại có loại giọng nói âm điệu khác Đất nước Việt Nam có nhiều dân tộc, dân tộc học tiếng Việt nói tiếng Việt lại có cách phát âm âm điệu khác nhau, dẫn đến có dân tộc khác người từ vùng miền khác giao tiếp tiếng Việt với khó Nhưng với phát triển khoa học cơng nghệ sử dụng phần mềm chuyển đổi/khơi phục/tái tạo âm cho phù hợp với người vùng miền hay dân tộc khác Điều lại phát sinh vấn đề trí tuệ nhân tạo cần liệu lớn âm tín hiệu tiếng nói người đọc tiếng Việt Mặc dù liệu tiếng nói thành phần thiết yếu để xây dựng cơng cụ xử lý tiếng nói, lượng liệu tiếng nói tiếng Việt hạn chế Nhằm xây dựng kho liệu lớn phục vụ cho nghiên cứu xử lý tiếng nói tiếng Việt, luận văn xây dựng hệ thống theo mô hình client/server Trong đó, phía client app điện thoại di động thông minh cho phép thu thập liệu tiếng nói thơng tin người cung cấp liệu đơn giản thuận tiện Phía server hệ thống lưu trữ tập trung, cho phép lưu trữ quản lý số lượng lớn mẫu ghi âm tiếng nói số cơng cụ thuật tốn cho phép hỗ trợ xử lý tiếng nói Qua nghiên cứu, luận văn làm rõ cách xử lý sơ tiếng nói, mơ hình, phương pháp tương đối tốt cho việc lưu trữ, quản lý liệu tiếng nói tiếng Việt Bên cạnh đó, luận văn tiến hành xây C C R UT.L dựng chương trình thực tế thu thập mẫu để chứng minh cho hiểu biết tác giả mơ hình lưu trữ quản lý mẫu liệu D lớn phục vụ xử lý tiếng nói Mục tiêu, phạm vi nghiên cứu luận văn Luận văn nghiên cứu ý tưởng phương pháp sử dụng mơ hình thu thập, lưu trữ quản lý liệu tiếng nói lớn từ xây dựng hệ thống phần mềm có khả thu thập liệu tiếng nói phân tán, xử lý sơ mẫu lưu trữ liệu sẵn sàng phục vụ xử lý tiếng nói theo phương pháp liệu lớn Với kết cụ thể: - Nghiên cứu, cài đặt đánh giá hiệu thuật tốn tính tỉ lệ tín hiệu nhiễu (SNR) tín hiệu tiếng nói miền thời gian dùng để gán nhãn tín hiệu tiếng nói thu thập - Xây dựng hệ thống phần mềm nhằm thu thập CSDL tiếng nói phục vụ cho nghiên cứu xử lý tiếng nói nhận dạng hay tổng hợp tiếng nói, với tính năng: + Tiền xử lý liệu thu thập để đánh giá chất lượng ghi âm + Cho phép người dùng nghe lại đánh giá chất lượng đoạn thu âm nhằm làm liệu thu thập được, ví dụ phát tín hiệu ghi âm khơng trùng khớp với nội dung kịch thu âm + Phát triển hệ thống theo mơ hình client-server ứng dụng di động đa tảng Đối tượng nghiên cứu bao gồm: Các đặc tính Tiếng Việt; Tính vùng miền Tiếng Việt; Các thuật tốn tính tỉ lệ tín hiệu nhiễu tín hiệu tiếng nói; Mơ hình lưu trữ liệu lớn; Lập trình ứng dụng di động; Các hệ thống thư viện lập trình hỗ trợ C C R UT.L xử lý tiếng nói; Phạm vi nghiên cứu bao gồm: Trong thời gian hạn chế D mức độ phức tạp toán xử lý tiếng nói với liệu lớn, luận văn tập trung xây dựng tảng thu thập liệu lớn phục vụ cho nghiên cứu lĩnh vực tổng hợp nhận dạng tiếng nói người Việt Phƣơng pháp nội dung nghiên cứu Luận văn sử dụng phương pháp nghiên cứu kết hợp nghiên cứu lý thuyết với phương pháp thực nghiệm thông qua xây dựng sở liệu phát triển phần mềm xử lý Hướng tiếp cận nghiên cứu tài liệu qua báo đăng tạp chí khoa học khai thác hệ thống phần mềm liên quan đến vấn đề nghiên cứu mạng Internet * Ý nghĩa khoa học - Tổng hợp kiến thức liên quan đến xử lý lưu trữ tín hiệu tiếng nói tiếng Việt - Nắm vững vận dụng ngôn ngữ lập trình thiết bị di động, dịch vụ web hệ quản trị CSDL để xây dựng ứng dụng - Kết luận văn sở liệu tiếng nói lớn gán nhãn với độ xác cao sẵn sàng phục vụ hệ thống xử lý tiếng nói tương lai * Ý nghĩa thực tế - Xây dựng ứng dụng theo mơ hình client/server để thu thập CSDL tiếng nói lớn phục vụ cho nghiên cứu xử lý tiếng nói Cấu trúc luận văn gồm: phần mở đầu, chương nội dung, kết luận, danh mục tài liệu tham khảo phụ lục Chương 1: Tổng quan xử lý tiếng nói C C R UT.L Chương 2: Các thuật tốn tính tỉ lệ tín hiệu tạp âm tín hiệu tiếng nói D Chương Triển khai kết thực nghiệm Kết đạt đƣợc luận văn Kết luận văn bao gồm: - Báo cáo tổng thể sở lý thuyết xử lý tiếng nói, phương pháp thu thập xử lý liệu tiếng nói với số lượng lớn - Đề xuất sử dụng thuật toán xây dựng hệ thống hỗ trợ xử lý tiếng nói, lưu trữ cung cấp dịch vụ phù hợp để làm tảng cho ứng dụng xử lý tiếng nói tiếng Việt - Một số liệu CSDL tiếng nói thu thập, xử lý sơ gán nhãn nhằm chứng minh cho tính hiệu khả thi hệ thống CHƢƠNG TỔNG QUAN VỀ XỬ LÝ TIẾNG NÓI 1.1 Tổng quan tổng hợp tiếng nói Tổng hợp tiếng nói mơn khoa học nhằm nghiên cứu xây dựng công nghệ để tạo âm tiếng nói từ máy giống tiếng nói người Trong năm gần tiếng nói tổng hợp trải qua chặng đường dài, việc ứng dụng tổng hợp tiếng nói vào thực tiễn trở nên phổ biến Tuy nhiên, chất lượng âm độ tự nhiên tiếng nói tổng hợp vấn đề mở C C R UT.L D Hình 1.1 – Hệ thống TTS tổng quát Tương tự ứng dụng tổng hợp tiếng nối, ứng dụng nhận dạng tiếng nói phổ biến thời gian gần đây, cho phép giao tiếp người máy Từ tín hiệu âm người nói, thơng qua phận ghi âm hệ thống nhận dạng, máy tính hiểu phân biệt ý nghĩa câu nói 1.2 Khái niệm tín hiệu tiếng nói Về chất, âm từ lời nói, âm giới tự nhiên sóng âm lan truyền mơi trường Khi nói dây hầu bị chấn động, tạo nên sóng âm, sóng truyền khơng khí đến màng nhĩ – màng mỏng nhạy cảm tai ta – làm cho màng nhĩ dao động, dây thần C C R UT.L kinh màng nhĩ nhận cảm giác âm tần số dao động sóng đạt đến độ lớn định D 1.2.1 Biểu diễn miền thời gian Âm dạng sóng lưu trữ theo định dạng thơng dụng máy tính file wav với tần số lấy mẫu thường gặp là: 8000 Hz, 10000 Hz, 11025 Hz, 16000 Hz, 22050 Hz, 32000 Hz, 44100 Hz, …; độ phân giải hay gọi số bít/mẫu 16 bít số kênh (Mono) (Stereo) Tuỳ theo thiết bị, thời điểm, người phát âm liệu âm số hố, biểu diễn lại máy tính khác 1.2.2 Biểu diễn miền tần số Một đại lượng đặc trưng để biểu diễn tín hiệu tiếng nói miền tần số phổ Phổ tín hiệu tiếng nói biểu diễn phụ thuộc biên độ vào thời gian tần số, hình ảnh biểu diễn tín hiệu tiếng nói theo trục tần số 1.3 Các đặc tính tín hiệu tiếng nói Tiếng nói tạo từ độ rung dây âm quản thơng qua khí quản hoạt động tuyến âm Như vậy, tiếng nói âm Tiếng nói có chu kỳ dao động, có tần số âm 1.3.1 Âm sắc Âm sắc bốn đặc tính âm tín hiệu tiếng nói Âm sắc giúp ta phân biệt tiếng nói âm người cảm nhận khác Âm sắc liên quan mật thiết đến phổ tín hiệu 1.3.2 Cƣờng độ C C R UT.L Cường độ độ to hay nhỏ âm nói Cường độ lớn âm truyền xa môi trường truyền D Cường độ âm số lượng mà sóng âm truyền thời gian định đơn vị diện tích cố định vng góc với phương truyền âm 1.3.3 Trƣờng độ Trường độ hay biết độ dài âm phát phụ thuộc vào chấn động lâu hay nhanh phần tử môi trường truyền Trường độ người khác thời điểm khác 1.3.4 Âm hữu Âm hữu (voiced speech) âm phát có thanh, ví dụ nguyên âm /a/, /e/, /i/, /o/, /u/ phụ âm /m/, /n/, /l/ Thực âm hữu tạo việc khơng khí qua mơn (thanh mơn tạo khép mở dây điều khiển hai sụn chóp) với độ căng dây cho chúng tạo nên dao động 1.3.5 Âm vô Âm vô (voiced speech) âm tạo tiếng dây khơng rung rung đơi chút tạo giọng giọng thở, ví dụ /t/, /p/ hay /k/ Trong xử lý tín hiệu tiếng nói, âm vơ khơng có ích tính tần số Vì âm vơ khơng có khung tín hiệu tuần hồn Tần số âm vô không xác định 1.4 Xử lý ngắn hạn (short-time processing) Tín hiệu tiếng nói có tính chất quan trọng đặc tính thay đổi tương đối chậm theo thời gian Thông thường, C C R UT.L đặc tính tín hiệu ổn định khoảng thời gian từ 10 ms đến 30 ms Do đó, người ta thường chia tín hiệu cần xử lý thành khung D tín hiệu liên tiếp nhau, khung có độ dài từ 10 ms đến 30 ms Sau đó, ta tiến hành xử lý khung tín hiệu Các khung tín hiệu gọi khung phân tích, khung trùng (overlap) phần để đảm bảo đặc tính tín hiệu biến đổi trơn tru khung liên tiếp Việc chia khung lặp lại từ đầu đến cuối tín hiệu cần xử lý 1.5 Tỉ lệ tín hiệu nhiễu tín hiệu tiếng nói (SNR) 1.5.1 SNR gì? SNR (Signal-to-noise ratio) thuật ngữ dùng để tính tỉ lệ giá trị lượng tín hiệu lượng nhiễu ảnh hướng đến độ xác thơng tin SNR phục vụ việc gắn nhãn tín hiệu tiếng nói thu thập được, nhằm đánh giá chất lượng ghi âm Có nhiều thuật tốn tính SNR khn khổ luận văn xin giới thiệu thực nghiệm hai thuật toán sau: 10 CHƢƠNG CÁC THUẬT TỐN TÍNH TỈ LỆ TÍN HIỆU TRÊN TẠP ÂM CỦA TÍN HIỆU TIẾNG NĨI 2.1 Mở đầu Như đề cập chương trước, tham số SNR tín hiệu tiếng nói tham số có ý nghĩa quan trọng lĩnh vực xử lý tiếng nói Tìm SNR xác tiền đề để tiến hành nghiên cứu khác lĩnh vực 2.2 Thuật tốn VUS (Voiced/Unvoiced/Silence) Để tính SNR, cần phải xác định đoạn im lặng đoạn ghi âm Để xác định đoạn im lặng, sử dụng thuật toán C C R UT.L VUS, xác định đoạn hữu thanh/ vô thanh/ khoảng lặng (voiced/ unvoiced/ silence) dựa lượng thời gian ngắn (STE), tỷ lệ D trượt ngang (ZCR) tỷ lệ lượng băng tần thấp/ tồn dải (LF) Tín hiệu đầu vào cần phân biệt đoạn lời nói khoảng lặng, sau đó, đoạn lời nói cần phân biệt thành phần hữu thành phần vô Phân biệt đoạn lời nói khoảng lặng dựa lượng ngắn hạn Ngưỡng đặt theo phương pháp gốc Phân biệt đoạn khơng lời nói khoảng lặng dựa ngưỡng Các thuộc tính phân biệt thành phần hữu thành phần vô lượng thời gian ngắn, tỷ lệ truyền qua không tỷ lệ lượng băng tần thấp/ toàn dải Các thuộc tính chuẩn hóa cân nhắc theo phương pháp Kondoz 2.3 Thuật toán WADA (Waveform Amplitude Distribution Analysis) Thuật toán WADA-SNR thuật toán tương đối sử dụng để ước tính tỉ số SNR tín hiệu giọng nói dựa phép 11 phân tích luật phân phối biên độ tín hiệu Với thuật tốn này, biên độ giọng nói gốc tn theo luật phân phối Gamma với tham số hình dạng 0.4, biên độ nhiễu tuân theo luật phân phối Gaussian 2.3.1 Đặc tính giọng nói gốc tiếng ồn Hàm mật độ xác suất giọng nói biểu diễn phương trình sau: ( ) ( ) ( ) ( ) (1) Trong đó: - x: biên độ giọng nói - αx: tham số hình dạng phân phối gamma αx = 0.4 C C R UT.L chứng minh giá trị phù hợp để mơ tín hiệu giọng D nói nên giá trị lấy mặc định 0.4 tính tốn - βx: tham số tỷ lệ phân phối gamma Giá trị phục vụ cho việc chuẩn hóa hàm mật độ xác suất khơng có ảnh hưởng đến phép ước tính SNR nên lấy Tiếng ồn giả định tuân theo luật phân phối Gaussian v[n] có hàm mật độ xác suất sau: ( ) √ ( ) (2) Trong đó: - σv: độ lệch chuẩn tiếng ồn Giả sử giọng nói tiếng ồn có giá trị trung bình độc lập thống kê với Giọng nói có nhiễu z[n] tính theo cơng thức sau: 12 z[n] = x[n] + v[n] (3) Từ (1), (2), (3) lượng giọng nói tiếng ồn tính tốn sau: ( ) (4) Trong đó: - Px: lượng giọng nói gốc - Pv: lượng tiếng ồn Cuối cùng, ta có tỷ số SNR giọng nói có nhiễu z[n]: ( ( ) ) C C R UT.L 2.5 Kết so sánh thuật toán 2.5.1 Cài đặt liệu đầu vào Các bước thực Để kiểm chứng thuật toán này, trước tiên chuẩn bị mẫu giọng nói gốc (giọng nói khơng có nhiễu), sau tiến hành thêm tín hiệu nhiễu (tiếng ồn trắng, nhạc giọng nói nhiễu khác) để có mẫu tín hiệu đầu vào với tỉ số SNR khác từ 10dB đến 30dB Các mẫu tín hiệu dùng làm đầu vào cho thuật toán W D -SNR tính tốn đưa kết SNR tương ứng SNR từ kết tính tốn dùng để so sánh với SNR biết so sánh với kết SNR tính tốn thuật tốn khác D 2.5.2 Kết so sánh Nhận thấy giá trị SNR tính thuật tốn WADA-SNR biến đổi quán so với thuật toán VUS-SNR, thực với loại nhiễu khác 13 CHƢƠNG TRIỂN KHAI HỆ THỐNG VÀ KẾT QUẢ THỰC NGHIỆM 3.1 Mở đầu Hướng nghiên cứu luận văn xây dựng hệ thống tảng thu thập liệu tiếng nói phục vụ cho việc xử lý tổng hợp nhận dạng giọng nói Việt Các phương pháp dùng cho việc tập hợp nhận dạng giọng nói Việt trước tiên cần phải thu thập liệu tiếng nói sát với ứng dụng thực tế Dữ liệu tiếng nói cần gán nhẵn đầy đủ gọi meta-data Sau phân tích nhu cầu xử lý tiếng nói Việt hệ thống cần có tính sau: Hệ thống cho phép ghi âm người nói cách thuận lợi, bắt kỳ nơi đâu C C R UT.L khơng phải đến phịng ghi âm chuyên nghiệp, phục vụ đa vùng miền Hệ thống cho phép nhập thông tin người đọc như: nam/nữ, D tuổi, vùng miền Hệ thống phải đánh giá nhiễu trình ghi âm để thông báo cho người đọc cần phải đọc lại hay khơng, ghi lại thơng tin tỉ lệ nhiễu tín hiệu meta-data Hệ thống cho phép người sử dụng tham gia đánh giá chất lượng tín hiệu âm để giúp bổ sung thêm thông tin cho tín hiệu Từ u cầu tốn phát biểu triển khai phần 3.2 Phát biểu toán Xây dựng hệ thống phần mềm theo mơ hình client/server triển khai thu thập liệu tiếng nói đa vùng miền Phía server, cho phép tiếp nhận lưu trữ liệu giọng nói từ phía client gửi Hệ thống có khả đánh giá tự động mức độ nhiễu tín hiệu giọng nói Hệ thống cần có phương án lưu trữ truy vấn liệu với quy mô lớn tốc độ đáp ứng nhanh Phía client, xây dựng hệ thống mobi app cho phép người dùng ghi âm câu nói hệ thống 14 thị, đánh giá tức thời chất lượng ghi âm Hệ thống triển khai qua mạng Internet để thực ghi âm đâu 3.3 Lựa chọn thuật toán Từ đánh giá chương 2, chương tiến hành cài đặt thuật tốn việc tính tốn ước lượng tham số SNR tín hiệu gióng nói thu Đây thuật toán qua trọng việc thực phần mềm lý do: - Ghi âm theo kịch chương trình thơng qua phần mềm thiết bị di động mơi trường ghi âm ln có nhiễu cao - Khi đánh giá tham số SNR cho phép phần mềm đánh C C R UT.L giá chất lượng ghi âm tức thời sau ghi, từ yêu cầu người sử dụng ghi âm lại để đạt chất lượng tốt (nếu cần) D - Khi ghi âm xong, việc gán nhãn thông tin SNR quan trọng việc khai thác liệu sau Do cần lựa chọn thuật tốn xác phù hợp với mơi trường định xây dựng Tác giá tiến hành sau: - Thuật tốn tính SNR: WADA-SNR; - Mơi trường cài đặt: Ngôn ngữ Python 3.4 Thiết kế hệ thống 3.4.1 Các cam kết ràng buộc 3.4.2 Đối tượng hướng đến 3.4.3 Tác nhân 15 3.4.4 Ca sử dụng C C R UT.L 3.4.5 Thiết kế sở liệu D 16 3.4.6 Thiết kế server D C C R UT.L 17 3.4.7 Sơ đồ phân rã chức Hệ Thống Năng Hệ Thống Suất Lao Động Đăng ký Ghi âm Đánh giá Đổi tài khoản Quản trị Đăng ký Bắt đầu Nghe lại Thống kê Đăng nhập Dừng lại Đánh giá Tìm kiếm Làm D C C R UT.L Nghe lại Upload Tải 18 3.4.8 Sơ đồ luồng liệu D C C R UT.L 19 3.5 Công nghệ sử dụng 3.5.1 Cơng nghệ phía server 3.5.2 Công nghệ chức client 3.5.2.1 React Native 3.5.2.2 Python 3.5.2.3 REST API 3.5.2.4 Django Framework 3.5.2.5 ASP.NET MVC 3.5.2.6 JQuery 3.5.2.7 Ajax 3.5.3 Thiết kế giao diện C C R UT.L 3.5.3.1 Giao diện thông tin người dùng D Người dùng sau truy cập ứng dụng, lần đầu sử dụng hệ thống mặc định chuyển người dùng đến giao diện đăng ký thông tin - Người dùng cập nhật đầy đủ thông tin cần thiết, hệ thống ghi nhận, lưu thông tin vào CSDL chuyển người dùng đến giao diện ghi âm - Trường hợp người dùng bấm “Lưu” nhập chưa đầy đủ, hệ thống có thơng báo để người dùng biết thực quy định - 20 3.5.3.2 Giao diện ghi âm - Người C C R UT.L dùng đăng ký thành công chuyển đến giao diện Ghi âm, hệ thống tự động hiển thị đoạn văn ngẫu nhiên, người dùng nội dung đoạn văn, bấm nút Bắt đầu đọc theo nội dung để tiến hành ghi âm Khi hồn thành nội dung đoạn văn bấm nút Dừng lại để kết thúc ghi âm D - Sau kết thúc ghi âm, người dùng nghe lại nội dung ghi, trường hợp chưa đạt theo mong muốn thực ghi âm lại cách bấm Bắt đầu - Trường hợp đoạn ghi âm đạt u cầu người dùng tải lên server cách bấm nút Upload - Nếu người dùng sau ghi âm bấm nút Làm đưa trạng thái ban đầu vừa truy cập chức 21 3.5.3.3 Giao diện đánh giá chất lượng ghi âm Đối với ghi âm lưu trữ CSDL, người dùng thực nghe lại lần lượt, đồng thời tiến hành đánh giá chất lượng cho thu - Người dùng có tùy chọn đánh giá là: Tốt Không tốt - Sau đánh giá thành công, hệ thống tự động ghi nhận gửi kết đánh giá đến server, lưu trữ vào CSDL - C C R UT.L D 3.5.3.4 Giao diện quản trị 3.6 Kết thực nghiệm 3.6.1 Dữ liệu văn Dữ liệu văn gồm 100 câu xây dựng từ điểm sau: - Trích dẫn câu nói văn bản, sách văn học - Số tiếng vô thanh, hữu tương đối đầy đủ - Các câu nói ngắn gọn, người đọc khơng nghỉ chừng 3.7 Kết thu thập liệu Sau xây dựng hệ thống đẩy app mobile lên App Store, tác giả tiến hành cho thu thập thông qua kênh: 1- Sinh viên trường Đại học Bách Khoa, Đại học Đà Nẵng 2- Nhân viên VNPT Quảng Trị 3- Một số đối tượng ngẫu nhiên khác 22 Bảng liệu kết thu thập tổng quát STT 2 Nội dung Số người tham gia ghi âm liệu Số người 10 tuổi Số người từ 15 đến 19 tuổi Số người từ 20 đến 29 tuổi Số người từ 30 đến 59 tuổi Số lượng nam giới Số lượng nữ giới Tổng số file ghi âm Tổng số câu kịch ghi âm Số lƣợng 41 13 14 13 33 3.383 100 C C R UT.L Bảng liệu kết thu thập theo vùng miền STT 10 11 12 13 14 15 Giọng vùng miền D Bắc (r, s, tr đọc nhẹ) Bắc (r, s, tr đọc nặng) Bắc (lẫn l n) Thanh Hóa Nghệ An Hà Tĩnh Quảng Bình Quảng Trị Thừa Thiên Huế Quảng Nam, Quảng Ngãi, Đà Nẵng Tây Nguyên Bình Định Phú n - Bình Thuận Đơng Nam Bộ Tây Nam Bộ Số lƣợng (ngƣời) 15 0 0 0 24 0 23 3.8 Đánh giá ƣu nhƣợc điểm hệ thống Sau triển khai thực nghiệm thời gian đánh giá ưu nhược điểm hệ thống sau: Về ưu điểm: - Đã hồn thành đầy đủ tính yêu cầu phi tính toán đưa Việc thu thập thuận tiện cho nhiều đối tượng sử dụng - Về chất lượng ghi âm: Đa số ghi đạt chất lượng ghi âm, số lượng câu đầy đủ - Hiệu hệ thống: đáp ứng nhanh, tải file âm nghe lại có độ trễ thấp (