Tiêu chí đánh giá chủ quan

Một phần của tài liệu Phương pháp nâng cao chất lượng tiếng nói có nhiễu dùng học máy thống kê bằng mô hình pha trộn Gaussian (LV thạc sĩ) (Trang 60 - 61)

5. Ý nghĩa khoa học và thực tiễn

3.5.1.Tiêu chí đánh giá chủ quan

Đánh giá chủ quan là tiêu chí sử dụng người nghe để đánh giá chất lượng tiếng nói. Việc đánh giá chủ quan được xem là quan trọng hơn do mục tiêu cuối cùng của tiếng nói sau khi được nâng cao chất lượng phải đảm bảo người nghe hiểu được và chấp nhận được. Tuy nhiên để đánh giá chủ quan thì tốn kém, mất thời gian vì cần thiết bị nghe và phòng nghe chuyên dụng để tránh nhiễu môi trường. Ngoài ra các phương pháp đánh giá chủ quan khó đảm bảo sự tin cậy do người nghe có thể mất tập trung, không chú tâm vào việc đánh giá hoặc cố tình cho điểm sai. Để khắc phục các yếu điểm đó thì cần tăng số lượng người nghe, số lượng phép test để đảm bảo các giá trị thống kê có sự ổn định và tin cậy.

Trong luận văn này chúng tôi sử dụng độ đo MOS - sử dụng để đo lường chất lượng tiếng nói sau khi khôi phục bằng việc đánh giá chấm điểm theo 5

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

mức cảm nhận của các đối tượng nghe. Các mức đánh giá được trình bày trong bảng 3.3.

Bảng 3.3: Mô tả mức điểm đánh giá

Mức đánh giá Chất lượng tiếng nói 5 4 3 2 1 Rất tốt Tốt Trung bình Kém

Không đạt yêu cầu

Phương pháp đánh giá chủ quan được thực hiện với 05 người là người Việt- là các sinh viên tại trường Đại học Công nghệ thông tin và truyền thông có độ tuổi từ 18 đến 20 và có khả năng nghe bình thường. Tất cả các tín hiệu tiếng nói của 567 câu tiếng Việt được lấy ngẫu nhiên từ bộ dữ liệu trong các bài kiểm tra đánh giá. Chúng tôi sử dụng 4 loại tín hiệu âm thanh: tín hiệu tiếng nói sạch, tín hiệu tiếng nói có nhiễu (nhiễu nhà máy) và 2 loại tín hiệu khôi phục sử dụng mô hình Spectral subtraction (trừ phổ) và LP-GMM. Mức điểm đánh giá MOS là điểm trung bình của tất cả các mẫu đánh giá.

Một phần của tài liệu Phương pháp nâng cao chất lượng tiếng nói có nhiễu dùng học máy thống kê bằng mô hình pha trộn Gaussian (LV thạc sĩ) (Trang 60 - 61)