9 Phương pháp đo chất lượng dịch vụ thoại
9.3.1 Đánh giá dựa trên tín hiệu chủ động
Phương pháp này (intrusive signal-based measuring) thiết lập cuộc gọi giữa hai thiết bị đo để so sánh tín hiệu đầu ra với một tín hiệu chuẩn.
Thủ tục so sánh được thực hiện theo ba bước:
• Tiền xử lý
• Mô hình hóa và đánh giá nhận thức về âm thanh (pyscho acoustic)
Hình 31 – Phương pháp đánh giá chất lượng khách quan chủ động
Hạn chế của mô hình này là nó ảnh hưởng đến lưu lượng thoại trong quá trình đo, sử dụng một phần tài nguyên mạng và thường đòi hỏi các thiết bị phức tạp. Tuy nhiên, phương pháp này vẫn phổ biến vì tính tương quan giữa kết quả của nó với MOS.
9.3.1.1 PSQM
PSQM (Perceptual Speech Quality Measurement) bao gồm một thuật toán đánh giá sự khác biệt giữa mọt tín hiệu bị làm méo bởi hệ thống thoại và một tín hiệu chuẩn. Sự khác biệt này được sử dụng để tính mức méo nhiễu (noise disturbance), tham số được coi là có ảnh hưởng trực tiếp đến chất lượng thoại. Mô hình này thích hợp với tín hiệu thoại băng hẹp (300-3400Hz) được xử lý bởi codec thoại tốc độ thấp.
Hình 32 – Quy trình đánh giá bằng mô hình PSQM
Mạng Đánh giá chất lượng Người nói Người nghe Đoạn thoại mẫu Mã hóa/ giải mã Thuật toán PSQM Ánh xạ điểm số khách quan PSQM sang thang điểm chủ quan tín hiệu đầu vào
tín hiệu đầu ra
điểm PSQM
Thuật toán PSQM có thể được chia làm ba khối chính:
1. Tiền xử lý: các yếu tổ ảnh hưởng đến giác quan nghe của con người như độ to (loudness) và tần số được xem xét.
2. Mô hình giác quan (perceptual modeling): biến đổi giá trị sang miền giác quan (perceptual domain)
3. Mô hình nhận thức (cognitive modeling): so sánh tín hiệu đầu vào và đầu ra qua 4 quá trình: cân bằng mức (loudness scaling), nhiễu nhận thức trong (internal cognitive noise), xử lý bất đối xứng (asymmetry processing) và xử lý khoảng lặng (silence interval processing).
Giá trị 0 phản ánh sự giống hoàn toàn của tín hiệu thoại đầu vào và đầu ra. Giá trị cao hơn phản ánh độ méo (distortion) của kết nối thoại. Thông thường, giá trị 15-20 cho thấy kết nối có chất lượng rất kém [13].
Mô hình PSQM cho kết quả tương đối tốt tuy nhiên giá trị tính toán phụ thuộc vào việc đồng bộ tín hiệu trước khi thuật toán xử lý. Bước này được coi là một bước quan trọng [15]. Phương pháp này không thích hợp cho việc đánh giá các tham số như trễ, mất tiếng (time clipping), mất gói hoặc biến đổi trễ và sự tồn tại của biến đổi trễ có thể làm cho thuật toán không hoạt động được. Hiện nay, phương pháp này không được khuyến nghị sử dụng và đã được thay thế bởi PESQ [15].
9.3.1.2 PAMS
Mục tiêu của PAMS (Perceptual Analysis Measurement system) là đánh giá được chất lượng thoại theo như ý kiến chủ quan cho hệ thông bị ảnh hưởng bởi các yếu tố như tiếng ngắt quãng (time clipping), mất gói tin, trễ thay đổi và méo do mã hóa. PAMS được tối ưu hóa cho việc đo kiểm với mẫu thoại nhân tạo và chất lượng thoại một chiều qua codec cũng như nhiều loại mạng bao gồm mạng thoại cố định, di động và thoại IP.
Để sử dụng được phương pháp PAMS, cần có những giả thiết sau:
• không có biến đổi trễ
• không có khuyếch đại/suy hao
• không có lọc
• không có nhiễu nền
Hình 33 – Thuật toán PAMS
Mô hình này được chia thành các khối chức năng sau:
• Tiền xử lý: tín hiệu vào/ra được cân bằng cả về thời gian và mức trong mỗi khoảng thoại để bù lại các khoảng trễ, các biến đổi trễ nhỏ, và độ khuyếch đại của hệ thống. Sau đó, tín hiệu được cân bằng (equalise).
• Biến đổi thính giác (auditory transform): cả hai tín hiệu được mô hình hóa để có tính đặc trừng của tín hiệu thoại.
• Tham số hóa sai số: sự khác biệt giữa mặt cảm giác (sensation surface) của hai tín hiệu được tính toán để đưa ra mặt sai số (error surface). Các sai số nghe được (audible error) được ánh xạ vào các điểm số chất lượng chủ quan.
PAMS đánh dấu một bước quan trọng trong việc phát triển phương pháp đánh giá khách quan bằng việc sử dụng phương pháp đánh giá từ đầu cuối đến đầu cuối và theo cảm quan của người (perspective). Mô hình này có thể xử lý được các điều kiện biến đổi theo thời gian (time varying) và cho phép thực hiện việc đánh giá một cách nhanh chóng và nhất quán. Độ tin cậy của phương pháp phụ thuộc chủ yếu vào độ chính xác của ánh xạ giữa tham số sai số và điểm số chất lượng chủ quan [13, 18].
9.3.1.3 PESQ
Trong khoảng cuối những năm 1990, ITU đã tiến hành đánh giá năm phương pháp đánh giá chất lượng thoại khác nhau. Hai phương pháp tốt nhất là PSQM99 và PAMS được kết hợp thành một mô hình mới, sau đó được đưa vào khuyến nghị P.862 trong năm 2001 [19]. Phương pháp mới này được gọi là PESQ (Perceptual evaluation of speech quality) và đã nhanh chóng trở thành
Căn chỉnh thời gian Căn chỉnh mức Cân bằng Biến đổi thính giác Biến đổi thính giác Tham số hóa sai số Tham số hóa sai số Mặt cảm thụ chuẩn Mặt cảm thụ đầu ra tín hiệu đầu vào tín hiệu đầu ra điểm chất lượng
tiêu chuẩn phổ biến nhất trong các phương pháp đánh giá chất lượng khách quan dựa trên tín hiệu.
Giống như PSQM và PAMS, PESQ được phát triển với mục đích đánh giá chất lượng thoại một chiều cho tín hiệu thoại băng hẹp. Nó kết hợp quy trình căn chỉnh thời gian (time alignment) của PAMS với phương pháp mô hình giác quan (perceptual modeling) của PSQM99. Ngoài ra, PESQ bổ sung thêm các chức năng mới như cân bằng hàm truyền đạt và một phương pháp tính độ méo trung bình theo thời gian. Cả mẫu nhân tạo và tự nhiên đều có thể sử dụng được trong việc kiểm tra và mô hình này được khuyến nghị sử dụng trong việc đánh giá codec thoại, chọn lựa codec, kiểm tra mạng đang hoạt động và kiểm tra mạng thừ nghiệm.
Hình 34 – Thuật toán PESQ
Thuật toán PESQ bao gồm các bước sau:
1. Tiền xử lý: căn chỉnh mức để giữ cho tín hiệu chuẩn và tín hiệu đầu ra ở cùng mức năng lượng. Nếu cần thiết, bù tín hiệu để trừ hao hiệu ứng lọc. Loại bỏ các trễ biến thiên. Căn chỉnh thời gian của tín hiệu chuẩn và tín hiệu đầu ra để tiện cho việc so sánh.
2. Biến đổi thính giác: đưa các tính chất thính giác vào mô hình.
3. Xử lý nhiễu: sự khác biệt nghe thấy giữa tín hiệu chuẩn và tín hiệu đầu ra được mô tả bằng mặt sai số. Tính toán yếu tố nhiễu tuyệt đối và nhiễu có tính cộng.
4. Hai giá trị trung bình được kết hợp tuyến tính để tính ra điểm số giá trị khách quan. Hệ thống cần đánh giá Điều chỉnh mức Điều chỉnh mức Lọc Lọc Điều chỉnh thời gian và cân bằng tín hiệu Biến đổi thính giác Biến đổi thính giác Xử lý nhiễu Mô hình nhận thức Xác định các tín hiệu xấu Tín hiệu chuẩn Tín hiệu đầu ra điều chỉnh lại thời gian Chất lượng thoại
Mặt hạn chế của mô hình PESQ là kết quả chất lượng không dễ hiểu. Mô hình cân nhắc các yếu tố ảnh hưởng như méo thoại một chiều và nhiễu nhưng lại không xem xét yếu tố như tiếng vọng và side tone. Vì vậy, có thể đạt được điểm PESQ cao mặc dù chất lượng thoại lại kém. Tuy nhiên, phương pháp PESQ vẫn có sự tương quan cao với điểm số chất lượng khách quan hơn các phương pháp trước đó như PSQM [20].
Mô hình PESQ có thể được mở rộng hơn nữa bằng cách bổ sung hiệu ứng modeling masking gọi là trải tần số thời gian (time frequency spreading). Phương pháp mới được gọi là PESQM và được dùng để đánh giá yếu tốc như sidetone và méo tiếng vọng [21].