III. GIỚI THIỆU MỘT SỐ PHƢƠNG PHÁP ĐÁNH GIÁ CHẤT LƢỢNG THOẠ
3. Phƣơng phỏp đỏnh giỏ chất lƣợng thoại theo cảm nhậ n PESQ
3.1 Giới thiệu
Khi PSQM đƣợc tiờu chuẩn hoỏ thành ITU-T P.861 thỡ phạm vi của tiờu chuẩn phần lớn nằm ở việc đỏnh giỏ cỏc bộ codec mà sử dụng trong cỏc ứng dụng di
động nhƣ GSM. VoIP khụng phải là đối tƣợng tại thời điểm này. Ngay sau đú yờu cầu đo kiểm cho cỏc đối tƣợng khỏc nhau đƣợc thay đổi một cỏch mạnh mẽ và ITU- T đó thành lập ra một nhúm để điều chỉnh lại tiờu chuẩn P.861 để đỏp ứng cỏc nhu cầu đo kiểm mới nhƣ là VoIP. Với cỏc mạng này, thuật toỏn đo kiểm gặp phải cỏc mộo tớn hiệu lớn hơn rất nhiều so với codec GSM nhƣng yếu tố quan trọng nhất là độ trễ giữa tớn hiệu đo kiểm và tớn hiệu tham khảo khụng cũn là yếu tố khụng đổi nữa.[6]
Tiếp cận đầu tiờn để vƣợt qua cỏc vấn đề này là sự phỏt triển của PSQM+, nú cú thể xử lý cỏc độ mộo lớn nhƣ đƣợc gõy ra bởi cỏc lỗi burst nhƣng vẫn cũn tồn tại vấn đề quan trọng đú là vấn đề bự cho sự thay đổi của trễ.
Với tiờu chuẩn mới ITU-T P.862 mà bản chất là PESQ, vấn đề này cuối cựng đó đƣợc giải quyết. PESQ kết hợp giữa mụ hỡnh nhận thức õm học tuyệt vời của PSQM+ với một thuật toỏn đồng bộ thời gian giỳp cho việc xử lý trễ thay đổi một cỏch hoàn hảo. Hiện nay, PSQM và PESQ là hai tiờu chuẩn đầy đủ cho vấn đề đo kiểm chất lƣợng thoại.[6]
3.2 Cấu trỳc của mụ hỡnh PESQ
Hỡnh 44: Mụ hỡnh thuật toỏn PESQ
Tổng quỏt về mụ hỡnh PESQ đƣợc thể hiện hỡnh trờn. Mụ hỡnh đƣợc bắt đầu với việc đồng bộ mức cho cả hai tớn hiệu với một mức nghe chuẩn. Cỏc tớn hiệu này đƣợc lọc (sử dụng một bộ FFT) bằng bộ lọc đầu vào để mụ hỡnh hoỏ một tổ hợp
nghe núi điện thoại. Cỏc tớn hiệu đƣợc đồng bộ thời gian và đƣợc xử lý thụng qua bộ biến đổi tiếng tƣơng tự nhƣ trong PSQM. Một phần của việc chuyển đổi liờn quan đến việc làm bằng tớn hiệu cho đỏp ứng tần số của hệ thống và biến số khuyếch đại. Sự khỏc nhau giữa việc biến đổi tớn hiệu tham khảo và tớn hiệu suy biến đƣợc gọi là nhiễu. Nhiễu này đƣợc xử lý để tỏch ra hai thụng số mộo, rồi đƣợc tập hợp trong miền tần số và thời gian và đƣợc tớnh toỏn sang điểm đỏnh giỏ chủ quan trung bỡnh MOS.[6]
3.2.1 Đồng bộ thời gian
Đồng bộ thời gian trong PESQ đƣợc sử dụng bởi vỡ trễ của cỏc tớn hiệu là thay đổi đối với cả khoảng lặng và khoảng tiếng.
- Cỏc tớn hiệu đƣợc lọc bởi bộ lọc thụng hẹp để chỉ lấy phần tớn hiệu trong phần cảm nhận
- Đỏnh giỏ trễ dựa trờn gúi thoại
- Chia tớn hiệu tham khảo thành cỏc đoạn thoại - Đỏnh giỏ trễ cho từng đoạn thoại
- Tƣơng quan sang trễ dựa trờn biểu đồ cho từng đoạn thoại
- Chia đoạn thoại và đồng bộ lại để kiểm tra thay đổi của trễ trong thời gian hội thoại
Kết quả là một loạt cỏc phõn đoạn với thời gian bắt đầu, thời gian kết thỳc và trễ.
3.2.2 Chuyển đổi tiếng
Việc chuyển đổi tiếng trong PESQ là một mụ hỡnh õm học để ỏnh xạ tớn hiệu thành cỏc đặc trƣng của tiếng núi cảm nhận theo thời gian và tần số.
- Phổ Bark: Một chuyển đổi STFT với cửa sổ Hamming đƣợc sử dụng để tớnh toỏn phổ năng lƣợng tức thời trong mối khung.
- Làm bằng tần số: Phổ Bark trung bỡnh đƣợc tớnh toỏn cho từng khung thoại tớch cực. Sự khỏc nhau về phổ đƣa ra một đỏnh giỏ của hàm chuyển đổi, giả thiết rằng hệ thống đang đo kiểm cú đỏp ứng tần số khụng đổi. Tớn hiệu tham khảo đƣợc làm bằng với tớn hiệu suy biến sử dụng đỏp ứng này với đƣờng bao giới hạn làm bằng +/-20dB
- Làm bằng biến khuyếch đại: Tỷ lệ giữa cụng suốt nghe đƣợc của tớn hiệu tham khoả và tớn hiệu suy biến ở trong mỗi khung đƣợc sử dụng để tớnh toỏn biến số khuyếch đại. Thụng số này đƣợc lọc bởi bộ lọc thụng thấp cấp 1 (first-order
low-pass) và làm đƣờng bao rồi tớn hiệu suy biến đƣợc làm bằng với tớn hiệu tham khảo.
- Ánh xạ độ to: Phổ Bark đƣợc ỏnh xạ sang độ to bao gồm một ngƣỡng phụ thuộc tần số. Điều này đƣa ra độ to cảm nhận trong mỗi gúi thời gian-tần số.
3.2.3 Xử lý nhiễu và mụ hỡnh cảm thụ
Sự khỏc nhau tuyệt đối giữa tớn hiệu suy biến và tớn hiệu tham khảo đƣa ra một đo kiểm về lỗi tiếng. Trong PESQ, điều này đƣợc xử lý thụng qua một số bƣớc trƣớc khi tớnh toỏn giỏ trị trung bỡnh phi tuyến theo thời gian và tần số.
- Xoỏ: Khi trễ thay đổi, sẽ cú phõn đoạn bị chồng lờn tớn hiệu suy biến. Nếu sự chồng này quỏ nửa khung, cỏc phõn đoạn này sẽ bị xoỏ
- Mặt nạ: Mặt nạ trong mỗi khung thời gian-tần số đƣợc mụ hỡnh hoỏ sử dụng một ngƣỡng đơn giản mà dƣới đú tớn hiệu sẽ khụng nghe đƣợc, ngƣỡng thƣờng đƣợc đặt bằng ẳ giỏ trị nhỏ nhất trong 2 giỏ trị độ to của tớn hiệu tham khảo và tớn hiệu suy biến
- Khụng đối xứng: khụng giống nhƣ P.861, PESQ tớnh toỏn 2 giỏ trị trung bỡnh lỗi khỏc nhau, một giỏ trị cú và một giỏ trị khụng cú yếu tố bất đối xứng. Nhõn tố bất đối xứng PESQ đƣợc tớnh toỏn từ một tỷ lệ ổn định của mật độ phổ Bark của độ to tớn hiệu tham khảo và tớn hiệu suy biến trong mỗi khung tần số-thời gian.
3.2.4 Tổng hợp của nhiễu trong tần số và thời gian
Nhiễu đƣợc tổng hợp sử dụng cụng thức Lp quy tắc Lp để tớnh toỏn trung bỡnh phi tuyến theo cụng thức sau:
Trƣớc tiờn, nhiễu đƣợc cộng lại theo tần số sử dụng quy tắc Lp đƣa ra một đo lƣờng theo khung của nhiễu cảm nhận đƣợc. Nhiễu khung này sau đú đƣợc nhõn với 2 giỏ trị, giỏ trị thứ nhất tỷ lệ nghịch với năng lƣợng tức thỡ của tớn hiệu tham khảo. Điều này thay thế cho giỏ trị khoảng lặng trong P.861. Giỏ trị thứ 2 làm giảm tớnh quan trọng trong cỏc khung tại cỏc điểm đầu của khung nếu nhƣ tổng chiều dài lớn hơn 16s, mụ hỡnh ảnh hƣởng của bộ nhớ ngắn hạn trong nghe chủ quan. Sau khi đỏnh giỏ, nhiễu khung đƣợc trung bỡnh hoỏ theo thời gian qua cỏc khoảng chia 20 khung (xấp xỉ 320ms) sử dụng quy tắc Lp. Cỏc khoảng này đƣợc chồng lờn nhau 50% và khụng sử dụng hàm cửa sổ nào. Cỏc giỏ trị nhiễu này cuối cựng đƣợc trung
bỡnh trờn cả chiều dài của file tiếng sử dụng quy tắc Lp. Nhƣ vậy, quỏ trỡnh tổng hợp nhiễu sử dụng 3 lần Lp để ỏnh xạ nhiễu thành một giỏ trị
3.2.5 Đồng bộ lại cỏc khung lỗi
Trong một số trƣờng hợp, việc đồng bộ thời gian lần đầu tiờn cú thể khụng thành cụng trong việc xỏc định chớnh xỏc sự thay đổi của trễ, dẫn đến cỏc lỗi lớn cho từng phõn đoạn với trễ khụng chớnh xỏc. Cỏc lỗi này đƣợc nhận dạng bằng đỏnh dấu khung lỗi (cú nhiễu đối xứng lớn hơn 45) và một phõn đoạn đƣợc đỏnh dấu lỗi khi cú ớt hơn 5 khung tốt nằm giữa 2 khung lỗi liờn tiếp. Từng phõn đoạn này sau đú đƣợc đồng bộ lại và tớnh toỏn lại nhiễu. Tƣơng quan chộo đƣợc sử dụng để tỡm ra một đỏnh giỏ trễ mới. Chuyển đổi tiếng của tớn hiệu suy biến đƣợc tớnh toỏn lại và tỡm lại đƣợc giỏ trị nhiễu. Đối với từng khung, nếu đồng bộ lại mang đếngiỏ trị nhiễu thấp hơn, giỏ trị mới này đƣợc sử dụng. Việc tổng hợp nhiễu cho toàn bộ tớn hiệu đƣợc thực hiện sau khi hoàn thành việc đồng bộ lại.
3.2.6 Đỏnh giỏ điểm MOS và hiệu chỉnh mụ hỡnh
Để huấn luyện PESQ, một số lƣợng lớn cỏc thụng số nhiễu đối xứng và khụng đối xứng đƣợc tớnh toỏn nhờ cỏc giỏ trị p khỏc nhau cho mỗi giai đoạn lấy trung bỡnh. Một sự kết hợp tuyến tớnh cỏc thụng số nhiễu đƣợc sử dụng nhƣ là một bộ ƣớc lƣợng điểm MOS. Tƣơng tự, một ỏnh xạ tuyến tớnh cũng đƣợc sử dụng trong quỏ trỡnh hiệu chuẩn. Việc huấn luyện cuối cựng đƣợc thực hiện trờn cơ sở dữ liệu của 30 cuộc đo thử chủ quan. Cụng thức điểm MOS sử dụng PESQ nhƣ sau:
PESQMOS = 4.5 – 0.1 disturbanceSYMMETRIC – 0.0309 disturbanceASYMMETRIC
Trong điều kiện thụng thƣờng, giỏ trị đo đƣợc sẽ nằm trong khoảng từ 1,0 (tồi) đến 4,5 (khụng mộo). Trong trƣờng hợp cú mộo lớn, giỏ trị PESQMOS cú thể giảm xuống dƣới 1,0, nhƣng điều này rất ớt khi xảy ra.[6]
CHƯƠNG 3: GIỚI THIỆU MỘT SỐ HỆ THỐNG ĐO KIỂM VOIP