49 5.2 Một số phương pháp đánh giá khách quan chất lượng hình ảnh trong các ứng dụng đa phương tiện 49 5.2.1 Phương pháp đánh giá khách quan chất lượng hình ảnh video trong các ứng dụng
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
BÙI THỊ CẨM TÚ
NGHIÊN CỨU CÁC PHƯƠNG PHÁP ĐÁNH GIÁ CHẤT LƯỢNG VIDEO TRONG CÁC ỨNG DỤNG ĐA
PHƯƠNG TIỆN
Ngành: Công nghệ Điện tử - Viễn thông
Chuyên ngành: Kỹ thuật Điện tử
LUẬN VĂN THẠC SĨ ĐIỆN TỬ - VIỄN THÔNG
NGƯỜI HƯỚNG DẪN KHOA HỌC: TIẾN SĨ LÊ VŨ HÀ
Hà Nội - 2013
Trang 35
MỤC LỤC
LỜI CAM ĐOAN 3
LỜI CẢM ƠN 4
MỤC LỤC 5
DANH MỤC BẢNG BIỂU 8
DANH MỤC HÌNH VẼ 9
THUẬT NGỮ VIẾT TẮT 10
CHƯƠNG 1 TỔNG QUAN VỀ CÔNG NGHỆ ĐA PHƯƠNG TIỆN VÀ CÁC ỨNG DỤNG ĐA PHƯƠNG TIỆN 14
1.1 Công nghệ đa phương tiện 14 1.2 Một số ứng dụng đa phương tiện điển hình 14 1.2.1 Video call 14
1.2.2 Một số ứng dụng điển hình dựa trên IPTV 15
1.2.2.1 Dịch vụ hội nghị truyền hình 16
1.2.2.2 Video on Demand (VOD) 18
1.2.2.3 Truyền hình thời gian thực (Live TV), MobileTV 19
1.2.2.4 Dịch vụ hình ảnh và nhạc chờ đa phương tiện (MediaRingBackTone) 20
1.2.2.5 Truyền hình giám sát (Video Surveillance) 20
1.3 Mã hóa video trong các ứng dụng đa phương tiện 21 CHƯƠNG 2 NGHIÊN CỨU VỀ CHẤT LƯỢNG VIDEO CỦA CÁC ỨNG DỤNG ĐA PHƯƠNG TIỆN 23
2.1 Các yếu tố ảnh hưởng đến chất lượng video 23 2.1.1 Ảnh hưởng bởi hệ thống mã hóa/giải mã 23
2.1.2 Giới hạn về băng thông 24
2.1.3 Mất gói tin 24
2.1.4 Nghẽn tại máy chủ 24
2.1.5 Jitter và Timing drift 25
2.1.6 Ảnh hưởng của nhiễu 25
2.1.7 Suy hao đường truyền và fadding trong thông tin di động 25
2.2 Vấn đề đánh giá chất lượng video trong các ứng dụng đa phương tiện 25 2.3 Thực trạng đo đánh giá chất lượng video trong các ứng dụng đa phương tiện ở Việt Nam 26 2.3.1 Thực trạng triển khai các dịch vụ đa phương tiện của một số nhà cung cấp dịch vụ tại Việt Nam 26 2.3.1.1 Tập đoàn VNPT 26
2.3.1.2 Tập đoàn Viettel 26
2.3.1.3 FPT Telecom 26
2.3.1.4 VTC 26
2.3.2 Vấn đề đo đánh giá chất lượng video trong các ứng dụng đa phương tiện 27
CHƯƠNG 3 NGHIÊN CỨU TÌNH HÌNH CHUẨN HÓA PHƯƠNG PHÁP ĐÁNH GIÁ CHẤT LƯỢNG HÌNH ẢNH 28
Trang 46
3.1 Tình hình tiêu chuẩn hóa phương pháp đánh giá chủ quan 28 3.2 Tình hình tiêu chuẩn hóa phương pháp đánh giá khách quan 30 CHƯƠNG 4 PHƯƠNG PHÁP ĐÁNH GIÁ CHỦ QUAN CHẤT LƯỢNG
VIDEO TRONG CÁC ỨNG DỤNG ĐA PHƯƠNG TIỆN 32
4.1 Các điều kiện trong phương pháp đánh giá chủ quan 32 4.2 Một số phương pháp đánh giá chủ quan chất lượng hình ảnh video trong các ứng dụng đa phương tiện 36 4.2.1 Phương pháp đánh giá phân loại tuyệt đối (ACR) 36
4.2.2 Phương pháp đánh giá phân loại tuyệt đối với tham chiếu ẩn (ACR-HR) 38
4.2.3 Phương pháp đánh giá phân loại suy giảm (DCR) 38
4.2.4 Phương pháp so sánh theo cặp (PC) 40
4.2.5 Phương pháp thang đo chất lượng liên tục bằng tác nhân kích thích kép (DSCQS) 41
4.2.6 Phương pháp đánh giá chất lượng liên tục bằng tác nhân kích thích đơn (SSCQE) 42
4.2.7 Phương pháp đánh giá chủ quan chất lượng hình ảnh (SAMVIQ) 43
4.3 Tổng kết 44 CHƯƠNG 5 PHƯƠNG PHÁP ĐÁNH GIÁ KHÁCH QUAN CHẤT LƯỢNG VIDEO TRONG CÁC ỨNG DỤNG ĐA PHƯƠNG TIỆN 47
5.1 Các mô hình tham chiếu trong phương pháp đánh giá khách quan 47 5.1.1 Mô hình tham chiếu đầy đủ ( Full _reference) 47
5.1.2 Mô hình tham chiếu rút gọn ( Reduce – Reference) 48
5.1.3 Mô hình không tham chiếu ( Non(Zero) _ reference) 49
5.2 Một số phương pháp đánh giá khách quan chất lượng hình ảnh trong các ứng dụng đa phương tiện 49 5.2.1 Phương pháp đánh giá khách quan chất lượng hình ảnh video trong các ứng dụng đa phương tiện theo giải thuật FR-NTT 50
5.2.2 Phương pháp đánh giá khách quan chất lượng hình ảnh video trong các ứng dụng đa phương tiện theo giải thuật FR-PEVQ 51
5.2.3 Phương pháp đánh giá khách quan chất lượng hình ảnh video trong các ứng dụng đa phương tiện theo FR-SwissQual 53
5.2.4 Phương pháp đánh giá khách quan chất lượng hình ảnh video trong các ứng dụng đa phương tiện theo FR-Tektronix 54
5.2.5 Phương pháp đánh giá khách quan chất lượng hình ảnh video trong các ứng dụng đa phương tiện theo Yonsei 54
5.2.6 Phương pháp đánh giá chất lượng hình ảnh video trong các ứng dụng đa phương tiện theo giải thuật NR-BLINDSII 54
5.2.7 Phương pháp đánh giá khách quan chất lượng hình ảnh video trong các ứng dụng đa phương tiện theo giải thuật NR- NIQE 55
5.3 Hiệu năng của các phương pháp đo đánh giá chất lượng hình ảnh trong các ứng dụng đa phương tiện 58 5.3.1 Hiệu năng các phương pháp theo mô hình tham chiếu đầy đủ (FR) 59
5.3.2 Hiệu năng các phương pháp theo mô hình tham chiếu rút gọn (RR) 59
5.3.3 Hiệu năng các phương pháp theo mô hình không tham chiếu (NR) 60
Trang 57
5.4 Mô phỏng phương pháp đánh giá chất lượng hình ảnh theo giải thuật
5.4.1 Môi trường cài đặt 61
5.4.2 Dữ liệu hình ảnh thử nghiệm 61
5.4.3 Đánh giá PSNR dữ liệu hình ảnh thử nghiệm 68
5.4.4 Kết quả đánh giá dữ liệu hình ảnh thử nghiệm theo giải thuật NR-NIQE 68
CHƯƠNG 6 KẾT LUẬN VÀ KHUYẾN NGHỊ 70
6.1 Kết luận 70 6.2 Khuyến nghị 71 PHỤ LỤC A 74
HƯỚNG DẪN CHO NGƯỜI QUAN SÁT (ACR, ACR-HR, DCR, PC) 74
PHỤ LỤC B 76
CÁC HÀM MÔ PHỎNG PHƯƠNG PHÁP NIQE TRONG MATLAB 76
PHỤ LỤC C 80
CÁC THAM SỐ CHẤT LƯỢNG VIDEO ĐA PHƯƠNG TIỆN 80
C.1 Các tham số chất lượng Video 80 C.1.1 Các lớp Video 80
C.1.2 Yêu cầu tốc độ khung hình (FR) đối với các ứng dụng 80
C.2 Các tham số chất lượng khách quan 83 C.2.1 Các tham số luồng Video đa phương tiện 83
C.2.2 Đánh giá chất lượng Video qua tỉ lệ mất khung I, P, B trong luồng Video 83
C.2.3 Các tham số chất lượng truyền tải Video (Transport Metrics) 84
C.2.4 Các tham số sửa lỗi 85
C.2.5 Các tham số gói tin UDP tin cậy 85
C.2.6 Các tham trễ và biến động trễ 85
C.2.7 Các tham số đánh giá theo TR 101 290 MPEG 86
C.3 Chuyển đổi kết quả đánh giá khách quan bằng PSNR sang MOS 87 C.4 Các tham số đối với MobileTV 87 C.5 Đánh giá độ lệch hình và tiếng 87 TÀI LIỆU THAM KHẢO 89
Trang 68
DANH MỤC BẢNG BIỂU
Bảng 1 Các tiêu chuẩn kỹ thuật đặc trưng về hình ảnh trong hội nghị truyền hình 18
Bảng 2 Các chuẩn phổ dụng và các chỉ tiêu kỹ thuật tương ứng 19
Bảng 3 Định dạng độ phân giải 19
Bảng 4 Tiêu chuẩn ITU về phương pháp đánh giá chủ quan chất lượng hình ảnh 28
Bảng 5 Các điều kiện quan sát 33
Bảng 6 Các chuỗi kiểm tra áp dụng trong đánh giá chất lượng video của các ứng dụng đa phương tiện 35
Bảng 7 Thang đo chất lượng 5 mức theo phương pháp ACR 37
Bảng 8 Thang đo chất lượng 5 mức theo phương pháp DCR 39
Bảng 9 Thang so sánh 7 mức theo phương pháp PC 40
Bảng 10 Hiệu năng của các phương pháp theo mô hình tham chiếu đầy đủ (FR)[6] 59
Bảng 11 Hiệu năng của các phương pháp theo mô hình tham chiếu rút gọn (RR)[6] 59
Bảng 12 Hiệu năng của các phương pháp theo mô hình không tham chiếu (NR) [7] 60
Bảng 13 PSNR của các hình ảnh thử nghiệm 68
Bảng 14 Chỉ số NIQE chuỗi hình ảnh thử nghiệm (1) 68
Bảng 15 Chỉ số NIQE chuỗi hình ảnh thử nghiệm (2) 68
Bảng 16 Khuyến nghị áp dụng các phương pháp đánh giá 71
Bảng 17 Định nghĩa của các lớp video 80
Bảng 18 Chuyển đổi giá trị PSNR sang MOS 87
Trang 79
DANH MỤC HÌNH VẼ
Hình 1 Sơ đồ kết nối thiết bị điển hình cho Video conference 17
Hình 2 Quá trình phát triển của các tiêu chuẩn mã hóa 22
Hình 3 Tổ chức tiêu chuẩn hóa phương pháp đánh giá khách quan 31
Hình 4 Đánh giá chủ quan chất lượng hình ảnh 33
Hình 5 Trình chiếu trong phương pháp ACR 37
Hình 6 Ví dụ về đặc tính MOS trong phương pháp ACR 38
Hình 7 Trình chiếu trong phương pháp DCR 39
Hình 8 Trình chiếu trong phương pháp PC 40
Hình 9 Trình chiếu trong phương pháp DSCQS 41
Hình 10 Phân loại đánh giá DSCQS 42
Hình 11 Trình chiếu trong phương pháp SSCQE 43
Hình 12 Ví dụ về bố trí màn hình đánh giá SAMVIQ 44
Hình 13 Mô hình triển khai tham chiếu đầy đủ 48
Hình 14 Mô hình tham chiếu rút gọn 49
Hình 15 Mô hình không tham chiếu 49
Hình 16 Giải thuật NTT trong đánh giá khách quan chất lượng video trong các ứng dụng đa phương tiện 50
Hình 17 Nguyên tắc hoạt động của các thiết bị đo chất lượng video theo giải thuật PEVQ 52
Hình 18 Cấu hình đo theo giải thuật PEVQ 53
Hình 19 MOS tương ứng với độ lệch hình và tiếng 88
Trang 810
THUẬT NGỮ VIẾT TẮT
Viết tắt Chú giải tiếng anh Chú giải tiếng Việt
AAC Advanced Audio Codec Giải mã âm thanh tiên tiến
ACR Absolute Category Rating Phân loại tuyệt đối
ACR-HR Absolute Category Rating with Hidden Reference Đánh giá phân loại tuyệt đối với tham chiếu ẩn AVI Audio Video Interleave Định dạng AVI
CIF Common Intermediate Format Định dạng trung gian phổ thông
DCR Dgradation Category Rating Phân loại theo mức suy giảm
DMOS Difference Mean Opinion Score Điểm đánh giá sai khác chất lượng trung bình
DSCQS Double Stimulus Continuous Quality Scale Thang đo chất lượng kích thích kép liên tục DSCS Double Stimulus Comparison Scale Thang so sánh kích thích kép
DSIS Double Stimulus Impairment Scale
FRTV Full Reference TeleVision Truyền hình tham chiếu đầy đủ HDTV High Definition TV Truyền hình độ nét cao
HE-AAC High Eficiency ACC Chuẩn âm thanh ACC hiệu quả HRC Hypothetical Reference Circuit Mạch tham khảo giả thiết
ILG VQEG’s Independent Laboratory
Group
Nhóm phòng thí nghiệm độc lập của VQEG
IPTV Internet Protocol on TV Truyền hình trên nền IP
IPv4,
IPv6 Internet Protocol version 4 / 6 Giao thức IP version 4 / 6
ITU International Telecommunication Union Hiệp hội Viễn thông thế giới
MAC Medium Access Control Điều khiển truy cập phương tiện MOS Mean Opinion Score Điểm đánh giá trung bình
MOSp Mean Opinion Score, predicted Điểm đánh giá trung bình được dự báo
MPEG Moving Picture Expert Group Nhóm chuyên gia các hình ảnh động
MSAN MultiService Access Node Thiết bị truy cập đa dịch vụ
NR No (or Zero) Reference Không tham chiếu
PDU Protocol Data Unit Đơn vị dữ liệu giao thức
PDV Packet Delay Variation Biến động trễ gói
Trang 911
PEVQ Perceptual Evaluation of Video Quality Đánh giá trực giác chất lượng Video
PON Passive Optical Network Mạng quang thụ động
PSNR Peak Signal-to-Noise Ratio Tỷ số tín hiệu cực đại trên tạp nhiễu PVR Personal Video Recorder Thiết bị ghi Video cá nhân
PVS Processed Video Sequence Trình tự xử lý Video
QCIF Quarter Common Intermediate
QoE Quallity of Exprerience Chất lượng dịch vụ
RMSE Root Mean Square Error Sai số bình phương trung bình gốc
SAMVIQ Subjective Asseccment Methodology for Video Quality Phương pháp đánh giá chất lượng Video chủ quan
SRC Source Reference Channel or Circuit Kênh hoặc mạch tham chiếu gốc
SSCQE Single Stimulus Continuous Quality Evaluation Phương pháp đánh giá chất lượng liên tục kích thích đơn
SSMR Single Stimulus with Multiple Repetition Kích thích đơn với nhiều lần lặp lại
UDP/IP User Datagram Protocol/Internet
Protocol
Giao thức UDP (xem IETF RFC 768 [B5]) / IP (see IETF RFC 791 [B6])
VQEG Video Quality Experts Group Nhóm chuyên gia nghiên cứu chất lượng Video VQEG Video Quality Experts Group Nhóm chuyên gia chất lượng Video YUV Colour Space and file format Không gian màu và định dạng tệp
Trang 1012
LỜI NÓI ĐẦU
Với sự phát triển nhanh chóng của công nghệ, các ứng dụng đa phương tiện được phát triển hầu như ở mọi nơi Các hãng cung cấp thiết bị cũng như các nhà cung cấp dịch
vụ đều hướng tới việc cung cấp các ứng dụng đa phương tiện
Thực tiễn cho thấy các dịch vụ thông tin ngày nay không chỉ đơn thuần là cung cấp dữ liệu, số liệu mà đòi hỏi sự trực quan và tương tác cao Dữ liệu đa phương tiện bao gồm text, đồ họa và đặc biệt là ảnh video… Do đó, các hình thức, loại hình, cũng như yêu cầu về chất lượng dịch vụ truyền thông đa phương tiện ngày càng phong phú,
đa dạng Việc đánh giá chất lượng ảnh, video sẽ góp phần quan trọng đối với chất lượng của các ứng dụng đa phương tiện được cung cấp Cùng với sự phát triển mạnh
mẽ của các ứng dụng đa phương tiện trên thực tế thì việc nghiên cứu các phương pháp đánh giá chất lượng của các ứng dụng này, cụ thể hơn là đánh giá chất lượng video, hình ảnh của các dữ liệu đa phương tiện là hết sức quan trọng và cần thiết Do đó mục tiêu của luận văn này sẽ nghiên cứu các phương pháp đánh giá chất lượng video cho các ứng dụng đa phương tiện
Đối tượng nghiên cứu của luận văn là nghiên cứu các phương pháp đánh giá chất lượng Video cho các ứng dụng đa phương tiện, nghiên cứu các loại hình dịch vụ
đa phương tiện, các chuẩn liên quan đến các lớp Video và chất lượng video của các tổ chức quốc tế Ngoài ra, đối tượng nghiên cứu của luận văn còn bao gồm các tài liệu kỹ thuật, các kết quả nghiên cứu có liên quan đến lĩnh vực truyền thông đa phương tiện và các loại máy đo liên quan đến chất lượng Video và âm thanh
Nhằm mục đích nghiên cứu các phương pháp đánh giá chất lượng video trong các ứng dụng đa phương tiện, luận văn được xây dựng theo các nội dung như sau: CHƯƠNG 1: TỔNG QUAN VỀ CÔNG NGHỆ ĐA PHƯƠNG TIỆN VÀ CÁC ỨNG DỤNG ĐA PHƯƠNG TIỆN
CHƯƠNG 2: NGHIÊN CỨU VỀ CHẤT LƯỢNG VIDEO CỦA CÁC ỨNG DỤNG
ĐA PHƯƠNG TIỆN
CHƯƠNG 3: NGHIÊN CỨU TÌNH HÌNH CHUẨN HÓA PHƯƠNG PHÁP ĐÁNH GIÁ CHẤT LƯỢNG HÌNH ẢNH
CHƯƠNG 4: PHƯƠNG PHÁP ĐÁNH GIÁ CHỦ QUAN CHẤT LƯỢNG VIDEO TRONG CÁC ỨNG DỤNG ĐA PHƯƠNG TIỆN
CHƯƠNG 5: PHƯƠNG PHÁP ĐÁNH GIÁ KHÁCH QUAN CHẤT LƯỢNG VIDEO
Trang 1113
TRONG CÁC ỨNG DỤNG ĐA PHƯƠNG TIỆN
CHƯƠNG 6: KẾT LUẬN VÀ KHUYẾN NGHỊ
Mục tiêu của luận văn là từ các kết quả nghiên cứu, thực hiện chương trình mô phỏng một trong những giải thuật đánh giá khách quan chất lượng video trong các ứng đụng đa phương tiện, làm nền tảng cơ bản phát triển một hệ thống đánh giá chất lượng hình ảnh Các kết quả mô phỏng được trình bày trong chương 5
Với lượng thời gian có hạn, em đã nỗ lực thu thập tài liệu và xử lý thông tin liên quan đến các phương pháp đánh giá chất lượng video cho các ứng dụng đa phương tiện Tuy nhiên, do việc đánh giá chất lượng video trong các ứng dụng đa phương tiện
là một vấn đề mới mẻ và phức tạp với nhiều phương pháp đánh giá đa dạng, phong phú và còn đang được tiếp tục nghiên cứu, nên một số nội dung trong luận văn chưa được chi tiết và không thể tránh khỏi những thiếu sót Em hy vọng nhận được nhiều ý kiến đóng góp để luận văn được hoàn thiện và tiếp tục phát triển
Trong quá trình thực hiện luận văn, em đã nhận được sự hướng dẫn hết sức tận tình của Thầy giáo – Tiến sĩ Lê Vũ Hà, một lần nữa em xin chân thành cảm ơn Thầy
đã hướng dẫn, giúp đỡ để em có thể hoàn thành luận văn tốt nghiệp
Học viên Bùi Thị Cẩm Tú
Trang 1214
CHƯƠNG 1 TỔNG QUAN VỀ CÔNG NGHỆ ĐA PHƯƠNG TIỆN VÀ CÁC
ỨNG DỤNG ĐA PHƯƠNG TIỆN 1.1 Công nghệ đa phương tiện
Nhiều quốc gia đã bắt đầu triển khai hệ thống quảng bá số cho phép cung cấp các ứng dụng đa phương tiện và quảng bá dữ liệu bao gồm video, âm thanh, hình ảnh tĩnh, văn bản và đồ họa
Hệ thống quảng bá phân phối các ứng dụng đa phương tiện có một số đặc điểm khác với các hệ thống truyền hình khác đang sử dụng hiện nay, đó là việc truy nhập thông tin có thể thực hiện thông qua bộ thu cố định hoặc di động; tỷ lệ khung hình cũng có thể cố định hoặc thay đổi, kích thước hình ảnh có phạm vi thay đổi lớn (ví dụ: từ SQCIF đến HDTV); video thường được nhúng với âm thanh, văn bản; video có thể được xử lý bằng các bộ mã hóa video tiên tiến và khoảng cách quan sát dài hay ngắn phụ thuộc vào ứng dụng
Và do đó cơ sở hạ tầng hệ thống quảng bá các dịch vụ đa phương tiện đặc trưng bởi việc sử dụng bộ thu cố định hay di động, tỷ lệ khung hình cố định hay biến đổi, định dạng hình ảnh khác nhau, bộ giải/mã hóa video tiên tiến, mất gói tin, v v; Vấn đề đối với các dịch vụ đa phương tiện xác định là các yêu cầu đặc trưng cho từng loại hình dịch vụ và xác nhận sự phù hợp của giải pháp kỹ thuật cho từng dịch vụ tương ứng với yêu cầu đặc trưng của dịch vụ đó;
Các dịch vụ băng rộng và truyền thông đa phương tiện cho máy tính cá nhân và điện thoại di động đã được mở rộng nhanh chóng và mạnh mẽ Việc cung cấp dịch vụ cho khách hàng với một mức chất lượng thích hợp đòi hỏi công nghệ đánh giá chất lượng
có thể đo lường chính xác chất lượng của video trong dịch vụ đa phương tiện Để hiệu quả thiết kế và quản lý các dịch vụ chất lượng dịch vụ xem xét, chúng ta cần một công nghệ đánh giá chất lượng video cho phép đánh giá tự động chất lượng này Việc đánh giá chất lượng cho các ứng dụng truyền hình đã được nghiên cứu và sử dụng rộng rãi,
ví dụ bởi Nhóm các chuyên gia chất lượng video (VQEG) Gần đây, với sự phát triển của các ứng dụng đa phương tiện, thì việc nghiên cứu và áp dụng các kết quả trong công nghệ đánh giá chất lượng video cho các ứng dụng luồng Internet đang là vấn đề được quan tâm
1.2 Một số ứng dụng đa phương tiện điển hình
1.2.1 Video call
Video Call là dịch vụ thoại thấy hình, cho phép các thuê bao khi đang đàm thoại có thể nhìn thấy hình ảnh trực tiếp của nhau thông qua camera của thiết bị di động
Trang 1315
Điện thoại truyền hình (video call) là một trong các ứng dụng đa phương tiện đột phá trong lĩnh vực thông tin truyền thông Thay vì chỉ giao tiếp thuần túy bằng tín hiệu thoại thì giờ đây ta có thể nhìn thấy và nói chuyện với nhau
Điện thoại truyền hình (video call) thông thường bao gồm 2 hoặc 3 luồng giao thức truyền theo thời gian thực (RTP) trực tiếp thông qua mạng IP Các luồng giao thức truyền:
- Audio (được mã hóa trong chuẩn mã hóa thoại G.722 và G.728)
- Video (mã hóa theo chuẩn H.261 và H.263) ở các cổng khác nhau
- Điều khiển camera từ xa (FECC – far-end camera control) (tùy chọn)
Trong Video call, mã hóa video bao gồm H.261(kiểu mã hóa cũ) và H.263 (kiểu mã hóa mới) được sử dụng để mã hóa video trên nền IP Các loại mã hóa này bao gồm các thông số và giá trị sau:
- Tốc độ mã hóa bit: 64kbps, 320 kbps Các tốc độ bit này có thể là bội số bất kỳ của 100bps
Định dạng 4 khung hình – (4CIF Resolution 704x576)
Định danh phụ của QCIF (SQCIF -Resolution 128x96)
Định dạng 16CIF (Resolution 1408x1152)
- Tốc độ khung hình: 15 khung hình/s (fps), 30 fps
Ứng dụng video call còn được sử dụng kết hợp với nhiều ứng dụng đa phương tiện khác như hội nghị truyền hình (VC), video theo yêu cầu (VOD)…
1.2.2 Một số ứng dụng điển hình dựa trên IPTV
Hệ thống IPTV phát triển dựa trên hệ thống mạng băng thông rộng đang triển khai, có khả năng cung cấp được 05 nhóm dịch vụ như sau:
Dịch vụ truyền hình quảng bá gồm các dịch vụ:
- Truyền hình trực tiếp ( Live TV);
- Truyền hình phát lại (Time-shifted TV);
- Kênh ảo VoD (Virtual channel from VoDs)
- NVoD (near Video on Demand);
- Truyền hình di động (Mobile TV)
Dịch vụ theo yêu cầu (on demand), bao gồm các dịch vụ:
Trang 1416
- Video theo yêu cầu (Video on Demand – VoD);
- Truyền hình theo yêu cầu (TV on Demand – TVoD);
- Trò chơi theo yêu cầu (Games on Demand);
- Nghe nhạc theo yêu cầu (Music on Demand);
- Karaoke theo yêu cầu (Karaoke on Demand)
Các dịch vụ tương tác (interactive), bao gồm các dịch vụ:
- PVR (Personal Video Recorder), cPVR (Client PVR);
- nPVR (Networked PVR);
- Dự đoán và bình chọn (Guess and Voting);
- Giáo dục qua truyền hình (TV education);
- Thương mại trên truyền hình;
- Chức năng tương tác qua mobile
- Dịch vụ thông tin và truyền thông, bao gồm các dịch vụ:
- Internet trên TV (Web browser);
- Cung cấp thông tin qua truyền hình (TV information);
- Nhắn tin qua truyền hình (TV Messaging);
- Hội nghị truyền hình (video conference);
- Điện thoại truyền hình (Video phone);
Các dịch vụ gia tăng khác , bao gồm các dịch vụ:
- Tin nhắn SMS/MMS;
- TV Mail;
- Chia sẻ nội dung (media sharing);
- Video blog;
- Giám sát mọi nơi (global monitoring);
- Game online (multiplayer games)
Sau đây nghiên cứu chi tiết của một số dịch vụ điển hình
1.2.2.1 Dịch vụ hội nghị truyền hình
Dịch vụ hội nghị truyền hình (video conference) - một trong những ứng dụng đa phương tiện được sử dụng rộng rãi ngày nay, là dịch vụ được triển khai và sử dụng dịch vụ dựa trên các công nghệ mạng truyền thông tiên tiến như IP, ATM hay ISDN Dịch vụ này có khả năng truyền hình ảnh, âm thanh trực tuyến giữa nhiều điểm trên mạng không giới hạn về khoảng cách địa lý
Truyền hình ảnh:
Cho phép tùy biến từ 1 – 40 hình/ s, nâng cao chất lượng hình ảnh khi đường truyền tốt:
- QCIF Video (176x144 điểm ảnh): 80Kbps
- CIF Video (352x288 điểm ảnh): 150Kbps
- VGA Video (640x480 điểm ảnh): 300Kbps
Trang 1517
Thiết kế đường truyền
Hệ thống thiết bị hội nghị truyền hình là một hệ thống thiết bị điện tử (bao gồm cả phần cứng và phần mềm) sử dụng công nghệ kỹ thuật số, nén mã hóa và giải mã (coder/decoder) âm thanh và video trong thời gian thực Giải pháp hội nghị truyền hình dựa trên công nghệ IP với sự hỗ trợ nhiều giao thức (H.320, H.323, SIP, SCCP) cho phép triển khai hệ thống Hội nghị truyền hình tiên tiến nhưng vẫn tận dụng được
cơ sở hạ tầng có sẵn
Hình 1 Sơ đồ kết nối thiết bị điển hình cho Video conference
Thiết bị cơ bản bao gồm:
1 Camera - Thu tín hiệu hình ảnh
2 Micro - Thu tín hiệu âm thanh
3 DECODE - Xử lý mã hóa nhận và truyền tín hiệu âm thanh và hình ảnh và truyền qua đường truyền
4 Màn hình hiển thị - Hiển thị hình ảnh của các phòng họp từ xa
5 Loa - Phát tín hiệu âm thanh của các phòng họp từ xa
6 MCU - Thiết bị quản lý và xử lý đa điểm
Trang 1618
7 Lưu Trữ - Ghi lại nội dung cuộc họp
8 Show Present - Thường là phần mềm có chức năng trình chiếu tài liệu tại một máy tính lên hình ảnh của hội nghị
Bảng 1 Các tiêu chuẩn kỹ thuật đặc trưng về hình ảnh trong hội nghị truyền hình
Các tiêu chuẩn đóng gói
Độ delay hình ảnh tối đa 500 milisecond
1.2.2.2 Video on Demand (VOD)
VoD là hệ thống cho phép người dùng lựa chọn và xem các nội dung video hoặc âm thanh theo yêu cầu VoD hồi đáp thắc mắc được phát ra bởi một thuê bao qua thiết bị set-top box hoặc PC, các luồng hồi đáp là mỗi chuỗi các gói unicast tới địa chỉ IP của thiết bị set-top box hoặc máy tính cá nhân Điển hình, trạm quản lý thuê bao sẽ hiển thị một danh sách các sự kiện VoD từ một thuê bao có thể lựa chọn chương trình Cũng phương pháp như vậy, luồng gói dữ liệu IP sẽ biểu diễn một truyền dẫn unicast tới thiết bị set-top box hoặc máy tính cá nhân của thuê bao
RTSP được sử dụng trong các ứng dụng VoD để khách hàng truy cập, điều khiển nội dung lưu trữ tại VoD server VoD thực chất là liên lạc một-một được tạo ra sử dụng unicast Unicast cho phép thực hiện dịch vụ VoD và gửi đến khách hàng đơn lẻ
Hai thành phần quan trọng của một dịch vụ VOD là dịch vụ di động và phiên di động
Dịch vụ di động đề cập đến khả năng truy cập một dịch vụ từ các thiết bị khác qua sử
dụng các mạng truy cập khác nhau Dịch vụ di động True cũng yêu cầu chuyển vùng, tức là không chỉ cho phép các phương pháp truy cập khác nhau cho người sử dụng
Trang 1719
thiết bị khác nhau, mà còn cho phép các UE và để kết nối thông qua mạng lõi IMS quản lý bởi các nhà khai thác khác
Phiên di động là đặc tính cho phép người dùng kết thúc việc xem các video giữa các
phiên và sau đó tiếp tục xem từ cùng một vị trí bằng cách sử dụng một UE Điều này
có nghĩa rằng thời gian hiện tại (thiết lập) trong bộ phim cần phải được lưu trong mạng khi chấm dứt phiên ban đầu, cho phép các MF để bắt đầu streaming bộ phim từ các ô
đã lưu thiết lập khi bộ phim được phát trên các thiết bị của người dùng kế tiếp
Chuẩn nén hình ảnh trong VoD
Bảng 2 Các chuẩn phổ dụng và các chỉ tiêu kỹ thuật tương ứng
Định dạng
video
Sốkhung hình
Tốc độ (Kbps)
30
30
30
384-2000 28.8-768 400-1500 2000-6000 28.8-500
QCIF, CIF SQCIF, QCIF, CIF, 4CIF, 16CIF
QCIF, CIF, 4CIF 4CIF, 16CIF QCIF, CIF
1.2.2.3 Truyền hình thời gian thực (Live TV), MobileTV
Truyền hình thời gian thực (Live TV) là một ứng dụng mà người sử dụng có thể truy cập các nội dung về truyền hình thông qua mạng 3G Luồng Video chất lượng cao thời gian thực có thể được phát thông qua dịch vụ Video Call trong mạng 3G hoặc có thể thực hiện qua kết nối đến hệ thống WAP Portal Đây được hiểu là dịch vụ truyền hình
số trên nền mạng IP cung cấp dạng phát quảng bá (Broadcast) những chương trình truyền hình được thu lại từ hệ thống truyền hình mặt đất, truyền hình cáp, truyền hình
vệ tinh hoặc kênh truyền hình riêng tới khách hàng
Các kênh truyền hình được hỗ trợ tính năng trả tiền theo từng kênh hoặc theo từng thời điểm người xem muốn xem (Pay-per-View – PPV) Set-top-box (STB) có giao diện
Trang 1820
hướng dẫn xem chương trình và kế hoạch phát sóng chương trình TV cập nhật dễ dàng Người xem có thể chuyển kênh thuận tiện trên STB tại đầu cuối của khách hàng
1.2.2.4 Dịch vụ hình ảnh và nhạc chờ đa phương tiện (MediaRingBackTone)
Hình 2 Mô hình cuộc gọi hình ảnh và nhạc chờ đa phương tiện (Media
RingBackTone)
Quy trình thực hiện cuộc gọi Video RingBackTone như sau:
- Khách hàng có thể đăng ký dịch vụ hình ảnh và nhạc chờ đa phương tiện
- Khi có cuộc gọi đến số điện thoại của khách hàng thì cuộc gọi sẽ được định tuyến đến hệ thống Video Ring BackTone thông qua Video Gateway Người gọi đến sẽ nhận được Video Clip do khách hàng đăng ký dịch vụ đã chọn lựa trong quá trình thiết lập cuộc gọi Khi cuộc gọi được thiết lập, Video Clip sẽ được giải phóng và cuộc gọi được kết nối
1.2.2.5 Truyền hình giám sát (Video Surveillance)
Dữ liệu giám sát (hình ảnh video) được truyền từ IP Camera về các máy chủ NVR (Network Video Recorder – là một máy chủ được cài đặt phần mềm NVR), ở đây dữ liệu video được xử lý một cách real-time và cung cấp các chức năng xử lý hình ảnh thông minh hỗ trợ chức năng giám sát cho hệ thống trung tâm
Do hệ thống hoạt động trên nền IP nên chỉ cần máy chủ kết nối với internet, khách hàng hoàn toàn có thể quan sát được camera ở mọi lúc, mọi nơi Dịch vụ Video Surveillance cho phép khách hàng dễ dàng quan sát hình ảnh, video qua giao diện web
và quản lý tập trung hàng trăm camera qua hệ thống quản lý giám sát tập trung (Central Monitoring System)
Trang 1921
Hình 3 Mô hình kết nối dịch vụ truyền hình giám sát
Một ứng dụng khác của dịch vụ truyền hình giám sát là Mobile Camera của giúp cho khách hàng có thể xem được trạng thái giao thông tại các nút giao thông.Dịch vụ này
đã được triển khai tại Hà Nội và TP Hồ Chí Minh, góp phần vào việc giải quyết ùn tắc giao thông đô thị Hay IP camera hiện tại được rất nhiều hộ gia đình, cá nhân sử dụng
để có thể quan sát căn hộ của mình, khi cần thiết, từ nơi làm việc
Một trong những chức năng chính của dịch vụ truyền hình giám sát là phân tích hình ảnh thông minh:
Ghi hình khi xuất hiện chuyển động (Motion Detection)
Chụp ảnh khuôn mặt
Phát hiện vật lạ trong khu vực giám sát
Phát hiện mất đồ trong khu vực giám sát
Đếm người ra vào
Phát hiện xâm nhập vào khu vực cấm
1.3 Mã hóa video trong các ứng dụng đa phương tiện
Mã hóa và giải mã video là một trong những khâu quan trọng trong các ứng dụng đa phương tiện Hiện tại có hai hệ thống tiêu chuẩn chính trong việc thiết lập các tiêu chuẩn nén video Đó chính là ITU (International Telecommunications Union) và MPEG (Motion Picture Experts Group), trong đó các tiêu chuẩn của MPEG được sử dụng chủ yếu trong các ứng dụng đa phương tiện Trong những năm qua cả hai hệ thống tiêu chuẩn này đều đưa ra các tiêu chuẩn cho việc mã hóa và giải mã video
Trang 2022
Hình 2 Quá trình phát triển của các tiêu chuẩn mã hóa
Trong đó, MPEG-4 được thiết kế đặc biệt cho việc nén hình ảnh và âm thanh, tiêu chuẩn này cho phép cung cấp các dịch vụ và nội dung có chất lượng từ thấp cho đến chất lượng cao qua các môi trường truyền tải khác nhau như: băng rộng, không dây, chuyển mạch gói MPEG-4 thực sự là một tập các tiêu chuẩn công nghệ nhằm đảm bảo chất lượng dịch vụ từ nhà cung cấp dịch vụ nội dung đến người dùng cuối MPEG-4 bao gồm các thành phần sau:
- Hệ thống MPEG-4;
- Hệ thống hình ảnh MPEG-4;
- Hệ thống âm thanh MPEG-4;
- Cơ cấu phân phối đa phương tiện (DMIF)
Trong MPEG-4, âm thanh và hình ảnh có thể được lưu trữ và truyền riêng biệt, thiết bị đầu cuối cần phải có khả năng kết hợp các thành phần riêng biệt này dữ liệu đa phương tiện thực sự để trình diễn Thành phần hệ thống MPEG-4 mô tả mối liên hệ giữa hai thành phần âm thanh và hình ảnh, cho phép tổng hợp lại nội dung đa phương tiện tại đầu cuối
Trang 2123
CHƯƠNG 2 NGHIÊN CỨU VỀ CHẤT LƯỢNG VIDEO CỦA CÁC ỨNG
DỤNG ĐA PHƯƠNG TIỆN
Với sự đa dạng và hữu ích của các ứng dụng đa phương tiện thì việc kiểm soát chất lượng video trong các ứng dụng đa phương tiện cũng rất quan trọng Với thực trạng hiện nay thì chất lượng video phụ thuộc chủ yếu vào chất lượng truyền dẫn video trên đường truyền và hệ thống mã hóa/giải mã video Dưới đây là phân tích các yếu tố ảnh hưởng và đánh giá thực trạng chất lượng video của các ứng dụng đa phương tiện
2.1 Các yếu tố ảnh hưởng đến chất lượng video
Có rất nhiều yếu tố ảnh hưởng đến chất lượng video, từ bước hệ thống mã hóa/giải mã, nén/giải nén, các yếu tố trên đường truyền dẫn như giới hạn băng thông đường truyền, mất gói tin, suy hao đường truyền, lỗi bít, can nhiễu, fadding, hay nghẽn tại máy chủ….Trong phần này sẽ nêu một số yếu tố chính ảnh hưởng tới chất lượng video [21]
2.1.1 Ảnh hưởng bởi hệ thống mã hóa/giải mã
Mã hóa và giải mã video là một trong những khâu quan trọng trong các ứng dụng đa phương tiện Hiện tại có hai hệ thống tiêu chuẩn chính trong việc thiết lập các tiêu chuẩn nén video Đó chính là ITU (International Telecommunications Union) và MPEG (Motion Picture Experts Group) [1] Trong những năm qua cả hai hệ thống tiêu chuẩn này đều đưa ra các tiêu chuẩn cho việc mã hóa và giải mã video
Dữ liệu Video trong các ứng dụng đa phương tiện hiện nay thường được mã hóa và nén bằng MPEG2, MPEG4 Part 10/H.264, Microsoft WMV9/VC1 và một số chuẩn nén khác Các bộ mã hóa video thường hỗ trợ một khoảng khá rộng tốc độ nén, điều này cho phép những lựa chọn khác nhau giữa chất lượng và băng thông Phần lớn các phương pháp nén video đều dựa vào việc mã khác nhau giữa các frame (inter-frame) Điều này có nghĩa là, thay vì phải gửi đi tất cả các frame, thì chỉ gửi đi sự sai khác của một frame với frame trước đó Phương pháp mã hóa này làm việc tốt với những video
có những thay đổi hình ảnh ít, tuy nhiên sẽ là ảnh hưởng đáng kể đến chất lượng hình ảnh và băng thông nếu có sự thay đổi lớn giữa các frame hình ảnh Đa số các chuẩn mã hóa vừa cho phép mã hóa với tốc độ bít cố định (chất lượng hình ảnh thay đổi) hay tốc bít thay đổi (chất lượng hình ảnh ít thay đổi)
Các phương pháp mã hóa video nói chung thường kết hợp cả kiểu mã hóa intra-frame
và inter-frame Trong kiểu mã hóa intra-frame, một frame ảnh được chia thành các khối, mỗi khối này được biến đổi thành tập các hệ số thông qua biến đổi Cosin rời rạc Một nhóm các khối được kết hợp lại thành một thực thể duy nhất (slice), và đôi khi được đóng gói vào một gói Nếu có lỗi trên đường truyền xảy ra thì có thể cả một nhóm các khối sẽ bị mất, tạo nên “sọc” trong các ảnh giải mã Điều này xảy ra bởi vì
Trang 2224
các hệ số của biển đổi Cosin rời rạc trong mỗi khối được tính toán dựa trên khối đầu tiên trong slice, nếu lỗi làm mất thông tin của khối đầu tiên thì tất cả các khối còn lại trong slice là không xác định Một vài lỗi có thể làm hỏng cấu trúc của frame, do đó không có khả năng tái tạo lại frame Với kiểu mã hóa inter-frame (motion based coding), các vector chuyển động được xác định và mã hóa cho mỗi khối Trong các hệ thống mã hóa kiểu inter-frame, việc mất một frame có thể làm cho các frame theo sau
nó trở nên không sử dụng được cho đến khi I-frame tiếp theo được nhận, kết quả là có thể thu được hình ảnh video trắng hay hình ảnh bị đông cứng, chất lượng video bị suy giảm đáng kể Trong hầu hết các trường hợp các tiêu chuẩn mã hóa video đều cung cấp khả năng linh động ở cả bộ mã hóa và giải mã cho việc cân bằng giữa chất lượng
và tốc độ Việc hiểu biết rõ ràng về ảnh hưởng của các bộ mã hóa và giải mã video là yếu tố quan trọng góp phần vào việc đánh giá chính xác các ảnh hưởng của mạng đến chất lượng truyền video trên mạng
2.1.2 Giới hạn về băng thông
Sự giới hạn về băng thông thường xảy ra tại lớp truy nhập Nếu băng thông dành sẵn không đủ để truyền một stream video thì sẽ xảy ra mất gói tại các bộ đệm của bộ định tuyến, dẫn đến việc suy giảm chất lượng video Một vấn đề khá tinh tế cũng xảy ra khi
mã hóa video với tốc độ bít thay đổi Trong trường hợp này, sự thay đổi hình ảnh hay
sự thay đổi các frame là đáng kể sẽ làm tăng yêu cầu về băng thông trong một khoảng thời gian ngắn, điều này có thể gây lên hiện tượng mất gói và do đó làm suy giảm chất lượng hình ảnh
- Khi giao thức UDP được dùng để truyền tải dữ liệu video, khi xảy ra hiện tượng mất gói thì một vài phần của video stream có thể bị mất
- Khi giao thức TCP được dùng để truyền tải dữ liệu video, khi một gói bị mất thì sẽ
có yêu cầu truyền lại gói đã bị mất, điều này làm thiếu hụt bộ đệm tại set-top-box, gây nên hiện tượng dừng hình
Khi truyền video bằng giao thức UDP, hiện tượng mất gói có thể làm hỏng một phần hay thậm chí hoàn toàn các frame
2.1.4 Nghẽn tại máy chủ
Không hẳn mọi yếu tố ảnh hưởng đến chất lượng video đều gây ra bởi mạng, nếu máy chủ cung cấp dịch vụ phải phục vụ tối đa số người dùng theo khả năng của nó, điều
Trang 2325
này sẽ gây ra sự tắc nghẽn tại máy chủ cung cấp dịch vụ Sự tắc nghẽn này gây ra hiện tượng dừng hình quá lâu tại phía đầu cuối Để giảm tải cho máy chủ dịch vụ có thể dùng các giao thức phù hợp như UDP Multicast Nhưng giao thức này chỉ phù hợp khi
có một số lượng lớn người dùng xem cùng một nội dung tại cùng một thời điểm
2.1.5 Jitter và Timing drift
Jitter là khái niệm dùng để mô tả sự khác nhau của khoảng thời gian đi từ nguồn đến đích của các gói tin Jitter càng lớn khi xảy ra nghẽn mạng hay tắc nghẽn tại máy chủ dịch vụ Jitter có thể gây ra tràn bộ đệm tại set-top-box, gây nên hiện tượng dừng hình tại đầu cuối Hiện tượng Timing drift xảy ra khi đồng hồ tại đầu gửi và đầu nhận có sự sai khác nhau về tốc độ, gây ra sự tràn vùng đệm tại đầu nhận Để hạn chế sự ảnh hưởng của hiện tượng này, yêu cầu phía đầu nhận phải hiệu chỉnh lại tốc độ của đồng
hồ cho phù hợp để tránh hiện tượng tràn bộ đệm
2.1.6 Ảnh hưởng của nhiễu
Do can nhiễu (xuyên âm, trùng kênh, tương thích điện từ trường….) dẫn đến tín hiệu thu bị sai lệch, hình ảnh hiển thị có thể bị muỗi, nhòe, …và giật tiếng
2.1.7 Suy hao đường truyền và fadding trong thông tin di động
Do suy hao đường truyền hay fadding, tín hiệu truyền hình thu được tại đầu thu bị suy giảm chất lượng, dẫn đến suy giảm chất lượng hình ảnh hiển thị
2.2 Vấn đề đánh giá chất lượng video trong các ứng dụng đa phương tiện
Như đã phân tích ở trên, trong quá trình truyền tải video từ nguồn đến đích có rất nhiều yếu tố ảnh hưởng làm suy giảm chất lượng videobao gồm các ảnh hưởng của việc mã hóa/giải mã và các tác động của mạng truyền tải Do đó việc đánh giá chất lượng video là vấn đề rất được quan tâm nhằm đảm bảo chất lượng dịch vụ cung cấp Hiện nay trên thế giới áp dụng 2 phương pháp đo đánh giá chất lượng hình ảnh nói chung và chất lượng video trong các ứng dụng đa phương tiện nói riêng, đó là phương pháp chủ quan và phương pháp khách quan
Phương pháp chủ quan sử dụng con người, đây là phương pháp đánh giá chất lượng video cho kết quả tốt nhất Tuy nhiên, phương pháp này khá tốn thời gian và tiền bạc, và không phải lúc nào cũng thực hiện được
Một phương pháp khác là phương pháp đánh giá khách quan, phương pháp đánh giá khách quan cho phép xây dựng các mô hình cho phép đánh giá chất lượng hình ảnh
từ các tham số liên quan đến mạng truyền dẫn và các hệ thống mã hóa và giải mã.Việc
mô hình hóa các tác động của mạng truyền tải và các ảnh hưởng của giải mã/mã hóa này là một vấn đề khá phức tạp vì những ảnh hưởng này phụ thuộc nhiều vào kiểu mã hóa, các thuộc tính và cấu hình của hệ thống cụ thể
Trang 24Ngày 28/9/2009 Công ty VASC thuộc tập đoàn VNPT đã chính thức cung cấp rất nhiều các dịch vụ đa phương tiện trên nền IPTV với thương hiệu MyTV và slogan
“ Những gì bạn muốn” với rất nhiều dịch vụ được cung cấp như: Truyền hình thời gian thực (Live TV, Phim theo yêu cầu (VOD), Karaoke (KoD), Truyền hình theo yêu cầu (TVoD), Âm nhạc (MoD), Game theo yêu cầu (GoD)…
Ngoài ra trên nền di động VNP và VMS cung cấp khá nhiều dịch vụ đa phương tiện như Mobile Internet, Mobile Broadband, Mobile TV, Traffic Camera… [22]
2.3.1.2 Tập đoàn Viettel
Tập đoàn Viettel đã cung cấp rất nhiều các ứng dụng đa phương tiện thông qua mạng
di động 3G hoặc EDGE/GPRS, bao gồm nhóm dịch vụ cơ bản (Video Call và Mobile Internet) và nhóm các dịch vụ gia tăng như Video call, MobiTV, Mobile Internet, Mclip, Vmail, Mstore, Imuzik 3G [23]
2.3.1.3 FPT Telecom
Các dịch vụ đa phương tiện của FPT cung cấp ra thị trường thông qua dịch vụ IPTV với thương hiệu iTV và slogan: “ Muốn gì xem nấy” Dịch vụ iTV khá đa dạng với nhiều tiện ích và nội dung giải trí, bao gồm các kênh truyền hình trong và ngoài nước, kho phim, các chương trình thiếu nhi, tiếng anh cho bé và rất nhiều nội dung khác[24]
2.3.1.4 VTC
Tháng 04 năm 2009, VTC Digicom phối hợp với một số Viễn thông các tỉnh,thành phố đã chính thức bắt đầu triển khai dịch vụ IPTV cung cấp rất nhiều các ứng dụng đa phương tiện Cho đến nay dịch vụ IPTV củaVTC Digicom cung cấp gần 100 kênh truyền hình trong đó có 30 kênh truyền hình độ phân giải cao theo chuẩn HD (High Definition), VTC còn xây dựng thành công kho dữ liệu khổng lồ với hơn 3000 bộ phim đặc sắc có thuyết minh phụ đề tiếng Việt, gần 2000video ca nhạc cùng một hệ thống các phim tài liệu hấp dẫn khác phục vụ cho VoD Đặc biệt IPTV của VTC Digicom song hành cùng giải ngoại hạng Anh, với tính năng xem lại các trận bóng đá, các chương trình tổng hợp giải ngoại hạng Anh Lựa chọn công nghệ nén hiệu quả
Trang 2527
(MPEG-4) VTC Digicom hiện đã làm chủ hệthống có thể đáp ứng về năng lực cho 100.000 thuê bao cùng với nền truy nhập băngrộng ADSL 2+ có tốc độ download 25 Mb/s trong khoảng cách 1.5 km, băng thông rộng tới 2.2 MHz [25]
2.3.2 Vấn đề đo đánh giá chất lượng video trong các ứng dụng đa phương tiện
Như đã đề cập, hiện nay ở Việt Nam, rất nhiều các nhà cung cấp dịch vụ đã triển khai
và cung cấp cho khách hàng hàng loạt các ứng dụng đa phương tiện, trong đó chủ yếu
là các dịch vụ liên quan đến truyền hình ảnh Tuy nhiên qua khảo sát thực tế, vấn đề
đo đánh giá chất lượng video trong các ứng dụng này lại không được quan tâm nhiều Việc đo đánh giá chất lượng video chỉ thực hiện một lần sau khi triển khai, do nhà thầu cung cấp hệ thống phối hợp thực hiện trước khi đưa vào sử dụng, còn trong quá trình khai thác không thực hiện đo đánh giá định kỳ để đảm bảo chất lượng luôn ổn định và đảm bảo Việc đảm bảo cung cấp mức chất lượng video phù hợp trong các ứng dụng
đa phương tiện cho khách hàng của các nhà cung cấp dịch vụ tại Việt Nam hiện nay vẫn đang dựa trên phản ánh, khiếu kiện của khách hàngmà không phải từ kết quả đo kiểm đánh giá chất lượng định kỳ
Trang 26- Phương pháp đánh giá chủ quan: Sử dụng thực nghiệm quan sát và những
người tham gia để đánh giá chất lượng theo thang điểm lựa chọn trung bình (MOS)
- Phương pháp đánh giá khách quan: Tại đầu cuối, sử dụng thiết bị đo các
tham số khác nhau để đánh giá chất lượng tổng thể của tín hiệu hình ảnh
3.1 Tình hình tiêu chuẩn hóa phương pháp đánh giá chủ quan
Liên minh Viễn thông quốc tế (ITU) là tổ chức tiêu chuẩn quốc tế công bố các khuyến nghị liên quan đến đánh giá chất lượng hình ảnh để điều chỉnh môi trường quan sát và tiêu chí quan sát với mục đích đạt được kết quả đánh giá chất lượng chính xác nhất Khuyến nghị ITU-T/R chủ yếu liên quan đến phương pháp đánh giá chất lượng hình ảnh được liệt kê trong Bảng 4 Loạt khuyến nghị BT được công bố bởi ITU-R (ngành tiêu chuẩn Thông tin Vô tuyến) liên quan đến phương pháp đánh giá chủ quan chất lượng hình ảnh truyền hình và loạt khuyến nghị J/P của ITU-T (ngành tiêu chuẩn Viễn thông) cũng có thể áp dụng cho các ứng dụng viễn thông (truyền hình cáp và đa phương tiện)
Bảng 4 Tiêu chuẩn ITU về phương pháp đánh giá chủ quan chất lượng hình ảnh
BT.500 Phương pháp luận đánh giá chủ quan chất lượng hình ảnh truyền hình
BT.710
HDTV
Phương pháp đánh giá chủ quan chất lượng hình ảnh truyền hình số phân giải cao (HDTV)
BT.802 Các yêu cầu sử dụng để truyền dẫn thông qua mạng phân phối sơ cấp và
mạng thành phần của tín hiệu truyền hình số xác định phù hợp với tiêu chuẩn 4:2:2 của khuyến nghị ITU-R BT.601 (Part A)
Trang 27BT.1907 Các kỹ thuật đo chất lượng hình ảnh theo cảm nhận khách quan đối với
các ứng dụng sử dụng HDTV trong sự có mặt của tín hiệu tham chiếu đầy đủ
BT.1908 Các kỹ thuật đo chất lượng hình ảnh khách quan đối với các ứng dụng
truyền phát sử dụng HDTV trong sự có mặt của tín hiệu tham chiếu rút gọn
BT.2020
UHDTV
Các giá trị tham số của các hệ thống truyền hình phân giải siêu cao về sản xuất và trao đổi chương trình quốc tế
P.910 Các phương pháp đánh giá chủ quan chất lượng hình ảnh video của các
ứng dụng đa phương tiện
J.140 Phương pháp đánh giá chủ quan chất lượng hình ảnh của hệ thống
J.143 Các yêu cầu sử dụng cho đo đánh giá chất lượng hình ảnh theo cảm
nhận khách quan trong truyền hình cáp số
J.144 Các kỹ thuật đo đánh giá chất lượng hình ảnh theo cảm nhận khách
quan đối với truyền hình cáp số theo mô hình tham chiếu đầy đủ
J.145 Đo đánh giá và kiểm soát chất lượng dịch vụ đối với truyền dẫn âm
thanh trên các mạng thành phần và mạng phân phối
J.147 Phương pháp đo đánh giá chất lượng hình ảnh khách quan bằng cách sử
Trang 2830
dụng các tín hiệu đo thử trong dịch vụ
J.148 Các yêu cầu đối với mô hình chất lượng đa phương tiện theo cảm nhận
khách quan
J.149 Phương pháp đặc tả độ chính xác và định cỡ chéo chỉ số đo chất lượng
hình ảnh (VQM)
J.244 Các phương pháp định cỡ tham chiếu rút đầy đủ và rút gọn đối với các
hệ thống truyền dẫn hình ảnh với mất đồng chỉnh liên tục của miền không gian và thời gian có khuếch đại và bù liên tục
J.246 Các kỹ thuật đô đánh giá chất lượng hình ảnh theo cảm quan đối với các
dịch vụ đa phương tiện trên mạng truyền hình cáp số với sự có mặt của tham chiếu băng rộng rút gọn
J.340 Thuật toán tham khảo cho tính toán tỷ lệ tín hiệu trên tạp nhiễu đỉnh của
chuỗi hình ảnh đã được xử lý có bù dịch chuyển không gian cố định, dịch chuyển thời gian cố định, khuếch đại và bù độ chói cố định
J.341 Đo đánh giá chất lượng hình ảnh đa phương tiện theo cảm nhận khách
quan của HDTV đối với truyền hình cáp số trong sự có mặt của tham chiếu đầy đủ
J.342 Đo đánh giá chất lượng hình ảnh đa phương tiện theo cảm nhận khách
quan của HDTV đối với truyền hình cáp số trong sự có mặt của tham chiếu rút gọn
Truyền hình phân giải siêu cao - Các đặc tính âm thanh và sắp xếp kênh
âm thanh cho sản xuất chương trình
Trang 2931
Các tiêu chuẩn quốc tế cho phương pháp đánh giá khách quan chất lượng hình ảnh (bao gồm cả chất lượng phương tiện truyền thông hình ảnh) được thực hiện bởi Liên minh Tiêu chuẩn Viễn thông và Thông tin vô tuyến quốc tế tương ứng với ITU-T và ITU-R Hình 3 cho thấy mối tiên hệ của các tổ chức tiêu chuẩn của ITU-T và ITU-R Nhóm nghiên cứu ITU-T số 12 (SG12) nghiên cứu các vấn đề liên quan đến chất lượng dịch vụ viễn thông, và phối hợp với nhóm nghiên cứu ITU-T khác về các vấn đề liên quan đến "chất lượng dịch vụ (QoS) và hiệu suất." Nhóm nghiên cứu ITU-T số 9
có trách nhiệm nghiên cứu mạng truyền hình cáp, nó đưa ra các khuyến nghị được tiêu chuẩn hóa để đánh giá chất lượng các dịch vụ truyền hình cáp Ngoài ra, nhóm nghiên cứu số 6 trong ITU-R chịu trách nhiệm chính đối với dịch vụ phát thanh truyền hình,
và đánh giá chất lượng liên quan Việc phát triển các mô hình đánh giá chất lượng khách quan cho dịch vụ đa phương tiện sẽ yêu cầu kết hợp đánh giá khách quan chất lượng hình ảnh được thực hiện bởi SG9 và đánh giá chất lượng khách quan ngôn luận thực hiện bởi SG12, hội tụ truyền thông và phát thanh truyền hình bằng cách tập hợp các chuyên gia trong cả hai lĩnh vực hợp tác với nhau trong việc tiêu chuẩn hóa kỹ thuật đánh giá chất lượng Trong việc theo đuổi mục tiêu này, đã hình thành hai nhóm chuyên gia: Nhóm báo cáo viên về đánh giá chất lượng đa phương tiện (JRG-MMQA) trong ITU-T và nhóm chuyên gia đánh giá chất lượng hình ảnh (VQEG) làm việc chặt chẽ với nhau để thúc đẩy công tác tiêu chuẩn hóa quốc tế
ITU-R SG6
Các dịch vụ truyền
phát
Nhóm báo cáo tham dự để đánh giá chất lượng
đa phương tiện (JRG-MMQA) Nhóm chuyên gia nghiên cứu chất lượng hình ảnh (VQEG)
Hình 3 Tổ chức tiêu chuẩn hóa phương pháp đánh giá khách quan
Trang 3032
CHƯƠNG 4 PHƯƠNG PHÁP ĐÁNH GIÁ CHỦ QUAN CHẤT LƯỢNG
VIDEO TRONG CÁC ỨNG DỤNG ĐA PHƯƠNG TIỆN
Phương pháp đánh giá chủ quan chất lượng hình ảnh sử dụng một nhóm người tham gia xếp loại và đánh giá chất lượng hình ảnh Những phương pháp này có thể được áp dụng cho các mục đích khác nhau: lựa chọn các kỹ thuật xử lý hình ảnh, xếp hạng hiệu suất của của hệ thống nghe nhìn và đánh giá các mức chất lượng video trong một kết nối nghe nhìn.Phương pháp đánh giá chủ quan được sử dụng để đánh giá hiệu suất của
hệ thống truyền hình bằng cách sử dụng các phép đo trực tiếp phản ứng của người xem Do đó các phương pháp đánh giá chủ quan sẽ cung cấp trực tiếp phản ứng của người dùng về chất lượng video trong các dịch vụ đa phương tiện đang được cung cấp Các phương pháp đánh giá chủ quan được phân làm 2 loại, loại thứ nhất đánh giá hiệu suất của hệ thống được thiết lập ở những điều kiện tối ưu, loại này thường được gọi là đánh giá chất lượng Loại thứ hai đánh giá chất lượng của hệ thống được thiết lập ở những điều kiện không tối ưu liên quan đến lỗi truyền dẫn và mã hóa, đây được xem là đánh giá suy giảm
4.1 Các điều kiện trong phương pháp đánh giá chủ quan
Các bước tiến hành để đánh giá chất lượng hình ảnh cho các ứng dụng đa phương tiện như sau:
- Xác định một loạt các mẫu hình ảnh để tiến hành kiểm tra
- Lựa chọn một số tham số cấu hình
- Thiết lập môi trường kiểm tra tuân thủ với các tham số cấu hình mong muốn
- Tập hợp người tham gia vào kiểm tra
- Tiến hành kiểm tra và phân tích các kết quả
Môi trường kiểm tra chất lượng hình ảnh chính thức tuân theo quy định trong khuyến nghị ITU- T P910 được liệt kê trong Bảng 5 Theo những đề xuất này, các bài kiểm tra đánh giá phải được thực hiện trong một phòng đặc biệt (gọi là phòng đánh giá chất lượng), nơi có thể tạo ra những điều kiện môi trường Để tránh làm ảnh hưởng đến đánh giá, nó cân phải cách âm với bên ngoài (mức ồn khoảng 30 dBA hoặc ít hơn) Thiết lập sử dụng để kiểm tra đánh giá chất lượng hình ảnh trong các ứng dụng
đa phương tiện như Hình 4
Trang 3133
Hình 4 Đánh giá chủ quan chất lượng hình ảnh
Khi các hệ thống được đánh giá trong thử nghiệm sử dụng định dạng hình ảnh rút gọn như CIF, SIF hoặc QCIF v.v các chuỗi sẽ được hiển thị trên một cửa sổ của màn hình hiển thị và màu của màn hình nền nên là 50% màu xám
Có hai phương pháp được sử dụng để kiểm tra hình ảnh từ các nguồn ghi:
a) Bằng cách truyền hoặc phát lại các bản ghi video thời gian thực thong qua các
hệ thống thử nghiệm, trong khi đối tượng là đang được theo dõi và phản hồi
b) Bằng cách xử lý off-line các nguồn ghi thông qua thiết bị thử nghiệm và bản ghi được xuất ra để tạo thiết lập ghi mới
Trong trường hợp thứ hai, kỹ thuật số VTR có thể được sử dụng để giảm thiểu suy yếu
mà được tạp ra trong quá trình ghi lại Trong bất kỳ trường hợp nào, việc xem xét đến
sự suy yếu được đưa ra bởi sự phối hợp mã hóa tốc độ thấp là thường xuyên hơn so với việc suy yếu được đưa ra bởi quá trình điều chế, các VTR chất lượng chuyên nghiệp như D2, MII có thể được sử dụng
Bảng 5 Các điều kiện quan sát
Tỷ lệ độ sáng của màn hình khi không hoạt động với
độ sang cao điểm
≤ 0.05
Trang 3234
Tỷ lệ độ sáng của màn hình, khi đang chỉ hiển thị mức
màu đen trong một căn phòng hoàn toàn tối đen, tới
mức tương ứng với cao điểm của màu trắng
≤ 0.1
Tỷ lệ độ sáng của nền phía sau hình ảnh quan sát với
độ sáng cao điểm của hình ảnh (2)
≤ 0.2
(1): Khoảng cách quan sát phụ thuộc vào từng loại ứng dụng
(2): Giá trị này là giá trị điển hình, trong một số các ứng dụng cụ thể có thể cho phép giá trị cao hơn tùy thuộc vào ứng dụng
(3) Đối với màn hình máy tính, sắc độ của nền có thể được điều chỉnh để thích ứng với sắc độ của màn hình
Kinh nghiệm đánh giá của đối tượng (chất lượng chủ quan) có thể rất khác nhau, ngay cả khi họ đang xem hình ảnh Để làm giảm các biến thể của các kết quả đánh giá, một mẫu hình ảnh duy nhất phải được chấm điểm bởi một số lượng lớn của các đối tượng Khuyến nghị ITU-R BT.500 quy định các đối tượng đánh giá phải bao gồm ít nhất 15 người không chuyên (những người không thường xuyên tham gia vào các công việc liên quan đến chất lượng hình ảnh truyền hình và không có nhiều kinh nghiệm trong các bài kiểm tra đánh giá)
Việc lựa chọn các chuỗi kiểm tra thích hợp cũng là một điểm quan trọng trong việc lên kế hoạch cho phương pháp đánh giá chủ quan Khi kiểm tra được thực hiện với các nhóm người quan sát khác nhau hoặc trong các thí nghiệm khác nhau, nhưng điều quan trọng là cùng sử dụng một bộ các chuỗi kiểm tra có sẵn
Một bộ các chuỗi kiểm tra dành cho việc đánh giá chủ quan chất lượng hình ảnh trong các ứng dụng đa phương tiện được khuyến nghị bởi ITU theo mô tả trong Bảng 6 Trong bảng này, các thông tin sau được đưa ra cho mỗi chuỗi:
- Loại hình ảnh;s
- Mô tả ngắn gọn bối cảnh;
- Định dạng nguồn (525 dòng hoặc 625 dòng, định dạng [ITU-R BT.601-4]);
- Các giá trị thông tin về không gian và thời gian
Tất cả các chuỗi được liệt kê trong Bảng 6 là công khai và được sử dụng tự do cho các đánh giá và các mô tả Một số chuỗi đề xuất được đề xuất trong thư viện CCIR được
mô tả trong báo cáo [38]
Các chuỗi khác của thư viện CCIR có thể được sử dụng phù hợp cho các ứng dụng đặc
Trang 3335
biệt dựa trên việc lưu trữ và tìm kiếm video
Tập các chuỗi kiểm tra vẫn đang được nghiên cứu Tập các chuỗi kiểm tra được liệt kê trong Bảng 6 có thể được hoàn thiện hoặc mở rộng trong tương lai
Bảng 6 Các chuỗi kiểm tra áp dụng trong đánh giá chất lượng video của các ứng
dụng đa phương tiện
Bản đồ Wasington DC và chuyển động của bàn tay và bút chì
Susie A Người phụ nữ trẻ đang nói
chuyện điện thoại
smity2 B Nhân viên bán hàng bên bàn
Trước khi có một cuộc thử nghiệm, các quan sát viên nên được kiểm tra thị lực, điều chỉnh để độ tinh (của mắt), thị lực bình thường trên biểu đồ Snellen hoặc Landolt và tầm nhìn màu sắc bình thường bằng cách sử dụng các biểu đồ đặc biệt được lựa chọn (ví dụ: Ishihara) Trước khi bắt đầu các phiên đánh giá, cần hướng dẫn chi tiết về những nội dung của thử nghiệm cho các quan sát viên Một văn bản hướng dẫn có thể được đưa cho các quan sát viên được đề xuất trong Phụ lục A Những người quan sát
Trang 3436
được giới thiệu cẩn thận về phương pháp đánh giá, các yếu tố suy giảm chất lượng có khả năng xảy ra, thang đo đánh giá, tín hiệu định thời v.v
Trong một phiên (là một chuỗi các bài trình bày) không nên kéo dài quá nửa giờ
Khi nhiều cảnh hoặc hình ảnh được kiểm tra, thì các nội dung này được trình bày ngẫu nhiên Thứ tự ngẫu nhiên có thể được sửa đổi để đảm bảo rằng các cảnh hay chuỗi hình ảnh tương tự không được trình bày liên tiếp
Khuyến cáo rằng ít nhất là 2, nếu có thể thì sẽ là 3 hoặc 4 các lần lặp lại (tức là, lặp lại các điều kiện giống hệt nhau) trong quá trình thử nghiệm Có nhiều lý do để thực hiện việc lặp lại thử nghiệm, đặc biệt là đối với các thử nghiệm sử dụng nhiều người quan sát Các lần thử nghiệm lặp lại làm cho nó có thể tính toán độ tin cậy riêng cho mỗi đối tượng và, nếu cần thiết, để loại bỏ các kết quả không đáng tin cậy từ một vài đối tượng Việc ước lượng của cả hai và giữa độ lệch tiêu chuẩn còn là một điều kiện tiên quyết để thực hiện phân tích chính xác sự sai lệch và khái quát kết quả đến một mức rộng hơn Thêm vào đó, các hiệu ứng đạt được trong khi thử nghiệm là một mức độ nào đó được ổn định
Nói chung, các phép kiểm tra chất lượng hình ảnh chủ quan được thực hiện tuân theo các hướng dẫn quy định trong khuyến nghị ITU-R BT.500-11 Hơn nữa, khuyến nghị ITU-T P.910 cung cấp các chỉ tiêu kỹ thuật hướng dẫn phương pháp thực hiện phép thử đối với hình ảnh Khi thực hiện một cách chính quy, các phép kiểm tra định tính đưa ra đánh giá chính xác và hợp lý về phương diện sinh học chất lượng hình ảnh Tuy nhiên, tiến hành kiểm tra một cách chính quy sẽ tiêu tốn thời gian và đòi hỏi các phương tiện đặc biệt
4.2 Một số phương pháp đánh giá chủ quan chất lượng hình ảnh video trong các ứng dụng đa phương tiện
4.2.1 Phương pháp đánh giá phân loại tuyệt đối (ACR)
Phương pháp ACR được quy định trong khuyến nghị ITU-T P.910 (còn gọi là phương pháp tác nhân kích thích đơn) là một trong các phương pháp được sử dụng rộng rãi nhất để đánh giá chất lượng dịch vụ viễn thông Như trong Hình 5, các đối tượng xem đoạn hình ảnh được đánh giá trong vòng 10 giây và trong khoảng thời gian
10 giây, sau đó họ đánh giá hình ảnh theo thang chất lượng 5 mức như trong Bảng 7 Trong các kết quả đánh giá, số lượng bình chọn của các đối tượng trong mỗi thể loại được đánh trọng số bởi các điểm số đánh giá và được biểu diễn bằng điểm đánh giá
Từ khi hiệu ứng chuyển cảnh được biết đến, điểm số đánh giá chất lượng hình ảnh bị ảnh hưởng bởi chất lượng hình ảnh trước đó (một hình ảnh có chất lượng suy giảm nhẹ
có xu hướng đạt được điểm đánh giá cao hơn khi nó được xem ngay sau một hình ảnh
Trang 3537
chất lượng rất thấp so với khi được xem sau một hình ảnh có chất lượng rất tốt), có thể loại bỏ hiệu ứng này bằng cách thay đổi trình tự trình chiếu của các đoạn hình ảnh đánh giá một cách ngẫu nhiên đối với từng đối tượng đánh giá, hoặc lặp lại việc đánh giá cho các hình ảnh tương tự trong một trình tự khác
Do không có tiêu chuẩn đánh giá chất lượng hình ảnh trong phương pháp ACR, nên các kết quả đánh giá ảnh hưởng mạnh đến phạm vi biến đổi chất lượng hình ảnh được đánh giá khi đo kiểm Vì vậy, phải cẩn thận khi so sánh các kết quả đánh giá trong các đo đạc khác nhau Khi các đánh giá ACR được thực biện bởi nhiều tổ chức, phải thực hiện các bước sơ bộ để đảm bảo rằng cùng một phạm vi biến đổi chất lượng được thực hiện bởi một tổ chức
Hình 5 Trình chiếu trong phương pháp ACR
Bảng 7 Thang đo chất lượng 5 mức theo phương pháp ACR
Các chỉ số chất lượng điểm lựa chọn trung bình (MOS) được thể hiện trên Hình
6, trong đó minh họa ví dụ về các đặc điểm MOS thu được theo phương pháp ACR Một giá trị MOS bằng 3,5 có nghĩa là có khoảng 90% số người đưa ra đánh giá “3: Khá tốt” hoặc cao hơn Ngược lại có khoảng 10% đưa ra đánh giá “2: Kém” hoặc thấp hơn Do đó, bằng việc thiết kế chất lượng dịch vụ để đạt được điểm số MOS thấp nhất
là 3,5 có thể đảm bảo rằng tỷ lệ không quá 10% số người đánh giá chất lượng dịch vụ
Trang 3638
là kém Đối với điểm số MOS bằng 2,5, có khoảng 50% số người đưa ra đánh giá tối thiểu là “3: Khá tốt” và khoảng 50% số người đưa ra đánh giá “2: Kém” hoặc thấp hơn Điểm số MOS bằng 2,5 đôi khi được gọi là giới hạn chấp nhận được
2: Kém hoặc cao hơn3: Khá tốt hoặc cao hơn4: Tốt hoặc cao hơn5: Xuất sắc
Điểm lựa chọn trung bình (MOS)
Hình 6 Ví dụ về đặc tính MOS trong phương pháp ACR
4.2.2 Phương pháp đánh giá phân loại tuyệt đối với tham chiếu ẩn (ACR-HR)
Trong phương pháp ACR-HR đưa ra trong khuyến nghị ITU-T P.910, để loại
bỏ ảnh hưởng chủ quan của người quan sát, tham chiếu của hình ảnh bị ẩn đối với người quan sát Các kết quả đánh giá thu được bằng phương pháp ACR được xử lý bằng cách sử dụng công thức sau để tính toán sự khác biệt điểm số giữa hình ảnh đánh giá và hình ảnh tham chiếu Kết quả đánh giá được biểu diễn bởi điểm đánh giá trung bình sai khác (DMOS)
DMOS = điểm hình ảnh đánh giá - điểm hình ảnh tham chiếu + 5
Ở đây, chất lượng hình ảnh tham chiếu được đánh giá hoặc “5: Xuất sắc” hoặc
“4: Tốt” bởi một chuyên gia trong lĩnh vực chất lượng hình ảnh
Phương pháp đánh giá này thường xuyên được Nhóm chuyên gia chất lượng hình ảnh (VQEG) sử dụng để nghiên cứu các phương pháp đánh giá khách quan chất lượng hình ảnh
4.2.3 Phương pháp đánh giá phân loại suy giảm (DCR)
Trong phương pháp DCR đưa ra trong khuyến nghị ITU-T P.910 Hình 7, các
Trang 3739
đối tượng được xem các đoạn hình ảnh tham chiếu để hình thành cơ sở đánh giá chất lượng, tiếp theo là các đoạn hình ảnh đánh giá (khoảng 10 giây) và trong khoảng 10 giây tiếp theo, họ đánh giá chất lượng hình ảnh theo thang chất lượng 5 mức trong Bảng 8 Hình ảnh tham chiếu thường được trình chiếu trước khi các đối tượng thực hiện đánh giá chất lượng hình ảnh, do đó cung cấp cho họ cơ sở để đánh giá chất lượng hình ảnh kế tiếp Kết quả là, phương pháp này có thể ngăn ngừa ở một mức độ nào đó hiệu ứng chuyển cảnh trong phương pháp ACR Các kết quả đánh giá được biểu diễn bằng điểm đánh giá trung bình như trong phương pháp ACR, nhưng để phân biệt các giá trị MOS thu được từ phương pháp ACR, chúng đôi khi được gọi là giá trị DMOS (MOS sai khác)
Một đơn vị đánh giá
Hình 7 Trình chiếu trong phương pháp DCR
Bảng 8 Thang đo chất lượng 5 mức theo phương pháp DCR
Trang 3840
phương pháp ACR để có được cùng một đánh giá trong các điều kiện tương tự Trong phương pháp DCR, điểm số DMOS là 4,5; 3,5 và 2,5 đôi khi ứng với các tiêu chuẩn chất lượng đối với giới hạn phát hiện, giới hạn chấp nhận được và giới hạn chịu đựng
Phương pháp DCR được biết đến như là phương pháp thang đo suy giảm bằng tác nhân kích thích đôi (DSIS) hoặc phương pháp của liên minh truyền hình châu Âu
4.2.4 Phương pháp so sánh theo cặp (PC)
Trong phương pháp PC đưa ra trong khuyến nghị ITU-T P.910, đoạn hình ảnh đánh giá được trình chiếu cho các đối tượng theo cặp như trong Hình 8 (khoảng 10 giây mỗi hình ảnh) Đối tượng so sánh chất lượng hình ảnh đầu với chất lượng hình ảnh thứ hai và trong khoảng 10 giây tiếp theo sẽ đánh giá hình ảnh nào đạt chất lượng tốt hơn Các đánh giá được thực hiện bởi thang so sánh 7 mức như trong Bảng 9
Một đơn vị đánh giá
Hình 8 Trình chiếu trong phương pháp PC
Bảng 9 Thang so sánh 7 mức theo phương pháp PC
Trang 3941
Do kết quả đánh giá là chủ quan với hiệu ứng tuần tự nên sai khác giữa các kết quả phụ thuộc vào đoạn hình ảnh được trình chiếu đầu tiên, các đánh giá nên được thực hiện với thứ tự trình chiếu khác nhau, ngay cả khi các cặp hình ảnh đã được đánh giá Phương pháp PC cho phép thực hiện so sánh trực tiếp giữa các cặp hình ảnh, vì vậy nó có thể phát hiện sự khác biệt tinh tế về chất lượng Tuy nhiên, các kết quả đánh giá chất lượng được tạo ra bởi phương pháp này là tương đối, không phải tuyệt đối, hơn nữa phương pháp này mất nhiều thời gian để thực hiện hơn phương pháp ACR hoặc DCR (do phải kết hợp số lượng lớn các hình ảnh đánh giá)
4.2.5 Phương pháp thang đo chất lượng liên tục bằng tác nhân kích thích kép (DSCQS)
Phương pháp thang đo chất lượng liên tục bằng tác nhân kích thích kép được quy định trong khuyến nghị ITU-R BT.500 Phương pháp này được dùng rộng rãi để đánh giá chất lượng của hệ thống và các tuyến truyền dẫn sử dụng trong phát sóng truyền hình Phương pháp này đặc biệt hiệu quả trong trong trường hợp không trình chiếu đây đủ các điều kiện chất lượng và nó có khả năng đồng thời đánh giá sự khác biệt về chất lượng giữa một đoạn hình ảnh tham chiếu đầy đủ và hình ảnh đánh giá, chất lượng tuyệt đối của đoạn hình ảnh đánh giá
Trong phương pháp DSCQS, như minh họa trong Hình 9, một cặp hình ảnh bao gồm đoạn hình ảnh tham chiếu và một đoạn hình ảnh đánh giá đã bị suy giảm trong quá trình xử lý, chẳng hạn như mã hóa hình ảnh được trình chiếu 2 lần và việc đánh giá được thực hiện khi các hình ảnh trình chiếu lần thứ hai Các hình ảnh được trình bày theo thứ tự ngẫu nhiên và các đối tượng không biết được đâu là đoạn hình ảnh tham chiếu
Thời gian
10 giây
10
giây
5-11 giây Bình chọn
10 giây
H ảnh B
3 giây
H ảnh A
10 giây
10 giây
H ảnh C H ảnh D
3 giây 3 giây
10 giây
10 giây
H ảnh D
3 giây
H ảnh C
5-11 giây Bình chọn
Hình 9 Trình chiếu trong phương pháp DSCQS
Các đối tượng cho điểm các hình ảnh theo thang đánh giá chất lượng liên tục dựa trên 5 mức như Hình 10 (tương tự với các mục trong thang đo chất lượng 5 mức) Thang đánh giá được chuẩn hóa trong khoảng 0 ÷ 100 (giá trị tối đa là 100, giá trị tối thiểu là 0) Sự khác biệt trong các giá trị đánh giá hình ảnh giữa đoạn hình ảnh tham chiếu và hình ảnh đánh giá trong mỗi cặp được tính toán (điểm số của hình ảnh đánh
Trang 4042
giá trừ đi điểm số hình ảnh tham chiếu) Các giá trị trung bình sai khác chất lượng hình ảnh thu được từ tất các đối tượng chính là giá trị DSCQS Do giá trị DSCQS được tính toán từ sự sai khác chất lượng hình ảnh, cho nên khi giá trị càng nhỏ thì chất lượng càng cao (càng gần với hình ảnh tham chiếu) và khi giá trị càng lớn thì chất lượng hình ảnh càng kém (càng khác xa so với hình ảnh tham chiếu)
Xuất sắcTốtKhá tốtKémXấu
Hình ảnh A Hình ảnh B
Sai khác chất lượng hình ảnh
Hình 10 Phân loại đánh giá DSCQS
4.2.6 Phương pháp đánh giá chất lượng liên tục bằng tác nhân kích thích đơn (SSCQE)
Suy giảm chất lượng hình ảnh số thay đổi theo thời gian tùy thuộc vào đặc điểm của nội dung hình ảnh Vì lý do này, các cảnh hình ảnh khác nhau nên được sử dụng khi thực hiện các đánh giá chất lượng Tuy nhiên, các phương pháp giống DSCQS cần một thời gian dài để tiến hành các đánh giá chất lượng bởi một lượng lớn cảnh hình ảnh Hơn nữa, một nhu cầu đối với các phương pháp đánh giá tương đối là làm sao có thể được sử dụng trong trường hợp không có sẵn các đoạn hình ảnh chuẩn, chẳng hạn như khi khách hàng xem nội dung hình ảnh tại nhà của họ Phương pháp SSCQE đưa
ra trong khuyến nghị ITU-R BT.500-11 là phương pháp đánh giá chất lượng chủ quan liên tục không sử dụng các đoạn hình ảnh chuẩn Thay vào đó, các đối tượng bình chọn chất lượng hình ảnh liên tục bằng cách điều khiển một thanh trượt (thiết bị ghi điểm số)
Hình 11 minh họa cách đánh giá SSCQE
Tin tức Sống động Thể thao Thời gian
Đoạn chương trình (PS) ≥ 25 phút
Tham số chất lượng (QP)
Phiên đo thử (TS) 30 ÷ 60 phút Phiên đo thử (TS) 30 ÷ 60 phút
Trình chiếu đo thử (TP) bao gồm tất cả các kết hợp PS/QP