TỔNG QUAN VỀ CÔNG NGHỆ ĐA PHƯƠNG TIỆN VÀ CÁC ỨNG DỤNG ĐA PHƯƠNG TIỆN
Công nghệ đa phương tiện 14
Nhiều quốc gia đang triển khai hệ thống quảng bá số, cho phép cung cấp các ứng dụng đa phương tiện và quảng bá dữ liệu đa dạng như video, âm thanh, hình ảnh tĩnh, văn bản và đồ họa.
Hệ thống quảng bá phân phối ứng dụng đa phương tiện có những đặc điểm nổi bật so với các hệ thống truyền hình hiện tại, bao gồm khả năng truy cập thông tin qua bộ thu cố định hoặc di động Tỷ lệ khung hình có thể thay đổi, kích thước hình ảnh đa dạng từ SQCIF đến HDTV, và video thường được kết hợp với âm thanh, văn bản Ngoài ra, video có thể được xử lý bằng các bộ mã hóa tiên tiến, với khoảng cách quan sát linh hoạt tùy thuộc vào ứng dụng.
Cơ sở hạ tầng hệ thống quảng bá dịch vụ đa phương tiện sử dụng bộ thu cố định hoặc di động, với tỷ lệ khung hình cố định hay biến đổi và định dạng hình ảnh khác nhau Các giải mã video tiên tiến và vấn đề mất gói tin cũng là yếu tố quan trọng Để đảm bảo chất lượng dịch vụ, cần xác định các yêu cầu đặc trưng cho từng loại hình dịch vụ và xác nhận sự phù hợp của giải pháp kỹ thuật với những yêu cầu này.
Các dịch vụ băng rộng và truyền thông đa phương tiện cho máy tính cá nhân và điện thoại di động đang phát triển nhanh chóng Để cung cấp dịch vụ chất lượng cho khách hàng, cần có công nghệ đánh giá chất lượng video chính xác Việc thiết kế và quản lý dịch vụ chất lượng đòi hỏi một công nghệ đánh giá tự động Nghiên cứu về chất lượng video cho các ứng dụng truyền hình đã được thực hiện và áp dụng rộng rãi, đặc biệt bởi Nhóm các chuyên gia chất lượng video (VQEG) Hiện nay, với sự phát triển của ứng dụng đa phương tiện, nghiên cứu và áp dụng công nghệ đánh giá chất lượng video cho các ứng dụng luồng Internet đang trở thành vấn đề quan trọng.
Một số ứng dụng đa phương tiện điển hình 14
Video Call là dịch vụ thoại hình ảnh, cho phép người dùng nhìn thấy nhau qua camera di động trong khi đàm thoại Đây là một ứng dụng đa phương tiện đột phá trong lĩnh vực thông tin truyền thông, giúp cải thiện trải nghiệm giao tiếp so với việc chỉ sử dụng tín hiệu thoại Video Call thường sử dụng 2 hoặc 3 luồng giao thức truyền theo thời gian thực (RTP) qua mạng IP, mang đến khả năng kết nối trực tiếp và hiệu quả.
- Audio (được mã hóa trong chuẩn mã hóa thoại G.722 và G.728)
- Video (mã hóa theo chuẩn H.261 và H.263) ở các cổng khác nhau
- Điều khiển camera từ xa (FECC – far-end camera control) (tùy chọn)
Trong video call, mã hóa video sử dụng H.261 (kiểu mã hóa cũ) và H.263 (kiểu mã hóa mới) để mã hóa video trên nền IP Các loại mã hóa này có các thông số và giá trị đặc trưng.
- Tốc độ mã hóa bit: 64kbps, 320 kbps Các tốc độ bit này có thể là bội số bất kỳ của 100bps
Độ phõn giải ẳ khung hỡnh (Onequarter Common Interchange Format QCIF- Resolution 176x144)
Định dạng khung hình (Common Interchange Format – CIFResolution 352x288)
Định dạng 4 khung hình – (4CIF Resolution 704x576)
Định danh phụ của QCIF (SQCIF -Resolution 128x96)
Tốc độ khung hình cho video call thường là 15 khung hình/s (fps) hoặc 30 fps Ứng dụng này không chỉ hỗ trợ giao tiếp mà còn tích hợp với nhiều ứng dụng đa phương tiện khác như hội nghị truyền hình (VC) và video theo yêu cầu (VOD).
1.2.2 Một số ứng dụng điển hình dựa trên IPTV
Hệ thống IPTV phát triển dựa trên hệ thống mạng băng thông rộng đang triển khai, có khả năng cung cấp được 05 nhóm dịch vụ như sau:
Dịch vụ truyền hình quảng bá gồm các dịch vụ:
- Truyền hình trực tiếp ( Live TV);
- Truyền hình phát lại (Time-shifted TV);
- Kênh ảo VoD (Virtual channel from VoDs)
- NVoD (near Video on Demand);
- Truyền hình di động (Mobile TV)
Dịch vụ theo yêu cầu (on demand), bao gồm các dịch vụ:
- Video theo yêu cầu (Video on Demand – VoD);
- Truyền hình theo yêu cầu (TV on Demand – TVoD);
- Trò chơi theo yêu cầu (Games on Demand);
- Nghe nhạc theo yêu cầu (Music on Demand);
- Karaoke theo yêu cầu (Karaoke on Demand)
Các dịch vụ tương tác (interactive), bao gồm các dịch vụ:
- PVR (Personal Video Recorder), cPVR (Client PVR);
- Dự đoán và bình chọn (Guess and Voting);
- Giáo dục qua truyền hình (TV education);
- Thương mại trên truyền hình;
- Chức năng tương tác qua mobile
- Dịch vụ thông tin và truyền thông, bao gồm các dịch vụ:
- Internet trên TV (Web browser);
- Cung cấp thông tin qua truyền hình (TV information);
- Nhắn tin qua truyền hình (TV Messaging);
- Hội nghị truyền hình (video conference);
- Điện thoại truyền hình (Video phone);
Các dịch vụ gia tăng khác , bao gồm các dịch vụ:
- Chia sẻ nội dung (media sharing);
- Giám sát mọi nơi (global monitoring);
Sau đây nghiên cứu chi tiết của một số dịch vụ điển hình
1.2.2.1 Dịch vụ hội nghị truyền hình
Dịch vụ hội nghị truyền hình (video conference) là một ứng dụng đa phương tiện phổ biến hiện nay, sử dụng các công nghệ mạng truyền thông tiên tiến như IP, ATM và ISDN Dịch vụ này cho phép truyền hình ảnh và âm thanh trực tuyến giữa nhiều điểm, không bị giới hạn về khoảng cách địa lý.
Cho phép tùy biến từ 1 – 40 hình/ s, nâng cao chất lượng hình ảnh khi đường truyền tốt:
- QCIF Video (176x144 điểm ảnh): 80Kbps
- CIF Video (352x288 điểm ảnh): 150Kbps
- VGA Video (640x480 điểm ảnh): 300Kbps
Hệ thống thiết bị hội nghị truyền hình là một giải pháp điện tử hiện đại, kết hợp cả phần cứng và phần mềm, sử dụng công nghệ kỹ thuật số để nén, mã hóa và giải mã âm thanh và video trong thời gian thực Giải pháp này dựa trên công nghệ IP và hỗ trợ nhiều giao thức như H.320, H.323, SIP và SCCP, cho phép triển khai hệ thống hội nghị truyền hình tiên tiến mà vẫn tận dụng được cơ sở hạ tầng hiện có.
Hình 1 Sơ đồ kết nối thiết bị điển hình cho Video conference
Thiết bị cơ bản bao gồm:
1 Camera - Thu tín hiệu hình ảnh
2 Micro - Thu tín hiệu âm thanh
3 DECODE - Xử lý mã hóa nhận và truyền tín hiệu âm thanh và hình ảnh và truyền qua đường truyền
4 Màn hình hiển thị - Hiển thị hình ảnh của các phòng họp từ xa
5 Loa - Phát tín hiệu âm thanh của các phòng họp từ xa
6 MCU - Thiết bị quản lý và xử lý đa điểm
7 Lưu Trữ - Ghi lại nội dung cuộc họp
8 Show Present - Thường là phần mềm có chức năng trình chiếu tài liệu tại một máy tính lên hình ảnh của hội nghị
Bảng 1 Các tiêu chuẩn kỹ thuật đặc trưng về hình ảnh trong hội nghị truyền hình
Các tiêu chuẩn đóng gói hình ảnh VDOnet,VDOwave,MPEG4 Độ phân giải hình ảnh
Có thể thay đổi theo yêu cầu của client
Tốc độ truyền ảnh:hình/s (frm/s)
Mặc định là 15 hình/s Dải điều chỉnh cho phép từ: 1 – 40 hình/ s Độ delay hình ảnh tối đa 500 milisecond
VoD (Video on Demand) là hệ thống cho phép người dùng lựa chọn và xem nội dung video hoặc âm thanh theo yêu cầu Hệ thống này phản hồi yêu cầu từ thuê bao thông qua thiết bị set-top box hoặc PC, với các luồng dữ liệu unicast gửi đến địa chỉ IP của thiết bị Trạm quản lý thuê bao sẽ cung cấp danh sách các sự kiện VoD để người dùng có thể chọn chương trình mong muốn Quá trình này diễn ra thông qua việc truyền tải gói dữ liệu IP đến thiết bị của người dùng.
RTSP là giao thức quan trọng trong các ứng dụng Video on Demand (VoD), cho phép khách hàng truy cập và điều khiển nội dung lưu trữ trên máy chủ VoD VoD thực chất là hình thức truyền tải một-một thông qua unicast, giúp cung cấp dịch vụ VoD và gửi nội dung đến từng khách hàng một cách hiệu quả.
Hai thành phần quan trọng của một dịch vụ VOD là dịch vụ di động và phiên di động
Dịch vụ di động cho phép người dùng truy cập các dịch vụ từ nhiều thiết bị khác nhau thông qua các mạng truy cập đa dạng Dịch vụ di động True không chỉ hỗ trợ nhiều phương thức truy cập cho các thiết bị khác nhau mà còn yêu cầu chuyển vùng, cho phép các thiết bị đầu cuối (UE) kết nối qua mạng lõi IMS do các nhà khai thác khác quản lý.
Phiên di động cho phép người dùng dừng xem video và tiếp tục từ vị trí đã dừng trên thiết bị khác Điều này yêu cầu thời gian hiện tại của bộ phim được lưu trữ trong mạng khi phiên ban đầu kết thúc, giúp các dịch vụ phát trực tuyến bắt đầu từ vị trí đã lưu khi người dùng chuyển sang thiết bị mới.
Chuẩn nén hình ảnh trong VoD
Bảng 2 Các chuẩn phổ dụng và các chỉ tiêu kỹ thuật tương ứng Định dạng video
Tốc độ (Kbps) Định dạng độ phân giải
QCIF, CIF SQCIF, QCIF, CIF, 4CIF, 16CIF
QCIF, CIF, 4CIF 4CIF, 16CIF QCIF, CIF
Bảng 3 Định dạng độ phân giải Định dạng độ phân giải PixelxLines
1.2.2.3 Truyền hình thời gian thực (Live TV), MobileTV
Truyền hình thời gian thực (Live TV) cho phép người dùng truy cập nội dung truyền hình qua mạng 3G, cung cấp luồng video chất lượng cao thông qua dịch vụ Video Call hoặc kết nối WAP Portal Dịch vụ này được hiểu là truyền hình số trên nền tảng mạng IP, cung cấp chương trình truyền hình được thu lại từ hệ thống truyền hình mặt đất, cáp, vệ tinh hoặc kênh riêng đến tay khách hàng.
Các kênh truyền hình hiện nay hỗ trợ tính năng trả tiền theo từng kênh hoặc theo thời điểm người xem mong muốn (Pay-per-View - PPV) Thiết bị Set-top-box (STB) cung cấp giao diện dễ sử dụng để hướng dẫn người xem theo dõi chương trình và kế hoạch phát sóng TV cập nhật Người xem có thể dễ dàng chuyển kênh trên STB tại đầu cuối của khách hàng.
1.2.2.4 Dịch vụ hình ảnh và nhạc chờ đa phương tiện (MediaRingBackTone)
Hình 2 Mô hình cuộc gọi hình ảnh và nhạc chờ đa phương tiện (Media
Quy trình thực hiện cuộc gọi Video RingBackTone như sau:
- Khách hàng có thể đăng ký dịch vụ hình ảnh và nhạc chờ đa phương tiện
Khi khách hàng nhận cuộc gọi, cuộc gọi sẽ được định tuyến qua hệ thống Video Ring BackTone thông qua Video Gateway Người gọi sẽ xem Video Clip mà khách hàng đã đăng ký trong quá trình thiết lập cuộc gọi Khi cuộc gọi được kết nối, Video Clip sẽ được giải phóng và cuộc gọi chính thức bắt đầu.
1.2.2.5 Truyền hình giám sát (Video Surveillance)
Dữ liệu giám sát từ camera IP được truyền về máy chủ NVR (Network Video Recorder), nơi video được xử lý theo thời gian thực Tại đây, các chức năng xử lý hình ảnh thông minh được cung cấp, hỗ trợ hiệu quả cho hệ thống giám sát trung tâm.
Hệ thống giám sát video hoạt động trên nền tảng IP, cho phép khách hàng kết nối với internet và theo dõi camera mọi lúc, mọi nơi Dịch vụ Video Surveillance cung cấp giao diện web dễ sử dụng, giúp người dùng dễ dàng quan sát hình ảnh và video, đồng thời quản lý hàng trăm camera thông qua hệ thống quản lý giám sát tập trung (Central Monitoring System).
Hình 3 Mô hình kết nối dịch vụ truyền hình giám sát
Dịch vụ Mobile Camera cung cấp cho khách hàng khả năng theo dõi tình trạng giao thông tại các nút giao, đã được triển khai tại Hà Nội và TP Hồ Chí Minh, góp phần giảm ùn tắc giao thông đô thị Bên cạnh đó, IP camera ngày càng được nhiều hộ gia đình và cá nhân sử dụng để giám sát căn hộ từ xa, mang lại sự tiện lợi khi cần thiết từ nơi làm việc.
Một trong những chức năng chính của dịch vụ truyền hình giám sát là phân tích hình ảnh thông minh:
Ghi hình khi xuất hiện chuyển động (Motion Detection)
Phát hiện vật lạ trong khu vực giám sát
Phát hiện mất đồ trong khu vực giám sát
Phát hiện xâm nhập vào khu vực cấm.
Mã hóa video trong các ứng dụng đa phương tiện 21 CHƯƠNG 2 NGHIÊN CỨU VỀ CHẤT LƯỢNG VIDEO CỦA CÁC ỨNG DỤNG ĐA PHƯƠNG TIỆN
Mã hóa và giải mã video đóng vai trò quan trọng trong ứng dụng đa phương tiện, với hai hệ thống tiêu chuẩn chính là ITU (International Telecommunications Union) và MPEG (Motion Picture Experts Group) Các tiêu chuẩn của MPEG chủ yếu được áp dụng trong các ứng dụng đa phương tiện Trong những năm qua, cả ITU và MPEG đã phát triển các tiêu chuẩn cho việc mã hóa và giải mã video.
Hình 2 Quá trình phát triển của các tiêu chuẩn mã hóa
MPEG-4 được thiết kế đặc biệt để nén hình ảnh và âm thanh, cho phép cung cấp dịch vụ và nội dung với chất lượng từ thấp đến cao qua nhiều môi trường truyền tải khác nhau như băng rộng, không dây và chuyển mạch gói Tiêu chuẩn này là một tập hợp các công nghệ nhằm đảm bảo chất lượng dịch vụ từ nhà cung cấp nội dung đến người dùng cuối.
- Hệ thống hình ảnh MPEG-4;
- Hệ thống âm thanh MPEG-4;
- Cơ cấu phân phối đa phương tiện (DMIF)
Trong MPEG-4, âm thanh và hình ảnh được lưu trữ và truyền tải một cách độc lập, yêu cầu thiết bị đầu cuối phải có khả năng kết hợp các thành phần này để trình diễn nội dung đa phương tiện Hệ thống MPEG-4 mô tả mối quan hệ giữa âm thanh và hình ảnh, cho phép tổng hợp lại nội dung tại đầu cuối một cách hiệu quả.
CHƯƠNG 2 NGHIÊN CỨU VỀ CHẤT LƯỢNG VIDEO CỦA CÁC ỨNG
Chất lượng video trong các ứng dụng đa phương tiện là yếu tố quan trọng cần được kiểm soát, đặc biệt trong bối cảnh hiện nay Chất lượng video chủ yếu phụ thuộc vào khả năng truyền dẫn và hệ thống mã hóa/giải mã Bài viết này sẽ phân tích các yếu tố ảnh hưởng và đánh giá thực trạng chất lượng video trong các ứng dụng đa phương tiện.
Các yếu tố ảnh hưởng đến chất lượng video 23
Chất lượng video chịu ảnh hưởng từ nhiều yếu tố quan trọng, bao gồm quy trình mã hóa và giải mã, nén và giải nén dữ liệu Ngoài ra, các yếu tố trên đường truyền như băng thông hạn chế, mất gói tin, suy hao tín hiệu, lỗi bit, can nhiễu, fadding và tình trạng nghẽn tại máy chủ cũng đóng vai trò quyết định Bài viết này sẽ điểm qua một số yếu tố chính ảnh hưởng đến chất lượng video.
2.1.1 Ảnh hưởng bởi hệ thống mã hóa/giải mã
Mã hóa và giải mã video đóng vai trò quan trọng trong các ứng dụng đa phương tiện Hiện nay, hai hệ thống tiêu chuẩn chính cho nén video là ITU (Liên minh Viễn thông Quốc tế) và MPEG (Nhóm Chuyên gia Điện ảnh) Trong những năm qua, cả ITU và MPEG đã phát triển các tiêu chuẩn để cải thiện quy trình mã hóa và giải mã video.
Dữ liệu video trong các ứng dụng đa phương tiện hiện nay thường được mã hóa và nén bằng các chuẩn như MPEG2, MPEG4 Part 10/H.264 và Microsoft WMV9/VC1 Các bộ mã hóa video hỗ trợ nhiều tốc độ nén khác nhau, cho phép lựa chọn giữa chất lượng hình ảnh và băng thông Phần lớn phương pháp nén dựa vào mã hóa giữa các frame (inter-frame), chỉ gửi đi sự khác biệt giữa các frame thay vì gửi toàn bộ Phương pháp này hiệu quả với video có ít thay đổi hình ảnh, nhưng có thể ảnh hưởng đến chất lượng và băng thông khi có sự thay đổi lớn giữa các frame Hầu hết các chuẩn mã hóa cho phép mã hóa với tốc độ bít cố định hoặc thay đổi, tùy thuộc vào chất lượng hình ảnh.
Các phương pháp mã hóa video thường kết hợp mã hóa intra-frame và inter-frame Trong mã hóa intra-frame, mỗi frame được chia thành các khối và biến đổi thành hệ số qua biến đổi Cosin rời rạc Các khối này được kết hợp thành một slice, nhưng nếu có lỗi truyền, cả nhóm khối có thể bị mất, dẫn đến "sọc" trong ảnh giải mã Mất thông tin khối đầu tiên trong slice sẽ ảnh hưởng đến tất cả khối còn lại, làm hỏng cấu trúc frame Đối với mã hóa inter-frame, các vector chuyển động được mã hóa cho mỗi khối, và việc mất một frame có thể làm hỏng các frame tiếp theo cho đến khi nhận được I-frame, gây ra hình ảnh video trắng hoặc đông cứng, làm giảm chất lượng video Các tiêu chuẩn mã hóa video thường cung cấp tính linh động cho cả mã hóa và giải mã, giúp cân bằng giữa chất lượng và tốc độ Hiểu rõ ảnh hưởng của các bộ mã hóa và giải mã là yếu tố quan trọng để đánh giá chính xác tác động của mạng đến chất lượng truyền video.
2.1.2 Giới hạn về băng thông
Giới hạn băng thông thường xảy ra tại lớp truy nhập, ảnh hưởng đến việc truyền stream video Khi băng thông không đủ, sẽ xảy ra mất gói tại các bộ đệm của bộ định tuyến, dẫn đến suy giảm chất lượng video Một vấn đề phức tạp hơn là khi mã hóa video với tốc độ bít thay đổi; sự thay đổi hình ảnh hoặc frame đáng kể có thể làm tăng yêu cầu băng thông trong thời gian ngắn, gây mất gói và làm giảm chất lượng hình ảnh.
Mất gói tin trên mạng có thể xảy ra do nhiều nguyên nhân như nghẽn mạng, mất kết nối, không đủ băng thông hoặc lỗi trên đường truyền Hiện tượng này thường bùng phát trong điều kiện tắc nghẽn mạng cao, dẫn đến mức độ mất gói tăng cao Chất lượng video suy giảm do mất gói phụ thuộc vào giao thức truyền tải video được sử dụng.
Khi sử dụng giao thức UDP để truyền tải dữ liệu video, hiện tượng mất gói có thể dẫn đến việc một số phần của video stream bị thiếu.
Khi giao thức TCP được sử dụng để truyền tải dữ liệu video, việc mất gói tin dẫn đến yêu cầu truyền lại, gây ra tình trạng thiếu hụt bộ đệm tại set-top-box và hiện tượng dừng hình xảy ra.
Khi truyền video bằng giao thức UDP, hiện tượng mất gói có thể làm hỏng một phần hay thậm chí hoàn toàn các frame
Chất lượng video không chỉ bị ảnh hưởng bởi mạng mà còn do khả năng phục vụ của máy chủ cung cấp dịch vụ Khi máy chủ phải phục vụ quá nhiều người dùng, sẽ xảy ra tình trạng tắc nghẽn, dẫn đến hiện tượng dừng hình kéo dài ở phía đầu cuối Để giảm tải cho máy chủ, có thể áp dụng các giao thức như UDP Multicast, tuy nhiên, giao thức này chỉ hiệu quả khi có một lượng lớn người xem cùng lúc.
Jitter là sự khác biệt về thời gian giữa các gói tin khi di chuyển từ nguồn đến đích, thường gia tăng khi xảy ra nghẽn mạng hoặc tắc nghẽn tại máy chủ dịch vụ Hiện tượng này có thể dẫn đến tràn bộ đệm ở set-top-box, gây dừng hình ở đầu cuối Timing drift xảy ra khi đồng hồ ở đầu gửi và đầu nhận có sự khác biệt về tốc độ, dẫn đến tràn bộ đệm tại đầu nhận Để giảm thiểu tác động của jitter, đầu nhận cần hiệu chỉnh lại tốc độ đồng hồ cho phù hợp, nhằm tránh hiện tượng tràn bộ đệm.
Can nhiễu như xuyên âm, trùng kênh, và tương thích điện từ trường có thể gây sai lệch tín hiệu thu, dẫn đến hình ảnh hiển thị bị muỗi, nhòe và âm thanh bị giật.
2.1.7 Suy hao đường truyền và fadding trong thông tin di động
Suy hao đường truyền và fadding gây ra sự suy giảm chất lượng tín hiệu truyền hình tại đầu thu, dẫn đến hình ảnh hiển thị kém chất lượng.
Vấn đề đánh giá chất lượng video trong các ứng dụng đa phương tiện 25
Trong quá trình truyền tải video, nhiều yếu tố ảnh hưởng đến chất lượng, bao gồm mã hóa/giải mã và mạng truyền tải Do đó, việc đánh giá chất lượng video trở thành một vấn đề quan trọng để đảm bảo dịch vụ tốt Hiện nay, có hai phương pháp phổ biến để đánh giá chất lượng hình ảnh và video trong ứng dụng đa phương tiện: phương pháp chủ quan và phương pháp khách quan.
Phương pháp chủ quan, dựa vào sự đánh giá của con người, là cách hiệu quả nhất để đánh giá chất lượng video Mặc dù mang lại kết quả tốt, phương pháp này lại tốn kém về thời gian và chi phí, đồng thời không phải lúc nào cũng khả thi trong thực tế.
Phương pháp đánh giá khách quan cho phép xây dựng các mô hình đánh giá chất lượng hình ảnh dựa trên các tham số của mạng truyền dẫn và hệ thống mã hóa, giải mã Tuy nhiên, việc mô hình hóa ảnh hưởng của mạng truyền tải cùng với tác động của mã hóa và giải mã là một thách thức phức tạp, do những ảnh hưởng này phụ thuộc vào kiểu mã hóa, thuộc tính và cấu hình của từng hệ thống cụ thể.
Thực trạng đo đánh giá chất lượng video trong các ứng dụng đa phương tiện ở Việt Nam 26
2.3.1 Thực trạng triển khai các dịch vụ đa phương tiện của một số nhà cung cấp dịch vụ tại Việt Nam
Tập đoàn Bưu chính Viễn thông Việt Nam (VNPT) là nhà cung cấp dịch vụ viễn thông và Internet hàng đầu tại Việt Nam, chiếm 48% thị phần thuê bao băng rộng Mạng NGN của VNPT hỗ trợ triển khai nhiều dịch vụ đa dạng, đáp ứng nhu cầu ngày càng cao của người dùng.
Vào ngày 28/9/2009, Công ty VASC thuộc tập đoàn VNPT đã chính thức ra mắt nhiều dịch vụ đa phương tiện trên nền tảng IPTV dưới thương hiệu MyTV, mang đến trải nghiệm giải trí phong phú cho người dùng.
"Những gì bạn muốn" cung cấp đa dạng dịch vụ như Truyền hình thời gian thực (Live TV), Phim theo yêu cầu (VOD), Karaoke (KoD), Truyền hình theo yêu cầu (TVoD), Âm nhạc (MoD), và Game theo yêu cầu (GoD).
Ngoài ra trên nền di động VNP và VMS cung cấp khá nhiều dịch vụ đa phương tiện như Mobile Internet, Mobile Broadband, Mobile TV, Traffic Camera… [22]
Tập đoàn Viettel đã phát triển nhiều ứng dụng đa phương tiện qua mạng di động 3G và EDGE/GPRS Các dịch vụ này bao gồm dịch vụ cơ bản như Video Call và Mobile Internet, cùng với các dịch vụ gia tăng như MobiTV, Mclip, Vmail, Mstore, và Imuzik 3G.
Dịch vụ IPTV iTV của FPT, với slogan "Muốn gì xem nấy", mang đến cho người dùng trải nghiệm giải trí đa dạng iTV cung cấp nhiều tiện ích, bao gồm các kênh truyền hình trong và ngoài nước, kho phim phong phú, cùng các chương trình thiếu nhi và tiếng Anh cho bé, đáp ứng nhu cầu giải trí của mọi lứa tuổi.
Tháng 04 năm 2009, VTC Digicom phối hợp với một số Viễn thông các tỉnh,thành phố đã chính thức bắt đầu triển khai dịch vụ IPTV cung cấp rất nhiều các ứng dụng đa phương tiện Cho đến nay dịch vụ IPTV củaVTC Digicom cung cấp gần 100 kênh truyền hình trong đó có 30 kênh truyền hình độ phân giải cao theo chuẩn HD (High Definition), VTC còn xây dựng thành công kho dữ liệu khổng lồ với hơn 3000 bộ phim đặc sắc có thuyết minh phụ đề tiếng Việt, gần 2000video ca nhạc cùng một hệ thống các phim tài liệu hấp dẫn khác phục vụ cho VoD Đặc biệt IPTV của VTC Digicom song hành cùng giải ngoại hạng Anh, với tính năng xem lại các trận bóng đá, các chương trình tổng hợp giải ngoại hạng Anh Lựa chọn công nghệ nén hiệu quả
VTC Digicom đã phát triển một hệ thống mạnh mẽ, có khả năng phục vụ 100.000 thuê bao, kết hợp với công nghệ truy cập băng rộng ADSL 2+ cho tốc độ tải xuống lên đến 25 Mb/s trong khoảng cách 1.5 km và băng thông rộng đạt 2.2 MHz.
2.3.2 Vấn đề đo đánh giá chất lượng video trong các ứng dụng đa phương tiện
Hiện nay, nhiều nhà cung cấp dịch vụ tại Việt Nam đã triển khai ứng dụng đa phương tiện, chủ yếu liên quan đến truyền hình ảnh Tuy nhiên, vấn đề đánh giá chất lượng video trong các ứng dụng này chưa được chú trọng Việc đo lường chất lượng video chỉ được thực hiện một lần sau khi triển khai, mà không có đánh giá định kỳ trong quá trình khai thác để đảm bảo chất lượng ổn định Hiện tại, việc đảm bảo chất lượng video cho khách hàng vẫn chủ yếu dựa vào phản ánh và khiếu nại của họ, thay vì từ kết quả đo kiểm định kỳ.
CHƯƠNG 3 NGHIÊN CỨU TÌNH HÌNH CHUẨN HÓA PHƯƠNG PHÁP ĐÁNH GIÁ CHẤT LƯỢNG HÌNH ẢNH
Chất lượng hình ảnh có tác động trực tiếp tới chất lượng dịch vụ truyền hình HDTV, nó có thể được đánh giá theo hai phương pháp sau:
Phương pháp đánh giá chủ quan dựa vào thực nghiệm quan sát và sự tham gia của người dùng để xác định chất lượng thông qua thang điểm lựa chọn trung bình (MOS).
Phương pháp đánh giá khách quan là việc sử dụng thiết bị để đo lường các tham số khác nhau nhằm đánh giá chất lượng tổng thể của tín hiệu hình ảnh.
3.1 Tình hình tiêu chuẩn hóa phương pháp đánh giá chủ quan
Liên minh Viễn thông quốc tế (ITU) là tổ chức tiêu chuẩn quốc tế, công bố các khuyến nghị về đánh giá chất lượng hình ảnh nhằm tối ưu hóa môi trường và tiêu chí quan sát, từ đó đạt được kết quả đánh giá chính xác nhất Các khuyến nghị ITU-T/R chủ yếu tập trung vào phương pháp đánh giá chất lượng hình ảnh, như được trình bày trong Bảng 4 Đồng thời, loạt khuyến nghị BT của ITU-R liên quan đến phương pháp đánh giá chủ quan chất lượng hình ảnh truyền hình, trong khi các khuyến nghị J/P của ITU-T cũng áp dụng cho các ứng dụng viễn thông như truyền hình cáp và đa phương tiện.
Bảng 4 Tiêu chuẩn ITU về phương pháp đánh giá chủ quan chất lượng hình ảnh
BT.500 Phương pháp luận đánh giá chủ quan chất lượng hình ảnh truyền hình
Phương pháp đánh giá chủ quan chất lượng hình ảnh truyền hình số phân giải cao (HDTV)
BT.802 quy định các yêu cầu cần thiết để truyền dẫn tín hiệu truyền hình số qua mạng phân phối sơ cấp và mạng thành phần, đảm bảo tuân thủ tiêu chuẩn 4:2:2 theo khuyến nghị ITU-R BT.601 (Phần A).
Phương pháp đánh giá chủ quan truyền hình số phân giải tiêu chuẩn (SDTV)
Hình ảnh có độ phân giải siêu cao
BT.1210 Các vật tư sử dụng trong đánh giá chủ quan
Các giá trị tham số phân cấp mở rộng khuôn dạng hình ảnh LSDI cho sản xuất và trao đổi chương trình quốc tế
BT.1907 đề cập đến các kỹ thuật đo lường chất lượng hình ảnh dựa trên cảm nhận của người dùng, đặc biệt trong các ứng dụng HDTV Nghiên cứu này tập trung vào việc sử dụng tín hiệu tham chiếu đầy đủ để đảm bảo độ chính xác và tính khách quan trong việc đánh giá chất lượng hình ảnh Các phương pháp này giúp cải thiện trải nghiệm người xem và đáp ứng các tiêu chuẩn cao trong ngành công nghiệp truyền hình.
BT.1908 đề xuất các kỹ thuật đo lường chất lượng hình ảnh khách quan cho các ứng dụng truyền phát sử dụng HDTV Các phương pháp này được áp dụng trong bối cảnh tín hiệu tham chiếu rút gọn, nhằm đảm bảo độ chính xác và hiệu quả trong việc đánh giá chất lượng hình ảnh.
Các giá trị tham số của các hệ thống truyền hình phân giải siêu cao về sản xuất và trao đổi chương trình quốc tế
P.910 Các phương pháp đánh giá chủ quan chất lượng hình ảnh video của các ứng dụng đa phương tiện
J.140 Phương pháp đánh giá chủ quan chất lượng hình ảnh của hệ thống truyền hình cáp
J.141 Chỉ thị hiệu năng các dịch vụ số liệu được phân phối trên hệ thống truyền hình cáp số
J.142 Các phương pháp đo đánh giá các tham số truyền dẫn của tín hiệu truyền hình cáp số
J.143 Các yêu cầu sử dụng cho đo đánh giá chất lượng hình ảnh theo cảm nhận khách quan trong truyền hình cáp số
J.144 Các kỹ thuật đo đánh giá chất lượng hình ảnh theo cảm nhận khách quan đối với truyền hình cáp số theo mô hình tham chiếu đầy đủ
J.145 đề cập đến việc đánh giá và kiểm soát chất lượng dịch vụ cho truyền dẫn âm thanh trên các mạng thành phần và mạng phân phối Trong khi đó, J.147 mô tả phương pháp đánh giá chất lượng hình ảnh khách quan thông qua việc sử dụng các tín hiệu đo thử trong dịch vụ.
J.148 Các yêu cầu đối với mô hình chất lượng đa phương tiện theo cảm nhận khách quan
J.149 Phương pháp đặc tả độ chính xác và định cỡ chéo chỉ số đo chất lượng hình ảnh (VQM)
Các điều kiện trong phương pháp đánh giá chủ quan 32
Các bước tiến hành để đánh giá chất lượng hình ảnh cho các ứng dụng đa phương tiện như sau:
- Xác định một loạt các mẫu hình ảnh để tiến hành kiểm tra
- Lựa chọn một số tham số cấu hình
- Thiết lập môi trường kiểm tra tuân thủ với các tham số cấu hình mong muốn
- Tập hợp người tham gia vào kiểm tra
- Tiến hành kiểm tra và phân tích các kết quả
Môi trường kiểm tra chất lượng hình ảnh phải tuân thủ quy định trong khuyến nghị ITU-T P910, được nêu trong Bảng 5 Các bài kiểm tra cần được thực hiện trong phòng đánh giá chất lượng, nơi có thể tạo ra điều kiện môi trường tối ưu Để đảm bảo độ chính xác của đánh giá, phòng này cần được cách âm với bên ngoài, với mức ồn không vượt quá 30 dBA Thiết lập này rất quan trọng cho việc kiểm tra chất lượng hình ảnh trong các ứng dụng đa phương tiện, như minh họa trong Hình 4.
Hình 4 Đánh giá chủ quan chất lượng hình ảnh
Khi đánh giá các hệ thống trong thử nghiệm với định dạng hình ảnh rút gọn như CIF, SIF hoặc QCIF, các chuỗi sẽ được hiển thị trên một cửa sổ màn hình Màu nền của màn hình nên được thiết lập ở mức 50% màu xám.
Có hai phương pháp kiểm tra hình ảnh từ các nguồn ghi: đầu tiên, sử dụng việc truyền hoặc phát lại video thời gian thực qua các hệ thống thử nghiệm trong khi theo dõi và phản hồi đối tượng Thứ hai, là xử lý off-line các nguồn ghi bằng thiết bị thử nghiệm, từ đó xuất ra bản ghi để tạo thiết lập ghi mới.
Kỹ thuật số VTR có khả năng giảm thiểu suy yếu trong quá trình ghi lại, đặc biệt là khi so sánh với sự suy yếu do điều chế Việc xem xét sự suy yếu từ phối hợp mã hóa tốc độ thấp thường xảy ra hơn, vì vậy các VTR chất lượng chuyên nghiệp như D2 và MII là lựa chọn lý tưởng để đảm bảo chất lượng ghi âm tối ưu.
Bảng 5 Các điều kiện quan sát
Tham số Sự thiết lập
Khoảng cách quan sát (1) 1 – 8 H Độ sáng cực đại của màn hình 100-200 cd/m (Chú ý 2)
Tỷ lệ độ sáng của màn hình khi không hoạt động với độ sang cao điểm
Tỷ lệ độ sáng của màn hình trong điều kiện tối hoàn toàn, khi chỉ hiển thị màu đen, đạt đến mức tương ứng với đỉnh sáng của màu trắng.
Tỷ lệ độ sáng của nền phía sau hình ảnh quan sát với độ sáng cao điểm của hình ảnh (2)
Sắc độ của nền (3) D65 Ánh sáng nền của phòng ≤ 20 lux
(1): Khoảng cách quan sát phụ thuộc vào từng loại ứng dụng
(2): Giá trị này là giá trị điển hình, trong một số các ứng dụng cụ thể có thể cho phép giá trị cao hơn tùy thuộc vào ứng dụng
(3) Đối với màn hình máy tính, sắc độ của nền có thể được điều chỉnh để thích ứng với sắc độ của màn hình
Kinh nghiệm đánh giá chất lượng hình ảnh của các đối tượng có thể rất khác nhau, ngay cả khi họ xem cùng một hình ảnh Để giảm thiểu sự biến đổi trong kết quả đánh giá, cần có một mẫu hình ảnh duy nhất được đánh giá bởi một số lượng lớn đối tượng Theo khuyến nghị ITU-R BT.500, các đối tượng đánh giá nên bao gồm ít nhất 15 người không chuyên, tức là những người không thường xuyên tham gia vào công việc liên quan đến chất lượng hình ảnh truyền hình và không có nhiều kinh nghiệm trong các bài kiểm tra đánh giá.
Việc chọn lựa chuỗi kiểm tra phù hợp là yếu tố quan trọng trong việc lập kế hoạch cho phương pháp đánh giá chủ quan Khi thực hiện kiểm tra với các nhóm quan sát khác nhau hoặc trong các thí nghiệm khác nhau, việc sử dụng một bộ chuỗi kiểm tra đồng nhất là rất cần thiết.
Một bộ chuỗi kiểm tra được ITU khuyến nghị để đánh giá chất lượng hình ảnh một cách chủ quan trong các ứng dụng đa phương tiện, được mô tả chi tiết trong Bảng 6 Bảng này cung cấp các thông tin quan trọng cho từng chuỗi kiểm tra.
- Mô tả ngắn gọn bối cảnh;
- Định dạng nguồn (525 dòng hoặc 625 dòng, định dạng [ITU-R BT.601-4]);
- Các giá trị thông tin về không gian và thời gian
Tất cả các chuỗi trong Bảng 6 đều công khai và có thể được sử dụng miễn phí cho các đánh giá và mô tả Một số chuỗi được đề xuất trong thư viện CCIR đã được trình bày trong báo cáo [38].
Các chuỗi khác của thư viện CCIR có thể được sử dụng phù hợp cho các ứng dụng đặc biệt dựa trên việc lưu trữ và tìm kiếm video
Các chuỗi kiểm tra hiện tại vẫn đang trong quá trình nghiên cứu và có thể được cải thiện hoặc mở rộng trong tương lai, như đã nêu trong Bảng 6.
Bảng 6 Các chuỗi kiểm tra áp dụng trong đánh giá chất lượng video của các ứng dụng đa phương tiện
Chuỗi Loại Mô tả Định dạng gốc SI TI washdc D
Bản đồ Wasington DC và chuyển động của bàn tay và bút chì
3inrow C Người đàn ông trên bàn, camera pan
Betacam SP (525-lines) 81.7 30.8 vtc1nw A Người phụ nữ ngồi đọc mẩu tin
Susie A Người phụ nữ trẻ đang nói chuyện điện thoại
ITU-R BT.601-4 525-/625-lines 58.7 24.6 flower garden E Cảnh quan, camera pan ITU-R BT.601-4
525-/625-lines 227.0 46.4 smity2 B Nhân viên bán hàng bên bàn với quyển tạp chí
Để đảm bảo tính chính xác trong thí nghiệm, cần ít nhất 15 quan sát viên tham gia, ưu tiên lựa chọn những người bình thường, không phải chuyên gia và không có kinh nghiệm giám định Tuy nhiên, trong giai đoạn đầu phát triển hệ thống truyền thông video hoặc trong các thí nghiệm thí điểm trước khi tiến hành thí nghiệm lớn hơn, nhóm chuyên gia nhỏ từ 4-8 người có thể cung cấp đánh giá và trình bày kết quả hiệu quả.
Trước khi tiến hành thử nghiệm, các quan sát viên cần được kiểm tra thị lực và điều chỉnh để đảm bảo độ tinh khiết của mắt, với thị lực bình thường trên biểu đồ Snellen hoặc Landolt, cùng với việc kiểm tra tầm nhìn màu sắc bằng các biểu đồ chuyên dụng như Ishihara Trước khi bắt đầu các phiên đánh giá, cần cung cấp hướng dẫn chi tiết về nội dung thử nghiệm cho các quan sát viên, có thể thông qua một văn bản hướng dẫn được đề xuất trong Phụ lục A Các quan sát viên cũng cần được giới thiệu cẩn thận về phương pháp đánh giá, các yếu tố có thể làm suy giảm chất lượng, thang đo đánh giá và tín hiệu định thời.
Trong một phiên (là một chuỗi các bài trình bày) không nên kéo dài quá nửa giờ
Khi nhiều cảnh hoặc hình ảnh được kiểm tra, chúng sẽ được trình bày một cách ngẫu nhiên Thứ tự ngẫu nhiên này có thể được điều chỉnh để đảm bảo rằng các cảnh hoặc chuỗi hình ảnh tương tự không xuất hiện liên tiếp.
Khuyến cáo nên thực hiện ít nhất 2, và tốt nhất là 3 hoặc 4 lần lặp lại trong quá trình thử nghiệm, đặc biệt là với các thử nghiệm có nhiều người quan sát Việc lặp lại thử nghiệm giúp tính toán độ tin cậy cho từng đối tượng và loại bỏ các kết quả không đáng tin cậy Ước lượng độ lệch tiêu chuẩn là điều kiện tiên quyết để phân tích chính xác sự sai lệch và khái quát hóa kết quả Hơn nữa, các hiệu ứng đạt được trong thử nghiệm thường ổn định ở một mức độ nhất định.
Các phép kiểm tra chất lượng hình ảnh chủ quan được thực hiện theo hướng dẫn của khuyến nghị ITU-R BT.500-11, trong khi khuyến nghị ITU-T P.910 cung cấp các chỉ tiêu kỹ thuật cho phương pháp thử nghiệm hình ảnh Việc thực hiện các phép kiểm tra định tính một cách chính quy mang lại đánh giá chính xác và hợp lý về chất lượng hình ảnh, nhưng cũng tiêu tốn thời gian và yêu cầu các phương tiện đặc biệt.
Một số phương pháp đánh giá chủ quan chất lượng hình ảnh video trong các ứng dụng đa phương tiện 36
4.2.1 Phương pháp đánh giá phân loại tuyệt đối (ACR)
Phương pháp ACR, theo khuyến nghị ITU-T P.910, là một trong những phương pháp phổ biến nhất để đánh giá chất lượng dịch vụ viễn thông Trong phương pháp này, người xem sẽ đánh giá đoạn hình ảnh trong vòng 10 giây, giúp thu thập dữ liệu chính xác về trải nghiệm người dùng.
Sau 10 giây, hình ảnh sẽ được đánh giá theo thang chất lượng 5 mức, như trình bày trong Bảng 7 Kết quả đánh giá được tính toán bằng cách trọng số số lượng bình chọn của các đối tượng trong mỗi thể loại với các điểm số đánh giá, và được thể hiện dưới dạng điểm đánh giá.
Hiệu ứng chuyển cảnh ảnh hưởng đến điểm số đánh giá chất lượng hình ảnh, khi một hình ảnh có chất lượng suy giảm nhẹ thường đạt điểm cao hơn nếu được xem sau hình ảnh chất lượng thấp Để loại bỏ hiệu ứng này, có thể thay đổi trình tự trình chiếu của các đoạn hình ảnh hoặc lặp lại việc đánh giá cho các hình ảnh tương tự theo trình tự khác.
Do không có tiêu chuẩn đánh giá chất lượng hình ảnh trong phương pháp ACR, các kết quả đánh giá có thể bị ảnh hưởng mạnh đến phạm vi biến đổi chất lượng hình ảnh Điều này yêu cầu sự cẩn trọng khi so sánh các kết quả từ các đo đạc khác nhau Khi các đánh giá ACR được thực hiện bởi nhiều tổ chức, cần tiến hành các bước sơ bộ để đảm bảo rằng cùng một phạm vi biến đổi chất lượng được áp dụng nhất quán.
Hình ảnh A Hình ảnh B Hình ảnh C
Một đơn vị đánh giá
Hình 5 Trình chiếu trong phương pháp ACR
Bảng 7 Thang đo chất lượng 5 mức theo phương pháp ACR Điểm số đạt được Đánh giá
Các chỉ số chất lượng điểm lựa chọn trung bình (MOS) được thể hiện trên Hình
Điểm MOS (Mean Opinion Score) là chỉ số đánh giá chất lượng dịch vụ, trong đó giá trị 3,5 cho thấy khoảng 90% người dùng đánh giá từ “3: Khá tốt” trở lên, trong khi chỉ 10% đánh giá “2: Kém” hoặc thấp hơn Để đảm bảo tỷ lệ đánh giá kém không vượt quá 10%, cần thiết kế chất lượng dịch vụ đạt điểm MOS tối thiểu là 3,5 Ngược lại, điểm MOS 2,5 cho thấy khoảng 50% người dùng đánh giá tối thiểu là “3: Khá tốt” và 50% còn lại đánh giá “2: Kém” hoặc thấp hơn, thường được coi là giới hạn chấp nhận được.
2: Kém hoặc cao hơn 3: Khá tốt hoặc cao hơn 4: Tốt hoặc cao hơn 5: Xuất sắc Điểm lựa chọn trung bình (MOS)
Tỷ lệ của các đối tượng (%)
Hình 6 Ví dụ về đặc tính MOS trong phương pháp ACR 4.2.2 Phương pháp đánh giá phân loại tuyệt đối với tham chiếu ẩn (ACR-HR)
Phương pháp ACR-HR, theo khuyến nghị ITU-T P.910, nhằm loại bỏ ảnh hưởng chủ quan của người quan sát và ẩn hình ảnh tham chiếu Kết quả đánh giá từ phương pháp ACR được xử lý bằng công thức để tính toán sự khác biệt điểm số giữa hình ảnh đánh giá và hình ảnh tham chiếu Kết quả cuối cùng được thể hiện qua điểm đánh giá trung bình sai khác (DMOS).
DMOS = điểm hình ảnh đánh giá - điểm hình ảnh tham chiếu + 5 Ở đây, chất lượng hình ảnh tham chiếu được đánh giá hoặc “5: Xuất sắc” hoặc
“4: Tốt” bởi một chuyên gia trong lĩnh vực chất lượng hình ảnh
Nhóm chuyên gia chất lượng hình ảnh (VQEG) thường xuyên áp dụng phương pháp đánh giá này để nghiên cứu và phát triển các phương pháp đánh giá khách quan về chất lượng hình ảnh.
4.2.3 Phương pháp đánh giá phân loại suy giảm (DCR)
Trong phương pháp DCR theo khuyến nghị ITU-T P.910, người tham gia xem các đoạn hình ảnh tham chiếu để hình thành cơ sở đánh giá chất lượng, sau đó đánh giá chất lượng các đoạn hình ảnh khác trong khoảng 10 giây tiếp theo Hình ảnh tham chiếu được trình chiếu trước để cung cấp nền tảng cho việc đánh giá Phương pháp này giúp giảm thiểu hiệu ứng chuyển cảnh so với phương pháp ACR Kết quả đánh giá được thể hiện bằng điểm số trung bình, và để phân biệt với giá trị MOS từ phương pháp ACR, các giá trị này thường được gọi là DMOS (MOS sai khác).
Tham chiếu Hình ảnh A Hình ảnh B
Một đơn vị đánh giá
Một đơn vị đánh giá
Hình 7 Trình chiếu trong phương pháp DCR
Bảng 8 Thang đo chất lượng 5 mức theo phương pháp DCR Điểm số đạt được Đánh giá
5 Không hề cảm thấy khó chịu
4 Có cảm thấy, nhưng không khó chịu
Đánh giá DMOS cung cấp hình ảnh tham chiếu cho phép so sánh, giúp nâng cao độ chính xác trong việc đánh giá suy giảm chất lượng so với phương pháp ACR.
Phương pháp DCR được đánh giá là phù hợp hơn so với ACR trong việc đánh giá các hệ thống ít suy giảm chất lượng Tuy nhiên, việc yêu cầu hai mẫu hình ảnh cho mỗi đánh giá DMOS khiến thời gian thực hiện gấp đôi so với phương pháp ACR Trong phương pháp DCR, điểm số DMOS lần lượt là 4,5, 3,5 và 2,5, tương ứng với các tiêu chuẩn chất lượng của giới hạn phát hiện, giới hạn chấp nhận được và giới hạn chịu đựng.
Phương pháp DCR, hay còn gọi là phương pháp thang đo suy giảm bằng tác nhân kích thích đôi (DSIS), là một phương pháp được phát triển bởi liên minh truyền hình châu Âu.
4.2.4 Phương pháp so sánh theo cặp (PC)
Phương pháp PC theo khuyến nghị ITU-T P.910 yêu cầu trình chiếu các đoạn hình ảnh cho người đánh giá theo cặp, mỗi hình ảnh kéo dài khoảng 10 giây Người đánh giá sẽ so sánh chất lượng của hình ảnh đầu tiên với hình ảnh thứ hai và trong khoảng thời gian 10 giây tiếp theo, họ sẽ xác định hình ảnh nào có chất lượng tốt hơn Đánh giá được thực hiện dựa trên thang so sánh 7 mức, như được trình bày trong Bảng 9.
≤ 10 giây Bình chọn Hình ảnh A Hình ảnh B Hình ảnh C
Một đơn vị đánh giá
Một đơn vị đánh giá
Hình 8 Trình chiếu trong phương pháp PC
Bảng 9 Thang so sánh 7 mức theo phương pháp PC Điểm số đạt được Đánh giá
Kết quả đánh giá chất lượng hình ảnh có tính chủ quan và bị ảnh hưởng bởi thứ tự trình chiếu, do đó cần thực hiện đánh giá với thứ tự khác nhau để đảm bảo tính chính xác Phương pháp so sánh trực tiếp PC giúp phát hiện sự khác biệt tinh tế về chất lượng giữa các cặp hình ảnh Tuy nhiên, kết quả từ phương pháp này chỉ mang tính tương đối và mất nhiều thời gian hơn so với các phương pháp ACR hoặc DCR, do yêu cầu kết hợp nhiều hình ảnh đánh giá.
4.2.5 Phương pháp thang đo chất lượng liên tục bằng tác nhân kích thích kép (DSCQS)
Phương pháp thang đo chất lượng liên tục bằng tác nhân kích thích kép, theo khuyến nghị ITU-R BT.500, được sử dụng phổ biến để đánh giá chất lượng hệ thống và các tuyến truyền dẫn trong phát sóng truyền hình Phương pháp này đặc biệt hiệu quả khi không đủ điều kiện chất lượng trình chiếu, đồng thời cho phép đánh giá sự khác biệt về chất lượng giữa hình ảnh tham chiếu đầy đủ và hình ảnh đánh giá, cũng như chất lượng tuyệt đối của hình ảnh đánh giá.
Trong phương pháp DSCQS, một cặp hình ảnh bao gồm hình ảnh tham chiếu và hình ảnh đánh giá đã bị suy giảm trong quá trình xử lý Hình ảnh được trình chiếu hai lần, và việc đánh giá diễn ra sau lần trình chiếu thứ hai Các hình ảnh được trình bày theo thứ tự ngẫu nhiên, và người tham gia không biết hình ảnh nào là hình ảnh tham chiếu.
Một đơn vị đánh giá
Một đơn vị đánh giá
Hình 9 Trình chiếu trong phương pháp DSCQS
Tổng kết 44 CHƯƠNG 5 PHƯƠNG PHÁP ĐÁNH GIÁ KHÁCH QUAN CHẤT LƯỢNG
Việc áp dụng các phương pháp đánh giá chủ quan mang lại kết quả chính xác và đáng tin cậy nhất Tuy nhiên, để thực hiện những phương pháp này, cần đầu tư vào các điều kiện thử nghiệm với chi phí cao Do đó, phương pháp này được khuyến khích sử dụng trong những trường hợp không quá nghiêm ngặt về ngân sách, nhằm đạt được kết quả đo lường chính xác và tin cậy.
Khi đánh giá hệ thống mới, phương pháp so sánh cặp PC là lựa chọn phù hợp, cho phép thiết lập thử nghiệm để kiểm tra các thông số như mã hóa và mất gói tin Phương pháp này rất hữu ích trong việc đánh giá chất lượng video cho các ứng dụng đa phương tiện trước khi nghiệm thu và đưa vào sử dụng Nhiều nhà cung cấp dịch vụ trên thế giới đã áp dụng phương pháp này để đánh giá các hệ thống thử nghiệm IPTV.
Sự ra đời của nén truyền hình số đã dẫn đến sự suy yếu chất lượng hình ảnh, phụ thuộc vào phân cảnh và thay đổi theo thời gian Chất lượng hình ảnh trong các video ngắn được mã hóa kỹ thuật số có thể dao động đáng kể tùy thuộc vào nội dung phân cảnh, với sự suy giảm chất lượng có thể xảy ra trong thời gian ngắn Để đánh giá những suy giảm này, phương pháp chủ quan SAMVIQ được áp dụng Việc thiết lập điều kiện thử nghiệm và thang đo đánh giá cho phép phân tích sự suy yếu hình ảnh theo phân cảnh và thời gian, thể hiện qua việc lựa chọn các phân cảnh, phương thức trình diễn và tiêu chí đánh giá, cũng như xử lý kết quả đánh giá.
Bốn phương pháp đánh giá chủ quan ACR, ACR-HR, DCR và PC có thể áp dụng để đánh giá chất lượng video cho các hệ thống phân phối dịch vụ đa phương tiện Việc lựa chọn phương pháp thử nghiệm phù hợp phụ thuộc vào sự khác biệt trong cách sử dụng tham chiếu Cụ thể, ACR, ACR-HR và PC thuộc nhóm không sử dụng tham chiếu rõ ràng, trong khi DCR là phương pháp sử dụng tham chiếu rõ ràng.
Phương pháp DCR được sử dụng để kiểm tra độ chính xác truyền dẫn của các nguồn tín hiệu, đóng vai trò quan trọng trong việc đánh giá hệ thống chất lượng cao Được định nghĩa trong [ITU-R BT.500-9], DCR là một phương pháp thiết yếu để đánh giá chất lượng hình ảnh truyền hình, đặc biệt trong các tình huống thoại và hội nghị truyền hình Những đánh giá cụ thể về mức DCR rất có giá trị, giúp người xem nhận diện sự suy giảm chất lượng.
Để kiểm tra độ xác thực của các nguồn tín hiệu, phương pháp DCR là lựa chọn tối ưu DCR cũng rất hữu ích trong việc đánh giá các hệ thống chất lượng cao trong truyền thông đa phương tiện Khả năng phân biệt giữa sự suy giảm không thể nhận thấy và nhận thấy trong DCR hỗ trợ cho việc này, cùng với khả năng so sánh chất lượng tham chiếu.
ACR là phương pháp hiệu quả và nhanh chóng để thực hiện và trình bày các tác nhân kích thích tương tự như trong các hệ thống truyền thống Do đó, ACR rất lý tưởng cho các bài thử nghiệm khả năng.
ACR-HR là phương pháp tiên tiến của ACR, tập trung vào việc cải thiện sự trình diễn phân cảnh và tốc độ Điểm nổi bật của ACR-HR là khả năng loại bỏ ảnh hưởng của cảm nhận người xem từ video tham chiếu, giúp giảm thiểu tác động của các yếu tố như sở thích cá nhân, chất lượng video tham chiếu và sự khác biệt giữa giám sát viên và khách hàng ACR-HR thích hợp cho các thử nghiệm quy mô lớn, với yêu cầu video tham chiếu đạt chất lượng tối thiểu Tuy nhiên, phương pháp này có thể không nhạy cảm với một số vấn đề có thể dễ dàng nhận diện bằng các phương pháp trực tiếp khác, như DCR, ví dụ như sự suy giảm trong việc đạt được màu sắc.
Phương pháp PC nổi bật với khả năng nhận biết cao, điều này đặc biệt quan trọng khi chất lượng hình ảnh thử nghiệm gần như đồng đều Khi nhiều danh mục được đánh giá trong cùng một thử nghiệm, quy trình dựa trên phương pháp PC có thể kéo dài Do đó, một thử nghiệm ACR hoặc DCR có thể được thực hiện trước với một số quan sát giới hạn, sau đó áp dụng phương pháp PC cho những mục đã nhận được đánh giá tương tự.
CHƯƠNG 5 PHƯƠNG PHÁP ĐÁNH GIÁ KHÁCH QUAN CHẤT LƯỢNG
VIDEO TRONG CÁC ỨNG DỤNG ĐA PHƯƠNG TIỆN
Tâm lý đánh giá của người tham gia đóng vai trò quan trọng trong việc xác định chất lượng chủ quan của hình ảnh Tuy nhiên, phương pháp này yêu cầu nhiều thời gian, nỗ lực và thiết bị chuyên dụng, gây khó khăn trong việc nâng cao hiệu quả đánh giá chất lượng và thiết kế dịch vụ Điều này cũng ảnh hưởng đến quá trình giám sát và kiểm soát chất lượng dịch vụ.
Nhu cầu đánh giá khách quan chất lượng hình ảnh ngày càng tăng, dựa trên các đặc điểm vật lý của tín hiệu truyền thông, dịch vụ, mã hóa và truyền tải để ước lượng chất lượng hình ảnh.
Công nghệ đánh giá chất lượng video khách quan ước lượng chất lượng từ thông tin điểm ảnh, định lượng chất lượng bằng cách so sánh thông tin điểm ảnh tham chiếu với các video bị suy yếu Các kỹ thuật này cố gắng mô phỏng đặc trưng của hệ thống thị giác con người, nhằm đạt được thang điểm chất lượng hình ảnh tương quan tốt với đánh giá của người xem trực tiếp.
Hiện nay, trong phương pháp đánh giá khách quan, điểm đánh giá chất lượng (MOS) thường được tính trung bình trên thang điểm từ 1 đến 5 Thang điểm này bao gồm các mức 5, 4, 3, 2 và 1, phản ánh sự hài lòng của khách hàng.
Chất lượng tín hiệu Video Rất tốt Tốt Trung bình Xấu Rất xấu
Các mô hình tham chiếu trong phương pháp đánh giá khách quan 47
Phương pháp đánh giá khách quan chất lượng video bao gồm việc xây dựng các mô hình đánh giá chất lượng hình ảnh dựa trên các tham số liên quan đến mạng truyền dẫn và hệ thống mã hóa, giải mã Hiện tại, có ba mô hình chính đang được nghiên cứu và áp dụng: mô hình tham chiếu đầy đủ, mô hình tham chiếu rút gọn và mô hình không tham chiếu.
5.1.1 Mô hình tham chiếu đầy đủ ( Full _reference)
Các giải thuật trong mô hình tham chiếu đầy đủ thực hiện so sánh chi tiết giữa hình ảnh đầu vào và đầu ra của hệ thống Quá trình so sánh này bao gồm các tính toán phức tạp, không chỉ xử lý theo điểm ảnh mà còn theo thời gian và không gian giữa dòng dữ liệu video Kết quả của các giải thuật này thường phù hợp với các đánh giá chủ quan (MOS).
PSNR (Peak Signal-to-Noise Ratio) là một trong những thuật toán đầu tiên trong mô hình tham chiếu đầy đủ, đánh giá tỷ số giữa giá trị lớn nhất của tín hiệu và tạp âm, được tính theo đơn vị dB Giá trị PSNR khoảng 35dB thường được xem là “tốt”, trong khi giá trị dưới 20dB là không chấp nhận được Hiện nay, PSNR được áp dụng rộng rãi trong kỹ thuật đánh giá chất lượng hình ảnh và video.
Ngoài giải thuật PSNR, đã có nhiều giải thuật cho mô hình tham chiếu đầy đủ được phát triển, bao gồm MPQM (Moving Pictures Quality Metric - 1996) của EPFL Thụy Sỹ, VQM (Video Quality Metric - 1999) của Viện nghiên cứu Viễn thông Mỹ (NTIA ITS) và CVQE (Continuous Video Quality Evaluation - 2004) Những giải thuật này thích hợp cho các ứng dụng video với tốc độ bit thấp Trong số đó, chỉ có VQM được tiêu chuẩn hóa và tích hợp vào tiêu chuẩn ITU-T J.144.
Giải pháp dựa trên mô hình tham chiếu đầy đủ giúp đánh giá chính xác chất lượng tín hiệu hình ảnh tại đầu thu bằng cách so sánh chi tiết từng điểm ảnh của hai tín hiệu.
Hệ thống đo đánh giá Đầu ra/ Video bị suy giảm Đầu vào/ Video tham chiếu
Tỷ lệ chất lượng hình ảnh khách quan
Hình 13 Mô hình triển khai tham chiếu đầy đủ 5.1.2 Mô hình tham chiếu rút gọn ( Reduce – Reference)
Mô hình tham chiếu rút gọn (RR) được sử dụng để đánh giá chất lượng hình ảnh một cách khách quan Nó thực hiện việc so sánh giữa hình ảnh đã xử lý, bị bóp méo do mã hóa và tổn thất trong quá trình truyền tải, với một lượng nhỏ thông tin được trích xuất từ các hình ảnh nguồn Mô hình này giúp nâng cao độ chính xác trong việc đánh giá chất lượng hình ảnh.
RR tận dụng các đặc tính của hình ảnh nguồn và tín hiệu hình ảnh suy giảm, mang lại độ chính xác cao, mặc dù không đạt được mức độ chính xác như mô hình FR.
Các đặc tính cụ thể được lấy từ hình ảnh nguồn và tín hiệu đã xử lý Dữ liệu tham chiếu về các thông số tại điểm A được gửi đến hệ thống đo tại điểm B, cho phép so sánh các thông số ở điểm cuối chuỗi Các thông số này bao gồm đặc tính khối, thông tin tín hiệu không gian, thời gian và tạp nhiễu.
Hình 14 Mô hình tham chiếu rút gọn 5.1.3 Mô hình không tham chiếu ( Non(Zero) _ reference)
Các giải thuật không tham chiếu rất phù hợp cho việc giám sát và phân tích chất lượng video trực tuyến tại đầu cuối Chúng có thể xem xét các yếu tố ảnh hưởng ít hơn so với các thuật toán trong mô hình tham chiếu đầy đủ, cho phép triển khai trong nhiều ngữ cảnh khác nhau Tuy nhiên, thiết kế các giải thuật này gặp nhiều khó khăn, dẫn đến hiện tại chỉ có một số phương pháp được đề xuất và một số công ty đã tích hợp vào sản phẩm thương mại của họ, coi đây là bí mật công nghệ.
Hình 15 Mô hình không tham chiếu
Một số phương pháp đánh giá khách quan chất lượng hình ảnh trong các ứng dụng đa phương tiện 49
Có 5 tổ chức đề xuất mô hình đánh giá khách quan chất lượng hình ảnh trong các ứng dụng đa phương tiện bao gồm:
- NTT (Nhật Bản) với Mô hình FR - NTT_QE;
- OPTICOM (Đức) với Mô hình FR - PEVQ phiên bản 3.4;
- SwissQual (Thụy Sỹ) với Mô hình FR - Vquad;
- Tektronix (Mỹ) với Mô hình FR - VQEG.bat phiên bản 2.5.93;
Mô hình RR - Yonsei_RR56k, Yonsei_RR128k & Yonsei_RR256k
Mặc dù chưa được tiêu chuẩn hóa, nhiều nghiên cứu đã được thực hiện về các phương pháp đánh giá theo mô hình NR Trong khuôn khổ luận văn, các phương pháp đánh giá này sẽ được đề cập và phân tích chi tiết.
- Phương pháp đánh giá chất lượng hình ảnh tự nhiên NIQE
5.2.1 Phương pháp đánh giá khách quan chất lượng hình ảnh video trong các ứng dụng đa phương tiện theo giải thuật FR-NTT
Hình 16 Giải thuật NTT trong đánh giá khách quan chất lượng video trong các ứng dụng đa phương tiện
Thuật toán NTT, như được trình bày trong Hình 16, đánh giá chất lượng video bị ảnh hưởng bởi biến dạng thông qua một quy trình gồm nhiều bước cụ thể.
Bước 1: Quá trình căn chỉnh không gian/thời gian giữa các video tham chiếu và video bị biến dạng
Bước này thực hiện việc sắp xếp và căn chỉnh các điểm ảnh cùng khung hình của video tham chiếu và video bị biến dạng, giúp so sánh chúng một cách chính xác Đồng thời, quá trình này loại bỏ nhiễu tần số cao không thể nhận biết bởi con người, và hiệu chỉnh tăng/lệch phù hợp với giá trị điểm ảnh của video tham chiếu Việc hiệu chỉnh này cũng giúp loại bỏ ảnh hưởng từ sự sắp xếp màu trong bộ giải mã và hiển thị, bao gồm cả card video.
Bước 2: Xác định các thông số đánh giá chất lượng mã hóa, bao gồm:
1) Tỷ lệ tín hiệu lớn nhất trên nhiễu PSNR
2) Giá trị Biến dạng khối Log (-Min_HV)
Giá trị này cho biết độ biến dạng khối bằng cách tính toán tỷ lệ giữa các cạnh ngang, cạnh dọc (HV) và các cạnh khác
3) Năng lượng chuyển động trung bình của khối (Ave_MEB) Năng lượng chuyển động trung bình trên mỗi khối thể hiện sự biến dạng chuyển động và biến dạng cục bộ Để tính toán giá trị này cần cần tính toán độ sáng khác nhau giữa các khung trên mỗi khối 8x8 điểm ảnh, việc này được thực hiện trên cả video tham chiếu và video đã qua xử lý
4) Sự biến thiên năng lượng cục bộ (FV_LME)
Thông số này thể hiện sự thay đổi theo thời gian của biến dạng không gian cục bộ, đồng thời mô tả mức độ biến đổi của méo không gian trong chuỗi.
Giá trị của thông số này phản ánh sự suy giảm tốc độ khung và hiện tượng đóng băng khung hình, thông qua việc sử dụng tín hiệu video suy giảm trong quá trình căn chỉnh Quá trình này cung cấp các thông số liên quan đến việc đóng băng khung hình.
Bước 3 Đánh giá sự biến dạng liên quan đến mất gói tin
Bước này bắt nguồn từ hai thông số thêm vào liên quan đến sự biến dạng video gây ra do mất gói tin
Biến dạng khối cục bộ xảy ra trong các khung hình cụ thể, được xác định thông qua việc tính toán mức độ thay đổi theo thời gian giữa các khung hình khi độ sáng thay đổi từ khung này sang khung khác, so sánh giữa video bị biến dạng và video tham chiếu.
Sự biến dạng trong video ở dạng đóng băng và tốc độ khung hình được xác định bằng cách tính toán thời gian mà video hiển thị cùng một hình ảnh, trong khi hình ảnh tham chiếu đang thay đổi.
Bước 4: Ước lượng chất lượng tổng thể
Bước này đánh giá tổng thể tác động của việc suy giảm chất lượng bằng cách tính toán tổng trọng số của năm thông số đặc trưng được thu thập ở bước 2 và 3.
5.2.2 Phương pháp đánh giá khách quan chất lượng hình ảnh video trong các ứng dụng đa phương tiện theo giải thuật FR-PEVQ
Mô hình PEVQ được phát triển nhằm dự đoán tác động của suy hao đường truyền đến chất lượng hình ảnh theo cảm nhận của người dùng, với mục tiêu chính là phục vụ cho các ứng dụng đa phương tiện di động và IPTV Các tính năng nổi bật của PEVQ bao gồm khả năng đánh giá chính xác chất lượng hình ảnh trong các điều kiện truyền tải khác nhau.
Đồng chỉnh thời gian của các cảnh hình ảnh đầu vào được thực hiện nhanh chóng và đáng tin cậy nhờ vào phân tích tương quan đặc tính đa chiều Phương pháp này đạt được giới hạn vượt trội so với các thử nghiệm của VQEG, đặc biệt hiệu quả trong việc xử lý cắt xén thời gian, đóng băng khung hình và bỏ qua khung hình.
- Đồng chỉnh không gian toàn khung
- Thuật toán đồng chỉnh màu sắc dựa trên biểu đồ tích lũy
- Phát hiện và cảm nhận chính xác trọng số của khung hình bị đóng băng và bỏ qua
Để phát hiện chất lượng hình ảnh, chỉ cần sử dụng bốn chỉ số hoạt động trong các miền thời gian, không gian và màu sắc, được kích thích bởi hệ thống thị giác con người Tính chất mặt nạ nhận thức của hệ thống thị giác (HVS) được mô phỏng qua các giai đoạn của thuật toán Những chỉ số này được tích hợp thông qua một thuật toán kết hợp không gian và thời gian phức tạp.
Trong giai đoạn đầu, thuật toán thực hiện đồng chỉnh giữa các miền khác nhau và thu thập thông tin về khung hình Tiếp theo, các hình ảnh được đồng bộ và cân bằng, sau đó so sánh sự khác biệt về độ sáng và màu sắc, đồng thời tính đến ảnh hưởng của mặt nạ và chuyển động Cuối cùng, các chỉ số chất lượng được kết hợp vào một hàm phi tuyến tính để thu được MOS cuối cùng.
PEVQ, được phát triển bởi Roland Bitto từ OPTICOM, là một công cụ đo lường chất lượng cho các ứng dụng đa phương tiện Nó dựa trên một thước đo chất lượng truyền hình trước đó do Tiến sĩ John Beerends và Andries Hekstra từ KPN phát triển PEVQ cho phép triển khai hiệu quả mà không làm giảm độ chính xác trong dự báo, và đã được công nhận rộng rãi trong ngành công nghiệp viễn thông di động.
Hiện nay, hãng OPTICOM đã phát triển nhiều thiết bị đánh giá chất lượng video dựa trên giải thuật này, với nguyên lý hoạt động và cấu hình đo được minh họa trong Hình 17 và Hình 18.
Hình 17 Nguyên tắc hoạt động của các thiết bị đo chất lượng video theo giải thuật
Hình 18 Cấu hình đo theo giải thuật PEVQ
5.2.3 Phương pháp đánh giá khách quan chất lượng hình ảnh video trong các ứng dụng đa phương tiện theo FR-SwissQual