Lý thuyết mô hình tốc độ - tổn thất cho quá trình mã hoá và truyền dữ liệu được
Shannon phát triển từ từ năm 1948 [9] và nó trở thành nền tảng cho các phương pháp mô hình trong các nghiên cứu về mã hoá và truyền tin. Lý thuyết R-D xác định lượng tối thiểu thông tin R có thể được truyền qua kênh để nguồn có thể được khôi phục lại tại bên nhận mà không vượt quá một giá trị tổn thất D được đưa ra. Lý thuyết R-D đưa ra các biên lý thuyết cho một khối lượng nén có thể đạt được bằng phương pháp nén dữ liệu có tổn hao. Rất nhiều kỹ thuật mã hoá video và hình ảnh hiện nay có các thủ tục chuyển đổi miền không gian, lượng tử và cáp phát bít áp dụng nguyên lý chung của mô hình RD. Do các lý do trên Một mô hình RD là một phần tử quan trọng trong mã hoá
video và điều khiển tốc độ. Việc tối ưu tốc độ, tổn thất cho các tài nguyên khác nhau
yêu cầu một hiểu biết sâu trong hàm mô hình R-D. Tốc độ video được điều khiển chủ yếu bởi QP mà QP lại liên quan tới tổn hao trong giải mã video. Một miêu tả chính xác
của mô hình RD dựa trên QP làm nó có thể điều khiển tốc độ bit của video được mã
hoá một cách chính xác.
Dựa trên lý thuyết thông tin ta có lượng tin được xác định bởi công thức:
gọi là lượng thông tin về . Lượng tin trung bình của nguồn A
là: .
Lượng tin chung của X và Y có dạng:
Mai Gia Hà Page 66
Với nguồn có phân bố Gause với tổn thất D là MSE (mean
squared error) thì mô hình RD được tính là: trong đó là phương
sai của các mẫu tin.
Với nguồn có phân bố laplace trong đó thì hàm R-D
có được tính theo Berger [10] là:
Trong đó D là hàm của tham số lượng tử Qstep.
Lee [16] đề xuât mô hình RD bằng cách khai triển Taylor hàm R(D) trên thành:
Ngoài 2 phân bố Guase và Laplace còn số một số đề xuất hàm mật độ phân bố của
nguồn video mà điển hình là [Kamaci 2005] đề xuất hàm mật độ xác suất cho nguồn
video là: (hàm Caushy) và mô hình R-D là: trong đó c và
là các hệ số.
[Kim 2001] đề xuất một mô hình RD vùng (là phần trăm hệ số không của hệ số
lượng tử trong mỗi khung hoặc mỗi MB) khi đó mô hình tốc độ được đề xuất là:
Các mô hình R-D đã phát triển rất nhiều tuy nhiên các ứng dụng hiện nay sử dụng chủ yếu các mô hình dựa trên hàm phổ mật độ có phân bố Laplace (ví dụ như TMN8 của H263 và G2 của MPEG-4 như được trình bày ở dưới đây.