27. CÁC HÀM ĐÁNH GIÁ ĐỘ TIN CẬY
Trong trường hợp nguồn tin rời rạc chúng ta có thể xác định được rõ ràng tốc độ tạo ra thông tin, chính là entropy của tiến trình ngẫu nhiên của nguồn tin. Với nguồn tin liên tục, vấn đề này phức tạp hơn. Đầu tiên, một đại lương thay đổi liên tục có thể coi như có vô hạn các giá trị và do đó đòi hỏi một số lượng vô hạn bit nhị phân để biểu diễn chính xác. Điều này có nghĩa là để phát đi đầu ra của một nguồn liên tục với khả nănghồi phục chính xáctại đầu thu nhìn chung đòi hỏi phải có một kênh truyền có dung lượng vô hạn (theo bit/giây). Vì thông thường các kênh truyền có một lượng nhiễu nhất định, nên dung lượng kênh chỉ là hữu hạn và do đó yêu cầu truyền dẫn hoàn toàn chính xác là không thể thực hiện được.
Tuy nhiên điều này lại trốn tránh một sự thật. Thực tế, chúng ta không mong muốn truyền dẫn hoàn toàn chính xác khi chúng ta có nguồn liên tục, mà chúng ta chỉ mong muốn truyền dẫn với một khả năng chịu đựng lỗi nhất định. Câu hỏi đặt ra là liệu chúng ta có thể gán một tốc độ xác định cho một nguồn liên tục khi chúng ta yêu cầu chỉ một mức độ tin cậy nhất định trong phục hồi, được đo lường theo một cách thích hợp nào đấy. Tất nhiên là nếu tăng yêu cầu về độ tin cậy, tốc độ cũng sẽ tăng lên. Chúng ta sẽ thấy rằng, trong các trường hợp tổng quát, với một tốc độ xác định, bằng cách mã hóa thích hợp thông tin, ta có thể phát thông tin đi trên kênh truyền có dung lượng kênh bằng tốc độ theo yêu cầu và đảm bảo thỏa mãn các yêu cầu về độ tin cậy. Kênh truyền có dung lượng nhỏ hơn thì không đủ.
Trước hết ta cần đưa ra phát biểu toán học tổng quát của khái niệm độ tin cậy của truyền dẫn. Xét một tập các bản tin có độ dài làT giây. Nguồn tin được mô tả bởi hàm mật độ xác suất, trong không gian các bản tin đó nguồn sẽ chọn bản tin với xác suấtP(x). Một hệ thống truyền thông được mô tả (nhìn từ bên ngoài) bởi xác suất có điều kiệnPx(y), là xác suất nếu bản tinxđược tạo ra bởi nguồn, thì phía thu sẽ nhận được bản tiny. Tổng thể cả hệ thống (bao gồm cả nguồn và hệ thống truyền) được biểu diễn bởi hàm xác suấtP(x,y), là xác suất có bản tinxvà bản tin cuối cùng ở đầu ra lày. Nếu biết được hàm này, là biết được toàn bộ đặc tính của hệ thống, nhìn từ quan điểm độ tin cậy. Bất kỳ một đánh giá nào về độ tin cậy phải tương ứng về mặt toán học với một phép toán áp dụng choP(x,y). Phép toán này phải có ít nhất các đặc điểm về thứ tự của một hệ thống, nghĩa là ta phải có thể phát biểu với hai hệ thống được biểu diễn bởiP1(x,y)vàP2(x,y) rằng, theo tiêu chí về độ tin cậy, hoặc (1) hệ thống đầu tiên có độ tin cậy cao hơn (2) hệ thống thứ hai có độ tin cậy cao hơn hoặc (3) chúng có độ tin cậy bằng nhau. Điều này có nghĩa là một tiêu chí về độ tin cậy có thể được biểu diễn bởi một hàm có giá trị bằng số
v P(x,y)
có đối số thay đổi trên tất cả các giá trị hàm xác suấtP(x,y)có thể có.
Bây giờ chúng ta sẽ thấy rằng với các giả thiết hợp lý và rất tổng quát, hàmv P(x,y) có thể được viết dưới dạng đặc biệt hơn, đó là trung bình của hàmρ(x,y)trên tập hợp các giá trị khả dĩ củaxvày:
v P(x,y) = P(x,y)ρ(x,y)dx dy.
Để có được kết quả trên ta chỉ cần giả thiết rằng (1) nguồn tin và hệ thống là ergodic để một mẫu rất dài sẽ là điển hình của tập hợp, với xác suất gần bằng 1 và (2) đánh giá là “hợp lý”, theo nghĩa là nó có thể đưa ra một đánh giá sơ bộ trên cơ sở các mẫu này bằng cách quan sát một đầu vào và một đầu ra điển hìnhx1và
y1; Nếu các mẫu này có độ dài tăng lên thì đánh giá sơ bộ đó cũng (với xác suất bằng 1) tiệm cận tới giá trị đánh giá chính xác dựa trên hiểu biết đầy đủ vềP(x,y). Cho giá trị đánh giá sơ bộ làρ(x,y), thì hàmρ(x,y) sẽ tiệm cận với (khiT ∞) một hằng số với hầu hết(x,y)trong vùng xác suất cao tương ứng với hệ thống.
ρ(x,y) v P(x,y) và chúng ta cũng có thể viết
ρ(x,y) P(x,y)ρ(x,y)dx dy
vì
P(x,y)dx dy=1.
Đây chính là kết quả mong muốn.
Hàmρ(x,y)có đặc trưng tổng quát của “khoảng cách ” giữaxvày.9Nó đo lường mức độ không mong muốn (theo tiêu chuẩn độ tin cậy của chúng ta) để nhận đượcykhi phát đix. Kết quả tổng quát được đưa ra ở trên có thể phát biểu lại như sau: Bất kỳ một đánh giá hợp lý nào cũng có thể được biểu diễn là trung bình của hàm khoảng cách trên tập hợp các bản tin và bản tin hồi phụcxvàyvới trọng số là xác suấtP(x,y), miễn là độ dàiT của bản tin được lấy đủ lớn.
Sau đây là các ví dụ đơn giản về hàm đánh giá: 1. Tiêu chí RMS (giá trị hiệu dụng).
v= x(t) y(t) 2.
Trong phương pháp đo lường độ tin cậy rất hay được dùng này thì hàm khoảng cáchρ(x,y)(ngoại trừ hệ số không đổi) là bình phương của khoảng cách Euclide thông thường giữa các điểmxvàytrong không gian của chúng.
ρ(x,y) = 1
T
T
0 x(t) y(t) 2dt.
2. Theo tiêu chí giá trị hiệu dụng với trọng số tần số. Tổng quát hơn ta có thể áp dụng các trọng số khác nhau cho các thành phần tần số khác nhau trước khi sử dụng RMS để đo độ tin cậy. Nó tương đương với cho phần sai khácx(t)˘y(t)đi qua một bộ lọc tạo dạng và sau đó xác định công suất trung bình ở đầu ra. Do vậy, cho
e(t) =x(t) y(t) và f(t) = ∞ ∞e(τ)k(t τ)dτ khi đó ρ(x,y) = 1 T T 0 f(t)2dt.
3. Theo tiêu chí sai số tuyệt đối
ρ(x,y) = 1
T
T
0 x(t) y(t) dt.
4. Cấu trúc của tai và não người xác định ngầm định một đánh giá, hay thậm chí là nhiều đánh giá thích hợp trong truyền dẫn thoại hoặc âm nhạc. Ví dụ, có một tiêu chí đánh giá là “tính thông minh”, trong đóρ(x,y)bằng tần số tương đối của các từ bị biên dịch sai khi bản tin phát làx(t)và bản tin nhận là
y(t). Mặc dù chúng ta không thể đưa ra một biểu diễn rõ ràng củaρ(x,y)trong các trường hợp này, về nguyên lý có thể được xác định bằng các thử nghiệm đủ nhiều. Một số đặc tính của nó tuân theo các kết quả thí nghiệm nổi tiếng về nghe, ví dụ như tai hầu như không nhạy cảm với pha, tuy nhiên với biên độ và tần số thì lại nhạy gần tuân theo hàm logarit.
5. Trường hợp rời rạc có thể coi như một trường hợp đặc biệt trong đó chúng ta ngầm giả thiết một đánh giá dựa trên tần suất sai số. Hàmρ(x,y)được định nghĩa là số ký hiệu trong chuỗiykhác với các ký hiệu tương ứng củaxchia cho tổng số ký hiệu trongx.