Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 28 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
28
Dung lượng
303,63 KB
Nội dung
Trang 100 Bài 7 Mãhóatốiưunguồnrờirạckhôngnhớ 7.1 Các định lý về giới hạn trên và dưới của chiều dài trung bình 7.2 Mãhoá theo Shannon và Fano 7.3 Phương pháp mãhoátốiưu theo Huffman Trang 101 Các định lý về giới hạn trên và dưới của chiều dài trung bình Định lý 7.1 Cho nguồn tin X = { a 1 , ., a K } với các xác suất tương ứng p 1 , ., p K . Một bộ mã phân tách được bất kỳ cho nguồn này với cơ số mã m , chiều dài trung bình từ mã sẽ thoả (trong đó H (X) là entropy của nguồn với cơ số của logarit là m ). Chứng minh ( ) m H l log X ≥ ∑∑∑ = − == =−−=− K i i l i K i ii K i ii p m pmlpppmlXH i 111 lnlnlnln)( 01111 11 =−≤− ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ = ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ −≤ ∑∑ = − = − K i l K i i l i i i m p m p Trang 102 Các định lý về giới hạn trên và dưới của chiều dài trung bình (tt) Chú ý dấu “=” xảy ra khi và chỉ khi , tức là Định lý 7.2 Cho nguồn tin X = {a 1 , ., a K } với các xác suất tương ứng p 1 , ., p K , có thể xây dựng một mã prefix với cơ số m sao cho Chứng minh Chọn chiều dài l i của từ mã cho tin a i theo qui tắc Chúng ta có ( ) 1 log X +< m H l 1= − i l p m i i l i mp − = ⎡⎤ i p mi l log−= 1 11 =≤⇒ ∑∑ == − K i i K i l pm i ⎡⎤ i lp mi p mi pmll iii ≤⇒−≥⇒−= − loglog Trang 103 Chứng minh định lý (tt) Vì các chiều dài được chọn này thoã bất đẳng thức Kraft nên tồn tại một mã prefix tương ứng có các chiều dài này. Tiếp tục chúng ta có Điều này hoàn tất chứng minh của chúng ta. ⎡⎤ 1loglog +−<⇒−= ii p mi p mi ll ∑∑∑ === +−< K i i K i p mi K i ii pplp i 111 log ( ) 1 log X 1 log log 1 +=+ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ −= ∑ = m H m pp K i ii Trang 104 Hệ quả Có thể mãhoá một nguồnmà có chiều dài trung bình tiếp cận đến với sai số nhỏ tuỳ ý. Chúng ta thực hiện điều này bằng cách mãhoá các dãy N tin của nguồn X = {a 1 , ., a K } theo Định lý 7.2. Lúc này chúng ta có nguồn mới với kích thước là K N , mỗi phần tử là một dãy của N tin được lấy độc lập từ nguồn X. Entropy của nguồn mới này là NH(X) và chiều dài trung bình các từ mã của nó theo định nghĩa sẽ là N lần chiều dài trung bình các từ mã của nguồn ban đầu, . Áp dụng Định lý 7.1 và Định lý 7.2 đối với nguồn mới chúng ta có ( ) m H log X l Trang 105 Hệ quả (tt) Áp dụng Định lý 7.1 và Định lý 7.2 đối với nguồn mới ta có Vì N có thể lớn tuỳ ý, nên tiếp cận đến H(X) / log m với tốc độ tương đương với 1/N tiến đến 0 khi N tiến ra vô cùng. Để đánh giá một phương pháp mãhoá nào đólàtốt hay không người ta đưa ra khái niệm hiệu suất lập mã. Hiệu suất lập mã Hiệu suất lập mã h được định nghĩa bằng tỉ số của entropy của nguồn với chiều dài trung bình của bộ mã được lập () ( ) 1 log X log X +<≤ m NH lN m NH ( ) ( ) Nm H l m H 1 log X log X +<≤ ⇒ l ( ) l H h X = Trang 106 Mãhóatốiưu Là phép mãhóamà kết quả là một bộ mã có chiều dài trung bình là nhỏ nhất trong tất cả các phép mãhóa có thể có cho nguồn. Bộ mã của phép mãhóatốiưu cho nguồn được gọi là bộ mãtối ưu. Ba phép mã hóa: Shannon, Fano, Huffman. Trong mỗi phép mãhóa chúng ta sẽ mãhóa với cơ số mã m = 2 trước (mã hóa nhị phân), sau đósẽ mở rộng cho trường hợp m > 2. Trang 107 Phương pháp mãhoá Shannon B1.Sắp xếp các xác suất theo thứ tự giảm dần. Không mất tổng quát giả sử p 1 ≥ . ≥ p K . B2. Định nghĩa q 1 = 0, q i = , ∀ i = 1, 2, ., K. B3. Đổi q i sang cơ số 2, (biểu diễn q i trong cơ số 2) sẽ được một chuỗi nhị phân B4.Từ mã được gán cho a i là l i kí hiệu lấy từ vị trí sau dấu phẩy của chuỗi nhị phân tương ứng với q i , trong đó l i = ∑ − = 1 1 i j j p ⎥ ⎥ ⎤ ⎢ ⎢ ⎡ − i p 2 log Trang 108 Ví dụ Hãy mãhoánguồn S = {a 1 , a 2 , a 3 , a 4 , a 5 , a 6 } với các xác suất lần lượt là 0,3; 0,25; 0,2; 0,12; 0,08; 0,05. H = 2.36, = 2,75, h = 2,36/2,75 = 85,82% ∑ − = = 1 1 i j ji qq ⎡ ⎤ ii pl 2 log−= Tin a i Xác suất p i Biểu diễn nhị phân Từ mã w i a 1 0,3 0 0,00 2 00 a 2 0,25 0,3 0,01001 . 2 01 a 3 0,2 0,55 0,10001 . 3 100 a 4 0,12 0,75 0,11000 . 4 1100 a 5 0,08 0,87 0,11011 . 4 1101 a 6 0,05 0,95 0,111100 . 5 11110 l Trang 109 Nhận xét - Bài tập Phương pháp Shannon cho kết quả là một mã prefix. Phương pháp Shannon có thể mở rộng cho trường hợp m > 2 Bài tập Hãy mãhoá các nguồn sau bằng phương pháp Shannon. Tính entropy của nguồn, chiều dài trung bình và hiệu suất của phép mã hóa. S 1 = {a 1 , a 2 , a 3 , a 4 , a 5 , a 6 } với các xác suất lần lượt là 0,25; 0,21; 0,19; 0,16; 0,14; 0,05. S 2 = {a 1 , a 2 , a 3 , a 4 , a 5 , a 6 , a 7 , a 8 } với các xác suất lần lượt là 0,21; 0,18; 0,15; 0,14; 0,12; 0,01; 0,06 ; 0,04. S 3 = {a 1 , a 2 , a 3 , a 4 , a 5 , a 6 , a 7 , a 8 , a 9 } với các xác suất lần lượt là 0,25; 0,19; 0,15; 0,11; 0,09; 0,07; 0,06; 0,04; 0,04. [...]... nếu mãtốiưu cho nguồn S là tốt hơn mã theo qui tắc đã phát biểu thì mã được dẫn xuất từ mãtốiưu này bằng cách bỏ đi hai từ mã wK và wK–1 và thay vào từ mãmà bỏ đi bit cuối của wK thì sẽ được một mãtốiưu tốt hơn cho nguồn S’, điều này mâu thuẫn Vậy mã nhận được cho S theo qui tắc trên là tốiưu Định lý Định lý 7.3 và 7.4 cho phép qui bài toán tìm mãtốiưu cho nguồn có K tin về bài toán tìm mã tối. .. bộ mã mới so với bộ mã cũ Δl = pilj + pjli – pili – pjlj = (pj – pi)(li – lj) < 0 Điều này mâu thuẫn với định nghĩa của bộ mãtốiưu Trang 115 Hai định lý của Huffman Bổ đề này thật sự phát biểu một điều rằng, để mã hoá tốiưu cho một nguồn tin thì tin có xác suấ càng lớn phải được mãhoá thành từ mã có chiều dài càng nhỏ Định lý 7.3 (Định lý số 1 của Huffman) Trong bộ mãtốiưu (m = 2) cho một nguồn. .. Phương pháp mã hoá tốiưu Huffman Trước hết xét cơ số mã m = 2 Trường hợp m > 2, chúng ta sẽ có một sự chú ý về sự khác biệt so với trường hợp m = 2 Bổ đề Cho nguồn S = {a1, , aK} có các xác suất lần lượt là p1, , pK Gọi l1, , lK là chiều dài các từ mã tương ứng với bộ mãtốiưu cho S Nếu pi > pj thì li ≤ lj Chứng minh Với pi > pj, giả sử li > lj Xét bộ mã mới bằng cách hoán đổi hai từ mã có chiều... tổng quát phương pháp Fano không phải là phương pháp mã hóa tốiưu Chú ý Trong trường hợp nếu xác suất pK–1 + pK bằng với một xác suất pi nào đó thì chúng ta có thể đặt pK–1 + pK nằm dưới hoặc nằm trên xác suất pi thì kết quả chiều dài từ mã trung bình vẫn không thay đổi cho dù các từ mã kết quả có thể khác nhau Trang 122 Mở rộng cho cơ số m > 2 Nếu K ≤ m thì việc mã hoá tốiưu là quá tầm thường Giả... bit cuối Nếu có một từ mã wi khác có chiều dài bằng lK đồng thời khác từ mã wK chỉ ở bit cuối thì chúng ta có thể hoán đổi wK–1 và wi cho nhau, vì vậy định lý cũng được chứng minh Nếu không tồn tại một từ mã wi như vậy thì chúng ta có thể tạo ra một bộ mã mới bằng cách bỏ đi bit cuối của từ mã wK Bộ mã mới này không vi phạm điều kiện prefix và có chiều dài trung bình nhỏ hơn bộ mã cũ Vì vậy định lý được... chứng minh Trang 117 Hai định lý của Huffman (tt) Định lý 7.4 (Định lý số 2 của Huffman) Xét một nguồn mới S’ = {a’1, , a’K–1} với sự phân bố xác suất là p’1, , p’K–1 trong đó p’i = pi với 1 ≤ i ≤ K – 2 còn p’K–1 = pK–1 + pK Nếu {w’1, , w’K–1} làm một mãtốiưu cho S’ thì mã nhận được theo qui tắc sau là mãtốiưu cho S 1≤i≤K–2 wi = w’i, wK–1 = w’K–10 wK = w’K–11 Chứng minh Vì lK = lK–1 = 1 + l’K–1, nên... qui tắc trên là tốiưu Định lý Định lý 7.3 và 7.4 cho phép qui bài toán tìm mãtốiưu cho nguồn có K tin về bài toán tìm mãtốiưu cho nguồn có K–1 tin Và quá trình này có thể được lặp lại cho đến khi chỉ còn hai tin Lúc đó thì mãtốiưu là dễ thấy Trang 119 Giải thuật mãhóa Huffman B1 Sắp xếp các xác suất theo thứ tự giảm dần chẳng hạn p1 ≥ ≥ pK B2 Gán 0 tới bit cuối của wK–1 và 1 đến bit cuối của... 125 Nhận xét Xét nguồn S = {a1, a2, a3, a4} có sự phân bố xác suất là {0,4; 0,25; 0,2; 0,15} Xét nguồn mới S2 = {aiaj, 1 ≤ i, j ≤ 4} có tập phân bố xác suất là {0,16; 0,1; 0,08; 0,06; 0,1; 0,0625; 0,05; 0,0375; 0,08; 0,05; 0,04; 0,03; 0,06; 0,0375; 0,03; 0,0225} H(S) = 1,9 và H(S2) = 2H(S) = 3,8 Hai bảng sau đây trình bày kết quả việc mã hoá tốiưu cho S và S2 theo Huffman Nhận xét Việc mãhoá cho một... thì hai từ mã tương ứng với hai tin có xác suất nhỏ nhất phải có chiều dài bằng nhau (lK–1 = lK) và có thể làm cho chúng chỉ khác nhau duy nhất ở bit cuối (bit tận cùng bên phải) Chứng minh Nếu lK–1 < lK thì loại bỏ bit cuối cùng của từ mã wK chúng ta được một bộ mã mới vẫn có tính prefix nhưng có chiều dài trung bình nhỏ hơn bộ mã cũ Trang 116 Hai định lý của Huffman (tt) Giả sử wK–1 và wK không thoả... 1 1 3 4 wi 00 0 010 1 011 0 100 1 101 0 110 1 0 1110 1 1 1111 Nhận xét - Bài tập Nhận xét Phương pháp Fano thường cho kết quả tốt hơn phương pháp Shannon Bài tập Hãy mãhoá các nguồn sau bằng phương pháp Fano Tính hiệu suất của phép mãhóa S1 = {a1, a2, a3, a4, a5, a6} với các xác suất lần lượt là 0,25; 0,21; 0,19; 0,16; 0,14; 0,05 S2 = {a1, a2, a3, a4, a5, a6 , a7, a8} với các xác suất lần lượt là . phép mã hóa tối ưu cho nguồn được gọi là bộ mã tối ưu. Ba phép mã hóa: Shannon, Fano, Huffman. Trong mỗi phép mã hóa chúng ta sẽ mã hóa với cơ số mã. 106 Mã hóa tối ưu Là phép mã hóa mà kết quả là một bộ mã có chiều dài trung bình là nhỏ nhất trong tất cả các phép mã hóa có thể có cho nguồn. Bộ mã