Ý tưởng trong bài báo là sử dụng mã Polar để mã hóa khung dữ liệu MELP (Mixed-Excitation Linear Predictive) bằng cách chọn các bít dữ liệu theo thứ tự ưu tiên để gán vào các kênh ảo theo thứ tự chất lượng tốt đến giảm dần, đề xuất này mang lại độ lợi mã hóa đến 0,8 dB ở vùng Eb/N0 cao (khoảng 7dB) so với mã Hamming (7,4), với độ phức tạp chấp nhận được. Mời các bạn cùng tham khảo!
Ứng dụng mã cực (Polar) mã hóa tiếng nói tốc độ thấp theo chuẩn MELP Nguyễn Anh Hào Phạm Xuân Nghĩa Khoa Vô tuyến điẹn tử, Học viện Kỹ thuật quân Email: hao6379@gmail.com, nghiapx@mta.edu.vn có giá trị nhỏ kênh có độ tin cậy cao, kênh có Abstract— Ý tưởng báo sử dụng mã Polar để mã hóa khung liệu MELP (Mixed-Excitation Linear Predictive) cách chọn bít liệu theo thứ tự ưu tiên để gán vào kênh ảo theo thứ tự chất lượng tốt đến giảm dần, đề xuất mang lại độ lợi mã hóa đến 0,8 dB vùng Eb/N0 cao (khoảng 7dB) so với mã Hamming (7,4), với độ phức tạp chấp nhận Z(WNi ) lớn kênh có độ tin cậy thấp Keywords- Mã Polar, mã thoại tốc độ thấp, MELP I GIỚI THIỆU Mã phân cực (Polar Code - PC) Arikhan giới thiệu năm 2009 mã tuyến tính chứng minh đạt chất lượng kênh kênh nhị phân không nhớ rời rạc B-DMC tiếp cận đến giới hạn Shannon Đối với cấu trúc khung mã hóa thoại theo chuẩn MELP (2400 bps) gồm bit thơng tin có vai trị quan trọng khác nhau, tác động đến chất lượng tiếng nói sau khơi phục khác Phần cịn lại báo có bố cục sau: Mục trình bày tổng quan mã phân cực, đồng thời phân tích, đánh giá chất lượng mã phân cực kênh AWGN, mục trình bày mã MELP, mục trình bày đề xuất ứng dụng mã MELP, cuối phần Kết luận II TỔNG QUAN VỀ MÃ PHÂN CỰC (POLAR) Hình 1: Ví dụ phân cực kênh BEC với xác suất xóa 0.5 Ý tưởng mã phân cực từ kênh B-DMC W có (i) thể tạo N kênh ảo (virtual channels) WN , i N thông qua phép biến đổi tuyến tính cho N kênh phân cực Có nghĩa thơng tin tương hỗ chúng I(W ) tiến tới tiến tới (phân Mã phân cực sử dụng đặc tính phân cực với kênh có độ tin cậy cao sử dụng để truyền tin cịn kênh có độ tin cậy thấp đóng băng “frozen” Các bit đóng băng bit không mang tin giả thiết máy thu biết trước Bộ giải mã Arikhan đưa giải mã xóa SC (Successive Cancellation) q trình giải mã thực từ U ,U , ,U N Thực tế trình giải mã cực) [1] Hình mơ tả q trình phân cực kênh kênh nhị phân đối xứng có xác suất xóa 0.5 thực bit mang tin U j ,1 j i Các bít Quá trình biến đổi mã thực nhờ phép biến đổi G2 n gọi phép mũ Kronecker bậc n ma trận G2 : lại bit đóng băng Bộ giải mã SC tạo u N u N N dựa quan trắc đầu kênh y Bộ giải mã thực N 1 G2 1 định cho ui Nếu ui bit đóng băng Để xây dựng mã phân cực cần phải đánh giá thông tin tương hỗ kênh ảo Thay việc tính tốn thông tin tương hỗ phức tạp, [1] sử dụng tham số Bhattachryya Z(W ) giải mã cố định ui giá trị biết trước máy thu Nếu ui bit tin, giải mã chờ sử dụng tất bit ước lượng trước i để tính tốn phân cực kênh Các kênh có Z(WN ) 93 Đặc điểm quan trọng mã phân cực việc phân cực kênh tạo kênh tốt kênh xấu Việc mã hóa thực cách phát bit mang tin tức kênh tốt, có nghĩa U i chọn bit mang tin I(U i ;Y N ,U i 1 ) tiến tới đóng băng - Vị trí bit thơng tin có tỷ lệ lỗi bit nhỏ khơng phải vị trí kênh có giá trị phân cực lớn III Được phát minh năm 1995 Alan McCree, mã dự đốn tuyến tính kết hợp với kích thích (MELP) chuẩn mã hóa tiếng nói Bộ Quốc Phịng Chính Phủ Mỹ, ứng dụng chủ yếu ứng dụng quân thông tin vệ tinh, âm bảo mật thiết bị vô tuyến bảo mật I(U i ;Y N ,U i 1 ) tiến tới Chú ý I(U i ;Y N ,U i 1 ) tương ứng với việc giải mã U i với đầu vào Y bít i 1 giải mã trước U Ở đây, khảo sát tỷ lệ lỗi bit theo vị trí từ mã dùng mã phân cực kênh AWGN thuật toán giải mã SC Hình mơ tả tỷ lệ lỗi với vị trí bít mã từ mã có độ dài 128 bít, tỷ lệ mã hóa 1/2 kênh AWGN; với tỷ số tín tạp SNR=0 SNR=2 Theo [2], [3], mã MELP dựa mơ hình tham số mã dự đốn tuyến tính (LPC - Linear Prediction Coding) có cải tiến, bổ xung thêm năm đặc trưng để khắc phục nhược điểm mã LPC; Bộ trộn kích thích, chuỗi xung ngẫu nhiên, lọc phổ thích nghi tăng cường, trải phổ xung mơ hình lượng Fourier, khung liệu MELP tạo thành từ đoạn liệu âm khoảng thời gian 22.5ms, gồm 180 mẫu với tốc độ lấy mẫu 8,000 mẫu/giây Sau qua q trình phân tích, tính tốn đặc trưng, đoạn liệu mã hóa 54 bit truyền đi, tốc độ liệu (54 bit/22,5ms tương đương 2400 bit/ 1giây) Phạm vi, giá trị cụ thể tham số cho Bảng Khao sat so loi bit theo vi tri 4000 3500 3000 Bit erro num 2500 Bảng 1: Bảng cấp phát số bit dùng cho tham số MELP [2] 2000 Tên tham số Hệ số LPC10 (LSF) Năng lượng Fuorier Hệ số khuếch đại (G1,G2) Chu kỳ Pitch, Chồng âm Bộ lọc âm (5 băng cố định) Cờ ngẫu nhiên Mã sửa lỗi (FEC) Bit đồng Tổng số bit/ khung 22,5ms 1500 1000 500 0 10 20 30 40 Bit Index 50 60 70 Hình 2: Tỷ lệ lỗi theo vị trí bít tin mã PC với N=128, K=64; truyền kênh AWGN; SNR=0dB Số bit kiểm tra: 10000 Khao sat so loi bit theo vi tri 700 500 400 300 200 100 0 10 20 30 40 Bit Index 50 60 Có âm (bit) 25 8 1 54 Âm câm (bit) 25 13 54 Trong báo này, xét trường hợp 54 bit âm câm (Unvoice), số lượng bit thực chất chứa thơng tin 41, cịn lại 13 bit dùng để bổ sung mã FEC; cụ thể tiêu chuẩn MELP sử dụng mã Hamming sau: - Lấy 12 bit hệ số LPC (LSF - Line Spectrum Frequency) đầu tiên: ý bit cấu trúc MELP xếp theo thứ tự quan trọng (ưu tiên); dùng ba mã H(7,4) để mã hóa, sau mã hóa tăng thêm bit - Tiếp tục lấy bit hệ số khuếch đại (G1) dùng mã H(8,4) để mã hóa; sau mã hóa tăng thêm bit Các bit lại truyền trực tiếp, tổng số bit tăng thêm sau mã hóa 13 bit; tổng số bit khung liệu 54 bit 600 Bit erro num MÃ THOẠI TỐC ĐỘ THẤP CHUẨN MELP 2400 70 Bảng 2: Cấu trúc 54 bit âm câm (MELP) với mã Hamming [2] Hình 3: Tỷ lệ lỗi theo vị trí bít tin mã PC với N=128, K=64; truyền kênh AWGN; SNR=2dB Số bit kiểm tra: 10000 Từ kết Hình Hình ta có nhận xét sau: - Tỷ lệ lỗi bit giảm nhanh SNR tăng - Vị trí bit thơng tin ln có tỷ lệ lỗi lớn - Ln tồn vị trí bit thơng tin có tỷ lệ lỗi nhỏ (nhỏ nhiều lần giá trị trung bình) (vị trí bít số 61 Hình 3) H(7,4) LSF G1 G2 Pitch Đồng Tổng 25 4 41 H(8,4) 54 H(7,4) H(7,4) 13 Từ bảng 2, ta có số nhận xét: 94 Khi mã hóa liệu cần mã (3 H(7,4) H(8,4)) để mã hóa -Tỷ lệ lỗi bit mã hóa đồng (khơng có ưu tiên theo vai trò) - Tỷ lệ lỗi bit giảm chậm SNR tăng, điều phụ thuộc vào tính chất mã Hamming Với số lượng bit thông tin đầu vào 10.000.000 bit Kết chạy mô sử dụng loại mã Hamming phân cực trình bày Hình 10 ỨNG DỤNG MÃ PHÂN CỰC TRONG MÃ THOẠI CHUẨN MELP IV -2 10 BER Đề xuất ý tưởng: Như trình bày, thấy mã phân cực có đặc điểm truyền bit thông tin với tỷ lệ lỗi bit khác theo vị trí bit từ mã Cịn mã hóa tiếng nói theo chuẩn MELP lại có vai trị bit thông tin khung liệu khác Ở mục này, chúng tơi trình bày ý tưởng dùng mã Polar P(32,19) để thay mã Hamming khung liệu MELP với hy vọng nhận độ xác cao với bit quan trọng khung tín hiệu tiếng nói, điều xuất phát từ tính chất mã Polar, nội dung đề xuất trình bày -6 -8 10 G2 Pitch Đồng Tổng 25 41 54 P(32,19) 10 AWGN De-Polar (41 bit) De-Hamming (41 bit) F-Hamming (54 bit) Eb/N0, dB 10 Mã thoại tốc độ thấp chuẩn MELP ứng dụng rộng rãi hệ thống thông tin vô tuyến điện quân Đặc biệt trang bị vô tuyến điện Tập đồn Cơng nghiệp Viễn thơng Qn đội sản xuất sử dụng mã thoại chuẩn MELP Đối với mã thoại chuẩn MELP, 25 bit liệu LFS (chính tham số lọc LPC10) có vai trò quan trọng nhất, cần tham số tái tạo lại âm thanh, tham số khác bổ sung để làm rõ đặc trưng tiếng nói gốc Mặt khác, 25 bit LFS lại xếp theo vai trò (thứ tự ưu tiên) giảm dần, theo chuẩn MELP dùng mã Hamming để mã hóa bảo vệ 12 bit [2] Với đề xuất dùng mã Polar (32,19), ta không bảo vệ 15 bit LFS mà ưu tiên bit quan trọng Để đánh giá kết này, thực mô mathlab với khung liệu gốc 41 bit truyền kênh AWGN với ba trường hợp: - Thứ truyền khung 41 bit khơng mã hóa - Thứ hai truyền 54 bit, 16 bit mã hóa mã Hamming theo chuẩn MELP thành 29 bit, lại 25 bit truyền trực tiếp - Thứ ba truyền 54 bit, 19 bit mã hóa Polar (32,19) thành 32 bit, cịn lại 22 bit truyền trực tiếp Ỏ đầu thu thực giải mã, lọc lấy 41 bit thông tin so sánh tỷ lệ lỗi theo vị trí bit với 41 bit gốc Kết mô thể Hình Hình Sử dụng số cơng cụ [4], [5], thực xây dựng mơ hình mô so sánh tỷ lệ lỗi bit truyền khung liệu 54 bit (Unvoice) Matlab với hai trường hợp: khung liệu 54 bit đóng gói theo chuẩn MELP (dùng mã Hamming) hai khung liệu 54 bit đóng gói theo đề xuất (dùng mã P(32,19)) Mơ hình hệ thống trình bày Hình F-Polar (54 bit) Từ kết hình ta có số nhận xét sau: - Ở SNR < dB chất lượng mã Polar mã Hamming - Ở SNR ≥ dB chất lượng mã Polar bắt đầu tốt mã Hamming, điều rõ rệt chất lượng kênh tăng lên Ví dụ BER = 10-6 độ lợi dùng mã Polar tốt khoảng 0.8 dB so với mã Hamming Ở dùng mã P(32,19) để mã hóa, số lượng bít mã hóa nhiều hơn: 19 bit so với phương án mã hóa cũ, bít quan trọng mã hóa ưu tiên (ánh xạ lên kênh có chất lượng tốt hơn) F-MELP (41 bit) Hình 5: Kết so sánh BER loại khung liệu MELP 54 bit Bảng 3: Cấu trúc 54 bit âm câm (MELP) với mã Polar LFS -4 10 10 Dùng 19 bit thông tin (gồm 15 bit LFS bit G1) khung liệu để gán vào 19 kênh ảo tốt mã P(32,19) theo vị trí ưu tiên Như số lượng bit khung sau mã hóa đảm bảo 54 bit, số lượng bit mã hóa (bảo vệ) lại nhiều 19 bit/ 16 bit so với mã Hamming, Bảng trình bày cấu trúc khung (54 bit âm câm) tín hiệu tiếng nói sử dụng mã Polar G1 No code Polar Hamming BER Hình 4: Sơ đồ mơ so sánh chất lượng mã Hamming mã phân cực cho liệu chuẩn MELP 95 - Số lượng bit mã hóa (tỷ lệ lỗi nhỏ) phương án đề xuất lớn (19/16 bit) - Các bit quan trọng bảo vệ tốt (tỷ lệ lỗi nhỏ) 0.05 0.04 Để đạt ưu điểm độ lợi đây, sử dụng mã phân cực ta phải trả giá độ phức tạp mã hóa giải mã, qua tính tính tốn thấy độ phức tạp mã hóa giải mã Polar có độ dài N O(N.log2N) Độ phức tạp tương đối thấp hồn tồn thực dòng chip phổ biến No code Polar Hamming BER 0.03 0.02 V 0.01 0 10 20 30 Bit Index 40 Bài báo sử dụng đặc trưng mã phân cực phân cực kênh ảo để ứng dụng phù hợp với hóa tiếng nói MELP (2400 bps) có cấu trúc liệu phân biệt vị trí bit theo vai trị thơng tin Mơ hình kết hợp mã Polar mã thoại MELP 2400 bps có kết mơ tốt ứng dụng thực tế Tuy nhiên, cấu trúc khung liệu ngắn (54 bit), nên sử dụng mã Polar (32,19) nên chất lượng cải thiện chưa nhiều Mã Polar hiệu cấu trúc liệu lớn có phân biệt vai trị bit thơng tin 50 Hình 6: So sánh tỷ lệ lỗi bit SNR = dB, khung truyền 41 bit thông tin, số khung truyền 100.000 mẫu 0.03 0.025 BER TÀI LIỆU THAM KHẢO No code Polar Hamming 0.02 0.015 [1] [2] 0.01 [3] 0.005 0 [4] [5] 10 20 30 Bit Index 40 KẾT LUẬN 50 [6] Hình 7: So sánh tỷ lệ lỗi bit SNR = dB, khung truyền 41 bit thông tin, số khung truyền 1.000.000 mẫu Từ kết Hình hình 7, ta có số nhận xét sau: 96 E Arıkan (2009), “Channel Polarization: A Method for Constructing Capacity-Achieving Codes for Symmetric Binary-Input Memoryless Channels,” IEEE Trans Inf Theory, vol 55, no 7, pp 3051–3073 MIL_STD-3005, "Analog-to-Digital Conversion of Voice by 2,400 Bit/Second Mixed Excitation Linear Prediction (MELP)", US DoD STANAG-4591, The 1200 and 2400 bit/s Nato Interoperable narrow band voice coder, NATO H Vangala, E Viterbo and Y Hong (2015), "A Comparative Study of Polar Code Constructions for the AWGN channel", arXiv:1501.02473 Harish Vangala, "Poler code in MATLAB", Monash University, Clayton, VIC- 3800, Australia, Available: http:// www.polarcodes.com Mani Bastani Parizi (2012), Polar Codes: Finite Length Implementation, Error Correlations and Multilevel Modulation, EPFL - Ecole Polytechnique Fe’de’rale de Lausanne ... ưu điểm độ lợi đây, sử dụng mã phân cực ta phải trả giá độ phức tạp mã hóa giải mã, qua tính tính tốn thấy độ phức tạp mã hóa giải mã Polar có độ dài N O(N.log2N) Độ phức tạp tương đối thấp hồn... bit Kết chạy mô sử dụng loại mã Hamming phân cực trình bày Hình 10 ỨNG DỤNG MÃ PHÂN CỰC TRONG MÃ THOẠI CHUẨN MELP IV -2 10 BER Đề xuất ý tưởng: Như trình bày, thấy mã phân cực có đặc điểm truyền... sử dụng đặc trưng mã phân cực phân cực kênh ảo để ứng dụng phù hợp với hóa tiếng nói MELP (2400 bps) có cấu trúc liệu phân biệt vị trí bit theo vai trị thơng tin Mơ hình kết hợp mã Polar mã thoại