Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 62 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
62
Dung lượng
2,27 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ DƯƠNG THANH TÙNG ĐÁNH GIÁ ĐỊNH LƯỢNG KHẢ NĂNG CHỐNG LẠI MẤT MÁT GÓI TIN CỦA THUẬT TOÁN MÃ HÓA ILBC TRONG CÁC HỆ THỐNG THÔNG TIN THOẠI LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN Hà Nội - 2016 HÀ NỘI ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ DƯƠNG THANH TÙNG ĐÁNH GIÁ ĐỊNH LƯỢNG KHẢ NĂNG CHỐNG LẠI MẤT MÁT GÓI TIN CỦA THUẬT TOÁN MÃ HÓA ILBC TRONG CÁC HỆ THỐNG THÔNG TIN THOẠI Ngành: Công nghệ Thông tin Chuyên ngành: Truyền liệu Mạng máy tính Mã số: LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TS HOÀNG XUÂN TÙNG Hà Nội - 2016 ĐẠI HỌC QUỐC GIA HÀ NỘI LỜI CAM ĐOAN Tôi xin cam đoan nội dung luận văn “Đánh giá định lượng khả chống lại mát gói tin thuật toán mã hóa iLBC hệ thống thông tin thoại” sản phẩm thực hướng dẫn Tiến sĩ Hoàng Xuân Tùng Trong toàn nội dung luận văn, điều trình bày nghiên cứu từ tài liệu tham khảo Tất tài liệu tham khảo có xuất xứ rõ ràng trích dẫn hợp pháp Tôi xin chịu trách nhiệm cho lời cam đoan Hà Nội, ngày tháng năm 2016 Người cam đoan Dương Thanh Tùng LỜI CẢM ƠN Tôi xin bày tỏ lòng biết ơn sâu sắc đến thầy hướng dẫn tôi, Tiến sĩ Hoàng Xuân Tùng Thầy giúp có hội để theo đuổi nghiên cứu lĩnh vực yêu thích Trong suốt trình thực luận văn, thầy tận tình hướng dẫn cho tôi, góp ý cho đường lối, đồng thời đưa lời khuyên bổ ích để hoàn thành luận văn Tiếp đến, xin chân thành cảm ơn thầy cô giáo Khoa Công nghệ Thông tin, Đại học Công nghệ - Đại học Quốc gia Hà Nội truyền đạt cho kiến thức kinh nghiệm vô quí báu trình học tập nghiên cứu Tôi muốn cảm ơn bạn lớp đồng nghiệp cho lời động viên, hỗ trợ góp ý mặt chuyên môn Cuối cùng, xin cảm ơn gia đình, bạn bè, người bên cạnh ủng hộ động viên MỤC LỤC LỜI CAM ĐOAN DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT LỜI MỞ ĐẦU CHƯƠNG – TỔNG QUAN VỀ HỆ THỐNG THÔNG TIN THOẠI VÀ CÁC VẤN ĐỀ MÃ HÓA, GIẢI MÃ ÂM THOẠI 1 Âm thoại trình số hóa tín hiệu âm 1.1.1 Âm thoại 1.1.2 Số hóa âm thoại 2 Tổng quan hệ thống thông tin thoại 1.2.1 Giới thiệu hệ thống thông tin thoại 1.2.2 Các yếu tố ảnh hưởng đến chất lượng hệ thống thông tin thoại Mã hóa – giải mã tín hiệu âm hệ thống thông tin thoại 1.3.1 Chức mã hóa – giải mã hệ thống thoại 1.3.2 Các phương pháp mã hóa tín hiệu thoại 1.3.2.1 Phương pháp mã hóa tín hiệu dạng sóng (Waveform coding) 1.3.2.2 Phương pháp mã hóa tiếng nói Vocoder 1.3.2.3 Phương pháp mã hóa lai (Hybrid coding) Đánh giá chất lượng âm thoại 10 1.4.1 Các yêu cầu mã hóa âm thoại 10 1.4.2 Các tham số liên quan đến chất lượng thoại 11 1.4.3 Các phương pháp đánh giá chất lượng thoại phổ biến 11 CHƯƠNG – ILBC CODEC 16 Giới thiệu iLBC Codec kỹ thuật xử lý tiếng nói dựa mã hóa dự đoán tuyến tính 16 2.1.1 Giới thiệu iLBC Codec 16 2.1.2 Kỹ thuật xử lý tiếng nói dựa mã hóa dự đoán tuyến tính 18 2 Quá trình mã hóa iLBC Codec (Encoder) 25 2.2.1 Tổng quan trình mã hóa iLBC Codec 25 2.2.2 Các nguyên tắc mã hóa 27 Quá trình giải mã iLBC Codec (Decoder) 29 2.3.1 Tổng quan trình giải mã iLBC Codec 29 2.3.2 Các nguyên tắc giải mã 31 CHƯƠNG – ĐÁNH GIÁ KHẢ NĂNG CHỐNG LẠI MẤT MÁT GÓI TIN TRÊN ĐƯỜNG TRUYỀN THOẠI 33 3 Khái niệm chống mát gói tin đường truyền thoại 33 Phân loại kỹ thuật chống mát gói tin 33 3.2.1 Kỹ thuật chống gói từ phía gửi 34 3.2.2 Kỹ thuật bù gói từ phía nhận 36 3 Đánh giá khả chống lại mát gói tin iLBC Codec 41 3.3.1 Phân tích khả chống mát gói tin iLBC Codec 41 3.3.2 Phương pháp đánh giá khả chống mát gói tin iLBC Codec 44 CHƯƠNG – ĐÁNH GIÁ BẰNG THỰC NGHIỆM 47 Quá trình thực 47 Kết trình thực nghiệm 50 KẾT LUẬN 53 TÀI LIỆU THAM KHẢO 54 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Ý NGHĨA STT KÍ HIỆU ACELP AMR-WB AMDF Average Magnitude Difference Function CELP Code Excited Linear Predictive EMBSD FEC IP LAN Local Area Network LPC Linear Predictive Coding 10 LTP Long-Term Predictive 11 LSP Line Spectrum Pair 12 LSF Line Spectral Frequency 13 MOS Mean Opinion Score 14 MMSE 15 MSE Mean Squared Error 16 MNB Measuring Normalizing Blocks 17 PEAQ Perceptual Evaluation of Audio Quality 18 PESQ Perceptual Evaluation of Speech Quality 19 PSQM Perceptual Speech Quality Measure 20 PAMS Perceptual Assesment of Speech Quality 21 RELP Residual-Excited Linear Predictive 22 RTP 23 RMSE 24 SNR Signal-to-Noise Ratio 25 STP Short-Term Predictive 26 TCP Transmission Control Protocol 27 VoIP Voice Over Internet Protocol Algebraic Code Excited Linear Prediction Adaptive Multi-Rate Wideband Enhanced Modified Bark Spectral Distortion Forward Error Correction Internet Protocol Minimum of Mean Squared Error Real-Time Protocol Root Mean Square Energy LỜI MỞ ĐẦU Ngày nay, nhu cầu liên lạc người trở nên phổ biến rộng khắp, yêu cầu loại hình dịch vụ thông tin ngày phong phú Điều đòi hỏi thiết bị dịch vụ xử lý thông tin phải phát triển để đáp ứng nhanh nhạy, xác thông tin Tuy nhiên dịch vụ lại chiếm nhiều băng thông đường truyền chất lượng thông tin không tốt nhiều yếu tố khách quan tác động đến Để sử dụng cách hiệu sở hạ tầng viễn thông, kỹ thuật chuyển mạch gói đời Kỹ thuật chia liệu cần vận chuyển thành gói (hay khung) có kích thước định dạng xác định Mỗi gói vận chuyển riêng rẽ đến nơi nhận đường truyền khác Khi toàn gói liệu đến nơi nhận chúng hợp lại thành liệu ban đầu Tuy nhiên, hiệu kỹ thuật chuyển mạch gói kèm với nhược điểm Trong hệ thống thông tin thoại, yếu tố mát gói tin có ảnh hưởng lớn đến chất lượng dịch vụ Mất gói xảy gói gửi từ nguồn đến đích vượt khoảng thời gian cho phép chờ nhận không đến đích Có nhiều giải thuật với mục đích giải vấn đề gói áp dụng phát để tạo dư thừa cho việc gói, thu để che giấu gói bị Trong hệ thống thông tin giao thức IP, kỹ thuật nhà phát triển, tổ chức, thống đưa xử lý tín hiệu thoại, nhằm khắc phục nhược điểm nêu Các xử lý gọi chung Codec, từ đời có nhiều chuẩn Codec áp dụng rộng rãi Mỗi Codec có đặc điểm riêng, bù đắp cho lại cân yếu tố băng thông yêu cầu chất lượng gói tin sau trình giải mã Để làm rõ khía cạnh vấn đề này, lựa chọn việc tìm hiểu iLBC Codec, đánh giá yếu tố chống mát gói tin so sánh với Codec khác có tính chất tương tự Việc tìm hiểu đặc tính Codec giúp lựa chọn có giải pháp tốt xây dựng hệ thống thông tin thoại Bố cục luận văn chia thành chương, với nội dung cốt lõi tập trung vào vấn đề chính: - Phần 1: Giới thiệu tổng quan hệ thống thông tin thoại vấn đề liên quan đến mã hóa, giải mã tín hiệu hệ thống - Phần 2: Trình bày khái niệm mã hóa giải mã tín hiệu thoại nói chung iLBC Codec nói riêng Các thuật toán xử lý tín hiệu thoại dựa mã hóa dự đoán tuyến tính trình thực việc mã hóa, giải mã tín hiệu iLBC Codec - Phần 3: Đánh giá khả chống lại mát gói tin Codec, cụ thể phân tích đặc trưng iLBC Codec kỹ thuật mã hóa, giải mã nhằm bù gói đường truyền thoại Cuối đánh giá định lượng khả bù gói Codec thực nghiệm, thực phần mềm mô Matlab Simulink CHƯƠNG – TỔNG QUAN VỀ HỆ THỐNG THÔNG TIN THOẠI VÀ CÁC VẤN ĐỀ MÃ HÓA, GIẢI MÃ ÂM THOẠI 1 Âm thoại trình số hóa tín hiệu âm 1.1.1 Âm thoại Âm (Sound) dao động học phần tử, nguyên tử hay hạt vật chất lan truyền không gian, cảm nhận trực tiếp qua tai người va đập vào màng nhĩ kích thích não Sóng âm tần đặc trưng biên độ, tần số (bước sóng) vận tốc lan truyền Đối với tai người, âm cảm nhận sóng có dao động dải tần từ 20Hz đến 20kHz Tín hiệu âm chia thành loại dựa dải tần: - Âm dải tần sở (âm tiếng nói thoại, gọi tắt âm thoại): có dải tần từ 300Hz đến 4kHz - Âm dải rộng (tiếng nói trình diễn, âm nhạc…): có dải tần số từ 100Hz đến 20kHz Audio âm thoại thu nhận được, xử lý tái tạo thiết bị điện tử, đối tượng truyền thông đa phương tiện Trong luận văn đề cập đến âm thoại Âm thoại có số đặc điểm sau: - Giới hạn dải phổ tín hiệu ~ 4kHz - Tần số lấy mẫu fs = 8kHz tương đương với chu kỳ Te = 125µs - Lượng tử hóa giá trị với mã hóa bit - Tốc độ bit tiêu chuẩn: 8bit x 8kHz = 64kbps 1.1.2 Số hóa âm thoại Đầu tiên, tiếng nói microphone biến đổi sang tín hiệu điện dạng tương tự Microphone bao gồm màng mỏng cuộn dây đặt khe từ trường nam châm Để giảm lượng liệu cần thiết tương ứng với sóng âm, tín hiệu cho qua lọc thông dải khoảng tần số từ 300Hz đến 3,4kHz Sau đó, tín hiệu biến đổi sang tín hiệu số chuyển đổi tương tự - số (A/D Converter) dùng kĩ thuật điều chế xung mã PCM với tần số lấy mẫu 8kHz mã hoá mẫu bit Do đó, luồng tín hiệu số sau biến đổi có tốc độ 64kbps [1, tr.2-3] Hình 1.1 – Số hóa mã hóa tín hiệu thoại Việc xử lý âm tương tự âm số ban đầu cho chất lượng âm mức tốt Tuy nhiên để truyền qua hệ thống thông tin thoại đòi hỏi nhiều tỉ lệ băng thông sử dụng chất lượng tín hiệu Codec đời để giải vấn đề Tín hiệu số đầu chuyển đổi A/D có tốc độ 64kbps nén lại mã hoá tiếng nói Mã hoá tiếng nói phương pháp nén tín hiệu thoại dạng số Yêu cầu mã hoá tiếng nói phải đảm bảo thời gian thực chất lượng chấp nhận Ví dụ, thay truyền luồng số từ tiếng nói sử dụng công nghệ truyền thông số quan phát âm thời điểm phát tiếng Như vậy, chuỗi bit truyền ngắn nên tốc độ giảm xuống Tín hiệu số đầu chuyển đổi A/D có tốc độ 64kbps chia thành đoạn có chiều dài 20ms, đoạn chứa 1280 bit (tương ứng 160 mẫu) Để truyền chuỗi bit này, người ta thay thông số lọc có chiều dài 260 bit Như vậy, 260 bit 20ms tương ứng với tốc độ truyền thật 13kbps Tốc độ truyền đảm bảo chất lượng tín hiệu thu mức chấp nhận băng thông yêu cầu cho đường truyền giảm nhiều Tổng quan hệ thống thông tin thoại 1.2.1 Giới thiệu hệ thống thông tin thoại Hệ thống thông tin thoại tập hợp tất thành phần tham gia hình thành nên mô hình truyền – nhận tín hiệu âm thoại Có nhiều hệ thống hệ thống vệ tinh, hệ thống mạng cục LAN (Local Area Network), Internet,… Đặc điểm chung hệ thống tiếp nhận, xử lý tín hiệu thông tin thoại sau truyền tải từ bên gửi đến bên nhận để truyền đạt thông tin Trong hệ thống có hệ thống phổ biến với người nay, hệ thống truyền thông tin thoại qua kênh truyền sử dụng giao thức TCP/IP, hay gọi VoIP (Voice over Internet Protocol) Trong khuôn khổ luận văn đề cập đến việc mã hóa, giải mã xử lý tiếng nói mô hình VoIP, hay truyền giọng nói giao thức IP, công nghệ truyền tiếng nói người (âm thoại) qua mạng thông tin sử dụng giao thức TCP/IP Nó sử dụng gói liệu IP (trên mạng LAN, WAN, Internet) với thông tin truyền tải gói tin âm mã hoá Công nghệ chất dựa chuyển mạch gói, nhằm thay công nghệ truyền thoại cũ dùng chuyển mạch kênh Nó nén (ghép) nhiều kênh thoại đường truyền tín hiệu, tín hiệu truyền qua mạng Internet, làm giảm giá thành so với chuyển mạch kênh Để thực việc này, điện thoại IP, thường tích hợp sẵn giao thức báo hiệu chuẩn giao thức SIP hay H.323, kết nối tới tổng đài IP (IP PBX) doanh nghiệp hay nhà cung cấp dịch vụ Điện thoại IP điện thoại thông thường (chỉ khác thay nối với mạng điện thoại qua đường dây giao tiếp RJ11 điện thoại IP nối trực tiếp vào mạng LAN qua cáp Ethernet, giao tiếp RJ45) phần mềm thoại (soft-phone) cài thiết bị đầu cuối (máy tính, điện thoại,…) 41 𝑁 𝑥̂𝑏,𝑛 = −1 ∗ ∑ 𝑏𝑖 𝑥𝑛−𝑖+𝑁+1 𝑖=1 Với xb,n mẫu dự đoán sau thuộc frame bị mất, xn-1+N+1 mẫu tiếng nói thuộc frame nhận sau đó; bị hệ số LPC tính từ M mẫu thuộc frame nhận sau frame bị Hệ số LPC tính công thức LevinsonDurbin Vì thực dự đoán sau nên cần nhận frame phía sau frame bị mất, vậy, thời gian trễ xử lý tăng lên Quá trình dự đoán mẫu lặp lại cho toàn frame bị với trật tự thời gian ngược Độ lợi thích ứng Gb áp dụng theo cách tương tự Gb bắt đẩu cuối frame bị 1.8 đầu frame bị Độ lợi nhân vào mẫu tiếng nói dự đoán Có hai ước đoán cho frame bị mất, xf,n+i xb,n+i Dự đoán trước xf,n+i dự đoán phần đầu frame bị tốt hơn; xb,n+i dự đoán tốt phần sau frame bị Do vậy, cần kết hợp hai dự đoán với trọng số tuyến tính để đạt dự đoán mẫu đơn giản: Xn+i = (1-α)xf,n+i + αxb,n+i Với α trọng số tăng tuyến tính, α=0 đầu frame bị cuối frame bị Ở phương pháp dự đoán đệ quy, việc bù gói thực nội suy từ gói trước gói sau gói bị Nội suy gói bị từ gói hai chiều giúp cải thiện tốt chất lượng tiếng nói, nhiên độ trễ xử lý lại tăng lên cần thời gian cho việc đợi thêm gói thoại 3 Đánh giá khả chống lại mát gói tin iLBC Codec Các yếu tố ảnh hưởng tới khả chống lại mát gói tin iLBC Codec bao gồm mã hóa dự đoán tuyến tính theo khung độc lập, sử dụng tính tương quan dài hạn, mã hóa trạng thái khởi đầu (start state) Chi tiết cụ thể ảnh hưởng phân tích theo phần 3.3.1 Phân tích khả chống mát gói tin iLBC Codec a Mã hóa dự đoán tuyến tính dài hạn theo khung độc lập Bản chất Codec mã hóa dự đoán tuyến tính (LPC) mã hóa tín hiệu lỗi (residual signal) dựa block sử dụng bảng mã thích ứng (codebook) [7] Thực tế, trình mã hóa phương pháp CELP sử dụng bảng mã thích ứng với kích thích tín hiệu theo thời gian Cách thức có nhiều vấn đề, sau số vấn đề đó: - Nếu tín hiệu bị bị lỗi trình truyền, bảng mã thích ứng giải mã khác với bảng mã mã hóa - Ở phần đầu đoạn tín hiệu có âm thanh, bảng mã thích ứng không đủ để mô tả xác chu kì (pitch cycle) Điều dẫn đến việc giảm tín hiệu lời thoại tín hiệu giải mã 42 Trong kỹ thuật CELP, việc mong muốn tái tạo vùng âm thoại có chu kì lớn, không mong muốn nhận nhiễu có mâu thuẫn lẫn Thực tế, kết mã hóa CELP tín hiệu bao gồm nhiễu vùng thoại iLBC Codec sử dụng kỹ thuật mã hóa dự đoán tuyến tính LPC, đồng thời cho phép sử dụng codebook (khái niệm có CELP) trước sau mã hóa, đoạn frame thoại, gọi vector trạng thái khởi đầu Trạng thái khởi đầu xác định đoạn mẫu có lượng phần residual cao Đoạn mẫu chứa phần tần số chủ yếu có chứa âm thoại Ta coi tín hiệu trạng thái khởi đầu cho việc mã hóa dự đoán tuyến tính dài hạn Vị trí hình dạng sóng trạng thái mã hóa truyền theo frame [7] Bảng mã thích ứng gắn với trạng thái khởi đầu đoạn giải mã Sau bảng mã sử dụng cho mã hóa dự đoán dài hạn theo thời gian chiều,…, tiếp tục trở sau cho khung tín hiệu lại từ lúc kết thúc trạng thái khởi động cuối frame tín hiệu Trong suốt trình mã hóa này, bảng mã thích ứng điều chỉnh liên tục với tín hiệu giải mã gần Tiếp theo, bảng mã thích ứng gắn với đoạn trạng thái khởi động giải mã đoạn tín hiệu mã hóa Sau đó, bảng mã thích ứng sử dụng cho mã hóa dự đoán dài hạn theo thời gian chiều, ví dụ, ngược trở lại đầu frame tín hiệu, từ điểm bắt đầu trạng thái khởi động tới điểm bắt đầu frame Theo cách này, gói liệu chứa đựng thông tin trạng thái khởi đầu, thông tin lag, gain đủ cho việc mã hóa xác hoàn chỉnh frame [7] Phương thức nhấn mạnh bảng mã thích ứng giải mã độc lập với việc tiếp nhận việc gói tin trước Hơn nữa, tín hiệu khởi đầu xuất frame xung tần quan trọng (significant pitch pulse) nằm bảng mã thích ứng điểm khởi đầu (starting point) đó, pitch cycle frame mã hóa xác Sẽ không xảy việc tái tạo vùng âm thoại có chu kì lớn kéo theo việc mã hóa nhiễu tới bảng mã thích ứng nữa, trạng thái khởi đầu (start state) chứa đầy đủ xung tần (pitch pulse) Có thể nhận thấy giải vấn đề xây dựng bảng mã codebook bảng mã thích ứng sử dụng tất giai đoạn trình mã hóa, sử dụng giai đoạn dùng bảng mã lớn cố định, thường phổ biến phương pháp CELP Khi việc tái tạo tần số cao giải (đối với ứng dụng sử dụng bảng mã thích ứng), áp dụng vấn đề liên quan tới tiếng nói thoại khác Ví dụ, việc mã hóa vùng âm thoại sử dụng việc tái tạo tần số cao linh hoạt mã hóa vùng nhiễu trình mã hóa trạng thái khởi đầu Trong iLBC Codec vấn đề nhiễu giải phương pháp lọc sau (Post Filter) b Chọn mã hóa trạng thái khởi đầu Đối với phương pháp mã hóa tuyến tính dài hạn độc lập frame việc mã hóa trạng thái khởi đầu quan trọng Về bản, cần có chuẩn hóa toàn 43 trạng thái khởi đầu lượng tử vô hướng với nhiễu thu để tạo nhiễu lượng tử [7] Đối với âm thoại, trạng thái khởi đầu chứa đựng tần số pitch pulse quan trọng Pitch pulse mô tả trạng thái khởi đầu sau giải mã Việc lượng tử vô hướng tín hiệu dạng xung dẫn tới đánh đổi không tốt tải (overload) nhiễu hạt cho lượng tử Do đó, cần xử lý trước trạng thái khởi đầu với lọc All-Pass nhằm phân bố đồng lượng tín hiệu mẫu Trong lọc tối ưu cho tín hiệu cho trước, lựa chọn thay vào thiết kế đơn giản để tránh phải truyền thêm thông tin phụ nhằm xác định lọc All-Pass cho giải mã Nhận thấy lọc All-Pass tổng hợp lọc tổng hợp LPC giải mã trước sau theo thời gian Kết ngoại trừ ảnh hưởng lặp lại tổng hợp, residual signal trước xử lý giống hệt với residual signal dự đoán, lọc tổng hợp LPC thực theo hướng ngược trở lại phía trước Do đó, thay cho kết với vùng peak tập trung đầu pitch cycle, phương pháp cho vùng phân bố dự đoán lỗi rộng pitch cycle Sau giải mã trạng thái khởi đầu, lọc All-Pass đảo ngược thực để bù lại ảnh hưởng việc tiền xử lý c Mã hóa Codec hoạt động theo frame với 160/240 mẫu/frame, có hai phân tích LPC thực hiện: sử dụng cửa sổ từ vị trí lựa chọn kéo dài tới đầu frame, cửa sổ lại kéo dài tới cuối frame Hai lọc LPC mã hóa sử dụng đường dải tần (Line Spectral Frequencies - LSF) Sau lọc phân tích với lọc phân tích LPC nội suy chuẩn, frame lỗi (residual frame) chia thành sub-frame, frame có gồm 40 mẫu Hai sub-frame kề có phần lượng cao chọn Sau đó, 57 mẫu đầu cuối hai sub-frame kề chọn làm trạng thái khởi đầu mã hóa Việc lựa chọn đoạn 57/58 mẫu đầu cuối lặp lại nhằm tối đa hóa lượng tín hiệu Trạng thái khởi đầu mã hóa sử dụng bit cho độ lớn 3/4 bit cho vị trí lựa chọn [6] 44 Dựa trạng thái khởi đầu giải mã, bảng mã thích ứng khởi tạo để mã hóa tiếp 23/24 mẫu hai sub-frame có lượng cao Đối với sub-frame lại phía trước (theo trục thời gian), tất 80 mẫu kích thích LPC giải mã vừa sử dụng để khởi tạo tiếp Tương tự vậy, tất mẫu giải mã trước đó, 127 mẫu, sử dụng để tạo bảng mã thích ứng cho mẫu phía sau (theo trục thời gian) Trong ba tình huống, bảng mã thích ứng chứa đựng đoạn kích thích LPC giải mã dịch chuyển theo thời gian mẫu Thêm vào đó, bảng mã thích ứng nội suy với vector, vector có cách kết hợp tuyến tính vector kích thích LPC dịch chuyển theo thời gian Các hệ số kết hợp tuyến tính thay đổi theo thời gian huấn luyện nhằm tối thiểu hóa lỗi sai số trung bình bình phương sử dụng bảng mã thích ứng Bảng mã thích ứng chấp nhận với cấu hình gồm nhiều giai đoạn gain-shape: việc mô tả sub-frame lọc giai đoạn d Giải mã Đầu tiên, giải mã giải mã trạng thái khởi đầu, tiếp sub-frame trước (theo thời gian) cuối sub-frame sau (theo thời gian) Trước lọc tổng hợp, mã hóa thực lọc sau tần số (pitch postfiltering) vùng residual signal Khi gói tin không nhận thời điểm định, trình che giấu gói tin (Packet Loss Concealment) thực Việc chống mát thực miền kích thích LPC 3.3.2 Phương pháp đánh giá khả chống mát gói tin iLBC Codec a Phương pháp đánh giá Như nói chương 1, chất lượng tín hiệu âm hệ thống truyền tin thoại bao gồm nhiều yếu tố cấu thành độ trễ, độ gói tin, jitter,… Để đánh giá yếu tố người ta sử dụng số MOS Mặc dù gói đóng vai trò quan trọng chất lượng tín hiệu thu được, để đánh giá gói tin phương pháp MOS không hoàn toàn xác Để thực việc này, luận văn sử dụng phương pháp tính sai số trung bình bình phương MSE (Mean Squared Error) [15, tr.20] MSE khái niệm thống kê học, nghĩa sai số trung bình bình phương, phép ước lượng trung bình bình phương sai số, tức khác biệt ước lượng đánh giá MSE hàm rủi ro, tương ứng với giá trị kỳ vọng mát sai số bình phương mát bậc hai Sự khác biệt xảy ngẫu nhiên, ước lượng không tính đến thông tin cho ước tính xác MSE moment bậc hai sai số, kết hợp hai phương sai ước lượng thiên vị Đối với ước lượng thiên vị, MSE phương sai ước lượng Cũng giống phương sai, MSE có đơn vị đo lường theo bình phương số lượng ước tính Trong trường hợp tương tự với độ lệch chuẩn, lấy bậc hai MSE cho sai số root-mean-square (RMSE), độ 45 lệch root-mean-square (RMSD), có đơn vị tương tự đại lượng ước tính Đối với đại lượng thiên vị, RMSE bậc hai phương sai, gọi độ lệch chuẩn 𝑛 ̂𝑖 − 𝑌𝑖 )2 Đây định ∑𝑖=1 bình phương sai số (𝑌 MSE trung bình 𝑛 lượng dễ dàng tính cho mẫu cụ thể Như vậy, với định nghĩa đơn giản MSE, nói đơn giản việc đánh giá khả chống mát gói tin iLBC Codec phương pháp MSE dựa vào so sánh file ban đầu file sau truyền qua hệ thống truyền tin thoại Dễ dàng nhận thấy đường truyền xảy lỗi, gói tin bị mát không đến bên nhận, tín hiệu thoại ban đầu tín hiệu sau giải mã có sai khác mặt thuộc tính Công việc đánh giá phương pháp MSE so sánh thuộc tính tín hiệu trước sau để đưa nhận định Độ lệch thuộc tính tín hiệu ban đầu tín hiệu sau giải mã với tỉ lệ gói tương ứng nói lên khả bù gói Codec Để có nhìn rõ iLBC Codec vấn đề này, trình đánh giá iLBC Codec thực với G.711 Codec Sơ đồ thực việc đánh sau [10, tr.48]: Hình 3.10 – Sơ đồ đánh giá khả chống gói Codec theo phương pháp MSE b Các bước mô đánh giá Bước 1: Xây dựng thuật toán Bước 2: Mô sở liệu bị gói Bước 3: Thực phương pháp bù gói phía giải mã Bước 4: Thực so sánh mẫu tín hiệu thu tín hiệu ban đầu Bước 5: Nhận xét & đánh giá 46 c Sơ đồ thực mô Bắt đầu Giả lập gói theo tỉ lệ 5%, 10%, 15%, 20%, 50%, 80% Thực bù gói phía giải mã So sánh mẫu tín hiệu thu tín hiệu ban đầu Kết thúc Hình 3.11 – Mô trình chống gói tin d Nhận xét Việc đánh giá định lượng khả mát gói tin với phương pháp đánh giá cảm quan không cho kết lượng hóa xác Do trình thực nghiệm dựa phương pháp đánh giá định lượng cách phân tích mẫu, đồng thời giúp kiểm tra lại phương pháp đánh giá cảm quan Quá trình thực nghiệm thực iLBC Codec G.711 Codec Mặc dù G.711 Codec hoạt động với tốc độ bit 64kbps, lớn nhiều so với iLBC Codec, giải thuật mã hóa, giải mã G.711 tích hợp sẵn tính che giấu mát gói tin (Packet Loss Concealment) Từ đó, trình đánh giá khả chống gói iLBC Codec khách quan [17, tr.1] 47 CHƯƠNG – ĐÁNH GIÁ BẰNG THỰC NGHIỆM Quá trình đánh giá thực nghiệm sử dụng công cụ sau: - Ứng dụng Simulink để mô trình mã hóa, ngẫu nhiên gói tin giải mã gói tin sau thu nhận hai Codec G.711 iLBC - Phần mềm Matlab để tính toán, thống kê giá trị MSE tín hiệu sau bù gói so với tín hiệu ban đầu Sơ đồ thực nghiệm sau: Mất frame ngãu nhiên Encoder Tín hiệu PCM Tín hiệu Bit stream Decoder Tín hiệu Bit stream (đã gói) Tín hiệu thoại Hình 4.1 - Sơ đồ khối thực nghiệm việc gói tin Quá trình thực nghiệm làm theo bước sau: - Sử dụng ứng dụng Simulink mô hệ thống mã hóa giải mã file âm sau làm gói tin cách ngẫu nhiên Một điểm cần lưu ý iLBC Codec lựa chọn tốc độ mã hóa giải mã kiểu frame có chiều dài 30ms, với tốc độ bit tương ứng 13,33kbps kiểu frame 20ms, với tốc độ bit tương ứng 15,2kbps - Các giá trị gói tin bị tính theo phần trăm số mẫu gói tin ban đầu, 5%, 10%, 15%, 20%, 50%, 80% - Sau bước trên, tất giá trị đo đạc từ số lượng gói tin bị ảnh hưởng tới số mẫu/frame âm ban đầu âm sau khôi phục tính toán giá trị sai số, dựa theo công thức sai số trung bình bình phương MSE (Mean Squared Error) - Đánh giá vẽ biểu đồ so sánh dựa giá trị MSE thu Quá trình thực Thực nghiệm thực file âm thoại ban đầu file PCM, có định dạng wav, mã hóa 16 bit với tần số lấy mẫu 8kHz, tên Speech.wav File thực nghiệm mã hóa dạng frame 30ms iLBC Codec (Do iLBC hỗ trợ hai loại kích cỡ frame 30ms 20ms) Sơ đồ mô mã hóa giả lập gói thực Simulink sơ đồ sau: 48 Hình 4.2 – Sơ đồ mô mã hóa giả lập gói tin cho hai Codec File âm ban đầu đưa đồng thời qua mã hóa tương ứng với G.711 Codec iLBC Codec Đầu mã hóa chuỗi bit stream, đưa qua module giả lập gói (Loss Channel) với tỉ lệ gói tùy chỉnh Ứng với tỉ lệ gói tin, giải mã Codec cho file âm bù gói tương ứng Thực nhập tỉ lệ phần trăm gói vào cửa sổ Lossy Channel để thu file âm giải mã tương ứng Mỗi file thu đặt tên theo nguyên tắc chung Ví dụ, ứng với tỉ lệ gói 20% file giải mã iLBC Codec thu ilbc20_1.wav, G.711 Codec pcm20_1.wav Phần “_1” tên file giải mã thứ tự thực nghiệm giải mã (lần “_1”, lần hai “_2”) So sánh tín hiệu file lúc trước sau mô gói tin 20% hai Codec, biểu diễn miền thời gian: 49 Hình 4.3 – Dạng sóng file miền thời gian trước sau bù gói tỉ lệ 20% Nhận thấy miền thời gian, mẫu tham gia đánh giá để tính toán độ mát gói tin gói tin bị đường truyền không xác Do thực nghiệm làm miền tần số tín hiệu thu Quá trình so sánh file sau giải mã với file ban đầu miền tần số, từ tính giá trị MSE mẫu So sánh tín hiệu file lúc trước sau mô gói tin 20% hai Codec miền tần số, sử dụng công thức biến đổi Fourier nhanh Câu lệnh để biến đổi Fourier nhanh cho file âm ban đầu Matlab sau: origin = audioread('speech.wav'); origin = abs(fft(origin)); Làm tương tự file âm giải mã, ta thu tập hợp biến đổi Fourier tín hiệu Ví dụ tỉ lệ gói 20%, miền tần số mẫu biểu diễn sau: Hình 4.4 – Biến đổi FFT file trước sau bù gói tỉ lệ 20% Để đánh giá chủ quan file âm này, thực việc nghe trực tiếp file đưa đánh giá chủ quan chất lượng âm Nhận thấy có khác biệt chất lượng file không nhiều, file sau khôi phục gói có chất lượng chút, số vị trí bị rè nhảy từ không rõ Nhìn hình 4.3 ta thấy khác phần tín hiệu lỗi hai Codec tín hiệu ban đầu Tuy nhiên ước lượng cảm quan Đánh giá khách quan cách sử dụng phương pháp tính sai số trung bình bình phương (MSE) file so với file ban đầu, theo giá trị tần số Sử dụng phần mềm Matlab để phân tích mẫu hai file đầu vào theo giá trị tần số tính giá trị MSE chúng: 50 Hình 4.5 – Tính giá trị MSE file âm Sau chạy đoạn Script để tính MSE, kết thu sau: Làm tương tự G.711 Codec, kết thu giá trị MSE Codec so với tín hiệu ban đầu theo tỉ lệ gói tin Các kết lưu trữ lại phục vụ cho việc phân tích thống kê để đưa kết cuối Kết trình thực nghiệm Như vậy, iLBC Codec, ứng với tỉ lệ gói tin bị (5%, 10%, 15%, 20%, 50%, 80%), ta thu giá trị MSE tương ứng Chú ý giá trị MSE nhỏ sai số mẫu thấp, file âm khôi phục giống với file ban đầu trước bị gói Làm tương tự G.711 Codec, ứng với giá trị gói ta thu giá trị MSE Codec Sau lần thực thực nghiệm, giá trị MSE thực nghiệm thu bảng (Cột trung bình giá trị trung bình sau lần đo): 51 LẦN LẦN LẦN TRUNG BÌNH PLR G711 iLBC G711 iLBC G711 iLBC G.711 iLBC 5% 33.178 3.59 34.0962 3.963 33.4435 4.782 33.5726 4.1117 10% 34.4731 10.3979 35.4731 8.6858 32.6413 6.5793 34.1958 8.5543 15% 37.0358 8.2565 39.9381 9.0378 36.1626 9.2011 37.7122 8.8318 20% 42.8885 17.8741 41.2652 10.1482 42.4233 19.5354 42.1923 15.8526 50% 57.6702 39.0521 54.3549 23.03 58.7473 32.9715 56.9241 31.6845 80% 71.1384 48.4524 72.9959 47.7667 73.5138 51.2692 72.5494 49.1628 Kết cuối thu được mô tả đồ thị Các thành phần phần trăm gói biểu diễn trục hoành, trục tung giá trị MSE tương ứng Các giá trị gói 5%, 10%, 15%, 20%, 50% 80% SO SÁNH KHẢ NĂNG CHỐNG MẤT GÓI CỦA G.711 CODEC VÀ ILBC CODEC G711 iLBC 100 90 80 MSE (%) 70 60 50 40 30 20 10 5% 10% 15% 20% 50% 80% PACKET LOSS RATE (%) Hình 4.6 – Kết thực nghiệm khả chống gói G.711 Codec iLBC Codec sau lần thực nghiệm Nhìn vào đồ thị ta có số kết luận sau: - Trong điều kiện mát gói tin nhiều (từ 5% đến 80%, tính từ trái qua phải), đồ thị có xu hướng lên trên, hay giá trị sai số trung bình bình phương MSE Codec tăng lên, tức khả khôi phục frame bị Codec giảm dần theo phần trăm gói - Trong điều kiện gói 15%, giá trị MSE Codec chênh lệch không nhiều (đồ thị không lên nhanh), điều có nghĩa lượng gói tin Codec bị 15%, khả khôi phục Codec 52 hoạt động tốt, gói tin phục hồi gần giống với gói tin ban đầu Khi tỉ lệ gói 15%, đồ thị có xu hướng lên nhanh - Xét tổng thể giá trị MSE iLBC Codec thấp G.711 Codec, dù điều kiện gói Ví dụ, lần thực nghiệm thứ nhất: + Tỉ lệ gói 5%: MSEG.711(33.178) > MSEiLBC(3.59) + Tỉ lệ gói 10%: MSEG.711(34.4731) > MSEiLBC(10.3979) Do nói ưu điểm tốc độ bit sử dụng thấp hơn, khả bù gói iLBC Codec tốt G.711 Codec 53 KẾT LUẬN Việc tiết kiệm băng thông đường truyền nâng cao chất lượng hệ thống thoại điều quan trọng mà nhà sản xuất thiết bị, nhà cung cấp dịch vụ cần phải quan tâm Tuy nhiên, truyền thoại mạng chuyển mạch gói, thoại dịch vụ thời gian thực nên yêu cầu thời gian trễ tỷ lệ gói thấp Mất gói lớn xảy làm chất lượng hội thoại đi, gây khó chịu cho người sử dụng Vì vậy, việc nghiên cứu áp dụng biện pháp để chống mát gói tin, nâng cao chất lượng hệ thống thông tin thoại mạng IP điều cần thiết Qua trình tìm hiểu, luận văn thực số công việc sau: - Trình bày lý thuyết hệ thống thông tin thoại, yếu tố ảnh hưởng đến chất lượng truyền dẫn thoại, phương pháp đánh giá chất lượng tiếng nói chủ quan khách quan - Trình bày hai kỹ thuật mã hóa tiếng nói dựa dự đoán tuyến tính thường dùng mạng IP: LPC CELP - Tìm hiểu thuật toán mã hóa, giải mã phân tích khả chống gói iLBC Codec - Đánh giá định lượng khả chống gói iLBC Codec so với G.711 Codec, ngôn ngữ Matlab ứng dụng mô Simulink; thực đánh giá định lượng phương pháp đánh giá khách quan kiểm nghiệm lại phương pháp đánh giá chủ quan Tuy nhiên, việc thực bù gói đánh giá khả chống mát gói tin ngẫu nhiên gói (packet loss rate) Do vậy, hướng phát triển đề tài tương lai là: - Thực phương pháp đánh giá chống mát gói tin theo vị trí gói (packet loss location), kích cỡ gói (packet loss size) mẫu gói tin bị (packet loss pattern) [13, tr.1] - Thực phương pháp đánh giá gói tin theo chùm (bursty loss) 54 TÀI LIỆU THAM KHẢO TÀI LIỆU TIẾNG VIỆT: Nguyễn Đại Hòa (2013), Nghiên cứu kỹ thuật mã hóa tiếng nói di động, Đồ án tốt nghiệp Đại học, Học viện Công nghệ Bưu Viễn thông, Khoa Viễn thông 2 Trương Lê Phương Anh (2011), Nâng cao chất lượng thoại mạng IP kỹ thuật bù gói, Luận văn Thạc sĩ kỹ thuật, ĐH Đà Nẵng Các biện pháp đảm bảo chất lượng dịch vụ, Đại học Sư phạm Kỹ thuật Hưng Yên, Khoa Công nghệ thông tin Nguyễn Thị Ngọc Diệp, Thuật toán xử lý tiếng nói Speech Enhancement đánh giá tính hiệu thuật toán, ĐH Bách khoa Đà Nẵng, Khoa Điện tử viễn thông TÀI LIỆU TIẾNG ANH: S Andersen - Aalborg University; A Duric, Telio, H Astrom, R Hagen, W Kleijn, J Linden (December 2004), Internet Low Bit Rate Codec (iLBC), Request for Comments: 3951, Global IP Sound A Duric, Telio, S Andersen - Aalborg University (December 2004), Real-time Transport Protocol (RTP) Payload Format for internet Low Bit Rate Codec (iLBC) Speech, Request for Comments: 3952 S V Andersen, W B Kleijn, R Hagen, J Linden, M N Murthi, J Skoglund, iLBC - A linear predictive coder with robustness to packet losses, Department of Communication Technology - Aalborg University, Denmark; Global IP Sound Stockholm, Sweden and San Francisco, USA Wai C Chu, Speech Coding Algorithms – Foundation and Evolution of Standardized Coders, Mobile Media Laboratory, DoCoMo USA Labs, San Joe, California A M Kondoz, Digital Speech - Coding for Low Bit Rate Communication Systems, University of Surrey, UK 10 Lingfen Sun (January 2004), Speech quality prediction for voice over internet protocol networks, Doctor of Philosophy, School of Computing, Communications and Electronics Falcuty of Technoloty 11 Lijing Ding and Rafik A Goubran (2003), Assessment of Effects of Packet Loss on Speech Quality in VoIP, Department of Systems and Computer Engineering, Carleton University 12 Wenyu Jiang, Henning Schulzrinne (June 2002), Comparisons of FEC and Codec Robustness on VoIP quality and bandwidth efficiency, Columbia University, Department of Computer Science 55 13 Lingfen Sun; Emmanuel Ifeachor (2012), Impact of Packet Loss Location on Perceived Speech Quality, University of Plymouth 14 Alexander F Ribadeneira (2007), An analysis of the MOS under conditions of Delay, Jitter and Packet Loss and an Analysis of the Impact of Introducing Piggybacking and Reed Solomon FEC for VoIP, Master of Science, College of Arts and Sciences, Georgia State University 15 Muhammad Azam (October 2011), Methods for Recovery of Missing Speech Packets, Master of Science, Blekinge Institute of Technology 16 Nam In Park, Hong Kook Kim, Min A Jung, Seong Ro Lee, Seung Ho Choi (2011), Burst Packet Loss Concealment Using Multiple Codebooks and Comfort Noise for CELP-Type Speech Coders in Wireless Sensor Networks, Paper, Gwangju Institude of Science and Technology (GIST), Mokpo National University, Seoul National University of Science and Technology 17 Artur Janicki, Bartlomiej Ksiezak, Packet Loss Concealment Algorithm for VoIP Transmission in Unreliable Networks, Institute of Telecommunications, Warsaw University of Technology 18 Mohamed CHIBANI (2007), Increasing the Robustness of CELP Speech Codecs against Packet Losses, Université de Sherbrooke, Québec, Canada