Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 77 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
77
Dung lượng
2,99 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ DƯƠNG THANH TÙNG ĐÁNHGIÁĐỊNHLƯỢNGKHẢNĂNGCHỐNGLẠIMẤTMÁT GĨI TINCỦATHUẬT TỐN MÃ HĨA ILBCTRONGCÁCHỆTHỐNGTHƠNGTINTHOẠI LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNGTIN Hà Nội - 2016 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ DƯƠNG THANH TÙNG ĐÁNHGIÁĐỊNHLƯỢNGKHẢNĂNGCHỐNGLẠIMẤTMÁTGÓITINCỦATHUẬT TỐN MÃ HĨA ILBCTRONGCÁCHỆTHỐNGTHƠNGTINTHOẠI Ngành: Công nghệ Thôngtin Chuyên ngành: Truyền liệu Mạng máy tính Mã số: LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNGTIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TS HOÀNG XUÂN TÙNG Hà Nội - 2016 LỜI CAM ĐOAN Tôi xin cam đoan nội dung luận văn “Đánh giáđịnhlượngkhảchốnglạimátgóitinthuật tốn mãhóaiLBChệthốngthôngtin thoại” sản phẩm thực hướng dẫn Tiến sĩ Hoàng Xuân Tùng Trongtoàn nội dung luận văn, điều trình bày tơi nghiên cứu từ tài liệu tham khảo Tất tài liệu tham khảo có xuất xứ rõ ràng trích dẫn hợp pháp Tơi xin chịu trách nhiệm cho lời cam đoan Hà Nội, ngày tháng năm 2016 Người cam đoan Dương Thanh Tùng LỜI CẢM ƠN Tơi xin bày tỏ lòng biết ơn sâu sắc đến thầy hướng dẫn tôi, Tiến sĩ Hồng Xn Tùng Thầy giúp tơi có hội để theo đuổi nghiên cứu lĩnh vực u thích Trong suốt q trình thực luận văn, thầy tận tình hướng dẫn cho tơi, góp ý cho đường lối, đồng thời đưa lời khun bổ ích để tơi hồn thành luận văn Tiếp đến, tơi xin chân thành cảm ơn thầy cô giáo Khoa Công nghệ Thông tin, Đại học Công nghệ - Đại học Quốc gia Hà Nội truyền đạt cho kiến thức kinh nghiệm vơ q báu q trình học tập nghiên cứu Tơi muốn cảm ơn bạn lớp đồng nghiệp cho lời động viên, hỗ trợ góp ý mặt chun mơn Cuối cùng, tơi xin cảm ơn gia đình, bạn bè, người bên cạnh ủng hộ động viên MỤC LỤC LỜI CAM ĐOAN DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT LỜI MỞ ĐẦU CHƯƠNG – TỔNG QUAN VỀ HỆTHỐNGTHƠNGTINTHOẠI VÀ CÁC VẤN ĐỀ MÃ HĨA, GIẢI MÃ ÂM THOẠI 1 Âm thoại trình số hóatín hiệu âm 1.1.1 Âm thoại 1.1.2 Số hóa âm thoại 2 Tổng quan hệthốngthôngtinthoại 1.2.1 Giới thiệu hệthốngthôngtinthoại 1.2.2 Các yếu tố ảnh hưởng đến chất lượnghệthốngthôngtinthoạiMãhóa – giải mãtín hiệu âm hệthốngthôngtinthoại 1.3.1 Chức mãhóa – giải mãhệthốngthoại 1.3.2 Các phương pháp mãhóatín hiệu thoại 1.3.2.1 Phương pháp mãhóatín hiệu dạng sóng (Waveform coding) 1.3.2.2 Phương pháp mãhóa tếng nói Vocoder 1.3.2.3 Phương pháp mãhóalai (Hybrid coding) Đánhgiá chất lượng âm thoại 10 1.4.1 Các yêu cầu mãhóa âm thoại 10 1.4.2 Các tham số liên quan đến chất lượngthoại 11 1.4.3 Các phương pháp đánhgiá chất lượngthoại phổ biến 11 CHƯƠNG – ILBC CODEC .16 Giới thiệu iLBC Codec kỹ thuật xử lý tiếng nói dựa mãhóa dự đốn tuyến tính 16 2.1.1 Giới thiệu iLBC Codec 16 2.1.2 Kỹ thuật xử lý tiếng nói dựa mãhóa dự đốn tuyến tính 18 2 Q trình mãhóaiLBC Codec (Encoder) 25 2.2.1 Tổng quan trình mãhóaiLBC Codec 25 2.2.2 Các nguyên tắc mãhóa 27 Quá trình giải mãiLBC Codec (Decoder) 29 2.3.1 Tổng quan trình giải mãiLBC Codec 29 2.3.2 Các nguyên tắc giải mã 31 CHƯƠNG – ĐÁNHGIÁKHẢNĂNGCHỐNGLẠIMẤTMÁTGÓITIN TRÊN ĐƯỜNG TRUYỀN THOẠI 33 3 Khái niệm chốngmátgóitin đường truyền thoại 33 Phân loại kỹ thuậtchốngmátgóitin 33 3.2.1 Kỹ thuậtchốnggói từ phía gửi 34 3.2.2 Kỹ thuật bù gói từ phía nhận 36 3 ĐánhgiákhảchốnglạimátgóitiniLBC Codec 41 3.3.1 Phân tích khảchốngmátgóitiniLBC Codec 41 3.3.2 Phương pháp đánhgiákhảchốngmátgóitiniLBC Codec 44 CHƯƠNG – ĐÁNHGIÁ BẰNG THỰC NGHIỆM 47 Quá trình thực 47 Kết trình thực nghiệm 50 KẾT LUẬN 53 TÀI LIỆU THAM KHẢO .54 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT STT KÍ HIỆU Ý NGHĨA ACELP AMR-WB AMDF CELP EMBSD FEC IP LAN Local Area Network LPC Linear Predictive Coding 10 LTP Long-Term Predictive 11 LSP Line Spectrum Pair 12 LSF Line Spectral Frequency 13 MOS 14 MMSE 15 MSE Mean Squared Error 16 MNB Measuring Normalizing Blocks 17 PEAQ Perceptual Evaluation of Audio Quality 18 PESQ Perceptual Evaluation of Speech Quality 19 PSQM Perceptual Speech Quality Measure 20 PAMS Perceptual Assesment of Speech Quality 21 RELP Residual-Excited Linear Predictive 22 RTP Real-Time Protocol 23 RMSE 24 SNR Signal-to-Noise Ratio 25 STP Short-Term Predictive 26 TCP Transmission Control Protocol 27 VoIP Voice Over Internet Protocol Algebraic Code Excited Linear Prediction Adaptive Multi-Rate Wideband Average Magnitude Difference Function Code Excited Linear Predictive Enhanced Modified Bark Spectral Distortion Forward Error Correction Internet Protocol Mean Opinion Score Minimum of Mean Squared Error Root Mean Square Energy LỜI MỞ ĐẦU Ngày nay, nhu cầu liên lạc người trở nên phổ biến rộng khắp, yêu cầu loại hình dịch vụ thơngtin ngày phong phú Điều đòi hỏi thiết bị dịch vụ xử lý thôngtin phải phát triển để đáp ứng nhanh nhạy, xác thơngtin Tuy nhiên dịch vụ lại chiếm nhiều băng thông đường truyền chất lượngthôngtin không tốt nhiều yếu tố khách quan tác động đến Để sử dụng cách hiệu sở hạ tầng viễn thông, kỹ thuật chuyển mạch gói đời Kỹ thuật chia liệu cần vận chuyển thành gói (hay khung) có kích thước định dạng xác định Mỗi gói vận chuyển riêng rẽ đến nơi nhận đường truyền khác Khi tồn gói liệu đến nơi nhận chúng hợp lại thành liệu ban đầu Tuy nhiên, hiệu kỹ thuật chuyển mạch gói kèm với nhược điểm Tronghệthốngthôngtin thoại, yếu tố mátgóitin có ảnh hưởng lớn đến chất lượng dịch vụ Mấtgói xảy gói gửi từ nguồn đến đích vượt khoảng thời gian cho phép chờ nhận khơng đến đích Có nhiều giải thuật với mục đích giải vấn đề gói áp dụng phát để tạo dư thừa cho việc gói, thu để che giấu gói bị Tronghệthốngthôngtin giao thức IP, kỹ thuật nhà phát triển, tổ chức, thống đưa xử lý tín hiệu thoại, nhằm khắc phục nhược điểm nêu Các xử lý gọi chung Codec, từ đời có nhiều chuẩn Codec áp dụng rộng rãi Mỗi Codec có đặc điểm riêng, bù đắp cho lại cân yếu tố băng thơng u cầu chất lượnggóitin sau trình giải mã Để làm rõ khía cạnh vấn đề này, tơi lựa chọn việc tìm hiểu iLBC Codec, đánhgiá yếu tố chốngmátgóitin so sánh với Codec khác có tính chất tương tự Việc tìm hiểu đặc tính Codec giúp lựa chọn có giải pháp tốt xây dựng hệthốngthôngtinthoại Bố cục luận văn chia thành chương, với nội dung cốt lõi tập trung vào vấn đề chính: - Phần 1: Giới thiệu tổng quan hệthốngthôngtinthoại vấn đề liên quan đến mã hóa, giải mãtín hiệu hệthống - Phần 2: Trình bày khái niệm mãhóa giải mãtín hiệu thoại nói chung iLBC Codec nói riêng Cácthuật tốn xử lý tín hiệu thoại dựa mãhóa dự đốn tuyến tính q trình thực việc mã hóa, giải mãtín hiệu iLBC Codec - Phần 3: Đánhgiákhảchốnglạimátgóitin Codec, cụ thể phân tích đặc trưng iLBC Codec kỹ thuậtmã hóa, giải mã nhằm bù gói đường truyền thoại Cuối đánhgiáđịnhlượngkhả bù gói Codec thực nghiệm, thực phần mềm mô Matlab Simulink CHƯƠNG – TỔNG QUAN VỀ HỆTHỐNGTHÔNGTINTHOẠI VÀ CÁC VẤN ĐỀ MÃ HÓA, GIẢI MÃ ÂM THOẠI 1 Âm thoại q trình số hóatín hiệu âm 1.1.1 Âm thoại Âm (Sound) dao động học phần tử, nguyên tử hay hạt vật chất lan truyền không gian, cảm nhận trực tiếp qua tai người va đập vào màng nhĩ kích thích não Sóng âm tần đặc trưng biên độ, tần số (bước sóng) vận tốc lan truyền Đối với tai người, âm cảm nhận sóng có dao động dải tần từ 20Hz đến 20kHz Tín hiệu âm chia thành loại dựa dải tần: - Âm dải tần sở (âm tiếng nói thoại, gọi tắt âm thoại): có dải tần từ 300Hz đến 4kHz - Âm dải rộng (tiếng nói trình diễn, âm nhạc…): có dải tần số từ 100Hz đến 20kHz Audio âm thoại thu nhận được, xử lý tái tạo thiết bị điện tử, đối tượng truyền thông đa phương tiện Trong luận văn đề cập đến âm thoại Âm thoại có số đặc điểm sau: - Giới hạn dải phổ tín hiệu ~ 4kHz - Tần số lấy mẫu fs = 8kHz tương đương với chu kỳ Te = 125µs - Lượng tử hóagiá trị với mãhóa bit - Tốc độ bit tiêu chuẩn: 8bit x 8kHz = 64kbps 1.1.2 Số hóa âm thoại Đầu tiên, tiếng nói microphone biến đổi sang tín hiệu điện dạng tương tự Microphone bao gồm màng mỏng cuộn dây đặt khe từ trường nam châm Để giảm lượng liệu cần thiết tương ứng với sóng âm, tín hiệu cho qua lọc thông dải khoảng tần số từ 300Hz đến 3,4kHz Sau đó, tín hiệu biến đổi sang tín hiệu số chuyển đổi tương tự - số (A/D Converter) dùng kĩ thuật điều chế xung mã PCM với tần số lấy mẫu 8kHz mã hố mẫu bit Do đó, luồngtín hiệu số sau biến đổi có tốc độ 64kbps [1, tr.2-3] Hình 1.1 – Số hóamãhóatín hiệu thoại Đối với phương pháp mãhóa tuyến tính dài hạn độc lập frame việc mãhóa trạng thái khởi đầu quan trọng Về bản, cần có chuẩn hóa tồn trạng thái khởi đầu lượng tử vô hướng với nhiễu thu để tạo nhiễu lượng tử [7] Đối với âm thoại, trạng thái khởi đầu chứa đựng tần số pitch pulse quan trọng Pitch pulse mô tả trạng thái khởi đầu sau giải mã Việc lượng tử vơ hướng tín hiệu dạng xung dẫn tới đánh đổi không tốt tải (overload) nhiễu hạt cho lượng tử Do đó, cần xử lý trước trạng thái khởi đầu với lọc All-Pass nhằm phân bố đồng lượngtín hiệu mẫu Trong lọc tối ưu cho tín hiệu cho trước, lựa chọn thay vào thiết kế đơn giản để tránh phải truyền thêm thôngtin phụ nhằm xác định lọc All-Pass cho giải mã Nhận thấy lọc All-Pass tổng hợp lọc tổng hợp LPC giải mã trước sau theo thời gian Kết ngoại trừ ảnh hưởng lặp lại tổng hợp, residual signal trước xử lý giống hệt với residual signal dự đoán, lọc tổng hợp LPC thực theo hướng ngược trở lại phía trước Do đó, thay cho kết với vùng peak tập trung đầu pitch cycle, phương pháp cho vùng phân bố dự đoán lỗi rộng pitch cycle Sau giải mã trạng thái khởi đầu, lọc All-Pass đảo ngược thực để bù lại ảnh hưởng việc tiền xử lý c Mãhóa Codec hoạt động theo frame với 160/240 mẫu/frame, có hai phân tích LPC thực hiện: sử dụng cửa sổ từ vị trí lựa chọn kéo dài tới đầu frame, cửa sổ lại kéo dài tới cuối frame Hai lọc LPC mãhóa sử dụng đường dải tần (Line Spectral Frequencies - LSF) Sau lọc phân tích với lọc phân tích LPC nội suy chuẩn, frame lỗi (residual frame) chia thành sub-frame, frame có gồm 40 mẫu Hai sub-frame kề có phần lượng cao chọn Sau đó, 57 mẫu đầu cuối hai subframe kề chọn làm trạng thái khởi đầu mãhóa Việc lựa chọn đoạn 57/58 mẫu đầu cuối lặp lại nhằm tối đa hóalượngtín hiệu Trạng thái khởi đầu mãhóa sử dụng bit cho độ lớn 3/4 bit cho vị trí lựa chọn [6] Dựa trạng thái khởi đầu giải mã, bảng mã thích ứng khởi tạo để mãhóa tiếp 23/24 mẫu hai sub-frame có lượng cao Đối với subframe lại phía trước (theo trục thời gian), tất 80 mẫu kích thích LPC giải mã vừa sử dụng để khởi tạo tiếp Tương tự vậy, tất mẫu giải mã trước đó, 127 mẫu, sử dụng để tạo bảng mã thích ứng cho mẫu phía sau (theo trục thời gian) Trong ba tình huống, bảng mã thích ứng chứa đựng đoạn kích thích LPC giải mã dịch chuyển theo thời gian mẫu Thêm vào đó, bảng mã thích ứng nội suy với vector, vector có cách kết hợp tuyến tính vector kích thích LPC dịch chuyển theo thời gian Cáchệ số kết hợp tuyến tính thay đổi theo thời gian huấn luyện nhằm tối thiểu hóa lỗi sai số trung bình bình phương sử dụng bảng mã thích ứng Bảng mã thích ứng chấp nhận với cấu hình gồm nhiều giai đoạn gain-shape: việc mô tả sub-frame lọc giai đoạn d Giải mã Đầu tiên, giải mã giải mã trạng thái khởi đầu, tiếp sub-frame trước (theo thời gian) cuối sub-frame sau (theo thời gian) Trước lọc tổng hợp, mãhóa thực lọc sau tần số (pitch postfiltering) vùng residual signal Khi góitin khơng nhận thời điểm định, q trình che giấu góitin (Packet Loss Concealment) thực Việc chốngmát thực miền kích thích LPC 3.3.2 Phương pháp đánhgiákhảchốngmátgóitiniLBC Codec a Phương pháp đánhgiá Như nói chương 1, chất lượngtín hiệu âm hệthống truyền tinthoại bao gồm nhiều yếu tố cấu thành độ trễ, độ gói tin, jitter,… Để đánhgiá yếu tố người ta sử dụng số MOS Mặc dù gói đóng vai trò quan trọng chất lượngtín hiệu thu được, để đánhgiágóitin phương pháp MOS khơng hồn tồn xác Để thực việc này, luận văn sử dụng phương pháp tính sai số trung bình bình phương MSE (Mean Squared Error) [15, tr.20] MSE khái niệm thống kê học, nghĩa sai số trung bình bình phương, phép ước lượng trung bình bình phương sai số, tức khác biệt ước lượngđánhgiá MSE hàm rủi ro, tương ứng với giá trị kỳ vọng mát sai số bình phương mát bậc hai Sự khác biệt xảy ngẫu nhiên, ước lượng khơng tính đến thơngtin cho ước tính xác MSE moment bậc hai sai số, kết hợp hai phương sai ước lượng thiên vị Đối với ước lượng khơng có thiên vị, MSE phương sai ước lượng Cũng giống phương sai, MSE có đơn vị đo lường theo bình phương số lượng ước tính Trong trường hợp tương tự với độ lệch chuẩn, lấy bậc hai MSE cho sai số root-mean-square (RMSE), độ lệch root-mean-square (RMSD), có đơn vị tương tự đại lượng ước tính Đối với đại lượng khơng có thiên vị, RMSE bậc hai phương sai, gọi độ lệch chuẩn � MSE trung bình ∑ bình phương sai số (�̂� − � )�2 Đây định � �=1 lượng dễ dàng tính cho mẫu cụ thể Như vậy, với định nghĩa đơn giản MSE, nói đơn giản việc đánhgiákhảchốngmátgóitiniLBC Codec phương pháp MSE dựa vào so sánh file ban đầu file sau truyền qua hệthống truyền tinthoại Dễ dàng nhận thấy đường truyền xảy lỗi, góitin bị mát khơng đến bên nhận, tín hiệu thoại ban đầu tín hiệu sau giải mã có sai khác mặt thuộc tính Công việc đánhgiá phương pháp MSE so sánh thuộc tính tín hiệu trước sau để đưa nhận định Độ lệch thuộc tính tín hiệu ban đầu tín hiệu sau giải mã với tỉ lệ gói tương ứng nói lên khả bù gói Codec Để có nhìn rõ iLBC Codec vấn đề này, trình đánhgiáiLBC Codec thực với G.711 Codec Sơ đồ thực việc đánh sau [10, tr.48]: Hình 3.10 – Sơ đồ đánhgiákhảchốnggói Codec theo phương pháp MSE b Các bước mô đánhgiá Bước 1: Xây dựng thuật tốn Bước 2: Mơ sở liệu bị gói Bước 3: Thực phương pháp bù gói phía giải mã Bước 4: Thực so sánh mẫu tín hiệu thu tín hiệu ban đầu Bước 5: Nhận xét & đánhgiá c Sơ đồ thực mô Bắt đầu Giả lập gói theo tỉ lệ 5%, 10%, 15%, 20%, 50%, 80% Thực bù gói phía giải mã So sánh mẫu tín hiệu thu tín hiệu ban đầu Kết thúc Hình 3.11 – Mơ q trình chốnggói tn d Nhận xét Việc đánhgiáđịnhlượngkhảmátgóitin với phương pháp đánhgiá cảm quan khơng cho kết lượnghóa xác Do q trình thực nghiệm dựa phương pháp đánhgiáđịnhlượng cách phân tích mẫu, đồng thời giúp kiểm tra lại phương pháp đánhgiá cảm quan Quá trình thực nghiệm thực iLBC Codec G.711 Codec Mặc dù G.711 Codec hoạt động với tốc độ bit 64kbps, lớn nhiều so với iLBC Codec, giải thuậtmã hóa, giải mã G.711 tích hợp sẵn tính che giấu mátgóitin (Packet Loss Concealment) Từ đó, q trình đánhgiákhảchốnggóiiLBC Codec khách quan [17, tr.1] CHƯƠNG – ĐÁNHGIÁ BẰNG THỰC NGHIỆM Quá trình đánhgiá thực nghiệm sử dụng cơng cụ sau: - Ứng dụng Simulink để mô trình mã hóa, ngẫu nhiên góitin giải mãgóitin sau thu nhận hai Codec G.711 iLBC - Phần mềm Matlab để tính tốn, thống kê giá trị MSE tín hiệu sau bù gói so với tín hiệu ban đầu Sơ đồ thực nghiệm sau: Tín hiệu PCM Mất frame ngãu nhiên Encoder Tín hiệu Bit stream Decoder Tín hiệu Bit stream (đã gói) Tín hiệu thoại Hình 4.1 - Sơ đồ khối thực nghiệm việc gói tn Q trình thực nghiệm làm theo bước sau: - Sử dụng ứng dụng Simulink mơ hệthốngmãhóa giải mã file âm sau làm góitin cách ngẫu nhiên Một điểm cần lưu ý iLBC Codec lựa chọn tốc độ mãhóa giải mã kiểu frame có chiều dài 30ms, với tốc độ bit tương ứng 13,33kbps kiểu frame 20ms, với tốc độ bit tương ứng 15,2kbps - Cácgiá trị góitin bị tính theo phần trăm số mẫu góitin ban đầu, 5%, 10%, 15%, 20%, 50%, 80% - Sau bước trên, tất giá trị đo đạc từ số lượnggóitin bị ảnh hưởng tới số mẫu/frame âm ban đầu âm sau khơi phục tính tốn giá trị sai số, dựa theo cơng thức sai số trung bình bình phương MSE (Mean Squared Error) - Đánhgiá vẽ biểu đồ so sánh dựa giá trị MSE thu Quá trình thực Thực nghiệm thực file âm thoại ban đầu file PCM, có định dạng wav, mãhóa 16 bit với tần số lấy mẫu 8kHz, tên Speech.wav File thực nghiệm mãhóa dạng frame 30ms iLBC Codec (Do iLBC hỗ trợ hai loại kích cỡ frame 30ms 20ms) Sơ đồ mơ mãhóagiả lập gói thực Simulink sơ đồ sau: Hình 4.2 – Sơ đồ mơ mãhóagiả lập góitin cho hai Codec File âm ban đầu đưa đồng thời qua mãhóa tương ứng với G.711 Codec iLBC Codec Đầu mãhóa chuỗi bit stream, đưa qua module giả lập gói (Loss Channel) với tỉ lệ gói tùy chỉnh Ứng với tỉ lệ gói tin, giải mã Codec cho file âm bù gói tương ứng Thực nhập tỉ lệ phần trăm gói vào cửa sổ Lossy Channel để thu file âm giải mã tương ứng Mỗi file thu đặt tên theo nguyên tắc chung Ví dụ, ứng với tỉ lệ gói 20% file giải mãiLBC Codec thu ilbc20_1.wav, G.711 Codec pcm20_1.wav Phần “_1” tên file giải mã thứ tự thực nghiệm giải mã (lần “_1”, lần hai “_2”) So sánh tín hiệu file lúc trước sau mơ góitin 20% hai Codec, biểu diễn miền thời gian: Hình 4.3 – Dạng sóng file miền thời gian trước sau bù gói tỉ lệ 20% Nhận thấy miền thời gian, mẫu tham giađánhgiá để tính tốn độ mátgóitingóitin bị đường truyền khơng xác Do thực nghiệm làm miền tần số tín hiệu thu Q trình so sánh file sau giải mã với file ban đầu miền tần số, từ tính giá trị MSE mẫu So sánh tín hiệu file lúc trước sau mô góitin 20% hai Codec miền tần số, sử dụng công thức biến đổi Fourier nhanh Câu lệnh để biến đổi Fourier nhanh cho file âm ban đầu Matlab sau: origin = audioread('speech.wav'); origin = abs(fft(origin)); Làm tương tự file âm giải mã, ta thu tập hợp biến đổi Fourier tín hiệu Ví dụ tỉ lệ gói 20%, miền tần số mẫu biểu diễn sau: Hình 4.4 – Biến đổi FFT file trước sau bù gói tỉ lệ 20% Để đánhgiá chủ quan file âm này, thực việc nghe trực tiếp file đưa đánhgiá chủ quan chất lượng âm Nhận thấy có khác biệt chất lượng file không nhiều, file sau khôi phục gói có chất lượng chút, số vị trí bị rè nhảy từ khơng rõ Nhìn hình 4.3 ta thấy khác phần tín hiệu lỗi hai Codec tín hiệu ban đầu Tuy nhiên ước lượng cảm quan Đánhgiá khách quan cách sử dụng phương pháp tính sai số trung bình bình phương (MSE) file so với file ban đầu, theo giá trị tần số Sử dụng phần mềm Matlab để phân tích mẫu hai file đầu vào theo giá trị tần số tính giá trị MSE chúng: Hình 4.5 – Tính giá trị MSE file âm Sau chạy đoạn Script để tính MSE, kết thu sau: Làm tương tự G.711 Codec, kết thu giá trị MSE Codec so với tín hiệu ban đầu theo tỉ lệ góitinCác kết lưu trữ lại phục vụ cho việc phân tích thống kê để đưa kết cuối Kết trình thực nghiệm Như vậy, iLBC Codec, ứng với tỉ lệ góitin bị (5%, 10%, 15%, 20%, 50%, 80%), ta thu giá trị MSE tương ứng Chú ý giá trị MSE nhỏ sai số mẫu thấp, file âm khôi phục giống với file ban đầu trước bị gói Làm tương tự G.711 Codec, ứng với giá trị gói ta thu giá trị MSE Codec Sau lần thực thực nghiệm, giá trị MSE thực nghiệm thu bảng (Cột trung bình giá trị trung bình sau lần đo): LẦN LẦN LẦN TRUNG BÌNH PLR G711 iLBC G711 iLBC G711 iLBC G.711 iLBC 5% 33.178 3.59 34.0962 3.963 33.4435 4.782 33.5726 4.1117 10% 34.4731 10.3979 35.4731 8.6858 32.6413 6.5793 34.1958 8.5543 15% 37.0358 8.2565 39.9381 9.0378 36.1626 9.2011 37.7122 8.8318 20% 42.8885 17.8741 41.2652 10.1482 42.4233 19.5354 42.1923 15.8526 50% 57.6702 39.0521 54.3549 23.03 58.7473 32.9715 56.9241 31.6845 80% 71.1384 48.4524 72.9959 47.7667 73.5138 51.2692 72.5494 49.1628 Kết cuối thu được mô tả đồ thị Các thành phần phần trăm gói biểu diễn trục hoành, trục tung giá trị MSE tương ứng Cácgiá trị gói 5%, 10%, 15%, 20%, 50% 80% S O S Á N H K H Ả N Ă N G C H Ố N G M Ấ T G Ó I C Ủ A G 11 CODEC VÀ ILBC CODEC G711 iLBC 100 90 80 MSE (%) 70 60 50 40 30 20 10 5% 10% 15% 20% 50% 80% PACKET LOSS RATE (%) Hình 4.6 – Kết thực nghiệm khảchốnggói G.711 Codec iLBC Codec sau lần thực nghiệm Nhìn vào đồ thị ta có số kết luận sau: - Trong điều kiện mátgóitin nhiều (từ 5% đến 80%, tính từ trái qua phải), đồ thị có xu hướng lên trên, hay giá trị sai số trung bình bình phương MSE Codec tăng lên, tức khả khôi phục frame bị Codec giảm dần theo phần trăm gói - Trong điều kiện gói 15%, giá trị MSE Codec chênh lệch không nhiều (đồ thị không lên nhanh), điều có nghĩa lượnggóitin Codec bị 15%, khả khôi phục Codec hoạt động tốt, góitin phục hồi gần giống với góitin ban đầu Khi tỉ lệ gói 15%, đồ thị có xu hướng lên nhanh - Xét tổng thể giá trị MSE iLBC Codec thấp G.711 Codec, dù điều kiện gói Ví dụ, lần thực nghiệm thứ nhất: + Tỉ lệ gói 5%: MSEG.711(33.178) > MSEiLBC(3.59) + Tỉ lệ gói 10%: MSEG.711(34.4731) > MSEiLBC(10.3979) Do nói ngồi ưu điểm tốc độ bit sử dụng thấp hơn, khả bù góiiLBC Codec tốt G.711 Codec KẾT LUẬN Việc tiết kiệm băng thông đường truyền nâng cao chất lượnghệthốngthoại điều quan trọngmà nhà sản xuất thiết bị, nhà cung cấp dịch vụ cần phải quan tâm Tuy nhiên, truyền thoại mạng chuyển mạch gói, thoại dịch vụ thời gian thực nên yêu cầu thời gian trễ tỷ lệ gói thấp Mấtgói lớn xảy làm chất lượng hội thoại đi, gây khó chịu cho người sử dụng Vì vậy, việc nghiên cứu áp dụng biện pháp để chốngmátgói tin, nâng cao chất lượnghệthốngthơngtinthoại mạng IP điều cần thiết Qua trình tìm hiểu, luận văn thực số cơng việc sau: - Trình bày lý thuyết hệthốngthôngtin thoại, yếu tố ảnh hưởng đến chất lượng truyền dẫn thoại, phương pháp đánhgiá chất lượng tiếng nói chủ quan khách quan - Trình bày hai kỹ thuậtmãhóa tiếng nói dựa dự đốn tuyến tính thường dùng mạng IP: LPC CELP - Tìm hiểu thuật tốn mã hóa, giải mã phân tích khảchốnggóiiLBC Codec - ĐánhgiáđịnhlượngkhảchốnggóiiLBC Codec so với G.711 Codec, ngôn ngữ Matlab ứng dụng mô Simulink; thực đánhgiáđịnhlượng phương pháp đánhgiá khách quan kiểm nghiệm lại phương pháp đánhgiá chủ quan Tuy nhiên, việc thực bù góiđánhgiákhảchốngmátgóitin ngẫu nhiên gói (packet loss rate) Do vậy, hướng phát triển đề tài tương lai là: - Thực phương pháp đánhgiáchốngmátgóitin theo vị trí gói (packet loss location), kích cỡ gói (packet loss size) mẫu góitin bị (packet loss pattern) [13, tr.1] - Thực phương pháp đánhgiágóitin theo chùm (bursty loss) TÀI LIỆU THAM KHẢO TÀI LIỆ U TIẾNG VIỆT: Nguyễn Đại Hòa (2013), Nghiên cứu kỹ thuậtmãhóa tiếng nói di động, Đồ án tốt nghiệp Đại học, Học viện Cơng nghệ Bưu Viễn thơng, Khoa Viễn thông 2 Trương Lê Phương Anh (2011), Nâng cao chất lượngthoại mạng IP kỹ thuật bù gói, Luận văn Thạc sĩ kỹ thuật, ĐH Đà NẵngCác biện pháp đảm bảo chất lượng dịch vụ, Đại học Sư phạm Kỹ thuật Hưng Yên, Khoa Công nghệ thôngtin Nguyễn Thị Ngọc Diệp, Thuật tốn xử lý tiếng nói Speech Enhancement đánhgiá tính hiệu thuật tốn, ĐH Bách khoa Đà Nẵng, Khoa Điện tử viễn thông TÀI LIỆ U TIẾNG ANH: S Andersen - Aalborg University; A Duric, Telio, H Astrom, R Hagen, W Kleijn, J Linden (December 2004), Internet Low Bit Rate Codec (iLBC), Request for Comments: 3951, Global IP Sound A Duric, Telio, S Andersen - Aalborg University (December 2004), Real-tme Transport Protocol (RTP) Payload Format for internet Low Bit Rate Codec (iLBC) Speech, Request for Comments: 3952 S V Andersen, W B Kleijn, R Hagen, J Linden, M N Murthi, J Skoglund, iLBC A linear predictve coder with robustness to packet losses, Department of Communication Technology - Aalborg University, Denmark; Global IP Sound Stockholm, Sweden and San Francisco, USA Wai C Chu, Speech Coding Algorithms – Foundaton and Evolution of Standardized Coders, Mobile Media Laboratory, DoCoMo USA Labs, San Joe, California A M Kondoz, Digital Speech - Coding for Low Bit Rate Communicaton Systems, University of Surrey, UK 10 Lingfen Sun (January 2004), Speech quality predicton for voice over internet protocol networks, Doctor of Philosophy, School of Computing, Communications and Electronics Falcuty of Technoloty 11 Lijing Ding and Rafik A Goubran (2003), Assessment of Effects of Packet Loss on Speech Quality in VoIP, Department of Systems and Computer Engineering, Carleton University 12 Wenyu Jiang, Henning Schulzrinne (June 2002), Comparisons of FEC and Codec Robustness on VoIP quality and bandwidth efficiency, Columbia University, Department of Computer Science 13 Lingfen Sun; Emmanuel Ifeachor (2012), Impact of Packet Loss Location on Perceived Speech Quality, University of Plymouth 14 Alexander F Ribadeneira (2007), An analysis of the MOS under conditons of Delay, Jitter and Packet Loss and an Analysis of the Impact of Introducing Piggybacking and Reed Solomon FEC for VoIP, Master of Science, College of Arts and Sciences, Georgia State University 15 Muhammad Azam (October 2011), Methods for Recovery of Missing Speech Packets, Master of Science, Blekinge Institute of Technology 16 Nam In Park, Hong Kook Kim, Min A Jung, Seong Ro Lee, Seung Ho Choi (2011), Burst Packet Loss Concealment Using Multple Codebooks and Comfort Noise for CELP-Type Speech Coders in Wireless Sensor Networks, Paper, Gwangju Institude of Science and Technology (GIST), Mokpo National University, Seoul National University of Science and Technology 17 Artur Janicki, Bartlomiej Ksiezak, Packet Loss Concealment Algorithm for VoIP Transmission in Unreliable Networks, Institute of Telecommunications, Warsaw University of Technology 18 Mohamed CHIBANI (2007), Increasing the Robustness of CELP Speech Codecs against Packet Losses, Université de Sherbrooke, Québec, Canada ... TRƯỜNG ĐẠI HỌC CÔNG NGHỆ DƯƠNG THANH TÙNG ĐÁNH GIÁ ĐỊNH LƯỢNG KHẢ NĂNG CHỐNG LẠI MẤT MÁT GĨI TIN CỦA THUẬT TỐN MÃ HĨA ILBC TRONG CÁC HỆ THỐNG THƠNG TIN THOẠI Ngành: Công nghệ Thông tin Chuyên ngành:... thông tin thoại Mã hóa – giải mã tín hiệu âm hệ thống thơng tin thoại 1.3.1 Chức mã hóa – giải mã hệ thống thoại 1.3.2 Các phương pháp mã hóa tín hiệu thoại 1.3.2.1 Phương pháp mã hóa. .. GIÁ KHẢ NĂNG CHỐNG LẠI MẤT MÁT GÓI TIN TRÊN ĐƯỜNG TRUYỀN THOẠI 33 3 Khái niệm chống mát gói tin đường truyền thoại 33 Phân loại kỹ thuật chống mát gói tin 33 3.2.1 Kỹ thuật chống