Nghiên cứu kĩ thuật mã hoá tiếng nói trong hệ thống di động gsm

54 40 0
Nghiên cứu kĩ thuật mã hoá tiếng nói trong hệ thống di động gsm

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƢỜNG ĐẠI HỌC VINH 621.382 KHOA ĐIỆN TỬ VIỄN THÔNG ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC Đề tài: NGHIÊN CỨU KĨ THUẬT MÃ HỐ TIẾNG NĨI TRONG HỆ THỐNG DI ĐỘNG GSM Giáo viên hướng dẫn : ThS Lê Văn Chƣơng Sinh viên thực : Nguyễn Văn Đồng Lớp : 50K2 - ĐTVT Mã số sinh viên : 0951080313 Khóa học : 2009 - 2014 Nghệ An - 01/2014 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC VINH - BẢN NHẬN XÉT ĐỒ ÁN TỐT NGHIỆP Họ tên sinh viên: Nguyễn Văn Đồng Mã số sinh viên: 0951080313 Ngành: Điện tử - Viễn thông Khoá: 50 Giảng viên hƣớng dẫn: ThS Lê Văn Chƣơng Cán phản biện: ThS Đặng Thái Sơn Nội dung thiết kế tốt nghiệp: Nhận xét cán phản biện: Ngày tháng năm 2014 Cán phản biện MỤC LỤC Trang LỜI NÓI ĐẦU TÓM TẮT ĐỒ ÁN DANH MỤC CÁC BẢNG BIỂU DANH MỤC CÁC HÌNH VẼ ĐỒ THỊ DANH MỤC CÁC CHỮ VIẾT TẮT CHƢƠNG XỬ LÝ TÍN HIỆU TRONG THƠNG TIN DI ĐỘNG 1.1 Số hoá mã hố tiếng nói 1.2 Mã hoá kênh 1.3 Tổ chức cụm 10 1.4 Ghép xen 11 1.5 Mật mã hoá 13 1.6 Điều chế 13 CHƢƠNG CÁC PHƢƠNG PHÁP MÃ HÓA TIẾNG NĨI 15 2.1 Q trình tạo tiếng nói 15 2.1.1 Chuỗi thoại 15 2.1.2 Phát âm 16 2.1.2.1 Kích thích 17 2.1.2.2 Vocal tract 18 2.1.3 Dạng lọc nguồn 20 2.1.3.1 Vocal tract 20 2.1.3.2 Kích thích 20 2.1.3.3 Dạng lọc nguồn tổng quát 21 2.2 Các phƣơng pháp sở mã hố tiếng nói 22 2.2.1 Phƣơng pháp mã hoá tiếng nói dạng sóng 23 2.2.1.1 PCM (Pulse Code Modulation) 23 2.2.1.2 DM (Delta Modulation) 24 2.2.1.3 DPCM (Differential PCM) 25 2.2.1.4 ADPCM (Adaptive Differential PCM)-G.726 25 2.2.2 Phƣơng pháp mã hóa tiếng nói kiểu Vocoder 26 2.2.3 Phƣơng pháp mã hóa lai (Hybrid) 27 2.2.3.1 Mã hố phân tích AbS 28 a, Dự đoán ngắn hạn STP (Short Term Predictor) 29 b, Dự đoán dài hạn LTP (Long Term Predictor) 34 2.3 ng dụng phƣơng pháp sở mã hóa âm truyền thơng 35 2.3.1 Các yêu cầu mã hóa âm thoại 35 2.3.2 Các tham số liên quan đến chất lƣợng thoại 36 2.3.3 Các phƣơng pháp đánh giá chất lƣợng thoại 37 2.3.3.1 Phƣơng pháp đánh giá ch quan (MOS) 37 2.3.3.2 Các phƣơng pháp đánh giá khách quan 37 CHƢƠNG MÃ HỐ VÀ GIẢI MÃ TIẾNG NĨI TRONG HỆ THỐNG THÔNG TIN DI ĐỘNG GSM 39 3.1 Các mã hố tiếng nói dự tuyển cho hệ thống GSM 39 3.1.1 SBC- APCM 39 3.1.2 SBC-ADPCM 39 3.1.3 MPE-LTP 39 3.1.4 RPE-LTP 40 3.2 Bộ mã hoá tiếng nói RPE-LTP 41 3.2.1 Tiền xử lý 41 3.2.2 Lọc phân tích STP 42 3.2.3 Lọc phân tích LTP 43 3.2.4 Tính toán RPE 45 3.3 Bộ giải mã tiếng nói RPE-LTP 47 3.3.1 Giải mã RPE 51 3.3.2 Lọc tổng hợp LTP 51 3.3.3 Lọc tổng hợp STP 51 3.3.4 Hậu xử lý 51 KẾT LUẬN 51 TÀI LIỆU THAM KHẢO 52 LỜI NÓI ĐẦU Ngày nay, phƣơng tiện truyền thông phát triển số lƣợng ngƣời sử dụng phƣơng tiện liên lạc ngày tang lên, vấn đề mã hóa tiếng nói đƣợc nghiên cứu ứng dụng rộng rãi gọi điện thoại truyền thống, gọi điện thoại qua mạng di động, qua Internet hay qua vệ tinh, Mạc dù với phát triển c a công nghệ truyền thông qua cáp quang làm cho băng thơng khơng cịn vấn đề lớn goi điện truyền thống Tuy nhiên, bang thông gọi đƣờng dài, gọi quốc tế, gọi qua vệ tinh hay gọi di động cần phải trì bang thơng mức định Chính việc mã hóa tiếng nói cần thiết, giúp giảm thiểu số lƣợng tín hiệu cần truyền đƣờng truyền nhƣng đảm bảo chất lƣợng gọi Xuất phát từ yêu cầu trên, với mục đ ch t m hiểu s u kĩ thuật mã hố tiếng nói, em định thực đề tài “Nghiên cứu kĩ thuật mã hố tiếng nói hệ thống di động GSM” Nội dung đề tài bao gồm chƣơng ch nh: - Xử lý tín hiệu thơng tin di động - Các phƣơng pháp sở mã hố tiếng nói - Mã hố giải mã tiếng nói hệ thống thông tin di động GSM Em xin chân thành cảm ơn ThS Lê Văn Chƣơng hƣớng dẫn, tận tình giúp đỡ em hồn thành đề tài Nhƣng thời gian kinh nghiệm nghiên cứu hạn chế nên đồ án thực cịn nhiều thiếu sót Em mong nhận xét, đánh giá, đóng góp từ thầy cô bạn bè để nội dung đồ án đƣợc hồn thiện TĨM TẮT ĐỒ ÁN Trong thơng tin di động mã hóa tiếng nói để giảm thiểu tín hiệu cần truyền đƣờng truyền nhƣng đảm bảo chất lƣợng gọi yếu tố cần thiết quan trọng Đồ án giới thiệu tổng quan xử lý tín hiệu thông tin di động; phƣơng pháp sở mã hóa tiếng nói mã hóa, giải mã tiếng nói hệ thống GSM Dựa vào điểm số ý kiến trung bình MOS mã hóa tiếng nói RPE-LTP cho kết tốt Điểm số dựa tiêu chí: chất lƣợng giọng nói, khả kháng tạp nhiễu, trễ xử lý độ tính tốn phức tạp c a chúng RPE-LTP mã hóa dựa tảng k ch th ch xung RPE dự đoán dài hạn LTP Nó thể đặc t nh vƣợt trội với MOS 4/5 lớn nhiều so với mã hóa cịn lại Vậy nên đồ án tr nh bày chi tiết mã hóa tiếng nói RPE-LTP ABSTRACT In mobile communication, the voice encoder to minimize the signal transmitted on transmission while ensuring call quality is an important factor and important This thesis introduces an overview of signal processing in mobile communication, these base method voice encoder and the ministries encoder, decode voice in the system GSM Based on the average scores opinions MOS, the RPE-LTP voice encoder for best results This score is based on the criteria: voice quality, possibility noise resistance, processing delay and computational complexity of our RPE-LTP encoder based on regular pulse excitation RPE and long term prediction LTP It has demonstrated superior properties with MOS is 4/5, much greater than the other encoder So this thesis has presented details of the voice encoder RPE-LTP DANH MỤC CÁC BẢNG BIỂU Bảng 3.1 So sánh điểm số ý kiến trung bình MOS Codec 33 Bảng 3.2 Lƣợng tử hệ số LARc(i) 36 Bảng 3.3 Nội suy tham số LAR (J=khối tại) 36 Bảng 3.4 Bảng lƣợng tử cho tham số khuếch đại LTP 38 Bảng 3.5 Vị trí bit tham số ng c a mã hố tiếng nói RPE-LTP khung thoại 20ms 42 DANH MỤC CÁC HÌNH VẼ ĐỒ THỊ Hình 1.1 Q trình biến đổi tín hiệu GSM Hình 1.2 Biến đổi A/D Hình 1.3 Mã hố thoại Hình 1.4 Mã hố kênh Hình 1.5 Ghép xen tín hiệu tiếng nói Hình 2.1 Quá trình tạo thoại Hình 2.2 Phát m c a vocal tract 10 Hình 2.3 Dạng sóng tiếng nói c a đoạn thoại (âm hữu thanh) ngắn 11 Hình 2.4 Log cƣờng độ phổ c a đoạn thoại (âm hữu thanh) ngắn 12 Hình 2.5 Dạng lọc nguồn tổng quát 14 Hình 2.6 Mơ hình chung mã hố phân tích tổng hợp AbS 21 Hình 2.7 Đồ thị hàm mật độ xác suất c a hệ số LAR 26 Hình 2.8 Mối quan hệ khung, khung cửa sổ Hamming 27 H nh 3.1 Sơ đồ khối mã hóa RPE-LTP 34 Hình 3.2 Đáp ứng xung (trái) đáp ứng tần số (phải) c a lọc trọng số 39 Hình 3.3 Vị trí mẫu chuỗi 39 H nh 3.4 Sơ đồ khối giải mã RPE-LTP 40 DANH MỤC CÁC CHỮ VIẾT TẮT A/D Analog to Digital AB Abs Access Burst Analysis by Synthesis ADPCM Adaptive Differently PCM DB DM DPCM FC FEC Dummy Burst Delta Modulation Differential PCM Frequency Correction Burst Forward Error Correction GMSK Gaussian Minimum Shift Keying GSM LAR LP LPC LTP MOS MPE-LTP NB PCM PDF QMF QoS RELP RPE RPE-LTP SB SNR STP Global System For Mobile Communications Logarithm Area Ratio Linear Prediction Linear Prediction Coding Long Term Predictor Mean Opinion Score Multi-Pulse Excited LPC Codec with Long term Predictor Normal Burst Pulse Code Modulation Probability Density Function Quadrature Mirror Filter Quality of Service Residual Excited Linear Prediction Regular Pulse Excitation Regular Pulse Excited - Long Term Prediction Synchronization Burst Signal to Noise Ratio Short term Predictor Chuyển đổi tín hiệu từ tƣơng tự sang số Cụm truy xuất Phân tích tổng hợp Điều chế mã xung vi sai thích ứng Cụm giả Điều chế Delta Điều chế mã xung vi sai Cụm điều chỉnh tần số Mã sửa lỗi hƣớng Điều chế khóa chuyển pha cực tiểu Hệ thống thông tin di động tồn cầu Tỉ số vùng logarith Dự đốn tuyến tinh Mã hóa dự đốn tuyến tính Dự đốn dài hạn Điểm số ý kiến trung bình Dự đốn tuyến tính kích thích tín hiệu sau dự đốn Cụm thƣờng Điều chế xung mã Hàm mật độ xác suất Bộ lọc gƣơng cầu phƣơng Chất lƣợng dịch vụ Dự đoán tuyến tính kích thích tín hiệu sau dự đốn K ch th ch xung K ch th ch xung – Dự đoán dài hạn Cụm đồng Tỉ số hiệu nhiễu Dự đoán ngắn hạn CHƢƠNG 1: XỬ LÝ TÍN HIỆU TRONG THƠNG TIN DI ĐỘNG Q trình biến đổi xử lý tín hiệu mạng thông tin di động GSM đƣợc mô tả nhƣ sau: Hình 1.1 Q trình biến đổi tín hiệu mạng thơng tin di động GSM 1.1 Số hố mã hố tiếng nói Đầu tiên, tiếng nói đƣợc microphone biến đổi sang tín hiệu điện dạng tƣơng tự Microphone bao gồm mỏng cuộn d y đạt khe từ trƣờng c a nam ch m Để giảm lƣợng liệu cần thiết tƣơng ứng với sóng âm, ta cho tín hiệu qua lọc thông dải khoảng tần số từ 300 Hz đến 3.4 kHz Sau đó, t n hiệu đƣợc biến đổi sang tín hiệu số biến đổi A/D dùng kĩ thuật điều xung mã PCM với tần số lấy mẫu 8kHz mã hoá mẫu 13 bit Do đó, luồng tín hiệu số sau đƣợc biến đổi có tốc độ 104 kbps Tín hiệu số ng c a biến đổi A/D có tốc độ 104 kbps đƣợc nén lại mã hố tiếng nói Mã hố tiếng nói phƣơng pháp nén t n hiệu thoại dạng số u cầu c a mã hố tiếng nói phải đảm bảo thời gian thực chất lƣợng chấp nhận đƣợc Trong GSM, ngƣời ta sử dụng mã Vocoder Nguyên tắc c a kỹ thuật thay truyền luồng số từ tiếng nói ta truyền thông số c a quan phát âm thời điểm phát tiếng Nhƣ vậy, chuỗi bit truyền ngắn nên tốc độ giảm xuống Hình 1.2 Biến đổi A/D Tín hiệu số ngõ c a biến đổi A/D có tốc độ 104 kbps đƣợc chia thành đoạn có chiều dài 20ms, nhƣ đoạn chứa 2080 bit (tƣơng ứng 160 mẫu) Để truyền chuỗi này, ngƣời ta thay thông số c a lọc có chiều dài 260 bit Nhƣ vậy, 260 bit 20ms tƣơng ứng với tốc độ truyền thật 13 kbps Hình 1.3 Mã hóa thoại 1.2 Mã hoá kênh Mã kênh thêm vào từ mã cần truyền số bit dƣ thừa để làm tang khoảng cách Hamming c a từ mã, nhằm mục đ ch giúp cho đầu thu phát sửa đƣợc nhiều lỗi Bộ mã hoá tiếng nói đƣa khối 260 bit/20ms đến mã hoá kênh Các bit đƣợc chia thành 182 bit loại I (các bit đƣợc bảo vệ) 78 bit loại II (các bit không đƣợc bảo vệ), dựa theo tầm quan trọng c a bit nhận đƣợc từ thí nghiệm ch quan Các bit loại I đƣợc chia thành loại, Ia Ib sử dụng mức chất lƣợng đƣợc thực thời gian thực - Các phƣơng pháp đánh giá khách quan : sử dụng số mô h nh để ƣớc lƣợng mức chất lƣợng theo thang điểm MOS 2.3.3.1 Phƣơng pháp đánh giá ch quan (MOS) Kỹ thuật đánh giá chất lƣợng thoại sử dụng đối tƣợng số lƣợng lớn ngƣời nghe, sử dụng phƣơng pháp thống kê để t nh điểm chất lƣợng Điểm đánh giá bình quân c a nhiều ngƣời đƣợc t nh điểm Mean Opinion Scoring (MOS) Phƣơng thức đánh giá theo MOS đƣợc thực theo kiểm tra hội thoại hai chiều hoạc nghe chiều Các kiểm tra nghe m ột chiều sử dụng mẫu thoại chuẩn Ngƣời nghe nghe mẫu truyền qua hệ thống đánh giá chất lƣợng tổng thể c a mẫu dựa thang điểm cho trƣớc 2.3.3.2 Các phƣơng pháp đánh giá khách quan - Các phƣơng pháp so sánh : dựa việc so sánh tín hiệu thoại truyền dẫn với tín hiệu chuẩn biết Tín hiệu dùng để so sánh dùng tín hiệu âm thoại đầu vào So sánh dựa dạng sóng âm c a hai tín hiệu hoạc so sánh dựa thông số đạc trƣng cho m thoại - Các phƣơng pháp ƣớc lƣợng tuyệt đối : dựa việc ƣớc lƣợng tuyệt đối chất lƣợng tín hiệu thoại - Các mô h nh đánh giá truyền dẫn : phƣơng pháp xác định giá trị chất lƣợng thoại mong muốn dựa hiểu biết mạng Ví dụ: mơ hình ETSI Model 39 CHƢƠNG 3: MÃ HỐ VÀ GIẢI MÃ TIẾNG NĨI TRONG HỆ THỐNG THƠNG TIN DI ĐỘNG GSM 3.1 Các ộ h tiếng n i tu ển ch hệ thống G M Việc chọn mã hố giải mã tiếng nói (speech codec) thích hợp cho hệ thống GSM từ tập mã hoá dự tuyển đƣợc dựa phép thử so sánh khái quát loạt điều kiện hoạt động Các so sánh khắt khe chất lƣợng tiếng nói, sức kháng lỗi kênh, độ trễ hệ thống nhƣ độ phức tạp 3.1.1 SBC- APCM SBC-APCM codec mã hoá bang với PCM thích nghi theo khối Codec sử dụng lọc gƣơng cầu phƣơng QMF (Quadrature Mirror Filter) để ph n tách tín hiệu lối vào thành 16 bang rộng 250 Hz, hai bang cao số không đƣợc truyền Ấn định bit th ch nghi đƣợc sử dụng bang sở t lệ công suất c a loạt bang tạo thành nên thông tin biên cần truyền Tốc độ truyền dẫn tổng cộng c a tín hiệu bang 10 kbps, thông tin biên 3kbps mà chúng đƣợc bảo vệ độ dƣ thừa 3kbps c a mã sửa lỗi hƣớng FEC (Forward Error Correction) 3.1.2 SBC-ADPCM SBC-ADPCM codec mã hoá ba ng với PCM delta th ch nghi Trong sơ đồ này, tiếng nói lối vào đƣợc chia thành ba ng con, số có bang đƣợc truyền Các t n hiệu bang đƣợc mã hoá mã vi sai với đánh giá ngƣợc th ch nghi để đổi lại với SBC-APCM đƣợc đề nghị, đánh giá thuận th ch nghi đƣợc sử dụng Ấn định bit c a ba ng đƣợc đạt cố định, khơng có thơng tin biên đƣợc truyền đi, nhờ làm cho hệ thống thích nghi với tạp nhiễu nhiều không cần mã FEC Tốc độ mã c a codec 15 kbps 3.1.3 MPE-LTP MPE-LTP (Multi-Pulse Excited LPC codec with Long Term Predictor) codec dự doán tuyến t nh k ch th ch đa xung với dự đoán dài hạn Việc thực mã hố giải mã tiếng nói cụ thể đƣợc sử dụng thử nghiệm để so sánh đòi hỏi tốc độ 40 truyền dẫn 13.2 kbps mã hố FEC đƣợc gắn vào với tốc độ 2.8 kbps đƣợc sử dụng để bảo vệ bit quan trọng c a mã hố giải mã tiếng nói 3.1.4 RPE-LTP RPE-LTP (Regular Pulse Excited - Long Term Prediction) codec LPC k ch th ch xung Bộ mã hóa tiếng nói dựa tảng kích thích xung (regular pulse excitation) với dự đoán dài hạn liên quan tới mã hóa tiếng nói khác là: RELP (Residual Excited Linear Prediction) MPE -LPC (Multi Pulse Excited LPC) Lợi c a RELP không phức tạp sử dụng mã hóa dải tần gốc Bộ mã hóa MPE-LTP phức tạp nhƣng cung cấp mức độ hiệu cao Bộ mã hóa RPE-LTP cho kết tốt, cân hiệu t nh phức tạp Bốn codec đƣợc so sánh với chất lƣợng tiếng nói, khả nang kháng tạp nhiễu, trễ xử lý độ phức tạp t nh toán c a chúng Từ kinh nghiệm với hệ thống tham chiếu điều tần (FM), hai t lệ lỗi bit tiêu đƣợc đề nghị mà só sánh chất lƣợng đƣợc thực Điểm số ý kiến trung bình MOS (Mean Opinion Score) tính trung bình thang điểm nhiều điều kiện thử nghiệm khác đƣợc tìm là: Bảng 3.1 So sánh điểm số ý kiến trung bình MOS Codec Codec Bit rate (kbps) MOS FM - 1.95 SBC - APCM 16 3.14 SBC – ADPCM 15 2.92 MPE – LPT 16 3.27 RPE – LPC 13 3.54 RPE - LTP 13 ~ 4.0 Các kết nhấn mạnh t n vƣợt trội c a codec kích thích xung tầm quan trọng c a dự đoán dài hạn LTP Codec RPE, thể đạc t nh ƣa chuộng nhất, đƣợc cải thiện cách áp dụng LTP; codec RPE-LTP bảo đảm MOS khoảng 4.0 điểm dải rộng điều kiện hoạt động 41 3.2 Bộ mã hoá tiếng nói RPE-LTP Sơ đồ mã hố RPE-LTP đƣợc thể nhƣ h nh 3.1 Trong có phận chức nang sau:  Tiền xử lý  Lọc phân tích STP  Lọc phân tích LTP  Tính tốn RPE H nh 3.1 Sơ đồ khối mã hóa RPE -LTP 3.2.1 Tiền xử lý Tín hiệu tiếng nói lấy mẫu đƣợc cho qua lọc để loại bỏ sai lệch DC tồn cho qua lọc tiền nhấn Mơ hình tốn học c a tạo tiếng nói mã hóa lƣợng suy giảm dần với tần số tăng dần Do đó, việc tiền nhấn đƣợc áp dụng để n ng độ xác tính tốn cách nhấn phần tần số cao công suất thấp c a phổ tiếng nói Điều thực đƣợc lọc cực với hàm truyền dạng: 42 (3.1) Trong 3.2.2 Lọc phân tích STP Tiếng nói đƣợc tiền nhấn đƣợc ph n đoạn thành khối 160 mẫu tƣơng ứng với khoảng thời gian 20 ms đệm Đối với đoạn gồm L=160 mẫu, chín hệ số tự tƣơng quan đƣợc tính từ s(k) theo công thức sau: i =0,1,2, ,8 (3.2) Từ hệ số tự tƣơng quan c a tiếng nói ACF(i), tám hệ số phản xạ đƣợc tính theo thuật toán lạp Schur, phƣơng pháp tƣơng đƣơng với thuật toán LevisionDurbin đƣợc sử dụng để giải phƣơng tr nh then chốt LPC để t m hệ số phản xạ r(i), nhƣ hệ số lọc STP Tuy nhiên, thuật toán Schur đƣa đến hệ số phản xạ r(i) mà Các hệ số phản xạ r(i) đƣợc tính nằm khoảng i = 1,2,…,8 (3.3) Các hệ số phản xạ r(i) đƣợc biến đổi thành t số vùng logarit LAR(i), LAR(i) đƣợc nén-giản theo luật logarit có tính chất lƣợng tử hoá tốt hệ số r(i) i = 1,2,…,8 (3.4) Các tham số lọc LAR(i), i = 1,2,…,8 có dải động khác hàm mật độ xác suất có hình dạng khác Điều lý giải cho việc mã hóa cặp LAR thứ nhất, thứ hai, thứ ba, thứ tƣ tƣơng ứng với bit, bit, bit, bit (3.5) Với Trong hàm (3.6) đƣợc định nghĩa giá trị nguyên gần c a z tƣơng ứng với hệ số A(i), B(i) với giá trị bảng 3.2 43 đƣợc cho theo Bảng 3.2 Lƣợng tử hệ số LAR thứ i A(i) B(i) 20.000 20.000 20.000 20.000 13.637 15.000 8.334 8.824 0.000 0.000 4.000 -5.000 0.184 -3.500 -0.666 -2.235 Các hệ số Min đƣợc biến đổi Max -32 -32 -16 -16 -8 -8 -4 -4 +31 +31 +15 +15 +7 +7 +3 +3 nhƣ sau: (3.7) Để làm giảm bớt thay đổi đột biến chất đƣờng bao tín hiệu tiếng nói quanh rìa khung phân tích STP, tham số AR’’ đƣợc nội suy tuyến tính thành AR’ Trong khối chứa 160 mẫu tiếng nói, lọc phân tích ngắn hạn đƣợc thực với chuỗi tham số khác theo bảng 3.3 Bảng 3.3 Nội suy tham số LAR (J = khối tại) k 0…12 13…26 27…39 40…159 3.2.3 Lọc phân tích LTP Tín hiệu STP dƣ từ việc lọc ngắn hạn có độ dài 160 mẫu, tƣơng ứng với 20 ms đƣợc ph n chia thành đoạn chứa 40 mẫu tƣơng ứng với ms 44 Ta kí hiệu: j = 0, …, số thứ tự đoạn tín hiệu dƣ thừa đoạn với j = 0, …, 3; giá trị c a khung chứa 160 mẫu) ( = 0, …, 39 Sai số dự đoán LTP đƣợc tối thiểu hoá độ trễ λ mà cực đại hố tƣơng quan chéo STP dƣ giá trị c a nhận đƣợc đƣợc nhớ đệm với độ trễ λ Cụ thể, STP dƣ có độ dài L =160 mẫu đƣợc chia thành bốn đoạn với độ dài N=40 mẫu đoạn tham số khuếch đại (gain) độ trễ (lag) cho lọc dự đoán dài hạn LTP đƣợc xác định cách t nh tƣơng quan chéo đoạn xử lý đoạn dài 40 mẫu đƣợc trƣợt cách liên tục c a đoạn STP dƣ dài 120 mẫu trƣớc Giá trị tƣơng quan lớn đƣợc tìm thấy độ trễ λ = mà đoạn xử lý giống với khứ c a m nh Điều có khả nang với chu kì pitch hoạc bội c a chu k pitch Do đó, hầu hết độ dƣ thừa tách khỏi STP dƣ j = 0,…3 Hệ số khuyếch đại độ trễ (3.8) đƣợc tính cách chuẩn hóa hệ số tƣơng quan chéo (3.9) i = 0,…3 Một tham số LTP hóa thành (độ trễ) (3.10) (độ lợi) t m đƣợc chúng đƣợc mã có giá trọ đoạn (40,…,120) nên cần dùng bit để mã hóa đ đƣợc mã hóa với bit nhƣ sau: 45 (3.11) Trong mức định đƣợc cho theo bảng 3.4 hệ số khuyếch đại đƣợc mã hóa Bảng 3.4 Bảng lƣợng tử cho tham số khuyếch đại LTP i Decision Level Quantizing Level 0.2 0.10 0.5 0.35 0.8 0.65 1.00 Các tham số LTP đƣợc mã hóa cặp ( và ) đƣợc giải mã chỗ thành ) nhƣ sau: (3.12) mức lƣợng tử đƣợc tính theo bảng 4.4 Với Với tham số LTP vừa t nh đƣợc, LTP dƣ đƣợc tính sai lệch STP dƣ ƣớc lƣợng c a (t nh đƣợc nhờ trợ giúp c a tham số LTP giải mã đƣợc chỗ nhƣ sau: (3.13) Với (3.14) Ở đ y biểu diễn đoạn biết c a khứ 46 c a đƣợc lƣu nhớ đệm tìm kiếm Cuối nội dung c a nhớ đệm tìm kiếm đƣợc cập nhật cách sử dụng LTP dƣ đƣợc giải mã chỗ để tạo nên STP dƣ đƣợc ƣớc lƣợng nhƣ dƣới đ y: (3.15) 3.2.4 Tính tốn RPE Tín hiệu dƣ thừa dài hạn đƣợc lọc lọc trọng số Đồ thị đáp ứng xung đáp ứng tần số nhƣ h nh 3.3 Bộ lọc trọng số lọc đáp ứng xung hữu hạn 11 điểm, làm trơn, có tác dụng làm trơn thay đổi mẫu, loại bỏ nhiễu tần số cao, làm cho chuyển tiếp đoạn trở nên mềm mại Do đó, chất lƣợng tiếng nói tổng hợp đƣợc cải thiện Hình 3.2 Đáp ứng xung (trái) đáp ứng tần số (phải) c a lọc trọng số Phép chập 40 mẫu chuỗi e(k) 11 mẫu chuỗi h(n) tạo nên mẫu đƣợc mô tả theo công thức 3.18, lƣu ý ta tính 40 mẫu c a phép chập (3.16) Với Giai đoạn k ch th ch xung bao gồm việc giảm 40 mẫu dƣ thừa dài hạn 47 xuống thành chuỗi 13 bit thông qua kết hợp c a kỹ thuật đan xen chia nhỏ mẫu (3.17) Ta minh họa (3.17) hình sau: Hình 3.3 Vị trí mẫu chuỗi Nang lƣợng c a bốn chuỗi đƣợc chiết đƣợc tính tốn, chuỗi dự tuyển có nang lƣợng lớn đƣợc chọn để biểu diễn cách tốt LTP dƣ (3.18) Theo vị trí m c a lƣới ban đầu có bit đ để mã hóa dịch trƣợt ban đầu c a lƣới đoạn Các biên độ xung đƣợc chuẩn hóa theo biên độ cao c a khối đƣợc lƣợng tử hóa bit Và giá trị cực đại c a khối lƣợng tử hóa bit Các vị tr lƣới, biên độ xung giá trị cực đại c a chuỗi đƣợc giải mã chỗ LTP dƣ , xung thiết bị thiếu chuỗi đƣợc điền với giá trị 3.3 Bộ giải mã tiếng nói RPE-LTP Sơ đồ khối giải mã RPE-LTP đƣợc tr nh bày h nh 3.4, thể cấu trúc ngƣợc hình thành phận chức nang:  Giải mã RPE  Lọc tổng hợp LTP  Lọc tổng hợp STP  Hậu xử lý 48 H nh 3.4 Sơ đồ khối giải mã RPE-LTP 3.3.1 Giải mã RPE Trong giải mã, lƣới vị trí M, giá trị cực đại k ch th ch c a đoạn biên độ xung k ch th ch đƣợc lƣợng tử nghịch đảo biên độ xung kích thích đƣợc tính tốn cách nhân biên độ giải mã đƣợc với trị cực đại khối tƣơng ứng c a chúng Mô h nh LTP dƣ e’, đƣợc tái tạo lại việc định vị xác biên độ xung theo theo lƣợng dịch M ban đầu 3.3.2 Lọc tổng hợp LTP Đầu tiên, tham số lọc LTP (khuyếch đại tạo và độ trễ ) đƣợc khôi phục Chúng đƣợc dùng để xây dựng lọc tổng hợp LTP Sau t n hiệu LTP dƣ khơi phục đƣợc đƣợc sử dụng để kích thích lọc tổng hợp LTP để khôi phục đoạn có độ dài c a STP dƣ đƣợc ƣớc lƣợng 3.3.3 Lọc tổng hợp STP Các tham số đƣợc giải mã cách sử dụng giải mã từ mà nhận đƣợc Và lần lại đƣợc nội suy tuyến tính phía 49 rìa c a khung ph n t ch tham số c a khung l n cận nhằm tránh thay đổi đột ngột đạc điểm c a đƣờng bao phổ tiếng nói Cuối cùng, tập tham số nội suy đƣợc biến đổi tạo thành hệ số phản xạ , t nh ổn định c a lọc tổng hợp STP đƣợc bảo đảm hệ số phản xạ đƣợc khơi phục rơi ngồi vịng trịn đơn vị đƣợc phản xạ ngƣợc vào vòng tròn đơn vị nhờ thực lấy giá trị nghịch đảo c a chúng Công thức biến đổi trở lại đƣợc cho nhƣ sau: thành (3.19) 3.3.4 Hậu xử lý Quá trình hậu xử lý đƣợc thiết lập việc giải nhấn cách sử dụng lọc H(z) biểu thức 3.1 Nhƣ khoảng thời gian 20 ms, tƣơng đƣơng với việc mã hóa 160 mẫu, bit đƣợc phân bố mã hóa tiếng nói RPE-LTP đƣợc trình bày theo bảng 3.5 Bảng 3.5 Vị trí bit tham số ngõ c a mã hóa tiếng nói RPE-LTP khung thoại 20 ms Tham số STP Tên tham số Log Area ratios 1.8 Đoạn thứ LTP Độ trễ LTP Khuyếch đại LTP RPE Vị tr lƣới RPE Kí hiệu LAR LAR LAR LAR LAR LAR LAR LAR Số lƣợng bit 6 5 4 3 Bit b1-b6 b7-b12 b13-b17 b18-b22 b23-b26 b27-b30 b31-b33 b34-b36 N1 b1 M1 2 b37-b43 b44-b45 b46-b47 50 Giá trị cực đại khối RPE Xung RPE thứ Xung RPE thứ … Xung RPE thứ 13 Xmax1 x1(0) x1(1) … x1(12) Đoạn thứ LTP Độ trễ LTP Khuyếch đại LTP RPE Vị tr lƣới RPE Giá trị cực đại khối RPE Xung RPE thứ Xung RPE thứ … Xung RPE thứ 13 Đoạn thứ LTP Độ trễ LTP Khuyếch đại LTP RPE Vị tr lƣới RPE Giá trị cực đại khối RPE Xung RPE thứ Xung RPE thứ … Xung RPE thứ 13 Đoạn thứ LTP Độ trễ LTP Khuyếch đại LTP RPE Vị tr lƣới RPE Giá trị cực đại khối RPE Xung RPE thứ Xung RPE thứ … Xung RPE thứ 13 3 b48-b53 b54-b56 b57-b59 … b90-b92 N2 b2 M2 Xmax2 X2(0) X2(1) … X2(12) 2 3 b93-b99 b100-4101 b102-b103 b104-b109 b110-b112 b113-b115 … b146-b148 N3 b3 M3 Xmax3 X3(0) X3(1) … X3(12) 2 3 b149-b155 b156-b157 b158-b159 b160-b165 b166-b168 b169-b171 … b202-b204 N4 b4 M4 Xmax4 X4(0) X4(1) … X4(12) 2 3 3 Tóm lại, tổng số bit truyền dẫn khung là: 36+ 4x(2+7+2+6+13x3) = 260 bit 51 b205-b211 b212-b213 b214-b215 b216-b221 b222-b224 b225-b227 … B258-b260 KẾT LUẬN Về can thấy mã hố tiếng nói GSM mã hố tiếng nói dạng lai (hybrid) LPC vocoder mã hố dạng sóng Trong mơ hình lọc từ cấu h nh vocoder đƣợc giữ nguyên song tham số kích thích lại đƣợc cải thiện Điều nghĩa phần ch yếu c a tham số đƣợc truyền liên quan tới chuỗi kích thích Bộ mã hố lai san đƣợc hố ngan cách mã hoá vocoder mã hố dạng sóng Quy trình mã hố tiếng nói mã hố tiếng nói tóm tắt lại nhƣ sau Tín hiệu tiếng nói lối vào đƣợc chia thành khung 20 ms để biến đổi thành tín hiệu số Các bƣớc c a tr nh mã hoá bao gồm: Lọc dự đốn tuyến tính LPC, Lọc dự đốn dài hạn LTP mã hoá k ch th ch xung RPE Các thơng số đƣợc mã hố bao gồm bit mã c a thông số LPC, LTP RPE Về mạt thực hành, em cố gắng mơ đƣợc kĩ thuật mã hố tiếng nói chạy đƣợc PC Trƣớc tiên, chƣơng trình thực nén tín hiệu tiếng nói file mẫu có sẵn dƣới định dạng wav codec RPE-LTP Sau đó, tổng hợp thông số lại để tạo thành tín hiệu tiếng nói ngõ Với chƣơng tr nh mô này, em hy vọng chƣơng tr nh phần giúp ta h nh dung đƣợc kĩ thuật mã hoá Em xin cám ơn giúp đỡ tận t nh c a thầy ThS Lê Văn Chƣơng hƣớng dẫn em thực báo cáo Do thời gian kiến thức có hạn nên báo cáo thực nhiều thiếu sót, em mong nhận xét, đánh giá, đóng góp từ thầy bạn bè Em cố gắng t m hiểu thêm Một lần nữa, em xin chân thành cảm ơn 52 TÀI LIỆU THAM KHẢO [1] Phạm Thanh Đàm, “Thông tin di động”, Học viện Công nghệ Bƣu ch nh Viễn thông Tp.HCM, 2010 [2] A M Kondoz, “Digital Speech - Coding for Low Bit Rate Communication Systems, 2nd”, John Wiley & Sons, Ltd, 2004 [3] Raymond Steele and Lajos Hanzo, “Mobile Radio Communication 2nd”, John Wiley & Sons, Ltd, 1992 [4] http://vntelecom.org/diendan/forum.php, truy nhập cuối ngày 18/12/2013 [5] “GSM 06.10”, ETSI, 1997 [6] Randy Goldberg and Lance Riek, “A ctic l H ndboo of Speech ode s”, CRC Press LLC, 2000 [7] Wai C Chu, “Speech coding lgo ithms”, John Wiley & Sons, Ltd, 2003 53 ... hiểu s u kĩ thuật mã hố tiếng nói, em định thực đề tài ? ?Nghiên cứu kĩ thuật mã hố tiếng nói hệ thống di động GSM? ?? Nội dung đề tài bao gồm chƣơng ch nh: - Xử lý tín hiệu thơng tin di động - Các... CHƢƠNG 3: MÃ HỐ VÀ GIẢI MÃ TIẾNG NĨI TRONG HỆ THỐNG THƠNG TIN DI ĐỘNG GSM 3.1 Các ộ h tiếng n i tu ển ch hệ thống G M Việc chọn mã hố giải mã tiếng nói (speech codec) thích hợp cho hệ thống GSM từ... đánh giá khách quan 37 CHƢƠNG MÃ HỐ VÀ GIẢI MÃ TIẾNG NĨI TRONG HỆ THỐNG THÔNG TIN DI ĐỘNG GSM 39 3.1 Các mã hố tiếng nói dự tuyển cho hệ thống GSM 39 3.1.1 SBC- APCM

Ngày đăng: 27/08/2021, 11:17

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan