Kỹ thuật nén tiếng nói số ứng dụng trong thông tin vô tuyến sóng ngắn

4 9 0
Kỹ thuật nén tiếng nói số ứng dụng trong thông tin vô tuyến sóng ngắn

Đang tải... (xem toàn văn)

Thông tin tài liệu

Bài viết trình bày việc lựa chọn phương pháp nén tiếng nói tối ưu đối với tiếng Việt và việc tích hợp bộ nén tiếng nói được chọn vào trong một hệ thống thu phát qua kênh sóng ngắn. Việc ứng dụng kỹ thuật tiếng nói đã được số hóa trong thông tin liên lạc HF tạo điều kiện cho việc bảo mật tiếng nói đạt được độ bảo mật cao. Trước đây, việc bảo mật thoại được thực hiện bằng kỹ thuật xáo trộn ở trường tương tự. Mời các bạn cùng tham khảo!

Thảo Quốc 2015vềvềĐiện ĐiệnTử, Tử,Truyền TruyềnThông Thông TinTin (ECIT 2015) HộiHội Thảo Quốc GiaGia 2015 Công CôngNghệ NghệThông Thơng (ECIT 2015) Kỹ Thuật Nén Tiếng Nói Số Ứng Dụng Trong Thơng Tin Vơ Tuyến Sóng Ngắn TS Nguyễn Nam Hải Học viện Kỹ thuật mật mã Email: nam_haivn@yahoo.com sở cho số hệ thống bảo mật thoại Ban đầu, LPC sử dụng với tốc độ 2.400bps, sau phiên 1.200bps, 800bps 600bps đưa hệ thống chuẩn hệ thống riêng Abstract— Trong thông tin liên lạc tầm xa qua kênh sóng ngắn HF, có nhiều nguyên nhân nhiễu tầng điện li, giao thoa sóng, tín hiệu đến qua nhiều đường… nên tiếng nói thu máy thu khó ln đảm bảo chất lượng tốt Trong việc truyền số liệu tin cậy đạt chất lượng tốt điều kiện xấu Điều mang lại cho kỹ thuật thoại số lĩnh vực ứng dụng rộng lớn Việc ứng dụng kỹ thuật tiếng nói đươc số hóa thơng tin liên lạc HF tạo điều kiện cho việc bảo mật tiếng nói đạt độ bảo mật cao Trước đây, việc bảo mật thoại thực kỹ thuật xáo trộn trường tương tự Mặc dầu kỹ thuật xáo trộn tương tự mang lại chất lượng tiếng nói tốt dễ bị người nghe giải mã Trong đó, mã thoại số mã hóa dạng số hồn tồn có độ bảo mật cao số liệu Trong phạm vi báo không bàn đến vấn đề bảo mật tiếng nói mà tập trung hệ thống số kỹ thuật nén tiếng nói phổ biến triển khai thực tế giải pháp nén tiếng Việt 600 bps Twelp ứng dụng truyền thoại kênh HF Bộ nén tiếng nói “vocoder” thực chất thực trình nén giải nén tiếng nói kỹ thuật số Bộ nén tiếng nói 600bps thường sử dụng kỹ thuật nén khác nén 2.400bps Trong ứng dụng thực tế có “thỏa hiệp” định nén với tốc độ khác Với tốc độ số liệu 2.400bps, mang nhiều thơng tin, tiếng nói thu có chất lượng tốt Ngồi ra, tốc độ này, độ trẽ tồn q trình xử lí ngắn nên độ trễ tín hiệu giũa hai đầu PhátThu ngắn Tuy nhiên, lí tốc độ nén 600bps hữu dụng thơng tin liên lạc HF, đặc biệt dòng thiết bị động mang vai yêu cầu liên lạc 24h/ngày, dịng số liệu 600bps thu qua kênh truyền với tỉ số Tín/Tạp nhỏ 10dB so với dòng số liệu 2.400bps Đây lần người ta nhận thấy tiêng nói số tin tiếng nói tương tự nhiều lần Thêm vào đó, trường hợp truyền tiếng nói số, tín hiệu nhiễu tín hiệu từ máy phá sóng bị tự động lọc bỏ nhờ có khả cắt bỏ Modem đơn tone nối tiếp sử dụng việc truyền số liệu Với ưu điểm kỹ thuật tiếng nói số có giá trị thật cao phủ nhận lĩnh vực thông tin liên lạc dành cho quân Từ khóa— Sóng ngắn, kỹ thuật tiếng nói, HF, bảo mật tiếng nói I GIỚI THIỆU Tiếng nói phương tiện chủ yếu mà người sử dụng để liên lạc giao tiếp ngày Ngày phương tiện truyền thông phát triển số người sử dụng phương tiện liên lạc tăng lên mã hố tiếng nói nghiên cứu ứng dụng rộng rãi gọi điện thoại truyền thống, gọi qua mạng di dộng, qua mạng Internet, qua vệ tinh, v.v Trong báo trình bày việc lựa chọn phương pháp nén tiếng nói tối ưu tiếng Việt việc tích hợp nén tiếng nói chọn vào hệ thống thu phát qua kênh sóng ngắn Trong thông tin liên lạc tầm xa qua kênh sóng ngắn HF, có nhiều nguyên nhân nhiễu tầng điện li, giao thoa sóng, tín hiệu đến qua nhiều đường nên tiếng nói thu máy thu khó ln có chất lượng tốt Trong việc truyền số liệu tin cậy ln đạt chí điều kiện xấu Sự thật mang lại cho kỹ thuật thoại số lĩnh vực ứng dụng rộng lớn II Để nén tín hiệu tiếng nói người ta sử dụng hai phương pháp: - Phương pháp nén dựa dạng sóng - Nén theo thơng số nén theo thơng số hỗn hợp (hybrid) Đối với phương pháp nén dựa dạng sóng, tiếng nói nén việc giảm thiểu độ dư mẫu tiếng nói Phương pháp nén tiếng nói khoảng 64kbps đến 16kbps Ngược lại với phương pháp nén tiếng nói dựa dạng sóng, phương pháp nén theo thơng số dựa cách tiếng nói tạo Thay truyền mẫu dạng sóng tín hiệu tiếng nói người ta truyền thơng số liên quan đến chế tạo tiếng nói đến bên thu bên thu tiếng nói từ mơ hình tạo tiếng nói Như phương pháp người ta đạt tỉ lệ nén cao Mơ hình nén tiếng nói LPC- Linear Prediction Coding - Phịng thí nghiệm Bell Labs, Atal vào năm 1971 Mơ hình thiết kế nhằm mơ chế tạo tiếng nói người tỉ lệ nén Không thế, việc ứng dụng kỹ thuật tiếng nói số thơng tin liên lạc HF hỗ trợ cho việc bảo mật tiếng nói đạt cấp độ mã hóa cao Trước đây, việc bảo mật thoại thực kỹ thuật xáo trộn trường tương tự Mặc dầu kỹ thuật xáo trộn tương tự mang lại chất lượng tiếng nói tốt dễ bị người nghe giải mã Trong đó, thoại số mã hóa dạng số hồn tồn có độ bảo mật cao số liệu Kỹ thuật tiếng nói số đưa vào hệ thống máy thu phát sóng ngắn vào đầu năm 1980 liên tục phát triển ngày Trong thập kỉ 80 90, kỹ thuật thoại số phổ biến Mã Dự đốn Tuyến tính (LPC) Biến thể chuẩn thực theo kỹ thuật LPC-10e trở thành ISBN: 978-604-67-0635-9 CÁC PHƯƠNG PHÁP NÉN TIẾNG NÓI 384 384 HộiHội Thảo Quốc Gia 2015 Điện Tử, Truyền Thông Công Nghệ Thông Tin (ECIT 2015) Thảo Quốc Gia 2015 Điện Tử, Truyền Thông Công Nghệ Thông Tin (ECIT 2015) đạt đến tận 800bps, nhiên tốc độ thông dụng khuyến cáo sử dụng 1200bps - 4800bps Tiếng nói tái tạo theo mơ hình LPC nghe tựa tiếng người máy, nhiên độ nghe hiểu cao Với lý phương pháp nén dựa theo thơng số khó đạt chất lượng tiếng nói cao kể âm vơ hữu người ta đề xuất phương pháp thứ ba tích hợp đặc trưng phương pháp dạng sóng nén theo thơng số Phương pháp giữ nguyên chất phương pháp theo thông số bao gồm lọc âm phân tích tần số âm định âm vơ hữu Thay sử dụng chuỗi xung tuần hồn để thể tín hiệu kích hoạt dành cho đoạn tiếng nói hữu người ta sử dụng tín hiệu giống dạng sóng dành cho đoạn tiếng nói vơ hữu Trong thơng tin liên lạc sóng ngắn có băng thơng hẹp (300 3000Hz), phương pháp nén tiếng nói theo thơng số phương pháp hỗn hợp quan tâm phân tích khả ứng dụng thực tế MELP dựa LPC10e có thêm 05 đặc điểm khác với tích hợp tiền xử lí (Pre-processor) Nhờ có tiền xử lí nên mơ hình MELP ứng dụng ba tốc độ 2400, 1200 & 600bps A Mơ hình LPC Bộ nén tiếng nói (Vocoder) LPC10 sử dụng rộng rãi phần hệ thống bảo mật thiết bị thu phát sóng ngắn HF NATO qn Mỹ Mơ hình phổ biến LPC LPC10e Q trình phân tích LPC10e (phía bên phát) đưa hệ số dự đoán, hệ số mô lọc quản người tập hợp tuyến tính mẫu tiếng nói trước Để có chất lượng tốt lượng tử hóa, nội suy, dánh giá độ ổn định sửa sai người ta chuyển hệ số dự đốn sang thành hệ số phản xạ Tiếng nói tổng hợp đầu LPC10e kết phép tích chập có khuchs đại hệ số dự đoán với chuỗi xung có chu kì tần số âm ước lượng với chuỗi xung ngẫu nhiên thể âm vơ Mơ hình LPC10e ba gồm hai thơng số xác định âm vô âm hữu có độ dài 1/2 khung, âm ước lượng khung 22,5ms, giá trị luuwongj khung 22,5ms phổ thời gian ngắn đại diện lọc dự đốn bậc 10 Ưu điểm mơ hình LPC10e độ nghe hiểu cao tốc độ 2400bps, nhiên tiếng nói mang màu sắc tổng hợp, khơng tự nhiên Ngồi ra, tiếng nói tổng hợp giảm chất lượng rõ rệt tốc độ thấp Trong thực tế, để truyền tốc độ 24000bps với độ tin cậy chấp nhận kênh truyền HF phải tốt với tỉ lệ tín tạp cao (lớn +12dB) Điều hạn chế thành công LPC10 vocoder đáng kể Ngoài ra, kể trường hợp truyền 2400bps tốt chất lượng tiếng nói LPC10 đạt mức tối thiểu nhậy cảm với nhiễu Hình Mơ hình hệ thống mã hóa MELP Bộ nén tiếng nói MELP 600bps xử lí đoạn tiếng nói 25ms, đệm chứa đoạn độ dài 100ms Thông số MELP 600bps mã bao gồm 64 bit cho đoạn 100ms tốc độ 600bit/s Bảng mã chi tiết thông số sau: Aperiodic Flag: 0bit; Band-pass Voicing: 4bit; Energy: 11 bit; Pitch: bit; Spectrum: 10+10+9+9 Quá trình xử lý thoại để truyền hình Hình Quá trình xử lý thoại để truyền Xét tín hiệu tiếng nói đầu vào khung thời gian 22,5 ms sau qua chuyển đổi AD, ta 180 mẫu x 14 bit Sau liệu cho qua mã hóa Melp đầu mã hóa cịn lại 54 bit Ta thêm vào bit chẵn lẻ sau cho qua mã hóa Reed-Solomon sau thêm vào bít đồng 180 mẫu Cuối cho liệu qua chuyển đổi DAC truyền lên băng sở B Mơ hình MELP MELP tổ chức nhà nước Mỹ DoD Digital Voice Processing Consortium phát triển trở thành chuẩn cho ứng dụng kênh dải hẹp Mơ hình thể nâng cấp rõ rệt chất lượng tiếng nói độ nghe hiểu Hình Q trình xử lý thoại nhận 385 385 Hội Thảo Quốc Gia 2015 Điện Tử, Truyền Thông Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 Điện Tử, Truyền Thông Công Nghệ Thông Tin (ECIT 2015) Tín hiệu từ băng sở sau qua chuyển đổi ADC 180 mẫu Sau cho qua giải mã Reed-Solomon lại 54 bit Tiếp tục cho qua giải mã MELP thu 180 mẫu sau cho qua chuyển đổi DAC Cuối tín hiệu tiếng nói đưa LOA C Mơ hình TWELP Nhằm nâng cao chất lượng tiếng nói sau giải nén tốc độ thấp, năm gần chun gia Nga phát triển mơ hình mang tên TWELP (Tri–Wave Excited Linear Prediction) Mơ hình phát triển dựa mơ hình LPC với số thay đổi quan trọng sau: - Phương pháp ước lượng âm tiên tiến tin cậy - Phân tích âm đồng Mơ hình kích ba–sóng: Sóng kích thành phần hữu thanh; Sóng kích thành phần vơ sóng kích thành phần q độ (âm bật hai nguyên âm) Sơ đồ lượng tử hóa mơ tả hình Hình Độ nghe hiểu hai phương pháp MELPe TWELP Hình Chất lượng ngơn ngữ TWELP 1200 MELPs 1200 Hình Sơ đồ lượng tử hóa III ỨNG DỤNG MƠ HÌNH TWELP TRONG MƠI TRƯỜNG THƠNG TIN LIÊN LẠC SĨNG NGẮN HF Theo tiêu chí PESQ (sự đánh giá theo nhận thức chất lượng tiếng nói– Perceptual Evaluation of Speech quality) tốc độ 2400, 1200, 600bps nén tiếng nói TWELP đánh giá tốt MELPe cách rõ rệt Trong danh sách thử nghiệm đánh giá có tiếng châu Á tiếng Trung quốc tiếng Nhật Hai biểu đồ hình thể kết đánh giá độ nghe hiểu PESQ hai phương pháp MELPe TWELP tốc độ 12000bps & 600bps biểu đồ hình so sánh độ nghe hiểu PESQ ba phương pháp AMBE+2 tốc độ 2450 bps, MELPe tốc độ 2400 bps TWELP tốc độ 2400 bps Với kết đánh giá qua ba sơ đồ, ta thấy hai tốc độ phương pháp TWELP cho hệ số PESQ tốt MELPe phương pháp nén TWELP xem xét ứng dụng dự án “tiếng nói số tốc độ thấp thơng tin liên lạc qua kênh sóng ngắn” Số lượng ngơn ngữ  Hình So sánh chất lượng ngơn ngữ TWELP 2400 với AMBE+ 24500 MELPe 2400 IV TÍCH HỢP BỘ NÉN TWELP TRONG HỆ THỐNG TRUYỀN QUA KÊNH SÓNG NGẮN VÀ ĐÁNH GIÁ Bộ nén tiếng nói TWELP hai tốc độ 1200bps 600bps thiết kế tích hợp hệ thống hình Modem kỹ thuật số điều chế /giải diều chế theo chuẩn BPSK (Bidirectional Phase Shift Key) Bộ vi xử lý ARM AT91SAM7S256 điều khiển dịng số liệu vào/ra nén tiếng nói modem truyền Thiết bị thu phát sử dụng máy IC 700PRO Cự ly thử nghiệm khoảng 300Km hai 386 386 HộiHội Thảo Quốc Gia 2015 Điện Tử, Truyền Thông Công Nghệ Thông Tin (ECIT 2015) Thảo Quốc Gia 2015 Điện Tử, Truyền Thông Công Nghệ Thông Tin (ECIT 2015) địa điểm Hà nội Hà Tĩnh, tín hiệu truyền qua sóng trời cự li [3] [4] [5] [6] [7] [8] Hình Sơ đồ hệ thống truyền tiếng nói số qua kênh sóng ngắn Với phương thức đánh giá chất lượng tiếng nói thơng tin liên lạc vơ tuyến: ****** = 6/6 Chất lượng tuyệt vời ***** = 5/6 Chất lượng tốt **** = 4/6 Chất lượng tốt *** = 3/6 Chấp nhận ** = 2/6 Tạm * = 1/6 Kém Thì chất lượng tiếng nói bên bên máy thu hai tơc độ 1200bps 600bps thể bảng I BẢNG I CHẤT LƯỢNG TIẾNG NÓI Tốc độ nén 1200 600 Phương thức điều chế BPSK BPSK Dải thông Độ nghe hiểu Nhận biết giọng nói Giới hạn thấp SNR 3kHz kHz **** *** *** ** 4.0dB 0.5dB V KẾT LUẬN Việc phân tích, thực tích hợp nén thoại TWELP vào hệ thống thu phát sóng ngắn trình bày báo giải vấn đề nan giải truyền thoại số qua kênh sóng ngắn HF Đó thơng tin tiếng nói truyền hiểu chất lượng đường truyền (tỷ lệ tín/tạp 0.5dB) Cho đến ngày nay, giới, tiếng nói số thơng tin liên lạc sóng ngắn sử dụng phổ biến tốc độ 1200bps Với tốc độ việc liên lạc khó thực khoảng thời gian có nhiễu lớn fading liên tục đặc biệt đêm từ 22 đến sáng Với tốc độ 600bps tiếng nói truyền nhận với độ nghe hiểu kênh truyền việc liên lạc trì phần lớn thời gian TÀI LIỆU THAM KHẢO [1] [2] Carl Kritzinger - Low Bit rate Speech Coding , April 2006 Thesis presented in partial fulfiment of the requirement for the degree of Master of Science in Engineering Science at the University of Stellenbosch Mark W – a 600bps MELP Vocoder for use on HF channel, Harris Corporation , RF Communications Division , 1680 University Avenue Rochester , New York 14610 387 387 Charles Brain and Andy Talbot- High-quality Voice Communications is possible without exceeding SSB bandwidth or expensive broadcast studio equipment, QEX June 2000 Kihong Kim, the Attached Institute of ETRI, Youseong , Daejeon, Korea and Jinkeun Hong, Baekseok University, Korea – Evaluation of Transmission and Quality Performance of Digital Voice Communications in an HF Network; 2009 IEEEE ANDREAS SPANIAS, Speech coding: A tutorial review, Arizona State University, USA - 1994 http://twelp.pro www.electronicsarena.co.uk Wai C Chu, Speech Coding Algorithms- Foundation and Evolution of Standardized Coders, John Wiley & Sons, 2003 ... đoạn tiếng nói hữu người ta sử dụng tín hiệu giống dạng sóng dành cho đoạn tiếng nói vơ hữu Trong thơng tin liên lạc sóng ngắn có băng thơng hẹp (300 3000Hz), phương pháp nén tiếng nói theo thông. .. tốc độ phương pháp TWELP cho hệ số PESQ tốt MELPe phương pháp nén TWELP xem xét ứng dụng dự án ? ?tiếng nói số tốc độ thấp thông tin liên lạc qua kênh sóng ngắn? ?? Số? ?lượng ngơn ngữ  Hình So sánh... chất lượng tiếng nói LPC10 đạt mức tối thiểu nhậy cảm với nhiễu Hình Mơ hình hệ thống mã hóa MELP Bộ nén tiếng nói MELP 600bps xử lí đoạn tiếng nói 25ms, đệm chứa đoạn độ dài 100ms Thông số MELP

Ngày đăng: 27/04/2022, 10:18

Hình ảnh liên quan

BẢNG I. CHẤT LƯỢNG TIẾNG NÓI Tốc  - Kỹ thuật nén tiếng nói số ứng dụng trong thông tin vô tuyến sóng ngắn

c.

Xem tại trang 4 của tài liệu.
Hình 8. Sơ đồ hệ thống truyền tiếng nói số qua kênh sóng ngắn Với phương thức đánh giá chất lượng tiếng nói trong thông tin  liên lạc vô tuyến:  - Kỹ thuật nén tiếng nói số ứng dụng trong thông tin vô tuyến sóng ngắn

Hình 8..

Sơ đồ hệ thống truyền tiếng nói số qua kênh sóng ngắn Với phương thức đánh giá chất lượng tiếng nói trong thông tin liên lạc vô tuyến: Xem tại trang 4 của tài liệu.

Tài liệu cùng người dùng

Tài liệu liên quan