HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG XỬ LÝ ÂM THANH, HÌNH ẢNH (Dùng cho sinh viên hệ đào tạo đại học từ xa) Lưu hành nội HÀ NỘI - 2007 CuuDuongThanCong.com https://fb.com/tailieudientucntt HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THƠNG XỬ LÝ ÂM THANH, HÌNH ẢNH Biên soạn : TS NGUYỄN THANH BÌNH THS VÕ NGUYỄN QUỐC BẢO CuuDuongThanCong.com https://fb.com/tailieudientucntt LỜI NÓI ĐẦU Tài liệu hướng dẫn học tập mơn "Xử lý âm hình ảnh" dành cho khối đào tạo từ xa chuyên ngành điện tử viễn thông Tài liệu giới thiệu kiến thức xử lý âm hình ảnh Đặc biệt, tác giả trọng tới vấn đề xử lý tín hiệu ứng dụng mạng viễn thơng: phương pháp nén tín hiệu, lưu trữ, tiêu chuẩn nén tín hiệu âm hình ảnh Những kiến thức trình bày tài liệu giúp học viên tiếp cận nhanh với vấn đề thực tiễn thường gặp mạng viễn thông Vì khối lượng kiến thức lĩnh vực xử lý âm hình ảnh lớn, với quỹ thời gian eo hẹp dành cho biên soạn, tài liệu hướng dẫn chưa thâu tóm tồn kiến thức cần có lĩnh vực xử lý âm hình ảnh Để tìm hiểu số vấn đề có đề cương mơn học đòi hỏi học viên phải nghiên cứu thêm số sách tham khảo tác giả đề cập tới phần cuối tài liệu Nội dung sách chia làm hai chương: - Chương 1: Kỹ thuật xử lý âm - Chương 2: Kỹ thuật xử lý hình ảnh Để học tốt mơn này, sinh viên cần phải có kiến thức xử lý tín hiệu số Các kiến thức bạn tìm hiểu “Xử lý tín hiệu số” dành cho sinh viên Đại học từ xa Học viện Đây lần biên soạn đầu tiên, chắn tài liệu nhiều sơ sót, mong bạn đọc trình học tập thày giảng dạy mơn học đóng góp ý kiến xây dựng Trong thời gian gần nhất, tác giả cố gắng cập nhập, bổ xung thêm để tài liệu hướng dẫn hoàn chỉnh Mọi ý kiến đóng góp đề nghị gửi theo địa email: binhntptit@yahoo.com Tp Hồ Chí Minh 19/05/2007 Nhóm biên soạn CuuDuongThanCong.com https://fb.com/tailieudientucntt CuuDuongThanCong.com https://fb.com/tailieudientucntt CHƯƠNG KỸ THUẬT XỬ LÝ ÂM THANH 1.1 TỔNG QUAN VỀ XỬ LÝ ÂM THANH 1.1.1 Giới thiệu sơ lược âm & hệ thống xử lý âm 1.1.1.1 Đặc tính âm tương tự [1] Mục đích lời nói dùng để truyền đạt thơng tin Có nhiều cách mô tả đặc điểm việc truyền đạt thông tin Dựa vào lý thuyết thơng tin, lời nói đại diện thuật ngữ nội dung thông điệp, thông tin Một cách khác để biểu thị lời nói tín hiệu mang nội dung thơng điệp, dạng sóng âm Hình 1.1 Dạng sóng tín hiệu ghi nhận từ âm người Kỹ thuật dùng việc ghi âm sử dụng thông số cơ, điện trường làm nên nhiều cách thức ghi âm ứng với loại áp suất khơng khí khác Điện áp đến từ microphone tín hiệu tương tự áp suất khơng khí (hoặc đơi vận tốc) Dù phân tích cách thức nào, phương pháp so sánh với phải dùng tỉ lệ thời gian Trong thiết bị tương tự đại trơng xử lý âm tốt thiết bị cổ điển, tiêu chuẩn xử lý khơng có thay đổi, cơng nghệ xử lý tốt Trong hệ thống xử lý âm tương tự, thông tin truyền đạt thông số liên tục biến thiên vô hạn Hệ thống xử lý âm số lý tưởng có tính tương tự hệ thống xử lý âm tương tự lý tưởng: hai hoạt động cách “trong suốt” tạo lại dạng sóng ban đầu khơng lỗi Tuy nhiên, giới thực, điều kiện lý tưởng tồn tại, hai loại hệ thống xử lý âm hoạt động khác thực tế Tín hiệu số truyền khoảng cách ngắn tín hiệu tương tự với chi phí thấp Trong giáo trình này, tập trung đề cập đến hệ thống số xử lý âm Thông tin dùng để truyền đạt âm thoại chất có tính rời rạc [2], biểu diễn chuỗi ghép gồm nhiều phần tử từ tập hữu hạn ký hiệu (symbol) Các ký hiệu từ âm phân loại thành âm vị (phoneme) Mỗi ngơn ngữ có tập âm vị khác nhau, đặc trưng số có giá trị từ 30 đến 50 Ví dụ tiếng Anh biểu diễn tập khoảng 42 âm vị Tín hiệu thoại truyền với tốc độ nào? Đối với tín hiệu âm thoại nguyên thủy chưa qua hiệu chỉnh tốc độ truyền ước lượng tính cách lưu ý giới hạn vật lý việc nói lưu lốt người nói tạo âm thoại khoảng 10 âm vị giây Mỗi CuuDuongThanCong.com https://fb.com/tailieudientucntt âm vị biểu diễn số nhị phân, mã gồm bit biểu diễn tất âm vị tiếng Anh Với tốc độ truyền trung bình 10 âm vị/giây, không quan tâm đến vấn đề luyến âm âm vị kề nhau, ta ước lượng tốc độ truyền trunh bình âm thoại khoảng 60bit/giây Trong hệ thống truyền âm thoại, tín hiệu thoại truyền lưu trữ xử lý theo nhiều cách thức khác Tuy nhiên loại hệ thống xử lý âm có hai điều cần quan tâm chung là: Việc trì nội dung thơng điệp tín hiệu thoại Việc biểu diễn tín hiệu thoại phải đạt mục tiêu tiện lợi cho việc truyền tin lưu trữ, dạng linh động cho việc hiệu chỉnh tín hiệu thoại cho không làm giảm nghiêm trọng nội dung thơng điệp thoại Việc biểu diễn tín hiệu thoại phải đảm bảo việc nội dung thơng tin dễ dàng trích người nghe, thiết bị phân tích cách tự động 1.1.1.2 Khái niệm tín hiệu Là đại lượng vật lý biến thiên theo thời gian, theo không gian, theo nhiều biến độc lập khác, ví dụ như: ¾ Âm thanh, tiếng nói: dao động sóng theo thời gian (t) ¾ Hình ảnh: cường độ sáng theo khơng gian (x, y, z) ¾ Địa chấn: chấn động địa lý theo thời gian Biểu diễn tốn học tín hiệu: hàm theo biến độc lập Ví dụ: ¾ u (t ) = 2t − ¾ f ( x, y ) = x − xy − y Thơng thường tín hiệu tự nhiên khơng biểu diễn hàm sơ cấp, tính tốn, người ta thường dùng hàm xấp xỉ cho tín hiệu tự nhiên Hệ thống: thiết bị vật lý, thiết bị sinh học, chương trình thực phép tốn tín hiệu nhằm biến đổi tín hiệu, rút trích thơng tin, … Việc thực phép tốn gọi xử lý tín hiệu 1.1.1.3 Phân loại tín hiệu: Tín hiệu đa kênh: gồm nhiều tín hiệu thành phần ,cùng chung mơ tả đối tượng (thường biểu diễn dạng vector, ví dụ tín hiệu điện tim (ECG-ElectroCardioGram) , tín hiệu điện não (EEG – ElectroEncephaloGram), tín hiệu ảnh màu RGB Tín hiệu đa chiều: biến thiên theo nhiều biến độc lập, ví dụ tín hiệu hình ảnh, tín hiệu tivi trắng đen Tín hiệu liên tục theo thời gian: tín hiệu định nghĩa điểm đoạn thời gian [a,b], ký hiệu x (t ) CuuDuongThanCong.com https://fb.com/tailieudientucntt Hình 1.2 Tín hiệu liên tục theo thời gian Tín hiệu rời rạc thời gian: tín hiệu định nghĩa thời điểm rời rạc khác nhau, ký hiệu x(n) Hình 1.3 Tín hiệu rời rạc theo thời gian Tín hiệu liên tục giá trị: tín hiệu nhận trị đoạn [Ymin , Ymax ] , ví dụ tín hiệu tương tự (analog) Hình 1.4 Tín hiệu liên tục giá trị Tín hiệu rời rạc giá trị: tín hiệu nhận trị tập trị rời rạc định trước (tín hiệu số) CuuDuongThanCong.com https://fb.com/tailieudientucntt Hình 1.5 Tín hiệu rời rạc giá trị Tín hiệu analog: tín hiệu liên tục thời gian, liên tục giá trị Hình 1.6 Tín hiệu analog Tín hiệu số: tín hiệu rời rạc thời gian, rời rạc giá trị Hình 1.7 Tín hiệu số Tín hiệu ngẫu nhiên: giá trị tín hiệu tương lai khơng thể biết trước Các tín hiệu tự nhiên thường thuộc nhóm Tín hiệu tất định: giá trị tín hiệu khứ, tương lại xác định rõ, thơng thường có cơng thức xác định rõ ràng 1.1.1.4 Phân loại hệ thống xử lý Gồm hai loại hệ thống hệ thống tương tự hệ thống số Trong hệ thống xử lý số: hệ thống lập trình được, dễ mơ phỏng, cấu hình, sản xuất hàng loạt với độ xác cao, giá thành hạ, tín hiệu số dễ lưu trữ, vận chuyển lưu, nhược điểm khó thực với tín hiệu có tần số cao CuuDuongThanCong.com https://fb.com/tailieudientucntt 1.1.1.5 Hệ thống số xử lý âm [3] Độ nhạy tai người cao, phân biệt số lượng nhiễu nhỏ chấp nhận tầm biên độ âm lớn Các đặc tính tín hiệu tai người nghe được đo đạc cơng cụ phù hợp Thông thường, tai người nhạy tầm tần số 2kHz 5kHz, có người nhận dạng tín hiệu 20kHz Tầm động nghe tai người phân tích người ta nhận kết có dạng đáp ứng logarith Tín hiệu âm truyền qua hệ thống số chuỗi bit Bởi bit có tính chấtt rời rạc, dễ dàng xác định số lượng cách đếm số lượng giây, dễ dàng định tốc độ truyền bit cần thiết để truyền tín hiệu mà khơng làm thơng tin Hình 1.8 Để nhận tám mức tín hiệu khác cách phân biệt, tín hiệu đỉnhđỉnh tín hiệu nhiểu phải nhỏ độ sai biệt mức độ Tỉ số tín hiệu nhiễu phải tối thiểu 8:1 18dB, truyền bit.Ở 16 mức tỉ số tín hiệu nhiễu phải 24dB, truyền bit 1.1.1.6 Mơ hình hóa tín hiệu âm [4] Có nhiều kỹ thuật xử lý tín hiệu mơ hình hóa áp dụng giải thuật việc khôi phục âm Chất lựơng âm thoại phụ thuộc lớn vào mơ hình giả định phù hợp với liệu Đối với tín hiệu âm thanh, bao gồm âm thoại, nhạc nhiễu khơng mong muốn, mơ hình phải tổng qt khơng sai lệnh so với giả định Một điều cần lưu ý hầu hết tín hiệu âm thoại tín hiệu động thực tế, mơ hình thực tiễn thường giả định phân tích tín hiệu tín hiệu có tính chất tĩnh khoảng thời gian xét Mơ hình phù hợp với hầu hết nhiều lãnh vực việc xử lý chuỗi thời gian, bao gồm việc phục hồi âm mơ hình Autoregressive (viết tắt AR), dùng làm mơ hình chuẩn cho việc phân tích dự đốn tuyến tính CuuDuongThanCong.com https://fb.com/tailieudientucntt Tín hiệu biểu diễn tổng giá trị P tín hiệu trước tín hiệu nhiễu trắng, P bậc mơ hình AR: P s[u ] = ∑ s[n − i ]ai + e[n] (1.1) i =1 Mơ hình AR đại diện cho q trình tuyến tính tĩnh, chấp nhận tín hiệu tương tự nhiễu tín hiệu tương tự điều hòa Một mơ hình khác phù hợp nhiều tình phân tích mơ hình auto regressive moving-average (ARMA) cho phép điểm cực điểm Tuy nhiên mơ hình AR có tính linh động phân tích mơ hình ARMA, ví dụ tín hiệu nhạc phức tạp cần mơ hình có bậc P > 100 để biểu diễn dạng sóng tín hiệu, tín hiệu đơn giản cần biểu diễn bậc 30 Trong nhiều ứng dụng, việc lựa chọn bậc mô hình phù hợp cho tốn cho đảm bảo việc biểu diễn tín hiệu thỏa việc khơng làm thơng tin tín hiệu việc phức tạp Có nhiều phương pháp dùng để ước lượng bậc mơ hình AR phương pháp maximum likelihood/least-squares [Makhoul, 1975], phương pháp robust to noise [Huber, 1981, Spath, 1991], v.v… Tuy nhiên, việc xử lý tín hiệu âm nhạc phức tạp thơng thường sử dụng mơ hình Sin (Sinusoidal) có hiệu ứng dụng âm thoại Mơ hình Sin phù hợp phương pháp dùng để giảm nhiễu Tín hiệu cho cơng thức sau ⎛ nT ⎞ s[n]∑ [n]sin ⎜⎜ ∫ ωi (t )dt + φi ⎟⎟ i =1 ⎝0 ⎠ Pn (1.2) Đây mơ hình tổng qt điều chế biên độ điều chế tần số, nhiên lại khơng phù hợp tín hiệu tương tự nhiễu, việc biểu diễn tín hiệu nhiễu biểu diễn số lượng hàm sin lớn 1.1.1.7 Kiến trúc hệ thống số xử lý âm Đối với máy tính số xử lý âm thanh, người ta thường dùng phương pháp Điều chế xung (Pulse Code Modulation , viết tắt PCM) Dạng sóng âm chuyển sang dãy số PCM sau, xét tín hiệu hình sin làm ví dụ: Tín hiệu gốc tín hiệu Hình 1.9 Air Displacement Time Hình 1.9 Dạng sóng âm nguyên thủy Kế đến, sử dụng microphone để thu tín hiệu âm (trong khơng khí) chuyển đổi thành tín hiệu điện, tầm điện áp ngõ microphone ±1 volt Hình 1.10 CuuDuongThanCong.com https://fb.com/tailieudientucntt 2.3.3.11.6 Sprites MPEG-4 có lọai đối tượng khác thường dùng làm cảnh sprite Sprite đối tượng video thường có kích thước lớn hình hiển thị Sprite đối tượng sử dụng liên tục cảnh (tương tự cảnh tĩnh) Thông thường cảnh game bao gồm cảnh số đối tượng nhân tạo di chuyển theo kịch game hành động người chơi Trong trình hành động cảnh nhìn thấy vùng nhỏ cảnh nền, vùng thành phần ảnh tĩnh (Hình 2.3.25) MPEG-4 cung cấp khả truyền toàn cảnh sprite khả tạo cảnh khác cách truyền thông tin cropping wraping để xác định phần sprite hiển thị thời điểm định Sau sprite truyền có thơng tin cropping/wraping cho sprite đối tượng cận ảnh (foreground) cần truyền Trong game điển hình phần sprite sử dụng nhiều lần lượng liệu cần truyền giảm đáng kể Hình 2.3.25 Cảnh (sprite) truyền có kích thước lớn khả hiển thị hình Việc truyền tồn sprite bắt đầu chương trình hiệu làm tăng băng thông thời gian truyền trước hoạt động bắt đầu MPEG-4 sử dụng phương pháp sau để tránh vấn đề Sprite truyền phần cần Một phần sprite cần thiết thời điểm tức thời truyền Tất cảnh sprite lưu trữ giải mã phần sprite Theo phương pháp khác, sprite mã hóa liên tiếp truyền tồn với độ phân giải thấp độ phân giải cao truyền sau Sprite mã hóa tín hiệu chói với hai thành phần màu MPEG trước ln mã Intra chất ảnh tĩnh 2.3.3.11.7 Animations Như biết số điểm mạnh MPEG-4 khả truyền đối tượng tự nhiên đối tượng tự tạo (vì dụ hình animation) kết hợp chúng giải mã Một nhiều khả thú vị sử dụng đối tượng nhân tạo mặt người hoạt hình (facial animation) Đây ví dụ khác việc ánh xạ texture thành đường nét chuyển động trường hợp đường nét định mơ hình lưới hay mơ hình 3D hình thành bới node Vị trí node mã hóa sử dụng mã hóa dự đốn trước để tăng hiệu suất mã đường nét khuôn mặt thay đổi 159 CuuDuongThanCong.com https://fb.com/tailieudientucntt Version MPEG-4 thêm vào thân hình (body) động Thân hình đối tượng tạo mơ hình thân hình ảo động dạng tập hợp lưới 3D nhiều cạnh Hai tập hợp thông số định nghĩa cho body: Tập hợp tham số định nghĩa body (BDPbody definition parameter) tập hợp thông số động body (BAP - body animation parameter) Tập BDP định nghĩa tập thông số để biến đổi body mặc định thành body theo yêu cầu khách hàng với bề mặt body, kích thước body texture Các tham số động body (BAP) cho phép tạo chuyển động với mơ hình body khác Như vậy, nhận BAP từ luồng bit thu mà tạo linh hoạt body Khi thu được, BDP dùng để biến đổi body chung (body người chuẩn chẳng hạn) thành body riêng biệt dựa vào giá trị thơng số Bất thành phần trống Một thành phần trống thay thành phần mặc định tương ứng body biều Các đặc điểm mặc định xem đặc điểm chuẩn Các đặc điểm định nghĩa sau: bàn chân đến hướng phía trước, hai cánh tay đặt hai bên body với lòng bàn tay hướng vào body Các đặc điểm ngầm định tất BAP có giá trị mặc định Mơ hình body người hổ trợ ứng dụng khác từ mô chuyển động thực người đến công nghệ game sử dụng mơ hình giống người 2.3.3.11.8 Scalability MPEG-4 cung cấp chế độ phân cấp chất lượng tức thời cố định mức đối tượng Trong hai trường hợp, kỹ thuật sử dụng để tạo lớp sở (base layer) tượng trưng cho chất lượng thấp từ luồng bit nhiều lớp tăng cường (enhancement layer) Những lớp tạo việc mã hóa đơn giản Chất lượng hình ảnh điều chỉnh thể hai cách khác Nếu băng thơng bị giới hạn luồng bit truyền bao gồm lớp sở lớp sở vài lớp tăng cường bấc thấp Một cách khác tất lớp truyền đến giải mã, định lớp sử dụng để giải mã Nếu thiết bị hiển thị có độ phân giải thấp tài ngun tính tốn khơng đủ lớp tăng cường bỏ qua VOPs In Subtract Down Converter Up Converter Base Layer Encoder Base Layer Decoder Enhancement Layer Encoder Enhancement VOL Multiplexer Multiplexer output Base layer VOL Hình 2.3.26 Bộ mã hóa phân cấp chất lượng MPEG-4 160 CuuDuongThanCong.com https://fb.com/tailieudientucntt Hình 2.3.26 mơ tả sơ đồ khối mã hóa thực trình phân cấp chất lượng với mức cố định Các VOP ngõ vào biến đổi xuống độ phân giải thấp mã hóa để tạo lớp sở Lớp sở đưa tới ngõ tới tổng hợp Multiplexer Lớp sở giải mã chỗ đưa tới up-converted để có độ phân giải ngõ vào Tín hiệu có độ phân giải cao so sánh với tín hiệu ngõ vào trừ (Subtract), ảnh sai biệt đầu trừ mã hóa riêng mã hóa lớp tăng cường Chú ý luồng VOP sau mã hóa tạo thành lớp đối tượng video Lớp sở sử dụng mã hóa Intra Inter lớp tăng cường sử dụng mã hóa dự đốn Việc phân cấp chất lượng tạm thời đơn giản Luồng bit đến VOP chia thành luồng nhỏ Số VOP yêu cầu gửi đến mã hóa lớp sở, phần lại gửi đến nhiều mã hóa tăng cường QUa strình phân cấp MPEG-4 áp dụng riêng rẽ đối tượng sở Điều làm cho q trình mã hóa giải mã trửo nên linh động Chẳng hạn giải mã hệ thống game khơng có đủ khả để giải mã tất đối tượng tốc độ cao nên chọn giải mã cảnh tốc độ thấp chấp nhận mức độ chuyển động bị giựt, đồng thời giải mã với tốc độ cao đối tượng cận ảnh làm cho chuyển động chúng mịn 2.3.3.11.9 Mã hóa mở rộng (ACE: Advanced Coding Extension) Version MPEG-4 đưa ba công cụ để cải thiện hiệu suất mã hóa đối tượng video Bao gồm: Bù chuyển động toàn cục (GMC: global motion compensation), bù chuyển động phần tư (quarter pel motion compensation) DCT hình dáng thích ứng (shapeadative DCT) Các công cụ cải thiện hiệu suất mã đến 50% so với version tùy theo lọai ảnh tốc độ bit GMC cho phép mã hóa toàn chuyển động đối tượng với vài thông số cải thiện độ phân giải vector chuyển động cách giảm sai số dự đoán sử dụng độ dư Shape-adaptive DCT dùng để cải thiện hiệu suất mã khối đường biên tất pixel phần tử ảnh Thay sử dụng DCT hai chiều 8x8 dùng khối DCT chiều hàng dọc trước sau đến hàng ngang xét pixel thuộc đối tượng, gọi active pixel 2.3.3.12 Chuẩn H.261 Khuyến cáo H.261 CCITT chuẩn nén cho dịch vụ hội nghị truyền hình điện thoại truyền hình qua mạng số dịch vụ tích hợp ISDN tốc độ n × 64Kbps Chuẩn có đặc tính quan trọng ngưỡng trễ mã hố tối đa 150ms trễ phù hợp với truyền thông video hai chiều dựa vào cảm nhận người xem hình ảnh phản hồi trực tiếp dễ dàng thực mạch tích hợp VLSI chi phí thấp cho việc thương mại hố sản phẩm rộng rãi 2.3.3.13 Chuẩn H.263 H.263 chuẩn dành cho video tốc độ thấp 46 Kbps dùng ứng dụng hội nghị từ xa qua mạng PSTN Chuẩn có đặc tính MPEG-1 MPEG-2 Mã hoá video H.263 dựa chuẩn H.261 thực chất phiên mở rộng H.261 với phương 161 CuuDuongThanCong.com https://fb.com/tailieudientucntt pháp mã hoá video kết hợp DPCM/DCT Cả hai chuẩn dùng kỹ thuật DCT, bù chuyển động, mã hố chiều dài từ mã thay đổi, lượng tử hố vơ hướng xử lý cấp macroblock Duy có khái niệm khung PB H.263 đặc biệt, tên PB có nguồn gốc từ P B, kết hợp P B 2.3.4 Ứng dụng đánh giá khả kinh tế tiêu chuẩn nén Bảng 2.3.7 tập hợp ứng dụng tiêu chuẩn nén Định dạng MJPEG có hạn chế ứng dụng Nó dùng chủ yếu máy ghi hình đĩa (q trình mã hóa giải mã đơn vị) Bảng 2.3.7 Các ứng dụng tiêu chuẩn nén Ứng dụng Tiêu mã hóa chuẩn Độ phân giải cực đại đại Tốc độ bit cực Videophone H.261 176x144 64 ÷128 Kbps Hội nghị truyền H.261 352x288 0.384 MPEG-2 720x576 DPCM 720x576 hình Truyền hình cáp Truyền hình Studio / sản xuất MPEG2(@4:2:2) HDTV / sản xuất MPEG-2 HDTV / truyền MPEG-2 Mbps 4…9 Mbps < 50 Mbps MPEG-2 MJPEG ÷1.554 720x576 < 50 Mbps 1920x1280 1920x1280 100 Mbps 20 Mbps dẫn Việc đời chuẩn MPEG-2 khẳng định ưu MPEG so với MJPEG đáp ứng từ khâu sản xuất đến truyền dẫn phát sóng Với tiềm kinh tế mạnh việc đầu tư thiết bị theo chuẩn MPEG cho tất khâu truyền hình điều không bàn cãi Nhưng khả đầu tư cho truyền hình Việt Nam hạn chế, lại giai đoạn nghiên cứu thử nghiệm, việc tìm giải pháp thích hợp đảm bảo điều kiện kinh tế, chất lượng hình ảnh phù hợp cho công đoạn vấn đề cần thiết Trong khâu phát sóng, chuẩn MPEG-2 MP@ML (4:2:0) lựa chọn tối ưu có nguyên nhân sâu sắc có yếu tố khách quan Sâu sắc người ta phải tiết kiệm tối đa dải thông đường truyền, tăng số lượng chương trình MPEG-2 MP@ML sử dụng ảnh I, P, B nén với hệ số nén cao, giảm vận tốc dòng chương trình thấp để phát quảng bá tới máy thu Ví dụ cụ thể, phát qua phát đáp vệ tinh có dải thơng 36 MHz, sử dụng nén MPEG-2 ta truyền 10÷12 chương trình Yếu tố khách quan mắt người cảm nhận độ phân tích đến chừng mực đủ Nếu truyền tín hiệu có vận tốc cao 162 CuuDuongThanCong.com https://fb.com/tailieudientucntt hơn, mắt người cảm nhận thêm không đáng bao mà số lượng chương trình phải giảm đáng kể Điều đồng nghĩa với hiệu phát sóng thấp Tóm lại, mục đích ưu tiên phát quảng bá nén để phát nhiều chương trình Như vậy, vấn đề ta quan tâm lựa chọn chuẩn công đoạn sản xuất hậu kỳ Đối với nén máy ghi hình cần phải ý giữ chất lượng tín hiệu đủ cho gia công xử lý studio Các phương pháp nén máy ghi hình số thực chất xử lý nội máy để giảm vận tốc dòng số ghi lên băng vừa đủ thấp nhằm giải nhiều vấn đề thực tế Đối với MPEG-2, sử dụng MPEG-2 4:2:2P@ML khâu hậu kỳ Về mặt chất lượng, sử dụng máy ghi công nghệ nén MPEG dùng loại ảnh I thuận lợi cho việc dựng in tương đương M-JPEG Nhưng cách giải chưa kinh tế, hệ thống mạch theo công nghệ nén MPEG, mạch “dự đoán bù chuyển động” mạch phức tạp có giá thành cao mà lại khơng sử dụng (chỉ dùng ảnh I, không sử dụng ảnh P B) Vì mục tiêu phát nhiều chương trình nên phát quảng bá sử dụng nén MPEG-2 với nhóm ảnh đầy đủ I, P, B hệ số nén cao Qua phân tích trên, ta thấy chuẩn M-JPEG sử dụng thiết bị sản xuất chương trình tiện dụng cho sản xuất studio dựng hậu kỳ, làm kỹ xảo với giá thành hệ thống phù hợp 163 CuuDuongThanCong.com https://fb.com/tailieudientucntt PHỤ LỤC: CÁC TIÊU CHUẨN MÃ HỐ ÂM THANH VÀ HÌNH ẢNH TRONG TRUYỀN THÔNG ĐA PHƯƠNG TIỆN Các tiêu chuẩn ITU- T cho âm Các tiêu chuẩn ITU-T cho âm bao gồm G.711 · G.722 · G.722.1 · G.722.2 · G.723 · G.723.1 · G.726 · G.728 · G.729 · G.729.1 · G.729a G.711 chuẩn ITU-T dùng cho thoại chủ yếu hệ thống tổng đài, đựơc phát hành thức vào năm 1972 G.711 trình bày mẫu điều chế xung mũ logarit cho tín hiệu băng tần thoại, tần số lấy mẫu 8000 mẫu giây Có hai giải thuật định nghĩa chuẩn này, giải thuật µ-law dùng khu vực Bắc Mỹ, Nhật giải thuật A-law dùng khu vực Châu Âu nước lại Cả hai giải thuật điều tính tốn mũ logarit, giải thuật A-law thiết kế đặc biệt cho mục đích thực phép tính q trình tính tốn cho đơn giản hơn, chuẩn định nghĩa chuỗi giá trị mã lặp lại có mức cơng suất dB Hai giải thuật µ-law mã hóa dạng mẫu PCM tuyến tính 14-bit A-Law 13-bit với mẫu 8-bit Như vậy, mã hóa G.711 tạo luồng liệu bit có tốc độ 64kbit/giây với tần số lấy mẫu 8kHz G.722 chuẩn ITU-T dùng cho mã hóa tiếng nói băng tần rộng hoạt động với tốc độ truyền 32-64 kbit/giây Cơng nghệ mã hóa dựa việc phân chia băng tần ADPCM G.722.1 cung cấp việc nén liệu với tốt độ bit thấp Một biến thể G722.1 G.722.2, biết tên AMR-WB (Adaptive Multirate Wideband), cho phép việc nén với tốc độ thấp nữa, đáp ứng tốt với kiểu nén khác thay đổi địa hình mạng Trong trường hợp sau, băng thơng tự động bảo tồn có nghẽn mạch cao Khi việc nghẽn quay trở mức bình thường, chế độ tốc độ bit cao mức nén thấp phục hồi Chuẩn G.722 liệu mẫu âm tốc độ 16kHz, gấp đôi tốc độ xử lý giao tiếp thoại truyền thống, kết chất lượng thoại tốt Chuẩn G.722.1, biết qua tên khác “Siren™”, chuẩn quốc tế cho mã hóa âm băng rộng tốc độ 24 32 kbps (băng thông thoại 50Hz-7kHz, tần số lấy mẫu 16 ksps)tốc độ 16kb/giây), sử dụng hệ thống hội nghị truyền hình phê chuẩn vào 30 tháng 09 năm 1999 Chuẩn G.722.1 nén dựa biến đổi cho tối ưu hóa âm thoại lẫn nhạc Độ phức tạp tính tốn tương đối thấp nén chất lượng cao, độ trễ giải thuật hai điểm đầu cuối 40ms Phiên G.722.1/Annex C, phê chuẩn ITU-T vào 14 tháng 05 năm 2005, biết thơng qua tên Siren14™, phát triển Polycom với dạng không cần quyền truyền với tần số 14kHz (32ksps) 164 CuuDuongThanCong.com https://fb.com/tailieudientucntt Số lượng mã hóa âm băng tần rộng ITU đơi khơng hiểu xác Thực tế, có ba loại mã hóa phân biệt, điều có chung tên G.722 Đầu tiên, G.722 mã hóa với tần số 7kHz, sử dụng ADPCM hoạt động với tốc độ truyền 48-64kbps Một phiên khác G.722.1 hoạt động với tốc độ liệu nửa có chất lượng tốt G.722 với phương pháp mã hóa dựa vào tảng chuyển đổi Và chuẩn G.722.2, hoạt động với âm thoại băng tần rộng với tốc độ bit truyền thấp, sử dụng giải thuật CELPbased Về vấn đề quuyền, đến thời điểm này, giấy đăng ký quyền cho G.722 hết hạn, chuẩn xem chuẩn miễn phí G.722.1 thuộc quyền tập đồn Polycom chuẩn G.722.2 có tên AMR-WB, thuộc quyền sở hữu tập đoàn VoiceAge G.722.2 (GSM AMR WB) Adaptive Multi Rate - WideBand hay AMR-WB chuẩn mã hóa tiếng nói phát triển sau AMR sử dụng công nghệ tương tự ACELP Mã cung cấp chất lượng âm thoại tuyệt vời sử dụng băng tần thoại rộng 50-7000 Hz so sánh với mã âm thoại băng hẹp dùng rộng rãi POTS với 300-3400Hz AMRWB hệ thống hóa thành G.722.2, chuẩn mã hóa âm thoại chuẩn ITU-T Các trạng thái hoạt động ẢM: AMR-WB hoạt động tương tự AMR với nhiều tốc độ bit khác gồm: 6.60; 8.85; 12.65; 14.25; 15.85; 18.25; 19.85; 23.05 23.85 kbps Tín hiệu truyền với tốc độ thấp cho chất lượng thoại tốt ứng với môi trường không nhiễu 12.65 kbps Tốc độ bit cao hữu dụng mơi trường có nhiễu trường hợp tín hiệu truyền âm nhạc Tốc độ bit 6.60 8.85 cung cấp chát lượng chấp nhận so sánh với mã hóa băng tần hẹp AMR-WB chuẩn hóa cho việc sử dụng tương lai hệ thống mạng UMTS Chuẩn cung cấp chất lượng thoại tốt nhiều chọn dùng cho nhiều mạng cũ hỗ trợ cho băng rộng Tháng 10 năm 2006, kiểm nghiệm AMR-WB thực hệ thống mạng thực T-Mobile Ericssion phối hợp Đức G.723 chuẩn ITU-T mã hóa âm thoại băng tần rộng, chuẩn mở rộng G.721 điều chế xung sai phân tương thích với tốc độ truyền 24 40 kbps cho ứng dụng thiết bị nhân mạch số, G.723 thay chuẩn G.276, chuẩn lỗi thời Chuẩn G.723.1 chuẩn mã hóa âm cho thoại với tính nén thoại khung 30 mili giây, chu kỳ 7.5ms sử dụng Nhạc âm tone DTMF fax ton truyền tin cậy với chuẩn mã hóa này, số phương pháp khác nhưu G.711 phương pháp dãy băng tần dùng để truyền tín hiệu Chuẩn G.723.1 chủ yếu dùng ứng dụng Voice over IP (VoIP) yêu cầu băng thơng thấp Nó trở thành chuẩn ITU-T vào năm 1995, điều phức tạp giải thuật yêu cầu 16MIPS với 2.2kByte RAM 165 CuuDuongThanCong.com https://fb.com/tailieudientucntt Có hai tốc độ bit mà G.723.1 hoạt động: o o 6.3 kbit/s (sử dụng khung 24 byte), dùng giải thuật MPC-MLQ (MOS 3.9) 5.3 kbit/s (sử dụng khung 20 byte) dùng giải thuật ACELP (MOS 3.62) G.726 chuẩn mã hóa tiếng nói ITU-T ADPCM truyền âm với tốc độ 16, 24, 32, 40 kbps Là chuẩn thay cho G.721 (ADPCM tốc độ 32kbps) chuẩn G.723 (ADPCM với tốc độ 24 40 kbps) G.726 hoạt động với tần số 16 kbps Bốn tốc độ bit thường sử dụng cho chuẩn G.726 tương ứng với kích thước mẫu theo thứ tự 2-bits, 3-bits, 4-bits, 5-bits Tốc độ thường dùng 32 kbps, tốc độ nửa so với chuẩn G.711, làm gia tăng dung lượng củ mạng lên 50% Thông thường dùng mạng điện thoại quốc tế hệ thống điện thoại không dây DECT G.721 giới thiệu lần vào năm 1984, chuẩn G.723 giới thiệu vào năm 1988 Cả hai gộp chung thành chuẩn G.726 vào năm 1990 G.727 giới thiệu thời điểm với G.726, tốc độ bít tối ưu cho mơi trường PCME Packet Circuit Multiplex Equipment Điều đạt cách nhúng lượng tử hóa bit vào lượng tử hóa bit, cho phép hủy bỏ bit có trọng số nhỏ chuỗi bit truyền mà khơng có ảnh hưởng xấu đến tín hiệu âm thoại G.728 chuẩn ITU-T mã hóa âm thoại với tốc độ 16kbps Công nghệ sử dụng LDCELP, Low Delay Code Excited Linear Prediction Độ trễ mã mẫu ( 0.625 ms) Dự đốn tuyến tính thực tính tốn với lọc LPC ngược bậc 50 Ngõ vào kích thích tạo để đảm bảo nhận độ lợi VQ Chuẩn đưa vào năm 1992 dạng giải thuật mã dấu chấm động Năm 1994, dùng cho dấu chấm tĩnh phát hành G.728 có tốc độ lên đến 2400 bps Độ phức tạp bảng mã 30 MIPS, với yêu càu 2.2kByte RAM G.729 giải thuật nén liệu âm dùng cho tín hiệu thoại, nén tín hiệu âm với khung 10 mili giấy Các tone nhạc DTMF fax truyền với mã hóa này, mà phải sử dụng G.711 phương pháp ngoại băng tần để truyền tín hiệu G.729 đa số dùng ứng dụng Voice over IP (VoIP) với yêu cầu băng tần thấp Chuẩn G.729 hoạt động tốc độ kbps, phiên mở rộng hoạt động 6.4 kbps môi trường truyền xấu 11.8 kbps với yêu cầu chất lượng thoại tốt Trong thực tế, người ta thường dùng chuẩn G.729a, tương tự G.729 có độ tính tốn đơn giản hơn, nhiên chuẩn lại không cho chấtl lượng thoại tốt Phiên G.729b chuẩn có quyền, sử dụng module VAD để phát tín hiệu thoại hay phi thoại Nó bao gồm module DTX dùng để định nâng cấp thông số nhiễu cho tín hiệu phi thoại (các khung nhiễu) Các khung truyền để thực việc nâng cấp gọi khung SID Một tạo nhiễu (CNG) tích hợp chuẩn này, kênh truyền, việc truyền bị dừng lại lý tín hiệu tín hiệu phi thoại, site lại xem đường kết nối bị đứt Vì sử dụng chuẩn cần phải thận trọng 166 CuuDuongThanCong.com https://fb.com/tailieudientucntt Những năm gần đây, chuẩn G.729 nghiên cứu mở rộng để hỗ trợ cho tín hiệu âm thoại băng tần rộng mã hóa âm thành chuẩn G.729.1 Bộ mã hóa G.729.1 thiết kế theo mơ hình phân cấp, tốc độ bit chất lượng điều hiệu chỉnh đơn giản cách thức cắt giảm chuỗi bit truyền G.729.1 thêm chức băng tần rộng so với G.729 thông qua lớp nhúng vào Lớp G.729 (12kps) dạng băng tần hẹp 14 kbps thêm vào chất lượng băng tần rộng thơng qua việc tái tạo phổ, sử dụng đóng gói thời gian đóng gói tần số (có tốc độ truyền cộng thêm 2kbps) Các lớp khác ( ứng với từn bước kbps) thêm nhiều thông tin nội dung phổ tần số cao làm gia tăng chất lượng tín hiệu Các mã phát triển phối hợp tổ chức: France Telecom, tập đoàn Mitsubishi Electric, tập đoàn Nippon Telegraph Telephone (NTT), Université de Sherbrooke Các tiêu chuẩn ITU- T cho hình ảnh Video Chuẩn H.261 chuẩn ITU mã hóa tín hiệu video năm 1990 đưa để truyền hệ thống đường dây ISDN với tốc độ liệu số nhân 64 kbps Tốc độ liệu giải thuật mã hóa đưa để hoạt động 40 kbps Mbps Chuẩn hỗ trợ khung video CIF QCIF với độ phân giải 352x288 176x144 theo thứ tự tương ứng (và 4:2:0 mẫu với độ phân giải màu 176x144 88x72 theo thứ tự tương ứng) Chuẩn xét đến tình dự phòng cho việc truyền hình với độ phân giải 704x576 ( hiệu chỉnh vào năm 1994) Chuẩn H.261 chuẩn mã hóa tín hiệu video số áp dụng thực tế Việc thiết kế chuẩn H.261 nỗ lực tiên phong, chuẩn mã hóa video tồn cầu sau (MPEG-1, MPEG-2/H.262, H.263, H.264) chủ yếu dựa chuẩn Ngoài ra, cac phương pháp sử dụng hội đồng phát triển H.261 (đứng đầu Sakae Okubo) cộng tác phát triển chuẩn ứng dụng cơng việc chuẩn hóa chuẩn sau lĩnh vực Giải thuật mã hóa sử dụng hybrid chuyển dộng ước đốn hình ảnh nội mã hóa truyền không gian với việc lượng tử vô hướng, phân hình theo kiểu zig-zac mã hóa entropy 2.1 Chuẩn H.261 Quá trình việc thiết kế gọi macroblock Mỗi macroblock bao gồm dãy 16x16 mẫu luma hay dãy mẫu chroma 8x8 dùng việc lấy mẫu 4:2:0 khơng gian màuYCbCr Dự đốn hình ảnh nội thực laọi bỏ dư thừa tạm thơi, với vector chuyển động dùng để hỗ trợ cho việc bù mã hóa cho việc di động Mã di chuyển sử dụng chuyển đổi cosin rời rạc 8x8 (DCT) dùng để loại bỏ dư thừa thuộc không gian, hệ số biến đổi lượng tử phân hình theo kiểu zig-zac mã hóa entropy (dùng mã RunLevel variable-length) để loại bỏ dư thừa thống kê Chuẩn H.261 thật định rõ cách để giải mã video Các nhà thiết kế mã hóa tự việc đưa giải thuật mã hóa riêng họ, với tín hiệu ngõ mã hóa khơng tự nhiên nhằm mục đích giải mã giải mã miễn thiết kế theo chuẩn Các mã hóa thiết kế tuỳ ý 167 CuuDuongThanCong.com https://fb.com/tailieudientucntt nhằm thực trình tiền xử lý mà chúng muốn ngõ vào video ưu tiên mặc định thực Một kỹ thuật hiệu vấn đề hậu xử lý trở thành phần tử yếu hệ thống tốt dựa chuẩn H.261 lọc giải khóa Nó thực việc giảm xuất vật nhân tạo nhiễu có dạng hình khối gây việc bù di động theo dạng khối phần chuyển đổi việc thiết kế tạo Việc lọc giải khóa trở thành phần tích hợp hầu hết chuẩn nay, H.264 (ngay sử dụng chuẩn H.264, việc hậu xử lý cho phép thực hịên cho chất lượng cao) Việc lọc đề cập việc chuẩn hóa có ảnh hưởng đến việc cải tiến quan trọng khả nén thiết kế H.261 Tuy nhiê, H.261 định hướng lịch sử lãnh vực phát triển mã hóa video 2.2 Chuẩn H.262 Chuẩn H.262 chuẩn mã hóa video số ITU-T Chuẩn liên quan đến phần video chuẩn ISO/IEC MPEG-2 (được biết tên ISO/IEC 13818-2) Chuẩn phát triển hợp tác ITU-T tổ chức ISO/IEC JTC 1, trở thành chuẩn chung cho hai tổ chức ITU-T Recommendation H.262 ISO/IEC 13818-2 phát triển phát hành dạng chuẩn quốc tế Hai tài liệu mô tả hầu hết tất khía cạnh chuẩn 2.3 Chuẩn H263 Chuẩn H.263 chuẩn mã hóa ITU-T thiết kế vào năm 1995/1996 dùng cho giải pháp mã hóa nén tốc độ truyền thấp cho dịch vụ hội nghị truyền hình Mã thiết kế hệ thống H.324 (PSTN mạch chuyển mạch mạch khác truyền dịch vụ hội nghị truyền hình điện thoại truyền hình), hệ thốgn dùng mã H.323 (hội nghị truyền hình RTP/IP-based), H.320 (hội nghị truyền hình ISDN-based), RTSP (phương tiện truyền thơng dạng streaming) SIP (hội nghị Internet) Hầu hết nội dung Flash Video( dùng site YouTube, Google Video, MySpace, v.v….) mã hóa dạng định dạng này, có site sử dụng mã hóa VP6, hỗ trợ phiên Flash Tín hiệu video H.263 giải mã thư viện phi quyền LGPL-licensed dùng chương trình ffdshow, VLC media player MPlayer Chuẩn H.263 phát triển phiên nâng cấp dựa chuẩn H.261, chuẩn MPEG-1, MPEG-2 Phiên hoàn thành vào năm 1995 hoàn toàn phù hợp việc thay cho H.261 với tất tốc độ truyền Hiện có phiên H.263v2 (còn gọi chuẩn H.263+ 1998) chuẩn H.263v3 (H.263++ 2000) Chuẩn mã hóa ITU-T sau H.263 H.264, có tên AVC MPEG-4 phần thứ 10 Hầu hết sản phẩm hội nghị truyền hình cơng nghệ ln tích hợp ba chuẩn H.264, H.263 H.261 2.4 Chuẩn H264 168 CuuDuongThanCong.com https://fb.com/tailieudientucntt Chuẩn H.264, MPEG-4 Part 10, hay AVC (dùng cho Advanced Video Coding), chuẩn mã hóa video số với độ nén cực cao, kết ITU-T Video Coding Experts Group (VCEG) kết hợp với ISO/IEC Moving Picture Experts Group (MPEG), xem sản phẩm thương mại Joint Video Team (JVT) Chuẩn ITU-T H.264 ISO/IEC MPEG4 Part 10(ISO/IEC 14496-10) ứng dụng công nghệ lý tưởng Phiên nháp hoàn thành vào tháng 05 năm 2003 Chuẩn H.264 đặt tên theo dòng ITU-T H.26x chuẩn video, tên AVC đặt tên dựa theo tên dự án hợp tác, với tên dự án H.26L Chuẩn gọi tên khác H.264/AVC, AVC/H.264, H.264/MPEG-4 AVC, MPEG-4/H.264 AVC nhằm nhấn mạnh tính kế thừa Đơi khi, gọi “mã hóa JVT” với lý tổ chức JVT phát triển Mục đích dự án H.264/AVC tạo chuẩn có khả cung cấp tín hiệu video chất lượng cao với tốc độ bit truyền thấp, nhỏ hay nửa so với tốc độ chuẩn trước ( MPEG-2, H.263, hay MPEG-4 Part 2) với tính ứng dụng cao thực tế Ngoài ra, chuẩn phải đáp ứng yêu cầu cung cấp cách thức linh động cho phép chuẩn ứng dụng rộng rãi nhiều trình ứng dụng ( ví dụ cho tốc độ bit cao thấyp độ phân giải cao thấp, chạy ổn định nhiều hệ thống mạng ( cho việc broadcast, lưu trữ DVD, mạng gói RTP/IP, hệ thống tổng đài phương tiện ITU-T) 2.5 Chuẩn JVT Chuẩn JVT hoàn thành việc nâng cấp, phát triển số tính mở rộng so với chuẩn nguyên thuỷ, biết tên Fidelity Range Extensions (FRExt) Các phiên mở rộng hỗ trợ mã hóa video với độ trung thực cao cách thức gia tăng độ xác lấy mẫu (bao gồm mã hóa 10-bit 12-bit) với thơng tin màu độ phân gải cao (gồm cấu trúc lấy mẫu YUV 4:2:2 YUV 4:4:4) Một số tính khác dự án Fidelity Range Extensions ( phép biến đổi số ngun chuyển mạch tương thích 4×4 8×8, ma trận trọng số lượng tử hóa dựa giác quan, mã hóa khơng mát hình nội hiệu quả, hỗ trợ không gian màu cộng thêm phép biến đổi màu số dư) Công việc thiết kế dự án hoàn thành vào tháng năm 2004 phiên nháp mắt vào tháng 09 năm 2004 169 CuuDuongThanCong.com https://fb.com/tailieudientucntt TÀI LIỆU THAM KHẢO Anil K Jain, Fundamentals of Digital Image Processing, Prentice Hall, 1988 J R Parker, Algorithms for Image Processing and Computer Vision, Wiley, 1996 Alan C Bovik , Handbook of Image and Video Processing, Academic Press, 2000 John R Deller, John H L Hansen, John G Proakis, Discrete-Time Processing of Speech Signals, Wiley-IEEE Press, 1999 R C Gonzalez, R E Woods, Steven L Eddins, Digital Image Processing Using MATLAB, Prentice Hall, 2003 R C Gonzalez, R E Woods Digital Image Processing , Prentice Hall, 2002 William K Pratt, Digital Image Processing: PIKS Inside, Third Edition © 2001 John Wiley & Sons, Inc Michael Robin & Michel Poulin, Digital Television Fundamental, McCraw-Hill Companies Inc 10 Đỗ Hoàng Tiến, Dương Thanh Phương Truyền hình kỹ thuật số NXB Khoa học kỹ thuật, 2004 11 Lương Mạnh Bá, Nguyễn Thanh Thủy, Nhập môn xử lý ảnh số, NXB Khoa học kỹ thuật, 1999 170 CuuDuongThanCong.com https://fb.com/tailieudientucntt MỤC LỤC LỜI NÓI ĐẦU CHƯƠNG KỸ THUẬT XỬ LÝ ÂM THANH 1.1 TỔNG QUAN VỀ XỬ LÝ ÂM THANH 1.1.1 Giới thiệu sơ lược âm & hệ thống xử lý âm 1.1.2 Nhắc lại số khái niệm tốn học xử lý âm 1.2 MƠ HÌNH XỬ LÝ ÂM THANH 10 13 1.2.1 Các mô hình lấy mẫu mã hố thoại 1.2.2 Các mơ hình dùng xử lý âm 1.2.3 Mơ hình thời gian rời rạc 13 19 27 1.3 LÝ THUYẾT VÀ CÁC BÀI TỐN CƠ BẢN 30 1.3.1 Phân tích dự đốn tuyến tính 1.3.2 Dự đốn tuyến tính xử lý thoại 30 36 1.4 PHÂN TÍCH CHẤT LƯỢNG XỬ LÝ THOẠI 1.4.1 Các phương pháp mã hoá 1.4.2 Các tham số liên quan đến chất lượng thoại 1.4.3 Các phương pháp đánh giá chất lượng thoại 1.5 MƠ HÌNH ỨNG DỤNG XỬ LÝ THOẠI 40 40 41 41 48 1.5.1 Mơ hình thời gian động 1.5.2 Mơ hình chuỗi markov ẩn 1.5.3 Mạng nơron 48 53 55 CHƯƠNG 2: KỸ THUẬT XỬ LÝ ẢNH 60 2.1 TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ VIDEO SỐ 2.1.1 Khái niệm xử lý ảnh 2.1.2 Lĩnh vực ứng dụng kỹ thuật xử lý ảnh 2.1.3 Các giai đoạn xử lý ảnh 2.1.4 Các phần tử hệ thống xử lý ảnh số 2.1.5 Biểu diễn ảnh số 2.1.6 Lý thuyết toán ứng dụng xử lý ảnh video số 60 60 61 62 64 67 92 2.2 PHÂN TÍCH CÁC KỸ THUẬT XỬ LÝ ẢNH VÀ VIDEO 106 2.2.1 Khái niệm quan hệ điểm ảnh 2.2.2 Các phương pháp xác địnhvà dự đóan biên ảnh 106 109 2.3 CÁC KỸ THUẬT NÉN ẢNH 115 2.3.1 Giới thiệu chung kỹ thuật nén ảnh 2.3.2 Phương pháp nén ảnh JPEG 2.3.3 Chuẩn nén MPEG 2.3.4 Ứng dụng đánh giá khả kinh tế tiêu chuẩn nén 115 121 140 162 PHỤ LỤC: GIỚI THIỆU CÁC TIÊU CHUẨN MÃ HĨA ÂM THANH VÀ HÌNH ẢNH TRONG TRUYỀN THƠNG ĐA PHƯƠNG TIỆN 164 171 CuuDuongThanCong.com https://fb.com/tailieudientucntt Các tiêu chuẩn ITU- T cho âm 164 Các tiêu chuẩn ITU- T cho hình ảnh Video 167 TÀI LIỆU THAM KHẢO 170 172 CuuDuongThanCong.com https://fb.com/tailieudientucntt XỬ LÝ ÂM THANH, HÌNH ẢNH Mã số: 411XAH450 Chịu trách nhiệm thảo TRUNG TÂM ÐÀO TẠO BƯU CHÍNH VIỄN THƠNG CuuDuongThanCong.com https://fb.com/tailieudientucntt ... https://fb.com/tailieudientucntt CHƯƠNG KỸ THUẬT XỬ LÝ ÂM THANH 1.1 TỔNG QUAN VỀ XỬ LÝ ÂM THANH 1.1.1 Giới thiệu sơ lược âm & hệ thống xử lý âm 1.1.1.1 Đặc tính âm tương tự [1] Mục đích lời nói dùng để... xử lý âm tốt thiết bị cổ điển, tiêu chuẩn xử lý khơng có thay đổi, cơng nghệ xử lý tốt Trong hệ thống xử lý âm tương tự, thông tin truyền đạt thông số liên tục biến thiên vô hạn Hệ thống xử lý. .. THƠNG XỬ LÝ ÂM THANH, HÌNH ẢNH Biên soạn : TS NGUYỄN THANH BÌNH THS VÕ NGUYỄN QUỐC BẢO CuuDuongThanCong.com https://fb.com/tailieudientucntt LỜI NĨI ĐẦU Tài liệu hướng dẫn học tập môn "Xử lý âm hình