Đề thi và đáp án môn xử lý dữ liệu đa phương tiện

33 1.4K 5
Đề thi và đáp án môn xử lý dữ liệu đa phương tiện

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

1.Trình bày sơ đồ nguyên lý phương pháp mã hóa dải tần (Subband Coding – SBC) (Câu 1,1 – Đề 1) (Câu 1,1 – Đề 5). Giải thích vai trò của băng lọc số (Digital Filter Banks) trong nguyên lý giảm tần số lấy mẫu và nội suy của phương pháp này (Subsampling and Interpolation with Band pass Filters) (Câu 2,1 – Đề 4).Trả lời:Xét sơ đồ nguyên lý của phương pháp mã hóa dải tần con (Subband Coding – SBC) trong trường hợp tín hiệu 1 chiều rời rạc. Phương pháp mã hóa SBC bao gồm các bước sau: Subband và CodingQuá trình subband được thực hiện như sau:•Lọc phân tích: tín hiệu ban đầu được đưa qua các bộ lọc nhằm chia tín hiệu thành các thành phần tín hiệu ứng với các dải tần không bị chồng nhau.•Tín hiệu của các các dải tần sau khi đi qua bộ lọc được giảm tần số lấy mẫu đi M lần (M là số dải tần chia tín hiệu).Quá trình Coding: là quá trình thực hiện lượng tử hóa và mã hóa riêng trên các dải tần số. Quá trình này đòi hỏi phương pháp lượng tử hóa và mã hóa, thực hiện phân phối dòng bit dựa trên tín chất của dòng tín hiệu sau bộ lọc. Đây là bước mang lại hiệu quả nén cho toàn bộ quá trình mã hóa SBC. Trong đó, phân phối bit là việc phân chia số bit hiện có cho mã hóa từng dải, dựa theo tín hiệu của từng dải do trong từng dải, lượng thông tin là khác nhau. Phân phối bit ảnh hưởng lớn đến khôi phục dữ liệu sau quá trỉnh giải nén.Giải thích vai trò của băng lọc số trong giảm tần số lấy mẫu và nội suy của phương pháp SBC: Vai trò của băng lọc số (Digital Filter Banks): Băng lọc số trong phương pháp SBC giúp phân tách tín hiệu nguồn ban đầu thành các tín hiệu trên các băng tần khác nhau, phục vụ cho việc mã hóa. Trong quá trình giải mã, băng lọc số sẽ kết hợp các tín hiệu trên các băng tần khác nhau để có thể khôi phục được tín hiệu ban đầu.Việc giảm tần số lấy mẫu của tín hiệu sau bộ lọc làm phổ tín hiệu rộng ra, trải hết trên trục tần số, nên số mẫu lúc này cũng giảm theo. Giảm tần số lấy mẫu được thực hiện dựa trên định lý lấy mẫu Nyquist và hệ quả của định lý Nyquist. Tỷ lệ giảm tần số lấy mẫu phụ thuộc vào tỷ lệ giữa dải thông của bộ lọc với dải tần tín hiệu vào2.Trình bày và giải thích sơ đồ mã hóa SBC dùng trong nén ảnh JPEG2000 như thế nào? (Câu 1,2 – Đề 1). Giải thích kỹ thuật xử lý đa phân giải được áp dụng như thế nào trong sơ đồ này (Câu 2,2 – đề 4)Trả lời: (Câu này không rõ ý hỏi của câu hỏi, nên chỉ làm tạm thời).Trong nén ảnh JPEG2000, sơ đồ mã hóa SBC được sử dụng là sơ đồ kỹ thuật băng lọc thông thấp thông cao: Đầu vào của sơ đồ là tín hiệu gốc ban đầu, được cho qua 2 bộ lọc thông thấp – thông cao, sau quá trình này sẽ thu được 2 dải tần con tương ứng với hai bộ lọc, tín hiệu tương ứng hai dải tần con này sẽ được lấy mẫu xuống hai lần. Quá trình này sẽ được tiếp tục với hai băng tần con này, tùy thuộc vào ứng dụng mà người thiết kế có thể sử dụng bao nhiêu băng lọc. Kỹ thuật xử lý đa phân giải được áp dụng trong sơ đồ: Trong sơ đồ này, quá trình subsampling hay còn gọi là giảm tần số lấy mẫu đi 2 lần chính là quá trình xử lý đa phân giải. Xét với ảnh, việc giảm tần số lấy mẫu chính là giảm độ phân giải, tùy thuộc vào số lượng băng lọc mà có thể xác định các độ phân giải khác nhau. Ví dụ: Ảnh ban đầu có độ phân giải NxN pixels, trước hết áp dụng bộ lọc theo chiều ngang cho từng dòng của dữ liệu ảnh với một bộ lọc thông thấp và một bộ lọc thông cao, sau đó giảm tần số lấy mẫu ở đầu ra của 2 bộ lọc đi 2 lần, ta được 2 ảnh mới có kích thước (NxN)2. Tiếp theo, áp dụng 2 bộ lọc thông thấp và thông cao theo chiều dọc của 2 ảnh mới, ở đầu ra của 2 bộ lọc tiếp tục giảm tần số lấy mẫu đi 2 lần, ta thu được 4 ảnh có kích thước N2 x N2 pixels. 3.Trình bày và giải thích sơ đồ mã hóa SBC dùng trong mã hóa âm thanh dải rộng như thế nào? (Câu 1,3 – Đề 1) (Câu 2,3 – đề 4)Trả lời:Sơ đồ mã hóa SBC dùng trong mã hóa âm thanh Đề chỉ yêu cầu trình bày sơ đồ MÃ HÓA thôi, sơ đồ giải mã ko cần nêuĐặc điểm của các khối chức năng trong sơ đồ mã hóa (sơ đồ a), và sơ đồ giải mã (sơ đồ b). Đầu vào của sơ đồ mã hóa là tín hiệu gốc ban đầu, đầu ra của sơ đồ là các dòng bit.•Khối TimeFrequency Mapping: Đây là khối được sử dụng để chia tín hiệu đầu vào thành các dải tần con (subband), khối này thường là các băng lọc với nhiều bộ lọc có đáp ứng tần số khác nhau. Đối với âm thanh dải rộng, kỹ thuật băng lọc thông dải được sử dụng, bao gồm M băng lọc thông dải, sau khi tín hiệu đi qua M băng lọc sẽ thu được M dải tần tương ứng với từng bộ lọc. Sau đó thực hiện giảm tần số lấy mẫu của mỗi băng tần con đi M lần. •Khối Psychoacoustic Model: khối này đầu vào là tín hiệu gốc và tín hiệu sau khi đã được chia thành các subbands. Khối này được sử dụng để tính toán các hiệu ứng che của tín hiệu đưa vào dựa trên mô hình cảm thụ âm thanh của con người. Tín hiệu này được đưa vào khối này được tính toán để tìm ra các thành phần tần số có năng lượng nhỏ dưới ngưỡng nghe và các thành phần tần số bị che bởi các thành phần tần số trên các dải tần khác. Từ đó tính ra ngưỡng che cho mỗi dải tần và đưa tới khối lượng tử hóa để tiến hành lượng tử. Độ rộng về thời gian của khối tín hiệu đưa vào khối Psychoacoustic Model để tiến hành phân tích càng lớn ta thu được hiệu quả nén càng cao. •Khối lượng tử hóa và mã hóa (Quantizer and Coding): Khối có đầu vào là các subband được chia sau khi tín hiệu gốc đi qua băng lọc và các hiệu ứng che được tính toán từ khối Psychoacoustic Model. Nhiệm vụ của khối này là tiến hành lượng tử hóa tín hiệu trên các subbands một cách phù hợp sao cho số bit sử dụng cho mỗi subband là ít nhất (nhưng vẫn phải đảm bảo chất lượng của tín hiệu) và sau đó mã hóa tín hiệu trên các subband với phương pháp mã hóa như Huffman, mã hóa đại số… Ngoài ra, mỗi subband đều có ngưỡng nghe riêng, khối lượng tử hóa làm nhiệm vụ lượng tử tín hiệu của mỗi subband với đủ số bit để duy trì khoảng cách giữa nhiễu do lượng tử và ngưỡng nghe của mỗi subband. Như vậy ta có thể giảm được số bit cần để lượng tử hóa mỗi mẫu tín hiệu của subband tùy thuộc vào ngưỡng che của subband tương ứng nhờ vậy ta có thể tăng được hiệu quả nén dữ liệu.•Khối Frame Packing: Dữ liệu sau khi ta lượng tử và mã hóa được đưa vào khối này để đóng gói thành các frame và chuyển đi trong hệ thống mạng.

TỔNG HỢP CÁC CÂU HỎI THI Câu số 1: Phương pháp SBC (Câu – Đề vs Câu – Đề vs Câu – Đề 5) Trình bày sơ đồ nguyên lý phương pháp mã hóa dải tần (Subband Coding – SBC) (Câu 1,1 – Đề 1) (Câu 1,1 – Đề 5) Giải thích vai trò băng lọc số (Digital Filter Banks) nguyên lý giảm tần số lấy mẫu nội suy phương pháp (Subsampling and Interpolation with Band pass Filters) (Câu 2,1 – Đề 4) Trả lời: Xét sơ đồ nguyên lý phương pháp mã hóa dải tần (Subband Coding – SBC) trường hợp tín hiệu chiều rời rạc Phương pháp mã hóa SBC bao gồm bước sau: Subband Coding Quá trình subband thực sau: • Lọc phân tích: tín hiệu ban đầu đưa qua lọc nhằm chia tín hiệu thành thành phần tín hiệu ứng với dải tần không bị chồng • Tín hiệu các dải tần sau qua lọc giảm tần số lấy mẫu M lần (M số dải tần chia tín hiệu) Quá trình Coding: trình thực lượng tử hóa mã hóa riêng dải tần số Quá trình đòi hỏi phương pháp lượng tử hóa mã hóa, thực phân phối dòng bit dựa tín chất dòng tín hiệu sau lọc Đây bước mang lại hiệu nén cho toàn trình mã hóa SBC Trong đó, phân phối bit việc phân chia số bit có cho mã hóa dải, dựa theo tín hiệu dải dải, lượng thông tin khác Phân phối bit ảnh hưởng lớn đến khôi phục liệu sau trỉnh giải nén Giải thích vai trò băng lọc số giảm tần số lấy mẫu nội suy phương pháp SBC: Vai trò băng lọc số (Digital Filter Banks): Băng lọc số phương pháp SBC giúp phân tách tín hiệu nguồn ban đầu thành tín hiệu băng tần khác nhau, phục vụ cho việc mã hóa Trong trình giải mã, băng lọc số kết hợp tín hiệu băng tần khác để khôi phục tín hiệu ban đầu Việc giảm tần số lấy mẫu tín hiệu sau lọc làm phổ tín hiệu rộng ra, trải hết trục tần số, nên số mẫu lúc giảm theo Giảm tần số lấy mẫu thực dựa định lý lấy mẫu Nyquist hệ định lý Nyquist Tỷ lệ giảm tần số lấy mẫu phụ thuộc vào tỷ lệ dải thông lọc với dải tần tín hiệu vào Trình bày giải thích sơ đồ mã hóa SBC dùng nén ảnh JPEG2000 nào? (Câu 1,2 – Đề 1) Giải thích kỹ thuật xử lý đa phân giải áp dụng sơ đồ (Câu 2,2 – đề 4) Trả lời: (Câu không rõ ý hỏi câu hỏi, nên làm tạm thời) Trong nén ảnh JPEG-2000, sơ đồ mã hóa SBC sử dụng sơ đồ kỹ thuật băng lọc thông thấp thông cao: Đầu vào sơ đồ tín hiệu gốc ban đầu, cho qua lọc thông thấp – thông cao, sau trình thu dải tần tương ứng với hai lọc, tín hiệu tương ứng hai dải tần lấy mẫu xuống hai lần Quá trình tiếp tục với hai băng tần này, tùy thuộc vào ứng dụng mà người thiết kế sử dụng băng lọc Kỹ thuật xử lý đa phân giải áp dụng sơ đồ: Trong sơ đồ này, trình subsampling hay gọi giảm tần số lấy mẫu lần trình xử lý đa phân giải Xét với ảnh, việc giảm tần số lấy mẫu giảm độ phân giải, tùy thuộc vào số lượng băng lọc mà xác định độ phân giải khác Ví dụ: Ảnh ban đầu có độ phân giải NxN pixels, trước hết áp dụng lọc theo chiều ngang cho dòng liệu ảnh với lọc thông thấp lọc thông cao, sau giảm tần số lấy mẫu đầu lọc lần, ta ảnh có kích thước (NxN)/2 Tiếp theo, áp dụng lọc thông thấp thông cao theo chiều dọc ảnh mới, đầu lọc tiếp tục giảm tần số lấy mẫu lần, ta thu ảnh có kích thước N/2 x N/2 pixels Trình bày giải thích sơ đồ mã hóa SBC dùng mã hóa âm dải rộng nào? (Câu 1,3 – Đề 1) (Câu 2,3 – đề 4) Trả lời: Sơ đồ mã hóa SBC dùng mã hóa âm Đề yêu cầu trình bày sơ đồ MÃ HÓA thôi, sơ đồ giải mã ko cần nêu Đặc điểm khối chức sơ đồ mã hóa (sơ đồ a), sơ đồ giải mã (sơ đồ b) Đầu vào sơ đồ mã hóa tín hiệu gốc ban đầu, đầu sơ đồ dòng bit • Khối Time/Frequency Mapping: Đây khối sử dụng để chia tín hiệu đầu vào thành dải tần (subband), khối thường băng lọc với nhiều lọc có đáp ứng tần số khác Đối với âm dải rộng, kỹ thuật băng lọc thông dải sử dụng, bao gồm M băng lọc thông dải, sau tín hiệu qua M băng lọc thu M dải tần tương ứng với lọc Sau thực giảm tần số lấy mẫu băng tần M lần • Khối Psychoacoustic Model: khối đầu vào tín hiệu gốc tín hiệu sau chia thành subbands Khối sử dụng để tính toán hiệu ứng che tín hiệu đưa vào dựa mô hình cảm thụ âm người Tín hiệu đưa vào khối tính toán để tìm thành phần tần số có lượng nhỏ ngưỡng nghe thành phần tần số bị che thành phần tần số dải tần khác Từ tính ngưỡng che cho dải tần đưa tới khối lượng tử hóa để tiến hành lượng tử Độ rộng thời gian khối tín hiệu đưa vào khối Psychoacoustic Model để tiến hành phân tích lớn ta thu hiệu nén cao • Khối lượng tử hóa mã hóa (Quantizer and Coding): Khối có đầu vào subband chia sau tín hiệu gốc qua băng lọc hiệu ứng che tính toán từ khối Psychoacoustic Model Nhiệm vụ khối tiến hành lượng tử hóa tín hiệu subbands cách phù hợp cho số bit sử dụng cho subband (nhưng phải đảm bảo chất lượng tín hiệu) sau mã hóa tín hiệu subband với phương pháp mã hóa Huffman, mã hóa đại số… Ngoài ra, subband có ngưỡng nghe riêng, khối lượng tử hóa làm nhiệm vụ lượng tử tín hiệu subband với đủ số bit để trì khoảng cách nhiễu lượng tử ngưỡng nghe subband Như ta giảm số bit cần để lượng tử hóa mẫu tín hiệu subband tùy thuộc vào ngưỡng che subband tương ứng nhờ ta tăng hiệu nén liệu • Khối Frame Packing: Dữ liệu sau ta lượng tử mã hóa đưa vào khối để đóng gói thành frame chuyển hệ thống mạng Tại có khác áp dụng SBC cho mã hóa ảnh mã hóa âm dải rộng (Câu 1,4 – Đề 1) Tại có khác áp dụng SBC cho mã hóa ảnh JPEG – 2000 mã hóa âm dải rộng MP3 (Câu 2,4 – Đề 4) (Câu 1,3 – Đề 5) Trả lời: (Về chất câu hỏi giống nhau, nên trả lời chung ý thứ cho câu) Sự khác áp dụng SBC cho mã hóa ảnh mã hóa âm dải rộng • Trong nén âm dải rộng, băng lọc sử dụng băng lọc thông dải có nhiều lọc với đáp ứng tần số khác nhau, nén ảnh sử dụng băng lọc thông thấp – thông cao • • • • • Nén âm dải rộng có khối tính toán hiệu ứng che, nén ảnh khối chức không cần thiết Nén ảnh loại bỏ thành phần tần số chứa thông tin sau trình lọc, nén âm dải rộng loại bỏ thành phần tần số dựa theo ngưỡng nghe Nén ảnh sau sử dụng mã hóa dự đoán DPCM lượng tử hóa vô hướng (Scalar Quantization) Trong nén âm dải rộng, lượng tử hóa cho số bit sử dụng cho subband mã hóa tín hiệu dựa subband phương pháp mã hóa Huffman, mã hóa đại số… Nén ảnh không cần có khối frame packing không cần đóng gói liệu sau lượng tử mã hóa thành frame Có khác do: ảnh âm có chất vật lý khác cách người cảm nhận hình ảnh âm khác Ảnh thông tin vật thể hay quang cảnh chiếu sáng mà người quan sát cảm nhận mắt hệ thống thần kinh thị giác Trong âm dao động học nguyên tử, phân tử hạt vật chất lan truyền không gian, cảm nhận trực tiếp qua tai người va đập vào màng nhĩ, làm rung màng nhĩ kích hoạt hệ thống thần kinh thính giác Và người nhạy cảm với âm so với hình ảnh Câu số 2: Phương pháp mã hóa dự đoán Trình bày sơ đồ nguyên lý phương pháp mã hóa dự đoán DPCM vai trò dự đoán (predictor) (Câu 1,1 – Đề 2) Hãy cho biết tỷ số nén mức độ tổn hao phụ thuộc vào khối xử lý sơ đồ này? (câu 2,1-Đề 3) Trả lời: + Trình bày sơ đồ nguyên lý phương pháp mã hóa DPCM vai trò dự đoán Sơ đồ nguyên lý phương pháp mã hóa dự đoán DPCM (Ở trình bày sơ đồ nguyên lý nên cần vẽ sơ đồ nêu vai trò khối chức đó) Trong sơ đồ này, có khối chức năng: • Bộ lấy mẫu: trính rời rạc hóa tín hiệu tương tự, bước chuyển tín hiệu mang thông tin dạng liên tục thành tín hiệu mang thông tin rời rạc, phương pháp lấy mẫu (Sampling) cho tín hiệu rời rạc phải mang đầy đủ thông tin tín hiệu tương tự, để tái tạo thông tin cách trung thực đầu thu • Bộ dự đoán (Predictor): Bộ dự đoán sử dụng để tính toán dự đoán mẫu tín hiệu theo mẫu thời điểm trước (tín hiệu tham chiếu) Trong trình dự đoán có sai số dự đoán (Predictor error) Cần phải phân biệt sai số dự đoán sai số lượng tử hóa o Sai số dự đoán (prediction error) chênh lệch giá trị dự đoán giá trị thực Nó không làm tổn thất thông tin dẫn đến làm suy giảm chất lượng ảnh Giá trị sai số định tốc độ bit giảm nhiều hay ít, tức ảnh hưởng đến hiệu suất nén o Sai số lượng tử hóa (quantization error) sai số đặc trưng cho tổn thất liệu dẫn đến làm suy giảm chất lượng ảnh phục hồi • Bộ mã hóa (Encoder): trình mã hóa sai số dự đoán + Hãy cho biết tỷ số nén mức độ tổn hao phụ thuộc vào khối xử lý sơ đồ này? Tỷ số nén phụ thuộc vào khối dự đoán vì: trình dự đoán mẫu dựa mẫu trước đó, đó, dự đoán xác mức độ sai khác giá trị mẫu thực với giá trị mẫu dự đoán nhỏ nên cần số lượng bit để mã hóa sai số dự đoán nên tốc độ bit giảm ngược lại, trình dự đoán khiến cho sai số dự đoán lớn ảnh hưởng đến số bit cần để mã hóa sai số dự đoán lớn tốc độ dòng bit lớn Vì vậy, tỷ số nén phụ thuộc vào khối dự đoán Mức độ tổn hao phụ thuộc vào khối lượng tử hóa (trong sơ đồ nên viết gộp lấy mẫu lượng tử hóa làm 1) vì: trình lượng tử hóa trình rời rạc hóa mẫu miền số nguyên, đó, liệu ban đầu số thực sau qua khối lượng tử hóa làm tròn thành số nguyên Do đó, tổn hao phụ thuộc vào khối lượng tử hóa Bộ dự đoán thực áp dụng DPCM nén ảnh video? Giải thích sơ đồ mã hóa DPCM nén video (Câu 1,2) – Đề 2) Trả lời: + Bộ dự đoán thực áp dụng DPCM nén ảnh video Dựa khái niệm mặt phẳng ảnh (frame) TV chuẩn bao gồm trường, trường gồm dòng quét chẵn/lẻ frame ảnh Ảnh truyền hình dự đoán dòng ảnh đơn (không chứa đựng tín hiệu âm thanh) Từ phương pháp quét, có phương pháp dự đoán nén ảnh video sau: • Dự đoán Intrafield (Intrafield Prediction): Chỉ sử dụng điểm ảnh (pixel) thuộc ½ frame ảnh (hay gọi mảnh) để tạo dự đoán Dự đoán mảnh không tận dụng quan hệ điểm ảnh lân cận theo chiều đứng nên cho sai số dự đoán cao • Dự đoán Intraframe (Intraframe Prediction): Với hỗ trợ nhớ mảnh, dự đoán ảnh sử dụng tất điểm ảnh (pixel) thuộc hai mảnh mọt khung để tạo dự đoán Như lợi dụng quan hệ tương hỗ điểm ảnh lân cận theo phương ngang phương đứng nên dự đoán xác hơn, cho sai số dự đoán nhỏ • Dự đoán interfield (Interfield Prediction): phương pháp tạo dự đoán sử dụng khung khung tham chiếu Dự đoán liên mảnh sử dụng mảnh khung khung khác • Dự đoán interframe (Interframe Prediction): phương pháp sử dụng hai mảnh khung khung khung tham chiếu để dự đoán + Giải thích sơ đồ mã hóa nén ảnh video Do đặc điểm nén ảnh video chia làm loại intraframe interframe nên mã hóa dự đoán DPCM nén ảnh video chia thành loại: • Mã hóa dự đoán DPCM Intraframe video Intraframe nén nén ảnh tĩnh (ví dụ theo chuẩn JPEG), trình nén intraframe mã hóa dự đoán DPCM thường sử dụng để dự đoán mã hóa thành phần chiều DC khối điểm ảnh intraframe Cụ thể sau: ảnh ban đầu chia thành block có kích thước 8x8 pixels, block biến đổi DCT, kết sau biến đổi DCT ma trận có kích thước 8x8, sau ma trận lượng tử hóa dựa bảng lượng tử hóa Kết sau lượng tử hóa ma trận có kích thước 8x8 với giá trị số nguyên Thành phần chiều DC giá trị bên trái ma trận Các giá trị thành phần chiều DC block mã hóa dự đoán DPCM • Mã hóa dự đoán DPCM Interframe video Interframe chuỗi frame có mối quan hệ mặt thời gian, việc mã hóa interframe giúp giảm độ dư thừa mặt thời gian Các frame liên tiếp chuỗi frame nhìn chung giống Do ta sử dụng đặc điểm để dự đoán Để tái lặp lại tương tự frame người ta sử dụng khái niệm “bù chuyển động” đo lường sai khác mối khối điểm ảnh khung hình Việc khôi phục ảnh việc sử dụng vector chuyển động khối ảnh tương tự khung khung tham chiếu với sai số chuyển động (phần sai lệch nhỏ hai ảnh) Hãy cho biết dự đoán DPCM áp dụng nén ảnh theo chuẩn JPEG (Câu , 2)– Đề 3) Trả lời: Trong nén ảnh JPEG, dự đoán DPCM sử dụng để mã hóa thành phần chiều DC Ở thành phần chiều DC liệu phần tử block sau lượng tử hóa quét zig-zag Việc sử dụng DPCM tìm sai khác giá trị thành phần chiều DC block với giá trị thành phần chiều DC block trước Dữ liệu sau trình DPCM mã hóa Huffman Bộ dự đoán thực áp dụng DPCM mã hóa tiếng nói thoại? Giải thích sơ đồ mã hóa DPCM mã hóa tiếng nói thoại (Câu 1, – Đề 2) Trả lời: (Câu khó trình bày quá!!!) + Bộ dự đoán thực áp dụng DPCM trình mã hóa tiếng nói thoại: Do tính chất âm tiếng nói thoại, độ tương quan mẫu tín hiệu tương đối lớn Do đó, người ta áp dụng phương pháp dự đoán DPCM dựa dự đoán mẫu tín hiệu dựa mẫu tín hiệu thời điểm trước Cụ thể, mã hóa tiếng nói thoại, người ta thường sử dụng phương pháp DPCM dựa dự đoán tuyến tính (Linear Prediction) + Giải thích sơ đồ mã hóa DPCM mã hóa tiếng nói thoại: (Vẽ lại hình ảnh slide 13 – chapter 3: sơ đồ DPCM tuyến tính) Giải thích: Mẫu tín hiệu x[n] đầu vào, dự đoán dự đoán mẫu p[n] dựa mẫu trước Bộ lượng tử hóa tiến hành lượng tử hóa sai khác x[n] p[n] d[n] Sai số dự đoán d[n] mã hóa truyền kênh truyền, đồng thời kết hợp với p[n] làm đầu vào để dự đoán tiến hành dự đoán mẫu sau Hãy giải thích sơ đồ mã hóa dự đoán áp dụng trình nén video, trình bày thuật toán dự đoán nén video theo MPEG-1 (Câu 2,3 – Đề 3) Trả lời: Sơ đồ mã hóa dự đoán áp dụng trình nén video (Theo t, sơ đồ với yêu cầu câu hỏi sử dụng sơ đồ slide 12 – chapter 3) vì: nén video DPCM sử dụng nén thành phần chiều DC intraframe nén sai khác block frame với block frame tham chiếu Do đó, sử dụng sơ đồ dạng Closed – Prediction hợp lý Việc trình bày giải thích trình thực giải thích dựa trình nén video: nén intraframe nén interframe • Nén intraframe: Dữ liệu đầu vào sơ đồ thành phần chiều DC khối điểm ảnh sau biến đổi DCT Thành phần chiều khối (block) so sánh với thành phần chiều khối (block) trước Sự sai khác hai thành phần chiều mã hóa • Nén interframe: Dữ liệu đầu vào sơ đồ khối điểm ảnh (block) frame Nếu khối điểm ảnh frame tìm thấy frame tham chiếu, ta tìm sai khác hai khối điểm ảnh block hiệu block nêu Block sai khác biến đổi DCT, lượng tử hóa mã hóa DPCM thành phần chiều tương tự nén intraframe Ngoài ra, sai khác vị trí hai block frame frame tham chiều mã hóa dựa theo nguyên tắc mã hóa DPCM + Trình bày thuật toán dự đoán nén video theo chuẩn MPEG-1 (thật chung chung, không hiểu nên nêu phần có nhiều thứ: thuật toán ước lượng chuyển động, thuật toán so sánh khối, Nếu nói thuật toán dự đoán không hiểu nên nêu gì… Bó tay!!!) Đây ý, chém theo này, nêu hẳn trình thực ước lượng chuyển động bù chuyển động MPEG-1 phối hợp kỹ thuật ước lượng chuyển động bù chuyển động Về chất thì, dự đoán bù chuyển động MPEG-1 khối tiên đoán dự đoán DPCM Tuy nhiên mặt tính toán, độ phức tạp giải thuật, dự đoán chuyển động tốn chi phí cao, bù lại, độ xác dự đoán lại cao nhiều so với giải thuật dự đoán DPCM Nén ảnh theo chuẩn JPEG, phương pháp mã hóa dự đoán DPCM kết hợp với phương pháp mã hóa dựa phép biến đổi DCT nào? (Câu 1,4 – Đề 2) Trả lời: Theo chuẩn nén ảnh JPEG, ảnh chia thành block có kích thước 8x8 pixels, block qua phép biến đổi DCT Đây trình biến đổi tập giá trị pixel ảnh miền không gian sang tập giá trị khác miền tần số cho hệ số tập giá trị có tương quan điểm ảnh gần nhỏ Nhiệm vụ trình biến đổi DCT tập trung lượng vào số hệ số biến đổi tương ứng với vùng tần số thấp, dẫn đến cho hệ số vùng tần số cao gần mà không ảnh hưởng đáng kể đến chất lượng ảnh Mỗi block sau qua biến đổi DCT ma trận 8x8 hệ số thực, hệ số ma trận gọi thành phần chiều DC, hệ số lại gọi hệ số xoay chiều AC Phương pháp mã hóa dự đoán DPCM sử dụng chuẩn JPEG việc mã hóa dự đoán thành phần chiều DC block so với thành phần chiều DC block trước Hãy giải thích nguyên lý dự đoán áp dụng nén ảnh JPEG khác với dự đoán áp dụng nén video theo chuẩn - Hình 2.12: Hướng tiếp cận thứ thuật toán 2D-LOG Giải thuật tìm kiếm ba bước TSS (Three Step Search): giải thuật thực qua ba bước sau: • Bước 1: Xác định kích thước bước dịch ban đầu, kiểm tra điểm • Bước 2: Giảm kích thước dựa tiêu chuẩn MAD, kiểm tra điểm • Bước 3: Lặp lại bước trên, xác định điểm có MAD nhỏ Câu số 7: Đồng (Câu – Đề 6): Trình bày mô hình đồng liệu đa phương tiện cho biết mô hình thường áp dụng truyền đa phương tiện mạng IP Trả lời: Các mô hình đồng DỮ LIỆU ĐPT (chưa xét đến audio/video hay j hết): mô hình •Mô hình dòng thời gian (Timeline): Các hành động xác định thời điểm bắt đầu, thực đồng bám theo thời gian tồn đối tượng (hình chap9 slide 11) Mô hình sử dụng dòng thời gian tổng thể Đồng bám liên tục theo dòng thời gian, yêu cầu cần phải có đồng đồng hồ Mô hình cho chất lượng cao có yêu cầu chi phí cao •Mô hình điểm tham chiếu (Reference point) : Trong mô hình thời điểm tham chiếu hay điểm đồng xác định bên thời gian tồn đối tượng đa phương tiện, thời điểm thực đồng thời gian dòng liệu đa phương tiện để trình diễn (player) Mô hình dùng nhãn thời gian đánh dấu bên đối tượng thời điểm cần đồng •Mô hình phân cấp (Hierarchic): thực theo chế phân cấp thứ tự đối tượng đồng theo hình Tuy nhiên thời điểm cần đồng điểm bắt đầu hay kết thúc đối tượng mà nằm đối tượng bị phân mảnh •Đồng dựa kiện (Event based): Thực đồng dựa kiện bắt đầu kết thúc đối tượng Ở hành động, thao tác bắt đầu kết thúc thời điểm xác định Ví dụ: ứng dụng tương tác, việc ấn nút, kích hoạt menu làm hiển thị lên hình ảnh chơi đoạn audio số… •Đồng audio-video thời gian thực nơi nhận : Mô hình thiết lập lại quan hệ thời gian gói liệu audio – video để trình diễn liên tục, cảm thụ trung thực nơi nhận so với nguồn Kĩ thuật bao gồm: + Điều độ trình diễn hướng thời gian + Điều độ trình diễn dựa đệm liệu nhận •Tích hợp audio–video: kết hợp, bổ sung vào hệ thống có loại liệu, ứng dụng trình diễn thể đa phương tiện (tích hợp định dạng file, vào định dạng Web, tích hợp vào CSDL…) (Câu – Đề 2): Xét nguyên tắc đồng audio – video biểu diễn hình Hình (Slide 17 – Chương 9) 2.1 Giải thích nguyên tắc theo mô hình đồng nào? Tại dòng audio coi chủ? Trả lời: Đây mô hình Đồng audio -video thời gian thực nơi nhận, sử dụng kĩ thuật đồng theo dòng audio Dòng audio coi chủ (không lắm): + Dòng audio chủ (principle jet) người nhạy cảm với âm so với hình ảnh Dòng video (slave jet) đồng theo dòng audio + Tại điểm đồng bộ: nhãn thời gian gói tin dòng video so sánh với nhãn thời gian gói tin dòng audio Nếu frame video bị trễ giới hạn bị loại bỏ 2.2 Hãy giải thích nguyên tắc đồng audio – video ý nghĩa tham số jitter, skew sơ đồ thời gian Trả lời: Nguyên tắc đồng bộ: âm hình ảnh truyền theo dòng khác (tốc độ dòng liệu có chất yêu cầu hoàn toàn khác nhau), cần phải xác lập đồng audio-video nơi nhận đảm bảo thời gian thực.Vấn đề thiết lập lại quan hệ thời gian gói liệu audio-video để trình diễn liên tục, cảm thụ trung thực nơi nhận so với nguồn Ý nghĩa tham số: (xem slide chap9 page 17) + Jitter: độ trễ biến thiên, khác tức thời thời gian trễ dòng video-audio + Skew: độ lệch thời gian dòng audio video 2.3 Thế hiệu ứng che (masking effects) mô hình cảm thụ âm Hãy cho biết phương pháp mã hóa tiếng nói thoại không xét đến hiệu ứng che? Hãy trình bày nguyên tắc mã hóa âm dải rộng dựa hiệu ứng che nào? Trả lời: Nguyên tắc đồng bộ: âm hình ảnh truyền theo dòng khác (tốc độ dòng liệu có chất yêu cầu hoàn toàn khác nhau), cần phải xác lập đồng audio-video nơi nhận đảm bảo thời gian thực.Vấn đề thiết lập lại quan hệ thời gian gói liệu audio-video để trình diễn liên tục, cảm thụ trung thực nơi nhận so với nguồn Ý nghĩa tham số: (xem slide chap9 page 17) + Jitter: độ trễ biến thiên, khác tức thời thời gian trễ dòng video-audio + Skew: độ lệch thời gian dòng audio video Câu số 8: (Câu – Đề 5): Xét sơ đồ khung phương pháp nén ảnh dựa phép biến đổi hình sau (Hình ảnh slide – Chương 6) Hãy cho biết chức năng, nhiệm vụ khối sơ đồ Trả lời: Trong sơ đồ khung chia làm phần: phía nén, phía giải nén Xét phần nén sơ đồ bao gồm có khối chức năng: Khối T hay gọi khối Transform: khối thực biến đổi liệu ảnh gốc sang miền không gian khác • Khối Q hay gọi khối Quantization: khối lượng tử hóa thực biến đổi miền liệu số thực sau biến đổi sang miền số nguyên Đây khối định mát thông tin trình nén • Khối E hay gọi khối Encode: khối mã hóa dựa phương pháp mã hóa VLC (Variable Length Coding), … Phân tích đặc điểm cho yêu cầu kỹ thuật nén dựa phép biến đổi cho biết kỹ thuật dùng chuẩn nén nén ảnh, nén video, nén audio? Phương pháp nén dựa phép biến đổi có ảnh hưởng đến chất lượng mã hóa nén liệu (Coder) truyền thông đa phương tiện • Trả lời: Câu số 9: (Câu – Đề 5): Hãy giải thích trình xử lý liệu sơ đồ nén ảnh theo chuẩn JPEG trình bày thuật toán xử lý liệu khối sơ đồ (Hình ảnh slide 32 – Chương 6) Trả lời: Từ sơ đồ nén ảnh theo chuẩn JPEG (slide 32 – chapter 6) Ta giải thích chức khối chức sau: - Color Converter: Đây khối thực biến đổi không gian màu từ RGB sang YcrCb (hoặc YUV) tức là: tăng thành phần độ chói Y, giảm thành phần màu sắc U, V (do mắt người nhạy cảm với độ sáng màu sắc) - Level Offset: Đây khối thực việc xử lý liệu cho thành phần hệ màu YUV (hoặc YcrCb) Các tín hiệu màu U, V có biên độ cực đại (giá trị nhị phân hệ thống lấy mẫu bit), tín hiệu Y có khoảng cực đại từ đến 255 giá trị Để đơn giản cho việc thiết kế mã hóa DCT, tín hiệu Y dịch xuống cách trừ 128 giá trị điểm ảnh (pixel) khối để có khoảng cực đại tín hiệu tương tự tín hiệu U V Ở phần giải mã DCT, giá trị 128 cộng vào thành phần độ chói Khối 8x8 DCT: khối thực chia ảnh thành khối có kích thước 8x8 pixel Nhằm mục đích giảm thời gian tính toán tăng khả xác thực tính toán Do điểm ảnh lân cận có độ tương quan cao, phép biến đổi DCT cho khối nhỏ tập trung lượng vào số hệ số biến đổi, việc loại bỏ số mức lượng thấp khối tạo ta mát thông tin cục giúp nâng cao chất lượng hình ảnh - Khối Uniform Quantization: Đây khối lượng tử hóa, thực chuyển đổi giá trị khối 8x8 pixels từ miền số thực sang số nguyên, kết sau biến đổi DCT miền không gian số thực Việc thực lượng tử hóa điểm mấu chốt việc xác định độ mát thông tin trình nén Ngoài ra, khối lượng tử hóa giúp việc xác định lượng tập trung chủ yếu miền tần số thấp, liệu miền tần số cao khối sau lượng tử hóa có giá trị nên việc loại bỏ thành phần không cần thiết dễ dàng - Sau lượng tử hóa: khối điểm ảnh 8x8 pixels có thành phần là: thành phần chiều DC thành phần xoay chiều AC • Thành phần chiều DC giá trị trung bình thành phần khác ma trận sau lượng tử hóa Thành phần chiều thực mã hóa dự đoán DPCM với thành phần chiều khối điểm ảnh khác • Thành phần xoay chiều AC giá trị thành phần khác ma trận sau lượng tử hóa Ma trận thực quét Zig – Zag nhằm mục tích tăng hiệu tính toán Thông thường hệ số tương ứng tần số cao có giá trị nên quét Zig zag tạo nhiều dãy hệ số liên tiếp Sau đó, sử dụng thuật toán mã hóa có độ dài thay đổi VLC (ví dụ Huffman, …) để mã hóa thành phần + Trình bày thuật toán xử lý khối sơ đồ: Trong khối khối Color Converter: khối thực việc chuyển đổi hệ màu RGB sang hệ màu YUV YcrCb - Đối với hệ màu YUV, thuật toán biến đổi giá trị điểm ảnh sau: • Y = 0.299*R + 0.587*G + 0.144*B • U = -0.147*R – 0.289*G + 0.436*B = 0.492* (B – Y) • V = 0.615*R – 515*G – 0.100*B = 0.877* (R – Y) - 1.Sơ đồ nguyên lý phương pháp mã hóa DPCM vai trò dự đoán Sơ đồ nguyên lý Điều xung mã sai phân (DPCM – Differentical Pulse Code Modulation) phương pháp nén liệu có mát thông tin Cơ sở phương pháp dựa mã hóa dự đoán, thường đước sử dụng tín hiệu lấy mẫu có độ tương quan mạnh (nghĩa hai mẫu gần tương tự nhau), có quan hệ lân cận mẫu, tín hiệu ảnh video, tín hiệu tiếng nói… Như có nhiều lợi ích mã hóa khác mẫu kế cận thay cho mã hóa giá trị tuyệt đối mẫu Nguyên tắc mã hóa dự đoán : Mã hóa sai khác mẫu : mẫu dự đoán theo thời điểm trước mẫu Giá trị mẫu giải mã dựa sai khác giá trị dự đoán thời điểm trước Như thấy thay truyền toàn thông tin mẫu, ta truyền sai lệch mẫu Điều cho phép đạt hiệu nén cao nhiều so với việc mã hóa truyền giá trị mẫu riêng biệt Tín hiệu đầu vào qua lấy mẫu để tiến hành lấy mẫu tín hiệu,sau mã hóa mã hóa (mã hóa sai khác mẫu thông qua mẫu trước dựa vào dự đoán),sau truyền đi.Phía nhận giải mã lại tín hiệu giải mã ,dựa vào dự đoán khôi phục lại tín hiệu ban đầu Vai trò dự đoán: Do độ tương quan mẫu tín hiệu tín hiệu tiếng nói, tín hiệu video, lớn nên thực dự đoán cách gần giá trị mẫu từ số mẫu trước Bộ dự đoán sử dụng để tính toán dự đoán mẫu tín hiệu theo mẫu thời điểm trước (tín hiệu tham chiếu) Trong trình dự đoán có sai số dự đoán(Pridection error) Cần phân biệt sai số dự đoán sai số lượng tử Hai khái niệm có chất khác : Sai số dự đoán (prediction error) chênh lệch giá trị dự đoán giá trị thực Nó không làm tổn thất thông tin dẫn đến suy giảm chất lượng ảnh Giá trị sai số định tốc độ bit giảm nhiều hay ít, tức ảnh hưởng đến hiệu suất nén Sai số lượng tử (quantization error) sai số đặc trưng cho tổn thất liệu dẫn đến làm suy giảm chất lượng ảnh phục hồi 2.Bộ dự đoán thực áp dụng DPCM nén ảnh video.Giải thích sơ đồ mã hóa DPCM nén video Phương pháp DPCM dùng nén ảnh video: • • Mã hóa dự đoán DPCM Intraframe video Mã hóa dự đoán DPCM Interframe video a: Dự báo mảnh (Intrafield)b: Dự báo ảnh (Intraframe) c: Dự báo liên mảnh (Interfield) d: Dự báo liên ảnh (Interframe a Dự đoán Intrafield (Intrafield Prediction): Chỉ sử dụng điểm thuộc nửa ảnh (một mảnh) để tạo dự đoán Dự đoán mảnh không tận dụng quan hệ điểm ảnh lân cận theo chiều đứng nên cho sai số dự đoán cao b Dự đoán Intraframe (Intraframe Prediction): Với hỗ trợ nhớ mảnh, dự đoán ảnh sử dụng tất điểm thuộc hai mảnh khung để tạo dự đoán Như lợi dụng quan hệ tương hỗ điểm lân cận theo Phương ngang Phương đứng nên dự đoán xác hơn, cho sai số dự đoán nhỏ c Dự đoán Interfield (Interfield prediction): Phương pháp tạo dự đoán sử dụng khung hành khung tham chiếu khác Dự đoán liên mảnh sử dụng mảnh (chẵn lể) khung khác d Dự đoán interframe (Interframe prediction): Phương pháp sử dụng hai mảnh ảnh kề Bộ dự đoán thực áp dụng DPCM mã hóa tiếng nói.Giải thích sơ đồ mã hóa DPCM mã hóa tiếng nói thoại Bộ dự đoán thực áp dụng DPCM mã hóa tiếng nói:dự đoán mẫu tín hiệu theo mẫu thời điểm trước (tín hiệu tham chiếu) Sơ đồ mã hóa DPCM mã hóa tiếng nói thoại Giải thích:Mẫu x(n) đầu vào,bộ dự đoán dự đoán mẫu x’(n),bộ lượng tử hóa tiến hành lượng tử hóa sai khác x(n) x’(n),đầu d’(n).d’(n) mã hóa truyền kênh truyền,đồng thời kết hợp với x’(n) làm đầu vào để dự đoán tiến hành dự đoán mẫu sau Nén ảnh theo chuẩn Jpeg,phương pháp DPCM kết hợp với phương pháp mã hóa dựa biến đổi DCT ? DPCM dùng JPEG để mã hóa thành phần DC Từng thành phần DC block mã hóa DPCM sau mã hóa Huffman DiffDC(blocki) = DC(blocki) – DC(blocki–1) Bài 2: - Mô hình ảnh mô hình đồng theo dòng audio Dòng liệu audio có vai trò chủ (principle jet) dòng video (slave jet) đồng theo dòng audio - Nguyên tắc: Dòng liệu audio có vai trò chủ (principle jet), dòng video (slave - jet) đồng theo dòng audio Tại điểm đồng bộ: nhãn thời gian gói tin dòng video so sánh với nhãn thời gian gói tin dòng audio Nếu frame video bị trễ giới hạn bị loại bỏ Cảm thụ độ lệch audio video: - Vùng đồng (in synchronization): độ lệch cho phép từ -80 ms đến +80 ms Vùng đồng (out synchronization): độ lệch từ -160 ms đến +160 ms Vùng trung gian (transient): độ lệch khoảng +80 đến +160 -160 đến -80 - Độ rung trễ ‘jitter’: khác tức thời thời gian dòng - video – audio Độ lệch ‘skew’: độ lệch thời gian hai dòng audio – video Độ trễ điểm đầu cuối ‘end – to – end delay’ định nghĩa toàn thời gian trễ từ âm thanh,hình ảnh hình thành điểm nguồn,được truyền qua mạng đến điểm đích thể 3.Thế hiệu ứng che Hiệu ứng che tượng số âm tồn không gian (vẫn nằm dải tần số mà người cảm nhận được) tai ta không nghe thấy số lý định (biên độ nhỏ bị âm khác lấn át) tượng gọi che hoàn toàn Một trường hợp khác hiệu ứng che che phần âm bị che không biến hoàn toàn mà cảm nhận nhiên với biên độ thấp (âm trở nên bé hơn) Các giá trị hiệu ứng che chủ yếu xác định dựa thực nghiệm có giá trị không giống người Có hiệu ứng che : - Ngưỡng nghe (Threshold in Quiet) - Che mặt tần số (Frequency masking) - Che mặt thời gian (Temporal masking) Tại phương pháp mã hóa tiếng nói thoại ko xét đến hiệu ứng che: Bởi tai người không cảm nhận âm bị che âm khác có lượng lớn mức định).Tiếng nói thoại khoảng 300-3kHz,đại loại ta nghe thấy âm bị che.(???) Giải thích nguyên tắc mã hóa âm dải rộng dựa hiệu ứng che: Nén âm tiếng nói kết hợp với mô hình cảm nhận âm phương pháp giảm lượng liệu cần thiết số hóa tín hiệu âm Cơ sở phương pháp nén số tín hiệu âm có khả gây kích thích mạnh lên não khiến não bỏ qua không xử lí tín hiệu âm định khác Nói cách khác, âm che lấp âm khác, ta lợi dụng điểm bỏ qua không mã hóa âm Ta kể vài ví dụ AAC, ATRAC… Hình 2.5 Sơ đồ trình nén mã hóa Trong hình 2.5 ta thấy bước trình nén Tín hiệu đầu vào chia thành nhiều dải tần số khác nhau, trải rộng khắp phổ tần số Sau thực xong việc phân chia, ta xử lí dải tần số cách riêng rẽ, dựa vào đặc điểm trình cảm nhận âm quan thính giác người từ ảnh hưởng che dải tần số xung quanh, dải có ngưỡng nghe định Nếu dải có cường độ thấp ngưỡng nghe ta loại bỏ (vì dải bị che dải lân cận tai người cảm nhận nữa) Đối với dải có cường độ cao ngưỡng nghe trình mã hóa thực Tín hiệu có cường độ cao người cảm nhận rõ ràng, mã hóa nhiều bit so với tín hiệu có cường độ thấp [...]... frame/s, tức là 1 giây sẽ có 3 frame I, và 7 frame P  Để nén 1 frame I mất tối đa 1/3 giây  Để nén 1 frame P mất 1/3 : 3 = 1/9 giây Câu số 4: Xử lý dữ liệu đa phương tiện và nén âm thanh (Đề 4) 1 Hãy cho biết vấn đề xử lý dữ liệu đa phương tiện trong truyền thông đa phương tiện gồm các kỹ thuật xử lý chủ yếu gì? Tại sao? (Câu 1,1 – Đề 4) Trả lời: Các vấn đề: • Thu nhận và số hóa tín hiệu • Các phép biến... (Câu 2 – Đề 6) 1 Hãy giải thích quá trình xử lý dữ liệu trong sơ đồ nén video theo chuẩn MPEG-1 dưới đây Sơ đồ này có yêu cầu xử lý thời gian thực như thế nào? Trả lời: + Quá trình xử lý dữ liệu trong sơ đồ mã hóa video theo chuẩn MPEG1 Đầu vào của sơ đồ này chuỗi các frame video, đầu ra của sơ đồ chính là chuỗi dòng bit sau khi mã hóa Ta sẽ đi vào phân tích cụ thể quá trình xử lý như sau: Đầu vào là... đổi và cho biết hiện nay kỹ thuật này đã được dùng trong các chuẩn nén nào đối với nén ảnh, nén video, nén audio? Phương pháp nén dựa trên phép biến đổi có ảnh hưởng như thế nào đến chất lượng bộ mã hóa nén dữ liệu (Coder) trong truyền thông đa phương tiện • Trả lời: Câu số 9: (Câu 3 – Đề 5): Hãy giải thích quá trình xử lý dữ liệu trong sơ đồ nén ảnh theo chuẩn JPEG dưới đây và trình bày thuật toán xử. .. này bao gồm: + Điều độ trình diễn hướng thời gian + Điều độ trình diễn dựa trên bộ đệm dữ liệu nhận •Tích hợp audio–video: sự kết hợp, bổ sung vào hệ thống hiện có các loại dữ liệu, các ứng dụng và trình diễn thể hiện đa phương tiện (tích hợp trong định dạng file, vào định dạng Web, tích hợp vào CSDL…) 2 (Câu 2 – Đề 2): Xét nguyên tắc đồng bộ audio – video được biểu diễn trong hình dưới đây Hình (Slide... đoán cao b Dự đoán Intraframe (Intraframe Prediction): Với sự hỗ trợ của một bộ nhớ mảnh, dự đoán trong ảnh sử dụng tất cả các điểm thuộc cả hai mảnh của một khung để tạo dự đoán Như vậy sẽ lợi dụng được quan hệ tương hỗ của các điểm lân cận theo cả Phương ngang và Phương đứng nên dự đoán chính xác hơn, cho sai số dự đoán nhỏ hơn c Dự đoán Interfield (Interfield prediction): Phương pháp tạo dự đoán... nên có thể thực hiện dự đoán một cách gần đúng một giá trị mẫu nào đó từ một số mẫu trước đó Bộ dự đoán được sử dụng để tính toán dự đoán ra các mẫu tín hiệu theo mẫu tại thời điểm trước (tín hiệu tham chiếu) Trong quá trình dự đoán sẽ có sai số dự đoán(Pridection error) Cần phân biệt giữa sai số dự đoán và sai số lượng tử Hai khái niệm này có bản chất khác nhau : Sai số dự đoán (prediction error) chỉ... point) : Trong mô hình này thì các thời điểm tham chiếu hay điểm đồng bộ được xác định bên trong thời gian tồn tại của đối tượng đa phương tiện, tại thời điểm đó thực hiện đồng bộ thời gian giữa các dòng dữ liệu đa phương tiện để trình diễn (player) Mô hình sẽ dùng nhãn thời gian đánh dấu bên trong các đối tượng tại các thời điểm cần đồng bộ •Mô hình phân cấp (Hierarchic): thực hiện theo cơ chế phân cấp... nói:dự đoán các mẫu tín hiệu theo mẫu tại thời điểm trước (tín hiệu tham chiếu) Sơ đồ mã hóa DPCM trong mã hóa tiếng nói thoại Giải thích:Mẫu x(n) đầu vào,bộ dự đoán dự đoán mẫu x’(n),bộ lượng tử hóa tiến hành lượng tử hóa sự sai khác giữa x(n) và x’(n),đầu ra là d’(n).d’(n) được mã hóa và truyền đi trên kênh truyền,đồng thời được kết hợp với x’(n) làm đầu vào để bộ dự đoán tiến hành dự đoán các mẫu... – Y) • V = 0.615*R – 0 515*G – 0.100*B = 0.877* (R – Y) - 1.Sơ đồ nguyên lý phương pháp mã hóa DPCM và vai trò bộ dự đoán Sơ đồ nguyên lý Điều xung mã sai phân (DPCM – Differentical Pulse Code Modulation) là phương pháp nén dữ liệu có mất mát thông tin Cơ sở của phương pháp này dựa trên mã hóa dự đoán, thường đước sử dụng đối với các tín hiệu lấy mẫu có độ tương quan mạnh (nghĩa là hai mẫu gần nhau... đổi: • Lượng tử hóa • Mã hóa/Nén • Truyền tín hiệu qua mạng • Đồng bộ dữ liệu đa phương tiện Còn để trả lời tại sao cần các kĩ thuật trên thì nêu mục đích của từng kĩ thuật 2 Hãy cho biết tại sao phương pháp nén âm thanh hiện nay thường được chia thành 2 loại chính: mã hóa nén tiếng nói thoại và mã hóa âm thanh dải rộng (Câu 1,2 – Đề 4) Trả lời: Câu này chắc lập cái bảng phân biệt đặc điểm khác nhau

Ngày đăng: 22/06/2016, 21:56

Từ khóa liên quan

Mục lục

  • Câu số 1: Phương pháp SBC (Câu 1 – Đề 1 vs Câu 2 – Đề 4 vs Câu 1 – Đề 5)

  • Câu số 2: Phương pháp mã hóa dự đoán

  • Câu số 3: Nén video số (Đề 3)

  • Câu số 4: Xử lý dữ liệu đa phương tiện và nén âm thanh (Đề 4)

  • Câu số 5: Đề 1

  • Câu số 6: Chuẩn MPEG-1 (Câu 2 – Đề 6)

  • Câu số 7: Đồng bộ

  • Câu số 8: (Câu 2 – Đề 5):

  • Câu số 9: (Câu 3 – Đề 5):

  • 1.Sơ đồ nguyên lý phương pháp mã hóa DPCM và vai trò bộ dự đoán

    • Sơ đồ nguyên lý

    • Vai trò của bộ dự đoán:

    • 2.Bộ dự đoán được thực hiện thế nào khi áp dụng DPCM trong nén ảnh video.Giải thích sơ đồ mã hóa DPCM trong nén video

    • 3. Bộ dự đoán được thực hiện thế nào khi áp dụng DPCM trong mã hóa tiếng nói.Giải thích sơ đồ mã hóa DPCM trong mã hóa tiếng nói thoại

    • 4. Nén ảnh theo chuẩn Jpeg,phương pháp DPCM được kết hợp với phương pháp mã hóa dựa trên biến đổi DCT như thế nào ?

    • Bài 2:

      • 1.

      • 2.

      • 3.Thế nào là hiệu ứng che

        • Tại sao các phương pháp mã hóa tiếng nói thoại ko xét đến hiệu ứng che:

        • Giải thích nguyên tắc mã hóa âm thanh dải rộng dựa trên hiệu ứng che:

Tài liệu cùng người dùng

Tài liệu liên quan