Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 23 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
23
Dung lượng
317,45 KB
Nội dung
Đề cương xử lý âm – hình ảnh MỤC LỤC PHOTO HUYỀN TRANG Câu 1: Hệ thống mã hóa thoại? Các phương pháp mã hóa thoại: mã hóa dạng sóng, mã hóa tham số, mã hóa lai? Cho ví dụ a Mã hóa dạng sóng Mã hoá dạng sóng: chia làm hai loại Trong miền thời gian: mã hoá điều xung mã (PCM), điều biến xung mã vi sai (DPCM điều biến xung mã vi sai thích nghi (ADPCM) Trong miền tần số: mã hoá băng SBC (subband coding) mã hoá biến đổi thích nghi ATC (Adaptive Transform Coding) - - Tại phía phát: Bộ mã hóa nhận tín hiệu tiếng nói tương tự mã hóa thành tín hiệu số trước truyền - Tại phía thu: Làm ngược lại để khôi phục tiếng nói - Khôi phục tín hiệu sóng giống tín hiệu gốc - Độ phức tạp, giá thành, độ trễ công suất tiêu thụ thấp - Chỉ tạo tiếng nói chất lượng cao tốc độ lớn 16kbps - Không tạo tiếng nói chất lượng cao tốc độ nhỏ 16kbps b Mã hóa tham số: hay gọi mã hóa vocoder Các tín hiệu giả thiết tạo từ mô hình (giống mô hình tạo tiếng nói từ quan phát âm người), mô hình điều khiển vài tham số chức Trong trình mã hóa, tham số mô hình suy từ tín hiệu thoại đầu vào + không bảo toàn dạng sóng ban đầu tín hiệu + ví dụ: mã hóa dự đoán tuyến tính LPC, mã hóa dự đoán tuyến tính kích thích hỗn hợp MELP Nguyên lý: tín hiệu PCM đầu vào phân thành khung thoại (N mẫu thoại), khoảng cách khung N mẫu Ưu: + có hiệu âm thoại PHOTO HUYỀN TRANG Có thể cung cấp thoại số với tốc độ nhỏ 2kbps Nhược: +Chất lượng phụ thuộc nhiều vào mô hình thoại + Phức tạp mã hóa dạng sóng + Chỉ xử lý tiếng nói người + Tiếng nói tái tạo khác nhiều so với tiếng nói tự nhiên người c Mã hóa lai: Sử dụng công nghệ mã hóa dạng sóng mã hóa vocoder Có thể đạt chất lượng thoại tốt tốc độ bit – 16Kbps Ví dụ: mã hóa phân tích dựa tổng hợp Abs, RPE-LTP… Độ phức tạp mã hóa cao - Mã hóa LPC: Quá trình mã hóa: Lấy mẫu: • • Tín hiệu tiếng nói lấy mẫu tốc độ fs = 8000 mẫu/s Sau chia thành segment: (160 mẫu, 20 ms) Xác định âm hữu hay vô thanh: PHOTO HUYỀN TRANG • Căn vào biên độ (năng lượng) hay tần số tín hiệu segment • Dùng bit để báo cho giải mã biết Ước lượng tần số pitch • Dựa vào hàm tự tương quan • Giá trị pitch sau lượng tử hóa mã hóa dùng bit Xác định thông số lọc • Các hệ số lọc G, {ap(k)} Quá trình giải mã: Xác định tín hiệu kích thích tần số pitch: • Khi segment âm vô thanh: tạo nguồn kích thích nhiễu trắng • Khi segment âm hữu thanh: tạo nguồn chuỗi xung tuần hoàn Xác định hệ số G {ap(k)} cho segment Cho tín hiệu kích thích qua lọc tạo tín hiệu thoại Mỗi segment giải mã độc lập, sau kết hợp lại với LPC Vocoder 2.4Kbps Mô hình lọc biểu diễn dạng vector: - A thay đổi theo chu kỳ 20ms (theo tính chất không dừng (non-stationary) tín hiệu thoại), tần số lấy mẫu 8000 Hz, chu kỳ 20 ms tương đương với 160 mẫu Do tín hiệu thoại phân chia thành khung có độ dài 20 ms (50 khung/sec) PHOTO HUYỀN TRANG - Mô hình tương đương với - Như vậy, 160 giá trị S đại diện cho 13 giá trị A • Phân tích LPC (LPC Analysis): Cho S, tìm A tốt • Tổng hợp LPC (LPC Synthesis): Cho A, tổng hợp S Nhược điểm LPC: Giới hạn 1: Trong số trường hợp, khung âm phân loại thành hữu vô Giới hạn 2: Việc sử dụng hoàn toàn nhiễu ngẫu nhiên hoàn toàn chuỗi xung có chu kỳ tạo kích thích không phù hợp với thực tế Giới hạn 3: Thông tin pha tín hiệu gốc không xem xét Giới hạn 4: Phương pháp thực việc tổng hợp khung thoại, chuỗi xung dùng để kích thích lọc lại tổng hợp hệ số có từ việc phân tích LP, vi phạm tảng mô hình AR - Câu 2: Mô hình Psychacoustic Phương pháp mã hóa âm Các chuẩn mã hóa âm – MP3 Sự cảm thụ tai người âm thanh: - Khoảng cách dải âm lớn yếu mà tai người nghe 120dB Người nghe phát thay đổi độ ồn âm tín hiệu bị thay đổi khoảng 1dB (biên độ thay đổi 12%) - Khả nhận biết mức độ ồn liên quan mật thiết với công suất âm theo bậc mũ 1/3 - Nếu tăng công suất âm lên 10 lần, người nghe nhận độ ồn tăng lên tầm lần - Dải nghe người thông thường từ 16Hz đến 20kHz, độ nhạy âm lớn từ 2kHz đến 4kHz - Khả xác định hướng nguồn âm tốt xác định khoảng cách đến nguồn âm PHOTO HUYỀN TRANG • Ngưỡng nghe: Tai người phát âm biến đổi cục áp suất không khí đo mức áp suất âm – SPL Khi thành phần tần số thấp mức ngưỡng âm có tần số không nghe Ngưỡng hàm tần số âm Tai người nhạy cảm phạm vi tần số từ – 4Khz Mặt nạ thời gian Khi tiếng nóiđược đưa vùng “chồng” lên thành phần bên cạnh miền tần số, âm lượng tăng đột biến che khuất âm nhỏ hơn, gần với âm che khuất mặt thời gian Ở âm xuất trước lẫn sau tăng âm lượng bị che khuất • Mặt nạ tần số • + Cho dù thành phần tín hiệu có mức áp suất âm cao mức ngưỡng nghe, bị che khuất thành phần có mức áp suất âm lớn mà gần tín hiệu miền tần số + Mỗi thành phần tín hiệu lấy “phần ngưỡng nghe” qua thành phần bên cạnh + Nếu thành phần tần số bên cạnh bị che phủ “phần ngưỡng nghe” thành phần tín hiệu không nghe - Chuẩn mã hóa âm MP3 (MPEG – layer 3) MP3 – MPEG lớp 3, cung cấp chất lượng Audio gần giống đĩa CD tốc độ bit thấp MP3 hỗ trợ tần số lấy mẫu khác nhau: 48KHz, 32KHz, 44,1 KHz Sử dụng khung lọc (trước, sau) với tổng số 1152 mẫu Ở tần số 48Khz, khung mang 24ms âm Dùng cho thiết bị chuyên dụng, đa môi trường Tốc độ dòng số liệu từ 32 – 320Kbps Gồm 32 băng tới hạn thành 18 MDCT MP3 sử dụng phương pháp mã hóa băng mã hóa chuyển đổi tương thích PHOTO HUYỀN TRANG Câu 3: Nén ảnh JPEG JPEG 2000 a Nén ảnh JPEG - Chuẩn nén ảnh chủ yếu dùng cho ảnh tĩnh đơn sắc màu Tuy nhiên sử dụng cho nhiều ứng dụng với ảnh động cho chất lượng ảnh khôi phục tốt tính toán so với nén MPEG - Sử dụng phép biến đổi cosin rời rạc DCT - Sử dụng phương pháp mã hóa Huffman entropy b Nén ảnh JPEG 2000 - JPEG-2000 có tỉ lệ xuyên âm thấp công nghệ JPEG truyền thống - Cho phép tách phân giải khác nhau, tách miền quan tâm đưa - dòng bit nén đơn Sử dụng kĩ thuật mã hóa dạng sóng rời rạc DWT-Discrete Wavelet Transform PHOTO HUYỀN TRANG + Xử lý trước biến đổi: đảm bảo liệu đưa vào nén ảnh có dạng đối xứng qua + Biến đổi liên thành phần: loại bỏ tính tương quan thành phần ảnh, chuyển từ RGB sang YCrCb sử dụng ICT RCT, giúp tăng hiệu nén + Biến đổi thuận riêng thành phần: Sử dụng biến đổi wavelet Chia tín hiệu thành băng băng mã hóa riêng rẽ + Lượng tử hóa: Cho phép đạt tỉ lệ nén cao cách thể giá trị biến đổi với độ xác tương ứng cần thiết với mức chi tiết ảnh cần nén.Các hệ số biến đổi lượng tử hoá theo phép lượng tử hoá vô hướng + Mã hóa: sử dụng phổ biến phương pháp SPIHT (mã hóa phân cấp theo vùng) EZW (Embedded Zerotree Wavelet Encoder) Giải nén: làm ngược lại - Các ưu điểm JPEG 2K Sử dụng với truyền dẫn hiển thị lũy tiến chất lượng, độ phân giải, thành phần màu có tính định vị không gian Sử dụng chế nén ảnh cho dạng thứnén (có tổn thất không tổn thất) JPEG2000 đưa tỷ lệ nén cao nhiều so với JPEG Tỷ lệ nén lên tới 200:1 Có khả mã hóa ảnh với tỉ lệ nén theo vùng khác (ROI) Truy cập giải nén thời điểm nhận liệu So sánh JPEG vs JPEG2K JPEG Sử dụng phép biến đổi DCT JPEG2K Biến đổi dạng sóng rời rạc DWTDiscrete Wavelet Transform Phương pháp mã hóa entropy Huffman Mã hóa SPIHT EZW PHOTO HUYỀN TRANG Tỷ lệ xuyên âm cao Hệ số nén không cao Không có khả mã hóa ảnh với tỷ lệ nén khác theo vùng Xuyên âm thấp Hệ số nén cao (200:1) Có khả mã hóa ảnh với tỉ lệ nén theo vùng khác (ROI) Câu 4: Các mô hình lấy mẫu YCbCr: - 4:4:4: Tín hiệu chói màu lấy mẫu tất điểm lấy mẫu dòng tích cực tín hiệu video Cấu trúc lấy mẫu trực giao Tần số chói = tần số màu - 4:2:2: Tín hiệu chói lấy mẫu tất điểm lấy mẫu dòng tích cực tín hiệu video Tín hiệu màu dòng lấy mẫu với tần số nửa tần số lấy mẫu tín hiệu chói - 4:2:0: Tín hiệu chói lấy mẫu tất điểm lấy mẫu dòng tích cực tín hiệu video Cách điểm lấy mẫu tín hiệu màu Tại dòng chẵn lấy mẫu tín hiệu màu Cr, dòng lẻ lấy mẫu tín hiệu Cb Như vậy, tần số lấy mẫu tín hiệu chói fD, Thì tần số lấy mẫu tín hiệu màu fD/2 - 4:1:1: Tín hiệu chói lấy mẫu tất điểm lấy mẫu dòng tích cực tín hiệu video Tín hiệu màu dòng lấy mẫu với tần số phần tư tần số lấy mẫu tín hiệu chói Như vậy, tần số lấy mẫu tín hiệu chói fD, tần số lấy mẫu tín hiệu màu CR CB fD/4 Câu 5: Sơ đồ khối nguyên lý hoạt động mã hóa giải mã MPEG Các loại ảnh, cấu trúc dòng bit… Mã hóa MPEG: PHOTO HUYỀN TRANG - - - - Dữ liệu từ khối ảnh (macroblocks) cần mã hoá đưa đến trừ (Subtractor) đoán chuyển động (Motion Estimator) Bộ đoán chuyển động so sánh khối ảnh đưa vào với khối ảnh đưa vào trước lưu lại ảnh dùng để tham khảo (Reference Picture) đoán chuyển động tìm khối ảnh ảnh tham khảo gần giống với khối ảnh Bộ đoán chuyển động sau tính toán vector chuyển động (Motion Vector), vector đặc trưng cho dịch chuyển theo hai chiều dọc ngang khối ảnh cần mã hoá so với ảnh tham khảo Chúng ta lưu ý vector chuyển động có độ phân giải nửa thực quét xen kẽ Bộ đoán chuyển động đồng thời gửi khối ảnh tham khảo mà chúng thường gọi khối tiên đoán (Predicted macroblock) tới trừ để trừ với khối ảnh cần mã hoá (thực trừ điểm ảnh tương ứng tức Pixel by pixel) Kết ta sai số tiên đoán (Error Prediction) tín hiệu dư, chúng đặc trưng cho sai khác khối ảnh cần tiên đoán khối ảnh thực tế cần mã hoá Tín hiệu dư hay sai số tiên đoán biến đổi DCT, hệ số nhận sau biến đổi DCT lượng tử hoá để làm giảm số lượng bits cần truyền Các hệ số đưa tới mã hoá Huffman, số bits đặc trưng cho hệ số tiếp tục làm giảm mộtcách đáng kể Dữ liệu từ đầu mã hoá Huffman kết hợp với vector chuyển động thông tin khác (thông tin I, P, B pictures) để gửi tới giải mã Giải mã MPEG: PHOTO HUYỀN TRANG 10 - Quá trình khôi phục ảnh giải mã hoàn toàn ngược lại Từ luồng liệu nhận đầu vào, vector chuyển động tách đưa vào bù chuyển động (Motion Compensator), hệ số DCT đưa vào biến đổi ngược IDCT để biến tín hiệu từ miền tần số thành tín hiệu miền không gian Đối với P pictures B pictures, vector chuyển động kết hợp với khối tiên đoán (predicted macroblock) để tạo thành ảnh tham khảo Các loại ảnh: - - - Ảnh I: + (Intra-pictures) ảnh mã hoá cách độc lập mà không cần tham khảo tới ảnh khác Hiệu nén tín hiệu đạt loại bỏdư thừa không gian mà yếu tố thời gian tham gia vào trình + I-pictures dùng cách tuần hoàn để tạo thành điểm tựa cho dòng liệu trình giải mã Ảnh P (Predictive – pictures): + sử dụng ảnh I P sát phía trước để bù chuyển động dùng để tham khảo cho việc tiên đoán ảnh khác + Mỗi khối ảnh P-picture mã hóa theo kiểu tiên đoán (predicted) mã cách độc lập (intra-coded) + sử dụng nén theo không gian thời gian, hiệu nén Ppictures tăng lên cách đáng kể so với I-pictures Ảnh B + sử dụng ảnh I P phía trước phía sau cho việc bù chuyển động, cho kết nén cao + Mỗi khối B-pictures tiên đoán theo chiều ngược, xuôi, hai hướng mã cách độc lập Để tiên đoán ngược từ ảnh phía sau nó, mã hóa tiến hành xếp lại ảnh theo thứ tự để truyền đi, tạo độ trễ Cấu trúc dòng bit gồm thành phần: PHOTO HUYỀN TRANG 11 + Khối: block gồm 8x8 pixel tín hiệu chói tín hiệu màu + Tổ hợp khối MB (macro block): gồm khối Y, Cb Cr có kích thước 16 x 16 pixel MB có thông tin khối Y, khối Cb, khối Cr theo chuẩn lấy mẫu 4:2:0 + Mảng (Slice): gồm nhiều MB kề nhau, Kích thước lớn mảng bao gồm toàn bộbức ảnh kích thước nhỏ mảng macroblock Slice header mang thông tin vịtrí mảng toàn ảnh, hệ số lượng tử dùng để xác định ma trận lượng tử trình giải mã slice + Ảnh (Khung): gồm nhiều slice ghép lại với Có loại ảnh I, P, B Picture header chứa thông tin về: thứ tự ảnh nhóm ảnh (thông tin dùng đểsắp xếp lại thứtự ảnh giải mã ), loại ảnh, kích thước vùng tìm kiếm vector chuyển động + Nhóm ảnh (GOP): gồm tập nhiều ảnh ảnh I, sau ảnh P, B Có loại GOP GOP đóng GOP mở GOP xác định tham số M, N GOP header chứa mã xác định thời gian ảnh nhóm + Chuỗi video ảnh (Sequence of pictures): Bắt đầu sequence header, sau nhiều GOP, cuối từmã "end-of-sequence" Sequence header chứa đựng thông sốnhư: kích thước ảnh, khổ ảnh, tần số ảnh, tốc độbit dòng video số, tần số ảnh kích thước bộnhớ đệm Câu 6: Hệ thống truyền hình chất lượng cao với số dòng z=1080, khổ ảnh 16:9, tần số quét 60 mành/giây (quét xen kẽ) Tín hiệu video số hóa với độ phân giải giống theo chiều ngang chiều dọc Ảnh lấy mẫu theo tiêu chuẩn 4:2:2 Mức lượng tử 256 cho thành phần chói 128 cho hai thành phần màu Tìm khối lượng thông tin số nhận sau số hóa chương trình truyền hình có thời gian Giải: PHOTO HUYỀN TRANG 12 + 256 mức cho chói => bit biểu diễn chói, 128 mức cho màu => bit biểu diễn màu + Kích thước ảnh 16:9, số dòng z= 1080 => Số cột: (108016)/9= 1920 => Số điểm ảnh: (19201080) pixel + điểm ảnh sử dụng: bit chói, 14 bit màu (2 màu) => 22 bit + Tần số quét: 60/2=30(Hz) (do quét xen kẽ) + Lấy mẫu theo chuẩn: 4:2:2 => Tần số quét cho màu= 1/2 Tần số quét cho chói => Dung lượng 2h: 10801920(8.30 + 7.30/2 + 7.30/2).2.3600 =… Câu : Cho chuỗi video dài 90 phút , mã hóa theo chuẩn H263 lưu ảnh theo kiểu PB, kích cỡ khung 4CIF, tốc độ quét 30 hình/s, biết trung bình khung I nén giây Chất lượng video yêu cầu tỷ số nén khung I 10 :1, khung P gấp 2lần khung I, khung B gấp lần khung P Tính kích cỡ đoạn video Nếu sửu dung ALSL 2+ để download tính thời gian để tải đoạn video Cho ALSL: 24Mbps; 4CIF: (704576) cho Y, (352288) cho CbCR Giải: + Kích thước video là: + Quét 30 hình/s: Có 30 khung: có khung I, 28 khung lại: 14 cặp PB (14P 14B) (mode PB: ảnh P B cạnh nhau, có khung I) Tỷ số nén khung I: 10:1 => 2.(kích thước khung)/10 Tỷ số nén khung P: 20:1 => 14.(kích thước khung)/20 Tỷ số nén khung B: 40:1 => 14.(kích thước khung)/40 Ta có: 90 phút [2.(kích thước khung)/10 + 14.(kích thước khung)/20 + 14.(kích thước khung)/40].60.90 Sử dụng ALSL, tốc độ 24M: => t = (kích thước 90 phút)/(24.106) =…(s) PHOTO HUYỀN TRANG 13 Câu 8: Giả sử, có ảnh mầu 24 bit với thành phần mầu đỏ, xanh xanh lơ thành phần mầu mã hóa bit cho điểm ảnh (pixel) Nếu muốn giảm xuống thành ảnh màu bít lượng tử hóa thành phần mầu đỏ xanh dùng bit mã hóa cho thành phần thành phần mầu xanh lơ mã hóa bit Xây dựng lượng tử dùng cho thành phần mầu khác Giả sử điểm ảnh có giá trị mầu (R, G, B) = (200, 150, 40) Xác định giá trị mầu sau lượng tử hóa Giải: Với mức R G, ban đầu dùng 8bit => 256 mức biểu diễn (0->256) Giảm 3bit => có mức biểu diễn mức: => khoảng lượng tử= 256/8= 32 Tương tự, với màu B, có mức biểu diễn mức: khoảng lượng tử= 256/4= 64 => Giá trị màu sau lượng tử: R= (192+224)/2=208, G= (128+160)/2=144, B= (0+64)/2=32 (R, G, B)= (208, 144, 32) Bài tập Bài 1: Nêu ý nghĩa phương pháp cân lược đồ xám? Cho ảnh đầu vào I có 10 mức xám Thực cân lược đồ xám ảnh I cho? Trả lời: n=4x4=16 (ma trận I=4x4) PHOTO HUYỀN TRANG 14 Số mức xám=10; k=0 đến N(k): số lần xuất k Nk 0 0 4 0 0 0 0 0 0 Thay 3, Thay 6, Thay 8, Thay 9 9 J= 6 3 8 3 Nêu ý nghĩa tăng cường ảnh? Cho ảnh đa mức xám I với mức xám nằm đoạn [0, 255] Dùng biến đổi s=log(1+r) để tìm ảnh đầu ra? Bài 2: Tính số mức lượng tử hóa cho tín hiệu hình sin có biên độ 3V cần biến đổi thành dạng số cho nhận tỷ số tín hiệu tạp âm lượng tử hóa không thấp 27 dB - Bước lượng tử hóa : ( L số mức lượng tử hóa) Với lượng tử hóa :, , =A=3(V) ) =10log Thay vào giải L= 63.33 PHOTO HUYỀN TRANG 15 Bài : Xác định số bit cần thiết để mã hóa cho băng ? Biết băng che 12 dB băng 7, 15 dB băng tín hiệu gốc mã hóa bit/mẫu/băng Băng 10 11 12 13 14 15 16 Mức (db) 12 10 20 60 14 20 15 - Băng bị che 15dB, thực chất có 14dB băng nằm duới - ngưỡng nghe không cần mã hóa Băng bị che 12dB, thực chất có 20dB băng nằm ngưỡng nghe, 20-12=8dB cần phải mã hóa - Ta có SNR=6,02n+1,761 - Khi tăng giảm bít SNR tăng giảm 6dB - Mà băng bị che 12dB bị che bít Số bít cần để mã hóa 8-2=6(bit) Bài 4: Xét chuỗi video mã hóa sử dụng H.263 chế độ PB, có kích cỡ ảnh 4CIF, tốc độ 30 fps Chuỗi video trình chiếu 90 phút Các tham số nén cho sau: trung bình có ảnh I mã hóa giây Chuỗi video chất lượng yêu cầu có tỉ lệ nén trung bình ảnh I, P, B tương ứng 10:1, 20:1, 40:1 Tính dung lượng chuỗi video sau mã hóa? Tính thời gian để tải đoạn video trường hợp sử dụng ALSL2+? Có fs=30frame/s; thời gian trình chiếu=90x60=5400(s) Với cỡ ảnh 4CIF: (704x576) cho chói (352x288) cho mầu ALSL: 24Mbps - Số bit khung : =A - Quét 30 hình/1s: có 30 khung có khung I 28 khung lại 14 cặp PB (14P 14B) Số bít giây là: + =6,08256Mbps Dung lượng chuỗi video 6,08256Mbps x5400(s)=32845,824 (Mbit) Thời gian để tải chuỗi video == 1368,576 (s) PHOTO HUYỀN TRANG 16 Bài 5: Cho hệ thống LPC tổng quát hình vẽ đây: Tính giá trị 10 mẫu tổng hợp đầu ra? Biết: - Bộ dự đoán có bậc p=4 với hệ số dự đoán: a1=1,793; a2=-1,401; a3=0,566; a4=-0,147 Độ lợi G=2, độ dài chu kỳ pitch=60; giả thiết âm hữu thanh, u(m)=1 m=1 u(m)=0 giá trị m khác Các điều kiện đầu =0 thời điểm bắt đầu chu kỳ pitch Công thức: , với G=2; (k)=1 với k=1, (k)=0 với gt khác Ta có: S(k)= a1S(k-1) + a2S(k-2) + a3S(k-3) + a4S(k-4) + Với k= 1, ta có: k= 1, S(0)= S(-1)= S(-2)= S(-3)= => S(1)= a1.S(0) + a2.S(-1) + a3.S(-2) + a4.S(-3) + 2= => S(2)= a1.S(1) + a2.S(0) + a3.S(-1) + a4.S(-2) + 0= 3,586 => S(3)= a1.S(2) + a2.S(1) + a3.S(0) + a4.S(-1) + 0= 3,628 => S(4)= a1.S(3) + a2.S(2) + a3.S(1) + a4.S(0) + 0= 2,606 => S(5)= a1.S(4) + a2.S(3) + a3.S(2) + a4.S(1) + 0=… PHOTO HUYỀN TRANG 17 =>S(6)= a1.S(5) + a2.S(4) + a3.S(3) + a4.S(2) + 0= =>S(7)= a1.S(6) + a2.S(5) + a3.S(4) + a4.S(3) + 0= =>S(8)= a1.S(7) + a2.S(6) + a3.S(5) + a4.S(4) + 0= =>S(9)= a1.S(8) + a2.S(7) + a3.S(6) + a4.S(5) + 0= =>S(10)= a1.S(9) + a2.S(8) + a3.S(7) + a4.S(6) + 0= Sử dụng phương pháp tối thiểu hóa bình phương sai số để tìm hệ số dự đoán dự đoán bậc (ai, i=1,2)? Biết khối liệu thoại có giá trị tự tương quan sau: R(0)=1; R(1)=0,6 R(2)=-0,2 Cho x[4]=0,5 x[3]=-0,1 giả thiết dự đoán lỗi bình phương trung bình có độ dài Tính giá trị dự đoán cho mẫu tín hiệu x[5]=? Bài 6: Cho ảnh màu RGB với R=200, G=150, B=40 Xác định thành phần Y, Cb, Cr cho ảnh theo mô hình Y, Cb, Cr? Giả sử với ảnh màu RGB cho có thành phần mầu mã hóa bit/pixel Nếu muốn biểu diễn thành ảnh màu bít sử dụng lượng tử hóa với tỷ lệ R, G, B tương ứng dùng 3, 3, bit mã hóa Xác định giá trị màu sau lượng tử hóa? Ta có: Thay giá trị R,G,B vào nhân ma trận bình thường kết ảnh màu 24 bit ảnh màu bit 8bit/R 3bit/R 8bit/G bit/G 8bit/B bit/B PHOTO HUYỀN TRANG 18 Với mức R G, ban đầu dùng 8bit => 256 mức biểu diễn (0->256) Giảm 3bit => có mức biểu diễn mức: => khoảng lượng tử= 256/8= 32 Tương tự, với màu B, có mức biểu diễn mức: khoảng lượng tử= 256/4= 64 => Giá trị màu sau lượng tử: R= (192+224)/2=208, G= (128+160)/2=144, B= (0+64)/2=32 (R, G, B)= (208, 144, 32) Bài 7: Cho khối ảnh S(2x2): DCT-2D ảnh S trên? Hãy tìm ảnh sở biến đổi Ta có - U0=, U1=, U0,0=U0.U0t = = U0,1=U0.U1t = = U1,0=U1.U0t = = U1,1=U1.U1t = = Ta lại có T0,0====12 T0,1====0 T0,0====0 T1,1====6 PHOTO HUYỀN TRANG 19 a Biểu diễn ảnh S qua ảnh sở tìm đươc trên? S’= T0,0.U0,0+ T0,1.U0,1+ T1,0.U1,0+ T1,1.U1,1 12 + +0 +6.= Bài 8: Cho hệ thống truyền hình chất lượng cao với số dòng z=1080, tỷ lệ khuôn hình 16:9, tần số quét 60 mành/giây (quét đan xen) Tín hiệu video số hóa với độ phân giải theo chiều ngang chiều dọc giống Mức lượng tử 256 cho thành phần chói 128 cho hai thành phần màu Tính khối lượng thông tin số có sau thực số hóa chương trình truyền hình có thời gian với khuôn dạng lấy mẫu : 4:2:0? + 256 mức cho chói => bit biểu diễn chói, 128 mức cho màu => bit biểu diễn màu + Kích thước ảnh 16:9, số dòng z= 1080 => Số cột: (108016)/9= 1920 => Số điểm ảnh: (19201080) pixel + điểm ảnh sử dụng: bit chói, 14 bit màu (2 màu) => 22 bit + Tần số quét: 60/2=30(Hz) (do quét xen kẽ) + Lấy mẫu theo chuẩn: 4:2:0 => Tần số quét cho màu= 1/2 Tần số quét cho chói => Dung lượng 2h: 10801920(8.30 + 7.30/2 + 7.30/2).2.3600 =… Bài 9: Xác định số bít trung bình cho điểm ảnh ( bao gồm chói màu) Biết ảnh sử dụng chuẩn lấy mẫu 4:2:2 với 16 bít/mẫu tỷ số nén chói màu 25.Cần bít để lưu trữ ảnh sử dụng chuẩn lấy mẫu 4:2:0 độ phân giải chói 576x720, tỷ số nén chói 20 tỷ số nén màu gấp lần chói?Xác định phương pháp điều chế đơn giản dùng để truyền băng tần 2MHz, tần số 25hz ảnh mã hóa theo định dang câu a ? PHOTO HUYỀN TRANG 20 Chuẩn lấy mẫu 4:2:2 có mẫu gồm chói màu (số mẫu chói màu nhay) Số bít điểm ảnh là: 8x16=128 (bit) Số bít điểm ảnh là: 128/4=32 (bít) Số bít trung bình cho điểm ảnh là: 32/25=1,28 (bit) a Cần bít để lưu trữ ảnh sử dụng chuẩn lấy mẫu 4:2:0 độ phân giải chói 576x720, tỷ số nén chói 20 tỷ số nén - màu gấp lần chói? Chuẩn lấy mẫu 4:2:0 độ phân giải cuẩ màu =1/2 chói Ta có số bít cho thành phần chói là: (567x720x16) (bit) Số bit cho thành phần màu ½ thành phần chói = ½(567x720x16) (bít) - Số bít lưu trữ là: =414720 bít b Xác định phương pháp điều chế đơn giản dùng để truyền băng tần 2MHz, tần số 25hz ảnh mã hóa theo định dang câu a ? Trong câu a có số bít thành phần chói thành phần màu Số bít thành phần chói = màu= (bit) Tổng só bít khung (bit) - Do tần số ảnh 25 hz Số bít khung :.25 = A Số mức để truyền : log2(n)= n Phương pháp điều chế M-PSK, M_QAM, M-ASK, M-PM Bài 10: Dữ liệu đa phương tiện truyền qua mạng với tốc độ 1.5 Mbps Dữ liệu bao gồm video audio số Audio có tốc độ bít trung bình 300kbps Biết Video số có định dạng chuẩn PAL nén dùng MPEG1 Khung video có cấu trúc IBBPBBPBBPBBI…Tỷ số nén 10:1 20:1 tương ứng cho khung I khung P Tính tỷ số nén khung B để đảm bảo truyền liệu đa phương tiện với tốc độ 1.5 Mbps Giả sử chuẩn PAL tín hiệu chói có độ phân giải 352x288 tín hiệu màu lấy mẫu nửa độ phân giải chói Tần số quét hình 25Hz Mào đầu ghép kênh đóng gói không vượt 15% luồng liệu video MPEG- - Tốc độ trung bình video : 1,5-0,3=1,2 Mbps - Khung video có I, 8B 3P - Tốc độ I nén xuống 10 lần 0,1 - Tốc độ 3P nén xuống 20 lần 3/20=0,15 PHOTO HUYỀN TRANG 21 Tốc độ 8B nén xuống X lần là: 8/X Tốc độ trung bình - Mỗi mẫu mã hóa bít Số bít khung là: 352x288x8+2x=1216512 Tốc độ trung bình video là: 1216512 25 = ( mào đầu không vượt 15%) X=50 Vậy tỷ số nén khung B 50:1 - Bài 11: Chuẩn mã hóa Video Mpeg với tốc độ mã hóa 1.15Mbit/s tần số quét 25hz với M=4 N=16 Nếu khung I có số bít gấp lần khung P khung P có số bít gấp lần khung B Tính số bít trung bình cho macroblock tương ứng với kiểu khung giả sử khung có 396 macroblock M=4: khoảng cách I P, P P N=16: chiều dài khung Thứ tự khung I, P, B khung lớn là: IBBBPBBBPBBBPBBB Vậy có khung I, 12 khung B khung P - Gọi x số bít khung P Số bít khung I 4x, số bít khung B x/5 Tốc độ mã hóa là:=.25=1,15.106 X=78298 bit Số bít trung bình khung P macroblock=x/396 Số bít trung bình khung I macroblock=4x/396 Số bít trung bình khung B macroblock= PHOTO HUYỀN TRANG 22 Bài 12: Chuẩn mã hóa Video Mpeg tần số quét 25hz với M=3 N=12 Nếu khung I có số bít gấp lần khung P khung P có số bít gấp lần khung B Mỗi macroblock khung B sử dụng 50 bít Xác định tốc độ bít luồng video giả sử khung có 396 macroblock Ta có M=3 khoảng cách khung I P, khung P P N=12: độ dài toàn khung Thứ tự xếp khung : IBBPBBPBBPBB Có khung I, khung B khung P Gọi x số bít khung P, số bít khung I 3x số bít khung B x/4 Tốc độ mã hóa là=.25 (*) Vậy số bít trung bình khung I macroblock 3x/396 số bít trung bình khung P macroblock x/396 số bít trung bình khung B macroblock =50 (bit) theo gia thiết X=7920 (bit) – tốc độ mã hóa luồng video là: 0.132 Mbps (thay x vào *) Bài tập giải ngân hàng PHOTO HUYỀN TRANG 23