Thảo luận Truyền thông đa phương tiện đề tài Nén video.Các chuẩn MPEG.Nén video và audio theo MPEG

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	13
Dung lượng	157,47 KB

Nội dung

VIDEO DATAII MỘT SỐ KHÁI NIỆM THUẬT NGỮ1 Một số khái niệm+Dữ liệu Video : là dữ liệu kết hợp cả hình ảnh động và âm thanh động trong cùng một file+Video cameraCó hai loại camera video – analog và digitalanalog video camera : Video camera chuyển đổi ảnh nó “nhìn thấy” nhờ thấu kính. Ánh sáng và cường độ màu thu được từ thấu kính sẽ chuyển thành điện thế, ảnh của vật thay đổi theo thời gian cường độ màu và ánh sáng phát ra trên các phần của sự vật . Vì vậy tín hiệu thu được từ video loại này được coi là tín hiệu analog vì nó tương tự như cường độ ánh sáng . Hình ảnh thu được từ Video camera loại này được ghi lên băng từDigital videoVideo số về nguyên tắc đó là dữ liệu tạo ra từ từ giá trị màu của các điểm ảnh (pixel) .Nói chung dữ liệu video tạo ra từ camera số có chất lượng tốt hơn analog video tạo ra. Lý do vì chúng ta có thể thay đổi đọ phân giải ảnh. Trong khi đó về nguyên tắc vedeo tương tự có độ phân giải không hạn chế , song xét cho cùng ảnh chúng ta nhìn thấy lại bị giới hạn bởi thiết bị.+ Một số ưu điểm của video số :Dễ edit, dễ sửa lỗi để đổi nâng cao chất lượng Có thể tạo ra dạng mới vmail một dạng email có gửi kèm video, dễ truyền giữa các máy tính.Dễ tích hợp text, audio, image.Có thể chứa trên các thiết bị có dung lượng lớn dễ bảo quản như CDROM, DVD trong khi đó analog video lưu trữ trên băng từ rất khó bảo quản.Video số được ứng dụng trong nhiều lĩnh vực như camera cảnh giới (surveillance camera, movie camera,…). Ví dụ với camera cảnh giới người ta thu chỉ 5 ảnhs khi đó ta có 5x 640x480 x12bit=18,438,000 bits tương đương với 2.3 triệu bytes nếu lưu vài ngày để kiểm tra thì dung tích chứa sẽ rất lớn.2 Thiết bị hiển thị Thiết bị dùng để hiển thị dữ liệu video phổ biến hiện nay là tivi (television) vì vậy ta tìm hiểu một số thông tin về nó. Tỉ lệ chuẩn giữa chiều rộng và chiều cao của màn hình tivi là :wh= 43 (aspect rate), tỉ lệ này do Thomas Edison đưa ra từ 1930. Do yêu cầu về chất lượng của một số loại hình dịch vụ như phim, phim màn ảnh rộng người ta đã chọn các tỉ lệ khác như : Trên thế giới hiện hiện dang sử dụng các hệ thống truyền hình sau NTSC ở châu Mỹ ; PAL và SECAM ở châu Âu và các khu vực khác trên thế giới Để người nhận ra sự chuyển động của ảnh các ảnh trên màn hình cần

Bộ Công Thương TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CÔNG NGHIỆP KHOA CÔNG NGHỆ THÔNG TIN o0o Giảng viên hướng dẫn : Ths:Trần Bích Thảo Nhóm 5 Lớp ĐH Tin 3A-Nam Định Sinh viên thực hiện : Khương Hoàng Hà Đỗ Ngọc Hậu Câu hỏi: Nén video.Các chuẩn MPEG.Nén video và audio theo MPEG Nam Định 04/10/2012 Truyền thông đa phương tiện VIDEO DATA II- MỘT SỐ KHÁI NIỆM THUẬT NGỮ 1- Một số khái niệm +Dữ liệu Video : là dữ liệu kết hợp cả hình ảnh động và âm thanh động trong cùng một file +Video camera Có hai loại camera video – analog và digital - analog video camera : Video camera chuyển đổi ảnh nó “nhìn thấy” nhờ thấu kính. Ánh sáng và cường độ màu thu được từ thấu kính sẽ chuyển thành điện thế, ảnh của vật thay đổi theo thời gian cường độ màu và ánh sáng phát ra trên các phần của sự vật . Vì vậy tín hiệu thu được từ video loại này được coi là tín hiệu analog vì nó tương tự như cường độ ánh sáng . Hình ảnh thu được từ Video camera loại này được ghi lên băng từ - Digital video Video số về nguyên tắc đó là dữ liệu tạo ra từ từ giá trị màu của các điểm ảnh (pixel) .Nói chung dữ liệu video tạo ra từ camera số có chất lượng tốt hơn analog video tạo ra. Lý do vì chúng ta có thể thay đổi đọ phân giải ảnh. Trong khi đó về nguyên tắc vedeo tương tự có độ phân giải không hạn chế , song xét cho cùng ảnh chúng ta nhìn thấy lại bị giới hạn bởi thiết bị. + Một số ưu điểm của video số : - Dễ edit, dễ sửa lỗi để đổi nâng cao chất lượng - Có thể tạo ra dạng mới vmail- một dạng email có gửi kèm video, dễ truyền giữa các máy tính. - Dễ tích hợp text, audio, image. - Có thể chứa trên các thiết bị có dung lượng lớn dễ bảo quản như CD-ROM, DVD trong khi đó analog video lưu trữ trên băng từ rất khó bảo quản. - Video số được ứng dụng trong nhiều lĩnh vực như camera cảnh giới (surveillance camera, movie camera,…). Ví dụ với camera cảnh giới người ta thu chỉ 5 ảnh/s khi đó ta có 5x 640x480 x12bit=18,438,000 bit/s tương đương với 2.3 triệu byte/s nếu lưu vài ngày để kiểm tra thì dung tích chứa sẽ rất lớn. 2- Thiết bị hiển thị - Thiết bị dùng để hiển thị dữ liệu video phổ biến hiện nay là tivi (television) vì vậy ta tìm hiểu một số thông tin về nó. - Tỉ lệ chuẩn giữa chiều rộng và chiều cao của màn hình tivi là :w/h= 4/3 (aspect rate), tỉ lệ này do Thomas Edison đưa ra từ 1930. Do yêu cầu về chất lượng của một số loại hình dịch vụ như phim, phim màn ảnh rộng người ta đã chọn các tỉ lệ khác như : - Trên thế giới hiện hiện dang sử dụng các hệ thống truyền hình sau NTSC ở châu Mỹ ; PAL và SECAM ở châu Âu và các khu vực khác trên thế giới - Để người nhận ra sự chuyển động của ảnh các ảnh trên màn hình cần phải làm tươi hay thay đổi với tốc đô nào đó. Người ta gọi là refresh rate. Để thấy được ảnh chuyển động trơn tốc độ làm tươi tối thiểu là 15 fps (frame per scond); các camera và project lấy tốc độ 16 fps, công nghiệp làm phim lấy 24 fps; NTSC lấy 30 fps; và PAL , SECAM lấy 25 fps; - Ảnh được tạo trên màn hình nhờ các đường quét (scan line), do tỉ lệ chiều rộng và chiều cao của màn hình là 4/3 do đó số điểm trên mỗi đường phụ thuộc vào số đường quét trên màn hình. Ví dụ màn hình có 483 đường khi đó số pixel trên mỗi đường là 4/3 x 843= 640 pixel. II -NÉN DỮ LIỆU VIDEO 1- nguyên tắc nén video - Để nén dữ liệu video người ta dựa vào hai nguyên tắc : -vứt bỏ dữ liệu dư thừa về không gian (spatial redundancy) mà nó có trên mỗi ảnh - Vứt bỏ dữ liệu dư thừa theo thời gian (temporal redundancy) , điều xảy ra do các ảnh video cạnh nhau tương đối giống nhau. + Bỏ dữ liệu dư thừa theo không gian Thực chất bỏ bớt các phần giống nhau trên một ảnh + Bỏ dữ liệu dư thừa theo thời gian Thực chất bỏ bớt các phần giống nhau trên các ảnh cạnh nhau (sử dụng ảnh I,B, P) 2- Một số phương pháp nén trực quan đơn giản dữ liệu video a/ phương pháp Subsampling Bộ mã hóa (encoder )chọn ra các ảnh khác nhau và viết nó vào dòng nén (compressed stream) cách làm này cho hệ số nén bằng 2. Bộ giải mã đưa vào các ảnh và nhân nó lên thành hai ảnh. b/ Differencing (mã các điểm khác nhau): ảnh được so với ảnh đứng trước nó, nếu sự khác nhau giữa chúng nhỏ (một số ít điểm), khi đó bộ mã chỉ mã các điểm khác nhau bằng cách viết 3 số vào dòng nén cho mỗi điểm, gồm tọa độ điểm ảnh và giá trị khác nhau của hai điểm ảnh . Nếu sự khác nhau giữa hai ảnh là lớn , trên ảnh hiện thời người ta ghi dòng ra nguyên dạng . Nếu sự sai khác giữa cường độ điểm ảnh trong ảnh trước và ảnh hiện thời nhỏ hơn ngưỡng nào đó, điểm được coi là không khác nhau. c/ Block Differencing (mã các khối khác nhau) Đây là phương pháp tốt hơn phương pháp differencing, ảnh được chia thành nhiều khối , trong mỗi khối B của ảnh hiện thời được so với khối P tương ứng ở ảnh đứng trước nó. Nếu hai khối khác nhau nhiều hơn số nào đó , thì B được nén bằngg cách ghi lai tọa độ ảnh của khối, tiếp theo là các giá trị của các điểm ảnh hoặc phần sai khác của các điểm ảnh vào dòng nén. Ưu điểm của tọa độ khối nhỏ hơn ghi tọa độ điểm ảnh và tọa độ khối chỉ ghi một lần, Ở bên trong giá trị của tất cả các điểm ảnh, ngay cả khi các điểm ảnh không thay đổi cũng phải viết vào dòng ra. Mặc dù các các giá trị này được coi là khác nhau nên chúng nhỏ. Do đó phương pháp này làm nhỏ rất nhiều kích thước khối. d/ Motion Compensation( bù chuyển động): Chúng ta biết rằng sự khác nhau giữa các ảnh liên tiếp trong film (movie) rất nhỏ vì nó là kết quả của chuyển động của camera quay hoặc giữa hai ảnh, đặc tính này được khai thác để làm tốt hơn cho việc nén ảnh. Nếu bộ mã hóa phát hiện ra rằng phần P của ảnh trước đó chuyển đến vị trí khác trong ảnh hiện thời , thì P có thể nén bằng cách ghi tiếp theo 3 trường (item) vào dòng nén, vị trí trước của nó, vị trí hiện thời và thông tin để xác định các biên của P. Phần sau chúng ta sẽ nói đến bù chuyển động dựa vào(Manning 98) Về nguyên tắc một phần có thể có mẫu bất kỳ . Trong thực tế chúng ta giới hạn các khối có kíchd thước như nhau (có thể hình vuông, chữ nhật), bộ mã hóa sẽ scan lần lượt các khối trên ảnh hiện thời. Với mỗi khối B nó đi tìm trên ảnh trước đó khối C giống hệt (nếu nén không mất thông tin) hoặc gần giống(nếu nén có mất dữ liệu). Phát hiện ra khối như thế, bộ mã hóa sẽ viết vào dòng ra sự sai khác giá vị trí hiện thời và vị trí đã gặp trước đó. Sự sai khác này cho ở dạng (Cx − Bx, Cy − By) = (Δx,Δy).Nó được gọi là vecto dịch chuyển Ví dụ: Trong hình này mặt trời và các cây di chuyển về bên phải(do camera chuyển động), trong khi đó câu bé di chuyển một khoảng cách khác về bên trái. (đó là cảnh chuyển động) Bù chuyển động rất hiệu quả nếu object dịch chuyển nhưng không thay đổi tỷ lệ hoặc không quay. Sự thay đổi nhanh cường độ sáng(illuminate) từ ảnh này sang ảnh khác cũng làm giảm hiệu quả của phương pháp này. Nói chung bù chuyển động cũng là kỹ thuật nén làm mất dữ liệu. e/ Frame Segmentation( phân đoạn ảnh): Ảnh hiện thời được phân chia thành các khối không chồng nhau nonoverlapping blocks) , các khối có thể là vuông hay chữ nhật, sau đó ta coi rằng chuyển động trong video chủ yếu theo đường ngang (horizontal), như vậy các khối ngang sẽ làm giảm số vecto chuyển động không làm giảm tỉ lệ nén. Kích thước khối là quan trọng vì khối lớn sẽ làm giảm cơ hội tìm ra cái giống nó, khối quá nhỏ thì có quá nhiều vecto chuyển động, trong thực tế người ta lấy kích thước là bội mũ của 2 để tiện sử lý trong phần mềm như 2,4,8,16 f/ Search Threshold (tìm theo ngưỡng): Mỗi khối B trong ảnh hiện thời trước tiên được so với bản sao C trong ảnh trước nó, nếu chúng giống nhau hoặc sự khác nhau giữa chúng dưới ngưỡng qui định khi đó bộ mã hóa coi như khối không có chuyển động. - Block Search (tìm khối) Đây là quá trình mất nhiều thời gian do vậy khi thiết kế thuật toán cần lưu ý. Nếu khối B hiện thời trong ảnh hiện thời, lúc đó cần tìm trong ảnh trước khối giống hoặc gần giống với B. Việc tìm kiếm được hạn chế trong một vùng nhỏ (gọi là vùng tìm kiếm) quanh khối B, vùng này được xác định bởi tham số di chuyển cực đại dx, dy . các tham số này ấn định khoảng cách tính bằng pixel theo chiều ngang và chiều thẳng đứng cực đại giữa khối B và khối bất kỳ giống B trong ảnh trước.Nếu B là hình vuông cạnh b, thì vùng tìm kiếm chứa (b + 2dx)(b + 2dy) pixel và sẽ có (2dx+1)(2dy +1) hình khác nhau, chồng nhau bxb hình vuông. Số khối cần tuyển chọn (candidate) trong vùng này tỉ lệ với dxdy. Hình dưới đây minh họa vùng tìm kiếm. - Distortion measure (Đo độ sai khác) Đây là phần quan trọng đối với bộ mã hóa, độ đo sai lệch cho phép chọn khối thích hợp nhất với khối B, nó phải đơn giản , nhanh và tin cậy. Có một vài cách chọn dẽ đề cập ở section 4.14 Độ sai khác tuyệt đối trung bình ( mean absolutw error) được tính trung bình theo sự sai khác tuyệt đối giữa Bij trong khối B và điểm tương ứng Cij trong khối tuyển chọn C (candidate block C) Độ đo này được tính cho mỗi khối trong số (2dx+1)(2dy +1) khối khác nhau và b xb khối cần lựa chọn (candidate) có giao. Nếu độ đo của khối C k nhỏ hơn ngưỡng thì nó được coi là giống B Trái lại sẽ không có khối nào giống B và B được mã không bù chuyển động. Một cách tự nhiên phát sinh câu hỏi ở đây là điều gì sẽ xảy ra khi khối trong ảnh hiện thời không trùng với với khối nào trong ảnh trước . Câu trả lời là chúng ta hãy tưởng tượng camera dịch lia từ trái qua phải , đối tượng mới được đưa vào từ bên phải trong thời gian lia, khôi bên phải của ảnh có thể chứa các đối tượng không có trong ảnh trước. - Độ sai khác trung bình bình phương ( mean square difference) là cho ở dạng: - Độ đo PDC (Pel difference Classification (PDC) - Pel ở đây được coi là điểm ảnh , tương đương pixel - Độ đo PDC nó phân loại sự sai khác theo các diểm ảnh, cụ thể là sai khác theo hàng , sau đó sai khác theo cột Tín hiệu video sau khiđược số hoá 8 bit có tốcđộ 216 Mb/s.Để có thể truyềntrong một kênh truyền hình thông thường, tín hiệu video số cần phảiđược nén trongkhi vẫn phảiđảm bảo chất lượng hìnhảnh. Nénvideo trong những năm 1950được thực hiện bằng công nghệ tương tự với tỷ số nén thấp. Ngày nay công nghệ nén đã đạt được những thành tựu cao hơn bằngviệc chuyển đổi tín hiệu video từ tương tự sang số. Công nghệ nén số (DigitalCompressed)đòi hỏi năng lực tính toán nhanh. Song ngày nay với sự phát triển củacông nghệ thông tin,điều này không còn trở ngại. Như chúng ta biết tín hiệu video có dải phổ từ 0 – 6 MHz, tuy nhiên trong nhiềutrường hợp năng lượng phổ chủ yếu tập trungở miền tần số thấp và chỉ có rất ít thôngtin chứađựngở miền tần số cao. Đối với tín hiệu video số, số lượng bitđược sử dụngđể truyền tải thông tinđối với mỗi miền tần số khác nhau, có nghĩa là: miền tần số thấp, nơi chứađựng nhiềuthông tin,được sử dụng số lượng bít lớn hơn và miền tần số cao, nơi chứađựng ítthông tin,được sử dụng số lượng bít ít hơn. Tổng số bít cần thiếtđể truyền tải thôngtin về hìnhảnh sẽ giảm một cáchđáng kể và dòng dữ liệuđược “nén ” mà chất lượnghìnhảnh vẫnđảm bảo. Thực chất của kỹ thuật “nén video số” là loại bỏ đ i các thôngtin dư thừa. Cácthông tin dư thừa trong nén video số thường là: +Độ dư thừa không gian giữa các pixel; +Độ dư thừa thời gian do cácảnh liên tiếp nhau; +Độ dư thừa do các thành phần màu biểu diễn t ừng pixel có độtương quan cao; +Độ dư thừa thống kê do các kí hiệu xuất hiện trong dòng bít với xác suất xuất hiện khôngđều nhau; +Độ dư thừa tâm lý thị giác (các thông tin nằm ngoài khả năng cảm nhận của mắt).vv… Như vậy, mụcđích của nén tín hiệu video là : -Giảm tốcđộ dòng bít của tín hiệu gốc xuống một giá trị nhấtđịnhđủđểcó thể tái tạoảnh khi giải nén; -Giảm dung lượng dữ liệu trong lưu trữ cũng như giảm băng thông cần thiết. Tiết kiệm chi phí trong lưu trữ và truyền dẫn dữ liệu trong khi vẫn duy trì chất lượng ảnh ở mức chấp nhận đựơc. Vớinguyên nhân và mụcđích của việc nén tín hiệuđược trình bày như ở trên, ngày nay có nhiều các chuẩn nénđã rađời như: JPEG, M-JPEG, MPEG, DV… Trong đó chuẩn nén MPEG được s ửdụng nhiều trong nén video trong truyền hình với thành công của chuẩn nén video MPEG-2 trong truyền hình số và chuẩn nén MPEG-4 trong truyền hình trên mạng Internet II- Họ chuẩn nén MPEG MPEG -viết tắt của Moving Pictures Experts Group , nó là tên gọi chỉ nhóm chuyên gia thực hiện dự án nén dữ liệu media. Dự án này được bắt đầu từ năm1988. Kết quả dự án đã được thừa nhận là chuẩn ISO (International Standardization Organization) và chuẩn IEC (International Electrotechnical Committee). Thực chất Mpeg là kỹ thuật nén dữ liệu video, nó được sử dụng để nén ảnh và âm thanh số và đồng bộ hai loại dữ liệu này. Để có cái nhìn hệ thống về họ chuẩn Mpeg , chúng ta hãy xem xét các phiên bản của họ chuẩn Mpeg. Cho đến nay đã có các phiên bản sau : -Mpeg-1 :phát triển chuẩn nén dữ liệu multimedia (video, audio) dựa trên mục tiêu là tương tác với CD và thiết bị digital audio broadcasting. Chuẩn này đã rất thành công trong lĩnh vực thương mại trong thời gian qua. Đến nay người ta vẫn dùng Mpeg-1 cho dữ liệu video và được kết hợp với kỹ thuật nén audio MP3. - Mpeg -2 được dành chủ yếu mục tiêu truyền hình số ( digital television). Các kỹ thuật của nó đáp ứng cho việc nén cởi nén và đồng bộ dữ liệu video trong lĩnh vực truyền hình. - Mpeg-3 : với mục tiêu nén dữ liệu multimedia tương tác với các đĩa quang có mật độ ghi cao như HDVD ( High-Definition/Density DVD ). Nhưng kết quả thu được không khác biệt nhiều với Mpeg-2 , nên người ta bỏ phiên bản này. - Mpeg-4 với mục tiêu nhằm vào nén, cởi nén dữ liệu multimedia có tốc độ thấp , cỡ vài nghìn bit trên giây. Nó nhằm vào các thiết bị xử lý multimedia nhỏ, thiết bị cầm tay như video telephones , mobile phone , thiết bị di chuyển nhanh (các thiết bị multimedia đặt trên xe ) nén , cởi nén và truyền nhanh các đoạn video ngắn. Một đặc điểm quan trọng của Mpeg-4 là người ta đã đưa quan điểm xử lý object vào trong quá trình xử lý dữ liệu nhờ đó nó đặt được nền tảng cho các lĩnh vực liên quan phát triển trong tương lai. Các chuẩn của Mpeg có vai trò rất quyết định đến tốc độ truy cập dữ liệu. Chuẩn Mpeg-1 có đốc độ 1.5 Mbit/s . Mpeg-2 có tốc độ thấp nhất 10 Mbit/s. Mpeg -4 nhằm vào các thiết bị nhỏ , thiết bị cầm tay nên tốc độ truy cập chỉ đạt tối đa 64 Kbit/s . Để hiểu nguyên lý làm việc của họ chuẩn Mpeg chúng ta sẽ xem xét kỹ thuật nén Mpeg-1. 1- Chuẩn Mpeg-1 Mpeg-1 được thực chất cho dữ liệu video . tài liệu của chuẩn được mô tả trong tài liệu IS1172-2.của tổ chức ISO. Dưới đây chúng ta sẽ tìm hiểu một số kỹ thuật sử dụng trong Mpeg-1 a - Tỷ lệ nén video của Mpeg-1 Để có thể sử dụng dữ liệu video, Mpeg-1 cần phải đạt tỉ lệ nén bao nhiêu ? Để dễ hiểu ta xét ví dụ sau : - Giả sử ảnh video có độ phân giải 360×288 - Độ sâu của ảnh (depth) 24bit/pixel; - Tốc độ làm tươi ảnh (refresh rate) 24 frame/s - dữ liệu âm thanh : tốc độ lấy mẫu 44 KHz ; phân giải 16bit/sample; mode stereo. Khi đó tốc độ đọc phần dữ liệu ảnh là :360×288×24×24 = 59,719,680 bits/s; Tốc độ đọc dữ liệu âm thanh : 2×44,000×16 = 1,408,000 bits/s. Như vậy để đọc cả âm và hình cần tốc độ khoảng 61.1 Mbit/s. Nếu đọc với tốc độ 1,5 Mbit/s thì hệ số nén cần đạt lớn hơn 40 lần. Ở đây chúng ta chưa tính đến thời gian giải nén. Điều nay giải thích vì sao Mpeg-1 phải có tỉ lệ nén cao, tốc độ giải nén nhanh. Lưu ý rằng tốc độ đọc vật lý của các ổ đĩa CD là 150 Kbps – đây là tốc độ cơ bản , kí hiệu là x, b- Mpeg-1 nén dữ liệu nhờ kỹ thuật chuyển đổi không gian màu Mỗi ảnh trong dãy ảnh video được chuyển từ không gian màu RGB sang không gian màu Y, Cb, Cr trong đó Y ứng với thành phần aluminance , Cb, Cr ứng với Chrominance hai thành phần này tương ứng hue (sắc màu) và saturate (độ đậm nhạt). Dựa vào đặc điểm mắt người không nhạy cảm với sự thay đổi của Cb, Cr , Mpeg-1 lấy độ phân giải của Cb, Cr bằng nửa độ phân giải của Y. c- Mpeg-1 nén dữ liệu và tạo thành các gói (packet) Mỗi gói được bắt đầu bằng code gồm 32 bit, tiếp theo là header và kết thúc gói bằng mã endcode 32 bit. ở giữa header và end ode có chứa một số gói.Mỗi gói chứa dữ liệu nén hoặc audio hoặc video. Kích thước của mỗi gói được xác định trước bởi bộ mã Mpeg (MPEG encoder theo yêu cầu lưu trữ hoặc thiết bị truyền đi) , điều này giải thích vì sao một packet không cần đầy đủ các ảnh video, nó có thể là phần nào đó của audio, phần nào đó của ảnh video.Hình H15 dưới đây mô tả cấu trúc dữ liệu nén của Mpeg-1 d - Mpeg-1 giải nén audio và ảnh động riêng biệt Bộ giải mã Mpeg-1 nhằm khôi phục lại dữ liệu video , nó gồm 3 lớp (layer). Lớp giải mã ảnh video, lớp giải mã audio và lớp data system. Lớp data system có nhiệm vụ đọc và phân tích dữ liệu trong phần header của các gói , các đường dẫn dẫn đến các gói khác, đồng bộ dữ liệu đã giải nén ở các buffer. e - Mpeg-1 sử dụng 3 loại ảnh I ,P,B để nén - Ảnh I (Intra frame, key frame) có thể coi là ảnh gốc, với ảnh này khi giải mã nó không cần lấy thông tin từ ảnh khác; - Anhr P (predicted picture ) là ảnh khi giải nén nó phải sử dụng thông tin từ các ảnh trước nó, thường nó là nén của ảnh I. - Ảnh B (Bi –directionaly frame ) là ảnh mà khi giải nén nó phải dùng cả ảnh đứng trước và ảnh sau nó. Ảnh B là ảnh có tỉ lệ nén cao nhất. Từ khái niệm ảnh I,B,P chúng ta dễ thấy rằng trật tự các ảnh trên đĩa CD khác với trật tự xuất hiện của các ảnh . Trong hình H2 , dãy số ằm ngang là thứ tự ảnh trên đĩa CD, cột số bên phải là thứ thự ảnh khi play. [...]... HOÁ VÀ GIẢI MÃ DÙNG MPEG- 2 Sơ đồ bộ mã hoá và giải mã MPEG 2 được trình bày trên hình 2 Mã hoá MPEG- 2 Quá trình mã hoá cho P pictures và B pictures được giải thích như sau: Dữ liệu từ các khối ảnh (macroblocks) cần được mã hoá sẽ được đưa đến cả bộ trừ (Subtractor) và bộ đoán chuyển động (Motion Estimator) Bộ đoán chuyển động sẽ so sánh các khối ảnh mới được đưa vào này với các khối ảnh đã được đưa vào... hiệu ở miền không gian Đối với P pictures và B pictures, vector chuyển động sẽ được kết hợp với các khối tiên đoán (predicted macroblock) để tạo thành các ảnh tham khảo 2 - Chuẩn MPEG- 4 MPEG- 4 là chuẩn mới cho dữ liệu audiovisual data.Tuy nhiên nén video và audio vẫn là đặc điểm nổi trội của Mpeg -4 Phần này mô tả những nét chính về MPeg4 Mpeg- 4 được bắt đầu từ 5/1991.Năm 1999... luôn nhờ vào bộ giải mã nội bộ ngay chính bên trong bộ mã hoá, do đó ta có thể thực hiện thay đổi thứ tự các bức ảnh và dùng các phương pháp tiên đoán như đã trình bày ở trên Giải mã MPEG- 2 Quá trình khôi phục lại ảnh tại bộ giải mã là hoàn toàn ngược lại Từ luồng dữ liệu nhận được ở đầu vào, vector chuyển động được tách ra và đưa vào bộ bù chuyển động (Motion Compensator), các hệ số DCT được đưa vào bộ... được kết hợp với vector chuyển động và các thông tin khác (thông tin về I, P, B pictures) để gửi tới bộ giải mã Hình 2 Sơ đồ bộ mã hoá và giải mã dùng MPEG Đối với trường hợp P-pictures, các hệ số DCT cũng được đưa đến bộ giải mã nội bộ (nằm ngay trong bộ mã hoá) Tín hiệu dư hay sai số tiên đoán được biến đổi ngược lại dùng phép biến đổi IDCT và được cộng thêm vào ảnh đứng trước để tạo nên ảnh tham khảo... biến đổi cosin để lượng hóa và mã hóa Quá trình lượng hóa và mã hóa của Mpeg -1 tương tự như Jpeg Khi mã hóa Mpeg và Jpeg khác nhau ở bảng mã và cách làm trong về số nguyên Mpeg sử dụng cách làm tròn về số nguyên gần nhất, g - Mpeg- 1 tổ chức ảnh thành các slice Mỗi ảnh trong Mpeg được tổ chức thành các slice, mỗi slice gồm một số macroblock liền kề... dãy ảnh mới để hiển thị Nói chung trật tự hiển thị khác với trật tự vào Một vùng của ảnh đang xét khi giải mã có thể phải dùng đến các ảnh trước, ảnh sau trong nhóm hoặc ngoài nhóm f - Mpeg- 1 sử dụng phép biến đổi cosin trong quá trình nén Mỗi ảnh được Mpeg- 1 chia thành các khối cơ bản – gọi là macroblock Khối cơ bản có kích thước 16 x16, khối... với các khối ảnh đã được đưa vào trước đó và được lưu lại như là các ảnh dùng để tham khảo (Reference Picture) Kết quả là bộ đoán chuyển động sẽ tìm ra các khối ảnh trong ảnh tham khảo gần giống nhất với khối ảnh mới này Bộ đoán chuyển động sau đó sẽ tính toán vector chuyển động (Motion Vector), vector này sẽ đặc trưng cho sự dịch chuyển theo cả hai chiều dọc và ngang của khối ảnh mới cần mã hoá so với... đoán và khối ảnh thực tế cần mã hoá Tín hiệu dư hay sai số tiên đoán này sẽ được biến đổi DCT, các hệ số nhận được sau biến đổi DCT sẽ được lượng tử hoá để làm giảm số lượng các bits cần truyền Các hệ số này sẽ được đưa tới bộ mã hoá Huffman, tại đây số bits đặc trưng cho các hệ số tiếp tục được làm giảm đi một cách đáng kể Dữ liệu từ đầu ra của mã hoá Huffman sẽ được kết hợp với vector chuyển động và. .. nén Mpeg sử dụng ba kiểu ảnh I,P, B Các ảnh này được xếp thành từng nhóm, các nhóm có thể tổ chức thành loại nhóm đóng hoặc nhóm mở (open group, closed group).Nhóm đóng là nhóm mà khi khôi phục ảnh nó chỉ sử dụng các ảnh trong nhóm, nhóm mở là nhóm có thể sử dụng ảnh ở ngoài nhóm để khôi phục lại ảnh Các anh I,P,B ở đầu vào được sắp xếp theo. .. Phần này mô tả những nét chính về MPeg4 Mpeg- 4 được bắt đầu từ 5/1991.Năm 1999 công bố chuẩn phiên bản đầu tiên.Năm 2003 Mpeg- 4 ISO và IEC công nhận quốc tế Tài liệu chuẩn mang mã số ISO/IEC 14496 Dưới đây là một số đặc trưng quan trọng của Mpeg- 4 : a- Có các công cụ (Tools) cơ bản để truy cập dữ liệu multimedia Nhờ các công cụ này, người ta có thể indexing,

Ngày đăng: 27/08/2014, 10:56

Xem thêm