Mô hình cơ sở dữ liệu video cho lập danh mục và khôi phục nội dung

Các thuật toán này đảm bảo cho việc sử dụng các tệp video trên máy tính cũng như truyền dữ liệu video trên mạng là hiệu quả trong thời gian thực.. Các dữ liệu video này được lưu trữ và x

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI ĐẠI HỌC CÔNG NGHỆ

PHẠM THANH TÙNG

MÔ HÌNH CƠ SỞ DỮ LIỆU VIDEO CHO LẬP DANH MỤC

VÀ KHÔI PHỤC NỘI DUNG

LUẬN VĂN THẠC SỸ

Người hướng dẫn: PGS TS Đỗ Trung Tuấn

Hà Nội - 2005

Trang 2

MỤC LỤC

MỤC LỤC 1

Danh mục các kí hiệu và viết tắt 5

MỞ ĐẦU 7

Chương 1 – GIỚI THIÊU TỔNG QUAN VỀ VIDEO 9

1.1 Một số khái niệm cơ bản 9

1.1.1 Video 9

1.1.2 Video số 9

1.1.3 Dữ liệu video số 10

1.1.4 Kích cỡ khuôn hình 10

1.1.5 Kích cỡ khuôn hình và độ phân giải 10

1.1.6 Tỷ lệ khuôn hình 11

1.1.7 So sánh quét xen dòng và quét tuần tự 11

1.1.8 Tốc độ của phát hình 12

1.2 Các yêu cầu hệ thống của Video 12

1.2.1 Phát hình trong thời gian thực 12

1.2.2 Tính đồng bộ của thiết bị khi xử lý video 12

1.3 Các đặc điểm của dữ liệu video và video số 13

1.3.1 Khả năng truyền tải thông tin 13

1.3.2 Độ phân giải của video số 13

1.3.3 Dữ liệu lớn (chiếm nhiều không gian lưu trữ) 14

1.4 Phân lớp video 15

1.4.1 Phân lớp theo mục đích sử dụng 15

Trang 3

1.5 Các hướng nghiên cứu và ứng dụng 17

1.5.1 ứng dụng video cho đào tạo điện tử (e-learning) 17

1.5.2 Xây dựng hệ quản trị cơ sở dữ liệu video 17

1.5.3 Hệ thống mô phỏng và thực tại ảo 18

1.5.4 Video theo yêu cầu 18

1.5.5 Truyền hình số 18

Chương 2 - CÁC ĐỊNH CHUẨN VIDEO 19

2.1 Định dạng chuẩn cho hệ điều hành 19

2.1.1 Định dạng AVI 19

2.1.2 Các định dạng MOV 22

2.2 Các định chuẩn MPEG 25

2.2.1 Giới thiệu 25

2.2.2 MPEG–1 26

2.2.3 MPEG–2 29

2.2.4 MPEG–4 31

2.3 So sánh các định chuẩn MPEG 33

2.3.1 Bảng so sánh các định chuẩn MPEG 33

2.3.2 So sánh các định dạng Video AVI, MPG, RM/RA, ASF, IVF, VIV, MOV, DivX 34

Chương 3 – MÔ HÌNH CƠ SỞ DỮ LIỆU VIDEO 39

3.1 Tổng quan 39

3.2 Cấu thành dữ liệu video 41

3.2.1 Những đặc tính duy nhất của dữ liệu video 42

3.2.2 Nội dung của dữ liệu video 43

3.3 Yêu cầu cho mô hình video 44

Trang 4

3.3.1 Hỗ trợ trừu tượng hóa cấu trúc video đa mức 44

3.3.2 Hỗ trợ quan hệ không gian và thời gian 45

3.3.3 Hỗ trợ chú giải video 46

3.3.4 Độc lập dữ liệu video 46

3.4 Một số mô hình video 46

3.4.1 Các mô hình dựa trên phân đoạn video 46

3.4.2 Các mô hình dựa trên chú giải 48

3.4.3 Các mô hình đối tượng video 49

3.4.4 Mô hình dữ liệu video đại số 50

3.4.5 Các mô hình dữ liệu video khác 51

Chương 4 - MÔ HìNH CƠ SỞ DỮ LIỆU VIDEO CHO LẬP DANH MỤC VÀ KHÔI PHỤC NỘI DUNG VIDEO 53

4.1 Tổng quan 53

4.2 Mô hình hóa dữ liệu ảnh/video mức thấp 55

4.2.1 Mô hình hóa không gian – thời gian qua một dãy các khung 56

4.2.2 Mô hình đề xuất 57

4.3 Khung cấu thành các tình huống 60

4.3.1 Khái quát thao tác không gian – thời gian 60

4.3.2 Kí hiệu và khái niệm 62

4.3.3 Sự kiện không gian 63

4.3.4 Sự kiện thời gian 68

4.4 Mô hình hướng đối tượng của dữ liệu video 73

4.4.1 Từ sự kiện đến lớp 74

4.4.2 Khái niệm dữ liệu video khái quát trong mẫu hướng đối tượng 77

4.4.3 Mô hình đề xuất 82

KẾT LUẬN 85

Trang 5

TÀI LIỆU THAM KHảO 86

Trang 6

Danh mục các kí hiệu và viết tắt

VDBMS Video Database Management System

OVID Object Video Information Database

VIMSYS Visual Information Management System

VODM Video Object Description Model

VSDG Video Sematic Directed Graph

SECAM Sequential colour with memory

NTSC National Television Standard Committee

MPEG Moving Picture Experts Group

YUV Không gian mầu Y: giá trị độ sáng luminance

U,V: giá trị màu chrominance JPEG Joint Picture Experts Group

SIF Standard Intechange Format

ISO International Organization for Standardization

EIA Electronic Industries Association

DVD Digital Versatile Disc hoặc Digital Video Disc

Trang 7

AVI Audio Video Interleave

MOV Quick Time Movie File Extension

WMV Windows Media file with Audio/Video

IMA Interactive Multimedia Association

Trang 8

MỞ ĐẦU

Cùng với sự phát triển của máy tính, video số ngày càng trở nên phổ biến hơn trong nhiều lĩnh vực của cuộc sống như truyền thông, giáo dục, đào tạo, giải trí, và xuất bản Cụ thể là một số lượng lớn dữ liệu video hoặc đã tồn tại ở dạng số hoá, hoặc sẽ sớm được số hoá Theo một khảo cứu thế giới, đã có hơn sáu triệu giờ phim truyện và video được chiếu trên toàn thế giới, với tỷ lệ tăng hàng năm khoảng 10%

Nó bằng 1.8 triệu Gb dữ liệu video MPEG được mã hoá nếu là dạng số hoá

Với sự gia tăng số lượng thông tin video khổng lồ, sẽ không thể mã hoá được hết nếu không có sự quản lý mang tính hệ thống dữ liệu video Các hệ quản trị CSDL truyền thống được thiết kế để quản lý kiểu cấu trúc dữ liệu đơn giản, nhưng không phải là dữ liệu video

Bản chất của dữ liệu video là có cấu trúc phức tạp và nó đòi hỏi các phương pháp mới để mô hình hoá, sắp xếp, chèn và tính toán dữ liệu Rất nhiều mô hình CSDL video được đề xuất nhưng nói chung vẫn chưa đáp ứng được các yêu cầu của một CSDL cũng như áp dụng vào thực tế

Luận văn này tập trung vào:

 Giới thiệu video: các khái niệm, định chuẩn

 Trình bày các mô hình CSDL video

 Trình bày mô hình CSDL video cho lập danh mục và khôi phục nội dung Luận văn được nghiên cứu với sự kết hợp của nhiều phương pháp: thu thập, phân tích, phân loại; nghiên cứu, phân tích và tổng hợp tài liệu; phân tích và thiết kế

hệ thống thông tin; phương pháp mô hình hoá trực quan Luận văn gồm bốn chương:

Mở đầu

Trang 9

 Chương một: Giới thiệu tổng quan về video, các đặc trưng dữ liệu, phân lớp

video

 Chương hai: Tập trung nghiên cứu, phân tích, so sánh các định chuẩn của

video AVI, MOV, MPEG: tên định chuẩn, mục đích sử dụng, mã nén, kích cỡ,

tỷ lệ, thời gian nén, chất lượng Từ đó rút ra kết luận và đưa ra các bảng so sánh định chuẩn video

 Chương ba: Mô hình CSDL video

 Chương bốn: Mô hình CSDL video cho lập danh mục và khôi phục nội dung

Kết luận

Trang 10

CHƯƠNG 1 GIỚI THIỆU TỔNG QUAN VỀ VIDEO

 Video ra đời vào những năm đầu của thế kỷ XX và phát triển khá mạnh mẽ, nhưng phải đến cuối thập kỷ XX video số mới phát triển Với sự ra đời và phát triển mạnh của máy tính và hệ thống viễn thông, dữ liệu video đã được số hoá

và đưa vào xử lý trên hệ thống máy tính Việc xử lý dữ liệu video được số hoá trên máy tính tỏ ra khá hiệu quả Kết quả là dữ liệu video số đã được đưa vào rất nhiều ứng dụng trong thực tế như đào tạo điện tử dựa vào máy tính CBT

(Computer Based Training), hỗ trợ đào tạo trên mạng WBT (Web Base

Training), hệ thống mô phỏng, video theo yêu cầu (Video On Demand) và một

vấn đề được quan tâm hàng đầu hiện nay là CSDL video

 Chương này sẽ tập trung giới thiệu về các khái niệm, đặc điểm và các ứng dụng của video số

1.1 Một số khái niệm cơ bản

Trang 11

 Dữ liệu video ở dạng bít 0 và 1 nên việc tác động lên video đơn giản hơn video truyền thống

1.1.3 Dữ liệu video số

 Dữ liệu video số là các đoạn phim đã được số hoá và được ghi thành tệp trên đĩa cứng, đĩa CD, đĩa DVD, băng từ và các thiết bị lưu trữ khác mà máy tính có thể hiểu được

 Một tệp video thông thường có hai phần: dữ liệu hình ảnh và dữ liệu âm thanh Khi phát, các dữ liệu hình ảnh và các dữ liệu âm thanh được phát đồng bộ nhau

1.1.4 Kích cỡ khuôn hình

Kích cỡ khuôn hình (frame size) là chiều dọc và chiều ngang của khuôn hình

được tính bằng điểm ảnh Ví dụ: khuôn hình ảnh 720x486 chứa 349.920 điểm ảnh, 640x480 chứa 307.200 điểm ảnh

Kích cỡ khuôn hình của video phải được xác định rõ theo định dạng chuẩn của video xuất ra Ví dụ: kích cỡ khuôn hình 720x480 điểm ảnh cho hệ NTSC, 720x576 điểm ảnh cho hệ PAL Hoặc có thể xác định khuôn hình 320x240 điểm ảnh cho các video có kích cỡ nhỏ, có thể sử dụng trên Web Tăng kích cỡ khuôn hình đồng nghĩa với việc máy tính phải tốn nhiều bộ nhớ và thời gian xử lý hơn khi hiển thị hay soạn thảo video

1.1.5 Kích cỡ khuôn hình và độ phân giải

Khi xử lý video số, kích cỡ khuôn hình tham chiếu đến độ phân giải Một loạt các thuộc tính rất quan trọng của khuôn hình khi soạn thảo video: điểm ảnh, tỷ lệ của khuôn hình, độ phân giải, độ sâu mầu Mối liên hệ giữa các yếu tố này là rất quan trọng như kích cỡ khuôn hình và yêu cầu bộ nhớ; độ phân giải cao hơn thì hình ảnh chi tiết hơn và do đó yêu cầu cần nhiều bộ nhớ cho soạn thảo hơn

Trang 12

1.1.6 Tỷ lệ khuôn hình

Tỷ lệ của khuôn hình là tỷ lệ kích thước chiều rộng/chiều cao của ảnh Ví dụ: tỷ

lệ khuôn hình của video NTSC là 4:3, một số video lớn hơn sử dụng tỷ lệ 16:9 Tỷ

lệ của khuôn hình không chỉ là các cạnh mà nó còn liên quan đến các chuẩn video

Ví dụ: tỷ lệ 4:3 là chuẩn cho các sản phẩm video của hệ điều hành Windows, Mac, khuôn hình 720x480 điểm ảnh sử dụng cho chuẩn NTSC

1.1.7 So sánh quét xen dòng và quét tuần tự

Interlaced là kỹ thuật quét xen dòng để làm tươi hình ảnh trên màn hình Interlaced hay Progressive-scan là kỹ thuật quét tuần tự các dòng

No-Kỹ thuật quét xen dòng là thuộc tính bắt và hiển thị video, nó không có cấu trúc phức tạp trong định dạng tệp hoặc truyền thông Kỹ thuật quét tuần tự các dòng cung cấp các hình ảnh tốt hơn khi soạn thảo hay tạo hiệu ứng video Video tương tự

và số có thể phân loại như là kỹ thuật quét xen dòng và quét tuần tự các dòng Các chương trình video của chuẩn PAL, NTSC, SECAM sử dụng kỹ thuật quét xen dòng: mỗi khuôn hình coi như hai phần hiểu thị Hầu hết màn hình máy tính sử dụng quét tuần tự Các khuôn hình được hiển thị một lần và được quét từ trên xuống trước khi khuôn hình tiếp theo được hiển thị

Trong quét xen dòng video, một khuôn hình được phân chia thành hai phần, phần đầu được gọi là trường cao, phần sau gọi là trường thấp Mỗi phần chứa các dòng quét khác nhau Trên màn hình hiển thị TV phần đầu được hiển thị thành các dòng quét ngang trên màn hình, phần sau quét ngang lấp đầy các chỗ trống ở trong phần đầu Vì một khuôn hình của video NTSC hiển thị trong khoảng thời gian 1/30 giây, quét xen dòng, nên bị chia thành hai phần, do đó thời gian hiển thị của một phần là 1/60 giây Một khuôn hình PAL và SECAM hiển thị trong khoảng 1/25 giây, quét xen dòng, thời gian hiển thị là 1/50 giây

Trang 13

1.1.8 Tốc độ của phát hình

Tốc độ phát hình là số hình ảnh được phát trong thời gian một giây Các video phổ biến được phát với tốc độ 25 và 29,97 hình/giây

1.2 Các yêu cầu hệ thống của Video

1.2.1 Phát hình trong thời gian thực

Khi nói đến hệ thống video, yếu tố quan trọng để phản ánh trung thực nội dung của video đó là thời gian thực Để có thể phát, hiển thị các tín hiệu video trong thời gian thực thì các thiết bị phải đảm bảo đủ mạnh, đường truyền với băng thông đủ lớn Ví dụ: khi chạy một tệp video có định chuẩn AVI phát trên máy Pentium I 133Mhz, card màn hình 1Mb, chúng ta thấy hình ảnh chuyển động chậm hơn so với thực tế, âm thanh bị lệch so với hình ảnh Chúng ta cũng thấy rất rõ điều này khi xem video trực tiếp trên Internet hay mạng tốc độ thấp

1.2.2 Tính đồng bộ của thiết bị khi xử lý video

Các thiết bị trong hệ thống xử lý video bao giờ cũng yêu cầu tính đồng bộ cao

để đảm bảo chất lượng hình ảnh và tốc độ của video Ví dụ: khi xây dựng hệ thống video các thiết bị phải đảm bảo:

 Tốc độ xử lý của video đủ mạnh và có thể phải sử dụng các bộ xử lý chuyên dụng như bộ xử lý Silicon Graphic

 Bộ nhớ đủ lớn Thông thường bộ nhớ máy tính hiện nay sử dụng cho việc soạn thảo, xử lý video trên 512Mb

 Băng thông trong các hệ thống video phải đảm bảo tốc độ Ví dụ: đường mạng trong hệ thống xử lý video thường sử dụng cáp quang (1000 Mgbit)

 Card màn hình tích hợp các bộ giải mã video chuyên dụng, bộ nhớ card màn hình đủ mạnh trên 128MB

Trang 14

 Tốc độ truy cập dữ liệu của ổ cứng cao, không gian ổ cứng lớn để đảm bảo lưu được dữ liệu truyền từ các thiết bị khác như máy quay vào máy tính Một giờ video theo chuẩn NTSC với khuôn hình 720x480 điểm ảnh, khi chuyển vào máy tính chiếm khoảng 15 Gb ổ cứng

 Các thiết bị trộn các kênh video, các thiết bị phát video đều phải tuân thủ các chuẩn về video như hệ NTSC, hệ PAL hay SECAM và các yếu tố thời gian thực

1.3 Các đặc điểm của dữ liệu video và video số

1.3.1 Khả năng truyền tải thông tin

Bản chất của video là tích hợp rất nhiều các yếu tố như kỹ thuật, nghệ thuật

do đó video trở thành dạng dữ liệu có khả năng truyền tải thông tin nhanh, đầy đủ, chính xác và rất ấn tượng Với đặc tính này, video có ưu thế hơn hẳn các dữ liệu khác như văn bản, âm thanh

Video có nhiều ưu điểm, nhưng có một hạn chế là dữ liệu video quá lớn và nó yêu cầu thiết bị cao hơn nhiều so với các cách thể hiện khác Mặc dù vậy, ngày nay, với công nghệ thông tin và truyền thông phát triển, các kỹ thuật nén ngày càng được cải thiện, ứng dụng video đã được triển khai nhiều hơn trong thực tế

1.3.2 Độ phân giải của video số

Như chúng ta đã biết video là loại dữ liệu số có kích cỡ rất lớn Do đó người ta phải tìm mọi cách để giảm thiểu kích cỡ của video Một trong các cách này là sử dụng độ phân giải phù hợp cho video Người ta đã nghiên cứu và thấy rằng mắt người bị giới hạn về khả năng nhìn Với màu sắc được hiển trị trên màn hình huỳnh quang thì mắt người chỉ nhận biết được sự khác nhau của chất lượng hình ảnh chuyển động với độ phân giải dưới 72 dpi (72 điểm ảnh/inch) Đối với các hình ảnh chuyển động có độ phân giải cao hơn thì mắt người không nhận biết được Vì vậy,

Trang 15

video số thông thường như các máy quay số (digital camera), các thiết bị chuyển đổi dữ liệu video từ dạng tương tự sang dạng số

Một số trường hợp đặc biệt khi cần có video chất lượng rất cao như các đoạn phim sử dụng cho việc phân tích khoa học cần phóng to lên nhiều lần thì phải dùng những máy quay đặc biệt để có thể tăng độ phân giải của video lên trên 72 dpi Trong trường hợp này dữ liệu video sẽ lớn lên khá nhiều Ví dụ: tăng độ phân giải lên 300 dpi thì kích cỡ của tệp video tăng lên trên 4 lần

1.3.3 Dữ liệu lớn (chiếm nhiều không gian lưu trữ)

Video số là loại dữ liệu có kích cỡ rất lớn, nó chiếm rất nhiều không gian lưu trữ hay không gian đĩa cứng Ví dụ: một đoạn video có thời lượng là một giờ, kích

cỡ khuôn hình là 720x480, tốc độ phát hình 29,97 hình/giây, độ sâu mầu cho một điểm ảnh là 24bit Kích thước tệp video này là:

Để khắc phục trở ngại này người ta đã sử dụng nhiều biện pháp như giảm kích

cỡ khuôn hình, giảm độ sâu mầu, nhưng hữu hiệu hơn cả vẫn là sử dụng các thuật toán nén video, như các thuật toán nén MPEG Các thuật toán này đảm bảo cho việc

sử dụng các tệp video trên máy tính cũng như truyền dữ liệu video trên mạng là hiệu quả trong thời gian thực Hiện nay, đã có rất nhiều thuật toán nén video khác nhau, nhưng nền tảng vẫn chủ yếu dựa trên các thuật toán nén ảnh như thuật toán RLE, LZW, Wavelet, DCT Ngoài ra, người ta còn có một số thuật toán nén giành

Trang 16

riêng cho video số như: giảm không gian màu, nén cấu trúc trong, nén dựa vào đối tượng cơ bản

1.4 Phân lớp video

1.4.1 Phân lớp theo mục đích sử dụng

Video là dữ liệu khá đặc biệt do đó phải có các phương pháp xử lý riêng cho từng mục đích sử dụng Chúng ta có thể phân loại video theo các cách đơn giản sau:

 Video số sử dụng cho soạn thảo

Video loại này có chất lượng rất cao Thông thường sử dụng các thuật toán nén không mất thông tin Các dữ liệu video này được lưu trữ và xử lý trên các thiết bị đặc biệt, chuyên dụng như lưu trên các ổ cứng theo chuẩn SCSI có tốc độ đọc ghi nhanh, được hỗ trợ bởi card RAID, các thiết bị phần cứng để xử lý video như TACGA 3000, DV2000, máy tính tốc độ cao có trang bị các chíp đặc biệt hỗ trợ việc xử lý đồ hoạ

 Video số sử dụng cho đầu cuối

Đây là các sản phẩm video số có chất lượng thấp hơn so với video dùng làm soạn thảo nhưng kích cỡ lại nhỏ hơn rất nhiều (nhỏ hơn vài chục lần so với video gốc) do sử dụng các thuật toán nén mất thông tin có thể sử dụng trên mạng, Internet hoặc các ứng dụng thông thường Trong lớp các video số này, người ta lại phân thành nhóm các sản phẩm nhỏ hơn

Các sản phẩm video số ghi trên đĩa CD là sản phẩm có chất lượng tương đối cao và được phân phối rộng khắp trên thị trường Nó sử dụng định chuẩn nén MPEG1 Một đĩa CD có dung lượng 700Mb lưu trữ được 80 phút video

Các sản phẩm video số ghi trên đĩa DVD có sức chứa 4,7 Gb Do đó, người ta

có thể nâng cấp chất lượng video số cao hơn chuẩn MPEG–1 bằng cách sử dụng chuẩn MPEG–2 Một đĩa DVD có thể lưu trữ được hai giờ video số với chất lượng

Trang 17

Các sản phẩm video số phân phối trên mạng băng thông rộng, sử dụng chuẩn MPEG–1, MPEG–2, hoặc định chuẩn AVI, MOV với chất lượng video số cao Các định chuẩn này thường yêu cầu tốc độ truyền bít trên 15 Mb/giây

Các sản phẩm video số phân phối trên mạng băng thông hẹp hoặc Internet, sử dụng chuẩn video MPEG–4 hoặc AVI Nhóm các sản phẩm video số này có chất lượng thấp, khuôn hình nhỏ Sản phẩm video số này yêu cầu tốc độ đường truyền thấp dưới 500 Kb/giây

Video từ máy quay, Băng

Quá trình xử lý video sau

đó chuyển thành Video đầu cuối sử dụng trong các ứng dụng

Sơ đồ: thu và chuyển đổi dữ liệu video từ băng vào máy tính và xử lý thành các tệp Video theo các định chuẩn: MPEG1, MPEG2, MPEG4, AVI,MOV sử dụng cho các ứng dụng

Hình 1.1: Sơ đồ chuyển đổi dữ liệu video

1.4.2 Phân lớp theo nội dung đối tƣợng trong video

Một số cách phân lớp khác đó là phân lớp theo nội dung đối tượng, màu sắc có trong video số Cách phân lớp này thường sử dụng cho việc xử lý, áp dụng các kỹ

Trang 18

thuật nén cho video Ví dụ: video đen trắng hay video mầu, cảnh thay đổi nhanh hay

ít thay đổi, video hoạt hình Từ đó người ta đưa vào các kỹ thuật nén với các tham

số nén hữu hiệu cho phép giảm đáng kể kích cỡ video cho từng loại Ví dụ: trong video hoạt hình số người ta có thể sử dụng các thuật toán nén bằng cách phân ra đối tượng để nén tốt nhất dữ liệu video loại này

1.5 Các hướng nghiên cứu và ứng dụng

Hiện nay, nghiên cứu và ứng dụng video vào trong đời sống đang là một vấn đề cấp thiết và được các nhóm nghiên cứu, các hãng phần mềm tập trung nghiên cứu bởi lợi ích mà nó đem lại là rất lớn Những hướng nghiên cứu mới và các ứng dụng video đang được phát triển bao gồm:

1.5.1 ứng dụng video cho đào tạo điện tử (e-learning)

Đào tạo điện tử tham chiếu đến những bài học được thể hiện bằng công nghệ điện tử Đây là lĩnh vực mới hỗ trợ và thay thế một phần đào tạo truyền thống Nó xuất phát từ những yêu cầu học tập mà trong đó học viên và giáo viên bị ngăn cách bởi không gian địa lý Với hệ thống mạng LAN, WAN và Internet việc phân phối các bài học điện tử đã trở nên dễ dàng hơn Nhưng để nội dung các bài học trở nên hấp dẫn, sinh động và trực quan thì dữ liệu video đóng vai trò chủ chốt Do đó việc nghiên cứu xây dựng video cho các bài giảng điện tử để có thể truyền tải trên hệ thống mạng hay đặt trên đĩa CD là vấn đề hết sức cần thiết

1.5.2 Xây dựng hệ quản trị cơ sở dữ liệu video

Một hướng nghiên cứu khác là xây dựng hệ quản trị cơ sở dữ liệu video – VDBMS Đây là một vấn đề khá phức tạp vì dữ liệu video rất lớn Việc xử lý dữ liệu như tìm kiếm, phân loại video trong thời gian thực hay thời gian chấp nhận được là hết sức khó khăn

Trang 19

1.5.3 Hệ thống mô phỏng và thực tại ảo

Hiện nay công nghệ mô phỏng và thực tại ảo đang rất được quan tâm Một hệ thống mô phỏng đầy đủ trên máy tính như mô phỏng buồng lái máy bay hay buồng lái xe tăng có thể thay thế các thiết bị thực tế để đào tạo người học với chi phí nhỏ hơn rất nhiều so với thực tế

1.5.4 Video theo yêu cầu

Đây là một ứng dụng video phục vụ người dùng theo yêu cầu Thông thường chúng ta xem video theo các kênh truyền hình định trước, dịch vụ video theo yêu cầu cho phép chúng ta lựa chọn những chương trình, những video mình thích hay quan tâm và yêu cầu trung tâm dịch vụ phát cho chúng ta những video đó trong thời gian thực Video theo yêu cầu là một dịch vụ mới đòi hỏi hạ tầng cơ sở truyền thông mạnh, hệ quản trị cơ sở dữ liệu tốt Dịch vụ này đang được nghiên cứu và triển khai tại Nhật, Mỹ và các nước có công nghệ thông tin phát triển

1.5.5 Truyền hình số

Đây là dịch vụ truyền hình đang được phát triển khá rộng rãi trên thế giới Nó thay thế truyền hình tín hiệu tương tự truyền thống bằng các kênh truyền hình số với chất lượng hình ảnh cao hơn, ít nhiễu hơn Công nghệ này dựa trên định chuẩn video MPEG–2 và MPEG–4

Trang 20

-CHƯƠNG 2 CÁC ĐỊNH CHUẨN VIDEO

Trong quá trình soạn thảo, xử lý và export video cần hiểu rõ về các định chuẩn video Ví dụ: để tạo ra một video sử dụng trên Intermet chúng ta cần phải thiết lập các tham số nén đảm bảo tệp video theo đúng định dạng và mục đích sử dụng Ngoài các yếu tố kỹ thuật, việc xác định định dạng của video còn phụ thuộc vào các yếu tố kinh nghiệm của người xử lý MPEG, AVI cho Windows, QuickTime cho MOV là các định dạng được sử dụng rộng rãi Trong chương này chúng ta làm rõ các định chuẩn với mục đích sử dụng, các kỹ thuật nén, kích cỡ, thời gian xử lý nén

 Intel Indeo 5.10 (Intel indeo 5.03): được sử dụng cho các định dạng Video

phân tán trên mạng Internet, cho các máy tính có bộ xử lý MMX hoặc bộ xử lý

từ Pentium II trở lên Mã nén có đặc trưng: có lựa chọn nén nhanh, điều khiển các keyframe mềm dẻo, điều chỉnh sắc độ, các hiệu ứng playback, và cuối cùng tạo ra các tệp video có dữ liệu giảm đáng kể

- Kiểu nén này cho phép người xử lý video có thể điều chỉnh để tạo ra các video dùng cho các băng thông khác nhau

Trang 21

- Ví dụ: có thể điều chỉnh để tạo ra video dùng cho modem 56Kb, 28,8Kb hay đường cáp mạng Mã nén này được thiết kế để làm việc cùng với mã nén âm thanh Intel Audio

 Intel Indeo Video Raw R1.1: được sử dụng tốt nhất cho việc thu các tín hiệu

video làm dữ liệu video nguồn sử dụng cho soạn thảo video, với thiết bị thu – Intel Video Mã nén này cung cấp các hình ảnh chất lượng cao Các tệp video dùng lựa chọn Intel Indeo Video Raw R1.1, có kích cỡ nhỏ hơn các tệp video chưa được nén ở định dạng này màu sắc của hình ảnh video đã được chuyển từ không gian mầu RGB thành không gian mầu YUV

 Intel Indeo Video Interactive: là kiểu nén tương tự như định dạng 5.10 nhưng

có một số hỗ trợ mở rộng như đặc tính trong suốt, nhiều đối tượng chuyển động

và các hiệu ứng hiển thị lại trong video

 Microsoft RLE: dùng để nén các khuôn hình mà nội dung là các vùng mầu

đồng nhất có kích cỡ lớn và số lượng mầu không nhiều, màu phẳng (các ảnh không có chiều sâu) Ví dụ: khi xử lý các video phim hoạt hình, sử dụng kiểu nén này tỏ ra khá hữu hiệu Kiểu nén này có mã nén độ dài 8 bit dùng thuật toán nén không mất thông tin RLE (Run–Length–Encoding) Chất lượng video cao

 Microsoft Video 1: sử dụng kỹ thuật nén mất thông tin theo phương pháp nén

không gian màu Mã nén này có nhiều tham số có thể thay đổi như: số mầu trên khuôn hình của video (8 bit hay 24 bit mầu), chất lượng video, số keyframe Chuẩn nén này có thể tạo ra các tệp video sử dụng cho các chương trình đào tạo từ xa hay các tệp video sử dụng cho mạng tốc độ thấp

 Indeo (R) Video R3:2: sử dụng để nén video 24 bit dùng cho đĩa CD Tỷ lệ

nén tốt, chất lượng hình ảnh cao, và tốc độ hiển thị nhanh hơn so với kiểu nén Microsoft Video 1 Cho kết quả tốt nhất nếu sử dụng mã nén Indeo Video trên

dữ liệu video nguồn mà trước đó dữ liệu này không bị nén với tỷ lệ cao bằng

Trang 22

các kỹ thuật nén mất thông tin Các tệp video được nén bằng kỹ thuật nén Indeo(R) video R3:2 có chất lượng tương đương với các tệp video sử dụng kỹ thuật nén Cinepak

 Cinepak Code By Radius: sử dụng để nén video 24 bit dùng cho CD-ROM

hoặc cho mục đích tải về từ Web Đây là kiểu nén đạt được tỷ lệ nén cao hơn và tốc độ giải nén nhanh hơn so với mã nén Microsoft Video 1 Chúng ta có thể đặt tham số chất lượng hình ảnh Các tệp video sau khi xử lý có thể hiển thị lại trên đường truyền có tốc độ 30 Kb/giây Kỹ thuật mã bằng Cinepak tạo ra sản phẩm video có tốc độ giải nén rất nhanh nhưng khi nén mất rất nhiều thời gian

Kỹ thuật nén này phù hợp cho việc chuyển một đoạn video thành kết quả cuối cho người sử dụng

 Intel Audio Software codec: sử dụng cho nhạc và lời nói trên Internet Tỷ lệ

nén tối đa là 8:1 Mã nén này được thiết kế để làm việc với chương trình Intel Video Software

 TrueSpeech: sử dụng cho nói chuyện trên mạng Internet với tốc độ truyền

thấp

 Microsoft GSM 6.10: sử dụng cho điện thoại trên Internet ở châu âu

 MS-ADPCM (Microsoft implementation of Adaptive Differential Pulse Code

Modulation): sử dụng để tạo các tệp audio có chất lượng cao ghi trên đĩa

CD-ROM Kiểu nén này được sử dụng rộng rãi

 Microsoft IMA ADPCM: sử dụng tạo các tệp audio cho các sản phẩm

multimedia Mã nén này dựa trên mã nén ADPCM được phát triển bởi IMA

 Lucent Technologies SX8300P: sử dụng cho giao tiếp trên Internet tốc độ

thấp

Trang 23

 Elemedia TM AX2400P: sử dụng tạo các tệp âm nhạc chất lượng cao trên

 Cinepak: được sử dụng để nén video 24 bit Các tệp sử dụng mã nén này để

dùng cho CD-ROM và Web video Mã nén có tỷ lệ nén cao và tốc độ giải nén nhanh Cinepak dùng thuật toán nén không đối xứng các tệp video có kích cỡ nhỏ nhưng thời gian nén rất lâu Cho kết quả tốt nhất nếu dùng Cinepak để tạo tệp video

 Sorenson Video: được sử dụng để nén video 24 bit Các tệp sử dụng mã nén

này để dùng cho CD-ROM và Web video Nó cũng giống như mã nén Cinepak nhưng là mã nén mới thiết kế để nén với chất lượng cao Mã nén này cho hình ảnh tốt hơn, kích cỡ tệp video nhỏ hơn so với mã Cinepak vì vậy nó phù hợp cho việc tạo các tệp video cuối cùng chứ không phù hợp cho soạn thảo

 Planar RGB: sử dụng hiệu quả cho các khuôn hình có vùng màu đặc như các

tệp Animation Nó sử dụng thuật toán nén RLE kết hợp với kỹ thuật tạo mã Animation (Animation codec)

 Motion JPEGA and Motion JPEG: được dùng cho mục đích chuyển mã

video giữa các thiết bị Ví dụ: chuyển các tệp video trong hệ thống máy tính,

Trang 24

các đoạn video trên băng ra các thiết bị khác của mày tính như đĩa CD thông qua thiết bị thu video Mã nén Motion JPEGA and Motion JPEG được hỗ trợ nhiều trong các chíp có trên các thiết bị thu video do đó tốc độ xử lý rất nhanh

 Photo–JPEG: dùng để nén một chuỗi các ảnh tĩnh có màu sắc biến đổi dần

(các đường biên không rõ nét) Đây là kiểu nén mất thông tin nhưng có thể đặt được tham số nén để ảnh có chất lượng rất cao Mã nén Photo-JPEG là kiểu nén đối xứng – thời gian nén gần bằng thời gian giải nén, nhưng thời gian nén

là khá nhiều so với thời gian thực của video Các ảnh đã được nén theo kiểu này thì không nên dùng làm nguồn để soạn thảo vì nó đã bị mất thông tin Tuy nhiên với tỷ lệ nén không cao nhưng cho chất lượng ảnh tốt nên có thể dùng để lưu trữ hoặc để di chuyển giữa các hệ thống máy tính Rất nhiều phần cứng nén video (hardware compression) sử dụng định dạng JPEG

 H.261, H.263: sử dụng tạo các video cho hội thảo, có tỷ lệ nén cao Không nên

sử dụng chuẩn này cho soạn thảo video thông thường

 Component video: được sử dụng cho thu video chất lượng cao để tạo và lưu

trữ video nguồn hay tạo các đoạn video trung gian cho xử lý Mã nén này có tỷ

lệ nén rất thấp do đó các tệp video chiếm rất nhiều không gian đĩa

 Graphics: được sử dụng cho việc nén và tạo video với chất lượng cao, có độ

sâu màu 8 bít Mục tiêu của mã nén là để nén các ảnh động (một chuỗi các ảnh) nhưng đôi khi cũng có thể sử dụng cho nén video Mã nén này không đạt được

tỷ lệ nén cao Nó chỉ thích hợp cho các tệp video lưu trữ và playback trên đĩa cứng, không phù hợp với các tệp video trên CD-ROM

 Video: được sử dụng cho việc thu và nén các tín hiệu video có nguồn ở dạng

tín hiệu tương tự Mã nén này tạo ra các tệp video có chất lượng cao và sử dụng tốt cho lưu trữ trên ổ đĩa cứng hoặc trên đĩa CD-ROM Nó hỗ trợ cả hai loại nén theo không gian và theo thời gian cho video 16 bit mầu

Trang 25

 Animation: được sử dụng cho việc nén các khuôn hình có vùng màu có kích

cỡ lớn, như các khuôn hình cho phim hoạt hình Mã nén này có các tham số cho phép thay đổi tỷ lệ nén Với tỷ lệ nén là 100%, video không bị nén Nếu tỷ

lệ dưới 100% tệp video bị nén ở dạng mất thông tin Mã nén Animation dựa trên lý thuyết nén của Apple và thuật toán nén RLE

 DV–PAL và DV–NTSC: dùng để tạo các tệp video với định dạng PAL, NTSC

phục vụ in ra băng theo các hệ trên hoặc ngược lại lấy từ băng vào máy tính thông qua card thu video số Chuẩn nén này rất hữu dụng cho việc chuyển dữ liệu video từ hệ thống máy tính này sang hệ thống máy tính khác hoặc từ thiết

bị này sang thiết bị khác

Đối với các thiết bị phần cứng hỗ trợ soạn thảo Video thường có các mã nén riêng được viết bởi nhà sản xuất thiết bị phần cứng

Đối với hệ thống Mac người ta thường sử dụng các mã nén âm thanh sau:

 mLaw 2:1: sử dụng cho việc chuyển các tệp audio với các ứng dụng trên các

máy trạm Tại đó mLaw là định dạng audio chuẩn, mLaw được sử dụng cho điện thoại số ở Bắc Mỹ và Nhật Bản

 16-bit Big Endian và 16-bit Little Endian: sử dụng cho các phần cứng và

phần mềm chuyên dụng để nén audio Audio đã được nén bằng mã nén này

thường không tốt cho soạn thảo

- 24–bit Integer và 32–bit Integer: sử dụng cho audio 24–bit hoặc 32–bit

Mã nén này được sử dụng tốt cho các phần cứng và phần mềm chuyên dụng Nó là sản phẩm cuối do đó các tệp video chứa mã nén này không nên dùng để soạn thảo

- IMA 4:1: sử dụng cho các tệp audio tại các trạm IMA 4:1 được phát triển

bởi IMA sử dụng mã ADPCM

Trang 26

- 32–bit Floating và 64–bit Floating: sử dụng trong các thiết bị phần cứng

và phần mềm chuyên dụng nhưng thường không sử dụng cho soạn thảo Video

- ALaw 2:1: giống mLaw nhưng được sử dụng cho điện thoại số ở châu âu

- QDesign Music Codec: sử dụng để nén các tệp audio chất lượng cao dùng

trên Internet Chất lượng của nó tương đương các tệp âm thanh trên ROM có định dạng 16 – bit, 44.1 kHz Các tệp âm thanh được nén theo mã này có thể nghe trực tiếp bằng đường Internet có tốc độ 28.8 Kb/giây

CD Qualcomm PureVoice: được thiết kế để tạo các tệp âm thanh tốt nhất ở

tần số 8 kHz Cơ sở của mã nén này dựa trên thuật toán nén chuẩn của Telephone CDMA (Code Division Multiple Access)

- MACE 3:1 and MACE 6:1: để tạo các tệp audio thông thường cho hệ

điều hành Mac Nó dựa trên thuật toán nén âm thanh MACE (Macintosh Audio Compression and Expansion codec) Mã nén MACE 3:1 có tỷ lệ nén thấp hơn mã nén MACE 6:1 nhưng có chất lượng cao hơn

2.2 Các định chuẩn MPEG

2.2.1 Giới thiệu

Chuẩn nén video MPEG được phát triển bởi MPEG (Moving Picture Experts Group), hiện đang được sử dụng rộng rãi trong các sản phẩm video MPEG đứng đầu trong việc ứng dụng trong truyền hình số, mã và giải mã HDTV, CD, DVD, video conferencing, video cho Internet và các ứng dụng khác MPEG được sử dụng rộng rãi như vậy chính là nhờ khả năng nén hiệu quả, làm giảm đáng kể kích cỡ tệp video Thông qua xử lý nén bằng MPEG, các video có thể truyền hiệu quả trên mạng Cơ sở của chuẩn nén MPEG là sử dụng thuật toán biến đổi cosin rời rạc DCT với việc phân chia khuôn hình ảnh thành các khối và đánh giá chuyển động Các đặc điểm chi tiết về kỹ thuật của chuẩn MPEG được tổ chức ISO (International

Trang 27

Commission) công nhận Có ba định dạng Video theo chuẩn MPEG là MPEG–1, MPEG–2, MPEG–4 chính thức trở thành định dạng chuẩn quốc tế

2.2.2 MPEG–1

MPEG–1 đã được hoàn thiện vào năm 1991, với nhiều ưu điểm như: tối ưu hoá khi làm việc với độ phân giải 352x240 điểm ảnh, 30 hình/giây cho hệ NTSC và độ phân giải 352x288 điểm ảnh, 25 hình/giây [22] Chuẩn này cố định độ phân giải nên thường gây ra một số lỗi nếu độ phân giải đặt không đúng Tuy nhiên, trường hợp đặc biệt MPEG–1 có chế độ làm việc với độ phân giải rất cao 4095x4095 phát 60 hình/giây MPEG–1 thông thường làm việc tối ưu với tốc độ 1,5 Mb/giây cho các ứng dụng MPEG–1 sử dụng cho các ứng dụng có chế độ quét hình tuần tự Nó không trực tiếp làm việc với các ứng dụng video sử dụng chế độ quét xen dòng như ứng dụng truyền hình MPEG–1 có chất lượng tương đương với chất lượng truyền hình Video MPEG–1 sử dụng làm định dạng chuẩn cho các sản phẩm video CD MP3 là chuẩn nén âm thanh được sử dụng trong MPEG–1

MPEG–1 bao gồm một số phần sau:

 Đồng bộ hoá video và audio

 Mã nén cho các tín hiệu video non-interlaced, sử dụng thuật toán DCT

 Mã nén cho cho các tín hiệu audio theo chuẩn 3 lớp:

- Lớp 1 MP1 (MPEG–1 Audio Layer 1)

MPEG–1 được thiết kế theo chuẩn MPEG–1, phân định địa chỉ của các kênh

dữ liệu âm thanh và hình ảnh, kết hợp với thời gian Đây là chức năng quan trọng vì

từ dạng dữ liệu này sẽ được chuyển đổi thành các kênh dữ liệu phù hợp

Trang 28

Hình 3.1: Sơ đồ nguyên mẫu chuẩn giải nén MPEG–1

(ISO/IEC 11172) Theo sơ đồ này chúng ta thấy rằng, thông qua các địa chỉ được lưu trữ trong chuẩn MPEG–1, khi giải nén sẽ xác định được chính xác các kênh audio và video Thuật toán nén cho chuẩn MPEG–1 có khả năng nén cao Đầu tiên chuyển video từ không gian mầu RGB về không gian mầu YUV, sử dụng thuật toán nén không gian mầu để giảm dữ liệu video Sau đó dùng thuật nén theo thời gian chuyển động bằng cách phân chia video thành các dãy, lựa chọn các keyframe Phân chia khuôn hình thành các clice, macro block, và block Dùng giải thuật DCT nén không gian ảnh Nén không gian dữ liệu một lần nữa bằng giải thuật nén không mất thông tin

Trang 29

Hình 3.2:Sơ đồ nén dữ liệu âm thanh Đầu vào là các tín hiệu mã với tần số 32, 44.1, 48 KHz Dựa theo bản đồ lọc và lấy ra các mẫu đặc trưng Psychoacoustic model là quá trình tập hợp dữ liệu và điều khiển việc lượng tử hoá và mã hoá để tạo ra khối các khuôn hình Khối các khuôn hình là các gói chuẩn (cơ sở) được mã hoá

ứng dụng của MPEG–1:

 Phân phối video (Video CD)

Một ứng dụng rộng khắp của MPEG–1 hiện nay đó là việc phân phối video thường là phim Các video theo chuẩn MPEG–1 có chất lượng tốt, kích cỡ nhỏ Phim được chuyển thành dạng MPEG–1, ghi trên đĩa CD-ROM và đang được các hãng phân phối trên toàn thế giới

 Video công cộng (Video Kiosk)

Video kiosks hoặc information kiosks, là các trạm video công cộng hướng dẫn người sử dụng các thông tin cần thiết của một hệ thống nào đó Nó thường được đặt tại các nhà ga, ngân hàng, siêu thị Các video này được đặt trên đĩa cứng hoặc CD-ROM với định chuẩn MPEG–1 MPEG–1 đảm bảo chất lượng, kích cỡ nhỏ do đó

có thể dễ dàng sử dụng trong các ứng dụng này

 Dịch vụ video thông qua đường truyền điện thoại (Video Dial Tone)

Hệ thống này đang được thử nghiệm ở nhiều nước tiên tiến như Nhật Bản, Mỹ Thông qua đường truyền điện thoại, máy điện thoại để bàn, có màn hình hoặc hệ thống điện thoại di động, người sử dụng có thể đặt các chương trình video xem trực tiếp trên máy điện thoại hay có thể đàm thoại và thấy được hình ảnh của nhau Dịch

vụ này bị giới hạn về băng thông do đó người ta sử dụng định chuẩn video MPEG–

1

Thư viện video: các thư viện dữ liệu video hiện nay đang được thay thế dần các băng video casset bằng dữ liệu video số theo chuẩn MPEG–1 ưu điểm của các đĩa

Trang 30

CD theo chuẩn MPEG–1 là dễ hiển thị, dễ truy cập, không gian lưu trữ nhỏ, chất lượng hình ảnh tốt Hiện nay rất nhiều thư viện của các trường đại học, viện nghiên cứu, trung tâm đang chuyển dần sang sử dụng dữ liệu video số

2.2.3 MPEG–2

MPEG–2 đã hoàn thành vào tháng 11/1994 [23] MPEG–2 ban đầu được phát triển trên cơ sở các kỹ thuật nén tốt nhất của MPEG–1 nhưng phần mã hoá được mở rộng hơn Các mã này được áp dụng cho các ảnh có không gian mầu YUV với thành phần Y:U:V là 4:2:2 Tuy nhiên MPEG–2 vẫn không được triển khai trong các ứng dụng video Đến tháng 4/1997, MPEG-2 đưa thêm các mã phân định nhiều kênh audio Một số thuật toán nén âm thanh được áp dụng trong phần này không còn bị lệ thuộc vào các thuật toán được áp dụng trong MPEG–1 Như vậy, chuẩn này đã được

tổ chức ISO công nhận và được sử dụng làm chuẩn video cho truyền hình số Mã nén MPEG–2 có thể đáp ứng kỹ thuật quét xen dòng của video Mục tiêu của định chuẩn này là nâng chất lượng của video lên cao hơn chuẩn MPEG–1 do đó yêu cầu

về đường truyền cũng cao hơn, từ 5-20 Mb/giây MPEG–2 bao gồm Profiles and Levels Profiles định rõ dòng bit và độ phân giải của không gian mầu, Levels xác định độ phân giải ảnh và tốc độ bit lớn nhất của mỗi Profiles Các Profiles và Levels được sử dụng phổ biến hiện này gọi là Main Profiles, Main Levels ký hiệu (MP@ML) Chúng có độ phân giải video 720x480 với tốc độ 30 hình/giây, tốc độ bít là 15 Mb/giây cho video hệ NTSC HDTV sử dụng độ phân giải 1920x1080, 30 hình/giây, tốc độ bít là 80 Mb/giây gọi là Main Profiles, High Levels (MP@HL) MPEG–2

Trang 31

Hình 3.3:Mô hình hệ thống giải mã MPEG–2

Theo mô hình, này MPEG–2 đánh địa chỉ phối hợp một hoặc nhiều luồng dữ liệu của video và audio thành một luồng đơn thống nhất Các dữ liệu trên luồng dữ liệu này được tổ chức phù hợp nhất cho việc lưu trữ và phát video Việc tổ chức này dựa vào hai lớp chính: Program Stream và Transport Stream Program Stream(PS)

là việc phối hợp một hoặc nhiều gói tin cơ bản PES (Packetised Elementary Streams) trong các luồng dữ liệu đơn thành một luồng dữ liệu thống nhất Gói tin Program Stream có độ lớn khác nhau và như vậy thời gian truyền gói tin là khác nhau Trong quá trình truyền các gói tin, nến phát hiện có một gói tin bị mất thì hệ thống sẽ yêu cầu truyền lại toàn bộ các gói tin (vì Program Stream không xác định gói tin nào phải được truyền lại) Program Stream được thiết kế cho việc sử dụng trong hệ thống đường truyền rất ít lỗi Nó phù hợp với các ứng dụng có dùng phần mềm để xử lý

Transport Stream(TS) là việc phối hợp một hoặc nhiều gói tin cơ bản PES (Packetised Elementary Streams) trong các luồng dữ liệu đơn thành một luồng dữ liệu đơn thống nhất Gói tin Transport Stream có độ lớn bằng nhau là 188byte và như vậy thời gian truyền gói tin là như nhau Trong quá trình truyền các gói tin, nếu phát hiện có một gói tin bị mất thì hệ thống không yêu cầu truyền lại toàn bộ các gói

Trang 32

tin mà chỉ yêu cầu truyền lại gói tin bị mất (vì Transport Stream đánh chỉ số cho các gói tin) Transport Stream được thiết kế cho việc sử dụng trong hệ thống đường truyền có nhiều lỗi

ứng dụng của MPEG-2:

 Video theo yêu cầu: VOD là một ứng dụng cơ bản về video Tuy nhiên, hầu hết các ứng dụng của VOD là phim Ban đầu trong các khách sạn, bệnh viện và cuối cùng là ở trong gia đình Tất cả chúng đều được tương tác qua ti vi Dịch

vụ này cho phép người sử dụng đặt các chương trình phim theo ý thích, và có thể xem bất kể thời gian nào Các ứng dụng VOD sử dụng định chuẩn video MPEG–2

 Truyền hình cáp CATV (Cable Television): sử dụng chuẩn video MPEG–2 để

nén, giải nén và phân phối video Đây là chuẩn video có chất lượng rất cao, yêu

cầu băng thông rộng

 Hệ thống phát hình trực tiếp qua vệ tinh DBS (Direct Broadcast Satellite): sử

dụng chuẩn MPEG–2 cho việc phát hình trực tiếp Lợi thế của hệ thống này là bất kể đâu và bất kể thời gian nào chúng ta cũng có thể bắt đuợc tín hiệu truyền hình

 Truyền hình chất lượng cao HDTV (High Definition Television): Mỹ và một số

nước khác sử dụng MPEG–2 làm chuẩn video cho truyền hình chất lượng cao

 Một số ứng dụng khác: MPEG–2 sử dụng trong các phầm mềm của các thiết bị

video như: băng Video chất lượng cao, đĩa video số chất lượng cao DVD, video conferencing và trong các máy quay video số

2.2.4 MPEG–4

MPEG–4 là chuẩn ISO/IEC được phát triển bởi MPEG [24] Nhóm này cũng

đã phát triển chuẩn MPEG–1 và MPEG–2 Các chuẩn này cho phép phát hành video

Trang 33

nghiên cứu và kỹ sư trên toàn thế giới MPEG–4 được hoàn thành vào tháng 10/1998 và trở thành chuẩn quốc tế từ tháng 1/1999 Cuối năm 1999, phiên bản 2 của MPEG–4 ra đời Định dạng này mềm dẻo, yêu cầu tốc độ đường truyền thấp và không có độ phân giải video chuẩn

Nén hình ảnh trong MPEG–4 sử dụng kỹ thuật nén đối tượng cơ bản với việc phần lớp và lưu các thông tin đối lượng Mỗi lớp lưu mã nén về nội dung của một chuỗi các ảnh (bao gồm: đường viền, quỹ đạo chuyển động, kết cấu bề mặt) Khi giải nén, thông qua nội dung được lưu trong các lớp để xây dựng lại từng phần của đoạn video

Hình 3.4:Mô hình nén và giải nén theo từng lớp của MPEG-4

Trang 34

Hình 3.5:Ví dụ về một cảnh trong MPEG–4 Theo mô hình nén và giải nén theo từng lớp của MPEG–4, video được nén trên

3 lớp với tỷ lệ giảm kích cỡ (không gian) là 2 lần trên từng lớp Trên các lớp ngoài, những thông tin về nội dung của một chuỗi hình ảnh còn lưu tỷ lệ giảm không gian của lớp so với lớp trên đó Khi giải nén dựa vào tỷ lệ này cùng với các thông tin về đường viền, quỹ đạo chuyển động, kết cấu bề mặt của đối tượng trong video để phục hồi lại đoạn video gốc

Như vậy, dựa vào tỷ lệ giảm kích cỡ không gian video, chúng ta có thể điều chỉnh tốc độ phát hình cũng như kích cỡ của tệp video cho phù hợp với băng thông

ứng dụng của MPEG–4: do có tính mềm dẻo MPEG–4 đã được triển khai trong ba

lĩnh vực chính:

 Truyền hình số,

 Các ứng dụng đồ hoạ tương tác,

 ứng dụng đa phương tiện tương tác

Chuẩn kỹ thuật của MPEG–4 được thống nhất cho sản xuất, phân phối các sản phẩm video cho cả ba lĩnh vực trên

2.3 So sánh các định chuẩn MPEG

2.3.1 Bảng so sánh các định chuẩn MPEG

MPEG–1 MPEG–2 MPEG–4

Chất lượng Chất lượng video

tương đương VHS

Chất lượng video rất cao

Phân chia lớp video

từ chất lượng cao đến chất lượng thấp Chất lượng cao tương đương với MPEG-2

Trang 35

Thuật toán nén DCT, nén động DCT, nén động Nén đối tượng cơ bản

sử dụng cho các video độ phân giải thấp

Truyền hình số, HDTV, CATV, DVD, chất lượng cao, thường sử dụng cho video độ phân giải cao

Phân phối video trên mạng, mạng không dây và Internet

Hội thảo từ xa (Video conference) H263 Truyền hình số

2.3.2 So sánh các định dạng Video AVI, MPG, RM/RA, ASF, IVF, VIV, MOV, DivX

 ASF/WMA/WMV - ASF là định dạng video Streaming tiên tiến của Microsoft Nội dung của nó bao gồm các thông tin Video, audio, các cảnh (Slide Shows)

và đồng bộ hoá các thành phần WMA (Windows Media Audio) chỉ chứa audio WMV (Windows Media file with Audio/Video) tương tự như ASF Nó có thể downloaded và hiển thị theo dòng (Streaming) từ các server ở xa

 AVI - viết tắt từ "Audio Video Interleave" - là chuẩn video cho Windows của Microsoft Nó là chuẩn độc quyền thiết kế cho video và audio của Microsoft

Trang 36

Windows Nó là định chuẩn thiết kế cho việc lưu trữ các thông tin Audio và video Định dạng tệp video có phần mở rộng là AVI Tệp AVI thường có độ phân giải là 320x240 và 30 khuôn hình/giây, nhưng có thể hiển thị toàn màn hình Tuy nhiên Video cho Windows không yêu cầu các phần cứng đặc biệt, và được làm nhỏ kích cỡ khi sử dụng trong các ứng dụng multimedia Rất nhiều sản phẩm multimedia sử dụng định dạng này vì nó là video theo chuẩn Windows, các hãng có thể bán rộng rãi các sản phẩm cho người dùng Tương đương với định dạng AVI chỉ có định dạng QuickTime

 DivX là nhãn hiệu đăng ký của DivXNetworks, Inc DivX là định chuẩn video

dựa trên kỹ thuật nén MPEG-4 Các tệp DivX có thể download trên các đường mạng tốc độ cao trong thời gian ngắn

 IVF (Intel Video Technology) là tệp sử dụng mã nén Indeo gốc được phát triển bởi Intel

 MOV (Quick Time Movie File Extension) là định chuẩn video và hoạt hình (Animation) do hãng máy tính Apple Computer phát triển Quicktime được xây dựng cho hệ điều hành Macintosh và được sử dụng hầu hết trong các ứng dụng video, hoạt hình Máy tính PC cũng có thể chạy được định dạng Quicktime nhưng phải có phần mềm hiển thị Quicktime chuẩn Quicktime cạnh tranh với nhiều chuẩn khác như AVI, ActiveMovie Trình hiển thị Quicktime hỗ trợ hầu hết các định dạng nén như Cinepak, JPEG and MPEG QuickTime cho chất lượng hiển thị audio/video cao, hỗ trợ nhiều định dạng trong các thiết bị

Trang 37

ba kiểu mã nén MPEG audio, layer 1, layer 2, layer 3 tăng dần theo chất lượng

âm thanh và thời gian mã hoá Layer là định dạng nén “PASC”, nén với mục tiêu tạo tệp audio cho Digital Compact Cassettes Layer 2 là định dạng nén

"MUSICAM" Layer 3 là định dạng mới hiện nay, có chất lượng cao, kích cỡ phù hợp, được sử dụng rộng rãi trên Internet

Trang 38

dòng dữ liệu từ máy chủ đã được giải nén và đưa ra các thiết bị âm thanh trên máy tính

 Real Video là kỹ thuật “streaming” được phát triển bởi RealNetworks cho sử dụng video trực tiếp trên Internet Real Video sử dụng các kỹ thuật nén đa dạng

và làm việc với cả hai dạng: kết nối IP thông thường và kết nối IP Multicast RealVideo 8 thường tăng cường chất lượng video và làm trơn quá trình hiển thị trên các kiểu kết nối, từ kết nối dạng quay số điện thoại đến kết nối băng thông rộng Nó được sử dụng nhiều cho các thiết bị như Webcam hoặc hiển thị video trực tiếp

Để hiển thị các video trực tiếp trên mạng hay Internet, chương trình RealPlayer

và QuickTime là lựa chọn tốt nhất cho việc sử dụng video streaming, nó hỗ trợ xử

lý chất lượng cho video và audio Chúng có thể làm việc với hầu hết các phiên bản của trình duyệt Internet Explorer và Netscape, đồng thời có thể hiển thị hầu hết các định dạng video Windows Media Player là một trình hiển thị audio và video tốt nhưng nó chỉ hỗ trợ cho các định dạng audio, video của windows

Để có thể sử dụng video trên các đường mạng tốc độ thấp chúng ta phải sử dụng các định chuẩn video phù hợp với yêu cầu tốc độ Hiện nay các ứng dụng trên

Trang 39

hình ảnh không cao, kích thước khuôn hình nhỏ và sử dụng các mã nén tối ưu để có thể phát hành trên mạng Internet cũng như mạng tốc độ thấp dễ dàng Hiện nay, các định chuẩn sau được dùng nhiều cho việc phát hành video trên mạng: WMA, WAX, WMV, WVX, RM, AVI…

Trang 40

CHƯƠNG 3 MÔ HÌNH CƠ SỞ DỮ LIỆU VIDEO

3.1 Tổng quan

Cùng với sự phát triển của máy tính, video số ngày càng trở nên phổ biến hơn trong nhiều lĩnh vực của cuộc sống như truyền thông, giáo dục, đào tạo, giải trí và xuất bản

Với sự gia tăng số lượng thông tin video khổng lồ, sẽ không thể mã hoá được hết nếu không có sự quản lý mang tính hệ thống của dữ liệu video Xuất phát từ một yêu cầu thực tế dẫn đến việc máy tính hoá các hệ thống quản trị cơ sở dữ liệu dạng

số và văn bản, được gọi là hệ quản trị cơ sở dữ liệu (database managerment system) truyền thống Các hệ quản trị CSDL truyền thống được thiết kế để quản lý kiểu dữ liệu có cấu trúc đơn giản, nhưng không phải là dữ liệu video Vì dữ liệu video là kiểu dữ liệu có cấu trúc phức tạp và nó đòi hỏi các phương pháp mới để mô hình hoá, sắp xếp, chèn và tính toán dữ liệu, do đó việc thiết kế CSDL, giao diện người

sử dụng và việc duyệt dữ liệu video là quan trọng hơn nhiều so với trong hệ quản trị CSDL truyền thống

Mô hình Video

Dữ liệu video

Dữ liệu video thô

Cấu trúc và danh mục dữ liệu video

Người dùng

Video Authoring

GUI Video Input

Video player

Các phân đoạn video Họat cảnh video Xử lý truy vấn

Danh mục video