Các thuật toán này đảm bảo cho việc sử dụng các tệp video trên máy tính cũng như truyền dữ liệu video trên mạng là hiệu quả trong thời gian thực.. Các dữ liệu video này được lưu trữ và x
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI ĐẠI HỌC CÔNG NGHỆ
PHẠM THANH TÙNG
MÔ HÌNH CƠ SỞ DỮ LIỆU VIDEO CHO LẬP DANH MỤC
VÀ KHÔI PHỤC NỘI DUNG
LUẬN VĂN THẠC SỸ
Người hướng dẫn: PGS TS Đỗ Trung Tuấn
Hà Nội - 2005
Trang 2MỤC LỤC
MỤC LỤC 1
Danh mục các kí hiệu và viết tắt 5
MỞ ĐẦU 7
Chương 1 – GIỚI THIÊU TỔNG QUAN VỀ VIDEO 9
1.1 Một số khái niệm cơ bản 9
1.1.1 Video 9
1.1.2 Video số 9
1.1.3 Dữ liệu video số 10
1.1.4 Kích cỡ khuôn hình 10
1.1.5 Kích cỡ khuôn hình và độ phân giải 10
1.1.6 Tỷ lệ khuôn hình 11
1.1.7 So sánh quét xen dòng và quét tuần tự 11
1.1.8 Tốc độ của phát hình 12
1.2 Các yêu cầu hệ thống của Video 12
1.2.1 Phát hình trong thời gian thực 12
1.2.2 Tính đồng bộ của thiết bị khi xử lý video 12
1.3 Các đặc điểm của dữ liệu video và video số 13
1.3.1 Khả năng truyền tải thông tin 13
1.3.2 Độ phân giải của video số 13
1.3.3 Dữ liệu lớn (chiếm nhiều không gian lưu trữ) 14
1.4 Phân lớp video 15
1.4.1 Phân lớp theo mục đích sử dụng 15
Trang 31.5 Các hướng nghiên cứu và ứng dụng 17
1.5.1 ứng dụng video cho đào tạo điện tử (e-learning) 17
1.5.2 Xây dựng hệ quản trị cơ sở dữ liệu video 17
1.5.3 Hệ thống mô phỏng và thực tại ảo 18
1.5.4 Video theo yêu cầu 18
1.5.5 Truyền hình số 18
Chương 2 - CÁC ĐỊNH CHUẨN VIDEO 19
2.1 Định dạng chuẩn cho hệ điều hành 19
2.1.1 Định dạng AVI 19
2.1.2 Các định dạng MOV 22
2.2 Các định chuẩn MPEG 25
2.2.1 Giới thiệu 25
2.2.2 MPEG–1 26
2.2.3 MPEG–2 29
2.2.4 MPEG–4 31
2.3 So sánh các định chuẩn MPEG 33
2.3.1 Bảng so sánh các định chuẩn MPEG 33
2.3.2 So sánh các định dạng Video AVI, MPG, RM/RA, ASF, IVF, VIV, MOV, DivX 34
Chương 3 – MÔ HÌNH CƠ SỞ DỮ LIỆU VIDEO 39
3.1 Tổng quan 39
3.2 Cấu thành dữ liệu video 41
3.2.1 Những đặc tính duy nhất của dữ liệu video 42
3.2.2 Nội dung của dữ liệu video 43
3.3 Yêu cầu cho mô hình video 44
Trang 43.3.1 Hỗ trợ trừu tượng hóa cấu trúc video đa mức 44
3.3.2 Hỗ trợ quan hệ không gian và thời gian 45
3.3.3 Hỗ trợ chú giải video 46
3.3.4 Độc lập dữ liệu video 46
3.4 Một số mô hình video 46
3.4.1 Các mô hình dựa trên phân đoạn video 46
3.4.2 Các mô hình dựa trên chú giải 48
3.4.3 Các mô hình đối tượng video 49
3.4.4 Mô hình dữ liệu video đại số 50
3.4.5 Các mô hình dữ liệu video khác 51
Chương 4 - MÔ HìNH CƠ SỞ DỮ LIỆU VIDEO CHO LẬP DANH MỤC VÀ KHÔI PHỤC NỘI DUNG VIDEO 53
4.1 Tổng quan 53
4.2 Mô hình hóa dữ liệu ảnh/video mức thấp 55
4.2.1 Mô hình hóa không gian – thời gian qua một dãy các khung 56
4.2.2 Mô hình đề xuất 57
4.3 Khung cấu thành các tình huống 60
4.3.1 Khái quát thao tác không gian – thời gian 60
4.3.2 Kí hiệu và khái niệm 62
4.3.3 Sự kiện không gian 63
4.3.4 Sự kiện thời gian 68
4.4 Mô hình hướng đối tượng của dữ liệu video 73
4.4.1 Từ sự kiện đến lớp 74
4.4.2 Khái niệm dữ liệu video khái quát trong mẫu hướng đối tượng 77
4.4.3 Mô hình đề xuất 82
KẾT LUẬN 85
Trang 5TÀI LIỆU THAM KHảO 86
Trang 6Danh mục các kí hiệu và viết tắt
VDBMS Video Database Management System
OVID Object Video Information Database
VIMSYS Visual Information Management System
VODM Video Object Description Model
VSDG Video Sematic Directed Graph
SECAM Sequential colour with memory
NTSC National Television Standard Committee
MPEG Moving Picture Experts Group
YUV Không gian mầu Y: giá trị độ sáng luminance
U,V: giá trị màu chrominance JPEG Joint Picture Experts Group
SIF Standard Intechange Format
ISO International Organization for Standardization
EIA Electronic Industries Association
DVD Digital Versatile Disc hoặc Digital Video Disc
Trang 7AVI Audio Video Interleave
MOV Quick Time Movie File Extension
WMV Windows Media file with Audio/Video
IMA Interactive Multimedia Association
Trang 8MỞ ĐẦU
Cùng với sự phát triển của máy tính, video số ngày càng trở nên phổ biến hơn trong nhiều lĩnh vực của cuộc sống như truyền thông, giáo dục, đào tạo, giải trí, và xuất bản Cụ thể là một số lượng lớn dữ liệu video hoặc đã tồn tại ở dạng số hoá, hoặc sẽ sớm được số hoá Theo một khảo cứu thế giới, đã có hơn sáu triệu giờ phim truyện và video được chiếu trên toàn thế giới, với tỷ lệ tăng hàng năm khoảng 10%
Nó bằng 1.8 triệu Gb dữ liệu video MPEG được mã hoá nếu là dạng số hoá
Với sự gia tăng số lượng thông tin video khổng lồ, sẽ không thể mã hoá được hết nếu không có sự quản lý mang tính hệ thống dữ liệu video Các hệ quản trị CSDL truyền thống được thiết kế để quản lý kiểu cấu trúc dữ liệu đơn giản, nhưng không phải là dữ liệu video
Bản chất của dữ liệu video là có cấu trúc phức tạp và nó đòi hỏi các phương pháp mới để mô hình hoá, sắp xếp, chèn và tính toán dữ liệu Rất nhiều mô hình CSDL video được đề xuất nhưng nói chung vẫn chưa đáp ứng được các yêu cầu của một CSDL cũng như áp dụng vào thực tế
Luận văn này tập trung vào:
Giới thiệu video: các khái niệm, định chuẩn
Trình bày các mô hình CSDL video
Trình bày mô hình CSDL video cho lập danh mục và khôi phục nội dung Luận văn được nghiên cứu với sự kết hợp của nhiều phương pháp: thu thập, phân tích, phân loại; nghiên cứu, phân tích và tổng hợp tài liệu; phân tích và thiết kế
hệ thống thông tin; phương pháp mô hình hoá trực quan Luận văn gồm bốn chương:
Mở đầu
Trang 9 Chương một: Giới thiệu tổng quan về video, các đặc trưng dữ liệu, phân lớp
video
Chương hai: Tập trung nghiên cứu, phân tích, so sánh các định chuẩn của
video AVI, MOV, MPEG: tên định chuẩn, mục đích sử dụng, mã nén, kích cỡ,
tỷ lệ, thời gian nén, chất lượng Từ đó rút ra kết luận và đưa ra các bảng so sánh định chuẩn video
Chương ba: Mô hình CSDL video
Chương bốn: Mô hình CSDL video cho lập danh mục và khôi phục nội dung
Kết luận
Trang 10CHƯƠNG 1 GIỚI THIỆU TỔNG QUAN VỀ VIDEO
Video ra đời vào những năm đầu của thế kỷ XX và phát triển khá mạnh mẽ, nhưng phải đến cuối thập kỷ XX video số mới phát triển Với sự ra đời và phát triển mạnh của máy tính và hệ thống viễn thông, dữ liệu video đã được số hoá
và đưa vào xử lý trên hệ thống máy tính Việc xử lý dữ liệu video được số hoá trên máy tính tỏ ra khá hiệu quả Kết quả là dữ liệu video số đã được đưa vào rất nhiều ứng dụng trong thực tế như đào tạo điện tử dựa vào máy tính CBT
(Computer Based Training), hỗ trợ đào tạo trên mạng WBT (Web Base
Training), hệ thống mô phỏng, video theo yêu cầu (Video On Demand) và một
vấn đề được quan tâm hàng đầu hiện nay là CSDL video
Chương này sẽ tập trung giới thiệu về các khái niệm, đặc điểm và các ứng dụng của video số
1.1 Một số khái niệm cơ bản
Trang 11 Dữ liệu video ở dạng bít 0 và 1 nên việc tác động lên video đơn giản hơn video truyền thống
1.1.3 Dữ liệu video số
Dữ liệu video số là các đoạn phim đã được số hoá và được ghi thành tệp trên đĩa cứng, đĩa CD, đĩa DVD, băng từ và các thiết bị lưu trữ khác mà máy tính có thể hiểu được
Một tệp video thông thường có hai phần: dữ liệu hình ảnh và dữ liệu âm thanh Khi phát, các dữ liệu hình ảnh và các dữ liệu âm thanh được phát đồng bộ nhau
1.1.4 Kích cỡ khuôn hình
Kích cỡ khuôn hình (frame size) là chiều dọc và chiều ngang của khuôn hình
được tính bằng điểm ảnh Ví dụ: khuôn hình ảnh 720x486 chứa 349.920 điểm ảnh, 640x480 chứa 307.200 điểm ảnh
Kích cỡ khuôn hình của video phải được xác định rõ theo định dạng chuẩn của video xuất ra Ví dụ: kích cỡ khuôn hình 720x480 điểm ảnh cho hệ NTSC, 720x576 điểm ảnh cho hệ PAL Hoặc có thể xác định khuôn hình 320x240 điểm ảnh cho các video có kích cỡ nhỏ, có thể sử dụng trên Web Tăng kích cỡ khuôn hình đồng nghĩa với việc máy tính phải tốn nhiều bộ nhớ và thời gian xử lý hơn khi hiển thị hay soạn thảo video
1.1.5 Kích cỡ khuôn hình và độ phân giải
Khi xử lý video số, kích cỡ khuôn hình tham chiếu đến độ phân giải Một loạt các thuộc tính rất quan trọng của khuôn hình khi soạn thảo video: điểm ảnh, tỷ lệ của khuôn hình, độ phân giải, độ sâu mầu Mối liên hệ giữa các yếu tố này là rất quan trọng như kích cỡ khuôn hình và yêu cầu bộ nhớ; độ phân giải cao hơn thì hình ảnh chi tiết hơn và do đó yêu cầu cần nhiều bộ nhớ cho soạn thảo hơn
Trang 121.1.6 Tỷ lệ khuôn hình
Tỷ lệ của khuôn hình là tỷ lệ kích thước chiều rộng/chiều cao của ảnh Ví dụ: tỷ
lệ khuôn hình của video NTSC là 4:3, một số video lớn hơn sử dụng tỷ lệ 16:9 Tỷ
lệ của khuôn hình không chỉ là các cạnh mà nó còn liên quan đến các chuẩn video
Ví dụ: tỷ lệ 4:3 là chuẩn cho các sản phẩm video của hệ điều hành Windows, Mac, khuôn hình 720x480 điểm ảnh sử dụng cho chuẩn NTSC
1.1.7 So sánh quét xen dòng và quét tuần tự
Interlaced là kỹ thuật quét xen dòng để làm tươi hình ảnh trên màn hình Interlaced hay Progressive-scan là kỹ thuật quét tuần tự các dòng
No-Kỹ thuật quét xen dòng là thuộc tính bắt và hiển thị video, nó không có cấu trúc phức tạp trong định dạng tệp hoặc truyền thông Kỹ thuật quét tuần tự các dòng cung cấp các hình ảnh tốt hơn khi soạn thảo hay tạo hiệu ứng video Video tương tự
và số có thể phân loại như là kỹ thuật quét xen dòng và quét tuần tự các dòng Các chương trình video của chuẩn PAL, NTSC, SECAM sử dụng kỹ thuật quét xen dòng: mỗi khuôn hình coi như hai phần hiểu thị Hầu hết màn hình máy tính sử dụng quét tuần tự Các khuôn hình được hiển thị một lần và được quét từ trên xuống trước khi khuôn hình tiếp theo được hiển thị
Trong quét xen dòng video, một khuôn hình được phân chia thành hai phần, phần đầu được gọi là trường cao, phần sau gọi là trường thấp Mỗi phần chứa các dòng quét khác nhau Trên màn hình hiển thị TV phần đầu được hiển thị thành các dòng quét ngang trên màn hình, phần sau quét ngang lấp đầy các chỗ trống ở trong phần đầu Vì một khuôn hình của video NTSC hiển thị trong khoảng thời gian 1/30 giây, quét xen dòng, nên bị chia thành hai phần, do đó thời gian hiển thị của một phần là 1/60 giây Một khuôn hình PAL và SECAM hiển thị trong khoảng 1/25 giây, quét xen dòng, thời gian hiển thị là 1/50 giây
Trang 131.1.8 Tốc độ của phát hình
Tốc độ phát hình là số hình ảnh được phát trong thời gian một giây Các video phổ biến được phát với tốc độ 25 và 29,97 hình/giây
1.2 Các yêu cầu hệ thống của Video
1.2.1 Phát hình trong thời gian thực
Khi nói đến hệ thống video, yếu tố quan trọng để phản ánh trung thực nội dung của video đó là thời gian thực Để có thể phát, hiển thị các tín hiệu video trong thời gian thực thì các thiết bị phải đảm bảo đủ mạnh, đường truyền với băng thông đủ lớn Ví dụ: khi chạy một tệp video có định chuẩn AVI phát trên máy Pentium I 133Mhz, card màn hình 1Mb, chúng ta thấy hình ảnh chuyển động chậm hơn so với thực tế, âm thanh bị lệch so với hình ảnh Chúng ta cũng thấy rất rõ điều này khi xem video trực tiếp trên Internet hay mạng tốc độ thấp
1.2.2 Tính đồng bộ của thiết bị khi xử lý video
Các thiết bị trong hệ thống xử lý video bao giờ cũng yêu cầu tính đồng bộ cao
để đảm bảo chất lượng hình ảnh và tốc độ của video Ví dụ: khi xây dựng hệ thống video các thiết bị phải đảm bảo:
Tốc độ xử lý của video đủ mạnh và có thể phải sử dụng các bộ xử lý chuyên dụng như bộ xử lý Silicon Graphic
Bộ nhớ đủ lớn Thông thường bộ nhớ máy tính hiện nay sử dụng cho việc soạn thảo, xử lý video trên 512Mb
Băng thông trong các hệ thống video phải đảm bảo tốc độ Ví dụ: đường mạng trong hệ thống xử lý video thường sử dụng cáp quang (1000 Mgbit)
Card màn hình tích hợp các bộ giải mã video chuyên dụng, bộ nhớ card màn hình đủ mạnh trên 128MB
Trang 14 Tốc độ truy cập dữ liệu của ổ cứng cao, không gian ổ cứng lớn để đảm bảo lưu được dữ liệu truyền từ các thiết bị khác như máy quay vào máy tính Một giờ video theo chuẩn NTSC với khuôn hình 720x480 điểm ảnh, khi chuyển vào máy tính chiếm khoảng 15 Gb ổ cứng
Các thiết bị trộn các kênh video, các thiết bị phát video đều phải tuân thủ các chuẩn về video như hệ NTSC, hệ PAL hay SECAM và các yếu tố thời gian thực
1.3 Các đặc điểm của dữ liệu video và video số
1.3.1 Khả năng truyền tải thông tin
Bản chất của video là tích hợp rất nhiều các yếu tố như kỹ thuật, nghệ thuật
do đó video trở thành dạng dữ liệu có khả năng truyền tải thông tin nhanh, đầy đủ, chính xác và rất ấn tượng Với đặc tính này, video có ưu thế hơn hẳn các dữ liệu khác như văn bản, âm thanh
Video có nhiều ưu điểm, nhưng có một hạn chế là dữ liệu video quá lớn và nó yêu cầu thiết bị cao hơn nhiều so với các cách thể hiện khác Mặc dù vậy, ngày nay, với công nghệ thông tin và truyền thông phát triển, các kỹ thuật nén ngày càng được cải thiện, ứng dụng video đã được triển khai nhiều hơn trong thực tế
1.3.2 Độ phân giải của video số
Như chúng ta đã biết video là loại dữ liệu số có kích cỡ rất lớn Do đó người ta phải tìm mọi cách để giảm thiểu kích cỡ của video Một trong các cách này là sử dụng độ phân giải phù hợp cho video Người ta đã nghiên cứu và thấy rằng mắt người bị giới hạn về khả năng nhìn Với màu sắc được hiển trị trên màn hình huỳnh quang thì mắt người chỉ nhận biết được sự khác nhau của chất lượng hình ảnh chuyển động với độ phân giải dưới 72 dpi (72 điểm ảnh/inch) Đối với các hình ảnh chuyển động có độ phân giải cao hơn thì mắt người không nhận biết được Vì vậy,
Trang 15video số thông thường như các máy quay số (digital camera), các thiết bị chuyển đổi dữ liệu video từ dạng tương tự sang dạng số
Một số trường hợp đặc biệt khi cần có video chất lượng rất cao như các đoạn phim sử dụng cho việc phân tích khoa học cần phóng to lên nhiều lần thì phải dùng những máy quay đặc biệt để có thể tăng độ phân giải của video lên trên 72 dpi Trong trường hợp này dữ liệu video sẽ lớn lên khá nhiều Ví dụ: tăng độ phân giải lên 300 dpi thì kích cỡ của tệp video tăng lên trên 4 lần
1.3.3 Dữ liệu lớn (chiếm nhiều không gian lưu trữ)
Video số là loại dữ liệu có kích cỡ rất lớn, nó chiếm rất nhiều không gian lưu trữ hay không gian đĩa cứng Ví dụ: một đoạn video có thời lượng là một giờ, kích
cỡ khuôn hình là 720x480, tốc độ phát hình 29,97 hình/giây, độ sâu mầu cho một điểm ảnh là 24bit Kích thước tệp video này là:
Để khắc phục trở ngại này người ta đã sử dụng nhiều biện pháp như giảm kích
cỡ khuôn hình, giảm độ sâu mầu, nhưng hữu hiệu hơn cả vẫn là sử dụng các thuật toán nén video, như các thuật toán nén MPEG Các thuật toán này đảm bảo cho việc
sử dụng các tệp video trên máy tính cũng như truyền dữ liệu video trên mạng là hiệu quả trong thời gian thực Hiện nay, đã có rất nhiều thuật toán nén video khác nhau, nhưng nền tảng vẫn chủ yếu dựa trên các thuật toán nén ảnh như thuật toán RLE, LZW, Wavelet, DCT Ngoài ra, người ta còn có một số thuật toán nén giành
Trang 16riêng cho video số như: giảm không gian màu, nén cấu trúc trong, nén dựa vào đối tượng cơ bản
1.4 Phân lớp video
1.4.1 Phân lớp theo mục đích sử dụng
Video là dữ liệu khá đặc biệt do đó phải có các phương pháp xử lý riêng cho từng mục đích sử dụng Chúng ta có thể phân loại video theo các cách đơn giản sau:
Video số sử dụng cho soạn thảo
Video loại này có chất lượng rất cao Thông thường sử dụng các thuật toán nén không mất thông tin Các dữ liệu video này được lưu trữ và xử lý trên các thiết bị đặc biệt, chuyên dụng như lưu trên các ổ cứng theo chuẩn SCSI có tốc độ đọc ghi nhanh, được hỗ trợ bởi card RAID, các thiết bị phần cứng để xử lý video như TACGA 3000, DV2000, máy tính tốc độ cao có trang bị các chíp đặc biệt hỗ trợ việc xử lý đồ hoạ
Video số sử dụng cho đầu cuối
Đây là các sản phẩm video số có chất lượng thấp hơn so với video dùng làm soạn thảo nhưng kích cỡ lại nhỏ hơn rất nhiều (nhỏ hơn vài chục lần so với video gốc) do sử dụng các thuật toán nén mất thông tin có thể sử dụng trên mạng, Internet hoặc các ứng dụng thông thường Trong lớp các video số này, người ta lại phân thành nhóm các sản phẩm nhỏ hơn
Các sản phẩm video số ghi trên đĩa CD là sản phẩm có chất lượng tương đối cao và được phân phối rộng khắp trên thị trường Nó sử dụng định chuẩn nén MPEG1 Một đĩa CD có dung lượng 700Mb lưu trữ được 80 phút video
Các sản phẩm video số ghi trên đĩa DVD có sức chứa 4,7 Gb Do đó, người ta
có thể nâng cấp chất lượng video số cao hơn chuẩn MPEG–1 bằng cách sử dụng chuẩn MPEG–2 Một đĩa DVD có thể lưu trữ được hai giờ video số với chất lượng
Trang 17Các sản phẩm video số phân phối trên mạng băng thông rộng, sử dụng chuẩn MPEG–1, MPEG–2, hoặc định chuẩn AVI, MOV với chất lượng video số cao Các định chuẩn này thường yêu cầu tốc độ truyền bít trên 15 Mb/giây
Các sản phẩm video số phân phối trên mạng băng thông hẹp hoặc Internet, sử dụng chuẩn video MPEG–4 hoặc AVI Nhóm các sản phẩm video số này có chất lượng thấp, khuôn hình nhỏ Sản phẩm video số này yêu cầu tốc độ đường truyền thấp dưới 500 Kb/giây
Video từ máy quay, Băng
Quá trình xử lý video sau
đó chuyển thành Video đầu cuối sử dụng trong các ứng dụng
Sơ đồ: thu và chuyển đổi dữ liệu video từ băng vào máy tính và xử lý thành các tệp Video theo các định chuẩn: MPEG1, MPEG2, MPEG4, AVI,MOV sử dụng cho các ứng dụng
Hình 1.1: Sơ đồ chuyển đổi dữ liệu video
1.4.2 Phân lớp theo nội dung đối tƣợng trong video
Một số cách phân lớp khác đó là phân lớp theo nội dung đối tượng, màu sắc có trong video số Cách phân lớp này thường sử dụng cho việc xử lý, áp dụng các kỹ
Trang 18thuật nén cho video Ví dụ: video đen trắng hay video mầu, cảnh thay đổi nhanh hay
ít thay đổi, video hoạt hình Từ đó người ta đưa vào các kỹ thuật nén với các tham
số nén hữu hiệu cho phép giảm đáng kể kích cỡ video cho từng loại Ví dụ: trong video hoạt hình số người ta có thể sử dụng các thuật toán nén bằng cách phân ra đối tượng để nén tốt nhất dữ liệu video loại này
1.5 Các hướng nghiên cứu và ứng dụng
Hiện nay, nghiên cứu và ứng dụng video vào trong đời sống đang là một vấn đề cấp thiết và được các nhóm nghiên cứu, các hãng phần mềm tập trung nghiên cứu bởi lợi ích mà nó đem lại là rất lớn Những hướng nghiên cứu mới và các ứng dụng video đang được phát triển bao gồm:
1.5.1 ứng dụng video cho đào tạo điện tử (e-learning)
Đào tạo điện tử tham chiếu đến những bài học được thể hiện bằng công nghệ điện tử Đây là lĩnh vực mới hỗ trợ và thay thế một phần đào tạo truyền thống Nó xuất phát từ những yêu cầu học tập mà trong đó học viên và giáo viên bị ngăn cách bởi không gian địa lý Với hệ thống mạng LAN, WAN và Internet việc phân phối các bài học điện tử đã trở nên dễ dàng hơn Nhưng để nội dung các bài học trở nên hấp dẫn, sinh động và trực quan thì dữ liệu video đóng vai trò chủ chốt Do đó việc nghiên cứu xây dựng video cho các bài giảng điện tử để có thể truyền tải trên hệ thống mạng hay đặt trên đĩa CD là vấn đề hết sức cần thiết
1.5.2 Xây dựng hệ quản trị cơ sở dữ liệu video
Một hướng nghiên cứu khác là xây dựng hệ quản trị cơ sở dữ liệu video – VDBMS Đây là một vấn đề khá phức tạp vì dữ liệu video rất lớn Việc xử lý dữ liệu như tìm kiếm, phân loại video trong thời gian thực hay thời gian chấp nhận được là hết sức khó khăn
Trang 191.5.3 Hệ thống mô phỏng và thực tại ảo
Hiện nay công nghệ mô phỏng và thực tại ảo đang rất được quan tâm Một hệ thống mô phỏng đầy đủ trên máy tính như mô phỏng buồng lái máy bay hay buồng lái xe tăng có thể thay thế các thiết bị thực tế để đào tạo người học với chi phí nhỏ hơn rất nhiều so với thực tế
1.5.4 Video theo yêu cầu
Đây là một ứng dụng video phục vụ người dùng theo yêu cầu Thông thường chúng ta xem video theo các kênh truyền hình định trước, dịch vụ video theo yêu cầu cho phép chúng ta lựa chọn những chương trình, những video mình thích hay quan tâm và yêu cầu trung tâm dịch vụ phát cho chúng ta những video đó trong thời gian thực Video theo yêu cầu là một dịch vụ mới đòi hỏi hạ tầng cơ sở truyền thông mạnh, hệ quản trị cơ sở dữ liệu tốt Dịch vụ này đang được nghiên cứu và triển khai tại Nhật, Mỹ và các nước có công nghệ thông tin phát triển
1.5.5 Truyền hình số
Đây là dịch vụ truyền hình đang được phát triển khá rộng rãi trên thế giới Nó thay thế truyền hình tín hiệu tương tự truyền thống bằng các kênh truyền hình số với chất lượng hình ảnh cao hơn, ít nhiễu hơn Công nghệ này dựa trên định chuẩn video MPEG–2 và MPEG–4
Trang 20-CHƯƠNG 2 CÁC ĐỊNH CHUẨN VIDEO
Trong quá trình soạn thảo, xử lý và export video cần hiểu rõ về các định chuẩn video Ví dụ: để tạo ra một video sử dụng trên Intermet chúng ta cần phải thiết lập các tham số nén đảm bảo tệp video theo đúng định dạng và mục đích sử dụng Ngoài các yếu tố kỹ thuật, việc xác định định dạng của video còn phụ thuộc vào các yếu tố kinh nghiệm của người xử lý MPEG, AVI cho Windows, QuickTime cho MOV là các định dạng được sử dụng rộng rãi Trong chương này chúng ta làm rõ các định chuẩn với mục đích sử dụng, các kỹ thuật nén, kích cỡ, thời gian xử lý nén
Intel Indeo 5.10 (Intel indeo 5.03): được sử dụng cho các định dạng Video
phân tán trên mạng Internet, cho các máy tính có bộ xử lý MMX hoặc bộ xử lý
từ Pentium II trở lên Mã nén có đặc trưng: có lựa chọn nén nhanh, điều khiển các keyframe mềm dẻo, điều chỉnh sắc độ, các hiệu ứng playback, và cuối cùng tạo ra các tệp video có dữ liệu giảm đáng kể
- Kiểu nén này cho phép người xử lý video có thể điều chỉnh để tạo ra các video dùng cho các băng thông khác nhau
Trang 21- Ví dụ: có thể điều chỉnh để tạo ra video dùng cho modem 56Kb, 28,8Kb hay đường cáp mạng Mã nén này được thiết kế để làm việc cùng với mã nén âm thanh Intel Audio
Intel Indeo Video Raw R1.1: được sử dụng tốt nhất cho việc thu các tín hiệu
video làm dữ liệu video nguồn sử dụng cho soạn thảo video, với thiết bị thu – Intel Video Mã nén này cung cấp các hình ảnh chất lượng cao Các tệp video dùng lựa chọn Intel Indeo Video Raw R1.1, có kích cỡ nhỏ hơn các tệp video chưa được nén ở định dạng này màu sắc của hình ảnh video đã được chuyển từ không gian mầu RGB thành không gian mầu YUV
Intel Indeo Video Interactive: là kiểu nén tương tự như định dạng 5.10 nhưng
có một số hỗ trợ mở rộng như đặc tính trong suốt, nhiều đối tượng chuyển động
và các hiệu ứng hiển thị lại trong video
Microsoft RLE: dùng để nén các khuôn hình mà nội dung là các vùng mầu
đồng nhất có kích cỡ lớn và số lượng mầu không nhiều, màu phẳng (các ảnh không có chiều sâu) Ví dụ: khi xử lý các video phim hoạt hình, sử dụng kiểu nén này tỏ ra khá hữu hiệu Kiểu nén này có mã nén độ dài 8 bit dùng thuật toán nén không mất thông tin RLE (Run–Length–Encoding) Chất lượng video cao
Microsoft Video 1: sử dụng kỹ thuật nén mất thông tin theo phương pháp nén
không gian màu Mã nén này có nhiều tham số có thể thay đổi như: số mầu trên khuôn hình của video (8 bit hay 24 bit mầu), chất lượng video, số keyframe Chuẩn nén này có thể tạo ra các tệp video sử dụng cho các chương trình đào tạo từ xa hay các tệp video sử dụng cho mạng tốc độ thấp
Indeo (R) Video R3:2: sử dụng để nén video 24 bit dùng cho đĩa CD Tỷ lệ
nén tốt, chất lượng hình ảnh cao, và tốc độ hiển thị nhanh hơn so với kiểu nén Microsoft Video 1 Cho kết quả tốt nhất nếu sử dụng mã nén Indeo Video trên
dữ liệu video nguồn mà trước đó dữ liệu này không bị nén với tỷ lệ cao bằng
Trang 22các kỹ thuật nén mất thông tin Các tệp video được nén bằng kỹ thuật nén Indeo(R) video R3:2 có chất lượng tương đương với các tệp video sử dụng kỹ thuật nén Cinepak
Cinepak Code By Radius: sử dụng để nén video 24 bit dùng cho CD-ROM
hoặc cho mục đích tải về từ Web Đây là kiểu nén đạt được tỷ lệ nén cao hơn và tốc độ giải nén nhanh hơn so với mã nén Microsoft Video 1 Chúng ta có thể đặt tham số chất lượng hình ảnh Các tệp video sau khi xử lý có thể hiển thị lại trên đường truyền có tốc độ 30 Kb/giây Kỹ thuật mã bằng Cinepak tạo ra sản phẩm video có tốc độ giải nén rất nhanh nhưng khi nén mất rất nhiều thời gian
Kỹ thuật nén này phù hợp cho việc chuyển một đoạn video thành kết quả cuối cho người sử dụng
Intel Audio Software codec: sử dụng cho nhạc và lời nói trên Internet Tỷ lệ
nén tối đa là 8:1 Mã nén này được thiết kế để làm việc với chương trình Intel Video Software
TrueSpeech: sử dụng cho nói chuyện trên mạng Internet với tốc độ truyền
thấp
Microsoft GSM 6.10: sử dụng cho điện thoại trên Internet ở châu âu
MS-ADPCM (Microsoft implementation of Adaptive Differential Pulse Code
Modulation): sử dụng để tạo các tệp audio có chất lượng cao ghi trên đĩa
CD-ROM Kiểu nén này được sử dụng rộng rãi
Microsoft IMA ADPCM: sử dụng tạo các tệp audio cho các sản phẩm
multimedia Mã nén này dựa trên mã nén ADPCM được phát triển bởi IMA
Lucent Technologies SX8300P: sử dụng cho giao tiếp trên Internet tốc độ
thấp
Trang 23 Elemedia TM AX2400P: sử dụng tạo các tệp âm nhạc chất lượng cao trên
Cinepak: được sử dụng để nén video 24 bit Các tệp sử dụng mã nén này để
dùng cho CD-ROM và Web video Mã nén có tỷ lệ nén cao và tốc độ giải nén nhanh Cinepak dùng thuật toán nén không đối xứng các tệp video có kích cỡ nhỏ nhưng thời gian nén rất lâu Cho kết quả tốt nhất nếu dùng Cinepak để tạo tệp video
Sorenson Video: được sử dụng để nén video 24 bit Các tệp sử dụng mã nén
này để dùng cho CD-ROM và Web video Nó cũng giống như mã nén Cinepak nhưng là mã nén mới thiết kế để nén với chất lượng cao Mã nén này cho hình ảnh tốt hơn, kích cỡ tệp video nhỏ hơn so với mã Cinepak vì vậy nó phù hợp cho việc tạo các tệp video cuối cùng chứ không phù hợp cho soạn thảo
Planar RGB: sử dụng hiệu quả cho các khuôn hình có vùng màu đặc như các
tệp Animation Nó sử dụng thuật toán nén RLE kết hợp với kỹ thuật tạo mã Animation (Animation codec)
Motion JPEGA and Motion JPEG: được dùng cho mục đích chuyển mã
video giữa các thiết bị Ví dụ: chuyển các tệp video trong hệ thống máy tính,
Trang 24các đoạn video trên băng ra các thiết bị khác của mày tính như đĩa CD thông qua thiết bị thu video Mã nén Motion JPEGA and Motion JPEG được hỗ trợ nhiều trong các chíp có trên các thiết bị thu video do đó tốc độ xử lý rất nhanh
Photo–JPEG: dùng để nén một chuỗi các ảnh tĩnh có màu sắc biến đổi dần
(các đường biên không rõ nét) Đây là kiểu nén mất thông tin nhưng có thể đặt được tham số nén để ảnh có chất lượng rất cao Mã nén Photo-JPEG là kiểu nén đối xứng – thời gian nén gần bằng thời gian giải nén, nhưng thời gian nén
là khá nhiều so với thời gian thực của video Các ảnh đã được nén theo kiểu này thì không nên dùng làm nguồn để soạn thảo vì nó đã bị mất thông tin Tuy nhiên với tỷ lệ nén không cao nhưng cho chất lượng ảnh tốt nên có thể dùng để lưu trữ hoặc để di chuyển giữa các hệ thống máy tính Rất nhiều phần cứng nén video (hardware compression) sử dụng định dạng JPEG
H.261, H.263: sử dụng tạo các video cho hội thảo, có tỷ lệ nén cao Không nên
sử dụng chuẩn này cho soạn thảo video thông thường
Component video: được sử dụng cho thu video chất lượng cao để tạo và lưu
trữ video nguồn hay tạo các đoạn video trung gian cho xử lý Mã nén này có tỷ
lệ nén rất thấp do đó các tệp video chiếm rất nhiều không gian đĩa
Graphics: được sử dụng cho việc nén và tạo video với chất lượng cao, có độ
sâu màu 8 bít Mục tiêu của mã nén là để nén các ảnh động (một chuỗi các ảnh) nhưng đôi khi cũng có thể sử dụng cho nén video Mã nén này không đạt được
tỷ lệ nén cao Nó chỉ thích hợp cho các tệp video lưu trữ và playback trên đĩa cứng, không phù hợp với các tệp video trên CD-ROM
Video: được sử dụng cho việc thu và nén các tín hiệu video có nguồn ở dạng
tín hiệu tương tự Mã nén này tạo ra các tệp video có chất lượng cao và sử dụng tốt cho lưu trữ trên ổ đĩa cứng hoặc trên đĩa CD-ROM Nó hỗ trợ cả hai loại nén theo không gian và theo thời gian cho video 16 bit mầu
Trang 25 Animation: được sử dụng cho việc nén các khuôn hình có vùng màu có kích
cỡ lớn, như các khuôn hình cho phim hoạt hình Mã nén này có các tham số cho phép thay đổi tỷ lệ nén Với tỷ lệ nén là 100%, video không bị nén Nếu tỷ
lệ dưới 100% tệp video bị nén ở dạng mất thông tin Mã nén Animation dựa trên lý thuyết nén của Apple và thuật toán nén RLE
DV–PAL và DV–NTSC: dùng để tạo các tệp video với định dạng PAL, NTSC
phục vụ in ra băng theo các hệ trên hoặc ngược lại lấy từ băng vào máy tính thông qua card thu video số Chuẩn nén này rất hữu dụng cho việc chuyển dữ liệu video từ hệ thống máy tính này sang hệ thống máy tính khác hoặc từ thiết
bị này sang thiết bị khác
Đối với các thiết bị phần cứng hỗ trợ soạn thảo Video thường có các mã nén riêng được viết bởi nhà sản xuất thiết bị phần cứng
Đối với hệ thống Mac người ta thường sử dụng các mã nén âm thanh sau:
mLaw 2:1: sử dụng cho việc chuyển các tệp audio với các ứng dụng trên các
máy trạm Tại đó mLaw là định dạng audio chuẩn, mLaw được sử dụng cho điện thoại số ở Bắc Mỹ và Nhật Bản
16-bit Big Endian và 16-bit Little Endian: sử dụng cho các phần cứng và
phần mềm chuyên dụng để nén audio Audio đã được nén bằng mã nén này
thường không tốt cho soạn thảo
- 24–bit Integer và 32–bit Integer: sử dụng cho audio 24–bit hoặc 32–bit
Mã nén này được sử dụng tốt cho các phần cứng và phần mềm chuyên dụng Nó là sản phẩm cuối do đó các tệp video chứa mã nén này không nên dùng để soạn thảo
- IMA 4:1: sử dụng cho các tệp audio tại các trạm IMA 4:1 được phát triển
bởi IMA sử dụng mã ADPCM
Trang 26- 32–bit Floating và 64–bit Floating: sử dụng trong các thiết bị phần cứng
và phần mềm chuyên dụng nhưng thường không sử dụng cho soạn thảo Video
- ALaw 2:1: giống mLaw nhưng được sử dụng cho điện thoại số ở châu âu
- QDesign Music Codec: sử dụng để nén các tệp audio chất lượng cao dùng
trên Internet Chất lượng của nó tương đương các tệp âm thanh trên ROM có định dạng 16 – bit, 44.1 kHz Các tệp âm thanh được nén theo mã này có thể nghe trực tiếp bằng đường Internet có tốc độ 28.8 Kb/giây
CD Qualcomm PureVoice: được thiết kế để tạo các tệp âm thanh tốt nhất ở
tần số 8 kHz Cơ sở của mã nén này dựa trên thuật toán nén chuẩn của Telephone CDMA (Code Division Multiple Access)
- MACE 3:1 and MACE 6:1: để tạo các tệp audio thông thường cho hệ
điều hành Mac Nó dựa trên thuật toán nén âm thanh MACE (Macintosh Audio Compression and Expansion codec) Mã nén MACE 3:1 có tỷ lệ nén thấp hơn mã nén MACE 6:1 nhưng có chất lượng cao hơn
2.2 Các định chuẩn MPEG
2.2.1 Giới thiệu
Chuẩn nén video MPEG được phát triển bởi MPEG (Moving Picture Experts Group), hiện đang được sử dụng rộng rãi trong các sản phẩm video MPEG đứng đầu trong việc ứng dụng trong truyền hình số, mã và giải mã HDTV, CD, DVD, video conferencing, video cho Internet và các ứng dụng khác MPEG được sử dụng rộng rãi như vậy chính là nhờ khả năng nén hiệu quả, làm giảm đáng kể kích cỡ tệp video Thông qua xử lý nén bằng MPEG, các video có thể truyền hiệu quả trên mạng Cơ sở của chuẩn nén MPEG là sử dụng thuật toán biến đổi cosin rời rạc DCT với việc phân chia khuôn hình ảnh thành các khối và đánh giá chuyển động Các đặc điểm chi tiết về kỹ thuật của chuẩn MPEG được tổ chức ISO (International
Trang 27Commission) công nhận Có ba định dạng Video theo chuẩn MPEG là MPEG–1, MPEG–2, MPEG–4 chính thức trở thành định dạng chuẩn quốc tế
2.2.2 MPEG–1
MPEG–1 đã được hoàn thiện vào năm 1991, với nhiều ưu điểm như: tối ưu hoá khi làm việc với độ phân giải 352x240 điểm ảnh, 30 hình/giây cho hệ NTSC và độ phân giải 352x288 điểm ảnh, 25 hình/giây [22] Chuẩn này cố định độ phân giải nên thường gây ra một số lỗi nếu độ phân giải đặt không đúng Tuy nhiên, trường hợp đặc biệt MPEG–1 có chế độ làm việc với độ phân giải rất cao 4095x4095 phát 60 hình/giây MPEG–1 thông thường làm việc tối ưu với tốc độ 1,5 Mb/giây cho các ứng dụng MPEG–1 sử dụng cho các ứng dụng có chế độ quét hình tuần tự Nó không trực tiếp làm việc với các ứng dụng video sử dụng chế độ quét xen dòng như ứng dụng truyền hình MPEG–1 có chất lượng tương đương với chất lượng truyền hình Video MPEG–1 sử dụng làm định dạng chuẩn cho các sản phẩm video CD MP3 là chuẩn nén âm thanh được sử dụng trong MPEG–1
MPEG–1 bao gồm một số phần sau:
Đồng bộ hoá video và audio
Mã nén cho các tín hiệu video non-interlaced, sử dụng thuật toán DCT
Mã nén cho cho các tín hiệu audio theo chuẩn 3 lớp:
- Lớp 1 MP1 (MPEG–1 Audio Layer 1)
- Lớp 2 MP2 (MPEG–1 Audio Layer 2)
- Lớp 3 MP3 (MPEG–1 Audio Layer 3)
MPEG–1 được thiết kế theo chuẩn MPEG–1, phân định địa chỉ của các kênh
dữ liệu âm thanh và hình ảnh, kết hợp với thời gian Đây là chức năng quan trọng vì
từ dạng dữ liệu này sẽ được chuyển đổi thành các kênh dữ liệu phù hợp
Trang 28Hình 3.1: Sơ đồ nguyên mẫu chuẩn giải nén MPEG–1
(ISO/IEC 11172) Theo sơ đồ này chúng ta thấy rằng, thông qua các địa chỉ được lưu trữ trong chuẩn MPEG–1, khi giải nén sẽ xác định được chính xác các kênh audio và video Thuật toán nén cho chuẩn MPEG–1 có khả năng nén cao Đầu tiên chuyển video từ không gian mầu RGB về không gian mầu YUV, sử dụng thuật toán nén không gian mầu để giảm dữ liệu video Sau đó dùng thuật nén theo thời gian chuyển động bằng cách phân chia video thành các dãy, lựa chọn các keyframe Phân chia khuôn hình thành các clice, macro block, và block Dùng giải thuật DCT nén không gian ảnh Nén không gian dữ liệu một lần nữa bằng giải thuật nén không mất thông tin
Trang 29Hình 3.2:Sơ đồ nén dữ liệu âm thanh Đầu vào là các tín hiệu mã với tần số 32, 44.1, 48 KHz Dựa theo bản đồ lọc và lấy ra các mẫu đặc trưng Psychoacoustic model là quá trình tập hợp dữ liệu và điều khiển việc lượng tử hoá và mã hoá để tạo ra khối các khuôn hình Khối các khuôn hình là các gói chuẩn (cơ sở) được mã hoá
ứng dụng của MPEG–1:
Phân phối video (Video CD)
Một ứng dụng rộng khắp của MPEG–1 hiện nay đó là việc phân phối video thường là phim Các video theo chuẩn MPEG–1 có chất lượng tốt, kích cỡ nhỏ Phim được chuyển thành dạng MPEG–1, ghi trên đĩa CD-ROM và đang được các hãng phân phối trên toàn thế giới
Video công cộng (Video Kiosk)
Video kiosks hoặc information kiosks, là các trạm video công cộng hướng dẫn người sử dụng các thông tin cần thiết của một hệ thống nào đó Nó thường được đặt tại các nhà ga, ngân hàng, siêu thị Các video này được đặt trên đĩa cứng hoặc CD-ROM với định chuẩn MPEG–1 MPEG–1 đảm bảo chất lượng, kích cỡ nhỏ do đó
có thể dễ dàng sử dụng trong các ứng dụng này
Dịch vụ video thông qua đường truyền điện thoại (Video Dial Tone)
Hệ thống này đang được thử nghiệm ở nhiều nước tiên tiến như Nhật Bản, Mỹ Thông qua đường truyền điện thoại, máy điện thoại để bàn, có màn hình hoặc hệ thống điện thoại di động, người sử dụng có thể đặt các chương trình video xem trực tiếp trên máy điện thoại hay có thể đàm thoại và thấy được hình ảnh của nhau Dịch
vụ này bị giới hạn về băng thông do đó người ta sử dụng định chuẩn video MPEG–
1
Thư viện video: các thư viện dữ liệu video hiện nay đang được thay thế dần các băng video casset bằng dữ liệu video số theo chuẩn MPEG–1 ưu điểm của các đĩa
Trang 30CD theo chuẩn MPEG–1 là dễ hiển thị, dễ truy cập, không gian lưu trữ nhỏ, chất lượng hình ảnh tốt Hiện nay rất nhiều thư viện của các trường đại học, viện nghiên cứu, trung tâm đang chuyển dần sang sử dụng dữ liệu video số
2.2.3 MPEG–2
MPEG–2 đã hoàn thành vào tháng 11/1994 [23] MPEG–2 ban đầu được phát triển trên cơ sở các kỹ thuật nén tốt nhất của MPEG–1 nhưng phần mã hoá được mở rộng hơn Các mã này được áp dụng cho các ảnh có không gian mầu YUV với thành phần Y:U:V là 4:2:2 Tuy nhiên MPEG–2 vẫn không được triển khai trong các ứng dụng video Đến tháng 4/1997, MPEG-2 đưa thêm các mã phân định nhiều kênh audio Một số thuật toán nén âm thanh được áp dụng trong phần này không còn bị lệ thuộc vào các thuật toán được áp dụng trong MPEG–1 Như vậy, chuẩn này đã được
tổ chức ISO công nhận và được sử dụng làm chuẩn video cho truyền hình số Mã nén MPEG–2 có thể đáp ứng kỹ thuật quét xen dòng của video Mục tiêu của định chuẩn này là nâng chất lượng của video lên cao hơn chuẩn MPEG–1 do đó yêu cầu
về đường truyền cũng cao hơn, từ 5-20 Mb/giây MPEG–2 bao gồm Profiles and Levels Profiles định rõ dòng bit và độ phân giải của không gian mầu, Levels xác định độ phân giải ảnh và tốc độ bit lớn nhất của mỗi Profiles Các Profiles và Levels được sử dụng phổ biến hiện này gọi là Main Profiles, Main Levels ký hiệu (MP@ML) Chúng có độ phân giải video 720x480 với tốc độ 30 hình/giây, tốc độ bít là 15 Mb/giây cho video hệ NTSC HDTV sử dụng độ phân giải 1920x1080, 30 hình/giây, tốc độ bít là 80 Mb/giây gọi là Main Profiles, High Levels (MP@HL) MPEG–2
Trang 31Hình 3.3:Mô hình hệ thống giải mã MPEG–2
Theo mô hình, này MPEG–2 đánh địa chỉ phối hợp một hoặc nhiều luồng dữ liệu của video và audio thành một luồng đơn thống nhất Các dữ liệu trên luồng dữ liệu này được tổ chức phù hợp nhất cho việc lưu trữ và phát video Việc tổ chức này dựa vào hai lớp chính: Program Stream và Transport Stream Program Stream(PS)
là việc phối hợp một hoặc nhiều gói tin cơ bản PES (Packetised Elementary Streams) trong các luồng dữ liệu đơn thành một luồng dữ liệu thống nhất Gói tin Program Stream có độ lớn khác nhau và như vậy thời gian truyền gói tin là khác nhau Trong quá trình truyền các gói tin, nến phát hiện có một gói tin bị mất thì hệ thống sẽ yêu cầu truyền lại toàn bộ các gói tin (vì Program Stream không xác định gói tin nào phải được truyền lại) Program Stream được thiết kế cho việc sử dụng trong hệ thống đường truyền rất ít lỗi Nó phù hợp với các ứng dụng có dùng phần mềm để xử lý
Transport Stream(TS) là việc phối hợp một hoặc nhiều gói tin cơ bản PES (Packetised Elementary Streams) trong các luồng dữ liệu đơn thành một luồng dữ liệu đơn thống nhất Gói tin Transport Stream có độ lớn bằng nhau là 188byte và như vậy thời gian truyền gói tin là như nhau Trong quá trình truyền các gói tin, nếu phát hiện có một gói tin bị mất thì hệ thống không yêu cầu truyền lại toàn bộ các gói
Trang 32tin mà chỉ yêu cầu truyền lại gói tin bị mất (vì Transport Stream đánh chỉ số cho các gói tin) Transport Stream được thiết kế cho việc sử dụng trong hệ thống đường truyền có nhiều lỗi
ứng dụng của MPEG-2:
Video theo yêu cầu: VOD là một ứng dụng cơ bản về video Tuy nhiên, hầu hết các ứng dụng của VOD là phim Ban đầu trong các khách sạn, bệnh viện và cuối cùng là ở trong gia đình Tất cả chúng đều được tương tác qua ti vi Dịch
vụ này cho phép người sử dụng đặt các chương trình phim theo ý thích, và có thể xem bất kể thời gian nào Các ứng dụng VOD sử dụng định chuẩn video MPEG–2
Truyền hình cáp CATV (Cable Television): sử dụng chuẩn video MPEG–2 để
nén, giải nén và phân phối video Đây là chuẩn video có chất lượng rất cao, yêu
cầu băng thông rộng
Hệ thống phát hình trực tiếp qua vệ tinh DBS (Direct Broadcast Satellite): sử
dụng chuẩn MPEG–2 cho việc phát hình trực tiếp Lợi thế của hệ thống này là bất kể đâu và bất kể thời gian nào chúng ta cũng có thể bắt đuợc tín hiệu truyền hình
Truyền hình chất lượng cao HDTV (High Definition Television): Mỹ và một số
nước khác sử dụng MPEG–2 làm chuẩn video cho truyền hình chất lượng cao
Một số ứng dụng khác: MPEG–2 sử dụng trong các phầm mềm của các thiết bị
video như: băng Video chất lượng cao, đĩa video số chất lượng cao DVD, video conferencing và trong các máy quay video số
2.2.4 MPEG–4
MPEG–4 là chuẩn ISO/IEC được phát triển bởi MPEG [24] Nhóm này cũng
đã phát triển chuẩn MPEG–1 và MPEG–2 Các chuẩn này cho phép phát hành video
Trang 33nghiên cứu và kỹ sư trên toàn thế giới MPEG–4 được hoàn thành vào tháng 10/1998 và trở thành chuẩn quốc tế từ tháng 1/1999 Cuối năm 1999, phiên bản 2 của MPEG–4 ra đời Định dạng này mềm dẻo, yêu cầu tốc độ đường truyền thấp và không có độ phân giải video chuẩn
Nén hình ảnh trong MPEG–4 sử dụng kỹ thuật nén đối tượng cơ bản với việc phần lớp và lưu các thông tin đối lượng Mỗi lớp lưu mã nén về nội dung của một chuỗi các ảnh (bao gồm: đường viền, quỹ đạo chuyển động, kết cấu bề mặt) Khi giải nén, thông qua nội dung được lưu trong các lớp để xây dựng lại từng phần của đoạn video
Hình 3.4:Mô hình nén và giải nén theo từng lớp của MPEG-4
Trang 34Hình 3.5:Ví dụ về một cảnh trong MPEG–4 Theo mô hình nén và giải nén theo từng lớp của MPEG–4, video được nén trên
3 lớp với tỷ lệ giảm kích cỡ (không gian) là 2 lần trên từng lớp Trên các lớp ngoài, những thông tin về nội dung của một chuỗi hình ảnh còn lưu tỷ lệ giảm không gian của lớp so với lớp trên đó Khi giải nén dựa vào tỷ lệ này cùng với các thông tin về đường viền, quỹ đạo chuyển động, kết cấu bề mặt của đối tượng trong video để phục hồi lại đoạn video gốc
Như vậy, dựa vào tỷ lệ giảm kích cỡ không gian video, chúng ta có thể điều chỉnh tốc độ phát hình cũng như kích cỡ của tệp video cho phù hợp với băng thông
ứng dụng của MPEG–4: do có tính mềm dẻo MPEG–4 đã được triển khai trong ba
lĩnh vực chính:
Truyền hình số,
Các ứng dụng đồ hoạ tương tác,
ứng dụng đa phương tiện tương tác
Chuẩn kỹ thuật của MPEG–4 được thống nhất cho sản xuất, phân phối các sản phẩm video cho cả ba lĩnh vực trên
2.3 So sánh các định chuẩn MPEG
2.3.1 Bảng so sánh các định chuẩn MPEG
MPEG–1 MPEG–2 MPEG–4
Chất lượng Chất lượng video
tương đương VHS
Chất lượng video rất cao
Phân chia lớp video
từ chất lượng cao đến chất lượng thấp Chất lượng cao tương đương với MPEG-2
Trang 35Thuật toán nén DCT, nén động DCT, nén động Nén đối tượng cơ bản
sử dụng cho các video độ phân giải thấp
Truyền hình số, HDTV, CATV, DVD, chất lượng cao, thường sử dụng cho video độ phân giải cao
Phân phối video trên mạng, mạng không dây và Internet
Hội thảo từ xa (Video conference) H263 Truyền hình số
2.3.2 So sánh các định dạng Video AVI, MPG, RM/RA, ASF, IVF, VIV, MOV, DivX
ASF/WMA/WMV - ASF là định dạng video Streaming tiên tiến của Microsoft Nội dung của nó bao gồm các thông tin Video, audio, các cảnh (Slide Shows)
và đồng bộ hoá các thành phần WMA (Windows Media Audio) chỉ chứa audio WMV (Windows Media file with Audio/Video) tương tự như ASF Nó có thể downloaded và hiển thị theo dòng (Streaming) từ các server ở xa
AVI - viết tắt từ "Audio Video Interleave" - là chuẩn video cho Windows của Microsoft Nó là chuẩn độc quyền thiết kế cho video và audio của Microsoft
Trang 36Windows Nó là định chuẩn thiết kế cho việc lưu trữ các thông tin Audio và video Định dạng tệp video có phần mở rộng là AVI Tệp AVI thường có độ phân giải là 320x240 và 30 khuôn hình/giây, nhưng có thể hiển thị toàn màn hình Tuy nhiên Video cho Windows không yêu cầu các phần cứng đặc biệt, và được làm nhỏ kích cỡ khi sử dụng trong các ứng dụng multimedia Rất nhiều sản phẩm multimedia sử dụng định dạng này vì nó là video theo chuẩn Windows, các hãng có thể bán rộng rãi các sản phẩm cho người dùng Tương đương với định dạng AVI chỉ có định dạng QuickTime
DivX là nhãn hiệu đăng ký của DivXNetworks, Inc DivX là định chuẩn video
dựa trên kỹ thuật nén MPEG-4 Các tệp DivX có thể download trên các đường mạng tốc độ cao trong thời gian ngắn
IVF (Intel Video Technology) là tệp sử dụng mã nén Indeo gốc được phát triển bởi Intel
MOV (Quick Time Movie File Extension) là định chuẩn video và hoạt hình (Animation) do hãng máy tính Apple Computer phát triển Quicktime được xây dựng cho hệ điều hành Macintosh và được sử dụng hầu hết trong các ứng dụng video, hoạt hình Máy tính PC cũng có thể chạy được định dạng Quicktime nhưng phải có phần mềm hiển thị Quicktime chuẩn Quicktime cạnh tranh với nhiều chuẩn khác như AVI, ActiveMovie Trình hiển thị Quicktime hỗ trợ hầu hết các định dạng nén như Cinepak, JPEG and MPEG QuickTime cho chất lượng hiển thị audio/video cao, hỗ trợ nhiều định dạng trong các thiết bị
Trang 37ba kiểu mã nén MPEG audio, layer 1, layer 2, layer 3 tăng dần theo chất lượng
âm thanh và thời gian mã hoá Layer là định dạng nén “PASC”, nén với mục tiêu tạo tệp audio cho Digital Compact Cassettes Layer 2 là định dạng nén
"MUSICAM" Layer 3 là định dạng mới hiện nay, có chất lượng cao, kích cỡ phù hợp, được sử dụng rộng rãi trên Internet
Trang 38dòng dữ liệu từ máy chủ đã được giải nén và đưa ra các thiết bị âm thanh trên máy tính
Real Video là kỹ thuật “streaming” được phát triển bởi RealNetworks cho sử dụng video trực tiếp trên Internet Real Video sử dụng các kỹ thuật nén đa dạng
và làm việc với cả hai dạng: kết nối IP thông thường và kết nối IP Multicast RealVideo 8 thường tăng cường chất lượng video và làm trơn quá trình hiển thị trên các kiểu kết nối, từ kết nối dạng quay số điện thoại đến kết nối băng thông rộng Nó được sử dụng nhiều cho các thiết bị như Webcam hoặc hiển thị video trực tiếp
Để hiển thị các video trực tiếp trên mạng hay Internet, chương trình RealPlayer
và QuickTime là lựa chọn tốt nhất cho việc sử dụng video streaming, nó hỗ trợ xử
lý chất lượng cho video và audio Chúng có thể làm việc với hầu hết các phiên bản của trình duyệt Internet Explorer và Netscape, đồng thời có thể hiển thị hầu hết các định dạng video Windows Media Player là một trình hiển thị audio và video tốt nhưng nó chỉ hỗ trợ cho các định dạng audio, video của windows
Để có thể sử dụng video trên các đường mạng tốc độ thấp chúng ta phải sử dụng các định chuẩn video phù hợp với yêu cầu tốc độ Hiện nay các ứng dụng trên
Trang 39hình ảnh không cao, kích thước khuôn hình nhỏ và sử dụng các mã nén tối ưu để có thể phát hành trên mạng Internet cũng như mạng tốc độ thấp dễ dàng Hiện nay, các định chuẩn sau được dùng nhiều cho việc phát hành video trên mạng: WMA, WAX, WMV, WVX, RM, AVI…
Trang 40CHƯƠNG 3 MÔ HÌNH CƠ SỞ DỮ LIỆU VIDEO
3.1 Tổng quan
Cùng với sự phát triển của máy tính, video số ngày càng trở nên phổ biến hơn trong nhiều lĩnh vực của cuộc sống như truyền thông, giáo dục, đào tạo, giải trí và xuất bản
Với sự gia tăng số lượng thông tin video khổng lồ, sẽ không thể mã hoá được hết nếu không có sự quản lý mang tính hệ thống của dữ liệu video Xuất phát từ một yêu cầu thực tế dẫn đến việc máy tính hoá các hệ thống quản trị cơ sở dữ liệu dạng
số và văn bản, được gọi là hệ quản trị cơ sở dữ liệu (database managerment system) truyền thống Các hệ quản trị CSDL truyền thống được thiết kế để quản lý kiểu dữ liệu có cấu trúc đơn giản, nhưng không phải là dữ liệu video Vì dữ liệu video là kiểu dữ liệu có cấu trúc phức tạp và nó đòi hỏi các phương pháp mới để mô hình hoá, sắp xếp, chèn và tính toán dữ liệu, do đó việc thiết kế CSDL, giao diện người
sử dụng và việc duyệt dữ liệu video là quan trọng hơn nhiều so với trong hệ quản trị CSDL truyền thống
Mô hình Video
Dữ liệu video
Dữ liệu video thô
Cấu trúc và danh mục dữ liệu video
Người dùng
Video Authoring
GUI Video Input
Video player
Các phân đoạn video Họat cảnh video Xử lý truy vấn
Danh mục video