v. Dịch vụ SLIDE (SLS: Slide Show Service)
2.2. Chuyển đổi tín hiệu analog sang dữ liệu số và các tiêu chuẩn nén trong T-
2.2.1. Chuyển đổi tín hiệu sang dữ liệu số
i. Chuyển đổi tín hiệu audio sang dữ liệu số
Để chuyển đổi m t tín hiệu tương tự sang tín hiệu số cần trải qua ba bước: Lấy mẫu, lượng tử hóa và mã hóa.
SVTH: NGUYỄN MINH TUẤN 21 Lấy mẫu:
Đây là quá trình chuyển đổi tín hiệu analog thành dãy xung điều biên (VPAM). Chu kỳ của dãy xung lấy mẫu (Tm) được xác định theo định lý lấy mẫu của Nyquist:
Tm ≤
Trong đó fmax là tần số lớn nhất của tín hiệu analog.
Hình 2.9: Lấy mẫu tín hiệu analog
Dịch vụ âm thanh trong DMB có thể hỗ trợ chuẩn âm thanh nổi lấy mẫu ở tốc đ 11,025Khz; 22,05 Khz; 44,1Khz, hoặc 48Khz. Tốc đ bit tối đa cho dữ liệu âm thanh nổi có thể lên đến 128 Kbps.
Lƣợng tử hóa:
Là quá trình làm tròn biên đ xung lấy mẫu tới mức lượng tử gần nhất. Có nghĩa là gán cho xung lấy mẫu m t số nguyên phù hợp. Mục đích của lượng tử hóa là để mã hóa giá trị mỗi xung lấy mẫu thành m t từ mã có số lượng bit ít nhất.
Mã hóa:
Chức năng của mã hóa là chuyển đổi biên đ xung lượng tử thành m t từ mã gồm m t số bit nhất định. Bằng cách mã hóa, cuối cùng các dữ liệu âm thanh số cũng được tạo ra từ các tín hiệu âm thanh điện.
SVTH: NGUYỄN MINH TUẤN 22
Hình 2.10: Lượng tử hóa và mã hóa tín hiệu
ii. Chuyển đổi từ ảnh tĩnh sang dữ liệu số
Chúng ta gọi những bức ảnh hay những bức hình là ảnh tĩnh. Hình ảnh này có thể đại diện cho các dữ liệu kỹ thuật số với nhiều dạng khác nhau. Đại diện đơn giản đầu tiên đó là ảnh đen trắng. Và chúng ta xem bức ảnh được tạo thành từ nhiều dấu chấm nhỏ, mỗi dấu chấm nhỏ được goi là m t Pixel (viết tắt của phần tử ảnh). Mỗi dấu chấm này được mã hóa bằng 8 bit dữ liệu. 8 bit dữ liệu này cho thấy đ sáng của mỗi dấu chấm khi ở khoảng giữa đen và trắng được chia thành 256 khoảng.
Đối với ảnh màu, mỗi điểm ảnh được mã hóa bằng 24 bit với 8 bit cho Red, 8 bit cho Green và 8 bit cho Blue. Chúng ta gọi dữ liệu đồ họa này là RGB data. Dữ liệu ảnh đại diện bởi RGB data không sử dụng nén để có dữ liệu chất lượng lớn.
Do đó trong m t số trường hợp, nó đại diện cho dữ liệu số ảnh tĩnh bằng cách nén RGB data với nhiều cách khác nhau. Ngày nay JPEG (Joint Photographic Expert Ground) là m t trong những phương pháp nén ảnh hiệu quả được sử dụng r ng rãi trong Camera kỹ thuật số.
Kích thước dữ liệu của m t bức ảnh được tính như sau: (Số điểm ảnh chiều dài X số điểm ảnh chiều r ng) X 24 bit.
Ví dụ m t bức ảnh có kích thước là 640 X 480 Pixel (307.200 Pixel) thì có kích thước dữ liệu là 640 X 480 X 24 bit = 7.372.800 bit = 921.600 Bytes = 921,6 Kb.
JPEG có tỷ lệ nén ảnh tới vài chục lần. Tuy nhiên ảnh sau khi giải nén sẽ khác với ảnh ban đầu. Chất lượng ảnh bị suy giảm sau khi giải nén. Sự suy giảm này tăng dần theo hệ số nén. Tuy nhiên sự mất mát thông tin này là có thể chấp nhận được và việc loại bỏ những thông tin không cần thiết được dựa trên những nghiên cứu về hệ nhãn thị của mắt người.
SVTH: NGUYỄN MINH TUẤN 23 iii. Chuyển đổi từ video sang dữ liệu số
Video là m t dạng trình chiếu liên tục những bức ảnh. Do sự chuyển tiếp giữa các bức ảnh là rất nhanh nên mắt và não chúng ta không thể nhận thấy được sự chuyển tiếp đó khi xem m t video. Thông thường thì TV và các video DMB thay đổi liên tiếp 30 khung hình sau mỗi giây. Do đó, chúng ta gọi số khung hình thay đổi trong m t giây là Frame rate và có đơn vị là fps (khung hình trên giây). Đối với video DMB thì Frame rate là 30, có nghĩa là tốc đ khung hình là 30 fps.
Tốc đ bit (Bit rate) là số lượng bit cho mỗi giây để hiển thị video. Ví dụ m t video có Frame rate là 30 fps và mỗi khung hình là m t ảnh màu (RGB image) có đ phân giải là 640 X 480 Pixel như ví dụ ở mục ii của phần trên, thì tốc đ bit của video đó là:
Video bit rate = 7.372.800 bit/frame X 30 frame/sec = 221.184.000 bit/sec = 221.184.000 bps
Chúng ta đã biết tính toán dung lượng của dữ liệu, và như thế nào là lớn đối với việc lưu trữ và truyền dẫn với băng thông và đường truyền của chúng ta. Do đó chúng ta cần đến công nghệ nén video trước khi truyền dẫn. Sao cho có thể hiển thị được các Video có dung lượng thấp nhưng vẫn đảm bảo chất lượng hình ảnh. DMB, HDTV, DVD đều sử dụng công nghệ nén giống với MPEG.
Để tạo ra các tiêu chuẩn nén như vậy, thì ISO (International Organization for Standardization-tổ chức tiêu chuẩn quốc tế) đã phát triển chuẩn MPEG, và ITU (International Telecommunications Union-Liên minh viễn thông quốc tế) đã phát triển chuẩn H.264 từ năm 1980. Ngày nay H.264 (MPEG-4 Part 10/AVC) được sử dụng trong nhiều ứng dụng của DMB broadcasting.
2.2.2. Các tiêu chuẩn nén trong T_DMB
Như đã nói ở phần trên, trong truyền dẫn T-DMB chúng ta cần đến công nghệ nén để giảm kích thước tập tin truyền dẫn bằng cách mã hóa lại các tập tin để loại bỏ các thông tin dư thừa trước khi truyền đi. Sau khi nén kích thước của tập tin giảm đi nhiều nhưng vẫn đảm bảo chất lượng.
Hiện nay trên thế giới có nhiều chuẩn nén đã ra đời và dần được cải tiến về công nghệ nén với các thuật toán và phương thức xử lý ngày càng phức tạp hơn. Nhờ đó mà kích thước tập tin sau khi nén được giảm nhiều hơn so với các chuẩn nén trước, nhưng chất lượng lại tốt hơn.
Trong T-DMB chuẩn nén được áp dụng chủ yếu đối với dữ liệu âm thanh và hình ảnh.
i. Tiêu chuẩn nén ảnh tĩnh JPEG
Có nhiều phương pháp nén ảnh, nhưng đều dựa trên nguyên tắc tìm ra các “phần tử thừa” trong dữ liệu và mã hóa chúng theo nhiều mức đ khác nhau.
SVTH: NGUYỄN MINH TUẤN 24
Công nghệ JPEG - viết tắt của Joint Photographic Experts Group (Hiệp h i nhiếp ảnh nhà nghề) là m t công nghệ nén ảnh tương đối hiệu quả có thể làm việc với các ảnh kích cỡ lớn, nhiều màu.
Kỹ thuật này có thể đạt được hệ số nén hơn 80 lần so với ảnh gốc. Tuy nhiên, hệ số nén càng cao thì hình ảnh sau khi giải nén sẽ càng bị sai lệch nhiều hơn, nó chỉ gần giống như ban đầu chứ không đạt hoàn toàn như hình ảnh gốc. Dù sao thì với mắt thường rất khó nhận ra điều khác biệt.
Nguyên lý của phương pháp nén JPEG là: Cắt hình ảnh thành từng khối nhỏ, phân tích tất cả các dữ liệu về màu sắc, đ sáng mà các khối đó chứa bằng các phương trình ma trận. Ảnh màu trong không gian RGB (Red, Green, Blue) được chuyển đổi qua hệ YUV. Trong khi thị giác của con người lại rất nhạy cảm với hệ Y, ít nhạy cảm hơn nhiều với hệ U, V. Hệ thống sẽ nén thành phần Y của ảnh ở mức đ ít hơn nhiều so với U và V. Kế tiếp là dùng biến đổi Cosin rời rạc, sau nữa là mã hóa theo phương pháp Hoffman. Khi giải nén ảnh, các bước thực thi sẽ làm ngược lại quá trình nói trên.
ii. Tiêu chuẩn nén âm thanh số và video số
Hiệp h i viễn thông quốc tế (ITU) và tổ chức tiêu chuẩn quốc tế/Uỷ ban kỹ thuật điện tử quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêu chuẩn mã hoá video. Các tiêu chuẩn mã hoá Video theo khuyến nghị của ITU-T gọi tắt là chuẩn H.26x (H.261, H.262, H.263 và H.264). Đối với ISO/IEC thì phát triển các chuẩn nén MPEG-x (MPEG-1, MPEG-2, MPEG-4 và MPEG-7).
Những khuyến nghị của ITU được thiết kế dành cho các ứng dụng truyền thông video thời gian thực như Video Conferencing hay điện thoại truyền hình. Mặt khác, những tiêu chuẩn MPEG được thiết kế hướng tới mục tiêu lưu trữ video chẳng hạn như trên đĩa quang DVD, quảng bá video số trên mạng cáp, đường truyền số DSL, truyền hình vệ tinh hay những ứng dụng truyền dòng video trên mạng internet hoặc thông qua mạng không dây (wireless).
Khác với tiêu chuẩn nén ảnh tĩnh JPEG. Các tiêu chuẩn của MPEG – viết tắt của Motion Picture Experts Group (Hiệp h i các chuyên gia điện ảnh) cung cấp các tiêu chuẩn nén và giải nén âm thanh số, video số hoặc ảnh đ ng. MPEG series bao gồm 4 loại tiêu chuẩn, đó là MPEG 1, MPEG 2, MPEG 4 và MPEG 7.
MPEG 1 là m t tiêu chuẩn nén được sử dụng cho lưu trữ kỹ thuật số, như là máy MP3, CD-I (Compact Disc–Interactive, CD tương tác) và công nghệ VCD (Video-CD). Nó nén tối đa lên đến 1/300 với tốc đ bit tối đa là 1.5Mbps và cung cấp hình ảnh giống như VHS (Video Home System). Tuy nhiên ngày nay yêu cầu cao hơn về tốc đ truyền dữ liệu, đ phân giải cao và đ nét cao. Do đó việc sử dụng MPEG 1 giảm nhiều so với MPEG 2 hoặc MPEG 4.
SVTH: NGUYỄN MINH TUẤN 25
Hình 2.11: Băng VHS
Lợi thế của MPEG 1 là nó đã được chuẩn hóa và đã được sử dụng trong m t thời gian dài, và nó có thể chạy mà không có bất kỳ m t vấn đề nào mặc dù không cài bất cứ phần mềm nào trên máy tính thông thường. Nhưng điểm bất lợi của nó là nó không phù hợp cho các đại diện của hình ảnh có đ phân giải cao và đ nét cao, và nó không hỗ trợ phụ đề đa ngôn ngữ và bảo vệ sao chép như DVD.
MPEG 2 được sử dụng như là m t tiêu chuẩn của DVD (Digital Versatile/Video Disc) và phát sóng truyền hình kỹ thuật số. Nó đã được chuẩn hóa vào năm 1994 để bổ sung cho những yếu điểm của MPEG 1. Nó có tốc đ bit tối đa là 10Mbps và cung cấp đ phân giải và đ nét cao hơn MPEG 1. Và dần dần, hiện nay đĩa DVD đã thay thế băng VHS.
MPEG 2 cung cấp hình ảnh có đ nét cao và âm thanh đạt chất lượng CD, do đó nó được ứng dụng như là thế hệ lưu trữ tiếp theo. Chuẩn nén này còn hỗ trợ phụ đề đa ngôn ngữ và bảo vệ chống coppy. Tuy nhiên, điều đó cũng đồng nghĩa là có nhiều dữ liệu cho mỗi giây, do đó cần chia sẻ tài nguyên CPU và b nhớ nhiều hơn so với MPEG 1. Vì vậy mà nó cũng cần nhiều chi phí cho sản xuất nên giá thành thiết bị DVD cũng cao.
MPEG 4 được thiết lập năm 1998 để mã hóa đa dữ liệu cho thông tin liên lạc thời gian thực, phát truyền hình, web, phim bởi các thành phần đ c lập và linh hoạt. MPGE 4 có tỉ lệ nén tốt hơn MPEG 1 và 2, do đó nó được sử dụng r ng rãi trong mạng thông tin có tốc đ thấp hơn 128Mbps cho đến mạng thông tin liên lạc tốc đ cao. Cũng vì vậy mà chuẩn nén này được sử dụng nhiều trong phát quảng bá internet, cho dịch vụ video thời gian thực (ASF, WMV, RM, MOV), dịch vụ video thời gian thực có kèm theo thông điệp, dịch vụ hình ảnh kèm tiếng nói trong thông tin di đ ng giống như điện thoại. Và chuẩn nén này còn được sử dụng cho nén video trong công nghệ T-DMB.
SVTH: NGUYỄN MINH TUẤN 26
MPEG 4 được coi là m t cu c cách mạng mới trong media số. Nó là chuẩn multimedia toàn cầu thế hệ kế tiếp. Nó được thiết kế để truyền tải video với chất lượng DVD (MPEG-2) qua mạng.
MPEG 7 được đưa vào phát triển năm 2001, nó là m t chuẩn trong họ MPEG nhưng tách biệt với các tiêu chuẩn MPEG 1,2,và 4. MPEG 7 không dùng để mã hóa các dữ liệu đa phương tiên để lưu trữ hay truyền tải. Tiêu chuẩn này chưa được chuẩn hóa hoàn toàn, nhưng nó đang được tiếp tục nghiên cứu. Nó được gọi là giao diện mô tả n i dung đa phương tiện (Multimedia content description interface). Chuẩn này giúp chúng ta có thể tương tác với dữ liệu đa phương tiên thông qua n i dung của dữ liệu mà ta muốn tương tác.
Nhờ vào MPEG 7 mà chúng ta có thể thược hiện được m t số ứng dụng như sau:
- Khi chúng ta muốn tìm kiếm m t bài hát mà chúng ta không biết bất kỳ m t thông tin gì như tên bài hát, ca sỹ trình bày, nhạc sỹ sáng tác… mà chỉ nhớ m t đoạn giai điệu của bài hát đó. Nhưng ta có thể tìm được bài hát đó trong m t kho dữ liệu khổng lồ bằng cách hát lên giai điệu đó thông qua m t hệ thống recorder (Ghi âm). Âm thanh của chúng ta sau đó được lấy mẫu và trích các đặc trưng và sau đó hệ thống sẽ so sánh các đặc trưng đó với kho dữ liệu và cho chúng ta những kết quả thích hợp nhất.
- Chúng ta có thể tìm được m t bức ảnh nào đó tương tự với m t bức ảnh có sẵn hoặc giống với m t bức ảnh do chúng ta tự vẽ ra. Hệ thống sẽ trích chọn những đặc trưng rồi sau đó so sánh với dữ liệu và trả kết quả thích hợp về cho chúng ta.
- Hoặc là khi chúng ta chỉ muốn xem m t số trích đoạn trong m t video dài hoặc m t b phim nào đó. Chúng ta chỉ cần gửi m t từ khóa tương ứng tới hệ thống. Ví dụ ta chỉ muốn xem các bàn thắng trong m t trận bóng đá thì chúng ta chỉ cần gửi từ khóa truy vấn là “Goal”.
Tiêu chuẩn công nghệ này đáp ứng nhu cầu cao về tốc đ và chất lượng tìm kiếm dữ liệu.
H.264 là chuẩn nén mở, được công bố chính thức vào năm 2003, là chuẩn hỗ trợ công nghệ nén tiên tiến và hiệu quả nhất hiện nay.H.264 (còn được gọi là chuẩn MPEG-4 Part 10/AVC for Advanced Video Coding hay MPEG-4 AVC) nó kế thừa những ưu điểm nổi tr i của những chuẩn nén trước đây. Đồng thời sử dụng những thuật toán nén và phương thức truyền hình ảnh mới phức tạp, phương pháp nén và truyền hình ảnh mà chuẩn H.264 sử dụng đã làm giảm đáng kể dữ liệu và băng thông truyền đi của video.
SVTH: NGUYỄN MINH TUẤN 27
Với cách nén và truyền thông tin bằng chuẩn H.264 làm giảm đến 50% băng thông và kích thước file dữ liệu lưu trữ so với cách nén MPEG-4 Part 2. và giảm tới hơn 80% băng thông và kích thước file dữ liệu lưu trữ so với nén bằng chuẩn Motion JPEG. Điều đó cho chúng ta thấy với cùng m t hệ thống nếu chúng ta sử dụng chuẩn nén mới chúng ta có thời gian lưu trữ gấp đôi và băng thông mạng giảm đi m t nửa, lợi ích mà chúng ta thấy ngay đó là chi phí cho lưu trữ dữ liệu video giảm m t nửa so với dùng hệ thống có chuẩn nén thông thường. Ngoài ra việc truyền hình ảnh chiếm băng thông giảm m t nửa, vì vậy chi phí dành cho thuê băng thông mạng cũng giảm đáng kể. Hoặc chúng ta có thể tăng chất lượng hình ảnh giám sát lên gấp đôi nhưng vẫn đảm bảo được băng thông và thời gian lưu trữ như trước đây.
iii. Tiêu chuẩn nén Audio trong T-DMB
Nén audio trong T-DMB được gọi là “MUSICAM”. Chúng ta sử dụng tiêu chuẩn nén MPEG-1 Audio Layer-2. MUSICAM hỗ trợ 4 dạng audio đó là Stereo, Joint Stereo, Dual Channel, Single Channel. Với nhiều chất lượng âm thanh và tốc đ bit khác nhau, nó cung cấp nhiều tốc đ bit khác nhau, thấp nhất từ 32 Kbps đến cao nhất là 384Kbps.
Hình 2.12 Cho ta thấy cấu trúc của MUSICAM Frame Header. Và đ dài của m t MUSICAM là 24ms (0.024s). B nhận T-DMB sẽ phân tích Frame header này để kiểm tra nhiều thông tin khác nhau của tốc đ bit âm thanh.
Hình 2.12: Cấu trúc của Audio Frame Header
iv. Tiêu chuẩn nén Video trong T-DMB
Video trong T-DMB được nén với tiêu chuẩn nén MPEG-4 Part 10/AVC (H.264). Công nghệ video H.264 có tỉ lệ nén cao, do đó mà nó đã được áp dụng cho các lĩnh vực truyền dẫn khác như là S-DMB (Satellite-DMB).