Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 20 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
20
Dung lượng
459,74 KB
Nội dung
1
BỘ GIÁO DỤC VÀ ĐÀO TẠO TẬP ĐOÀN BƯU CHÍNH VIỄN THÔNG VIỆT NAM
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
TRẦN VƯƠNG NGUYÊN
ÁP DỤNGMỘTSỐKỸTHUẬTNÉNẢNHCHO
TRUYỀN DỮLIỆUẢNHĐỘNGQUAMẠNG
MÃ SỐ: 60.48.15
Người hướng dẫn khoa học: PGS.TS Ngô Quốc Tạo
TÓM TẮT LUẬN VĂN THẠC SĨ KỸTHUẬT
HÀ NỘI - 2011
2
MỞ ĐẦU
Trong thời đại phát triển ứng dụng công nghệ thông tin hiện nay,
việc truyền các hình ảnhđộngquamạng ngày càng có nhiều ứng
dụng. Khi chúng ta trò truyện với một người bạn qua mạng, chúng ta
có thể nhìn thấy người bạn đó, khi chúng ta tham gia một cuộc họp
trực tuyến, chúng ta có thể nhìn thấy những thành viên khác của cuộc
họp, các bác sĩ có thể tham gia theo dõi và chỉ đạo một ca mổ quan
trọng mà không có điều kiện có mặt trực tiếp – bất chấp khoảng cách
về mặt địa lý. Với sự phát triển của Internet, ngành công nghiệp
truyền hình có thêm một phương tiện nữa để có thể truyền tải nội
dung tới người xem. Tất cả những điều này đều dựa trên cơ sởtruyền
dữ liệuảnh động.
Một trong những yếu tố quan trọng trong truyền các hình ảnh
chuyển độngđộng là vấn đề đường truyền. Nguyên do là khi truyền
các hình ảnh động, chúng ta phải truyền liên tục hết khung hình này
đến khung hình khác với tốc độ rất cao để đảm bảo hình ảnh liên tục.
Để giải quyết vấn đề này, giải pháp đơn giản và ít tốn kém nhất là
thực hiện nén hình ảnh trước khi truyền.
3
Chương 1
TỔNG QUAN VỀ CÁC ĐỊNH DẠNG ẢNH PHỔ BIẾN
1.1 ĐỊNH DẠNG ẢNH BMP
1.1.1 Giới thiệu và lịch sử phát triển
Định dạng tập tin BMP, còn được biết đến với tên gọi tập tin ảnh
Bitmap hoặc định dạng tập tin Bitmap độc lập với thiết bị (DIB), là
một định dạng tập tin ảnh đồ họa Raster được dùng để lưu trữ các
hình ảnh số, độc lập với thiết bị hiển thị.
1.1.2 Cấu trúc tập tin
1.1.1.1 Cấu trúc chung
Tập tin ảnh bitmap bao gồm phần tiêu đề là một cấu trúc có kích
thước cố định miêu tả các đặc điểm của tập tin ảnh. Các phiên bản
BMP khác nhau có thể có phần tiêu đề này khác nhau.
1.1.1.2 Lưu DIB trong bộ nhớ
Một tập tin ảnh Bitmap khi nạp vào bộ nhớ sẽ trở thành một cấu
trúc dữliệu DIB - một thành phần quan trọng của Windows GDI
API. Các cấu trúc dữliệu DIB trong bộ nhớ gần như giống với định
dạng tập tin BMP, nhưng nó không chứa 14 byte Tiêu đề tập tin
bitmap và bắt đầu với các Tiêu đề DIB.
1.1.1.3 Tiêu đề tập tin bitmap
Các byte này là phần bắt đầu của tập tin và được sử dụng để xác
định các tập tin. Một ứng dụng sẽ đọc phần bắt đầu này để đảm bảo
rằng tập tin thực sự là một tập tin BMP và không bị lỗi. Hai byte đầu
tiên của định dạng tập tin BMP là ký tự ‘B’, sau đó là ký tự ‘M’
trong bảng mã 1-byte ASCII.
4
1.1.1.4 Tiêu đề DIB (Tiêu đề Thông tin bitmap)
Các byte này báo cho các ứng dụng thông tin chi tiết về hình ảnh
sẽ được sử dụng để hiển thị trên màn hình.
1.1.1.5 Bảng màu
Bảng màu (còn gọi là Palette) lưu trữ trong tập tin ảnh BMP ngay
sau Tiêu đề tập tin BMP và DIB (và có thể sau ba mặt nạ màu R, G,
B nếu sử dụng tùy chọn BI_BITFIELDS trong
BITMAPINFOHEADER). Vì vậy, vị trí của nó là kích thước của
BITMAPFILEHEADER cộng với kích thước của tiêu đề DIB (cộng
thêm 12 byte cho ba mặt nạ bit).
Số lượng các mục trong bảng màu là 2
n
hoặc là mộtsố nhỏ hơn được
quy định trong phần Tiêu đề. Thông thường, mỗi mục trong bảng
màu cần 4 byte theo thứ tự B, G, R, 0x00.
1.1.1.6 Lưu trữ Pixel
Các bit được dùng để thể hiện các Pixel được đóng gói thành các
hàng. Kích thước của mỗi hàng là một bội số của 4 byte. Khi hình
ảnh có chiều cao lớn hơn 1 (Pixel), sẽ có nhiều hàng được lưu trữ
liên tục tạo thành mảng Pixel.
Tổng số byte cần thiết để lưu trữ mộtmảng Pixel trong một hình
ảnh có Số Bit mỗi Pixel (bpp) là n, với 2
n
màu, có thể được tính dựa
trên sự làm tròn lên kích thước của mỗi hàng là một bội số của 4
byte.
1.1.1.7 Mảng Pixel (dữ liệu bitmap)
Mảng Pixel là một khối các DWORD 32 bit mô tả các điểm ảnh
trong hình ảnh. Thông thường các pixel được lưu trữ theo thứ tự quét
từ góc dưới bên trái, đi từ trái sang phải và từ dưới lên trên. Ban đầu,
độ sâu của màu là 1, 4, 8, và 24 bpp, tuy nhiên hiện nay cho phép các
định đạng với 1, 2, 4, 8, 16, 24, và 32 bpp.
5
Nếu một bitmap 24 bit màu có độ rộng là 1, sẽ cần 3 byte dữliệu
cho mỗi hàng (R, G, B) và 1 byte đệm. Nếu độ rộng là 2 sẽ có 2 byte
đệm, nếu là 3 sẽ có 3 byte đệm, và nếu là 4 thì không cần byte đệm.
1.1.1.8 Định dạng Pixel
Khi tập tin hình ảnh bitmap được lưu trên đĩa hoặc bộ nhớ, các
điểm ảnh có thể được định nghĩa bằng mộtsố bit (1bit, 2bit, 4bit,
16bit, 24bit, 32bit).
1.1.3 Ứng dụng
Sự đơn giản của định dạng BMP, cùng với sự phổ biến của hệ
điều hành Windows, cộng thêm với việc miễn phí bản quyền, cũng
như thực tế cho thấy nó rất hiệu quả trong việc sao chụp các tài liệu,
làm cho nó trở nên phổ biến và hầu hết các chương trình xử lý ảnh
đều có thể làm việc với BMP.
1.2 ĐỊNH DẠNG ẢNH PNG
1.2.1 Giới thiệu và lịch sử phát triển
Portable Network Graphics (PNG) là một phương thức mã hóa
định dạng hình ảnh sử dụngthuật toán nén không mất dữ liệu. PNG
được tạo ra để cải tiến và thay thế định dạng GIF (Graphics
Interchange Format) và là một định dạng tập tin hình ảnh không yêu
cầu bản quyền.
PNG hỗ trợ hình ảnh dựa trên bảng màu (24 bit RGB hoặc 32 bit
RGBA), ảnh xám (có hoặc không có kênh alpha), và ảnh RGB (có
hoặc không có kênh alpha).
1.2.2 Cấu trúc tập tin
1.2.2.1 Tiêu đề tập tin
Mỗi tập tin PNG được khởi đầu bằng 8 byte ký hiệu, mang các
giá trị theo hệ Hexa là 89 50 4E 47 0D 0A 1A 0A (hệ Decimal là
137 80 78 71 13 10 26 10)
6
1.2.2.2 Các khối trong tập tin
Ngay sau phần tiêu đề tập tin là đến một loạt các khối, mỗi khối
này chứa mộtsố thông tin về hình ảnh. Mỗi khối sẽ xác định đó là
quan trọng hay phụ trợ, và khi chương trình xử lý gặp một khối phụ
trợ thì có thể bỏ qua nó. Các khối được lưu trữ dựa trên cơ sở lớp cấu
trúc, được thiết kế cho phép định dạng tập tin PNG có thể mở rộng
trong khi vẫn duy trì khả năng tương thích với các phiên bản cũ.
Một khối bao gồm: mô tả chiều dài (4 byte), loại hoặc tên khối (4
byte), dữliệu chính (một chuỗi byte), và mã kiểm tra CRC (4 byte).
Phần loại hoặc tên khối chứa 4 byte tương đương 4 ký tự chữ cái
trong bảng mã ASCII. Các chữ cái này sẽ cung cấp thông tin về bản
chất của khối.
1.2.2.3 Độ sâu của màu
Hình ảnh PNG có thể sử dụng bảng màu lập chỉ mục hoặc được
tạo thành từ một hoặc nhiều kênh (số các giá trị trực tiếp đại diện cho
số lượng các điểm ảnh). Khi có nhiều hơn một kênh trong một hình
ảnh tất cả các kênh sẽ có cùng mộtsố bit được phân bổ cho mỗi điểm
ảnh (được gọi là độ sâu bit của kênh).
1.2.2.4 Độ trong suốt của hình ảnh
PNG cung cấp các lựa chọn trong suốt. Với hình ảnh màu thực và
màu xám, giá trị mỗi điểm ảnh có thể được xác định là trong suốt
hoặc một kênh alpha có thể được thêm vào (cho phép bất kỳ tỷ lệ
phần trăm của độ trong suốt được sử dụng).
1.2.3 Ứng dụng
PNG được sử dụng rộng rãi trên mạng internet do nó hỗ trợ tính
trong suốt, và nó sử dụngmộtthuật toán nén không mất dữ liệu.
7
1.3 ĐỊNH DẠNG ẢNH JPG
1.3.1 Giới thiệu và lịch sử phát triển
JPEG là một phương pháp nén mất dữliệu thường được sử dụng
cho nhiếp ảnhkỹthuật số. Mức độ nén có thể được điều chỉnh, cho
phép lựa chọn một sự cân bằng giữa kích thước lưu trữ và chất lượng
hình ảnh. Thông thường ở tỷ lệ nén 10:01, JPEG có chất lượng hình
ảnh có thể mang lại cảm nhận gần như không khác so với ảnh gốc.
1.3.2 Cấu trúc tập tin
1.3.2.1 Phần mở rộng tên tập tin JPEG
Phần mở rộng tên tập tin phổ biến nhất cho các tập tin sử dụng
phương pháp nén JPEG là jpg, jpeg, mặc dù jpe, jfif và jif cũng được
sử dụng.
1.3.2.2 Hồ sơ màu
Nhiều tập tin JPEG nhúng một hồ sơ màu ICC (không gian màu).
Các hồ sơ màu thường được sử dụng bao gồm sRGB và Adobe RGB.
1.3.2.3 Cú pháp và cấu trúc
Một hình ảnh JPEG bao gồm một chuỗi các đoạn, bắt đầu với một
ký hiệu đánh dấu, mỗi ký hiệu đánh dấu đó bắt đầu với một byte
0xFF theo sau bởi một byte chỉ ra loại của ký hiệu.
1.3.3 Ứng dụng
Các thuật toán nén JPEG là tốt nhất trên các bức ảnh và các bức
tranh của những cảnh thực tế với các biến thể hình ảnh và màu sắc
mịn. Đối với việc sử dụng web, nơi dữliệu dạng hình ảnh là quan
trọng, JPEG là rất phổ biến. JPEG / Exif cũng là định dạng phổ biến
nhất được sử dụng bởi máy ảnhkỹthuật số.
8
1.4 KẾT LUẬN CHƯƠNG
Chương 1 trình bày về cấu trúc các định dạng ảnh phổ biến. việc nắm
vững cấu trúc các định dạng ảnhcho phép lựa chọn cách thức tốt
nhất để lưu trữ và xử lý các ảnh tùy theo từng trường hợp.
Chương 2
CÁC THUẬT TOÁN NÉNẢNH
2.1 THUẬT TOÁN NÉNDỮLIỆU HUFFMAN
2.1.1 Tổng quan
Mã hóa Huffman là mộtthuật toán mã hóa dữliệu ngẫu nhiên
được sử dụng để nén không mất dữ liệu. Thuật ngữ này đề cập đến
việc sử dụngmột bảng mã có chiều dài biến đổi để mã hóa mộtdữ
liệu nguồn (chẳng hạn như các ký tự trong một tập tin) mà bảng mã
chiều dài thay đổi đã được bắt nguồn một cách cụ thể dựa trên ước
tính xác suất xảy ra cho mỗi có thể giá trị của dữliệu nguồn. Nó
được phát triển bởi David A. Huffman trong khi ông là một nghiên
cứu sinh tại MIT, và công bố năm 1952 với tên "Một phương pháp
xây dựng mã hóa sốdư tối thiểu ".
2.1.2 Mã hóa dữliệu
2.1.2.1 Định nghĩa mộtsố vấn đề
Cho biết: Một tập hợp dữliệu và trọng số của chúng (thường là tỷ
lệ xác suất)
Cần tìm: Mã tiền tố nhị phân (một tập hợp các từ mã) với chiều
dài từ mã tối thiểu.
Đầu vào: Tập hợp ký tự alphabet với chiều dài n: A = {a
1
, a
2
, … ,
a
n
}
9
Đầu ra: Mã C (A, W) = {c
1
, c
2
, … , c
n
} là một tập hợp các từ mã
(nhị phân), trong đó c
i
là từ mã của a
i
, 1 ≤ i ≤ n
2.1.2.2 Mã hóa
Kỹ thuật này hoạt động bằng cách tạo ra một cây nhị phân của
các nút. Ở đây có thể được lưu trữ trong mộtmảng thông thường,
kích thước trong đó phụ thuộc vào số lượng dữliệu n. Một nút có thể
là một nút lá hoặc nút nội bộ. Ban đầu, tất cả các nút là nút lá, có
chứa các dữliệu riêng của mình là trọng số (tần số xuất hiện) của dữ
liệu, một liên kết đến một nút cha mẹ làm cho nó dễ dàng để đọc mã
(ngược lại) bắt đầu từ một nút lá . Các nút nội bộ có chứa trọng sốdữ
liệu, các liên kết đến hai nút con và liên kết đến một nút cha. Như
một quy ước chung, bit “0” đại diện cho nút con trái và bit “1” đại
diện cho nút con phải. Một cây hoàn thiện đã lên đến nút lá n và nút
nội bộ n - 1.
2.1.3 Giải mã dữliệu
Nói chung, quá trình giải mã đơn giản chỉ là một vấn đề của dịch
giá trị byte của dòng mã tiền tố, thường là bằng cách vượt qua các
nút của cây Huffman như là mỗi bit được đọc từ dòng đầu vào (đạt
đến một nút lá nhất thiết phải chấm dứt việc tìm kiếm giá trị byte cụ
thể).
2.2 THUẬT TOÁN NÉNẢNH JPEG
2.2.1 Tổng quan
Các phương pháp nén JPEG thường tổn hao, có nghĩa là mộtsố
thông tin hình ảnh ban đầu là bị mất và không thể phục hồi, có thể
ảnh hưởng đến chất lượng hình ảnh.
10
2.2.2 Mã hóa JPEG
Mặc dùmột tập tin JPEG có thể được mã hóa trong nhiều cách
khác nhau, phổ biến nhất được thực hiện với mã hóa JFIF. Quá trình
mã hóa bao gồm các bước:
1. Các đại diện của các màu sắc trong hình ảnh được chuyển đổi
từ RGB sang YCbCr, bao gồm một thành phần luma (Y), đại diện
cho độ sáng, và hai thành phần sắc độ (Cb và Cr), đại diện cho
màu.
2. Giảm độ phân giải của dữ liệu, thường là một hệ số 2. Điều này
phản ánh thực tế là mắt ít nhạy cảm với các chi tiết màu sắc tốt
hơn các chi tiết độ sáng tốt.
3. Hình ảnh được chia thành các khối điểm ảnh 8 × 8, và với mỗi
khối, mỗi dữliệu Y, Cb, và Cr trải quamột biến đổi cosin rời rạc
(DCT).
4. Biên độ của các thành phần tần số được lượng tử hóa.
5. Các dữliệu kết quảcho tất cả các khối 8 × 8 nén với mộtthuật
toán không mất dữ liệu, một biến thể của mã hóa Huffman.
Quá trình giải mã đảo ngược các bước này, ngoại trừ lượng tử bởi vì
nó là không thể đảo ngược.
2.2.2.1 Mã hóa
Nhiều tùy chọn trong tiêu chuẩn JPEG không được sử dụng phổ
biến, trong khi những thứ khác quy định cụ thể các phương pháp mã
hóa. Đây là một mô tả ngắn gọn của một trong các phương pháp mã
hóa phổ biến khi ápdụngchomột đầu vào có 24 bit cho mỗi pixel.
2.2.2.2 Không gian biến đối màu
Thứ nhất, hình ảnh được chuyển đổi từ RGB thành một không
gian màu khác nhau gọi là YCbCr. Nó có ba thành phần Y, Cb và Cr:
Y: thành phần đại diện cho độ sáng của điểm ảnh, và các thành phần
[...]... chọn và phối hợp các phương pháp nén khác nhau sao cho đảm bảo dữliệu cần truyền là nhỏ nhất Chương 3 XÂY DỰNG ỨNG DỤNGTRUYỀNẢNHQUAMẠNG SỬ DỤNGTHUẬT TOÁN NÉNẢNH CHUYỂN ĐỘNG 3.1TỔNG QUAN Ứng dụngtruyền hình ảnhquamạng có sử dụngthuật toán nénảnh chuyển động được chia thành 2 ứng dụng nhỏ như sau: Ứng dụng 1: có nhiệm vụ thu các hình ảnh từ camera, chuyển đổi hình ảnh thành mảng byte, thực hiện... thu được giữa việc nénảnh bằng phương pháp nénảnh chuyển động và nénảnh bằng thuật toán JPEG, ta nhận thấy phương pháp nénảnh bằng thuật toán JPEG cho kết quả tốt hơn Tuy nhiên khi nénmộtảnh bằng thuật toán JPEG sẽ khiến ảnh bị mất mát dữliệu và làm giảm chất lượng ảnh, điều này sẽ không phù hợp với các ảnh cần giữ nguyên chất lượng Trong khi đó thuật toán nénảnh chuyển động đảm bảo giữ nguyên... hình ảnh, và có thể phối hợp với các thuật toán nén không mất dữliệu khác để nâng cao hiệu suất nén 20 KẾT LUẬN Truyền hình ảnh và hình ảnh chuyển độngquamạng là bài toán đã và đang thu hút được sự quan tâm của nhiều nhà phát triển phần mềm Trong khuôn khổ của luân văn, học viên đã nghiên cứu mộtsố định dạng ảnh phổ biến, mộtsố phương pháp nénảnh phổ biến, cũng như phương pháp nénảnh khi truyền. .. của các điểm ảnh, và nếu chúng nhỏ hơn một ngưỡng cho phép nào đó, thì ta coi như không có sự sai lệch nào cả, và bỏ quaảnh đó Hướng thứ hai là thay vì bỏ qua cả một hình ảnh, ta sẽ bỏ qua những điểm ảnh có sự sai biệt nhỏ hơn một ngưỡng cho phép nào đó 2.5KẾT LUẬN CHƯƠNG Chương 2 trình bày thuật toán nén không mất dữliệu Huffman và các thuật toán nén ảnh JPEG, Fractal, nénảnh chuyển động Từ các... đổi Tốc độ giải nénảnh nhanh: Thuật toán được trình bày là mộtthuật toán không đối xứng vì các tính toán trong việc nén ảnh đòi hỏi một lượng thời gian lớn hơn rất nhiều lần so với thời gian giải nén Tính độc lập về độ phân giải giữa ảnh nén và ảnh gốc: Thuật toán nén ảnh và giải nén bằng kỹ thuật Fractal về thực chất đã cung cấp một bộ tạo sinh để vẽ lại ảnh gốc dựa trên mộtsố cực nhỏ thông... chuỗi byte đã xử lý: Sử dụng TcpIP 3.2.2 Nhận dữliệu và phát hình ảnh Đối với ứng dụng Nhận dữliệu và phát hình ảnh ta cần quan tâm đến các vấn đề sau: Nhận dữ liệu: Là việc nhận mảng byte được truyền từ ứng dụng Thu hình ảnh Xử lý chuỗi byte thu được: Sau khi thu được chuỗi byte, ứng dụng Nhận dữliệu cần giải nén chuỗi byte, tiếp theo sử dụng phép toán XOR với chuỗi dữliệu thu được ở lần trước... mới truyền hình ảnh đi Nhược điểm của cách tiếp cận này là các hình ảnhtruyền đi không liên tục, do những ảnh mà có sự sai khác không đủ lớn sẽ không được truyền đi, và trong mộtsố trường hợp đặc biệt có thể gây ra sự thiếu hụt dữliệu Ta sẽ truyền đi toàn bộ các ảnh liên tục, dùcho mức độ khác biệt của chúng là thế nào Tuy nhiên, thay vì truyền đi toàn bộ dữliệu hình ảnh, ta chỉ truyền đi dữ liệu. .. lý với các mảng byte này và truyền sang ứng dụngsố 2 Ứng dụng 2: có nhiệm vụ nhận các mảng byte từ ứng dụng 1, thực hiện giải mã các dữliệu thu được, và hiển thị trên màn hình 3.2XÂY DỰNG ỨNG DỤNG 3.2.1 Thu hình ảnh và gửi dữliệu Đối với ứng dụng thu hình ảnh và gửi dữ liệu, ta cần quan tâm đến các vấn đề sau: Thu hình ảnh từ camera: Điều này được thực hiện bằng cách xử dụng bộ thư viện Direct X Cứ... nénảnh khi truyềnquamạng dựa trên phát hiện sự khác biệt giữa các hình ảnh liên tiếp Các nội dung nghiên cứu chính bao gồm: - Các định dạng ảnh phổ biến: Nhằm nắm được cấu trúc của các định dạng ảnh cơ bản - Các phương pháp nénảnh phổ biến: Nhằm nắm được các phương pháp mã hóa ảnh cơ bản - Phương pháp nénảnh khi truyềnquamạng dựa trên việc tính toán các sai lệch giữa các hình ảnh liên tiếp: Nhằm... vào một thư viện domain gọi là domain pool Trước khi mã hóa, tất cả các domain trong thư viện domain được phân loại Điều này tránh sự phân loại lại của các domain 2.3.5 Kết luận Dựa vào lý thuyết và các kiểm nhiệm thực tế, phương pháp nénảnh này cho thấy: Tỉ sốnén cao: Điểm nổi bật nhất mà thuật toán nén và giải nén bằng kỹthuật Fractal cung cấp được là tỉ sốnén cực cao với chất lượng ảnhnén . CHÍNH VIỄN THÔNG
TRẦN VƯƠNG NGUYÊN
ÁP DỤNG MỘT SỐ KỸ THUẬT NÉN ẢNH CHO
TRUYỀN DỮ LIỆU ẢNH ĐỘNG QUA MẠNG
MÃ SỐ: 60.48.15
Người hướng dẫn khoa học:. phương pháp nén
khác nhau sao cho đảm bảo dữ liệu cần truyền là nhỏ nhất.
Chương 3
XÂY DỰNG ỨNG DỤNG TRUYỀN ẢNH QUA MẠNG SỬ
DỤNG THUẬT TOÁN NÉN ẢNH CHUYỂN