Tổng quan về định dạng file ảnh và phương pháp định dạng file ảnh

Để làm được điều đó máy tính hay máy in chia màn hình, trang giấy thành một mạng lưới chứa các ôvuông, sau đó sử dụng các giá trị chứa trong file ảnh để định ra mầu sắc, độ sáng tối củat

Trang 1

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

KHOA KỸ THUẬT ĐIỆN TỬ I

- -CÔNG NGHỆ PHÁT THANH TRUYỀN HÌNH SỐ

ĐỀ TÀI Tổng quan về định dạng file ảnh

và phương pháp chuyển đổi định dạng file ảnh

Giảng viên: Nguyễn Quốc Dinh

Nhóm 12: Nguyễn Trung Kiên

Ngô Tuấn Linh

Lã Hùng Anh

Trang 2

Hà Nội, 2015

Mục lục

Danh mục hình vẽ 4

Danh mục bảng biểu 5

Danh mục chữ viết tắt 5

Chương I Tổng quan về định dạng file ảnh 6

1.1 Khái niệm ảnh số 6

1.2 Pixel 6

1.3 Độ phân giải (dpi,ppi) 7

1.4 Lý thuyết màu 7

1.5 Độ sâu màu 8

1.6 Định dạng ảnh bitmap 8

1.5.1 Khái niệm 8

1.5.2 Đặc điểm 8

1.7 Định dạng ảnh vector 9

1.7.1 Khái niệm 9

1.7.2 Đặc điểm 9

1.7.3 So sánh ảnh bitmap với ảnh vector 11

Chương II Chuyển đổi định dạng file ảnh 12

2.1 Các kiểu ảnh trong matlab 12

2.1.1 Ảnh Index 12

2.1.2 Ảnh Grayscale 13

2.1.3 Ảnh nhị phân 13

2.1.4 Ảnh RGB 14

2.2 Các phép biến đổi ảnh số 15

2.2.1 Phép biển đổi Fourier 15

2.2.2 Biến đổi DCT 15

2.2.3 Biến đổi Radon 16

Trang 3

2.3.1 Định dạng ảnh GIF 17

2.3.2 Định dạng ảnh BMP 20

2.3.3 Định dạng ảnh JPEG 21

2.3.4 Định dạng ảnh TIF, TIFF 25

2.3.5 Định dạng ảnh PNG 26

2.4 So sánh tổng quan giữa các định dạng ảnh 30

2.5 Một số thuật toán chuyển đổi định dạng ảnh 31

2.5.1 Chuyển đổi định dạng từ ảnh bitmap sang bitmap 31

2.5.2 Chuyển đổi định dạng từ ảnh vector sang vector 33

2.5.3 Chuyển đổi định dạng từ ảnh vecto sang bitmap 33

2.5.4 Chuyển đổi định dạng từ ảnh bitmap sang vector 33

Chương III Mô phỏng kết quả trên matlab 35

3.1 Các hàm xử lý ảnh sử dụng matlab 35

3.1.1 Đọc và ghi dữ liệu ảnh 35

3.1.2 Chuyển đổi giữa các kiểu dữ liệu, kiểu ảnh 35

3.1.3 Các phép toán cơ bản đối với dữ liệu ảnh 36

3.1.4 Các hàm hiển thị trong matlab 36

3.1.5 Các phép biến đổi hình học 36

3.2 Mô phỏng kêt quả chuyển đổi giữa các định dạng ảnh bitmap 37

3.2.1 Guide và giao diện mô phỏng 37

3.2.2 Một số hàm sử dụng trong Guide 38

3.2.3 Mô phỏng chuyển đổi ảnh JPG sang PNG và TIF 38

3.2.4 Mô phỏng quá trình biến đổi DCT trong định dạng file JPEG 41

Trang 4

Lời mở đầu

Ngày này, với sự phát triển mạnh mẽ của ngành công nghiệp máy tính, các sản phẩm

đồ họa ngày càng nâng cao về chất lượng cũng như giảm dung lương lưu trữ, tiết kiệm bộnhớ cho hệ thống nói chung và trong truyền hình nói riêng Nhưng chất lượng hình ảnh

và dung lượng lưu trữ luôn tỉ lệ nghịch với nhau Với từng nhu cầu sử dụng mà ta có thể

sử dụng các loại định dạng đồ họa phù hợp Nếu dùng để lưu trữ thì các định dạng sửdụng nén không mất thông tin là sự lựa chọn số một, còn nếu muốn truyền tải trênInternet, hay lưu trữ trên web… thì các định dạng hỗ trợ nén mất thông tin nhưng vẫn giữđược chất lượng tốt như định dạng JPG là một lựa chọn phù hợp

Nội dung của đề tài bao gồm 3 chương:

Chương 1: Tổng quan về định dạng file ảnhChương 2: Chuyển đổi định dạng file ảnh

Chương 3: Mô phỏng kết quả trên matlab

Nhóm sinh viên thực hiện đề tài: Nguyễn Trung Kiên

Ngô Tuấn Linh

Lã Hùng Anh

Do hạn chế về mặt thời gian cũng như kiến thức nên không thể tránh khỏi những thiếusót trong lần biên soạn đầu tiên này, chúng em xin chân thành cảm ơn và mong đợi ý kiếnđóng góp của thầy cô và các bạn

Trang 5

Danh m c hình vẽ ục hình vẽ

1

8

Danh m c b ng bi u ục hình vẽ ảng biểu ểu

Bảng 2 từ mã gán cho các kí tự bởi mã Huffman 30

Danh m c ch vi t t t ục hình vẽ ữ viết tắt ết tắt ắt

JPG Photographic Experts Group Định dạng file JPEG

PNG Portable Network Graphics Định dạng file PNG

Trang 6

Ch ương I Tổng quan về định dạng file ảnh ng I T ng quan v đ nh d ng file nh ổng quan về định dạng file ảnh ề định dạng file ảnh ịnh dạng file ảnh ạng file ảnh ảng biểu

1.1 Khái ni m nh s ệm ảnh số ảng biểu ố

Ảnh số được tạo nên từ hàng trăm ngàn cho đến hàng triệu ô vuông rất nhỏ - được coi

là những thành tố của bức ảnh và thường được biết dưới tên gọi là pixels Máy tính haymáy in sử dụng những ô vuông nhỏ này để hiển thị hay in ra bức ảnh Để làm được điều

đó máy tính hay máy in chia màn hình, trang giấy thành một mạng lưới chứa các ôvuông, sau đó sử dụng các giá trị chứa trong file ảnh để định ra mầu sắc, độ sáng tối củatừng pixel trong mạng lưới đó - ảnh số được hình thành

1.2 Pixel

Pixel là một điểm vật lý trong một hình ảnh raster hoặc một khối màu rất nhỏ và làđơn vị cơ bản nhất để tạo nên một bức ảnh kỹ thuật số Mỗi điểm ảnh là một mẫu của mộthình ảnh ban đầu, nhiều điểm ảnh hơn thường cung cấp đại diện chính xác hơn của bảngốc Hình ảnh trong hệ thống màu sắc, màu sắc thường là ba hoặc bốn đại diện trongcường độ thành phần như màu đỏ, xanh lá cây, và màu xanh, hoặc màu lục lam, đỏtươi…

Trang 7

Hình 2 Chia khung nh thành các ô (Pixel) ảng biểu

1.3 Đ phân gi i (dpi,ppi) ộ phân giải (dpi,ppi) ảng biểu

Khái niệm resolution - độ phân giải chỉ lượng thông tin được chứa đựng trong một tậptin ảnh kỹ thuật số được hiển thị trên các thiết bị hoặc được in ra, thông thường được đobằng pixel Nói một cách tổng quát, độ phân giải của bức ảnh càng cao, thì việc hiển thị

nó trên website hoặc trang in càng chi tiết và mượt mà - do đó một vài bức ảnh có độphân giải rất cao có thể chứa nhiều pixels hơn mức mà mà mắt người có thể nhìn thấy

Sự khác biệt giữa Pixels Per Inch và Dots Per Inch Mặc dù thường được dùng thaythế cho nhau, tuy nhiên, về mặt kỹ thuật, pixels per inch (PPI) và dots per inch (DPI)không phải là một PPI chỉ số lượng pixel có trên 1 inch của một bức ảnh số hoặc mànhình máy tính PPI tuy không ảnh hưởng đến chất lượng thực sự của bản thân bức ảnhnhưng nó có thể ảnh hưởng đến việc hiển thị bức ảnh đó trên trang web hoặc bản in.DPI, ở một khía cạnh khác, lại chỉ độ phân giải của các bản in mà máy in có thể tạo

ra Đây là một đặc tính vật lý của máy in Mỗi dot của máy in đều có kích thước vật lýxác định Máy in sử dụng các dot mực để hiển thị hình ảnh; máy in tạo ra càng nhiều dottrên một inch vuông thì chất lượng bản in càng cao Các dòng máy in cấp thấp có DPIthấp trong khi các dòng máy in cấp cap sẽ có DPI cao Ví dụ, một máy in hỗ trợ 1200DPI

có nghĩa là máy thể in 1200 điểm trên 1 inch (theo cả chiều ngang lẫn chiều dọc)

Khi in ấn, một điểm quan trọng cần chú ý, đó là phải đảm bảo rằng DPI phải lớn hơnhoặc bằng PPI Nếu DPI nhỏ hơn PPI, máy in sẽ không thể thể hiện được đầy đủ được độphân giải cao của tấm ảnh Nếu DPI lớn hơn PPI, máy in sẽ sử dụng nhiều dot mực đểbiểu diễn một pixel Trái ngược với PPI, DPI không phụ thuộc vào kích cỡ trang in DPI

là một chỉ số cố định với một máy in cho trước

1.4 Lý thuy t màu ết tắt

Hình 3 Nguyên lý tr n màu ộ phân giải (dpi,ppi)

Màu sắc được lưu trong dữ liệu số hóa theo hai chế độ chính: RGB và CMYK.RGB(Red, Green, Blue) các màu trong hình khối được tạo và lưu theo tỷ lệ của 3 màu cơ

Trang 8

bản: đỏ, xanh da trời và xanh lá cây Phần lớn các máy tính hiện nay đều sử dụng chế độnày Thang màu được chỉ định từ 0 đến 255 Ảnh RGB sử dụng ba màu để tái tạo đến16.7 triệu màu sắc tự nhiên RGB là chế độ mặc định cho các ảnh trong Paint.

Màn hình máy tính luôn luôn hiển thị các màu sử dụng mô hình RGB Một số ưuđiểm khi sử dụng màu RGB:

- Tiết kiệm dung lượng nhớ và cải thiện hiệu suất làm việc trong quá trình tách màu

- Độc lập cao đối với thiết bị, do không gian màu RGB không phụ thuộc vào mànhình hoặc mực in

CMYK (Cyan, Magenta, Yellow, Black) là các màu bù với màu cơ bản RGB trongvòng tròn màu Các màu này thường được sử dụng trong ngành công nghiệp in ấn và xuấtbản

Màu CMYK là phần màu được sử dụng tạo ra màu sắc cho việc in ảnh trong máy in

Mô hình CMYK dựa trên chất lượng hấp thụ ánh sáng của mực in trên giấy Khi ánh sángtrắng va đập trên mực, một phần của phổ bị hấp thụ và một phần phản xạ trở lại đến mắtcon người Về lý thuyết, các sắc tố tinh khiết, xanh lơ (C) đỏ thẫm (M) và vàng (Y) phảikết hợp với nhau để hấp thụ toàn bộ màu và tạo ra màu đen Trong ảnh CMYK màu trắngthuần tuý được tạo ra khi cả bốn thành phần đều có giá trị bằng 0 Các màu cơ bản được

sử dụng là: Xanh lơ, Đỏ tươi, Vàng và Đen

1.5 Đ sâu màu ộ phân giải (dpi,ppi)

Là tổng số màu được sử dụng trong một ảnh, điều này tuỳ thuộc vào kích thước, chấtlượng, độ phân giải, cũng như định dạng ảnh Độ sâu màu được tính bằng số pixel màuhiển thị Một bit ảnh thể hiện 2 màu Đối với ảnh đen trắng độ sâu màu là 1 bit, ảnh đacấp xám là 8 bit (256 màu), ảnh đầy đủ màu sắc gồm 256 màu Mỗi ảnh RGB có 24 bit(16.7 triệu) màu, với các ảnh chuyên nghiệp độ sâu màu là 30~48 bit (10~16 triệu) màu

1.6 Đ nh d ng nh bitmap ịnh dạng file ảnh ạng file ảnh ảng biểu

1.5.1 Khái ni m ệm ảnh số

Ảnh Bitmap được xây dựng từ các điểm ảnh màu (pixels) là một khối nhỏ màu hìnhchữ nhật Tất cả các điểm màu được sắp xếp với nhau theo một trật tự tạo thành ảnh.Định dạng ảnh bitmap được thiết kế sử dụng đối với các điểm ảnh hoặc hình đồ hoạtương tự nhau Một bức ảnh được tạo nên từ rất nhiều các điểm pixels Các ảnh có độphân giải cao (chất lượng ảnh tốt) bao gồm nhiều pixels và chiếm nhiều không gian bộnhớ hơn so với cùng bức ảnh có độ phân giải thấp Trong quá trình tạo ảnh cho trangWeb, file ảnh được chỉnh sửa và thường lưu lại với độ phân giải là 72 pixels/inch (1 inch

= 2.54 cm) Màn hình máy tính có độ phân giải là 2-96 pixel trên 1 inch tuỳ thuộc vàohãng sản xuất máy tính Người ta sử dụng lớp ảnh bitmap cho đồ hoạ văn bản tạo vì tínhnăng tiện lợi trong việc chỉnh sửa sau này cũng như việc lưu mỗi đối tượng tạo ra trên các

Trang 9

1.5.2 Đ c đi m ặc điểm ểu

Ảnh Bitmap phụ thuộc vào độ phân giải Độ phân giải được hiểu là tập hợp các điểmpixel trong 1 ảnh và tính bằng dpi (dots per inch) hoặc ppi (pixels per inch) Ảnh Bitmaphiển thị trên máy tính có độ phân giải là: 72 hoặc 96 ppi Tuy nhiên khi in ảnh bitmap đạtchất lượng cao chúng ta cần đặt độ phân giải khoảng 150-300

Đối với ảnh Bitmap chúng ta không thể phóng to, thu nhỏ kích thước ảnh mà vẫn giữnguyên chất lượng ảnh Giảm kích thước ảnh Bitmap đồng nghĩa với việc chúng ta xoá đimột số điểm pixel và không thể khôi phục lại được Tăng kích thước ảnh Bitmap bằngcách tạo mới thêm các điểm pixel, chương trình xử lý ảnh sẽ ước lượng giá trị màu dựatrên các điểm màu gần nó, quá trình đó gọi là Inter polation

Việc thay đổi kích thước ảnh được gọi chính xác là quá trình “điều chỉnh tỷ lệ” (trong

đồ hoạ trình diễn, đây là sự điều chỉnh trục y - trục giá trị được chọn bởi chương trình,sao cho các cách biệt về dữ liệu được rõ ràng Mọi chương trình đồ hoạ đều có khả năngchia thang tỷ lệ trên trục y, nhưng thang đó có thể không thoả mãn Điều chỉnh thangbằng tay sẽ cho kết quả tốt hơn) Tuy nhiên khi tăng kích thước ảnh lên chúng ta cần chú

ý tới hạn định sự xuất hiện bề mặt lởm chởm răng cưa Điều chỉnh tỷ lệ kích thước ảnhBitmap nhỏ đi sẽ không tạo bất kỳ hiệu ứng nào Thực tế khi thu nhỏ ảnh chúng ta đãtăng độ phân giải của ảnh

Ảnh Bitmap nói chung không trợ giúp việc tạo nền trong suốt, ngoại trừ hai định dạngfile ảnh GIF và PNG trợ giúp hiệu ứng này Cần chú ý rằng các phần mềm sửa đổi ảnhđều trợ giúp việc tạo hiệu ứng trong suốt nhưng chỉ có 2 định dạng file trên mới lưu đượchiệu ứng này Một quan niệm sai lầm khi cho rằng vùng ảnh được tạo trong suốt sẽ duytrì hiệu ứng đó khi file ảnh được lưu dưới bất kỳ định dạng ảnh nào hoặc khi ta sao chép

và dán sang một chương trình khác Thực tế, hiệu ứng đó sẽ không còn, tuy nhiên trongmột số phần mềm xử lý ảnh thông dụng ta có thể giấu, lưu vùng ảnh bitmap được tạotrong suốt

Trang 10

1.7.2 Đ c đi m ặc điểm ểu

Người ta hoàn toàn có thể thay đổi các thuộc tính đối tượng ảnh vector mà không ảnhhưởng tới đối tượng cơ bản đó Đối với ảnh vector chúng ta không chỉ thay đổi thuộc tính

mà còn có thể thay đổi hình dạng và sự hiển thị ảnh qua các điểm nút của ảnh

Ảnh vector cho phép biến đổi theo tỷ lệ do đó chúng không phụ thuộc vào độ phângiải Ta có thể tăng giảm kích thước cả trên màn hình hay khi in mà không ảnh hưởng tớichất lượng ảnh

Một ưu điểm nổi bật khác của ảnh vector là chúng không hạn chế về hình dạng cácđiểm như trong ảnh bitmap Đối tượng vector này có thể thay thế hoàn toàn bởi đối tượngvector khác

Bên cạnh những ưu điểm nổi bật, hạn chế cơ bản nhất của ảnh vector là sự khôngthích hợp đối với các ảnh tự nhiên, ảnh chụp từ máy kỹ thuật số Ảnh vector được tạo từcác vùng màu thuần nhất hoặc vùng màu xám nhưng chúng không thể mô tả các màu sắctinh tế khác nhau trong một bức ảnh Đó cũng chính là lý do tại sao chúng ta không thấyảnh vector xuất hiện nhiều trong các bức tranh nghệ thuật, tranh truyện cũng như hìnhbiếm họa Tuy nhiên ngày nay công cụ tạo ảnh vector trợ giúp chúng ta ứng dụng đốitượng bề mặt ảnh bitmap giống như cảnh tự nhiên và trên đó ta hoàn toàn có thể tạo hiệuứng, tạo cảnh nền trong suốt, tạo bóng cho từng đối tượng để có các cảnh khác nhau tuỳtheo mục đích sử dụng

Các đối tượng Vector cơ bản được xây dựng sẵn trong phần mềm, chúng ta không thểquét một ảnh vào và lưu dưới dạng ảnh vector mà không sử dụng phần mềm chuyển đổiđặc biệt Ảnh vector dễ dàng chuyển đổi sang ảnh bitmap Khi chuyển đổi ta có thể xácđịnh bất kỳ kích thước nào cho ảnh bitmap mà không ảnh hưởng tới chất lượng ảnh Tuyvậy, điều cần nhớ trước khi chuyển ảnh là phải lưu lại ảnh vector gốc bởi lẽ ảnh bitmap

đã mất đi toàn bộ chất lượng và trạng thái vector của các đối tượng trong ảnh Chú ý rằngkhi ta mở ảnh vector trong phần mềm chỉ trợ giúp ảnh bitmap thì tất cả các thuộc tính,chất lượng ảnh vector sẽ bị chuyển đổi thành dữ liệu ảnh bitmap

Lý do quan trọng nhất khi ta quyết định chuyển đổi ảnh vector sang ảnh bitmap là khichúng được sử dụng trên trang Web Tại thời điểm hiện nay, các trang Web đều chưa hỗtrợ định dạng ảnh vector một cách hiệu quả Chúng ta có thể sử dụng ảnh vector trênMacromedia Flash nhưng định dạng file này yêu cầu phải hỗ trợ Plug-in Định dạng SVGđược coi là định dạng chuẩn ảnh vector trên Web

Ảnh gốc Ảnh bitmap (400%) Ảnh vector (400%) Ảnh vector có chế độ phân giảikhông phụ thuộc vào kích thước ảnh, chúng không biến đổi khi ta phóng to, thu nhỏ ảnhnhư đối với ảnh bitmap Do đối tượng vector được xây dựng từ các phương trình toán họckhác với đối tượng bitmap được tạo thành từ các điểm ảnh, kích thước file ảnh vector nhỏhơn nhiều so với kích thước cùng ảnh bitmap

Trang 11

Lúc đó file này chứa ảnh vector nhưng thuộc tính tô màu được ghi dưới dữ liệu ảnhbitmap.

 Tập hợp các điểm màu pixels

 Phụ thuộc vào chế độ phân giải

 Chất lượng giảm khi thay đổi lại kích thước ảnh

 Dễ dàng chuyển đổi giữa các định dạng ảnh

 Hạn chế là hình dạng, kích thước ảnh luôn luôn là hình chữ nhật

 Chỉ có một số (rất ít) định dạng ảnh trợ giúp tạo hiệu ứng trong suốt

b Ảnh vector

 Được xác định bằng các đường toàn học, dễ dàng thay đổi, điều chỉnh tỷ lệ,hình dạng và tạo các hiệu ứng trên ảnh

 Chất lượng ảnh không phụ thuộc vào độ phân giải, phóng to, thu nhỏ ảnh

 Không tạo nền, luôn có mặc định hỗ trợ hiệu ứng trong suốt

 Thường tạo các cảnh khung, xương sống ảnh có sẵn qua các hình dạng, đốitượng toán học cơ bản Không thích hợp đối với các ảnh nghệ thuật cao, ảnh

tự nhiên, hay ảnh chụp kỹ thuật số

Hình 4 S khác nhau gi a nh bitmap và nh vector ự khác nhau giữa ảnh bitmap và ảnh vector ữ viết tắt ảng biểu ảng biểu

Trang 12

Ch ương I Tổng quan về định dạng file ảnh ng II Chuy n đ i đ nh d ng file nh ểu ổng quan về định dạng file ảnh ịnh dạng file ảnh ạng file ảnh ảng biểu

2.1 Các ki u nh trong matlab ểu ảng biểu

2.1.1 nh Index Ảnh Index

Ảnh được biểu diễn bởi hai ma trận, một ma trận dữ liệu ảnh X và một ma trận màu(còn gọi là bản đồ màu) map Ma trận dữ liệu có thể thuộc kiểu uint8, uint16 hoặc double

Hình 5 C u trúc nh Index ấu trúc ảnh Index ảng biểu

Ma trận màu là một ma trận kich thước m x 3 gồm các thành phần thuộc kiểu double

có giá trị trong khoảng [0 1] Mỗi hàng của ma trận xác định thành phần red, green, bluecủa một màu trong tổng số m màu được sử dụng trong ảnh Giá trị của một phần tử trong

ma trận dữ liệu ảnh cho biết màu của điểm ảnh đó nằm ở hàng nào trong ma trận màu

Trang 13

Hình 6 Ánh x b n đ màu trong nh Index ạng file ảnh ảng biểu ồ màu trong ảnh Index ảng biểu

2.1.2 nh Grayscale Ảnh Index

Mỗi ảnh được biểu diễn bởi một ma trận hai chiều, trong đó giá trị của mỗi phần tửcho biết độ sáng (hay mức xám) của điểm ảnh đó Ma trận này có thể một trong các kiểuuint8, uint16 hoặc double Ảnh biểu diễn theo kiểu này còn gọi là ảnh “trắng đen”

Hình 7 nh Grayscale Ảnh Index

2.1.3 nh nh phân Ảnh Index ịnh dạng file ảnh

Ảnh được biểu diễn bởi một ma trận hai chiều thuộc kiểu logical Mỗi điểm ảnh chỉ

có thể nhận một trong hai giá trị là 0 (đen) hoặc 1 (trắng)

Trang 14

Hình 8 nh nh phân Ảnh Index ịnh dạng file ảnh

2.1.4 nh RGB Ảnh Index

Còn gọi là ảnh “truecolor” do tính trung thực của nó Ảnh này được biểu diễn bởi một matrận ba chiều kích thước m x n x 3, với m x n là kích thước ảnh theo pixels Ma trận nàyđịnh nghĩa các thành phần màu red, green, blue cho mỗi điểm ảnh, các phần tử của nó cóthể thuộc kiểu uint8, uint16 hoặc double

Trang 15

Hình 9 C u trúc nh RGB ấu trúc ảnh Index ảng biểu

Hình 10 Mô t 3 thành ph n màu trong nh RGB ảng biểu ần màu trong ảnh RGB ảng biểu

2.2 Các phép bi n đ i nh s ết tắt ổng quan về định dạng file ảnh ảng biểu ố

2.2.1 Phép bi n đ i Fourier ểu ổng quan về định dạng file ảnh

Phép biến đổi Fourier biểu diễn ảnh dưới dạng tổng của các lũy thừa phức của cácthành phần biên độ, tần số, pha khác nhau của ảnh Nếu f(m,n) là một hàm của hai biếnkhông gian rời rạc m và n, thì biến đổi Fourier hai chiều của f(m,n) được định nghĩa:

Nếu f(m,n) biểu diễn độ sáng của ảnh X ở vị trí pixel (m,n) thì F(w1,w2) chính là biếnđổi

Fourier của ảnh X Do các dữ liệu trên máy tính được lưu trữ dưới dạng rời rạc, cụ thể

là dữ liệu ảnh được tổ chức theo đơn vị pixel nên phép biến đổi Fourier cũng được rời rạchóa thành biến đổi Fourier rời rạc (DFT) Các phép biến đổi DFT thuận và nghịch kíchthước M x N được định nghĩa như sau:

F(p,q) gọi là các hệ số của biến đổi DFT

Trang 16

Với các ứng dụng trong xử lý ảnh, chúng ta chỉ quan tâm đến các hàm fft2 và ifft2.

Cú pháp:

F=fft2(X,Mrows,Ncols)f=ifft2(F,mrows,ncols)Nếu ảnh ban đầu có kích thước nhỏ hơn thì Matlab tự động thêm vào các zero pixeltrước khi biến đổi Sau khi thực hiện biến đổi DFT bằng fft2, thành phần DC sẽ nằm ởgóc trên bên trái của ảnh Ta có thể dùng hàm fftshift để dịch thành phần DC này về trungtâm của ảnh

2.2.2 Bi n đ i DCT ết tắt ổng quan về định dạng file ảnh

Biến đổi cosine rời rạc (DCT) biểu diễn ảnh dưới dạng tổng của các cosine của các thành

phần biên độ và tần số khác nhau của ảnh Hàm dct2 tính DCT hai chiều của một ảnh.

DCT có tính chất mà với các ảnh điển hình, hầu hết các thông tin về ảnh chỉ tập trungtrong một vài hệ số của DCT, trong khi các hệ số còn lại chỉ chứa rất ít thông tin Vì lý donày, DCT thường được sử dụng trong các ứng dụng nén ảnh khác nhau nhờ hiệu suất gầnnhư tối ưu của nó đối với các ảnh có độ tương quan cao giữa các điểm ảnh lân cận.Chẳng hạn, DCT là trung tâm của giải thuật nén ảnh theo chuẩn quốc tế thường được biếtvới tên JPEG (tên này do nhóm phát triển đặt ra: Joint Photographic Experts Group)

DCT hai chiều của ma trận A có kích thước MxN được định nghĩa như sau :

và biến đổi ngược của nó cho bởi công thức :

Trang 17

2.2.3 Bi n đ i Radon ết tắt ổng quan về định dạng file ảnh

Phép biến đổi Radon được thực hiện bởi hàm radon trong Matlab, biểu diễn ảnh dướidạng các hình chiếu của nó dọc theo các hướng xác định Hình chiếu của một hàm haibiến f(x,y) là tập hợp các tích phân đường Hàm radon tính các tích phân đường từ nhiềuđiểm nguồn dọc theo các đường dẫn song song, gọi là các tia chiếu, theo một hướng xácđịnh nào đó Các tia chiếu này nằm cách nhau 1 pixel Để biểu diễn toàn bộ ảnh, hàmradon sẽ lấy nhiều hình chiếu song song của ảnh từ các góc quay khác nhau bằng cáchxoay các điểm nguồn quanh tâm của ảnh

Biến đổi Radon của f(x,y) tương ứng với góc quay Ѳ là tích phân đường của f dọc theotrục y’:

RѲ (x’)¿∫

−∞

∞

f (x ' cosѲ− y ' sinѲ , x ' sin Ѳ+ y ' cosѲ)dy '

Khi: [x ' y ']=[−cosθθ sθinθθ cosθθ sθinθθ][v x]

Hình 11 Ph ương I Tổng quan về định dạng file ảnh ng pháp bi n đ i Radon ết tắt ổng quan về định dạng file ảnh

Trong Matlab, biến đổi Radon được tính bằng hàm Radon có cú pháp như sau:

[R,Xp] = radon(I,theta)

2.3 M t s đ nh d ng nh bitmap thông d ng ộ phân giải (dpi,ppi) ố ịnh dạng file ảnh ạng file ảnh ảng biểu ục hình vẽ

Ảnh thu được sau quá trình số hóa thường được lưu lại cho các quá trình xử lý ảnhtiếp theo hoặc truyền đi Trong quá trình phát triền của kỹ thuật xử lý ảnh, tồn tại nhiềuđịnh dạng ảnh khác nhau từ đên trắng tới ảnh màu (BMP, JPEG, GIF,…) Tuy các địnhdạng này khác nhau nhưng chúng đều tuân theo một cấu trúc chung nhất Nhìn chung,một tệp ảnh bất kỳ gồm 3 phần:

- Phần đầu tệp (Header)

Trang 18

- Phần dữ liệu nén (Data compression)

- Bảng màu (Palette Color)

Trong đó Phần đầu tệp là phần chưa thông tin về kiểu ảnh, kích thước, độ phân giải,

số bít dùng cho 1 pixel, cách mã hóa và vị trí bảng màu

Phần dữ liệu nén: Lưu dữ liệu được nén bởi thuật toán khai bảo ở phần Header

Phần cuối Bảng màu Phần này không nhất thiết phải có ví dụ như ảnh đen trắng Nếu có,bảng màu cho biết số màu dùng trong ảnh và bảng màu được sử dụng để hiển thị màu củaảnh Một số các đinh dạng khác nhau, cấu hình khác nhau, đặc trưng khác nhau mà cáctham số này có thể khác nhau

2.3.1 Đ nh d ng nh GIF ịnh dạng file ảnh ạng file ảnh ảng biểu

GIF (từ viết tắt của Graphics Interchange Format) là một kiểu định dạng ảnh bitmap

ra đời năm 1987 bởi hãng CompuServe, sử dụng thuật toán nén không mất dữ liệu(thôngtin) LZW Ảnh GIF có tối đa 256 màu (8 bits), được đánh chỉ số index trong bảng màu,cho phép tạo màu nền trong suốt

Hình 12 nh đ nh d ng GIF Ảnh Index ịnh dạng file ảnh ạng file ảnh

2.3.1.1 Ph ương pháp nén LZW trong ảnh GIF ng pháp nén LZW trong nh GIF ảnh GIF

Giải thuật nén LZW xây dựng một từ điển lưu các mẫu có tần suất xuất hiện cao trongảnh Từ điển là tập hợp những cặp từ vựng và nghĩa của nó Trong đó, từ vựng sẽ là các

từ mã được sắp xếp theo thứ tự nhất định Nghĩa là một chuỗi con trong dữ liệu ảnh Từđiển được xây dựng đồng thời với quá trình đọc dữ liệu Sự có mặt của một chuỗi controng từ điển khẳng định rằng chuỗi đó đã từng xuất hiện trong phần dữ liệu đã đọc.Thuật toán liên tục “tra cứu” và cập nhật từ điển sau mỗi lần đọc một ký tự ở dữ liệu đầuvào Do kích thước bộ nhớ không phải vô hạn và để đảm bảo tốc độ tìm kiếm, từ điển chỉgiới hạn 4096 ở phần tử dùng để lưu lớn nhất là 4096 giá trị của các từ mã Như vậy độ

Trang 19

Hình 13 S đ thu t toán LZW ơng I Tổng quan về định dạng file ảnh ồ màu trong ảnh Index ật toán LZW

+ 256 từ mã đầu tiên theo thứ tự từ 0…255 chữa các số nguyên từ 0…255 Đây là mãcủa

256 kí tự cơ bản trong bảng mã ASCII

+ Từ mã thứ 256 chứa một mã đặc biệt là “mã xóa” Mục đích việc dùng mã xóanhằm khắc phục tình trạng số mẫu lặp trong ảnh lớn hơn 4096 Khi đó một ảnh đượcquan niệm là nhiều mảnh ảnh, và từ điển là một bộ từ điển gồm nhiều từ điển con Cứ hếtmột mảnh ảnh người ta lại gửi một mã xóa để báo hiệu kết thúc mảnh ảnh cũ, bắt đầumảnh ảnh mới đồng thời khởi tạo lại từ điển cho mảnh ảnh mới Mã xóa có giá trị là 256 + Từ mã thứ 257 chứa mã kết thúc thông tin Mã này có giá trị là 257 Như chúng ta

đã biết, một file ảnh GIF có thể chứa nhiểu ảnh Mỗi một ảnh sẽ được mã hóa riêng.Chương trình giải mã sẽ lặp đi lặp lại thao tác giải mã từng ảnh cho đến khi gặp mã kếtthúc thông tin thì dừng lại

+ Các từ mã còn lại (từ 258 đến 4095) chứa các mẫu thương lặp lại trong ảnh 512phần tử đầu tiên của từ điển biểu diễn bằng 9 bit Các từ mã từ 512 đến 1023 biểu diễnbởi 10 bit, từ 1024 đến 2047 biểu diễn bởi 11 bit và từ 2048 đến 4095 biểu diễn bởi 12bit

2.3.1.2 Đánh giá đ nh d ng nh GIF ịnh dạng ảnh GIF ạng ảnh GIF ảnh GIF

GIF là một tập tin màu 8-bit, có nghĩa là hình ảnh mà tập tin cho ra bị giới hạn bởi 1bảng gồm 256 màu sắc Có 2 điều đặc biệt về định dạng GIF đó là tập tin có khả năng lưulại màu trong suốt và hỗ trợ hình ảnh động

Tập tin GIF dùng nén dữ liệu bảo toàn trong đó kích thước tập tin có thể được giảm

mà không làm chất lượng hình ảnh kém đi (cho những hình ảnh có ít hơn 256 màu) Số

Trang 20

lượng tối đa 256 màu làm cho định dạng này không phù hợp cho các hình chụp (thường

có nhiều màu sắc), tuy nhiên các kiểu nén dữ liệu bảo toàn cho hình chụp nhiều màu cũng

có kích thước quá lớn đối với truyền dữ liệu trên mạng hiện nay

So với định dạng JPEG là dạng nén dữ liệu thất thoát có thể được dùng cho các ảnhchụp, nhưng lại làm giảm chất lượng cho các bức vẽ ít màu, tạo nên những chỗ nhòe thaycho các đường sắc nét, đồng thời độ nén cũng thấp cho các hình vẽ ít màu Như vậy, GIFthường được dùng cho sơ đồ, hình vẽ nút bấm và các hình ít màu, còn JPEG được dùngcho ảnh chụp

Ưu điểm:

 Được phổ biến rộng rãi nhất

 Hỗ trợ tạo mức hiệu ứng nền trong suốt transparency

 Có khả năng tạo chỉ số trong bảng màu

 Nén không mất dữ liệu (thông tin)

 Thích hợp cho các ảnh có số màu hiển thị không quá nhiềunhư ảnh đen trắng, ảnh có từng vùng màu đơn như truyện tranh,đường kẻ nghệ thuật

Nhược điểm:

 Số màu tối đa sử dụng là 256 màu

 Không thể thay đổi, điều khiển được tỷ lệ nén

 Vì số màu được dùng hạn chế như thế nên không phù hợp vớiảnh chất lượng cao, ảnh nhiều màu đa dạng trong tự nhiên

2.3.2 Đ nh d ng nh BMP ịnh dạng file ảnh ạng file ảnh ảng biểu

Định nghĩa: BMP là một định dạng ảnh chuẩn bitmap trong môi trường Microsoft

Windows Ảnh được lưu có chỉ số hay không chỉ số các dữ liệu điểm ảnh RGB (tính theopixel) với độ lớn (kích thước 1, 4, 8, hay 24 bit) một cách có hiệu quả Dữ liệu lưu có thểkhông nén hay nén theo thuật toán nén dữ liệu 4-8 bit RLE BMP là sự lựa chọn tốt nhấtđối với các định dạng ảnh bitmap đơn giản có hỗ trợ phạm vi dữ liệu điểm ảnh RGBrộng

Trong đồ họa máy vi tính, BMP, còn được biết đến với tên tiếng Anh khác làWindows bitmap, là một định dạng tập tin hình ảnh khá phổ biến Các tập tin đồ họa lưudưới dạng BMP thường có đuôi là BMP hoặc DIB (Device Independent Bitmap) Cácthuộc tính tiêu biểu của một tập tin ảnh BMP (cũng như file ảnh nói chung) là

• Số bit trên mỗi điểm ảnh (bit per pixel), thường được ký hiệu bởi n Một ảnh BMPn-bit có màu Giá trị n càng lớn thì ảnh càng có nhiều màu, và càng rõ nét hơn Giátrị tiêu biểu của n là 1 (ảnh đen trắng), 4 (ảnh 16 màu), 8 (ảnh 256 màu), 16 (ảnh

Trang 21

65536 màu) và 24 (ảnh 16 triệu màu) Ảnh BMP 24-bit có chất lượng hình ảnhtrung thực nhất.

• Chiều cao của ảnh (height), cho bởi điểm ảnh (pixel)

• Chiều rộng của ảnh (width), cho bởi điểm ảnh

Cấu trúc tập tin ảnh BMP bao gồm 4 phần

• Bitmap Header (14 bytes): giúp nhận dạng tập tin bitmap

• Bitmap Information (40 bytes): lưu một số thông tin chi tiết giúp hiển thị ảnh

• Color Palette (4*x bytes), x là số màu của ảnh: định nghĩa các màu sẽ được sửdụng trong ảnh

• Bitmap Data: lưu dữ liệu ảnh

Đặc điểm nổi bật nhất của định dạng BMP là tập tin hình ảnh thường không được nénbằng bất kỳ thuật toán nào Khi lưu ảnh, các điểm ảnh được ghi trực tiếp vào tập tin - mộtđiểm ảnh sẽ được mô tả bởi một hay nhiều byte tùy thuộc vào giá trị n của ảnh Do đó,một hình ảnh lưu dưới dạng BMP thường có kích cỡ rất lớn, gấp nhiều lần so với các ảnhđược nén (chẳng hạn GIF, JPEG hay PNG)

Quá trình nén trong BMP

Bitmap là một chuỗi đơn giản của các điểm ảnh xếp chồng lên nhau Tuy nhiên, cùngmột hình ảnh được lưu trong định dạng GIF hoặc JPEG sử dụng ít byte để lưu trữ cho cáctập tin

Bitmap có thể được nén đến một điểm Quá trình này được gọi là mã hóa Run LengthEncoding RLE mã hóa tất cả các điểm cùng một màu sắc được kết hợp thành một điểmảnh Một sự khác biệt là Bitmap thông thường có thể chấp nhận 16 triệu màu sắc khácnhau cho mỗi điểm ảnh Tiết kiệm cùng một hình ảnh trong mã hóa loạt dài giảm các bit-per-pixel xuống 8 Giảm mức độ của màu sắc trong không nhiều hơn 256

2.3.3 Đ nh d ng nh JPEG ịnh dạng file ảnh ạng file ảnh ảng biểu

Định nghĩa: JPEG viết tắt của Joint Photographic Experts Group, một tổ chức tạo ra

định dạng ảnh đồ họa JPEG sử dụng thuật toán nén mất thông tin Ảnh JPEG có tối đa

16 triệu màu (24-bit), cung cấp thông tin định rõ tỷ lệ, mức độ nén

JPEG là một trong những phương pháp nén ảnh hiệu quả, có tỷ lệ nén ảnh tới vài chụclần Tuy nhiên ảnh sau khi giải nén sẽ khác với ảnh ban đầu Chất lượng ảnh bị suy giảmsau khi giải nén Sự suy giảm này tăng dần theo hệ số nén Tuy nhiên sự mất mát thôngtin này là có thể chấp nhận được và việc loại bỏ những thông tin không cần thiết đượcdựa trên những nghiên cứu về hệ nhãn thị của mắt người

Phần mở rộng của các file JPEG thường có dạng jpeg, jfif, jpg, JPG, hay JPE dạng.jpg là dạng được dùng phổ biến nhất Hiện nay dạng nén ảnh JPEG rất được phổ biếntrong ĐTDD cũng như những trang thiết bị lưu giữ có dung lượng nhỏ

Trang 22

Mức độ nhạy cảm của mắt người:

Trong không gian màu YUV, nhãn thị của con người rất nhạy cảm với thành phần Y

và kém nhạy cảm với hai loại U và V Phương pháp nén JPEG đã nắm bắt phát hiện này

để tách những thông tin thừa của ảnh Hệ thống nén thành phần Y của ảnh với mức độsuy giảm ít hơn so với U, V, bởi người ta ít nhận thấy sự thay đổi của U và V so với Y

Sự khác biệt giữa nén 1% và 50% không phải là quá xấu, nhưng sự sụt giảm byte là ấntượng Các con số tôi cho thấy một số lượng lưu trữ, số lượng không gian ổ đĩa cứng hìnhảnh chiếm

Có lẽ ta đã phỏng đoán rằng 50% có nghĩa là 50% của hình ảnh được bao gồm trongthuật toán nén Nếu không đặt một hình ảnh nén 50% bên cạnh một hình ảnh trùng lặpchính xác ở nén 1%, thì có vẻ khá tốt Nhưng những gì về hình ảnh đó nén 99%? Có vẻkhủng khiếp Nhìn vào nó một lần nữa Xem làm thế nào nó được thực hiện của các khối?

Đó là những gì có nghĩa là bởi lossy Bytes bị mất tại các chi phí của các chi tiết Ta cóthể thấy nơi mà các thuật toán nén được tìm thấy nhiều nhóm pixel rằng tất cả các xuấthiện để được gần gũi trong màu sắc và chỉ cần nhóm lại tất cả chúng với nhau như một

Hình 14 Kh năng nén c a đ nh d ng JPEG ảng biểu ủa định dạng JPEG ịnh dạng file ảnh ạng file ảnh

Mã hóa

Công đoạn chính là chia nhỏ bức ảnh thành nhiều vùng nhỏ (thông thường là nhữngvùng 8x8 pixel) rồi sử dụng biến đổi cosin rời rạc để biến đổi những vùng thể hiện nàythành dạng ma trận có 64 hệ số thể hiện "thực trạng" các pixel Điều quan trọng là ở đây

hệ số đầu tiên có khả năng thể hiện "thực trạng" cao nhất, khả năng đó giảm rất nhanh với

Trang 23

các hệ số khác Nói cách khác thì lượng thông tin của 64 pixels tập trung chủ yếu ở một

số hệ số ma trận theo biến đổi trên

Trong giai đoạn này có sự mất mát thông tin, bởi không có biến đổi ngược chính xác.Nhưng lượng thông tin bị mất này chưa đáng kể so với giai đoạn tiếp theo Ma trận nhậnđược sau biến đổi cosin rời rạc được lược bớt sự khác nhau giữa các hệ số Đây chính làlúc mất nhiều thông tin vì người ta sẽ vứt bỏ những thay đổi nhỏ của các hệ số Như thếkhi bung ảnh đã nén ta sẽ có được những tham số khác của các pixel Các biến đổi trên ápdụng cho thành phần U và V của ảnh với mức độ cao hơn so với Y Sau đó thì áp dụngphương pháp mã hóa của Gernot Hoffman: phân tích dãy số, các phần tử lặp lại nhiềuđược mã hóa bằng ký hiệu ngắn (marker) Khi bung ảnh người ta chỉ việc làm lại cácbước trên theo quá trình ngược lại cùng với các biến đổi ngược

Nhược điểm lớn nhất là chất lượng ảnh đã bị nén mất đi (lossy), một số đường baogiữa các khối màu sẽ xuất hiện điểm mờ, và các vùng sẽ mất đi sự rõ nét Và giống nhưdạng mp3, JPEG sẽ không thể phục hồi giống như hình ảnh ban đầu dù dung lượng đượctăng lên giống dung lượng ảnh thật

Các ảnh JPEG không thể làm trong suốt hoặc chuyển động

2.3.3.1 Quá trình bi n đ i DCT trong đ nh d ng JPEG ến đổi DCT trong định dạng JPEG ổi DCT trong định dạng JPEG ịnh dạng ảnh GIF ạng ảnh GIF

Ta có quá trình biến đổi DCT và mã hóa dữ liều theo sơ đồ sau:

Trang 24

Hình 15 Quá trình bi n đ i DCT và DCT ng ết tắt ổng quan về định dạng file ảnh ược c

Ví dụ

Dưới đây là ví dụ về quá trình biến đổi DCT và quá trình biến đổi DCT ngược, khôi phụclại ảnh gốc của một bức ảnh 8x8 như hình dưới:

Hình 16 Ví d bi n đ i DCT và DCT ng ục hình vẽ ết tắt ổng quan về định dạng file ảnh ược c khôi ph c l i nh ục hình vẽ ạng file ảnh ảng biểu

Code mô phỏng DCT trong matlab

Trang 25

invdct = @(block_struct) T' * block_struct.data * T;

I2 = blockproc(B2,[8 8],invdct);

imshow(I), figure, imshow(I2)

2.3.3.2 Đánh giá nh nén b ng chu n JPEG ảnh GIF ằng chuẩn JPEG ẩn JPEG

Ưu điểm:

 Có nhiều tỷ lệ nén mất dữ liệu khác nhau

 Có thể nén với tỷ lệ nén rất cao

 Cung cấp 24-bit màu (16 triệu màu)

 Định dạng tốt nhất đối với các ảnh cần nhiều màu sắc tự nhiên (màuliên tiếp nhau trong bảng màu) như ảnh chụp phong cảnh, ảnh và cácminh hoạ trên sách báo, ảnh 3 chiều

 Có thể tải từng phần ảnh trên mạng vào từng thời điểm khác nhau(quá trình "progressive JPEGs")

Nhược điểm:

 Không thể đánh chỉ số màu trong bảng màu

 Không hỗ trợ tạo ảnh nền trong suốt

 Nén mất dữ liệu

 Không phải mọi máy tính đề hiển thị tốt, cố định 24-bit màu

2.3.4 Đ nh d ng nh TIF, TIFF ịnh dạng file ảnh ạng file ảnh ảng biểu

Định nghĩa: Tiff (Tag Image File Format) Loại file ảnh bitmap này sử dụng thuật

toán nén không mất dữ liệu và chúng ta có thể ghi lại dưới các định dạng file khác nhau,TIF và TIFF được sử dụng rộng rãi Photoshop cho phép chuyển đổi TIF sang định dạngảnh vector và có thể lưu tới 4 kênh màu Với ảnh đồ hoạ trên web, chúng ta không thểthực hiện được 3 kênh màu sử dụng trong chế độ màu RGB (độ sâu màu là 24 bit)

Định dạng
Số trang	51
Dung lượng	4,44 MB