1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Báo cáo xử lý ảnh nhận dạng khối cơ bản matlab

37 2,7K 51

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 37
Dung lượng 1,6 MB

Nội dung

Xử lý ảnh là môn học có nhiều ứng dụng thực tế. Báo cáo xử lý ảnh nhận dạng các khối cơ bản sử dụng phần mềm Matlab đưa ra các khái niệm cơ bản về xử lý ảnh, tập trung vào phương pháp nhận dạng các khối hình vuông, chữ nhật. Có thể lựa chọn làm đề tài báo cáo môn học xử lý ảnh.

Trang 2

Mục lục

Chương 1: Thu thập ảnh

1.1 Cơ chế thu thập ảnh Pinhole……… 2

1.2 Cảm biến CCD……… 6

Chương 2: Xử lý tăng cường chất lượng ảnh. 2.1 Lọc nhiễu……… 12

2.2 Tăng cường độ sáng, độ tương phản ảnh……… 14

Chương 3: Các phương pháp xử lý ảnh cơ bản. 3.1 Tăng giảm kích thước……… 16

3.2 Xoay ảnh……… 18

3.3 Biến đổi không gian màu ảnh (RGB)………21

Chương 4: Dò biên và phân vùng ảnh. 4.1 Kỹ thuật dò biên………24

4.2 Phân vùng ảnh……… 30

Chương 5: Nhận dạng đối tượng ảnh……… 38

Phụ lục: Code Matlab nhận dạng hình tròn……….40

Trang 3

CHƯƠNG 1: PHƯƠNG PHÁP THU THẬP ẢNH

Trong công nghệ xử lý ảnh thì công đoạn đầu tiên là chụp ảnh, nghĩa là chúng

ta lấy được dữ liệu của 1 bức ảnh trước khi xử lý Để làm được việc đó cần phải có thiết bị chụp ảnh mà phổ biến là các camera Chất lượng của bức ảnh được quyết định cấu tạo và chất lượng của camera

Về cơ bản, cấu tạo một camera số hay máy chụp hình kỹ thuật số gồm:

Chất lượng hình ảnh phụ thuộc nhiều vào tốc độ cửa sập và cảm biến thu nhận ảnh Trong đó, phương pháp thu nhận ảnh Pinhole được sử dụng phổ biến trong hầu hết các máy ảnh hiện nay

1 Cơ chế thu nhận ảnh pinhole:

Trang 4

Nguyên lý của nhiếp ảnh pinhole dựa trên một hiện tượng quang học vốn được khám phá hàng ngàn năm trước: Hiện tượng tạo ảnh qua khe hẹp.

Nguyên lý tạo ảnh qua khe hẹp

Từ nguyên lý quang học này, những chiếc máy ảnh pinhole đã ra đời vào giữa thế kỷ

19 Cấu tạo của những chiếc máy ảnh này rất đơn giản: chúng chỉ là những hộp kín được đục một lỗ rất nhỏ để tiếp nhận ánh sáng Hình ảnh sẽ được thu nhận trên phim hoặc tấm nhạy sáng đặt bên trong hộp Chính cái lỗ nhỏ trên thân máy ảnh pinhole giữ chắc năng như một ống kính máy ảnh.So với ống kính thông thường, “ống kính” pinhole có độ mở nhỏ hơn hàng chục cho đến hàng trăm lần, và tất nhiên là không sử dụng một thấu kính nào cả Đường kính của “lỗ kim” này càng nhỏ, bề dày càng mỏng thì ảnh thu được càng nét

Máy ảnh pinhole cổ điển có cấu tạo rất đơn giản

Trang 5

Do độ mở quá nhỏ, ảnh pịnhole rất rối, đòi hỏi thời gian phơi sáng dài, tùy từng hoàn cảnh mà có thể là vài giây, vài phút cho đến vài ngày Cũng do độ mở nhỏ, độ sâu trường ảnh gần như là vô hạn, độ nét ở tất cả mọi điểm trên tấm ảnh là ngang bằng nhau.Vệ mặt chất lượng, ảnh pinhole thường bị mờ, đen ở góc và sai sắc Ưu điểm duy nhất là ảnh không bị méo hình ở mọi góc độ do không chịu hiện tượng cầu sai của thấu kính.Mặc dù có rất nhiều hạn chế, nhưng ở thời đại nào, nhiếp ảnh pinhole cũng

có một lượng tín đồ nhất định

Máy ảnh DSLR với "ống kính" pinhole

Với một thân máy DSLR, nhiếp ảnh pinhole đã trở nên dễ dàng hơn rất nhiều so với thời cha ông, do những thân máy này có khả năng đo sáng tự động, dải nhạy sáng cao giúp tăng tốc độ chụp, trong một số điều kiện ánh sáng tốt có thể loại bỏ sự hỗ trợ của chân máy Nhiếp ảnh pinhole thực sự là một trải nghiệm thú vị không nên bỏ qua đối với các tay máy DSLR, khi được bỏ qua những ống kính tân tiến nhất để trở

về với “cội nguồn” nhiếp ảnh của con người.Tuy nhiên, tạo ra một tấm ảnh pinhole

có chất lượng là một việc không dễ Để tấm ảnh có độ nét cao nhất, những tay chơi pinhole chuyên nghiệp phải sử dụng những tấm kim loại dát mỏng, với “lỗ kim” cực nhỏ được đục bằng tia laser với độ chính xác cao nhất Nhưng quan trọng hơn cả vẫn

là sự kiên nhẫn và lòng đam mê của người chụp ảnh

1.2 Cảm biến máy ảnh ( CCD)

Trang 6

Camera CCD (Charge CoupleDevice) là một thiết bị thu nhận ảnh dưới dạng tín hiệu số bằng cách thu nhận cường độ sáng tại từng điểm thông qua một loại linh kiện có tên là photo diode Cường độ sáng tại mỗi điểm này sẽ được mã hoá thành 3 giá trị màu cơ bản là RED, GREEN, BLUE theo lý thuyết màu do Thomson đưa ra năm 1802 Ảnh nhận được từ Camera loại này là một ma trận Vector:

Mọi người thường hình dung CCD là một thiết bị số điển hình, song thiết bị này lại sử dụng công nghệ tương tự CCD thường có hình chữ nhật kích thước ½ inch

và 2/3 inch hoặc lớn hơn tuỳ thiết bị, bao gồm transitor MOS (metal oxide semiconductor), được sắp xếp thành ma trận Kích thước của ma trận (số lượng transitor, hay còn gọi là số pixel) xác định độ phân giải tối đa của CCD Chẳng hạn,

CCD với ma trận mỗi chiều 1280 và 1024 pixel (transistor) sẽ cho 2.048 x 1.536

=3.145.728 điểm ảnh (3,1 megapixel)

Số transitor càng lớn, CCD cho độ phân giải càng cao Do công nghệ sản xuất

vi mạch ngày càng tinh vi kích thước của transitor ngày càng nhỏ hơn, cho phép tăng

nhiệt độ transitor trên một diện tích Bởi vậy, các máy ảnh số hiện nay sử dụng CCD

có khả năng cho tới 5-6 triệu điểm ảnh

Cùng với CCD, một thiết bị điện tử khác là ADC (analog to digital converter -

bộ chuyển tín hiệu tương tự sang tín hiệu số) độc lập thực hiện chức năng chuyển đổi giá trị điện tích của các điểm trên CCD sang một giá trị số biểu thị màu tương ứng

Nếu kích thước ma trận trên CCD quyết định độ phân giải, thì ADC xác định độ sâu

màu (color depth, đo bằng bit), tức khả năng thể hiện các sắc độ màu của hình ảnh

được ghi nhận Độ sâu càng lớn, màu càng trung thực.

Trang 7

Cấu trúc của 1 CCD

Năm 1999, công ty Fuji Photo Film và Fujifilm Microdevices đã phát triển thành công thế hệ tiếp theo của CCD là Super CCD Bằng cách thay đổi hình dạng của các pixel và sắp xếp chúng lại theo cách mới, Super CCD hơn hẳn CCD ở những điểm sau:

-Nhờ diode quang có dạng bát giác và các điểm ảnh được sắp xếp theo kiểu tổ

ong, Super CCD có độ phân giải cao hơn, tỷ suất tín hiệu / nhiễu (S/N) cao hơn, vùng

màu động rộng hơn so với CCD thông thường

-Sắp xếp theo kiến trúc tổ ong phù hợp hơn với quy tắc phân bố tần số trong tự nhiên và đặc trưng trong mắt người Vì thế độ hiệu quả điểm ảnh của CCD tăng lên 1,6 lần – Super CCD 2 triệu điểm ảnh có thể tạo ảnh có chất lượng tương đương ảnh tạo ra bởi CCD 3 triệu điểm ảnh

-Kiến trúc tổ ong kết hợp với công nghệ xử lý tín hiệu cho phép hạn chế độ suy giảm chất lượng ảnh khi sử dụng chức năng phóng đại số (digital zoom)

-Kiến trúc này cho phép bỏ qua bước đọc lại dữ liệu ảnh mà không làm giảm chất lượng ảnh ; chẳng hạn cho phép xuất ra tín hiệu video chất lượng cao

-Để đáp ứng cùng chức năng, kiến trúc sử dụng CCD đơn giản hơn nhiều so

với CCD thông thường

-Super CCD tiết kiệm được năng lượng vì có khả năng ghi nhận được hình ảnh

độ phân giải cao với lượng điểm ảnh ít hơn

Hiện nay, Super CCD được sử dụng trong các loại máy ảnh số chuyên nghiệp

có độ phân giải cao (6 triệu điểm ảnh)

Một số hình minh họa cấu tạo một cảm biến ảnh:

Trang 8

a) 12.1 MegaPixels b) 6.1 MegaPixels c)3.2 MegiaPixels

Hình 3.2 Tương quan về kích thước sensor và số điểm ảnh

(Nguồn: hãng máy ảnh Canon)

Hình 3.4 Một CCD 300 KiloPixels được phóng to

Thế hệ CCD kế tiếp mang tính đột phá về công nghệ do công ty Sigma (Nhật Bản) công bố đầu năm 2002 là bộ cảm biến ảnh (image sensor) FOVEON X3, có khả năng ghi nhận tất cả màu RGB trên từng điểm ảnh (pixel) FOVEON X3 là bộ cảm biến ảnh đầu tiên trên thế giới sử dụng bộ tách sóng quang (photo-detector) 3 lớp tương tự công nghệ 3 lớp màu trên film thường Các lớp này được xếp chồng lên nhau trên một tấm silic để ghi nhận các màu RGB (Red, Green, Blue) trên từng pixel Một

lớp ghi nhận màu đỏ, một màu xanh lá, lớp còn lại màu xanh dương Nghĩa là mọi

pixel trên bộ cảm biến FOVEON X3 đều ghi nhận được tất cả màu RGB Đây là hệ thống đầu tiên có thể ghi nhận thông tin màu một cách trọn vẹn Những loại cảm biến khác chỉ sử dụng bộ tách sóng quang một lớp, nghĩa là chỉ có một bộ tách sóng quang trên pixel Để bắt màu, các pixel được tổ chức thành hệ thống lưới hoặc thể khảm (mosaic), giống như một bàn cờ ba màu Mỗi pixel chỉ bắt một màu R, G hay B Các

Trang 9

bộ lọc chỉ cho phép một bước sóng ánh sáng (R, G hay B) đi qua và đến bất kỳ pixel nào, nên nó chỉ ghi nhận được một màu ứng với bước sóng này Kết quả là bộ cảm biến mosaic chỉ có thể bắt được 25% ánh sáng màu R và màu B, và 50% ánh sáng màu G Khiếm khuyết của bộ cảm biến ảnh theo kiểu mosaic (mosaic-based image sensor) là chúng chỉ có thể ghi nhận được 1/3 màu, sau đó phải dựa vào khả năng xử

lý liên hợp để nội suy 2/3 màu bị mất Quá trình nội suy này sẽ tạo ra màu giả tạo và làm mất chi tiết của ảnh Thực tế, một số máy ảnh số dùng phương pháp làm mờ ảnh nhằm giảm bớt màu giả tạo

Hình 3.5 CCD thế hệ mới công nghệ Foveon X3 của Sigma.

Thử nghiệm cho thấy với công nghệ FOVEON X3 cho những tấm ảnh sắc nét

hơn, chi tiết màu tốt hơn và thực hơn, dù không cần phải hiệu chỉnh Máy ảnh số sử dụng công nghệ Foveon X3 không cần sức mạnh xử lý để tạo thông tin màu bị mất, giảm thiểu đòi hỏi về phần cứng, thiết kế đơn giản và tối thiểu hóa thời gian trễ giữa

hai lần bấm của máy Công nghệ Foveon X3 còn mở ra khả năng thiết kế những dòng

thiết bị thế hệ mới, không có ranh giới giữa ảnh tĩnh và video, không có sự suy giảm chất lượng Vì bộ cảm ứng ảnh dùng công nghệ Foveon X3 có thể bắt đầy đủ các màu

trên mọi pixel nên các pixel này có thể nhóm lại với nhau để tạo ra một hệ pixel lớn hơn: “siêu pixel” với đầy đủ thông tin màu Năng lực này gọi là khả năng thay đổi

điểm ảnh – Vairable Pixel Sizing (VPS), chuẩn mới đầu tiên của ảnh số Với VPS, tín

hiệu từ các nhóm pixel có thể được nối lại với nhau để máy ảnh đọc chúng như một pixel Ví dụ, một bộ cảm biến 2300 x 1500 có thể chứa trên 3,4 triệu pixel Nhưng nếu

VPS được dùng để nhóm các pixel này khối 4x4, bộ cảm biến ảnh sẽ tự điều chỉnh để

có độ phân giải 575 x 375 pixel, mỗi thành phần sẽ hơn 16 lần so với thành phần gốc

Kích cỡ và cấu hình của một nhóm pixel có thể là biến số 2x2, 4x4, 3x5 , và được điều chỉnh thông qua bộ xử lý tích hợp bên trong Foveon X3 Điều này cho phép CCD

Trang 10

có thể thu nhận bức ảnh đầy đủ màu trong điều kiện ánh sáng yếu bằng cách giảm tín

hiệu nhiễu nhờ khả năng gộp điểm ảnh Sử dụng VPS để làm giảm độ phân giải cũng cho phép bộ cảm biến chụp được số khung ảnh cao hơn, tăng tốc độ chụp mỗi tấm ảnh

Trang 11

CHƯƠNG 2: XỬ LÝ TĂNG CƯỜNG CHẤT LƯỢNG ẢNH

Trong hai thập kỉ gần đây, lọc bỏ nhiễu xung là một trong những vấn đề rất được quan tâm ở lĩnh vực xử lý ảnh Xuất phát từ nguyên nhân thực tế như lỗi trong quá trình truyền tải, trục trặc ở bộ phận cảm biến trên thiết bị thu hình kỹ thuật số,… Một bộ phận các điểm ảnh (tùy vào tỷ lệ nhiễu) sẽ biến đổi cường độ sáng, dẫn đến chất lượng ảnh bị giảm đáng kể Đối với những hệ thống xử lý ảnh số, việc lọc nhiễu, làm trơn ảnh được xem là bước tiền xử lý quan trọng và chất lượng của giai đoạn này ảnh hưởng rất lớn đến tính hiệu quả của các xử lý tiếp sau như: phân đoạn ảnh, nhận dạng đối tượng, dò tìm cạnh,…hay nói cách khác đó là quá trình nâng cao chất lượng ảnh Nâng cao chất lượng ảnh là bước cần thiết trong xử lý ảnh nhằm hoàn thiện một

số đặc tính của ảnh Nâng cao chất lượng ảnh gồm hai công đoạn khác nhau: tăng cường ảnh và khôi phục ảnh Tăng cường ảnh nhằm hoàn thiện các đặc tính của ảnh như sau :

em xin nói về phân biệt các loại nhiễu trong quá trình xử lý ảnh Trên thực tế tồn tại nhiều loại nhiễu, tuy nhiên người ta thường xem xét 3 loại nhiễu chính : nhiễu cộng, nhiễu nhân và nhiễu xung Nhiễu cộng : Nhiễu cộng thường phân bố khắp ảnh, nếu gọi ảnh quan sát (ảnh thu được) là Xqs, ảnh gốc là Xgốc, nhiễu là , ảnh thu được có thể biểu diễn bởi: Xqs = Xgốc + Nhiễu nhân : Nhiễu nhân thường phân bố khắp ảnh,

Trang 12

ảnh thu được có thể biểu diễn bởi: Xqs = Xgốc * Nhiễu xung : Nhiễu xung thường gây đột biến tại một số điểm ảnh.

2.1 Các kỹ thuật chính được dùng làm trơn ảnh

2.1.1 Làm trơn nhiễu bằng lọc tuyến tính

- Lọc trung bình (Mean Filter)

- Lọc thông thấp (Low pass Filter)

- Lọc đồng hình (Homomorphie Filter)

- Gaussian Blur

2.1.2 Làm trơn nhiễu bằng lọc phi tuyến

- Lọc trung vị (Median Filter)

- Lọc ngoài (Outlier Filter)

- Lọc loại bỏ nhiễu đốm Crimmins (Crimmins Speckle Removal)

- Bộ lọc giữ biên (Kuwahara Filter)

2.1.3.Ứng dụng của làm trơn ảnh

Xét ở khía cạnh nào đó, ta có thể nói làm trơn ảnh được ứng dụng khá phổ biến trong nhiều lĩnh vực của đời sống như giải trí, y học, an ninh và một số lĩnh vực khác… Làm trơn ảnh nếu nó đứng riêng lẻ thì hầu như không có ứng dụng gì ngoài công dụng theo nghĩa đen của nó là làm mịn ảnh, và giảm nhiễu Nhưng khi đặt nó vào trong quy trình xử lý thì nó rất quan trọng, kết quả của nó giúp các xử lý phía sau chính xác hơn Ví dụ như dò biên với thuật toán canny, trước tiên người ta sẽ dùng Gaussian để làm mịn ảnh trước giúp lọai bỏ nhiễu nhằm giúp kết quả dò biên tránh được những sai lầm do nhiễu gây ra Trong một số trường hợp, các đối tượng thông tin có cùng tính chất với nhiễu (điển hình là trong ảnh siêu âm), việc phát hiện đối tượng khác thường (detect abnormal object) và loại bỏ chúng trước khi tiến hành các

xử lý cao hơn là rất quan trọng Tùy từng đặc thù ảnh và nhiễu mà người ta chọn phương pháp, và sử dụng cửa sổ (design kernel) thích hợp nhằm đạt hiệu quả cao nhất

là loại bỏ cái cần loại, giữ lại cái cần giữ Ứng dụng vào công nghệ giám sát “camera lọc nhiễu ba chiều” nhằm tăng cường công tác bảo mật an toàn – an ninh, nếu xảy ra bất cứ một vấn đề hay sự cố gì đều được camera ghi lại, từ đó làm tư liệu, bằng chứng

để tìm ra nguyên nhân xảy ra vấn đề

Trang 13

2.4 Làm trơn nhiễu bằng lọc tuyến tính (Linear Filter)

2.4.1 Lọc trung bình không gian (Mean Filter, Average Filter)

Lọc trung bình là bộ lọc sử dụng cửa sổ lọc của lớp tuyến tính(linear class) để lọc nhiễu và làm trơn ảnh Ý tưởng cơ bản của bộ lọc này là thay thế giá trị tại mỗi điểm ảnh bằng trung bình các giá trị của các điểm lân cận nhằm loại bỏ những điểm ảnh biến đổi lớn so với điểm lân cận(nhiễu), và những điểm ảnh nằm trên biên cũng

có sự biến đổi lớn so với lân cận Chúng ta cùng xem một số ví dụ về cửa sổ lọc trong

kĩ thuật lọc trung bình

Lọc trung bình được biểu diễn bằng công thức toán học như sau:

Nếu trong kỹ thuật trên ta dùng các trọng số(của cửa sổ lọc) như nhau, phương trình trên sẽ trở thành :

Với : f(x,y) : ảnh đầu vào

g(x,y): ảnh đầu ra

a(k,l): cửa sổ lọc(mặt nạ)

Trang 14

Ưu điểm : Là bộ lọc tuyến tính đơn giản trong tính toán Ảnh đạt độ trơn mịn Khuyết điểm:Không hoàn toàn loại bỏ các tác dụng của nhiễu, các điểm ảnh đơn

lẻ(nhiễu) sẽ ảnh hưởng đến giá trị trung bình của các pixel lân cận Độ sắc nét của ảnh kém Độ tương phản thấp

2.4.2 Gaussian Blur

Gaussian blurring là cách làm mờ một ảnh bằng hàm Gaussian Phương pháp này được ứng dụng rộng rãi và hiệu quả trong các phần mềm xử lý đồ họa Nó cũng là công cụ phổ biến để thực hiện quá trình tiền xử lý hình ảnh dùng để làm dữ liệu đầu vào tốt cho các phân tích cao cấp hơn trong Computer Vision, hoặc cho các giải thuật được thực hiện trong một tỉ lệ khác của hình đã được cho Như vậy, ta có thể nói Gaussian blurr là một loại bộ lọc làm mờ ảnh, sử dụng lý thuyết hàm Gaussian(cũng được biết đến như là dạng phân tán chuẩn (Normal Distribution) trong thống kê) để tính toán việc chuyển đổi (Transformation) mỗi điểm ảnh của hình, giúp làm giảm nhiễu và mức độ chi tiết (không mong muốn) của hình ảnh Đây là phương trình hàm Gaussian (Gaussion Distribution) trong không gian một chiều

Với x, y là tọa độ theo hai trục đứng và ngang Trong không gian hai chiều, công thức này sản sinh ra những đường viền là những đường tròn đồng tâm, tuân theo logic phân tán Gausian từ điểm trung tâm Giá trị từ hệ thống phân tán này sẽ được sử dụng để xây dựng một ma trận tích chập dùng tính toán phép tích chập với ảnh gốc.Giá trị mới sau khi tính tích nhân chập với cửa sổ (kernel) đại diện cho hàm Gaussian

có thể coi là trung bình lượng giá của các điểm ảnh xung quanh nó Ta thấy rằng giá trị lượng của phần tử trung tâm kernel tương ứng với điểm ảnh đang xét là lớn nhất, giá trị này sẽ nhỏ hơn đối với các phần tử tương ứng với các điểm ảnh kế cận một

Trang 15

cách đối xứng và tỉ lệ thuận với khoảng cách của phần tử này với trung tâm Tính chất này giúp giữ lại đường viền và đường biên cũng như làm mờ một cách đồng bộ hơn so với các phương pháp khác Trong lý thuyết, hàm Gaussian tại mỗi điểm trên hình là khác 0 Điều này có nghĩa là Gaussian kernel nên có kích thước bằng với hình ảnh và giá trị tại mỗi phần luôn khác 0 Tuy nhiên trong thực hành, do việc tính toán dựa trên xấp xỉ rời rạc (Discrete Appoximation) cho nên giá trị của các phần tử trên bề mặt Gaussian ở khoảng cách lớn hơn 3σ so với trung tâm gần như không đáng kể (tiệm cận 0) Do vậy các Gaussian distribution ngoài bán kính này sẽ bị bỏ qua, đó cũng là lí

do mà thông thường Gaussian kernel có kích thước giới hạn 3, 5, 7 (Cái này tùy thuộc vào giá trị phương sai chuẩn mà bạn chọn) Khoảng cách giữa hai điểm gần nhau trong Gausssian kernel là σ

Trang 16

CHƯƠNG 3: CÁC PHƯƠNG PHÁP XỬ LÝ ẢNH CƠ BẢN

Xử lý ảnh là bước cần thực hiện trước khi đưa ra các quyết định về hình ảnh Việc sử dụng phần mềm Matlab hỗ trợ rất trong trong xử lý ảnh

3.1 Các hàm chuyển đổi kiểu ảnh:

Với các thao tác nhất định sẽ thật hữu ích khi có thể chuyển đổi ảnh từ dạng này sang dạng khác Chẳng hạn, nếu ta muốn lọc một màu ảnh được lưu trữ dưới dạng ảnh chỉ số đầu tiên ta nên chuyển đổ nó thành dạng ảnh RGB Khi ta áp dụng phép lọc tới ảnh RGB, Matlab sẽ lọc giá trị cường độ trong ảnh tương ứng Nếu ta cố gắng lọc ảnh chỉ số, Matlab đơn giản chỉ áp đặt phép lọc tới ma trận ảnh chỉ số và kết quả

sẽ không có ý nghĩa

Chú ý: Khi chuyển đổi một ảnh từ dạng này sang dạng khác, ảnh kết quả có thể khác ảnh ban đầu Chẳng hạn, nếu ta chuyển đổi một ảnh màu chỉ số sang một ảnh cường

độ, kết quả ta sẽ thu được một ảnh đen trắng

Danh sách sau đây sẽ liệt kê các hàm được sử dụng trong việc chuyển đổi kiểu ảnh:

dither: Tạo một ảnh nhị phân từ một ảnh cường độ đen trắng bằng cách

trộn, tạo một ảnh chỉ số từ một ản RGB bằng cách trộn (dither)

gray2id: Tạo một ảnh chỉ số từ một ảnh cường độ đen trắng.

grayslice: Tạo một ảnh chỉ số từ một ảnh cường độ đen trắng bằng cách đặt

ngưỡng

im2bw: Tạo một ảnh nhị phân từ một ảnh cường độ, ảnh chỉ số hay ảnh

RGB trên cơ sở của ngưỡng ánh sáng

ind2gray: Tạo một ảnh cường độ đen trắng từ một ảnh chỉ số.

ind2rgb: Tạo một ảnh RGB từ một ảnh chỉ số.

mat2gray: Tạo một ảnh cường độ đen trắng từ dữ liệu trong một ma trận bằng

cách lấy tỉ lệ giữ liệu

rgb2gray: Tạo một ảnh cường độ đen trắng từ một ảnh RGB.

rgb2ind: Tạo một ảnh chỉ số từ một ảnh RGB.

Ta cũng có thể thực hiện các phép chuyển đổi kiểu chỉ sử dụng cú pháp của Matlab Chẳng hạn, ta có thể chuyển đổi một ảnh cường độ sang ảnh RGB bằng cách ghép nối 3 phần copy của ma trận ảnh gốc giữa 3 chiều: RGB=cat(3,I,I,I );

Ảnh RGB thu được có các ma trận đồng nhất cho các mặt phẳng R, G, B vì vậy ảnh hiển thị giống như bóng xám.Thêm vào những công cụ chuyển đổi chuẩn đã nói

Trang 17

ở trên, cũng có một số hàm mà trả lại kiểu ảnh khác như một phần trong thao tác mà chúng thực hiện Chuyển đổi không gian màu.

Toolbox xử lý ảnh biểu diễn màu sắc như các giá trị RGB ( trực tiếp trong ả

ảnh chỉ số ) Tuy nhiên, có các phương pháp khác cho việc biểu diễn màu có thể được đại diện bởi các giá trị hue, saturation và các giá trị thành

Toolbox cung cấp một tập các thủ tục để chuyển đổi giữa các không gian

chúng coi dữ liệu màu sắc dưới dạng RGB tuy nhiên, ta có thể xử lý một ảnh màu khác nhau bằng cách chuyển đổi nó sang RGB sau đó chuyển đổi ảnh màu ban đầu

3.2 Chuyển đổi định dạng các file ảnh:

Để thay đổi định dạng đồ hoạ của một ảnh, sử dụng hàm imread để đọc m

hàm imwrite đồng thời chỉ ra định dạng tương ứng

Để minh hoạ, ví dụ sau đây sử dụng hàm imread để đọc một file BMP vào hàm imwrite lưu ảnh này dưới định dạng PNG

bitmap = imread('mybitmap.bmp','bmp'); imwrite(bitmap,'mybitmap.png','png');

3.3 Thay đổi kích thước ảnh

- Để thay đổi kích thước của một ảnh, sử dụng hàm imresize Sử dụng hàm này ta có thể:

+ Chỉ ra kích thước của ảnh kết quả

+ Chỉ ra phương pháp nội suy được sử dụng

+ Chỉ ra bộ lọc được sử dụng để ngăn ngừa hiện tượng răng cưa

+ Chỉ ra kích thước cho ảnh kết quả

- Sử dụng hàm imresize, ta chó thể chỉ ra kích thước của ảnh kết quả theo hai cách:+ Bằng cách chỉ ra hệ số phóng đại được sử dụng trên ảnh

+ Bằng cách chỉ ra chiều của ảnh kết quả

Sử dụng hệ số phóng đại ảnh để mở rộng một ảnh, chỉ ra hệ số phóng đại lớn hơn 1

Để thu nhỏ một ảnh, chỉ ra hệ số phóng đại nằm giữa 0 và 1 Chẳng hạn, lệnh sau tăng kích thước của ảnh I lên 1.25 lần:

Hình : Ảnh trước và sau khi imresize

I = imread('circuit.tif');

Trang 18

Chỉ định phương pháp nội suy được sử dụng.

- Theo mặc định, hàm imresize sử dụng phương pháp nội suy các pixel gần nhất (nearest – neighborinterpolation) để tính giá trị các pixel của ảnh ra Tuy nhiên, ta có thể chỉ định các phương pháp nội suy khác Bảng sau đây liệt kê các phương pháp nội suy được trợ giúp theo thứ tự của độ phức tạp

Sử dụng bộ lọc để ngăn chặn hiện tượng răng cưa

- Việc giảm kích thước (hình học) của một ảnh có thể gây ra những ảnh hưởng nhất định lên ảnh chẳng hạn như hiện tượng xuất hiện răng cưa tại biên của ảnh Điều này

là do thông tin luôn bị mất khi ta giảm kích thước một ảnh Răng cưa xuất hiện như những gợn sóng trong ảnh sau cùng

- Khi giảm kích thước của ảnh sử dụng nội suy song tuyến tính hoặc song khối, hàm imresize tự động áp đặt một bộ lọc thông thấp lên ảnh trước khi nội suy Điều này để giảm ảnh hưởng của răng cưa trong ảnh ra Ta có thể chỉ ra kích thước của bộ lọc này hoặc chỉ ra một bộ lọc khác thay thế

Chú ý: Thậm chí đã sử dụng một bộ lọc thông thấp, chất lượng của ảnh vẫn bị ảnh hưởng do thông tin luôn bị mất trong quá trình nội suy

- Hàm imresize không áp đặt một bộ lọc thông thấp lên ảnh nếu phương pháp nội suy các pixel gần nhất được sử dụng Phương pháp nội suy này ban đầu được sử dụng với các ảnh chỉ số và bộ lọc thông thấp không thích hợp cho kiểu ảnh này

- Ta cũng có thể chỉ ra một bộ lọc tự tạo thay cho các bộ lọc có sẵn

Hàm imresize

Cú pháp của hàm này như sau:

Ngày đăng: 26/06/2014, 14:19

HÌNH ẢNH LIÊN QUAN

Hình 3.4  Một CCD 300 KiloPixels được phóng to - Báo cáo xử lý ảnh nhận dạng khối cơ bản matlab
Hình 3.4 Một CCD 300 KiloPixels được phóng to (Trang 8)
Hình 3.2  Tương quan về kích thước sensor và số điểm ảnh - Báo cáo xử lý ảnh nhận dạng khối cơ bản matlab
Hình 3.2 Tương quan về kích thước sensor và số điểm ảnh (Trang 8)
Hình 3.5  CCD thế hệ mới công nghệ Foveon X3 của Sigma. - Báo cáo xử lý ảnh nhận dạng khối cơ bản matlab
Hình 3.5 CCD thế hệ mới công nghệ Foveon X3 của Sigma (Trang 9)
Hình : Ảnh trước và sau khi imresize - Báo cáo xử lý ảnh nhận dạng khối cơ bản matlab
nh Ảnh trước và sau khi imresize (Trang 17)
Hình 2: Ảnh trước và sau khi imrotate - Báo cáo xử lý ảnh nhận dạng khối cơ bản matlab
Hình 2 Ảnh trước và sau khi imrotate (Trang 20)

TỪ KHÓA LIÊN QUAN

w