1. Trang chủ
  2. » Công Nghệ Thông Tin

TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH ĐỀ TÀI: COMUTER VISION THỊ GIÁC NHÂN TẠO

56 2,5K 19

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 56
Dung lượng 2,21 MB

Nội dung

TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNHĐỀ TÀI: COMUTER VISIONTHỊ GIÁC NHÂN TẠO

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA

oOo

-TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH

ĐỀ TÀI:

COMUTER VISION THỊ GIÁC NHÂN TẠO

Giảng viên hướng dẫn : TS Ngô Văn Sỹ

Học viên thực hiện : Lý Thị Thanh Đào

Trần Nguyên Độ

Lê Xuân Đức Huỳnh Văn Đông

Đà Nẵng, 02 - 2014

Trang 2

LỜI MỞ ĐẦU

Thị giác máy là một lĩnh vực đã và đang phát triển mạnh mẽ trên thế giới hiện nay.Khái niệm về thị giác máy tính – Computer Vision có liên quan tới nhiều ngành học và cónhiều hướng nghiên cứu khác nhau

Cùng với sự phát triển của xã hội, vấn đề an ninh bảo mật ngày càng có những yêucầu khắt khe Các hệ thống xác định, nhận dạng con người được ra đời với độ tin cậy cao.Một trong những bài toán nhận dạng con người được ưa chuộng là nhận dạng thông quakhuôn mặt bởi nó chính là cách mà con người sử dụng để phân biệt lẫn nhau Bên cạnh đó,việc thu thập, xử lý thông tin qua ảnh để nhận biết đối tượng đang được quan tâm và ứngdụng rộng rãi Với phương pháp này, người ta có thể thu nhận được nhiều thông tin từ đốitượng mà không cần phải tác động nhiều tới đối tượng đó Với sự hỗ trợ của máy tính, bàitoán nhận dạng mặt người từ ảnh số đã có được môi trường phát triển thuận lợi Các hệthống nhận dạng mặt người online, offline đã ra đời và đã đạt độ tin cậy nhất định

Dựa trên các lý thuyết về xử lý ảnh số, tách mặt người và nhận dạng mặt người, nhómchúng em đã cùng nhau nghiên cứu thực hiện tiểu luận “THỊ GIÁC NHÂN TẠO” và đã thuđược một số kết quả nhất định

Nhóm chúng em xin chân thành cảm ơn thầy TS Ngô Văn Sỹ đã cung cấp cho chúng

em những kiến thức hữu ích trong môn học Xử lý ảnh số cũng như kinh nghiệm làm tiểu luận

Đà Nẵng, 27 tháng 04 năm 2014

Trang 3

MỤC LỤC LỜI MỞ ĐẦU

MỤC LỤ

Chương 1: GIỚI THIỆU VỀ THỊ GIÁC NHÂN TẠO - COMPUTER VISION 6

1.1 Các vấn đề ứng dụng 6

1.1.1 Bản xem trước của ảnh số 7

1.1.2 Truy vấn cơ sở dữ liệu ảnh 8

1.1.3 Kiểm tra bên trong đầu người 8

1.1.4 Xử lý quét các trang văn bản 9

1.1.5 Tính toán độ phủ của tuyết sử dụng ảnh vệ tinh 9

1.1.6 “Nhìn” từng bộ phận 9

1.1.7 Nhận dạng mặt người 10

1.2 Các hoạt động trong ảnh 10

1.2.1 Thay đổi những điểm ảnh trong vùng lân cận nhỏ 10

1.2.2 Tăng cường trong toàn bộ ảnh 11

1.2.3 Kết hợp nhiều ảnh 12

1.2.4 Tính năng tính toán từ một ảnh 12

1.2.5 Tách những đại diện ảnh không mang tính biểu tượng 13

1.3 Sử dụng máy tính và phần mềm 13

1.4 Các lĩnh vực liên quan 13

Chương 2: CƠ SỞ LÝ THUYẾT TẠO ẢNH VÀ BIỂU DIỄN ẢNH 14

2.1 Cảm biến ánh sáng 14

2.2 Thiết bị tạo ảnh 15

2.2.1 Cảm biến CCD 15

2.2.2 Thông tin hình ảnh 17

2.2.3 Máy quay phim 18

2.2.4 Mắt con người 18

2.3 Những vấn đề về ảnh số 19

2.3.1 Biến dạng hình học 19

2.3.2 Phân tán 20

2.3.3 Giãn nở 20

2.3.4 Các biến thể CCD 20

2.3.5 Xén hoặc bọc xung quanh 20

2.3.6 Biến dạng màu sắc 20

Trang 4

2.3.7 Hiệu ứng lượng tử 21

2.4 Hàm biểu diễn ảnh và hình ảnh kỹ thuật số 21

2.4.1 Các loại hình ảnh 21

2.4.2 Các định nghĩa 21

2.5 Định dạng ảnh số 23

2.5.1 Gọi thứ tự quét mành 24

2.5.2 Tiêu đề tập tin ảnh 24

2.5.3 Dữ liệu hình ảnh 24

2.5.4 Nén dữ liệu 25

2.5.5 Các định dạng thường được sử dụng 25

2.5.6 Ảnh nhị phân mã chạy 25

2.5.7 Bản đồ mức xám linh động 26

2.5.8 Định dạng file ảnh GIF 27

2.5.9 Định dạng tập tin ảnh TIFF 27

2.5.10 Định dạng JPEG cho hình ảnh tĩnh 27

2.5.11 Định dạng MPEG cho video 27

2.5.12 So sánh các định dạng 28

2.6 Cấu trúc 3D từ ảnh 2D 28

2.7 Năm khung tham chiếu 29

2.7.1 Điểm ảnh Coordinate Frame I 30

2.7.2 Object Coordinate Frame O 30

2.7.3 Camera Coordinate Frame C 31

2.7.4 Real Image Coordinate Frame F 31

2.7.5 World Coordinate Frame W 31

2.8 Các loại cảm biến 31

2.8.1 Microdensitometer 31

2.8.2 Magnetic Resonance Imaging (MRI) 33

2.8.3 X-ray 33

Chương 3: THIẾT KẾ CHI TIẾT VÀ TRIỂN KHAI HỆ THỐNG 34

3.1 Thu thập và tách mặt người trong ảnh 34

3.2 Chuẩn hóa ảnh 35

3.3 Cắt và xoay chuẩn ảnh 35

3.4 Trích chọn đặc tính bằng phương pháp PCA 38

3.4.1 Quá trình học 39

3.4.1.1 Chuẩn hóa ma trận ảnh 40

3.4.1.2 Tính trung bình tập ảnh đầu vào 41

Trang 5

3.4.1.3 Tính eigenface 41

3.4.2 Quá trình trích chọn đặc tính 45

3.5 Quá trình nhận dạng 46

Chương 4: CHƯƠNG TRÌNH MÔ PHỎNG 47

4.1 Lưu đồ thuật toán 47

4.2 Thực hiện chương trình 47

4.2.1 Khối chụp ảnh từ webcam và thực hiện hiệu chỉnh ảnh 47

4.2.1.1 Thực hiện chụp ảnh từ webcam 47

4.2.1.2 Thực hiện hiệu chỉnh ảnh 48

4.2.2 Khối thực hiện đọc dữ liệu cho quá trình ảnh học 48

4.2.3 Khối trích chọn đặc tính 49

4.2.3.1 Tính trung bình ảnh 49

4.2.3.2 Tính các eigenfaces 49

4.2.4 Khối nhận dạng 51

4.2.4.1 Nhận dạng 51

4.2.4.2 Tính khoản cách eucledian 52

4.2.5 Chương trình chính 53

4.3 Kết quả chương trình 55

4.3.1 Kết quả chương trình mô phỏng 55

4.3.2 Giao diện của chương trình mô phỏng 55

TÀI LIỆU THAM KHẢO 56

Trang 6

Chương 1 GIỚI THIỆU VỀ THỊ GIÁC NHÂN TẠO

COMPUTER VISION

Không còn nghi ngờ gì khi nói máy móc có thể “nhìn”, ví dụ hệ thống giám sát giaothông tự động ở những thành phố lớn trên thế giới, những máy rút tiền tự động ATM có thểquét mắt người để nhận diện chủ thẻ và những xe ô tô có thể được lái bởi một máy tính sửdụng đầu vào là một máy camera Chương này sẽ giới thiệu cái nhìn tổng thể về một số vấn

đề và phương pháp của thị giác nhân tạo

Mục tiêu của thị giác nhân tạo là đưa ra quyết định hữu ích về đối tượng vật lý vàcảnh thực dựa trên hình ảnh cảm nhận được

Để đưa ra quyết định về các đối tượng thực, việc luôn luôn cần thiết là xây dựng một

số mô tả hoặc mô hình của các đối tượng từ các hình ảnh của chúng Bởi vì điều này, nhiều

chuyên gia sẽ nói rằng “mục tiêu của thị giác nhân tạo là xây dựng bản mô tả cảnh trong những hình ảnh”

Vấn đề quan trọng được nêu ra trong chương này và nghiên cứu trong phần còn lạicủa tiểu luận bao gồm:

- Cảm biến: Làm thế nào để các cảm biến có được hình ảnh của thế giới thực? Làmthế nào để những hình ảnh mã hóa các thuộc tính của thế giới thực, chẳng hạn như vật liệu,hình dáng, ánh sáng và các mối quan hệ không gian?

- Thông tin được mã hóa: Làm thế nào để những hình ảnh mang lại thông tin hiểu thếgiới thực 3D, bao gồm cả hình học, kết cấu, chuyển động, và nhận dạng của các đối tượngtrong nó?

- Cách biểu diễn: Cách biểu diễn nào nên được sử dụng cho các mô tả lưu trữ của cácđối tượng, các bộ phận, các thuộc tính và các mối quan hệ của chúng?

- Các thuật toán: Những phương pháp nào dùng để xử lý thông tin hình ảnh và xâydựng mô tả của thế giới thực và đối tượng của nó?

Những vấn đề này sẽ được nghiên cứu trong các chương tiếp theo Trong chương nàygiới thiệu các ứng dụng và một số vấn đề quan trọng khác nảy sinh trong bối cảnh củachúng

1.1 Các vấn đề ứng dụng

Các ứng dụng của máy tính trong phân tích ảnh gần như vô hạn Chỉ một phần nhỏtrong các ứng dụng có thể trình bày ở đây nhưng chúng sẽ phục vụ cho sự chuyển động vàđịnh hướng trong các lĩnh vực nghiên cứu

Trang 7

1.1.1 Bản xem trước của ảnh số

Một ảnh kỹ thuật số có thể biểu diễn cho một phim hoạt hình, một trang văn bản,khuôn mặt của một người, một bản đồ của Katmandu, hoặc một sản phẩm mua từ một cửahàng Một ảnh kỹ thuật số chứa một số cố định hàng và cột của của những điểm ảnh, viết tắt

là các thành phần của hình ảnh Những điểm ảnh như các giá trị lượng tử vuông nhỏ thường được đánh số từ 0 đến 255, đại diện cho độ sáng tại các điểm của hình ảnh Tùythuộc vào các phương pháp mã hóa, 0 có thể là tối nhất và 255 là sáng nhất, hoặc ngược lại

Hình 1.1 Ảnh bên trái, phía trên: ảnh của một khuôn mặt.

-Ảnh giữa, phía trên: ảnh phóng to của 8x8 điểm ảnh từ vùng mắt bên phải.

Ảnh bên phải, phía trên: vị trí mắt phát hiện bởi chương trình máy tính.

Ảnh phía dưới: bảng giá trị cường độ từ ảnh phóng to 8x8.

Ảnh bên trái phía trên trong hình 1.1 là một ảnh kỹ thuật số của một khuôn mặt 257hàng (cao) và 172 cột (rộng) Ảnh ở giữa phía trên là ảnh 8x8 phóng to từ con mắt bên phảicủa ảnh bên trái Ở dưới cùng của hình là biểu diễn 64 giá trị độ sáng của các điểm ảnh trongảnh phóng to Những giá trị dưới 100 biểu diễn cho sự phản xạ thấp hơn từ độ tối của mắt,trong khi các con số cao hơn biểu diễn cho độ trắng sáng của mắt

Trang 8

1.1.2 Truy vấn cơ sở dữ liệu ảnh

Bộ nhớ số lớn, truyền tải băng thông cao và máy tính cá nhân đa phương tiện đã tạođiều kiện cho sự phát triển của cơ sở dữ liệu hình ảnh Sử dụng tốt nhiều hình ảnh hiện tạiđòi hỏi các phương pháp phục hồi tốt Các kỹ thuật cơ sở dữ liệu tiêu chuẩn áp dụng cho cáchình ảnh đã được tăng cường với các khóa văn bản, tuy nhiên, phục hồi dựa trên nội dung làcần thiết và là một chủ đề của nhiều nghiên cứu hiện nay

Hình 1.2 - Hình ảnh truy vấn (trái) và hai hình tương tự tạo ra

bởi một hệ thống cơ sở dữ liệu ảnh

1.1.3 Kiểm tra bên trong đầu người

Thiết bị ảnh cộng hưởng từ tính (MRI) có thể cảm nhận được vật liệu bên trongnhững đối tượng 3D Hình 1.3 cho thấy hình ảnh bên trong đầu người: phần sáng có liênquan đến chuyển động của vật chất, vì vậy đây thực sự là một ảnh dòng chảy của máu, cóthể “nhìn thấy” các mạch máu quan trọng

Hình 1.3 - Ảnh cộng hưởng từ (bên trái), nơi sáng liên quan đến dòng máu

và ảnh nhị phân (bên phải) kết quả từ sự thay đổi tất cả các điểm ảnh

với giá trị 208 hoặc cao hơn đến 255 và những giá trị dưới 208 đến 0.

Trang 9

Kỹ thuật thị giác máy thường được sử dụng trong phân tích hình ảnh y tế Sẽ thậttuyệt vời nếu chúng ta có thể “xem” những gì xảy ra trong não MRI có thể cảm nhận đượchoạt động hữu cơ liên quan đến quá trình suy nghĩ và điều này là một lĩnh vực hiện rất thú vịcủa nghiên cứu.

1.1.4 Xử lý quét các trang văn bản

Một vấn đề thường gặp là chuyển thông tin từ tài liệu giấy sang dạng số cho các hệthống thông tin Ví dụ, chúng ta có thể muốn tạo một cuốn sách cũ có sẵn trên Internet, hoặc

có thể cần phải chuyển đổi một kế hoạch chi tiết của một số đối tượng thành một tập tin hìnhhọc để các phần có thể được tạo bởi một công cụ bằng máy điều khiển số

1.1.5 Tính toán độ phủ của tuyết sử dụng ảnh vệ tinh

Phần lớn bề mặt trái đất được quét thường xuyên từ vệ tinh và vệ tinh truyền tải ảnh

về trái đất dưới dạng số Những hình ảnh này sau đó có thể được xử lý để trích nhiều thôngtin Ví dụ, thống kê số lượng tuyết trong lưu vực của một dòng sông có thể là quan trọng đốivới việc điều chỉnh một đập cho dòng điều khiển, cung cấp nước, hoặc môi trường sốngđộng vật hoang dã Ước tính khối lượng tuyết có thể được thực hiện bằng cách tính toán sốlượng điểm ảnh như tuyết xuất hiện trong ảnh Một điểm ảnh từ một ảnh vệ tinh có kết quả

từ cảm nhận một ô 10m x 10m của trái đất, nhưng một số vệ tinh báo cáo có thể thấy những

ô nhỏ hơn nhiều hơn thế Thông thường, ảnh vệ tinh phải được so sánh với bản đồ hoặc hìnhảnh khác để xác định điểm ảnh trong một khu vực cụ thể hoặc lưu vực sông

Máy tính được biết đến với khả năng xử lý một lượng lớn dữ liệu, chắc chắn các vệtinh quét mặt đất sẽ tạo ra một lượng lớn dữ liệu hữu ích cho nhiều mục đích Ví dụ, sốlượng và vị trí của các điểm ảnh tuyết có thể là đầu vào cho một chương trình máy tính môphỏng chế độ thủy văn của vùng đó (thông tin nhiệt độ cho khu vực là đầu vào cho chươngtrình)

Một ứng dụng khác có liên quan đang tiến hành kiểm kê các loại cây trồng và dựđoán thu hoạch

1.1.6 “Nhìn” từng bộ phận

Tại nhiều điểm của quá trình sản xuất, các bộ phận được chuyển trên băng tải hoặctrong hộp Các bộ phận phải được đặt riêng lẻ trong máy, đóng gói, kiểm tra Nếu hoạtđộng phức tạp, một robot dẫn đường có thể cung cấp một giải pháp

Hình 1.4 cho thấy ba phần trong các bộ phận của một thiết bị trong không gian làmviệc Bằng cách nhận biết các cạnh và lỗ, hệ thống thị giác của robot có thể đoán ở cả nhậndạng của một phần và vị trí của nó trong không gian làm việc Sử dụng một mô hình 3Dđược thực hiện bởi CAD (thiết kế với hỗ trợ của máy tính) cho mỗi phần dự đoán và vị trí dựđoán của nó, hệ thống thị giác sau đó so sánh các dữ liệu hình ảnh cảm nhận với một đồ họa

Trang 10

máy tính được tạo ra từ mô hình và vị trí của nó trong không gian Các vạch sáng trong hình1.4 cho thấy ba thành phần chính giữa ảnh và các mô hình của các đối tượng trong nó Cuốicùng, mắt robot có thể nói với cánh tay robot làm thế nào để nâng một phần và nơi để đặt nó.

Hình 1.4 - Việc kiểm tra, lắp ráp robot phù hợp với các mô hình lưu trữ 3D

để cảm nhận một hình ảnh 2D.

1.1.7 Nhận dạng mặt người

Nhận dạng khuôn mặt là cách dễ dàng nhất mà con người sử dụng để phân biệt nhữngngười khác nhau Tuy nhiên, công việc có thể xem là dễ dàng với con người này lại là mộtvấn đề phức tạp khi thực hiện bằng công cụ toán học

Nhận diện mặt người là một dạng của nhận diện vật mẫu (pattern recognition) dựatrên những đặc điểm của một khuôn mặt Khuôn mặt cần nhận diện được đem so sánh vớivới khuôn mặt mẫu theo một cách nào đó Kết quả của quá trình nhận diện này cho biếtkhuôn mặt có trong ảnh đầu vào là “đã được biết đến” hay “chưa được biết đến” Trong một

hệ thống điều khiển, kết quả đó sẽ được sử dụng để thực hiện các chức năng của điều khiển

1.2.1 Thay đổi những điểm ảnh trong vùng lân cận nhỏ

Giá trị điểm ảnh có thể được thay đổi theo cách thức liên quan đến một số lượng nhỏcác điểm ảnh lân cận, ví dụ như các vùng lân cận trong hàng hoặc cột liền kề Thông thườngđược cho giá trị 1 hoặc 0 trong một hình ảnh nhị phân sẽ bị đảo ngược để làm cho nó giốngnhư các vùng lân cận

Trang 11

Mục đích của hoạt động này có thể loại bỏ khả năng nhiễu từ các quá trình số hóa.Hoặc nó có thể chỉ là để đơn giản hóa nội dung hình ảnh, ví dụ như để bỏ qua hòn đảo nhỏtrong một hồ nước hoặc điểm không hoàn hảo trong một tờ giấy Hình 1.5 cho thấy một hìnhảnh nhị phân của một số các tế bào hồng cầu đã được làm sạch bằng cách loại bỏ các khuvực nhỏ trong một nền lớn hơn.

Hình 1.5 - (trên cùng bên trái) Ảnh nhị phân qua kính hiển vi của các tế bào máu: kết quả

từ việc loại bỏ vùng tối nhỏ trong vùng sáng hoặc ngược lại; (dưới) mẫu cho thấy cách vùng

lân cận điểm ảnh có thể được làm sạch

1.2.2 Tăng cường trong toàn bộ ảnh

Một số hoạt động xử lí toàn bộ hình ảnh theo một cách thống nhất Các hình ảnh cóthể quá tối (giá trị độ tối đa của nó là 120), vì vậy tất cả các giá trị độ tối có thể được nhân 2

để cải thiện sự hiển thị

Nhiễu hoặc chi tiết không cần thiết có thể được loại bỏ bằng cách thay thế giá trị củamỗi điểm ảnh đầu vào với mức trung bình của tất cả chín điểm ảnh trong khu vực gần nhấtcủa nó

Ngoài ra, các chi tiết có thể được tăng cường bằng cách thay thế mỗi giá trị điểm ảnhbởi sự tương phản giữa nó và các vùng lân cận

Hình 1.6 cho thấy một tính toán đơn giản tương phản áp dụng tại tất cả các điểm ảnhcủa một ảnh đầu vào Lưu ý làm thế nào các ranh giới của hầu hết các đối tượng được pháthiện tốt Các kết quả hình ảnh đầu ra từ các tính toán chỉ thực hiện trên các vùng 3x3 đườnglân cận của hình ảnh đầu vào

Một hình ảnh được chụp bằng ống kính và muốn tạo ra một hình ảnh đầu ra với độbiến dạng ít hơn Trong trường hợp này, phải "di chuyển" các giá trị điểm ảnh đến các địađiểm khác trong hình ảnh di chuyển đến gần hơn với trung tâm hình ảnh

Trang 12

Hình 1.6 - Độ tương phản trong hình ảnh bên trái được thể hiện trong hình ảnh bên phải Trên 10% điểm ảnh về độ tương phản được làm sáng trong khi thấp hơn 90% được thực

hiện tối Tương phản là tính từ khu vực 3x3 của mỗi điểm ảnh.

1.2.3 Kết hợp nhiều ảnh

Một hình ảnh có thể được tạo ra bằng cách thêm hoặc trừ đi hai hình ảnh đầu vào.Hình ảnh trừ nhau thường được sử dụng để phát hiện sự thay đổi theo thời gian Hình 1.7cho thấy hai hình ảnh của một bộ phận chuyển động và hình ảnh khác do trừ đi giá trị điểmảnh tương ứng của hình ảnh thứ hai từ những hình ảnh đầu tiên Hình ảnh trừ nắm bắt đượcranh giới của các đối tượng di chuyển, nhưng không hoàn hảo (các giá trị âm, điểm ảnhkhông được sử dụng, tất cả những không thay đổi đã được lưu lại trong hình ảnh đầu ra)

Hình 1.7 – Hình ảnh của một bộ phận chuyển động (trái và trung tâm)

và một ảnh khác (bên phải) nắm bắt được ranh giới của phần này.

1.2.4 Tính năng tính toán từ một ảnh

Tổng quát trong bài toán tính lỗ, các vùng mang giá trị 0 tương ứng với lỗ hổng trongquá trình kiểm tra có thể là hình ảnh của các đối tượng, thường được gọi là các đốm màu.Tính năng quan trọng có thể là diện tích trung bình đối tượng, chu vi … Chúng ta có thểmuốn đầu ra các tính năng quan trọng riêng cho mỗi đối tượng phát hiện

Trang 13

1.2.5 Tách những đại diện ảnh không mang tính biểu tượng

Hoạt động cấp cao hơn thường trích xuất đại diện của hình ảnh mà không mang tínhbiểu tượng, đó là, cấu trúc dữ liệu không giống như một hình ảnh

1.3 Sử dụng máy tính và phần mềm

Máy vi tính là kì diệu cho tính toán chính xác của thông tin định lượng Gần đây, với

bộ nhớ khổng lồ và bộ vi xử lý có tốc độ cao, người ta có thể tính toán với những hình ảnhbằng nhiều cách khác nhau Cách đơn giản nhất là có một chương trình có thể thực hiện rấtnhiều các hoạt động hình ảnh Thư viện phần mềm có sẵn nhiều chương trình con để xử lýhình ảnh: người dùng viết một chương trình ứng dụng trong đó gọi các thư viện để thực hiệncác hoạt động cần thiết trên dữ liệu hình ảnh

Hầu hết các công ty bán các thiết bị đầu vào cho thị giác máy cũng cung cấp các hoạtđộng cho thư viện hình ảnh và thậm chí cả các chương trình điều khiển với giao diện ngườidùng đồ họa đẹp (GUI) Phần cứng chuyên dụng có sẵn để tăng tốc hoạt động của hình ảnh

có thể mất nhiều giây, hoặc thậm chí vài phút, trên một bộ xử lý mục đích chung

Các máy tính song song được thiết kế với nhiệm vụ chính là xử lý hình ảnh Thôngthường, phần cứng chỉ cần thiết cho tốc độ xử lí cao hoặc phản ứng thời gian thực

Ngôn ngữ lập trình đặc biệt với các hình ảnh và các hoạt động hình ảnh như ngôn ngữcấp thấp đã được xác định, đôi khi, những điều này đã được kết hợp với các hoạt động đểđiều khiển một robot công nghiệp Ngày nay, có rất nhiều chương trình có thể xử lý hình ảnhtốt và sẽ được thực hiện bằng một ngôn ngữ phổ biến cho nhiều mục đích, chẳng hạn như C,

và một máy tính đa mục đích có sẵn

1.4 Các lĩnh vực liên quan

Thị giác máy tính có liên quan đến nhiều ngành khác Đầu tiên, điều quan trọng làphải phân biệt giữa xử lý hình ảnh và sự hiểu biết hình ảnh Xử lý hình ảnh chủ yếu liênquan tới việc chuyển đổi hình ảnh thành nhiều ảnh, trong khi đó, sự hiểu biết hình ảnh liênquan đến việc ra quyết định dựa trên hình ảnh và xây dựng một cách rõ ràng các mô tả cảnhcần thiết để làm như vậy Xử lý ảnh được sử dụng phổ biến trong hỗ trợ của sự hiểu biếthình ảnh

Việc xử lý hình ảnh thường được dựa trên mô hình của một hình ảnh như là một hàmliên tục f(x, y) của hai thông số không gian x và y hoặc các mô hình của một hình ảnh như làmột mảng 2D rời rạc I[r, c] mẫu số nguyên về độ sáng tối

Nhận thức tâm lý con người rất quan trọng vì hai lý do, đầu tiên, bức ảnh cho ngườidùng phải nắm các đặc tính của khách hàng, và thứ hai, nghiên cứu về khả năng của conngười trong sự hiểu biết hình ảnh có thể hướng dẫn sự phát triển của chúng ta về các thuậttoán

Trang 14

Chương 2

CƠ SỞ LÝ THUYẾT TẠO ẢNH VÀ BIỂU DIỄN ẢNH

Chúng ta lấy được rất nhiều thông tin về thế giới thông qua cảm giác thị giác Ánhsáng phản chiếu đối tượng và thông qua các đối tượng để tạo ra một hình ảnh trên võng mạccủa mắt Từ những hình ảnh này cho ta hình dung về cấu trúc của môi trường 3D Các thànhphần quan trọng là: (a) một cảnh của các đối tượng, (b) chiếu sáng của các đối tượng, và (c)cảm nhận được ánh sáng phản chiếu của các đối tượng

Mục đích chính của chương này là để mô tả cách tạo ra hình ảnh cảm biến kỹ thuật sốcủa cảnh 2D hoặc 3D Các loại bức xạ khác nhau phản xạ hoặc thâm nhập vào các đối tượngtrong thế giới vật chất có thể được cảm nhận bởi thiết bị hình ảnh Hình ảnh kỹ thuật số 2D

là một loạt các mẫu cường độ phản xạ hoặc truyền qua các đối tượng Hình ảnh này được xử

lý bởi một máy tính hoặc chương trình máy tính để đưa ra quyết định về những cảnh

Thông thường, một hình ảnh 2D đại diện cho một phóng chiếu của một cảnh 3D, đây

là đại diện phổ biến nhất được sử dụng trong thị giác máy và trong cuốn sách này Cuốichương này, chúng tôi thảo luận một số mối quan hệ giữa các cấu trúc trong thế giới 3D vàcấu trúc trong hình ảnh 2D

2.1 Cảm biến ánh sáng

Lịch sử khoa học cho biết về sự tiến bộ của các thiết bị tạo ra để cảm biến và sản xuấtcác loại khác nhau của bức xạ điện từ, chẳng hạn như sóng radio, tia X, lò vi sóng … Hóachất trong các thụ thể của mắt người là nhạy cảm với bức xạ (ánh sáng) với các bước sóngkhác nhau, từ khoảng 400nm (màu tím) đến 800 nm (màu đỏ) Cảm biến CCD có thể cảmnhận bước sóng dài hơn 800 nanomet (hồng ngoại) Có các thiết bị để phát hiện chiều dài rấtngắn X-quang và những người mà phát hiện sóng radio Bước sóng khác nhau của bức xạ cótính chất khác nhau, ví dụ như chụp X-quang có thể xuyên qua xương con người trong khibước sóng dài hơn tia hồng ngoại có thể không thâm nhập ngay cả những đám mây

Hình 2.1 - Phản ánh của bức xạ nhận được từ một nguồn duy nhất của chiếu sáng

Trang 15

Hình 2.1 cho thấy một mô hình đơn giản của nhiếp ảnh thông thường: một yếu tố bềmặt, được chiếu sáng bởi một nguồn duy nhất (mặt trời hoặc một bóng đèn flash) phản chiếubức xạ về phía máy ảnh, mà giác quan của nó qua các hóa chất trên phim Bước sóng trongphạm vi kết quả ánh sáng tạo ra hoặc phản ánh cơ chế rất gần bề mặt của đối tượng Kỹ thuậtứng dụng đòi hỏi phải có một số kiến thức của vật liệu được cảm biến và bức xạ và sử dụngcảm biến.

2.2 Thiết bị tạo ảnh

Có nhiều thiết bị khác nhau tạo ra hình ảnh kỹ thuật số Chúng khác nhau về hiệntượng cảm nhận cũng như trong thiết kế điện tử Một số cảm biến sẽ được mô tả trongchương này Mục đích của chúng tôi là để tiết lộ những khía cạnh quan trọng trong chứcnăng và khái niệm của mỗi cảm biến, để lại thông tin kỹ thuật nhất để đọc bên ngoài

2.2.1 Cảm biến CCD

Hình 2.2 cho thấy một máy ảnh được xây dựng sử dụng thiết bị công nghệ tích điệnkép (CCD), thiết bị đầu vào linh hoạt nhất và phổ biến cho các hệ thống thị giác máy Máyảnh CCD là rất nhiều như một máy ảnh phim 35mm thường được sử dụng cho các bức ảnhgia đình, ngoại trừ trên mặt phẳng ảnh, thay vì bộ phim hóa học phản ứng với ánh sáng, các

tế bào trạng thái rắn nhỏ chuyển đổi năng lượng ánh sáng thành điện tích Mỗi tế bào chuyểnđổi năng lượng ánh sáng mà nó nhận được vào điện tích

Hình 2.2 - Máy ảnh CCD (Thiết bị tích điện kép) phản xạ hình ảnh một chiếc bình, các cell rời rạc chuyển đổi năng lượng ánh sáng thành điện tích, được biểu diễn

như là con số nhỏ khi đầu vào với một máy tính.

Tất cả các tế bào đầu tiên được xóa về 0, và sau đó họ bắt đầu tích hợp vào các hoạtđộng năng lượng ánh sáng chiếu vào chúng Một màn trập có thể có hoặc có thể không cầnthiết để kiểm soát thời gian cảm biến Mặt phẳng ảnh hoạt động như một bộ nhớ kỹ thuật số

có thể được đọc từng hàng của một quá trình đầu vào máy tính Con số này cho thấy mộtmáy ảnh đơn giản

Trang 16

Nếu hình ảnh kỹ thuật số có kích thước 500 dòng và 500 cột của các giá trị màu xám,một mảng bộ nhớ của một phần tư của một triệu byte thu được Một máy ảnh CCD đôi khicắm vào một máy tính bảng, được gọi là một cài đặt đơn giản khung, trong đó có bộ nhớ chohình ảnh và có thể kiểm soát của máy ảnh Thiết kế mới hiện nay cho phép truyền thông kỹthuật số trực tiếp (ví dụ như sử dụng các tiêu chuẩn IEEE 1394) Ngày nay, các nhà sản xuấtmáy ảnh lớn cung cấp máy ảnh kỹ thuật số có thể lưu trữ một vài chục hình ảnh trong bộnhớ trong thân máy, một số chứa một đĩa mềm cho mục đích này Những hình ảnh này cóthể là đầu vào cho chế biến máy tính bất cứ lúc nào

Hình 2.3 phác họa một hệ thống máy tính toàn bộ với cả hai đầu vào và đầu ra máyảnh đồ họa

Hình 2.3 - Vai trò trung tâm của bộ đệm khung trong xử lý hình ảnh.

Đây là một hệ thống điển hình làm nhiệm vụ tầm nhìn hoặc công việc chụp ảnh ykhoa Nó cũng là điển hình cho các máy tính đa phương tiện, trong đó có thể có một máyảnh rẻ tiền có sẵn để có hình ảnh cho các mục đích teleconferencing Vai trò của một bộ đệmkhung hình như một cửa hàng hình ảnh tốc độ cao là trung tâm ở đây: máy ảnh cung cấp mộthình ảnh đầu vào được lưu trữ ở dạng kỹ thuật số trong bộ đệm khung hình sau tương tự đểchuyển đổi kỹ thuật số mà nó có sẵn để hiển thị cho người sử dụng và chế biến bằng cáchcác thuật toán máy tính khác nhau Bộ đệm khung hình thực sự có thể lưu trữ nhiều hình ảnhhoặc các dẫn xuất của họ

Hình 2.4 - mảng hình học: (a) tròn, (b) thẳng tuyến tính, (c) ROSA.

Trang 17

có ống kính ở tất cả

Một máy ảnh CCD thường sẽ sử dụng cùng một loại ống kính như máy ảnh phim35mm được sử dụng cho các bức ảnh gia đình Một ống kính duy nhất với hai bề mặt lồiđược thể hiện trong hình 2.2, nhưng ống kính thực tế nhất là hợp chất với hơn hai bề mặtkhúc xạ Có hai điểm rất quan trọng được thực hiện Đầu tiên, ống kính là một ánh sáng thuánh sáng đạt đến điểm hình ảnh thông qua toàn bộ một hình nón của các tia đạt ống kính từđiểm 3D Ba tia được thể hiện quy hoạch từ đầu của bình hoa trong hình 2.2, chúng xác địnhnhững thái cực của hình nón của các tia thu thập bởi các ống kính chỉ trên cùng của chiếcbình Một hình nón tương tự như tia tồn tại cho tất cả các điểm trường khác Vì sự khônghoàn hảo hình học trong ống kính, uốn khác nhau của màu sắc khác nhau của ánh sáng, vàcác hiện tượng, hình nón của các tia thực sự kết quả trong một đêm hoặc tại chỗ mờ trên mặtphẳng ảnh được gọi là vòng tròn của sự nhầm lẫn Thứ hai, các mảng cảm biến CCD đượcxây dựng từ các đơn vị vật lý rời rạc, do đó, mỗi tế bào cảm biến tích hợp các tia nhận được

ở nhiều điểm lân cận của một bề mặt 3D Hai hiệu ứng làm mờ hình ảnh và độ sắc nét hạnchế của nó và kích thước của các chi tiết cảnh nhỏ nhất có thể được cảm nhận

Mảng CCD được sản xuất trên chip thường dài khoảng 1cm x 1cm Nếu mảng có640x480 điểm ảnh hoặc 512x512 điểm ảnh, mỗi điểm ảnh có chiều rộng thực tế của khoảng0,001 inch Có những cách hữu ích khác của việc đặt các tế bào cảm biến CCD trên mặtphẳng ảnh (hoặc dòng hình ảnh) như thể hiện trong hình 2.4 Một mảng tuyến tính có thểđược sử dụng trong trường hợp chúng ta chỉ cần đo chiều rộng của các đối tượng hoặc nơichúng tôi có thể chụp ảnh và kiểm tra một trang web liên tục của vật liệu do bởi máy ảnh.Với một mảng tuyến tính, 1000 đến 5000 điểm ảnh có sẵn trong một hàng duy nhất Mộtmảng như vậy có thể được sử dụng mà cảm biến tuyến tính được chuyển qua các tài liệuđược quét như thực hiện với một máy quét cầm tay hoặc máy quét cơ khí chính xác cao,chẳng hạn như tại máy quét dạng phẳng

Hiện nay, nhiều máy quét dạng phẳng có sẵn cho một vài trăm đô la và được sử dụng

để có được hình ảnh kỹ thuật số từ các bức ảnh màu hoặc phương tiện truyền thông in ấn.Ống kính hình trụ thường được sử dụng để tập trung một dòng trong thế giới thực vào mảngCCD tuyến tính Mảng tròn sẽ được thuận tiện để kiểm tra quay số tương tự như trên đồng

hồ đo tốc độ hoặc đối tượng được đặt cẩn thận liên quan đến máy ảnh và các mảng tròn được

Trang 18

quét để kiểm tra hình ảnh của kim Phân vùng ROSA thú vị thể hiện trong hình 2.4 cung cấpgiải pháp phần cứng để tích hợp tất cả các năng lượng ánh sáng chiếu vào một trong hai lĩnhvực hoặc ban nhạc của vòng tròn Nó được thiết kế cho lượng tử hóa phổ sức mạnh của hìnhảnh một, nhưng có thể có sử dụng đơn giản khác.

2.2.3 Máy quay phim

Máy quay phim tạo ra hình ảnh bằng cách tạo ra các khung hình với tốc độ 30 hìnhmỗi giây, cho phép một đại diện của đối tượng chuyển động theo thời gian, thêm vào cáctính năng không gian thể hiện trong những hình ảnh đơn hoặc khung Để tạo ra cảm giácchuyển động mịn cho người xem, 60 nửa khung hình mỗi giây được sử dụng: những khunghình một nửa là tất cả các hàng hình ảnh kỳ lạ tiếp theo tất cả các hàng hình ảnh thậm chíliên tiếp thay thế Một tín hiệu âm thanh cũng được mã hóa

Hình 2.5 - Bản phác thảo thô của mắt người như máy ảnh.

Khung của một chuỗi phim được phân cách bởi các dấu hiệu và một số chương trìnhnén ảnh được sử dụng để giảm dung lượng hình ảnh Các tiêu chuẩn truyền hình tương tự đãđược thiết kế cẩn thận để đáp ứng nhiều yêu cầu: các tính năng thú vị nhất cho phép các tínhiệu tương tự được sử dụng cho màu hoặc TV trắng đen và mang theo âm thanh hoặc vănbản tín hiệu là tốt

Công nghệ máy ảnh CCD cho máy thị giác đôi khi bị tiêu chuẩn màn hình hiển thịđược thiết kế cho người sử dụng Đầu tiên, xen kẽ các khung chẵn/lẻ trong một chuỗi video,không cần thiết để tạo ra một hình ảnh mịn như để người một con người cảm nhận đượcnhư là trên thiết bị máy thị giác Thứ hai, nhiều mảng CCD đã có điểm ảnh với tỷ lệ 4:3 củachiều rộng và chiều cao vì hầu hết các màn hình cho con người có một tỷ lệ kích thước 4:3.Điểm ảnh vuông và một tham số quy mô duy nhất sẽ được hưởng lợi thị giác máy

2.2.4 Mắt con người

Mắt người có một camera hình cầu với một ống kính tiêu cự 20mm ở bên ngoài tậptrung các hình ảnh trên võng mạc là đối diện với ống kính và cố định bên trong của mặt cầunhư hình 2.5 Mống mắt kiểm soát lượng ánh sáng truyền qua ống kính bằng cách kiểm soát

Trang 19

kích thước của động tử Mỗi mắt có một trăm triệu tế bào thụ thể - khá nhiều so với mộtmảng CCD điển hình Hơn nữa, võng mạc không tập trung đều với các tế bào cảm biến Mộtkhu vực gần trung tâm của võng mạc, được gọi là hố mắt, có nồng độ rất dày đặc của các thụthể màu sắc, được gọi là tế bào hình nón Cách xa trung tâm, mật độ của tế bào hình nóngiảm trong khi mật độ của các thụ thể đen-trắng, tế bào hình que tăng lên.

Các giác quan mắt người có ba cường độ màu sắc riêng biệt cho ba thành phần củamột bề mặt hình ảnh điểm duy nhất trên hố mắt, bởi vì ánh sáng nhận được từ chỗ đó rơi vào

3 loại tế bào hình nón Mỗi loại hình nón có một sắc tố đặc biệt nhạy cảm với bước sóng củaánh sáng trong một phạm vi nhất định Một trong những đặc tính hấp dẫn nhất của con ngườimắt não là khả năng nhận thức suốt một thế giới 3D liên tục và ổn định ngay cả khi mắtthường xuyên di chuyển Những lực kéo của mắt là cần thiết cho nhận thức thị giác conngười thích hợp Một phần đáng kể của não người là tham gia vào xử lý tín hiệu vào thị giác

2.3 Những vấn đề về ảnh số

Một số vấn đề ảnh hưởng đến quá trình cảm nhận, một số quan trọng nhất trong số đóđược liệt kê dưới đây Hiệu quả tổng thể của sự kết hợp của những vấn đề này là một hìnhảnh mà có một số biến dạng trong cả hình học và cường độ của nó

2.3.1 Biến dạng hình học

Biến dạng hình học có mặt trong một số cách trong quá trình chụp ảnh Ống kính cóthể không hoàn hảo để các chùm ánh sáng được thu thập từ một yếu tố bề mặt cảnh không bịcong chính xác như dự định Hình ảnh bị méo thường được quan sát cho các ống kính độ dàitiêu cự nhỏ, đường thẳng ở ngoại vi của cảnh xuất hiện từ trung tâm của hình ảnh khi hiểnthị ở bên phải trong hình 2.6

Hình 2.6 - Hình ảnh cho thấy biến dạng khác nhau.

(Trái) Grey mức cắt trong A/D chuyển đổi xảy ra tại giao lộ của một số sọc sáng; (Trung tâm) nở làm tăng cường độ tại các vùng lân cận của điểm ảnh sáng;

(Phải) méo thường được quan sát thấy khi ống kính có độ dài tiêu cự ngắn hạn

Trang 20

2.3.2 Phân tán

Chùm bức xạ có thể uốn cong hoặc phân tán bởi môi trường mà họ đi qua Hình ảnhtrên không và vệ tinh đặc biệt dễ bị ảnh hưởng như vậy, đó là do hơi nước hoặc nhiệt độ choống kính giống như đặc điểm khí quyển

I2[r, c] = s[r, c] I1[r, c] + t[r, c] Trong một trường hợp xấu, các mảng CCD có thể có một số

tế bào chết mà không cho phản ứng nào cả Khuyết tật như vậy có thể được phát hiện qua sựkiểm tra: một biện pháp khắc phục phần mềm là giao phản ứng của tế bào chết là bằng trungbình của những tế bào lân cận

2.3.5 Xén hoặc bọc xung quanh

Trong chuyển đổi tương tự sang kỹ thuật số, một cường độ rất cao có thể được cắt bớtmột giá trị tối đa, hoặc, thứ tự bit cao của nó có thể bị mất, làm cho giá trị được bao bọcxung quanh vào một số mã hóa cho một cường độ thấp hơn Kết quả của bọc xung quanhđược nhìn thấy trong một hình ảnh màu xám quy mô như một vùng sáng với một lõi tối hơn,trong một hình ảnh màu sắc nó có thể dẫn đến một sự thay đổi đáng chú ý trong màu sắc.Hình ảnh ở bên trái trong hình 2.6 cho thấy bọc xung quanh: một số nút giao của đường sángkết quả trong những điểm ảnh nào đậm hơn so với hai dòng

2.3.6 Biến dạng màu sắc

Bước sóng khác nhau của ánh sáng bị bẻ cong khác nhau bởi một ống kính (chỉ sốkhúc xạ của ống kính thay đổi theo bước sóng) Kết quả là, năng lượng trong các bước sóngánh sáng khác nhau từ vị trí cùng một cảnh thực sự có thể hình ảnh một vài điểm ảnh ngoàitrên các máy dò Ví dụ, hình ảnh của một ranh giới đen-trắng rất sắc nét ở ngoại vi của cảnh

có thể dẫn đến một đoạn đường của sự thay đổi cường độ trải rộng trên nhiều điểm ảnh tronghình ảnh

Trang 21

2.3.7 Hiệu ứng lượng tử

Quá trình số hóa thu thập một mẫu của cường độ từ một khu vực riêng biệt của cảnh

và ánh xạ tới một trong một tập hợp rời rạc của các giá trị màu xám và do đó dễ bị trong cảviệc trộn và các vấn đề làm tròn

2.4 Hàm biểu diễn ảnh và hình ảnh kỹ thuật số

2.4.1 Các loại hình ảnh

Trong tính toán với các hình ảnh, thuận tiện để làm việc với cả các khái niệm về hìnhảnh tương tự và hình ảnh kỹ thuật số Chức năng hình ảnh là một mô hình toán học thườngđược sử dụng trong phân tích rất hiệu quả để xem xét các hình ảnh như một hàm hai biến.Tất cả các phân tích chức năng sau đó có sẵn để phân tích hình ảnh Hình ảnh kỹ thuật sốchỉ là một mảng hình chữ nhật 2D của các giá trị rời rạc Cả hai không gian hình ảnh vàphạm vi cường độ được lượng tử hóa thành một tập hợp rời rạc của các giá trị, cho phéphình ảnh được lưu trữ trong một cấu trúc bộ nhớ máy tính 2D Nó được phổ biến để ghi lạicường độ như một số 8-bit (1 byte) cho phép các giá trị từ 0 đến 255 256 cấp độ khác nhauthường là tất cả các độ chính xác có sẵn từ các cảm biến và thường là đủ để đáp ứng người

sử dụng Ví dụ, một hình ảnh có thể được công bố trong một chương trình C như I[512][512] Mỗi điểm ảnh của một hình ảnh màu sẽ yêu cầu 3 giá trị đó Trong một số ứng dụng y

tế, mã hóa 10-bit được sử dụng, cho phép 1024 giá trị cường độ khác nhau

Các định nghĩa sau đây được dùng để làm rõ các khái niệm quan trọng và còn để thiếtlập ký hiệu sử dụng trong suốt cuốn sách này Chúng tôi bắt đầu với một khái niệm lý tưởngcủa một hình ảnh tương tự được tạo ra bởi một hệ thống quang học lý tưởng, chúng tôi giảđịnh để có độ chính xác vô hạn Hình ảnh kỹ thuật số được hình thành bằng cách lấy mẫuhình ảnh này tương tự tại các địa điểm rời rạc và đại diện cho cường độ tại một vị trí nhưmột giá trị riêng biệt Tất cả các hình ảnh thực tế bị ảnh hưởng bởi quá trình vật lý hạn chế

độ chính xác trong cả hai vị trí và cường độ

Trang 22

một điểm ảnh để các tế bào mảng chứa các mẫu cường độ được đưa ra trong hình ảnh bênphải.

- Hàm biểu diễn hình ảnh: là một đại diện toán học hàm f(x, y) của một bức hình nhưmột hàm hai biến trong không gian x và y Trong đó, x và y là các giá trị thực xác định vị trícủa điểm ảnh và f(x, y) giá trị xác định cường độ của điểm ảnh tại điểm (x, y)

Hình 2.7 – Các hệ thống phối hợp khác nhau cho ảnh:

(a) raster oriented sử dụng hàng và cột phối hợp bắt đầu tại [0,0] từ trên cùng bên trái; (b) Cartesian phối hợp các khung [0,0] dưới cùng bên trái; (c) Cartesian phối hợp các khung [0,0] tại trng tâm ảnh; (d) Mối liên hệ giữa điểm ảnh trung tâm [x,y]

dến các phần tử mẫu trong mảng phần tử I[i,j]

- Hình ảnh màu trắng đen: là một hình ảnh kỹ thuật số đơn sắc I[r, c] với một giá trịcường độ cho mỗi điểm ảnh

- Hình ảnh đa phổ: là một hình ảnh 2D M[x, y] trong đó có một vector của các giá trịtại mỗi điểm không gian hoặc điểm ảnh Nếu hình ảnh thực sự là một hình ảnh màu sắc, sau

đó các vector có 3 yếu tố

- Hình ảnh nhị phân: là hình ảnh kỹ thuật số với tất cả các giá trị điểm ảnh 0 hoặc 1

- Hình ảnh được dán nhãn: là một hình ảnh kỹ thuật số L[r, c] có giá trị điểm ảnh làbiểu tượng từ một bảng chữ cái hữu hạn Giá trị biểu tượng của một điểm ảnh biểu thị kếtquả của một số quyết định cho điểm ảnh đó Khái niệm liên quan là hình ảnh theo chủ đề vàhình ảnh màu giả

Hệ tọa độ phải được sử dụng để giải quyết từng điểm ảnh của một hình ảnh, hoạtđộng trên nó trong một chương trình máy tính, để đề cập đến nó trong một công thức toánhọc, hoặc để giải quyết nó liên quan đến tọa độ thiết bị Hệ thống khác nhau được sử dụngtrong cuốn sách này và những nơi khác được thể hiện trong hình 2.7

Trang 23

- Lượng tử hoá hình ảnh và đo lường không gian: Mỗi điểm ảnh của một hình ảnh kỹthuật số đại diện cho một mẫu của một số khu vực nguyên tố của các hình ảnh thực sự nhưđược thể hiện trong hình 2.8 Nếu các điểm ảnh được chiếu từ mặt phẳng ảnh lại ra nguồnnguyên liệu trong hiện trường, sau đó kích thước của yếu tố đó cảnh là độ phân giải danhnghĩa của cảm biến

Hình 2.8 – 4 ảnh kỹ thuật số của 2 khuôn mặt: (a) 127 hàng x 176 cột; (b) (126x176) được tạo ra bằng cách lấy trung bình mỗi 2x2 điểm cạnh nhau từ ảnh (a); (c) (124x176) được tạo

ra giống cách trên từ (b); (120x176) được tạo ra bằng cách trên từ ảnh (c).

Ví dụ, nếu một tờ giấy vuông 10 inch được chụp ảnh để tạo thành một hình ảnh kỹthuật số 500x500, sau đó độ phân giải danh nghĩa của cảm biến là 0,02 inch Khái niệm này

có thể không có ý nghĩa nếu cảnh có rất nhiều sự thay đổi chiều sâu, từ độ phân giải danhnghĩa sẽ thay đổi theo chiều sâu và định hướng bề mặt Có giải pháp của một bộ cảm biến cóliên quan đến độ chính xác của nó trong việc đưa ra các phép đo không gian hoặc trong việcphát hiện các tính năng tốt (với việc sử dụng cẩn thận, và một số thông tin mô hình, mộthình ảnh 500x500 điểm ảnh có thể được sử dụng để thực hiện đo đạc với độ chính xác 1phần trong 5000, được gọi là độ phân giải phụ của điểm ảnh)

- Độ phân giải: là hiện tượng của một bộ cảm biến CCD kích thước của các yếu tốcảnh hình ảnh cho một điểm ảnh trên mặt phẳng ảnh

- Tầm nhìn của một bộ cảm biến (FOV): là kích thước của khung cảnh mà nó có thểcảm nhận được, ví dụ 10 inch 10 inch Vì điều này có thể thay đổi với chiều sâu, nó có thể

có ý nghĩa hơn để sử dụng lĩnh vực góc nhìn, chẳng hạn như 55 độ đến 40 độ

- Điểm ảnh hỗn hợp là một điểm ảnh có cường độ đại diện cho một mẫu từ một hỗnhợp các loại vật liệu trong thế giới thực

2.5 Định dạng ảnh số

Hình ảnh kỹ thuật số được sử dụng phổ biến rộng rãi trong truyền thông, cơ sở dữliệu, thị giác máy và các định dạng tiêu chuẩn đã được phát triển để các phần cứng và phần

Trang 24

mềm khác nhau có thể chia sẻ dữ liệu Hình 2.9 minh họa những tình huống này Thật khôngmay, có hàng chục định dạng ảnh khác nhau vẫn còn sử dụng Một vài phần trong số nhữngphần quan trọng nhất được thảo luận tóm tắt trong phần này Một hình ảnh chưa xử lý có thểchỉ là một chuỗi các byte mã hóa các điểm ảnh trong các bậc hàng-hàng.

Hình 2.9 - Nhiều thiết bị hoặc chương trình ứng dụng tạo ra, hoặc chuyển đổi dữ liệu hình ảnh.Tiêu chuẩn định dạng tập tin hình ảnh(IFS) là cần thiết để tạo ra chương trình của các

thiết bị trong gia đình.

2.5.1 Gọi thứ tự quét mành

Thứ tự quét mành có lẽ với sự nhảy dòng phân chia hàng Thông tin như loại hìnhảnh, kích thước, thời gian thực hiện, và phương pháp tạo ảnh không phải là phần của mộthình ảnh thô Thông tin như vậy có thể được viết tay trên một nhãn hoặc trên máy tính xáchtay trong nghiên cứu của một ai đó

Các chi tiết dưới đây sẽ cung những thông tin cần thiết cho xử lý hình ảnh Mặc dùcác công nghệ thay đổi nhanh chóng nhưng một số khái niệm chung vẫn là nền tảng cơ bảncủa xử lý định dạng ảnh

2.5.2 Tiêu đề tập tin ảnh

Một tiêu đề tập tin là cần thiết để tạo một tập tin tự mô tả hình ảnh do vậy công cụ để

xử lý hình ảnh có thể làm việc với nó Các tiêu đề nên bao gồm không gian hình ảnh, loại,ngày tạo ra, và một số loại tiêu đề Nó cũng có thể chứa một bảng màu hoặc bảng mã hóađược sử dụng để giải thích các giá trị điểm ảnh Một tính năng tốt không thường có sẵn, baogồm việc ghi chú về cách thức hình ảnh được tạo ra vàxử lý

2.5.3 Dữ liệu hình ảnh

Một số định dạng có thể chỉ xử lý hạn chế về loại hình ảnh, chẳng hạn như nhị phân

và đơn sắc, tuy nhiên, con người đã tiếp tục phát triển bao gồm nhiều loại hình ảnh và các

Trang 25

tính năng Giới hạn kích thước điểm ảnh và kích thước hình ảnh thông thường khác nhaugiữa các định dạng tập tin khác nhau Một số định dạng có thể xử lý một chuỗi các khung.Các định dạng đa phương tiện đang phát triển và bao gồm các dữ liệu hình ảnh cùng với cácvăn bản, đồ họa, âm nhạc …

2.5.4 Nén dữ liệu

Nhiều định dạng cung cấp cho việc nén các dữ liệu hình ảnh, do vậy tất cả các giá trịđiểm ảnh không được mã hóa trực tiếp Nén hình ảnhcó thể làm giảm kích thước của mộthình ảnh đến 30% hoặc thậm chí 3% kích thước thô của nó tùy thuộc vào chất lượng yêu cầu

và phương pháp sử dụng Nén có thể không làm giảm chất lượng hay không làm mất dữ liệuhoặc làm giảm chất lượng hay là làm mất mát dữ liệu Với nén không làm mất mát dữ liệu,hình ảnh ban đầu có thể được phục hồi một cách chính xác Với nén làm mất dữ liệu, cácđiểm ảnh đại diện không thể được phục hồi một cách chính xác: đôi khi sự mất mát chấtlượng có thể cảm nhận được, nhưng không phải luôn luôn như thế Để thực hiện nén, tập tinhình ảnh phải bao gồm một số thông tin về phương pháp nén và các thông số Phần lớn hìnhảnh kỹ thuật số là rất khác từ các thông tin kỹ thuật sốmang tính biểu tượng - mất hoặc thayđổi một vài bit của dữ liệu hình ảnh kỹ thuật số sẽ có một vài hoặc không ảnh hưởng đếnngười dùng, bất kể cho dù đó là một con người hay máy Tình hình là khá khác nhau cho hầuhết các tập tin máy tínhkhác nhau

2.5.5 Các định dạng thường được sử dụng

Một số hình ảnh có định dạng GIF, JPG hoặc thậm chí định dạng PS Một số đượcquét từ những bức ảnh và định dạng kỹ thuật số ban đầu của nó là GIF hay TIFF Xử lý hìnhảnh có thể được thực hiện bằng cách sử dụng công cụ đơn giản hoặc phức tạp hoặc chươngtrình C, C ++ Một số các định dạng thông dụng nhất được tóm tắt như mô tả dưới đây Địnhdạng tập tin hình ảnh đồ họa vẫn đang tiến triển với xu hướng mở rộng hơn

2.5.6 Ảnh nhị phân mã chạy

Mã hóa chạy là một chương trình mã hóa hiệu quả cho nhị phân hoặc hình ảnh đượcdán nhãn: nó không chỉ làm giảm không gian bộ nhớ, mà còn có thể tăng tốc độ hoạt độnghình ảnh, chẳng hạn như thiết lập các hoạt động Mã hóa chạy làm việc tốt khi có rất nhiềuđiểm ảnh dư thừa trong mỗi hàng của hình ảnh

Giả sử một hình ảnh nhị phân, mỗi hàng của hình ảnh, chúng ta có thể ghi lại các số 0theo sau các số 1 xen kẽ luân phiên trên toàn bộ hàng Hình 2.10 cho thấy một ví dụ

Mã chạy B thể hiện trên hình vẽ cho thấy một cách mã hóa nhỏ gọn hơn của chỉ chạy

1 từ đó chúng ta vẫn có thể khôi phục lại hàng ban đầu Mã hóa chạy thường được sử dụngcho việc nén trong tập tin định dạng tiêu chuẩn

Trang 26

Hình 2.10 - Mã hóa chạy liên tiếp các giá trị 0 hoặc 1, và đối với một số lĩnh vực

nó mang lại một hình ảnh nén hiệu quả

2.5.7 Bản đồ mức xám linh động

Một trong những định dạng tập tin đơn giản nhất để lưu trữ và trao đổi dữ liệu hìnhảnh là PBM hoặc họ các định dạng bản đồ bit (PBM /PGM, PPM) Tiêu đề hình ảnh vàthông tin điểm ảnh được mã hóa trong ASCII Tập tin hình ảnh đại diện là một hình ảnh 8hàng x 16 cột với giá trị màu xám tối đa là 192 được thể hiện trong hình 2.11 Hai biểu diễn

đồ họa cũng được hiển thị, mỗi đầu ra của công cụ chuyển đổi hình ảnh áp dụng cho đầu vàovăn bản gốc Hình ảnh ở bên trái thấp hơn đã được thực hiện bằng cách tái tạo các điểm ảnh

để tạo ra một hình ảnh lớn hơn với 32 hàng x 64 cột; hình ảnh ở phía dưới bên phải đượcthực hiện bởi tiền chuyển đổi sang định dạng JPG với nén mất mát dữ liệu Mục tiêucủa tậptin PGM là giá trị Magic “P2" như trong ví dụ, chỉ ra cách các thông tin hình ảnh được mãhoá (mức độ màu xám ASCII trong ví dụ của chúng ta) Nhị phân, chứ không phải là mã hóađiểm ảnh ASCII có sẵn cho hình ảnh lớn (các con số kỳ diệu cho nhị phân là “P4")

Hình 2.11 - Tập tin văn bản (ASCII) đại diện cho một hình ảnh của từ “Hi”, 64 là mức nền,

128 là mức độ của “H” và phần dưới của “i”,và 192 là mức độ chấm của “I” Ở dưới bên trái là một hình ảnh in được làm từ các văn bản trên tập tin sử dụng định dạng công cụ chuyển đổi hình ảnh Ở phía dưới bên phải là một hình ảnh được thực hiện bằng cách sử

dụng thuật toán nén mất mát dữ liệu.

Trang 27

2.5.8 Định dạng file ảnh GIF

Định dạng ảnh GIF (Graphics Interchange Format) được sử dụng để mã hóa một sốlượng lớn các hình ảnh trên www hoặc trong cơ sở dữ liệu hiện tại Tập tin GIF là tương đối

dễ dàng để làm việc, nhưng không thể được sử dụng cho màu sắc có độ chính xác cao, vì chỉ

có 8-bit được sử dụng để mã hóa màu sắc 256 giá trị màu có sẵn là thường đầy đủ hình ảnhhiển thị trên màn hình máy tính; một lựa chọn 16 màu nhỏ gọn hơn cũng có thể được sửdụng

2.5.9 Định dạng tập tin ảnh TIFF

TIFF hoặc TIF là rất chung chung và rất phức tạp Nó được sử dụng trên tất cả cácnền tảng phổ biến và thường là định dạng được sử dụng bởi máy quét scanner TIFF hỗ trợnhiều hình ảnh với 1 đến 24 bit màu cho mỗi điểm ảnh Tùy chọn có sẵn cho cả nén mất máthay không mất mát dữ liệu

2.5.10 Định dạng JPEG cho hình ảnh tĩnh

Mục đích chính của JPEG (JFIF /JFI/JPG) là cung cấp cho việc nén ảnh màu tĩnh chấtlượng cao Các chương trình mã hóa JPEG là chuỗi định hướng và cho phép phần cứng thờigian thực để mã hóa và giải mã Một hình ảnh có thể có đến 64k x 64k điểm ảnh với mỗiđiểm ảnh là 24 bit, mặc dù chỉ có mỗi hình ảnh trên một tập tin Tiêu đề có thể chứa mộthình ảnh thu nhỏ lên đến 64k không nén byte JPEG độc lập với hệ thống mã hóa màu sắc,

đó là một lợi thế lớn Để đạt được nén cao, một cách linh hoạt, chương trình mã hóa mất dữliệu phức tạp được sử dụng thường có thể nén một hình ảnh chất lượng cao tỉ lệ 20:01 màkhông làm giảm đáng kể chất lượng ảnh Nén làm việc tốt khi hình ảnh có một vùng rộnglớn màu sắc gần như không đổi và khi trong khu vực có thay đổi với tần số cao những chitiết nhỏ là không quan trọng đối với người sử dụng (JPEG cũng có thể được tùy chọn sửdụng nén không giảm chất lượng, mà có thể đạt được 02:01 nén sử dụng mã hóa tiên đoán).JPEG không được thiết kế cho video

2.5.11 Định dạng MPEG cho video

MPEG (MPG/MPEG-1/MPEG-2) là một dòng theo định hướng chương trình mã hóacho video, audio, văn bản và đồ họa “MPEG” là viết tắt của Motion Picture Experts Group,một tập đoàn quốc tế đại diện của ngành công nghiệp và chính phủ Các họ MPEG tiêuchuẩn hiện đan phát triển nhanh chóng cùng với công nghệ máy tính và truyền thông.MPEG-1 được thiết kế chủ yếu cho các hệ thống đa phương tiện và cung cấp cho một tốc độnén là 0,25Mbit mỗi giây cho tập tin âm thanh và nén 1,25Mbits cho tập tin video Các tốc

độ này phù hợp với các công cụ đa phương tiện phổ biến cho máy tính cá nhân, nhưng làquá thấp cho truyền hình chất lượng cao Tiêu chuẩn MPEG-2 cung cấp tốc độ tới15Mbitmỗi giây để xử lý kịp với tốc độ của truyền hình độ nét Các chương trình nén có lợi thế về

Trang 28

cả hai không gian dư thừa, như được sử dụng trong định dạng JPEG, và dư thừa thời gian vàthường cung cấp một tỉ lệ nén hữu ích 25:1, với tỷ lệ có thể 200:1.

Hình 2.12 - Kích thước tập tin (theo byte) cho những bức ảnh giống nhau và được định dạng theo những phương pháp mã hóa khác nhau: mã hóa mức xám 8x16 hình ảnh

“HI” thể hiện trong hình 2.11 và màu 347x489 hình ảnh“Cars”.

Nhiều khu vực không thay đổi nhiều từ một khung kế tiếp và một chương trình mãhóa chỉ có thể mã hóa thay đổi và thậm chí dự đoán khung hình từ khung trước và sau trongcác chuỗi video (phiên bản tương lai của chuẩn này sẽ có thể mã hóa cho các đối tượng đượcnhận ra và mã chương trình tạo ra hình ảnh của nó) Chất lượng truyền thông được xác địnhtại thời điểm mã hóa Motion JPEG là một chương trình lai mà chỉ áp dụng nén ảnh JPEGsang những khung hình video đơn lẻ và không tận dụng lợi thế của sự dư thừa thời gian.Trong khi mã hóa và giải mã đơn giản hóa sử dụng Motion JPEG, nén không phải là tốt, vìvậy bộ nhớ sử dụng và truyền tải sẽ kém hơn so với các video MPEG

2.5.12 So sánh các định dạng

Hình 2.12 so sánh một số định dạng hình ảnh phổ biến về kích thước lưu trữ Các cộtbên trái của bảng áp dụng cho bức ảnh nhỏ 8x16 thang đo hình ảnh mức xám “Hi”, trong khicột bên phải được áp dụng cho hình ảnh màu 489x 347 Nó có thể có được những hình ảnhkích thước khác nhau cho cùng một bức ảnh ảnh bằng cách sử dụng trình tự của chuyển đổiđịnh dạng khác nhau Ví dụ, tập tin CARS.TIF đầu ra từ máy quét là 509253 byte, trong khichuyển đổi sang một tập tin GIF với chỉ 256 màu cần 138267 byte, và một tập tin TIF yêucầu 171430 byte Tập tin TIF cuối cùng này có ít bit trong các mã màu, nhưng dường như làchất lượng là như nhau khi xem trên các màn hình CRT Một phần ba kích thước tập tinJPEG cũng được hiển thị giống nhau Trong khi nén mất mát dữ liệu JPEG có lợi thế rõ ràng

Ngày đăng: 17/05/2014, 14:35

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
2. Kresimir Delac,Mislav Grgic and Marian Stewart Bartlett “Recent Advances in Face Recognition” Croatia, November 2008 Sách, tạp chí
Tiêu đề: Recent Advances in Face Recognition
3. Kresimir Delac & Mislav Grgic, “Face Recognition”, I-Tech Education & Publishing Sách, tạp chí
Tiêu đề: Face Recognition
4. Matthew Turk and Alex Penland, “Eigenface For Regconition”, Journal of Cognitive Neuroscience, March 1991 Sách, tạp chí
Tiêu đề: Eigenface For Regconition
5. M. Turk and A. Pentland, “Eigenfaces for recognition,” Journal of Cognitive Neu- roscience , vol. 3, no. 1, pp. 71–86, 1991 Sách, tạp chí
Tiêu đề: Eigenfaces for recognition
6. Vaishark Belle, “Detection and Recognition of Human Faces using Random Forests for a Mobile Robot”, Master’s thesis, Aachen, 2008 Sách, tạp chí
Tiêu đề: Detection and Recognition of Human Faces using Random Forests for a Mobile Robot
7. Matthew A.Turk and Alex P.Pentland, “Face Recognition Using Eigenfaces”, Massachusettes Institute of Technology Sách, tạp chí
Tiêu đề: Face Recognition Using Eigenfaces
8. Rafael C.Gonzalez and Richard E.Woods and Steven L.Eddins, “Digital Image Processing Using Matlab” Sách, tạp chí
Tiêu đề: Digital Image Processing Using Matlab
1. Bài giảng Xử lý Ảnh Số, TS Ngô Văn Sỹ. , Đại Học Bách Khoa Đà Nẵng Khác

HÌNH ẢNH LIÊN QUAN

Hình 1.1 - -Ảnh bên trái, phía trên: ảnh của một khuôn mặt. - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 1.1 -Ảnh bên trái, phía trên: ảnh của một khuôn mặt (Trang 6)
Hình 1.2 - Hình ảnh truy vấn (trái) và hai hình tương tự tạo ra - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 1.2 Hình ảnh truy vấn (trái) và hai hình tương tự tạo ra (Trang 7)
Hình 1.3 - Ảnh cộng hưởng từ (bên trái), nơi sáng liên quan đến dòng máu - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 1.3 Ảnh cộng hưởng từ (bên trái), nơi sáng liên quan đến dòng máu (Trang 8)
Hình 1.4 cho thấy ba phần trong các bộ phận của một thiết bị trong không  gian làm việc - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 1.4 cho thấy ba phần trong các bộ phận của một thiết bị trong không gian làm việc (Trang 9)
Hình 1.5 -  (trên cùng bên trái) Ảnh nhị phân qua kính hiển vi của các tế bào máu:  kết quả từ việc loại bỏ vùng tối nhỏ trong vùng sáng hoặc ngược lại; (dưới) mẫu - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 1.5 (trên cùng bên trái) Ảnh nhị phân qua kính hiển vi của các tế bào máu: kết quả từ việc loại bỏ vùng tối nhỏ trong vùng sáng hoặc ngược lại; (dưới) mẫu (Trang 11)
Hình 1.7 – Hình ảnh của một bộ phận chuyển động (trái và trung tâm) - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 1.7 – Hình ảnh của một bộ phận chuyển động (trái và trung tâm) (Trang 12)
Hình 1.6 - Độ tương phản trong hình ảnh bên trái được thể hiện trong hình ảnh bên  phải - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 1.6 Độ tương phản trong hình ảnh bên trái được thể hiện trong hình ảnh bên phải (Trang 12)
Hình 2.2 - Máy ảnh CCD (Thiết bị tích điện kép) phản xạ hình ảnh một chiếc bình,  các cell rời rạc chuyển đổi năng lượng ánh sáng thành điện tích, được biểu diễn - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 2.2 Máy ảnh CCD (Thiết bị tích điện kép) phản xạ hình ảnh một chiếc bình, các cell rời rạc chuyển đổi năng lượng ánh sáng thành điện tích, được biểu diễn (Trang 17)
Hình 2.3 - Vai trò trung tâm của bộ đệm khung trong xử lý hình ảnh. - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 2.3 Vai trò trung tâm của bộ đệm khung trong xử lý hình ảnh (Trang 18)
Hình 2.4 - mảng hình học: (a) tròn, (b) thẳng tuyến tính, (c) ROSA. - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 2.4 mảng hình học: (a) tròn, (b) thẳng tuyến tính, (c) ROSA (Trang 18)
Hình 2.5 - Bản phác thảo thô của mắt người như máy ảnh. - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 2.5 Bản phác thảo thô của mắt người như máy ảnh (Trang 20)
Hình 2.6 - Hình ảnh cho thấy biến dạng khác nhau. - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 2.6 Hình ảnh cho thấy biến dạng khác nhau (Trang 22)
Hình 2.7 – Các hệ thống phối hợp khác nhau cho ảnh: - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 2.7 – Các hệ thống phối hợp khác nhau cho ảnh: (Trang 25)
Hình ảnh kỹ thuật số được sử dụng phổ biến rộng rãi trong truyền thông, cơ - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
nh ảnh kỹ thuật số được sử dụng phổ biến rộng rãi trong truyền thông, cơ (Trang 27)
Hình 2.11 - Tập tin văn bản (ASCII) đại diện cho một hình ảnh của từ “Hi”, 64 là  mức nền, 128 là mức độ của “H” và phần dưới của “i”,và 192 là mức độ chấm của - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 2.11 Tập tin văn bản (ASCII) đại diện cho một hình ảnh của từ “Hi”, 64 là mức nền, 128 là mức độ của “H” và phần dưới của “i”,và 192 là mức độ chấm của (Trang 30)
Hình  2.12 - Kích thước tập tin (theo byte) cho những bức ảnh giống nhau và  được định dạng theo những phương pháp mã hóa khác nhau: mã hóa mức xám  8x16 hình ảnh “HI” thể hiện trong hình 2.11 và màu 347x489 hình ảnh“Cars” - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
nh 2.12 - Kích thước tập tin (theo byte) cho những bức ảnh giống nhau và được định dạng theo những phương pháp mã hóa khác nhau: mã hóa mức xám 8x16 hình ảnh “HI” thể hiện trong hình 2.11 và màu 347x489 hình ảnh“Cars” (Trang 31)
Hình 2.13- Một cảnh phức tạp với nhiều loại tín hiệu độ sâu cho nhận thức của con - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 2.13 Một cảnh phức tạp với nhiều loại tín hiệu độ sâu cho nhận thức của con (Trang 33)
Hình 2.14 - Năm tọa độ khung hình cần thiết cho phân tích cảnh 3D: thế giới W,  đối tượng O (đối với kim tự tháp Op hoặc khối Ob), máy ảnh C, hình ảnh thực sự F - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 2.14 Năm tọa độ khung hình cần thiết cho phân tích cảnh 3D: thế giới W, đối tượng O (đối với kim tự tháp Op hoặc khối Ob), máy ảnh C, hình ảnh thực sự F (Trang 34)
Hình 2.16 - (trái) Chiếu cường độ tối đa (MIP) được thực hiện bằng cách chiếu các  điểm ảnh sáng tối từ một tập hợp các slices MRA từ một đầu của con người; (phải)  một máy tính tạo ra hình ảnh hiển thị điểm ảnh ba chiều mật độ cao của một tập - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 2.16 (trái) Chiếu cường độ tối đa (MIP) được thực hiện bằng cách chiếu các điểm ảnh sáng tối từ một tập hợp các slices MRA từ một đầu của con người; (phải) một máy tính tạo ra hình ảnh hiển thị điểm ảnh ba chiều mật độ cao của một tập (Trang 38)
Hình 3.1 - Quá trình thu thập và tách đối tượng khỏi ảnh. - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 3.1 Quá trình thu thập và tách đối tượng khỏi ảnh (Trang 39)
Hình 3.2 - Khối chuẩn hóa ảnh - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 3.2 Khối chuẩn hóa ảnh (Trang 40)
Hình 3.3 - Xác định vùng mắt bằng phân tích lược đồ mức xám - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 3.3 Xác định vùng mắt bằng phân tích lược đồ mức xám (Trang 41)
Hình 3.7 - Xoay chuẩn đối tượng theo góc α    Chuẩn sáng ảnh - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 3.7 Xoay chuẩn đối tượng theo góc α Chuẩn sáng ảnh (Trang 43)
Hình 3.8 - Kết quả cân bằng mức xám, biểu đồ sau khi mức xám phân bố - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 3.8 Kết quả cân bằng mức xám, biểu đồ sau khi mức xám phân bố (Trang 44)
Hình 3.9 -  Sơ đồ bên trong khối Trích chọn đặc tính sử dụng PCA - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 3.9 Sơ đồ bên trong khối Trích chọn đặc tính sử dụng PCA (Trang 45)
Hình 3.10 - Các ảnh học của bộ dữ liệu 1 - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 3.10 Các ảnh học của bộ dữ liệu 1 (Trang 46)
Hình 3.11 - Chuẩn hóa ma trận ảnh - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 3.11 Chuẩn hóa ma trận ảnh (Trang 47)
Hình 3.13 - Biều đồ giá trị riêng của ma trận hiệp phương sai. - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 3.13 Biều đồ giá trị riêng của ma trận hiệp phương sai (Trang 49)
Hình 3.14 - 34 eigenfaces tìm được - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 3.14 34 eigenfaces tìm được (Trang 50)
Hình 3.15 - Biều đồ  giá trị riêng của ma trận hiệp phương sai. - TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO
Hình 3.15 Biều đồ giá trị riêng của ma trận hiệp phương sai (Trang 50)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w