1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu

86 520 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 86
Dung lượng 1,34 MB

Nội dung

Như vậy, mục tiêu của xử lý ảnh có thể phân làm ba hướng như sau: ■ Xử lý ảnh ban đầu để có được một ảnh mới theo yêu cầu xác định ví dụ như ảnh mờ cần xử lý để được ảnh rõ hơn, lọc nhiễ

Trang 1

LỜI CẢM ƠN

Trong thời gian thực hiện luận văn thạc sỹ em đã nhận được rất nhiều

sự khích lệ, động viên, giúp đỡ tò phía thầy cô, cha mẹ và bạn bè xung quanh

Em xin bày tỏ lòng biết ơn chân thành nhất tới thầy giáo, PGS TS Ngô Quốc Tạo, người đã trực tiếp hướng dẫn em hoàn thành luận văn thạc sỹ này.

Cảm ơn đề tài: " Hệ thống đeo tay hỗ trợ đọc sách tiếng Việt dành cho người khiếm thị” Mã số VAST01.07/15-16 hỗ trợ trong thực hiện luận văn.

Em xin gửi lời cảm ơn chân thành tới các thầy cô trong trường Đại học

Sư phạm Hà Nội 2

Em đã cố gắng học tập và hoàn thành luận văn thạc sỹ nhưng có thể luận văn thạc sỹ vẫn còn thiếu sót Em rất mong nhận được sự góp ý, chỉ bảo của các thầy cô và các bạn để luận văn thạc sỹ hoàn thiện hơn

Hà nội, ngày 01 tháng 07 năm 2015

Tác giả luận văn

Nguyễn Đức Toàn

Trang 2

LỜI CAM ĐOAN

Tôi xin cam đoan rằng số liệu và kết quả nghiên cứu trong luận văn này

là trung thực và không trùng lặp với các đề tài khác Tôi cũng xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc

Hà nội, ngày 01 tháng 07 năm 2015

Tác giả luận văn

Nguyễn Đức Toàn

Trang 3

MỤC LỤC

MỞ ĐÀU 8

1 Lý do chọn đề tà i 8

2 Mục đích nghiên cứu 8

3 Nhiệm vụ nghiên cứu 8

4 Đổi tượng và phạm vỉ nghiên cứu 9

5 Phương pháp nghiên cứu 9

CHƯƠNG 1: KHÁI NIỆM VÈ PHÂN ĐOẠN ẢNH 11

1.1 Xử lý ảnh, các vấn đề Ctf bản trong xử lý ảnh 11

1.2 Quá trình xử lý ảnh 11

12.1 Thu nhận ảnh (Image Acquisition) 13

12.2 Tiền xử lý (Image Processing) 14

12.3 Phân đoạn (Segmentation) hay phân vùng ảnh 14

12.4 Biểu diễn ảnh (Image Representation) 15

1.2.5 Nhận dạng và nội suy ảnh (Image Recognition and Interpretation) 15

12.6 Cơ sở tri thức (Knowledge Base) 16

1.2.7 Mô tả ảnh 16

1.3 Phân đoan ảnh 19

13.1 Điểm ảnh (Picture Element) 19

13.2 Độ phân giải của ảnh 20

1.3.3 Mức xám của ảnh 20

13A Quan hệ giữa các điểm ảnh 21

1.3.4.1 Các lân cận của điểm ảnh (Image Neighbors) 21

1.3.4.2 Khoảng cách giữa các điểm ảnh 22

1.3.4.3 Các thành phần cơ bản của hệ thống xử lý ảnh 24

1.3.5 Những vấn đề khác trong xử lý ảnh 25

Trang 4

1.3.5.L Biến đổi ảnh Ợmage Transform) 25

13.5.2 Nén ảnh 25

I.3.5.3 Các định dạng cơ bản trong xử lý ảnh 26

CHƯƠNG 2: PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH 27

Trộn các vùng 38

2.1 Phương pháp phân đoạn ảnh dựa trên miền đồng nhất 47

2.1.1 Phương pháp tách cây tứ phân 48

2.1.2 Phương pháp cục b ộ 50

2.2 Phương pháp phân đoạn ảnh dựa trên LPB (Local Binary Pattern-Mẩu nhị phân cục bộ) 52

2.2.1 LBP trong miền không gian 53

2.2.2 LBP spatỉotemporal 55

2.2.3 Mô tả mặt bằng LBP 57

2.2.4 Mở rộng và các ứng dụng 59

2.3 Phưong pháp phân đoạn ảnh dựa trên Histogram (Ngưỡng) 60

23.1 Thao tác vói ảnh nhị phân 70

23.1.1 Điểm ảnh và các điểm láng riềng 70

2.3.1.2 Connected components labeling 71

2.3.1.3 Xác định số từ trong ảnh tài liệu 78

CHƯƠNG 3: ỨNG DỤNG PHÂN ĐOẠN CHO ẢNH TÀI LIỆU 80• • •

3.1 Yêu cầu bài toán: Giải quyết bài viết của học sinh 80

3.2 Cách giải quyết yêu cầu của bài toán 80

3.3 Xây dựng DEMO 80

3.3.1 Giao diên chính; 80

3.3.2 Nhập hình ảnh 81

3.3.3 Sử dụng thuật toán Gray 81

3.3.4 Sử dụng thuật toán Segmentation 82

Trang 5

3.3.5 Sử dụng thuật toán Sobel 82

3.4 So sánh với ảnh phong cảnh 83

3.4.1 Giao diên chính 83

3.4.2 Nhập hình ảnh 83

3.4.3 Sử dụng thuật toán Gray 84

3.4.4 Sử dụng thuật toán Segmentatìon 84

3.4.5 Sử dụng thuật toán Sobel 85

KẾT LUÂN VÀ KIẾN NGHI 86 • •

TÀI LIỆU THAM KHẢO 87

Trang 6

DANH MỤC BẢNG

Hình 2.1 Các phương pháp phân đoạn ảnh 28

Bảng 2.2.ƯU nhược điểm của các phương pháp phân vùng 28

Bảng 2.3 Bảng tra màu 33

Bảng 2.3 Biểu đồ tần xuất histogram của ảnh 1 61

Bảng 2.4 : Định nghĩa thành phần liên thông 72

Bảng 2.5 Anh nhị phân và nhãn của các thành phần 72

Bảng 2.6 Cấu trúc Union - Find với hai tập nhãn 73

Bảng 2.7 Giả mã cho thủ tục Find 74

Bảng 2.8 : Giả mã cho thủ tục Union 74

Bảng 2.9 Giả mã thuật toán và gán nhãn cho các thành phần liên thông 76

Bảng 2.10 ứng dụng thuật toán gán nhãn cho các thành phần liên thông 78

Trang 7

DANH MỤC HÌNH

Hình 2.1 Các phương pháp phân đoạn ảnh 28

Bảng 2.2.ƯU nhược điểm của các phương pháp phân vùng 28

Bảng 2.3 Bảng tra màu 33

Bảng 2.3 Biểu đồ tần xuất histogram của ảnh 1 61

Bảng 2.4 : Định nghĩa thành phần liên thông 72

Bảng 2.5 Anh nhị phân và nhãn của các thành phần 72

Bảng 2.6 Cấu trúc Union - Find với hai tập nhãn 73

Bảng 2.7 Giả mã cho thủ tục F ind 74

Bảng 2.8 : Giả mã cho thủ tục Union 74

Bảng 2.9 Giả mã thuật toán và gán nhãn cho các thành phần liên thông 76

Bảng 2.10 ứng dụng thuật toán gán nhãn cho các thành phần liên thông 78

Trang 8

MỞ ĐẦU

1 Lý do chọn đề tài

Trong những năm gần đây công nghệ thông tin phát triển với tốc độ nhanh chóng Sự phát triển của công nghệ thông tin đã thúc đẩy sự phát triển của nhiều lĩnh vực xã hội khác như: y học, giáo dục, giải trí, kinh tế

Lĩnh vực xử lý ảnh cũng như công nghệ thực tại ảo đã ra đòi và thâm nhập mạnh mẽ vào đời sống của con người

Ảnh thu được sau qua trình thu nhận ảnh hoặc các phép biến đổi không tránh khỏi nhiễu hoặc khuyết thiếu Sự sai sót này một phần bởi các thiết bị quang học và điện tò, phần khác bởi bản thân các phép biến đổi không phải là toàn ánh, nên có sự ánh xạ thiếu hụt đến những điểm trên ảnh kết quả

Việc khắc phục các nhược điểm này luôn là vấn đề đặt ra cho các hệ thống xử lý ảnh vì vậy các nhà khoa học đã phân đoạn ảnh ra để làm rõ nét hơn cho bức ảnh cần xử lý và tăng cường nâng cao chất lượng ảnh

Xuất phát trong hoàn cảnh đó “Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu” được em chọn làm đề tài.

2 Mục đích nghiên cứu

Tìm hiểu tổng quan về phân đoạn ảnh, các phương pháp phân đoạn ảnh

và chọn ra phương pháp phân đoạn ảnh cụ thể

Trên cơ sở các kiến thức đã thu thập và nghiên cứu, tổng hợp các kỹ thuật để hướng đến các ứng dụng thực tế phân đoạn cho ảnh tài liệu

3 Nhiệm vụ nghiên cứu

Tìm hiểu khái niệm phân đoạn ảnh

Các phương pháp phân đoạn ảnh

ứng dụng phương pháp phân đoạn cho ảnh tài liệu

Trang 9

4 Đối tượng và phạm vỉ nghiên cứu

Đối tượng, phạm vi nghiên cứu về tổng quan về phân đoạn ảnh, các phương pháp phân đoạn ảnh và chọn ra phương pháp phân đoạn cho ảnh cụ thể và các ứng dụng thực tế phân đoạn cho ảnh tài liệu

5 Phương pháp nghiên cứu

Thu thập tài liệu, phân tích, suy luận, tổng hợp, đánh giá Từ đó đề xuất

nghiên cứu và tìm hiểu: “Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài ỉỉệu”.

Trang 10

NÔI DUNG Chương 1: Khái nỉệm về phân đoạn ảnh

1.1 Xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh

1.2 Quá trình xử lý ảnh

1.3 Phân đoạn ảnh

Chương 2: Phương pháp phân đoạn ảnh

2.1 Phương pháp phân đoạn ảnh dựa trên miền đồng nhất

2.2 Phương pháp phân đoạn ảnh dựa trên LBP (Local Binary Pattern)( Mẩu nhị phân cục bộ)

2.3 Phương pháp phân đoạn ảnh dựa trên Histogram (Ngưỡng)

Chương 3: ứng dụng phương pháp phân đoạn cho ảnh tài liệu.

- Yêu cầu bài toán: Giải quyết bài viết của học sinh

- Đặc thù của ảnh sau khi phân đoạn: là ảnh đen trắng (ảnh đơn màu)

- Thử nghiệm với các dữ liệu

Trang 11

CHƯƠNG 1: KHÁI NIÊM VÈ PHÂN ĐOAN ẢNH • • 1.1 Xử lý ảnh, các vấn đề Ctf bản trong xử lý ảnh.

Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng

vai trò quan trọng nhất Xử lý ảnh là một lĩnh vực mang tính khoa học và

công nghệ Những năm trở lại đây với sự phát triển của phần cứng máy tính,

xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người và máy

Quá trình xử lý ảnh là một quá trình thao tác nhằm phân tích, biến đổi một ảnh đầu vào để đưa ra một kết quả mong muốn Kết quả của quá trình xử

lý ảnh có thể là một ảnh tốt hơn hoặc một kết luận Điều này tùy thuộc vào mục đích yêu cầu của quá trình Như vậy, mục tiêu của xử lý ảnh có thể phân làm ba hướng như sau:

■ Xử lý ảnh ban đầu để có được một ảnh mới theo yêu cầu xác định (ví

dụ như ảnh mờ cần xử lý để được ảnh rõ hơn, lọc nhiễu, phân đoạn ảnh để lấy được những yêu cầu cần thiết )

■ Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc phân loại, nhận dạng ảnh (Ví dụ như phân tích nhận dạng vân tay, nhận dạng chữ viết, nhận dạng ảnh tài liệu )-

■ Đưa ra một kết luận ở mức cao hơn, sâu hơn (ví dụ như từ ảnh một tai nạn giao thông phác họa hiện trường tai nạn

1.2 Quá trình xử lý ảnh

Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ, là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng

Trang 12

Xử lý ảnh liên quan đến nhiều lĩnh vực và cần nhiều kiến thức cơ sở khác Đầu tiên phải kể đến Xử lý túi hiệu số là một môn học hết sức cơ bản cho xử lý tín hiệu chung, các khái niệm về tích chập, các biến đổi Fourier, biến đổi Laplace, các bộ lọc hữu hạn Thứ hai, các công cụ toán như Đại số tuyến tính, Xác xuất, thống kê Một số kiến thứ cần thiết như Trí tuệ nhân tao, Mạng nơron nhân tạo cũng được đề cập trong quá trình phân tích và nhận dạng ảnh Các phương pháp xử lý ảnh bắt đầu tò các ứng dụng chính: nâng cao chất lượng ảnh và phân tích ảnh.

ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo được truyền qua cáp từ Luân Đôn đến New York từ những năm 1920 vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của ảnh Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm

1955 Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình xử lý ảnh sô thuận lợi Năm 1964, máy tính đã có khả năng xử lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổi đường biên, lưu ảnh Từ năm 1964 đến nay, các phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng

Các phương pháp tri thức nhân tạo như mạng nơron nhân tạo, các thuật toán xử lý hiện đại và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả quan

Để dễ tưởng tượng, xét các bước cần thiết trong xử lý ảnh Đầu tiên, ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh) Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểu CCIR) Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy ra từ Camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo (Máy ảnh số hiện nay là một thí

Trang 13

dụ gần gũi) Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh; có thể quét từ ảnh chụp bằng máy quét ảnh.

Các phương pháp xử lý ảnh bắt đầu tò các ứng dụng chính như nâng cao chất lượng ảnh và phân tích ảnh

Do vậy, quá trình xử lý ảnh bao giờ cũng bắt đầu bằng công việc thu nhận ảnh và kết thúc là việc nhận dạng ảnh hoặc một phán đoán theo ý nghĩa trên cơ sở nhận dạng ảnh Cụ thể, các bước cơ bản trong quá trình xử lý ảnh được thể hiện thông qua hình dưới đây:

Hình 1.1 Các bước cơ bản trong xử lỷ ảnh

1.2.1 Thu nhận ảnh (Image Acquisition)

Đây là bước đầu tiên trong quá trình xử lý ảnh Đầu ra của giai đoạn này là ảnh đã được số hoá Vì vậy, công việc cụ thể ở giai đoạn này là thu ảnh qua một bộ thu ảnh và số hoá những túi hiệu liên tục được sinh ra bởi bộ thu ảnh đó

Bộ thu ảnh có thể là máy chụp ảnh đơn sắc hay màu, máy quét ảnh, máy quay Nếu bộ thu ảnh cung cấp chưa phải dạng số hoá thì phải chuyển đổi hay số hoá ảnh

Ảnh có thể nhận qua camera màu hoặc đen trắng Thường ảnh nhận qua camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh

25 dòng), cũng có loại camera đã số hoá (như loại CCD - Change Coupled Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh Camera thường

Trang 14

dùng là loại quét dòng ; ảnh tạo ra có dạng hai chiều Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh).

1.2.2 Tiền xử lý (Image Processing)

Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào

bộ tiền xử lý để nâng cao chất lượng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn

Mục đích của các công việc này là làm cho chất lượng ảnh trở lên tốt hơn chuẩn bị cho các bước xử lý tiếp theo

Khử nhiễu: Nhiễu được chia thành hai loại là nhiễu hệ thống và nhiễu

ngẫu nhiên Đặc trưng của nhiễu hệ thống là tính tuần hoàn Do vậy, có thể khử nhiễu hệ thống bằng việc sử dụng phép biến đổi Fourie và loại bỏ các đỉnh điểm Đối với nhiễu ngẫu nhiên, trường hợp đơn giản là các vết bẩn tương ứng với các điểm sáng hay tối thì có thể khử bằng phương pháp nội suy, lọc trung vị và lọc trung bình

Chỉnh độ tương phản: Công việc cụ thể là chỉnh sửa tính không đồng

đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh

1.2.3 Phân đoạn (Segmentation) hay phân vùng ảnh

Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt

để nhận dạng Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lồi, làm mất độ chính xác của ảnh Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này

Kết quả của bước phân đoạn ảnh thường được cho dưới dạng dữ liệu điểm ảnh thô, trong đó hàm chứa biên của vùng ảnh hoặc tập họp tất cả các điểm ảnh thuộc về chính vùng ảnh đó Trong cả hai trường hợp, sự chuyển đổi

Trang 15

dữ liệu thô này thành một dạng thích hợp hơn cho việc xử lý trong máy tính là hết sức cần thiết, nghĩa là nên biểu diễn một vùng ảnh dưới dạng biên hay dưới dạng một vùng hoàn chỉnh gồm tất cả những điểm ảnh thuộc về nó.

1.2.4 Biểu diễn ảnh (Image Representation)

Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được

Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác

Anh sau khi số hoá sẽ được lưu vào bộ nhớ hoặc chuyển sang các khâu tiếp theo để phân tích Nếu lưu trữ ảnh trực tiếp tò các ảnh thô đòi hỏi dung lượng bộ nhớ rất lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thông thường, các ảnh thô đó được biểu diễn lại theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh như: biên ảnh, vùng ảnh - Biểu diễn dạng biên cho một vùng phù hợp với những ứng dụng chỉ quan tâm đến các đặc trưng hình dạng bên ngoài của đối tượng

Ví dụ như các góc cạnh và điểm uốn trên biên

Biểu diễn dạng vùng thích hợp cho những ứng dụng khai thác các tính chất bên trong của đối tượng Ví dụ như vân ảnh hoặc cấu trúc xương của nó

Trong một số ứng dụng thì cả hai cách biểu diễn trên đều cần thiết

1.2.5 Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)

Nhận dạng ảnh là quá trình xác định ảnh bằng cách so sánh ảnh vớimẫu chuẩn đã được lưu từ trước

Trang 16

Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng ảnh.

Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể nội suy thành mã điện thoại Có nhiều cách phân loại khác nhau về ảnh Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân theo hai loại nhận dạng sau:

- Nhận dạng theo tham số

- Nhận dạng theo cấu trúc

Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là: Nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản, nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người

1.2.6 Cơ sở tri thức (Knowledge Base)

Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, nhiễu do môi trường thu ảnh phong phú Trong nhiều khâu

xử lý và phân tích ảnh, ngoài việc đơn giản hoá các phương pháp toán học đảm bảo tiện lợi cho xử lý thì chúng ta luôn hướng đến việc xây dựng hệ thống tự động tiếp nhận và xử lý theo cách của con người Vì vậy, nhiều khâu hiện nay đã được xử lý theo các phương pháp trí tuệ nhân tạo, sử dụng cơ sở tri thức của con người

1.2.7 Mô tả ảnh

Từ Hình 1.1, ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp theo để phân tích Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image Features) như: biên ảnh (Boundary), vùng ảnh (Region) Một số phương pháp biểu diễn thường dùng:

Trang 17

• Biểu diễn bằng mã chạy (Run-Length Code)

• Biểu diễn bằng mã xích (Chaîne -Code)

• Biểu diễn bằng mã tứ phân (Quad-Tree Code)

- Biểu diễn bằng mã chạy

Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân Một vùng ảnh R có thể mã hoá đơn giản nhờ một ma trận nhị phân:

U(m, n) = 1 nếu (m, n) thuộc R U( m, n) = 0 nếu (m, n) không thuộc R Trong đó: Uịmn), là hàm mô tả mức xám ảnh tại tọa độ (m, n) Với cách biểu diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1

Giả sử chúng ta mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ

độ (x, y) theo các chiều và đặc tả chỉ đối với giá trị “1 ” khi đó dạng mô tả có thể là: (x, y)r; trong đó (x, y) là toạ độ, r là số lượng các bit có giá trị “1 ” liên

tục theo chiều ngang hoặc dọc

- Biểu diễn bằng mã tứ phân

Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh Vùng ảnh đầu tiên được chia làm bốn phần thường là bằng nhau Nếu mỗi vùng đã đồng

nhất (chứa toàn điểm đen (1) hay trắng (0)) thì gán cho vùng đó một mã và

không chia tiếp Các vùng không đồng nhất được chia tiếp làm bốn phần theo thủ tục trên cho đến khi tất cả các vùng đều đồng nhất Các mã phân chia thành các vùng con tạo thành một cây phân chia các vùng đồng nhất

Trang 18

Trên đây là các thành phần cơ bản trong các khâu xử lý ảnh Trong thực

tế, các quá trình sử dụng ảnh số không nhất thiết phải qua hết các khâu đó tùy theo đặc điểm ứng dụng Hình 1.2 cho sơ đồ phân tích và xử lý ảnh và lưu đồ thông tin giữa các khối một cách khá đầy đủ Ảnh sau khi được số hóa được nén, lưu lại để truyền cho các hệ thống khác sử dụng hoặc để xử lý tiếp theo Mặt khác, ảnh sau khi số hóa có thể bỏ qua công đoạn nâng cao chất lượng (khi ảnh đủ chất lượng theo một yêu cầu nào đó) để chuyển tới khâu phân đoạn hoặc bỏ tiếp khâu phân đoạn chuyển trực tiếp tới khâu trích chọn đặc trưng Hình 1.2 cũng chia các nhánh song song như: nâng cao chất lượng ảnh

có hai nhánh phân biệt: nâng cao chất lượng ảnh (tăng độ sáng, độ tương phản, lọc nhiễu) hoặc khôi phục ảnh (hồi phục lại ảnh thật khi ảnh nhận được

Trang 19

1.3 Phân đoan ảnh

Phân đoạn ảnh là một thao tác ở mức thấp và là bước then chốt trong quá trình xử lý ảnh Giai đoạn này nhằm phân tích ảnh thành những vùng rời rạc có cùng tính chất nào đó dựa vào việc xác định biên và các vùng liên thông cho từng vùng Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám Các vùng ảnh này thông thường sẽ tương ứng với toàn bộ hay từng phần của đối tượng thật bên trong ảnh

Mỗi vùng ảnh là một tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đó như mức xám, mức màu, độ nhám Đường bao quanh một vùng ảnh là biên ảnh Các điểm ảnh trong một vùng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều hay tinh kết cấu tương đồng

Dựa vào đặc tính vật lý của ảnh người ta có nhiều kỹ thuật phân vùng như phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền kề; phân vùng dựa và biên gọi là phân vùng biên Ngoài ra còn

có các kỹ thuật phân vùng khác dựa vào biên độ, dựa vào kết cấu

1.3.1 Điểm ảnh (Picture Element)

Gốc của ảnh là ảnh liên tục về không gian và độ sáng Để xử lý ảnh bằng máy tính thì ảnh cần phải được số hóa số hóa ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí và độ sáng Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi điểm như vậy gọi là điểm ảnh - Picture Element (PEL) hay gọi tắt là Pixel Trong khuôn khổ ảnh hai

chiều, mỗi pixel ứng với cặp tọa độ (x,y).

Như vậy, điểm ảnh (Pixel) là một phần tò của ảnh số tại tọa độ (x,y) với

độ xám hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian

Trang 20

và mức xám (hoặc màu) của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh.

1.3.2 Độ phân giải của ảnh

bố theo trục X , y trong không gian hai chiều

Ví dụ: Độ phân giải của màn hình CGA (Color Graphic Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200) Cùng loại màn hình CGA và ở cùng độ phân giải 320*200, ta

sẽ thấy màn hình CGA 12” mịn hơn màn hình CGA 17” Lý do chính là ở cùng một độ phân giải nhưng diện tích màn hình rộng hơn thì độ mịn hay tính liên tục của các điểm ảnh sẽ thấp hơn

Ảnh đen trắng: là ảnh có hai màu đen trắng với mức xám ở các điểm

ảnh có thể khác nhau

Ảnh nhị phân: là ảnh chỉ có 2 mức đen trắng phân biệt dùng 1 bit mô

tả 2 mức khác nhau Như vậy, mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1

Trang 21

Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu người ta thường dùng 3 byte để mô tả mức màu Khi đó mỗi điểm ảnh có thể nhận số giá trị màu là 28*3=224 ~ 16,7 triệu màu.

1.3.4 Quan hệ gỉữa các đỉểm ảnh

Một ảnh số giả sử được biểu diễn bằng hàm f(x,y) Tập con các điểm ảnh là S; cặp đỉểm ảnh cố quan hệ vói nhau là p,q Để thể hỉện quan hệ gỉữa

các điểm ảnh chúng ta có một số kháỉ niệm sau:

L3.4.1 Các lân cận cửa điểm ảnh Ợmage Neighbors)

Giả sử có điểm ảnh p tại tọa độ (x,ỵ) p có 4 điểm lân cận gần nhất theo

chiều đứng và ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam, Bắc).

NẶp) - {(x-hy)ỉ (xty-l)ỉ (x,y+l); ịx+hy)}

Trong đó: số 1 là giá trị logic; NẶp) là tập 4 điểm lân cận của p.

Hình Ỉ.3 Lân cân các điểm ảnh của toa đô (x,y)

Hình 1.3 Lần cận các điểm ảnh của tọa độ (x,y)

Các điểm lân cận chéo Np(p) (Có thể coi lân cận chéo là 4 hướng:

Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)

Np(p) = {(x+hy+1); (x+hy-l); (x-hy+1); (x-l;y-l)ỉ

Tập kết hợp: N 8( p ) = NẶp) + Npịp) là tập hợp 8 lân cận của điểm ảnh p.

Trang 22

r > ĩ 9 A

Chú ý: Nêu năm ở biên ảnh thì một sô điêm lân cận sẽ năm ngoàiảnh

I.3.4.2 Khoảng cách giữa các điểm ảnh

Định nghĩa: Khoảng cách D(p,q) giữa hai điểm ảnh p tọa độ ịx,y), q

tọa độ (s,t) là hàm khoảng cách (Distance) nếu:

1 D(p,q) > 0 (Với D(p,q)=0 nếu và chi nếu p —q)

2 D(p,q) = D(q,p)

3 D(p,z) <D(p,q) + D(q,z); z là một điểm ảnh khác.

Khoảng cách Euclỉde: Khoảng cách Euclide giữa hai điểm ảnh p(x,y)

và q(s,t) được định nghĩa như sau:

D e(p,q) = A/(x-s)2 + (y-t)2

Khoảng cách Euclide giữa hai điểm p và q là chiều dài đoạn thẳng p ^ Trong hệ tọa độ Descartes, nếu p = (pl, p2, , pn) và q = (ql, q2, , qn) là hai điểm trong không gian Euclidn chiều, thì khoảng cách từ p đến q bằng:

d(p, q) - ự ( p i - q i ỹ + (P 2 ~qĩf +■■■ + ( £ * qnỹ

-\ Y l i P i - 'ứ 'í—1Dạng chuẩn Euclid là khoảng cách của một điểm đến điểm gốc trong không gian Euclid:

|p|| = \J p Ì + p I H - + P Ì = y /p - p

trong đó phương trình sau cùng là tích vô hướng Đây là chiều dài của p, khi

ta xem nó là một Véc-tơ Euclid có gốc nằm ở gốc tọa độ Khoảng cách khi đóbằng p - q | | = \ / ( p - q ) - ( p - q ) = vÌ pP + l l q f - 2P ■q-

Trang 23

Khoảng cách khối: Khoảng cách D4(p,q) được gọi là khoảng cách

khối đồ thị (City - Block Distance) và được xác định như sau:

D4(p,q) = I je-,sl + \y-t\

Giá trị khoảng cách giữa các điểm ảnh r: giá trị bán kính r giữa điểm

ảnh từ tâm điểm ảnh đến tâm điểm ảnh q khác Ví dụ: màn hình CGA 12”

(12”*2,54cm=30,48cm=304,8mm) độ phân giải 320*200; tỷ lệ 4/3 (Chiều dài/Chiều rộng) Theo định lý Pitago về tam giác vuông, đường chéo sẽ lấy tỷ

lệ 5 phần (5/4/3: đường chéo/chiều dài/chiều rộng); khi đó độ dài thật là (505/244/183) chiều rộng màn hình 183mm ứng với màn hình CGA 200 điểm ảnh theo chiều dọc Như vậy, khoảng cách điểm ảnh lân cận của CGA 12” là

khối gửi đi và khối nhận được Một mã với khoảng cách d cho phép phát hiện đ — 1 lỗi vì sau khi thay đổi không quá d — 1 vị trí của một mã tự, ta

không thể thu được một mã tự mới Ngoài ra, nếu chỉ có không

Trang 24

quá — l ) / 2 lỗi, người nhận có thể sửa lỗi và tìm ra mã tự gửi đi Đó là

vì trong khoảng cách (^ — l ) / 2 từ khối tự nhận được chỉ có đúng một mã

tự Nếu có nhiều hơn (rá — 1) / 2 lỗi thì người nhận không thể tìm ra chính xác mã tự gửi đi Một phương thức đối phó với trường hợp này là sử dụng giải mã danh sách, trong đó người nhận liệt kê tất cả các mã tự nằm trong một bán kính nhất định

Khoảng cách bàn cờ: Khoảng cách D8(p,q) còn gọi là khoảng cách

bàn cờ (Chess-Board Distance) giữa điểm ảnh p,q được xác định như sau:

Trang 25

Anh mức xám được áp dụng trong nhiều lĩnh vực như sinh vật học hoặc trong công nghiệp Thực tế chỉ ra rằng bất kỳ ứng dụng nào trên ảnh, mức xám cũng ứng dụng được trên ảnh màu Với lý do đó, hệ thống ban đầu nên chỉ bao gồm các thiết bị thu nhận và hiển thị ảnh đen trắng Với ảnh màu, nên

sử dụng một hệ thống mới như Hình 1.4, trừ trường hợp cần một camera TV màu và một màn hình đa tần số (ví dụ như NEC Multisync, Sony Multiscan, hoặc Mitsubishi Diamond Scan) để hiển thị ảnh màu Nếu khả năng hạn chế,

có thể dùng PC kèm theo vỉ mạch VGA và màn hình VGA, để dựng ảnh được

1.3.5 Những vấn đề khác trong xử lý ảnh

1.3.5.1 Biến đỗi ảnh (Image Transform)

Trong xử lý ảnh, do số điểm ảnh lớn, các tính toán nhiều (độ phức tạp tính toán cao) đòi hỏi dung lượng bộ nhớ lớn, thời gian tính toán lâu Các phương pháp khoa học kinh điển áp dụng cho xử lý ảnh hầu hết khó khả thi

Vì vậy, chúng ta sử dụng các phép toán tương đương hoặc biến đổi ảnh sang miền xử lý khác để dễ tính toán

Sau khi xử lý xong, chúng ta dùng biến đổi ngược để đưa ảnh về miền xác định ban đầu Các phép biến đổi thường gặp trong xử lý ảnh gồm:

- Biến đổi Fourier, Cosin, Sin,

- Biến đổi (mô tả) ảnh bằng tích chập, tích Kronecker,

- Các biến đổi khác như KL (Karhumen Loeve), Hadamard

Một số các công cụ sác xuất thông kê cũng được sử dụng trong xử lýảnh

1.3.5.2 Nén ảnh

Anh dù ở dạng nào vẫn chiếm không gian nhớ rất lớn Vì vậy, khi mô

tả ảnh có thể sử dụng kỹ thuật nén ảnh để thu thu gọn dung lượng nhớ dành cho ảnh Các giai đoạn nén ảnh có thể chia ra thành 2 thế hệ là thế hệ lvà thế

Trang 26

hệ 2 Hiện nay, các chuẩn nén ảnh MPEG được dùng với ảnh đang khá phổ biến Một số phương pháp, thuật toán nén được sử dụng rộng rãi là: Mã hóa loại dài RLC, mã hóa Huffman, mã hóa LZW, mã hóa khối, phương pháp Kim tự tháp Laplace,

I.3.5.3 Các định dạng cơ bản trong xử lý ảnh

Hình ảnh khi lưu trữ dưới dạng tệp tin sẽ được số hóa Một số dạng ảnh

đã được chuẩn hóa như: ảnh GIF, BMP, PCX, IMG,

■ Ảnh IMG: Là ảnh đen trắng, được nén theo từng dòng Mỗi dòng gồm các gói, các dòng giống nhau cũng nén thành một gói

■ Anh PCX: Là một trong những định dạng ảnh cổ điển nhất Nó sử dụng phương pháp mã loạt dài RLE (Run Length Encoded) để nén dữ liệu ảnh Quá trình nén và giải nén được thực hiện trên từng dòng ảnh

■ Anh TIFF: Là ảnh mà dữ liệu chứa trong tệp thường được tổ chức thành các nhóm dòng (cột) quét của dữ liệu ảnh

■ Anh GIF: Dạng ảnh GIF cho chất lượng cao, độ phân giải đồ họa cao

và cho phép hiển thị trên hầu hết các phần cứng

Tuy các định dạng này khác nhau, song chúng đều tuân theo một cấu trúc chung nhất là gồm 3 phần:

■ Mào đầu tệp (Header): Là phần chứa các thông tin về kiểu ảnh, kích thước, độ phân giải, số bit dùng cho 1 pixel, cách mã hóa, vị trí bảng màu

■ Dữ liệu nén (Data Compression): số liệu ảnh được mã hóa bởi kiểu

mã hóa chỉ ra trong phần Header

■ Bảng màu (Palette Color): Bảng màu cho biết số màu dùng trong ảnh

và sử dụng trong việc hiển thị màu của ảnh Anh đen trắng không nhất thiết phải có bảng màu

Trang 27

CHƯƠNG 2: PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH

Phân đoạn ảnh là bước then chốt trong xử lý ảnh Giai đoạn này nhằm phân tích ảnh thành những thành phần có cùng tính chất nào đó dựa theo biên hay các vùng liên thông Tiêu chuẩn đểxác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám Trước hết cần làm rõ khái niệm "vùng ảnh" (Segment) và đặc điểm vật lý của vùng Vùng ảnh là một chi tiết, một thực thể trông toàn cảnh Nó là một tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đó : mức xám, mức màu, độ nhám Vùng ảnh là một trong hai thuộc tính của ảnh Nói đến vùng ảnh là nói đến tính chất bề mặt Đường bao quanh một vùng ảnh (Boundary) là biên ảnh Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng

Dựa vào đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân vùng : phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền kề ; phân vùng dựa vào biên gọi là phân vùng biên Ngoài ra còn có các kỹ thuật phân vùng khác dựa vào biên độ, phân vùng dựa theo kết cấu

Trang 28

Tóm lại, một cái nhìn tổng quan về các phưong pháp phân đoạn ảnh như sau:

giám sát

■ Tồn tại các phương pháp heuristic và hữu hạn

■ Không quan tâm đến các thông tin trong không gian ảnh

■ Có vấn đề trong việc xác định số lượng các cụm ban đầu

■ Khó khăn trong việc điều chỉnh các cụm sao cho phù hợp với

Trang 29

các vùng trong ảnh.Adaptive Clustering ■ Sở hữu tính liên tục

trong không gian ảnh

và tính thích nghi cục

bộ đối với các vùng ảnh

■ Sử dụng các ràng buộc

về không gian ảnh

■ Cực đại hoá một xác suất hậu điều kiện có thể bị sai do các cực trị địa phương

■ Hội tụ chậm

Histogram thresholding ■ Không cần biết trước

bất kỳ thông tin nào từ ảnh

■ Các giải thuật nhanh

■ Ảnh hưởng dễ dàng bởi nhiễu xuất hiện trong ảnh

Spatial-based techniquesSpit and Merge ■ Sử dụng các thông tin

về không gian ảnh là chính

■ Cho kết quả tốt với các ảnh chứa nhiều

vùng màu đồng nhất.

■ Định nghĩa mức độ đồng nhất về màu sắc

có thể phức tạp và khó khăn

■ Quadtree có thể gây ra các kết quả không như mong muốn

Trang 30

Region growing ■ Các vùng ảnh đồng

nhất và liên thông

■ Có một số thuật giải

có tốc độ thực thi khá nhanh

■ Tốn kém chi phí sử dụng bộ nhớ và tính toán

■ Gặp khó khăn trong việc thu thập tập các điểm mầm và xác định các điều kiện đồng nhất đầy đủ

■ Chịu ảnh hưởng bởi các đặc tính tự nhiên của kỹ thuật này

Graph theories ■ Thể hiện tốt không

gian ảnh bằng đồ thị

■ Một số thuật toán có tốc độ thực hiện nhanh

■ Một vài thuật giải mất khá nhiều thời gian thực hiện

■ Các đặc trưng cục bộ đôi khi được sử dụng nhiều hơn các đặc trưng toàn cục

Neural networks ■ Mức độ song song hoá

cao và có tốc độ thực thi nhanh

■ Khả năng chống chịu tốt trước các thay đổi xấu

■ Một công cụ hữu hiệu

■ Màu sắc có thể làm tăng độ phức tạp của mạng

■ Quá trình học cần phải biết trước số lượng các phân lớp/cụm

Trang 31

cho các ứng dụng nhận dạng và xử lý ảnh y khoa.

Edge-based ■ Là phương pháp được

hỗ trợ mạnh bởi các toán tử dò biên

■ Có hiệu năng tốt với các ứng dụng dò biên đối tượng theo đường cong

■ Khó khăn trong việc định nghĩa một hàm gradient cho các ảnh màu

■ Nhiễu hoặc các ảnh có

độ tương phản kém ảnh hưởng xấu đến kết quả phân vùng

Physics-based techniques

■ Khẳng định tính chắc chắn đối với các vùng bóng sáng/tối, và vùng bóng chuyển tiếp (diffuse hoặc shade)

■ Phân vùng các đối tượng dựa vào thành phần vật liệu cấu tạo

■ Bị giới hạn vào một số lượng nhất định các loại vật chất hình thành nên đối tượng

■ Khó khăn trong việc xác định vùng bóng sáng và bóng chuyển tiếp trong các ảnh thực

■ Một vài giải thuật đòi hỏi các thông tin về hình dạng đối tượng (không luôn luôn đáp

Trang 32

ứng được).

■ Chi phí tính toán khá cao

Đôi với bài toán truy vân ảnh theo nội dung, bước tiên xử lý phân đoạn phải chú ý đến các thông tin tòan cục và cả cục bộ Đồng thời đảm bảo tính liên tục trong không gian ảnh Vì vậy, ở đây ta sẽ đi sâu vào các thuật toán phân đoạn: phương pháp phân đoạn yếu của B.G Prasad áp dụng trong hệ thống truy vấn ảnh của ông; phương pháp phân đoạn trung bình-k thích nghi; phương pháp phân đoạn theo ngưỡng cục bộ thích nghi

Việc chọn số lượng màu phân biệt trong không gian màu giảm là một

sự trao đổi giữa sự thể hiện và tốc độ đối với một ứng dụng riêng biệt Với chỉ mục màu hiệu quả, số lượng màu ít thì thích hợp và nó cũng làm giảm sự tính toán Dưới đây là bảng gồm 25 màu (theo giác quan) được chọn từ bảng màu RGB chuẩn

Hình 2.2 Phân đoạn ảnh

Trang 34

Phương pháp này phụ thuộc vào việc xác định các biên Màu của một pixel (màu phân biệt được bằng giác quan) có thể được mô tả bằng loại màu trong vùng màu giảm tương ứng Tiến trình phân đoạn và xử lý chọn vùng trội được trình bày bằng sơ đồ sau:

Trang 36

Thủ tục này phân đoạn ảnh thành những vùng, bằng cách ánh xạ toàn

bộ pixel của ảnh lên vùng màu tương ứng trong không gian màu đã được giảm, và sau đó nhóm các pixel cùng loại với nhau Có nghĩa là: với mỗi pixel màu trên ảnh gốc, ta sẽ tìm được một màu trong 25 màu mà ta đã định nghĩa trước gần với nó nhất, nó sẽ được lưu lại và đó làm màu trong ảnh mới Ở đây, ta sẽ sử dụng khoảng cách Euclidean để tìm màu kết quả

Gọi pr, pg, pb là những giá trị cường độ màu của pixel tương ứng với

ba thành phần red, green, blue, và CiR, CiG, CiB là những giá trị màu tương ứng với nó trong bảng màu Để tính khoảng cách màu Cd, ta sử dụng khoảng cách Euclidean như sau:

để xây dựng cây chỉ mục ảnh dành cho máy tìm kiếm (seach engine)

Giải thích sơ đồ (các bước) phân đoạn và dò đường biên:

(1) Đọc ảnh và tạo một mảng ảnh chứa các thành phần màu RGB của mỗi pixel trong ảnh

(2) Với mỗi pixel trong ảnh, thực hiện:

(a) Tìm màu gần với màu của pixel trong ảnh gốc bằng cách sử dụng công thức tính Cd (với i= l,2, ,25)

Cd = min^(/?r - c j + ịpg — c j + (pb — CmỴ J,ỉ' = 1, ,25

với pr, pg, pb : 3 thành phần màu RGB của ảnh gốc

Trang 37

CiR, CiG, CiB : 3 thành phần màu tại vị trí i trong bảng 25màu.

Tính được Cd min ta sẽ có giá trị i, đây chính là vị trí của màu gần nhất cần tìm

(b) Gán màu tìm được này cho pixel đang xét (ứng với Cd min)

(3) Tạo bảng tần xuất cho mỗi màu được gán (tạo histogram cho ảnh).(4) Sắp xếp bảng tần xuất theo thứ tự giảm (để xác định những vùng màu trội)

(5) Lặp lại từ bước 6 đến 10 cho đến khi tìm được 3 vùng màu trội hoặc đến cuối bảng tần xuất

(6) Tiếp tục quét điểm ảnh theo thứ tự, dừng lại ở pixel đầu tiên có cùng giá trị màu trong bảng tần xuất được sắp xếp

(7) Gán vị trí pixel tìm được đó vào hai biến iseed, jseed tương ứng theo chiều ngang và chiều dọc của ảnh

(8) Đánh dấu toàn bộ vùng (region) bằng cách sử dụng vùng lân cận 8 connected của pixel đó

(9) Lấy tọa độ đường biên (x,y) của vùng được đánh dấu R và vẽ hình chữ nhật biên

(10) Xác định kích thước chuẩn hóa s(R) của hình chữ nhật biên bằng công thức:

s(R) = (Ixl - x2l*lyl - y2l)/N

Với (xl, yl) và (x2, y2) là tọa độ của tương ứng của 2 đỉnh đối nhau trong hình chữ nhật biên, N là kích thước của ảnh

Trang 38

Theo thuật toán này, để tránh việc lấy lặp lại các vùng trội thì ở bước 6, sau khi chọn được pixel đầu tiên thỏa, chúng ta sẽ kiểm tra xem pixel này đã có nằm trong vùng đã xét nào hay chưa, nếu chưa thì sẽ chọn nó.

Giải thuật này cho kết quả tương đối tin cậy trên nhiều loại ảnh khác nhau

biệt giữa hai vùng lân cận R' và , kí hiệu là f(^‘ ,Rj ) Hàm thể hiện sự

khác biệt dựa vào hai thành phần: màu sắc và cạnh

• Đối với thành phần màu, giải thuật sử dụng giá trị trong không gian màu HSV vì trị này ít bị ảnh hưởng bởi sự thay đổi nguồn chiếu sáng, ví dụ như hình dạng và bóng Cụ thể, chúng tôi lấy trị trung

Trang 39

bình của thành phần trong vùng R‘ , kí hiệu fẦh

• Thành phần thể hiện sự khác biệt còn lại là cạnh được biểu diễn bởi cường độ gradient Cường độ gradient chính là trị của các pixel

trong IG Chúng tôi qui định ^ Ri ,Rj ) là trị gradient trung bình giữa hai vùng R' và , được xác định dựa trên trị gradient của

những pixel chung của hai vùng

Gọi Bij là tập pixel thuộc vê ranh giới giữa hai vùng ' và j ,

Với I Bij I là số pixel của tập Bij

Ta có hàm thể hiện sự khác biệt dựa vào trị Hue và độ gradient được tính như sau:

Trong đó, d^ ^ Ri ^ Rj ^ là sự chênh lệch giữa trị trung bình của R‘

d(MỈỰX MR?) ) = min{ I I, (360-1 M Ỉ Ự ) - M Ỉ Ự ) 1} (3)

Với wl và w2 là các hệ số hằng đã định trước Nếu hàm thể hiện sự

khác biệt J K ‘ ’ j phụ thuộc chủ yêu vào trị Hue của màu săc hơn là cường

độ gradient thì wl » w2 Dựa vào kinh nghiệm thực tiễn trên các loại ảnhkhác nhau, trị của wl và w2 tương ứng là 0.8 và 0.2

Cấu trúc đồ thị lân cận RAG

M g ÍR ì ’Rj ) được định nghĩa như sau:

(1)

Trang 40

Giải thuật sử dụng cấu trúc đồ thị các vùng lân cận RAG để thể hiện quá trình

phân vùng ảnh Đồ thị RAG thể hiện tập các vùng Ri , i = 1, , n dưới dạng

đồ thị không hướng G = (V, E) Trong đó, V = {1, 2, n} với mỗi node thuộc V tương ứng với một vùng Ngoài ra, mỗi cạnh e(i j) E nếu i, j ,v, đồng

thời ' và j là hai vùng liền kề Vì quá trình trộn dựa vào đồ thị G nên

mỗi cạnh cần có một trọng số riêng Cụ thể, trong giải thuật, trọng số củacạnh e(ij) chính là trị của hàm ,Rj nhận được tò biểu thức tính toán

( 2 ).

Giải thuật Kruskal tìm cây khung nhỏ nhất T của đồ thị G như sau:

• Trước tiên, ta sắp các cạnh trong G theo thứ tự không giảm.

• Kế đến, xét từng cạnh một trong danh sách cạnh đã sắp xếp và kiểm tra cạnh đang xét có tạo chu trình với các cạnh đã được thêm vào T không Nếu cạnh này không tạo chu trình thì đưa nó vào T, ngược lại bỏ qua và xét cạnh kế tiếp

• Giải thuật tìm cây khung T sẽ dừng khi T chứa n-1 cạnh Khi đó, T

là cây khung nhỏ nhất của đồ thị G

Trong giải thuật phân đoạn chúng ta đang khảo sát, quá trình tạo cây khung nhỏ nhất MST của đồ thị các vùng liền kề RAG chính là trình tự trộn các vùng trong ảnh:

Ngày đăng: 09/05/2016, 17:10

HÌNH ẢNH LIÊN QUAN

Hình 1.1  Các bước cơ bản trong xử lỷ ảnh - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 1.1 Các bước cơ bản trong xử lỷ ảnh (Trang 13)
Hình 1.2 Sơ đồ phân tích và xử lỷ ảnh và lưu đồ thông tin giữa các khối - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 1.2 Sơ đồ phân tích và xử lỷ ảnh và lưu đồ thông tin giữa các khối (Trang 18)
Hình  Ỉ.3 Lân  cân  các điểm  ảnh  của toa đô (x,y) - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
nh Ỉ.3 Lân cân các điểm ảnh của toa đô (x,y) (Trang 21)
Hình 1.4 Các thành phần chỉnh của hệ thống xử lỷ ảnh - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 1.4 Các thành phần chỉnh của hệ thống xử lỷ ảnh (Trang 24)
Hình 2.1  Các phương pháp phân đoạn ảnh  Bảng 2.2. Ưu nhược điểm của các phương pháp phân vùng - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.1 Các phương pháp phân đoạn ảnh Bảng 2.2. Ưu nhược điểm của các phương pháp phân vùng (Trang 28)
Hình 2.2. Phân đoạn ảnh - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.2. Phân đoạn ảnh (Trang 32)
Hình 2.3 Sơ đồ xử lỷ chọn vùng và phân đoạn - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.3 Sơ đồ xử lỷ chọn vùng và phân đoạn (Trang 35)
Hình 2.4. Phân đoạn ảnh theo các thuật toán - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.4. Phân đoạn ảnh theo các thuật toán (Trang 38)
Hình 2.5 Xây dựng cây khung MST - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.5 Xây dựng cây khung MST (Trang 42)
Hình 2.6  Cập nhật cạnh trong quá trình áp dụng việc tạo MST - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.6 Cập nhật cạnh trong quá trình áp dụng việc tạo MST (Trang 43)
Hình 2.7. Sự thay đổi trong tỉnh đồng nhất - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.7. Sự thay đổi trong tỉnh đồng nhất (Trang 45)
Hình 2.9 : Một vỉ dụ về LBP tính toán. - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.9 Một vỉ dụ về LBP tính toán (Trang 54)
Hình 2.10: LBP từ ba mặt phẳng trực giao. - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.10 LBP từ ba mặt phẳng trực giao (Trang 57)
Hình 2.12  :  Ảnh trang tài ỉỉệu(bên trải) và histogram của ảnh (bên phải) - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.12 : Ảnh trang tài ỉỉệu(bên trải) và histogram của ảnh (bên phải) (Trang 61)
Bảng 2.3 Biểu đồ tần xuất histogram của ảnh I - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Bảng 2.3 Biểu đồ tần xuất histogram của ảnh I (Trang 61)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w