Xuất phát trong hoàn cảnh đó “Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu” được em chọn làm đề tài.. Đối tượng và phạm vi nghiên cứu Đối tượng, phạm vi nghiên cứu v
Trang 1Hà nội, ngày 01 tháng 07 năm 2015 Tác
giả luận văn
Nguyễn Đức Toàn
Trang 2LỜI CAM ĐOAN
Tôi xin cam đoan rằng số liệu và kết quả nghiên cứu trong luận văn này
là trung thực và không trùng lặp với các đề tài khác Tôi cũng xin cam đoanrằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã đuợc cảm ơn và cácthông tin trích dẫn trong luận văn đã đuợc chỉ rõ nguồn gốc
Hà nội, ngày 01 tháng 07năm 2015 Tác giả luận văn
Nguyễn Đức Toàn
Trang 3MỤC LỤC
MỞ ĐẦU 8
1 Lỷ do chọn đề tài 8
2 Mục đích nghiên cứu 8
3 Nhiệm vụ nghiên cứu 8
4 Đối tuợng và phạm vi nghiên cứu 9
5 Phuơng pháp nghiên cứu 9
CHƯƠNG 1: KHÁI NIỆM VỀ PHÂN ĐOẠN ẢNH 11
1.1 Xử lỷ ảnh, các vấn đề cơ bản trong xử lỷ ảnh 11
1.2 Quá trình xử lỷ ảnh 11
1.2.1 Thu nhận ảnh (Image Acquisition) 13
1.2.2 Tiền xử lỷ (Image Processing) 14
1.23 Phân đoạn (Segmentation) hay phân vùng ảnh 14
1.2.4 Biểu diễn ảnh (Image Representation) 15
1.23 Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)
15 1.2.6 Cơ sở tri thức (Knowledge Base) 16
1.2.7 Mô tả ảnh 16
1.3 Phân đoạn ảnh 19
1.3.1 Điểm ảnh (Picture Element) 19
1.3.2 Độ phân giải của ảnh 20
1.33 Mức xám của ảnh 20
1.3.4 Quan hệ giữa các điểm ảnh 21
13.4.1 Các lăn cận của điếm ảnh (Image Neighbors) 21
13.4.2 Khoảng cách giữa các điếm ảnh 22
Trang 41.3.43 Các thành phần cơ bản của hệ thống xử lý ảnh 24
1.3.5 Những vấn đề khác trong xử lỷ ảnh 25
1.3.S.L Biến đổi ảnh Ợmage Transform) 25
1.3.5.2 Nén ảnh 25
1.3.5.3 Các định dạng cơ hỏn trong xử lý ảnh 26
CHƯƠNG 2: PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH 27
Trộn các vùng 38
2.1 Phương pháp phân đoạn ảnh dựa trên miền đồng nhất 47
2.1.1 Phương pháp tách cây tứ phân 48
2.1.2 Phương pháp cục bộ 50
2.2 Phương pháp phân đoạn ảnh dựa trên LPB (Local Binary Pattern-Mẩu nhị phân cục bộ) 52
2.2.1 LBP trong miền không gian 53
2.2.2 LBP spatiotemporaỉ 55
2.2.3 Mô tả mặt bằng LBP 57
2.2.4 Mở rộng và các ứng dụng 59
2.3 Phương pháp phân đoạn ảnh dựa trên Histogram (Ngưỡng) 60
2.3.1 Thao tác vói ảnh nhị phân 70
2.3.1J Điểm ảnh và các điểm láng riềng 70
2.3J.2 Connected components labeling 71
2.3.1.3 Xác đinh số từ trong ảnh tài liệu 78
CHƯƠNG 3: ƯNG DỤNG PHÂN ĐOẠN CHO ẢNH TÀI LIỆU 80
3.1 Yêu cầu bài toán: Giải quyết bài viết của học sinh 80
3.2 Cách giải quyết yêu cầu của bài toán 80
Trang 53.3 Xây dựng DEMO 80
3.3.1 Giao diện chính; 80
3.3.2 Nhập hình ảnh 81
3.3.3 Sử dụng thuật toán Gray 81
3.3.4 Sử dụng thuật toán Segmentation 82
3.3.5 Sử dụng thuật toán Sobeỉ 82
3.4 So sánh với ảnh phong cảnh 83
3.4.1 Giao diên chính 83
3.4.2 Nhập hình ảnh 83
3.4.3 Sử dụng thuật toán Gray 84
3.4.4 Sử dụng thuật toán Segmentation 84
3.4.5 Sử dụng thuật toán Sobeỉ 85
KẾT LUẬN VÀ KIẾN NGHỊ 86
TÀI LIỆU THAM KHẢO 87
Trang 6DANH MỤC BẢNG
•
Hình 2.1 Các phương pháp phân đoạn ảnh 28
Bảng 2.2.Ưu nhược điểm của các phương pháp phân vùng 28
Bảng 2.3 Bảng tra màu 33
Bảng 2.3 Biểu đồ tần xuất histogram của ảnh 1 61
Bảng 2.4 : Định nghĩa thành phần liên thông 72
Bảng 2.5 Ảnh nhị phân và nhãn của các thành phần 72
Bảng 2.6 Cấu trúc Union - Find với hai tập nhãn 73
Bảng 2.7 Giả mã cho thủ tục Find 74
Bảng 2.8 : Giả mã cho thủ tục Union 74
Bảng 2.9 Giả mã thuật toán và gán nhãn cho các thành phần liên thông 76
Bảng 2.10 ứng dụng thuật toán gán nhãn cho các thành phần liên thông 78
DANH MỤC HÌNH • Hình 2.1 Các phương pháp phân đoạn ảnh 28
Bảng 2.2.Ưu nhược điểm của các phương pháp phân vùng 28
Bảng 2.3 Bảng tra màu 33
Bảng 2.3 Biểu đồ tần xuất histogram của ảnh 1 61
Bảng 2.4 : Định nghĩa thành phần liên thông 72
Bảng 2.5 Ảnh nhị phân và nhãn của các thành phần 72
Bảng 2.6 Cấu trúc Union - Find với hai tập nhãn 73
Bảng 2.7 Giả mã cho thủ tục Find 74
Bảng 2.8 : Giả mã cho thủ tục Union 74
Trang 7Bảng 2.9 Giả mã thuật toán và gán nhãn cho các thành phần liên thông 76Bảng 2.10 ứng dụng thuật toán gán nhãn cho các thành phần liên thông 78
MỞ ĐẦU
1 Lỷ do chọn đề tài
Trong những năm gần đây công nghệ thông tin phát triển với tốc độnhanh chóng Sự phát triển của công nghệ thông tin đã thúc đẩy sự phát triểncủa nhiều lĩnh vực xã hội khác như: y học, giáo dục, giải trí, kinh tế
Lĩnh vực xử lý ảnh cũng như công nghệ thực tại ảo đã ra đời và thâmnhập mạnh mẽ vào đời sống của con người
Ảnh thu được sau qua trình thu nhận ảnh hoặc các phép biến đổi khôngtránh khỏi nhiễu hoặc khuyết thiếu Sự sai sót này một phần bởi các thiết bịquang học và điện tử, phần khác bởi bản thân các phép biến đổi không phải làtoàn ánh, nên có sự ánh xạ thiếu hụt đến những điểm trên ảnh kết quả
Việc khắc phục các nhược điểm này luôn là vấn đề đặt ra cho các hệthống xử lý ảnh vì vậy các nhà khoa học đã phân đoạn ảnh ra để làm rõ nét hơncho bức ảnh cần xử lý và tăng cường nâng cao chất lượng ảnh
Xuất phát trong hoàn cảnh đó “Nghiên cứu phương pháp phân đoạn ảnh
và ứng dụng cho ảnh tài liệu” được em chọn làm đề tài.
2 Mục đích nghiên cứu
Tìm hiểu tổng quan về phân đoạn ảnh, các phương pháp phân đoạn ảnh
và chọn ra phương pháp phân đoạn ảnh cụ thể
Trên cơ sở các kiến thức đã thu thập và nghiên cứu, tổng hợp các kỹthuật để hướng đến các ứng dụng thực tế phân đoạn cho ảnh tài liệu
3 Nhiệm vụ nghiên cứu
Tìm hiểu khái niệm phân đoạn ảnh
Trang 8Các phương pháp phân đoạn ảnh.
ứng dụng phương pháp phân đoạn cho ảnh tài liệu
4 Đối tượng và phạm vi nghiên cứu
Đối tượng, phạm vi nghiên cứu về tổng quan về phân đoạn ảnh, cácphưong pháp phân đoạn ảnh và chọn ra phương pháp phân đoạn cho ảnh cụ thể
và các ứng dụng thực tế phân đoạn cho ảnh tài liệu
5 Phương pháp nghiên cứu
Thu thập tài liệu, phân tích, suy luận, tổng họp, đánh giá Từ đó đề xuất
nghiên cứu và tìm hiểu: “Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu”.
Trang 9Chương 2: Phương pháp phân đoạn ảnh
2.1 Phương pháp phân đoạn ảnh dựa trên miền đồng nhất
2.2 Phương pháp phân đoạn ảnh dựa trên LBP (Local Binary Pattern)
( Mầu nhị phân cục bộ)
2.3 Phương pháp phân đoạn ảnh dựa trên Histogram (Ngưỡng) Chương 3: ứng dụng phương pháp phân đoạn cho ảnh tài liệu.
- Yêu cầu bài toán: Giải quyết bài viết của học sinh
- Đặc thù của ảnh sau khi phân đoạn: là ảnh đen trắng (ảnh đơn màu)
- Thử nghiệm với các dữ liệu
CHƯƠNG 1: KHÁI NIỆM VÈ PHÂN ĐOẠN ẢNH
1.1 Xử lỷ ảnh, các vấn đề cơ bản trong xử lỷ ảnh.
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai
trò quan trọng nhất Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và
đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống Xử
lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người và máy
Quá trình xử lý ảnh là một quá trình thao tác nhằm phân tích, biến đổi mộtảnh đầu vào để đưa ra một kết quả mong muốn Kết quả của quá trình xử lý ảnh cóthể là một ảnh tốt hơn hoặc một kết luận Điều này tùy thuộc vào mục đích yêu cầucủa quá trình Như vậy, mục tiêu của xử lý ảnh có thể phân làm ba hướng như sau:
■ Xử lý ảnh ban đầu để có được một ảnh mới theo yêu cầu xác định (ví dụnhư ảnh mờ cần xử lý để được ảnh rõ hơn, lọc nhiễu, phân đoạn ảnh để lấy
Trang 10được những yêu cầu cần thiết ).
■ Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc phân loại,nhận dạng ảnh (Ví dụ như phân tích nhận dạng vân tay, nhận dạng chữ viết,nhận dạng ảnh tài liệu )
■ Đưa ra một kết luận ở mức cao hơn, sâu hơn (ví dụ như từ ảnh một tai nạngiao thông phác họa hiện trường tai nạn
1.2 Quá trình xử lý ảnh
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ, là một ngànhkhoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển rấtnhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyêndụng riêng
Xử lý ảnh liên quan đến nhiều lĩnh vực và cần nhiều kiến thức cơ sở khác.Đầu tiên phải kể đến Xử lý tín hiệu số là một môn học hết sức cơ bản cho xử lý tínhiệu chung, các khái niệm về tích chập, các biến đổi Fourier, biến đổi Laplace, các
bộ lọc hữu hạn Thứ hai, các công cụ toán như Đại số tuyến tính, Xác xuất, thống
kê Một số kiến thứ cần thiết như Trí tuệ nhân tao, Mạng nơron nhân tạo cũng được
đề cập trong quá trình phân tích và nhận dạng ảnh Các phương pháp xử lý ảnh bắtđầu từ các ứng dụng chính: nâng cao chất lượng ảnh và phân tích ảnh
ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo được truyềnqua cáp từ Luân Đôn đến New York từ những năm 1920 vấn đề nâng cao chấtlượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của ảnh Việc nângcao chất lượng ảnh được phát triển vào khoảng những năm 1955 Điều này có thểgiải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện choquá trình xử lý ảnh sô thuận lợi Năm 1964, máy tính đã có khả năng xử lý và nângcao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổiđường biên, lưu ảnh Từ năm 1964 đến nay, các phương tiện xử lý, nâng cao chấtlượng, nhận dạng ảnh phát triển không ngừng
Trang 11Các phương pháp tri thức nhân tạo như mạng nơron nhân tạo, các thuật toán
xử lý hiện đại và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi vàthu nhiều kết quả khả quan
Đe dễ tưởng tượng, xét các bước cần thiết trong xử lý ảnh Đầu tiên, ảnh tựnhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụpảnh) Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểuCCIR) Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy
ra từ Camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lýtiếp theo (Máy ảnh số hiện nay là một thí dụ gần gũi) Mặt khác, ảnh cũng có thểtiếp nhận từ vệ tinh; có thể quét từ ảnh chụp bằng máy quét ảnh
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính như nâng cao chấtlượng ảnh và phân tích ảnh
Do vậy, quá trình xử lý ảnh bao giờ cũng bắt đầu bằng công việc thu nhậnảnh và kết thúc là việc nhận dạng ảnh hoặc một phán đoán theo ý nghĩa trên cơ sởnhận dạng ảnh Cụ thể, các bước cơ bản trong quá trình xử lý ảnh được thể hiệnthông qua hình dưới đây:
Hình 1.1 Các bước cơ bản trong xử lý ảnh
1.2.1 Thu nhận ảnh (Image Acquisition)
Đây là bước đầu tiên trong quá trình xử lý ảnh Đầu ra của giai đoạn này làảnh đã được số hoá Vì vậy, công việc cụ thể ở giai đoạn này là thu ảnh qua một bộthu ảnh và số hoá những tín hiệu liên tục được sinh ra bởi bộ thu ảnh đó
Trang 12Bộ thu ảnh có thể là máy chụp ảnh đơn sắc hay màu, máy quét ảnh, máyquay Nếu bộ thu ảnh cung cấp chưa phải dạng số hoá thì phải chuyển đổi hay sốhoá ảnh.
Ảnh có thể nhận qua camera màu hoặc đen trắng Thường ảnh nhận quacamera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25dòng), cũng có loại camera đã số hoá (như loại CCD - Change Coupled Device) làloại photodiot tạo cường độ sáng tại mỗi điểm ảnh Camera thường dùng là loạiquét dòng ; ảnh tạo ra có dạng hai chiều Chất lượng một ảnh thu nhận được phụthuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh)
1.2.2 Tiền xử lý (Image Processing)
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộtiền xử lý để nâng cao chất lượng Chức năng chính của bộ tiền xử lý là lọc nhiễu,nâng độ tương phản để làm ảnh rõ hơn, nét hơn
Mục đích của các công việc này là làm cho chất lượng ảnh trở lên tốt hơnchuẩn bị cho các bước xử lý tiếp theo
Khử nhiễu: Nhiễu được chia thành hai loại là nhiễu hệ thống và nhiễu ngẫu
nhiên Đặc trưng của nhiễu hệ thống là tính tuần hoàn Do vậy, có thể khử nhiễu hệthống bằng việc sử dụng phép biến đổi Fourie và loại bỏ các đỉnh điểm Đối vớinhiễu ngẫu nhiên, trường họp đơn giản là các vết bẩn tương ứng với các điểm sánghay tối thì có thể khử bằng phương pháp nội suy, lọc trung vị và lọc trung bình
Chỉnh độ tương phản: Công việc cụ thể là chỉnh sửa tính không đồng đều
của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh
1.2.3 Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểudiễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong
bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tênngười thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng Đây là
Trang 13phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chínhxác của ảnh Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này.
Kết quả của bước phân đoạn ảnh thường được cho dưới dạng dữ liệu điểmảnh thô, trong đó hàm chứa biên của vùng ảnh hoặc tập hợp tất cả các điểm ảnhthuộc về chính vùng ảnh đó Trong cả hai trường hợp, sự chuyển đổi dữ liệu thô nàythành một dạng thích họp hon cho việc xử lý trong máy tính là hết sức cần thiết,nghĩa là nên biểu diễn một vùng ảnh dưới dạng biên hay dưới dạng một vùng hoànchỉnh gồm tất cả những điểm ảnh thuộc về nó
1.2.4 Biểu diễn ảnh (Image Representation)
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phânđoạn) cộng với mã liên kết với các vùng lận cận Việc biến đổi các số liệu này thànhdạng thích họp là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn các tínhchất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việctách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở đểphân biệt lóp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được
Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặctrưng của từng ký tự giúp phân biệt ký tự này với ký tự khác
Ảnh sau khi số hoá sẽ được lưu vào bộ nhớ hoặc chuyển sang các khâu tiếptheo để phân tích Nếu lưu trữ ảnh trực tiếp từ các ảnh thô đòi hỏi dung lượng bộnhớ rất lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thôngthường, các ảnh thô đó được biểu diễn lại theo các đặc điểm của ảnh được gọi là cácđặc trưng ảnh như: biên ảnh, vùng ảnh - Biểu diễn dạng biên cho một vùng phùhợp với những ứng dụng chỉ quan tâm đến các đặc trưng hình dạng bên ngoài củađối tượng
Ví dụ như các góc cạnh và điểm uốn trên biên
Biểu diễn dạng vùng thích hợp cho những ứng dụng khai thác các tính chất bên trong của đối tượng Ví dụ như vân ảnh hoặc cấu trúc xương của nó Trong một
Trang 14số ứng dụng thì cả hai cách biểu diễn trên đều cần thiết.
1.2.5 Nhận dạng và nội suy ảnh (Image Recognition and
Interpretation) Nhận dạng ảnh là quá trình xác định ảnh bằng cách so sánh
ảnh với
mẫu chuẩn đã được lưu từ trước
Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng ảnh
Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể nội suythành mã điện thoại Có nhiều cách phân loại khác nhau về ảnh Theo lý thuyết vềnhận dạng, các mô hình toán học về ảnh được phân theo hai loại nhận dạng sau:
- Nhận dạng theo tham số
- Nhận dạng theo cấu trúc
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trongkhoa học và công nghệ là: Nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử),nhận dạng văn bản, nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người
1.2.6 Cơ sở tri thức (Knowledge Base)
Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượngđiểm ảnh, nhiễu do môi trường thu ảnh phong phú Trong nhiều khâu xử lý và phântích ảnh, ngoài việc đơn giản hoá các phương pháp toán học đảm bảo tiện lợi cho xử
lý thì chúng ta luôn hướng đến việc xây dựng hệ thống tự động tiếp nhận và xử lýtheo cách của con người Vì vậy, nhiều khâu hiện nay đã được xử lý theo cácphương pháp trí tuệ nhân tạo, sử dụng cơ sở tri thức của con người
1.2.7 Mô tả ảnh
Từ Hình 1.1, ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sangcác khâu tiếp theo để phân tích Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏidung lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và côngnghệ Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mãhoá) theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image Features) như:
Trang 15biên ảnh (Boundary), vùng ảnh (Region) Một số phương pháp biểu diễn thườngdùng:
• Biểu diễn bằng mã chạy (Run-Length Code)
• Biểu diễn bằng mã xích (Chaîne -Code)
• Biểu diễn bằng mã tứ phân (Quad-Tree Code)
- Biểu diễn bằng mã chạy
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân.Một vùng ảnh R có thể mã hoá đơn giản nhờ một ma trận nhị phân:
U(m, n) = 1 nếu (m, n) thuộc R U( m, n) =
0 nếu (m, n) không thuộc R Trong đó: Uịmn), là hàm mô tả mức xám ảnh tại tọa độ (m, n) Với cách biểu diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1 Giả sử chúng ta mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ độ ịx, y) theo các chiều và đặc tả chỉ đối với giá trị “1 ” khi đó dạng mô tả có thể là: ịx, y)r; trong
đó ịx, y) là toạ độ, r là số lượng các bit có giá trị “1 ” liên tục theo chiều ngang
hoặc dọc
- Biểu diễn bằng mã xích
Phương pháp này thường dùng để biểu diễn đường biên ảnh Một đường bất kỳđược chia thành các đoạn nhỏ Nối các điểm chia, ta có các đoạn thẳng kế tiếp đượcgán hướng cho đoạn thẳng đó tạo thành một dây xích gồm các đoạn Các hướng cóthể chọn 4, 8, 12, 24 mỗi hướng được mã hoá theo số thập phân hoặc số nhị phânthành mã của hướng
- Biếu diễn bằng mã tứ phân
Phương pháp mã tứ phân được dùng để mã ho á cho vùng ảnh Vùng ảnh đầutiên được chia làm bốn phần thường là bằng nhau Nếu mỗi vùng đã đồng nhất
(chứa toàn điểm đen (1) hay trắng (ớ)) thì gán cho vùng đó một mã và không chia
tiếp Các vùng không đồng nhất được chia tiếp làm bốn phần theo thủ tục trên cho
Trang 16đến khi tất cả các vùng đều đồng nhất Các mã phân chia thành các vùng con tạothành một cây phân chia các vùng đồng nhất.
Trên đây là các thành phần cơ bản trong các khâu xử lý ảnh Trong thực
tế, các quá trình sử dụng ảnh số không nhất thiết phải qua hết các khâu đó tùytheo đặc điểm ứng dụng Hình 1.2 cho sơ đồ phân tích và xử lý ảnh và lưu đồthông tin giữa các khối một cách khá đầy đủ Ảnh sau khi được số hóa đượcnén, lưu lại để truyền cho các hệ thống khác sử dụng hoặc để xử lý tiếp theo.Mặt khác, ảnh sau khi số hóa có thể bỏ qua công đoạn nâng cao chất lượng(khi ảnh đủ chất lượng theo một yêu cầu nào đó) để chuyển tới khâu phân đoạnhoặc bỏ tiếp khâu phân đoạn chuyển trực tiếp tới khâu trích chọn đặc trưng.Hình 1.2 cũng chia các nhánh song song như: nâng cao chất lượng ảnh có hainhánh phân biệt: nâng cao chất lượng ảnh (tăng độ sáng, độ tương phản, lọcnhiễu) hoặc khôi phục ảnh (hồi phục lại ảnh thật khi ảnh nhận được bị méo)v.v
Trang 17Hình 1.2 Sơ đồ phân tích và xử lý ảnh và lưu đồ thông tin giữa các khối
1.3 Phân đoan ảnh
Phân đoạn ảnh là một thao tác ở mức thấp và là bước then chốt trongquá trình xử lý ảnh Giai đoạn này nhằm phân tích ảnh thành những vùng rờirạc có cùng tính chất nào đó dựa vào việc xác định biên và các vùng liên thôngcho từng vùng Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mứcxám, cùng màu hay cùng độ nhám Các vùng ảnh này thông thường sẽ tươngứng với toàn bộ hay từng phần của đối tượng thật bên trong ảnh
Mỗi vùng ảnh là một tập họp các điểm có cùng hoặc gần cùng một tínhchất nào đó như mức xám, mức màu, độ nhám Đường bao quanh một vùngảnh là biên ảnh Các điểm ảnh trong một vùng ảnh có độ biến thiên giá trị mứcxám tương đối đồng đều hay tinh kết cấu tương đồng
Dựa vào đặc tính vật lý của ảnh người ta có nhiều kỹ thuật phân vùngnhư phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồngnhất hay miền kề; phân vùng dựa và biên gọi là phân vùng biên Ngoài ra còn
có các kỹ thuật phân vùng khác dựa vào biên độ, dựa vào kết cấu
1.3.1 Điểm ảnh (Picture Element)
Gốc của ảnh là ảnh liên tục về không gian và độ sáng Đe xử lý ảnhbằng máy tính thì ảnh cần phải được số hóa số hóa ảnh là sự biến đổi gần đúngmột ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí và độ sáng.Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người khôngphân biệt được ranh giới giữa chúng Mỗi điểm như vậy gọi là điểm ảnh -Picture Element (PEL) hay gọi tắt là Pixel Trong khuôn khổ ảnh hai chiều,
mỗi pixel ứng với cặp tọa độ (x,y).
Như vậy, điểm ảnh (Pixel) là một phần tử của ảnh số tại tọa độ (x,y) với
độ xám hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đóđược chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian
Trang 18và mức xám (hoặc màu) của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh.
1.3.2 Độ phân giải của ảnh
bố theo trục X, y trong không gian hai chiều
Ví dụ: Độ phân giải của màn hình CGA (Color Graphic Adaptor) là mộtlưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh(320*200) Cùng loại màn hình CGA và ở cùng độ phân giải 320*200, ta sẽthấy màn hình CGA 12” mịn hơn màn hình CGA 17” Lý do chính là ở cùngmột độ phân giải nhưng diện tích màn hình rộng hơn thì độ mịn hay tính liêntục của các điểm ảnh sẽ thấp hơn
Ảnh đen trắng: là ảnh có hai màu đen trắng với mức xám ở các điểm
ảnh có thể khác nhau
Ảnh nhị phân: là ảnh chỉ có 2 mức đen trắng phân biệt dùng 1 bit mô tả
2 mức khác nhau Như vậy, mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc1
Trang 19Ảnh màu: trong khuôn khồ lý thuyết ba màu (Red, Blue, Green) để tạo
nên thế giới màu người ta thường dừng 3 byte để mô tả mức màu Khi đó mỗiđiểm ảnh có thể nhận số giá trị màu là 28*3=224 S316,7 triệu màu
1.3.4 Quan hệ giữa các điểm ảnh
Một ảnh số giả sử được biểu diễn bằng hàm f(x,y) Tập con các điểm ảnh
là S; cặp điểm ảnh có quan hệ với nhau là p,q Để thể hiện quan hệ giữa các
điểm ảnh chúng ta có một sổ khái niệm sau:
1.3.4.1 Các lần cận của điểm ảnh (Image Neighbors)
Gỉả sử có điểm ảnh p tại tọa độ (x,ỵ) p có 4 điểm lân cận gần nhất theo
chiều đứng và ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam,Bắc)
N 4 ( P ) = {(x-l,y)ỉ (x,y-l)ỉ (x,y+l)ỉ (x+l,y)ỉ
Trong đó: số 1 là giá trị logic; NẶp) là tập 4 đỉểm lân cận củap.
Các điểm lân cận chéo Np(p) (Cỏ thể coi lân cận chéo là 4 hướng:
Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)
N p (p) = {(x+l,y+l); (x+l,y-l); (x-l,y+l); (x-l;y-l)}
Tập kết hợp: Nsịp) = NẶp) + Np(p) là tập hợp 8 lân cận của điểm ành p.
Hình 1.3 Lân cân các điêm ảnh của tọa độ (x,y)
Hỉnh 1.3 Lân cận cảc điểm ảnh của tọa độ (x,y)
Trang 20I.3.4.2 Khoảng cách giữa các điểm ảnh
Định nghĩa: Khoảng cách D(p,q) giữa hai điểm ảnh p tọa độ (x,y), q tọa độ (s,t) là hàm khoảng cách (Distance) nếu:
1 D(p,q) > 0 (Với D(p,q)=0 nếu và chỉ nếu p-q)
Khoảng cách Euclide giữa hai điểm p và q là chiều dài đoạn thẳng p^ Trong
hệ tọa độ Descartes, nếu p = (pl, p2,.„, pn) và q = (ql, q2,.„, qn) là hai điểmtrong không gian Euclidn chiều, thì khoảng cách từ p đến q bằng:
Dạng chuẩn Euclid là khoảng cách của một điểm đến điểm gốc trong không gianEuclid:
IIPII = \JPĨ + v\ + • • ■ + vl = v/p - p
trong đó phương trình sau cùng là tích vô hướng Đây là chiều dài của p, khi ta xem
nó là một Véc-tơ Euclid có gốc nằm ở gốc tọa độ Khoảng cách khi đó
bằng IIP - qll = \/(p-q)-(p-q) = \/IIPIP + llq|p - 2p ■ q.
Trang 21Khoảng cách khối: Khoảng cách D 4 ịp,q) được gọi là khoảng cách khối đồ thị
(City - Block Distance) và được xác định như sau:
Khoảng cách hay khoảng cách nhỏ nhất d của một mã khối là số kí tự khác nhau nhỏ nhất giữa hai mã tự bất kì, và khoảng cách tương đối ò là tỉ lệ d f n , Một cách
cụ thể hơn, với hai mã tự C1J °ì- ^ ^ , đặt^(ci’ cz) là khoảng cách Hamming giữa và c 2,
nghĩa là số vị trí khác nhau giữa L: 1và c 2 Định nghĩa khoảng cách nhỏ nhất d của mã
Trang 22trường họp này là sử dụng giải mã danh sách, trong đó người nhận liệt kê tất cảcác mã tự nằm trong một bán kính nhất định.
Khoảng cách bàn cờ: Khoảng cách D 8 (p,q) còn gọi là khoảng cách bàn cờ (Chess-Board Distance) giữa điểm ảnh p,q được xác định như sau: D 8 (p,q) = maxị\ x-s, Iy-t\)
1.3.4.3 Các thành phần cơ bản của hệ thống xử lý ảnh
Hình 1.4 Các thành phần chính của hệ thống xử lý ảnh
Theo quan điểm của quy trình xử lý, chúng ta đã thể hiện các khối cơ bảntrên Hình 1.1, các khối chi tiết và luồng thông tin trên Hình 1.2 Theo quan điểmcủa hệ thống xử lý trên máy tính số, hệ thống gồm các đầu đo (thu nhận ảnh); bộ sốhóa ; máy tính số; Bộ hiển thị; Bộ nhớ Một hệ thống xử lý ảnh cơ bản có thể gồm:máy tính cá nhân kèm theo vỉ mạch chuyển đổi đồ hoạ VGA hoặc SVGA, đĩa chứacác ảnh dùng để kiểm tra các thuật toán và một màn hình có hỗ trợ VGA hoặcSVGA
Ảnh mức xám được áp dụng trong nhiều lĩnh vực như sinh vật học hoặctrong công nghiệp Thực tế chỉ ra rằng bất kỳ ứng dụng nào trên ảnh, mức xám cũngứng dụng được trên ảnh màu Với lý do đó, hệ thống ban đầu nên chỉ bao gồm cácthiết bị thu nhận và hiển thị ảnh đen trắng Với ảnh màu, nên sử dụng một hệ thống
Trang 23mới như Hình 1.4, trừ trường họp cần một camera TV màu và một màn hình đa tần
số (ví dụ như NEC Multisync, Sony Multiscan, hoặc Mitsubishi Diamond Scan) đểhiển thị ảnh màu Nếu khả năng hạn chế, có thể dùng PC kèm theo vỉ mạch VGA vàmàn hình VGA, để dựng ảnh được
1.3.5 Những vấn đề khác trong xử lỷ ảnh
1.3.5.1 Biến đổi ảnh (Image Transform)
Trong xử lý ảnh, do số điểm ảnh lớn, các tính toán nhiều (độ phức tạp tínhtoán cao) đòi hỏi dung lượng bộ nhớ lớn, thời gian tính toán lâu Các phương phápkhoa học kinh điển áp dụng cho xử lý ảnh hầu hết khó khả thi Vì vậy, chúng ta sửdụng các phép toán tương đương hoặc biến đổi ảnh sang miền xử lý khác để dễ tínhtoán
Sau khi xử lý xong, chúng ta dùng biến đổi ngược để đưa ảnh về miền xácđịnh ban đầu Các phép biến đổi thường gặp trong xử lý ảnh gồm:
- Biến đổi Fourier, Cosin, Sin,
- Biến đổi (mô tả) ảnh bằng tích chập, tích Kronecker,
- Các biến đổi khác như KL (Karhumen Loeve), Hadamard
Một số các công cụ sác xuất thông kê cũng được sử dụng trong xử lý
ảnh
1.3.5.2 Nén ảnh
Ảnh dù ở dạng nào vẫn chiếm không gian nhớ rất lớn Vì vậy, khi mô tả ảnh
có thể sử dụng kỹ thuật nén ảnh để thu thu gọn dung lượng nhớ dành cho ảnh Cácgiai đoạn nén ảnh có thể chia ra thành 2 thế hệ là thế hệ lvà thế hệ 2 Hiện nay, cácchuẩn nén ảnh MPEG được dùng với ảnh đang khá phổ biến Một số phương pháp,thuật toán nén được sử dụng rộng rãi là: Mã hóa loại dài RLC, mã hóa Huffman, mãhóa LZW, mã hóa khối, phương pháp Kim tự tháp Laplace,
1.3.5.3 Các định dạng cơ bản trong xử lý ảnh
Hình ảnh khi lưu trữ dưới dạng tệp tin sẽ được số hóa Một số dạng ảnh đã
Trang 24được chuẩn hóa như: ảnh GIF, BMP, PCX, IMG,
■Ảnh IMG: Là ảnh đen trắng, được nén theo từng dòng Mỗi dòng gồm cácgói, các dòng giống nhau cũng nén thành một gói
■Ảnh PCX: Là một trong những định dạng ảnh cổ điển nhất Nó sử dụngphương pháp mã loạt dài RLE (Run Length Encoded) để nén dữ liệu ảnh.Quá trình nén và giải nén được thực hiện trên từng dòng ảnh
■Ảnh TIFF: Là ảnh mà dữ liệu chứa trong tệp thường được tổ chức thànhcác nhóm dòng (cột) quét của dữ liệu ảnh
■Ảnh GIF: Dạng ảnh GIF cho chất lượng cao, độ phân giải đồ họa cao vàcho phép hiển thị trên hầu hết các phần cứng
Tuy các định dạng này khác nhau, song chúng đều tuân theo một cấu trúc chung nhất là gồm 3 phần:
■Mào đầu tệp (Header): Là phần chứa các thông tin về kiểu ảnh, kích thước,
độ phân giải, so bit dùng cho 1 pixel, cách mã hóa, vị trí bảng màu
■Dữ liệu nén (Data Compression): số liệu ảnh được mã hóa bởi kiểu mã hóachỉ ra trong phần Header
■Bảng màu (Palette Color): Bảng màu cho biết số màu dùng trong ảnh và sửdụng trong việc hiển thị màu của ảnh Ảnh đen trắng không nhất thiết phải
Trang 25đó : mức xám, mức màu, độ nhám Vùng ảnh là một trong hai thuộc tính của ảnh.Nói đến vùng ảnh là nói đến tính chất bề mặt Đường bao quanh một vùng ảnh(Boundary) là biên ảnh Các điểm trong một vùng ảnh có độ biến thiên giá trị mứcxám tương đối đồng đều hay tính kết cấu tương đồng.
Dựa vào đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân vùng : phânvùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền
kề ; phân vùng dựa vào biên gọi là phân vùng biên Ngoài ra còn có các kỹ thuậtphân vùng khác dựa vào biên độ, phân vùng dựa theo kết cấu