Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 56 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
56
Dung lượng
0,96 MB
Nội dung
Đồ ántốtnghiệp
Tìm hiểuphươngpháplàm
mảnh ảnh
Đồ ántôtnghiệpTìmhiểuphươngpháplàmmảnh
ảnh
Sinh viên Hà Đức Kiên - CT702 Trang
1
LỜI NÓI ĐẦU
Ngày nay khoa học nhận dạng có một vai trò vô cùng quan trọng bởi
các ứng dụng to lớn của nó trong nhiều lĩnh vực khoa học.Thining (làm mảnh)
là một bước tiền xử lý nhằm phục vụ cho những bước tiếp theo trong quá trình
nhận dạng. Đồán này giới thiệu các khái niệm, cách phân loại, và một số thuật
toán làm mảnh, những đánh giá cho từng loại thuật toán. Cấu trúc của đồán
gồm 4 chương bao gồm 3 ch
ương lý thuyết và 1 chương về cài đặt thực
nghiệm.
Chương 1: Tổng quan về làmmảnh ảnh.
Chương 2: Các thuật toán làmmảnh tuần tự.
Chương 3: Các thuật toán làmmảnh song song.
Chương 4: Cài đặt thực nghiệm.
Đồ ántôtnghiệpTìmhiểuphươngpháplàmmảnh
ảnh
Sinh viên Hà Đức Kiên - CT702 Trang
2
CHƯƠNG 1
TỔNG QUAN VỀ LÀMMẢNHẢNH
1.1 Xử lý ảnh
Cũng như xử lý dữ liệu bằng đồ họa, xử lý ảnh số là một lĩnh vực của
tin học ứng dụng. Xử lý ảnh số bao gồm các phươngpháp và kỹ thuật để biến
đổi, để truyền tải hoặc mã hoá các ảnh tự nhiên . Mục đích của xử lý ảnh gồm:
¾ Thứ nhất, biến đổi ảnh và làm đẹp ảnh.
¾
Thứ hai, tự động nhận dạng ảnh hay đoán nhận ảnh và đánh giá các nội
dung của ảnh.
Hình 1: các giai đoạn chính trong xử lý ảnh
1.1.1 Biểu diễn ảnh
Trong xử lý ảnh bằng máy tính , ảnh phải được đưa về dạng biểu diễn
số . Một ảnh được biểu diễn dưới dạng một ma trận hai chiều. Mỗi phần tử của
ma trận biểu diễn cho mức xám hay cường độ của điểm ảnh tương ứng. Mỗi
phần tử trong ma trận được gọi là phần tử ảnh (pixel).
Tuỳ theo vùng các giá trị xám của điểm ảnh, mà các ảnh được phân chia
ra thành ảnh màu, ảnh xám, hay ảnh nhị phân. Khi trên một ảnh chỉ tồn tại các
Đồ ántôtnghiệpTìmhiểuphươngpháplàmmảnh
ảnh
Sinh viên Hà Đức Kiên - CT702 Trang
3
giá trị 0 hoặc 1 thì ta nói đó là một ảnh nhị phân hoặc ảnh đen trắng và các
điểm ảnh của nó gọi là điểm ảnh nhị phân . Mỗi điểm ảnh nhị phân chỉ cần
dùng 1 bit để biểu diễn.
Với ảnh xám nếu dùng 1 Byte để biểu diễn thì số mức xám có thể biểu
diễn là 2
8
hay 256 màu. Mỗi mức xám được biểu diễn dưới dạng số nguyên
nằm trong khoảng từ 0 đến 255.
Với ảnh màu , việc biểu diễn tương tự ảnh xám chỉ khác các phần tử của
ma trận biểu diễn cho ba màu riêng rẽ gồm đỏ (red) , lục (green) , lam (blue) .
Để biểu diễn cho một điểm ảnh cần 24 bit , chia làm 3 khoảng 8 bit , mỗi
khoảng biểu diễn cho cường độ sáng của một trong các màu chính.
1.1.2 Nhận dạng
Nhận dạng là một ứng dụng quan trọng của làm mảnh. Nhận biết và
đánh giá nội dung của ảnh(nhận dạng) là sự phân tích một hình ảnh thành
những phần có nghĩa để phân biệt đối tượng này với đối tượng khác. Dựa vào
đó ta có thể mô tả cấu trúc của hình ảnh ban đầu. Có thể liệt kê một số phương
pháp nhận dạng cơ bản như nhận dạ
ng biên của một đối tượng trên ảnh , tách
cạnh , phân đoạn ảnh .v v Kỹ thuật này được dùng nhiều trong y học ( xử lý
tế bào , nhiễm sắc thể ) , nhận dạng chữ trong văn bản. Nhận dạng là quá trình
liên quan đến mô tả đối tượng mà người ta muốn đặc tả nó. Quá trình nhận
dạng thường đi sau quá trình trích chọn các đặc tính của đối tượng. Có hai
kiểu mô tả đối tượng :
•
Mô tả theo tham số ( nhận dạng theo tham số)
• Mô tả theo cấu trúc ( nhận dạng theo cấu trúc)
Trên thực tế người ta đã áp dụng nhận dạng chữ ( chữ cái , chữ số , chữ
có dấu) Hiện nay có các phươngpháp nhận dạng chữ bằng phươngpháp cấu
trúc , véctơ hoá đường nét các ảnh bản đồ , nhận dạng theo cấu trúc topo
Đồ ántôtnghiệpTìmhiểuphươngpháplàmmảnh
ảnh
Sinh viên Hà Đức Kiên - CT702 Trang
4
Nhận dạng chữ in hoặc đánh máy phục vụ cho quá trình tự động đọc tài
liệu , tăng tốc độ và chất lượng thu nhận thông tin. Nhận dạng chữ viết tay
(với mức độ ràng buộc về cách viết , kiểu chữ ) phục vụ cho nhiều lĩnh vực.
Ngoài hai kỹ thuật nhận dạng trên còn kỹ thuật nhận dạng mới dựa vào
kỹ thuật mạng nơron
đang được áp dụng và cho kết quả khả quan.
1.2 Xương và các phươngpháptìm xương
1.2.1. Thế nào là xương và làmmảnhảnh
Kết quả của việc làmmảnh là đưa ra xương của đối tượng ảnh , vậy
“xương ảnh là gì?”. Thuật ngữ “xương” dùng để chỉ kết quả mà không quan
tâm đến hình dạng chuẩn của mẫu hoặc các phương thức được sử dụng. Cho
đến nay, vẫn chưa có một định nghĩa đáng thuyết phục nào về xương ảnh. Vì
vậy việc tìm xương ả
nh, tức là tìm ra những nét đặc trưng cho một đối tượng
ảnh, là một điều hết sức khó khăn.
Xương được coi như hình dạng cơ bản của một đối tượng, với số ít các
điểm ảnh cơ bản. Ta có thể lấy được các thông tin về hình dạng nguyên bản
của một đối tượng thông qua xương. Vị trí, sự định hướng, độ dài của một
đoạn xương đặc trưng cho đoạn ảnh đó. Nhiệm vụ đặt ra là phải định rõ đặc
điểm thành phần của đoạn ảnh.
Các kỹ thuật tìm xương luôn là chủ đề nghiên cứu trong xử lý ảnh. Do
tính phức tạp của nó , mặc dù có những nỗ lực cho việc phát triển các thuật
toán tìm xương nhưng các phươngpháp đưa ra đều bị mất mát thông tin.
Nghiên cứu về
làmmảnh ta cần chú ý các vấn đề sau :
¾ Không phải tất cả các đối tượng đều có thể làm mảnh. Làmmảnh
chỉ hữu dụng với các đối tượng là đường, nghĩa là chúng chỉ
Đồ ántôtnghiệpTìmhiểuphươngpháplàmmảnh
ảnh
Sinh viên Hà Đức Kiên - CT702 Trang
5
thẳng hoặc cong và nó không có tác dụng với các đối tượng có
hình dạng đóng trong một vùng.
¾ Làmmảnh thông thường là bước chuẩn bị cho các bước tiếp theo
xử lý một đối tượng ảnh. Các bước tiếp theo làm việc trên các
thuộc tính cần thiết của xương.
1.2.2. Phân loại các thuật toán tìm xương
Có hai phươngpháptìm xương cơ bản :
¾ Phươngpháp thứ nhất xử dụng phép biến đổi trục trung vị , trục
trung vị được xác định bằng cách nối các điểm trung tâm của
khối bao bọc đối tượng , các điểm trung tâm thường được tính
bằng hàm khoảng cách cực đại . Phươngpháp này là phương
pháp tìm xương không dựa trên làm mảnh.
¾ Phươngpháp thứ hai bao gồm các thuật toán làm mảnh(thinning)
bằng các loại bỏ các điểm cực trị ( điểm biên) mà không làm thay
đổi tính liên thông và cấu trúc tôpô của ảnh cho đến khi độ rộng
của các đường bằng 1 đơn vị (1 pixel).
1.2.3. Phươngpháp thay đổi trục trung vị
Có thể người đầu tiên định nghĩa xương là Blum (1976), thông qua việc
định nghĩa hàm trục trung vị (MFA). Hàm MFA xử lý tất cả các điểm ảnh trên
đường biên như các điểm nguồn của một mặt sóng trước. Mỗi một điểm ảnh
lại tác động lên các láng giềng của nó với một thời gian trễ tương ứng với
khoảng cách, do vậy chúng cũng trở thành một phần củ
a sóng trước. Sóng
truyền qua mỗi điểm chỉ một lần và khi hai sóng gặp nhau, chúng sẽ triệt tiêu
nhau, sinh ra một góc. Trục trung vị (MA) là quĩ tích của các góc này, và là
Đồ ántôtnghiệpTìmhiểuphươngpháplàmmảnh
ảnh
Sinh viên Hà Đức Kiên - CT702 Trang
6
mẫu xương của một đối tượng. MAF sử dụng hai thông tin cả về không gian
lẫn thời gian, và có thể đảo ngược lại một ảnh gốc.
Có một cách để tìm ra trục trung vị là sử dụng đường biên của đối
tượng. Đối với bất cứ một điểm p nào đó trên đối tượng, đều có thể bao nó bởi
một đường biên. Nếu như có nhiều hơn m
ột điểm biên có khoảng cách ngắn
nhất thì p nằm trên trục trung vị. Bộ tất cả các điểm như vậy lập thành trục
trung vị của đối tượng. Điều đó phải được thực hiện với độ phân giải cao,
hoặc khoảng cách Ơcơlit là không bằng nhau, và như thế các điểm ảnh xương
sẽ mất đi. Ta dễ dàng thu được mộ
t xấp xỉ của trục trung vị trên một lưới đơn
giản sau hai bước:
¾ Bước thứ nhất, tính toán khoảng cách từ mỗi điểm ảnh của đối
tượng đến điểm biên gần nhất. Việc này yêu cầu phải tính toán
khoảng cách tới tất cả các điểm ảnh đường biên.
¾ Bước thứ hai, khoảng cách ảnh đã được tính toán, và các điể
m
ảnh có giá trị rộng nhất được xem là nằm trên trục trung vị.
Hình2: Trục trung vị
Hầu hết các nhà nghiên cứu đều cho rằng thay đổi trục trung vị thường
không mang lại một xương chuẩn, và thời gian tính toán quá dài, tuy nhiên, nó
là mẫu cơ bản của phần lớn các phươngpháplàm mảnh.
Đồ ántôtnghiệpTìmhiểuphươngpháplàmmảnh
ảnh
Sinh viên Hà Đức Kiên - CT702 Trang
7
Phương pháp thay đổi trục trung vị được coi là một phươngpháplàm
mảnh không lặp , ngoài ra còn có một vài thuật toán duyệt các điểm biên 2 bên
mẫu , tính điểm trung tâm của các đường nối giữa các điểm biên đó và xương
thu được là tập hợp các điểm trung tâm đó ( line following) hoặc các phương
thức sử dụng chuỗi Fourier (Fourier transform) cũng được coi là làmmảnh
không lặp.
1.2.4. Phươngpháptìm xương dựa trên làm mảnh
Các phươngpháptìm xương dựa trên làmmảnh chính là vấn đề mà đồ
án này nghiên cứu. Đó chính là các dạng thuật toán xoá các điểm biên của
mẫu một cách có chọn lọc cho đến khi thu được xương. Việc xoá đi hay giữ
lại một điểm ảnh (điểm đen) p dựa trên vùng lân cận của p. Như vậy chúng ta
xét các điểm ảnh, các thuật toán có thể được phân lớp thành các thuật toán
tuần tự
hay song song.
Đối với thuật toán tuần tự các điểm ảnh được xoá đi theo một trật tự
nhất định trong mỗi vòng lặp và giá trị của điểm ảnh p sau mỗi vòng lặp
không chỉ phụ thuộc vào giá trị của các láng giềng mà còn phụ thuộc vào các
điểm ảnh đã được xét trước đó trong chính vòng lặp đó.
Đối với thuật toán làmmảnh song song , các điểm ảnh có thể
được xử
lý cùng một lúc , giá trị của điểm ảnh chỉ phụ thuộc vào giá trị của các láng
giềng. Chính vì thế mà các thuật toán dạng này được xử dụng trên các bộ vi
xử lý song song để tăng khả năng tính toán. Tuỳ theo số chu trình con được xử
Đồ ántôtnghiệpTìmhiểuphươngpháplàmmảnh
ảnh
Sinh viên Hà Đức Kiên - CT702 Trang
8
dụng trong thuật toán mà làmmảnh song song được chia ra thành các kiểu
như sau : 1, 2 , hoặc 4 chu trình con.
1.3 Các khái niệm cơ bản trong làmmảnh
Xét điểm ảnh p(i,j) và các điểm lân cận
Hình3 : Điểm ảnh p và các láng giềng
Láng giềng : các điểm ảnh x
1
, x
2
,. , x
8
là 8_láng giềng của p và được
biểu thị bởi N(p) và chúng còn được gọi là kề 8 của p. Các điểm ảnh x
1
, x
3
,
x
5
, x
7
được gọi là 4_láng giềng hay kề 4 của p. Ta sẽ sử dụng x
i
để chỉ các
điểm ảnh và x
i
là điểm ảnh trắng hoặc đen tương ứng giá trị 0 hoặc 1 của nó.
Số các điểm ảnh đen trong N(p) được gọi là b(p).
Đường đi : một trật tự của các điểm ảnh y
1
, y
2
,. , y
n
được gọi là một
8_đường đi (hoặc 4_đường đi) nếu y
i+1
là một trong 8_láng giềng ( hoặc
4_láng giềng ) của y
i
(i=1, 2, ., n-1).
Hai điểm được gọi là liên thông với nhau nếu tồn tại đường đi giữa
chúng.
Một bộ con Q của ảnh P được gọi 8_liên thông ( hay 4_liên thông) nếu
mọi cặp điểm x, y trong Q đều tồn tại 8_đường đi (hoặc 4_đường đi) từ x đến
y phù hợp với các điểm của Q. Trong trường hợp này, Q được gọi là một
8_thành phần (hoặc 4_thành phần) của P.
x
4
x
3
x
2
x
5
P x
1
x
6
x
7
x
8
Đồ ántôtnghiệpTìmhiểuphươngpháplàmmảnh
ảnh
Sinh viên Hà Đức Kiên - CT702 Trang
9
Điểm biên : các điểm ảnh được xét để xoá là các điểm biên và thường
được định nghĩa là có ít nhất 1 trong các láng giềng là trắng. Có 2 loại biên 4
liên kết và 8 liên kết.
Hình 4 : các điểm biên liên kết 8
Điểm trong : các điểm đen mà không phải là điểm biên được gọi là
điểm trong của ảnh.
Điểm cuối : một điểm đen thoả mãn điều kiện b(p)=1 thì đượ
c coi là
điểm cuối. Điều kiện điểm cuối này được một số tác giả đưa ra với các dạng
khác nhau : p có thể được giữ lại khi có 2 hoặc 3 các điểm ảnh đen phối hợp
trên một bên của N(p), điều kiện này có thể được áp dụng chỉ sau hai vòng lặp
đầu tiên, hoặc rất có thể nó sẽ bị bỏ qua hoàn toàn để tránh các nhánh giả.
Phần lớn sự khác nhau giữa các thuật toán là ở điều kiện đảm bảo tính
liên thông. Điều kiện này được định nghĩa theo các thuật ngữ số giao, số liên
thông, và điểm ảnh đơn.
Số giao : có hai định nghĩa về số giao của một điểm ảnh.
[...]... THUẬT TOÁN LÀMMẢNH SONG SONG Trong làmmảnh song song, các điểm ảnh được kiểm tra để xoá dựa trên kết quả của vòng lặp trước đó Vì nguyên nhân này, các thuật toán làmmảnh song song phù hợp để cài đặt trên các bộ xử lý song song, các điểm ảnh phải Sinh viên Hà Đức Kiên - CT702 Trang 23 ĐồántôtnghiệpTìmhiểuphươngpháplàmmảnhảnh thoả mãn tập các điều kiện để có thể được xoá đồng thời Nhưng đáng... dày 2 điểm ảnh, các điểm ảnh được qui cho xương dựa trên tiêu chuẩn liên thông Do đó, các điểm ảnh này được giữ lại trong quá trình làmmảnh 1.4 Các tính chất và yêu cầu đối với làmmảnh Phần này giới thiệu về các yêu cầu, tính chất đối với một thuật toán làmmảnh và khả năng đáp ứng của từng loại thuật toán Sinh viên Hà Đức Kiên - CT702 Trang 11 Đồántôtnghiệp Tìm hiểuphươngpháplàmmảnh ảnh Các... thứ hai 3 3 LÀMMẢNH SONG SONG 4 CHU TRÌNH CON 3.3.1 Thuật toán của Bel-lan và Monoto Đây là một thuật toán 4_vòng lặp con, ở đây, các điểm ảnh xương được tìm thấy trên mỗi vòng lặp được phân định số vòng lặp để cho các phép tính toán độ rộng của đối tượng tiếp sau đó Các giá trị của các điểm ảnh xương từ Sinh viên Hà Đức Kiên - CT702 Trang 34 Đồántôtnghiệp Tìm hiểuphươngpháplàmmảnh ảnh các vòng... 8_láng giềng , kí tự C biểu diễn cho điểm trung tâm như hình 6a NW N NE W E C SW S SE Hình 6a cửa sổ 3x3 các điểm ảnh Sinh viên Hà Đức Kiên - CT702 Trang 26 Đồántôtnghiệp Tìm hiểuphươngpháplàmmảnh ảnh Đôi khi quá trình làmmảnh hoàn thành , vẫn còn có những điểm ảnh có thể xoá được Chủ yếu là dạng cầu thang gác , gần như một nửa số điểm ảnh trong một cầu thang gác có thể xoá được mà không làm ảnh. .. 8 Cửa sổ các láng giềng của Suzuki Sinh viên Hà Đức Kiên - CT702 Trang 33 Đồántôtnghiệpảnh Tìm hiểuphươngpháplàmmảnh 3.2.3 Thuật toán của Guo Thuật toán này cũng sử dụng XH (p) thực hiện việc làmmảnh trên 2_chu trình con, ảnh được chia thành 2 trường con riêng biệt trên một bảng kiểm tra mẫu và mỗi một vòng lặp con lại xoá đi các điểm ảnh p trên một trường con nếu p là điểm ảnh đường biên,... + x7 = 0 D6-D8 nhận được từ do việc quay D3-D5 1800 Người ta cũng đã đề nghị rằng nên sử dụng 2 vòng lặp con cho thuật toán này, vòng thứ nhất xoá những điểm ảnh thoả mãn các điều kiện D1-D5, vòng lặp thứ hai xóa những điểm ảnh phù hợp với D1,D2 và D6-D8 Tất Sinh viên Hà Đức Kiên - CT702 Trang 25 Đồántôtnghiệp Tìm hiểuphươngpháplàmmảnh ảnh nhiên, thuật toán này xoá đi những điểm ảnh đã bị cô... ảnh nào bị xoá 3.2 LÀMMẢNH SONG SONG 2 CHU TRÌNH CON 3.2.1 Thuật toán của Zang-Suen Đây là phép cài đặt dựa trên tập các điều kiện D1-D8 trong thuật toán Rutovitz theo 2 vòng lặp con Vòng thứ nhất, p được xoá đi nếu nó thoả mãn các điều kiện sau: Z1: 2 ≤ b(p) ≤ 6 Z2: XR (p) = 2 Z3: x1.x3.x7 = 0 Sinh viên Hà Đức Kiên - CT702 Trang 31 Đồántôtnghiệpảnh Z4: x1.x7.x5 = 0 Tìmhiểuphươngpháplàm mảnh. .. sinh Thuật toán này cũng được cài đặt trên môi trường phân tán bằng cách gán các tập con không gối lên nhau của mẫu cho các bộ điều khiển khác nhau để làmmảnh sau đó đồng bộ hoá thông tin của các biên khi kết thúc mỗi vòng lặp Trong một số sản phẩm gần Sinh viên Hà Đức Kiên - CT702 Trang 19 ĐồántôtnghiệpTìmhiểuphươngpháplàmmảnhảnh đây, một điểm biên được xoá đi nếu tất cả 4_láng giềng của... cuối thực Để tránh sự xói mòn quá mức và việc tạo ra các điểm cuối giả tạo cùng một lúc, chúng ta phải có những cách khác nhau nhằm loại trừ điều kiện điểm cuối, tạo ra những điều kiện tổng quát và thích hợp hơn, hoặc chỉ áp dụng điều kiện trên các giai đoạn trước làmmảnh Sinh viên Hà Đức Kiên - CT702 Trang 13 ĐồántôtnghiệpảnhTìmhiểuphươngpháplàmmảnh CHƯƠNG 2 CÁC THUẬT TOÁN LÀMMẢNH TUẦN TỰ... không đầy đủ của các thuật toán Sinh viên Hà Đức Kiên - CT702 Trang 12 ĐồántôtnghiệpTìmhiểuphươngpháplàmmảnhảnh 1.4.4 Yêu cầu tính liên thông và tính Tô pô Việc duy trì tính liên thông và tính chất Tô pô khi làmmảnh cũng đã được giải quyết bằng những cách khác nhau Trong các thuật toán tuần tự, kiểm tra một vùng 3 × 3 láng giềng dưới dạng số giao Các thuật toán song song giải quyết vấn đề .
Đồ án tốt nghiệp
Tìm hiểu phương pháp làm
mảnh ảnh
Đồ án tôt nghiệp Tìm hiểu phương pháp làm mảnh
ảnh
Sinh viên Hà Đức Kiên -.
Đồ án tôt nghiệp Tìm hiểu phương pháp làm mảnh
ảnh
Sinh viên Hà Đức Kiên - CT702 Trang
2
CHƯƠNG 1
TỔNG QUAN VỀ LÀM MẢNH ẢNH
1.1 Xử lý ảnh