Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 47 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
47
Dung lượng
2,21 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TAO
TRƯỜNG………………….
Luận văn
Tìm hiểuphươngphápDSEcho
bài toántìmxươngcủaảnh
1
_______________________________________________________________
Sinh viên: Lương Thị Hoài Xuân – CT1102
MỤC LỤC
MỤC LỤC 1
MỞ ĐẦU 3
DANH MỤC HÌNH VẼ 4
CHƢƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH 5
1.1 Các khái niệm cơ bản trong xử lý ảnh 5
1.1.1 Xử lý ảnh là gì 5
1.1.2 Ảnh và điểm ảnh 5
1.1.3 Quan hệ giữa các điểm ảnh 5
1.1.4 Mức xám củaảnh 6
1.1.5 Độ phân giải 7
1.2 Các phép toán cơ bản trên ảnh nhị phân 8
1.2.1 Các phép toán logic 8
1.2.2 Các phép toán hình thái học 8
1.3 Các giai đoạn chính trong xử lý ảnh 15
1.4 Một số ứng dụng cơ bản 16
CHƢƠNG 2: XƢƠNG VÀ CÁC KỸ THUẬT TÌM XƢƠNG 18
2.1 Khái niệm xương 18
2.2 Các hướng tiếp cận trong việc tìmxương 18
2.2.1 Tìmxương dựa trên làm mảnh 18
2.2.2 Tìmxương không dựa trên làm mảnh 19
2
_______________________________________________________________
Sinh viên: Lương Thị Hoài Xuân – CT1102
CHƢƠNG 3: CẮT TỈA XƢƠNG VỚI DSE 26
3.1 Giới thiệu 26
3.2 Phươngpháp DCE 27
3.2.1 Giới thiệu 27
3.2.2 Ý tưởng chính 29
3.2.3 Rời rạc hóa đường cong với DCE 31
3.2.4 Cắt tỉa xương với DCE 33
3.3 PhươngphápDSE 36
3.3.1 Ý tưởng chính 36
3.3.2 Các định nghĩa 37
3.3.3 Thuật toánDSE 39
CHƢƠNG 4: KẾT QUẢ THỰC NGHIỆM 41
4.1 Môi trường cài đặt 41
4.2 Chương trình thực nghiệm 41
4.2.1 Giao diện chương trình 41
4.2.2 So sánh kết quả tìmxương với các phươngpháp DCE 41
4.2.3 Hiệu quả của việc sử dụng ngưỡng (threshold) 43
KẾT LUẬN 45
TÀI LIỆU THAM KHẢO 46
3
_______________________________________________________________
Sinh viên: Lương Thị Hoài Xuân – CT1102
MỞ ĐẦU
Xương có thể xem như việc biểu diễn hình dạng một cách cô đọng trong đó
hình dạng có thể khôi phục lại hoàn toàn từ xương. Xương được sử dụng rộng rãi để
phân tích hình dạng và nhận dạng đối tượng như tra cứu ảnh và đồ họa máy tính, nhận
dạng kí tự, xử lý ảnh và phân tích các hình ảnh sinh học. Các thuật toántìmxương đã
được đưa ra nhưng đều gặp phải những hạn chế tương tự nhau đó là có độ nhạy cảm
cao đối với nhiễu đường biên, những biến đổi nhỏ trên đường biên của đối tượng có thể
làm thay đổi đáng kể xương nhận được, ảnh hưởng tới độ chính xác của xương. Đồ án
trình bày kỹ thuật cắt tỉa xương bằng phươngphápDSE (Discete Skeleton Evolution)
đã giải quyết những hạn chế nêu trên.
Đồ án gồm bốn chương: Chương 1 giới thiệu tổng quan về xử lý ảnh. Chương 2
giới thiệu khái niệm về xương và một số phươngpháptìm xương. Chương 3 trình bày
về phươngphápDSE (Discrete Skeletion Evolution). Chương 4 giới thiệu môi trường
cài đặt và kết quả thu được.
4
_______________________________________________________________
Sinh viên: Lương Thị Hoài Xuân – CT1102
DANH MỤC HÌNH VẼ
Hình 1.1. Hình minh họa các phép toán trên ảnh nhị phân 8
Hình 1.2. Hiệu quả của thao tác nhị phân đơn giản trên một ảnh nhỏ 9
Hình 1.3. A dãn bởi B 10
Hình 1.4. Dãn mất điểm ảnh 11
Hình 1.5. Dãn ảnh sử dụng phần tử cấu trúc 11
Hình 1.6. Phép co nhị phân. 12
Hình 1.7. Sử dụng phép toán mở 13
Hình 1.8. Phép đóng 14
Hình 1.9. Phép đóng với độ sâu lớn 14
Hình 1.10. Các giai đoạn chính trong xử lý ảnh 15
Hình 2.1. Trục trung vị 20
Hình 2.2. Xương Voronoi rời rạc ảnh hưởng của các hàm hiệu chỉnh khác nhau
22
Hình 2.3. Minh họa thuật toán trộn hai sơ đồ Voronoi 23
Hình 2.4. Minh họa thuật toán thêm một điểm biên vào sơ đồ Voronoi 24
Hình 3.1. Minh họa hạn chế 1 28
Hình 3.2. Minh họa hạn chế 2 28
Hình 3.3. Minh họa hạn chế 3. 29
Hình 3.4. Cắt tỉa xương với phân chia đường biên 30
Hình 3.5. Trình tự xươngcủa lá 31
Hình 3.6. Minh họa cắt tỉa xương với DCE 33
Hình 3.7. Các đỉnh lồi như nhau có thể sinh ra các nhánh xương khác nhau với
mức quan trọng khác nhau 35
Hình 3.8. Loại bỏ đỉnh lồi không quan trọng tạo ra hình ảnhxương tối ưu 35
Hình 3.9. Quá trình tiến hóa bộ xương thu được trong vòng lặp cắt tỉa xươngcủa
một con chim 36
Hình 3.10. Các điểm xương cuối và các điểm giao nhau. 38
Hình 3.11. Khôi phục lại hình dạng gốc từ xương. 38
Hình 4.1. Giao diện chương trình 41
Hình 4.2. Xương thu được bằng phươngpháp DCE và DSE 42
Hình 4.3. Xương thu được bằng phươngphápDSE theo các ngưỡng khác nhau, t
là giá trị ngưỡng 44
5
_______________________________________________________________
Sinh viên: Lương Thị Hoài Xuân – CT1102
CHƢƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1 Các khái niệm cơ bản trong xử lý ảnh
1.1.1 Xử lý ảnh là gì
Xử lý ảnh số bao gồm các phươngpháp và kỹ thuật biến đổi, để truyền tải hoặc
mã hóa các ảnh tự nhiên.
Xử lý ảnh là lĩnh vực nghiên cứu, là quá trình biến đổi từ một ảnh ban đầu sang
một ảnh mới tuân thủ tính chất và đặc trưng riêng của xử lý.
Có 2 mục đích chính của xử lý ảnh:
- Cải thiện chất lượng phục vụ cho quan sát.
- Chuẩn bị các điều kiện cho việc trích chọn các đặc trưng phục vụ cho việc
nhận dạng và ra quyết định.
1.1.2 Ảnh và điểm ảnh
Ảnh tự nhiên là ảnh liên tục về không gian và độ sáng. Để xử lý bằng máy tính
(số), ảnh cần phải được số hóa. Số hóa là sự biến đổi gần đúng một ảnh liên tục thành
một tập điểm phù hợp với ảnh thật về trí (không gian) và độ sáng (mức xám).
Khoảng cách giữa các điểm ảnh được thiết lập sao cho mắt người không phân biệt
được ranh giới giữa chúng. Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture
Elememt) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chiều, mỗi pixel tương ứng với
cặp tọa độ (x, y).
Điểm ảnh (pixel) là một phần tử củaảnh số tại tọa độ (x, y) với độ xám hoặc
màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh được chọn thích hợp sao
cho mắt người cảm nhận được sự liên tục về không gian và mức xám củaảnh số gần
như ảnh thật. Mỗi phần tử trong ma trận được gọi là phần tử ảnh.
Ảnh được xem như tập hợp các điểm ảnh.
1.1.3 Quan hệ giữa các điểm ảnh
1.1.3.1 Các lân cận của điểm ảnh
Giả sử một ảnh số được biểu diễn bằng hàm f(x, y), p và q là cặp điểm ảnh có
quan hệ với nhau, điểm ảnh p có tọa độ (x, y). Định nghĩa các lân cận của điểm ảnh.
6
_______________________________________________________________
Sinh viên: Lương Thị Hoài Xuân – CT1102
Lân cận 4 của p kí hiệu N
4
(p):
- N
4
(p) = {(x-1, y); (x, y-1); (x, y+1); (x+1, y)}
Lân cận chéo của p kí hiệu N
p
(p):
- N
p
(p) = {(x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)}
Lân cận 8 của p kí hiệu N
8
(p):
- N
8
(p) = N
4
(p) + N
p
(p)
1.1.3.2 Các mối liên kết điểm ảnh
Các mối liên kết được sử dụng để xác định giới hạn của đối tượng hoặc xác định
vùng trong một ảnh. Một liên kết được đặc trưng bởi tính liền kề giữa các điểm và mức
xám của chúng. Có ba loại liên kết:
- Liên kết 4: Hai điểm ảnh p và q được gọi là liên kết 4 nếu q thuộc N
4
(p)
- Liên kết 8: Hai điểm ảnh p và q được gọi là liên kết 8 nếu q thuộc N
8
(p)
- Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q được gọi là liên kết hỗn
hợp nếu q thuộc N
4
(p) hoặc q thuộc N
8
(p)
1.1.3.3 Đo khoảng cách giữa các điểm ảnh
Khoảng cách D(p, q) giữa hai điểm ảnh p có tọa độ (x, y), q có tọa độ (s, t) là
hàm khoảng cách (Distance) nếu:
- D(p, q) ≥ 0 (Với D(p, q)=0 khi và chỉ khi p=q)
- D(p, q) = D(q, p)
- D(p, z) ≤ D(p, q) + D(q, z); z là một điểm ảnh khác
Khoảng cách Euclide giữa hai điểm ảnh p(x, y) và q(s, t) được định nghĩa như
sau: D
e
(p, q) = [(x - s)
2
+ (y - t)
2
]
1/2
1.1.4 Mức xám củaảnh
Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại
điểm đó.
7
_______________________________________________________________
Sinh viên: Lương Thị Hoài Xuân – CT1102
Các thang giá trị mức xám thông thường là: 16, 32, 64, 128, 256 (Mức 256 là
mức phổ dụng nhất vì máy tính dùng 1 byte (8 bit) để biểu diễn mức xám. Mức xám
dùng 1 byte biểu diễn: 2
8
=256, tức là từ 0 đến 255)
Ảnh đen trắng là ảnh có hai màu đen và trắng. Nếu phân mức đen trắng thành L
mức, sử dụng số bit B để mã hóa mức đen trắng (hay mức xám) thì L được xác
định: L=2B.
- Nếu L=2, B=1 nghĩa là chỉ có 2 mức 0 và 1. Ảnh dùng hai mức 0 và 1 để
biểu diễn mức xám gọi là ảnh nhị phân. Mức 1 ứng với màu sáng còn mức
0 ứng với màu tối.
- Nếu L lớn hơn 2 đó là ảnh đa cấp xám. Như vậy ảnh nhị phân mỗi điểm
ảnh được mã hóa trên 1 bit, còn ảnh 256 mức mỗi điểm ảnh được mã hóa
trên 8 bit. Ảnh đen trắng nếu dùng 8 bit (1 byte) để biểu diễn mức xám số
mỗi mức xám được biểu diễn dưới dạng một số nguyên nằm trong khoảng
từ 0 đến 255, mức 0 biểu diễn cho cường độ đen nhất và mức 255 biểu diễn
cho cường độ sáng nhất.
Ảnh màu: là ảnh tổ hợp từ 3 màu cơ bản đỏ (Red), lục (Green), lam (Blue). Để
biểu diễn cho một điểm ảnh màu dùng 3 byte để mô tả 24 bit màu 2
8*3
=2
24
≈ 16,7 triệu
màu.
1.1.5 Độ phân giải
Độ phân giải (Resolution) củaảnh là mật độ điểm ảnh được ấn định trên ảnh số
khi hiển thị. Như vậy khoảng cách giữa các điểm ảnh được chọn sao cho mắt người
vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên một
mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không
gian hai chiều.
8
_______________________________________________________________
Sinh viên: Lương Thị Hoài Xuân – CT1102
1.2 Các phép toán cơ bản trên ảnh nhị phân
1.2.1 Các phép toán logic
Hình 1.1 dưới đây minh họa các phép toán với giá trị nhị phân “1” có màu đen,
còn giá trị nhị phân “0” có màu trắng.
(a)Ảnh a (b)Ảnh b
(c) (d) (e)
Hình 1.1. Hình minh họa các phép toán trên ảnh nhị phân
Trong hình 1.1: hình (a) và (b) là ảnh ban đầu; (c) phép NOT (b); (d) phép OR
(a,b); (e) phép AND (a,b).
1.2.2 Các phép toán hình thái học
Hình thái (morphology) có nghĩa là “hình thức và cấu trúc của một đối tượng”,
hoặc là cách sắp xếp mối quan hệ bên trong giữa các phần của đối tượng. Hình thái có
liên quan đến hình dạng, và hình thái số là một cách để mô tả hoặc phân tích hình dạng
của một đối tượng số.
9
_______________________________________________________________
Sinh viên: Lương Thị Hoài Xuân – CT1102
Những thao tác hình thái nhị phân được xây dựng trên ảnh chỉ có 2 mức xám 0
và 1, “0” ứng với màu trắng, “1” ứng với màu đen. Trước hết, để bắt đầu, ta hãy xem
hình 1.2a. Tập hợp các điểm ảnh đen tạo nên đối tượng ảnh hình vuông và trong hình
1.2b, đối tượng ảnh cũng là hình vuông nhưng là hình vuông lớn hơn so với hình 1.2a
một điểm ảnh về mọi phía, nghĩa là thay mọi lân cận trắng của các điểm ảnh trong hình
1.2a thành các điểm ảnh đen. Đối tượng trong hình 1.2c cũng được thao tác tương tự,
tức là hình 1.2b được tăng thêm một điểm ảnh về mọi phía. Thao tác đó có thể coi như
một phép dãn đơn giản, phép dãn một điểm ảnh về mọi phía. Việc dãn đó có thể được
thực hiện cho đến khi toàn bộ ảnh được thay bằng các điểm ảnh đen. Do vậy, đối tượng
ảnh trong hình 1.2a có thể được viết lại là{(3, 3) (3, 4) (4, 3) (4,4)}, với điểm ảnh phía
trên bên trái là (0, 0). Tuy nhiên, việc viết như vậy sẽ rất dài dòng và bất tiện nên ta gọi
đơn giản đối tượng ảnh là A, và các phần tử trong đó là các điểm ảnh.
(a) (b) (c)
Hình 1.2. Hiệu quả của thao tác nhị phân đơn giản trên một ảnh nhỏ
Trong hình 1.2: hình (a) ảnh ban đầu; (b) ảnh dãn 1 điểm ảnh; (c) ảnh dãn 2
điểm ảnh so với ảnh ban đầu.
1.2.2.1 Phép dãn nhị phân
Bây giờ ta sẽ chỉ ra thao tác tập hợp đơn giản nhằm mục đích định nghĩa phép
dãn nhị phân. Phép dịch A bởi điểm x (hàng, cột), được định nghĩa là một tập:
(A)x ={c | c = a + x, a A} (1.1)
Chẳng hạn nếu x có toạ độ (1, 2), khi đó điểm ảnh đầu tiên phía trên bên trái của
A sẽ dịch đến vị trí: (3, 3) + (1, 2) = (4, 5). Các điểm ảnh khác trong A sẽ dịch chuyển
[...]... thể chia thuật toántìmxương thành hai loại cơ bản: - Các thuật toántìmxương dựa trên làm mảnh - Các thuật toántìmxương không dựa trên làm mảnh 2.2.1 Tìm xƣơng dựa trên làm mảnh 2.2.1.1 Sơ lƣợc về thuật toán làm mảnh Thuật toán làm mảnh ảnh số nhị phân là một trong các thuật toán quan trọng trong xử lý ảnh và nhận dạng Xương chứa những thông tin bất biến về cấu trúc của ảnh, giúp cho quá trình... nhanh Phươngpháptìmxương được phân làm 4 loại: phươngpháp làm mảnh, thuật toán miền rời rạc dựa trên đồ thị Voronoi, các thuật toán dựa trên biến đổi khoảng cách và phép toán hình thái học Tất cả các xương thu được không khuất phục được sự nhạy cảm củaxương và nhiều trong số chúng cũng bao gồm phươngpháp cắt tỉa cùng với tìmxương Một phần thiết yếu của thuật toántìmxương là các thuật toán cắt... trọng do đó phươngpháp đề xuất tiếp tục giải quyết những hạn chế củaphươngpháp DCE Trong phươngpháp này tác giả thực hiên loại bỏ những nhánh xương có liên quan thấp nhất tới việc khôi phục lại hình dạng Phươngpháp này cho phép vượt qua sự bất ổn củaxương và thu được nhiều điểm xương ổn định 3.2 Phƣơng pháp DCE 3.2.1 Giới thiệu Có hai phươngpháp cắt tỉa xương chính: - Dựa trên phươngpháp đo lường... dạng trong tập dữ liệu MPEG-7 Có hai yếu tố chính hạn chế việc thực hiện củaxương dựa vào đối sánh hình dạng: - Sự nhạy cảm củaxương với sự biến đổi đường biên của đối tượng: một ít nhiễu hoặc biến đổi của đường biên thường tạo ra nhánh xương thừa điều này có thể làm biến đổi hình dạng đúng củaxương - Chi phí thời gian cho việc tìmxương và đối sánh các cây xương hay các đồ thị xương không thể đáp... như hình dạng cơ bản của một đối tượng, với số ít điểm các điểm ảnh cơ bản Ta có thể lấy được thông tin về hình dạng nguyên bản của một đối tượng thông qua xương 2.2 Các hƣớng tiếp cận trong việc tìm xƣơng Các kỹ thuật tìmxương luôn là chủ đề nghiên cứu trong xử lý ảnh Do đó tính phức tạp của nó, mặc dù có những nỗ lực cho việc phát triển các thuật toántìmxương nhưng các phương pháp đưa ra đều bị... nhất được xem là nằm trên xươngcủa đối tượng Hình 2.1 Trục trung vị Hầu hết các nhà nghiên cứu đều cho rằng thay đổi trục trung vị thường không mang lại một xương chuẩn, và thời gian tính toán quá dài, tuy nhiên nó là mẫu cơ bản của phần lớn các phương pháp làm mảnh Phương pháp thay đổi trục trung vị được coi là một phương pháp làm mảnh không lặp, ngoài ra còn có một vài thuật toán duyệt các điểm biên... độ đo có ý nghĩa cho việc cắt tỉa phần thừa củaxương mà không cần ngắt kết nối các xương Siddiqi et al nối thông lượng đo lường với phương pháp làm mảnh để trích xuất mạnh mẽ và chính xác kết nối xương Tuy nhiên lỗi trong tính toán thông lượng bị giới hạn bởi độ phân giải điểm ảnh và cũng tỉ lệ thuận với đường biên của tiến hóa đường biên trước đó Điều này làm cho vị trí chính xác của các điểm cuối... Xương chỉ gồm các điểm biên, càng mảnh càng tốt - Bền vững đối với nhiễu - Xươngcho phép khôi phục ảnh ban đầu của đối tượng - Xương thu được ở chính giữa đường nét của đối tượng được làm mảnh - Xương nhận được bất biến với phép quay 2.2.2 Tìm xƣơng không dựa trên làm mảnh Để tách được xươngcủa đối tượng có thể sử dụng đường biên của đối tượng Với bất cứ một điểm p nào đó trên đối tượng, đều có thể bao... trong phươngpháp cắt tỉa xương đó là dựa vào độ đo có ý nghĩa tới các điểm xương Khi định nghĩa độ đo có ý nghĩa cho các điểm xương sẽ loại bỏ các điểm xương có ý nghĩa thấp Skaked và Bruckstein đưa ra các phân tích hoàn chỉnh và so sánh các phươngpháp cắt tỉa để độ đo có ý nghĩa phổ biến của các điểm xương cùng với việc lan truyền vận tốc, độ dày tối đa, hàm bán kính chiều dài trục, chiều dài của. .. trung vị hay xươngcủa đối tượng Việc xác định xương được tiến hành thông qua hai bước: - Bước thứ nhất, tính khoảng cách từ mỗi điểm ảnhcủa đối tượng đến điểm biên gần nhất Như vậy cần phải tính toán khoảng cách tới tất cả các điểm biên củaảnh _ Sinh viên: Lương Thị Hoài Xuân – CT1102 20 - Bước thứ hai, khoảng cách củaảnh đã được tính toán và các điểm ảnh có giá trị . ĐÀO TAO
TRƯỜNG………………….
Luận văn
Tìm hiểu phương pháp DSE cho
bài toán tìm xương của ảnh
1
_______________________________________________________________. thuật toán tìm
xương thành hai loại cơ bản:
- Các thuật toán tìm xương dựa trên làm mảnh
- Các thuật toán tìm xương không dựa trên làm mảnh
2.2.1 Tìm xƣơng