Xét hai điểm q1, q2 R (p) (n (R (p)) 2) thể hiện trong hình 3.2, các đoạn đường bao ngắt nhất giữa q1 và q2 được ký hiệu là C (q1, q2). Khi đoạn đường bao là một tâp hợp các điểm ảnh, chúng ta đo chiều dài của đoạn đường bao bằng tổng khoảng cách Euclide giữa mỗi cặp ảnh điểm lân cận. Khoảng cách giữa hai điểm láng giềng di chuyển theo chiều ngang/dọc là 1 và theo đường chéo là . Nếu q1, và q2 chia đường bao thành 2 đoạn có chiều dài bằng nhau, một trong 2 đoạn đó được ký hiệu là C (q1, q2).
Hình 3.2. Định nghĩa của điểm ghost và BPR
Định nghĩa 3.2. Cho một đoạn đường cong C (q1, q2), gọi l (q1, q2) là chiều dài của cung C (q1, q2). Chúng ta xây dựng một hình tam giác cân với cơ sở q1q2 và với đỉnh g R2
d (g, q1)= d (g, q2) = l (q1, q2). (3.5) Thực tế có hai điểm khác nhau thỏa mãn công thức (3.5), nó được đánh dấu với g1 và g2 thể hiện trong hình 3.3c. Tác giả Wei Shena định nghĩa điểm g là điểm chốt của C (q1, q2).
38
_____________________________________________________________ Sinh viên: Nguyễn Thị Lan – CT1102
Thông thường, điểm chốt g không nằm trên đường bao, trừ khi các đoạn đường bao là một đoạn của đa giác đối xứng như trong hình 3.3b. Nếu g nằm trên đường bao như hình 3.3a, thì l (g, q1)> d (g, q1), l (g, q2)>d (g, q2), l(q1, q2 ) >d (g, q1)+d (g, q2), và g sẽ không thỏa mãn công thức (3.5).
Hình 3.3. Vùng của điểm ghost
Định nghĩa 3.3. Cho điểm p nằm trong đường cong C với n(R(p)) , và gọi q1, q2 là hai điểm thuộc R (p). Gọi g là điểm chốt của đoạn đư ờng bao C (q1, q2). Từ hình 3.2 cho hg là chiều cao của tam giác q1pq2. Tỷ lệ uốn (BPR)
(q1, p, q2) được định nghĩa như sau:
. (3.6)
3.2.2.2 Xác định tỷ lệ uốn BPR
Từ hình 3.2, khi tam giác q1pq2 là một tam giác cân, thì ta có
hg = (3.7)
Dễ thấy hg cung cấp thông tin hình dạng cục bộ của đoạn đường bao C(q1, q2), với chiều dài của cung l (q1, q2), thuộc tính của đoạn đường bao. Với một khoảng cách d(q1, q2) cố định, nếu l (q1, q2) lớn thì có khả năng uốn cong của C(q1, q2) là lớn. Do đó, hg phản ánh tỷ lệ uốn của đoạn đường bao C(q1,q2). Một đoạn đường bao cùng với điểm uốn cong cực đại và có một kết nối giữa
39
_____________________________________________________________ Sinh viên: Nguyễn Thị Lan – CT1102
độ cong cực đại của đường bao và xương tạo ra một nhánh xương. Do đó, hg được xem xét như là một phép đo để đánh giá tầm quan trọng của đoạn đường bao.
Theo công thức lượng giác, chúng ta có
(3.8) Từ đó ta suy ra
(3.9)
Nếu p là một điểm xương, là xấp xỉ với, ; vì vậy có được
(3.10) Công thức (3.10) chỉ ra rằng hp chứa không chỉ là thông tin của góc phân giác mà còn là chiều rộng của đối tượng. Dù một đoạn đường bao là ý nghĩa hay không được xác định không chỉ bởi các thông tin của chính nó, ví dụ: chiều dài của cung, nhưng cũng có thể trong ngữ cảnh đó là nơi mà đã được xác định vị trí của nó. Đoạn đường bao tương tự có thể nhiều hơn, có thể được coi là không ý nghĩa nếu nó nằm trong một phần rộng của hình dạng, trong khi nếu nó nằm trên một phần nhỏ của hình dạng thì nó có thể được coi như là một đặc trưng riêng. Do đó tỉ lệ hg và hp, tỷ lệ uốn tích hợp cả hai thông tin hình dạng cục bộ và toàn cục. Nó có thể được sử dụng để xác định xem một đường cong tạo ra một nhánh xương. Đặc biệt, hp là bằng 0 nếu các tiếp tuyến trên q1 và q2 là song song. Trong trường hợp này giá trị BPR là vô hạn, nó chỉ ra rằng p là một điểm xương. Hình 3.4 chỉ ra hiệu quả của phương pháp BPR trong cắt tỉa xương. Các đỉnh của hình 3.4 là tương tự nhau, tuy nhiên, chúng có hình dạng khác nhau góp phần cho đối tượng. Đỉnh của hình 3.4a có nhiều khả năng là một chi tiết không đáng kể trên đường biên, và
40
_____________________________________________________________ Sinh viên: Nguyễn Thị Lan – CT1102
vì vậy nhánh có nguồn gốc từ nó nên được cắt tỉa, trong khi đỉnh với cùng kích thước như hình 3.4b có nhiều khả năng là đặc trưng hình dạng quan trọng, và như vậy có thể tạo ra một nhánh xương. Đỉnh trong hình 3.4c là gần góc bên phải hơn so với đỉnh trong hình 3.4a, và do đó nó đưa ra một nhánh xương, vì nó thay thế góc bên phải như đặc trưng của hình dạng. Như đã chỉ ra trong hình 3.4, xương thu được bởi phương pháp của tác giả Wei Shena có thể phân biệt giữa nhánh không đáng kể như trong hình 3.4a và các nhánh quan trọng như trong hình 3.4 (b, c).
Hình 3.4. Mẫu hình chữ nhật với cùng một đỉnh được thêm vào đường biên của hình
Hàng (1). Xương thu được bằng phương pháp đề xuất.
Hàng (2). Xương của cùng một hình được cắt tỉa bằng độ đo ý nghĩa của chiều dài đoạn đường biên ngắn nhất
41
_____________________________________________________________ Sinh viên: Nguyễn Thị Lan – CT1102
3.2.2.3 Mối quan hệ của BPR với các độ đo ý nghĩa khác
Bằng công thức (3.7), (3.8) và (3.11) chúng ta có được
(3.11) Công thức (3.11) thể hiện sự kết nối giữa BPR và độ đo ý nghĩa: khoảng cách của dây cung , chiều dài của đoạn đường biên ngắn nhất l và góc phân giác . Sự tích hợp của cả 3 độ đo này là một trong những đóng góp chính của phương pháp đã được đề xuất. Nó là hợp lý để tích hợp ba độ đo với nhau theo cách này, nếu góc lớn hơn, có nhiều khả năng p là một điểm xương, và chức năng của tiếp tuyến này càng củng cố cho phương pháp này, đặc biệt khi góc = (giá trị lớn nhất), giá trị BPR là vô hạn. Hơn nữa tỷ lệ của l có tính chất cục bộ địa phương.
3.2.3 Đề xuất cho phát triển cắt tỉa xƣơng
Tác giả Wei Shena đề xuất một ý tưởng cho phát triển xương đệ quy bằng cách thêm điểm để phù hợp với một tiêu chí dựa trên BPR.
3.2.3.1 Tiêu chí để cắt tỉa nhánh xƣơng giả
Một tiêu chí được giới thiệu trong [4] được sử dụng để xác định xem nơi các điểm cho trước có là một điểm của xương. Đó là lý do tại sao tác giả gọi chúng là điểm sinh. Tác giả Wei Shena đã xem xét các tiêu chí ở đây trong vùng ảnh: Đối với một điểm p cho trước bên trong đường bao V với n(R (p)) 2, nếu có q1 r(p) và q2 R8 thỏa mãn:
42
_____________________________________________________________ Sinh viên: Nguyễn Thị Lan – CT1102
Điểm p được coi là một điểm xương, nơi mà (x1 – y1), và (x2 – y2) là tọa độ tương ứng của q1, q2. Dựa trên công thức (3.12) thì thu được xương, nhưng xương thu được chứa quá nhiều nhánh giả, ví dụ các nhánh có màu được thể hiện trong hình 3.5a. Lưu ý rằng các nhánh xương giả được đánh dấu cùng với màu sắc được tạo ra từ các đoạn đường bao không ý nghĩa của màu sắc giống nhau. Độ đo ý nghĩa BPR được đề xuất để giải quyết vấn đề này.
Hình 3.5. Xương chân của 1 con lạc đà
a) Xương được cắt tỉa dựa trên phương pháp tiếp cận trong.
b) Xương được tạo ra bởi tiêu chuẩn 1 có một số điểm cần thiết, như là một phần màu xanh lá cây.
c) Xương được cắt tỉa bằng phương pháp làm mảnh được đề xuất.
Tiêu chí 1: Điểm p thuộc nhánh xương cắt tỉa nếu có tồn tại q1 r(p) và q2 R8(p) thỏa mãn
(3.13)
Trong đó t là một ngưỡng cho trước, và và là tọa độ tương ứng của và .
Rõ ràng, tiêu chí 1 là một điều kiện cần thiết để xác định một điểm hình là điểm xương hay không, và dựa trên độ đo ý nghĩa được đề xuất, chỉ cần các
43
_____________________________________________________________ Sinh viên: Nguyễn Thị Lan – CT1102
cặp của các điểm đường bao kết nối với đoạn đường bao ý nghĩa là được sử dụng để xác định xem các điểm tương ứng là các điểm xương. Vì vậy các nhánh xương giả không được sinh ra bằng việc thay đổi tiêu chuẩn này.
3.2.3.2 Phát triển xƣơng cắt tỉa
Dựa trên tiêu chí 1, tác giả Wei Shena cung cấp các ý tưởng cho phát triển cắt tỉa xương kết nối. Đối với một đối tượng 2D, đường biên F được bao bọc bên trong đường bao C biểu diễn vùng của đối tượng, và Sk là xương của đối tượng.
Thuật toán phát triển xương cắt tỉa:
Procedure SkeletonGrow (Input F, Output Sk)
01. Choosen the point pm F, such that k (pm) is maximum 02. If pm satisfies Criterion 1
03. Add (pm, k (pm)) to Sk and push pm to a stack S 04. End
05. While S not empty
06. p pop (S)
07. For 8 neighbors x of p that satisfy Criterion 1 08. Add (x, k (x)) to Sk, push x to S
09. End 10. End
Xương dựa trên ý tưởng được đề xuất được thể hiện trong hình 3.5b, các nhánh xương giả được cắt tỉa. Một phần của xương thu được có thể chứa các điểm dư thừa, như phần màu xanh lá cây trong hình 3.5b. Trong nhiều phương pháp đối sánh hình dạng dựa trên cấu trúc xương, lấy một số điểm mẫu từ xương hoặc phát hiện những điểm đặc trưng (điểm cuối và điểm giao nhau) là cần thiết. Việc lấy các điểm giao thừa từ xương sẽ thuận lợi cho việc phân tích và đối sánh phù hợp thu được hình dạng phù hợp để phân tích. Để
44
_____________________________________________________________ Sinh viên: Nguyễn Thị Lan – CT1102
làm điều này bất kỳ các phép toán topo đều có thể được sử dụng để cắt tỉa xương. Tác giả Wei Shena sử dụng phương pháp làm mảnh được đề xuất và kết quả thể hiện trong hình 3.5c.
3.2.3.3 Độ phức tạp của BPR
Để tính toán BPR cần các thông số đường biên bởi chiều dài cung, trong đó có độ phức tạp O(m), m là số điểm đường biên. Đối với một điểm p được kiểm tra, xem nó có được thêm vào xương hay không, thì số điểm sinh là n. Kiểm tra điểm p thỏa mãn được tiêu chuẩn 1 có độ phức tạp O(n). Như vậy, tổng thời gian phức tạp của phương pháp tiếp cận là O(nN+m), trong đó N là số lượng điểm ảnh bên trong đường biên. Trên thực tế, trong ứng dụng thực tế, n thường bằng một giá trị nhỏ hơn, thường là 3 hoặc 4, và m là ít hơn nhiều so với N.
3.2.4 Kết luận
Trong bài này, tác giả Wei Shena và các cộng sự đã trình bày một độ đo có ý nghĩa mới cho cắt tỉa xương được gọi là tỷ lệ uốn. Dựa trên độ đo ý nghĩa, tác giả đề xuất một thuật toán cho phát triển xương. Thí nghiệm của tác giả trên tập dữ liệu MPEG-7 thu được cho thấy xương không nhạy cảm với nhiễu đường biên, theo nhiều quy mô, trong đó những nhánh xương không đáng kể được cắt tỉa, trong khi nhánh quan trọng vẫn còn.
45
_____________________________________________________________ Sinh viên: Nguyễn Thị Lan – CT1102
CHƢƠNG 4: KẾT QUẢ THỰC NGHIỆM
4.1 Môi trƣờng cài đặt
Chương trình được cài đặt trên Môi trường Windows 7, sử dụng ngôn ngữ Matlap với máy tính có cấu hình như sau:
CPU : i5 – 450M HDD: 320 GB Memory: 2GB
Tập dữ liệu được sử dụng trong thử nghiệm là tập dữ liệu thuộc: MPEG-7
4.2 Một số kết quả thử nghiệm 4.2.1 Giao diện chƣơng trình. 4.2.1 Giao diện chƣơng trình.
46
_____________________________________________________________ Sinh viên: Nguyễn Thị Lan – CT1102
4.2.2 Một số kết quả tìm xƣơng khác nhau của các phƣơng pháp
Hình 4.2. Xương của quả táo thu được bằng các phương pháp
a. Phương pháp tìm xương theo trục trung vị. b. Phương pháp tìm xương theo Matlab.
c. Phương pháp tìm xương theo DCE với N = 15, N là số đỉnh được lựa chọn bởi DCE
d. Phương pháp tìm xương theo BPR với t = 0. 8, t là giá trị ngưỡng được lựa chọn bởi BPR.
47
_____________________________________________________________ Sinh viên: Nguyễn Thị Lan – CT1102
Hình 4.3. Xương của con lạc đà thu được bằng các phương pháp
a. Phương pháp tìm xương theo trục trung vị. b. Phương pháp tìm xương theo Matlab.
c. Phương pháp tìm xương theo DCE với N = 15, N là số đỉnh được lựa chọn bởi DCE
d. Phương pháp tìm xương theo BPR với t = 1. 2, t là giá trị ngưỡng được lựa chọn bởi BPR
48
_____________________________________________________________ Sinh viên: Nguyễn Thị Lan – CT1102
4.2.3 Hiệu quả của việc sử dụng ngƣỡng t
Hiệu quả của các giá trị ngưỡng t khác nhau trên xương của một đối tượng được minh họa trong hình 4.4. Như đã giới thiệu trong mục 3.1, độ đo ý nghĩa được đề xuất, BPR có thể được thực hiện như một trường hợp đặc biệt giữa những mô hình khác nhau. Do đó, nhiều chi tiết xương có thể thu được bằng cách thiết lập ngưỡng t có giá trị khác nhau cho BPR. Khi giá trị ngưỡng t tăng, có ít hơn các nhánh trong xương, mà đại điện ý nghĩa cho các bộ phận của đối tượng, và các bộ phận không quan trọng bị bỏ qua. Đây là những đặc tính phù hợp với nhận thức của con người.
49
_____________________________________________________________ Sinh viên: Nguyễn Thị Lan – CT1102
Hình 4.4. Minh họa xương của đối tượng trong việc sử dụng các ngưỡng khác nhau, t là giá trị ngưỡng.
50
_____________________________________________________________ Sinh viên: Nguyễn Thị Lan – CT1102
KẾT LUẬN
Sau thời gian tìm hiểu, nghiên cứu đề tài “Tìm hiểu phương pháp BPR(Bending Potential Ratio) cho bài toán tìm xương của ảnh” và triển khai thực hiện, em đã đạt được một số kết quả như sau:
Về lý thuyết, đồ án của em đã trình bày và hiểu được:
Tổng quan về xử lý ảnh số.
Môt sốhướng tiếp cận trong tìm xương của ảnh.
Tìm hiểu thuật toán cắt tỉa xương của ảnh dựa vào BPR(Bending Potential Ratio) do Wei Shena và các cộng sự đề xuất [4].
Về thực nghiệm, em đã cài đặt thử nghiệm chương trình tìm xương và
cắt tỉa xương dựa vào độ đo BBR và so sánh với kết quả tìm xương theo hàm tìm xương của matlab.
Tuy nhiên trong quá trình thực hiện, thời gian không có nhiều, năng lực chuyên môn còn nhiều hạn chế, nên đề tài mới chỉ dừng lại ở mức đọc, dịch hiểu và tìm hiểu tóm lược về phương pháp, chưa đánh giá tổng hợp được phương pháp. Nếu có điều kiện, em sẽ tìm đọc tài liệu để nghiên cứu nhằm tổng hợp nhiều phương pháp và đưa ra được những đánh giá kết luận dựa trên những gì đã tìm hiểu được. Trong thời gian tới đề tài sẽ phát triển ở mức cao hơn, ví dụ như có thể tra cứu ảnh dựa trên cấu trúc xương.
Em rất mong nhận được sự đóng góp ý kiến của các Thầy Cô và các bạn để em có thêm kiến thức và kinh nghiệm tiếp tục hoàn thiện nội dung nghiên cứu trong đề tài.
51
_____________________________________________________________ Sinh viên: Nguyễn Thị Lan – CT1102
TÀI LIỆU THAM KHẢO
Tài liệu Tiếng Việt
[1]. Đỗ Năng Toàn, Phạm Việt Bình (2007), Giáo trình xử lý ảnh, Nhà xuất bản Đại học Thái Nguyên.
[2]. Lương Mạnh Bá, Nguyễn Thanh Thủy(2007), Nhập môn xử lý ảnh số, Nhà xuất bản KHKT.
[3]. Nguyễn Thị Hoa (2010), Đồ án Tốt Nghiệp, Trường ĐHDL Hải Phòng
Tài liệu Tiếng Anh
[4]. Wei Shena, Xiang Bai, Rong Hu, Hongyuan Wang, Login Jan Latec ki(2010), Skeleton Growing and Prunning with Bending Potential Ratio, CVPR.
[5]. Xiang Baia, Login Jan Latec ki(2007), Skeleton Prunning by Contour Partitionning with Discrete Curve Evolution, CVPR.
[6]. H. Blum, in: A Tranformation for Extrating New Description of Shape, Models for the Perception of Speech and Visual Form, MIT Press, 1967pp, 363-380.