Tính xác suất

Một phần của tài liệu Nghiên cứu kỹ thuật phân đoạn Random Walker Restart (Trang 63 - 76)

Giả sử một RW bắt đầu từ hạt giống thứ m điểm ảnhxmlk của nhãn lk

trong đồ thị G. RW truyền qua lại tới các cạnh bên với xác suất tỷ lệ thuận

với trọng số cạnh giữa chúng [7]. Cũng tại mỗi bước, có một xác suất khởi động lại c để trở về hạt giống lk

m

x . Sau khi hội tụ, thu được xác suất khả năng k

l im

r mà RW sẽ ở lại cuối cùng tại điểm ảnh xi. Ở đây, thuật toán sử dụng xác

suất trạng thái như phân phối p(xmlk ,lk)

ở công thức (2.6): k k l im l im r x p( )  (2.8) Bằng cách biểu thị lk im

r , i = 1,..., N trong các điều khoản của một vector

N chiều r k [rlk]N1

im l

k k k k k l m l m l m l m l m c cb c I c P b Qb r       1  ) ) 1 ( ( Pr ) 1 ( (2.9)

Trong đó bmlk [bi]N1 là vector N-chiều với bi=1 nếu Xixmlk

bi=0, và chuyển đổi ma trận P[pij]NN là ma trận kề W chuẩn hóa:

P = D-1 × W, (2.10) Trong đó D = diag (D1,..., DN), Nj ij i W D 1 .

Nếu những xác suất trạng thái rlk

im này được chèn vào (2.6) theo định nghĩa, những khả năng p (xi | lk) (i = 1,..., N) được tính bằng:

k l N k i l Qb x p ~ 1 )] | ( [   (2.11) Trong đó [ ] 1 ~ ~   b N b i lk

là vector N chiều với lk

i X x if b1,  và 0 ~  i b

nếu ngược lại.

Xét trong một RWR, Q[qij]NN được sử dụng để tính sự liên quan

giữa hai pixel. Nói cách khác, qi j là khả năng qi có cùng một nhãn được gán

cho qj. Tính theo công thức sau:

     t t t c P c P c I c Q         0 1 1 1 (2.12)

Q được định nghĩa là tổng trọng số của tất cả các ma trận Pt, t=0,..., ∞.

Lưu ý rằng Pt là ma trận chuyển đổi thứ t, mà các thành phần pti j có thể được hiểu là tổng xác suất cho RW bắt đầu tại vi kết thúc tại vj với t lần lặp, đã xem xét tất cả các đường đi có thể có giữa hai điểm ảnh. Bằng cách thay đổi số lần của vòng lặp t, có thể thấy rõ ràng mối quan hệ ở các quy mô khác nhau trong ảnh, và khi tăng t, và có hy vọng tìm ra cấu trúc thô (coarser). Vì vậy, RWR tìm ra các tác động của kết cấu bằng cách xem xét tất cả các đường đi giữa hai điểm ảnh ở tất cả các quy mô (bất kỳ số vòng lặp (t = 0,..., ∞)) trong hình

ảnh. Vì điểm ảnh kề có giá trị tương đồng cao, nếu tăng t, Pt

có trọng số thấp hơn, (1-c)t

(0 <c <1). Có thể được tính ma trận kết quả Q bằng cách sử dụng

phương pháp tuyến tính ma trận đảo. Mặc dù ma trận đòi hỏi nhiều không gian bộ nhớ hơn, có thể tính nhanh nếu ma trận thưa. Vì hệ thống láng giềng các điểm ảnh nhỏ được sử dụng trong bài này, ma trận chuẩn hóa P là rất

thưa. Do đó, Q có thể được tính nhanh. Tuy nhiên, nếu số lượng các lân cận gần nhất là chọn được một số lượng lớn cố định, sự phức tạp của ma trận đảo là rất cao. Trong trường hợp này, một số phương pháp tính xấp xỉ như phương pháp RWR được sử dụng.

2.2.3 Gán nhãn để phân đoạn ảnh

Giả sử rằng xác suất trước p(lk) ở (2.5) là thống nhất. Sử dụng khả năng p(xi | lk) ở (2.12), các quy tắc quyết định của mỗi điểm ảnh xi cho phân đoạn ảnh như sau:  k ili kl i p l x p x l R k k | argmax | max arg   (2.13)

Gán nhãn Ri cho mỗi điểm ảnh xi, thu được phân đoạn.

(a) Ảnh gốc (b) Nhãn ban đầu (c) Kết quả phân đoạn

(d) Phía sau cho màu đỏ (e) Màu xanh dương (f) Màu xanh lá

Hình 2.2 cho thấy quá trình tổng thể của thuật toán từ hạt giống để tính Xác xuất hậu nghiệm p(lk | xi) của mỗi nhãn và kết quả phân đoạn. Nó bắt đầu

với ba nhãn hạt giống ban đầu: Red, Green và Blue như trong hình 2.2(b). Sau khi tính toán khả năng cho mỗi nhãn, chúng ta tạo ra xác suất sau như trong hình 2.2(d), (e) và (f). Bởi một quy tắc quyết định, mỗi điểm ảnh được gán nhãn có xác suất lớn nhất. Cuối cùng, chúng ta có được kết quả phân đoạn trong hình 2.2(c), đối tượng biên ảnh được vẽ bằng màu đỏ phủ lên trên ảnh gốc.

2.3 Độ phức tạp thuật toán

Như đã trình bày tại 2.2, có ba giải pháp RWR: đầu tiên là tính toán trước và lưu trữ các ma trận nghịch đảo (phương pháp PreCompute). Thứ hai là tính toán nghịch đảo ma trận (phương pháp OnTheFly). Cuối cùng là phương pháp B_LIN [5].

1. Phương pháp OnTheFly không có bước tính toán trước, không lưu ma trận nghịch đảo nên cần rất ít bộ nhớ, nhưng trả kết quả mất nhiều thời gian.

2. Phương pháp PreCompute có thời gian truy vấn nhanh gần như lập tức, nhưng sử dụng quá nhiều không gian để lưu trữ các ma trận nghịch đảo: O(m2).

3. Phương pháp B_LIN có lợi thế của hai phương pháp trên, có thời gian tính toán gần như tức thời và sử dụng không qua nhiều không gian. Trong phương pháp B_LIN cần lưu k+1 ma trận nhỏ   ~

) ,..., 1 ( , 1 , 1 i k Q i ,

một ma trận U với hai chiều n*t, một ma trận V với hai chiều t*n.

Theo kinh nghiệm thực tế, nhiều phần tử của Q, U và V bằng không.

T

V

U  có thể là đối xứng khi sử dụng các tính gần đúng bậc thấp. Với sự đối xứng này có thể giảm 50% bộ nhớ so với phương pháp PreCompute.

Hình 2-3: So sánh độ phức tạp thuật toán

Đồ thị trên đây thể hiện so sánh thời gian tính toán (Query Time), chi phí lưu dữ liệu (Storage Cost) cho ba phương pháp. Phương pháp OnTheFly cần thời gian tính toán lớn nhất. Phương pháp PreCompute tốn nhiều bộ nhớ. Phương pháp B_LIN có thời gian tính toán ngắn và chi phí cho bộ nhớ là hợp lý.

CHƢƠNG 3:CÀI ĐẶT THỬ NGHIỆM PHÂN ĐOẠN ẢNH

3.1 Môi trƣờng cài đặt

Chương trình cài đặt trên môi trường Windows XP, sử dụng ngôn ngữ Matlap 7.0.1 với cấu hình máy tính như sau:

- CPU: Intel® Dual-Core E5700 3.0 Ghz - Memory: 1 GB DDR3

- HDD: 100 GB

3.2 Chƣơng trình thực nghiệm phân đoạn ảnh sử dụng RWR

Chương trình RWR có mã nguồn từ Dept. of EECS, ASRI, trường đại học Quốc gia Seoul, Hàn Quốc.

Chương trình GC có mã nguồn của Shawn Lankton. Chương trình RW có mã nguồn của Leo Grady

Các ảnh được chọn để chạy thử nghiệm phân đoạn ảnh là các ảnh tự nhiên có đường biên yếu và kết cấu yếu.

3.2.1 Thiết lập thông số

RWR cần một tham số, xác suất c. Theo thông số đó, phạm vi tuyên

truyền của một random walker từ nút bắt đầu bị biến đổi như hình 3-1. Nếu c giảm, xác suất mà random walker đi qua một diện tích lớn hơn sẽ tăng lên. Điều này có nghĩa là bằng cách thay đổi c, chúng ta có thể kiểm soát mức độ thông tin nhãn của một hạt giống ở quy mô khác nhau trong ảnh.

(a) Ảnh gốc (b) c=10-4 (c) c=10-5 (d) c=10-6

Hình 3-1: Sự thay đổi xác suất trạng thái ổn định r theo xác suất khởi động lại c

Hình 3-2 cho thấy một ví dụ khác của phân đoạn ảnh đối với sự biến đổi của xác suất c trong một ảnh thường. Theo xác suất c, kết quả phân đoạn bị thay đổi. Do đó, quan trọng là tìm xác suất c theo số lượng (hay chất

lượng) của hạt giống và kích thước ảnh. Ở đây c được lựa chọn theo kinh

nghiệm, và thuật toán thiết lập c = 4 x 10-4 cho tất cả các hình thường được thử nghiệm.

(a) Ảnh gốc (b) c=10-3 (c) c=10-4 (d) c=10-5

Hình 3-2: Phân đoạn đối với sự biết đổi của các xác suất khởi động lại c trong ảnh tự nhiên

3.2.2 Kết quả phân đoạn RWR B_LIN với c=10-4

3.2.3 Một số so sánh

3.2.3.1 Vấn đề biên ảnh yếu

Các vấn đề biên ảnh yếu là để tìm thấy những biên ảnh yếu khi chúng là một phần của một biên ảnh phù hợp. RW cho thấy kết quả phân đoạn tốt hơn GC trong sự tương phản thấp với số lượng hạt giống nhỏ. Mặc dù GC và RW có khả năng tìm kiếm biên ảnh yếu, thuật toán RWR các kết quả đầu ra trực quan hơn.

Trong hình 3-3, thuật toán RWR được so sánh với GC và RW trong vấn đề biên ảnh yếu. Hai ví dụ tổng hợp: vòng tròn và lưới 3 x 3 với bốn phần bị xóa. Với hạt giống (màu xanh lá cây và xanh dương) trong hình 3-3 (a), các phân đoạn đã thư được trong hình 3-3 (b), (d). Hình 3-3 (b) cho thấy rõ ràng rằng GC có vấn đề cắt nhỏ.

Trong hình 3-3 (c), chúng ta có thể xác định rằng các phân đoạn của RW bị ảnh hưởng đáng kể bởi sự khác biệt giữa số lượng của Green và Blue hạt giống. Cụ thể, RW nhạy cảm với số lượng hạt giống. Ngược lại, hình 3-3 (d) cho thấy rằng thuật toán của phân đoạn ảnh dựa trên RWR là ít phụ thuộc vào số lượng hạt giống và tạo ra phân đoạn tốt hơn, bởi vì khả năng được tính bằng trung bình của số lượng phù hợp của tất cả hạt giống.

(a) Ảnh gốc (b) GC (c) RW (d) RWR

Hình 3-3: So sánh thuật toán GC, RW, RWR cho ảnh có đƣờng biên yếu

3.2.3.2 Vấn đề kết cấu

Trong GC và RW, rất khó để tách biệt khu vực kết cấu mà không cần xem xét các kết nối bậc cao hơn, bởi vì chúng có quan hệ với tiêu chuẩn cắt giảm tối thiểu và xác suất khởi động lại tương ứng. Vì hai thuật toán này không xem xét các thông tin của hạt giống bên trong khu vực nhãn trước, không dễ dàng để đưa vào tính toán các tác động của kết cấu. Mặt khác thuật toán này có thể phản ánh các thông tin kết cấu bằng cách sử dụng xác suất trạng thái ổn định của RWR, bởi vì RWR xem xét tất cả các đường đi có thể giữa hai nút trong một hệ thống láng giềng nhỏ.

Mặc dù sử dụng một hệ thống láng giềng nhỏ, nhưng nó nắm bắt cấu trúc kết cấu tốt và thu được chi tiết đối tượng. Hình 3-4 sử dụng những hình ảnh tổng hợp bao gồm bốn hoặc năm lại kết cấu khác nhau. Đây là vấn đề phân đoạn kết cấu mà một kết cấu được rút ra trong số đó. Các kết quả phân đoạn trong hình 3-4 (d) cho thấy rằng thuật toán RWR tạo ra phân đoạn kết cấu đáng tin cậy hơn GC và RW.

(a) Ảnh gốc (b) GC (c) RW (d) RWR

Hình 3-4: So sánh phân đoạn cho ảnh có kết cấu yếu giữa các thuật toán GC, RW, RWR

3.2.3.3 Định lƣợng so sánh

Hai trường hợp trước đó thường phát sinh trong ảnh tự nhiên. Bây giờ, so sánh các phân đoạn thu được từ GC, RW và thuật toán RWR trên ảnh tự nhiên. Thuật toán sử dụng một tập dữ liệu của hình ảnh tự nhiên mà đối tượng người cung cấp một vị trí nổi bật/nhãn nền: cảnh thật. Để so sánh định lượng, sự giống nhau giữa kết quả phân đoạn và cài đặt sẵn cảnh thật được đo bằng cách sử dụng chuẩn hóa chồng: G R G R a    0 (3.1)

Trong đó R là tập hợp các điểm ảnh được gán như cận cảnh từ các kết quả phân đoạn ảnh và G là nền. Ở đây nó được sử dụng như là do độ chính xác của các phân đoạn ảnh. Đối với thí nghiệm này, chọn hình ảnh tự nhiên với vùng kết cấu cao (cluttered) hoặc với có sự phân phối màu sắc tương tự giữa cận cảnh và nền cảnh.

Trong hình ảnh 3-5, phân đoạn đã được tạo ra từ 3 thuật toán khác nhau trên ảnh tự nhiên. So với các phân đoạn từ GC và RW trong hình ảnh 3- 5, thuật toán RWR có chất lượng và số lượng tốt hơn về phân đoạn. Với mỗi một ảnh khác nhau ta thu được một kết quả phân đoạn khác nhau.

(a) Ảnh gốc (b) GC (c) RW (d) RWR

a0=0.628529 a0=0.571411 a0=0.768311

a0=0.745343 a0=0.7586564 a0=0.759456

a0=0.614095 a0=0.578121 a0=0.620484

a0=0.661218 a0=0.691435 a0=0.725402

3.3 Kết luận và kiến nghị Kết quả đạt đƣợc

Trong khuôn khổ của luận văn, tôi đã trình bày một cách có hệ thống các khái niệm từ cơ bản đến nâng cao trong phân đoạn ảnh. Các hướng tiếp cận trong phân đoạn ảnh với các thuật toán tiêu biểu đã được giới thiệu.

Trọng tâm luận văn trình bày cơ sở lý luận, thuật toán và đánh giá phương pháp phân đoạn ảnh dựa trên RWR. Phương pháp RWR tối ưu hơn so với các phương pháp phân đoạn ảnh trước đó, vì RWR khắc phục được hai khó khăn quan trọng trong ảnh tự nhiên là: “đường biên yếu” và “kết cấu yếu”.

Phương pháp RWR dựa vào việc coi một bức ảnh như một đồ thị có trọng số. Sau khi tính xác suất trạng thái ổn định của mỗi điểm ảnh bằng cách sử dụng RWR, ta có thể ước lượng khả năng phân tách và cuối cùng gán nhãn vào mỗi điểm ảnh.

Phần thực nghiệm đã thực hiện phân đoạn ảnh cho một số ảnh tự nhiên với các phương pháp GC, RW, RWR để làm cơ sở đánh giá độ phức tạp các thuật toán.

Kiến nghị

Các kết quả thực nghiệm cho thấy thuật toán RWR có sự phụ thuộc vào tham số xác suất c cũng như cách chọn các hạt giống ban đầu. Việc tìm tham số xác suất tối ưu cũng như phương pháp chọn các hạt giống sao cho có kết quả phân đoạn tốt nhất cho các ảnh tự nhiên có đường biên yếu hoặc kết cấu yếu hiện là các câu hỏi cần được nghiên cứu tiếp.

TÀI LIỆU THAM KHẢO Tiếng Việt

1. Lương Mạnh Bá, Nguyễn Thanh Thủy. Nhập môn xử lý ảnh số, Nhà xuất bản Khoa học kỹ thuật, Hà Nội.

2. Võ Đức Khánh, GS.TSKH. Hoàng Kiếm (2007). Giáo trình xử lý ảnh. Nhà xuất bản Đại học Quốc Gia TP Hồ Chí Minh.

3. Nguyễn Kim Sách (1977). Xử lý ảnh và video số, Nhà xuất bản Khoa học kỹ thuật, Hà Nội.

4. Đỗ Năng Toàn, Phạm Việt Bình (2007). Giáo trình xử lý ảnh, Nhà xuất

bản Đại học Thái Nguyên.

Tiếng Anh

5. Hanghang Tong, Christos Faloutsos, Jia-Yu Pan (2007). Fast RandomWalk

with Restart and Its Applications, ICDM 2006 Dec. 18-22, HongKong.

6. Leo Grady (2006). Random Walks for Image Segmentation. IEEE

Transactions On Pattern Analysis And Machine Intelligence, Vol. 28, No. 11, Nov. 2006

7. Tae Hoon Kim, Kyoung Mu Lee, and Sang Uk Lee (2008). Generative Image Segmentation Using Random Walks with Restart. ECCV 2008, Part III,

Một phần của tài liệu Nghiên cứu kỹ thuật phân đoạn Random Walker Restart (Trang 63 - 76)

Tải bản đầy đủ (PDF)

(76 trang)