Kiểm tra tính tương đồng các đặc tính của superpixel

Một phần của tài liệu Phân vùng ảnh nhờ sát nhập các miền động (Trang 31 - 34)

Để có được các miền đồng nhất trong sát nhập miền, vị từ được đề xuất P trong phương trình (3) kiểm tra sự phù hợp của miền. Thông tin miền thường được trình bày bởi các tín hiệu được lấy ra từ dữ liệu quan sát. Sự lựa chọn của những tín hiệu có thể là cường độ, màu, kết cấu và vân vân. Nếu ta xem các gợi ý như là một biến ngẫu nhiên, sự phân bố dấu hiệu của superpixel phụ thuộc vào sự phù hợp của các cặp miền. Trong phần này, ta xây dựng các đánh giá phù hợp miền như một quá trình kiểm tra tuần tự. Giả sử tham số θ có liên quan đến phân phối các tín hiệu ngẫu nhiên x. Cụ thể hơn, ta thu thập thông tin của tham số θ bằng cách quan sát các biến ngẫu nhiên trong bước kế tiếp.

Khi mọi mẫu tín hiệu mang thông tin thống kê về tham số θ, ta có thể thu thập thông tin ở phần cuối của quan sát. Đây là một trong những vấn đề thú vị trong nghiên cứu phân tích tuần tự, ở đó θ được gọi là một giả thuyết. Trong bối cảnh sát nhập miền, hai giả thuyết được tham gia vào nhiệm vụ đánh giá: một cặp miền là "phù hợp", và là "không phù hợp", được biểu thị bằng một giả thuyết rỗng H0: θ = θ0 ngược lại một giả thuyết thay thế H1: θ = θ1 tương ứng. Nội dung các giả thuyết là một trạng thái ẩn mà không được quan sát trực tiếp, nhưng được thống kê liên quan đến các tín hiệu quan sát được. Để quyết định có hay không một cặp miền thuộc cùng một nhóm, ta hãy xem các giải pháp kiểm tra giả thuyết của nó.

Một quy trình hiệu quả và phổ biến cho việc tích hợp các bằng chứng thống kê là kiểm tra tỷ lệ xác suất liên tục (SPRT) đã được đề xuất bởi Wald. SPRT cho thấy các giải pháp cho giả thuyết có thể được tìm thấy bằng cách làm cho số lượng các quan sát nhỏ nhất và đáp ứng các giới hạn trên các xác suất được xác định trước của hai lỗi. SPRT hoàn toàn là tuần tự trong tự nhiên, tức là, lấy mẫu liên tục trên các trường hợp của một biến ngẫu nhiên, cuối cùng sẽ dẫn đến một kết luận đáng tin cậy về các tham số θ.

Việc áp dụng SPRT để kiểm tra tính nhất quán của các dấu hiệu được mô tả như sau. Ta quan sát sự phân bố của tín hiệu ngẫu nhiên x trong một chuỗi cho đến khi một tỷ lệ gần giống δ ngoài khoảng thời gian (B, A) cho lần đầu tiên bằng một bước đi ngẫu nhiên, trong đó các số thực A và B thỏa mãn B <0 <A. Trình tự tỷ lệ gần giống liên tiếp δi là:

(4)

Trong đó P0 (x | θ0) và P1 (x | θ1) là các bản phân phối của dấu hiệu trực quan. P0 (x | θ0) và P1 (x | θ1) nên được phân biệt để đưa ra quyết định có tính thuyết phục. Ta sử dụng mô hình phân bố Gaussian để tính toán gần đúng phân bố các dấu hiệu. Hai xác suất có điều kiện được đưa ra như sau:

(5)

Trong đó Ia và Ib là màu trung bình của dữ liệu lấy mẫu trong miền a và b tương ứng, và Ia+b là giá trị trung bình của tập hợp mẫu. Si là ma trận hiệp phương sai của các miền, và λ1 và λ2 là các tham số vô hướng. Nếu mỗi bài kiểm tra là độc lập, thì thành phần của các tỷ lệ gần giống là tổng cá thể δi:

(6)

Trong đó N là số nguyên đầu tiên mà δ ≥ A hoặc δ ≤ B. Ta có thể thấy rằng các giải pháp cho giả thuyết được quyết định bởi mối quan hệ giữa δ, giới hạn trên và giới hạn dưới, ký hiệu là A và B, tương ứng. Nếu δ ra khỏi một trong các giới hạn này, thì giả thuyết được thực hiện và do đó kiểm tra dừng lại. Nếu không, việc kiểm tra được thực hiện trên một mẫu ngẫu nhiên mới.

Các δ tỷ lệ gần giống là tốt và cao khi quyết định thiết bị đầu cuối là có lợi cho H0, trong khi nó xấu và thấp khi tình huống bị đảo ngược. Trong lý thuyết SPRT [28], Wald đề nghị thực hiện các thử nghiệm với một tính toán gần đúng: A = log(1-β) /α và B = logβ (1-α), trong đó α và β là xác suất của các lỗi quyết định được đưa ra bởi:

α = Pr {bỏ H1 khi H1 đúng} (7)

β= Pr {nhận H1 khi H0 đúng} (8) Việc lựa chọn của α và β ảnh hưởng đến các chất lượng các miền sát nhập. Trực quan, như là tỷ lệ lỗi giảm, chất lượng miền sát nhập tăng. Tuy nhiên, nỗ lực tính toán đồng thời sẽ tăng theo. Trong việc thực hiện, cả hai α và β được thiết lập một giá trị cố định 0,05.

Đối với sự không chắc chắn về số lượng (trường hợp xấu nhất) của kiểm tra trong SPRT, một SPRT rút gọn được sử dụng ở đây bằng cách cài đặt một ràng buộc trên N0 về số lượng các bài kiểm tra. Trong lý thuyết của Wald, số lượng dự kiến của các bài kiểm tra là:

(9)

Ta thiết lập N0 là một hằng số mà là lớn hơn max {E {δ | θ0}, {E δ | θ1}}. Các SPRT được đề xuất dựa trên việc kiểm tra tính nhất quán của các tín hiệu.

Thuật toán 1: kiểm tra tính nhất quán của các tín hiệu Đặt λ2 = 1, α = 0.05, β = 0.05;

Tính toán các thông số:

N0: là một hằng số lớn hơn max {E{δ |θ0}, E{δ |θ1}}; A = log (1-β) /α, B = log β(1-α);

P0(x|θ0), P1(x|θ1) được tính toán sử dụng phương trình (5)

Đầu vào: một cặp các miền lân cận

Đầu ra: xác định D là hai miền "phù hợp" (D = 1) hoặc "không phù hợp"

(D = 0).

Bƣớc 1: Thiết lập δ và các thử nghiệm đếm từ n về 0.

Bƣớc 2: Chọn ngẫu nhiên m pixel trong mỗi cặp miền, trong đó m bằng một

phần hai kích thước của miền.

Bƣớc 3: Tính toán phân bố dấu hiệu trực quan x sử dụng phương trình (5) dựa trên các điểm ảnh này.

(10) Bƣớc 5: Nếu n ≤ N0 Nếu δ ≥ A, trả về D = 1 (phù hợp) Nếu δ ≤ B, trả về D = 0 (Không phù hợp) Nếu n > N0 Nếu δ ≥ 0, trả về D = 1 ( phù hợp) Nếu δ < 0, trả về D = 0 (không phù hợp)

Bƣớc 6: Quay lại bước 2.

Một phần của tài liệu Phân vùng ảnh nhờ sát nhập các miền động (Trang 31 - 34)

Tải bản đầy đủ (PDF)

(54 trang)