Phương pháp SAD truyền thống

6. Dự kiến kết quả (vi ết theo từng nội dung nghiên cứ u, dự kiến logíc và khoa học,

2.2. Phương pháp SAD truyền thống

Nhưđã phân tích ở phần 2.1, phương pháp SAD là phương pháp để nhận diện rất thuận tiện. Song, bên cạnh ưu điểm của phương pháp này, nĩ cịn cĩ một số

Bạch Ngọc Minh 37 Cơng thức (0-1) thể hiện tốc độ của

thuật tốn này áp dụng vào việc tính Bản đồ

chênh lệch.

Trong cơng thức này, t là thời gian chạy chương trình, S là sốđiểm cần tính, W là kích thước cửa sổ tính tốn và L là khoảng cách yêu cầu tính tốn. Với cơng thức trên, giả sử cứ mỗi 1.5 triệu phép tính hàm chạy trong 1 giây, tấm ảnh xử lý với kích thước 640 480 pixel, kích thước cửa sổ là 5 5 pixel và khoảng cách

a b c d e f

Hình 0.4: Các kết quả tính SAD thơng thường

a. Ảnh trái gốc

b. Ảnh phải gốc

c. Bản đồ chênh lệch mong muốn

d. Bản đồ chênh lệch tính bằng phương pháp SAD với cửa sổ 5 5

e. Bản đồ chênh lệch tính bằng phương pháp SAD với cửa sổ 7 7

f.Bản đồ chênh lệch tính bằng phương pháp SAD với cửa sổ 11 11

thực hiện là 50 pixel. Khi đĩ, thời gian phép tốn là 25.6 giây. Đây là một khoảng thời gian lớn, hay nĩi cách khác là tốc độ tính tốn của phép tốn là khá chậm.

Mặc dù tốc độ tính tốn rất chậm, kết quả tính tốn lại khơng chính xác hồn tồn. Lỗi của phương pháp SAD rất thường xuyên xảy ra do nhầm lẫn trong quá

Bạch Ngọc Minh 38 trình tính tốn. Hình 0.4 thể hiện một số kết quả tính bản đồ sai lệch bằng phương pháp SAD với các cửa sổ 5 5, 7 7 và 11 11 thực hiện trên ảnh Teddy.

Nhận xét, ứng với các hình trên, lỗi cục bộ xảy ra nhiều ở những thuật tốn sử dụng cửa sổ so sánh nhỏ. Tuy nhiên, hình dáng của các vật thể trong thuật tốn lại được giữ gần nhất với hình dáng thực của nĩ. Sử dụng cửa sổ lớn hơn sẽ cho lỗi cục bộ ít hơn, nhưng hình dáng của các vật thể lại bị sai sĩt đáng kể so với thực tế. Hơn thế nữa, các lỗi lớn vẫn khơng thể giảm thiểu trong thuật tốn này.

Hình 0.5 : Tốc độ phép tốn SAD với các kích thước cửa sổ khác nhau

Hình thể hiện thời gian của thuật tốn đo dựa trên đầu vào là một tấm ảnh cĩ kích thước 450x375. Lõi CPU là chip ATOM tốc độ 1.5GHz. Như vậy, tốc độ của thuật tốn khá bé, khơng thích hợp cho một hệ thống xử lý trên robot, kể cả khi đã loại bỏ tất cả các lỗi.

Lỗi của phương pháp SAD là do đâu? Phương pháp SAD dựa trên sự so sánh

độ khác biệt giữa các cửa sổảnh. Theo như ý tưởng thuật tốn thì ảnh của các điểm

ở hai tấm ảnh là giống nhau nhất. Tuy nhiên, khi gĩc chiếu đã thay đổi thì các điểm khĩ cĩ thể giữ nguyên hình dạng ở cả hai bức ảnh. Như vậy, khả năng tồn tại những

điểm khác cũng giống điểm đưa ra so sánh là khơng thể tránh khỏi. Và nĩ đã thực sự xảy ra. Tất cả những điểm lỗi trên các bức ảnh xảy ra là do chương trình tính tốn đã cho thấy những cửa sổ khác giống cửa sổ so sánh hơn cả cửa sổ so sánh.

Bạch Ngọc Minh 39 Như vậy, kết quả tính tốn của thuật tốn này thực sự khơng hiệu quả cho hệ

thống dẫn đường chạy trên robot. Nếu thực sự triển khai một hệ thống như vậy trên robot cứu hộ thì sẽ phải tốn chi phí rất lớn về khả năng tính tốn mà chưa chắc đã hiệu quả. Vì vậy, phương pháp này cần phải được cải thiện để cĩ được kết quả tốt hơn và phù hợp hơn cho hệ thống thực.

2.3. Phương pháp SAD điều chỉnh

Sau khi phân tích những nhược điểm của phương pháp xác định bản đồ chênh lệch dựa trên phương pháp SAD truyền thống, tơi muốn đề xuất một phương pháp tốt hơn về chất lượng cũng như tốc độ.

Hình 0.6: Phương pháp SAD điều chỉnh

Hình 0.6 thể hiện các bước của phương pháp mới nhằm lấy được bản đồ chênh lệch. Những mục tiếp theo của chương 3 sẽ thể hiện rõ từng bước của phương pháp này và ý nghĩa của chúng.

2.3.1. Phương pháp SAD đối với đường biên

Là phương pháp dựa trên phương pháp SAD nhưng chỉ áp dụng với những

điểm thuộc đường biên. Với cách này, tơi kỳ vọng sẽ cĩ được kết quả chính xác hơn với tốc độ tính tốn cao hơn.

Giả sử cĩ một cách nào đĩ, tơi cĩ thể giảm sốđiểm trong tập hợp dữ liệu cần tính xuống cịn 20% so với ban đầu. Như vậy, tốc độ của thuật tốn cĩ thể sẽ tăng

Bạch Ngọc Minh 40 lên đến 5 lần hay thời gian tính tốn sẽ giảm xuống 5 lần. Thật vậy, theo phương trình (0-1), nếu S giảm đi 5 lần và các giá trị khác vẫn giữ nguyên, ta sẽ cĩ t giảm 5 lần. Như vậy, tơi sẽ tìm những điểm đáng tin cậy nhất để tính tốn bản đồ chênh lệch nhằm giảm lỗi và tăng tốc độ.

Những điểm được chọn là những điểm mang tính phân biệt cao, hay nĩi cách khác là khĩ bị nhầm lẫn với những điểm khác. Dựa trên các tính chất của đường biên đã được nêu tại mục 1.6.11.6.1, những điểm thuộc đường biên cĩ tính phân biệt rất cao. Như vậy, lựa chọn đường biên để tính tốn trong trường hợp này là một lựa chọn hợp lý. Khi chọn đường biên làm tập hợp dữ liệu để tính tốn, bước đầu ta cũng cĩ thể tránh được sự nhầm lẫn gây ra bởi các điểm lân cận, lỗi nhiều nhất trong những phép tốn trước.

Hình 0.7: Đường biên cũng là đường bao đối tượng

Đường biên cịn giúp tạo ra kết quả nội suy chính xác hơn về sau. Thật vậy, cũng theo tính chất của đường biên, nĩ là đặc trưng bất biến và cũng chứa các

đường bao của các đối tượng. Nếu cho rằng các đối tượng cĩ độ sâu như nhau ở

mọi điểm của nĩ. Như vậy, khi cĩ được tồn bộđường bao của đối tượng và độ sâu của tất cả các điểm trên nĩ, ta cĩ thể suy ra độ sâu của những điểm cịn lại.

Dưới những lý do trên, tơi chọn đường biên là những điểm sẽ được tính tốn

độ sâu trực tiếp. Hình 0.8 là một sự so sánh kết quả tính bản đồ chênh lệch dựa trên

đường biên là 20% bức ảnh, đường biên là 30% bức ảnh và tồn bộ bức ảnh. Với kết quảđã thể hiện trong Hình 0.8, chúng ta rút ra một số nhận xét:

Bạch Ngọc Minh 41

• Kết quả của thuật tốn chính xác hơn đối với những đường biên. Sốđường biên tính tốn càng nhỏ, độ chính xác càng cao.

• Khi sốđiểm làm đường biên được tính tốn nhỏđến một ngưỡng nào đĩ thì kích thước cửa sổ tính tốn khơng cịn ảnh hưởng đến kết quả tính tốn nữa. Với nhận xét thứ 2, ta hiển nhiên cĩ thể giảm kích thước cửa sổ lấy SAD đi mà vẫn kỳ vọng cĩ được kết quả cĩ độ chính xác cao.

Hình 0.8: Đánh giá kết quả của phương pháp SAD dựa trên đường biên 2.3.2. Phương pháp trích chọn đường biên màu

Phương pháp trích chọn đường biên màu là một phương pháp cải tiến hơn so với phương pháp trích chọn đường biên dựa trên ảnh xám. Sở dĩ phải trích chọn đường biên màu vì đường biên ảnh xám khơng thể hiện được hết các đường bao của đối tượng. Các

ảnh xám khơng thể thể hiện được hết các tính chất nhưđối với ảnh màu.

Hình 0.9 thể hiện sự khác biệt giữa đường biên được lấy từảnh màu và đường biên được lấy từảnh xám. Nhìn vào kết quả của phép lấy đường biên, ta để ý:

Đường biên của ảnh màu kín hơn so với đường biên trong ảnh xám.

Những đường biên thực tế bị thiếu đi thì những đường biên sai sĩt lập tức vào

Bạch Ngọc Minh 42

a b

c d

Hình 0.9: Đường biên 20% sốđiểm bằng phương pháp Sobel màu và xám

a. Ảnh xám

b. Ảnh màu

c. Đường biên ảnh xám

Bạch Ngọc Minh 43 a b c d e Hình 0.10 : Các mảng màu của hình gốc a. Ảnh màu b. Ảnh xám c. Ảnh màu đỏ d. Ảnh màu xanh lục

e. Ảnh màu xanh lam

Hình 0.10 thể hiện lý do của sự thiếu đường biên trong đường biên ảnh xám. Trong ảnh màu hoặc các mảng màu của ảnh gốc cĩ những điểm cĩ sự nhảy bậc của màu sắc hoặc đường biên, nhưng trong ảnh xám khơng cĩ. Như vậy, thực hiện bắt các đường biên bằng các mảng màu cơ bản, ta sẽ cĩ các đường biên kín hơn và đặc trưng hơn. Sau đây sẽ là các bước để xây dựng giải thuật tìm đường biên dựa trên các mảng màu cơ bản:

• Bước 1: Ta coi 3 mảng màu giống như những ảnh xám bình thường khác, ta tìm đường biên bằng tốn tử sobel.

• Bước 2: Ứng với mỗi điểm chỉ cĩ thể cĩ 1 giá trị nên ta sẽ lấy giá trịđường biên của nĩ bằng giá trị lớn nhất trong 3 giá trị tính được trên 3 mảng màu. Tính tốn SAD dựa trên 3 mảng màu sẽ phải tốn thời gian gấp 3 lần so với tính tốn SAD dựa trên ảnh xám. Thật vậy, nếu coi mỗi màu cơ bản tương đương

Bạch Ngọc Minh 44 với một ảnh xám, ta sẽ phải tính SAD dựa trên 3 tấm ảnh so vì một tấm. Như vậy, dựa theo cơng thức (0-1), kích thước cửa sổ W sẽ tăng gấp 3 khiến thời gian thực hiện phép tốn t cũng tăng gấp 3 lần, tốc độ phép tốn sẽ giảm đi 3 lần.

Tuy nhiên, dựa vào phương pháp này, tốc độ phép tốn sẽ khơng bị giảm đi 3 lần như so với phương pháp SAD ảnh xám thơng thường. Thật vậy, bởi lẽ mặc dù

đường biên được lấy dựa trên 3 mảng màu, mỗi điểm chỉ là đường biên của một mảng màu cơ bản. Như vậy, tính đặc trưng của đường biên được nĩi đến trong mục 1.6.1 cũng chỉ tồn tại trong 1 mảng màu. Như vậy, phép tính SAD dựa vào điểm đĩ cũng chỉ phải tính trên một mảng màu. Và điều này khiến tốc độ thuật tốn lúc này khơng bị tăng gấp 3 lần.

2.4. Bộ lọc logic:

Trong bản đồ độ sâu cĩ nhiều lỗi được sinh ra vì nhiều lý do, nhưng chúng ta cĩ thể loại bỏ hầu hết chúng vì đặc trưng về logic của tấm ảnh. Sau đây là sự phân tích về các đặc trưng logic đĩ.

2.4.1. Sự che khuất trong hai tấm ảnh

Trong bản đồ chênh lệch cĩ những lỗi xảy ra do sự che khuất. Những chi tiết bị che khuất là những chi tiết chỉ tìm thấy ở một ảnh mà khơng thể tìm được ởảnh kia. Điều này gây ra là do hai tấm ảnh là kết quả từ hai gĩc nhìn khác nhau. Những chi tiết như vậy tìm được là khơng ít. Tuy nhiên, khi một chi tiết như thế tìm thấy thì khả năng cĩ thể tìm được ảnh của nĩ ở trong tấm ảnh cịn lại là khơng cĩ. Và lỗi sai xảy ra là tất yếu. Hình 0.11 là một sự minh họa cho lỗi xảy ra vì che khuất.

Bạch Ngọc Minh 45 Nhìn vào hai đồ thị trên, điểm A đã tồn tại trong ảnh bên trái nhưng bị che khuất trong ảnh bên phải. Chúng ta khơng thể tìm thấy được điểm A trong ảnh bên phải.

2.4.2. Bộ lọc logic trong trường hợp này

Trước hết, khi tính bản đồ chênh lệch là ta đang tính đến ∆x, hay là độ lệch của tọa độ x của một điểm giữa ảnh bên trái và ảnh bên phải. Gọi tọa độ x của ảnh bên trái là xl và ảnh bên phải là xr, khi đĩ, ta cĩ:

∆xA = xAl - xAr và ∆xB = xBl - xBr Suy ra:

xAr = xAl - ∆xA và xBr = xBl - ∆xB

Ở ảnh bên trái, điểm B nằm bên phải điểm A nên ta cĩ xBl > xAl. Nếu cĩ thể

tìm thấy được ∆xA thì điều kiện trước hết là điểm A khơng bị khuất sau điểm B. Như vậy, ta cĩ xBr > xAr. Từđĩ suy ra điều kiện để tìm thấy ∆xAđúng đĩ là:

xAl - ∆xA < xBl - ∆xB (0-2)

Nếu điều kiện trên khơng thỏa mãn với bất cứ một điểm nào, ta cĩ thể coi như∆xAđã bị tính sai và loại bỏ khỏi kết quả.

2.5. Bộ lọc kích thước:

2.5.1. Kích thước lỗi sai

Nếu tồn tại một lỗi sai trong kết quả, nĩ cĩ thể xảy ra do sự nhầm lẫn giữa các lần tính SAD. Nhưng sự nhầm lẫn này khơng đáng kể, đặc biệt khi ta tính tốn dựa trên những điểm hồn tồn đáng tin cậy nhưđường biên. Nếu vậy, trong bản đồ

chênh lệch của đường biên, những điểm tính bị lỗi sẽ chiếm diện tích khơng đáng kể. Và chúng ta cĩ thể dựa vào việc phân vùng và xác định kích thước vùng để loại bỏ các điểm bị sai.

Bạch Ngọc Minh 46

2.5.2. Cách lọc bằng kích thước:

Đầu tiên ta phải tìm cách đánh dấu những vùng cĩ sự sai lệch hợp lý với nhau vào cùng một vùng. Lưu ý rằng 2 pixel liên tiếp trong cùng một vùng sẽ cĩ giá trị sai lệch nhau khơng quá 1 đơn vị.

Hình 0.12: Lọc kích thước vùng

a. Kết quả khơng cĩ lọc kích thước

b. Kết quảđã cĩ lọc kích thước

Hình 0.12 thể hiện kết quả của một phép lọc kích thước vùng. Quan sát trong

Hình 0.12.a thấy cĩ tồn tại những lỗi sai nhưng rất rời rạc và cĩ kích thước bé. Quan sát Hình 0.12.b thấy những lỗi sai phát hiện ở Hình.a đã bị mất. Như vậy, phương pháp lọc này đã cĩ hiệu quả.

Kích thước của vùng điểm ảnh được cho là nhiễu cũng ảnh hưởng đến kết quả đầu ra. Nếu kích thước này quá bé, các lỗi sai sẽ khơng được lược bỏ hết. Nếu kích

Bạch Ngọc Minh 47 thước này lớn quá, các chi tiết đúng sẽ bị mất mát nhiều dẫn đến khĩ khăn trong quá trình nội suy.

2.6. Phương pháp SAD phân vùng

SAD phân đoạn là kỹ thuật sử dụng để nội suy một bản đồ độ sâu bao gồm các điểm đã tính được chuẩn. Sử dụng kỹ thuật này trong trường hợp chúng ta cĩ thểđốn được phạm vi của những điểm cần tính. Giả sử một điểm đã được xác định bên trong một vật thể mà những đường biên của nĩ đã được xác định độ sâu. Khi

đĩ, tồn tại một xác suất cao rằng những điểm bên trong vật thể sẽ cĩ độ sâu trong một phạm vi nhỏ xung quanh giá trị độ sâu của các đường biên của nĩ. Khi đĩ, sự

giới hạn độ sâu tính tốn của các điểm nội suy cĩ thể làm mất khả năng nhầm lẫn giữa điểm đã cho và các điểm bên ngồi.

Hình 0-1A : SAD phân đoạn

Ở Hình 0-1A, giả thiết độ sâu của những điểm thuộc đường biên bao gồm E1 và E2 đã tính được và tính chuẩn. Khi đĩ, giá trị vềđộ sâu của A chỉ cĩ thể dao

động xung quanh các giá trịđộ sâu của E1 và E2 dẫn đến khả năng tính tốn độ sâu của A được nâng cao lên, mặt khác lại khơng bị nhầm lẫn với một điểm cũng cĩ cấu trúc màu tương tự là điểm B.

Giả thiết biện pháp này khơng được sử dụng, khi đĩ ở ảnh đối chiếu cĩ thể

xuất hiện một điểm giống với điểm cần tính nằm ở lân cận khoảng cách với điểm B. Khi này, thuật tốn SAD cĩ thểđưa đến sự nhầm lẫn ở giá trịđộ sâu của A. Điểm A cĩ thểđược tính nhầm và ảnh hưởng trực tiếp đến các điểm nằm bên cạnh nĩ.

Bạch Ngọc Minh 48 Tĩm lại, phương pháp SAD phân đoạn dùng tốt trong trường hợp nội suy dựa theo giá trịđã tính đúng. Sử dụng biện pháp này giúp giảm lỗi và tăng tốc độ.

Tính tốn bản đồ chênh lệch là một trong những vấn đề quan trọng trong thị

giác máy tính 3D. Một số lượng lớn các thuật tốn đã được đề xuất để giải quyết

Phát hiện mặt phẳng bằng biến đổi Hough:

Phương pháp SAD đối với đường biên