Cài đặt thử nghiệm

3.2.1 Cài đặt chương trình

Các tính năng chính:

Chƣơng trình đƣợc viết bằng ngôn ngữ Visual C# 2008, chạy trên hệ điều hành Window 7, máy tính tốc độ Core 2 Duo 2.00GHz, bộ nhớ 2.00GB RAM. Chƣơng trình có các chức năng sau:

- Cho phép ngƣời sử dụng lựa chọn ảnh truy vấn và ảnh chứa đối tƣợng cần nhận dạng – Khoanh vùng đối tƣợng cần tìm trên ảnh chứa đối tƣợng nhận dạng.

- Hiển thị kết quả nhận dạng.

- Ứng dụng việc trích chọn đặc trƣng vào việc tìm ảnh

3.2.2 Kết quả thực nghiệm

Thực hiện cài đặt thử nghiệm phƣơng pháp SURF để trích chọn đặc trƣng bất biến, sau đó sử dụng RANDSAC để so khớp nhận dạng. Bƣớc đầu với một số kết quả sau:

Hình 3.3 thể hiện kết quả nhận dạng đối tƣợng, ở ảnh (a) các đối tƣợng đƣợc thu nhận trên một nền tƣơng đối rõ ràng nên việc trích chọn và so khớp đặc trƣng đƣợc tiến hành không mấy khó khăn và độ chính xác tƣơng đối cao, hơn nữa góc nhìn của đối tƣợng cần nhận dạng trong cả hai giống nhau chỉ khác nhau về tỷ lệ.

(a) (b)

(c)

Hình 3.3. Kết quả nhận dạng của ảnh chứa nhiều đối tượng được huấn luyện.(a) Ảnh truy vấn chứa nhiều đối tượng; (b) Ảnh huấn luyện; (c) Kết quả nhận dạng

Hình 3.4 thể hiện một ví dụ khác về nhận dạng đối tƣợng, đối tƣợng cần nhận dạng trong cả hai ảnh có sự khác nhau đôi chút về góc nhìn, hơn nữa ảnh truy vấn lại chứa quá nhiều đối tƣợng, đƣợc thu nhận trên một nền không rõ ràng nền sẽ có rất nhiều đặc trƣng đƣợc tìm thấy ở ảnh (a) vì vậy việc so khớp

đặc trƣng sẽ mất nhiều thời gian hơn và số lƣợng các so khớp không chính xác cũng tăng lên.

(a) (b)

(c)

Hình 3.4. Kết quả nhận dạng đối tượng bị che khuất một phần. (a) Ảnh truy vấn chứa nhiều đối tượng; (b) Ảnh chứa đối tượng cần nhận dạng; (c) Kết quả nhận dạng

Hình 3.5 thể hiện một ví dụ khác về nhận dạng đối tƣợng, đối tƣợng cần nhận dạng ở trong một ảnh lớn. Có thể quét chọn chính xác đối tƣợng để kết quả tìm kiếm đƣợc chính xác hơn.

(a)

(b) (c)

(d) (e)

Hình 3.5. Kết quả nhận dang đối tượng trước và sau khi khoanh vùng chọn đối tượng. (a) Ảnh truy vấn chứa nhiều đối tượng; (b) Ảnh chứa đối tượng cần nhận dạng chưa được khoanh vùng; (c) Kết quả nhận dạng khi chưa khoanh vùng đối tượng; (d) Ảnh chứa đối tượng cần nhận dạng đã được khoanh vùng đối tượng; (e) Kết quả nhận dạngkhi đã khoanh vùng đối tượng

* Nhận xét:

Thuật toán này đƣợc đánh giá là khá hiệu quả trong việc trích chọn đặc trƣng phục vụ cho việc nhận dạng đối tƣợng, đặc biệt khi các ảnh đƣợc thu nhận có tỷ lệ khác nhau hoặc các đối tƣợng trong ảnh đƣợc đặt ở các góc nhìn khác nhau. Tuy nhiên trong quá trình cài đặt thuật toán vẫn chƣa xử lý đƣợc trƣờng hợp đối tƣợng cần nhận dạng bị che khuất một số bộ phận hoặc bị thay đổi góc nhìn, tỷ lệ quá lớn.

KẾT LUẬN

Một trong những hƣớng tiếp cận để nhận dạng đối tƣợng hiệu quả đã và đang đƣợc nhiều nhóm nghiên cứu chú ý gần đây đó là dựa vào các đặc trƣng bất biến của đối tƣợng. Làm sao có thể nhận dạng chính xác đƣợc đối tƣợng trong ảnh cho dù đối tƣợng đó có sự biến đổi đôi chút về hình thức, sự thay đổi về tỷ lệ thu nhận ảnh, đối tƣợng cần nhận dạng bị che khuất một phần bởi các đối tƣợng khác hay các biến đổi khác là một vấn đề rất có ý nghĩa. Xuất phát từ thực tế đó luận văn nhằm tìm hiểu tổng quan về nhận dạng đối tƣợng, các phƣơng pháp phát hiện đặc trƣng bất biến mà nền tảng là dựa vào các điểm bất động và ứng dụng của chúng trong nhận dạng.

Trong quá trình nghiên cứu tài liệu và thực hiện luận văn dƣới sự định hƣớng của thầy hƣớng dẫn, luận văn đã đạt đƣợc một số kết quả nhƣ sau:

 Trình bày khái quát về nhận dạng đối tƣợng, các loại bất biến, lý thuyết điểm bất động và ứng dụng của điểm bất động trong nhận dạng đối tƣợng..

 Hệ thống hóa các phƣơng pháp phát hiện điểm bất động trong ảnh. Đặc biệt việc phát hiện điểm bất động sử dụng phƣơng pháp SURF đã mang lại kết quả khả quan về độ chính xác cũng nhƣ về tốc độ.

 Bằng cách hiểu rõ bản chất của từng phƣơng pháp tôi đã cài đặt và chạy thử nghiệm một kỹ thuật đã đƣợc trình bày trong chƣơng 2: cài đặt phƣơng pháp SURF trong trƣờng hợp các ảnh có sự khác nhau về tỷ lệ, góc nhìn và các đối tƣợng trong ảnh bị che khuất một số bộ phận không đáng kể.

 Ngoài ra, trong quá trình nghiên cứu tôi cũng tự tích lũy thêm cho mình các kiến thức về toán học, về kỹ thuật lập trình,…Và quan trọng là rèn luyện kỹ năng để thực hiện một nghiên cứu khoa học. Tuy mới chỉ là bƣớc đầu, nhƣng những kết quả này sẽ giúp ích cho tôi trong những nghiên cứu sau này để thu đƣợc những kết quả tốt hơn.

Một số vấn đề cần tiếp tục giải quyết:

 Các ảnh đƣợc thu nhận có sự khác nhau đáng kể về tỷ lệ, góc nhìn, đối tƣợng cần nhận dạng bị che khuất khá nhiều.

 Ảnh chứa các đối tƣợng cần nhận dạng bị thay đổi độ sáng, độ tƣơng phản.Các ảnh chịu phép biến đổi affine lớn.

TÀI LIỆU THAM KHẢO

[1] Nguyễn Quang Hoan, “Xử lý ảnh”, Học viện Công nghệ bƣu chính viễn thông.

[2] Đỗ Hồng Tân, Nguyễn Thị Thanh Hà 2003, Các định lý điểm bất động,

Đại học sƣ phạm Hà Nội

[3] Brown M. and Lowe D.G 2002, Invariant features from interest point groups, In The 13th British Machine Vision Conference, Cardiff University, UK.

[4] Harris C. and Stephens M. 1988, A combined corner and edge detector, Proceedings of the Alvey Vision Conference.

[5] Herbert Bay, Andreas Ess, Tinne Tuytelaars, Luc Van Gool 2008,

SURF: Speeded Up Robust Features, Computer Vision and Image Understanding (CVIU)

[6] Lowe D.G. 2004, Distinctive image features from Scale-Invariant keypoints, International Journal of Computer Vision 60.

[7] Mikolajczyk, K. 2002. Detection of local features invariant to affine transformations, Ph.D. thesis, Institut National Polytechnique de Grenoble, France.

[8] Mikolajczyk K. and Schmid C. 2001, Indexing based on scale invariant interest points, In: ICCV, Volume 1.

[9] Mikolajczyk, K., and Schmid, C. 2002. An affine invariant interest point detector. In European Conference on Computer Vision (ECCV), Copenhagen, Denmark.

[10] Mikolajczyk, K., Schmid, C. 2004, Scale and aﬃne invariant interest point detectors. In International Journal of Computer Vision 60.

[11] Mikolajczyk K. and Schmid C. 2005, A performance evaluation of local descriptors, In IEEE Transactions on Pattern Analysis and Machine Intelligence, to appear.

[12] Rothganger, F., S. Lazebnik, C. Schmid, and J. Ponce 2005, Object modeling and recognition using local affine-invariant image descriptors and multi-view spatial consraints, In International Journal of Computer Vision, to appear.

[13] Viola P. and Jones M. 2001, Rapid object detection using a boosted cascade of simple features, In: CVPR (1).

[14] Scovanner Paul, Ali. S, Shah. M 2007. A 3-dimensional sift descriptor and its application to action recognition. Proceedings of the 15th International Conference on Multimedia.

[15] Ryuji Funayama, Hiromichi Yanagihara, Luc Van Gool, Tinne Tuytelaars, Herbert Bay 2009, Robust Interest Point Detector and Descriptor, US 2009238460 (A1)

Xây dựng bộ mô tả cục bộ

Sự lựa chọn tỷ lệ tự động