Hình 3.6 Không nhận dạng được đối tượng
3.2 Cài đặt thử nghiệm
3.2.2 Một số kết quả thực nghiệm
Thực hiện cài đặt thử nghiệm phương pháp “Phép biến đổi đặc trưng bất biến tỷ lệ” để trích chọn đặc trưng bất biến, sau đó sử dụng thuật toán láng giềng gần nhất để so khớp nhận dạng. Bước đầu với một số kết quả sau:
(a) (b)
(c)
Hình 3.4. (a) Ảnh truy vấn chứa nhiều đối tƣợng; (b) Ảnh huấn luyện; (c) Kết quả nhận dạng
Hình 3.4 thể hiện kết quả nhận dạng đối tượng, ở ảnh (a) các đối tượng được thu nhận trên một nền tương đối rõ ràng nên việc trích chọn và so khớp đặc trưng được tiến hành không mấy khó khăn và độ chính xác tương đối cao, hơn nữa góc nhìn của đối tượng cần nhận dạng trong cả hai giống nhau chỉ khác nhau về tỷ lệ nhưng không đáng kể.
(a) (b)
(c)
Hình 3.5. (a) Ảnh truy vấn chứa nhiều đối tƣợng; (b) Ảnh chứa đối tƣợng cần nhận dạng; (c) Kết quả nhận dạng
Hình 3.5 thể hiện một kết quả thực nghiệm khác về nhận dạng đối tượng, đối tượng cần nhận dạng trong cả hai ảnh có sự khác nhau đôi chút về góc nhìn, hơn nữa ảnh truy vấn lại chứa quá nhiều đối tượng, được thu nhận trên một nền không rõ ràng nền sẽ có rất nhiều đặc trưng được tìm thấy ở ảnh (a) vì vậy việc so khớp đặc trưng sẽ mất nhiều thời gian hơn và số lượng các so khớp không chính xác cũng tăng lên. Tuy nhiên vẫn nhận dạng được đối tượng.
Hình 3.6. Không nhận dạng đƣợc đối tƣợng
Hình 3.6 thể hiện một ví dụ không nhận dạng được vì đối tượng cần nhận dạng bị che khuất quá nhiều nên các điểm khóa được trích chọn từ vị trí có đối tượng này không tương ứng với các đặc trưng trong ảnh thứ hai nên việc so khớp không thành công.
* Nhận xét:
Thuật toán này được đánh giá là khá hiệu qủa trong việc trích chọn đặc trưng phục vụ cho việc nhận dạng đối tượng, đặc biệt khi các ảnh được thu nhận có tỷ lệ khác nhau hoặc các đối tượng trong ảnh được đặt ở các góc nhìn khác nhau. Tuy nhiên trong quá trình cài đặt thuật toán vẫn chưa xử lý được trường hợp đối tượng cần nhận dạng bị che khuất một số bộ phận hoặc bị thay đổi góc nhìn, tỷ lệ quá lớn.
KẾT LUẬN
Một vấn đề kinh điển trong thị giác máy và xử lý ảnh là xác định xem liệu có hay không dữ liệu ảnh chứa một đối tượng, một đặc trưng hay một hoạt động nào đó. Thông thường công việc này có thể được giải quyết bởi con người một cách đơn giản và không cần phải nỗ lực nhiều, nhưng vẫn không được giải quyết một cách hài lòng trong thị giác máy đối với trường hợp tổng quát: các đối tượng tùy ý trong các hoàn cảnh khác nhau. Các phương pháp hiện thời cho việc giải quyết vấn đề này chỉ có thể giải quyết tốt cho các đối tượng đặc biệt như các đối tượng hình học đơn giản, các mặt người, các ký tự viết tay hay ký tự in, hoặc các loại xe v.v… trong những hoàn cảnh đặc biệt, được mô tả một cách điển hình dưới sự chiếu sáng, nền rõ ràng.
Một trong những hướng tiếp cận để nhận dạng đối tượng hiệu quả đã và đang được nhiều nhóm nghiên cứu chú ý gần đây đó là dựa vào các đặc trưng bất biến của đối tượng. Làm sao có thể nhận dạng chính xác được đối tượng trong ảnh cho dù đối tượng đó có sự biến đổi đôi chút về hình thức, sự thay đổi về tỷ lệ thu nhận ảnh, đối tượng cần nhận dạng bị che khuất một phần bởi các đối tượng khác hay các biến đổi khác là một vấn đề rất có ý nghĩa. Xuất phát từ thực tế đó luận văn nhằm tìm hiểu tổng quan về nhận dạng đối tượng, các phương pháp phát hiện đặc trưng bất biến mà nền tảng là dựa vào các điểm bất động và ứng dụng của chúng trong nhận dạng. Cụ thể luận văn đã đạt được các kết quả chính sau:
Trình bày tổng quan trình về bài toán nhận dạng đối tượng trong ảnh, đề cập đến hai vấn đề chính là các dạng bất biến trong ảnh và lý thuyết điểm bất động.
Hệ thống hóa một số phương pháp phát hiện điểm bất động trong ảnh như: Phương pháp Harris, phương pháp Harris-Laplace, phương pháp Harris-Affine và phương pháp “Phép biển đổi đặc trưng bất biến tỷ lệ”. Cài đặt thử nghiệm một kỹ thuật đã được trình bày trong chương 2: cài
hợp các ảnh có sự khác nhau về tỷ lệ, góc nhìn và các đối tượng trong ảnh không bị che khuất một số bộ phận không đáng kể.
Các vấn đề có thể nghiên cứu tiếp tục:
Các ảnh được thu nhận có sự khác nhau đáng kể về tỷ lệ, đối tượng cần nhận dạng bị che khuất khá nhiều bộ phần.
Ảnh chứa các đối tượng cần nhận dạng chịu các phép biến đổi affine, thay đổi độ sáng, độ tương phản.
TÀI LIỆU THAM KHẢO
Tiếng Việt
[1] Nguyễn Thanh Thủy, 2002, “Nhập môn xử lý ảnh số”, Trường Đại học Bách khoa Hà Nội.
Tiếng Anh
[2] Basri, R., and Jacobs, D.W. 1997. Recognition using region correspondences. International Journal of Computer Vision, 25(2):145- 166.
[3] Baumberg, A. 2000. Reliable feature matching across widely separated views. In Conference on Computer Vision and Pattern Recognition, Hilton Head, South Carolina, pp. 774-781.
[4] Brown, M. and Lowe, D.G. 2002. Invariant features from interest point groups. In The 13th British Machine Vision Conference, Cardiff University, UK, pp. 253–262
[5] Harris, C. and Stephens, M.J. 1988. A combined corner and edge detector. In Alvey Vision Conference, pages 147–152.
[6] Lindeberg, T. 1994. Scale-space theory: A basic tool for analysing structures at different scales. Journal of Applied Statistics, 21(2):224-270.
[7] Lowe, D.G. 1999. Object recognition from local scale-invariant features. In International Conference on Computer Vision, Corfu, Greece, pp. 1150-1157.
[8] Lowe, D.G. 2004. Distinctive image features from Scale-Invariant keypoints. International Journal of Computer Vision.
[9] Mikolajczyk, K. 2002. Detection of local features invariant to affine transformations, Ph.D. thesis, Institut National Polytechnique de Grenoble, France.
[11] Mikolajczyk, K. and Schmid, C. 2005. A performance evaluation of local descriptors. In IEEE Transactions on Pattern Analysis and Machine Intelligence.
[12] Rothganger, F., Lazebnik, S., Schmid, C. and Ponce. J. 2005. Object modeling and recognition using local affine-invariant image descriptors and multi-view spatial consraints. In International Journal of Computer Vision.
[13] http://en.wikipedia.org/wiki/Fixed-point_theorem
[14] http://signal.ece.utexas.edu/seminars/dsp_seminars/02spring/danilo.html
[15] http://www.hindawi.com/journals/fpta/guidelines.html
MỤC LỤC
CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT ...1
DANH MỤC CÁC HÌNH VẼ ...2
MỞ ĐẦU ...3
Chƣơng 1 TỔNG QUAN VỀ BẤT BIẾN VÀ NHẬN DẠNG ...5
ĐỐI TƢỢNG ...5
1.1 Tổng quan về nhận dạng ...5
1.1.1 Không gian biểu diễn đối tượng, không gian diễn dịch ...6
1.1.1.1 Không gian biểu diễn đối tượng...6
1.1.1.2 Không gian diễn dịch ...6
1.1.2 Mô hình và bản chất của quá trình nhận dạng...6
1.1.2.1 Mô hình ...6
1.1.2.2 Bản chất của quá trình nhận dạng ...8
1.1.3 Bài toán nhận dạng đối tượng ảnh ...8
1.2 Tổng quan về bất biến và vai trò của bất biến trong nhận dạng ... 10
1.2.1 Bất biến moment thống kê ... 10
1.2.2 Bất biến hình học ... 13
1.2.3 Bất biến đại số ... 15
1.2.4 Vai trò của bất biến trong nhận dạng ... 16
1.3 Điểm bất động và vai trò của điểm bất động trong nhận dạng... 17
1.3.1 Lý thuyết điểm bất động ... 17
1.3.2 Vai trò của điểm bất động trong nhận dạng đối tượng ... 19
1.3.2.1 Trích chọn các đặc trưng bất biến từ các điểm bất động ... 19
1.3.2.2 So khớp đặc trưng ... 20
Chƣơng 2 CÁC PHƢƠNG PHÁP XÁC ĐỊNH ĐIỂM BẤT ĐỘNG ... 22
TRONG ẢNH ... 22
2.1 Phương pháp Harris ... 22
2.2 Phương pháp Harris-Laplace ... 24
2.2.1 Sự thể hiện không gian tỷ lệ ... 24
2.2.2 Hàm Harris thích nghi tỷ lệ ... 27 2.2.3 Sự lựa chọn tỷ lệ tự động
2.2.3 Thuật toán phát hiện điểm bất biến Harris-Laplace ... 29
2.2.3.1 Thuật toán Harris-Laplace ... 30
2.2.3.2 Thuật toán Harris-Laplace đơn giản ... 31
2.2.3.3 Ví dụ về các điểm bất biến ... 31
2.3 Phương pháp xác định điểm bất biến Harris-Affine ... 32
2.3.1 Động cơ thúc đẩy ... 32
2.3.2 Ma trận moment cấp hai affine... 33
2.3.2.1 Phép biến đổi affine của ma trận moment cấp hai ... 34
2.3.2.2 Phép đo tính đẳng hướng ... 36
2.3.3 Phương pháp phát hiện điểm bất biến Harris-Affine ... 37
2.4 Phương pháp “Phép biến đổi đặc trưng bất biến tỷ lệ”... 44
2.4.1 Phát hiện cực trị không gian tỷ lệ ... 44
2.4.1.1 Tần số lấy mẫu theo tỷ lệ ... 46
2.4.1.2 Tần số lấy mẫu trong một vùng không gian... 47
2.4.2 Định vị chính xác điểm khóa ... 47
2.4.3 Gán hướng cho các điểm khóa ... 50
2.4.4 Bộ mô tả ảnh cục bộ ... 51
2.5 Kết luận ... 53
Chƣơng 3 ỨNG DỤNG ĐIỂM BẤT ĐỘNG TRONG ... 54
NHẬN DẠNG ĐỐI TƢỢNG ... 54
3.1 Bài toán nhận dạng đối tượng... 54
3.1.1 Mô hình bài toán nhận dạng đối tượng ... 55
3.1.2 Thuật toán... 56
3.2 Cài đặt thử nghiệm ... 58
3.2.1 Cài đặt chương trình... 58
3.2.2 Một số kết quả thực nghiệm ... 59
KẾT LUẬN ... 62