Tư tưởng của bài toán như sau: Cho trước một ảnh huấn luyện về đối tượng cần nhận dạng, ta tìm trong ảnh cần xét (gọi là ảnh truy vấn) có đối tượng đó hay không. Bằng cách đánh giá mức độ giống nhau của đối tượng
trong ảnh cho trước với các đối tượng trong ảnh truy vấn. Do đó cần phải giải quyết bài toán này theo cách đối sánh các đặc trưng của ảnh cho trước với các đặc trưng của ảnh truy vấn. Thực chất đây chính là một trường hợp đặc biệt của bài toán tra cứu ảnh dựa trên các đặc trưng đặc biệt nào đó. Và cũng lưu ý rằng yếu tố thời gian thực luôn được quan tâm cho mỗi bài toán, mức độ cần thiết của nó tùy thuộc vào bài toán mà ta giải quyết, yếu tố này quyết định sự thành công hay thất bại của nhiều bài toán.
Mô hình chung của bài toán nhận dạng đối tượng như sau:
Hình 3.2. Mô hình chức năng nhận dạng đối tượng
Ảnh đầu vào Trích chọn đặc trưng: Bất biến Ảnh huấn luyện Trích chọn đặc trưng: Bất biến So sánh độ tương tự Ảnh kết quả (ảnh có khoanh vùng đối tượng cần nhận dạng)
Như vậy, bài toán nhận dạng đối tượng bằng kỹ thuật Xử lý ảnh gồm ba bước chính:
- Xác định và trích chọn các đặc trưng của hai ảnh một cách độc lập. - Đánh giá độ tương tự (độ giống nhau) của đối tượng trong hai ảnh dựa vào việc so khớp các đặc trưng được trích chọn.
- Phân tích xác suất để thực hiện xác minh cuối cùng.
Đây chính là một bài toán lớn trong lĩnh vực nhận dạng và thị giác máy.
3.2. Chƣơng trình cài đặt thử nghiệm 3.2.1. Cài đặt chƣơng trình
Chương trình được viết bằng ngôn ngữ Visual C# 2008, chạy trên hệ điều hành Windows 7 – 32bit, máy tính tốc độ Core i5 2.53 GHz, bộ nhớ 4GB RAM. Chương trình có các chức năng sau:
- Cho phép người sử dụng lựa chọn ảnh truy vấn và ảnh chứa đối tượng cần nhận dạng – Khoanh vùng đối tượng cần tìm trên ảnh chứa đối tượng nhận dạng.
- Hiển thị kết quả nhận dạng.
- Ứng dụng việc trích chọn đặc trưng vào việc tìm ảnh
3.2.2. Kết quả thực nghiệm
Thực hiện cài đặt thử nghiệm phương pháp SIFT để trích chọn đặc trưng bất biến, sau đó sử dụng RANDSAC để so khớp nhận dạng. Bước đầu với một số kết quả sau:
(a) (b)
(c) Hình 3.3.
Kết quả nhận dạng của ảnh chứa nhiều đối tượng được huấn luyện.
(a) Ảnh truy vấn chứa nhiều đối tượng; (b) Ảnh huấn luyện;
(c) Kết quả nhận dạng.
Hình 3.3 thể hiện kết quả nhận dạng đối tượng, ở ảnh (a) các đối tượng
được thu nhận trên một nền tương đối rõ ràng nên việc trích chọn và so khớp đặc trưng được tiến hành không mấy khó khăn và độ chính xác tương đối cao, hơn nữa góc nhìn của đối tượng cần nhận dạng trong cả hai giống nhau chỉ
(a) (b)
(c)
Hình 3.4. Kết quả nhận dạng đối tượng bị che khuất một phần.
(a) Ảnh truy vấn chứa nhiều đối tượng; (b) Ảnh chứa đối tượng cần nhận dạng; (c) Kết quả nhận dạng.
Hình 3.4 thể hiện một ví dụ khác về nhận dạng đối tượng, đối tượng cần nhận dạng trong cả hai ảnh có sự khác nhau đôi chút về góc nhìn, hơn nữa ảnh truy vấn lại chứa quá nhiều đối tượng, được thu nhận trên một nền không rõ ràng nền sẽ có rất nhiều đặc trưng được tìm thấy ở ảnh (a) vì vậy việc so khớp đặc trưng sẽ mất nhiều thời gian hơn và số lượng các so khớp không chính xác cũng tăng lên.
* Nhận xét:
Thuật toán này được đánh giá là khá hiệu quả trong việc trích chọn đặc trưng phục vụ cho việc nhận dạng đối tượng, đặc biệt khi các ảnh được thu nhận có tỷ lệ khác nhau hoặc các đối tượng trong ảnh được đặt ở các góc nhìn khác nhau. Tuy nhiên trong quá trình cài đặt thuật toán vẫn chưa xử lý được trường hợp đối tượng cần nhận dạng bị che khuất một số bộ phận hoặc bị thay đổi góc nhìn, tỷ lệ quá lớn.
PHẦN KẾT LUẬN
Một trong những hướng tiếp cận để nhận dạng đối tượng hiệu quả đã và đang được nhiều nhóm nghiên cứu chú ý gần đây đó là dựa vào các đặc trưng bất biến của đối tượng. Làm sao có thể nhận dạng chính xác được đối tượng trong ảnh cho dù đối tượng đó có sự biến đổi đôi chút về hình thức, sự thay đổi về tỷ lệ thu nhận ảnh, đối tượng cần nhận dạng bị che khuất một phần bởi các đối tượng khác hay các biến đổi khác là một vấn đề rất có ý nghĩa. Xuất phát từ thực tế đó luận văn đã tìm hiểu về các phương pháp phát hiện đặc trưng bất biến mà nền tảng là dựa vào các điểm bất động, kỹ thuật SIFT áp dụng cho bài toán phát hiện và đánh dấu đối tượng,và ứng dụng của chúng trong nhận dạng.
Kết quả đạt được:
Trong quá trình nghiên cứu tài liệu và thực hiện luận văn dưới sự định hướng của thầy giáo hướng dẫn, luận văn đã đạt được một số kết quả như sau: -Trình bày khái quát về xử lý ảnh, các giai đoạn của xử lý ảnh số và các vấn đề trong phát hiện và đánh dấu đối tượng.
-Trình bày lý thuyết về điểm bất động và các đặc trưng bất biến của đối tượng, vai trò, đặc điểm; lý thuyết cơ bản của thuật toán SIFT cũng như các bước tiến hành; một số hướng cải tiến, phát triển thuật toán SIFT.
-Trình bày ứng dụng nhận dạng đối tượng ảnh dựa vào các đặc trưng bất biến được xây dựng từ các điểm bất động, cài đặt thử nghiệm thành công kỹ thuật SIFT đã trình bày ở chương 2 trong trường hợp các ảnh có sự khác nhau về tỷ lệ, góc nhìn và các đối tượng trong ảnh bị che khuất một số bộ phận không đáng kể.
-Ngoài ra, trong quá trình nghiên cứu tôi cũng tự tích lũy thêm cho mình các kiến thức về toán học, về kỹ thuật lập trình,…Và quan trọng là rèn luyện kỹ năng để thực hiện một nghiên cứu khoa học. Tuy mới chỉ là bước đầu, nhưng những kết quả này sẽ giúp ích cho tôi trong những nghiên cứu sau này để thu được những kết quả tốt hơn.
Một số vấn đề cần tiếp tục giải quyết:
- Các ảnh được thu nhận có sự khác nhau đáng kể về tỷ lệ, góc nhìn, đối tượng cần nhận dạng bị che khuất khá nhiều.
- Ảnh chứa các đối tượng cần nhận dạng bị thay đổi độ sáng, độ tương phản.Các ảnh chịu phép biến đổi affine lớn.
Trong quá trình thực hiện luận văn tốt nghiệp, bản thân tôi cũng đã rất nỗ lực, cố gắng, đầu tư nhiều thời gian, công sức cho việc tìm hiểu nghiên cứu đề tài dưới sự định hướng tận tình của thầy giáo PGS.TS. Đỗ Năng Toàn. Tuy nhiên, do hạn chế về mặt kiến thức của bản thân, thời gian cũng như các nguồn tài liệu, nên luận văn chưa được hoàn hảo, còn nhiều thiếu sót. Kính mong các thầy cô giáo cũng như các bạn đồng nghiệp chỉ bảo và giúp đỡ.
TÀI LIỆU THAM KHẢO
[1] Đỗ Năng Toàn, Phạm Việt Bình, Xử lý ảnh, Đại học công nghệ thông tin & Truyền Thông.
[2] Lương Mạnh Bá, Nguyễn Thanh Thủy, 1999, Nhập môn Xử lý ảnh số, Nhà xuất bản Khoa học và Kỹ thuật, Hà Nội.
[3] Nguyễn Quang Hoan, 2006, Xử lý ảnh, Học viện bưu chính viễn thông. [4] Đỗ Hồng Tân, Nguyễn Thị Thanh Hà 2003, Các định lý điểm bất động,
Đại học sư phạm Hà Nội.
[5] Brown M. and Lowe D.G 2002, Invariant features from interest point
groups, In The 13th British Machine Vision Conference, Cardiff
University, UK.
[6] David Lowe, 1999, The SIFT (Scale Invariant Feature Transform) Detector and Descriptor, University of British Columbia.
[7] http://en.wikipedia.org/wiki/Scale-invariant_feature_transform [8] http://opencv.willowgarage.com/wiki/