Các cách tiếp cận bài toán nhận diện đối tượng trong ảnh

Một phần của tài liệu NHẬN DIỆN VÀ ĐIỀU KHIỂN TRẠNG THÁI VẬT THỂ QUA IP CAMERA (Trang 26 - 27)

Đã có rất nhiều những nhà nghiên cứu, tổ chức quan tâm nghiên cứu và đưa ra các cách tiếp cận khác nhau để giải quyết bài toán này. Trong đó có một vài cách tiếp cận phổ biến như: thu thập một lượng dữ liệu về hình ảnh lớn chứ đối tượng và thực hiện việc huấn luyện thông qua học máy. Ví dụ nghiên cứu của: H. Schneiderman và T. Kanade. A Statistical Method for 3D object detection applied to faces and cars. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, năm 2000 [4]; hay H. Rowley, S. Baluja, T. Kanade. Rotation Invariant Neural Network-Based Face Detection. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 1998 [3]...) Tuy nhiên cách này đòi hỏi việc phải thu thập một lượng lớn dữ liệu thực tế của một đối tượng, điều này là thực sự khó khăn nếu ta tiến hành trên một nhóm các loại đối tượng khác nhau. Hơn nữa việc đưa ra những phương pháp học máy cũng đòi hỏi không ít thời gian và công sức. Do đó có một cách tiếp cận khác đó là đưa ra một bộ luật cho những đặc điểm của đối tượng, cách này sử dụng tri thức của người phát triển nhiều hơn so với sức mạnh của máy tính. Tuy nhiên, để đưa ra được những bộ luật như vậy cần rất nhiều hiểu biết cũng như những nghiên cứu chính xác đặc điểm của loại đối tượng cần nhận diện. Một kết quả nhận diện tốt phụ thuộc rất nhiều vào bộ luật cho từng loại đối tượng. Ví dụ như nghiên cứu của Crandall David J và Luo Jiebo đưa ra một cách tiếp cận để nhận diện các đối tượng có sự kết hợp của các màu sắc một cách cố định như các loại cờ, nhân vật hoạt hình, đồng phục hay logo. [2]

Cách tiếp cận thứ hai như đã nói phụ thuộc rất nhiều vào bộ luật đưa ra cho mỗi loại đồ vật. Và để giải quyết vấn đề này trong các bài toán mà loại đồ vật cần nhận diện đã được chỉ định trước, người ta đã đưa ra một phương pháp tương đối hiệu quả đó đánh dấu vật cần tìm, theo đó ảnh chụp vật cần tìm sẽ chứ những điểm đặc biệt,

giúp cho việc nhận diện bằng máy tính là dễ dàng hơn. Ví dụ về một phương pháp sử dụng cách này là nhiên cứu của nhóm tác giả J. Coughlan, R. Manduchi*, M. Mutsuzaki* và H. Shen. Rapid and Robust Algorithms for Detecting Colour Targets trong AIC Colour 05 - 10th Congress of the International Colour Association [11]. Nó đưa ra một phương thức được triển khai trên các thiết bị di động có camera cho phép tìm kiếm điểm màu đã được đánh dấu trong khoảng cách gần. Phương pháp này đạt được độ chính xác tương đối cao 95 % với một vài loại thiết bị đã được thực nghiệm với thời gian tính toán từ 0,12 đến 0,9 giây cho một bức ảnh.

Một phần của tài liệu NHẬN DIỆN VÀ ĐIỀU KHIỂN TRẠNG THÁI VẬT THỂ QUA IP CAMERA (Trang 26 - 27)