3. Cấu trúc luận văn
2.3 Phƣơng pháp tra cứu lá cây sử dụng KDES cải tiến
Sơ đồ hệ thống tra cứu lá cây sử dụng KDES đƣợc trình bày trong hình 2.2. Hệ thống tra cứu lá cây đƣợc chia thành hai bƣớc lớn: Bƣớc 1 là biểu diễn lá cây; bƣớc 2 là nhận dạng lá cây.
- Bước 1. Biểu diễn lá cây: Đầu vào là ảnh lá cây đã đƣợc tách khỏi nền phức tạp sao cho ảnh chƣa toàn bộ lá cây, đồi thời chứa it nền nhất ( từ
nay gọi tắt là ảnh). Đầu ra là bộ mô tả ảnh lá cây (Vectơ đặc trƣng biểu diễn ảnh lá cây). Bƣớc này đƣợc chia thành các bƣớc con sau đây:
Hình 2.2: Sơ đồ hệ thống nhận dạng lá cây sử dụng KDES
+ Trích chọn đặc trƣng mức điểm ảnh: ở mức này, một vectơ gradient đƣợc tính cho mỗi điểm ảnh.
+ Trích chọn đặc trƣng mức patch: Ở mức này, đầu tiên chúng ta sinh ra các tập patch, sau đó tính toán đặc trƣng mức patch. Chúng ta sử dụng các patch với kích thƣớc thích nghi. Với cách sinh tập pacth với kích thƣớc thích nghi, số lƣợng patch đƣợc sinh ra là nhƣ nhau với các ảnh có kích thƣớc khác nhau. Phƣơng pháp này cũng giúp đặc trƣng mức patch it nhạy cảm hơn đối với sự thay đổi của kích thƣớc ảnh. Với mỗi patch chúng ta tính toán vectơ đặc trƣng nhƣ sau: với một patch, chúng ta tính một vectơ đặc trƣng dựa trên phƣơng pháp đã nêu trong [5]. Cụ thể, trƣớc tiên chúng ta tính hƣớng chính của patch, sau đó chuẩn hóa tất cả các vectơ gradient theo hƣớng chính này. Việc chuẩn hóa này giúp véctơ đặc trƣng mức patch bất biến với phép xoay.
+ Trích chọn đặc trƣng mức ảnh: Ở bƣớc này, các đặc trƣng mức patch đƣợc kết hợp để tạo ra đặc trƣng mức ảnh bằng cách sử dụng một cấu trúc Pyramid (Kim tự tháp). Với mỗi ảnh, véctơ đặc trƣng cuối cùng đƣợc tính toán dựa trên các véctơ đặc trƣng ở mức thấp hơn sử dụng EMK (Eficient Match Kernel [5]. Đầu tiên, chúng ta tính toán véctơ đặc trƣng cho mỗi ô (cell) của cấu trúc Pyramid, sau đó nối các véctơ đặc trƣng của các ô này lại với nhau để thu đƣợc véctơ đặc trƣng cuối cùng
- Bước 2: Nhận dạng lá cây: Ta đi tính khoảng cách từ ảnh truy vấn đến các lớp. Sau khi lá cây đƣợc biểu diễn bởi một véctơ đặc trƣng, ta có thể sử dụng một phƣơng pháp nào đó để tính toán khoảng cách từ ảnh truy vấn đến các lớp. Ở đây chúng ta sử dụng máy véctơ hõ trợ nhiều lớp (Multi-class support vector machine – MSVM)
Phần tiếp theo trình bày chi tiết các bƣớc tính toán véctơ đặc trƣng.