Học tính năng nhỏ gọn

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu phát triển hệ thống tra cứu các loài thực vật quý hiếm tại khu bảo tồn thiên nhiên na hang tỉnh tuyên quang​ (Trang 27 - 31)

3. Cấu trúc luận văn

2.2.2 Học tính năng nhỏ gọn

Kernel tƣơng ứng cung cấp một cách nguyên tắc để đo lƣờng sự giống nhau của các bản vá hình ảnh, nhƣng việc đánh giá các Kernel có thể tốn kém về mặt tính toán khi số lƣợng hình ảnh lớn. Vì hiệu quả tính toán và để thuận tiện cho việc biểu diễn, em trình bày một cách tiếp cận để trích xuất các tính năng kích thƣớc thấp nhỏ gọn từ các kernel tƣơng ứng: (1) lấy mẫu các vectơ cơ sở với độ dài và cƣờng độ tƣơng đƣơng nhau từ vùng hỗ trợ để đảm bảo xấp xỉ chính xác tƣơng ứng với các kernel; (2) tìm hiểu các vectơ cơ sở bằng cách sử dụng phân tích thành phần chính của kernel; Một lợi thế quan trọng của phƣơng pháp này là không có cực tiểu cục bộ nào đƣợc tham gia, không giống nhƣ phân rã giá trị số ít kernel ràng buộc.

Dƣới đây là mô tả cách các tính năng không gian thu nhỏ đƣợc trích xuất từ kernel gradient Kgrad. Các tính năng cho các kernel khác có thể đƣợc tạo ra theo cùng một cách. Các kernel trong phƣơng trình

(2.5)

là sản phẩm bên trong

(2.6)

Qua đó, chúng ta có thể rút ra tính năng sau trên các bản vá hình ảnh:

Với là kết quả của Kronecker. Từ đó, có thể chỉ ra rằng . Bởi vì chúng tôi sử dụng Gaussian kernel, là một vectơ vô hạn.

Một cách đơn giản để giảm kích thƣớc là lấy mẫu các bản vá hình ảnh đủ từ hình ảnh đào tạo và thực hiện KPCA cho các kernel phù hợp. Tuy nhiên, cách tiếp cận nhƣ vậy làm cho các tính năng đã học phụ thuộc vào nhiệm vụ trong tay. Hơn nữa, KPCA có thể trở nên không thể tính toán đƣợc khi số lƣợng bản vá rất lớn.

Ở đây trình bày một cách tiếp cận để kết hợp gần đúng kernels trực tiếp mà không yêu cầu bất kỳ hình ảnh. Theo phƣơng pháp cổ điển, máy học chiều hữu hạn các tính năng bằng cách chiếu F grad ( P ) vào một tập các vectơ cơ sở. Một vấn đề quan trọng trong quá trình chiếu này là cách chọn một tập các vectơ cơ sở làm cho kernel có chiều hữu hạn gần đúng kernel ban đầu. Vì các thuộc tính pixel là các vectơ có chiều thấp, chúng ta có thể đạt đƣợc rất tốt xấp xỉ bằng cách lấy mẫu các vectơ cơ sở đủ bằng cách sử dụng lƣới mịn trên vùng hỗ trợ. Ví dụ, hãy xem xét Gaussian kernel

định hƣớng trên gradient. Cho một tập các vectơ cơ sở

với là mẫu vectơ gradient chuẩn hóa, ta có thể tính gần đúng một vectơ vô hạn bằng cách chiếu vào không gian đƣợc kéo dài bởi tập hợp các vectơ cơ sở này. Một quy trình nhƣ vậy tƣơng đƣơng với việc sử dụng hạt nhân có giới hạn:

Với là một vectơ , là một ma trận với , và . Biểu đồ tính năng kết quả bây giờ chỉ có 1 chiều. Theo cách tƣơng tự, chúng ta cũng có thể tính gần đúng các hạt nhân và .

Hình 2.1 : Xấp xỉ hữu hạn chiều.

Bên trái: kernel định hướng và xấp xỉ chiều hữu hạn của

nó. γo được đặt thành 5 (như được sử dụng trong các thí nghiệm) và được cố định thành [1 0]. Tất cả các đường cong hiển thị giá trị kernel là các hàm của . Đường màu đỏ là hàm ground truth kernel ko, và các đường màu đen, xanh lá cây và xanh dương là các kernel xấp xỉ hữu hạn với các kích thước lưới khác nhau.

Phải: lỗi bình phương trung bình gốc (RMSE) giữa xấp xỉ KPCA và kernel tương ứng như là một hàm của thứ nguyên. Tính toán RMSE trên 10000 điểm dữ liệu được lấy mẫu ngẫu nhiên. Ba dòng hiển thị RMSE giữa các hạt nhân Kgrad (màu đỏ) và Kcol (màu xanh) và Kshape (màu xanh lá cây) và kernel gần đúng tương ứng của chúng.

Tính năng chiều hữu hạn cho gradient kernel là

quả nhƣ các tính năng trên các bản vá hình ảnh. Kết quả đƣợc xác nhận nhƣ trong hình 2.1. Kết quả nhƣ mong đợi, lỗi xấp xỉ giảm nhanh chóng khi tăng kích thƣớc lƣới. Khi kích thƣớc lƣới lớn hơn 16, kernel hữu hạn và kernel ban đầu hầu nhƣ không thể phân biệt đƣợc. Đối với hình dạng kernel trên các mẫu nhị phân cục bộ, vì các biến là nhị phân, chúng ta chỉ cần chọn tập hợp tất cả các vectơ cơ sở 28

= 256 và do đó không có lỗi xấp xỉ nào đƣợc đƣa ra.

Tính năng nhỏ gọn. Mặc dù là chiều hữu hạn, nhƣng chiều có thể tăng do sản phẩm Kronecker. Ví dụ, hãy xem xét bộ mô tả kernel hình dạng: kích thƣớc của vectơ cơ sở trên kernel là 256; Nếu chúng ta chọn các vectơ cơ sở của hạt nhân vị trí trên lƣới thông thƣờng 5 x 5, thì chiều của mô tả nhân hình dạng kết quả Fshape sẽ là 256 x 25 = 6400, quá cao cho các mục đích thực tế. Lấy mẫu thống nhất dày đặc dẫn đến xấp xỉ chính xác nhƣng không đảm bảo tính trực giao của các vectơ cơ sở, do đó đƣa ra sự dƣ thừa. Kích thƣớc của vectơ cơ sở có thể đƣợc giảm thêm bằng cách thực hiện phân tích thành phần chính của kernel trên các vectơ cơ sở chung: với là các vectơ cơ sở cho vị trí kernel và là số lƣợng vectơ cơ sở. Thành phần chính của kernel -th có thể đƣợc viết là:

(2.9)

trong đó và là kích thƣớc của vectơ cơ sở cho hạt nhân định hƣớng và vị trí, và đƣợc học thông qua phân tích thành phần chính của hạt nhân: với là một ma trận hạt nhân trung tâm với :

(2.10)

Nhƣ thể hiện trong hình 2.1, các kernel tƣơng ứng có thể đƣợc xấp xỉ khá chính xác bằng cách sử dụng các vectơ cơ sở rút gọn của KPCA. Trong khuôn khổ phân tích thành phần chính của kểnl, bộ mô tả kernel gradient có dạng:

(2.11) Tóm lại, việc trích xuất các bộ mô tả kernel là để đánh giá hàm kernel

giữa các pixel. May mắn thay, chúng ta có thể tính riêng hai giá trị hạt nhân với chi phí + , thay vì . Bộ mô tả hạt nhân đắt nhất của chúng ta, hạt nhân hình dạng, mất khoảng 4 giây trong MATLAB để tính toán trên một hình ảnh điển hình (độ phân giải 300 x 300 và 16 x 16 bản vá hình ảnh trên lƣới 8x8).

Đó là khoảng 1,5 giây cho bộ mô tả kernel gradient, so với khoảng 0,4 giây cho SIFT trong cùng một cài đặt. Việc triển khai dựa trên GPU hiệu quả hơn chắc chắn sẽ giảm thời gian tính toán cho các bộ mô tả kernel sao cho các ứng dụng thời gian thực trở nên khả thi.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu phát triển hệ thống tra cứu các loài thực vật quý hiếm tại khu bảo tồn thiên nhiên na hang tỉnh tuyên quang​ (Trang 27 - 31)

Tải bản đầy đủ (PDF)

(75 trang)