5. Nội dung nghiên cứu
2.4.2. Khâu trích lọc các đặc trưng
Để trích lọc ra được các giá trịđặc trưng từ một ảnh đầu vào thì máy tính phải thực hiện qua 4 bước sau:
Sắp xếp các tính năng và hình ảnh
Nhân từng pixel (điểm ảnh) hình ảnh với pixel tính năng tương ứng
33
Chia tổng cho tổng số pixel trong tính năng
2.4.2.1. Tạo biểu đồ đặc trưng
Đầu tiên bức ảnh được đưa qua phần mềm xử lý ảnh để lấy biểu đồ đặc trưng (Hình 2.10b), bộ lọc (Hình 2.10a), giá trị sau nhân chập bộ lọc với biểu đồ đặc trưng của ảnh đầu vào (Hình 2.10c)
Hình 2.10: Thực hiện việc nhân chập các giá trị pixel đầu vào với pixel tính năng: a) bộ lọc; b) biểu đồ đặc trưng của ảnh; c) giá trị đặc trưng
Sau khi thực hiện việc nhân chập tất cả các giá trị pixel của bộ lọc với các giá trị pixel của biểu đồ đặc trưng thì ta thu được kết quả như Hình 2.11 sau:
Hình 2.11: Kết quả sau khi nhân chập giữa bộ lọc với biểu đồđặc trưng
Sau khi có kết quả nhân chập như Hình 2.11 thì ta thực hiện bước tính tổng các giá trị pixel rồi chia chô tổng số pixel. Khi điều đó được thực hiện, giá trị cuối cùng thu được được đặt ở trung tâm của hình ảnh được lọc như Hình 2.12:
34 Hình 2.12: Giá trị đặc trưng thu được sau nhân chập
Tương tự, chúng ta có thể di chuyển bộ lọc này xung quanh và làm tương tự tại bất kỳ pixel nào trong ảnh. Để rõ ràng hơn, hãy xem Hình 2.13 và Hình 2.14 sau:
Hình 2.13: Kêt quả sau nhân chập và tính giá trị đặc trưng
35 Như vậy, chúng ta di bộ lọc đến mọi vị trí khác trong hình ảnh và xem tính năng này khớp với khu vực đó như thế nào. Vì vậy, sau khi làm điều này, chúng ta sẽ nhận được đầu ra như Hình 2.15 (hay bản đồđặc trưng sau tích chập):
Hình 2.15: Biểu đồ đặc trưng sau trích lọc
2.4.2.2. Tạo véctơ đặc trưng
Từ biểu đồ đặc trưng ta cho qua hàm kích hoạt (ReLU) như sau:
𝑓(𝑥) = {0 𝑖𝑓 𝑥 < 0𝑥 𝑖𝑓 𝑥 ≥ 0 ( 2.1) Mục đích chính là loại bỏ tất cả các giá trị âm khỏi nhân chập. Tất cả các giá trị dương vẫn giữ nguyên nhưng tất cả các giá trị âm được thay đổi thành 0 như Hình 2.16 sau:
36 Vậy kết quả thu được sau khi cho toàn bộ biểu đồ đặc trưng qua hàm kích hoạt như Hình 2.17:
Hình 2.17: Biểu đồ đặc trưng thu được sau khi cho qua hàm kích hoạt
Tương tự, ta thực hiện cho tất cả các biểu đồ tính năng khác kết quả thu được như sau:
Hình 2.18: Kết quả đặc trưng thu được với ảnh RGB đưa vào để nhận dạng Từ kết quả tại Hình 2.18 sẽ cho qua phép gộp lấy giá trị lớn nhất (max pooling) như Hình 2.19 sau:
37 Hình 2.19: Thực hiện phép gộp lấy giá trị lớn nhất
Mục tiêu của bước này là giảm bớt kích thước cho đầu ra, từ biểu đồ đặc trưng có kích thước 7x7, qua phép gộp này thì thu được biểu đồđặc trưng có kích thước 4x4 như Hình 2.20.
Hình 2.20: Kết quả thu được sau khi thực hiện max pooling
Thực hiện xếp chồng các lớp để giảm kích thước đầu ra mong muốn như Hình 2.21 và Hình 2.22 sau:
38 Hình 2.21: Kích thước đầu ra 4x4 khi cho qua một lớp ẩn
Hình 2.22: Kích thước đầu ra 2x2 khi cho qua hai lớp ẩn
Kết quả cuối cùng sẽ cho qua một lớp kết nối toàn cục và cho qua phần mềm tạo ra một véctơ đặc trưng như Hình 2.23 sau:
39 Hình 2.23: Tạo véc tơ đặc trưng cho đối tượng