Khâu trích lọc các đặc trưng

Một phần của tài liệu Đề tài nghiên cứu ứng dụng thuật toán mạng nơ ron tích chập nhận dạng các đối tượng di động (Trang 47 - 54)

5. Nội dung nghiên cứu

2.4.2. Khâu trích lọc các đặc trưng

Để trích lọc ra được các giá trịđặc trưng từ một ảnh đầu vào thì máy tính phải thực hiện qua 4 bước sau:

 Sắp xếp các tính năng và hình ảnh

 Nhân từng pixel (điểm ảnh) hình ảnh với pixel tính năng tương ứng

33

 Chia tổng cho tổng số pixel trong tính năng

2.4.2.1. Tạo biểu đồ đặc trưng

Đầu tiên bức ảnh được đưa qua phần mềm xử lý ảnh để lấy biểu đồ đặc trưng (Hình 2.10b), bộ lọc (Hình 2.10a), giá trị sau nhân chập bộ lọc với biểu đồ đặc trưng của ảnh đầu vào (Hình 2.10c)

Hình 2.10: Thực hiện việc nhân chập các giá trị pixel đầu vào với pixel tính năng: a) bộ lọc; b) biểu đồ đặc trưng của ảnh; c) giá trị đặc trưng

Sau khi thực hiện việc nhân chập tất cả các giá trị pixel của bộ lọc với các giá trị pixel của biểu đồ đặc trưng thì ta thu được kết quả như Hình 2.11 sau:

Hình 2.11: Kết quả sau khi nhân chập giữa bộ lọc với biểu đồđặc trưng

Sau khi có kết quả nhân chập như Hình 2.11 thì ta thực hiện bước tính tổng các giá trị pixel rồi chia chô tổng số pixel. Khi điều đó được thực hiện, giá trị cuối cùng thu được được đặt ở trung tâm của hình ảnh được lọc như Hình 2.12:

34 Hình 2.12: Giá trị đặc trưng thu được sau nhân chập

Tương tự, chúng ta có thể di chuyển bộ lọc này xung quanh và làm tương tự tại bất kỳ pixel nào trong ảnh. Để rõ ràng hơn, hãy xem Hình 2.13 và Hình 2.14 sau:

Hình 2.13: Kêt quả sau nhân chập và tính giá trị đặc trưng

35 Như vậy, chúng ta di bộ lọc đến mọi vị trí khác trong hình ảnh và xem tính năng này khớp với khu vực đó như thế nào. Vì vậy, sau khi làm điều này, chúng ta sẽ nhận được đầu ra như Hình 2.15 (hay bản đồđặc trưng sau tích chập):

Hình 2.15: Biểu đồ đặc trưng sau trích lọc

2.4.2.2. Tạo véctơ đặc trưng

Từ biểu đồ đặc trưng ta cho qua hàm kích hoạt (ReLU) như sau:

𝑓(𝑥) = {0 𝑖𝑓 𝑥 < 0𝑥 𝑖𝑓 𝑥 ≥ 0 ( 2.1) Mục đích chính là loại bỏ tất cả các giá trị âm khỏi nhân chập. Tất cả các giá trị dương vẫn giữ nguyên nhưng tất cả các giá trị âm được thay đổi thành 0 như Hình 2.16 sau:

36 Vậy kết quả thu được sau khi cho toàn bộ biểu đồ đặc trưng qua hàm kích hoạt như Hình 2.17:

Hình 2.17: Biểu đồ đặc trưng thu được sau khi cho qua hàm kích hoạt

Tương tự, ta thực hiện cho tất cả các biểu đồ tính năng khác kết quả thu được như sau:

Hình 2.18: Kết quả đặc trưng thu được với ảnh RGB đưa vào để nhận dạng Từ kết quả tại Hình 2.18 sẽ cho qua phép gộp lấy giá trị lớn nhất (max pooling) như Hình 2.19 sau:

37 Hình 2.19: Thực hiện phép gộp lấy giá trị lớn nhất

Mục tiêu của bước này là giảm bớt kích thước cho đầu ra, từ biểu đồ đặc trưng có kích thước 7x7, qua phép gộp này thì thu được biểu đồđặc trưng có kích thước 4x4 như Hình 2.20.

Hình 2.20: Kết quả thu được sau khi thực hiện max pooling

Thực hiện xếp chồng các lớp để giảm kích thước đầu ra mong muốn như Hình 2.21 và Hình 2.22 sau:

38 Hình 2.21: Kích thước đầu ra 4x4 khi cho qua một lớp ẩn

Hình 2.22: Kích thước đầu ra 2x2 khi cho qua hai lớp ẩn

Kết quả cuối cùng sẽ cho qua một lớp kết nối toàn cục và cho qua phần mềm tạo ra một véctơ đặc trưng như Hình 2.23 sau:

39 Hình 2.23: Tạo véc tơ đặc trưng cho đối tượng

Một phần của tài liệu Đề tài nghiên cứu ứng dụng thuật toán mạng nơ ron tích chập nhận dạng các đối tượng di động (Trang 47 - 54)

Tải bản đầy đủ (PDF)

(80 trang)