Kiến trúc mạng MobilenetV2

Một phần của tài liệu Xây dựng hệ thống tra cứu thực vật rừng tại thành phố đà nẵng ứng dụng mô hình học sâu (Trang 31 - 33)

6. Dàn ý nội dung chính

1.3 Mạng học sâu

1.3.3 Kiến trúc mạng MobilenetV2

MobileNet là một mơ hình xương sống để khai thác tính năng đã được sử dụng rộng rãi về mặt lý thuyết và thực tế. Hơn nữa, nó có một hiệu suất hiện đại cho đối tượng phát hiện và phân đoạn ngữ nghĩa. Trong mơ hình MobileNet [19], chiều sâu phân tách Convolution có thể làm giảm đáng kể kích thước mơ hình và độ phức tạp của mạng, được áp dụng cho điện thoại di động và các thiết bị có cơng suất tính tốn thấp. So với mơ hình MobileNetV1, Mơ hình MobileNetV2 có mơ-đun tốt hơn với cấu trúc phần dư đảo ngược và khơng có bất tuyến tính trong các lớp hẹp.

Sử dụng các hệ số chiều rộng và độ phân giải đầu vào khác nhau, mơ hình MobileNetV2 hoạt động tốt hơn MobileNetV1, trong khi nó có chi phí tính tốn và kích thước mơ hình tương đương. Hơn thế nữa, mơ hình MobileNetV2, có hệ

số nhân chiều rộng là 1,4, hoạt động tốt hơn với suy luận nhanh hơn thời gian hơn ShuffleNet (× 2) và NASNet [45]. Do đó, mơ hình MobileNetV2 là một mơ hình trích xuất đặc trưng để phát hiện và phân đoạn đối tượng [23].

Hình 1.3.3-1. Khối chuyển đổi mơ hình MobileNetV2

Trong kiến trúc MobileNetV2 [23], như được chỉ ra trong Hình 1.3.3-1,

có hai loại khối: một khối dư có bước sóng là 1 và một khối khác có bước sóng là 2 để giảm kích thước. Cả hai loại khối đều có ba lớp, bao gồm một tích chập 1 × 1 với ReLU6 trong lớp đầu tiên, lớp thứ hai chứa tích chập theo chiều sâu và một phép chập 1 × 1 khác mà khơng có tính phi tuyến tính trong lớp thứ ba. Đầu vào, toán tử, và đầu ra của mỗi lớp được thể hiện trong Hình 1.3.3-1. [22]

Hình 1.3.3-2. Ba lớp của MobileNetV2

Trong Hình 1.3.3-2, t = 6 cho tất cả các thí nghiệm và t đóng góp như một hệ số mở rộng. Nếu có 64 kênh trong đầu vào, đầu ra bên trong sẽ chứa 64 × t = 64 × 6 = 384 kênh. Người ta cho rằng nếu ReLU được tái sử dụng, các mạng sâu sẽ có sức mạnh tương tự bộ phân loại tuyến tính trên một phần khối lượng khác 0 của miền đầu ra. [45]

Hình 1.3.3-3. Mơ hình kiến trúc tổng thể của MobileNetV2.

Hình 1.3.3-3. minh họa kiến trúc tổng thể của MobileNetV2 [22], trong

đó c là số lượng các kênh đầu ra, n là số lặp lại, s là bước sóng và hạt nhân 3 × 3 sử dụng cho tích chập khơng gian. Thơng thường, mạng chính, có hệ số chiều rộng 1, 224 × 224, sử dụng 3,4 triệu tham số và có chi phí tính tốn là 300 triệu nhân lên thêm. Trong khi kích thước mơ hình dao động trong khoảng 1,7 triệu đến 6,9 triệu tham số, chi phí mạng tính tốn chỉ đạt dưới 585 triệu MAdds.

Một phần của tài liệu Xây dựng hệ thống tra cứu thực vật rừng tại thành phố đà nẵng ứng dụng mô hình học sâu (Trang 31 - 33)

Tải bản đầy đủ (PDF)

(101 trang)