1. Trang chủ
  2. » Tất cả

Đánh giá các phương pháp tìm đường bao cho ảnh màu RGB

16 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 16
Dung lượng 2,64 MB

Nội dung

KHOA HỌC KỸ THUẬT ĐÁNH GIÁ CÁC PHƯƠNG PHÁP TÌM ĐƯỜNG BAO CHO ẢNH MÀU RGB • LÊ THỊ BẢO TRÂN TÓM TẮT Bài toán tìm đường bao là một vấn đề cơ bản được nghiên cứu sâu rộng trong lĩnh vực thị giác máy nói[.]

KHOA HỌC-KỸ THUẬT ĐÁNH GIÁ CÁC PHƯƠNG PHÁP TÌM ĐƯỜNG BAO CHO ẢNH MÀU RGB • LÊ THỊ BẢO TRÂN TĨM TẮT: Bài tốn tìm đường bao vấn đề nghiên cứu sâu rộng lĩnh vực thị giác máy nói chung Đường bao có nhiều khái niệm khác cách tiếp cận khác Bài viết phân tích đánh giá phương pháp tìm đường bao tiên tiến, gồm: Mạng tích chập mã hóa giải mã tìm đường bao (Conolutional Encoder Decoder Network - CEDN) [7] Mạng tinh lọc đường bao (RefineContourNet - RCN) [1] Đây cách tiếp cận với kiến trúc mạng khác nhau: CEDN sử dụng kiến trúc Fully Convolutional Network- FCN [6], RCN sử dụng kiến trúc Residual Network [8] RCN để làm rõ cách thức triển khai đánh giá dựa độ đo khác bao gồm Precesion-Recall, đường cong PR, đường cong ROC, AOC F-measure Từ cung cấp nhìn tổng quan hiệu năng, hiệu phương pháp cách lựa chọn phù hợp phương pháp cho ứng dụng khác Từ khóa: đường bao, mạng tích chập, CEDN, RCN Đặt vấn đề Khác với ảnh chụp từ phim hay thiết bị thu nhận ánh sáng tương tự phim, ảnh lưu trữ thiết bị điện tử hay máy tính ảnh kỹ thuật số Ánh kỹ thuật số loại tín hiệu rời rạc với hữu hạn mẫu thay loại tín hiệu tương tự ảnh phim, thiết bị điện tử khơng có khả lưu trữ vơ hạn mẫu Đê’ tránh gây nhầm lẫn, ảnh đề cập khóa luận ảnh kỹ thuật số, ảnh kỹ thuật số gọi ảnh tương tự hay ảnh màu tương tự Phần nhằm cung cấp khái niệm liên quan đến ảnh, thành phần cấu tạo, cách ảnh hoạt động ảnh ảnh màu RGB - đầu vào thuật tốn phân tích Nội dung nghiên cứu Điểm ảnh thành phần tách rời ảnh kỹ thuật số Đây khối đơn vị xây dựng lên ảnh Mọi ảnh kỹ thuật số tập hợp điểm ảnh Thông thường điểm ảnh biểu diễn cho màu sắc độ sáng vị trí ảnh Nếu coi ảnh lưới tọa độ điểm ảnh vng đơn vị Một ảnh có độ phân giải 1.920 X 1.080, có nghĩa có 1.920 điểm ảnh theo chiều ngang 1080 điểm ảnh theo chiều dọc Một ảnh biểu diễn dạng ma trận, ma trận có 1.920 cột 1.080 hàng Sau cùng, ảnh có 1920 X 1080 = 2.073.600 điểm ảnh số 15 - Tháng Ĩ/2022 65 TẠP CHI CƠNG IHIÍÍN6 Một điểm ảnh biểu diễn theo cách mức xám màu sắc (đa kênh) Đối với ảnh mức xám, điểm ảnh mang giá trị hay vô hướng đại diện cho độ xám với khoảng giá trị từ đến 255 Trong đó, biểu diễn cho cường độ sáng thấp hay màu đen 255 biểu diễn cho cường độ sáng cao hay màu trắng Trong thực tế, ảnh tiền xử lý qua bước chuẩn hóa co giãn dẫn đến việc điểm ảnh cần chuyển đổi qua kiểu liệu số thực Do 2.2 Khái niệm cấu tạo mạng tích chập Tích chập khái niệm xử lý tín hiệu số nhằm biến đổi thơng tin đầu vào thơng qua phép tích chập với lọc để trả đầu tín hiệu Tín hiệu làm giảm đặc trưng mà lọc không quan tâm giữ đặc trưng Hình 1: Phép tích chập ma trận chiều đó, thư viện Pytorch hay Tensorflow cần cài đặt chuyển đổi kiểu liệu trước áp dụng thuật toán trực tiếp lên ảnh Mỗi màu khác tổ hợp giá trị khác kênh RGB Khi giá trị lớn điểm ảnh gần với màu trắng, ngược lại giá trị kênh bé điểm ảnh tơi tiến đến màu đen Khơng gian màu RGB biểu diễn dạng khối lập phương Khi đó, thể tích khơi lập phương tồn khơng gian màu RGB biểu diễn với số lượng màu biểu diễn 256 X 256 X 256 = 16.777.216 màu Ánh màu khơng gian màu RGB có nhược điểm bao gồm: • Khó khăn việc định nghĩa khơng sử dụng bảng chọn màu • Khơng dựa chế tiếp nhận màu mắt người Mặc dù vậy, hầu hết ảnh lưu trữ xử lý máy tính thuộc khơng gian màu RGB tính đơn giản, hữu dụng phổ biến 2.1 Tổng quan Độ phân giải Độ phân giải mô tả nhiều dạng khác tùy theo mục đích kỹ thuật sử dụng Các dạng độ phân giải bao gồm: Số lượng điểm ảnh Khái niệm độ phân giải tương đương với số lượng điểm ảnh ảnh kỹ thuật số Đây dạng thông dụng độ phân giải, dùng thông số máy ảnh kỹ thuật số thiết bị hiển thị Tông sô điểm ảnh tính tốn sơ” lượng điểm ảnh chiều dài chiều rộng Một ảnh có kích thước M X N tương ứng với việc có M X N điểm ảnh 6Ĩ SỐ 15-Tháng 6/2022 Nguồn: Tác giả tổng hợp Ma trận xanh lục kết phép tích chập Ma trận xanh lam ma trận chiều nguyên tính tích chập Ma trận màu xám ma trận lọc hay cửa sổ trượt Vùng ma trận có nét đát viên thêm vào ma trận nguyên để thực phép tích chập Trong học sâu, mạng tích chập lớp mạng mạng nơ ron học sâu Mạng tích chập sử dụng để phân tích trích chọn đặc trưng từ ảnh Mạng tích chập lấy cảm hứng từ hoạt động sinh học mắt não người Như trình bày trên, mạng tích chập mơ hình thị giác máy ưu việt, tin cậy Bên cạnh việc có hiệu cao, mạng tích chập cịn mạng hiệu tính tốn địi hỏi tham sơ” dễ thực thi Mạng tích chập câ”u thành lớp tích chập, bản, lớp tích chập có ngun lý giơng với lọc tích chập mơ hình xử lý ảnh đơn giản Theo trực quan, KHOA HỌC-KỸ THUẬT lớp tích chập sử dụng cửa sổ ma trận trượt đến lớp cuối lớp kết nối đầy đủ để đưa xác suất (sliding window) áp đặt lên ma trận xem Ma trận xanh lục kết phép tích chập Ma trận lớp cho ảnh • Truyền ngược Tính tốn kết hàm thất xanh lam ma trận chiều ngun tính kết cuối nhãn có sẵn Kết hàm thất thoát truyền ngược trở lại để cập tích chập Ma trận màu xám ma trận lọc hay cửa sổ trượt Vùng ma trận có nét đứt viền nhật thông số cho lớp kết nối đầy đủ tích thêm vào ma trận nguyên để thực phép chập tích chập Cửa sổ trượt phép tích chập Các thơng số cập nhật để tối thiểu hóa hàm thất cố gắng tìm cách tối ưu lọc truyền thuận cho tập đặc trưng trích chọn theo thứ tự điểm ảnh thơ -> biên —> hình dạng -» kết cấu đặc trưng cấp độ cao hơn.3 Các phương pháp tìm đường bao Mạng tích chập mã hóa - giải mã đầy đủ dùng cho tìm đường bao (CEDN) Mạng CEDN đề xuất Jimei Yang đồng Trung tâm Nghiên cứu Adobe [7], gọi nhân lọc Bộ lọc trượt dần toàn ảnh vị trí tích vơ hướng tính vùng điểm ảnh nơi có lọc lọc Kết đầu ma trận có thành phần tích vơ hướng tính Kích thước đầu lớp tích chập xác định dựa kích thước ảnh đầu vào (Wl, Hl), kích thước lọc F, bước nhảy s độ rộng viền p (padding) Khi cơng thức tính kích thước đầu (W2, H2) cho lớp tích chập tính theo cơng thức: w2 = W1 + 2P-F +1 (2.1) H2 = H' + 2P~F +1 (2-2) Một mạng tích chập có cấu tạo gồm thành phần chính: Các lớp tích chập thành phần cốt lõi mạng tích chập, có nhiệm vụ trích chọn thơng tin thông qua kết nối cục lớp tích chập liên tiếp • Hàm Relu hay hàm kích hoạt phi tuyến Phép tích chập trường hợp đặc biệt phép tuyến tính Do đó, hàm Relu sử dụng kết hợp với lớp tích chập để kích hoạt thơng tin trừu tượng, thành phần phi tuyến cho lớp tích chập phía sau • Lớp max pooling hay lớp lấy mẫu xuống Nhiệm vụ lớp loại bỏ thông tin nhiễu, dư thừa giữ lại thơng tin hữu ích • Lớp cuối lớp kết nôi đầy đủ Lớp kết nối đầy đủ tính tốn xác suất để phân ảnh vào lớp khác Trong mạng học sâu kế thừa từ mạng tích chập, mạng phân lớp thường xóa bỏ giữ lại lớp trích chọn đặc trưng phía Trong suốt q trình huấn luyện, mạng tích chập thực cơng việc: • Truyền thuận Ánh đưa qua mạng tích chập truyền qua lớp xi theo tồn mạng Mạng CEDN sử dụng kiến trúc mạng tích chập mã hóa giải mã đầy đủ cho nhiệm vụ tìm đường bao vật thể Giải thuật tập trung vào việc phát đường bao bậc cao Mạng CEDN huấn luyện với tập PASCAL voc 2012 điều chỉnh nhãn giúp độ xác tăng đáng kể so với giải thuật tìm đường bao trước 3.1 Kiến trúc mạng CED Mạng tích chập mã hóa - giải mã đầy đủ (CEDN) Giống với tên gọi, mạng CEND bao gồm nhánh mã hóa giải mã Nhánh mã hóa bao gồm lớp tích chập theo sau Relu lớp max-pooling Hình ảnh sau qua nhánh mã hóa trở thành tập đặc trưng Nhánh mã hóa bao gồm lớp tích chạp ngược (deconvolution) theo sau Relu lớp tăng mẫu (uppooling) Các tập đặc trưng từ nhánh mã hóa sau qua nhánh giải mã thu đầu ảnh có kích thước kích thước ban đầu Việc kết hợp hai loại mạng tích chập mạng tích chập đầy đủ mạng tích chập ngược, mạng CEDN thừa kế ưu điểm bù trừ hạn chế chúng Trong mạng tích chập đầy đủ hạn chế độ xác mạng tích chập ngược lại hạn chế với tập liệu chi phí tính tốn Nhánh mã hóa phần mạng VGG16 Mạng VGG16 loại bỏ lớp kết nối đầy đủ giữ lại tồn lớp tích chập phía làm SỐ 15-Tháng 6/2022 67 TẠP CHÍ CƠNG THƯƠNG Hình 2: Kiến trúc mạng tích chập CEDN Nguồn: Tác giả tổng hợp nhiệm vụ trích xuất ảnh thành tập đặc trưng Đầu vào ảnh RGB kênh, kết 4.096 kênh đặc trưng với kích thước kênh X Các thông số nhánh mã hóa thơng số tiền huấn luyện đóng băng tránh việc thơng số bị thay đổi q trình huấn luyện Có thể coi tốn tìm đường bao tốn phân lớp nhị phân, giá trị tương ứng với đường bao giá trị tương ứng với Khi cơng thức hàm cross-entropy cho tốn phân lớp nhị phân rút gọn thành: C-2 Mạng tích chập VGG16 mạng tích chập sở mạng CEDN Mạng VGG16 đề xuất CE = -^tiiogf(Si) K Simonyan A Zisserman đại học Oxford báo: "Very Deep Convolutional Networks for Large-Scale Image Recognition" [14] Mạng VGG16 đạt 92,7% top-5 độ xác với tập liệu ImageNet Nó mạng tiếng thi ILSVRC-2014 VGG16 cải tiến mạng AlexNet cách thay lọc kích thước lớn thành lọc kích thước 3x3 Mạng VGG16 huấn luyện thời gian tuần sử dụng Nvidia GPU Titan Black Mạng VGG16 tiền huấn luyện với Pytorch đạt kết tốt mang mã Vggl6-397923af.pth Hàm that thoát sử dụng hàm pixel-wise logistic Các hàm đề cập hàm MSE, MAE, cross-entropy có khả áp dụng cho cặp điểm ảnh ảnh dự đoán ảnh nhãn Theo cài đặt, tác giả sử dụng hàm cross-entropy Công thức hàm cross-entropy: = c í log f(si) CE = (3.1) i Trong ti si giá trị nhãn kết dự đoán cho lớp tập c Thơng thường hàm kích hoạt (sigmoid/ softmax) áp dụng cho kết dự đoán trước tính cross-entropy loss Cơng thức f (si) biểu diễn cho hàm kích hoạt 68 SỐ 15-Tháng 6/2022 (32) log/(«1) - (1 - í,) log (1 -/(«»)) Trọng số p thêm vào để cân chênh lệch lớn số lượng điểm đường bao Thông thường p gán 10 Bảng mô tả câu tạo chi tiết mạng CEDN, danh cách lớp mơ hình CEDN Chiều hoạt động nhánh mã hóa từ xuống nhánh giải mã từ lên 3.2 Kiến trúc mạng RCN (RefineContourNet) Mạng RCN đề xuất Andre Peter Kelm đồng đại học Helmut Schmidt, Đức 11], RCN mạng tích chập dựa mạng ResNet dùng cho nhiệm vụ tìm đường bao Nhờ khả sử dụng thông tin bậc cao cách hiệu ResNet giúp cho kết tìm đường bao RCN trở nên tốt Mạng RCN sử dụng đặc trưng cao điểm khởi đầu tổng hỢp theo lớp với đặc trưng bậc thấp bậc thấp Mạng RCN huấn luyện tập PASCAL voc 2012 cho nhiệm vụ xử lý ảnh đánh giá tập PASCAL val đạt hiệu cao với số ODS 0.752 (Hình 3) Kiến trúc tầng đặc trưng cấp thâ'p kết hợp với đặc trưng cấp cao đưa kết làm đầu vào cho tầng phía Mạng tích chập RCN phát triển dựa mạng sở mạng ResNet-101 Ngoài cấu tạo KHOA HỌC-KỸ THUẬT Bỏng 1: cấu tạo chi tiết mạng CEDN Hình 3: Kiến trúc mạng tích chập RCN CEDN Nhánh mã hóa Nhánh giải mã input (ảnh màu output (ảnh đơn RGB 224x224) kênh nhị phân) conv3-64 conv3-64 conv5-1 conv5-32 Maxpool unpool (a) RCU conv3-128 (c) CRP Nguồn: Tác giả tổng hợp v3-128 conv5-64 Maxpool unpool conv3-256 conv3-256 conv3-256 Maxpool conv5-128 unpool conv3-512conv3-512 conv3-512 conv5-256 unpool Maxpool conv3-512conv3-512 conv3-512 (b) MRF conv5-512 Maxpool unpool V1-4096 conv1-512 Tập hợp đặc trung 4096 chiểu Nguồn: Tác giả tổng hợp mạng sử dụng thêm khôi tích chập bao gồm RCU, MRF CRP xem Hình Các khối sử dụng để tổ hợp đặc trưng tầng thấp với đặc trưng tầng cao Khối RCU bao gồm lớp tích chập ResNet nhằm mục đích tăng cường số lượng tham số cho mạng [1], Các kết nối tắt (skip connections) khôi RCU giúp chép thông tin lớp tích chập nhằm hạn chế tượng biến bùng nổ đạo hàm số lượng lớp khối RCU điều chỉnh cho phù hợp với tầng kiến trúc mạng RCN Kết khối RCU sau vào khôi MRF điều chỉnh lần lớp tích chập nhằm mục đích đồng số chiều đặc trưng tầng thấp với tầng cao Sau đó, đặc trưng tăng mẫu cho kích thước với đặc trưng có độ phân giải cao tầng cao kết hợp lại với Các khối sử dụng để tổ hợp đặc trưng tầng thấp với đặc trưng tầng cao (Hình 4) Sau khỏi khối MRF, đặc trưng sau kết hợp đưa qua khối CRP để trích xuất nhiều thơng tin so với sử dụng lớp max pooling thông thường, cấu tạo khối CRP giống với cấu tạo lớp tích chập mạng tích chập Tuy nhiên, kết sau khỏi lớp max pooling lại kết hợp trở lại với đầu vào nhờ khối CRP có khả đem lại kết giàu ngữ nghĩa Ớ tầng cuối cùng, ảnh màu RGB gốc đưa qua khối RCƯ sử dụng đầu vào khơi MRF, đầu vào cịn lại tập đặc trưng sau qua tầng trước nhằm mục đích cải thiện chất lượng kết Đặc điểm kiến trúc tầng đặc trưng cấp thấp kết hợp với đặc trưng cấp cao đưa kết làm đầu vào cho tầng phía Q trình giơng với việc tinh lọc đặc trưng qua nhiều tầng, mạng tích chập gọi mạng tích chập tinh lọc đường bao (RefineContourN et) Mạng RCN phát triển dựa mạng sở mạng tích chập ResNet-101 Mạng ResNet đề xuất K He, X Zhang, S.Ren, J Sun số 15 - Tháng Ĩ/2Ũ22 69 TẠP CHÍ CĨNG THMG Hình 4: Các khối tích chập mạng RCN Microsoft báo "Deep Residual Learning for Image Recognition" [8] Mạng ResNet giành chiến thắng thi ILSVRC-2015 Đặc điểm mạng ResNet sử dụng kết nôi tắt số lớp giúp tránh vấn đề biến đạo hàm (vanishing gradient) mạng sâu vấn đề bão hòa độ xác mà độ xác khơng thể cải thiện thêm Mạng ResNet-101 huấn luyện thời gian tuần sử dụng NVIDIA GPU Titan Black Mạng ResNet-101 tiền huấn luyện với Pytorch đạt kết tốt mang mã resnet 101 -63fe2227.pth Giống với mạng CEDN, hàm thất thoát sử dụng cho mạng RCN hàm pixel-wise logistic 70 SỐ 15-Tháng Ó/2022 Thực nghiệm 4.1 Huấn luyện mơ hình học sâu tích chập có giám sát Huấn luyện mạng học sâu tích chập trình "dạy" mơ hình khả học đặc trưng từ liệu tập liệu huấn luyện có sẵn đưa kết giông với nhãn Quá trình gọi "có giám sát" để phân biệt với q trình huấn luyện khơng giám sát liệu huấn luyện nhãn cung cấp kiểm soát người nhằm phục vụ mục đích cụ thể Q trình huấn luyện gồm cơng việc lan truyền thuận lan truyền ngược Trong q trình truyền thuận, ảnh truyền qua tồn KHOA HỌC-KỸ THUẬT mạng tới lớp cuối để đưa kết Kết đưa qua hàm kích hoạt thấp khả mơ hình hóa cịn q khớp Softmax, Sigmoid để tính xác suất huấn luyện khiến cho độ xác tập kiểm tượng mơ hình hóa hàm số sát với tập Mt 1111111 Huyên Mn, Kì Quả li ự đốn Ihĩ ỉiàiĩl Do vậy, sơ' lần duyệt tẩn tee quan sát nhãn tính tốn khấc biệt thơng qua hàm thất Sự khác biệt sử dụng để cập nhật trọng sô' tồn mạng thơng qua phương pháp suy giảm đạo hàm trình lan truyền ngược Cơ chế cập nhật trọng số thiết kế để cố gắng tối ưu hóa lọc mạng tích chập Dữ liệu huấn luyện liệu tổng hợp gán nhãn người dùng để huấn luyện mơ hình học sâu tích chập có giám sát bản, liệu huấn luyện thường phân thành tập 4.2 Dữ liệu huân luyện kích thước lơ, số lần duyệt vịng lặp Kích thước lơ (batch size), số lần duyệt (epoch) vịng lặp (iteration) thông số sử dụng trình huấn luyện Chúng có khả giám sát thời gian huấn luyện, tài nguyên huấn luyện độ xác thất mơ hình học sâu tích chập Các ảnh đưa vào mạng dạng lơ ảnh nhằm tăng tốc cho q trình huấn luyện Kích thước lơ thơng số quy định kích thước, số lượng ảnh lơ hay số lượng mẫu ảnh huấn luyện đưa qua mơ hình q trình huấn luyện (lan truyền thuận lan truyền ngược) Một số ưu điểm sử dụng kích thước lơ nhỏ tốn tài nguyên nhớ thời gian huấn luyện nhanh so với dùng kích thước lơ lớn Tuy nhiên, kích thước lơ nhỏ khiến cho q trình xâp xỉ đạo hàm thiếu xác Do vậy, kích thước lô hay sử dụng 5, 8, 16 sô' mạng lớn tập liệu lớn 32 64 Một lần duyệt định nghĩa thời điểm toàn tập huấn luyện đưa qua mơ hình q trình huấn luyện lần số lượng lần duyệt sử dụng để kiểm sốt độ xác mơ hình tập huấn luyện tập kiểm thử Khi số lượng lần duyệt tăng, mơ hình có trạng thái từ không khớp (underfitting) đến khớp (good fitting) đến khớp (overfitting) Trong đó, khơng khớp tượng mơ hình đạt độ xác lựa chọn người tự động thuật toán phát không khớp khớp để đạt trạng thái khớp tốt Vịng lặp q trình lơ qua mơ hình lần q trình huấn luyện Khi đó, tổng số vịng lặp lần duyệt số lượng lô cần thiết để kết thúc lần duyệt Vịng lặp sử dụng giống với sô' lượng lần duyệt, ưu điểm vịng lặp kết thúc q trình huấn luyện sớm trước kết thúc lần duyệt Ta có tương quan số lượng ảnh tập hn luyện N, kích thước lơ batch_size tổng số vòng lặp total_iteration sau: Ạ) total-iteration = — (4.1) batch_size Tốc độ học, suy giảm đạo hàm thuật toán tối ưu Tham số tốc độ học (learning rate) sử dụng để điều chỉnh lượng thay đổi mơ hình cập nhật trọng số trình lan truyền ngược Mốì quan hệ tốc độ học suy giảm đạo hàm biểu diễn theo công thức: Xt+I = Xt-lr*-^-f(Xt) (4.2) Trong Xt tọa độ thời điểm t, Ir tốc độ học đạo hàm hàm số thời điểm t Khi tốc độ học nhỏ dẫn tới việc kéo dài trình huân luyện khiến trình huấn luyện bị nghẽn Ngược lại, tốc độ học lớn khiến cho trình cập nhật trọng số nhanh dẫn tới việc vượt qua cực trị tối ưu khiến cho trình huấn luyện ổn định Những điều khiến cho tốc độ học trở thành siêu tham số quan trọng cài đặt mơ hình học sâu tích chập Do đó, nhiều thuật tốn đời nhằm tối ưu việc chọn tốc độ học Đối với người, tốc độ học thường lựa chọn dựa kinh nghiệm với thơng số mơ hình, tập liệu nhiều điểu kiện khác Các giá trị tốc độ học hay dùng thực tế bội 10 Ví dụ: le -1, le-2, le-3, le-4 Có thể coi q trình suy giảm đạo hàm trình viên bi di chuyển tới vị trí thấp (cực SỐ 15-Tháng 6/2022 71 TẠP CHÍ CƠNG THƯƠNG trị tồn cục) khơng gian đồ thị hàm số xem đến đích cách thay đổi tốc độ học Việc thay Hình Trong CỊLtá trình di chuyển tới vị trí tháp đổi tốc độ học dựa theo nguyên lý khởi tạo tốc độ nhất, viên bi bị mắc kẹt rãnh hay học lớn lúc ban đầu vầ giảm dần ĂUống đích cực trị cục bộ, khơng thể tiếp xuống điểm Phương pháp sử dụng giải thuật Adagrad, Adagrad coi tốc độ học biến sơ' thấp đồ thị (Hình 5) Hình 5: Quá trình suy giảm đạo hờm thay đổi sau lần cập nhật trọng sô Công thức tốc độ học giải thuật Adagrad: G^G^ + g} (4.5) x x'-^r's- (4;6> Nguồn: Tác giả tổng hợp Để giải vấn đề trên, lúc khởi động viên bi truyền thêm vận tốc quán tính (momentum) Nhờ đó, viên bi xuống vị trí cực tiểu địa phương khơng bị mắc kẹt mà có khả tiếp tục di chuyển vượt qua tiến tới điểm Trong đó: Xt tọa độ thời điểm t; r| sô'là tốc độ học khởi đầu, tham sô' làm mượt tránh việc mẫu có giá trị 0; Gt ma trận đường chéo với phần tử đường chéo bình phương đạo hàm hàm sơ' thời điểm t Nhược điểm lớn phương pháp tiến gần đích, tốc độ học bé, khiến cho việc huấn luyện bị đóng băng, vấn đề xảy sau Gt lớn Do vậy, giải thuật RMSprop [5] khắc phục nhược điểm cách tính trung bình Gt sau bước cập nhật tốc độ học theo công thức: Gt — p * xí+1 = + (1 — xt - cực trị toàn cục Sự suy giảm đạo hàm sử dụng vận tốc quán tính thể công thức: V, = ỵ*v,.j + lr*-^—-f(Xt) 72 SỐ 15-Tháng Ĩ/2022 (4.7) n (4.8) \/Gt + f — -jy—-/(V'í-1) dXt-ì (4.3) xt+1 = xt-vt (4.4) Trong xt tọa độ thời điểm t, tham sô' Y thường chọn 0.9, vt vận tốc tại, V(_] vận tốc trước viên bi với v0 = 0, Ir tốc độ học độ dốc hay đạo hàm (gradient) hàm sô' thời điểm trước Tuy phương pháp có khả tối ưu kết suy giảm đạo hàm, nhược điểm thời gian huấn luyện lâu kể xuống vị trí thấp cần thời gian để ổn định tượng dao động qua lại quanh vị trí cực tiểu tồn cục qn tính Để tăng tốc cho q trình trượt xuông dốc hạn chê' việc dao động không cần thiết xuống p} * Ól m' ỉ-à _ 02Vt-i + (1 -&)(gt)2 Vt~ 1-$ Xt = xt_i - TỊ * mt y/ĩh + f (4.9) (4.10) (4.11) (4.12) Trọng sô' p thường chọn 0.9 Sự thay đổ tốc độ học giống với thay đổi lực ma sát tác động lên viên bi Khi bắt đầu lăn dốc, ma sát bé viên bi lăn với tốc độ cao Khi hết dốc, ma sát tăng dần giúp hạn chê việc dao động qua lại Cuối cùng, cách kết hợp phương pháp KHOA HỌC-KỸ THUẬT vận tốc - quán tính phương pháp RMSprop, giải liệu, tập trainval sử dụng để huấn thuật Adam [10] xuất sử dụng phổ biến Giải thuật Adam kết hợp luyện mơ hình Ánh đánh nhãn phân vùng ảnh đơn kênh gồm nhiều giá trị, giá trị màu sắc ưu điểm giải thuật sử dụng vận tốc qn tính RMSprop khiến trở thành giải thuật nhanh tối ưu thời điểm Các công thức từ (4.8) đến (4.11) cơng thức giải thuật Adam Trong gt đạo hàm thời điểm t, mt giống với phương pháp vận tốc - quán tính đại lượng đà (momentum) thêm vào, vt giống với RMSprop đại lượng biến đổi tốc độ học, sốpi, 02 r| chọn từ trước 4.3 Tập liệu Tập liệu Pascal voc sử dụng cho thi nhận diện vật thể theo nhiều lớp ảnh thực tế [13] Tập gồm 20 lớp phân thành nhóm chính, gồm: • Người (1 lớp) • Động vật (6 lớp) • Phương tiện giao thơng (7 lớp) • Đồ vật (6 lớp) Dành cho nhiệm vụ chính, bao gồm: • Phân lớp vật thể (classification) • Phát vật thể (detection) • Phân vùng (segmentation) • Phân lớp hành động (action classification) • Nhận diện (recognition) Tập Pascal VOC2012 mắt năm 2012 gồm phần: (i) phần bao gồm tập huấn luyện tập xác thực với nhãn tương ứng (ii) phần bao gồm tập kiểm thử nhãn Bài lốn phát đương bao huấn luyện tập liệu dành cho nhiệm vụ phân vùng Tập ảnh dùng cho phân vùng giông với tập dành cho phân lớp tập huấn luyện tập xác thực Tập trainval tổng hợp tập huân luyện tập xác thực với 10.000 ảnh chất lượng cao đánh nhãn Hariharan đồng Tập trainval bao gồm 12.031 ảnh, ảnh thực tế nằm thư mục JPEGI mages ảnh đánh nhãn phân vùng nằm thư mục Segmentationclass (dành cho phân vùng lớp) SegmentaionObject (dành cho phân vùng vật thể) Do tốn tìm đường bao yêu cầu khôi lượng lớn gán cho 21 lớp Các ảnh phân vùng sử dụng phần mở rộng bao gồm jpg, jpeg png Do loại phần mở rộng khiến việc đọc nhãn gặp nhiều sai sót phức tạp Vì vậy, để tăng cường độ xác cho nhãn tốn phát đường bao, ảnh đánh nhãn Pascal VOC2012 khơng sử dụng, thay vào tập nhãn Pascal-Context Tập nhãn Pascal-Context tập nhãn cập nhật thêm cho tập Pascal VOC2012 Tập bao gồm 12.031 tập tin matlab đánh mã số tương tự với mã số tập ảnh thực tế Dung lượng tập ảnh Pascal VOC2012 1.3G tập Pascal-Context 30.7MB Để sinh nhãn cho tốn tìm đường bao, ảnh nhãn dùng cho nhiệm vụ phân vùng trải qua bước tiền xử lý Trước đưa qua bước tiền xử lý, ảnh nhãn lưu trữ tệp matlab chứa mã số tương ứng với ảnh gốc Ảnh nhãn ma trận đơn kênh chứa nhiều giá trị với giá trị tương ứng với lớp 21 lớp PASCAL voc Ví dụ: giá trị màu xanh biểu diễn cho xe đạp, giá trị màu hồng biểu diễn cho người (Xem Hình 6) Để chuyển đổi từ nhãn phân vùng thành nhãn đường bao, giải thuật tiền xử lý duyệt qua toàn điểm ảnh ảnh nhãn Tại vị trí, giá trị điểm ảnh so sánh với giá trị điểm ảnh lân cận địa phương Trong trường hơp giá trị điểm ảnh không trùng khớp với giá trị điểm ảnh xét giá trị điểm ảnh địa phương điểm ảnh xét cập nhật giá trị 1, tương ứng với giá trị nhãn đường bao Ngược lại, giá trị điểm ảnh trùng khớp với lân cận địa phương điểm ảnh xét gán giá trị tương ứng với giá trị nhãn Sau chuyển đổi nhãn, tập liệu phân chia thành tập huân luyện tập kiểm thử Trong tập huấn luyện bao gồm 10.581 ảnh tập kiểm thử bao gồm 1.450 ảnh Do khối lượng thông tin đường bao thường nhỏ, nên sô’ lượng ảnh tập huân luyện điều chỉnh lớn SỐ 15-Tháng 6/2022 73 TẠP CHÍ CƠNG THƯƠNG Hình 6: Tiền xử lý ảnh nhỡn, (a) ảnh nhãn trước xử lý (b) ảnh nhãn sau xử lý Nguồn: Tác giả tổng hợp nhiều so với tập kiểm thử mà đảm bảo hiệu mơ hình tập kiểm thử Mã số ảnh 4.5 Huấn luyện mô hĩnh CEDN (Bảng 3) Thay huấn luyện Caffe theo tác giả lưu theo dòng vào tệp văn "train.txt" "val.txt" (Hình 7a, Hình 7b) 4.4 Huấn luyện kiểm thử mơ hình báo, q trình huân luyện thực Pytorch Mỗi ảnh huấn luyện cắt ngẫu nhiên vùng có kích thước 224 X 224 X với ảnh đối xứng gương vùng để tổ hợp thành lơ có kích thước 224 X 224 X X Ảnh nhãn CEDNvàRCN Cấu hình máy chủ Google Colab sử dụng để thực việc hn luyện mơ hình CEDN RCN Bảng thể sơ" cấu hình máy chủ thực theo cách tương tự để tạo lơ với kích thước 224 X 224 X X tương ứng với ảnh huấn luyện Các phương pháp sử dụng để Hình 7a: Tập ảnh nhãn “rfwb í : »^55? IPS JOT 12,£D1 lew 74 Số 15-Tháng 6/2022 3X’ CCCff.jps KHOA HỌC ■ KỸ THUẬT Hình 7b: Tập ởnh màu RGB gốc ■ -T * LKỈi&gMĐl; s i-Wfrt_>SK»it ‘ WJixmjpi 5-3 ipg arj3(^.ire Mơ.aoiM^iH jar’jjscEzt^ JMFJHKEM.jpj Xtìù«*j&')ỉ*9 xv:_»>ý-ÌỊí.j ! 17.r< W.OOCM^I ^7J»»Ke R &:?axH7i.fltg WJ»£?3&JPJ 2flC7aOTe.jp} KCTttc^Wjpc Nguồn: Tác giả tổng hợp Bảng Cấu hình máy chủ huấn luyện đánh giá mơ hình CEDN Cấu hình máy chủ huấn luyện đánh giá mơ hình CEDN Tên thơng số Giá tn CPU Intel(R) Xeon(R) CPU @ 2.20GHz, nhân luồng RAM 13G Ổ cứng 30G HDD GPU IxTesla K80, compute 3.7,2496 CUDA cores, 12GB GDDR5 VRAM Thời gian huấn luyện liên tục tối đa 12 tiếng Thài gian nghỉ 90 phut Nguồn: Tác giả tổng hợp Bảng Thông sô' huấn luyện mơ hình CEDN Thơng số huấn luyện mơ hình CEDN Tên thông số Gia tri Thu viện Pytorch 224x224x3 10-4 Kích thước ảnh đầu vào Adam Tốc độ học Hàm tối ưu Hàm thất Sơ' lấn duyệt Kích BCE (binary cross entropy) 30 thước lô 64 ảnh Số vòng lặp/1 lần duyệt 166 vòng lặp Nguồn: Tác giả tổng hợp SỐ 15-Tháng 6/2022 75 TẠP CHÍ CƠNG THƯƠNG Hình 8: Hình ảnh thực tế lõ ảnh Ảnh (a) lơ ảnh gốc có nhãn tương ứng Ảnh (b) Các đường xanh sáng ảnh (b) đường bao sau trích xuất từ tập liệu thuật toán Nguồn: Tác giả tổng hợp tăng cường liệu huấn luyện bao gồm: Cắt ngẫu nhiên: đề cập, vùng ngẫu nhiên khác cắt biến đổi kích thước 224 X 224 X Hình hình ảnh thực tế lơ bao gồm ảnh nguyên ảnh nhãn biến đổi Do kích thước lơ 64, nên lân duyệt thực 166 vịng lặp Khi huấn luyện mơ hình, chương trình tự động tính hàm thất tập kiểm thử lưu lại trọng số mơ hình sau kết thúc lần duyệt Các trọng số đánh thứ tự theo lần duyệt nhằm mục đích lưu lại mơ hình mơc hn luyện (Hình 9) Hình biểu diễn biểu đồ 76 Số 15 - Tháng 6/2022 thất thoát sau huấn luyện qua 30 lần duyệt Mơ hình có xu hướng khớp với tập huấn luyện kể từ lần duyệt thứ Tổng quan, giá trị thất thoát tập huấn luyện 0.09 tập kiểm thử 0.15 Hĩnh 9: Biểu đồ thất thoát mơ hình CEDN Nguồn: Tác giả tổng hợp KHOA HỌC KỸ THUẬT Bảng Thông số huấn luyện mô hình RCN Thơng số huấn luyện mơ hình RCN Tên thơng số Gia tn Thu viện Pytorch 224x224x310-4 Kích thước ảnh đầu vào Adam Toe độ học Hàm tối Ưu Hàm thất Số lẩn duyệt Kích BCE (binary cross entropy) 30 thước lơ 64 ảnh Số vịng lặp/1 lần duyệt 166 vòng lặp Nguồn: Tác giả tổng hợp Sau thu mơ hình sau huấn luyện lần duyệt thứ 30 Tiến hành chạy chương trình ảnh đánh giá Khác với trình huấn luyện, ảnh khơng cắt thành ảnh có kích thước 224 X 224 X mà giữ nguyên kích thước ảnh gốc wxhx3 đưa qua mơ hình Mơ hình chạy toàn tập kiểm thử kết lưu dạng tệp có mở rộng npy tệp chuyên dùng để lưu trữ ma trận Numpy 4.6 Thực nghiệm Huấn luyện mơ hình RCN (Bảng 4) Q trình hn luyện mơ hình thực thơng qua thư viện Pytorch Đầu vào mơ hình lơ với kích thước ảnh lơ 224 X 224 X Các phương pháp sử dụng để tăng cường liệu bao gồm: • Cắt ngẫu nhiên: Các vùng kích thước 224 X 224 X cắt ngẫu nhiên từ ảnh nguyên • Lật ảnh theo chiều ngang dọc: Ánh sau cắt ngẫu nhiên lật lại theo chiều ngang dọc cách đâo ngược ma trận ảnh Lật ảnh giúp tăng cường liệu vật thể đốì xứng vật thể với hướng khác • Thu phóng ảnh tỷ lệ 0.7 1.3: Thu phóng giúp mơ hình học đặc tính đường bao độ phân giải khác Tương tự mạng CEDN, mạng RCN gặp vấn đề hiệu lượng thông tin đường bao bé so với tập liệu Vì vậy, lơ ảnh có kích thước cố định 224 X 224 X cắt từ vùng ngẫu nhiên ảnh giúp tăng cường khả học mạng Khác với CEDN, có vùng cắt ngẫu nhiên khỏi ảnh gốc thay vùng Mạng RCN cấu tạo mạng sở ResNet-101 Do đó, khơi mạng ResNet-101 đóng băng tham số nhằm tận dụng khả trích chọn đặc trưng mơ hình tiền huấn luyện Trong đó, tham số khối RCN bao gồm RCU, MRF CRP cập nhật sau lần duyệt Giải thuật tối ưu Adam sử dụng để tối ưu kết huấn luyện Hàm thất thoát sử dụng hàm BCE (binary cross entropy) với trọng số cho điểm ảnh đường bao 10 Mơ hình huấn luyện với tốc độ học 10-4 số lần duyệt 30 Để tăng tốc trình huấn luyện, kích thước lơ đặt 64 Do kích thước ảnh đầu mơ hình RCN bị giảm nửa so với ảnh đầu vào, nên trước tính hàm thất thốt, ảnh đầu nội suy kích thước 224 X 224 X để đồng hóa kích thước với nhãn Khi hn luyện mơ hình, chương trình tự động tính hàm thất thoát tập kiểm thử lưu lại trọng số mơ hình sau kết thúc lần duyệt Các trọng số đánh thứ tự theo lần duyệt nhằm mục đích lưu lại mơ hình mốc huấn luyện (Hình 10) Hình 10 biểu diễn thay đổi hàm thất thoát trình huấn luyện Mơ hình RCN có xu hướng khớp khoảng 10 đến 20 lần duyệt bắt đầu trạng thái khớp lần duyệt lớn 20 Tổng quan, giá trị thất thoát tập huấn luyện 0.079 tập kiểm thử 0.09 Như vậy, giá trị thất mơ hình RCN thấp từ 0.01 đến 0.02 so với mô hình CEDN SỐ 15-Tháng 6/2022 77 ĨẠP CHÍ CĨNG IGIIÍNG Hình 10: Biểu dồ thất mơ hình RCN Precision Recall số không âm nhỏ Precesion cao đồng nghĩa với việc tỷ lệ điểm tìm đường bao lầ cao, Recall cao tương ứng với tỷ lệ điểm đường bao tìm thây cao Precesion Recall có mối quan hệ nghịch đảo với Khi giảm giá trị độ đo dẫn tới việc tăng giá trị cho độ đo lại Trong toán phát đường bao, thay đổi giá trị T từ đến 255 Recall giảm dần Precession tăng dần Đồng nghĩa với việc tăng giá trị T làm giảm khả xuâ’t dương tính giả (false positive), đồng thời làm giảm khả Nguồn: Tác giả tổng hợp Đánh giá Đánh giá kết dựa mơ hình huân luyện từ phần thực nghiệm Kết toán phát đường bao ảnh mức xám có giá trị điểm ảnh nằm dải từ đến 255 Gía trị điểm ảnh cho biết khả điểm ảnh đường bao Đê’ áp dụng độ đo Precision Recall, ngưỡng T sử dụng để phân biệt đường bao ảnh Các giá trị lớn ngưỡng T đặt giá trị biểu diễn cho đường bao nhỏ ngưỡng T đặt biểu diễn cho Sau áp dụng ngưỡng T, kết đầu ảnh nhị phân Kêì hợp với ảnh thực tế (Ground Truth) đường bao ảnh nhị phân để tính Precesion Recall Khi đó, độ đo Precision hay cịn gọi tỷ lệ dự đốn xác xác định cơng thức: Số điểm ảnh n_ _ dự đoán ,, Precision - - —- -25 -(6.1) Tổng số điểm ảnh dự đốn đường bao Tham số cịn lại, Recall hay cịn gọi độ nhạy tính theo cơng thức: Số điểm ảnh (6.2) liecall = Tổng sô’ điểm ảnh thực tế đường bao 78 SỐ 15 - Tháng Ĩ/2022 xuất dương tính thật (true positive) ngược lại Đường cong PR đường cong ROC Khi ngưỡng T thay đổi biểu diễn Precesion Recall đồ thị thu đồ thị có dạng đường cong nghịch đảo gọi Precesion-Recall curve Đồ thị Precesion-Recall biểu diễn tính chất đo lường độ hiệu hệ thống phân lớp nhị phân Trong khơng gian PR, mục tiêu mơ hình phân lớp nhị phân cố gắng đưa đường cong PR góc bên phải nhâ’t Ngồi Precesion Recall, độ đo khác sử dụng Precesion nghịch đảo Recall nghịch đảo tham sơ’ độ đo cho tốn nghịch đảo nhãn đường bao đổi giá trị cho (giá trị đường bao 0) Đặc biệt độ đo Recall Recall nghịch đảo gọi tỷ lệ dương tính thật tỷ lệ dương tính giả thường biểu diễn dạng đường cong ROC Đê’ đánh giá độ xác mơ hình, đường cong PR ROC sử dụng tốn tìm đường bao có tính châ’t tốn phân loại Đơ’i tượng phân loại điểm ảnh Để tính đường cong PR ROC số lượng ngưỡng sử dụng 300 với độ lớn bước nhảy 0.03 giá trị nằm đoạn [0,1], KHOA HỌC-KỸ THUẬT Kết luận nghiên cứu tương lai Qua đánh giá phân tích khóa luận, ta CĨ thể thấy tìm đường bao vật thể ảnh toán hữu dụng xuất nhiều toán thị giác máy Việc dò đường bao phức tạp trừu tượng đường bao yêu cầu thông tin mức độ cao Khóa luận đánh giá so sánh phương pháp tìm đường bao tiên tiến phương pháp học sâu, CEDN RCN Trong CEDN sử dụng kiến trúc mạng tích chập mã hóa giải mã đầy đủ, kiến trúc sử dụng nhiều toán phân vùng Phương pháp RCN sử dụng kiến trúc ResNet đa tầng, kiến trúc hiệu nhát việc lọc tách đặc trưng cách sử dụng kết nối tắt phương pháp đạt độ Kết xác tốt Do sử dụng kiến trúc tiên tiến ResNet, nên độ xác RCN có phần nhỉnh so với CEDN Tuy nhiên, cấu trúc RCN tương đối lớn, phức tạp chậm so vơi kiến trúc đơn tầng, đơn luồng CEDN Trong tương lai, tác giả tiếp tục nghiên cứu phương pháp phân vùng phân đoạn ảnh cách ứng dụng phương pháp dò đường bao, bao gồm CEDN RCN, với việc nâng cao hiệu cho phương pháp dò đường bao với tập liệu lớn, nhằm tăng cường khả đáp ứng cho nhiều dạng liệu khác Hình 7a kết dự định đạt nghiên cứu tương lai ■ TÀI LIỆU THAM KHẢO: Vijesh Soorya Rao Andre Peter Keim and Udo Zoelzer (2019) Object contour and edge detection with refinecontournet Computer Science, 1-5 John Canny (1986) A computational approach to edge detection IEEE, 679-698 D Tai D Martin, c Fowlkes and J Malik (2001) A database of human segmented natural images and its application to evaluating segmentation algorithms and measuring ecological statistics International Conference on Computer Vision, 766-774 Jesse Davis and Mark Goadrich (2006) The relationship between precesion-recall and roccurves Madison, WI, USA: Department of Computer Sciences and Department of Biostatistics and Medical Informatics, University of Wisconsin-Madison John c Duchi, Elad Hazan, and Yoram Singer (2011) Adaptive subgradient methods for online learning and stochastic optimization Journal ofMachine Learning Research, 12,2121-2159 Jonathan Long Evan Shelhamer and Trevor Darrell (2015) Fully convolutional networks for semantic segmentation Retrieved from: https://WWW cv-foundation org/openaccess/content_cvpr_2015/papers/Long_ Fully_Convolutional_Networks_2015_CVPR_paper.pdf Scott Cohen Honglak Lee Jimei Yang, Brian Price and Ming-Hsuan Yan (2016) Object contour detection with a fully convolutional encoder-decoder network Retrieved from: https://openaccess.thecvf.com/content_ cvpr_2016/papers/Yang_Object_Contour_Detection_CVPR_2016_paper.pdf Shaoqing Ren Kaiming He, Xiangyu Zhang and Jian Sun (2015) Deep residual learning for image recognition Retrieved from: https://www.cv-foundation.org/openaccess/content_cvpr_2016/ papers/He_Deep_Residual_ Learning_CVPR_2016_paper.pdf Pablo Arbelaez Kevis-Kokitsi Maninis, Jordi Pont-Tuset and Luc van Gool (2016) Convo-lutional oriented boundaries IEEE, 2-4 10 Diederik p Kingma and Jimmy Ba (2015) Adam: A method for stochastic optimization International Conference on Learning Representations (ICLR) Ithaca, NY: arXiv.org So 15-Tháng 6/2022 79 TẠP cui CÕNC THIÍONC 11 Yann LeCun, Léon Bottou, Yoshua Bengio, and Pattrick Haffner (1998) Gradient-basedleaming applied to document recognition IEEE, 1-2 12 Mallat (1999) A wavelet tour ofsignal processing chap 1-2-3, pages 158-174 USA: Academic Press 13 Luc Van Gool Christopher K.I.Williams John Winn Mark Everingham, s M Ali Es- lami and Andrew Zisserman.(2013) The pascal visual object classes challenge: A retrospec- five Germany: springier 14 Karen Simonyan and Andrew Zisserman (2014) Very deep convolutional networks for large-scale image recognition International Conference on Learning Representations, 2-4 15 Saining Xie and Zhuowen Tu (2015) Holistically-nested edge detection Retrieved from: https://doi.org/ 10 48550/arXiv 1504.06375 Ngày nhận bài: 5/5/2022 Ngày phản biện đánh giá sửa chữa: 23/5/2022 Ngày chấp nhận đăng bài: 16/6/2022 Thông tin tác giả: LÊ THỊ BẢO TRÂN Trường Đại học Ngoại ngữ - Tin học Thành phố Hồ Chí Minh EVALUATION OF CONTOUR FINDING METHODS FOR RGB COLOR IMAGES • LE THI BAO TRAN Ho Chi Minh City University of Foreign Languages - Information Technology ABSTRACT: The problem of finding contours is a fundamental problem that is extensively studied in the field of machine vision in general The contour also has different concepts for different approaches The article analyzes and evaluates two advanced contour finding methods including: Convolutional Encoder Decoder Network (CEDN) and RefineContourNet (RCN) These are two approaches with two different network architectures: CEDN uses Fully Convolutional Network-FCN architecture, and RCN uses Residual Network architecture RCN to clarify how to implement and evaluate based on different metrics including Precesion-Recall, PR curve, ROC curve, AOC and F-measure From there, it provides an overview of the performance and effectiveness of the two methods and how to choose the right methods for different applications Keywords: envelope, convolutional network, CEDN, RCN 80 SỐ 15 - Tháng 6/2022 ... với giá trị điểm ảnh xét giá trị điểm ảnh địa phương điểm ảnh xét cập nhật giá trị 1, tương ứng với giá trị nhãn đường bao Ngược lại, giá trị điểm ảnh trùng khớp với lân cận địa phương điểm ảnh. .. hợp Đánh giá Đánh giá kết dựa mơ hình hn luyện từ phần thực nghiệm Kết toán phát đường bao ảnh mức xám có giá trị điểm ảnh nằm dải từ đến 255 Gía trị điểm ảnh cho biết khả điểm ảnh đường bao. .. giả tiếp tục nghiên cứu phương pháp phân vùng phân đoạn ảnh cách ứng dụng phương pháp dò đường bao, bao gồm CEDN RCN, với việc nâng cao hiệu cho phương pháp dò đường bao với tập liệu lớn, nhằm

Ngày đăng: 21/11/2022, 09:47

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w