Nghiên cứu, tích hợp một số công cụ xử lý ảnh phục vụ công tác xây dựng bản đồ số

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Nghiên cứu, tích hợp số cơng cụ xử lý ảnh phục vụ công tác xây dựng đồ số NGUYỄN NHƯ CƯỜNG Ngành: Công nghệ thông tin Giảng viên hướng dẫn: PGS TS Trần Quang Đức Viện: Công nghệ thông tin Truyền thông HÀ NỘI, 2021 i TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Nghiên cứu, tích hợp số cơng cụ xử lý ảnh phục vụ công tác xây dựng đồ số NGUYỄN NHƯ CƯỜNG Ngành: Công nghệ thông tin Giảng viên hướng dẫn: PGS TS Trần Quang Đức Viện: Chữ ký GVHD Công nghệ thông tin Truyền thông HÀ NỘI, 2021 ii CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ Họ tên tác giả luận văn: Nguyễn Như Cường Đề tài luận văn: Nghiên cứu, tích hợp số cơng cụ xử lý ảnh phục vụ công tác xây dựng đồ số Chuyên ngành: Công nghệ thông tin Mã số học viên: CA180131 Tác giả, Người hướng dẫn khoa học Hội đồng chấm luận văn xác nhận tác giả sửa chữa, bổ sung luận văn theo biên họp Hội đồng ngày 08/5/2021 với nội dung sau: Bổ sung, làm rõ mối quan hệ nội dung luận văn tên đề tài luận văn Chỉnh sửa cấu trúc luận văn, tên chương mục cụ thể sau: Chương Giới thiệu đề tài Chương Cơ sở lý thuyết Chương Đề xuất giải pháp thực nghiệm xây dựng công cụ phân vùng ảnh vệ tinh Bổ sung diễn giải cho cách thức đánh giá độ xác thuật tốn Bổ sung Danh mục thuật ngữ, chữ viết tắt Bổ sung, chỉnh sửa mô tả, tham chiếu tới bảng biểu hình vẽ Chỉnh sửa hình thức hiển thị danh mục tài liệu tham khảo Đồng thuật ngữ sử dụng luận văn Chỉnh sữa lỗi tả Hà Nội, ngày Giáo viên hướng dẫn tháng năm 2021 Tác giả luận văn PGS.TS Trần Quang Đức Nguyễn Như Cường CHỦ TỊCH HỘI ĐỒNG TS Trịnh Tuấn Đạt iii LỜI CẢM ƠN Trước hết, học viên xin gửi lời cảm ơn đến thầy cô trường Đại học Bách Khoa Hà Nội tận tình, nhiệt huyết giảng dạy năm học vừa qua Học viên xin gửi lời cám ơn tới cán Viện Đào tạo Sau đại học phòng Đào tạo trường Đại học Bách Khoa Hà Nội đơn vị chức tạo điều kiện thuận lợi cho học viên lớp Cơng nghệ thơng tin 2018A tham gia học tập, hồn thiện nghiên cứu Em xin gửi lời cảm ơn chân thành sâu sắc đến thầy PGS TS Trần Quang Đức tận tình hướng dẫn khơng mặt chun mơn mà cịn cung cấp mơi trường, động lực giúp học viên hoàn thành nghiên cứu Luận văn tài trợ Quỹ Phát triển khoa học công nghệ Quốc gia (NAFOSTED) đề tài mã số 102.02-2019.314 TÓM TẮT NỘI DUNG LUẬN VĂN Luận văn thực nghiên cứu, ứng dụng kỹ thuật mạng nơ ron phát nhà ảnh viễn thám vệ tinh độ phân giải siêu cao góp phần xây dựng đồ quy hoạch, đồ số phát nhà xây dựng trái phép Luận văn sử dụng phương pháp nghiên cứu phương pháp thư viện, phương pháp thống kê, phương pháp thực nghiệm Nghiên cứu thực dựa máy tính cá nhân tảng python với thư viện tensorflow, keras, opencv… Luận văn ứng dụng thành công mạng nơ ron việc phát nhà mảnh ảnh kích thước nhỏ đưa giải pháp nhằm phát nhà ảnh kích thước lớn mà khơng phải phân tách ảnh thành nhiều ảnh nhỏ Nghiên cứu luận văn hỗ trợ cho công việc lập đồ Việt Nam Nghiên cứu tiếp tục phát triển theo hướng tăng cường độ xác, gia tăng thêm khơng gian mẫu, xử lý ảnh viễn thám đa độ phân giải HỌC VIÊN Nguyễn Như Cường iv MỤC LỤC MỤC LỤC I DANH MỤC BẢNG BIỂU III DANH MỤC HÌNH VẼ IV DANH MỤC CHỮ VIẾT TẮT VI CHƯƠNG 1: GIỚI THIỆU ĐỀ TÀI 1.1 Tổng quan đề tài 1.1.1 Đặt vấn đề 1.1.2 Phương pháp nghiên cứu 1.1.3 Cấu trúc luận văn 1.2 Tổng quan xây dựng đồ số Việt Nam 1.2.1 Bản đồ số 1.2.2 Xây dựng đồ số từ ảnh viễn thám vệ tinh 1.3 Tổng quan ảnh vệ tinh 1.3.1 Khái niệm ảnh vệ tinh 1.3.2 Phân loại ảnh vệ tinh 1.3.3 Giải đoán ảnh vệ tinh 10 1.4 Bài toán phân vùng ảnh 10 1.4.1 Phát biểu toán 10 1.4.2 Phân vùng ảnh 11 CHƯƠNG CƠ SỞ LÝ THUYẾT 13 2.1 Mạng nơ ron tích chập 13 2.1.1 Mạng nơ ron 13 2.1.2 Mạng nơ ron tích chập 14 2.1.3 Các trình xây dựng mạng CNN 16 2.1.4 Tính chất mạng CNN 21 2.2 Mơ hình Mask R-CNN 22 i 2.2.1 Thuật toán R-CNN 22 2.2.2 Thuật toán Fast R-CNN 24 2.2.3 Thuật toán Faster R-CNN 25 2.2.4 Thuật toán Mask R-CNN 26 2.3 Kiến trúc ResNet 29 2.4 Phương pháp đánh giá mơ hình 33 CHƯƠNG ĐỀ XUẤT GIẢI PHÁP VÀ THỰC NGHIỆM XÂY DỰNG CÔNG CỤ PHÂN VÙNG ẢNH VỆ TINH 34 3.1 Giải pháp phân vùng đối tượng ảnh vệ tinh 34 3.1.1 Giải pháp 34 3.1.2 Về môi trường thử nghiệm 34 3.1.3 Về liệu 35 3.2 Huấn luyện mạng nơ ron 38 3.2.1 Cài đặt chi tiết 38 3.2.2 Huấn luyện 41 3.2.3 Đánh giá độ xác mơ hình 44 3.3 Sử dụng mạng nơ ron 44 3.3.1 Các cài đặt chung 44 3.3.2 Ứng dụng với liệu ảnh kích thước nhỏ 45 3.3.3 Ứng dụng với ảnh kích thước lớn 45 3.4 Kết thực nghiệm 46 3.4.1 Lưu trữ kết 46 3.4.2 Kết tiến hành liệu mẫu 46 3.4.3 Kết tiến hành liệu Việt Nam 50 KẾT LUẬN 57 DANH MỤC TÀI LIỆU THAM KHẢO 58 ii DANH MỤC BẢNG BIỂU Bảng 1.1 Một số ảnh vệ tinh giới Bảng 1.2 Một số loại quỹ đạo vệ tinh trái đất Bảng 3.1 Kết đánh giá model 44 iii DANH MỤC HÌNH VẼ Hình 1.1 Quy trình xây dựng đồ số từ ảnh viễn thám vệ tinh Hình 1.2 Phương pháp ghi nhận ảnh viễn thám vệ tinh Hình 1.3 Phổ sóng điện từ Hình 1.4 Các cấp độ phân vùng ảnh 11 Hình 1.5 Ứng dụng phân vùng ảnh với ảnh vệ tinh 12 Hình 2.1 Mơ hình hoạt động mạng nơ ron 13 Hình 2.2 Mơ hình liên kết mạng nơ ron thơng thường 15 Hình 2.3 Mơ hình liên kết mạng nơ ron tích chập 16 Hình 2.4 Mơ cấu trúc mạng nơ ron tích chập 16 Hình 2.5 Lớp nơ ron 17 Hình 2.6 Tính toán lớp nơ ron ma trận 5x5 17 Hình 2.7 Tạo nơ rơn 18 Hình 2.8 Dịch chuyển ma trận lọc tạo nơ ron 18 Hình 2.9 Thủ tục max pooling lớp ẩn 19 Hình 2.10 Mơ hình mạng nơ ron tích chập hồn chỉnh 20 Hình 2.11 Kiến trúc R-CNN R.Girshick [5] 23 Hình 2.12 Các thuật tốn họ thuật toán R-CNN 24 Hình 2.13 Kiến trúc mạng Fast R-CNN [6] 24 Hình 2.14 Sơ đồ hoạt động Faster R-CNN 25 Hình 2.15 Kiến trúc Mask R-CNN 26 Hình 2.16 Chu trình thuật toán Mask R-CNN 27 Hình 2.17 Kiến trúc hồn chỉnh thuật tốn Mask R-CNN 28 Hình 2.18 Mơ hình Residual Block 30 Hình 2.19 Kiến trúc mạng VGG-19, 34-layer tuyến tính ResNet-34 31 Hình 2.20 Kiến trúc tổng thể số mơ hình mạng ResNet 31 Hình 2.21 Cấu trúc mạng nơ ron ResNet 32 Hình 2.22 Kiến trúc mạng nơ ron ResNet-50 33 Hình 3.1 Một số hình ảnh liệu mẫu dành cho huấn luyện mơ hình 36 Hình 3.2 Bộ liệu khu đô thị Splendora 37 Hình 3.3 Bộ liệu khu thị Phú Gia 37 iv Hình 3.4 Dữ liệu huấn luyện: Hình bên trái ảnh gốc, hình bên phải thể mặt nạ ngơi nhà có ảnh 42 Hình 3.5 Dữ liệu huấn luyện: Hình bên trái ảnh gốc, hình bên phải thể mặt nạ ngơi nhà có ảnh 42 Hình 3.6 Đồ thị epoch loss 43 Hình 3.7 Đồ thị bounding box loss 43 Hình 3.8 Đồ thị mask loss 43 Hình 3.9 Một số ảnh nằm liệu mẫu 46 Hình 3.10 Dữ liệu 0.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung 47 Hình 3.11 Dữ liệu 5.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung 47 Hình 3.12 Dữ liệu 35.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung 48 Hình 3.13 Dữ liệu 36.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung 49 Hình 3.14 Bản đồ khu thị Splendora (nguồn google map) 50 Hình 3.15 Bản đồ khu đô thị Phú Gia (nguồn google map) 51 Hình 3.16 Mảnh số 1-9: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung 51 Hình 3.17 Mảnh số 8-7: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung 52 Hình 3.18 Mảnh số 1-4: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung 52 Hình 3.19 Mảnh số 6-10: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung 53 Hình 3.20 Mảnh số 1-10: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung 53 Hình 3.21 Khu thị Splendora 55 Hình 3.22 Các đối tượng dự đốn ảnh 55 Hình 3.23 Bản đồ phát đối tượng 56 v DANH MỤC CHỮ VIẾT TẮT Ý nghĩa Chữ viết tắt GIS Geographic Information System cm Centimet m Metre km Kilomet MR Medium resolution HR High resolution VHR Very high resolution PAN Panchromatic MS Multi spectral PS Pan sharpened CNN Convolutional neural network RCNN Region-Based Convolutional Neural Network ROI Region of Interest ReLU Rectified Linear Unit ResNet Residual network IoU Intersection over Union AP Average Precision mAP mean Average Precision MS COCO Microsoft Common Objects in Context vi 3.2.3 Đánh giá độ xác mơ hình Bảng 3.1 Kết đánh giá model mAP 10 ảnh 100 ảnh 1000 ảnh 91.31% 82.80% 78.67% Bảng 3.1 cho thấy kết đo số mAP qua việc đánh giá với 10 ảnh, 100 ảnh 1000 ảnh Tuy liệu đánh giá cung cấp bao gồm 60000 ảnh khác giới hạn luận văn thực đánh giá với tối đa 1000 ảnh Các ảnh lựa chọn ngẫu nghiên liệu để tiến hành đánh giá Kết cho thấy độ xác mơ hình huấn luyện đạt khoảng 80% trở lên, đáp ứng yêu cầu 3.3 Sử dụng mạng nơ ron 3.3.1 Các cài đặt chung - Các thông số cài đặt tương tự thông số thao tác huấn luyện mạng nơ ron Chỉ thông số thay đổi thông số USE_MINI_MASK sử dụng giá trị FALSE Thay đổi thông số giúp đưa mặt nạ đầy đủ - Một số thông số mặc định sau: o Pretrained model path: đường dẫn tới model huấn luyện o Image dir thư mục chứa ảnh cần dự đoán o Model dir thư mục chứa model huấn luyện o Logs dir thư mục chứa thông tin huấn luyện model o Class name tên lớp dự đoán (luận văn tập trung nghiên cứu vào phát nhà nên có 02 lớp nền, nhà) 44 # Default dir PRETRAINED_MODEL_PATH = os.path.join(ROOT_DIR,"data","mapping.h5") LOGS_DIRECTORY = os.path.join(ROOT_DIR, "logs") MODEL_DIR = os.path.join(ROOT_DIR, "logs") IMAGE_DIR = os.path.join(ROOT_DIR, "data", "splendora") class_name = ['BG', 'building'] - Model khởi tạo chế độ inference, khác với chế độ training trên, để thực hoạt động giải đốn ảnh model = modellib.MaskRCNN(mode="inference", model_dir=MODEL_DIR, c onfig=config) model_path = PRETRAINED_MODEL_PATH model.load_weights(model_path, by_name=True) - Sau ta tiến hành giải đốn / phân vùng với liệu đầu vào 3.3.2 Ứng dụng với liệu ảnh kích thước nhỏ Tập liệu dùng để giải đoán ảnh có kích nhỏ ảnh lớn cắt thành nhiều mảnh nhỏ Đặc điểm liệu số lượng ảnh xác định, ảnh hình có kích thước nhỏ khoảng 300 x 300 pixel (bằng với kích thước ảnh huấn luyện) kích thước tiles đồ với mức zoom = 21 ( kích thước nhỏ 320 x 320pixel) 3.3.3 Ứng dụng với ảnh kích thước lớn Đối với hình ảnh vệ tinh viễn thám thông thường, ảnh thu ảnh có kích thước lớn từ hàng nghìn đến hàng chục nghìn pixel Tuy nhiên kích thước khung ảnh dự đốn để có kết chuẩn xác 320 x 320 pixel Hơn nữa, dùng cách thức chia nhỏ ảnh sẵn có thành tập ảnh nhỏ xảy khả năng, đối tượng phát lặp lại 02, 03, chí 04 lần Để tránh tình trạng xảy ra, tơi đề nghị sử dụng giải thuật cửa sổ trượt Kích thước sổ trượt 320 x 320 pixel với bước nhảy 150 pixel Kích thước cửa sổ trượt lựa chọn trùng với kích thước ảnh liệu huấn luyện, tạo tương đồng nhằm tăng xác Bước nhảy cửa 45 sổ trượt 150 pixel tương ứng với ~50% kích thước cửa sổ Bước nhảy lựa chọn sau trình thử nghiệm thực tế Do bước nhảy chiếm tỉ lệ thấp 50% độ xác giảm Mặt khác, với bước nhảy chiếm tỉ lệ lớn 50% số lượng cửa sổ trượt tăng nhanh làm tăng thời gian tính tốn chiếm dụng tài nguyên 3.4 Kết thực nghiệm 3.4.1 Lưu trữ kết Kết sau phân vùng lưu trữ lại thành file để phục vụ công tác lập đồ công tác khác sau Dữ liệu lưu trữ bao gồm: ảnh giải đoán, ảnh đồ bounding box, ảnh đồ mask (với liệu ảnh nhỏ), file chứa thông tin phân vùng từ liệu ban đầu 3.4.2 Kết tiến hành liệu mẫu Bộ liệu mẫu bao gồm 60697 ảnh kích thước 300 x 300 pixel khu vực thành phố nước Để thực kiếm tra kết mơ hình với liệu mẫu, khn khổ luận văn, thí nghiệm tiến hành 51 ảnh mẫu tổng số mẫu ảnh Hình 3.9 Một số ảnh nằm liệu mẫu Tổng thời gian thực thi mơ hình với 51 ảnh liệu mẫu 23’50” tương ứng với thời gian xử lý trung bình 28,04” / ảnh 46 a) b) c) d) Hình 3.10 Dữ liệu 0.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung a) b) c) d) Hình 3.11 Dữ liệu 5.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung 47 Với kết thực thuật toán với ảnh 0.jpg 5.jpg đây, ta nhận thấy kết đạt với nhà nằm tách biệt với đạt khả nhận dạng ~ 100% Cá biệt ảnh 0.jpg, ta thấy có phần nhỏ mái nhà nằm cạnh cạnh trái ảnh thuật toán phát ngồi nhà Tuy nhiên, ta thấy rõ mặt nạ bao phủ đối tượng không trùng khớp hồn tồn với đối tượng, cạnh khơng phẳng cạnh nhà mà có nhiều hình dạng khác (hình c kết trên) Do ngơi nhà nằm tách biệt với nên đồ tạo lập từ bounding box nằm tách biệt, phân biệt với Tuy nhiêu với hình 5.jpg, ta có ngồi nhà nằm theo đường xiên chéo góc bên trái góc bên phải, đồ tạo lập từ mặt nạ cho thấy hướng ngơi nhà cịn đồ tạo thành từ bouding box không cho thấy hướng nhà mà vị trí tương đối ngơi nhà a) b) c) d) Hình 3.12 Dữ liệu 35.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung 48 Hình cho ta thấy kết nhận diện với dãy nhà nằm sát theo đường chéo Ta dễ dàng nhận thấy giống kết nhận diện từ 02 ví dụ trước, đồ tạo lập từ mặt nạ dự đốn (hình c) cho thấy hướng nhà hiển thị rõ Trong trường hợp nhà nằm sát nhau, ta nhận thấy đồ tạo lập từ bounding box (hình d) khơng cho ngăn cách, phân biệt đối tượng Các nhà bị phát nằm chồng lên a) b) c) d) Hình 3.13 Dữ liệu 36.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung Trong ảnh 36.jpg, mắt thường, ta nhận thấy có 08 ngơi nhà nằm song song với phía trái ảnh phần nhỏ 03 nhà khác nằm cạnh phải Nhìn vào kết dự đốn trên, ta nhận thấy, mơ hình dự đốn cho kết tương đối xác số lượng nhà ảnh phát Tuy nhiên, kết gặp số vấn đề sau: 49 - Bouding box hình chữ nhật nhỏ bao lấy toàn đối tượng Bouding box xác định hai tọa độ điểm bên trái điểm bên phải Tuy nhiên hình dạng cách thức xác định nên bounding box có khả bị chồng lên nhau, đặc biệt với đối tượng có cạnh khơng nằm theo hình ngang - Với ngơi nhà xoay theo hướng khác mặt nạ phát xoay theo nhà bouding box lại khơng xoay Vì dẫn đến việt chồng lấn bouding box xếp sát, chồng lấn - Ngồi ra, mặt nạ dự đốn có lúc khơng phủ kín đối tượng - Mặt khác việc cắt ảnh nên đối tượng nằm ảnh khác gây trùng lặp sai lệch kích thước 3.4.3 Kết tiến hành liệu Việt Nam a) Thực nghiệm với liệu gồm ảnh nhỏ Ta tiến hành thử nghiệm đồng thời 02 liệu khu vực khu đô thị Splendora – An Khánh – Hồi Đức – Hà Nội khu thị Phú Gia – TP Hồ Chí Minh Hình 3.14 Bản đồ khu thị Splendora (nguồn google map) 50 Hình 3.15 Bản đồ khu đô thị Phú Gia (nguồn google map) Đối vơi liệu khu đô thị Splendora, ta có 100 ảnh kích thước 228 x 219 pixel Thời gian hồn thành thuật tốn 3692s ( 01h 01’ 32”) với kết quả: ảnh gốc b) c) d) Hình 3.16 Mảnh số 1-9: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung 51 a) b) c) d) Hình 3.17 Mảnh số 8-7: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung Đối với liệu khu đô thị Phú Gia, ta có 120 ảnh kích thước 232 x210 pixel Thời gian hồn thành dự đốn 4442s ( 01h 14’ 02”) a) b) c) d) Hình 3.18 Mảnh số 1-4: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung 52 a) b) c) d) Hình 3.19 Mảnh số 6-10: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung a) b) c) d) Hình 3.20 Mảnh số 1-10: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ; d)bản đồ khung 53 Nhìn vào kết phân tích đố với liệu ảnh nhỏ 02 khu đô thị Splendora Phú Gia, ta nhận số vấn đề sau: Về mơ hình sử dụng: Mơ hình có khả phát nhà thấp tầng nhà cao tầng mảnh 1-10 (như Hình 3.20) Mơ hình cịn nhận diện sai độ xác mAP đạt khoảng 80% mảnh 8-7 (Hình 3.17) 01 đối tượng bị nhận diện thành 02 đối tượng khác Về đồ thành lập từ bouding box: cho hình dáng tương đối giống đối tượng cần tìm hai đối tượng có bounding box chồng đè khó phân tách (mảnh 6-10) Về đồ thành lập từ mask: cho hình dạng khơng đồng khu đồ thị, đối tượng “nhà” xây dựng số kiểu kiến trúc hạn chế mặt nạ lại cho kiểu dáng khác b) Thực nghiệm ảnh kích thước lớn Đối với thử nghiệm này, tiến hành thử nghiệm liệu khu thị Splendora - ảnh kích thước 2289 x 2193 pixel Kết thu sau: - Số lượng cửa sổ trượt: 182 - Thời gian thực hiện: 5054” ( 1h 24’ 14”) 54 Hình 3.21 Khu thị Splendora Hình 3.22 Các đối tượng dự đốn ảnh 55 Hình 3.23 Bản đồ phát đối tượng Nhìn vào kết phân vùng với đối tượng ảnh đồ đối tượng thành lập, ta nhận thấy việc sử dụng cửa sổ trượt mạng nơ ron số hạn chế như: có đối tượng coi nhà khơng phải nhà Có vùng phát chồng đè lên nhiều nhiều nên bị hợp thành vùng lớn 56 KẾT LUẬN Thuật toán phân tích hình ảnh dựa mạng nơ ron Mask R-CNN phù hợp với việc phân tích, phân vùng đối tượng ảnh Tuy nhiên để có kết tốt cần xây dựng liệu đủ lớn, chứa tất lớp, đối tượng cần phân vùng Trong phạm vị nghiên cứu này, nghiên cứu thực ảnh vệ tinh viễn thám độ phân giải siêu cao 0,3 – 0,5m Do hạn chế liệu đầu vào nên nhận diện nhà tương đối tạch biệt xây dựng theo phong cách phương tây Khi sử dụng kỹ thuật cắt ảnh gốc ban đầu thành mảnh nhỏ số lượng ảnh cần thực tính tốn thực kỹ thuật cửa sổ trượt với trường hợp kích thước cửa sổ trượt với kích thước ảnh Khi ảnh gốc ban đầu có kích thước lớn độ chênh lệch hai phương pháp lớn Tuy nhiêu với kỹ thuật cắt ảnh việc đồng tọa độ ảnh lớn hiệu chỉnh tiêu tốn nhiều so với kỹ thuật cửa sổ trượt Mặt khác, độ xác áp dụng áp dụng cửa sổ trượt chưa cao trình đồng tọa độ sau trượt Trong thời gian tới, nghiên cứu cần phát triển thêm theo hướng cập nhật đối tượng huấn luyện cho mạng nơ ron Đồng thời phát triển để phân vùng nhiều loại ảnh vệ tinh viễn thám khác với độ phân giải khác 57 DANH MỤC TÀI LIỆU THAM KHẢO [1] Thủ tướng Chính phủ, CHIẾN LƯỢC NGHIÊN CỨU VÀ ỨNG DỤNG CÔNG NGHỆ VŨ TRỤ ĐẾN NĂM 2020, 14/6/2016 [2] Thủ tướng Chính phủ, CHIẾN LƯỢC PHÁT TRIỂN VÀ ỨNG DỤNG KHOA HỌC VÀ CÔNG NGHỆ VŨ TRỤ ĐẾN NĂM 2030, 04/02/2021 [3] Thủ tướng Chính phủ, CHIẾN LƯỢC PHÁT TRIỂN VIỄN THÁM QUỐC GIA ĐẾN NĂM 2030, TẦM NHÌN ĐẾN NĂM 2040, 01/02/2019 [4] TS Đàm Xn Hồn, Giáo trình trắc địa ảnh viễn thám, Trường Đại học Nông nghiệp Hà Nội, 2008 [5] Ross Girshick, "Rich feature hierarchies for accurate object detection and semantic segmentation," 2013 [6] Ross Girshick, "Fast R-CNN," 2015 [7] Shaoquing Ren, "Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks," 2015 [8] Jasper Uijlings, "Selective Search for Object Recognition," 2012 [9] Kaiming He, "Mask R-CNN," 2017 [10] Vincent Feng, "An Overview of ResNet and its Variants," 2017 [11] Kaiming He, "Deep Residual Learning for Image Recognition," 2015 [12] Tổ chức AICrowd, 2021 [Online] https://www.aicrowd.com/ [Accessed 2021] Available: 58 ... phúc BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ Họ tên tác giả luận văn: Nguyễn Như Cường Đề tài luận văn: Nghiên cứu, tích hợp số cơng cụ xử lý ảnh phục vụ công tác xây dựng đồ số Chuyên ngành: Công. .. THẠC SĨ Nghiên cứu, tích hợp số cơng cụ xử lý ảnh phục vụ công tác xây dựng đồ số NGUYỄN NHƯ CƯỜNG Ngành: Công nghệ thông tin Giảng viên hướng dẫn: PGS TS Trần Quang Đức Viện: Chữ ký GVHD Công nghệ... vùng; c )bản đồ mặt nạ; d )bản đồ khung 52 Hình 3.18 Mảnh số 1-4: a )ảnh gốc; b) ảnh phân vùng; c )bản đồ mặt nạ; d )bản đồ khung 52 Hình 3.19 Mảnh số 6-10: a )ảnh gốc; b) ảnh phân

Định dạng
Số trang	68
Dung lượng	1,56 MB