Đồ án kết thúc học phần thị giác máy tính xây dựng ứng dụng tái tạo màu ảnh bằng ai

24 1 0
Đồ án kết thúc học phần thị giác máy tính xây dựng ứng dụng tái tạo màu ảnh bằng ai

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG VIỆT - HÀN ĐỒ ÁN KẾT THÚC HỌC PHẦN THỊ GIÁC MÁY TÍNH XÂY DỰNG ỨNG DỤNG TÁI TẠO MÀU ẢNH BẰNG AI Sinh viên thực hiện: Giảng viên hướng dẫn: Lớp: Trần Quang Sang Nguyễn Phạm Tuấn Vũ TS Phạm Nguyễn Minh Nhựt 19IT5 Đà nẵng, 16 tháng 05 năm 2022 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG VIỆT - HÀN ĐỒ ÁN KẾT THÚC HỌC PHẦN THỊ GIÁC MÁY TÍNH XÂY DỰNG ỨNG DỤNG TÁI TẠO MÀU ẢNH BẰNG AI Đà Nẵng, tháng 05 năm 2023 Xây dựng ứng dụng tái tạo màu ảnh AI LỜI CẢM ƠN Lời đầu tiên, chúng em xin gửi lời cảm ơn chân thành đến Trường Đại Học Công nghệ Thông tin Truyền thông Việt - Hàn tạo hội cho chúng em học tập ngơi trường có sở vật chất hàng đầu, với chất lượng giảng dạy vô chuyên nghiệp Trong suốt thời gian học tập rèn luyện Trường Đại Học Công nghệ Thông tin Truyền thông Việt - Hàn nay, chúng em nhận nhiều quan tâm, giúp đỡ quý Thầy cô bạn bè Chúng em gửi lời cảm ơn đặc biệt đến thầy Phạm Nguyễn Minh Nhựt, giảng viên hướng dẫn đề tài chúng em trình làm Nhờ giúp đỡ nhiệt tình, nhẫn nại dành thời gian hướng dẫn, bảo, trả lời thắc mắc suốt q trình để chúng em có kết tốt Với điều kiện thời gian kinh nghiệm cịn hạn chế, báo cáo khơng thể tránh thiếu sót Chúng em mong nhận bảo, đóng góp ý kiến q thầy để chúng em có điều kiện bổ sung, nâng cao ý thức mình, phục vụ tốt công tác thực tế sau Chúng em xin chân thành cảm ơn! Đà Nẵng, tháng năm 2023 Sinh viên thực Xây dựng ứng dụng tái tạo màu ảnh AI NHẬN XÉT Chữ ký Giáo viên hướng dẫn Xây dựng ứng dụng tái tạo màu ảnh AI MỤC LỤC CHƯƠNG TỔNG QUAN ĐỀ TÀI 1.1 Lý chọn đề tài 1.2 Mục tiêu phương pháp giải 1.3 Các công cụ 1.3.1 Python 1.3.2 Google Colaboratory CHƯƠNG BÀI TỐN TƠ MÀU ẢNH 2.1 Giới thiệu mạng tích chập (CNN) 2.1.1 2.1.2 Các kiểu lớp Các siêu tham số lọc 2.1.3 Các hàm kích hoạt thường dùng 2.2 Các hệ màu .1 2.2.1 Hệ màu chuẩn RGB 2.2.2 Hệ màu LAB 2.3 Xác định vấn đề tô màu ảnh hệ màu LAB 2.4 Kiến trúc mạng tích chập tốn tái tạo ảnh đen trắng 2.5 Tái tạo hình ảnh từ Z 2.6 Multinomial Loss Function với Cân màu sắc CHƯƠNG TRIỂN KHAI CHƯƠNG TRÌNH 3.1 Tải mơ hình 3.2 Đọc mơ hình 3.3 Tải trung tâm bins lượng tử hóa 3.4 Chuyển đổi hình ảnh sang CIE Lab Color Space 3.5 Kết chương trình KẾT LUẬN Kết đạt Hướng phát triển .4 TÀI LIỆU THAM KHẢO Xây dựng ứng dụng tái tạo màu ảnh AI CHƯƠNG TỔNG QUAN ĐỀ TÀI 1.1 Lý chọn đề tài Tái tạo màu ảnh cơng việc cần thiết để giữ gìn phục hồi hình ảnh quý giá người Tuy nhiên, việc tái tạo màu ảnh thủ công cần nhiều thời gian kỹ năng, sử dụng AI giúp cho q trình trở nên nhanh chóng dễ dàng AI trở thành công nghệ ngày phát triển áp dụng rộng rãi nhiều lĩnh vực, bao gồm xử lý ảnh Việc phát triển giải pháp AI để tái tạo màu ảnh giúp tăng tốc độ xử lý ảnh cải thiện chất lượng kết Đề tài có tính ứng dụng cao áp dụng nhiều lĩnh vực, bao gồm việc lưu trữ, bảo quản khơi phục hình ảnh q giá cá nhân hay tổ chức Ngồi ra, áp dụng lĩnh vực truyền thông, quảng cáo, trí tuệ nhân tạo, … Cuối cùng, đề tài có tính hứa hẹn việc nghiên cứu phát triển phương pháp để tái tạo màu ảnh, đồng thời giúp cho nhà nghiên cứu chuyên gia thực nghiên cứu xử lý ảnh có thêm phương pháp để thử nghiệm phát triển/ 1.2 Mục tiêu phương pháp giải  Mục tiêu: Phát triển giải pháp AI để tái tạo màu cho ảnh đen trắng ảnh màu bị màu Cụ thể, đề tài đặt mục tiêu cụ thể sau:  Tìm hiểu phương pháp tái tạo màu ảnh có đánh giá hiệu chúng  Nghiên cứu phát triển mơ hình học sâu (deep learning models) để tái tạo màu ảnh  Thử nghiệm đánh giá chất lượng mơ hình ảnh thực tế  Tối ưu hóa mơ hình để đạt chất lượng tái tạo màu tốt với thời gian xử lý ngắn  Áp dụng giải pháp để tạo ảnh màu từ ảnh đen trắng ảnh bị màu, đồng thời cải thiện chất lượng độ xác kết tái tạo màu  Tổng hợp đánh giá kết đề tài, đồng thời đề xuất hướng phát triển tương lai để cải thiện chất lượng hiệu giải pháp  Phương pháp giải quyết: Xây dựng ứng dụng tái tạo màu ảnh AI Đầu tiên, chuyển đổi hệ màu hình ảnh đầu vào từ dạng RGB sang LAB Thứ 2, Chuyển đổi hình ảnh sang dạng tensor lấy giá trị kênh L hình ảnh đầu vào Thứ 3, Nén liệu hình ảnh để trích xuất đặc trưng ảnh dự đoán giá trị kênh AB ảnh dựa vào đặc trưng Cuối cùng, lấy kết kết hợp với liệu kênh L ban đầu đổi hình ảnh sang dạng RGB để trả kết 1.3 Các công cụ 1.3.1 Python Python ngơn ngữ lập trình bậc cao cho mục đích lập trình đa năng, ngơn ngữ lập trình đa mẫu hình, lập trình hướng đối tượng lập trình cấu trúc hỗ trợ hồn tồn, nhiều tính hỗ trợ lập trình hàm lập trình hướng khía cạnh (bao gồmsiêu lập trình siêu đối tượng Python có đặc điểm gì? Python ngơn ngữ thơng dịch: Python ngôn ngữ thông dịch, điều nghĩa ngơn ngữ trực tiếp chạy dịng mã Nếu có lỗi mã chương trình, ngừng chạy Do đó, lập trình viên nhanh chóng tìm lỗi đoạn mã Python ngôn ngữ dễ sử dụng: Python sử dụng từ ngữ giống tiếng Anh Không giống ngôn ngữ lập trình khác, Python khơng sử dụng dấu ngoặc ơm Thay vào đó, ngơn ngữ sử dụng thụt đầu dịng Python ngơn ngữ linh hoạt: Các lập trình viên khơng cần phải khai báo loại biến viết mã Python xác định chúng vào thời điểm chạy Vì vậy, viết chương trình Python cách nhanh chóng Python ngôn ngữ cấp cao: Python gần gũi với ngôn ngữ người ngơn ngữ lập trình khác Do đó, lập trình viên khơng cần phải lo lắng chức kiến trúc quản lý nhớ Xây dựng ứng dụng tái tạo màu ảnh AI Python ngơn ngữ lập trình hướng đối tượng: Python coi thứ đối tượng, ngôn ngữ hỗ trợ phương thức lập trình khác lập trình hàm lập trình cấu trúc Các thư viện Python phổ biến: Matplotlib: Các nhà phát triển sử dụng Matplotlib để hiển thị liệu dạng đồ họa hai ba chiều (2D 3D) chất lượng cao Thư viện thường sử dụng ứng dụng khoa học Pandas: cung cấp cấu trúc liệu tối ưu hóa linh hoạt mà sử dụng để thao tác với liệu chuỗi thời gian liệu có cấu trúc, chẳng hạn bảng nhóm NumPy: thư viện phổ biến mà nhà phát triển sử dụng để dễ dàng tạo quản lý nhóm, thao tác với hình dạng logic thực phép toán đại số tuyến tính NumPy hỗ trợ tích hợp với nhiều ngơn ngữ C C ++ OpenCV-Python: Là thư viện mà nhà phát triển sử dụng để xử lý hình ảnh cho ứng dụng thị giác máy tính Thư viện cung cấp nhiều hàm cho tác vụ xử lý hình ảnh đọc ghi hình ảnh lúc, xây dựng mơi trường 3D từ mơi trường 2D chụp phân tích hình ảnh từ video Keras: Là thư viện mạng nơ-ron chuyên sâu Python với khả hỗ trợ tuyệt vời cho việc xử lý liệu, trực quan hóa Keras hỗ trợ nhiều mạng nơ-ron Thư viện có cấu trúc mơ-đun mang lại linh hoạt cho việc lập trình ứng dụng sáng tạo Tkinter: Tkinter gói Python có chứa module Tk hỗ trợ cho việc lập trình GUI (Graphical User Interface) Tk ban đầu viết cho ngôn ngữ Tcl Sau Tkinter viết để sử dụng Tk trình thơng dịch Tcl Python Tensorflow: Tensorflow thư viện mã nguồn mở cung cấp khả xử lí tính tốn số học dựa biểu đồ mô tả thay đổi liệu, node phép tính tốn học cịn cạnh biểu thị luồng liệu 1.3.2 Google Colaboratory Colaboratory hay gọi Google Colab, sản phẩm từ Google Research, cho phép thực thi Python tảng đám mây, đặc biệt phù hợp với Data analysis, machine learning giáo dục Xây dựng ứng dụng tái tạo màu ảnh AI Colab không cần u cầu cài đặt hay cấu hình máy tính, thứ chạy thơng qua trình duyệt, sử dụng tài nguyên máy tính từ CPU tốc độ cao GPUs TPUs cung cấp cho Tại nên sử dụng Google Colab? - Các thư viện cài đặt sẵn Phân phối Anaconda Jupyter Notebook có số liệu cài đặt sẵn Numpy, Pandas, Matplotlib Ngoài ra, Colab cung cấp nhiều thư viện machine learning cài đặt sẵn Keras, Pytorch, Tensorflow - Được lưu đám mây Mọi thứ lưu trữ cục máy lựa chọn Jupyter Notebook làm môi trường làm việc Nếu đề cao quyền riêng tư chắn tính ưa thích - Sử dụng GPU TPU miễn phí, Khơng cần phải suy nghĩ nhiều, chọn Google Colab thay Jupyter Notebook Vì, Google Research cho phép sử dụng GPU TPU chuyên dụng họ cho dự án machine learning cá nhân Đối với số dự án, gia tốc GPU TPU tạo khác biệt lớn số dự án nhỏ Xây dựng ứng dụng tái tạo màu ảnh AI CHƯƠNG BÀI TỐN TƠ MÀU ẢNH 2.1 Giới thiệu mạng tích chập (CNN) CNN viết tắt Convolutional Neural Network hay gọi CNNS mang nơ-ron tích chập, mơ hình Deep Learning tiên tiến, cho phép xây dựng hệ thống có độ xác cao thơng minh 2.1.1 Các kiểu lớp - Lớp tích chập (CONV) Đây lớp đóng vai trị mấu chốt CNN, layer đảm nhiệm việc thực tính tốn Stride, padding, filter map, feature map yếu tố quan trọng convolutional layer Cơ chế CNN tạo filter áp dụng vào vùng hình ảnh Các filter map gọi ma trận chiều, bên chứa parameter dạng số  Stride dịch chuyển filter map theo pixel dựa giá trị từ trái sang phải Xây dựng ứng dụng tái tạo màu ảnh AI  Padding: Là giá trị thêm lớp input  Feature map: Sau lần qt, q trình tính tốn thực Feature map thể kết sau lần filter map quét qua input - Lớp Pooling (POOL) Lớp pooling giảm bớt số lượng tham số hình ảnh q lớn Khơng gian pooling cịn gọi lấy mẫu lấy mẫu xuống làm giảm kích thước map giữ lại thơng tin quan trọng Các pooling có nhiều loại khác nhau:  Max Pooling  Average Pooling  Sum Pooling - Lớp kết nối đầy đủ (FC) Nhận đầu vào liệu làm phẳng, mà đầu vào kết nối đến tất neuron Trong mơ hình mạng CNNs, tầng kết nối đầy đủ thường tìm thấy cuối mạng dùng để tối ưu hóa mục tiêu mạng ví dụ độ xác lớp 2.1.2 Các siêu tham số lọc Các chiều lọc: Một lọc kích thước F×F áp dụng lên đầu vào chứa C kênh (channels) có kích thước tổng kể F×F×C thực phép tích chập đầu vào kích thước I×I×C cho feature map (hay cịn gọi activation map) có kích thước Xây dựng ứng dụng tái tạo màu ảnh AI Stride: Đối với phép tích chập phép pooling, độ trượt S ký hiệu số pixel mà cửa sổ di chuyển sau lần thực phép tính Zero-padding: Zero-padding tên gọi trình thêm P số khơng vào biên đầu vào Giá trị lựa chọn thủ công cách tự động ba phương pháp mô tả bên dưới: Phương pháp Valid Giá trị P=0 Same Full Sử dụng padding để làm cho feature map có kích thước [I/S] Kích thước đầu thuận lợi mặt tốn học Cịn gọi 'half' padding Padding tối đa cho phép tích chập sử dụng rìa đầu vào Minh họa Mục đích Khơng sử dụng padding Bỏ phép tích chập cuối số chiều khơng khớp Bộ lọc thấy đầu vào từ đầu đến cuối 2.1.3 Các hàm kích hoạt thường dùng Xây dựng ứng dụng tái tạo màu ảnh AI Rectified Linear Unit - Tầng rectified linear unit (ReLU) hàm kích hoạt g sử dụng tất thành phần Mục đích tăng tính phi tuyến tính cho mạng Những biến thể khác ReLU tổng hợp bảng dưới: ReLU Độ phức tạp phi tuyến tính thơng dịch mặt sinh học Leaky ReLU Gán vấn đề ReLU chết cho giá trị âm ELU Khả vi nơi Softmax - Bước softmax coi hàm logistic tổng quát lấy đầu vào vector chứa giá trị x∈Rn cho vector gồm xác suất p∈Rn thông qua hàm softmax cuối kiến trúc Nó định nghĩa sau: 2.2 Các hệ màu 2.2.1 Hệ màu chuẩn RGB Xây dựng ứng dụng tái tạo màu ảnh AI RGB hệ màu kết hợp từ màu chính, viết tắt là:  R: Red (màu đỏ)  G: Green (màu xanh cây)  B: (blue (màu xanh lam) Hệ màu RGB có đặc điểm bật phát xạ ánh sáng, hay cịn có tên gọi khác mơ hình ánh sáng bổ sung Hiểu cách đơn giản màu Red (Đỏ), Green (Xanh lá) Blue (Xanh dương) hòa trộn với theo tỉ lệ 1:1:1 tạo thành màu trắng (màu sáng màu gốc) Hệ màu RGB hoạt động cách phát điểm sáng màu khác để tạo thành hình ảnh, màu sắc đen tivi, máy tính, máy ảnh, … Tuy nhiên khơng gian màu RGB có hạn chế lớn không phù hợp với cách người cảm nhận màu sắc Do khơng phù hợp cho việc ứng dụng vào tìm kiếm ảnh 2.2.2 Hệ màu LAB Hệ màu CIE L*a*b* xây dựng dựa khả cảm nhận màu mắt người Các giá trị Lab mô tả tất màu mà mắt người bình thường nhìn thấy Lab xem mơ hình màu độc lập thiết bị thường sử dụng sở tham chiếu chuyển đổi màu từ không gian màu sang không gian màu khác Xây dựng ứng dụng tái tạo màu ảnh AI  △L có giá trị lớn ý nói màu mẫu nghiên màu trắng  △L có giá trị bé ý nói màu mẫu nghiên màu đen  △a có giá trị lớn ý nói màu mẫu nghiên màu đỏ  △a có giá trị bé ý nói màu mẫu nghiên màu xanh  △b có giá trị lớn ý nói màu mẫu nghiên màu vàng  △b có giá trị bé ý nói màu mẫu nghiên màu xanh 10 Xây dựng ứng dụng tái tạo màu ảnh AI 2.3 Xác định vấn đề tô màu ảnh hệ màu LAB Phương pháp sử dụng dùng cường độ sáng làm đầu vào từ dự đoán màu sắc kênh cịn lại, khơng thể sử dụng khơng gian màu RGB khơng có thơng tin liên quan đến cường độ sáng Do đó, sử dụng khơng gian màu LAB Ngồi khơng gian màu LAB, sử dụng không gian màu YCbCr không gian màu HSV kênh Y V khơng gian màu có chứa giá trị cường độ sáng Cũng giống không gian màu RGB, LAB hệ màu biểu diễn kênh kết hợp: - Kênh L (Lightness-Luminance) có trục thẳng đứng, biểu diễn độ sáng màu từ (Đen) đến 100 (Trắng) Kênh chứa thông tin độ sáng màu không chứa giá trị màu - Kênh “A”: Có giá trị màu từ Green (xanh lá) (-) Red (Đỏ) (+) - Kênh “B”: Có giá trị màu từ Blue (xanh dương) (-) tới Yellow (Vàng) (+) Sử dụng giá trị kênh L chứa giá trị độ sáng làm liệu đầu vào để tìm giá trị kênh a b Để đơn giản hóa phép tính, Kênh a b không gian màu LAB lượng tử hóa thành 313 bins hình Thay tìm giá trị kênh a b cho pixel, với lượng tử hóa có sẵn, cần tìm số bin khoảng từ đến 312 Một cách suy nghĩ dễ có giá trị kênh L nhận giá trị từ đến 255 cần tìm giá trị kênh a b lại để lấy giá trị khoảng từ đến 312 11 Xây dựng ứng dụng tái tạo màu ảnh AI Vì vậy, việc dự đốn màu vấn đề phức tạp, với pixel màu xám có đến 313 lớp để lựa chọn Hình phía gốc trái hình ảnh đầu hồn tất q trình dự đốn Các hình ảnh phụ màu đen khối lượng tử gam ab Xác suất cao hiển thị độ chói cao lượng tử hóa tốt Hình (a) hình ảnh chim dự đốn có xung quanh màu xanh nâu Con chim có màu nằm từ màu xanh đến đỏ Hình (b) trái Cam dự đốn có màu khác Hình (c) Áo sơ mi sarong dự đốn ứng với màu ngọc lam / lục lam / cam màu đỏ / hồng / tím tương ứng Lưu ý tính đa dạng phân phối perpixel, kết sau lấy giá trị trung bình thường khơng gian thích hợp 2.4 Kiến trúc mạng tích chập tốn tái tạo ảnh đen trắng Convolutional Neural Netwok Architecture mạng kiểu VGG với nhiều khối chập Mỗi khối có hai ba lớp chập theo sau hàm Rectified Linear Unit (ReLU) kết thúc lớp Batch Normalization Khơng giống mạng VGG, khơng có lớp tổng hợp kết nối đầy đủ Hình ảnh đầu vào resize lại thành 224x224 diễn tả thang độ xám hình ảnh đầu vào X Khi qua neural network hình trên, chuyển sang Ẑ Neural Network Về mặt toán học, phép biến đổi G ghi là: Ẑ = G(X) Kích thước Ẑ HxWxQ H = (56) W = (56) chiều cao chiều rộng đầu convolution layer cuối Đối với pixel HxW, Ẑ chứa vectơ Q (=313) Giá trị giá trị đại diện cho xác suất 12 Xây dựng ứng dụng tái tạo màu ảnh AI pixel thuộc lớp Mục tiêu tìm cặp giá trị kênh a, b cho phân phối xác suất ẐH,W 2.5 Tái tạo hình ảnh từ Z CNN hiển thị hình cung cấp cho tập hợp phân phối Ẑ từ hình ảnh đầu vào thay đổi kích thước X xem cách tái tạo cặp giá trị a, b từ phân phối Ẑ Có thể suy nghĩ cần lấy giá trị trung bình phân phối chọn cặp ab tương ứng với bin center lượng tử gần Tuy nhiên phân phối Gaussian giá trị trung bình phân phối đơn giản tương ứng với màu không bão hịa khơng tự nhiên Để hiểu điều này, nghĩ màu sắc bầu trời - màu xanh màu vàng cam Sự phân bố màu sắc bầu trời hai phương thức Trong tô màu bầu trời, màu xanh màu vàng tạo màu sắc hợp lý Nhưng trung bình màu xanh màu vàng màu xám không bắt mắt Vậy không sử dụng chế độ phân phối để có bầu trời xanh hay vàng? Nếu thử cho bầu trời có màu sắc rực rỡ, đơi điều phá vỡ thống không gian Vậy sử dụng phương pháp nội suy ước tính trung bình chế độ để có đại lượng gọi annealed-mean Một tham số gọi nhiệt độ (T) sử dụng để kiểm soát mức độ nội suy Giá trị cuối T = 0,38 sử dụng làm cân hai biên Các cặp ab tương ứng với annealed-mean phân phối Ẑ H,W thể Ŷ H,W viết chuyển đổi phân bố ban đầu ẐH,W Ŷ = H(Ẑ) Lưu ý hình ảnh qua CNN, kích thước giảm xuống 56 × 56 Do đó, hình ảnh ab dự đốn Y có kích thước 56 × 56 Để có hình ảnh màu, ghép lại với kích thước hình ảnh ban đầu sau thêm vào kênh độ sáng L để tạo hình ảnh màu cuối 2.6 Multinomial Loss Function với Cân màu sắc 13 Xây dựng ứng dụng tái tạo màu ảnh AI Tất Neural Networks training cách dùng hàm mát (loss function) Mục tiêu trình đào tạo giảm thiểu tổn thất so với tập huấn luyện Trong toán tô màu, liệu huấn luyện bao gồm hàng ngàn hình ảnh màu phiên thang độ xám chúng Đầu CNN Z cung cấp hình ảnh đầu vào X Cần chuyển đổi tất hình ảnh màu tập huấn luyện thành Z giá trị tương ứng chúng Về mặt toán học, đơn giản muốn đảo ngược ánh xạ H Z = H-1(Y) Đối với pixel, YH,W hình ảnh đầu Y, cần tìm bin ab gần biểu diễn ZH,W dạng one-hot vector, gán cho bin ab gần cho tất 312 bin khác Nhưng để có kết tốt hơn, bin lân cận xem xét phân phối Gaussian sử dụng để tính tốn phân phối ZH,W tùy thuộc vào khoảng cách từ ground truth Sau đó, sử dụng hàm cross entropy để so sánh thật tính cách sử dụng ground truth Z ước tính Z cách dùng ước Tuy nhiên, hàm mát tạo màu sắc buồn tẻ Điều phân phối màu sắc ImageNet lớn xung quanh gray line Cân màu sắc: Để nâng cấp thuật toán tạo màu sắc rực rỡ, thay hàm mát thành: Cân màu sắc v sử dụng để cân lại mát dựa độ lớp màu Điều góp phần làm cho hình ảnh có màu sắc rực rỡ bão hòa đầu 14 Xây dựng ứng dụng tái tạo màu ảnh AI CHƯƠNG TRIỂN KHAI CHƯƠNG TRÌNH 3.1 Tải mơ hình Để tải xuống mơ hình cách sử dụng tệp tập lệnh getModels.sh từ dòng lệnh 1sudo chmod a+x getModels.sh 2./getModels.sh Thao tác tải xuống tệp prototxt (chứa kiến trúc mạng), mơ hình caffe đào tạo cho ảnh màu ảnh đen trắng để cân lại màu tệp pts_in_hull.py có tâm bins khơng gian ab lượng tử hóa 3.2 Đọc mơ hình Cung cấp câu lệnh dẫn đến tệp protoFile tệp trọng số mã Chọn mơ hình phù hợp, tùy thuộc vào việc bạn có muốn sử dụng cân lại màu hay khơng? Mặc định sử dụng mơ hình cân lại màu sắc Đọc hình ảnh đầu vào xác định kích thước đầu vào mạng 224×224 Đọc mạng vào nhớ 3.3 Tải trung tâm bins lượng tử hóa Tải trung tâm bins lượng tử hóa Sau đó, định hạt nhân 1×1 tương ứng với trung tâm số 313 trung tâm bin định chúng cho lớp tương ứng mạng Cuối cùng, thêm lớp chia tỷ lệ với giá trị khác khơng 3.4 Chuyển đổi hình ảnh sang CIE Lab Color Space 15 Xây dựng ứng dụng tái tạo màu ảnh AI Hình ảnh RGB đầu vào chia tỷ lệ cho giá trị nằm phạm vi 01, sau chuyển đổi thành khơng gian màu Lab kênh độ sáng trích xuất Kênh độ sáng ảnh gốc thay đổi kích thước thành kích thước đầu vào mạng (224.224) trường hợp Thông thường, kênh độ sáng nằm khoảng từ đến 100 Vì vậy, chúng tơi trừ 50 để Sau đó, cung cấp kênh độ sáng chia tỷ lệ tập trung vào mạng làm đầu vào cho đường chuyển tiếp Đầu chuyển tiếp kênh ab dự đoán cho hình ảnh Nó thu nhỏ lại kích thước hình ảnh ban đầu sau hợp với hình ảnh độ sáng có kích thước ban đầu (được trích xuất trước độ phân giải gốc) để có hình ảnh Lab đầu Sau đó, chuyển sang khơng gian màu RGB để có hình ảnh màu cuối Sau lưu hình ảnh đầu 3.5 Kết chương trình Nút “Load”: dùng để tải hình ảnh lên ứng dụng Nút “Draw”: dùng để tiến hành chức tái tạo màu ảnh Nút “Exit”: dùng để thoát ứng dụng 16 Xây dựng ứng dụng tái tạo màu ảnh AI 17 Xây dựng ứng dụng tái tạo màu ảnh AI KẾT LUẬN Kết đạt Dưới bảo hướng dẫn tận tình thầy Đặng Đại Thọ, “Ứng dụng tái tạo màu ảnh AI” hồn thành Với nhiều thuận lợi khó khăn trình thực hiện, ứng dụng hồn thành khơng tránh phần sai sót Tuy nhiên, chúng em nỗ lực ứng dụng hồn thành nội dung sau:  Vận dụng ngôn ngữ Python việc xây dựng ứng dụng  Phần giao diện người dùng: giao diện thân thiện, bắt mắt cho phép người dùng dễ dàng xem thông tin sản phẩm Hướng phát triển  Bổ sung chức thiếu ứng dụng  Hoàn chỉnh giao diện ứng dụng sinh động đẹp mắt với người sử dụng  Xử lý lỗi chặt chẽ trước đưa vào sử dụng  Hoàn thiện chức phù hợp với thực tế 18 Xây dựng ứng dụng tái tạo màu ảnh AI TÀI LIỆU THAM KHẢO Mơ hình mạng Autoencoder: https://viblo.asia/p/tim-hieu-ve-autoencoderoOVlYvJv58W Mơ hình mạng tích chập CNN: https://viblo.asia/p/deep-learning-tim-hieu-vemang-tich-chap-cnn-maGK73bOKj2 19

Ngày đăng: 24/08/2023, 10:23

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan