Kết luận chương 3

Chuyển đổi từ hình ảnh sang hình ảnh bằng cách sử dụng mô hình GAN có điều kiện. Giải pháp cụ thể ở đây là xây dựng mô hình pix2pix ứng dụng trong bài toán chuyển đổi ảnh đã được trình bày ở chương 2.

Kết quả sau khi huấn luyện mô hình từ ảnh phác thảo giày, dép sang ảnh thực chất lượng hình ảnh thu được sẽ được cải thiện và sẽ tiếp tục thay đổi trong quá trình đào tạo.

KẾT LUẬN

Qua thời gian học tập, nghiên cứu và hoàn thành bài luận văn, chúng tôi đã đạt được những kết quả sau:

Thứ nhất, chúng tôi đã nghiên cứu những kiến thức cơ bản, phổ quát trong vấn đề học máy như: khái niệm, ứng dụng, phân loại, các bước để xây dựng một chương trình học máy, chúng tôi tập trung mô tả mạng Neural. Chúng tôi nhận thấy rằng mạng Neural là thành phần cơ bản có liên quan mật thiết tới học sâu và là cơ sở cho mô hình học sâu. Ngoài ra, chúng tôi còn khái quát một số kiến thức về học sâu và mô hình mạng CNN, một trong những mô hình học sâu tiên tiến.

Thứ hai, chúng tôi đã nghiên cứu một mô hình học máy đặc biệt là mô hình GAN, đồng thời chúng tôi tìm hiểu về mô hình Pix2Pix, một lớp mô hình chuyên biệt cho các tác vụ image-to-image translation. Kết quả cho thấy rằng mô hình GAN là một cách tiếp cận đầy hứa hẹn cho nhiều nhiệm vụ dịch từ ảnh sang ảnh, đặc biệt là những công việc liên quan đến đầu ra đồ họa có cấu trúc cao.

Cuối cùng, chúng tôi xây dựng chương trình thử nghiệm trên bộ dữ liệu

edges2shoes. Khi huấn luyện mô hình từ ảnh phác thảo giày, dép sang ảnh thực bằng mô hình pix2pix chất lượng hình ảnh thu được sẽ được cải thiện và sẽ tiếp tục thay đổi trong quá trình đào tạo. Kết quả này rất tốt cho dữ liệu đầu vào là các hình ảnh phác thảo.

Điểm hạn chế trong đề tài của chúng tôi là: Chưa xử lý trên nhiều tập dữ liệu khác nhau để đánh giá hết khả năng của mô hình GAN. Đánh giá hiệu năng của mô hình đã được đề cập nhưng chưa được đầy đủ, vấn đề này cần kiến thức toán học sâu hơn, hy vọng rằng chúng tôi sẽ tiếp tục nghiên cứu sau khi hoàn thành luận văn.

DANH MỤC TÀI LIỆU THAM KHẢO

[1] TS. Lê Xuân Vinh, “Giáo trình Machine Learning”, Đại học Quy Nhơn

[2] Goodfellow, Ian; Pouget-Abadie, Jean; Mirza, Mehdi; Xu, Bing; Warde-

Farley, David; Ozair, Sherjil; Courville, Aaron; Bengio, Yoshua

(2014). Generative Adversarial Networks . Proceedings of the International

Conference on Neural Information Processing Systems (NIPS 2014). pp. 2672–2680.

[3] Karras, T., Aila, T., Laine, S., & Lehtinen, J. (2018). Progressive

Growing of GANs for Improved Quality, Stability, and Variation.ArXiv,

abs/1710.10196.

[4] G. Antipov, M. Baccouche and J. Dugelay (2017), "Face aging with

conditional generative adversarial networks," 2017 IEEE International

Conference on Image Processing (ICIP), Beijing, 2017, pp. 2089-2093, doi:

10.1109/ICIP.2017.8296650.

[5] Jin, Y., Zhang, J., Li, M., Tian, Y., Zhu, H., & Fang, Z. (2017). Towards

the Automatic Anime Characters Creation with Generative Adversarial Networks. ArXiv, abs/1708.05509.

[6] P. Isola, J. Zhu, T. Zhou and A. A. Efros (2017), "Image-to-Image

Translation with Conditional Adversarial Networks," 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Honolulu, HI, 2017, pp. 5967-5976, doi: 10.1109/CVPR.2017.632.

[7] Zhang, H., Xu, T., & Li, H. (2017). StackGAN: Text to Photo-Realistic

Image Synthesis with Stacked Generative Adversarial Networks. 2017 IEEE

[8] Huang, R., Zhang, S., Li, T., & He, R. (2017). Beyond Face Rotation: Global and Local Perception GAN for Photorealistic and Identity Preserving Frontal View Synthesis. 2017 IEEE International Conference on Computer

Vision (ICCV), 2458-2467.

[9] Ledig, C., Theis, L., Huszár, F., Caballero, J., Aitken, A., Tejani, A., Totz,

J., Wang, Z., & Shi, W. (2017). Photo-Realistic Single Image Super-

Resolution Using a Generative Adversarial Network. 2017 IEEE Conference

on Computer Vision and Pattern Recognition (CVPR), 105-114.

[10] Olaf Ronneberger, Philipp Fischer, Thomas Brox (2015) . Medical

Image Computing and Computer-Assisted Intervention – MICCAI 2015, 2015, Volume 9351ISBN : 978-3-319-24573-7

[11] Jin, Lianchao & Tan, Fuxiao & Jiang, Shengming. (2020). Generative

Adversarial Network Technologies and Applications in Computer Vision.

Computational Intelligence and Neuroscience. 2020. 1-17.

10.1155/2020/1459107.

Kiến trúc của pix2pix

Giới thiệu và phân tích bài toán