1. Trang chủ
  2. » Giáo Dục - Đào Tạo

ỨNG DỤNG CỦA MẠNG ĐỐI NGHỊCH TẠO SINH TRONG BÀI TOÁN CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT

31 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 31
Dung lượng 1,92 MB

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Tạ Đăng Khoa ỨNG DỤNG CỦA MẠNG ĐỐI NGHỊCH TẠO SINH TRONG BÀI TOÁN CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT MÔN TRÍ TUỆ NHÂN TẠO NÂNG CAO Ngành Khoa học máy tính HÀ NỘI 2022 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Tạ Đăng Khoa ỨNG DỤNG CỦA MẠNG ĐỐI NGHỊCH TẠO SINH TRONG BÀI TOÁN CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT MÔN TRÍ TUỆ NHÂN TẠO NÂNG CAO Ngành Khoa học máy tính Cán bộ hướng dẫn GS TS Nguyễn Thanh Thủy HÀ NỘI 2022 LỜI CẢM ƠN Lời đầu tiên, tôi xin gửi.

Ngày đăng: 18/05/2022, 14:10

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Rameen Abdal, Yipeng Qin, and Peter Wonka. Image2stylegan: How to embed images into the stylegan latent space? CoRR, abs/1904.03189, 2019 Sách, tạp chí
Tiêu đề: CoRR
[3] Andrew Brock, Jeff Donahue, and Karen Simonyan. Large scale GAN training for high fidelity natural image synthesis. CoRR, abs/1809.11096, 2018 Sách, tạp chí
Tiêu đề: CoRR
[4] Giuseppe Carleo, Ignacio Cirac, Kyle Cranmer, Laurent Daudet, Maria Schuld, Naftali Tishby, Leslie Vogt-Maranto, and Lenka Zdeborová . Machine learning and the physical sciences. Reviews of Modern Physics, 91(4), dec 2019 Sách, tạp chí
Tiêu đề: Reviews of Modern Physics
[5] Zezhou Cheng, Qingxiong Yang, and Bin Sheng. Deep colorization. CoRR, abs/1605.00075, 2016 Sách, tạp chí
Tiêu đề: CoRR
[6] Chao Dong, Chen Change Loy, Kaiming He, and Xiaoou Tang. Image super- resolution using deep convolutional networks. IEEE Transactions on Pattern Anal- ysis and Machine Intelligence, 38(2):295–307, 2016 Sách, tạp chí
Tiêu đề: IEEE Transactions on Pattern Anal-ysis and Machine Intelligence
[7] David Eigen and Rob Fergus. Predicting depth, surface normals and semantic la- bels with a common multi-scale convolutional architecture. CoRR, abs/1411.4734, 2014 Sách, tạp chí
Tiêu đề: CoRR
[8] Leon A. Gatys, Alexander S. Ecker, and Matthias Bethge. A neural algorithm of artistic style. CoRR, abs/1508.06576, 2015 Sách, tạp chí
Tiêu đề: CoRR
[10] Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. Deep residual learning for image recognition. CoRR, abs/1512.03385, 2015 Sách, tạp chí
Tiêu đề: CoRR
[11] Tero Karras, Timo Aila, Samuli Laine, and Jaakko Lehtinen. Progressive growing of gans for improved quality, stability, and variation. CoRR, abs/1710.10196, 2017 Sách, tạp chí
Tiêu đề: CoRR
[12] Tero Karras, Samuli Laine, and Timo Aila. A style-based generator architecture for generative adversarial networks. CoRR, abs/1812.04948, 2018 Sách, tạp chí
Tiêu đề: CoRR
[13] Jonathan Long, Evan Shelhamer, and Trevor Darrell. Fully convolutional networks for semantic segmentation. In 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pages 3431–3440, 2015 Sách, tạp chí
Tiêu đề: 2015 IEEE Conference on Computer Vision andPattern Recognition (CVPR)
[14] Aravindh Mahendran and Andrea Vedaldi. Understanding deep image representa- tions by inverting them. CoRR, abs/1412.0035, 2014 Sách, tạp chí
Tiêu đề: CoRR
[15] Rafał Mantiuk, Kil Joong Kim, Allan G. Rempel, and Wolfgang Heidrich. Hdr- vdp-2: A calibrated visual metric for visibility and quality predictions in all lumi- nance conditions. ACM Trans. Graph., 30(4), jul 2011 Sách, tạp chí
Tiêu đề: ACM Trans. Graph
[16] Anh Mai Nguyen, Jason Yosinski, and Jeff Clune. Multifaceted feature visual- ization: Uncovering the different types of features learned by each neuron in deep neural networks. CoRR, abs/1602.03616, 2016 Sách, tạp chí
Tiêu đề: CoRR
[18] P. Patel, N. Kumari, M. Singh, and B. Krishnamurthy. Lt-gan: Self-supervised gan with latent transformation detection. In 2021 IEEE Winter Conference on Applica- tions of Computer Vision (WACV), pages 3188–3197, Los Alamitos, CA, USA, jan 2021. IEEE Computer Society Sách, tạp chí
Tiêu đề: 2021 IEEE Winter Conference on Applica-tions of Computer Vision (WACV)
[19] Elad Richardson, Yuval Alaluf, Or Patashnik, Yotam Nitzan, Yaniv Azar, Stav Shapiro, and Daniel Cohen-Or. Encoding in style: a stylegan encoder for image-to- image translation. CoRR, abs/2008.00951, 2020 Sách, tạp chí
Tiêu đề: CoRR
[20] Lars Ruthotto and Eldad Haber. An introduction to deep generative modeling.CoRR, abs/2103.05180, 2021 Sách, tạp chí
Tiêu đề: CoRR
[21] Yujun Shen, Jinjin Gu, Xiaoou Tang, and Bolei Zhou. Interpreting the latent space of gans for semantic face editing. CoRR, abs/1907.10786, 2019 Sách, tạp chí
Tiêu đề: CoRR
[22] Z. Wang, E.P. Simoncelli, and A.C. Bovik. Multiscale structural similarity for image quality assessment. In The Thrity-Seventh Asilomar Conference on Signals, Systems Computers, 2003, volume 2, pages 1398–1402 Vol.2, 2003 Sách, tạp chí
Tiêu đề: The Thrity-Seventh Asilomar Conference on Signals,Systems Computers, 2003
[23] Zhou Wang, A.C. Bovik, H.R. Sheikh, and E.P. Simoncelli. Image quality assess- ment: from error visibility to structural similarity. IEEE Transactions on Image Processing, 13(4):600–612, 2004 Sách, tạp chí
Tiêu đề: IEEE Transactions on ImageProcessing

HÌNH ẢNH LIÊN QUAN

Danh sách hình vẽ - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
anh sách hình vẽ (Trang 7)
Hình 2.1: Kiến trúc mạng GAN - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
Hình 2.1 Kiến trúc mạng GAN (Trang 13)
Hình 2.2: Kiến trúc mạng Stylegan - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
Hình 2.2 Kiến trúc mạng Stylegan (Trang 14)
Hình 2.3. - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
Hình 2.3. (Trang 15)
Hình 2.4: Hàm mất mát tri giác bằng việc so sánh các vectơ bậc cao - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
Hình 2.4 Hàm mất mát tri giác bằng việc so sánh các vectơ bậc cao (Trang 16)
Hình 2.5: Một khối trong mạng Resnet - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
Hình 2.5 Một khối trong mạng Resnet (Trang 16)
Kiến trúc mô hình StyleGan Encoder này bao gồm 2 phần: i) đưa bức ảnh đầu vào qua một mạng đã được đào tạo trước để phỏng đoán một vectơ ngữ nghĩa; ii) tối ưu vectơ ngữ nghĩa này để bức ảnh sinh ra giống với bức ảnh đầu vào. - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
i ến trúc mô hình StyleGan Encoder này bao gồm 2 phần: i) đưa bức ảnh đầu vào qua một mạng đã được đào tạo trước để phỏng đoán một vectơ ngữ nghĩa; ii) tối ưu vectơ ngữ nghĩa này để bức ảnh sinh ra giống với bức ảnh đầu vào (Trang 17)
tạo mô hình Resnet được thể hiện trong Hình 2.6. Sau bước này, chúng ta có thể phỏng đoán gần đúng được vectơ ngữ nghĩa của bức ảnh đầu vào, tuy nhiên bức ảnh được tạo bở vectơ này không hoàn toàn giống với bức ảnh ban đầu - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
t ạo mô hình Resnet được thể hiện trong Hình 2.6. Sau bước này, chúng ta có thể phỏng đoán gần đúng được vectơ ngữ nghĩa của bức ảnh đầu vào, tuy nhiên bức ảnh được tạo bở vectơ này không hoàn toàn giống với bức ảnh ban đầu (Trang 18)
Hình 2.8: Minh họa về thao tác có điều kiện trong không gian vectơ - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
Hình 2.8 Minh họa về thao tác có điều kiện trong không gian vectơ (Trang 21)
Hình 3.1: Quy trình chỉnh sửa kiểu tóc bằng phép biến đổi vectơ ngữ nghĩa - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
Hình 3.1 Quy trình chỉnh sửa kiểu tóc bằng phép biến đổi vectơ ngữ nghĩa (Trang 22)
cao. Như đã được đề cập ở Phần 2.5, bộ mã hóa StyleGan Encoder cho phép ánh xạ hình ảnh thực vào không gian ngữ nghĩa của GAN - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
cao. Như đã được đề cập ở Phần 2.5, bộ mã hóa StyleGan Encoder cho phép ánh xạ hình ảnh thực vào không gian ngữ nghĩa của GAN (Trang 23)
Hình 3.3: Quá trình đào tạo siêu phẳng phân tách vectơ ngữ nghĩa ứng với một thuộc tính nhị phân - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
Hình 3.3 Quá trình đào tạo siêu phẳng phân tách vectơ ngữ nghĩa ứng với một thuộc tính nhị phân (Trang 24)
Hình 3.4: Ví dụ minh họa siêu phẳng của thuộc tính nhị phân "tóc mái" - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
Hình 3.4 Ví dụ minh họa siêu phẳng của thuộc tính nhị phân "tóc mái" (Trang 24)
được thể hiện trong Hình 4.1. - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
c thể hiện trong Hình 4.1 (Trang 26)
Hình 4.3: Chỉnh sửa tính chất kiểu tóc của người châ uÁ cho kết quả giống với người châu Âu - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
Hình 4.3 Chỉnh sửa tính chất kiểu tóc của người châ uÁ cho kết quả giống với người châu Âu (Trang 27)
Hình 4.2: Chỉnh sửa quá nhiều về tính chất tóc xoăn kéo theo sự thay đổi về giới tính - ỨNG DỤNG CỦA  MẠNG ĐỐI NGHỊCH TẠO SINH  TRONG BÀI TOÁN  CHỈNH SỬA TÍNH CHẤT KHUÔN MẶT
Hình 4.2 Chỉnh sửa quá nhiều về tính chất tóc xoăn kéo theo sự thay đổi về giới tính (Trang 27)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

w