728x90
반응형
[논문 리뷰 - Cycle GAN] Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks (ICCV 2017)
·
Generative Models
본 논문은 ICCV 2017에 게재된 논문이며,Pix2pix 모델을 제안한 기관인 BAIR laboratory, UC Berkely에서 작성한 논문입니다.논문 링크: https://arxiv.org/abs/1703.10593 1. OverviewPix2pix 모델은 Paired image, 즉 source - target 이미지가 짝지어진 데이터로 학습을 한다.당연히 이러한 데이터는 Unpaired 이미지보다 그 양이 적을 것이다.Cycle GAN 에서는 대량의, 그리고 다양한 Unpaired 이미지를 사용해서 style transfer를 수행한다.  2. Adversarial LossDomain X에서 Domain Y로 변환된 데이터는 다시 역변환을 수행하면 원본 데이터로 복원되어야 한다.이러한 아이디..
[논문리뷰 - Pix2pix] Image-to-Image Translation with Conditional Adversarial Networks (CVPR 2017)
·
Generative Models
본 논문은 CVPR 2017에 게재된 논문입니다. (저자 소속: Berkeley AI Research, UC Berkely)논문 링크: https://arxiv.org/abs/1611.07004 1. Overview GAN 모델에서 특정 condition(information)을 기반으로 데이터를 생성하는 모델들을 conditional GAN이라고 합니다.Pix2pix는 conditional GAN 계열의 모델입니다.위의 사진처럼 Generator는 입력 이미지 x와 latent vector z를 모두 입력으로 받으며, Discriminator 또한 G(x)와 x를 이용해서 Real or Fake를 판별합니다.저자들은 Pix2pix 라는 간단한 모델 하나만으로도 여러 가지 image-to-image tr..
[논문 리뷰 - cGAN] Conditional Generative Adversarial Nets (2014)
·
Generative Models
본 논문은 University of Montreal & Yahoo Inc에서 작성한 논문입니다.논문 링크: https://arxiv.org/abs/1411.1784 1. cGANcGAN은 레이블, 텍스트 description, 이미지의 일부 같은 보조 정보를 입력으로 받는 조건부 모델이라고 할 수 있습니다.빨간색 화살표로 가리키는 부분이 바로 보조 정보(auxiliary information)가 추가되는 부분입니다.이것 말고는 모델 구조가 기존의 GAN과 동일합니다. 따라서 ojbective function 또한 기존 확률분포에서 조건부 확률로 변환된 것 외의 별 차이는 없습니다. DCGAN과 마찬가지로 기술적인 cotribution이 많지 않기 때문에 코드를 보면서 조금 더 공부해 보도록 합시다.  2..
[논문 리뷰 - DCGAN] Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks (ICLR 2016)
·
Generative Models
본 논문은 ICLR 2016에 게재된 논문이다. (저자 소속: Indico & Facebook AI Research)논문 링크: https://arxiv.org/abs/1511.06434 1. DCGAN Architecture기존 GAN 모델은 Generator와 Discriminator가 모두 fully-connected layer로 되어 있었다.당연하게도, 공간 정보를 잘 캡처하기 위해서 fc layer보단 convolutional layer가 더 좋을 것이다.저자들은 기존 GAN에 Convolution 개념을 적용한 DCGAN 이라는 모델을 제안한다.엄청 테크니컬한 기술이 들어간 것이 아니라서 모델 구조를 간단하게 요약해볼 수 있다.Generator에서는 fractional-strided, Disc..
[이미지 생성 모델] Autoencoder, VAE, GAN 설명
·
Generative Models
1. Autoencoder Autoencoder란 고차원의 input data를 저차원의 latent vector로 압축시킨 후에,이를 다시 input data shape으로 복원하는 모델이라고 할 수 있습니다. 학습 과정은 단순합니다.input과 output의 차이를 최소화하는 식으로 학습하면 되죠.Autoencoder는 Denoising, 데이터 압축에 사용하고, 생성된 latent vector는 input의 feature로 사용하기도 합니다.  2차원으로 압축된 latent vecotr를 시각화하면 위와 같은 그래프가 나옵니다.숫자들이 어느정도 알맞게 모여있는 것을 보실 수 있습니다.3 같은 경우 8과 매우 비슷하게 생겼죠?그래프 상에서도 가까운 거리에 위치해 있습니다.   2. VAE (Varia..
728x90
반응형