이미지를 생성하는 AI기술 ‘GAN’

PATENT SQUARE Offical Writer
2021-04-09
조회수 859


< © Nvidia >


인공지능은 이제 사람을 도와 일을 수행하는 비서의 역할을 넘어 그림을 그리고 작곡을 하는 예술가의 역할도 수행하고 있다. 그리고 어떠한 면에서는 사람보다 더욱 뛰어난 면모를 보인다. 이번 Design close up에서는 AI예술 분야에서 많이 사용되는 GAN (Generative Adversarial Networks: 생성적 적대 신경망)에 대해 알아보겠다. 이 기술은 딥러닝을 통해 이미지를 생성하거나 조합, 변형하는 알고리즘이다. GAN기술을 이용하면 적은 양의 정보로 원본 이미지를 예측할 수 있고. 사진을 특정한 방식의 이미지로 전환하는 것도 가능하며, 이미지 정보들의 변환과 재구축으로 ‘진짜처럼 보이는 가짜’이미지도 형성이 가능하다.


○ Edge 정보에 채색을 하는 GAN

< © Phillipi >


GAN의 학습 방식을 활용하면 적은 정보만을 보유한 이미지도 실물과 같은 고화질 사진으로 전환할 수 있다. 예를 들어 400개의 이미지를 2시간 동안 훈련시키면 기하학적 형태로 간략하게 그려진 파사드의 그림을 오른쪽의 사진과 같은 이미지로 구현할 수 있게 된다. 따라서 GAN기술을 사용하면 오른쪽 하단의 가방 이미지의 예처럼 간단한 스케치만으로도 시제품을 미리 확인하면서 디자인할 수 있다.


< © Nvidia >


엔비디아는 GAN을 활용한 이미지 크리에이터 소프트 웨어 ‘GauGAN’을 출시했다. 선을 그리거나 구간을 설정하기만 하면 그에 맞게 사진 그래픽이 생성되기 때문에 예술가 뿐 아니라 건축가, 영화 제작자 등이 활용하기에 용이하며, 고화질의 가상 세계를 쉽게 창조할 수 있다는 것이 엔비디아의 설명이다. ‘GauGAN’이라는 명칭은 유명한 화가인 고갱의 이름에서 따왔다고 한다.


○ 특정 화가의 화풍을 학습, 적용하는 ‘딥드림’

< © Deepdream >


이 프로그램은 특정 작가의 화풍을 지속적으로 학습시키면 특정 화가가 채색한 것 같은 그림으로 완성시킬 수 있다. 구글이 만든 ‘딥드림’은 입력된 이미지 요소를 잘게 나누어 데이터와 한 후 새롭게 입력된 이미지에 학습한 이미지 패턴을 적용시키는 GAN 프로그램이다. 즉, 백 년도 더 전에 사망한 고흐가 인공지능의 힘을 빌려 다시 등장한 셈이다. 최근에는 인공지능 기술을 3D 프린팅 기술과 접목시켜 유화 특유의 질감까지 표현할 수 있게 되었다고 하니 AI가 그린 그림이 화랑에 걸릴 날이 멀지 않았다고 할 수 있다.

< (10-2019-0059133) / 아주대학교산학협력단 >


국내에서 최근 취득한 GEN관련 특허 중에는 ‘에지(edge) 이미지로부터 컬러(color) 이미지를 생성하기 위한 GAN(generative adversarial networks) 기반 시스템‘이 있다. 딥러닝을 통해 컬러 이미지를 생성하는 이 기술은 만화를 채색하는 등의 작업을 수월하게 할 수 있다.


○ 인공지능이 표현한 로마 황제 초상

< © Voshart >


앞서 설명한 기술을 활용하면 조각상, 동전, 그림으로만 남아있는 로마 황제들도 사실적인 이미지로 되살릴 수 있다. 가상현실 전문가 다니엘 보샤트(Daniel Voshart)는 수집한 이미지들을 아트브리더(ArtBreeder)라는 인공지능 프로그램에 입력해 로마 황제의 형상을 3D로 구현했다. 보샤트는 자신이 구현한 정교한 초상화들을 모아 포스터로 만들어 판매하기도 했는데, 인공지능의 발달이 조각상에 생명을 불어넣어 역사를 더욱 생생하게 교육할 수 있게 한다는 점에서 역사학자들의 반응 또한 긍정적이다.


○ 사진을 특정 화풍의 이미지로 변환시키는 GAN 알고리즘

< © Toonify >


간단한 그림을 사진처럼 변환하는 방식이 있다면 반대로 사진을 그림처럼 변환하는 방식의 활용도 가능하다. ‘Toonify Yourself!’라는 홈페이지는 얼굴 사진을 인식해 디즈니 영화의 주인공처럼 만들어준다. Toonify Yourself!는 사전 훈련된 모델 StyleGAN에 디즈니 영화에 나오는 캐릭터 데이터를 학습시킨 알고리즘이며, 이미지 생성 알고리즘도 공개되어 있다.

< © Bryandlee >


중국의 AI,IT산업 전문 매체‘Synced’는 국내 석사 재학생 이동익씨가 StyleGEN의 이미지 생성 알고리즘을 응용해 만든 ‘웹툰 작가’ 알고리즘을 소개했다. 이는 고품질 이미지 얼굴 데이터를 웹툰 작가의 그림체에 맞게 변환하고 Freeze The Discriminator(FreezeD)를 기반으로 오류를 미세 조정하는 방식의 알고리즘이며, 10시간동안 500여 장의 웹툰 캐릭터를 학습하여 완성했다고 한다.


○ GAN을 기반으로 한 이미지 합성과 그의 활용

< © Nvidia >


엔비디아는 동물 이미지를 비슷한 종의 개체에 적용시켜 합성하는 프로그램 ‘GANimal’을 출시했다. 이미지를 GANimal에 입력하면 이미지 번역 네트워크가 기준 동물의 고유한 특성을 입력한 이미지에 투영하는 방식이다. 이러한 합성기술은 미디어 컨텐츠 분야 뿐 아니라 의료, 유통 서비스 등 여러 산업분야에서 활용되고 있다.


○ GAN을 기반으로 한 합성이미지를 쇼핑 분야에 적용시킨 ‘아마존’


< © Amazon >


‘아마존’은 딥러닝 알고리즘 '리스택GAN(ReStGAN)'개발을 통해 의류 검색 기능을 강화했다. 아마존의 설명에 의하면, 최근 개발한 GAN 기반 컴퓨터 비전 기술을 활용하면 고객이 원하는 제품 이미지를 설명을 듣고 검색 범위를 좁혀 제품을 제시할 수 있고, 고객이 선택한 제품과 비슷한 제품을 추천할 수도 있으며, 선택한 제품들을 하나의 모델에 입혀보는 ‘온라인 피팅’도 가능하다. 아마존은 이와 같은 내용을 컴퓨터 비전 분야의 선두로 꼽히는 ‘IEEE’컨퍼런스에서 발표한 바 있다.


○ 의료 분야에서의 GAN기술 활용

< (16353800) / Inception Institute of Artifical Intelligence, Ltd >


의료 산업 분야에서의 GAN의 활용도 활발하게 이루어지고 있다. 환자의 신상정보와 같은 민감 정보의 활용에 여려움을 겪고 있던 중 ‘합성 데이터’가 대안으로 제시된 것이다. 이에 더해, 최근 출원된 의료 영상 관련 특허를 소개하면, 영상에서 드러나는 질병의 심각 상태를 라벨링 할 수 있는 식별 기법의 사례를 들 수 있다.


○ 무한으로 생성되는 가상인물‘Fake Face’


< © Thispersondoesnotexist / © Lilmiquela >


GAN 기술의 발전으로 ‘Fake Face’를 만드는 기법 또한 고도화 되었다. 예전의 가상 인물은 어딘가 불쾌한 닮음 수준인 언캐니함을 보였지만, 페이스페이크의 가상 인물은 ‘언캐니 밸리’를 뛰어넘어 실물 모사 수준으로 성큼 다가왔다. 피부와 머리카락까지 진짜 사람과 비슷한 수준의 이미지를 도출할 수 있게 되었기 때문이다. 이에 따라 새로고침 한 번으로 가상인물 얼굴을 무한으로 생성하는 사이트가 등장하기도 했으며,(도메인은 thispersondoesnotexist.com으로, ‘이 사람은 존재하지 않습니다’라는 뜻이다) 인스타그램, 트위터 등의 SNS상에서 인플루언서로 활동을 활발하게 하고 있는 가상인물들도 있다.


○ 가짜를 구분하는 기술의 발전

< © Aitimes >


가상인물의 수요와 공급이 증가하고 거래가 활발해지면서 악용에 대한 위험 또한 증가하고 있다. 이에 대해 ‘뉴욕 타임스’는 ‘엔비디아’의 협조를 받아 가상 인물 생성의 간편성에 대해 조사한 뒤 사진의 진위 여부를 확인 할 수 있는 몇 가지 방안을 제시했다. 그 방법은 장신구, 안경테 등의 악세서리 양쪽이 동일한지에 대한 여부를 확인하는 것, 동공의 방향과 귀 모양을 보고 구분하는 것 등이 있다. 물론 일반 사람이 한눈에 알아보기는 힘든 ‘옥의 티’지만 이미지의 진위 여부를 구분하는 기술 또한 꾸준히 발전하면 GAN 기술의 악용을 방지할 수 있을 것이다.


○ 악용의 위험과 윤리 문제


< © UW News / © World today news >


인공지능 이미지 합성 기술이 비약적인 발달을 하던 중 지인의 사진을 음란물에 합성하여 능욕하는 ‘딥페이크 성희롱’ 문제가 화제 된 바 있다. 2018년도에는 오바마 전 대통령의 가짜 연설 영상이, 2020년 크리스마스에는 기묘한 춤사위를 선보이는 영국 엘리자베스 2세의 합성 영상이 영국 대표 민영방송‘채널4’에 공개되면서 이슈가 되기도 했다. 이러한 이슈들은 AI 기술이 악용 되었을 경우 가짜 뉴스를 생성하고 사회 불안을 조장하는 등의 큰 문제를 일으킬 수 있다는 경각심을 갖게 한다. 이러한 논의를 바탕으로 GAN을 기반으로 생성하는 이미지의 윤리적 사용의 중요성을 생각하며 인공지능을 활용한 4차 산업 혁명의 발전을 기대한다. (자료인용 : 특허청 디자인맵)



0 0