일상록/Ai 그림

WEB UI 구동과 관련한 주저리

운앵 2023. 2. 28. 18:53
반응형

stable diffusion

 

이 '스테이블 디퓨전'을 구동하는 방법에 대해서는 여러 지원 프로그램들이 있다. 대표적으로 WEB UI 이다. 개발자 및 기여자들이 추가 기능 및 보완을 하고 있는 프로그램이기도 하다. 보통 스테이블 디퓨전을 구동한다고 하면 WEB UI를 기반으로 돌린다고 생각해도 될 정도.

하지만 본체만 있다고 해선 구동이 되지 않는다. 화풍, 자세, 색감 등 여러 요인을 학습시킨 모델(Model)이 없기 때문이다. 물론 WEB UI를 설치하면 기본으로 모델 하나를 제공하는데 이 모델은 베이식 모델이라 생각하면 좋다. 현재 커뮤니티를 떠도는 여러 그림들은 이 베이직베이식 모델이 아닌 베이식 모델을 학습시켜 화풍을 달리하거나 색감을 좋게 바꾼 모델이다. 이 모델을 체크포인트(Checkpoint)라 부른다.

여기에 vae가 미포함된 모델이 존재하는데 vae는 그림을 선명하게 바꾼다고 생각하면 된다. vae가 없어도 흑백 아닌 그림이 나오지만 색감이 빠져 색 표현이 덜 된 상태로 나온다. vae는 학습된 데이터를 통해 색감을 부여한다. 즉, vae도 학습된 데이터가 어떤 것이냐에 따라서 같은 그림도 다르게 색감을 넣어 표현한다. 가령 1은 'red lip'을 붉은색으로 표현한다면 2는 연한 붉은색으로 표현하는 차이 정도이다.

큰 문제가 하나 더 있는데 바로 컴퓨터의 사양이다. 예시로 들은 1060 3GB도 겨우 돌릴 수준이지 스테이블 디퓨전이 구동되는 상황에서 던파같은 게임을 구동하면 던파와 스테이블 디퓨전에 영향이 간다. 따라서 보통 유저들은 RTX 3060급 미만이라면 구글 코랩(Collab)에서 구동 가능한 방식을 권유하는 편이다. RTX 2000번 대도 자가로 돌릴 수는 있다. 다만 발열이 높은 편이기에 발열이 있는 작업을 하면서 돌리는 건 어려울 수 있다. CPU나 하드디스크의 사양은 스테이블 디퓨전과 모델을 불러오는 속도 차이만 있을 뿐 큰 영향은 없다.

또한 그래픽카드의 경우 엔비디아의 지포스를 강력 권장한다. 라데온도 비틀고 비틀면 구동은 가능한데 당최 스테이블 디퓨전은 쿠다 코어(CUDA CORE)로 돌아가기에 쿠다 코어가 없는 라데온은 속도가 지포스에 비하면 느리다는 평가가 많다. 따라서 스테이블 디퓨전의 구동과 온라인 게임을 같이 하고 싶다면 그래픽 메모리가 높고 쿠다 코어가 많은 제품이 유리하다 할 수 있겠다.

모델은 WEB UI기준 'stable-diffusion-webui\models\Stable-diffusion' 에 넣어주면 된다. 이때 함정이 하나 있는데 'LORA' 모델이라는 함정이 있다. LORA는 특정 인물, 자세 등 세밀한 부분만 학습시킨 모델로서 원본 모델에 있는 데이터를 강화시키거나 없는 내용을 보충하는 모델이다. 이 모델은 '독립적으로 쓸 수 없다'. 이게 로라(Lora)모델인지 체크포인트(Checkpoint) 모델인지 확인하는 것은 매우 간단한데 용량이 1GB가 넘으면 체크포인트 모델, 그렇지 않으면 로라 모델이다.


내가 가진 GTX 1060 3GB와 RTX 2060 (6GB)간 차이는 다음과 같다.

 

* GTX 1060 3GB : 스테이블 디퓨전 혼자 구동해도 1분 30초 ~ 2분 이하의 시간이 들어간다. 만약 던파 같은 게임이나 유튜브 720p라도 키면 시간은 더 들어간다.

 

* RTX 2060 6GB : 던파, 유튜브 720p는 같이 돌려도 렉 없이 돌릴 수 있으며 같이 구동해도 12~15초 이내에 작업이 끝난다. 혼자 작업하면 아주 약간 더 빨리 작업물을 내놓는다.


다만, 창작물의 경우 대한민국에서는 인간이 만든 것만 창작물로 인정하고 있다. 또한 Ai의 위법성과 관련된 입법과 논의는 있었으나 정당성에 대한 입법은 없다. 문체부의 의견에 따르면 "Ai 학습을 통한 저작물의 이용을 무조건적 허용하는 건 아니고 일정 조건 하에 이용하는 것을 가능하게 하려고 한다"라고 밝힌 적도 있다. 또한 대다수의 국가에서 Ai가 만들어낸 작업물이 저작물로 인정되지 않는 점도 들었다.

 

이 점을 기억해두고 위법 사항이 있다면 쓰지 않는 게 좋고, 아예 법에 대해서 무지하다면 그저 혼자 사용하고 말아 버리는 것에서 그치는 게 가장 나을지도 모르겠다.

반응형