동영상 요약
비디오 ID: K3xJ7GQuHpw
요약 내용
00:00
최근에 손과 손가락을 정확하게 생성할 수 있는 이미지 생성기가 등장했습니다. 이 생성기는 텍스트를 정확하게 생성할 수 있을 뿐만 아니라 복잡한 프롬프트를 잘 따르는 능력도 가지고 있습니다. 또한 일반 사람들이 찍는 저품질의 셀카 이미지도 생성할 수 있어, 이제 AI 사진과 실제 사진을 구별하기가 거의 불가능해졌습니다. 새로운 이미지 생성기인 '플럭스(Flux)'와 두 가지 최신 이미지 생성기인 '스테이블 디퓨전 3(Stable Diffusion 3)' 및 'SDXL'을 사용하여 간단한 테스트를 진행해 보았습니다.
03:40
테스트에서는 동일한 프롬프트를 사용하여 세 개의 이미지를 생성했습니다. 첫 번째 프롬프트는 아프리카 어린이 세 명이 흙바닥에 서서 웃으며 손가락으로 'P'자를 만드는 모습이었습니다. 각 모델의 위치는 동일하게 유지했으며, 어떤 모델이 가장 잘 생성되었는지 평가해 보았습니다. 다음 프롬프트는 빨간 차의 트렁크에 앉아 수박을 먹고 있는 세 어린이의 이미지였습니다. 이 프롬프트는 많은 세부사항이 포함되어 있어 더욱 도전적이었습니다.
07:21
세 번째 프롬프트는 총을 두 손에 들고 카메라를 바라보는 금발 여성의 사진이었습니다. 이후에는 잔디에 누워 있는 여성의 유명한 프롬프트를 사용했습니다. 이 프롬프트는 각 모델의 성능을 비교하기에 적합했습니다. 다음으로는 무대에서 베이스 기타를 연주하는 젊은 여성의 이미지 생성이었습니다. 이 경우에는 베이스 기타의 줄이 정확히 네 개여야 하며, 손가락과 베이스의 디테일이 중요했습니다.
11:02
또한, 한 여성이 카메라를 등지고 서 있는 모습과, 팔을 하늘로 올리고 있는 젊은 여성의 이미지를 생성하는 프롬프트도 있었습니다. 마지막으로, 피를 흘린 흰 드레스를 입은 여성의 이미지와 애니메이션 스타일의 소녀 이미지 생성도 포함되었습니다. 각 프롬프트에 대한 결과를 비교하면서 어떤 모델이 가장 잘 생성했는지 평가했습니다.
14:43
결과적으로, 플럭스 모델이 대부분의 경우에서 가장 뛰어난 성능을 보였습니다. 특히 손과 손가락의 정확성에서 플럭스가 다른 모델들보다 우수했습니다. 예를 들어, 아프리카 어린이의 프롬프트에서는 플럭스만이 세 명의 어린이를 정확하게 생성했으며, 손가락도 'P'자를 만들고 있었습니다. 다른 모델들은 손가락이 부정확하거나 세부사항이 부족했습니다.
18:24
플럭스는 저품질의 셀카 사진을 생성하는 데에도 뛰어난 성능을 보였으며, 텍스트 생성에서도 높은 정확성을 보여주었습니다. 이 모델은 손의 위치에 관계없이 손가락을 정확하게 생성할 수 있는 유일한 AI 이미지 생성기로 평가받고 있습니다. 플럭스는 이전의 이미지 생성기들과 비교했을 때, 손과 손가락의 정확성에서 월등한 성능을 보였습니다.
22:05
플럭스는 최근에 발표된 새로운 이미지 생성기로, 블랙 포레스트 랩스(Black Forest Labs)에서 개발했습니다. 이 스타트업의 팀원들은 스테이블 디퓨전 XL의 원래 제작자들이라고 주장하고 있으며, 플럭스는 세 가지 모델을 출시했습니다. 첫 번째 모델은 '슐(Schnell)'로, 가장 빠른 모델이지만 품질은 가장 낮습니다. 두 번째 모델은 '개발자 모델(Dev Model)'로, 품질이 더 좋지만 속도는 느립니다. 마지막으로 '프로 모델(Pro Model)'은 가장 높은 품질을 제공하지만 유료입니다.
25:46
마지막으로, 플럭스를 로컬에서 설치하고 실행하는 방법에 대한 설명도 있었습니다. 이 과정은 여러 단계를 포함하며, 최소 12GB의 VRAM과 32GB의 RAM이 필요합니다. 설치 후에는 다양한 프롬프트를 사용하여 이미지를 생성할 수 있으며, 플럭스의 성능을 직접 체험해 볼 수 있습니다. 플럭스는 현재 AI 이미지 생성기 중에서 가장 뛰어난 성능을 자랑하며, 많은 사용자들이 이 모델로 전환할 가능성이 높습니다.