Stable Diffusion 3 출시: Stability AI의 가장 진보된 모델

2024년 6월 12일, Stability AI는 가장 정교한 이미지 생성기인 Stable Diffusion 3 Medium을 출시했습니다. 이제 가중치는 오픈 비상업적 라이선스와 저렴한 크리에이터 라이선스로 사용할 수 있습니다.

20억 개의 파라미터를 갖춘 SD3 Medium은 복잡한 설정 없이도 사실적인 이미지를 효율적으로 제공합니다. 중요한 점은 이 모델이 표준 소비자 하드웨어에서 원활하게 작동하도록 최적화되었다는 점입니다. Stability는 손과 얼굴의 일반적인 아티팩트를 극복했다고 밝혔습니다. Stability AI는 공간 관계, 구성 요소, 동작 및 스타일이 포함된 복잡한 프롬프트를 정확하게 해석할 수 있도록 SD3 Medium을 설계했습니다.

Stability AI는 SD3 Medium의 타이포그래피 기능을 개선하여 “전례 없는” 텍스트 생성 정확도를 달성했습니다. 이러한 발전은 모델에 사용된 확산 트랜스포머 아키텍처 덕분입니다.

또한 이 모델은 20억 개의 파라미터로 구성된 컴팩트한 크기 덕분에 일반적으로 8억~80억 개의 파라미터를 포함하는 Stable Diffusion 3 시리즈에 비해 그 규모가 훨씬 작습니다. 이 작은 규모와 낮은 VRAM 요구 사항이 결합되어 SD3 Medium은 성능 저하 없이 표준 소비자용 GPU에서 실행하기에 특히 적합합니다. 더 작은 데이터 세트에서 상세한 정보를 캡처할 수 있는 이 모델의 능력은 커스터마이징 잠재력도 크게 향상시킵니다.

스테이블리티 AI의 공동 CEO는 “스테이블리티 AI는 계속해서 제너레이티브 AI의 경계를 넓혀갈 것이며, 이미지 생성의 최전선에서 선두를 유지하는 것을 목표로 할 것”이라고 말했습니다.

SD3 Medium은 현재 Stability의 API를 통해 테스트할 수 있습니다. 모델 가중치는 개방형 비상업용 라이선스와 합리적인 가격의 크리에이터 라이선스 두 가지 라이선스 옵션으로 이용할 수 있습니다. 대규모 상업적 목적으로 SD3 Medium을 활용하는 데 관심이 있는 경우, 스타트업에 직접 연락하여 자세한 라이선스 계약을 논의하시기 바랍니다.

SD3 Medium은 Stability AI가 어려운 시기에 출시되었습니다. 2020년에 설립된 이 회사는 빠르게 제너레이티브 AI 분야에서 주목할 만한 기업으로 성장하여 Midjourney 및 OpenAI의 Dall-E와 같은 경쟁업체와 함께 인정을 받았습니다.) 2022년에는 기업 가치가 10억 달러에 달했습니다. 하지만 최근에는 법적 및 재정적 문제에 시달리고 있습니다.

스테이블리티가 자신의 작품을 무단으로 AI 모델 훈련에 사용했다는 아티스트들의 소송이 잇따라 제기되고 있습니다. 게다가 재정적 압박으로 인해 회사 매각을 고려했다는 보도도 있었습니다. 이러한 혼란으로 인해 지난 3월에는 CEO이자 설립자인 에마드 모스타크가 사임하고 탈중앙화 AI 프로젝트에 집중하기 위해 회사를 떠났습니다.

이러한 어려움에도 불구하고 Stability의 소프트웨어, 특히 SD3 Medium의 성능은 계속해서 인상적이며, 최신 결과물에서 더욱 개선된 점이 분명하게 드러나고 있습니다. Stability는 이미지 생성을 개선할 뿐만 아니라 비디오, 오디오, 언어를 포함하도록 기술을 확장하여 개발 이니셔티브에 더 넓은 범위를 반영하고 있습니다.

유사한 게시물