스테이블 비디오 디퓨젼(Stable Video Diffusion) 출시

스테이블 비디오 디퓨젼(Stable Video Diffusion) 출시

카테고리 없음 2023. 11. 23. 23:08

2023년 11월 21일, 이미지 모델인 스테이블 디퓨전을 기반으로 하는 생성형 비디오의 첫 번째 기반 모델인 스테이블 비디오 디퓨전을 출시합니다.

현재 연구용 프리뷰 버전으로 제공되는 이 최첨단 제너레이티브 AI 비디오 모델은 모든 유형의 사용자를 위한 모델을 만들기 위한 여정에서 중요한 한 걸음을 내딛는 것입니다.

이번 연구용 릴리스를 통해 안정적인 비디오 확산을 위한 코드를 GitHub 저장소에서 사용할 수 있으며, 로컬에서 모델을 실행하는 데 필요한 가중치는 Hugging Face 페이지에서 확인할 수 있습니다. 모델의 기술적 기능에 대한 자세한 내용은 연구 논문에서 확인할 수 있습니다.

다양한 비디오 애플리케이션에 적용 가능

유니티의 비디오 모델은 멀티뷰 데이터 세트에 대한 미세 조정을 통해 단일 이미지에서 멀티뷰 합성을 비롯한 다양한 다운스트림 작업에 쉽게 적용될 수 있습니다. 안정적인 확산을 중심으로 구축된 생태계와 유사하게 이 기반을 구축하고 확장하는 다양한 모델을 계획하고 있습니다.

미세 조정된 비디오 모델에서 멀티뷰 생성 샘플 보기

또한, 오늘부터 여기에서 대기자 명단에 등록하여 곧 출시될 텍스트-투-비디오 인터페이스를 갖춘 새로운 웹 환경에 액세스하실 수 있습니다. 이 도구는 광고, 교육, 엔터테인먼트 등 다양한 분야에서 안정적인 동영상 확산의 실제 적용 사례를 보여줍니다.

경쟁력 있는 성능

안정적인 비디오 확산은 초당 3~30프레임의 맞춤형 프레임 속도로 14프레임과 25프레임을 생성할 수 있는 두 가지 이미지-투-비디오 모델 형태로 출시되었습니다. 기본 형태로 출시될 당시 외부 평가를 통해 이 모델들은 사용자 선호도 조사에서 주요 폐쇄형 모델을 능가하는 것으로 나타났습니다.

연구 전용

최신 발전 사항으로 모델을 열심히 업데이트하고 사용자의 피드백을 반영하기 위해 노력하고 있지만, 이 모델은 현재 단계에서는 실제 또는 상업용 애플리케이션을 위한 것이 아니라는 점을 강조합니다. 안전과 품질에 대한 사용자의 인사이트와 피드백은 최종 출시를 위해 이 모델을 개선하는 데 중요합니다.

이는 새로운 방식의 이전 릴리스와도 일치하며, 전체 릴리스를 여러분과 공유할 수 있기를 기대합니다.

계속 확장되는 AI 모델 제품군

스테이블 비디오 확산은 다양한 오픈 소스 모델에 추가된 자랑스러운 제품입니다. 이미지, 언어, 오디오, 3D, 코드 등 다양한 양식을 아우르는 이 포트폴리오는 인간의 지능을 증폭하기 위한 Stability AI의 헌신을 입증합니다.

https://stability.ai/news/stable-video-diffusion-open-ai-video-model

Introducing Stable Video Diffusion — Stability AI

Stable Video Diffusion is a proud addition to our diverse range of open-source models. Spanning across modalities including image, language, audio, 3D, and code, our portfolio is a testament to Stability AI’s dedication to amplifying human intelligence.

stability.ai

저작자표시 비영리 변경금지

ABOUT ME

Triangular Triangular

티스토리툴바