-
생성형 AI를 활용한 디지털 에셋 창작 기술 동향인공지능 2024. 5. 2. 19:46
인공지능 기술을 활용한 디지털 에셋 생성의 최신 동향과 미래 발전 가능성을 파악합니다. 이미지 및 동영상 생성, 3D 모델링, 디지털 휴먼, 인터랙티브 콘텐츠, 그리고 콘텐츠 인터페이스 개발에 이르기까지, AI가 어떻게 창작의 경계를 넓히고 있는지 살펴봅니다.
1. 이미지 및 동영상 생성 기술
가. 이미지 생성 기술 동향
최근 AI 기술은 사진과 같은 고품질 이미지를 생성할 수 있는 능력을 갖추고 있습니다. 확산 모델(Diffusion Model)이나 안정적 확산(Stable Diffusion)과 같은 기술은 이미지 생성 과정에서 노이즈를 점진적으로 줄이며 선명한 이미지를 만들어내는 기술로 발전하고 있습니다. 이러한 기술은 예술, 엔터테인먼트, 광고 등 다양한 분야에서 활용되며 창작의 새로운 가능성을 제공합니다.
Stability AI
Activating humanity's potential through generative AI. Open models in every modality, for everyone, everywhere.
stability.ai
https://openai.com/index/dall-e-3
나. 동영상 생성 기술 동향
동영상 생성 분야에서는 Imagen Video(구글)나 Make-a-Video(메타) 등 큰 기술 회사들이 주도하고 있습니다. 이들은 짧은 텍스트 입력만으로도 실제와 같은 짧은 동영상을 생성할 수 있는 서비스를 제공하고 있으며, 이는 영화 제작, 광고 등에서 효율적인 자원 사용이 가능하게 합니다.
https://imagen.research.google/video/
Imagen Video
High Definition Video Generation with Diffusion Models
imagen.research.google
Make-A-Video by Meta AI
A state-of-the-art AI system generates high-quality videos from text prompts
makeavideo.studio
2. 3D 모델 및 장면 생성 기술
가. 3D 모델 생성 기술 동향
Nvidia의 GET3D 기술은 2D 이미지로부터 3D 객체를 생성할 수 있는 AI 기술을 제공하며, 이는 메타버스와 가상 현실의 경험을 풍부하게 합니다. 또한, 이러한 3D 모델은 즉시 사용 가능하고, 고도의 상세한 텍스처와 형태를 가진 디지털 에셋을 생성합니다.
https://research.nvidia.com/labs/toronto-ai/GET3D/
GET3D: A Generative Model of High Quality 3D Textured Shapes Learned from Images
GET3D: A Generative Model of High Quality 3D Textured Shapes Learned from Images
research.nvidia.com
https://github.com/openai/shap-e
GitHub - openai/shap-e: Generate 3D objects conditioned on text or images
Generate 3D objects conditioned on text or images. Contribute to openai/shap-e development by creating an account on GitHub.
github.com
나. 3D 장면 생성 기술 동향
최근 Nvidia가 발표한 Instant NeRF 기술은 여러 각도에서 촬영된 2D 이미지를 바탕으로 실시간 3D 장면을 생성할 수 있습니다. 이 기술은 VR/AR 응용 프로그램 및 게임 개발에 혁신을 가져오며, 사용자에게 실감나는 3D 경험을 제공합니다.
https://developer.nvidia.com/blog/getting-started-with-nvidia-instant-nerfs/
Getting Started with NVIDIA Instant NeRFs | NVIDIA Technical Blog
Johnathan Stephens provides a walkthrough of how he started using Instant NeRF.
developer.nvidia.com
3. 디지털 휴먼 창작 기술
가. 디지털 휴먼 언어 생성 모델
ChatGPT와 같은 고급 언어 모델은 사람과 거의 구별할 수 없는 수준의 대화를 생성할 수 있습니다. 이는 디지털 휴먼 기술에서 중요한 역할을 하며, 사용자와의 상호작용에서 자연스러운 대화를 가능하게 합니다.
나. 디지털 휴먼 동작 생성 모델
동작 생성 기술인 MotionGPT는 텍스트 입력을 기반으로 사람의 동작을 생성합니다. 이 기술은 가상 트레이닝, 게임 개발 및 영화 제작에서 캐릭터의 실감나는 움직임을 제공합니다.
MotionGPT
PaperAbstract Though the advancement of pre-trained large language models unfolds, the exploration of building a unified model for language and other multimodal data, such as motion, remains challenging and untouched so far. Fortunately, human motion displ
motion-gpt.github.io
4. 인터랙티브 콘텐츠 생성 기술
가. 인터랙티브 스토리텔링
AI Dungeon 같은 플랫폼은 사용자의 입력에 따라 독특한 스토리를 실시간으로 생성합니다. 이는 사용자가 직접 스토리의 진행을 결정할 수 있게 하며, 게임과 교육 분야에서 매우 유용합니다.
AI Dungeon
aidungeon.com
나. 게임 콘텐츠 생성
PCG(Procedural Content Generation) 기술은 게임 내에서 무작위로 콘텐츠를 생성하며, 이는 게임의 재플레이 가치를 높이고, 개발자가 새로운 환경과 경험을 쉽게 생성할 수 있게 합니다.
https://arxiv.org/abs/2001.09212
PCGRL: Procedural Content Generation via Reinforcement Learning
We investigate how reinforcement learning can be used to train level-designing agents. This represents a new approach to procedural content generation in games, where level design is framed as a game, and the content generator itself is learned. By seeing
arxiv.org
5. 콘텐츠 인터페이스 개발 기술
가. 멀티모달 XR 인터페이스 기술 발전 전망
멀티모달 인터페이스는 텍스트, 이미지, 음성 입력 등을 결합하여 사용자와 기기 간의 상호작용을 강화합니다. 이는 사용자 경험을 향상시키며, 보다 자연스러운 상호작용을 가능하게 합니다.
https://www.nvidia.com/ko-kr/gpu-cloud/picasso/
NVIDIA Picasso
생성형 AI 기반 시각적 애플리케이션을 구축하세요.
www.nvidia.com
나. 사용자 친화형 인터페이스 기술 동향
개인화된 사용자 경험을 제공하는 AI 기반 인터페이스는 점점 더 발전하고 있습니다. 이러한 인터페이스는 사용자의 행동 패턴과 선호도를 분석하여 맞춤형 서비스를 제공합니다.
https://blog.naver.com/naver_search/223241211096
네이버 검색 UX/UI가 개편되었습니다.
안녕하세요, 네이버 검색입니다. 올해 몇 차례의 공지를 통해 UX/UI 개선에 대한 내용을 소개해드린 바...
blog.naver.com
분야 기술 동향 예시 이미지 생성 확산 모델을 통한 고품질 이미지 생성 Stable Diffusion, DALL-E 동영상 생성 텍스트 입력으로 짧은 동영상 생성 기술 개발 Imagen Video(구글), Make a Video(메타) 3D 모델 생성 2D 이미지에서 3D 모델로의 변환을 가능하게 하는 AI 도구 Nvidia GET3D, Shap-E(OpenAI) 3D 장면 생성 실시간 3D 렌더링 및 장면 생성 기술 Nvidia의 Instant NeRF 디지털 휴먼 언어 생성 고도화된 언어 모델을 통한 자연스러운 대화 생성 ChatGPT, Google's Transformer Models 디지털 휴먼 동작 생성 텍스트 기반의 인간 동작 정보 생성 MotionGPT 인터랙티브 스토리텔링 사용자 입력에 응답하여 스토리를 생성하는 AI AI Dungeon 게임 콘텐츠 생성 무작위적이고 무한한 게임 콘텐츠 생성 PCGRL(Procedural Content Generation via Reinforcement Learning) 멀티모달 XR 인터페이스 다양한 입력 모드를 결합한 사용자 인터페이스 Nvidia 피카소(Picasso) 사용자 친화형 인터페이스 개인화된 사용자 경험 제공을 위한 인터페이스 최적화 네이버의 사용자 맞춤형 UX/UI 개편 '인공지능' 카테고리의 다른 글
인텔, 구글, AI 반도체 시장의 치열한 경쟁에 참전 (1) 2024.05.04 애플, 취리히 비밀 AI 연구소 설립과 MM1 모델 개발 (0) 2024.05.04 인공신경망 경량화 기술의 배경, 필요성, 주요기술 (0) 2024.05.02 애플, 온디바이스 AI를 위한 오픈 소스 소형언어모델 '오픈ELM' (0) 2024.04.29 엔비디아의 AI 스타트업 인수로 본 GPU 생태계 강화 및 비용 절감 전략 (0) 2024.04.29