메타(Meta)는 지난 10월 4일, 동영상 생성 인공지능(AI) 모델인 '무비 젠(Movie GEN)'을 발표하며, 텍스트 입력을 통해 최대 16초 길이의 동영상을 자동으로 생성할 수 있는 기술을 공개했습니다.
무비 젠은 텍스트 기반 동영상 생성뿐만 아니라 기존 동영상 편집 및 오디오 생성 기능도 포함하고 있어, 창의적인 동영상 제작을 더욱 간편하게 해주는 도구로 주목받고 있습니다.
Meta Movie Gen
Text input summary: A woman paints a canvas on an easel, in a wood-paneled room. The woman is wearing a white shirt. She has a calm expression as she concentrates on her work. A baby bear cub stands at her feet. The lighting is cool. Text input summary: Ma
ai.meta.com
무비 젠의 주요 기능과 특징
1. 텍스트 기반 동영상 생성
사용자는 간단한 텍스트 프롬프트를 통해 고화질(HD)의 동영상을 생성할 수 있습니다. 최대 1080p 해상도의 16초짜리 영상을 만들어주며, 카메라 모션, 객체 상호작용, 환경 물리학 등의 복잡한 요소까지 자동으로 처리하는 강력한 AI 기능을 자랑합니다.
2. 개인화된 동영상 제작
사용자가 자신이나 다른 사람의 이미지를 업로드하면 AI가 이를 바탕으로 맞춤형 동영상을 생성합니다. 예를 들어, 특정 인물의 사진을 넣고 다양한 설정을 추가해 자신만의 스토리를 담은 동영상을 제작할 수 있습니다.
3. 정밀한 비디오 편집
기존 동영상의 특정 요소, 예를 들면 객체나 색상을 변경하거나 배경을 교체하는 등의 고급 편집 기능도 제공합니다. 텍스트 명령을 통해 간단하게 영상의 일부분을 수정할 수 있어, 영상 제작자의 작업을 더욱 쉽게 만듭니다.
4. 오디오 생성
무비 젠은 영상과 완벽하게 동기화된 배경음악 및 효과음을 자동으로 생성하는 오디오 기능도 탑재하고 있습니다. 이를 통해 사용자는 비디오의 분위기에 맞는 다양한 사운드를 생성할 수 있으며, 발자국 소리나 바람이 부는 소리와 같은 '폴리(Foley) 사운드'도 구현이 가능합니다.
기술적 배경과 발전 과정
메타는 이번 무비 젠 모델이 '메이크 어 비디오(Make-A-Video)'와 같은 이전 프로젝트 및 라마(LLaMA) 이미지 모델 등에서 축적된 연구 결과를 바탕으로 개발되었다고 밝혔습니다. 특히, 시간 경과에 따른 데이터셋 분포 변화를 모델링하는 '플로우 매칭(Flow Matching)' 기술을 적용하여 비디오의 자연스러운 다음 장면을 유추하고, 더욱 매끄러운 영상 제작이 가능하도록 했습니다.
경쟁 구도와 시장 전망
무비 젠의 발표는 동영상 생성 AI 분야에서 메타가 오픈AI, 구글과의 경쟁을 본격화하는 신호탄이기도 합니다. 오픈AI는 2023년 2월 '소라(Sora)'를, 구글은 5월 '비오(Veo)'를 각각 공개하며 이 분야에서 선두를 다투고 있습니다. 이 밖에도 런웨이, 루마와 같은 스타트업들이 경쟁적으로 비디오 생성 AI 서비스를 선보이고 있는 상황입니다. 메타는 이러한 경쟁 속에서 무비 젠이 동영상 생성 AI 모델 중에서도 가장 앞선 기술을 보유하고 있다고 자신감을 드러냈습니다.
향후 계획
현재 무비 젠은 메타 내부 직원 및 일부 영화 제작자들에게 우선 제공되고 있으며, 내년 중으로 인스타그램, 왓츠앱, 메신저 등의 메타 플랫폼에 통합될 예정입니다. 이를 통해 더욱 많은 사용자들이 쉽게 동영상을 제작하고 공유할 수 있을 것으로 기대됩니다. 다만, 무비 젠은 오픈 소스로 공개되지 않을 계획이며, 메타 플랫폼에서만 제공될 예정입니다.
메타는 무비 젠을 통해 다양한 창작자들, 특히 영화 제작자와 크리에이터들이 손쉽게 동영상을 제작하고 창의력을 발휘할 수 있는 도구로 자리매김하겠다는 목표를 밝히고 있습니다.
'AI 동향' 카테고리의 다른 글
오픈AI 새 모델 'GPT-4o', 영화 Her의 실현? (0) | 2024.05.16 |
---|---|
Llama3 출시 : 오픈소스 AI의 발전 (1) | 2024.04.29 |
구글, 트랜스포머 아키텍처의 한계 극복하는 인피니-어텐션 발표 (0) | 2024.04.17 |
AI와 음악의 만남, 유디오의 세계로 여행하다 (0) | 2024.04.15 |
데이터브릭스, 범용 LLM 'DBRX' 출시 (0) | 2024.03.28 |