| 핵심 모드 | 텍스트를 비디오로, 이미지를 비디오로, 피사체 기반 비디오 생성, 비디오 편집, 비디오-투-비디오 편집, 피사체+비디오 기반 비디오-투-비디오 편집을 지원합니다. | 텍스트, 이미지, 오디오, 비디오 입력을 하나의 통합 멀티모달 생성 흐름에서 지원합니다. | 텍스트를 비디오로, 이미지 가이드 생성, 비디오 확장, 첫 프레임과 마지막 프레임 기반 생성을 지원합니다. |
|---|
| 레퍼런스와 편집 제어 | 참조 이미지에서 피사체 정체성을 유지하고, 움직임, 구도, 수정하지 않은 영역을 안정적으로 보존하면서 기존 비디오를 편집합니다. | 이미지, 오디오, 비디오 레퍼런스를 활용하면서 연기, 조명, 그림자, 카메라 움직임을 더 강하게 제어합니다. | 최대 3장의 참조 이미지와 첫 프레임/마지막 프레임 가이드를 사용해 더 촘촘한 장면 설계와 샷 제어를 제공합니다. |
|---|
| 오디오 생성 | 대사, 환경음, 표현력 있는 보컬 연기를 포함한 동기화된 오디오비주얼 결과물을 생성합니다. | 오디오와 비디오를 하나의 멀티모달 공동 생성 흐름 안에서 함께 생성합니다. | 고충실도 비디오 출력과 함께 네이티브 오디오를 생성합니다. |
|---|
| 출력 스타일과 품질 | 시네마틱한 출력, 강한 의미 이해, 물리적으로 설득력 있는 움직임, 안정적인 멀티샷 장면, 최대 15초 1080p 비디오를 지향합니다. | 멀티모달 범위, 움직임 안정성, 몰입형 오디오비주얼 결과, 디렉터 수준의 장면 제어를 지향합니다. | 720p, 1080p, 4K의 8초 고충실도 비디오, 가로/세로 출력, 강한 이미지 가이드 제어를 지향합니다. |
|---|
| 잘 맞는 경우 | 시네마틱한 짧은 출력, 피사체 일관성, 동기화된 오디오, 생성에서 편집까지 이어지는 흐름이 필요할 때 가장 잘 맞습니다. | 가장 폭넓은 멀티모달 입력과 하나의 제작 파이프라인 안에서 더 강한 레퍼런스 제어가 필요할 때 가장 잘 맞습니다. | 이미지 가이드 생성, 프레임 단위 제어, 세로 또는 가로 출력, API 지향 제작 흐름이 필요할 때 가장 잘 맞습니다. |
|---|