Ltx2 Pro Audio-to-Video - GMI Cloud Documentation

Generates video driven by audio input, optionally guided by image or prompt. Model

ltx-2-pro-audio-to-video

Inputs

Required

audio / audio_url (AUDIO or STRING)
Audio input file (2–20 seconds).

Optional

prompt (STRING)
Text guidance for scene generation.
image / image_url (IMAGE or STRING)
Optional first-frame visual reference.
resolution (STRING, default: 1920x1080)
Output resolution.
guidance_scale (FLOAT, default: 5)
Strength of prompt adherence.

Outputs

video (VIDEO)
Generated video.
video_url (STRING)
Public video URL.
file_path (STRING)
Local saved file path.

Ltx2 Fast TextToVideo Ltx2 Pro ImageToVideo