A menos que tengas una PC muy potente y sepas cómo sacarle jugo a Hunyuan o WAN 2.1 con buenos flujos en ComfyUI, lo más práctico por ahora es usar Google Veo 3 (o esperar un par de años hasta que aparezca una alternativa open source a la altura).
Ejemplo de flujo en ComfyUI:
min 4:01
-
-
Lo que serviría como reemplazo de Veo 3 (pero peor calidad)
Wan CausVid lora + VACE for i2v / controls + MMAudio.
y tal vez con LayerFlow quitarle el fondo: min 11:58
Aclaro que esta respuesta se quedara obsoleta seguro en unos meses o semanas, ya que avanza rápido la IA/modelos/precios/empresas ofreciéndolo
------------------------------
EDIT:
este open source aun le falta mucho para la calidad de veo3. (se necesita GPU de 96GB, aun no esta en ComfyUI)
HeyGen, rated 4.8/5 on G2, is the #1 AI video generator of 2025. Create professional AI-powered avatar videos, translate content, and bring ideas to life.
V03 AI: Google Veo 3 powered AI video generator for realistic videos with audio, v03 ai supports text to video and image to video by fast and quality mode.