Recomienden Software para clonar voz y si es de paga, que permita bastante texto

  • Autor Autor Criktonita
  • Fecha de inicio Fecha de inicio
C

Criktonita

Gamma
Verificado por Whatsapp
¡Usuario con pocos negocios! ¡Utiliza siempre saldo de Forobeta!
Hola gente qué tal, como dice el título, alguien conoce algun programa para clonar mi voz y que permita generar de acuerdo a un texto extenso y si se paga que sea acorde a lo convertido? porque he visto unas por ahi donde te cobran como 100 dolares y solo te permite algo de 10 mil palabras por mes...
 
Uh, me interesa.

Esperemos al que ya tiene mil voces clonadas para ver si conviene o no.
 
Yo también ando buscando eso , quiero clonar la voz una persona misma y que diga las palabras que yo quiera que diga en el texto
 
Creo haber visto en Youtube algunos tutoriales con código en colab para clonar la voz, no lo he intentado pero a de servir, muchos suelen utilizar este método para poder realizar videos con mayor facilidad
 
elevenlabs
 
👇ofrezco el servicio por si te interesa 👇

 
Si te das maña podes usar Coquitts https://github.com/aitrepreneur/xtts-webui Eso si, vas a requerir aprender a entrenar bien las voces en español. Igual por ahi te va a tocar darle una revisión, no es perfecta del todo.
 
Última edición:
la mejor opción calidad-precio seria rentar una PC con GPU por hora e instalar por ejemplo Applio, clona voces y como es local open source seria ilimitado, el precio por hora va a depender de la GPU rentada, por ejemplo una RTX A6000 tiene un costo por hora de 0.31$ pero puedes conseguir opciones mas económicas
otra ventaja es que aparte del clonador de voz podrías instalar todo un paquete de creación por ejemplo:

Ollama: para tener tu propio llm y te ahorras pagar chatGPT
Applio: Clonación de voz de alta calidad ilimitado
Flux: Para crear las imágenes y miniaturas
Stable Video Diffusión: Para crear videos que puedan completar tu creacion

hay muchas plataformas para rentar GPU en la nube actualmente, seria cuestion de que investigues cual te conviene mas
yo solo he probado esta: massedcompute.com
actualmente tengo mi propia GPU y pues hago todo en local
 
la mejor opción calidad-precio seria rentar una PC con GPU por hora e instalar por ejemplo Applio, clona voces y como es local open source seria ilimitado, el precio por hora va a depender de la GPU rentada, por ejemplo una RTX A6000 tiene un costo por hora de 0.31$ pero puedes conseguir opciones mas económicas
otra ventaja es que aparte del clonador de voz podrías instalar todo un paquete de creación por ejemplo:

Ollama: para tener tu propio llm y te ahorras pagar chatGPT
Applio: Clonación de voz de alta calidad ilimitado
Flux: Para crear las imágenes y miniaturas
Stable Video Diffusión: Para crear videos que puedan completar tu creacion

hay muchas plataformas para rentar GPU en la nube actualmente, seria cuestion de que investigues cual te conviene mas
yo solo he probado esta: massedcompute.com
actualmente tengo mi propia GPU y pues hago todo en local
Esa empresa massedcompute, aunque no la ve investigado, se ve como pequeña o algo. No me inspira confianza, pero tiene precios adecuados.
 
Esa empresa massedcompute, aunque no la ve investigado, se ve como pequeña o algo. No me inspira confianza, pero tiene precios adecuados.
confianza de que ? solo vas a rentar una GPU en la nube, que te pueden robar? 0.37 centavos?
creo que hay que dejar la paranoia un poco...
 
se acerca bastante a la realidad?
algo, parece más humano pero es voz neutra. Pero tendrás k hacer muchas pruebas. Funciona mejor en inglés.También me ha creado unas voces muy random pero se ven naturales más o menos xd
 
¿Tu solución para hacer vídeos automáticos proviene de china?
Creo que todas son de china, todos parten del mismo fork y de ahi van creando variantes.. Ya vas buen tiempo pregúntame cosas. Tomate un fin de semana y comienza a hacer pruebas es la única manera de aprender y oír los resultados por ti mismo.
se acerca bastante a la realidad?
En todas estas IAs de código abierto, lo importante es el entrenamiento, mientras tengas mejor data de muestra y entrenes el resultado será mejor.
Pero si sobre entrenas pierdes calidad tienes que usar herramientas como tensorflow para ver el punto exacto de calidad.
 
Atrás
Arriba