Tutorial: Clonando voces con IA | so-vits-svc

  • Autor Autor gabrielher
  • Fecha de inicio Fecha de inicio
Ahora lo estoy probando en un ubuntu server, instalado en mi pc, va mucho más rápido.
Con la 3070 estoy usando barch_size =8 , y epochs voy a meterle 1000 (tengo 200 audios en esta prueba)
Tarda aproximadamente 12segundos por epoch, a ver cuando termina que tal ha salido todo...
 

Es posible utilizar una GPU amd 6700 xt de 12gb?
 
Tengo entendido que de momento solo se puede con Nvidia (cuda)
Bueno, por suerte tengo mi 3060 guardada en una caja, tocara armar otra PC ya que no quiero dejar de usar mi 6700xt
 
Gracias por el aporte amigo.
 
Gracias, ya me habían comentado de esto, El finde semana me pongo con esto,

Sabes si para correr esto en modo local se necesita algo en especifico? con sable difusión uso una 3090 para usarlo en local.
¿Te parece que los resultados son buenos? ¿Existe una mejor alternativa a este método?
 
¿Te parece que los resultados son buenos? ¿Existe una mejor alternativa a este método?
Para ser una herramienta gratuita si son muy buenos, hay otra herramienta de pago que no me acuerdo el nombre esa si era mejor,

Pero depende como lo entrenes por ejemplo yo utilice un dataset de casi 2 horas de voz divididos en algo mas de 1k archivos de audio. lo entrene por unas 50 horas.

Dejaba toda la noche entrenando mientras dormía y al día siguiente comparaba la calidad con el archivo de hoy con el del día anterior. Y si, se notaba la mejora.

cuando genero audios con mi voz en ingles también va bien.

y no, no conozco otra alternativa gratuita, pero conforme pase el tiempo mejorara y como es de código abierto hay mucho mas gente intentando optimizar.
 
¿Usas está opción o solo la estabas probando? La veo bastante factible para utilizarla creando contenido de calidad sin parecer tan robótica la voz, estaba pensando usar Eleven laps, pero creo que son inferiores a esta opcion.
 
¿Usas está opción o solo la estabas probando? La veo bastante factible para utilizarla creando contenido de calidad sin parecer tan robótica la voz, estaba pensando usar Eleven laps, pero creo que son inferiores a esta opcion.
uso esa voz y sin problemas con YT o el algoritmo, el primer video que subí usando mi voz con so-vits-svc fue hace 8 días ahora tiene 3,1M de views, el 2do video que subí hace 2 días ya tiene 1,1M de visitas.

Pero siempre voy con la idea que esto es temporal, de alguna manera YT se dará cuenta que son voces IA y bajara el alcance perjudicando al canal.
 
Muy buenos resultados, no demuestra haber mucho problemas en primer plano.

¿Has comprobado eso del alcance del canal? No había escucha directamente algo así, pero si lo veo factible.
 
Me falta aprender mucho sin duda. Terminé mareada intentando entender qué hacer 😭 😭
 
Gracias por el dato, vamos a probar a ver que tal suena, menos mal google colab nos presta GPU, aunque a veces toca esperar mucho para que estén disponibles. Ojalá y se pudieran compilar con kaggle code
 
como haces para generarlo con tu voz en ingles?
 
ojalá no tuviera una piedra de pc xd

o al menos que se pudiera realizar desde el movil.
 
excelente aporte amigo justo lo que buscaba