Algun experto en voz IA para hacerle una consulta

  • Autor Autor Luisin
  • Fecha de inicio Fecha de inicio
Luisin

Luisin

Ni
SEO
Verificación en dos pasos activada
Resulta que quiero copiar un canal de ytb pero con IA, me llama la atención el canal y no puedo detectar si esta hecho con IA o no, son videos que sumando son 8hrs hablando todos los dias/ TODOS los dias sin parar..

Solo tomara unos minutos y decirme si es posible o no. Actualmente estoy entrenando Coqui TTS, pero llevo dias y no logro hacer que sea consistente para crear audios largos, de momento solo creo audios de 1 minuto por bloques. Y tengo que escucharlos siempre...por que por ahi salta algún error.

Saludos. 👌
 
Respuesta de una línea: Se puede pero es muy difícil, se necesita programar en Python y automatizar para que el audio se repare automáticamente.

Después de cierta cantidad de palabras (o tiempo) empieeezaaa a ponerse la voooz maaas aguda o muy raraaaaaaa??
En algunos audios generados se escuchan breeerbrorororo griirie o ruidos raros como si le estuviera dando una embolia a la IA??
Una voz con acento español se vuelve acento latino en algunos párrafos o visceversa???

Bienvenido a CoquiTTS y sus modelos TTS...

Seré curioso... ¿cómo llegaste a CoquiTTS? ¿algún tutorial de youtube?

El año pasado tenía CoquiTTS funcionaba bien, las voces una maravilla y se actualizó de golpe el modelo, todo cambió... tuve que clonar las voces de nuevo con el modelo, pero el mismo día se volvió a actualizar, al final volví al primer modelo.

Es como tú dices, SE TIENE QUE REVISAR CADA AUDIO PARA EVITAR SORPRESAS DESAGRADABLES... incluso en un video al final parecía una oración satánica de la IA, ya estaba publicado y recibiendo views, tuve que editar en YouTube!

Pero este año, ya logré desarrollar audios de 1 hora sin tener que revisar.

99% sin errores y ahora el 1% es simplemente un suspiro de la IA "sighhh" o un pequeño "golpe de microfono" de 5ms.

No fue fácil, tuve que programar mucho, utilizar programas externos, crear verificaciones de audio, etc. Al final está en python, c++ y c# para la interfaz gráfica.
Te mando MP.
 
Me interesa conocer ese canal
 
Atrás
Arriba