Pero veo que estás ahí estás cambiando el tipo de empaquetado, el codec del audio (estás reencodeandolo) y si hay subs los va a perder.
Para imágenes está el detalle de que muchas plataformas eliminan los datos exif (metadatos) para optimizarlas.
Si quieres probar, hay muchas herramientas, aunque para automatizar yo lo que he usado era
exiftool (en mi caso para borrar los datos, pero igual sirve a la inversa).
Si la plataforma en cuestión elimina los datos exif, entonces solo se me ocurre cambiar la imagen, ya sea un par de pixeles al azar, cambiar el codec, ¿meterle stenografía? (esta la haría por la gracia de hacerlo).
kj