Whisper


Whisper es un modelo de IA de código abierto para el reconocimiento de voz multiidioma desarrollado por OpenAI y entrenado con 680.000 horas de audio en cerca de 100 idiomas diferentes. Con unos requisitos computacionales moderados, alcanza un rendimiento similar a los modelos más avanzados, tanto de código abierto como de sistemas comerciales.


AutoSubs.net


AutoSubs.net es una aplicación web para la transcripción, traducción y subtitulado automático, uniendo en un flujo de trabajo automatizado la transcripción mediante el modelo Whisper, servicios de traducción como DeepL o Google Translate y el incrustado de los subtítulos generados en el vídeo. También ofrece la opción de voz superpuesta mediante síntesis de voz en autosubs.net/voz.