У меня есть куча аудиофайлов, содержащих обычную речь, в основном в формате mp3, которую я хотел бы преобразовать в текст. Кто-нибудь знает о программном обеспечении, которое может сделать это?
Попробуйте Mozilla DeepSpeech приложение с открытым исходным кодом, которое можно запустить как отдельное приложение, или Приложение Transcribear для преобразования речи в текст на основе браузера, которое потребует подключения к сети и загрузки записи на сервер Transcribear