Этот вопрос может уже иметь ответ здесь:
Как разделить речь, и фоновая музыка из видеофайла 3 отвечает Нет, мой вопрос отличается. Я отредактирую, чтобы объяснить как. У меня есть файл фильма mp4, я извлек аудио из видеофайла с помощью FFMPEG (ffmpeg-i видео mp4-c:a pcm_s16le audio.wav).
Теперь от звукового файла я могу получить форму сигнала, есть ли какой-либо способ, которым я могу дифференцировать музыку и речь от звукового файла в форме сигнала, и действительно ли это - лучший способ дифференцироваться? Мне требуются время начала и время окончания музыки от извлеченного звукового файла.
Так, в конце я мог бы получать несколько или единственный музыкальный файл от звукового файла.
Я видел Ваш вопрос ранее сегодня и работал над другим проектом.
Я еще не протестировал это, но смелость имеет фильтр, чтобы попытаться удалить вокалы или изолированные вокалы. Я испытываю затруднения при делении снимка, но структура меню была бы:
Мое чтение об этом (поиск Google) указывает, что работает хорошо при определенных обстоятельствах - например, если вокалы находятся на двух дорожках, и все инструменты или другие звуки разделяются между двумя дорожками.
Существует второй фильтр, меню "Vocal Remover " in the Plug-in 16 to 17", которое может также работать.