Как найти неопределенное повторение в строках текста

У меня есть обучающие видео, которые я пытаюсь записать на DVD с использованием Bombono DVD вместе с соответствующими субтитрами. Субтитры (файлы .srt) имеют следующий формат:

1 00: 00: 00,000 -> 00: 00: 02,000 В видео, где мы представили атом, я пошел

2 00: 00: 02,000 -> 00: 00: 06,000 немного о том, как в центре атома мы имеем ядро ​​

3 00: 00: 06,000 -> 00: 00: 09,000, и на самом деле это очень малая часть

и т. д.

Однако в субтитрах есть довольно много ошибок, в которых время для строки равно нулю секунд. Например:

81 00: 03: 37 000 -> 00: 03: 37 000 немного быстрее.

Когда программа для создания DVD-дисков находит эти строки, она отменяет весь процесс записи DVD. Я могу выяснить, какая строка вызвала ошибку, но затем мне нужно снова запустить запись, прежде чем я узнаю, где находится следующая.

Мой вопрос заключается в том, можно ли создать сценарий, который будет искать все файлы субтитров и находить все повторения в одной строке, если я не знаю, какая именно строка повторяется. По сути, можно ли показать каждую строку, в которой повторяются 12 символов, без указания того, что это за символы (поскольку они различны в каждом случае?)

Спасибо за вашу помощь.

0
задан 5 February 2014 в 23:23

1 ответ

awk '$2 == $4 {print NR ":" $0}' filename

произведет все незаконные строки с номером строки.

1
ответ дан 5 February 2014 в 23:23

Другие вопросы по тегам:

Похожие вопросы: