Подсчет дублированных слов в текстовом файле

У меня есть 20 МБ файл с текстом и идентификаторами. Мне нужен grep или что-то еще, чтобы посчитать и показать дубликаты идентификаторов.

1
задан 7 June 2012 в 11:22

1 ответ

awk '{print $2}' file_name | sort | uniq -c | sort -n | awk '$1>1 {print $2}' > duplicates
for x in $(< duplicates); do grep -n $x file;
done

, так что, если у вас есть идентификаторы во втором столбце, он напечатает идентификаторы дубликатов

Примечание. В file_name укажите имя вашего файла.

0
ответ дан 7 June 2012 в 11:22

Другие вопросы по тегам:

Похожие вопросы: