имя файла вида | uniq> вывод не удаляет дубликаты

Таким образом, я использую команду следующим образом:

sort file1.txt | uniq > cleared.txt

Однако файл cleared.txt имеет точно тот же размер, и все дубликаты все еще там. Вы могли объяснить что не так в способе, которым я пытаюсь сделать и возможно дать альтернативы также?

Спасибо!

Обновление: Я пытался использовать следующую команду awk, но дубликаты все еще там.

awk '!seen[$0]++'

Возможно, может быть полезно упомянуть, что файл, который я пытаюсь убрать, собран из различных файлов, которые могли бы происходить из различных стран/разметок. Обратите внимание на то, что я хочу сохранить одну копию дублированных слов.

3
задан 23 December 2016 в 05:33

1 ответ

Скорее всего, у Вас есть конечные пробелы, которые вызывают групповое обозначение. Попытайтесь разделить их с xargs, как:

sort file1 | xargs -n 1 |uniq
3
ответ дан 1 December 2019 в 16:20

Другие вопросы по тегам:

Похожие вопросы: