Как grep последовательность fasta, используя список идентификаторов в другом файле?

У меня есть большой файл последовательности fasta и список идентификаторов. Мне нужно grep некоторые последовательности с заголовком, используя их идентификаторы из другого файла. Вот примеры файлов.

Файл 1:

>AB1234 ACGTAGATA >AB3456 ACGATAGAT >AB4567 ACGTGTGA

Файл 2

>AB1234 >AB3456
0
задан 14 November 2017 в 23:03

4 ответа

У вас может быть grep чтение паттернов из файла, по одному шаблону в строке, с опцией -f:

grep -x -F -A 1 -f 'File 2' 'File 1'

Кроме того,

-F интерпретирует шаблоны буквально, а не как регулярные выражения, -x соответствует только целым строкам, -A N печатает N строки после каждого совпадения.
1
ответ дан 18 July 2018 в 03:17

Я получил это для работы:

for i in $(cut -d" " -f1- file2); do grep -o "$i" file1 | tee -a result.txt; done

Предположение file1 == id файл и file2 == файл, который должен быть greped

Result.txt :

AB1234 AB3456
0
ответ дан 18 July 2018 в 03:17

У вас может быть grep чтение паттернов из файла, по одному шаблону в строке, с опцией -f:

grep -x -F -A 1 -f 'File 2' 'File 1'

Кроме того,

-F интерпретирует шаблоны буквально, а не как регулярные выражения, -x соответствует только целым строкам, -A N печатает N строки после каждого совпадения.
1
ответ дан 24 July 2018 в 17:48

Я получил это для работы:

for i in $(cut -d" " -f1- file2); do grep -o "$i" file1 | tee -a result.txt; done

Предположение file1 == id файл и file2 == файл, который должен быть greped

Result.txt :

AB1234 AB3456
0
ответ дан 24 July 2018 в 17:48
  • 1
    Я ищу, чтобы получить последовательность, основанную на их идентификаторах. Я ожидаю результата. & gt; AB1234 ACGTAGATA & gt; AB3456 ACGATAGAT – Manoj Kumar 15 November 2017 в 05:20
  • 2
    Измените свой вопрос и покажите нам файл id и ожидаемый результат. – George Udosen 15 November 2017 в 08:45

Другие вопросы по тегам:

Похожие вопросы: