Как вырезать интервалы между строками файла и поместить их в несколько файлов?

У меня есть fasta-файл, содержащий идентификаторы и последовательности, подобные этому:

>4S3O_2:C
GSMSQAVQTNGTQPLSKTWELSLYELQRTPQEAITDGLEIVVSPRSLHSELMCPICLDMLKNTMTTKECLHRFCADCIITALRSGNKECPTCRKKLVSKRSLRPDPNFDALISKIYPS
>5JH8_1:A
AAMVLAYYSGYAGNYAALTRYAASFNAVAVDFYNITAQGAVTGNGDPAPNDAISFLLGRKIPAYGCVSNVDGNGNWSADIAHAVSTSAQSQAVANLVKFAQDKRFSGINVDFEAVAQGDRNNFSHFI

Я хочу рекурсивно вырезать строки, содержащие идентификаторы и последовательности, и поместить их в новые несколько файлов, названных в честь соответствующих идентификаторов (цепочки исключены), поэтому например, новый файл содержит

>4S3O_2:C
GSMSQAVQTNGTQPLSKTWELSLYELQRTPQEAITDGLEIVVSPRSLHSELMCPICLDMLKNTMTTKECLHRFCADCIITALRSGNKECPTCRKKLVSKRSLRPDPNFDALISKIYPS

и он называется 4S30_2.fasta

Вот что я пробовал:

awk -F ">" | sed -i -e '$0,$1{w file.fasta d}' BlindSet150.fasta 
0
задан 14 November 2021 в 20:20

0 ответов

Другие вопросы по тегам:

Похожие вопросы: