У меня есть fasta-файл, содержащий идентификаторы и последовательности, подобные этому:
>4S3O_2:C
GSMSQAVQTNGTQPLSKTWELSLYELQRTPQEAITDGLEIVVSPRSLHSELMCPICLDMLKNTMTTKECLHRFCADCIITALRSGNKECPTCRKKLVSKRSLRPDPNFDALISKIYPS
>5JH8_1:A
AAMVLAYYSGYAGNYAALTRYAASFNAVAVDFYNITAQGAVTGNGDPAPNDAISFLLGRKIPAYGCVSNVDGNGNWSADIAHAVSTSAQSQAVANLVKFAQDKRFSGINVDFEAVAQGDRNNFSHFI
Я хочу рекурсивно вырезать строки, содержащие идентификаторы и последовательности, и поместить их в новые несколько файлов, названных в честь соответствующих идентификаторов (цепочки исключены), поэтому например, новый файл содержит
>4S3O_2:C
GSMSQAVQTNGTQPLSKTWELSLYELQRTPQEAITDGLEIVVSPRSLHSELMCPICLDMLKNTMTTKECLHRFCADCIITALRSGNKECPTCRKKLVSKRSLRPDPNFDALISKIYPS
и он называется 4S30_2.fasta
Вот что я пробовал:
awk -F ">" | sed -i -e '$0,$1{w file.fasta d}' BlindSet150.fasta