Как вставить другой заголовок для каждой строки с sed?

Question 1

Я не могу прокомментировать ответ, потому что мне не хватает репутации, но мой муж сделал это обновление на Precise, и он полностью закрыл свою систему, и ему пришлось сделать полную переустановку. Поэтому мой совет будет, если вы используете Precise 12.04, не делайте этого обновления. Мы потратили часы, пытаясь восстановить его систему из-за этого.

Было бы здорово, если бы вместо простого размещения сообщения и кнопки установки в центре обновления они оставили ссылку, чтобы вы знали что это было.

Question 2

Поскольку вы специально попросили решение sed (я бы не предлагал на самом деле делать это таким образом, но вы могли бы):

$ sed = file | sed '1~2 s/^/>seq/'
>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

Первый вызов sed = file вставляет номера голой строки, затем второй украсит их, добавив строку >seq.

OTOH, если вы заранее знаете, что есть 770 строк, тогда вы можете сделать

printf ">seq%d\n" {1..770} | sed 'R file'

, хотя это зависит от расширения GNU sed R:

R filename Очередь очереди имени файла для чтения и вставки в выходной поток в конце текущего цикла или при следующем входе строка читается. Обратите внимание, что если имя файла не может быть прочитано или если его конец достигнут, строка не добавляется, без каких-либо признаков ошибки.

Конечно, если вы не знаете количество строк раньше времени, вы можете сделать

printf ">seq%d\n" $(seq 1 "$(wc -l < file)") | sed 'R file'

, но это потеряет преимущество только в том, что нужно только один раз прочитать файл .

На практике я, вероятно, использовал бы awk-решение @ John1024 или его эквивалент perl

perl -lpe 'print ">seq" . $.' file

Question 3

Question 4

Поскольку вы специально попросили решение sed (я бы не предлагал на самом деле делать это таким образом, но вы могли бы):

$ sed = file | sed '1~2 s/^/>seq/'
>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

Первый вызов sed = file вставляет номера голой строки, затем второй украсит их, добавив строку >seq.

OTOH, если вы заранее знаете, что есть 770 строк, тогда вы можете сделать

printf ">seq%d\n" {1..770} | sed 'R file'

, хотя это зависит от расширения GNU sed R:

R filename Очередь очереди имени файла для чтения и вставки в выходной поток в конце текущего цикла или при следующем входе строка читается. Обратите внимание, что если имя файла не может быть прочитано или если его конец достигнут, строка не добавляется, без каких-либо признаков ошибки.

Конечно, если вы не знаете количество строк раньше времени, вы можете сделать

printf ">seq%d\n" $(seq 1 "$(wc -l < file)") | sed 'R file'

, но это потеряет преимущество только в том, что нужно только один раз прочитать файл .

На практике я, вероятно, использовал бы awk-решение @ John1024 или его эквивалент perl

perl -lpe 'print ">seq" . $.' file

Question 5

Поскольку вы специально попросили решение sed (я бы не предлагал на самом деле делать это таким образом, но вы могли бы):

$ sed = file | sed '1~2 s/^/>seq/'
>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

Первый вызов sed = file вставляет номера голой строки, затем второй украсит их, добавив строку >seq.

OTOH, если вы заранее знаете, что есть 770 строк, тогда вы можете сделать

printf ">seq%d\n" {1..770} | sed 'R file'

, хотя это зависит от расширения GNU sed R:

R filename Очередь очереди имени файла для чтения и вставки в выходной поток в конце текущего цикла или при следующем входе строка читается. Обратите внимание, что если имя файла не может быть прочитано или если его конец достигнут, строка не добавляется, без каких-либо признаков ошибки.

Конечно, если вы не знаете количество строк раньше времени, вы можете сделать

printf ">seq%d\n" $(seq 1 "$(wc -l < file)") | sed 'R file'

, но это потеряет преимущество только в том, что нужно только один раз прочитать файл .

На практике я, вероятно, использовал бы awk-решение @ John1024 или его эквивалент perl

perl -lpe 'print ">seq" . $.' file

Question 6

Ваша задача может быть выполнена с помощью sed, но sed не имеет никакого естественного понимания арифметики, что делает ее неправильным инструментом. Awk хорошо работает:

$ awk '{print ">seq" NR} 1' file
>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

Как это работает:

print ">seq" NR Для каждой новой строки, прочитанной, сначала напечатаем требуемый заголовок. NR - счетчик строк awk. 1 Это критическая стенограмма awk для печати.

Question 7

Question 8

Использование простой петли:

count=1; while read -r line ; do printf '>seq%d\n%s\n' $((count++)) "$line"; done < file

Выход:

>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

Question 9

Использование paste:

 paste -d '\n' <(seq -f '>seq%g' 1 4) file

seq -f '>seq%g' 1 4 записывает номера, разделенные символом новой строки, в stdout & lt; (...) - подстановка процесса paste объединяет соответствующую строку каждого файла, разделенная по разделителю -d '\n' устанавливает разделитель конкатенации в новую строку вместо закладки по умолчанию

Question 10

Использование простой петли:

count=1; while read -r line ; do printf '>seq%d\n%s\n' $((count++)) "$line"; done < file

Выход:

>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

Question 11

Использование paste:

 paste -d '\n' <(seq -f '>seq%g' 1 4) file

seq -f '>seq%g' 1 4 записывает номера, разделенные символом новой строки, в stdout & lt; (...) - подстановка процесса paste объединяет соответствующую строку каждого файла, разделенная по разделителю -d '\n' устанавливает разделитель конкатенации в новую строку вместо закладки по умолчанию

Question 12

Ваша задача может быть выполнена с помощью sed, но sed не имеет никакого естественного понимания арифметики, что делает ее неправильным инструментом. Awk хорошо работает:

$ awk '{print ">seq" NR} 1' file
>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

Как это работает:

print ">seq" NR Для каждой новой строки, прочитанной, сначала напечатаем требуемый заголовок. NR - счетчик строк awk. 1 Это критическая стенограмма awk для печати.

Question 13

Question 14

Использование простой петли:

count=1; while read -r line ; do printf '>seq%d\n%s\n' $((count++)) "$line"; done < file

Выход:

>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

Question 15

Использование paste:

 paste -d '\n' <(seq -f '>seq%g' 1 4) file

seq -f '>seq%g' 1 4 записывает номера, разделенные символом новой строки, в stdout & lt; (...) - подстановка процесса paste объединяет соответствующую строку каждого файла, разделенная по разделителю -d '\n' устанавливает разделитель конкатенации в новую строку вместо закладки по умолчанию

Question 16

Ваша задача может быть выполнена с помощью sed, но sed не имеет никакого естественного понимания арифметики, что делает ее неправильным инструментом. Awk хорошо работает:

$ awk '{print ">seq" NR} 1' file
>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

Как это работает:

print ">seq" NR Для каждой новой строки, прочитанной, сначала напечатаем требуемый заголовок. NR - счетчик строк awk. 1 Это критическая стенограмма awk для печати.

steeldriver · Accepted Answer · 22 May 2018 в 19:19

Поскольку вы специально попросили решение sed (я бы не предлагал на самом деле делать это таким образом, но вы могли бы):

$ sed = file | sed '1~2 s/^/>seq/'
>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

Первый вызов sed = file вставляет номера голой строки, затем второй украсит их, добавив строку >seq.

OTOH, если вы заранее знаете, что есть 770 строк, тогда вы можете сделать

printf ">seq%d\n" {1..770} | sed 'R file'

, хотя это зависит от расширения GNU sed R:

R filename Очередь очереди имени файла для чтения и вставки в выходной поток в конце текущего цикла или при следующем входе строка читается. Обратите внимание, что если имя файла не может быть прочитано или если его конец достигнут, строка не добавляется, без каких-либо признаков ошибки.

Конечно, если вы не знаете количество строк раньше времени, вы можете сделать

printf ">seq%d\n" $(seq 1 "$(wc -l < file)") | sed 'R file'

, но это потеряет преимущество только в том, что нужно только один раз прочитать файл .

На практике я, вероятно, использовал бы awk-решение @ John1024 или его эквивалент perl

perl -lpe 'print ">seq" . $.' file

Спасибо steeldriver за ваше приятное объяснение, он также работал. Я попросил sed, потому что это команда, которую я знаю. — Idalia Rojas, 18 August 2017 в 23:36

steeldriver · Accepted Answer · 18 July 2018 в 08:18

Поскольку вы специально попросили решение sed (я бы не предлагал на самом деле делать это таким образом, но вы могли бы):

$ sed = file | sed '1~2 s/^/>seq/'
>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

Первый вызов sed = file вставляет номера голой строки, затем второй украсит их, добавив строку >seq.

OTOH, если вы заранее знаете, что есть 770 строк, тогда вы можете сделать

printf ">seq%d\n" {1..770} | sed 'R file'

, хотя это зависит от расширения GNU sed R:

R filename Очередь очереди имени файла для чтения и вставки в выходной поток в конце текущего цикла или при следующем входе строка читается. Обратите внимание, что если имя файла не может быть прочитано или если его конец достигнут, строка не добавляется, без каких-либо признаков ошибки.

Конечно, если вы не знаете количество строк раньше времени, вы можете сделать

printf ">seq%d\n" $(seq 1 "$(wc -l < file)") | sed 'R file'

, но это потеряет преимущество только в том, что нужно только один раз прочитать файл .

На практике я, вероятно, использовал бы awk-решение @ John1024 или его эквивалент perl

perl -lpe 'print ">seq" . $.' file

steeldriver · Accepted Answer · 24 July 2018 в 19:03

Поскольку вы специально попросили решение sed (я бы не предлагал на самом деле делать это таким образом, но вы могли бы):

$ sed = file | sed '1~2 s/^/>seq/'
>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

Первый вызов sed = file вставляет номера голой строки, затем второй украсит их, добавив строку >seq.

OTOH, если вы заранее знаете, что есть 770 строк, тогда вы можете сделать

printf ">seq%d\n" {1..770} | sed 'R file'

, хотя это зависит от расширения GNU sed R:

R filename Очередь очереди имени файла для чтения и вставки в выходной поток в конце текущего цикла или при следующем входе строка читается. Обратите внимание, что если имя файла не может быть прочитано или если его конец достигнут, строка не добавляется, без каких-либо признаков ошибки.

Конечно, если вы не знаете количество строк раньше времени, вы можете сделать

printf ">seq%d\n" $(seq 1 "$(wc -l < file)") | sed 'R file'

, но это потеряет преимущество только в том, что нужно только один раз прочитать файл .

На практике я, вероятно, использовал бы awk-решение @ John1024 или его эквивалент perl

perl -lpe 'print ">seq" . $.' file

John1024 · Answer 4 · 22 May 2018 в 19:19

Ваша задача может быть выполнена с помощью sed, но sed не имеет никакого естественного понимания арифметики, что делает ее неправильным инструментом. Awk хорошо работает:

$ awk '{print ">seq" NR} 1' file
>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

Как это работает:

print ">seq" NR Для каждой новой строки, прочитанной, сначала напечатаем требуемый заголовок. NR - счетчик строк awk. 1 Это критическая стенограмма awk для печати.

12

ответ дан John1024 22 May 2018 в 19:19

1

Я собирался предложить awk – Panther 18 August 2017 в 22:51
2

@steeldriver Причина в том, что я просто смотрел на некоторый код c ++ & lt; grin & gt ;. Ваше предложение намного лучше. Ответ обновлен. – John1024 18 August 2017 в 22:54
3

Спасибо, Джон !, Он работал очень хорошо. Я боялся спросить, потому что думал, что это очень сомнительный вопрос. – Idalia Rojas 18 August 2017 в 23:31
4

Я согласен с тем, что awk является гораздо более подходящим инструментом для этого. Еще один пример того, что важно понимать, что нужно клиенту - не просто делать то, о чем они просят (см. Знаменитую цитату из Ford), если я попрошу своих клиентов, что они хотят, они скажут «более быстрая лошадь» и т. Д.). – Floris 19 August 2017 в 16:27
5

Для менее критического сценария Awk используйте { printf(">seq%d\n%s\n", NR, $0) }. – David Foerster 19 August 2017 в 21:12

David Foerster · Answer 5 · 22 May 2018 в 19:19

Использование простой петли:

count=1; while read -r line ; do printf '>seq%d\n%s\n' $((count++)) "$line"; done < file

Выход:

>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

5

ответ дан David Foerster 22 May 2018 в 19:19

1

@ John1024 Спасибо, изменено на printf;) – Ravexina 19 August 2017 в 07:39

gardenhead · Answer 6 · 22 May 2018 в 19:19

Использование paste:

 paste -d '\n' <(seq -f '>seq%g' 1 4) file

seq -f '>seq%g' 1 4 записывает номера, разделенные символом новой строки, в stdout & lt; (...) - подстановка процесса paste объединяет соответствующую строку каждого файла, разделенная по разделителю -d '\n' устанавливает разделитель конкатенации в новую строку вместо закладки по умолчанию

0

ответ дан gardenhead 22 May 2018 в 19:19

1

можете ли вы объяснить роль 1 4 в команде seq? – Floris 19 August 2017 в 16:28
2

Вы также можете использовать анонимный канал вместо имени FIFO (для немного лучшей производительности или если ваша оболочка не поддерживает замещение процесса): seq -f '>seq%g' 1 4 | paste -d '\n' - file – David Foerster 3 September 2017 в 23:37

David Foerster · Answer 7 · 18 July 2018 в 08:18

Использование простой петли:

count=1; while read -r line ; do printf '>seq%d\n%s\n' $((count++)) "$line"; done < file

Выход:

>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

gardenhead · Answer 8 · 18 July 2018 в 08:18

Использование paste:

 paste -d '\n' <(seq -f '>seq%g' 1 4) file

seq -f '>seq%g' 1 4 записывает номера, разделенные символом новой строки, в stdout & lt; (...) - подстановка процесса paste объединяет соответствующую строку каждого файла, разделенная по разделителю -d '\n' устанавливает разделитель конкатенации в новую строку вместо закладки по умолчанию

John1024 · Answer 9 · 18 July 2018 в 08:18

Ваша задача может быть выполнена с помощью sed, но sed не имеет никакого естественного понимания арифметики, что делает ее неправильным инструментом. Awk хорошо работает:

$ awk '{print ">seq" NR} 1' file
>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

Как это работает:

print ">seq" NR Для каждой новой строки, прочитанной, сначала напечатаем требуемый заголовок. NR - счетчик строк awk. 1 Это критическая стенограмма awk для печати.

David Foerster · Answer 10 · 24 July 2018 в 19:03

Использование простой петли:

count=1; while read -r line ; do printf '>seq%d\n%s\n' $((count++)) "$line"; done < file

Выход:

>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

5

ответ дан David Foerster 24 July 2018 в 19:03

1

@ John1024 Спасибо, изменено на printf;) – Ravexina 19 August 2017 в 07:39

gardenhead · Answer 11 · 24 July 2018 в 19:03

Использование paste:

 paste -d '\n' <(seq -f '>seq%g' 1 4) file

seq -f '>seq%g' 1 4 записывает номера, разделенные символом новой строки, в stdout & lt; (...) - подстановка процесса paste объединяет соответствующую строку каждого файла, разделенная по разделителю -d '\n' устанавливает разделитель конкатенации в новую строку вместо закладки по умолчанию

0

ответ дан gardenhead 24 July 2018 в 19:03

1

можете ли вы объяснить роль 1 4 в команде seq? – Floris 19 August 2017 в 16:28
2

Вы также можете использовать анонимный канал вместо имени FIFO (для немного лучшей производительности или если ваша оболочка не поддерживает замещение процесса): seq -f '>seq%g' 1 4 | paste -d '\n' - file – David Foerster 3 September 2017 в 23:37

John1024 · Answer 12 · 24 July 2018 в 19:03

Ваша задача может быть выполнена с помощью sed, но sed не имеет никакого естественного понимания арифметики, что делает ее неправильным инструментом. Awk хорошо работает:

$ awk '{print ">seq" NR} 1' file
>seq1
CWGAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG
>seq2
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGC
>seq3
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATT
>seq4
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCGT

Как это работает:

print ">seq" NR Для каждой новой строки, прочитанной, сначала напечатаем требуемый заголовок. NR - счетчик строк awk. 1 Это критическая стенограмма awk для печати.

12

ответ дан John1024 24 July 2018 в 19:03

1

Я собирался предложить awk – Panther 18 August 2017 в 22:51
2

@steeldriver Причина в том, что я просто смотрел на некоторый код c ++ & lt; grin & gt ;. Ваше предложение намного лучше. Ответ обновлен. – John1024 18 August 2017 в 22:54
3

Спасибо, Джон !, Он работал очень хорошо. Я боялся спросить, потому что думал, что это очень сомнительный вопрос. – Idalia Rojas 18 August 2017 в 23:31
4

Я согласен с тем, что awk является гораздо более подходящим инструментом для этого. Еще один пример того, что важно понимать, что нужно клиенту - не просто делать то, о чем они просят (см. Знаменитую цитату из Ford), если я попрошу своих клиентов, что они хотят, они скажут «более быстрая лошадь» и т. Д.). – Floris 19 August 2017 в 16:27
5

Для менее критического сценария Awk используйте { printf(">seq%d\n%s\n", NR, $0) }. – David Foerster 19 August 2017 в 21:12

Как вставить другой заголовок для каждой строки с sed?

12 ответов

Другие вопросы по тегам:

Похожие вопросы: