У меня есть очень большой файл, из которого мне нужно удалить несколько строк. Это выглядит следующим образом:
CAM_READ_0623233309 / library_id = CAM_LIB_002149 / sample_id = CAM_SMPL_003380 raw_id = G9ALM7U02F5HAW length = 383 / IP_notice =? Эту генетическую информацию, загруженную из CAMERA в Дании, можно считать частью генетического происхождения Дании, являющейся частью генетической системы Дании. страна, из которой был получен образец. Пользователи этой информации соглашаются: 1) признать Данию страной происхождения в любой стране, где представлена генетическая информация, и 2) связаться с координатором КБР, указанным на веб-сайте КБР ( http: //www.cbd. int / country / ), если они намереваются использовать генетическую информацию в коммерческих целях. TGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGT
Мой вывод должен выглядеть
CAM_READ_0623233309 TGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGT
Будет следующей SED командной работы? sed -i "// library_id = CAM_LIB_ \ d {6} / sample_id = CAM_SMPL_ \ d {6} raw_id = G \ d {1} [AZ] {3} \ d {1} [AZ] {1} \ d {2} [AZ] {1} \ d {1} [AZ] {3} length = \ d {3} / IP_notice = \? Эта генетическая информация, загруженная из CAMERA, может считаться частью генетического наследия Дании - страна, из которой была получена проба. Пользователи этой информации соглашаются: 1) признать Данию в качестве страны происхождения в любой стране, где представлена генетическая информация, и 2) связаться с координатором КБР, указанным на веб-сайте КБР (http : //www.cbd.int/countries/) если они намерены использовать генетическую информацию в коммерческих целях. \? / d 'g1.fa
При полагании, что вход является всего одной длинной линией, и Вы хотите получить первый и последний объект, мы можем использовать awk
сделать точно это. Команда для этого была бы:
awk '{printf $1"\n"$NF"\n"}' data.txt
Демонстрационный вывод:
$> cat data.txt
CAM_READ_0623233309 /library_id=CAM_LIB_002149 /sample_id=CAM_SMPL_003380 raw_id=G9ALM7U02F5HAW length=383 /IP_notice=?This genetic information downloaded from CAMERA may be considered to be part of the genetic patrimony of Denmark, the country from which the sample was obtained. Users of this information agree to: 1) acknowledge Denmark as the country of origin in any country where the genetic information is presented and 2) contact the CBD focal point identified on the CBD website (http://www.cbd.int/countries/) if they intend to use the genetic information for commercial purposes.? TGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGT
$> awk '{printf $1"\n"$NF"\n"}' data.txt
CAM_READ_0623233309
TGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGT
$>