Сохраните содержание Веб-страницы в текстовом файле

Я имею после weblink:

http://www.rcsb.org/pdb/explore/sequenceText.do?structureId=1APS&chainId=A

Я хочу сохранить только определенные части этого файла в текстовом файле, то есть, я хочу только часть последовательности (с пробелами в корректных местах) а не заголовок или любые числа на той странице.

Во-вторых, мы видим, что существуют пробелы после каждого десятого символа во всех строках. Я хотел бы удалить только пробелы, которые происходят после каждого десятого символа и сохраняют это содержание в другом текстовом файле.

Действительно ли это возможно? Кто-либо может помочь в этом отношении?

0
задан 21 June 2013 в 02:44

1 ответ

Вы можете использовать egrep с ключом -o (Показать только ту часть совпадающей строки, которая соответствует PATTERN.) Например: echo page.html | egrep -o ". +" | SED S !!! | SED S !! > output.txt

0
ответ дан 21 June 2013 в 02:44

Другие вопросы по тегам:

Похожие вопросы: