При использовании grep в html-файлах, как я могу отображать только текст, а не теги?

Предполагая, что вы запустили свой компьютер с запущенным X (но не видимым на любом экране), вы можете сделать следующее:

Перейти к консоли с помощью Ctrl+F1 и войти в систему Установить свою отображаемую переменную [ f2] Выполнить xrandr и проверить выход. Попробуйте активировать один из подключенных дисплеев с помощью xrandr --output LVDS-0 --auto (где LVDS-0 - мой встроенный дисплей для ноутбука). Выйдите из системы и вернитесь к X с помощью Ctrl+F7. Теперь вы можете сбросить конфигурацию дисплея, как обычно.

Удачи!

FAQ:

Если xrandr дает вам `Can not open display ', то либо вы забыли экспортировать переменную DISPLAY, либо ваш X-сервер не запущен и работает
1
задан 1 January 2015 в 13:49

1 ответ

Используйте команду lynx и установите ее следующим образом:

sudo apt-get install lynx-cur

См. вход и выход здесь

$ lynx --dump infile.html | grep 'PATTERN'
HTML Tables

   HTML tables start with a table tag.

   Table rows start with a tr tag.

   Table data start with a td tag.
     __________________________________________________________________

1 Column:

   100
     __________________________________________________________________

1 Row and 3 Columns:

   100 200 300
     __________________________________________________________________

3 Rows and 3 Columns:

   100 200 300
   400 500 600
   700 800 900
     __________________________________________________________________

Используя [d2 ] См. Вход и выход здесь :

awk '{gsub(/<[^>]*>/,"")} /PATTERN/{# what you want to do }' infile
1
ответ дан 24 May 2018 в 00:31
  • 1
    Любой способ использовать lynx, но не потерять имена файлов? Помните, я ищу много документов. – don.joey 1 January 2015 в 15:13
  • 2
    Grep отображает имена файлов при выдаче результатов (somefile/somewhere:search result). Если вы подключаетесь к grep (а не к grep), вы теряете имена файлов ... – don.joey 1 January 2015 в 18:43

Другие вопросы по тегам:

Похожие вопросы: