Используйте команду lynx и установите ее следующим образом:
sudo apt-get install lynx-cur
См. вход и выход здесь
$ lynx --dump infile.html | grep 'PATTERN'
HTML Tables
HTML tables start with a table tag.
Table rows start with a tr tag.
Table data start with a td tag.
__________________________________________________________________
1 Column:
100
__________________________________________________________________
1 Row and 3 Columns:
100 200 300
__________________________________________________________________
3 Rows and 3 Columns:
100 200 300
400 500 600
700 800 900
__________________________________________________________________
Используя [d2 ] См. Вход и выход здесь :
awk '{gsub(/<[^>]*>/,"")} /PATTERN/{# what you want to do }' infile