Есть ли инструмент для удаления всех гиперссылок из HTML-файла?

Есть ли способ сделать это в Ubuntu? Я читал, что это возможно в PHP, но я совсем не знаком с PHP.

4
задан 29 May 2013 в 21:02

2 ответа

Вы можете использовать sed для этого, но он будет работать только для ссылок, которые находятся в одной строке в HTML-коде.

Обновление:

Черт, жадное регулярное выражение! ;) Этот должен работать сейчас!

sed -i 's|<a[^>]\+>|<a>|g' <the-html-file>

0
ответ дан 29 May 2013 в 21:02

Зависит от того, что вы пытаетесь сделать:

Если у вас есть куча файлов на вашем компьютере, и вы хотите удалить ссылки, используйте что-то вроде скрипта Perl для удаления тегов <a ...> ... </a>. , Вы можете удалить другие теги (или даже все теги) аналогичным образом. При правильных параметрах сопоставления с образцом этот подход может обрабатывать теги, разбитые на несколько строк (Это очень элегантно, но детали не поместятся на полях этого поста).

Если вы пытаетесь просматривать файлы на каком-либо веб-сервере, используя Firefox (или другой браузер), вам может подойти какой-нибудь сценарий greasemonkey, который автоматически изменяет страницы на лету перед их отображением.

0
ответ дан 29 May 2013 в 21:02

Другие вопросы по тегам:

Похожие вопросы: