Я хотел бы знать, как сделать веб-очистку с помощью терминала Ubuntu. Я считал что-то об использовании Python с beatifulsoup, urllib, но я задавался вопросом, существует ли там какой-либо способ сделать это, не запуская скрипт Python?
Скажем, я ищу сайт www.marmara.edu.tr (мой университетский сайт), и я хотел бы получить некоторые данные, как я могу сделать это командной строкой?
Объединитесь curl
и утилиты обработки текста как grep
, sed
awk
, и т.д.
Например:
curl https://askubuntu.com/questions/941409 &| grep -Po '(?<=<title>).*(?=</title>)'
возвращает заголовок страницы Вашего вопроса.