У меня есть список из n номеров (n известно) URL-адресов. Как я могу удалить имя протокола из URL-адреса?
Например: с https://xyz.com
, я хочу получить только часть xyz.com
.
Используя GNU grep и сопоставление PCRE,
grep -oP 'https://\K\S+' file
Это выводит непробелы после "https: //"
Вот простой вызов awk:
$ awk -F// '{print $NF}' fileName
-F
определяет разделитель полей. $ NF
печатает последнее поле.
Возможно, вам придется заключить в двойные кавычки //.
Как насчет использования awk
с Параметр F
и перенаправление текста?
awk -F'^http[s]?://' '{print $2}' fileName > outputFile
Или sed
с параметром i
sed -i s/'http[s]\?:\/\/'// fileName