wget может использоваться для получения по запросу определенных данных из веб-страницы?

Question 1

Может команда wget использоваться для получения по запросу определенных данных из веб-сайта, например; "детеныши выигрывают" из www.sportscore.com? Если так, чему рекомендовали бы синтаксис?

Question 2

wget (или curl, в этом отношении), не может сделать этого, но затем обычная практика должна выбрать страницу и извлечь соответствующие части с помощью другого инструмента предпочтительно тот, который понимает HTML. Например, для выборки данных таблицы Premier League Би-би-си я делаю:

curl http://www.bbc.com/sport/football/tables -Ls | 
  pup '.gel-long-primer tr td:nth-child(3), .gel-long-primer tr td:nth-child(10), .gel-long-primer tr td:nth-child(11) text{}'

(который получает меня названия команды, разница забитых и пропущенных мячей и точки, которые я позже обрабатываю использование awk, и т.д. составлять таблицу Cann.)

Осмотрите источник страницы, чтобы видеть, имеет ли элемент HTML со счетом, Вам интересно, характеристику идентификации, как id или name атрибут, или связан с тем, который можно иначе отфильтровать, затем используйте pup, и т.д. получить тот элемент от данных, загруженных wget или curl. Сайт, который Вы упомянули, не открывается для меня, таким образом, я не могу помочь с этим.

muru · Answer 1 · 7 December 2019 в 15:28

wget (или curl, в этом отношении), не может сделать этого, но затем обычная практика должна выбрать страницу и извлечь соответствующие части с помощью другого инструмента предпочтительно тот, который понимает HTML. Например, для выборки данных таблицы Premier League Би-би-си я делаю:

curl http://www.bbc.com/sport/football/tables -Ls | 
  pup '.gel-long-primer tr td:nth-child(3), .gel-long-primer tr td:nth-child(10), .gel-long-primer tr td:nth-child(11) text{}'

(который получает меня названия команды, разница забитых и пропущенных мячей и точки, которые я позже обрабатываю использование awk, и т.д. составлять таблицу Cann.)

Осмотрите источник страницы, чтобы видеть, имеет ли элемент HTML со счетом, Вам интересно, характеристику идентификации, как id или name атрибут, или связан с тем, который можно иначе отфильтровать, затем используйте pup, и т.д. получить тот элемент от данных, загруженных wget или curl. Сайт, который Вы упомянули, не открывается для меня, таким образом, я не могу помочь с этим.

wget может использоваться для получения по запросу определенных данных из веб-страницы?

1 ответ

Другие вопросы по тегам:

Похожие вопросы: