Я хотел бы взять снимки страницы YouTube (например, youtube.com/feed/trending)
Вот то, что я пробую:
wget https://www.youtube.com/feed/trending --convert-links -E
Проблема с видео миниатюрами. YouTube, кажется, служит пустым gif миниатюрам (позже замененный реальными миниатюрами? Не уверенный). В случае отклонения я вижу миниатюры первых 6 видео, но все остальное серо/недостающее. Действительно ли это связано с JavaScript? Кто-либо знает надежный способ создать снимки веб-страницу, которая работает на сложные страницы, такие как YouTube?
Спасибо
Я понятия не имею, для чего Вы используете это, но надлежащий способ захватить , что содержание страницы через Youtube API. Вы можете поиск путем отклонения . Это имеет дело с хорошими ответами JSON, которые можно настроить, к чему Вам нравится.
Их страница сама похожа, она использует API или возможно частную версию, но данные идут там, они просто задерживаются. Вот одно из изображений:
<img width="196" onload=";__ytRIL(this)" alt="" height="110" src="/yts/img/pixel-vfl3z5WfW.gif" data-thumb="https://i.ytimg.com/vi/Rqa9ph0cWSA/hqdefault.jpg?custom=true&w=196&h=110&stc=true&jpg444=true&jpgq=90&sp=68&sigh=Vt5qpPXMxoaOiEG4ohSszdhmMJU" data-ytimg="1" >
Обычно Вы смогли бы исправить это изображение путем выполнения замены простой строки, но YouTube изменяет порядок атрибутов между обновлениями. Необходимо обработать HTML и преобразовать эти data-thumb
атрибут к src
(и удалить загрузку больше тегов). И затем необходимо было бы загрузить их (потому что wget
не будет иметь), и затем преобразуйте ссылки.
, Но это - значительно больше работы, чем просто использование API из первого абзаца.
Не говоря уже о том, что то, что Вы делаете, является всеми видами против их условий предоставления услуг.
, Таким образом, мой ответ на это совпадает с коротким: Использование API.
<час>, Если Вы действительно полны решимости сделать это неправильный путь, Вы можете управлять реальным браузером, заставляют это загружать страницу и затем выводить DOM (что он на самом деле представляет).
Это на самом деле довольно аккуратно и служит реальной цели для автоматизации тестирования и генерирующий снимки экрана страниц, но Вы все еще оказываетесь перед необходимостью передавать его через что-то, чтобы преобразовать ссылки и загрузить активы. Вам, вероятно, надоедают того, что я говорил это теперь, но, просто используете вє API