Новости нашего ИТ логотип
Подписаться
Опубликовано

Парсинг сайтов Python: requests, токены, прокси

Автор

Универсальный парсинг сайтов на Python: requests vs headless, токены, куки, прокси и ротация IP #docker Вы когда-нибудь радовались идеальному прототипу парсера, который у вас летал на демо-странице, а в проде внезапно начал ловить 403, 429, пустые HTML и «куда-то делись карточки»? Контент отрисовывается на JS, сервер требует токен, после смены IP, старая сессия перестаёт работать. В этой статье я подробно разберу, как собирать данные устойчиво и предсказуемо, без излишней магии и с упором на реальную эксплуатацию.

link

avatar
Новости нашего ИТ
12 подписчиков
4753 поста
Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news

Свежие посты