Про парсинг 2020
Парсинг сайтов вырос в 2 раза
Основные форматы: разовые задачи и серверный вариант
Законы и мораль все игнорируют
Все больше парсят — web- парсинг сайтов увеличился минимум в 2 раза!
Об это говорит и статистика интереса Wordstat к данному направлению работ в вебе
Причем ухитряются, в соответствии с динамикой рынка, для поиска подрядчиков парсинга и идей по нему использовать в основном мобильные.
Наибольший интерес по стеку и задачам: разовые парсинги (на C# и с помощью софта- типового или кастомного) и построение веб-версии (серверной).
Веб реализация в основном это чистый php или python и всевозможные кроны задач на регулярной основе.
Средняя стоимость по рынку разового парсинга выросла не сильно- процентов на 20-25% и составляет 6-8 тыс.рублей на биржах и 5-7 тыс напрямую у профильных фрилансеров. Оно и понятно- софта и сайтов напаршено немерено, опыт прохождения и допила под задачу минимальный.
А вот серверный custom парс скрипт вырос в среднем на 50-130%, тк задачи усложнились, появились новые защиты от проксей, мобильный прокси, новые форматы эмуляции и пробивки. И если раньше стоимость была 15-17 тыс в среднем, то в нынешнее время меньше 20-30 часов никто даже не берется, а это по рынку разрабов 27-45 тыс рублей.
Вырос и сам рынок подряда: почти все фриланс биржи выделили парсинг в отдельные ветки обсуждений и заказа, иаще всего парс можно найти и в подразделах веток Программирование. Появились и узкоспециализированные компании с миллионными месячными оборотами (сидящих в регионах!).
Цели парсинга сайтов остались особо без изменений:
- мониторинг цен конкурентов
- товарное наполнение каталогов сайтов
- парсинг контента для информационников
- контактные данные (и персональные данные)
Формат сдачи проекта остался без изменений на любых объемах: CSV предпочтителен (до 1 млн.записей)
Часто проекты перепродают в несколько рук (например базы парсинга отзывов, мейлов и компаний).
В контексте что Яндекс.Дирек, что Google.Ads не стесняются рекламировать парсинг и услуги по нему ))
Бесплатного в парсинге и софте для него все больше, что свидетельствует о том, что в конкурентной тематике и с большим каталогом Вас спарсят ровно через 1-3 месяца. Так что мужайтесь и крепите свои булочки 😉 Думайте о лучшем, а защищайтесь сразу на этапе проектирования и создания web- проект. Потому что «говно случается» даже с праведниками.
Про юридическую, моральную и этическую сторону парсинга упоминать не будем, тут все плохо было и остается по сей день.
Ваш SEO Че