Скрапинг веб-сайтов с помощью Python
Автор - Райан Митчелл
Изучите методы скрапинга и краулинга веб-сайтов, чтобы получить доступ к неограниченному объему данных в любом уголке Интернета в любом формате. С помощью книги Райана Митчелла "Скрапинг веб-сайтов с помощью Python" вы узнаете, как использовать скрипты Python и веб-API, чтобы одновременно собрать и обработать данные с тысяч или даже миллионов веб-страниц. Идеально подходящая для программистов, специалистов по безопасности и веб-администраторов, знакомых с языком Python, эта книга знакомит не только с основными принципами работы веб-скраперов, но и углубляется в более сложные темы, такие как анализ сырых данных или использование скраперов для тестирования интерфейса веб-сайта.
Примеры программного кода, приведенные в книге, помогут разобраться в этих принципах на практике. Дополнительным преимуществом данной книги является не только использование Python, но и форма подачи материала. В книге даны не просто примеры кода, весь материал представлен в виде примеров конкретных и практических задач. Нельзя не отметить и наличие целого учебного сайта, разработанного Райан. На его примере наглядно показана отправка форм, работа капчи, скрапинг JavaScript (использование пауз в выполнении скриптов) и т. д.
Эту книгу можно рассматривать не только как введение в веб-скрапинг, но и как развернутое руководство по скрапингу веб-данных практически любого типа. Хотя в книге используется язык программирования Python и освещаются основные принципы его работы, ее не следует использовать в качестве вводного пособия по Python. Если вы не являетесь опытным программистом и не знаете Python вообще, чтение этой книги может быть несколько сложной задачей. Однако если вы опытный программист, то сочтете материал книги легким. В приложении A освещаются установка и работа с Python 3.x, который используется в этой книге. Если вы работали только с Python 2.x или у вас не установлен Python 3.x, вы, возможно, захотите ознакомиться с приложением A.
Издательство – ДМК-Пресс
Год издания – 2016
Формат книги - PDF
Размер - 10,5 Мб
Скрапинг веб-сайтов с помощью Python. Райан Митчелл - скачать
|