Современный скрапинг веб-сайтов с помощью Python
Митчелл Райан
Код товара: 4414519
(0 оценок)Оценить
ОтзывНаписать отзыв
ВопросЗадать вопрос
1 / 2
PDF
Нет в наличии
Доставим в
г. МоскваКурьером
бесплатно от 10 000 ₽
В пункт выдачи
от 155 ₽
бесплатно от 10 000 ₽
Точная стоимость доставки рассчитывается при оформлении заказа
Издательство:
Оригинальное название:
Web Scraping with Python. Collecting More Data from the Modern Web
Отмечено тегами
Описание
Характеристики
Если программирование напоминает волшебство, то веб-скрапинг — это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете.
В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.
- Разбирайте сложные HTML-страницы.
- Разрабатывайте поисковые роботы с помощью фреймворка Scrapy.
- Изучайте методы хранения данных, полученных с помощью скрапинга.
- Считывайте и извлекайте данные из документов.
- Очищайте и нормализуйте плохо отформатированные данные.
- Читайте и пишите информацию на естественных языках.
- Освойте поиск по формам и логинам.
- Изучите скрапинг JavaScript и работу с API.
- Используйте и пишите программы для преобразования изображений в текст.
- Учитесь обходить скрапинговые ловушки и блокаторы ботов.
- Протестируйте собственный сайт с помощью скрапинга.
В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.
- Разбирайте сложные HTML-страницы.
- Разрабатывайте поисковые роботы с помощью фреймворка Scrapy.
- Изучайте методы хранения данных, полученных с помощью скрапинга.
- Считывайте и извлекайте данные из документов.
- Очищайте и нормализуйте плохо отформатированные данные.
- Читайте и пишите информацию на естественных языках.
- Освойте поиск по формам и логинам.
- Изучите скрапинг JavaScript и работу с API.
- Используйте и пишите программы для преобразования изображений в текст.
- Учитесь обходить скрапинговые ловушки и блокаторы ботов.
- Протестируйте собственный сайт с помощью скрапинга.
Содержание
Введение
Что такое веб-скрапинг
Почему это называется веб-скрапингом
Об этой книге
Условные обозначения
Использование примеров кода
Благодарности
От издательства
Часть I. Разработка веб-скраперов
Глава 1. Ваш первый веб-скрапер
Глава 2. Углубленный синтаксический анализ
HTML-кода
Глава 3. Разработка веб-краулеров
Глава 4. Модели веб-краулинга
Глава 5. Scrapy
Глава 6. Хранение данных
Часть II. Углубленный веб-скрапинг
Глава 7. Чтение документов
Глава 8. Очистка «грязных» данных
Глава 9. Чтение и запись текстов на естественных
языках
Глава 10. Сбор данных из форм и проверка
авторизации
Глава 11. Веб-скрапинг данныхJavaScript
Глава 12. Веб-краулинг с помощью API
Глава 13. Обработка изображений и распознавание
текста
Глава 14. Как избежать ловушек веб-скрапинга
Глава 15. Тестирование сайтов с помощью веб-
скраперов
Глава 16. Параллельный веб-краулинг
Глава 17. Удаленный веб-скрапинг
Глава 18. Законность и этичность веб-скрапинга
Движемся дальше
Об авторе
Об обложке
Что такое веб-скрапинг
Почему это называется веб-скрапингом
Об этой книге
Условные обозначения
Использование примеров кода
Благодарности
От издательства
Часть I. Разработка веб-скраперов
Глава 1. Ваш первый веб-скрапер
Глава 2. Углубленный синтаксический анализ
HTML-кода
Глава 3. Разработка веб-краулеров
Глава 4. Модели веб-краулинга
Глава 5. Scrapy
Глава 6. Хранение данных
Часть II. Углубленный веб-скрапинг
Глава 7. Чтение документов
Глава 8. Очистка «грязных» данных
Глава 9. Чтение и запись текстов на естественных
языках
Глава 10. Сбор данных из форм и проверка
авторизации
Глава 11. Веб-скрапинг данныхJavaScript
Глава 12. Веб-краулинг с помощью API
Глава 13. Обработка изображений и распознавание
текста
Глава 14. Как избежать ловушек веб-скрапинга
Глава 15. Тестирование сайтов с помощью веб-
скраперов
Глава 16. Параллельный веб-краулинг
Глава 17. Удаленный веб-скрапинг
Глава 18. Законность и этичность веб-скрапинга
Движемся дальше
Об авторе
Об обложке
Отзывы
Вопросы
Поделитесь своим мнением об этом товаре с другими покупателями — будьте первыми!
Дарим бонусы за отзывы!
За какие отзывы можно получить бонусы?
- За уникальные, информативные отзывы, прошедшие модерацию
Как получить больше бонусов за отзыв?
- Публикуйте фото или видео к отзыву
- Пишите отзывы на товары с меткой "Бонусы за отзыв"
Задайте вопрос, чтобы узнать больше о товаре
Если вы обнаружили ошибку в описании товара «Современный скрапинг веб-сайтов с помощью Python» (авторы: Митчелл Райан), то выделите её мышкой и нажмите Ctrl+Enter. Спасибо, что помогаете нам стать лучше!