وبلاگ بلیان

精通Python网络爬虫 核心技术、框架与项目实战 = Deep in Python web crawler : core technology, frame and practices

معرفی کتاب «精通Python网络爬虫 核心技术、框架与项目实战 = Deep in Python web crawler : core technology, frame and practices» نوشتهٔ 韦玮، منتشرشده توسط نشر 机械工业出版社 در سال 2017. این کتاب در فرمت epub، زبان zh ارائه شده است. «精通Python网络爬虫 核心技术、框架与项目实战 = Deep in Python web crawler : core technology, frame and practices» در دستهٔ بدون دسته‌بندی قرار دارد.

本书从技术,工具与实战3个维度讲解了python网络爬虫:技术维度:详细讲解了pvthon网络爬虫实现的核心技术,包括网络爬虫的工作原理,如何用urllib库编写网络爬虫,爬虫的异常处理,正则表达式,爬虫中cookie的使用,爬虫的浏览器伪装技术,定向爬取技术,反爬虫技术,以及如何自己动手编写网络爬虫;工具维度:以流行的pvthon网络爬虫框架scrapy为对象,讲解了scrapy的功能使用,高级技巧,架构设计,实现原理,以及如何通过scrapy来更便捷,高效地编写网络爬虫;实战维度:以实战为导向,是本书的主旨,除了完全通过手动编程实现网络爬虫和通过scrapy框架实现网络爬虫的实战案例以外,还有博客爬取,图片爬取,模拟登录等多个综合性的网络爬虫实践案例. 本书不仅讲解了如何编写爬虫,而且还讲解了最流行的网络爬虫的使用。全书分为4个部分:第一部分对网络爬虫做了概要性的介绍,主要介绍了网络爬虫的常识和所涉及的技术概览;第二部分是本书的重点之一,详细讲解了网络爬虫的核心技术,包括网络爬虫的实现原理与实现技术、Urllib库和URLError库的异常处理、正则表达式与Cookie的使用、Fiddler的使用、爬虫的浏览器伪装技术、爬虫的定向抓取技术等;第三部分讲解了最流行的爬虫框架Scrapy的使用、架构和高级应用,是目前关于Scrapy最详细的讲解;第四部分是3个实战案例,讲解了博客爬虫、图片爬虫和模拟登陆爬虫的编写方法
دانلود کتاب 精通Python网络爬虫 核心技术、框架与项目实战 = Deep in Python web crawler : core technology, frame and practices