Python网络数据采集

读书评论:
  • 源泉Studio
    03-19
    “Bug 是产品生命中的挑战,好产品是不断面对 Bug 并战胜 Bug 的结果”,标题是网络数据采集,主体内容不仅有网络爬虫相关的内容,还有与之相关的如数据库、自然语言分析、云平台等等,但是对于一本两百多页的“小书”来说,这样的内容安排显得过多过杂了,网络爬虫涉及到的知识体系确实庞杂,但是什么都说,结果就是什么都说不清楚,使得这本书不像一本合格的教程,更像另外一本1000页以上大部头教程的绪论部分。另外作为国外出版的爬虫类书籍,最为致命的就是“科学上网”的问题,案例中的涉及的Wiki、Twitter、Google等等网站在国内通通被墙,不知道是该笑,还是该笑呢
  • Showing V1.4.1
    08-07
    提纲挈领的入门书,惊讶地发现好多东西我居然已经都自己摸索出来了……
  • 这么近,那么远
    12-18
    可以。“本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。第一部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。”
  • Individual
    10-09
    主要看完了第一部分,算是网络数据采集的入门书第一部分主要讲了爬虫,API,数据库还有文档读取这一类的内容。有API固然是好的,没有的话也只能自己爬了估计以后我们会花很多时间就是做这些事情,搭建我们自己的数据库不过书看到这,理论有点饱和了,理论还是得和实践搭配。能力才能有精进
  • 也者乎之
    08-19
    还算入门,不过读完了该不会还是不会,实际操练才行……
  • whoIam
    08-23
    内容覆盖的比较全,但是具体操作及实用还有待考究,比如验证码识别的准确率,还有一些库的基本命令与对应功能并不很全
  • Mr. Lions
    06-11
    ORELLY的书我觉得到最后作为收藏正好,无论是浅显入门的还是那些略专业的工具书
  • West
    12-24
    非常提纲携领地讲解了python爬虫可能涉及到的各个方面的知识。非常全面和广泛,但也牺牲了细节。不错的代码实例一定程度上弥补了细节不足的缺陷。算是鸟瞰整个知识领域的书,值得入门阅读。
  • 遇上alison
    08-08
    适合入门,感觉是各种爬虫库文档的精简版
  • 阅微草堂
    05-30
    爬虫和web是正反两面——权限与反扒机制,且其中有数据清洗,建模,分析展示的需求。
  • Elf
    11-08
    终于有本针对3.X的爬虫书了~
  • magnus
    09-13
    Web Scraping with Python: Collecting Data from the Modern Web | Ryan Mitchell | download http://b-ok.org/book/2575517/98b82a
  • 神威
    04-03
    2019第19本,主要讲爬虫方面的一些方法,还是需要一点编程基础不然容易晕,涉及的方面还是比较多的
  • 克隆小丸子
    06-10
    Beautifulsoup
  • 东邪
    11-10
    可以跳过代码去看,能对python的数据抓取相关工具有一个初步的认识
  • Joard Spike
    07-27
    适合入门的书籍,如果你对HTTP,HTML,Python这些都不了解的话
  • freetstar
    07-05
    入门 每个知识点点到为止 全面浅层了解python爬虫的一本书 翻译的还行 只是长句断句让人揪心啊
  • 猫壳
    12-13
    爬虫入门推荐,内容不难,面面俱到,唯一遗憾的是没讲如何多线程和分布式爬取,篇幅有限可以理解。作者还分享了一些踩坑的细节,甚至跟爬虫看似没有直接关系的知识点也介绍了一下。代码不是很Pythonic,看起来作者应该主要是写Java的,不过代码质量可以,Python 3也好评。