讲解 了 如何使用P川lOil来编写 网络爬虫程序 , 内 容包括 网络爬虫简
介 , 从页面 中 抓取数据 的三种方法 , 提取缓存 中 的 数据 , 使用 多 个线程和进
程来进行并发抓取 , 如何抓取动态页面 中 的 内 容 , 与表单进行交互 , 处理页
面 中 的 验证码 问 题, 以及使用 Sca rpy 和 Portia 来进行数据抓取 , 并在最后使
用 本书介绍 的 数据抓取技术对几个真实 的 网 站进行 了 抓取 , 旨在帮 助读者活
学活用书中介绍 的技术 。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !