×

Python爬虫教程之如何使用Python爬虫收集高考满分作文

消耗积分:0 | 格式:pdf | 大小:1.37 MB | 2018-09-21

melogua

分享资料个

  在互联网日益发展的今天,计算机应用成为生活中不可或缺的一部分。本文所介绍的网络爬虫程序,是从一个庞大的网站中,将符合预设条件的对象“捕获” 并保存的一种程序。如果将庞大的互联网比作一张蜘蛛网,爬虫程序就像网上游弋的蜘蛛,将网上一个个“猎物”摘取下来。

  平时所说的爬虫,就是网络爬虫,大家可以理解为在互联网网页上爬行的一只蜘蛛。可以把互联网比作一张大网,爬虫就是在这张网上爬来爬去的蜘蛛,如果遇到需要的有价值的资源,它就会爬取下来。想抓取什么,就可以用代码控制抓取你想要的内容,不需要的那部分可以忽略不计。

  当然网络爬虫并不是所有的网页都可以抓取,因为有些网页安全性极高,一般无法获取到他们的页面信息,抓取的资源(数据)也不是想怎么处理就怎么处理的,而是要在合法的范围内对数据进行一定的处理,如果对这些数据随意的散播或者用于不正当交易,是要负法律责任的。当然,一些保密的数据也会做好安全措施,不能轻易的被爬取。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !