小言_互联网的博客

不讲武德---不用代码爬虫

322人阅读  评论(0)

有人问,我不会代码,我能爬虫吗?我,很快啊,回答:可以!

不需要写代码的,那当然是需要工具了,较为熟知的爬虫工具有八爪鱼,和web scraper,这次我所使用的是web scraper。安装web scraper
,这篇文章讲述的算清晰的了。

开始操作:
当你下好后,打开浏览器,检查(或按F12)应该是张这个样子:如果是这样,那么说明你已经安装好了

那我们可以开始操作了:我们此次爬取的是豆瓣电影top250,对!就是这个刚学爬虫都要爬取的网站。

  • 第一步:先创建项目:注意名称必须是英文


  • 第二步:开始采集数据

当你点击了select后,直接在原网页上点击,最好点击整个元素框,点一两个程序就会自动补齐下面的选项框,当你看到红色的区域是符合你的预期的时候,点击done selecting,这时会发现有一串字符,会自动跑到文本框里。当操作完后点击save 进行保存即可

当这步操作完后,应该跟以下的界面一样:

之后点击contents进入到里面,进行真正意义上的采取数据:之后的操作跟之前一样,只不过这次type的类型是text,而不再是element,以及不用再对Multiple打钩

其中的name像这样:

需注意,这时点击select对网页进行选择的时候,你只能在网页的第一个框内进行点击:像这样

当你设置后所有字段后:你可以点击select graph进行类似于流程图的预览

点击data preview对数据进行预览,有不对的及时进行调整

当都没有问题,便可以对数据进行爬取。

  • 第三步:导出数据

点击scrapes进行对网页的爬取




然后这时,有人说,我不满意,你这个只能爬取一页,我要爬取多页数据,并且我还想爬取那种需要点击才能出数据的。
我,很快啊,回答:下次更,下次一定


转载:https://blog.csdn.net/weixin_44987290/article/details/110197787
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场