有人问,我不会代码,我能爬虫吗?我,很快啊,回答:可以!
不需要写代码的,那当然是需要工具了,较为熟知的爬虫工具有八爪鱼,和web scraper,这次我所使用的是web scraper。安装web scraper
,这篇文章讲述的算清晰的了。
开始操作:
当你下好后,打开浏览器,检查(或按F12)应该是张这个样子:如果是这样,那么说明你已经安装好了
那我们可以开始操作了:我们此次爬取的是豆瓣电影top250,对!就是这个刚学爬虫都要爬取的网站。
- 第一步:先创建项目:注意名称必须是英文
- 第二步:开始采集数据
当你点击了select后,直接在原网页上点击,最好点击整个元素框,点一两个程序就会自动补齐下面的选项框,当你看到红色的区域是符合你的预期的时候,点击done selecting,这时会发现有一串字符,会自动跑到文本框里。当操作完后点击save 进行保存即可
当这步操作完后,应该跟以下的界面一样:
之后点击contents进入到里面,进行真正意义上的采取数据:之后的操作跟之前一样,只不过这次type的类型是text,而不再是element,以及不用再对Multiple打钩
其中的name像这样:
需注意,这时点击select对网页进行选择的时候,你只能在网页的第一个框内进行点击:像这样
当你设置后所有字段后:你可以点击select graph进行类似于流程图的预览
点击data preview对数据进行预览,有不对的及时进行调整
当都没有问题,便可以对数据进行爬取。
- 第三步:导出数据
点击scrapes进行对网页的爬取
然后这时,有人说,我不满意,你这个只能爬取一页,我要爬取多页数据,并且我还想爬取那种需要点击才能出数据的。
我,很快啊,回答:下次更,下次一定
转载:https://blog.csdn.net/weixin_44987290/article/details/110197787