不讲武德---不用代码爬虫_小言_互联网的博客

不讲武德---不用代码爬虫

2020-12-07 11:43 659人阅读评论(0)

有人问，我不会代码，我能爬虫吗？我，很快啊，回答：可以！

不需要写代码的，那当然是需要工具了，较为熟知的爬虫工具有八爪鱼，和web scraper，这次我所使用的是web scraper。安装web scraper
，这篇文章讲述的算清晰的了。

开始操作：
当你下好后，打开浏览器，检查（或按F12）应该是张这个样子：如果是这样，那么说明你已经安装好了

那我们可以开始操作了：我们此次爬取的是豆瓣电影top250，对！就是这个刚学爬虫都要爬取的网站。

第一步：先创建项目：注意名称必须是英文

第二步：开始采集数据

当你点击了select后，直接在原网页上点击，最好点击整个元素框，点一两个程序就会自动补齐下面的选项框，当你看到红色的区域是符合你的预期的时候，点击done selecting，这时会发现有一串字符，会自动跑到文本框里。当操作完后点击save 进行保存即可

当这步操作完后，应该跟以下的界面一样：

之后点击contents进入到里面，进行真正意义上的采取数据：之后的操作跟之前一样，只不过这次type的类型是text，而不再是element，以及不用再对Multiple打钩

其中的name像这样：

需注意，这时点击select对网页进行选择的时候，你只能在网页的第一个框内进行点击：像这样

当你设置后所有字段后：你可以点击select graph进行类似于流程图的预览

点击data preview对数据进行预览，有不对的及时进行调整

当都没有问题，便可以对数据进行爬取。