一、介绍
我们先来做个简单的,我们的目标是爬取CSDN博客之星年度总评选的首页信息。
首页的地址:http://m234140.nofollow.ax.mvote.cn/wxvote/43ced329-3a4b-0a5d-a13c-f088cf8eafef.html
电脑浏览器打开的样子如下:
我们的目标就是爬取用蓝色框标出来的内容。主要包括:标题、参与博主、累计投票、访问次数及开始截止时间,这些数据爬取下来后我们最终在大屏页面上可以进行展示。
二、爬虫技术介绍
爬虫技术多种多样,目前比较流行的,会使用python进行爬取,从代码量上来说,确实python要少很多,而由于我
转载:https://blog.csdn.net/m0_37609579/article/details/104066561
查看评论