没错,我标题党了,只是为了引起重视
腊月二十八,还有 3 天就过年了,程序员们估计都放假了。
就在这么一个普通的早晨,橡皮擦发现了一个神奇的事情。
原计划反馈一下运营就好了,但是总感觉非常气愤,毕竟那一个个 10W+
粉丝的大佬都是橡皮擦努力的目标。
今天产生了目标崩塌的感觉。
先说一下结论:
我发现了 9 位博主,被 CSDN 相同用户批量关注,该 9 位博主除一位粉丝 5W+,其余在 CSDN 粉丝数目都超过了 13W+,属于拥有海量粉丝群的博主。
数据并没有打码,希望涉及到的博主见谅。
故事的背景
大家先看几张图片,图片来源 2021 年 2 月 9 日早 7:00,重点注意下面的粉丝名,截图在同一时间间隔内,如果不是因为出现零星的不同,橡皮擦会以为这是一个普通的数据 BUG。
如果大家好奇,我想现在去访问下列博主的主页,在关注选项卡也能看到相似的数据。
从关注者入手,追踪被关注的名单
找了几个关注者例子,例如下述 1 名注册 1 天的新账号,查看他的关注列表。
该用户关注人地址为:https://blog.csdn.net/m0_55258826?type=sub&subType=watch
查看他的关注列表,获取到了 9 位博主名单,与我上面的名单一致,此时可以猜测,这 9 名博主应该是被关注的范围用户。
接下来就到了橡皮擦熟悉的领域了,通过一些数据挖掘的方式获取这些大佬的粉丝,然后比对看有哪些人同时关注了这 9 人,寻找异常数据。
批量获取各位博主的最新 10000 粉丝
上述名单中每位大佬的粉丝数据,我都获取了一遍(数据可以联系橡皮擦获取),每个大佬获取 10000+ 粉丝。
接着我直接将数据放到了 EXCEL 里面,对其进行比对筛选,判断是否存在一个人同时关注 9 个人的情况。毕竟一个【真人】能同时注意到这 9 个人,这种概率属于小概率事件,只有可能是机器操作。
运行效果如下,然后在筛选出现数字 8 的总数(为何选择 8,因为比对我使用的是最后一列,统计的数字要减 1)
最终得到 10000 人中,同时关注 9 人的有 4300+人,也就是说,可能有 4 成粉丝存在问题,为橡皮擦这一发现鼓掌。同时你会发现关注 6 人或 7 人的比例也极高,这个就需要 CSDN 技术人员自行排查了。
备注:查询过程中存在一些异常数据,忽略即可。
对关注者的码龄进行筛选
关注 0 年码龄的关注者,咦哈,这个数字和刚才那个拟合了,十分接近。而且注意核对数字会发现每位博主关注者的码龄分布出奇的一致。
最后的总结
抽样检查了其他的一些 1 天小号,关注的名单是一致的,集中在上述 9 人,而大佬们的粉丝都突破了 10W+,抽样 10000人,得到的相同数据占比 40%,四舍五入不也就 5W 人吗,不多,不多~
啥也不说了,好气哦~,看到大佬们 15W+的粉丝,本来想学习一下,结果学到了,就这?
难道,粉丝 20W+ 的大佬其实都是虚幻的,由于 BUG 或者逻辑问题 dun dun dun 涨上去的。
目前的数据并未扩大到大佬们的全部粉丝,希望 CSDN 工程师自行查询吧。
写在后面的一些小结论:
- 第一种可能:有人批量注册 CSDN 账号,然后对以上 9 人进行批量关注;
- 第二种可能:产品逻辑问题,存在一个一键关注的入口,从数据来看,该入口被推荐博主名单应该是固定的(但并不仅仅是 0 年码龄的新用户产生了该问题,具体希望能进行筛查)
让大佬们知道自己的粉丝是这么增长上去的,情何以堪,┭┮﹏┭┮
。
你可以点开如下页面进行查看,切换到关注页即可。
- https://blog.csdn.net/qq_35190492/
- https://blog.csdn.net/qing_gee/
- https://blog.csdn.net/tefuirnever
相关阅读
想学习爬虫技术与数据分析技术,可以订阅技术专栏
如果你想跟博主建立亲密关系,可以关注博主公众号 “
非本科程序员
”,了解非本科程序员如何成长。
博主 ID:梦想橡皮擦
,希望大家点赞、评论、收藏。
转载:https://blog.csdn.net/hihell/article/details/113766057