小言_互联网的博客

统计CSDN流量与排名关系—设计拐点

405人阅读  评论(0)

 

背景

目前有13W历史浏览量、排名13W。今年的okr怎么定呢?思路是看看csdn整体的数据情况。取了两个关键指标:排名、浏览量。

 

统计脚本与数据分析


  
  1. import matplotlib.pyplot as plt
  2. from scipy.optimize import curve_fit
  3. import numpy as np
  4. from scipy import log
  5. #step1:统计数据
  6. x=np.array([ 1, 2, 3, 1122, 10000, 30000, 50000, 210000]) #CSDN排名
  7. y=np.array([ 1975, 1054, 938, 175, 13, 13, 5, 0.23]) #CSD访问流量
  8. #step2:拟合
  9. #多项式拟合
  10. def fit_poly():
  11. f=np.polyfit(x, y, 4)
  12. f_poly = np.poly1d(f)
  13. y_fit_poly =f_poly(x)
  14. return y_fit_poly
  15. #幂数拟合
  16. def fit_power():
  17. def alpha(x, a, b):
  18. return a*np.exp(-b/x)
  19. popt, pcov = curve_fit(alpha, x, y)
  20. a=popt[ 0]
  21. b=popt[ 1]
  22. return alpha(x, a, b)
  23. #指数拟合
  24. def fit_exp():
  25. def alpha(x, a, b):
  26. return x**a+b
  27. popt, pcov = curve_fit(alpha, x, y)
  28. a=popt[ 0]
  29. b=popt[ 1]
  30. return alpha(x, a, b)
  31. #对数拟合
  32. def fit_log():
  33. def alpha(x, a, b):
  34. return a*log(x)+b
  35. popt, pcov = curve_fit(alpha, x, y)
  36. a=popt[ 0]
  37. b=popt[ 1]
  38. return alpha(x, a, b)
  39. #step3:绘图
  40. y_fit = fit_poly()
  41. data_origin = plt.plot(x, y, '*', label = 'orgin')
  42. data_fit = plt.plot(x, y_fit, 'r', label = 'ployfit')
  43. plt.xlabel( 'flow')
  44. plt.ylabel( 'rank')
  45. plt.legend(loc= 4) #指定legend的位置右下角
  46. plt.title( 'polyfitting')
  47. plt.show()

 

多项式拟合(poly)

 

幂数拟合(power)

拐点(1000,240W)

 

对数拟合(Log)

拐点(30000,12W),(10000,150W),(1000,420W)

 

博客浏览量的爆发点

从上边的数据来看,排名与流量更符合对数关系。1W排名、150W流览量是比较好的一个最近拐点

今年可达一半、即取中点比较理想:(3W,13W) -> (2W, 80W) -> (1W, 150W)。(80-13) * 10000) / 365 = 1800,

拆解至每天的策略即:每天新增1800流览量

 


=>更多文章请参考《中国互联网业务研发体系架构指南》

=>更多行业权威架构案例及领域标准、技术趋势请关注微信公众号:

更多权威内容关注公众号:软件真理与光

 

 


转载:https://blog.csdn.net/Ture010Love/article/details/104261111
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场