小言_互联网的博客

算法其实也不难,掰碎了喂给你,七个步骤带你学会逻辑回归算法&应用

706人阅读  评论(0)

前言

什么是逻辑回归算法?

逻辑回归(Logistic Regression)是机器学习中的一种分类模型,分类模型又有二分与多分类,逻辑回归通常用于二分类,用来完成 0/1 分类问题,逻辑一词也代表了是(1)和非(0)。

什么场景可以应用逻辑回归算法?

1、判断是否是垃圾邮件

2、判断是否是金融诈骗

3、判断是否患病

4、预测用户是否点击特定的商品

5、判断用户的性别

逻辑回归算法应用实训

随着市场竞争环境越发激烈,某航空公司为了了解客户,获得更好的发展,收集了客户的相关数据,希望对客户的行为进行分析,对客户流失情况做预警,以便制定挽留策略。

客户流失是指客户因某种原因而离开为其服务公司的一种常见行为。由于各种因素的不确定性和市场不断的增长以及一些竞争对手的存在,很多客户不断地从一个公司转向另一个公司,其目的是为了求得更低的价格和更好的服务。

下面我们就来具体分析一下运用逻辑回归算法如何识别客户是否流失。

喂自己袋盐

需要进一步学习各类算法的小伙伴请订阅博主的下面两个专栏哟!

手把手教你ML机器学习算法源码全解析

https://blog.csdn.net/wenyusuran/category_2239263.html

人工智能AI实战系列代码全解析

https://blog.csdn.net/wenyusuran/category_8116497.html

第一步,数据采集与导入

尽可能收集影响客户流失的各种因素,包括:入会时间,第一次飞行时间、性别、会员卡级别、年龄、飞行次数、基本积分、总加权飞行公里数、平均乘机时间间隔、其他积分、非乘机的积分变动次数等等,形成数据表,导入PMT工具中。观察数据表,如图所示,左侧数据摘要显示有0.2%缺失值,需要进行缺失值处理。

数据观察

 

第二步,数据处理

处理缺失值主要有以下几种方法:

1.当某个变量或者某个样本中缺失值占比过大时,那么我们可以认为这一变量或者样本没有意义,可以直接删除。

2.用平均值、中值、分位数、众数、随机值等替代。

3.用其他变量做预测模型来算出缺失变量。

4.把变量映射到高维空间。

这里我们选择方式为Average/Most frequent即用平均值或众数算出缺失值,操作完成之后,再次浏览数据表发现数据摘要显示的是无缺失值,可以进行下一步操作。

 

第三步,定义流失客户

什么情况表示客户流失了?这里我们主要依据最后一次乘机时间至观察窗口末端的时长与观察窗口内最大乘机间隔的大小比较来判定,如果最后一次乘机时间至观察窗口末端时长>=观察窗口内最大乘机间隔,则定义为流失客户,用1来标记,反之则表示非流失客户,用0来标记。观察流失客户定义之后的数据分布情况,总共可得到非流失客户38433,流失客户为24555。

 

第四步,构建逻辑回归模型

选择可能对客户流失产生影响的特征值,这里选择年龄(age)、观测窗口季度平均飞行次数(AVG_FLIGHT_COUNT)、积分兑换次数(EXCHANGE_COUNT)、 非乘机的积分变动次数(Point_Chg_NotFlight)、平均乘机时间间隔(AVG_FLIGHT_INTERVAL)、平均折扣率(avg_discount)、观测窗口总飞行公里数(SEG_KM_SUM)共7个变量。构建正则化类型为岭回归(L2)的逻辑回归模型。

 

 

第五步,模型评估

对模型进行评估,查看评价结果,模型的AUC值达到了0.827,具有较好的泛化性能。精度达到了0.774,召回率为0.602具有一定的预测能力,还可进一步修改完善,提高准确率。

 

第六步,模型优化

对所选7个变量的特征值进行排名,剔除不明显的影响因素,采用信息增益、增益率、卡方三个指标进行评价,结果如图所示。可知排名最低的是年龄(age)变量,此变量对目标变量的影响微乎其微,反而徒增了数据体量及外部噪声。为了消除一些对目标变量影响不大的特征,减少外部噪声,选择将其过滤。

 

重新构建正则化类型为岭回归(L2)的逻辑回归模型,查看模型评价结果。可知模型精度提升至0.921,模型改进有效。

 

第七步,分析结果

通过以上步骤获得了具有较强预测性能的客户流失预测模型,接下来采用该模型预测未知流失标签的客户,来区分不同流失可能度的客户。然后筛选标签为流失的客户,显示有6635个可能流失客户。

 

回顾整个分析过程的操作流如图所示。

结论

 

美国佐治亚州立大学营销学教授V·库马尔(V. Kumar)专门研究企业赢回客户的策略,他认为企业应该更重视流失的客户。原因是流失客户熟悉公司情况,不用重新介绍品牌或服务内容,这降低了营销成本。所以如何留住可能流失的客户对航空公司来说非常重要。现在我们通过逻辑回归模型预测出可能流失的客户,需要制定有效的战略,留住这些客户。

首先对这些客户进行整体分析,挑选一些样本进行电话调研,了解客户最近的状态,分析客户长时间未使用我们的航空服务的原因。然后针对可能的原因制定客户吸引策略。对于公司内部员工制定流失客户邀约计划,对成功邀请客户重新体验服务的员工制定奖励政策。对于客户提供更多活动吸引再次体验,比如赠送会员卡、活动礼券,对客户进行关怀的行动,利用纪念活动、店庆活动、公益活动邀请客户再次登录。


转载:https://blog.csdn.net/wenyusuran/article/details/113942235
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场