天池平台已经举办了超过 200 场来自真实业务场景的竞赛,每场赛事沉淀的课题和数据集,将在天池保留和开放。天池平台已成为在校学生踏入职场前的虚拟实践基地,也成为聚集40万数据人才,孵化2000余家数据创新工作室的数据智能大社区。
七年前,天池团队的几名创始成员带着*“让全世界没有能力Access到大数据的人可以公平地Access到大数据” *的信念,走上了建设天池的道路。
这7年间,天池举办了超过200场来自真实业务场景的竞赛。从2014年的首场天池天猫推荐算法挑战赛到2015年的阿里巴巴集团算法黄金联赛,天池在阿里巴巴经济体内各条业务线成功地燃起了一把火,电商、金融、物流、文娱业务都相继在天池开放数据并举办算法竞赛。与此同时,高校也弥漫着浓浓的天池竞赛风,很多学生通过参加天池竞赛拿到了阿里巴巴校招的Offer。
为了满足社区开发者的学习诉求,帮助其更快地入门和成长,阿里云天池平台不仅把每场赛事沉淀的课题和数据集在天池永久保留和开放,还思考如何把头部玩家沉淀的珍贵解决方案和技术分享出来,让他们的经验成为某种可参考、可依循的轨迹,帮助初级开发者入门。显然,一本基于天池大数据竞赛实战经验和技术积累、从应用场景出发的算法图书是最好的输出形式,因此,天池平台联合电子工业出版社博文视点出版了《阿里云天池大赛赛题解析——机器学习篇》,并且正式预售啦!
天池平台 著
国内第一本针对竞赛实操的图书揭开人工智能算法的神秘面纱透析大赛专业选手的解题思路
四大经典场景无保留全解密
多年来,阿里云的天池大赛深受海内外热爱人工智能的学生的欢迎,大赛提供了海量的实际应用场景数据,其都是学生在校园场景中难以触及的。天池团队从200多场竞赛中筛选了最典型的四大竞赛——
工业蒸汽预测
天猫用户重复购买预测
O2O优惠券预测
阿里云安全恶意程序检测
每个竞赛都从赛题理解、数据探索、特征工程、模型训练、模型验证、特征优化、模型融合7个步骤展开讲解、层层递进,解析竞赛内容和解决方案,并提供全部的源码、数据集。为了让学习者更方便参与进来,天池还提供了免费的线上编码环境PAI DSW(Data Science Workshop),你无需下载和安装任何编程环境,在任何平台(Mac\Windows\Linux等)都可以无缝参与使用,点击这里查看DSW使用方法。
人人受用的实操手册
如果你想开始你的算法学习和竞赛之路,如果你想在竞赛中取得更好的成绩,如果你想知道普通选手和优秀选手的差距,如果你也想通过竞赛拿到更好的offer……那么无论你是小白还是大神,我都推荐你学习本书。作为小白,这是一本很适合的竞赛入门书,也是一本很好的算法学习实践图书;作为大神,你可以通过本书实战内容梳理自己的竞赛知识点和技能圈,查漏补缺,更上一层楼!
▊ 本书结构
赛题一 工业蒸汽量预测
1 赛题理解
1.1 赛题背景1.2 赛题目标1.3 数据概览1.4 评估指标1.5 赛题模型
2 数据探索
2.1 理论知识2.2 赛题数据探索
3 特征工程
3.1 特征工程的重要性和处理3.2 数据预处理和特征处理3.3 特征降维3.4 赛题特征工程
4 模型训练
4.1 回归及相关模型4.2 赛题模型训练
5 模型验证
5.1 模型评估的概念和方法5.2 模型调参5.3 赛题模型验证和调参
6 特征优化
6.1 特征优化的方法936.2 赛题特征优化
7 模型融合
7.1 模型优化7.2 赛题模型融合赛题二 天猫用户重复购买预测**1 赛题理解**1.1 赛题背景1.2 数据介绍1.3 评估指标1.4 赛题分析
2 数据探索
2.1 理论知识2.2 赛题数据探索
3 特征工程
3.1 特征工程介绍3.2 赛题特征工程思路3.3 赛题特征工程构造
4 模型训练
4.1 分类的概念4.2 分类相关模型
5 模型验证
5.1 模型验证指标5.2 赛题模型验证和评估
6 特征优化
6.1 特征选择技巧6.2 赛题特征优化赛题三 O2O优惠券预测**1 赛题理解**1.1 赛题介绍1.2 赛题分析
2 数据探索
2.1 理论知识2.2 初步的数据探索2.3 数据分布
3 特征工程
3.1 赛题特征工程思路3.2 赛题特征构建3.3 对特征进行探索
4 模型训练
4.1 模型训练与评估4.2 不同算法模型的性能对比4.3 结果输出
5 模型验证
5.1 评估指标
5.2 交叉验证
5.3 模型比较
5.4 验证结果可视化
5.5 结果分析5.6
模型调参5.7
实际方案
6 提交结果
6.1 整合及输出结果
6.2 结果提交及线上验证
赛题四 阿里云安全恶意程序检测
1 赛题理解
1.1 赛题介绍
1.2 赛题分析
2 数据探索
2.1 训练集数据探索
2.2 测试集数据探索
2.3 数据集联合分析
3 特征工程与基线模型
3.1 特征工程概述
3.2 构造线下验证集
3.3 基线模型
4 高阶数据探索
4.1 变量分析
4.2 高阶数据探索实战
5 特征工程进阶与方案优化
5.1 pivot特征构建
5.2 业务理解和结果分析
5.3 特征工程进阶实践
6 优化技巧与解决方案升级
6.1 优化技巧:Python处理大数据的技巧
6.2 深度学习解决方案:TextCNN建模
7 开源方案学习
天池大赛提供了一个“云”上的练兵场,让所有对人工智能应用感兴趣的开发者都能很容易地触达业界的实际需求和场景。基于天池的实际案例,本书向读者提供了一手的体感和经验,非常值得一读。
—— 阿里巴巴副总裁 贾扬清
更多科技资讯请见微信公众号:博文视点Broadview(微信号:bvbooks)
转载:https://blog.csdn.net/broadview2006/article/details/108284965