很多人想要搭上人工智能这列二十一世纪的快车,不断的顺应着互联网时代的变化,力求在这个不断革新的时代领域博得自己的一片立足之地。
同样在高速发展的时代,人工智能这个名词似乎让我们不再陌生,伴随而来固然是机器学习领域的新潮。
可能很多人对于‘机器学习’这个全新的名词了解之甚少,所以今天大灰狼就来和大家聊一聊‘机器学习’到底存在着怎样的神秘色彩?
到底什么是机器学习?
通俗的来讲,
机器学习(Machine Learning, ML)是一门多领域的交叉学科,它涉及的领域很广,包括概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。
是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。从而通过一系列的行为进化,让机器更加便捷逼真的为人类所用。
机器学习是AI人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎,同样,它也是一门让冷冰冰的机器赋予人性的高级学科。其目的就是为了设计和分析一些可以让计算机自动学习的算法。
它有哪些切实的用途?
截止目前,机器学习在互联网、医学及其他领域已经有了十分广泛的应用,例如:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用,这些都需要机器学习的不断深入和开发,才能达到更高的效率的应用需求。
接下来大灰狼就简单的和大家介绍一下机器学习的基本内容和简单的学习方法,
对于机器学习算法,它是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。
因为学习算法中涉及了大量的统计学理论,而机器学习与统计推断学联系尤为密切,所以也被称为统计学习理论。在算法设计方面,机器学习理论关注可以实现的、行之有效的学习算法。很多推论问题属于无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。
而对于机器学习,大灰狼也有以下几方面的建议和大家分享。
01 不要试图掌握所有知识后再开始学习
其实对于很多领域的学习都是这样,并且几乎每一个都不是独立存在的,它或多或少的都会与其他相关领域有一定的关联和互通性。
因此我们在对相关领域的知识进行学习的时候,并不需要先将其涉及的内容通学一遍,这样不可避免的就会造成很多时间上的浪费,同时学习的效率也会相对低下。而对于机器学习领域来说也是这样。一般来说,机器学习的课程和书籍有:
线性代数:矩阵/张量乘法、求逆,奇异值分解/特征值分解,行列式,范数等
统计与概率:概率分布,独立性与贝叶斯,最大似然(MLE)和最大后验估计(MAP)等
优化:线性优化,非线性优化(凸优化/非凸优化)以及其衍生的求解方法如梯度下降、牛顿法、基因算法和模拟退火等
微积分:偏微分,链式法则,矩阵求导等
信息论、数值理论等
对于一般人来说,学习完这些相关知识往往需要很长的时间和精力,容易半途而废,而且这些相关知识是工具而不是目的,我们的目的还是对机器学习有一定的了解和实践,因此这些课程完全可以在对机器学习的同时,有针对性的补充和了解,这样有目的性且耗时更低。
02 不要把深度学习作为入门第一课
虽然很对人学习‘机器学习’都是冲着深度学习来的,但把深度学习作为机器学习的第一课,并不是一个好的举措,原因如下:
深度学习的黑箱性更加明显,很容易学得囫囵吞枣
深度学习的理论/模型架构/技巧还在一直变化当中,并未尘埃落定
深度学习实验对硬件要求高,不太适合自学或者使用个人电脑进行学习
因此学习机器学习可以先从最基础的入门开始,在这里大灰狼推荐吴恩达老师的Cousera机器学习课程,(Machine Learning | Coursera)
03 不要收集过多的资料&分辨资料的时效性
虽然机器学习的兴起时间并不算太长,但机器学习的资料很多,动辄就有几个G的材料可以下载或者观看。而很多朋友都有“收集癖”,甚至一下子购买十几本书,但到真正用到的并无多少。
机器学习的发展和变化速度很快。在入门期间,建议“小而精”的选择资料,选择近期出版的且口碑良好的书籍即可。
下面大灰狼来和大家聊一下机器学习前期的相关准备
硬件条件
另一个大家常问的问题是:是否可以用自己的笔记本电脑进行机器学习。答案是肯定的,大部分市面上的数据集都可以放到你的内存中运行。
在入门阶段,我们很少会用到非常大的数据集,一般最大也就是MNIST,完全可以使用个人笔记本电脑进行运行。在Windows笔记本上也可以用GPU进行深度学习,请不要打着学习的名义重新购买机器…
软件选择
如果要做深度学习,大灰狼首推Linux,因为其对很多学习模型支持比较好(主要是深度学习的Library)。但即使你使用的是Windows系统,也可以用虚拟机装Ubuntu来进行学习。对于小型的深度学习模型足够了,大型的深度学习我们通畅也很少在本地/个人计算机上运行。
至于编程语言,首推Python,因为Python具有良好的拓展支持性,主流的工具包都有Python版本。但特定情况下,选择R作为编程语言也是可以的。其他可能的语言还包括C++、Java和Matlab,但我个人不大推荐。毕竟根据机器学习的走向来看,Python在机器学习上的应用也在近一步的的得到推广。
写在最后
虽然很多人曾说二十一是生物的世纪,但现在互联网的时代早已到来,这是属于人工智能的世纪。你若了解机器学习,就会发现数据分析也有它自己的魅力。
让每个人都可以尝试将机器学习知识应用于他们原本的领域,摒弃人为制造的知识壁垒。唯有这样,机器学习技术才能在更多的不同领域落地,从而反哺机器学习研究本身。
科技日新月异,我们不鄙弃追逐热点的人。但在这个浮躁的时代,不管选择什么方向最重要的就是独立思考的能力,和去伪存真的勇气。
因此,看完这篇文章,你可能仍然了解甚少,但每一份知识的学习都是无穷无尽的,我最希望的是你既不要急着全盘接受,也不要因为不对胃口全盘否定。慢下来,好好想想,制定适合自己的计划,这不仅是做科学工作的正确态度。更是我们每一个人对待生活的态度!
拒绝外界的噪音,无论是鼓励还是嘲笑,抱着‘长风破浪会有时,直挂云帆济沧海’的信念,坚定不移的努力下去,终有一天你会发现,成功大门的钥匙早已被你纳入囊中!
觉得不错记得点赞关注,
Windows笔记本利用GPU进行深度学习的相关资料可以关注我的微信公众号“灰狼洞主”回复‘机器学习’获取!
大灰狼期待与你一同进步!
转载:https://blog.csdn.net/weixin_44985880/article/details/105928097