来自|Medium
作者|Adam Geitgey
编译|深度学习这件小事
参与|Simy
你是否曾经听到别人谈论过机器学习,但对于什么是机器学习都只有一个模糊的印象?你是否厌倦了跟同事聊起机器学习时只能点点头说对呢?现在,让我们一起来改变这种情况吧!
本指南适用于对机器学习感兴趣但不知道怎么入门的人。 我猜有很多人可能在维基百科上看过“机器学习”词条,容易越看越崩溃,甚至弃疗。这就是为什么写这篇指南的原因。
我们的目标就是要让所有人都能看懂,防止大家“从入门到放弃”。如果看了本文,大家能对机器学习更感兴趣了,那我们的任务就完成了。
何为机器学习?
机器学习是一种思想:通过通用算法从一组数据中提取出有用信息,而无需针对具体问题编写自定义代码。无需编码,通用算法将基于给定数据构建出自己的逻辑。
如分类算法,它可以将数据归入不同分组。不用修改一行代码,用于识别手写数字的分类算法也可以用于识别垃圾邮件。同样的算法,基于不同训练数据,可以得到不同的分类逻辑。
该机器学习算法是一个黑盒,可以重复用于许多不同的分类问题。
“机器学习”是一个涵盖大量通用算法的总称。
两类机器学习算法
机器学习算法可简单分为两类:监督式学习( supervised learning )和非监督式学习(unsupervised learning)。
监督式学习
假设你是房产销售经理,因为不断增长的业务,聘请了一批新的实习生来帮助自己。但碰到了一个问题——你可以一眼看出房子的价值,但实习生们不如你有经验,不知道该如何给房子定价。
为了帮助你的实习生,你决定写一个小应用,可以根据房子大小,地段,以及类似房屋的成交价等因素来估算你的房屋的价值。
因此,近3个月来,每当有人在你所在城市出售房子,你就会记下来。 对于每个房子,你记下了一堆细节——卧室的数量,单位面积价格,地段等等,包括最重要的成交价:
这就是我们的训练集。
我们希望基于这个训练集写一个程序,估算房子价格。
我们想用训练集估算其他房子的价格。
这就是监督式学习。已知每个房子的售价,或者说,已知问题的答案,你就可以从反向推出解题的逻辑。
为了开发你的app,你将有关每个房子的训练数据输入到机器学习算法中,该算法会努力找出用什么数学方法可以正确估算出价格。
这就好像已知数学测试的答案,但所有算术符号都被擦掉了:
Oh no! 一个狡猾的学生擦去了答案上的所有算数符号!
从这,你可以看出这些数学测试题是怎么样的吗?你可能需要根据左边的数字做一些尝试来得到右边的答案。
在监督式学习中,你让计算机来找出这个数学关系。 一旦找出了这个关系,你就可以回答同一类型的任何其他问题!
非监督式学习
让我们回到我们房产销售的例子。如果你不知道每个房子的售价怎么办? 即使你只知道每个房子的大小,地段等,事实证明你仍然可以做一些非常酷的东西。这称为无监督式学习。
即使您没有尝试预测未知数字(如价格),您仍然可以通过机器学习做有趣的事情。
这就像有人给你一列数据并告诉你“我不知道这些数字是什么意思,但也许你可以找出其中的规律或是分组什么的——祝你好运!”
那么问题来了,这些数据要怎么处理呢?对于初学者,你可以用算法自动识别数据中不同的细分市场。也许你会发现,本地学校附近的购房者比较喜欢有很多卧室的小房子,但郊区的购房者更喜欢有三居室的大房子。了解不同类型的客户有助于指导销售工作。
你可以做的另一件很酷的事就是自动识别出与众不同的房屋。也许那些与众不同的房屋是巨型豪宅,你可以把最好的销售人员集中在这些地区,因为它们佣金更高。
监督式学习是我们接下来关注的重点,这不是因为无监督式学习不那么有用或有趣。实际上,随着算法的优化,无监督学习变得越来越重要,因为它可以在无正确答案标记数据的情况下使用。
旁注:还有很多其他类型的机器学习算法。但监督式学习是一个非常好的起点。
太酷了,但估计房子价格真的可以算作“学习”吗?
作为人类,你的大脑可以应付大多数情况,并学习如何处理没有任何明确指示的情况。如果卖了很久的房子,你会对房子的合适价格,推销房子的最佳方式,感兴趣的客户类型等问题产生一种本能“感觉”。强人工智能研究的目标是能够用计算机复现这种能力。
但目前机器学习算法并没有那么好——它们只在针对具体,限定的问题时才能有效工作。这种情况下,对“学习”的更好定义可能是“根据一些样本数据来找出解决特定问题的公式”。
不幸的是,“根据一些样本数据来找出解决特定问题的公式”并不是一个好名字。所以我们最终选择了“机器学习”。
当然,如果你是在50年后的未来阅读了这篇文章,并且已经找到了强AI的算法,那么整篇文章看起来会有些古怪。所以,未来的小伙伴,别犹豫,最好还是别继续看了,让你的机器仆人给你做个三明治吧。
— 未完,待续 —
为您推荐
10月机器学习Top 10 文章/教程汇总
过来,我这里有个「混淆矩阵」跟你谈一谈。
谣言止于智者,AI帮你识别虚假新闻
一步一步,看图理解LSTM与GRU
【资源】MIT强化学习教程,了解一下
本篇文章来源于: 深度学习这件小事
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
内容反馈