知行编程网知行编程网  2022-03-05 20:00 知行编程网 隐藏边栏 |   抢沙发  8 
文章评分 0 次,平均分 0.0

机器学习,从入门到放弃?

来自|Medium

作者|Adam Geitgey

编译|深度学习这件小事

参与|Simy


你是否曾经听到别人谈论过机器学习,但对于什么是机器学习都只有一个模糊的印象?你是否厌倦了跟同事聊起机器学习时只能点点头说对呢?现在,让我们一起来改变这种情况吧!


本指南适用于对机器学习感兴趣但不知道怎么入门的人。 我猜有很多人可能在维基百科上看过“机器学习”词条,容易越看越崩溃,甚至弃疗。这就是为什么写这篇指南的原因。


我们的目标就是要让所有人都能看懂,防止大家“从入门到放弃”。如果看了本文,大家能对机器学习更感兴趣了,那我们的任务就完成了。


何为机器学习?


机器学习是一种思想:通过通用算法从一组数据中提取出有用信息,而无需针对具体问题编写自定义代码。无需编码,通用算法将基于给定数据构建出自己的逻辑。


如分类算法,它可以将数据归入不同分组。不用修改一行代码,用于识别手写数字的分类算法也可以用于识别垃圾邮件。同样的算法,基于不同训练数据,可以得到不同的分类逻辑。

机器学习,从入门到放弃?

该机器学习算法是一个黑盒,可以重复用于许多不同的分类问题。


“机器学习”是一个涵盖大量通用算法的总称。


两类机器学习算法


机器学习算法可简单分为两类:监督式学习( supervised learning )和非监督式学习(unsupervised learning)。


监督式学习


假设你是房产销售经理,因为不断增长的业务,聘请了一批新的实习生来帮助自己。但碰到了一个问题——你可以一眼看出房子的价值,但实习生们不如你有经验,不知道该如何给房子定价。


为了帮助你的实习生,你决定写一个小应用,可以根据房子大小,地段,以及类似房屋的成交价等因素来估算你的房屋的价值。


因此,近3个月来,每当有人在你所在城市出售房子,你就会记下来。 对于每个房子,你记下了一堆细节——卧室的数量,单位面积价格,地段等等,包括最重要的成交价:

机器学习,从入门到放弃?

这就是我们的训练集。


我们希望基于这个训练集写一个程序,估算房子价格。

机器学习,从入门到放弃?

我们想用训练集估算其他房子的价格。


这就是监督式学习。已知每个房子的售价,或者说,已知问题的答案,你就可以从反向推出解题的逻辑。


为了开发你的app,你将有关每个房子的训练数据输入到机器学习算法中,该算法会努力找出用什么数学方法可以正确估算出价格。


这就好像已知数学测试的答案,但所有算术符号都被擦掉了:

机器学习,从入门到放弃?

Oh no! 一个狡猾的学生擦去了答案上的所有算数符号!


从这,你可以看出这些数学测试题是怎么样的吗?你可能需要根据左边的数字做一些尝试来得到右边的答案。


在监督式学习中,你让计算机来找出这个数学关系。 一旦找出了这个关系,你就可以回答同一类型的任何其他问题!


非监督式学习


让我们回到我们房产销售的例子。如果你不知道每个房子的售价怎么办? 即使你只知道每个房子的大小,地段等,事实证明你仍然可以做一些非常酷的东西。这称为无监督式学习。

机器学习,从入门到放弃?

即使您没有尝试预测未知数字(如价格),您仍然可以通过机器学习做有趣的事情。


这就像有人给你一列数据并告诉你“我不知道这些数字是什么意思,但也许你可以找出其中的规律或是分组什么的——祝你好运!”


那么问题来了,这些数据要怎么处理呢?对于初学者,你可以用算法自动识别数据中不同的细分市场。也许你会发现,本地学校附近的购房者比较喜欢有很多卧室的小房子,但郊区的购房者更喜欢有三居室的大房子。了解不同类型的客户有助于指导销售工作。


你可以做的另一件很酷的事就是自动识别出与众不同的房屋。也许那些与众不同的房屋是巨型豪宅,你可以把最好的销售人员集中在这些地区,因为它们佣金更高。


监督式学习是我们接下来关注的重点,这不是因为无监督式学习不那么有用或有趣。实际上,随着算法的优化,无监督学习变得越来越重要,因为它可以在无正确答案标记数据的情况下使用。


旁注:还有很多其他类型的机器学习算法。但监督式学习是一个非常好的起点。


太酷了,但估计房子价格真的可以算作“学习”吗?


作为人类,你的大脑可以应付大多数情况,并学习如何处理没有任何明确指示的情况。如果卖了很久的房子,你会对房子的合适价格,推销房子的最佳方式,感兴趣的客户类型等问题产生一种本能“感觉”。强人工智能研究的目标是能够用计算机复现这种能力。


但目前机器学习算法并没有那么好——它们只在针对具体,限定的问题时才能有效工作。这种情况下,对“学习”的更好定义可能是“根据一些样本数据来找出解决特定问题的公式”。


不幸的是,“根据一些样本数据来找出解决特定问题的公式”并不是一个好名字。所以我们最终选择了“机器学习”。


当然,如果你是在50年后的未来阅读了这篇文章,并且已经找到了强AI的算法,那么整篇文章看起来会有些古怪。所以,未来的小伙伴,别犹豫,最好还是别继续看了,让你的机器仆人给你做个三明治吧。


— 未完,待续 

为您推荐

10月机器学习Top 10 文章/教程汇总

过来,我这里有个「混淆矩阵」跟你谈一谈。

谣言止于智者,AI帮你识别虚假新闻

一步一步,看图理解LSTM与GRU

【资源】MIT强化学习教程,了解一下

本篇文章来源于: 深度学习这件小事

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享