编辑:忆臻
https://www.zhihu.com/question/341086622
本文仅作为学术分享,如果侵权,会删文处理
如今深度学习支撑下的人工智能退潮趋势已现,CV博士研究还有哪些方面可做?
作者:元峰
https://www.zhihu.com/question/341086622/answer/801275957
昨天看字节跳动的李航说,人工智能的发展可能进入一个平缓期。从个人这几年的观察来看,在深度学习感知领域,例如图像分类、检测和分割,目前已经很少有像VGG、ResNet、RCNN系列、SSD、YOLO、Deeplab这样在大算法思路上有突破性的工作了。DL学术界的论文很有突破性的越来越少了。当前深度学习的竞赛,例如人脸检测、目标检测,主要都是在Faster RCNN、SSD、FPN这种网络结构上堆砌更多层,叠加之前的成果,例如Focal Loss什么的,更深的网络、组合之前的一些成果,把榜单刷上去,但这已经不算突破性的成果了,而且这种大模型可能并不实用。在产业界,要做性能和模型运算量大小的权衡。
另外,例如开阔场景下的人脸识别,分辨率很低,用什么算法也不见得能把准确率做的很高。AI公司toB的行业属性,也导致它们不像互联网toC公司那么赚钱。像几家知名的AI公司,一年营业额可能也就在10亿到几十亿的水平,这个营收,离快手这种营收200多亿的都有一个数量级的差距。
AI不是一个单独的行业,它必须与各行各业结合才能产生价值,赋能各行各业,提升行业的效率。像把人脸识别、美颜算法卖给Oppo、小米这种公司,或者工业产品线上的缺陷检测,行人属性识别。总之,作为一个行业从业者,感觉这个行业并没有什么光鲜的。
现在人工智能研究方向已经逐渐从感知领域到认知领域转变。但是认知领域更基础一些,可能离产品化更远一些。
如果题主是踏实的人,进入这行也可以,认认真真,肯定是可以发出论文的。毕竟行业也比较热,资料也非常丰富。
个人愚见,不一定正确。
作者:李文亮
https://www.zhihu.com/question/341086622/answer/801363135
CV只是机器学习的一个应用领域。机器学习里的各种问题新层出不穷,比如监督式学习中,few shot learning,distribution regression, 以及学界大红大紫的非监督式模型,如生成模型,disentanglement,因果推断,统计检测方法,算法公平性,自己各种优化算法…任何一个搬过来都可以有CV应用。
如果说深度学习这一机器学习子集,在图像上的监督式学习应用出现了瓶颈(说白了就是结构,调参已经做到头了),我觉得不影响CV这个学术领域的发展,也不影响一个真正CV学者的研究范围。
同时,我不同意把仅拿来已有模型拿来做调参等炼丹手法的当做CV科研人员,博士也应该避免做这些事情。这个瓶颈如果存在,卡住的正是这帮人。
作者:陈昊
https://www.zhihu.com/question/341086622/answer/799715056
从科研界的角度来说,CV领域近些年来已经没有像13-15年那样每年都有突破性的进展了,而且年度最为重要的成果越来越集中在几个大的公司团队上。在业界角度里面,很多CV的项目存在落地困难的情况,仅有的几个落地项目也大多被大佬瓜分,这些落地困难不仅仅是算法本身的缺陷,还有业界对于深度学习算法可解释性不强的担忧,这些担忧导致政策,市场上迟迟不能开放。
如果对于CV领域确实感兴趣,我认为可以从以下几个方面入手:
-
引入其他理论来改造基于概率统计模型的不足;众所周知目前的深度学习模型并不是强人工智能,很多东西都做不了,其中大佬们认为最为关键的地方在于目前框架无法做到逻辑推理,无法做到高效地并且是可解释性的训练;完全基于独立假设的模型这从底层逻辑上就是严重的限制,很显然,现实情况中样本与样本之间存在相关性这一点就被忽略了,最近很多关于图神经网络结合CNN的成果也就是奔着解决这个问题去的。
-
在某些特定领域做深入地探讨,现在很多通用模型是在大规模常规图像上获得较好的结果,但是在某些特定领域,比如医学图像领域往往得不到很好的表现,这主要是因为通用模型考虑的一些因素在特定领域并不适合,但是特定领域的图像特点,数据集特点也不能在这些模型设计中得到重点考虑所致。
-
模型数学理论;其实我觉得构建相应的数学理论是解决模型可解释性的根本通道,现在CV算法在有些领域迟迟不能落地的原因一方面在于难以满足这些领域的严格可证伪要求,这导致这些领域尽管有很多学术成果,但是落地的很少,甚至没有。
上面都是我的浅见,是在贻笑大方了。
作者:tom zhang
https://www.zhihu.com/question/341086622/answer/801617195
第一,如今的人工智能不仅仅是深度学习,更谈不上深度学习对其支撑,论应用范围可能统计机器学习更庞大。
第二,视觉这一块深度学习做的多,而且很多领域开始进入准应用状态。但是,也不是说博士就不能做应用,整个计算机领域,应用也都是很大的一块,找合适的应用场景达到毕业要求是关键
第三,顶会很重要,牛刊很重要,但是不是谁都有,你看没有这两样的稍微过得去的CV博士还不是照样工作随便找。
第四,当然必须承认,深度学习方面很多肉已经被吃完了,剩下的就是骨头,比如黑匣模型的可解释性与调参的根据性。掂量下这种活自己能胜任吗。
为您推荐
本篇文章来源于: 深度学习这件小事
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
内容反馈