知行编程网知行编程网  2022-06-13 18:00 知行编程网 隐藏边栏 |   抢沙发  6 
文章评分 0 次,平均分 0.0

如何看待2021年秋招算法岗灰飞烟灭?

来自 | 知乎  

链接 | https://www.zhihu.com/question/406974583

编辑 | 深度学习这件小事

本文仅作学术交流,如有侵权,请联系后台删除
如何看待2021年秋招算法岗灰飞烟灭?

   问题

如何看待2021年秋招算法岗灰飞烟灭?

18年是否值得进入,19年供大于求,20年一片红海诸神黄昏。


去年都诸神黄昏了,今年换个词——“灰飞烟灭”。


21届找算法相关工作的同学不妨进来谈谈感想。



   高质量回答


XX Zhao
在远方

https://www.zhihu.com/question/406974583/answer/1341908112

著作权归作者所有。


我以一个公司的面试官角度来回答一下这个问题吧。

我目前在tmd中一家的业务线上担任图像算法工程师,由于团队成立不久,我平时工作中承接了大量的面试。从6月起,我们就开始了提前批的校招,每周进行一次统一面试。每次业务线笔试大概通过60个简历,其中有近40个投向了算法岗位。我们计算机视觉岗位在上一轮提前批面试中居然收到了28份简历,而我们整个校招的hc只有2-3个。目前我们的offer已经发放完毕,实际录用比大概是1:30,后续校招我们部门的计算机视觉算法岗位将要停止招聘了,不得不说很多优秀的人因为简历投递晚了失去了机会。

我们面试下来的总体感受是,简历非常多,但是我们想要的非常少。我们现在不需要调参侠,我们需要的是有扎实计算机基础的工程师。由于简历过多,我们将一轮面试调整为计算机通用基础面试。我们希望候选人的计算机基础扎实,编程语言,操作系统,数据结构,计算机网络这些基础不能差。但是相比于开发岗位而言,我们的要求其实大大低于开发岗位。在二面的时候,我们更关注于计算机视觉的落地经历,对于论文其实没什么要求。总体看下来,一面的通过率极低,很多人连栈和堆都不知道,这样的计算机基础根本过不了一面。在二面的时候,我们关注候选人的项目经历。很多候选人就读了两篇论文,跑了几个比赛,这些经历在这么多简历中显得非常普通,在一众候选人中也没什么亮点。我们需要的人是有一定工程能力,有实际的落地经历的,但是大多数人不具备基本的工程能力。

那我们需要什么人呢,我以我们的实习生为例,看看我们希望的候选人是什么样子的。

我们在4月中旬招收了一名实习生,他之前在学校主要做目标检测,我们招收的时候觉得他基础不错。从入职到转正答辩,大概经过了两个半月。我们看看这两个半月他做了什么。刚刚入职,我们商量了一下,确定了要做算法A。实习生在两周以内,对比了各种主流方法,确定使用一种简单的基于深度学习模型,理论上能够在CPU实时。随后1个月时间,实习生使用PyTorch复现了论文,并使用两种方法改进了该模型在实际场景中的缺点。在大概1个半月的时候,实习生认为,算法效果已经达到预期,我们验收发现,已经满足预期要求。在后面一周时间里面,实习生使用C++在我们的代码中加入了该模型的工程实现,但是原始的实现不能满足实时要求。实习生花了一周时间,加入了多线程,速度大大提高,但是只能达到准实时。后来实习生认为,该算法的部分模块和resize有相似之处,于是花费几天阅读了OpenCV的实现,认为通过定点化和SIMD能够改善速度。后续实习生又改进方法,提高cache命中率,使得速度能够在i5上达到50fps。这些工作能在两个半月实现,大大出乎我们的意料,答辩毫无悬念通过。

我们想要的cv工程师是什么样子的,从上面这个例子可以看到一角。训练模型,部署模型,算法优化,这些都是我们的工作,不给自己设限、追求极致是我们对工程师的要求。我们需要的是解决实际问题的能力,计算机视觉相关的算法和工程都是我们解决问题需要的技能,只有足够的基础才能在遇到问题时候给出足够好的解决方案。

对于CV岗位,我的态度是劝退。今年我们组的开发岗位hc很多,简历非常少,很容易就能拿到岗位。客户端开发更是难求,现在招聘已经不要求客户端开发经历了,只要编程基础扎实就好。对于大多数cv方向的同学,我建议换个方向,比如音视频开发的岗位可以考虑,算法方向音频相关算法也值得考虑。

邱震宇
程序员 机器学习 NLP探索者

https://www.zhihu.com/question/406974583/answer/1343760618

著作权归作者所有。


说点实在的,就我们这边NLP的算法工程师来说,有以下技能需要实实在在得掌握:

1、正则表达式。对,你没看错,就是正则表达式。除了简单的文本匹配场景外,各种文档结构化、信息抽取的冷启动,基本都是靠这个。因为在实际业务下,你不可能一上来就能获取高质量的标注数据,更别说上各种sota模型训练了,所以你可能要掌握各种正则骚操作,比如XX前面不存在XX字符且后面存在XX字符,或者XX字符出现几次且后面必须出现XX字符的场景。其实我一直想做一个根据人类语言自动提供正则表达式推荐的模型,调研了一阵子发现难度很大,从另一个角度也说明要写好正则表达式也非常难的。

2、常用句法分析工具。这个一般主要会在关键短语抽取、信息抽取里使用。由于缺少标注数据,不能使用sota模型,又因为单独使用正则毕竟不能cover各种case,因此有时候需要与句法分析工具结合,配合对简单语法的使用,例如主谓结构,动宾结构,补语结构等等,找出我们所需的信息单元。不过从头训练一个句法工具通常来不及满足业务方的上线期限,因此通常会使用一些已有工具如哈工大的LTP,虽然有些问题,但是大多数情况下够用。

3、性能优化的意识。这里并不特指某个性能优化的方法,而是在日常写代码的时候,要有这个意识,例如如何优化循环的效率、能够并行化操作的地方尽量并行化,模型读取数据的时候如何优化读取的效率,模型部署上线inference的时候是否满足业务的性能要求,如果不满足,能够找到性能优化的位置,例如模型设计的时候是否设计了冗余的层数、是否使用了过于复杂的模型,部署的时候是否使用一些高效的部署方式(例如tensorflow-serving)、是否可以使用tensorRT优化部分op,是否可以针对部署平台上的硬件环境重新编译tensorflow等等。这些都需要在实际的工程中自己一个个趟坑趟出来。

4、linux。这个技能也是刚需的,但是并不需要你对linux的操作精通到什么程度,但至少你得懂常用的操作命令吧,例如监控服务器的状态、防火墙策略的配置、docker的简单操作、常用数据库的操作(mysql、postgresql等)、压缩解压包命令、ftp/sftp命令、chmod命令、vi、cat、ps等等,具体就不详细说了。

除了上述技能外,我默认大家对NLP领域的技术都是符合条件的,所以就没额外说明。如果你对基础的统计机器学习、RNN、transformer、bert等不太了解的话,那实在是说不过去了。

上述技能针对的是需要落地需求的算法工程,但如果你是专门做算法研究,对落地没有要求的,那就可以忽略上面的东西,此时你需要的就是拼论文、拼比赛、拼研究组、拼导师、拼学长学姐。。。

最后说一下这个内卷问题,其实我在知乎上说非技术的事情很少,一方面是我在这块向来思考不多,怕说多了被人喷,另一方面我这个人也比较佛系,不太会去跟别人争来争去。这次也只是想陈述一下自己的观点,如果觉得有道理,可以试用试用,如果觉得没道理,大可以无视之。

首先,内卷这个问题是客观存在的。作为一个17年计算机专业但是非科班半路转行的人,我承认自己占了一定的早期红利,如果把我放到现在,估计我也是那批被卷成人干的人。即使是刚入行的几个月,我也会经常焦虑,焦虑自己会不会被其他有顶会、有比赛的大佬淘汰掉,看到其他北上广大厂的大佬的薪资,焦虑自己会被困在南京这个行业环境不太好的地方,甚至还会焦虑自己35岁是不是就下岗了。后来我慢慢跟自己和解了,接受了自己的能力所限,毕竟有人第一的话,总有人是最后一名吧,但是这个最后一名并不代表你是不好的,只是人家比你更好而已。

今年疫情原因加上行业内岗位日趋饱和,好工作确实难找,但这并不是我们的错,我们也没办法改变当前这个状况,我们能做的是好的岗位该争取就争取,但是面试过不了或者连面试机会都拿不到的时候也别过分在意,找工作的时候虽然要注意一些坑,但是最好不要考虑太多因素,遇到合适的就去吧。工作的时候,努力在自己力所能及的范围内将事情做到极致,该争取时候的争取,争取不到也无需过度在意,玩把游戏,弹弹琴就过去了。

毕竟生活大于工作。


DravenZhang
做程序员里最会买买买的人

https://www.zhihu.com/question/406974583/answer/1341906980

著作权归作者所有。


本人就是18年算法岗人数暴增读的研究生,那个时候懂点CNN,RNN啥的,熟悉几个网络结构,再有个一般的论文,竞赛参与几个,注意是“参与”,也不一定非要有名次,校招都能拿个好offer。实验室的师兄也都是个个工资20k。

当时的自己是本科毕业工作了一年,觉得天天做开发,写需求没啥意思。那时候人工智能、机器学习什么的也是铺天盖地的宣传,人人都以为这是未来的趋势,机器能取代人了,网上到处都是担心自己工作会不会被人工智能取代的帖子。很不幸,我也是其中的一个。

现在看来,研究生学算法可以说是赶着顶点买入的 “股票”。

抛开现象谈本质

深度学习或者机器学习都是很早就有了的东西,并不是近几年的创新出来的。只不过由于计算机算力的提升,使得老东西焕发了一下第二春。但是本质上却没有任何区别,直到现在深度学习的可解释性也是个业界难题。大家根本不能解释模型到底做了什么。

深度学习所依赖的更多的是大量的数据,以及对数据的预处理。模型的微小差异造成的对结果的影响,反倒在大量的数据面前显得微不足道,你是98.5%,我是98.7%,拿到现实场景中根本体现不出来。说白了,“人工智能” 全靠 “人工”

自从16年GAN(生成对抗网络)提出以来,再没有看到什么具有真正创新意义上的模型。大家都是在原有模型基础上,改点这个,改点那个。把这篇论文的东西拿来结合一下,再把那篇论文的东西拿来结合一下。好了,整点拗口的名次,新概念包装一下,然后出现了一篇CVPR。这都不是我瞎说。亲眼看到一篇CVPR,改装了一下条件生成对抗网络,再包装了一下,结构图画的好看点,就出来了。在理论上根本没有任何创新,甚至模型上的创新都没有,根本就是在玩排列组合

正是因为这些本质,正是因为这根本上的理论,可解释性等等都没有创新。才造成了现阶段的深度学习、人工智能不可能颠覆行业,不可能像前几次工业革命一样,不可能像蒸汽机,电力,内燃机,计算机,互联网等等成为改变社会,改变生活的革命。

唉,如果自己能早些看清这些本质就好了,怪只怪自己当时没有彻彻底底的调研清楚,被表象蒙蔽了双眼。

现在开设人工智能专业的学校越来越多。但是,随着人工智能的泡沫慢慢戳破,从“争先恐后” 到 “神仙打架” 到“诸神黄昏” 再到 “灰飞烟灭”。求职市场必然是供大于求,岗位严重内卷。我也算是见证了这一切。

正所谓吃一堑长一智,一定细致调研后做决定,切莫随波逐流

最后,随着现在越来越多的学生冲进这个领域,随着这个方向的泡沫逐渐破裂,大厂不断裁人,中小公司倒闭。想要入行的,想要读研的,想要未来从事相关工作的,劝各位一定想清楚,考虑再三再做决定,多问问自己到底自己喜不喜欢这个职业,到底自己能不能坚持的下来,能不能承受的住这个决定最坏的后果。况且,很多时候你以为你喜欢的,其实并不一定是喜欢,就算真的喜欢,当喜欢变成了日复一日的重复劳动,也不一定能喜欢的下去了

还是期盼着真正的人工智能时代的到来,那时候的生活,一定会有天翻地覆的变化。

<pre style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;letter-spacing: 0.544px;white-space: normal;font-family: -apple-system-font, system-ui, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;widows: 1;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section powered-by="xiumi.us" style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="margin-top: 15px;margin-bottom: 25px;max-width: 100%;opacity: 0.8;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section powered-by="xiumi.us" style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="margin-top: 15px;margin-bottom: 25px;max-width: 100%;opacity: 0.8;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section><p style="margin-bottom: 15px;padding-right: 0em;padding-left: 0em;max-width: 100%;color: rgb(127, 127, 127);font-size: 12px;font-family: sans-serif;line-height: 25.5938px;letter-spacing: 3px;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(0, 0, 0);box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-size: 16px;font-family: 微软雅黑;caret-color: red;box-sizing: border-box !important;overflow-wrap: break-word !important;">为您推荐</span></strong></span></p><p style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 14px;">长尾分布下图像分类问题最新综述(2019-2020)</span></p><p style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 14px;">GitHub重大更新:在线开发上线,是时候卸载IDE了</span></p><section style="margin: 5px 8px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;">特朗普拿H1B签证开刀,LeCun吴恩达等实名谴责!</section><section style="margin: 5px 8px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;">数据分析入门常用的23个牛逼Pandas代码</section><section style="margin: 5px 8px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="color:#576b95;"><span style="font-size: 14px;">如何在科研论文中画出漂亮的插图?</span></span><br  /></section></section></section></section></section></section></section></section></section>
如何看待2021年秋招算法岗灰飞烟灭?

本篇文章来源于: 深度学习这件小事

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享