unityloverz 发表于 2021-7-4 06:29

如何看待2021年秋招算法岗灰飞烟灭?

18年是否值得进入,19年供大于求,20年一片红海诸神黄昏。

IT圈老男孩1 发表于 2021-7-4 06:36

我以一个公司的面试官角度来回答一下这个问题吧。
我目前在tmd中一家的业务线上担任图像算法工程师,由于团队成立不久,我平时工作中承接了大量的面试。从6月起,我们就开始了提前批的校招,每周进行一次统一面试。每次业务线笔试大概通过60个简历,其中有近40个投向了算法岗位。我们计算机视觉岗位在上一轮提前批面试中居然收到了28份简历,而我们整个校招的hc只有2-3个。目前我们的offer已经发放完毕,实际录用比大概是1:30,后续校招我们部门的计算机视觉算法岗位将要停止招聘了,不得不说很多优秀的人因为简历投递晚了失去了机会。
我们面试下来的总体感受是,简历非常多,但是我们想要的非常少。我们现在不需要调参侠,我们需要的是有扎实计算机基础的工程师。由于简历过多,我们将一轮面试调整为计算机通用基础面试。我们希望候选人的计算机基础扎实,编程语言,操作系统,数据结构,计算机网络这些基础不能差。但是相比于开发岗位而言,我们的要求其实大大低于开发岗位。在二面的时候,我们更关注于计算机视觉的落地经历,对于论文其实没什么要求。总体看下来,一面的通过率极低,很多人连栈和堆都不知道,这样的计算机基础根本过不了一面。在二面的时候,我们关注候选人的项目经历。很多候选人就读了两篇论文,跑了几个比赛,这些经历在这么多简历中显得非常普通,在一众候选人中也没什么亮点。我们需要的人是有一定工程能力,有实际的落地经历的,但是大多数人不具备基本的工程能力。
那我们需要什么人呢,我以我们的实习生为例,看看我们希望的候选人是什么样子的。
我们在4月中旬招收了一名实习生,他之前在学校主要做目标检测,我们招收的时候觉得他基础不错。从入职到转正答辩,大概经过了两个半月。我们看看这两个半月他做了什么。刚刚入职,我们商量了一下,确定了要做算法A。实习生在两周以内,对比了各种主流方法,确定使用一种简单的基于深度学习模型,理论上能够在CPU实时。随后1个月时间,实习生使用PyTorch复现了论文,并使用两种方法改进了该模型在实际场景中的缺点。在大概1个半月的时候,实习生认为,算法效果已经达到预期,我们验收发现,已经满足预期要求。在后面一周时间里面,实习生使用C++在我们的代码中加入了该模型的工程实现,但是原始的实现不能满足实时要求。实习生花了一周时间,加入了多线程,速度大大提高,但是只能达到准实时。后来实习生认为,该算法的部分模块和resize有相似之处,于是花费几天阅读了OpenCV的实现,认为通过定点化和SIMD能够改善速度。后续实习生又改进方法,提高cache命中率,使得速度能够在i5上达到50fps。这些工作能在两个半月实现,大大出乎我们的意料,答辩毫无悬念通过。
我们想要的cv工程师是什么样子的,从上面这个例子可以看到一角。训练模型,部署模型,算法优化,这些都是我们的工作,不给自己设限、追求极致是我们对工程师的要求。我们需要的是解决实际问题的能力,计算机视觉相关的算法和工程都是我们解决问题需要的技能,只有足够的基础才能在遇到问题时候给出足够好的解决方案。
对于CV岗位,我的态度是劝退。今年我们组的开发岗位hc很多,简历非常少,很容易就能拿到岗位。客户端开发更是难求,现在招聘已经不要求客户端开发经历了,只要编程基础扎实就好。对于大多数cv方向的同学,我建议换个方向,比如音视频开发的岗位可以考虑,算法方向音频相关算法也值得考虑。
<hr/>打个广告。我们开始招聘2022届的计算机视觉算法实习生了,有意向的同学欢迎私聊我。

xiangtingsl 发表于 2021-7-4 06:38

说点实在的,就我们这边NLP的算法工程师来说,有以下技能需要实实在在得掌握:
1、正则表达式。对,你没看错,就是正则表达式。除了简单的文本匹配场景外,各种文档结构化、信息抽取的冷启动,基本都是靠这个。因为在实际业务下,你不可能一上来就能获取高质量的标注数据,更别说上各种sota模型训练了,所以你可能要掌握各种正则骚操作,比如XX前面不存在XX字符且后面存在XX字符,或者XX字符出现几次且后面必须出现XX字符的场景。其实我一直想做一个根据人类语言自动提供正则表达式推荐的模型,调研了一阵子发现难度很大,从另一个角度也说明要写好正则表达式也非常难的。
2、常用句法分析工具。这个一般主要会在关键短语抽取、信息抽取里使用。由于缺少标注数据,不能使用sota模型,又因为单独使用正则毕竟不能cover各种case,因此有时候需要与句法分析工具结合,配合对简单语法的使用,例如主谓结构,动宾结构,补语结构等等,找出我们所需的信息单元。不过从头训练一个句法工具通常来不及满足业务方的上线期限,因此通常会使用一些已有工具如哈工大的LTP,虽然有些问题,但是大多数情况下够用。
3、性能优化的意识。这里并不特指某个性能优化的方法,而是在日常写代码的时候,要有这个意识,例如如何优化循环的效率、能够并行化操作的地方尽量并行化,模型读取数据的时候如何优化读取的效率,模型部署上线inference的时候是否满足业务的性能要求,如果不满足,能够找到性能优化的位置,例如模型设计的时候是否设计了冗余的层数、是否使用了过于复杂的模型,部署的时候是否使用一些高效的部署方式(例如tensorflow-serving)、是否可以使用tensorRT优化部分op,是否可以针对部署平台上的硬件环境重新编译tensorflow等等。这些都需要在实际的工程中自己一个个趟坑趟出来。
4、linux。这个技能也是刚需的,但是并不需要你对linux的操作精通到什么程度,但至少你得懂常用的操作命令吧,例如监控服务器的状态、防火墙策略的配置、docker的简单操作、常用数据库的操作(mysql、postgresql等)、压缩解压包命令、ftp/sftp命令、chmod命令、vi、cat、ps等等,具体就不详细说了。
除了上述技能外,我默认大家对NLP领域的技术都是符合条件的,所以就没额外说明。如果你对基础的统计机器学习、RNN、transformer、bert等不太了解的话,那实在是说不过去了。
上述技能针对的是需要落地需求的算法工程,但如果你是专门做算法研究,对落地没有要求的,那就可以忽略上面的东西,此时你需要的就是拼论文、拼比赛、拼研究组、拼导师、拼学长学姐。。。
<hr/>最后说一下这个内卷问题,其实我在知乎上说非技术的事情很少,一方面是我在这块向来思考不多,怕说多了被人喷,另一方面我这个人也比较佛系,不太会去跟别人争来争去。这次也只是想陈述一下自己的观点,如果觉得有道理,可以试用试用,如果觉得没道理,大可以无视之。
首先,内卷这个问题是客观存在的。作为一个17年计算机专业但是非科班半路转行的人,我承认自己占了一定的早期红利,如果把我放到现在,估计我也是那批被卷成人干的人。即使是刚入行的几个月,我也会经常焦虑,焦虑自己会不会被其他有顶会、有比赛的大佬淘汰掉,看到其他北上广大厂的大佬的薪资,焦虑自己会被困在南京这个行业环境不太好的地方,甚至还会焦虑自己35岁是不是就下岗了。后来我慢慢跟自己和解了,接受了自己的能力所限,毕竟有人第一的话,总有人是最后一名吧,但是这个最后一名并不代表你是不好的,只是人家比你更好而已。
今年疫情原因加上行业内岗位日趋饱和,好工作确实难找,但这并不是我们的错,我们也没办法改变当前这个状况,我们能做的是好的岗位该争取就争取,但是面试过不了或者连面试机会都拿不到的时候也别过分在意,找工作的时候虽然要注意一些坑,但是最好不要考虑太多因素,遇到合适的就去吧。工作的时候,努力在自己力所能及的范围内将事情做到极致,该争取时候的争取,争取不到也无需过度在意,玩把游戏,弹弹琴就过去了。
毕竟生活大于工作。

闲鱼技术01 发表于 2021-7-4 06:39

我就知道这种日经劝退肯定一堆人邀请我。
我就不提供负能量了,反正算法存量放在那里,如何喷都无济于事,现状都是人多消化不掉,所以我这次破例提供心灵层面的安抚方案,行不行动需要自己判断了。
常言道,小卷怡情,大卷伤身,强卷灰飞烟灭
明白这个道理,就要学习规避内卷,你非要找头条快手阿里去成功,何必呢,和精英内卷有啥意思呢。。投百度华为,努力刷题去个他们的边缘业务线也行呀,那些地方,边缘业务就是养老岗位,只要你是 985 硕士博士毕业的,简历包装的花里胡哨就成(可千万别作假,很多大公司以后是不给二进宫的,一次污点毁你终生),疫情期间人家也还是招一点人的,你会写算法 ppt 都有饭吃,或者去个 boss 直聘,贝壳找房,58 同城啥的,人家一样要算法的呀,我就不信内卷到贝壳找房都要你发顶会(过 1-2 年后我可不清楚),而且这些地方基建相对差,万一他们某个业务做开了,二次开发场景都有很多机会参与,去这种地方,社会痞气强点,和领导闹好关系,完全有很多机会向他们展示你的才能呀。
像我们这种估计连贝壳都不如,彻底失败的公司,没啥独立业务的部门,现在对算法都没啥要求了,就我们这样挫的地方,都能手把手教你 es,spark,flink,kafka 等标准生产工具,深度调包深度学习三件套,线上服务 4 件套,部署开发一条龙(凑合能用那种),成为了转行人士的北极,算法人士的鹤岗,失败人士的浅色床单,大龄码农放鸽子的广场。只要研究生 985 毕业就行了,本科是大专都不管你,没到灰飞烟灭的地步,就是你跳槽出路相当堪忧,因为没啥亮点技术和业务。。。
另外,现阶段活命要紧,也别老盯着强势业务线投简历,走业务下沉,去中台部门也香呀,中国现阶段的红利都消失了,强势业务部门都是老人把持,老人只会扶持自己嫡系,你去了阿里头条一样会失败,资源都被前浪吃光了,剩下那些老人无事可干,找一堆能力顶尖的刷题兵,吭哧吭哧地给老人们干活,我一点都不明白这些人图啥,要是进 google 享受 wlb,苦哈哈刷题去了也值了,国内成功公司,校招进去那刻就是人生收入的巅峰,每天都在苦哈哈推黄赌毒广告,对社会科技进步没任何帮助,公司 996 也没自己思考的自由,跳槽还要发敬业福,也没地方敢接盘,为了那点连厕所首付都不够的钱,活着都有啥意思?这群后浪就不会起来反抗一下?
另外,万一连失败公司都进不去的,可以去找一堆没名气的小创业公司苟着嘛(注:没名气小公司,就是名字听起来像是啥xx躺平极限科技有限公司,反正听起来像科技公司,但是不知道是啥来路),小公司不好的地方在于,可能大概率碰到坏人,而且现阶段倒闭风险太高,可能半年就要跑路,每天累得生不如死,所以这是下下策。
真的逼得没办法,没出路要去这种小公司,我建议是你多看看企查查,调研一下公司背景,学生其实并没有社会经验通过数据判断这种公司,一个玄学办法就是上脉脉看看有没有人赞美和洗地,有的话一定别去,正常的小公司,没有任何存在感,有人提到的话,极高概率都是喷的,如果被喷也没人来洗白的公司,应该是正经干活,只是活的挺苦逼的小公司,如果被喷还有一堆水军洗地的,千万别去,保不济老大是啥价值观有问题的人,比如有赞那位啥鸭来着?
最后,还是多说几句鸡汤,大家不去,无非是学的太多,沉默成本太高不肯放弃,比如发了两篇顶会的焦虑能否发 5 篇,发了 5 篇的焦虑要 package 要低了,大家都没有认识到世界的残酷,捞一笔的心态很强,没有学会躺平思考,担心去了小公司以后去不了好公司,担心去了好公司边缘岗位被裁员,又担心小公司培养路径乱七八糟,又担心去大公司边缘业务线被 pua 啥的,影响成长。反倒像我这种没任何论文的学渣,心态好,去哪里都不介意,工资给的别租不起房就成,唯一祈福是别碰到坏人就成。
所以说,年轻人担心内卷,有时候的症结在于想的太多,真正面对的失败还是太少,真的失败以后,你是不会怕选择不好的,你只怕连选择的机会都没有,所谓灰飞烟灭,只是人比人得死罢了,每个人找自己的私域流量发展自己,躺平思考,何必在同一条赛道比赛撒灰?

fwalker 发表于 2021-7-4 06:48

最近公司来了一位实习生,可能刚出来实习,看见他的大三同学们好多去了大厂,就自己来了一家创业公司,其实换谁都觉得有点不平衡(换做你只是一位大三学生看见同学刷顶会去大厂不羡慕是假的)。再之前带过的一位研一妹子,经常问我是不是要刷题才能进大厂,我给他们的答案都是一样的,进大厂会让你的履历更光鲜,“可能”让你跳槽其它大厂会方便一点,但这跟你以后职业生涯能不能赚钱做得开不开心不是挂钩的,如果你在里面没啥实际项目落地也没啥用,如 @纳米酱 所说,大厂的强业务线基本由老人把住,新人只能打打辅助,在我前几年呆过的2家电商公司来看,AI部门顶峰100多人,到最后裁到剩下十个人维护现有业务线,公司亏钱的时候一定是向亏钱或者利润不大的部门(说的就是AI部门)开刀,只保留最赚钱的部门,所以算法岗的存量就这么多,加上前两年玩AI概念的公司多少玩没了的,自媒体还在鼓吹算法高薪岗位,导致越来越卷,所以我与纳米酱的意见是差不多的。
再说回我那位实习生,一天下班问我,是不是其它公司算法岗都要刷顶会才能进,我说不一定,首先搞研究的是玩不过报团的大厂独角兽,他们的实习门槛就要顶会一作了,其次不做算法研究也可以啊,很多公司需要懂工程懂落地的人,代码写得好还是很有市场的。
给同学们的建议,去大厂可以,如果他们有新开的业务线你觉得有发展空间的话可以试试。去创业公司或者中小公司也可以,先看看这个部门是不是公司赖以吃饭的部门,是的话就比较稳,公司也会给到资源去发展。
BTW,我那位实习生是个不错的小伙,学习能力不错人也勤快,我现在还差一位能全职的CV工程师帮我。

IT圈老男孩1 发表于 2021-7-4 06:49

重要的事先强调一遍:请先成为合格的软件工程师,再成为懂算法/机器学习的工程师。
就像相亲一样,你不能虽然长得丑,但是想得美。咳,我是说不能基础条件一塌糊涂,然后抱怨别人不去了解你的内在美。
同理作为算法岗工程师,无论具体是做推荐系统,做CV/NLP,做人工智能,大数据——只要你还叫工程师不叫研究员,在职能上你都属于“后端开发工程师”。作为一名合格的后端开发工程师,你至少要满足校招的要求不过分吧:
懂一门面向对象的语言,了解网络原理,数据库,分布式系统,手撕代码能解编程题。当这些基本功都合格了,你才有机会让别人去了解你内在的项目经验,而算法相关的项目,只是软件工程众多项目经历的其中之一,和其他后端项目比如数据库/多线程/分布式等项目比没有高下之分。
作为校招生,公司不指望你已经成为某个领域的专家,更看重你是否有全面扎实的计算机基础和编程能力。弥补短板,打好基础,祝大家都能拿到满意的工作。
联动:
人工智能相关的岗位薪酬状况如何?

jquave 发表于 2021-7-4 06:53

你们没意识到一个问题,2021年能拿到秋招算法offer的人已经在各大公司实习了。最终的offer将在实习生中竞争产生。现在都还没去实习的,说明你连复赛都没过,根本没机会进入决赛圈啊~
预选赛:研一上进组,快速夯实基础,掌握基本炼丹工具,跟着师兄深入一个领域,获得insight,提出新idea,速发几篇paper。
初赛:凭借预选赛的成果,拿到独角兽级别的公司的实习机会,研一下至研二上去实习,最好获得优秀实习生。基本掌握工业界技能,提高手速和干活能力,实际落地一两个项目。
复赛:凭借科研成果和实习经历,申请大厂每年三月开始的暑期实习生,顺利拿到研二下暑期实习机会。
决赛圈:开始大厂暑期实习,和其他实习生竞争,在最终实习生答辩中胜出。恭喜你获得2021年秋招算法offer。

mypro334 发表于 2021-7-4 06:53

我们部门2021年实习生招聘已经开始了~
【部门内推】阿里云-混合云-云管平台 2021年实习生招聘 - FnLee的文章 - 知乎 https://zhuanlan.zhihu.com/p/347190194


---以下内容是原文---
灰飞烟灭算不上,不过竞争变得更激烈了是真实发生的,最好的办法还是努力提高自己的能力吧~开发岗热门的部门竞争也很激烈的。
算法岗的竞争为什么会变得越来越激烈呢?我觉得和供需都有关系,在"供"方也就是学生这边,越来越多的学生在学校走上了"算法"(带引号的哈~)的道路,或是由于导师想做(在我们学校、我们学院,很多之前做通信、天线、材料的导师都开始做深度学习/机器学习,可以想象,在其它学校也会有诸如交通、机械、农业等等专业的导师涉足这个领域)、或是由于自己看到了三四年前算法岗的红利(用我们导师的话说就是只要会跑个模型、调个参就可以找到工作了);在"需"方也就是企业这边,企业经过前些年在算法方向的扩张,也许会发现当初扩张太快/招的人满足不了需求(需要有创造力的)/很多算法没有用或者难以落地。在同学们都感觉算法竞争激烈的同时,也许企业也会有"能够达到要求水平的同学招不到"的苦恼。
我是2021年毕业的硕士生,在北邮电子工程学院的一个实验室做深度学习、计算机视觉,本科也是在北邮电子工程学院毕业的,本帖子中涉及到的几位学长的本硕都是北邮电子工程学院(因为本科是普通一本的学长学姐就业情况相对来说又差了一些,并没有学校的歧视,只是陈述事实,我们实验室从普通一本考过来的同学确实在实力上有差距),我们导师名下比我高两届的学长去达摩院做算法了,比我高一届的学长就已经在说算法竞争非常激烈了,他最终去菜鸟做机器学习开发,虽然是开发岗,但是还是和算法有点关系的,到了现在的我,毕业后计划去阿里云做Java开发了。


#广告时间:我所在的部门是阿里云-基础产品事业部-混合云,base北京/杭州,我在杭州实习了三个月,工作体验还是非常好的,混合云面向的主要是大B客户(政企),帮助客户"建好云、管好云、用好云",目前业务处在快速发展的状态,人才缺口非常大(Java开发、go开发、前端开发),2022年及之后年份毕业的同学可以私戳我详细了解+内推#


好了,继续说算法的问题,我们实验室是一位导师带着不到20个学生,整体实力非常一般,长期的项目常年保持在两个左右,也都不忙,技术要求也不高,基本不需要落地,基本没有发ECCV\CVPR这种顶会的实力,也没有在一些顶级比赛取得成绩的实力,而且我们本科基本都是电子工程学院的,不是纯正的CS,所以对于计算机方面的基础知识的了解还是相对欠缺很多的。我的上一届学长在和我交流的时候就劝我尽早转方向去做开发(大概是去年的十月底),由于也不知道做开发要学什么、学到什么程度以及没有可以实际上手做相关项目的机会,所以我也没有为找开发岗的工作做专门的准备,还是躺在我的“舒适圈”里刷《统计学习方法》、《深度学习》、《百面机器学习》这一类的书,也刷了《剑指offer》和Leetcode(大概有400道题),粗略看了《C++ Primer》的前几章,学习了一些计算机方面的基础知识(之前也是有一点点基础的),其他的内容基本没有准备,比如数据库、Java、C++的STL什么的...
我的简历有三段经历,一个实验室的项目(视频理解相关的,只需要训练模型,不涉及落地),两个Kaggle的比赛(都是铜牌,前7-9%),没有实习经历,在校期间发了一篇三区论文(不是学生一作)。
我正式开始准备找工作是从今年的一月底开始的,进入状态找到学习的感觉又花了差不多一个月,所以到三四月份很多公司开始招实习生的时候还是感觉自己没有准备好,学长学姐都劝我们尽早行动别拖延,周边的同学也在三四月份就开始参加互联网大厂的提前批面试了,但是我还是很有“主见”的,虽然心里也是焦虑,但是还是很有“大将风范”,行动上并不着急,策略很被动,基本都是等到每家公司投简历的DDL才投简历,当然主要还是投算法方向的岗位,以大厂举例:微软、美团、腾讯、网易互联网、百度、招行信用卡在笔试之后就再也没有消息了(据了解有些公司算法HC本来就比较少,投简历投得晚基本就没有HC了,所以这也是我的策略的一个缺点),网易互娱和雷火给了面试机会分别挂在了一面和三面,给offer的有京东商城、网易的一个做视频理解的部门直招、大华、中科曙光、金山西山居,也拿到了中信证券、中信建投的offer,阿里云是最后一批投的,已经很晚了,抱着试一下运气的心态找了一个部门,内推人也没有具体说他们招的岗位,我投的算法,内推人直接给我转成了开发,阴差阳错吧,经过了两轮笔试、三轮技术面试、一轮HR面试,通过了,于是其他的公司就不再考虑了,之后就动身去阿里云实习了,去了之后感觉部门的师兄师姐人都非常好、团队氛围也很好、业务我也很感兴趣、Java开发零基础上手问题也不大,于是经过努力工作以及部门师兄师姐的帮助,顺利转正了。
这是我找实习的笔面试记录:


这是我找工作的总体思路:


这是我非常喜欢的一个在金融领域的大佬给我的回复:


这段话说的太好了:
“工作应该成为手段,生活才是目的,如果两者有冲突,哪建议优先生活吧,哈哈哈,毕竟大多数人的工作,最后都只是糊口而已,别管毕业时多么远大的抱负。我这两年就一直给一个学生灌输一个观点,就是千万别以为我们成年人的世界都是严谨、认真的理想状态,其实大家都是在过家家。”
快乐工作 认真生活。


一点思考:
在实习快结束的时候,部门的leader把我们几个实习生叫过去,问了我们几个问题:你们觉得程序员35岁就会被裁吗?你们觉得程序员掉头发的概率比其他行业高吗?
他的意思就是让我们要理性、要有自己的思考、要有自己的的认知和判断能力,不要被所谓的舆论洗脑,不要人云亦云,任何事情都不是非黑即白的。


下一个思考:
“为什么互联网行业收入高?
答:1、近10年来,体力劳动阶层的收入增幅高于社会平均水平。2、不同的社会分工,在收入上并不是简单的竞争对立关系,互联网行业的繁荣发展,也拉动了相关行业的繁荣发展,有助于各个行业的收入增加。3、只要各种生产要素能够自由流动,最后各个社会分工的收入差距会持续缩小。”
“为什么IT行业工作强度大&工资高,为什么不能通过招更多的人来降低劳动强度&人均工资?
答:1. 创造性工作(不容易被机器替代);2. 工作成果大规模推广成本低;3. 工作成果应用空间大。什么时候芯片发展受阻,软件发展速度变慢,IT薪酬估计会降到 建筑设计师 水平。”
“程序员的中年危机和别的行业没有什么区别。发展能解决一些问题,解决不了的问题,习惯了也就不是问题了。”


#广告时间 * 2:我所在的部门是阿里云-基础产品事业部-混合云,base北京/杭州,我在杭州实习了三个月,工作体验还是非常好的,混合云面向的主要是大B客户(政企),帮助客户"建好云、管好云、用好云",目前业务处在快速发展的状态,人才缺口非常大(Java开发、go开发、前端开发),今年的HC都没有用完,2022年及之后年份毕业的同学可以私戳我详细了解+内推#


我们大部门是混合云,主要是面向政企客户(政府、公安、国网、保险公司、银行、券商、基金公司...),向他们输出我们的专有云产品(未来会变成混合云),混合云是一个大趋势(比如一个初创企业最开始部署在公有云上,等到它的业务发展壮大,会发现使用公有云的成本比它自建一朵云的成本还要高,这个时候它必然是要跑的,只是一个时间问题),不是阿里云自己要做,而且客户要求我们做,政企客户的数字化转型必然要依靠专有云来实现,所以混合云也是阿里云继公有云之后的下一个增长点,近两年发展速度非常快。


附工作环境照片:
EFC园区-健身房


EFC园区-电梯间


EFC园区-外景


EFC园区-办公区


飞天园区-外景


飞天园区-茶水休闲区

unityloverz 发表于 2021-7-4 06:58

有些师弟不跟着毕业师兄的东西(已经中顶会,代码全套,前人对比实验全套)做下去。不听劝,硬要自己折腾 去做自己感兴趣的,师兄和他说过他感兴趣的方向的sota已经卷得不行了,他还去,然后搞不出来又去打比赛,结果最后搞了快一年啥也没,现在秋招才来找师兄内推。 真的是无语。 为什么有些师弟就总觉得自己只要努力就能出论文呢? 就不懂得论文不是靠个人努力就可以的,前人实验代码的积累,实验数据的积累,各种数据集坑的摸索,能帮忙剩下多少努力的时间。 真的是 不知道怎么说他好。这种师弟还不是个例。


2020年07月16日更新。有传承的实验室发paper真的难度低了好多,只要运气不要太差,基本一年内能搞篇顶会没啥问题( 写个2, 3篇 总能中的 ),搞完就去实习。
师弟要做的事情清单:
1 将前面好几代人的代码,更新下版本做个兼容。
2 看看前面师兄在各个数据集上的badcase的分析。
3 找一下有没有师兄论文发表后,新开放的数据集,用师兄们积累的代码跑一下。 然后再总结下badcase。
4 找一下有没有最近相关的新模型,找找有没有代码 跑一下,看看他们的 badcase.
5然后这些做完后,如果没有想法,拿这些case 去找师兄要个想法。或者自己和别人交流过程也会有些想法,也可以尝试。
6 写论文,同时拉个师弟让他参与熟悉你的论文想法,还有收拾下实验结果和总结 留给后面的人。


然后很多师弟的情况是,在师兄论文发表完后,给师弟们挂了个3作 4作(师兄挂师弟,是希望师弟能参与下,之后能独立写作,可是师弟往往啥也不参与,就摸鱼,经常是论文发表后都不知道论文在做啥,之后师兄去实习了)。然后,让师弟去做上面的 1和3,4 的时候 他们就觉得太难了。论文看不懂,代码看不下去。自己感觉做的东西不高大上,都是些枯燥或者重复的工作,然后就自己搞自己的去了。他们觉得师兄能发顶会 自己也能发, 却没看到发表论文的师兄是吃的前面多少位师兄积累的老本。


2020年7月19号补: 过来人提示: 提前批一般是各路神仙打架,普通人可以先找家公司实习,扩充自己的人脉,完善自己的简历。等提前批之后 有一定几率会遇到 一些企业发生战略调整(通常在季度末),新成立一些部门或者扩大部门,这时候如果能通过自己的关系得到消息的话,去投简历成功率会高一点(不会进备胎池,缺人缺得厉害,面完一般就要你赶紧来上班报道干活了)。


2020年7月27号补:
LeetCode一定要多写写,代码题能写出来,这样面试官和你方向不对口,也还有机会继续面试下去。


2020年8月底补:
今年我们这边收到的神仙简历感觉比去年少了,不知道其他厂怎么样

APSchmidt 发表于 2021-7-4 06:59

见证了AI行业的快速起飞、爆炸、焦虑和冷却。
最近又看了一些师弟师妹发来的简历,有感而发谈谈这个问题,希望看到这篇回答的师弟师妹能减少一些翻车的概率吧。
2019年,手握一两篇不错的paper,几个含金量不错比赛的Top 10经历,混混大厂实习,就够收割offer到手软了。无论技术研究部门还是业务部门。
去年,也就是2020年,我惊恐的发现,怎么我们这类技术研究部门的招聘bar提高了这么多?有顶会,有比赛,有实习,但是都不给面试资格?有SQuAD Top 3的经历还要再考虑下?看了一下,哦确实优秀的候选太多了,有两三篇ACL的候选人已经远超head count数量了,只有几篇水水的顶会,确实算不了什么(虽然这些简历被刷的同学放在前一届,十之八九放不错的offer了)。当然,以上是说硕士,对博士的要求就更高了,没有什么学术影响力,也没有让人眼前一亮的paper,十之八九可以免谈了。
但是!在去年这种情况下,照样有收割一二十个offer,拿SSP offer也没有太大压力的同学。如果跟上面这段的描述对比,你可能觉得“那不得是神仙哇?10篇ACL的那种??”
错了错了!一篇ACL都没有,却轻松干掉了手握几篇顶会的同学,还拿了SSP offer。
我的一个可爱小师弟就是这方面的范例╮(╯▽╰)╭
为什么呢?并不是说算法岗真的已经饱和到非神仙不要的程度了,而是说,市场对优秀人才的定义已经发生了变化。现在市场最迫切需要的是能把AI落地,能求解真实业务问题的工程师,注意是工程师!只会侃侃而谈学术动态,却不具备能力求解真实业务问题的人,放在今年的工业界是相当不优秀的。
在一些重要的AI落地场景,如搜索、推荐、计算广告,有大量的问题是当今学术界的这些论文解决不了的,而这些问题切实的关系到产品的用户体验和变现能力。而求解这些业务问题,并不是复现一两篇顶会就解了,而是你要无所不用其极,或许是迭代模型,或许是拍脑袋的训练策略,或许只是迭代数据,或许仅仅是生写一千条规则,甚至是死磕自上而下的性能优化,乃至考虑从产品维度推动解决问题。而这一切的背后,依托的不仅是业务经验(这就是为什么对口的实习经历很重要),更重要的是过硬的工程能力。至于学术上的创新,是锦上添花而不是必要条件。
可能这样说比较抽象,拿自己的经历举个简单的例子。前阵子给广告部门搞了几个月的query-bidword文本相关性问题,在十亿级语料上一顿pretrain,妥妥的肉眼可见的提升,各种疑难badcase解了一大堆。但!是!根本上不了线哇,几百上千台的线上GPU机器依然远远扛不住模型的计算复杂度。怎么办呢?
有人说,好像XX厂刚出了一篇做知识蒸馏的paper,声称在GLUE上面获得了重大提升...
too naive!
然后你发现,哪怕用上几十张V100来跑,也要跑上小一个月,还是收益未知的,谁会等你复现paper呢?创新就更无从谈起了。
学术经验仅仅是决策的一方面,你知道这个paper没必要复现,但是或许有的结论你可以借鉴。更重要的是靠多年的炼丹经验+工程能力,快速搭建一个简单粗暴、易于实施且预期有迭代空间和足够不错的起点的基线,然后才是堆砌多年积累的上分tricks,快速刷分。虽然下一步就是要搞创新了,不过堆tricks上分这一步完成后,在业务部门很多场景下其实问题已经解了,就可以考虑下一个问题了。显然,如果是到此为止的话,手速和代码质量才是最重要的,至于你的学术sense,sorry还没来得及发挥,leader说已经可以考虑开始下个需求了。
遗憾的是,现在市场上大部分的算法岗都是这种程度的。你可以考虑一下,这种情况下,你简历上就挂着几条不痛不痒的水文,你能证明自己的优势吗?灰飞烟灭也不足为奇吧


于是,有人会觉得在技术研究部门情况会好些。这时候你要面对的问题难度可能要上升一个level了,你发现完成上一步堆tricks刷分之后还是无法求解这个问题。于是终于有追前沿、搞创新的理由了。然后,这时候你以为就可以整体泡着茶看看paper,跟小伙伴们愉快的讨论学术idea?
天真了=,=
你会面对更大的压力,会对你的coding能力、炼丹速度和学术sense同时提出更大的挑战,毕竟别人写的1000行代码,那都是十之八九要上线产生收益的,而你的代码,又难,又容易出错,收益还未知,学术sense差点的小伙伴可能一周下来全是fail的实验,coding能力差的小伙伴可能一周下来就是一个fail的实验。于是,你为了对抗这种不确定,保证每周都有正向产出,你只能有更快的手速、更多的策略迭代以及挤出时间尽可能的从近期的paper找下灵感。这种感觉跟在学校实验室开心的做科研完全不同的好吧!!
看了今年不少师弟师妹的简历,深深觉得很多人根本是努力错了方向,最起码,简历内容呈现上,就打偏了方向,导致面试机会都拿不到。
而那些,证明了自己有不错coding能力(不是说刷了1000道leetcode的那种,而是有能写系统、做工程的能力)和炼丹经验(高影响力比赛拿到好名次真心是个不错的证明渠道)的师弟师妹,往往更容易得到青睐。如果这时,还有一些不错的论文,那我不相信会灰飞烟灭的,哪怕没什么好论文,也不至于很被动。
虽然大家都在唱衰算法岗,疯狂劝退,但是对于已经上车的师弟师妹,除了徒增焦虑也没什么用了(下车代价可能更大),因此不如好好琢磨一下你现在会什么,简历上有什么,以及市场需要什么。
2021届了,用人单位依然招不到合适的人,应届生们依然在抱怨优秀而努力的自己遇不到伯乐哇
页: [1] 2 3
查看完整版本: 如何看待2021年秋招算法岗灰飞烟灭?