找回密码
 立即注册
查看: 1062|回复: 20

20 万、50 万、100 万年薪的算法工程师在能力素质模型上有哪些差距?

[复制链接]
发表于 2021-9-5 14:22 | 显示全部楼层 |阅读模式
算法领域职位这两年大热,鱼目混珠的筒子不少,一直很困惑于如何甄别的问题。
1. 在回答时,尽量不要用一些似是而非的诸如「项目经验丰富」、「工作年头长」、「在大平台工作」、「背景好」、「聪明」、「学习能力强」等看似有理,其实在操作中全无用处的维度来回答;
2. 尽量使用定量,或者至少是定性的要素来界定,比如「主导过什么性质什么级别的项目」,「在算法建模或算法优化中的具体表现和指标」,「处理的数据量级和复杂非标程度」,「为实际的业务带来怎样的增长和价值提升」等等;
3. 从我接触的为数不算多的算法领域人才的经验,能够解决什么样的问题可能是一个甄别的要点,这里最好能够详细阐述能够解决的问题的性质、范围、落地模式、复杂程度等等维度;
4. 个人运气和机缘确实会在一定时间区间内对一个算法工程师的收入产生较大的影响,但从长期来看,这样的因素又会趋于弱化,所以不要用运气的成分来概括一个算法工程师的市场价值表现,那是没有诚意的;
5. 算法团队的 Leader 也可以谈谈你们在给算法候选人定薪的时候都会参照什么样的标准和因素,但如果是「他之前 30 万,所以我给他 40 万」之类的回答就算了;
6. 如果能够顺便说说一个算法工程师如何可以从 20 万进阶到 50 万乃至 100 万的高度,那就更加完美了。
在此敬谢。
发表于 2021-9-5 14:26 | 显示全部楼层

公元七世纪,在车迟国国家气象局组织的一次求雨活动中,虎力、鹿力、羊力三位大仙成功地祈下甘霖,于水火中救了黎民。老国王虽然不明就里,却从此尊他们为国师,奉道教为圭臬。
本世纪,算法工程师们的境遇也差不多:早些年,信奉糙快猛主义的大佬们觉得他们饱食终日、无所用心,没工作只好在学校混博士,靠数据上的障眼法装神弄鬼。可是,随着去年AlphaGo大破李世石,大佬们在心底喊出“我操”的同时,慌不择路地把各种搞劫持、送外卖的生意包装成人工智能,并纷纷请来几位懂算法的国师加持。虽然他们对国师们所做的事智商上并不理解,却虔诚地希望他们快点儿求下雨来。
于是,算法工程师的身价也水涨船高了。各门派工程师不论过去练的是java、php还是excel,都放弃了最好语言的争论,抄起了深度学习,发誓重新修炼成算法工程师。
因此,看到题主这样充满铜臭味儿的问题,我十分欣慰。虽说在北京,20万已经基本不可能招到靠谱儿的算法工程师了,还是姑且用上面的数字做个参照,谈谈算法工程师的三个层次吧。(这里说的算法,并不是计算机系本科课程《算法与数据结构》里那个算法。那门课里讲的,是排序、查找这类"确定性算法";而这里我们说的,是用统计方法对数据进行建模的"概率性算法"。)下文中会提到一些算法和模型,但不过是为了举例说明概念,无需深究,有兴趣钻研的朋友可以自己查阅资料。
第一层次"Operating":会使用工具

这个层次的工程师,对常用的模型比较熟悉,来了数据以后,好歹能挑个合适的跑一下。
达到这个层次,其实门槛不高。早些年,您只要掌握了什么叫LDA、哪叫SVM,再玩过几次libnear、mahout等开源工具,就可以拿到数据后跑个结果出来。到了深度学习时代,这件事儿似乎就更简单了:管它什么问题,不都是拿神经网络往上堆嘛!最近,经常会遇到一些工程师,成功地跑通了Tensorflow的demo后,兴高采烈地欢呼:我学会深度学习了,我明天就统治人类了!
这事要真这么简单,我是茄子。任凭你十八般开源工具用的再熟,也不可能搞出个战胜柯洁的机器人来。这里要给大家狠狠浇上一盆冷水:进入这个领域的人,都要先了解一个“没有免费的午餐定理”,这个定理的数学表达过于晦涩,我们把它翻译成并不太准确的文艺语言:
如果有两个模型搞一次多回合的比武,每个回合用的数据集不同,而且数据集没什么偏向性,那么最后的结果,十有八九是双方打平。
管你是普通模型、文艺模型还是2B模型,谁也别瞧不起谁。考虑一种极端情况:有一个参赛模型是“随机猜测”,也就是无根据地胡乱给个答案,结果如何呢?对,还是打平!所以,请再也不要问“聚类用什么算法效果好”这样的傻问题了。
这就很尴尬了!因为掌握了一堆模型并且会跑,其实并没有什么卵用。当然,实际问题的数据分布,总是有一定特点的,比方说人脸识别,图中间怎么说都得有个大圆饼。因此,问“人脸识别用什么模型好”这样的问题,就有意义了。而算法工程师的真正价值,就是洞察问题的数据先验特点,把他们表达在模型中,而这个,就需要下一个层次的能力了。
会使用工具,在算法工程师中仅仅是入门水平,靠这两把刷子解决问题,就好比杀过两只鸡就想做腹腔手术一样,不靠谱儿程度相当高。如果不是在薪酬膨胀严重的互联网界,我觉得20万是个比较合理的价格。
第二层次"Optimization":能改造模型

这个层次的工程师,能够根据具体问题的数据特点对模型进行改造,并采用相应合适的最优化算法,以追求最好的效果。
不论前人的模型怎么美妙,都是基于当时观察到的数据先验特点设计的。比如说LDA,就是在语料质量不高的情况下,在PLSA基础上引入贝叶斯估计,以获得更加稳健的主题。虽说用LDA不会大错,但是要在你的具体问题上跑出最好的效果,根据数据特点做模型上的精准改造,是不可避免的。
互联网数据这一现象更加明显,因为没有哪两家公司拥有的数据是相似的。百度的点击率模型,有数十亿的特征,大规模的定制计算集群,独特的深度神经网络结构,你能抄么?抄过来也没用。用教科书上的模型不变应万变,结果只能是刻舟求剑。
改造模型的能力,就不是用几个开源工具那么简单了,这需要有两方面的素养:
一、深入了解机器学习的原理和组件。机器学习领域,有很多看似不那么直接有用的基础原理和组件。比方说,正则化怎么做?什么时候应该选择什么样的基本分布?(如下表) 贝叶斯先验该怎么设?两个概率分布的距离怎么算?当你看到前辈高人把这些材料烹调在一起,变成LDA、CNN这些成品菜肴端上来的时候,也要想想如果自己下厨,是否了解食材,会不会选择和搭配。仅仅会吃几个菜,说出什么味道,离好厨师差的还远着呢。



二、熟练掌握最优化方法。机器学习从业者不懂最优化,相当于武术家只会耍套路。这就跟雷公太极和闫芳大师一样,实战起来一定是鼻青脸肿。管你设计了一个多牛逼的模型,如果无法在有限的计算资源下找出最优解,那么不过是个花瓶罢了。
最优化,是机器学习最、最、最重要的基础。你要知道,在目标函数及其导数的各种情形下,应该如何选择优化方法;各种方法的时间空间复杂度、收敛性如何;还要知道怎样构造目标函数,才便于用凸优化或其他框架来求解。而这些方面的训练,要比机器学习的模型还要扎实才行。


拿大家以为"以不变应万变"的深度学习举个例子。用神经网络处理语音识别、自然语言处理这种时间序列数据的建模,RNN(见上图)是个自然的选择。不过在实践中,大家发现由于“梯度消失”现象的存在,RNN很难对长程的上下文依赖建模。而在自然语言中,例如决定下面的be动词是“is”还是“are”这样的问题,有可能往前翻好多词才能找到起决定作用的主语。怎么办呢?天才的J. Schmidhuber设计了带有门结构的LSTM模型(见下图),让数据自行决定哪些信息要保留,那些要忘掉。如此以来,自然语言的建模效果,就大大提高了。大家初看下面两张RNN与LSTM的结构对比,面对凭空多出来的几个门结构可能一头雾水,唯有洞彻其中的方法论,并且有扎实的机器学习和最优化基础,才能逐渐理解和学习这种思路。


当然,LSTM这个模型是神来之笔,我等对此可望不可及。不过,在这个例子里展现出来的关键能力:根据问题特点调整模型,并解决优化上的障碍,是一名合格的算法工程师应该追求的能力。年薪50万能找到这样的人,是物有所值的。
第三层次"Objective":擅定义问题

这个层次的工程师(哦,似乎叫工程师不太合适了),扔给他一个新的实际问题,可以给出量化的目标函数。
当年,福特公司请人检修电机,斯坦门茨在电机外壳画了一条线,让工作人员在此处打开电机迅速排除了故障。结账时,斯坦门茨要1万美元,还开了个清单:画一条线,1美元;知道在哪儿画线,9999美元。
同样的道理,在算法领域,最难的也是知道在哪里画线,这就是对一个新问题构建目标函数的过程。而有明确的量化目标函数,正是科学方法区别于玄学方法、神学方法的重要标志。
目标函数,有时能用一个解析形式(Analytical form)写出来,有时则不能。比方说网页搜索这个问题,有两种目标函数:一种是nDCG,这是一个在标注好的数据集上可以明确计算出来的指标;另一种则是人工看badcase的比例,显然这个没法用公式计算,但是其结果也是定量的,也可以作为目标函数。
定义目标函数,初听起来并没有那么困难,不就是制定个KPI么?其实不然,要做好这件事,在意识和技术上都有很高的门槛。
一、要建立“万般皆下品、唯有目标高”的意识。一个团队也好、一个项目也好,只要确立了正确的、可衡量的目标,那么达到这个目标就只是时间和成本的问题。假设nDCG是搜索的正确目标函数,那么微软也好、Yahoo!也好,迟早也能追上Google,遗憾的是,nDCG这个目标是有点儿问题的,所以后来这两家被越拉越远。
所谓“本立而道生”:一个项目开始时,总是应该先做两件事:一是讨论定义清楚量化的目标函数;二是搭建一个能够对目标函数做线上A/B测试的实验框架。而收集什么数据、采用什么模型,倒都在其次了。
二、能够构造准确(信)、可解(达)、优雅(雅)的目标函数。目标函数要尽可能反应实际业务目标,同时又有可行的优化方法。一般来说,优化目标与评测目标是有所不同的。比如说在语音识别中,评测目标是“词错误率”,但这个不可导所以没法直接优化;因此,我们还要找一个“代理目标”,比如似然值或者后验概率,用于求解模型参数。评测目标的定义往往比较直觉,但是要把它转化成一个高度相关,又便于求解的优化目标,是需要相当的经验与功力的。在语音建模里,即便是计算似然值,也需要涉及Baum-Welch等比较复杂的算法,要定义清楚不是简单的事儿。
优雅,是个更高层次的要求;可是在遇到重大问题时,优雅却往往是不二法门。因为,往往只有漂亮的框架才更接近问题的本质。关于这点,必须要提一下近年来最让人醍醐灌顶的大作——生成对抗网络(GAN)。
GAN要解决的,是让机器根据数据学会画画、写文章等创作性问题。机器画画的目标函数怎么定?听起来是一头雾水。我们早年做类似的语音合成问题时,也没什么好办法,只能找人一句句听来打分。令人拍案叫绝的是,Ian GoodFellow在定义这个问题时,采取了下图的巧妙框架:


既然靠人打分费时费力,又不客观,那就干脆让机器打分把!好在让机器认一幅特定语义的图画,比如说人脸,在深度学习中已经基本解决了。好,假设我们已经有一个能打分的机器D,现在要训练一个能画画的机器G,那就让G不断地画,D不断地打分,什么时候G的作品在D那里得分高了,就算是学成了。同时,D在此过程中也因为大量接触仿品而提升了鉴赏能力,可以把G训练得更好。有了这样定性的思考还不够,这样一个巧妙设计的二人零和博弈过程,还可以表示成下面的数学问题:


这样一个目标,优雅得象个哲学问题,却又实实在在可以追寻。当我看到这个式子时,顿时觉得教会机器画画是个不太远的时间问题了。如果你也能对这样的问题描述感到心旷神怡,就能体会为什么这才是最难的一步。
一个团队的定海神针,就是能把问题转化成目标函数的那个人——哪怕他连开源工具都不会用。100万找到这样的人,可真是捡了个大便宜。
在机器学习领域,算法工程师脚下的进阶之路是清晰的:当你掌握了工具、会改造模型,进而可以驾驭新问题的建模,就能成长为最优秀的人才。沿着这条路踏踏实实走下去,100万并不是什么问题。什么?您说还有300万的呢?这个不用眼热,人家只不过把你写代码的时间都用来跳槽了而已。
<hr/>[我是@北冥乘海生,想吸收更多负能量,请大家关注我的公众号“计算广告”(Comp_Ad)和知乎专栏“计算广告”!]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
发表于 2021-9-5 14:26 | 显示全部楼层
不谈虚的能力,只谈现在国内的行情。
一. 20W(我觉得改为25W-35W较好,实际上现在20W招不到合格的算法工程师了)
相关方向的应届本科/硕士,能拿到BAT offer的那种。这个门槛其实很低,有不错的代码能力,对机器学习有一些很基本的掌握就行。
BAT算法工程师的面试,一方面是要能写代码,其实挺多也就是leetcode中等题的水平,ACM铜牌以上就无压力了,没搞过ACM的多刷刷leetcode这方面也不成问题;一方面是能跟面试官扯一些机器学习的东西。
理论基础其实面试官也好不到哪去,你随便问BAT那些在职的算法工程师一些偏理论的机器学习问题,也能把他们问懵逼。所以面试机器学习,理论基础你只要好好上过课就没问题了。项目经验,只要做过实验室的相关项目,或者有对应的实习经历,或者有相应的竞赛经历(kaggle,阿里天池等等)也没问题了。
二. 50W
有名实验室的优秀硕士/勉强能毕业的博士。 和几个清华、港中文、港科大的同学聊过,普遍表示他们实验室能毕业的博士offer没有低于50W的。很简单的道理,大部分知名实验室对博士的毕业标准就是三篇一作顶级会议;现在AI的行情,有三篇一作顶会在手,50W的offer是不难拿到的。
在那些实验室没达到这个标准,是没法博士毕业的。当然也有部分硕士毕业的时候就有三篇一作顶会,这种属于很优秀的了,拿50W年薪也是可以的。至于那种本科毕业就有三篇一作顶会的,应该是大神了,基本会去美帝top学校读PhD,一般不会直接去工作的。
三. 100W
100W及以上的算法工程师,基本属于科学家了,大多数在这个领域的知名公司担任leader的角色。
知乎这样的人其实挺多的,保护别人的隐私,我也不一个个艾特出来。
这些人大多是名校博士,导师在业界非常有名。博士期间发表了很多顶会论文,拿过Google PhD fellow/Microsoft Fellow,或者做出了非常有影响力的工作。
知乎上有一个问题 知乎 - 知乎
最高赞的回答列举了许多知乎上的算法大神。目测这个回答里面列的几乎所有算法方向在工业界工作的人,都属于100W及以上的级别。
当然他列的人也是存在档次差距的,有些已经在业界算是功成名就,远不止百万年薪了。另外他也列的不全,据我观察知乎上还有不少100W级的大神。

总而言之,什么样的人能成为一个算法团队的leader ?
要么读博士期间师从领域内大牛,并且有很好的论文,是这个领域的专家;要么在工业界做出了成果,有相当的资历;要么就是那种天赋异禀的大神,姚班的IOI金牌,这种本科直接年薪百万也不是问题,比如今年姚班的陈立杰和范浩强。
众所周知,学术是一个圈,而且还是一个挺小的圈;往往一个方向最好的几家实验室,还彼此认识,关系不错。工业界虽然是谁行谁上,但算法方向毕竟偏学术,特点非常接近学术界,带有圈子属性。现在算法人才不仅贵,而且难招。大公司跟名校建立合作关系,请学术大佬来当首席科学家,他的博士也全都打包过来;创业公司利用自身的人脉关系,比如face++能招到不少清华优秀学子(创始人清华姚班),商汤科技招了很多香港中文大学的博士(创始人香港中文大学教授)等等。
如果你能进入高端的学术圈,跟着一个大牛导师读PhD绝对是磨刀不误砍柴工的。这可以给你带来异常强大的业界人脉,和大佬们谈笑风生甚至一起合作的机会。你会发现业界那些牛逼闪闪,名气响亮的人,可能就是你的师父//师叔/师祖/师兄/师姐。找实习找工作都不按流程走,打个招呼就过去了。
当然了,火热的行情也让申请变得很难。机器学习方向,知名实验室知名导师的PhD申请,比以前竞争激烈了很多。看知乎的这个问题 知乎 - 知乎,你就知道现在这个方向的申请有多难了
发表于 2021-9-5 14:28 | 显示全部楼层
20 万:别人派活自己基本上能独立完成,偶尔需要 50 万的人给予一点帮助。没有人派活的话,可能就不知道接下来做什么能给团队产生最大的价值。
50 万:就算没人派活,也知道接下来自己的项目该如何做,以及做完这个项目下一个项目做什么能够对团队产生最大的价值。需要在不影响自己项目的前提下,花时间给一个到几个 20 万的人提供指导和帮助。
100 万:对下,能够给 20 万和 50 万的人派活,让他们觉得自己接到的活难度恰到好处,既不会简单到无聊,也不会难到做不出来,而且还能学到新东西。(实际上,明知道 20 万和 50 万的人解决不了的问题,都要自己解决了。)对上,能让各级老板觉得花在这个团队上几百万一年的人力资源成本实在是物超所值。
以上模型对各种类型的软件工程师都有效。
简单来说,对于级别为 i 的工程师而言,他对级别为 [0..i-1] 的工程师产生的价值越高越好,他需要从级别为 [i+1..] 的工程师(或老板)获得的帮助越少越好。一个工程师之所以被定级为 i,是因为他能够对 i-1 提供价值,但还做不到 i+1 能做到的事情。
最后,我知道题主很想要一个清晰的模型来说明如何定级和定薪酬,但很可惜这跟你工作上训练的任何模型一样,都有模糊说不清楚的部分。只是这个模型不是存在于你的机器上,而是存在于各位老板的脑子里。这个模型的训练数据是现有工程师的级别和薪酬,而且模型可能存在 overfitting 的问题,例如说「我们唯一一位 100 万的工程师能做这个,所以我们认为其他人都要能做成这个才有资格拿 100 万」。很遗憾,这些问题现阶段都是无解的……
发表于 2021-9-5 14:36 | 显示全部楼层
1. 20万。
北京的一线二线互联网公司给应届生的白菜价格:科班出身,算法相关方向的硕士生基本都能拿到;优秀的本科生(ACM铜奖之上或有一定深度的项目经验)无算法相关经历有一些也能拿到,公司愿意培养你;博士生,研究经历一般的能拿到。其实这里波动范围很大,有些公司会直接开出30万到40万的应届生offer,应届生是公司的未来,优秀的应届值这个钱。算法工程师不要说和学历无关,恰恰行业内都重视学历,重视你是否是科班出身,硕士期间做过机器学习,模式识别工作的明显和普通候选者有差别。一般情况下,本科生基本不会被招聘到算法岗位,研究生一般都经过研究锻炼,算法工程师需要该能力。这不是歧视本科生,行业现状如此。
2. 50万。
应届就进入一线和二线互联网公司做算法,一般BAT工作两到三年出来的优秀者(在相关方向有熟练的把握,具备一定深度,例如广告算法涉及的各个环节,相关做法以及能带来多少效果)能拿到该数目甚至更多;二线公司出来的可能只能到30至40万;优秀博士生应届毕业(深入研究方向,有多项成功的研究经历)就能到该数字甚至更多。想表达的是大家都注重出身经历。当然我说的是大致情况,我有一个师弟,硕士就是搞模式识别相关,在国企搞一年解决了户口,去了阿里给了p6,40万。我有一个同届同学,在创业公司搞了3年半,然后去了腾讯,T3.1,给了60万。运气占很大成分,例如对方缺人,急需,这时薪资一般都不是问题。
3. 100万。
阿里P7或p8,百度T7以上,腾讯T3.2之上,二线公司的高级技术经理/总监(非普通级别技术经理),融到很多钱的创业公司的算法专家,能达到这个数目。一般是那些在算法方向工作五六年之上,在本方向积累很深,并了解其他相关方向,对行业进展了如指掌的人。
100万有一定难度,但对于有些人来说很简单,这也和岗位匹配有关,例如一些重视数据算法的公司愿意砸钱招人你很容易到这个数,一些不重视数据算法的公司也许你花很多年也到不了。
我还没到100万,可能没法有过多的陈述。认识一个师兄,腾讯呆到6年的时候,100万,级别3.3。一个同学,硕士毕业工作五年,知名ai公司,近期要跳槽,人家给出120万。
楼主说的‘’你现在工资多少,我给你加多少‘’,尽管听上去很粗暴,但是行业内恰巧如此。只要你的级别够了,达到了薪资范围空间,例如百度T7能够上100万,hr就会以你当前工资为基准,去和你谈,别想着当前30万,人家给你100万,你当前70到80万才有一定机会。当前的工资决定了你下一次跳槽会涨多少,我们需要正视这种现象。
算法行业很火爆,工资高,但门槛也高,现在有很多人去参加培训或者自学,想转到算法行业,大家都努力这是好事,但是你不得不面对一个残酷的现实:在用人单位眼里,大部分培训或自学要比科班出身低一截。你工作两三年,然后去参加培训、去应聘,你将可能是去和应届生竞争,如果你没有学扎实,并且有较深入的实践,超出大部分人的水平,用人单位更愿意招科班出身的应届生。因此,请更努力,不要浮于表面,我面试的时候遇到太多这种候选者了,甚至为他们感觉可惜,大多人被耽误了。
~~~~~~~~~~~~~~~
2018.2.8更新:很久没上知乎,补充下这个回答了。
【100万】
这半年带领团队做成了一些极具挑战的项目,领导比较满意,涨了些工资和股票,现在pkg超过了100w。这半年也出去看了一些机会,几个成熟的创业公司开出了130w~150w的pkg,当然创业公司的期权还是比不上上市公司的股票。另外,下半年和以前的同事沟通加深了,大家也不避讳谈薪水了: 有一个去阿里p8给了180w,他过去带两三个人做项目,其实做的事情用的技术和我差不多,不过人家工作了近10年,我才五年半;有一个去了美团3.3,给了100w,他也工作了七八年。还有一些其他案例不一一列举。想表达的是:
(1) 还是bat大公司有钱,算法人才舍得投入,二线公司除了头条滴滴等个别公司,大多很难有那么大投入。
(2) 高薪是可以积累出来的,只要我们技术不退化,能干实事,尽管当前高薪,每年的普涨或者跳槽仍可以继续涨薪。
(3) 能干实事才能高薪。这里去除那些背靠大树,有政治资源的无为而治者。我们大多码农都是没有政治资源,全靠自身,这时候如果公司需要你在岗位上作出成绩,你取得了成果,掌握了核心,公司和领导都会将资源向你靠拢。
(4) 越往上越需要政治资源。你的团队,你的领导,缺一不可。
~~~~~~~~~~~~~~~
补充:
2018年7月。取匿了,方便交流,反正不暴露真名。
【150万+】
因为团队有技术储备,战斗力不错,遇到了新的项目机会,完成得还不错!公司追加了股票,算起来总包达到了 160万,一切来得很顺,要知道一年前还不够资格谈 100万。拿着这薪资也有很大压力,它代表着领导的期望,只能更加投入工作,并不断学习,提高自我和团队的能力,继续更进一步!
发表于 2021-9-5 14:39 | 显示全部楼层
世界正在起变化。

我不是cs专业的,而是在最苦逼行业之一:电子。为什么说苦逼呢?学科难度很高,却只能拿cs行业60%左右的钱。

当然,比物理和数学专业,还是幸福一些的。

为什么说正在起变化?因为即使是偏传统硬件的电子行业,其算法工程师的地位和收入也在行业内逐渐升高。

究其原因,是因为硬件平台已经逐渐完善,市场被巨头们瓜分殆尽。intel、arm、高通统治全世界,三星、台积电打下手,其余如华为、诺西等统统为以上巨头当牛做马。

而算法的革命才刚刚开始。

作为一个电子行业的算法狗,算是不幸中的万幸。
发表于 2021-9-5 14:47 | 显示全部楼层
最近看书,有感而发,抢答下。
首先,个人觉得薪水反应不了算法工程师的真正水平。我曾经给一个创业的朋友聊过这个话题,他说小公司有时候为了吸引人才,同样的水平,开的薪水可能比大公司高。因此我不聊薪水,我也聊下算法工程师的级别。
吴军老师在自己的书中按照物理学家的朗道的观点,划分了工程师的“朗道级别”。我先引用吴军老师的话,解释下“朗道级别”。
按照朗道的理论,物理学家可以分为五个等级,第一级最高,第五级最低。每一级之间能力和贡献相差十倍。
       在第一级当中朗道列出了当时十几个世界级的大师包括波尔、狄拉克等人。
       在第二级中全世界也只有几十位,朗道将自己列入了2.5级,在获得了诺贝尔奖后,将自己提升到了1.5级。
          在所有的物理学家中朗道给出了一个零级的物理大师那就是爱因斯坦。
       朗道等级最核心的思想是,人和人的差距,能力和能力的差距是数量级的差别而不是通常人们想象的差一点点。
仿照朗道的方法,吴军老师也将工程师分为了五个等级。对于其专业的人士也可以依次分类,分类的原则大致如下, 第五级:能独立解决问题,完成工程工作。 第四级:能指导和带领其他人一同完成更有影响力的工作。 第三级:能独立设计和实现产品并且在市场上获得成功。 第二级:能设计和实现别人不能做出的产品,也就是说他的作用很难取代。 第一级:开创一个产业。
个人觉得,按照这个级别,我不说算法工程师,我叫算法从业者吧,其实也可以分为五级,我说下自己对头两个级别的理解:
   第一级: Yann LeCun、Yoshua Bengio和Geoffrey Hinton 等,开创了深度学习时代;
    第二级: 能实现一个类似Caffe的框架
讲真,剩下的三级,我觉得比较难总结,就不写了
下面吴军老师的文章链接
工程师的五个等级 - Inspire - 博客频道 - CSDN.NET
发表于 2021-9-5 14:47 | 显示全部楼层
20  能够被动接受安排干活
50  能够解决问题
100 能够争取到资源
我把年薪看成年龄了
发表于 2021-9-5 14:53 | 显示全部楼层
本人从事数据相关行业10来年,经历过各种岗位的磨练与挑战,薪资这几个阶段都经历过,现在每天也在帮助企业招聘大数据人才,对20万、50万、100万,甚至更高级别的人才要求有一定的见解,下面我就从几个角度解构下这几类人的能力素质模型,这些也是我在日常招聘过程中对人才的基本要求,说得不对的地方欢迎大家拍砖:
技术能力:
20万级别的算法工程师,0年-3年,需要在无导师指导情况下,独立完成一个算法模型,算法种类有很多,你只需要熟悉某一类算法模型,比如预测评分模型、分类模型、关联推荐模型、文本分析等,仅仅只需要懂一类,程度上能独立工作就好,哪怕做出的模型还不够老练。
50万级别的算法工程师,3年-5年,需要掌握起码三类以上的算法模型,熟悉每一类算法模型中有哪些典型的算法,并且对各典型算法适用的场景了然于胸,举个例子,做分类的算法有决策树、逻辑回归、SVM模型等,需要知道怎样的数据形态适用哪种算法,每种算法的优缺点在哪里,适用于什么业务场景,如何进行模型的演进与优化。同时,要掌握模型实施的整个环节,从样本定义、特征值分析、算法选型、模型评估、模型部署、模型监控等。
100万级别的算法工程师,5年-10年以上,需要完全具备50万级别的算法能力外,这个级别的工程师是公司中的灵魂人物,需要不仅仅掌握模型算法的能力,也需要熟悉相关周边技术,比如大数据生态圈相关的技术,还要求具备公司在技术领域战略方向的确定选择和实施落地步骤的把控,比如,在金融信贷风控领域,需要做出授信额度模型、风险定价模型、反欺诈识别模型、客户需求意向度模型等等,需要这位带头大哥非常清晰各个模型的内在联系,落地步骤怎样哪些该优先去做哪些往后,哪些做哪些不做,等等。
业务能力:
20万级别的算法工程师,对业务经验没有太多要求,更多要求是技术上的能力,但如果懂业务,具备公司所在的行业业务经验,则加分也非常明显,如果是多个人同时竞争一个岗位,那么,原来是这一行业的最容易胜出。
50万级别的算法工程师,需要具备至少1年以上的同行业的业务经验,技术是会有瓶颈的,到了这个级别的工程师,一定要注意选定行业作为自己的职业,跳槽要慎重选择,不能频繁换行业,需要积累行业业务经验,这是重中之重。
100万级别的算法工程师,他是公司的专家、科学家,要做技术专家的同时,也要是一个业务专家。所有的技术最终是为业务服务的,只懂技术、只会搭积木是远远不够的。技术如果没带来收益,所有的投入都是没有产出的。作为公司的灵魂人物,所有技术战略方向、业务战略方向都与你有关,你为公司的营收业绩负责,不会因为你只是负责管理技术而对业务营收没有要求。
团队协同:
20万级别的算法工程师,要求不高,在团队成员中能够进行良好的沟通,到达一定技术水平时候,可以帮忙带领实习生工作。这个级别人员,我个人要求具备一个分享精神,分享才能让自己技术学习更快更牢固,分享帮助自己的同时更重要的是帮助自己。团队的学习氛围怎样,就是看这个级别的员工,团队成员有进步,团队才会更加牢固。
50万级别的算法工程师,leader级别,需要具备一定的管理能力,跨团队沟通协同能力,项目驱动能力。作为骨干人员,需要带领好自己的团队成员,对团队的高效产出负责。要会培养成员,能够做他们的导师。
100万级别的算法工程师,管理上,应该都是部门经理、总监以上的了,管理能力的要求比较高,要能够确定业务方向、公司战略方向等,决策失误,会浪费大量的资源,甚至会给公司带来灾难性后果。举个例子,重大算法模型的研究是一个充满风险的事情,需要投入大量的资源,但结果往往难以预料,这时候,就非常需要这位带头大哥对业务、行业、市场、对手等等有充分的了解,才能做出正确的抉择。

以上是我在日常招聘和管理中的拙见, 欢迎大家拍砖指正,欢迎大家关注我的知乎专栏“大数据实践与职业生涯”并留言,专栏会陆续的推出过往十多年的大数据工作经验总结和我的一些研究实践成果。如果你是大数据新人,或者想转行进入大数据领域,或者职业生涯上存在一些疑惑,都欢迎关注我的知乎live分享“大数据人的职业生涯规划” 、 “数据分析师-从零入门到精通”、“大数据人的数据科学家之路”。
发表于 2021-9-5 14:57 | 显示全部楼层
这个问题自我从5月6日提出,不到2周的时间,获得了超过25万的浏览,以及2000多人的关注,应该说,作为一类偏专业的问题,热度和关注度还是可以的。其间,也有不少朋友给出了不错的回答,在此一并表示感谢!
但坦率地讲,所有回答的质量是有点差强人意的。泛化的回答多,具象的回答少,模糊的回答多,清晰的回答少,带有误导性主观性的回答多,客观且带有启迪作用的回答少,天马行空的回答多,逻辑严谨的少。
至于那些带有实证数据支撑,案例解读的,更是少之又少。
我不知道有多少有志于算法的同学可以从这些答案中得到有效的养分,并可以身体力行。
至于说要从中提炼出算法人才的知识图谱和成长路径,更是缘木求鱼。
某些所谓的大咖,这样看来也不过如此吧。
我不知道他们真的是肚里有货倒不出来,还是本来肚子里面就没什么过硬的货色。

anyway,还是期待更多精彩的回答!
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-11-14 02:18 , Processed in 0.074070 second(s), 23 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表