Baste 发表于 2021-7-4 06:54

这个问题太适合在企业的算法工程师来回答了,好的算法工程师/研究员千篇一律,差的算法工程师真的是千奇百怪,但是非要说最差,那想必是如下这个层次所象征的一群人:
(研究型)吹水为主,但善于(乐于)”分享“,尤其是通用型、非深度型知识。如果只是这样,其实还好,还算不上差。但是再加上在几千的数据集上玩转着各种汹涌磅礴的End2End Deep Model,甚至模型还带着各种bug,在过拟合的时光中甚至麻痹了自己总结出一些几乎可以说意淫出来的结论。毒害自己也就罢了,可恨的是还有这种背景的工作在顶会发表出来,在知乎or other各种平台宣传出来,被各种入门的同学所追捧。所以,研究层面,这是我所见识过的差吧。(产品型)刚才说的场景可能偏学校或者研究部门,那这里要说的就是偏解决产品问题的算法工程师了。当然,属于1的筒子到了2岗位也自然会不甘示弱成为奇葩,但是2又有一些独特的个体。我所见识过的这样的筒子以大数据之道绑架旁人,嘲讽着别人的数据为鸡肋,非海量样本不统计;以调包侠之道欺骗自己,写着漫天的bug,调用着使用了数以月记的高star项目还不知道这个东西到底是什么的开源工具,被庞大的用户粘性欺骗了自己,以为自己站在机器学习制高点,改变世界的一群人。
1和2看起来像是笑话,也希望大家以笑话待之,但是可以保证的事此类事情无一夸大,均为非亲眼所见不敢相信的事实。感谢他们扩宽了我的眼界,不求抨击,但求以反面要求自己,能成为一个还不差的算法工程师吧。

fwalker 发表于 2021-7-4 06:55

感谢题主,看了一圈我觉得我还有救

FeastSC 发表于 2021-7-4 07:00

sudo pip install ...他在window系统下运行报错在群里这是什么问题

RecursiveFrog 发表于 2021-7-4 07:07

吐槽一下面试中遇到的奇葩:
1、我问已知上文想预测下一个词,怎么做?结果他说,先找人标数据,然后训练一个CRF……
2、猎头推荐了一个候选人,简历看着还不错,约了面试。结果这人非要把他写的一个技术文档让猎头转给我看一下,我就只好看了。点开pdf文档,里面讲用MLP做文本二分类,他用了两种方法,分别是随机初始化的词向量和预训练的词向量。两种方法的准确率分别是……49.9%和50.1%……然后得出结论预训练词向量比随机初始化要好……于是我默默取消了面试安排。

yukamu 发表于 2021-7-4 07:09

勃勃这种程度,据说在Facebook做NLP的时候经常让李夏路帮他擦屁股,代码稀烂无比

RecursiveFrog 发表于 2021-7-4 07:12

这年头能够保持面试的时候把聊天顺下去我觉得就很好了。
就这两个月的事情:
面试A:简历上写着”精通解决高方差高偏差问题“。想让该候选人推导一个误差的偏差方差分解,顺便聊聊boosting和bagging。先打开话题:什么是方差和偏差。答曰:不知道。话题就死在这里。
面试B:简历上有卡尔曼滤波的经验。想让该候选人推导一个已知联合高斯分布求条件高斯分布的公式,并聊聊线性高斯系统与隐变量模型。先打开话题:什么是卡尔曼滤波。答曰:不记得了。话题就死在这里。
面试C:简历上有降维的经验。想让他从PCA入手往下聊。先打开话题:什么是PCA。能给一个标准答复。继续:什么是特征值,答:不知道这个概念。话题就死在这里。

kirin77 发表于 2021-7-4 07:17

我智商太低,学不会TensorFlow1.x,只会用Pytorch……感谢Facebook赏我口饭吃

super1 发表于 2021-7-4 07:18

不考虑部分除职位名称之外和算法工程师没有任何关系的「算法工程师」。




觉得「深度学习」是万能的;觉得任何问题都能用「深度学习」来解决;觉得任何问题都应该用「深度学习」来解决;觉得「深度学习」是决策树类算法的上位取代;觉得效果达到90%就是做得很好,效果只有50%就是做得很差;分析问题时,喜欢先确定结论再找证据;解决问题时,喜欢先确定方法再看数据;比如先确定「这个任务我要用图神经网络来做」然后再看有哪些可用的数据,数据量如何;认为复杂的方案一定更好;认为自己没听说过名字的方法一定更好;认为论文或各种资料中的结论一定是正确的,认为论文或各种资料中提到的算法一定有效(尽管自己也经常发论文);如果有人通过实验推翻了那个结论或是判断那个算法无效,那一定是这个人的实验搞错了;认为创新性远比效果重要;认为只要有创新,就一定有意义(哪怕效果极差);认为可解释性远比效果重要;(注:并不是说可解释性不重要,而是说很多解释根本就是强行解释,并不是现象的真正原因;而很多人只需要一个能唬住自己,使自己看不出有什么问题的解释。)

yukamu 发表于 2021-7-4 07:24

当然是自己了,想都不用想啊。无人工智能学历背景、无论文发表、无项目上线、无系统的理论知识、无数学功底,还有比这些更可怕的吗?工作中更是无确切的方向,什么都在尝试,如NLP、物体检测、推荐系统。整天就是github和各种论坛找人家做好的,然后看看能不能用到工作中。python还是边工作边学,做个系统就扔到那,没任何调优,也没人用,可能都没人知道。
迷茫的代码
写个系统吧,这dict、list都是啥,用哪个不一样啊,反正都能实现。效率是啥?总共也没几条数据,关注它干啥。(后来发现LeetCode的list、map相关题真香)
代码整洁性与我有个毛关系?自己写,自己用,自己看。过一段时间,自己都不知道写的逻辑是啥了。(clean code,欲哭无泪啊)
多线程?碰是不可能碰的。能用现成框架就凑合用吧。曾经自己写一个类似map reduce思想的小程序,弄了一周,感觉头疼。最后开4个进程,也就快了2倍。这是个深坑,太可怕了。
迷茫的算法
LR四处用,就是分类呗。啥是线性?哪都能分出个结果,准确率高不高的又如何?有结果凑合用呗。有人问损失函数,咋推出来的?听没听说过最大似然估计?这不就是个0.5问题吗,调包呗,sklearn、keras、TensorFlow?哪个不能满足您呢?非要我自己写算法,写出来,你敢用吗?
梯度下降优化算法。Momentum、Adam,嗯,名字不错。又是圈圈,又是箭头,又是折线的。要表达啥啊,就是一堆公式,就能搞出下边这种图了?公式咋来的啊,这公式我要用脑子哪部分去理解啊?
神经网络也一样。正向传播就是顺着公式计算,反向传播就是求导。为啥大家都好好用链式法则去做矩阵乘法,到了激活函数部分就偏来个按位置乘了呢?还有的课程解释为放大器,这又是啥课?难道是电子电路?
CNN这更是啥啥啥?一堆堆的方块,一层层的落的一起。这都是咋想出来的啊。正向传播过去就行了,反向是怎么回来的啊?我知道啥是求导,但你这也能求导回来?骗我呢吧!
RNN和CNN是一个路子,全都是啥啥啥?下面图是闹着玩呢嘛?好像不是,一看貌似还挺清晰的,哈哈哈。有输入、有输出的。句子扔进去,貌似生成句子,或者做分类,loss用softmax还行。还是得说,为啥就能这样算呢?还是各个方向的都能算。
哎,更别说attention、transformer、bert......
当看到一次LDA算法中的数学时候,自己彻底的迷茫了。从几百年前的哥德巴赫的一个小猜想,一直证明到这玩意能用。真的只想说,请不要再摧残我的智商了,给我们这种路人丙角色留条活路吧。只想安安静静当个调包小虾米,只想默默的知道输入输出都是啥就行了。
迷茫的数据整理
都说调包侠大量时间都用在了数据清理上,认识数据。我想说几千条图片数据打标签,基本就能消耗掉几周时间。NLP那种语言类,如何去搞啊?分类分错了,手工检测?这个1M数据可能就要死人的啊?那么多、那么大、那么好的数据集,都是咋弄来的啊?不能真是人一点点肉眼搞出来的吧?
最后的感叹,青铜玩家为啥和王者玩家的差距这么大呢!知识混乱的堆叠在脑里边,有些可能还是错的,怎么能请个人去清理一下呢?突然想到下面这个视频(侵权请私信删),看了特别的想哭,真的是差距:
大傻:当高智商的边牧遇到低智商的哈士奇,双方是什么感觉?

xiangtingsl 发表于 2021-7-4 07:29

cver不会解线性方程
不会调试代码,动不动就说玄学,编译器是玄学,都没用深度学习大数据的传统算法
我的心情是这样的


关键是老板还信他。委以重任。
据说在做目标识别。。。
我自知水平差,业余时间都看书,嘲讽我看书有啥用。
很小的问题训练出超级大的模型
数学差也就算了,还不懂业务,但是在搞深度学习
我这种菜鸡案头放了一堆数学计算机书,动不动就翻一翻。人家放了一本心理学,把老板安排的明明白白。
我一直觉得这么好的才华,搞算法做技术太可惜了
页: 1 [2] 3
查看完整版本: 你见过最差的算法工程师能差到什么程度?