yukamu 发表于 2021-7-25 16:09

刚进算法团队,大牛们讨论高深的cv术语和算法,如何才能听懂?

有哪些算法黑话?

kyuskoj 发表于 2021-7-25 16:16

算法黑话祛魅
feature:一个数组
representation:还是一个数组
embedding:把输入映射成数组
提高泛化性:预测更准了
过拟合:训练过头了
attention:加权
adaptive:还是加权
few-shot learning:看了几个样本就学
zero-shot learning:一个没看就开始瞎蒙
self-supervised:自学
semi-supervised:教一点自学一点
unsupervised:没人教了,跟谁学?
end-to-end:一套操作,行云流水搞到底
multi-stage:发现不行,还得一步一步来
domain:我圈起来一堆样本,就管他叫一个domain
transfer:我非得在这一堆样本上训练,用在另一堆样本上,就是不直接训练,就是玩~
adversarial:我加了一部分就是让loss增大
robust:很稳我不会让loss变大的(但也不容易变小了)
…………(一更)
state of the art(sota):我(吹nb)第一
outperform:我虽然没第一,但是我比baseline强
baseline:(故意)选出来的方法,让我能够outperform
empirically:我做实验了,不知道为啥work
theoretically:我以为我知道为啥work,但没做实验,或者只做了个toy model
……………(二更)
multi开头词组
multi-task:把几个loss加一起,完事
multi-domain:把几堆儿样本混一块训练,完事
multi-modality:把视频语音文字图像graph点云xxx混一块训练,完事
multi-domain multi-modal multi-media model:mua~mua~mua~mua……
……………(待更)

HuldaGnodim 发表于 2021-7-25 16:16

等你职位高一点,你会发现有更多听不懂的术语,比DL和CV难学。


商业

落地,赋能,共创,共建,分发,支撑,抓手,体感,感知,方法论,融合,调性,心智解耦,拆解,集成,打法,解法,沉淀,对齐,拉齐,对标,对焦,拉通,打通,打透,吃透,颗粒度,迁移,分层,漏斗,闭环,战役,落盘,组合拳合力,体系心力,赛道,痛点,生命周期,履约,引爆点,串联,价值转化,链路,纽带,矩阵,协同,反哺,点线面,认知强化,击穿心智,下钻,挖掘,爆款,调性,心智
交互,兼容,包装,附能,响应,刺激,规模,重组,量化,宽松,资源倾斜,完善逻辑,抽离,打法,发力精细化,闭环,布局,商业模式,联动场景,痛点,落地,聚焦,跟进,方法论,迭代,快速响应,影响力价值,细分,垂直领域,维度,颗粒,定性定量,聚焦,去中心化,关键路径,接地气,梳理,输出
格局,生态,话术,体系,对齐,认知,分享,去中心化,勾兑流程,感知度加速,用户画像打磨,摸索,提炼,玩法,反哺,生态化反,上半场,下半场,负增长,头部,洞察,细分领域,生态链,私域流量,KOL,KOC,MCN,内容创业,知识付费,降维打击,下沉,社交,小视频,大V,蓝V,主播,带货
B2B、B2C、C2C,ABC、C2M、B2M、B2A、C2A、O2O,讲故事、互联网+、SaaS、slogan、F2C、用户流量、地推、BA、SA、PV、UV,DAU,LTV,2.0,IAAS,PAAS
运营

关键词、转化率、搜索次数、渠道、需求图谱、热度、收录、爬虫、爬取频率、流量、持续引流、运营、重度使用者、无门槛免费使用、打包下载、用户体验满分,数据洪流
打法,同步,对齐,闭环,生态,发力,导流,格局,长尾,垂直,落地,干货,阈值,优化,迭代,敏捷,评估,高优,体验,布局,创新,痛点,价值,流量,数据,玩法,体系,平台,跟进,反哺,回顾,沉淀,碰,对,用户画像,去中心化,商业模式。
降维打法、卷入、头部、腰部、沉浸、生态、渠道下沉、颠覆、裂变、导流、测试、迭代、露出、分发、逻辑、撬动、盘活、整合、操盘、平台、渠道、闭环、粘性、流量、模式、切入、共享
善用、精准、梳理、铺设、设置、合理、转化、路径、权重、高质量内容、驱动力、成长需要,惰性满足,享乐满足,舒适的满足,获得认同,攀比心理,满足好奇,追求效率,内部消化、冲击力,人性,同理心
UGC、PGC,互推,落地,运营侧,定位,正态,提升,野路子,打通,勾子商品,核心,漏斗,最优,召回,转化,QA,FAQ,类目
技术

中台,微服务,devops,解耦,触达,兜底,策略,价值上探,监控,黑名单,接入,不一致,开启,异常,验证,部署,升级,优化,下钻,调用,抛出,捕获,对象,并发,性能,缓存,域名,验证,Bug,排期,宣讲,评审,评估,机房,云主机,告警,推算,结构,算法,逻辑,密度,扩展性,适配,APP,小程序,M站,PC端,刷新,发布,阻塞,发版,绑定,授权,下载,更新,抓取,轮播,提审,入口,开关,配置,备份,兼容,功能,能力,三方,第三方,移动端,场景,习惯,识别,识别码,互斥,QA,UE,UED,版本,BRD,MRD,PRD,DRD,加载,格式,规格,通用,读写,架构,请求,排查
管理

OKR,持续优化,复盘,不设边界,TBD,价值观,One on One ,执行力,服从性,后续,概率,规范,流程,响应,跟进,配合,反馈,审批,审核,申请,评审,支持,追溯,优化,饱和度,梳理,形成,调研,搭建,主导,参与,深度参与,坑位,落实,JD,HC,996,人效,含金量,带人,推动,协调,资源,分析,锅,背锅,责任心,沟通能力,交流,脑爆,分享,对接,优先级,计划,工作量,规划,推进,预期,消化,回顾,专项,交付,Q,产出,结果导向


腾讯
精品、微创新、正能量、打法、发力、精细化、闭环、布局、商业模式、联动、泛娱乐、场景、痛点、减法、落地、聚焦、我们查下、跟进、不忘初心、方法论、迭代、快速响应、影响力、全栈、价值、细分、大数据、垂直领域、维度、颗粒、定性定量、聚焦、去中心化、关键路径、干货、接地气、梳理、输出、格局、生态、沉淀、结果导向、套路、用户体验、眼界、话术、体系、对齐、同步、认知、分享、面交、去中心化、勾兑、流程、感知度、赞、加速、用户画像、打磨、摸索、提炼、玩法、反哺、阈值。
阿里巴巴
价值观、颠覆、拥抱、改变、相信、基础设施、电子商务生态系统、企业社会责任、造福社会、理想主义、阿里云、技术、第五大经济体、促进进口、阿里人、野心、鲶鱼、DT战略、全球化、营业额、改变世界、团队精神、知识产权、打假、情怀、挣一块钱、脱贫、平台公益、利益共同体、生态化发展、引爆消费力、农村经济、赋能、把控能力、专业化人才、战略踩空、无人区、练兵场、倒逼、互联网下半场。
百度
人工智能、无人驾驶、交互、刷脸、车、永久免费、更懂你、革新、迎接、技术创新、梦想、生态链、未来已来、智能营销、降维攻击、转变、可能性、搜索场景、AI思维、洞察、开放能力、深度学习、人脸识别、万物互联、数字化、风口、精准识别、云端仿真、共享、感知、海量数据、赋能、开发者。
字节跳动
独立发展、不上市、连接、用户体验、粉丝分发、跨越式机遇、新责任、未来、用户需求、概念推导、内容生态、国际化、体量、创作者、规模效应、平台属性、数字经济、估值、融资、智能社交、超级内容平台、颗粒度、价值创造、视频化、增长点、出海、流量红利、产品渗透率、拥抱AI、模式重构、信息分发、人工智能实验室、算法、技术、数据挖掘、趋势、变革、内容创业、涨粉、赚钱、自媒体人、用户、创作者、构建、打击低俗信息、覆盖、粘性、精准、内容分发、产品体验、反馈、平台级公司、回馈、版权保护。
网易
猪厂、养猪、一日五餐、考拉上新货了、严选上新货了、代购、我们公司自己做的、我们公司自己养的、我们公司自己卖的、创新、品味、精品、工匠精神、匠心、新消费、泛中产、生活家、正品、世界级品质、用户体验、模式创新、中国智造、美好生活、丁磊同款、非典型、网易特色、走心、有毒营销、IP营销、戏精、扎心、套路、竞争壁垒、差异化、价值、公益、企业家精神、有态度、各有态度、好的老板、广告公司、段子手。
京东
电商、亏损、商品流通、综合零售、物流网、供应链、智能商业体、技术转型、短链、成本管控、正道成功、世界500强、B2C、智慧化、重构、产业链、共生、品牌附加值、白条、无人仓、无界零售、一体化、倒三角战略、一体化、整合、流量端、竞争求异、盟国思维、赋能、O2O、云端服务、一锤子买卖、终端、库房、产业价值、最后一公里。
滴滴出行
小桔人、合理定价、用户价值、我要打车、神器、美好出行、智能派单、服务、足迹、系安全带、车主和司机、线上、打破价格僵局、尊享五星级出行服务、平台、智能交通、全球领先、随叫随到、将你安全带向爱、网约车、竞争壁垒、创新、包容性、出租车产业转型升级、私家车保有量、挑战、共享汽车、大数据。

Zephus 发表于 2021-7-25 16:18

很正常,我在学校是做句法分析的,来了公司做机器翻译,很多概念也不是很懂,但这还不是最生疏的。
今年年初,我开始写CUDA了,那才是我从来没有接触过的东西,听mentor开会的感觉就是,啥啥这都是啥?啥是Apex?啥是XLA?啥是cuBLAS?听的我是一头雾水。但我花了一两周的时间,啥都不干,就看CUDA的基础知识,最终也算入了个门。
然后我还写了点新手教程,想带更多不懂CUDA的小伙伴入这个门:
godweiyang:熬了几个通宵,我写了份CUDA新手入门代码现在虽然还不算熟练,带也能够简单参与一些项目了,比如合作一起开发了Transformer训练推理加速库LightSeq:
bytedance/lightseq只要你花时间,没什么学不会的。

DungDaj 发表于 2021-7-25 16:26

哈哈,这个问题我是真的会,而且深有感触啊。
那还是18年的夏天,刚凭借着AlexNet转到深度学习方向不久(也真佩服我当时的领导,竟然敢要我),而我们公司主要业务又是计算机视觉,团队讨论与分享的氛围还是挺浓厚的,属于在分享会上,大家会讨论到面红耳赤的那种。
而当时作为小白,每次参加这种讨论会,都是找个角落,有点像小时候上学,生怕被老师点到。我当时是生怕被同事cue到,自己却说不出个一二三四来,真的是听着他们高谈阔论,侃侃而谈,而我自己云里雾里,一脸懵逼。
而到现在,马上三年过去了,在这种场合,我再也不会是当时的小透明,可以高谈阔论,可以侃侃而谈,当然中间过程还是有些痛苦,需要费一番功夫的。
其实不管在公司,还是在学校,在自己是小白的时候,别着急着去羡慕别人高谈阔论,也别急着去加入别人的讨论。在专业的人面前,肚子里有多少水,别人几句话就听出来了,硬要加入,大家都尴尬。这个时候,最主要要做的是,就是日夜不停的提升自己的专业技能,在自己的方向赶快做出成绩,让专业能力和公司业绩为自己双向背书,这时候你就会发现,你今天问的问题,就再也不会是问题了。
前面讲的都是非常有用的废话,道理谁都懂,但是怎么做呢?有一篇回答里面希望对你有帮助。
DLing:图像处理和识别的算法工程师,工作一年多,发现自己胜任不了这份工作,怎么办?

ainatipen 发表于 2021-7-25 16:32

拿个小本本记下来就好。如果你们团队气氛好的话,直接问也没有啥不行的。
其实吧,我参加的这样的会,无非这么几个目的:
某人/某组的报告 —— 我们的算法天下一,比xxx更快,比yyy更准确,比zzz更便宜……吹吧,吹吧,cvpr oral的骄傲放纵,也就是这个水平了某个问题的头脑风暴 —— 这个我比较喜欢,大家谈各自的思路和解决方案,比较优劣;但是基本也没要深入到某个具体算法的意思,都是high-level论文研讨会 —— 这就是台下的人随便吃吃喝喝,台上的人战战兢兢演讲,其实他也没有实现过的东西,听个大概意思就好
我想了想,貌似我带的小弟也经常会问类似的问题,说白了,这不是你自己的锅 —— 这是深度学习的锅。以前很系统的学过cv的人,都不会有类似的问题,但是如今用深度学习学cv的人,就会有这样的问题。
orb是个什么球?(这是一个基于角点的传统特征)世界坐标系是个什么坐标系?(这是立体视觉里面的一个概念,相关的还有相机坐标系,图像坐标系,像素坐标系)积分图又是个什么图?(这是基于DP的用来算矩形窗内元素和的O1算法)random walk是干嘛用的?(最常用的是在路径优化里面,还有在图像分割里面)分水岭又是什么鬼?(某传统的图像分割算法)
如果是这样的话,你自己去补个一两门传统的图像处理,机器学习和计算机视觉网课也就好了。

kirin77 发表于 2021-7-25 16:37

图像算法工程师三重境界 :

一、传统图像算法工程师:
主要涉及图形处理,包括形态学、图像质量、相机成像之3A算法、去雾处理、颜色空间转换、滤镜等,主要在安防公司或者机器视觉领域,包括缺陷检测;


二、现代图像算法工程师:
涉及模式识别,主要表现的经验为Adaboost、SVM的研究与应用,特征选取与提取,包括智能驾驶的研究与应用、行人检测、人脸识别;


三、人工智能时代图像算法工程师:
深度学习,主要在大型互联网公司或者研究所机构,具体体现在TensorFlow等开源库的研究与应用,包括机器人的研究、基于深度学习的人脸识别;

首先!!!算法工程师包括:

1、音/视频算法工程师(通常统称为语音/视频/图形开发工程师)

2、 图像处理算法工程师

3、计算机视觉算法工程师

4、通信基带算法工程师

5、信号算法工程师

6、 射频/通信算法工程师

7、 自然语言算法工程师

8、数据挖掘算法工程师

9、搜索算法工程师

10、控制算法工程师(云台算法工程师,飞控算法工程师,机器人控制算法)

11、导航算法工程师

12、 其他【其他一切需要复杂算法的行业】


图像处理算法工程师

相关术语:
(1) OCR:OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程

(2) Matlab:商业数学软件;

(3) CUDA:(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台(由ISA和GPU构成)。CUDA是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题

(4) OpenCL: OpenCL是一个为异构平台编写程序的框架,此异构平台可由CPU,GPU或其他类型的处理器组成。

(5) OpenCV:开源计算机视觉库;OpenGL:开源图形库;Caffe:是一个清晰,可读性高,快速的深度学习框架。

(6) CNN:(深度学习)卷积神经网络(Convolutional Neural Network)CNN主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。

(7) 开源库:指的是计算机行业中对所有人开发的代码库,所有人均可以使用并改进代码算法。


1必备技能总结
职位要求


编程技能:
1、 具有较强的编程能力和良好的编程习惯, 精通c/c++编程,并熟练使用VS 或matlab开发环境;


2、 在计算机技术领域拥有扎实的技术功底,尤其在数据结构、算法和代码、软件设计方面功力深厚;对数据结构有一定的研究基础如链表、堆杖、树等,熟悉数据库编程;


3、 出色的算法分析能力,对某一特定算法可以做广泛的综述,有实际算法实现经验;


4、 熟悉面向对象编程思想,精于windows下的C/C++、VC++程序设计,熟悉MATLAB,对MFC有相对的了解和应用经验;
专业技能:
1、扎实的数学功底和分析技能,精通计算机视觉中的数学方法;
   高等数学(微积分)、线性代数(矩阵论)、随机过程、概率论、
   摄影几何、模型估计、数理统计、张量代数、数据挖掘、数值分析等;
2、具备模式识别、图像处理、机器视觉、信号处理和人工智能等基础知识;
   对图像特征、机器学习有深刻认识与理解;
3、精通图像处理基本概念和常用算法包括图像预处理算法和高级处理算法;
   常见的图像处理算法,包括增强、分割、复原、形态学处理等;
   熟悉常见的模式识别算法,特别是基于图像的模式识别算法,掌握特征提取、特 征统计和分类器设计;
4、熟练使用OpenCV、Matlab、Halcon中的一种或一种以上工具库;
5、熟悉机器视觉系统的硬体选型,包括CCD相机,镜头及光源;熟悉相机与镜头搭配;
外语:
1.英文熟练,能够熟练阅读和理解专业英文资料,有英文文献检索和阅读能力;

2. 良好的英语沟通能力


综合能力:
1.对工作认真负责,积极主动,勤奋踏实;
2.做事严谨,注重细节,有耐心,能够在压力下独立工作;
3.学习钻研能力强,有较强的理解能力和逻辑思维能力和良好的创新意识;
4.良好的协调沟通能力和团队合作精神;
视觉算法经验:请提供实现的算法列表
    目标识别、图像配准、三维测量、标定和重建、手势识别;
    表面缺陷检测;尺寸测量;特征识别;
    图像去噪、滤波、融合算法
    3A算法:如自动曝光、自动对焦、自动白平衡
岗位职责:
1、负责计算机视觉中的图像采集,处理面阵和线扫描相机的成像和控制 ;
2、针对特定的计算机视觉问题,设计目标识别与快速定位与检测算法的实现,并进行优化;
3、对彩色图像和灰度图像实现物体表面的污点划痕检测算法设计和实现;
4、处理三维物体表面数据获取和实现三维测量算法的实现;
5、处理点激光和线激光源的成像,散斑噪声滤波和轮廓检测;
6、负责算法与软件GUI开发工程师接口;
7、完成上级领导交办的其他的工作。


2面试题大全
1-图像基础知识:
1.常用的图像空间。
2.简述你熟悉的聚类算法并说明其优缺点。
3.请描述以下任一概念:SIFT/SURFLDA/PCA
4.请说出使用过的分类器和实现原理。
5. Random Forest的随机性表现在哪里。
6. Graph-cut的基本原理和应用。
7. GMM的基本原理和应用。
8.用具体算法举例说明监督学习和非监督学习的区别。
2-笔试
大概有:
1.表示图像的特征有哪些
纹理,频率,梯度这种
2.写出canny边缘提取算法的原理
3.图像插值方法
4.自己设计一个OCR引擎
5.写出Kmeans程序,并在一个设计环境中怎样使用
6.中值滤波
7.static的作用
8.写一个c++宏
9.二分查找
10.整数翻转,如何处理越界问题
11.C++多态,静态联编和动态联编,虚函数表
12.模型融合如何做
13.提升树的思想,随机森林和提升树的区别
14.SVM推导,对偶性的作用,核函数有哪些,有什么区别
15.python两个每行都是数字的文件合并,去重。
16.shell编程,编辑文件。
17.进程与线程的区别
18.卷积神经网络介绍
19.SVM的推导
20.大文件求交集,如何解决哈希之后小文件还是放不进内存堆排序代码
21.连续和最大问题,如何证明?
22.bp算法介绍,梯度弥散问题。
23.svm介绍,优缺点是什么,lr介绍,区别是什么
24.lr与线性回归的区别
25.如果要预测房价,用什么模型
26.如果要预测房价,并且知道一个房间的房型信息,如何构建模型
27.sigmoid 函数的应用有哪些,为什么?
28.列举十种常用的神经网络模型
29.语音识别模型有哪些
30.如何识别一个人在喝酒,需要几个模型
31.卷积神经网络中卷积如何实现,激活函数的意义,损失函数有哪些,初始化参数如何选择
32.用过哪些深度学习框架,TensorFlow中的session是什么,session和interactivesession的区别
33.如何实现卷积层权值共享
34.如何保存模型,读取已有的模型
35.用过哪些深度学习模型,区别是什么。
36.了解哪些寻优算法
37.softmax损失函数作用是
38.c++ 的 const,static作用
39.强制类型转换cast之间的区别
40.svm推导,核函数的体现,常用的核函数有哪些
41.alexnet介绍
42.过拟合的原因,有哪些避免过拟合的trick
43.1G的文本统计词频,输出频率最高的1000个词
44.手写topk的代码,快排。代码还能如何优化,如果要上线的话还需要做哪些处理?
45.如果分类样本的标签只有一定的概率可信,如何处理?如何设置负样本?
46.过拟合的原因,有哪些防止过拟合的方法
47.模型评价如何做,其中存在哪些问题
48.决策树算法有哪些,随机森林和GBDT的区别
49.降维方法,PCA原理
50.哈夫曼树在机器学习中的应用
51.文本挖掘算法了解哪些
52.人流量预测系统如何设计
53.profession笔试:最优的进程调度算法,至少用多少个cpu
54.英语自我介绍,口语渣猝不及防
55.联想研究院 模式识别研究员 offer
56.异常值的影响,如何消除
57.所有了解的机器学习算法有哪些,框架性讲述
58.梯度下降算法了解哪些,优劣势是什么
59.二叉树中序遍历,递归和非递归
60.linux操作指令了解哪些,文本处理指令有哪些
61.一亿个数的文件,如何分成两个文件a,b,使得a文件的数都小于b,同时文件大小要差不多。
62.均匀分布如何生成正态分布
63.SVM原理,支撑向量越多越好还是越少越好
64.二叉树深度遍历,时间复杂度和空间复杂度
65.二维排序矩阵搜索
66.项目中的长时间推广问题,如何考虑样本之间非独立的影响。
67.编程题,矩阵中的最短路,有门有钥匙。动态规划加状态向量。
68.贝叶斯公式,实际如何计算,如何解决精度问题。
69.字符串转数字
70.svm核函数有哪些,如何选取,手写表达式
71.降维方法介绍
72.c的虚函数,虚函数指针和虚函数表存在哪儿
73.Linux 文件权限修改,参数介绍
74.模型的比较如何做
75.随机森林和提升树
76.卷积神经网络原理
77.如何避免网络的过拟合
78.如何网络调优
79.Python 的数据结构有哪些
80.tuple 和set的区别,set的底层实现
81.hash表的算法有哪些
82.svm推导,一直到序列最小化求解。核函数如何体现,有哪些类型。
83.构建分类器的整个流程是什么
84.数据清洗方法,缺失值处理方法,降维方法
85.pca原理推导
86.决策树算法的介绍
87.二维排序数组搜索
88.如何构建欺诈交易识别的模型?
89.不均衡的数据如何分类
90.归并排序,二维排序数组搜索,中序遍历重构二叉树
91.svm推导,为什么要用拉格朗日乘数法,对偶问题是什么
92.KKT条件都有什么,如何求解svm的最优化问题
93.数据不均衡如何解决,抽样得到的分类准确率如何转换为原准确率。
94.逻辑回归原理,推导求解方法。
95.为什么选用对数极大似然函数作为优化目标,用平方损失有什么问题。
96.逻辑回归对特征有什么要求,是否需要做离散化,离散化的好处与坏处。

七彩极 发表于 2021-7-25 16:42

你是新人你怕谁,听不懂就死记,然后上网去查。一天查一个,一年也就有了200多个。无论哪个行业200多个黑话基本都已经入行了。

c0d3n4m 发表于 2021-7-25 16:42

多听多记,找个关系好的大牛追着问。

RedZero9 发表于 2021-7-25 16:47

多用本子记录,空余时间充电补充一下
页: [1] 2
查看完整版本: 刚进算法团队,大牛们讨论高深的cv术语和算法,如何才能听懂?