小白机器学习入门(16)算法模型优化和特征优化
上一篇 小白机器学习入门(15)算法模型选择 从非算法人员出发讲模型选择说了一下,侧重讲了两个方面,按阶段选择合适的算法,以及以业务结果为目标进行算法模型推动。千万不要因为没有数据就停止不前。
本篇侧重讲一下非技术人员的模型优化和特征优化。以往模型训练、模型训练、特征优化,看起来都是算法人员的事情,因为非技术人员没有技术背景所以参与有限。
在实际业务里,算法人员尽管对算法模型相关做的比较好,但与业务相关或者算法解决很难需要业务调整的时候,算法人员就比较难处理,需要算法人员花费更多时间成本来了解业务、学习其他知识,甚至有些项目还要学习工程化研发的东西。
所以,业务相关、算法解决难需要业务调整的部分就需要非技术人员一起来配合算法人员完成。这块分为模型优化和特征优化。
1.模型优化
模型优化分为算法模型本身优化和算法模型任务目标优化。
模型本身优化,是指通过模型探索、数据分析、超参调优、样本调整等来将算法模型的输出结果调整到目标值。
算法模型任务目标优化,是指以算法模型所要解决的业务问题为主,进行优化算法模型组。比如算法模型前后增加容错机制、增加多个算法模型等等,使整体结果达到业务目标。如下图:
这是一个通过识别设计稿生成代码的链路设计,最开始是模拟人眼,通过图像识别来分析设计稿的布局(元素排列结构)、设计组件(按钮、Card、输入框、菜单等)以及其他识别,从而来模拟人来写代码,按照不同语言的规则来输出各个编程语言。
但是光凭图像上的区别,无法很好的区分 类似 按钮和标签 这种图形相似的设计组件,都是矩形、都有文字,长得一样。所以,从区分设计组件的任务目标上,就要通过图形上的文本分析、文本相关度、不同组件出现的位置概率不同等方面进行优化。
按钮和标签分类以及可信度百分比值
那么,这个过程中非技术人员能做哪些事情呢?业务分析、专业知识分析、认知推理模拟、归因分析、影响算法模型结果因素拆解和分析等。
比如:APP设计中,导航通常在页面上面 和底部,中间是内容区。在买菜APP设计中,Tabs标签在左侧或者上面。
左图:导航,右图标签页
再比如:导航、菜单、菜单导航的区别是什么? 等等
2.特征优化
除了已有特征数据上的技术处理,特征合并、特征变换、利用决策树产生新特征等。还有特征本身挖掘、特征选择等,这部分需要非技术人员一起来进行分析,通过业务梳理、业务流程拆解、数据分析等进行特征挖掘 和 特征选择。
研发写代码的思考逻辑推导
比如,通过还原研发从拿到设计稿到代码构成的思考逻辑,进一步抽取特征项,以及基于已有特征,再进行挖掘。从而分析出,通过行业、场景、业务、功能块、终端应用类型(PC Web、小程序、iOS、Android等)等特征项进一步提升算法分类准确度。
比如:表格组件多见于PC、Pad Web设计 以及金融行业 App设计。
Web表格组件
金融类APP-表格组件
无论是模型优化还是特征优化,业务相关分析都是非常重要的。
下一篇,继续说说工程化及剩下的部分。
页:
[1]