|
看了今年五一杯的题目,觉得今年的题目都很简单,我会持续更新详细思路
A题:血管机器人的订购与生物学习
A题是一个规划求解的问题,可以使用规划类算法,可以使用SPSSPRO的规划求解模块和LINGO进行求解:
目标函数:运营成本和治疗效果
其限制条件如下:
1)血管机器人只能工作一周,之后要被取出
2)血管机器人取出后需要操作手拆卸下来进行一周的保养
3)操作手没有工作的时候需要一直保养
4)新购买的容器艇需要一周的调试
5)容器艇使用后不需要保养,可以一直使用
6)容器艇未使用需要保养
7)一个容器艇需要四个熟练操作手
8)操作手学习的时候不需要容器艇
思路:
第一问有13个容器艇和50个熟练操作手,如第一周就用11个容器艇,那需要44个操作手,留下来的可以训练60个熟练操作手。以此类推,第二周5个容器艇,那就要20个操作手,根据附件一直推算即可。
这种优化类型的题目很多,可以参考20年和21年国赛的的真题,往年真题spsspro社区都有,大家有兴趣的可以去看一下,这个题目重点就是把约束条件设置好合理,具体的规划求解算法大家可以用spsspro的算法,可以直接快速求解。
<hr/>B题 矿石加工质量控制问题
B题是五一杯经典的化工分析预测类题目,需要建立不同的模型去对问题进行分析预测,建议使用机器学习算法,可以使用到的算法模型为遗传算法、时间序列、灰色预测,不建议使用BP神经网络作为预测算法,可以考虑马尔科夫模型来对第三问进行预测。同样的,spsspro都拥有这些算法 ,也是免费的。
本题有一点需要我们注意的地方,也是可以使自己模型更亮眼的地方就是在所给数据中,由于其他不确定因素的影响,在相同(或者相近)的系统温度下生产出来的产品质量可能有比较大的差别,让我们预测最大可能的结果,题目已经如此明确的提示我们,因此当做出来预测结果后,一定要进行处理!!可以利用预测的置信区间,残差分布等等反馈结果进行修改,或者对比相同温度下质量的波动找到规律等等。
第一问求解
step1:读取附件1的sheet1数据温度(temperature),读取sheet2数据产品质量(quality ),读取sheet3数据原矿参数( parameter)
step2:将temperature数据的时间 (Time)进行格式化为年月日,命名为date
step3:根据parameter的时间 (Time)与temperature 的date进行关联,得到合并数据集合AAA
step4:将quality的时间 (Time)格式化后,减去2个小时,命名为dt
step5:根据quality的时间 (Time)与AAA 的时间 (Time)进行关联(左关联),得到合并数据集合BBB,这也是最终处理好的数据
step6:设置X:&#39;系统I温度 (Temperature of system I)&#39;,
&#39;系统II温度 (Temperature of system II)&#39;,
&#39;原矿参数1 (Mineral parameter 1)&#39;, &#39;原矿参数2 (Mineral parameter 2)&#39;,
&#39;原矿参数3 (Mineral parameter 3)&#39;, &#39;原矿参数4 (Mineral parameter 4)&#39;
设置ya,yb,yc,yd:&#39;指标A (index A)&#39;, &#39;指标B (index B)&#39;, &#39;指标C (index C)&#39;,&#39;指标D (index D)&#39;
step7:构建仿真回归模型并进行评价,这里我构建了线性回归、随机森林、决策树、GBDT、xgboost,结果都是xgboost最优
PS:线性回归效果是真的拉跨
step8:预测新数据
使用xgboost的预测结果
2.2 第二问求解
step1~5跟第一题一样,这里不多说,或者可以直接拿step5产生的data1.csv的数据来用也可以。
step6:X、Y的设置这次要改一下。
step7:构建仿真回归模型并进行评价,这里我构建了线性回归、随机森林、决策树、GBDT、xgboost,结果还是决策树和xgboost最优
step8:以XGBoost预测新数据
2.3 第三问和第四问以及完整代码有兴趣的可以看下这个文章,
<hr/>C题 火灾报警系统问题 (已更)
C题是大数据、数据分析类题目,较为常规,没有专业限制。
代码讲解大家可以看这个文章
问题1:第一小问是用附件1确定真实火灾起数,第二小问是用附件1和附件2,利用可靠性和故障率对各类型部件进行评价:利用可靠性和故障率对各类型部件进行评价,帮助政府选取更加可靠的火灾探测器类型。
第一问,评价模型中主要是对可靠性和故障率进行量化,可以自己定义一些指标(通过查阅相关论文来确定一些指标),通过评价方法对各类型部件进行评价,由于可靠性是正向指标,故障率是负向指标,可以用topsis优劣解距离法、秩和比综合评价。
问题2:选择合适参数建立区域报警部件类型智能研判模型,当某大队辖区内某类型部件发出报警信息时,能够较好判断是否属于误报,提高报警准确率,并对附件3中各大队不同部件发出的报警信号进行真实性评价,确定附件3中各报警信号是真实火灾的概率。
第二问,主要是寻找哪些指标会引起误报,这些指标应该如何改变才能使误报变得最低,可以建立一个分类模型,观察哪一指标更大程度地影响误报率,这里可以用spsspro的机器学习板块,其中(决策树、随机森林、adaboost、xgboost等模型是可以给出特征重要性的结果),这可以帮助找到影响误报率的指标。
问题3:根据问题1所获得的各辖区火灾数据以及问题2的结果,结合表1分析该市各消防大队的综合管理水平,并将综合管理水平最低的三个辖区的技术指标(如辖区火灾发生频率、部件故障率、部件可靠性等)进行量化,提出改进方案。
第三问,还是一个综合评价模型,只不过这次变量发生了变化,这依旧可以用问题1的综合评价法进行分析。
问题4:根据有关文献和问题1至问题3模型分析的结果,请有针对的提出火灾报警系统各部件管理维护的意见建议。
第四问:开放性问题,自行提出意见。
点赞 持续更新详细思路(纯分享) |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|