找回密码
 立即注册
查看: 424|回复: 0

2022数学建模国赛

[复制链接]
发表于 2022-9-1 18:15 | 显示全部楼层 |阅读模式
本文从国赛题目分析、模型、算法、书籍、软件使用、论文写作、排版全面介绍数学建模。本文字数18000+,文章较长,建议先看目录,点击目录条目可以快速跳转,让大家对数学建模国赛、美赛及其他建模比赛中取得更好的成绩。
本文所有资料的下载地址见文末。
2022数学建模国赛各题分析

A题分析

A题大方向:微分方程、机理分析、动力系统、参数拟合、数据矫正、非线性优化、误差分析、精度分析
国赛前主要看这几个方面的论文

  • 热问题(热传递,热扩散,热对流)
  • 航海物理问题,流体问题
  • 环境方面问题(污染扩散问题)
  • 航空航天问题(卫星运行,航天器着陆,导弹问题)
  • 几何问题
比赛前可以多看看matlab官方网站里面提供的案例,文档和代码写得很详细,可以作为学习和参考
B题分析

根据往年经验,国赛B题题型变幻莫测,介于A题和C题之间。可能是微分方程题目,主要考察机理建模能力比如2019B 题“同心协力”策略研究;可能是图论题目,主要考察算法编程能力,比如2020B 题穿越沙漠;也可能是数据分析题,比如2021B 题乙醇偶合制备C4烯烃,当然这道题不是机器学习,而是传统的多元统计分析。因此,做B题需要对以上题型有全面的了解。
C题分析

国赛C题不同于美赛,美赛数据题有时候是纯数据题,而国赛不是,国赛C题一定有机理分析和规划问题在里面,因此不可强行套用机器学习和神经网络算法,一定得结合问题,不然就变成算法比赛而不是编程比赛了,第一步就把你pass。
比如2019年国赛C题: 机场的出租车问题,这就是一道典型的机理分析题目,你得首先理清出租车的停车、费用等的逻辑,也就是分析出租车相关机理,再去收集相关数据。再比如2020和2021国赛C题,这两题都是评价+规划的结合。对于评价问题,千万不要做评价算法公式的堆砌,比如topsis评价方法,很多人直接把这个topsis方法公式一堆,烂大街了已经。(遗传算法也是)。不是说不能用,一定要注意结合问题。
常见模型算法汇总

快速预览:


优化模型

性规划,半定规划、几何规划、非线性规划整数规划多目标规划(分层序列法)最优控制(结合微分方程组)、变分法、动态规划,存贮论、代理模型、响应面分析法、列生成算法。二分法、直接搜索法、变范围搜索、单因素优选法0.618 法(黄金分割法)、拉格朗日乘子法、信赖域算法,欧拉法\改进欧拉法,牛顿-拉弗森算法(牛顿迭代法)、拟牛顿法、梯度下降法
预测模型

微分方程,小波分析,回归分析灰色预测马尔可夫预测时间序列分析(AR MA ARMA ARIMA,LSTM神经网络),支持向量机,神经网络预测(与机器学习部分很多重合)
动态模型

微分方程模型(ODE、SDE、DDE、DAE、PDE),差分方程模型,元胞自动机排队论蒙特卡罗随机模拟
图论模型

最短路径,最小生成树,最小费用最大流,指派问题,旅行商问题,网络流,路径规划算法(Dijkstra,Floyd,A*,D*,RRT*,LPA*,D*lite)
评价模型

层次分析法,熵权法,最优赋权法,主成分分析法,主成分回归评价,因子分析,模糊综合评价,TOPSIS法,数据包络分析,秩和比法,灰色综合评价法,
最小二乘主客观一致赋权评价模型,BP神经网络综合评价法
统计分析模型

分布检验,均值T检验,方差分析,协方差分析,相关分析,卡方检验,秩和检验,回归分析,Logistic回归,聚类分析判别分析关联分析(Apriori算法)
现代智能算法

(求极值,多目标规划,TSP,车间调度等)模拟退火遗传算法粒子群算法,禁忌搜索、免疫算法,鱼群算法,神经网络,蚁群算法
机器学习


  • 分类问题:KNN,逻辑回归,决策树,随机森林, ADABOOST、GBDT\XGBoost\LightGBM,支持向量机,朴素贝叶斯,神经网络
  • 回归问题:线性回归, LASSO回归,岭回归,决策树回归,集成学习中回归方法,支持向量回归,高斯混合模型,神经网络
  • 聚类问题:K均值聚类, DBSCAN聚类,EM算法
其他:
图像处理(计算机视觉)、深度学习。分治法,贪心法,其他想到再补充。
各种评价方法的适用条件



关于微分方程求解(求解微分方程模型(ODE、SDE、DDE、DAE、PDE))
偏微分PDE(可以参考《数学建模算法与程序》(又称为算法大全,900多页的那本))
其实matlab已经可以解决大部分问题了,其他方程的解法,ODE(普通微分方程),DDE(延时微分方程)资料很多,我就不列举了
关于机器学习算法的选择:大部分课程里面教的决策树模型比如CART、ID3等,这类模型工业界几乎不用,树模型用的最多的是GBDT、XGBoost和LightGBM。GBDT金融科技领域用的多,LightGBM目前销量预测领域用的多。
数学建模书籍


  • 传统建模方面1.《数学模型》姜启源/谢金星; 2.《数学建模算法与应用》司守奎; 3.《Matlab在数学建模中的应用》卓金武 。这三本就够了,其中数学模型》姜启源/谢金星作为入门,《数学建模算法与应用》司守奎一定要细看
  • 对于美赛,看以下两本足够:4.《美国大学生数学建模竞赛题解析与研究》王杰;5.《正确写作美国大学生数字建模竞赛论文》王杰
  • 智能算法方面,可以看:6《Matlab智能算法30个案例》史峰
  • 网络规划方面,可以看:7.《复杂网络算法与应用》司守奎
  • 机器学习与数据挖掘方面(对于数据题,国赛C题,美赛C题D题),可以看:8.《统计学习方法》李航;9.《机器学习西瓜书》;深度学习方面,作为入门,可以看:10.《动手学深度学习Pytorch版》
  • 进阶:可以多看应用案例,比如和机械、环境、车辆方面结合的案例,比如11.《视觉SLAM十四讲:从理论到实践 by 高翔》;12.《无人驾驶车辆模型预测控制》;13.《MATLAB数值分析方法在电气工程中的应用》等等
  • latex学习推荐刘海洋老师的《LaTeX入门》
常用软件汇总

我们经常看到一些同学在群里问这个软件安装包有没有,那个软件怎么下载怎么安装。网络这么发达,需要学会使用搜索引擎。所以这里还是提一下如何下载安装软件
软件下载及安装


  • 第一步:微信搜索“XX软件下载/安装”,切换到文章栏目,有很多文章教程。常见的软件都有,如果没有,执行第2步
  • 第二步:在特定网站搜索
  • 第3步:百度/谷歌,进行全面搜索
编程相关


  • MATLAB(物理建模)、python(数据分析)、R、其他(SPSS、Stata、Origin)
  • 这里其实还有一个Lingo软件,不过我不推荐,有更好的替代方案,就是Yalmip工具箱+OPTI工具箱+gurobi求解器,Yalmip是基于matlab的求解规划问题的高级建模语言,OPTI提供众多开源的规划求解器,包括非线性求解器ipopt等,gurobi是当今世界上最优秀最快速的线性规划/二次规划求解器。以上搭配拥有更人性化的编程语言+更便捷的建模过程+更快的求解速度。上面的这个组合是matlab平台的,python平台有gurobipy或者cvxpy等等
  • pycharm的数据科学模式可以分段运行py文件,表格化查看中间变量,就像MATLAB一样,比jupyter(ipynb)更高效。
绘图相关

excel(简单绘图)、PPT(流程图)、visio(流程图、示意图等)、AxGlyph(物理示意图、受力分析图、流程图等)、Xmind(思维导图)
排版相关


  • word、latex(我主要用这个)、
  • typora+picgo(markdown语言,记笔记很方便,写好大纲再用latex写,picgo搭配gitee用来作图床),平时的报告也可以用typora写,github上有LaTeX风格的主题,自动编号等,支持导出word、pdf,十分高效
LaTeX相关


  • TeXLive(软件包)、Texstudio(IDE)、
  • excel2latex插件(导出latex表格,必装)、
  • XL toolbox(导出高清excel图片)
公式相关


  • Axmath(强烈推荐)
  • mathpix(公式OCR识别)
参考文献相关

Zetero+众多的插件,文献管理工具,配合插件等可以自动批量下载知网、谷歌学术等几百个数据库的文献,自动根据doi从scihub抓取文献,可以一键导出bib参考文献,方便LaTeX插入引文,也可以在Word里面进行参考文献的管理。
插件推荐

  • Jasminum(茉莉花):中文文献自动重命名,知网直接下载PDF并添加书签目录
  • Zutilo:一个为Zotero增加了各种实用宏的工具箱
  • ZotFile:Zotero的高级PDF管理
  • Zotero PDF Translate:PDF翻译Zotero内置的PDF阅读器
  • Mdnotes for Zotero:导出Zotero项目和笔记到markdown
PDF、Word、PPT、Excel相关


  • PDF:ABBYY(最强PDF OCR识别工具、pdf转word和excel)、Adobe acrobat
  • word:office tab(像浏览器一样的标签页,适用于word\excel\ppt)
  • PPT:Islide(很多图标等工具)
  • Excel:excel2latex、XL toolbox,作用上文已经提到
网站汇总


  • Github:找开源的数学建模代码等;
  • 百度网盘搜索引擎大力盘:搜索百度网盘丰富的资源,不管是软件还是书籍等,我平时找电子书或者大软件都在上面找;
  • Zlibrary:全球最大书籍网站,我经常在上面找书,很方便;
  • 最后,最最最重要的网站,就是谷歌搜索,学会使用谷歌是解决很多问题的关键;
浏览器插件


  • Adblock Plus 广告屏蔽
  • Autopagerize 自动翻页
  • Chrono下载管理器
  • History Button 历史记录
  • IDM Integration Module IDM下载
  • Last Tab 防止关闭最后一个标签页chrome也关闭
  • Octotree github文件树
  • Simpleextmanager 插件管理器
  • The Great Suspender Original 暂时冻结不用的标签页,节省内存
  • ublacklist 屏蔽垃圾网站
  • ublock Origin 屏蔽广告
  • Zotero Connector 搭配zetero软件自动下载文献
  • 暴力猴/油猴:用脚本达到开挂的效果
以上插件可以直接在商店安装,也可以在扩展迷、极简插件等网站下载
其他必备软件


  • IDM(高速下载工具)、
  • 百度网盘高速下载工具、
  • snipaste(截图贴图工具,防遮挡)、
  • 天若OCR(截图OCR识别工具)、
  • 有道词典、copytranslater(翻译工具)、
  • QTTabbar(资源管理器标签页)
其他提高效率的工具

everything(文件搜索工具)、quicker(快捷启动工具)、quicklook(空格预览文件工具)、memreduct(内存自动清理工具)、TrafficMonitor(在任务栏显示网速)
典型问题的求解方法

优化问题

优化问题是国赛和美赛中最重要也是最常见的问题,基本上大部分模型都可以建成优化模型,所以,优化问题需要重点关注
分析过去5年的国赛A题,第一问几乎都是参数优化问题,一般会给附件数据,我们把它抽象出来,也就是需要先建立一个模型,通过附件数据拟合模型中的未定参数。
什么是参数优化?举个例子,对于模型y=f(x)=ax+b,附件中会给定x和y的值。当然,模型y=ax+b不会告诉你,这是自己建立的模型。建立了模型之后,通过数据去拟合,求解参数a和b
怎么求a和b,这就是关于算法的问题。对于y=ax+b这样简单的模型,拟合本质上是优化,我们可以使用各种成熟的优化算法,如:单步长(变步长)搜索法、二分搜索法、黄金分割搜索法、最小二乘法、遗传粒子群模拟退火算法
以下是2021国赛训练做的2020国赛A题炉温曲线的第一问的参数拟合求解(需要论文及对应的latex源文件见上文(我收集的资料)一节):


如何判别是否是优化问题


  • 凡事关于最小最大相关或者尽量相关的词汇,一般都是优化问题。收益最大,风险最小,尽量对称,尽量小,尽量大等等
  • 另外还有一种最后趋于稳定的问题,一般也是优化问题,例如2019A高压油管压力控制,油压最后稳定在100,优化目标是最后一秒的油压曲线与100的偏差最小
优化问题的组成部分

注意优化问题特别是微分方程问题,一般由5个主要部分构成,它们分别是:

  • 优化变量(自变量)
  • 优化目标(单目标、多目标)(因变量)
  • 控制方程(微分方程模型主体及其他附属方程)
  • 边界条件
  • 初始条件
在论文写作时,我们需要做的是把优化目标、控制方程、约束条件等用数学语言表达出来。需要注意:应该明确写出上面5个部分,如果某些部分没有,应该至少写出优化目标和控制方程
以我们2021国赛暑期训练为例,我们做的是2020国赛A题炉温曲线,各位可以自行阅读题目,此处不赘述题目
模型的建立部分

在写作时,明确写出以xx为优化变量、以xx为控制方程(约束条件)、以xx为优化目标的单目标(多目标)优化模型




上面写完了模型的引入,下面开始写模型的公式:
其中优化变量和优化目标可以写一起,举例如下。其中排第一位的是优化变量的估计,表示求解出来的值只是全局最优的估计;argmin(argmax)下标优化变量,表示使得后面的优化目标方程最小时的优化变量的精确值;最后是优化目标方程


上面的是单目标的写法,对于多目标优化,写法也一样,如下:


下面开始写控制方程以及约束,注意有下面两点。
第一点、使用大括号把控制方程和约束条件、边界条件写一起。
第二点、后面需要有变量符号的解释(其中,a为:,b为:...)
为什么要这么写?原因是这样评委一看就知道所有的东西


当然,你也可以将上面5个部分分开写,我2022美赛A题就是这样写的,如下,也就是每个部分写个小标题并加粗:
第一、决策变量(优化变量))


第二、目标方程(优化目标)


第三、控制方程


第四、约束条件




第五、初始条件



模型的求解部分

上面建立完了模型,我们就开始写模型的求解,这部分就是算法了
对于一个优化问题,如何选择算法?当然算法不是乱选的,你得体现你的思考与创新
比如对于一个参数搜索问题,变步长搜索就比单步长搜索要好,为什么?因为变步长搜索在趋于最优解的时候缩小步长,能够减少运算次数,这就是它的优点。
再进一步,二分搜索法比变步长搜索法更好。你用二分,别人用穷举搜索,你的算法就比别人的更优秀。
注意,不是越复杂的算法就越好,而是使用简单的算法在最短的时间内解决问题才是最优的算法。
下面是一些常见优化问题的求解算法
参数拟合或者参数标定问题

利用最小二乘法,优化目标是误差最小,拟合函数一般是复杂的常微分方程(2019A)或者偏微分方程(2020A,2018A),例如2020A题需要拟合带10个未知参数的偏微分方程,这时候就需要用遗传算法等智能算法了
求复杂函数的最小\最大值\零点

这里的函数可不是简单的函数,一般题目中出现的就是微分方程等黑箱函数

  • 求解常微分方程的方法有欧拉法,改进欧拉法,龙格库塔法,算法最好自己写,尽量不调库
  • 求解偏微分方程一般是有限差分法,也最好自己写算法
  • 求解最大最小值一般,先用变范围搜索的方法大致搜索一遍,然后:
  • 对于单调函数,用二分法
  • 对太复杂的,一般用智能算法
对于上面提到的2020国赛A题论文以及配套的latex模板,各位想下载可以见上文我收集的资料一节。
论文写作方法

论文标题

欣赏历年国一作品标题如下:
2020年国赛优秀论文的标题

  • l 基于一维热传导方程的回焊炉炉温模型
  • l 基于一维热传导方程的炉温曲线机理模型研究
  • l 基于动态规划、统计分析、静态博弈的穿越沙漠游戏策略设计
  • l “穿越沙漠”游戏下玩家的最优策略模型
  • l 基于梯度下降的决策树算法与非线性规划的信贷风险评估与信贷策略模型
  • l 针对中小微企业最优信贷决策研究
  • l 接触式轮廓仪的自动标注数学模型研究
  • l 基于接触式轮廓仪测量数据的工件形状自动标注方法
  • l 校园供水系统智能管理
2019年国赛优秀论文的标题

  • l 基于数值模拟的高压油管压力控制模型
  • l 同心鼓“同心协力”策略探究
  • l 基于系统模拟的机场出租车决策与安排模型
  • l 空气质量数据的校准
  • l 基于数据挖掘对“薄利多销”进行分析
参考往年优秀论文,论文的标题一般采用下面两种形式:

  • 基于所使用的主要模型或者方法作为标题(推荐)
  • 直接使用赛题所给的题目或者要研究的问题作为标题
基于利润最大化的奥运商业网点分布微观经济模型(04)
基于回归分析的长江水质预测与控制(05)
基于Leslie模型的中国人口预测及模特卡罗仿真(07)
基于蒙特卡洛模拟的眼科病床安排排队模型(09)
基于0-1规划的交巡警平台设置与调度模型(11)
基于自适应模拟退火遗传算法的月球软着陆轨道优化(14)
基于聚类分析的双目标优化定价模型(17)
基于非稳态导热的高温作业专用服装设计(18)
基于RFMS 指标的大型百货商场会员画像数据挖掘(18)
对论文题目的要求是:简短精炼、高度概括、准确得体、恰如其分。既要准确表达论文内容,恰当反映所研究的范围和深度;又要尽可能概括、精炼,力求题目的字数少。论文题目的字数一般不要超过20个字。
不过,当希望题目字数少与恰当反映论文内容两者发生矛盾时,宁可多用几个字也要力求表达准确。
摘要(超级重要!!!)

什么是摘要:摘要是对论文内容的一份简短陈述,不能超过一页。
摘要的作用:使读者或评委在不阅读论文全文的情况下就能获得必要的信息。
摘要需要包含的三要素:解决了什么问题;应用了什么方法;得到了什么结果。
摘要书写的特点:摘要需充分概括论文内容,文字必须十分简练,书写时应注意突出论文的新见解、新方法和特色,陈述要客观,不能带有主观性。
摘要的重要性:摘要是数模论文写作中最重要的一部分,因为评阅老师的时间有限(每篇15分钟),拿到一篇论文后不会完整的从头读到尾,所以评阅老师往往会重点阅读摘要部分,并结合官方的评阅要点来对你的论文进行初步评定。因此,大家一定要好好打磨论文的摘要,摘要一般是其他部分都完成后再来书写,写完后需要反复阅读反复修改。


摘要的开头段

开头段:需要充分概括论文内容,一般两到三句话即可,长度控制在三至五行。第一句话可以简单交代下题目的背景(可选);第二句话交代你们所做的事情(必须);第三句话可以说下解决这个问题的实际意义(少部分有)。(重要性:第二句话> 第一句话> 第三句话)
例(19b)“同心鼓”游戏是一项团队协作能力拓展项目,队员通过拉绳使鼓抬高,达到使球在鼓面上跳动的目的。本文通过建立三维物理模型,利用数学物理方法,分析了“同心鼓”游戏中的物理过程。该问题的研究能为游戏参与者提供指导性意见,帮助参与者取得更好成绩。
摘要的中间段

中间段:需要对每个问题分别进行叙述,一般需要包含下面三要素:解决了什么问题;应用了什么方法;得到了什么结果。
(1)解决了什么问题?
有三种方式提出:
直接用一句话概括题目要我们求解的问题。(较少见到)
不单独提出我们要解决的是什么问题,因为在后面的两个要素中也会提到。(最常见到)
可以指出题目中问我们的是什么类型的问题,例如常见的有:预测类、评价类、规划优化类(极少见到)
例1 (20c) :针对问题一,主要解决两个问题:一是需要量化各企业的信贷风险,二是需要给出银行的最优信贷决策。(方式一)
例2 (20b):针对问题二,本文利用马尔可夫链,建立马尔可夫链天气预测模型,根据第一关的天气转换情况预测其余关卡的天气情况,再根据问题一的模型得出在不同天气状况下的最佳决策。(方式二)
例3 (20a):针对问题二,在大温区温度已知、制程界限给定的前提下确定元件最大过炉速度,实质上是非线性约束条件下的单目标单变量规划求解问题。(方式三)
(2)应用了什么方法?
这里写出你对于这个问题的求解思路,并说明你应用的模型。这里写作时一定要紧扣题目本身,不能脱离题目本身来描述模型。
例1 (19e) :针对问题三,根据问题一和问题二对商场每的销售额和利润率与打折力度,利用迭代加权最小二乘法,建立了打折力度为自变量、销售额利润率为因变量的线性回归模型。
例2 (19c) :针对上车点的设置问题,需要我们合理安排上车点数量,使得机场乘车效率最高。于是,我们以乘车效率为优化目标,安全因素为约束条件,上车点数量为决策变量,建立单目标优化模型。其中,我们通过合理制定机场出租车乘车区运行规则,利用计算机模拟的方法,计算得到各方案对应的乘车效率。
例3 (18c) :针对问题二,本题选用K-均值聚类法,以消费金额和消费次数作为衡量会员购买力的特征数据,运用SPSS 软件对提取好的数据(见附录2)对会员进行聚类,K 值以公式(1)进行确定
(3)得到了什么结果?
在介绍完使用的建模方法后,一定要加上通过这个方法或者模型得到的结果。一般有下面两种情况:
(i) 需要计算出数值答案,例如物理题、规划优化类、预测类直接回答该答案即可。(如果模型中有重要参数时,我们可以做灵敏度分析;如果涉及概率统计,可以考虑加上置信区间;如果是预测类或者数值计算类,可以考虑加上误差分析)
(ii) 开放的问题,例如评价类、提建议类、设计方案策略类对于较为开放的问题,我们在摘要中只需要写出主要的结论,在下结论时一定要有明确支持的观点,不要模棱两可。如果有数值描述的结果更好,例如:采取某种建议或者方案后提高了多少、降低了多少。此外,有时候问题的完整答案很长,这时候只需要在摘要中说出最主要的一部分结果,然后加一句话来引导读者在正文或者附录中查看完整的结果。
例1 (20a) :利用模拟退火算法迭代20000次进行求解,得到的最优方案为184.2181°C(小温区1~5)、189.8133°C(小温区6)、227.5226°C(小温区7)、264.0700°C(小温区8~9),传送带过炉速度为90.0982cm/min.
例2 (20b) :使用Matlab和C++编程求解,最终得到:在最佳策略下,第一关、第二关的剩余资金分别为10470、12730元,并将相应结果填入了Result.xlsx文件;随后,我们对该模型进行了灵敏度分析。
例3(20c):最终获得基于新冠肺炎突发事件下的信贷调整政策,并将其与第二问的结果进行对比,文章发现新冠疫情的爆发导致银行的信贷策略更加倾向于高新技术产业,这可能和此类产业在疫情间的快速发展有关。
例4(16b):求解得到小区开放后,周边一级主路的通行力得分提高了为11.32%,二级主路的通行力得分提高了为12.89%,三级主路的通行力得分提高了为0.26%。调整指标之间的直接影响矩阵,发现道路通行力对各指标间相互影响关系的强弱变化比较敏感。
摘要的结尾段(可选)

结尾段:可以总结下全文,也可以介绍下你的论文的亮点,也可以对类似的问题进行适当的推广。(如果写不出来的话可以不写,我统计发现只有30%的优秀论文有最后这段)
例1 (19d):文中所建立的模型简便易行,便于推广,可利用国控点的数据对近邻自建点的数据进行校准。
例2 (18b) :本文的亮点在于:首先,利用一般化的公式对系统调度进行了较为细致的机理分析,使得模型具有普适性;其次,给出了多个调度原则相互比较,从而有利于结果更优;最后,将蒙特卡洛模拟与机器学习的思想相结合,对上述调度原则的有效性进行验证,增强了模型的说服力。
例3 (20c) :最后,本文对模型进行了优、缺点评价与模型推广,得出该模型还可以向银行面对的其他对象和生活的其它方面进行推广的结论。
例4 (20b) :综上所述,本文依据各题所给的条件较全面地分析了相关因素对玩家决策的影响,并给出了不同条件下玩家的最佳策略,实现了在终点的最大收益。经过分析验证,本文的模型具有合理性和一定的现实意义。
摘要中常见的废话

避免空洞、一定要紧密结合题目本身论述


关键词

关键词一般放4-6个,可以放论文中使用的主要模型,也可以放论文里面出现次数较多,能体现论文的主要内容的词。
2020国赛ABC三题优秀论文的关键词:
A147 热传导方程、牛顿冷却定律、差分法、优化模型、爬山算法、A*算法
A195 一维热传导方程、Genetic Algorithm、多变量非线性规划、分层序列法
A212 传热模型、炉温曲线、多重搜索算法、模拟退火算法、多目标优化
B078 最优化模型、贪心法、回溯法、决策模型、蒙特卡洛方法、博弈论
B108 动态规划、统计分析、随机模拟、静态博弈
B125 动态规划、马尔可夫链、人工势能场、博弈论
B175 动态规划、多阶段决策模型、马尔可夫决策过程、马尔可夫预测、博弈思想
C109 信贷风险评估、梯度下降法改进的决策树模型、非线性规划、集成学习
C142 信贷策略、主成分分析、BP神经网络、遗传算法、突发因素
C170 量化分析、信贷风险、信贷决策、违约金字塔理论、突发事件因子
C227 特征工程、集成学习算法、多目标规划、XGBoost、系统聚类
C305 中小微企业的信贷决策问题、Logistic模型、多目标规划模型、欧氏距离
问题重述

数学建模比赛论文是要我们解决一道给定的问题,所以正文部分一般应从问题重述开始,一般确定选题后就可以开始写这一部分了。这部分的内容是将原问题进行整理,将问题背景和题目分开陈述即可,所以基本没啥难度。本部分的目的是要吸引读者读下去,所以文字不可冗长,内容选择不要过于分散、琐碎,措辞要精练。注意:在写这部分的内容时,绝对不可照抄原题!(论文会查重)应为:在仔细理解了问题的基础上,用自己的语言重新将问题描述一遍。语言需要简明扼要,没有必要像原题一样面面俱到。
问题分析

从实际问题到模型建立是一种从具体到抽象的思维过程,问题分析这一部分就是沟通这一过程的桥梁,因为它反映了建模者对于问题的认识程度如何,也体现了解决问题的雏形,起着承上启下的作用,也很能反应出建模者的综合水平。
这部分的内容应包括:题目中包含的信息和条件,利用信息和条件对题目做整体分析,确定用什么方法建立模型,一般是每个问题单独分析一小节,分析过程要简明扼要, 不需要放结论。
建议在文字说明的同时用图形或图表(例如流程图)列出思维过程,这会使你的思维显得很清晰,让人觉得一目了然。
注意:问题分析这一部分放置的位置比较灵活,可以放在问题重述后面作为单独的一节(见到的频率最高),也可以放在模型假设和符号说明后面作为单独的一节,还可以针对每个问题将其写在模型建立中。
模型假设

模型假设的常见情况
(1)题目明确给出的假设条件
这种情况最为简单,我们只需要把题目中给我们的假设搬过来就行了。例如2020B题第1问中,题目中假设玩家知道每天天气的状况。
(2)排除生活中的小概率事件(例如黑天鹅事件、非正常情况)
例如:
和交通运输相关的问题中,我们可以假设不存在地质灾难、交通事故等;
和经济金融相关的问题中,我们可以假设不存在经济危机、系统风险等;
和生产制造相关的问题中,我们可以假设不存在设备故障、生产事故等。
(3)仅考虑问题中的核心因素,不考虑次要因素的影响
例如:(注意:过于简化的模型会使得你的论文没有优势和亮点)
考虑传染病的传播规律时,可忽略性别、年龄等因素的影响;
考虑交通拥堵状况时,可只考虑机动车,暂不考虑非机动车和行人;
考虑人口预测问题时,可不考虑移民、大规模人口迁移等因素的影响。
(4)使用的模型中要求的假设
例如:
使用博弈论模型时可以假设参与博弈者都是“理性人”;
使用Markov模型时可以假设系统或状态具有无后效性;
使用回归模型时可以假设扰动项服从独立的正态分布。
(5)对模型中的参数形式(或者分布)进行假设
例如:(注意:如果能在论文中用数据验证这些假设更好)
假设人口增长服从阻滞增长模型(Logistic模型);
假设不考虑环境变动时,某鱼群的自然死亡率为常数;
假设产品的寿命(或旅客进机场的时间间隔)服从指数分布;
假设单位时间内排队的人数(或机器出现的故障数)服从泊松分布;
假设生产出来的产品某参数(例如重量、大小)服从 ( ,   ),且各产品独立。
(6)和题目联系很紧密的一些假设,主要是为了简化模型
这类假设与题目以及建立的模型结合的很紧密,需要我们深入挖掘。
2020年A题论文中的例子
A195

  • 仅考虑热传导和热对流对元件焊接区域中心温度的影响;
  • 假设元件在回焊炉中运动过程不影响炉腔内温度分布;
  • 假设各个小温区中心保持恒温,回焊炉达到稳定工作状态后温度分布不再改变;
  • 假设元件为材质处处均匀的带厚度无限大平板,内部不含热源。
A212

  • 假设观测误差、随机误差和连续问题离散化所产生的误差对本题的计算是没有影响的;
  • 在回焊炉中传热方式仅考虑热传导、热对流,假设热辐射对本题结果的计算没有影响;
  • 假设回焊炉温度高于室内温度的区域(即加热区域)的温度能够保持不变,每个温区内的温度均匀分布;
  • 假设在温度变化不大的情况下热时间常数和热空气和电路板间的热对流系数均保持不变。
2020年B题论文中的例子
B108

  • 对于天气不确定情况,各种情况的出现概率固定;在处理天气不确定的策略时,我们认为应当有对于天气概率的一些预期信息。为了简化我们处理为各种情况按固定概率出现。
  • 确定天气下的最优方案包含了随机天气下优秀方案的共性;除了确定的天气情况下我们可以得出确定的最优解外,含有博弈和随机天气的情况均不能得到严格最优解。我们认为单人确定性天气下得到的最优方案包含了方案优化中的特征,据此我们可以通过数据分析提取这些优化策略。
  • 多人游戏时,每个玩家都是理性人;多人游戏中,玩家总希望自己能存活并获得尽可能多的收益。由于玩家在沙漠中行走没有合作机制,因此合作博弈的基本条件不成立,因此所有玩家都进行不合作博弈,即完全为自己的利益考虑。
  • 这是一个纯粹的游戏,不涉及生命伦理问题,即我们可以对游戏者在沙漠中“死亡”的可能性进行分数量化。本模型允许给出对游戏者在沙漠中因缺乏食物而失败的方案,并对此进行量化评分。这对于实际人穿越沙漠问题这样的解应当排除,因为生命无价。
模型假设的两个问题
(1)模型假设的合理性怎么保证?
事实上,很少见到有论文来对模型中假设的合理性进行论证,如果需要论证的话可以考虑下面两个角度:第一:可以引用别人的文献或者资料,这样最有说服力;第二:如果要对模型中的参数形式(或者分布)进行假设,可以在正文中使用实际数据进行绘图或者进行假设检验来支持你的假设。
(2)模型假设设置的太强怎么办?
有同学为了简化问题,往往会给定过强的假设,事实上这样是有一定风险的,模型过于简单会显得你的论文没有深度和亮点。如果你建立的模型比别人考虑的因素更多的话,可以在某种程度上看成一种创新。但大多数时候,我们想考虑的因素或条件也很难进行估算或者考量,这时候你可以在论文后面的模型评价与改进部分加上你的想法,这样可以在一定程度上弥补这个问题。
符号说明

本部分是对模型中使用的重要变量进行说明,一般排版时要放到一张表格中。
注意:第一:不需要把所有变量都放到这个表里面,模型中用到的临时变量可以不放。第二:下文中首次出现这些变量时也要进行解释,不然会降低文章的可读性。这里的表格形式叫做“三线表”,一般在科技论文中被推荐使用


模型的建立

模型建立:模型建立是将原问题抽象成用数学语言的表达式,它一定是在先前的问题分析和模型假设的基础上得来的。因为比赛时间很紧,大多时候我们都是使用别人已经建立好的模型。这部分一定要将题目问的问题和模型紧密结合起来,切忌随意套用模型。我们还可以对已有模型的某一方面进行改进或者优化,或者建立不同的模型解决同一个问题,这样就是论文的创新和亮点。
模型求解:把实际问题归结为一定的数学模型后,就要利用数学模型求解所提出的实际问题了。一般需要借助计算机软件进行求解,例如常用的软件有Matlab,Spss, Lingo, Excel, Stata, Python等。求解完成后,得到的求解结果应该规范准确并且醒目,若求解结果过长,最好编入附录里。(注意:如果使用智能优化算法或者数值计算方法求解的话,需要简要阐明算法的计算步骤
三点要求:

  • 必须要有数学模型:即数学公式组成的一套数学结构、或者是一套数学的解决方案等;
  • 模型要求表达完整,正确和简明;
  • 模型要有实用性,要能求解出来,以能够解决问题为原则。
物理类问题中模型的建立:非常依赖物理知识类似于解高中物理题
优化类问题中模型的建立:目标函数+约束条件
使用别人已经建立好的模型:紧密联系问题,切忌无脑套用






模型的求解

(1)国赛中常出优化类问题,如果你用到了启发式算法求解的话,一定要简要写明算法步骤,并要结合具体的问题来阐明计算的思路。






(2)求解的结果应该在论文中突出的展示出来,有具体答案的问题比较简单,直接放上数值计算结果即可;如果是开放类问题的话,一定要对结果进行阐明和解释,如果能加上美观整洁的图表就更好了。


模型的分析与检验

模型的分析与检验的内容也可以放到模型的建立与求解部分,这里我们单独抽出来进行讲解,因为这部分往往是论文的加分项,很多优秀论文也会单独抽出一节来对这个内容进行讨论。
模型的分析:在建模比赛中模型分析主要有两种,一个是灵敏度(性)分析,另一个是误差分析。灵敏度分析是研究与分析一个系统(或模型)的状态或输出变化对系统参数或周围条件变化的敏感程度的方法。其通用的步骤是:控制其他参数不变的情况下,改变模型中某个重要参数的值,然后观察模型的结果的变化情况。误差分析是指分析模型中的误差来源,或者估算模型中存在的误差,一般用于预测问题或者数值计算类问题。模型的检验:模型检验可以分为两种,一种是使用模型之前应该进行的检验,
例如层次分析法中一致性检验,灰色预测中的准指数规律的检验,这部分内容应该放在模型的建立部分;另一种是使用了模型后对模型的结果进行检验,数模中最常见的是稳定性检验(有的论文也称为稳健型检验或稳健型分析),实际上这里的稳定性检验和前面的灵敏度分析非常类似,等会大家看到例子就明白了。
灵敏度分析的例子


稳定性检验的例子




误差分析的例子


模型的评价、改进与推广

本部分的标题需要根据你的内容进行调整,例如:如果你没有写模型推广的话,就直接把标题写成模型的评价与改进。很多论文也把这部分的内容直接统称为“模型评价”部分,比如下面这篇论文,这也是可以的。
三个部分写什么内容?模型的评价:主要写模型的优缺点;模型的改进:主要是针对模型中缺点有哪些可以改进的地方;模型的推广:将原题的要求进行扩展,进一步讨论模型的实用性和可行性。
其中,优缺点是必须要写的内容,下面两个内容是可选的,但还是建议大家写,实力比较强的建模者可以在这一块充分发挥,这部分对于整个论文的作用在于画龙点睛。


参考文献

所有引用他人或公开资料(包括网上资料)的成果必须按照科技论文的规范列出参考文献,并在正文引用处予以标注。参考文献的表达方式要符合规范。
其中,LaTeX可以用bibtex自动生成参考文献;对于word,我推荐大家安装一个参考文献管理软件,不用使用word自带的文献插入功能。这里推荐zotero以及一些必备插件,可以见【常用软件】一节
参考文献的注意事项:
(1)引用的内容需要在正文中标注出来
(2)不要引用别人的博客
例如,你发现某个博客中介绍了一个模型,你的论文中刚好可以用到,这时候你千万别直接引用它的博客,这样看起来很不规范。最好是找一本介绍了这个模型的书籍或者找一篇相关的论文作为你的参考文献。
(3)能引用前辈们论文里面的内容吗?
不能!美其名曰引用,实则是抄袭别人的论文内容!国赛有自建库,查重查到了后果很严重。大家一定要注意:论文里面引用的内容一定要正式。


附录

论文附录内容应包括支撑材料的文件列表,建模所用到的全部完整、可运行的源程序代码(含EXCEL、SPSS等软件的交互命令)等。如果缺少必要的源程序、程序不能运行或运行结果与论文不符,都可能会被取消评奖资格。如果确实没有用到程序,应在论文附录中明确说明“本论文没有用到程序”。
支撑材料内容包括用于支撑模型、结果、结论的所有必要材料,至少应包含建模所用到的所有可运行源程序、自主查阅使用的数据资料(赛题中提供的原始数据除外)、较大篇幅中间结果的图表等。将所有支撑材料文件使用WinRAR软件压缩在一个文件中(后缀为RAR或ZIP,大小不超过20MB)。支撑材料的文件列表应放入论文附录;如果确实没有需要提供的支撑材料,可以不提供支撑材料文件,并在论文附录中注明“本论文没有支撑材料”。如果支撑材料文件与论文内容不相符,该论文可能会被取消评奖资格。注意竞赛的承诺书和编号专用页不要放在支撑材料中,所有文件中不能有显示参赛者身份和所在学校及赛区的信息。


论文排版

LaTeX和word排版模板(带样式)在上文【我收集的资料】一节
我的个人经验和观点,仅供大家参考:
(1)如果未来要走学术道路,特别是计算机或者数学专业的同学,LaTeX是必不可少的。很多国外的期刊投稿的论文需要用LaTeX排版。
(2)平时喜欢在电脑上做笔记而且有大量公式要编辑的同学也可以学习LaTeX,用熟练的话非常方便。
(3)LaTeX要学好真的很难,一个是安装配置LaTeX的编译环境比较复杂,对于中文的支持也不算友好;另一个就是遇到了错误有时候真的很绝望,相对于Word能找到的资料还是挺少的,最好是有LaTeX大神愿意带你。
(4)对于数学建模比赛而言,大家可以在美赛中尝试使用LaTeX进行排版,国内比赛没有必要。另外,新手使用LaTeX排版都是套用别人的模版,大家可以百度下LaTeX工作室这个网站,上面有很多模版。
欣赏优秀论文的排版

共同特点:
(1)整体结构完整,大多数论文都是使用三级标题式进行布局;
(2)论文正文部分排版紧凑,没有大段空行,内容看上去翔实;
(3)表格整洁,一般使用三线表形式,表格上方有对应的标题;
(4)图形清晰美观,下方有对应的标题,文中要解释图形意义;
(5)公式编辑规范,大部分论文使用公式编辑器,且带有编号。
我这里给一个较为美观的基本排版方案,然后再来制作对应的论文模版:
(1)论文的首页是摘要页,论文标题使用三号黑体,摘要两个字使用四号黑体,关键词两个字使用小四黑体。
(2)论文的正文部分使用小四宋体(中文)和小四Times New Roman字体(西文),行距设置为单倍,首行缩进两个字符。
(3)一级标题使用四号黑体,无缩进居中对齐,段前段后6磅,单倍行距,编号使用“一、二、三、四、”等。
(4)二级标题使用小四黑体,无缩进左对齐,段后6磅,单倍行距,编号使用“1.1 1.2 2.1 2.2 2.3 ”等。
(5)三级标题使用小四黑体,无缩进左对齐,单倍行距,编号使用“3.1.1 3.1.2 5.3.1 5.3.2 ”等。不建议使用三级以上的标题,看起来太长了。
(6)论文中的图片、表格居中对齐,无缩进;表格上方和图片下方的标题使用五号宋体加粗(中文)和五号Times New Roman字体加粗(西文),无缩进,居中对齐。
样式的使用

样式是一种预先定义好的文本或段落格式,包括字体、字号、颜色、对齐方式、缩进等,你可以把样式看成一个排版的模版。一般我们利用样式设置论文的多级标题。
多级列表通常配合样式功能使用。论文中不同级别的标题通常需要进行编号,将多级列表链接到标题样式后,就能够实现标题的自动编号功能。


使用样式的好处

  • 打开导航窗格便于定位和查看文章内容
  • 可以生成自动列表,对于书籍排版或者毕业论文排版很有帮助
  • 将Word导出为PDF文件也可以得到相应的书签,方便读者阅读






三线表

三线表以其形式简洁、功能分明、阅读方便而在科技论文中被推荐使用。三线表一般主要由三条横线构成,从上到下分别称为顶线、栏目线和底线。(注意:表两侧没有竖线)其中顶线和底线为粗线,栏目线为细线。当然,三线表并不一定只有三条线,必要时可加辅助线,
后面我们会看到例子。在表格的上面要写上表格的编号和对应的标题,便于读者理解表格的内容。


对每个表格单独调整为三线表的格式比较费时,我们可以自己制作一个三线表的模版。以后遇到表格后,我们只需要轻轻点一下就能得到三线表的格式。(模板下载见上文【我收集的资料】一节)
图形的制作和排版

图形的排版比较简单,我们先将图片插入到论文中,然后设置无缩进居中对齐,最后在图片的下面写上图片的编号和标题即可。(记住:表上图下,即表的标题在上面,图的标题在下面)
图形的制作相对而言不那么好讲,因为图片的来源有很多种,例如:(1)Matlab、Python等编程软件绘制的图形(2)Excel、SPSS、Origin等数据统计分析工具得到的图形(3)展示模型或算法过程的流程图(4)描述问题分析或建模思路的示意图等等。
PPT保存高清图片

PPT中做好的图片怎么放到Word中呢?
第一步:将PPT中做好的图片组合起来(选中整个图片的所有对象,鼠标右键点击组合即可),让整个图片变成一个整体;
第二步:复制这个整体,到了Word中点击鼠标的右键,然后再粘贴为图片,最后根据你的需要修改下图片的大小和格式。
如果你想在Word中也可以修改这个图片,那么可以使用:插入-形状-新建画布这个功能,然后直接把这个整体粘贴到这个画布上,这时候可能需要修改下字体大小或者缩进,大家可以看视频的演示。建议大家直接粘贴为图片,这样比较省心,如果需要修改的话就直接在PPT上面修改,Word修改起来也没那么方便)
PPT中做好的图片怎么放到LaTeX中呢?
首先我们需要将ppt导出为图片,但是默认的ppt导出的图片的dpi为96,非常不清晰,这时候我们需要修改注册表,将ppt的dpi调高,一般学术论文要求的dpi为300或者600
具体方法如下:
默认情况下,要另存为图片的 PowerPoint 幻灯片的导出分辨率为每英寸 96 点 (dpi)。 若要更改导出分辨率,请执行以下步骤:

  • 退出所有 Windows 程序。
  • 右键单击“开始”,然后选择“运行”。 (在 Windows 7 中,选择“开始”,然后选择“运行”。)
  • 在“打开”框中,键入“regedit”,然后选择“确定”。
  • 根据你使用的 PowerPoint 版本,找到以下注册表子项之一: PowerPoint 2016、PowerPoint 2019、Microsoft 365 专属 PowerPoint HKEY_CURRENT_USER\Software\Microsoft\Office\16.0\PowerPoint\Options PowerPoint 2013 HKEY_CURRENT_USER\Software\Microsoft\Office\15.0\PowerPoint\Options PowerPoint 2010 HKEY_CURRENT_USER\Software\Microsoft\Office\14.0\PowerPoint\Options PowerPoint 2007 HKEY_CURRENT_USER\Software\Microsoft\Office\12.0\PowerPoint\Options PowerPoint 2003 HKEY_CURRENT_USER\Software\Microsoft\Office\11.0\PowerPoint\Options
  • 单击“选项”子项,指向“编辑”菜单上的“新建”,然后选择“DWORD (32 位)值”。
  • 输入“ExportBitmapResolution”,然后按 Enter 键。
  • 确保选中“ExportBitmapResolution”,然后选择“编辑”菜单上的“修改”。
  • 在“编辑 DWORD 值”对话框中选择“十进制”。
  • 在“数值数据”框中,输入分辨率“300”。 或使用下表中的参数。



  • 选择“确定”。
  • 在“文件”菜单上,选择“退出”,退出注册表编辑器。
  • 在 PowerPoint 中,打开幻灯片演示文稿,然后打开要导出的幻灯片。
  • 在“文件”菜单上,选择“另存为”。
  • 在“保存类型”框中,选择一种图片格式
  • 选择 “保存”。 系统将显示以下提示对话框: 选择“仅当前幻灯片”。 幻灯片以新格式和分辨率保存在“保存位置”框中指定的位置。
  • 若要验证幻灯片是否以指定的分辨率保存,请右键单击图片,然后选择“属性”
我整理的资料

无论是建模手还是编程手,或者是写作手,都需要系统学习数学建模,不然无法沟通。按我的理解,数学建模=文献检索+数学模型、算法+MATLAB&python编程+论文写作+word&latex排版,总共5个部分,缺一不可。数学建模要拿到顶尖的奖项,队伍中必须至少有一个熟悉上述全流程的角色存在,担任主持大局的作用。
对于我自己,我是作为全能手,也就是建模编程写作排版都熟悉。无论作为什么角色,都需要一份全面的资料,才能事半功倍。多看看往年竞赛的论文,了解建模和论文的套路。经过2年的数学建模比赛经历,我积累了这样一份全面的数模资料库。下文提到的内容资料库中都有,这些资料中的几百篇论文本人已经全部看完,最终获得了21国赛国二22美赛F,希望大家也能取得好成绩。
资料库下载链接为 资料库下载地址。
文件内容丰富,文件分类清晰,按论文、算法、书籍、模板等分类。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-11-15 02:07 , Processed in 0.069780 second(s), 23 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表