【MATLAB第8期】源码分享#基于贝叶斯Bayes算法优化 ...

七彩极 · 发表于 2022-10-7 07:41

clc; clear; close all;%% -------------- 1.初始化变量 ------ ----------opt.Delays = 1:30;%数据滞后30%opt.dataPreprocessMode为数据预处理，&#39;None&#39;代表无处理，&#39;Data Standardization&#39;代表标准化处理，%&#39;Data Normalization&#39;代表归一化处理opt.dataPreprocessMode  = &#39;Data Standardization&#39;; %三种数据处理方式 &#39;None&#39; &#39;Data Standardization&#39; &#39;Data Normalization&#39;opt.learningMethod    = &#39;LSTM&#39;;%选择LSTM作为训练模型opt.trPercentage       = 0.80; % 将数据划分为测试和训练数据集，0.8代表训练集比例                %----2.通用深度学习参数（LSTM和CNN通用参数）  opt.maxEpochs    = 50; %400                % 深度学习算法中最大训练次数。opt.miniBatchSize = 32;                      % 深度学习算法中的样本最小批处理数量大小。opt.executionEnvironment = &#39;cpu&#39;;             % 运行环境 &#39;cpu&#39; &#39;gpu&#39; &#39;auto&#39;opt.LR                = &#39;adam&#39;;             %LSTM学习函数 &#39;sgdm&#39; &#39;rmsprop&#39; &#39;adam&#39;opt.trainingProgress    = &#39;none&#39;;    %是否运行训练图 &#39;training-progress&#39; &#39;none&#39;% ------------- 3.BILSTM参数opt.isUseBiLSTMLayer  = true;                % 如果为true，则为双向 LSTM，如果为false，则转为单向LSTMopt.isUseDropoutLayer = true;                   % dropout 层避免过拟合opt.DropoutValue    = 0.5;                      % dropout 层概率为0.5% ------------ 4.优化参数opt.optimVars = [ optimizableVariable(&#39;NumOfLayer&#39;,[1 4],&#39;Type&#39;,&#39;integer&#39;) %优化LSTM隐含层层数(1-4) ，层数数据类型为整数 optimizableVariable(&#39;NumOfUnits&#39;,[50 200],&#39;Type&#39;,&#39;integer&#39;)%优化LSTM隐含层神经元(50-200) ，数据类型为整数 optimizableVariable(&#39;isUseBiLSTMLayer&#39;,[1 2],&#39;Type&#39;,&#39;integer&#39;)%优化LSTM结构，1代表LSTM，2代表Bilstm，，数据类型为整数 optimizableVariable(&#39;InitialLearnRate&#39;,[1e-2 1],&#39;Transform&#39;,&#39;log&#39;)%优化LSTM初始学习率(0.01-1) ，数据类型为浮点型 optimizableVariable(&#39;L2Regularization&#39;,[1e-10 1e-2],&#39;Transform&#39;,&#39;log&#39;)];%优化LSTM正则化L2系数(1e-10-1e-2) ，数据类型为浮点型opt.isUseOptimizer       = true;%是否选择贝叶斯优化 opt.MaxOptimizationTime = 14*20;%优化运行的最大时间14*60*60opt.MaxItrationNumber    = 10;%优化运行的最大迭代次数60opt.isDispOptimizationLog  = true;%是否展示优化过程日志opt.isSaveOptimizedValue    = false;       % 是否将所有优化输出保存在 mat 文件中opt.isSaveBestOptimizedValue = true;       %  是否将最佳优化输出保存为 mat 文件%----------------------------------------分割线--------------------------------------------------------

运行完以上代码，可生成opt结构数据

PS:导入的数据必须是一列数据！！
代码获取链接请关注本人后私聊，有偿，介意者忽略！

%----------------------------------------分割线--------------------------------------------------------
%% --------------- 5.加载数据
data = loadData(opt); %导入数据，案例数据为一列数据，A2:A145共 144个数据。
if ~data.isDataRead  %表示如果数据已经被打开了，那么不会重复导入数据
return;
end

运行代码得出界面

原始数据序列图

标准化预处理

其中CompleteData为完整数据table格式，包含你的excel数据的表头，即seriesdataHeder中的&#39;International&#39;，seriesdata为时间序列数据，x为seriesdata数据预处理后的数据。
loadData.m
%% ---------------------------- 加载数据调用函数 ---------------------------
function data = loadData(opt)
[chosenfile,chosendirectory] = uigetfile({&#39;*.xlsx&#39;;&#39;*.csv&#39;},...%uigetfile函数如果打开了文件，则返回1，如果取消，则返回0
&#39;Select Excel time series Data sets&#39;,&#39;data.xlsx&#39;);% 选择数据，chosenfile为文件名，chosendirectory为文件所在文件夹路径
filePath = [chosendirectory chosenfile];%filePath为该文件的路径
if filePath ~= 0 % 表示如果数据被打开
data.DataFileName = chosenfile;%创建data结构数据，包含文件名
data.CompleteData = readtable(filePath);%创建data结构数据，包含文件路径
if size(data.CompleteData,2)>1  %判断是否是一列数据
      warning(&#39;输入数据应该是一个excel文件且只有一列!&#39;);
      disp(&#39;Operation Failed... &#39;); pause(.9);
      disp(&#39;Reloading data. &#39;);    pause(.9);
      data.x = [];% x数据空白
      data.isDataRead = false;%数据不可阅读
      return;
end
data.seriesdataHeder = data.CompleteData.Properties.VariableNames(1,:);%创建data结构数据，包含数据表头标题
data.seriesdata = table2array(data.CompleteData(:,:));%%创建data结构数据，包含mat格式的序列数据
disp(&#39;Input data successfully read.&#39;);%输出输入数据成功读取
data.isDataRead = true;%数据读取成功
data.seriesdata = PreInput(data.seriesdata);%PreInput调用函数，表示如果数据是cell形式，会将cell转化为数值形式

figure(&#39;Name&#39;,&#39;InputData&#39;,&#39;NumberTitle&#39;,&#39;off&#39;);%绘图，时间序列数据绘图，且标题包含均值和标准值结果
plot(data.seriesdata); grid minor;
title({[&#39;Mean = &#39; num2str(mean(data.seriesdata)) &#39;, STD = &#39; num2str(std(data.seriesdata)) ];});
if strcmpi(opt.dataPreprocessMode,&#39;None&#39;) %判断数据处理形式，此处为无预处理
      data.x = data.seriesdata;
elseif strcmpi(opt.dataPreprocessMode,&#39;Data Normalization&#39;) %判断数据处理形式，此处为归一化预处理
      data.x = DataNormalization(data.seriesdata);
      figure(&#39;Name&#39;,&#39;NormilizedInputData&#39;,&#39;NumberTitle&#39;,&#39;off&#39;);
      plot(data.x); grid minor;
      title({[&#39;Mean = &#39; num2str(mean(data.x)) &#39;, STD = &#39; num2str(std(data.x)) ];});
elseif strcmpi(opt.dataPreprocessMode,&#39;Data Standardization&#39;) %判断数据处理形式，此处为标准化预处理
      data.x = DataStandardization(data.seriesdata);
      figure(&#39;Name&#39;,&#39;NormilizedInputData&#39;,&#39;NumberTitle&#39;,&#39;off&#39;);
      plot(data.x); grid minor;
      title({[&#39;Mean = &#39; num2str(mean(data.x)) &#39;, STD = &#39; num2str(std(data.x)) ];});
end

else
warning([&#39;为了训练网络,请加载数据。&#39; ... %此处表示数据没有读取，会进行相关提示。
      &#39;输入数据应该是一个excel文件且只有一个列!&#39;]);
disp(&#39;操作取消.&#39;);
data.isDataRead = false;
end
end%% --------------- 6.数据样本处理 [opt,data] = PrepareData(opt,data);
%代码运行后，会得到样本数据处理结果，前30个数据预测后1个数据，输入特征为30，输出特征为1，且训练：测试=8:2

data = 包含以下字段的 struct:
DataFileName: &#39;InternationalAirlinePassengers.xlsx&#39;
CompleteData: [144×1 table]
seriesdataHeder: {&#39;International&#39;}
seriesdata: [144×1 double]
isDataRead: 1
x: [144×1 double]
X: [30×114 double]
Y: [1×114 double]
XTr: {91×1 cell} %样本训练集输入
YTr: [91×1 double]%样本训练集输出
XTs: {23×1 cell} %样本测试集输入
YTs: [23×1 double]%样本测试集输出
XVl: {23×1 cell}
YVl: [23×1 double]

X为样本输入，Y为样本输出。

PrepareData.m
% --------------- 数据准备 ---
function [opt,data] = PrepareData(opt,data)
% 数据滞后构建时间序列数据
data = CreateTimeSeriesData(opt,data); %根据滑动窗口数值即滞后数，将一列数据，转化为样本输入和样本输出

%将数据划分为测试和训练数据
data = dataPartitioning(opt,data); %建立训练集、测试集样本

% LSTM数据形式
data = LSTMInput(data);%数据类型处理，如输入数据为cell形式，每个cell单元格包含训练样本数量的30*1个数据
end

%% --------------- 7.使用贝叶斯优化找到最佳 LSTM 参数
[opt,data] = OptimizeLSTM(opt,data);

10次迭代中，误差最小对应的LSTM结构及参数

运行过程__________________________________________________________
优化完成。
达到 MaxObjectiveEvaluations 10。
函数计算总次数: 10
总历时: 82.0708 秒。
总目标函数计算时间: 65.0795
观测到的最佳可行点:
NumOfLayer NumOfUnits isUseBiLSTMLayer InitialLearnRate L2Regularization
__________ __________ ________________ __________________ ____________________
2 65 1 0.0165185146872761 1.73848840686278e-05
观测到的目标函数值 = 0.092506
估计的目标函数值 = 0.094029
函数计算时间 = 3.2681
估计的最佳可行点(根据模型):
NumOfLayer NumOfUnits isUseBiLSTMLayer InitialLearnRate L2Regularization
__________ __________ ________________ __________________ ____________________
2 65 1 0.0165185146872761 1.73848840686278e-05
估计的目标函数值 = 0.094029
估计的函数计算时间 = 4.1336

% - - - - -贝叶斯优化运行Hyperparameters LSTM网络参数
function [opt,data] = OptimizeLSTM(opt,data)
if opt.isDispOptimizationLog %如果展示过程运行日志，则isLog为2，不展示则为0
isLog = 2;
else
isLog = 0;
end
if opt.isUseOptimizer%如果运用贝叶斯优化
opt.ObjFcn  = ObjFcn(opt,data);%目标函数构建（目标函数较为复杂，包含预设几层LSTM结构，是否是Bilstm结构等，不过多介绍）
BayesObject = bayesopt(opt.ObjFcn,opt.optimVars, ...
      &#39;MaxTime&#39;,opt.MaxOptimizationTime, ... %运行最长时间
      &#39;IsObjectiveDeterministic&#39;,false, ...%目标动态变化
      &#39;MaxObjectiveEvaluations&#39;,opt.MaxItrationNumber,...%最大迭代次数
      &#39;Verbose&#39;,isLog,...%运行日志
      &#39;UseParallel&#39;,false);%并行运算
end
endObjFcn.m部分关键代码
% --------------- 训练网络
try
data.BiLSTM.Net = trainNetwork(data.XTr,data.YTr,opt.layers,opt.opts); %如果网络建立没问题，则运行成功
disp(&#39;LSTM Netwwork successfully trained.&#39;);
data.IsNetTrainSuccess =true;
catch me
disp(&#39;Error on Training LSTM Network&#39;);
data.IsNetTrainSuccess = false;
return;
end
close(findall(groot,&#39;Tag&#39;,&#39;NNET_CNN_TRAININGPLOT_UIFIGURE&#39;))

predict(data.BiLSTM.Net,data.XVl,&#39;MiniBatchSize&#39;,opt.miniBatchSize);%将建立好的网络结构，输入验证数据，进行预测
valError = mse(predict(data.BiLSTM.Net,data.XVl,&#39;MiniBatchSize&#39;,opt.miniBatchSize)-data.YVl);
%误差为预测测试集输出数据与实际测试集输出数据的均方根误差

Net  = data.BiLSTM.Net;
Opts = opt.opts;

fieldName = [&#39;ValidationError&#39; strrep(num2str(valError),&#39;.&#39;,&#39;_&#39;)];%每次迭代会将对应的结构和参数进行保存为mat格式，并以误差数值进行命名
if ismember(&#39;OptimizedParams&#39;,evalin(&#39;base&#39;,&#39;who&#39;))
OptimizedParams =  evalin(&#39;base&#39;, &#39;OptimizedParams&#39;);
OptimizedParams.(fieldName).Net  = Net;
OptimizedParams.(fieldName).Opts = Opts;
assignin(&#39;base&#39;,&#39;OptimizedParams&#39;,OptimizedParams);
else
OptimizedParams.(fieldName).Net  = Net;
OptimizedParams.(fieldName).Opts = Opts;
assignin(&#39;base&#39;,&#39;OptimizedParams&#39;,OptimizedParams);
end

fileName = num2str(valError) + &#34;.mat&#34;;
if opt.isSaveOptimizedValue
save(fileName,&#39;Net&#39;,&#39;valError&#39;,&#39;Opts&#39;)
end
cons = [];

end
%% --------------- 8.评估结果
[opt,data] = EvaluationData(opt,data);

R2训练集拟合效果

训练集拟合误差

训练集拟合误差直方图

训练集线性拟合效果

测试集预测结果

测试集误差

测试集误差直方图

测试集线性拟合效果

总数据拟合效果

总数据拟合误差

总数据误差直方图

总数据线性拟合效果

		自动登录	找回密码
密码			立即注册

【MATLAB第8期】源码分享#基于贝叶斯Bayes算法优化 ...

本帖子中包含更多资源