麻雀搜索算法SSA优化BP神经网络回归预测以及MATLAB代码实现

文章目录

麻雀搜索算法SSA优化BP神经网络回归预测以及MATLAB代码实现
1. 麻雀搜索算法SSA原理
- 1.1 算法灵感来源
- 1.2 算法模型描述
2. SSA优化BP神经网络预测算法流程
3. SSA优化BP回归预测的MATLAB实现步骤
4. 运行结果与图像
5. MATLAB代码与数据下载地址

1. 麻雀搜索算法SSA原理

麻雀搜索算法是一种较新的智能优化算法，在2020年提出，主要是受麻雀的觅食行为和反捕食行为的启发。算法具有较高的收敛性能与全局搜索能力。

1.1 算法灵感来源

麻雀种群在觅食过程中分为发现者与加入者两部分，分别负责提供种群觅食的方向以及追随并获取食物。当麻雀种群意识到危险时，则会发生反捕食行为并更新种群位置。

1.2 算法模型描述

关于麻雀搜索算法，建立了六个假设规则，在参考文献中给出，故不作说明。

符号说明

N：最大迭代次数 n：种群大小 PD：发现者数量 SD 感应危险的麻雀数量
ST：安全值 R2：预警值（由随机数产生）

算法实现步骤

步骤一：初始化麻雀种群位置与适应度，N，n，PD，SD，ST参数初值。
步骤二：开始循环，iteration<N
步骤三：种群排序，得出当前的最优麻雀个体位置，以及最佳适应度值。（注意对于第一代麻雀而言，求出的为初始最优。最优个体能够优先获取食物）
步骤四：觅食行为，a). 按以下公式更新发现者位置。

式中，Q为服从正态分布的随机数，L为单位行向量，a为[0 1]之间的随机数。
步骤五：b). 按以下公式更新加入者位置。

式中，Xworst为适应度最低的麻雀位置，A+为只随机包含1与-1两个元素的行向量。
步骤六：反捕食行为，更新麻雀种群的位置。

式中，β是服从正态分布的随机数，作用是控制更新位置的步长。K是[-1,1]之间的随机数，fi是个体适应度值。ε是接近0的常数，避免分母为零的情况。
步骤七：更新历史最优适应度（相当于适应度的公告板更新）。
步骤八：执行步骤三到七，当达到最大迭代次数，结束循环。输出最优个体位置与适应度值。

2. SSA优化BP神经网络预测算法流程

选用麻雀搜索算法SSA优化BP神经网络的初始权重与阈值。选取训练集与测试集整体的均方误差为适应度值。适应度函数值越小，表明训练越准确，且兼顾模型的预测精度更好。

SSA优化BP回归预测流程图设计：

3. SSA优化BP回归预测的MATLAB实现步骤

3.1 数据说明
采用MATLAB官方的建筑物能源数据集为例，建立BP回归预测与麻雀搜索算法SSA优化BP的回归预测模型。

3.2 数据格式

样本编号	features1	features2	features3	…	featuresn	target
1	–	–	–	–	–	–
2	–	–	–	–	–	–
…	–	–	–	–	–	–
n	–	–	–	–	–	–

3.3 读取数据

%% 数据读取
data=xlsread('数据.xlsx','Sheet1','A1:N252'); %%使用xlsread函数读取EXCEL中对应范围的数据即可

%输入输出数据
input=data(:,1:end-1);    %data的第一列-倒数第二列为特征指标
output=data(:,end);  %data的最后面一列为输出的指标值

N=length(output);   %全部样本数目
testNum=15;   %设定测试样本数目
trainNum=N-testNum;    %计算训练样本数目

3.4 确定BP神经网络的拓扑结构
a). 输入层和输出层节点使用size函数直接获取。函数用法：[M,N]=size(A)，M为A的行数，N为A的列数。size(A,2)得到的是第二个参数N，即列数。

inputnum=size(input,2);   %输入层神经元节点个数
outputnum=size(output,2);  %输出层神经元节点个数

b). 隐含层节点的确定过程，使用循环来遍历范围内的隐含层节点与训练误差情况。因为要找最小的误差，所以初始化训练误差时，将MSE设置较大的数字，用于在循环中确定最佳的隐含层节点。

%确定隐含层节点个数
%采用经验公式hiddennum=sqrt(m+n)+a，m为输入层节点个数，n为输出层节点个数，a一般取为1-10之间的整数
MSE=1e+5; %初始化最小误差
for hiddennum=fix(sqrt(inputnum+outputnum))+1:fix(sqrt(inputnum+outputnum))+10

3.5 BP与SSA的参数设置

3.5.1 BP神经网络参数

net=newff(inputn,outputn,hiddennum_best,{
   'tansig','purelin'},'trainlm');% 建立模型

%网络参数配置
net.trainParam.epochs=1000;         % 训练次数，设置为1000次
net.trainParam.lr=0.01;                   % 学习速率，设置为0.01
net.trainParam.goal=0.00001;                    % 训练目标最小误差，设置为0.0001
net.trainParam.show=25;                % 显示频率，设置为每训练25次显示一次
net.trainParam.mc=0.01;                 % 动量因子
net.trainParam.min_grad=1e-6;       % 最小性能梯度
net.trainParam.max_fail=6;               % 最高失败次数

3.5.2 麻雀搜索算法SSA初始参数

popsize=30;   %初始种群规模
maxgen=50;   %最大进化代数
lb=repmat(-3,1,dim);    %自变量下限
ub=repmat(3,1,dim);   %自变量上限
ST = 0.6;%安全值
PD = 0.7;%发现者占种群的比重，其余的为加入者
SD = 0.2;%感应危险的麻雀所占比重

注：关于优化变量元素个数dim的计算，给出代码的计算公式如下。关于计算过程，请参考我的另一篇博客：3.3 节遗传算法优化BP权重和阈值的设计

%自变量个数
dim=inputnum*hiddennum_best+hiddennum_best+hiddennum_best*outputnum+outputnum;

3.5.3 适应度函数公式

数学模型为：

式中，TraingingSet，TestingSet，分别为训练集和测试集的样本。使用麻雀搜索算法优化后，适应度函数值越小，即均方误差MSE越小，表明训练越准确，且模型的预测精度更好。

计算适应度的代码命令：

fitness=(mse(output_train,train_simu)+mse(output_test,test_simu))/2; %适应度函数选取为训练集与测试集整体的均方误差平均值

3.6 优化后的权重与阈值赋给BP

%矩阵重构
net.iw{
   1,1}=reshape(w1,hiddennum_best,inputnum);  %输入层到隐含层的权值矩阵
net.lw{
   2,1}=reshape(w2,outputnum,hiddennum_best);   %隐含层的阈值向量
net.b{
   1}=reshape(B1,hiddennum_best,1);   %隐含层到输出层的权值矩阵
net.b{
   2}=reshape(B2,outputnum,1);   %输出层的阈值向量

3.7 SSA优化后的BP神经网络训练与仿真预测

%% 优化后的神经网络训练
net=train(net,inputn,outputn);%开始训练，其中inputn,outputn分别为输入输出样本

%% 优化后的神经网络测试
an1=sim(net,inputn_test);
test_simu1=mapminmax('reverse',an1,outputps); %把仿真得到的数据还原为原始的数量级