服务热线: 13472705338
新闻中心 news center

煤矿智能仓储系统研究与设计

伴随互联网、大数据、人工智能技术的迅猛发展,煤矿智能化相关技术与装备水平也在显著提升。同时,随着煤矿智能化程度...
联系我们 contact us
新闻中心
您当前的位置:首页 > 新闻中心 > 基于粒度计算与模糊规...

基于粒度计算与模糊规则的钢卷仓储吞吐量长期预测

信息来源: 发布时间:2021-12-04 点击数:

0 引言

为了提高钢铁物流的运输效率,避免出现堆积和空置的现象,有必要对钢卷仓储吞吐量进行预测。时间序列是按时间排列、随时间变化且相互关联的数据,因其延续性可以对历史数据进行建模分析,实现对未来数据的预测。目前,吞吐量预测使用较为广泛的方法是时间序列法和神经网络。

文献[1]将模糊信息粒化理论用于提升时序预测框架的效率和精度,为解决模糊性问题提供了一种解决思路。文献[2]通过分析与港口货物吞吐量相关的多种因素,构建多元回归方程,建立ARIMA模型对青岛港未来10年货物吞吐量进行了预测;文献[3]针对港口集装箱吞吐量数据非线性的特点,利用ARIMA模型预测10个月后的吞吐量数据;文献[4]使用经验模态分析(empirical mode decomposition,EMD)算法和SARIMA算法将时间序列分解,结合(support vector regression,SVR)算法对不同的分量进行预测,再将分量相加得到最终的预测值,为吞吐量的预测提供了新的解决思路;文献[5]通过SARIMA和人工精神网络(atificial neural networks,ANNs)模型将港口吞吐量数据分为线性和非线性部分进行预测,通过混合模型实现对吞吐量的预测;文献[6]建立基于时间序列的港口货物吞吐量广义回归神经网络预测模型,实现对港口货物吞吐量的分析和预测,将小波神经网络首次应用于港口集装箱吞吐量预测。

在基于数据的长期预测方面,文献[7]使用径向基函数神经网络进行风速长期预测,并分别分析了其线性和非线性模式;文献[8]中构造了一种结合模糊集、遗传算法和最小二乘支持向量机的混合模型,用于长期商业周期预测。上述文献中的方法多使用以年和季为基本单位的数据,数据量小且简单,规律性强,其计算得到的数据亦为年或季度数据且单点预测容易造成迭代误差,无法为规划提供具体指导。粒度计算和模糊规则的近似推理机制能够很好地解决复杂数据及大量非周期性数据的预测问题,且对数据粒的运算能够减少运算时间及迭代误差的影响[9,10]

针对钢卷吞吐量数据量大、规律性小且受多种因素影响的特点,本文提出基于粒度计算和模糊规则的预测方法。该模型包括时间序列分解、粒度划分及模糊推理三个步骤,通过时序分解模型将原始序列分解并划分数据粒,利用模糊规则预测得到下一数据粒,并不断迭代实现吞吐量的长期预测[11,12]

1 相关理论

1.1 粒度计算

粒度计算主要用于处理不确定的、模糊的、不完整和大量的数据,是对分析解决问题时使用粒度的任何理论、方法、技术的概括性描述[13]。不同于其他方法是以单个数据点为基本单位进行建模分析,粒度计算是以多个数据点组成的数据粒、区间值等粒度元素为基本分析单位,能够有效地减少迭代误差。

对于给定时间序列x={x1,x2,…,xn},可以将其划分为K段长度为L的子序列{D1,D2,…,DK}。通过设置L的大小,可以获得包含不同数据点的数据粒。

Dk(L)={x ((k-1) L+1),x ((k-1) L+2),…,x(k L)},k=1,2,…;Dk(L)为一个数据粒。划分过程如图1所示。

图1 数据粒划分

图1 数据粒划分  下载原图


1.2 时间序列分解模型

时间序列是同一现象在不同时间上的连续观察值排列而成的序列。常用的时间序列分解模型有加法模型和乘法模型[7,14]。时间序列Y可以表示为由Trend,Seasonal和Residual三个因素的函数即:yt=f(Tt,St,Rt)。

设yt是加法模型,则有yt=Tt+St+Rt,其中,yt,Tt,St,Rt分别为时间序列原始值、长期趋势、季节变动和残差。

类似地,乘法模型为:yt=Tt×St×Rt

经典的时间序列分解法假设周期性成分在每个周期内都是相同的,使用移动平均法分离长期趋势。M阶移动平均法公式(m-MA)为

 


式中m=2k+1,为时刻t的移动平均的值为前向k个值和后向k个值的均值。

时间序列加法模型分解算法步骤为:1)运用m阶移动平均法分离长期趋势,得到趋势序列T(t)。若m为偶数,则用2m-MA,若m为奇数,则用m-MA来计算时间序列的趋势成分T(t);2)计算分离趋势后的时间序列D(t)=y(t)-T(t);3)对同一周期的数据取均值获得周期成分,并对周期性成分拓展到D(t)的长度,即得到D(t)的所有周期性成分,记为S(t);4)将时间序列的T(t),S(t)分解出来后,剩余的即为残差成分,即R(t)=Y(t)-T(t)-S(t)。

1.3 模糊规则及推理

相邻时间序列的观测值之间具有依赖性,为了分析数据之间的关系,需要对划分后的数据粒进行聚类分析[15]。本文采用模糊C均值算法进行划分后的数据粒进行聚类,得到最优划分矩阵和聚类中心,从而为长期预测奠定基础。FCM算法为求下式所示的最优化问题

 


式中uij为第j个粒子对i个类的隶属度,1<c<N为分类数。m>1为模糊系数,dij为第j个粒子与第i类聚类中心的距离,取欧氏距离。通过Lagrange乘子法可以解得模糊聚类中心和模糊隶属度的计算公式,如式(4),式(5)所示

 


式中n为单个数据粒长度,Dkj为多个数据点所组成的信息粒。

具体算法迭代过程为:1)给定原始数据,分类数K(1<K<N),模糊系数m(m>1)以及允许误差E(E>0);2)随机初始化聚类中心Vij,并计算隶属度矩阵Uij;3)计算连续2次迭代的目标函数Q,若差值大于预设误差E,则重复计算聚类中心及隶属度矩阵。否则,终止算法,当前的U,V即为最优隶属度矩阵和聚类中心矩阵,根据最大隶属度确定数据所属类别。

模糊推理是根据历史数据的类别情况来决定待预测粒子,即根据前n个历史状态的数据粒可以推出下一个状态的数据粒,即

 


式中Dk-n,Dk-n+1,…,Dk-1为前n个时刻的数据粒,Dk为下一时刻的数据粒。基于上述的逻辑关系,本文考虑三阶模糊逻辑关系,形式为:

Rr:如果Dk-3属于Ck-3,Dk-2属于Ck-2,Dk-1属于Ck-1,则Dk属于Ck

Ck-3,Ck-2,Ck-1,Ck分别为输入和输出数据粒的所属类别。由此,可以在数据集上对每个数据粒建立上述规则,并建立起由N-3条规则形成的模糊规则库。即:

R1:如果Dk-3属于Ci1.1,Dt-2属于Ci1.2,Dk-1属于Ci1.3,则Dk属于Cj1

R2:如果Dk-3属于Ci2.1,Dt-2属于Ci2.2,Dk-1属于Ci2.3,则Dk属于Cj2

 


RN:如果Dk-3属于Ci3.1,Dt-2属于Ci3.2,Dk-1属于Ci3.3,则Dk属于Cj3

根据待预测粒子前:3个状态的数据粒Dk-3,Dk-2和Dk-1的所属类别,在模糊规则库中寻找一致的规则,记录多数规则对应的输出Dk,以Dk所属类别的聚类中心作为待预测数据粒的最终预测结果。模糊推理过程图如图2所示。

图2 模糊推理过程

图2 模糊推理过程  下载原图


2 基于粒度计算和模糊规则的长期预测模型

本文基于粒度计算和模糊规则的近似推理机制,以模糊近似解去代替绝对精确解,规避迭代误差,实现长期预测。初始阶段将处理后的数据使用时间序列分解模型分解为Trend,Seadonal,Residual三个组成部分,以7天的数据作为一个数据粒分别进行粒度划分,并分别进行模糊聚类,建立3个模糊规则库,根据模糊规则得到3个预测值,将三部分的预测值相加作为最终预测值。通过循环迭代实现长期预测并利用测试集进行验证。模型总体结构如图3所示。具体实现步骤如下:

1)数据预处理,将原始数据重采样得到每天的吞吐量数据,将数据分为训练集和测试集;

2)对数据进行平稳性检验后,使用时间序列分解将数据分解为3个组成部分,并进行粒度划分;

3)将得到的数据粒序列进行模糊聚类,分别建立模糊规则库;

4)根据模糊规则进行预测,得到待预测数据粒所属类别,以所属类别的聚类中心作为待预测数据粒的预测值;

5)将三部分预测值相加,得到最终的预测;

6)迭代运算实现长期预测。

图3 建模过程总体框图

图3 建模过程总体框图  下载原图


3 实例验证

3.1 数据预处理

本文采用某钢铁物流园区2014年~2018年的吞吐量数据,忽略节假日和天气等因素的影响。原始数据分布在每天不同的时间段且早期数据缺失严重,若直接进行建模会严重影响对时间序列的分解,需要对数据进行重采样并且删除缺失数据严重的时间段。因此,本文选取2014年6月2日~2018年1月28日的吞吐量数据进行预测,对预处理后的时间序列进行平稳性检验。检验结果如图4(a)所示。自相关系数长期大于零,说明序列间具有长期相关性;其单位根检验统计量对应的p值大于0.05,所以,原始序列为非平稳序列如图4(b)。

图4 原始数据时序与原始序列自相关

图4 原始数据时序与原始序列自相关  下载原图


3.2 时间序列分解与模糊规则

实验将2014年6月2日~2017年12月31日的吞吐量数据进行分解,得到分解后的三部分的数据,对其进行粒度划分及模糊聚类,建立模糊规则。模糊聚类参数设置为:迭代次数MAX_ITER=100,模糊系数m=2。

分别对分解后的数据进行模糊聚类,Trend数据聚类个数为4,Residual数据聚类个数为3,得到每个粒子的所属类别,聚类效果图如图5所示。由上文可得三阶模糊逻辑关系及模糊规则库,根据待预测粒子的前3个数据粒类别及其对应关系即可实现对下一粒子的预测。

图5 原始序列与分解序列

图5 原始序列与分解序列  下载原图


3.3 实验结果及分析

本文采用平均绝对误差(mean-absolute-error)作为模型评价标准,y为实际值,为预测值,N为预测结果的个数,N=1,2,3,…,MAE的值越小,说明预测模型的精确度越高。

以2014年6月9日~2017年12月31日总共1 302个数据作为训练数据对模型进行训练,以2018年1月1日~2018年1月28日共28个数据作为测试数据。验证了模型对钢卷吞吐量长期预测的有效性。利用ARIMA模型对数据进行建模测试,与本文模型进行对比分析表明,本文模型精确度要优于ARIMA模型,且长期吞吐量预测精度衰减速度要优于ARIMA模型,如图6和表1所示。

图6 模型预测值与原始值对比

图6 模型预测值与原始值对比  下载原图


  

表1 建模方法误差对比  下载原图



表1 建模方法误差对比

4 结束语

钢卷吞吐量数据复杂且不具有周期性,使得对数据要求高的经典时间序列预测精度不够,且采用单个数据点迭代预测的方式会使得预测误差不断扩大,仅具有较好的短期预测精度,无法保证长期预测的准确性。基于粒度计算与模糊规则的长期预测模型通过将原始数据划分为数据粒,通过历史数据建立模糊逻辑关系,实现对钢卷吞吐量的预测,降低了对数据的依赖性,规避了单个数据点预测的迭代误差,使得长期预测能够实现。本文对钢卷吞吐量有了较为精确的长期预测,使钢铁物流企业了解未来的吞吐量变化,提前进行库位分配和装备准备,提高了物流效率、降低了运行成本。

上海阳合仓储管理
官方二维码

版权所有©:阳合仓储 公司地址:上海市嘉定区南翔嘉美路428号 联系电话:134-7270-5338 沪公网安备 31011402008347号 沪ICP备14036201号-1