关于预测
我们公司是做图书馆管理系统的,然后现在我自己一个人在做统计分析系统,就是对图书馆管理系统的业务数据进行统计分析。后来老大说XXX统计分析系统这个名字不好,就改了,改成了XXX决策支持系统,就是要在当前统计的数据的基础上对未来数据进行预测,用来辅助决策。
统计的业务数据有很多,这里就说一部分吧,就是关于图书馆每天的借出量、还回量、损坏、丢失等等。
关于预测这方面我也找了一部分资料,比如指数平滑预测,但是这个预测方法不能跨期预测,比如:我以一天为一期,这样我预测明天的数据,就只需要今天的实际业务量和预测业务量,但是如果我要预测后天的,就不行了,因为后天的依赖于明天的实际业务量。好像一些预测算法都是这样的。
有没有比较好的想法,求教育啊...
------解决方案--------------------没有做过相关的系统,不过既然有数据可以依赖而推测,类推一下就可以了
比如可以根据今天的数据预测明天的结果,那么后天的结果就可以用明天的预测结果作为基础来预测
毕竟这只是预测,不可能很准确地反映真实结果,但是作为预测,可以知道个大概方向
所以每天的预测结果可以用前一天的预测作为基础去推测,这样递归一下就可以了
比如
f(n) = f(n-1)*a; //a是个修正系数,
那么f(明天)=f(今天)*修正系数
f(后天)=f(明天)*修正系数
。。。
依次类推
------解决方案--------------------这个命题太大了啊,根本就是数据模型的战争。
我认为首先应该先大范围人工粗略分析数据模型的特征,比如:
◎ 是否存在每周特征?比如都是周一周二还书高峰,周四周五借书高峰?
◎ 是否存在每月特征?比如都是月初还书、月底还书高峰?
◎ 是否存在每年特征?比如是否每年都是春季借书多,秋季还书多?
◎ 春节、端午、国庆?是否放假前都有个借书高峰?放假后还书高峰?
◎ 当然,也许上述特征都不存在;但我觉得一定会有些特征的。
然后再根据特征来选择合适的模型,或者将某几个模型进行组装。
我们经常会用到的是 同比数据 和 环比数据。
同比:也就是用去年同期的数据规则,结合今年的数据量,去预测下一个时间点或时间段的可能情况。
环比:也就是用上个月、或上个季度的数据规则,结合当期的数据量,来进行后续预测。
从我个人的经验来说,同比数据和环比数据的规则,比直接用近期数据做预测,要更有效些。
比如:去年图书损坏率如果是 5%,今天基本上也会是 5% 上下,除非突然火灾或者图书馆搬家啥的(突发事件导致的模型调整)。
------解决方案--------------------
------解决方案--------------------
------解决方案--------------------