简介:摘要目的分析季节性差分自回归移动平均模型(SARIMA)、广义相加模型(GAM)和长短期记忆神经网络模型(LSTM)在肾综合征出血热(HFRS)发病率拟合及预测中的效果,为优化HFRS预测模型提供参考。方法在公共卫生科学数据中心(https://www.phsciencedata.cn/)收集全国和HFRS发病率居前9位的省份(黑龙江、陕西、吉林、辽宁、山东、河北、江西、浙江和湖南省)2004-2017年HFRS逐月发病率资料,其中,2004-2016年资料作为训练数据,2017年1-12月资料作为测试数据。利用训练数据拟合全国和9个省份HFRS发病率的SARIMA、GAM、LSTM;利用拟合模型预测2017年1-12月HFRS发病率,并与测试数据比较。采用平均绝对百分比误差(MAPE)评价模型拟合及预测精度,MAPE < 20%时模型拟合或预测效果为好,20%~50%为可接受,> 50%为差。结果从总体拟合及预测效果来看,全国和黑龙江、陕西、吉林、辽宁、江西省的最优模型为SARIMA(MAPE分别为19.68%、20.48%、44.25%、19.59%、23.82%、35.29%),其中,全国和吉林省模型拟合及预测效果为好,其余均为可接受;山东、浙江省的最优模型为GAM(MAPE分别为18.29%、21.25%),其中,山东省模型拟合及预测效果为好,浙江省为可接受;河北、湖南省的最优模型为LSTM(MAPE分别为26.52%、22.69%),模型拟合及预测效果均为可接受。从拟合效果来看,GAM在全国数据中拟合精度最高,MAPE =10.44%。从预测效果来看,LSTM在全国数据中预测精度最高,MAPE = 12.23%。结论SARIMA、GAM、LSTM均能作为拟合HFRS发病率的最优模型,但不同地区拟合的最优模型表现出较大差异。今后在建立HFRS预测模型时应尽可能多地纳入备选模型进行筛选,以保证较高的拟合及预测精度。
简介:模型的验证是指对模型的性能指标(区分度、校准度)进行考察的过程。根据考察过程中是否使用预测模型的开发队列数据,模型验证可分为内部验证和外部验证。内部验证是检验模型开发过程的可重复性,常见形式包括随机拆分验证、交叉验证、Bootstrap重抽样以及“内部-外部”交叉验证。外部验证考察的是模型的可移植性和可泛化性,常见形式包括时段验证、空间验证以及领域验证。
简介:资本资产定价模型(CAPM)和套利定价理论(APT)是关于资本市场均衡的两个比较著名的模型。二种模型虽然在解释的角度、基本很设、方法、以及适用范围上均有重大区别,但是殊途同归,它们得出的结论是一致的:期望收益与风险之间存在着正相关的关系。