查看原文
其他

机器学习方法在经济研究中的应用

蒋 锋、张文雅 湖北长江传媒统计与决策学术传播 2023-03-12

原载《统计与决策》2022年第04期

本刊推介

RECOMMENDATIONS




摘  要:机器学习方法在处理复杂数据、构建高精度模型方面具有显著优势,在不同领域的研究中都得到了广泛应用。数字经济时代为经济领域带来海量数据的同时,也对经济研究提出诸多挑战。机器学习方法能充分挖掘数据中的非线性、非平稳信息,有效提高经济分析结果的精度。机器学习与经济问题的融合改变了传统经济学的研究范式。文章对近年来机器学习方法在经济研究中的应用进行回顾,从通货膨胀、汇率与货币、GDP、劳动力市场、社会稳定、政策评价等角度进行总结,比较了常用机器学习方法的优缺点,并展示了模型的评价准则,如均方根误差、F1-得分、AUC值等。


关键词:机器学习;神经网络;支持向量机;朴素贝叶斯;集成学习

中图分类号:C81;F011

文献标识码:


0 引    言


数字化时代的到来意味着数据将在人类生活中扮演重要角色,大规模、高纬度、结构复杂是大数据的三个典型特征[1]。20 世纪发展起来的机器学习方法能够从大量复杂数据中提取有效信息,并通过不断学习以实现最优模型的构建,因此在高维数据建模、图像和声音处理、模式识别以及复杂分类问题的解决方面得到了广泛应用。在经济领域的研究中,经济数据挖掘、经济指标分析与经济政策评估等是大家关注的重点,传统计量模型通常在多个假设前提下对经济变量之间的线性关系作出说明,提取出的信息往往较少。因此,将机器学习方法应用到经济研究领域能够极大提升分析问题的准确度,进而为政策制定者提供更有效的参考。因此,本文对近年来机器学习方法应用在经济研究中的文献进行梳理,比较几种经典的常用机器学习方法的优缺点,并展示了评估模型的指标,以期为其他学者开展相关研究提供参考。


机器学习方法分类


机器学习任务主要可以分为监督学习、无监督学习、半监督学习和强化学习四种。在监督学习中,数学模型是由包含输入值的一组数据创建的,并且需要关于输出值应该是什么的基本事实或先验信息,常见的监督学习有分类和回归两种。相反,在无监督学习中,数据仅包含输入值,不需要对输出值进行标记。这类算法旨在推断数据的底层结构或分布,即使用聚类算法或关联规则算法识别特征之间的关系[2]


1.1 监督学习


监督学习是对给定的一组数据点集,学习一个分类器或回归器,主要包括学习和预测两个过程。其中,分类是根据先验信息对数据进行类别划分,目标变量为样本所属类别,包括二分类和多分类问题,可以用于文档分类、垃圾邮件过滤、欺诈检测、风险识别等,常用的方法有K近邻、朴素贝叶斯、随机森林、支持向量机、神经网络等[3]。当输入和输出变量为连续值时,可构建逻辑回归、支持向量回归、神经网络等模型。


1.2 无监督学习


无监督学习[3]是从无标注数据中学习的机器学习方法,主要包括聚类、异常值检测、降维等。其中,聚类是最常用的无监督机器学习方法之一。聚类分析将具有相同特征或属性的数据划分到同一组中,不同组的数据之间存在较大差异。数据的相似性由距离函数进行度量。


1.3 半监督学习


半监督学习[4]研究计算机如何在有标注和无标注数据的情况下学习,主要包括半监督分类以及有约束聚类。前者是对监督学习中分类问题的扩展,所处理的数据中未标注数据较多,通过对该部分数据的训练来提升模型性能。后者是对无监督学习中聚类方法的扩展,目的是实现更准确的分类。


1.4 强化学习


在强化学习[3]中,机器会与环境产生互动,即机器产生动作状态的行为会影响环境状态,而这些影响又会反作用于机器使其受到奖励或惩罚。强化学习主要应用于智能控制领域,同样可以用于分类或概率估计。在强化学习中,机器不断试错以找到最优策略。


在经济研究中的主要应用


2.1 文献检索


本文旨在对近年来机器学习方法在经济研究中的应用进行整理总结,结合机器学习理论关键词和相应的研究方向,进行文献检索。外文文献主要来自WOS(Web of Science)数据库,中文文献主要从CNKI(中国知网)检索得到,设置论文发表时间为1999—2021 年。根据经济学十大原理[5],经济研究从微观上看,主要研究个体如何决策,以及不同个体决策后的相互影响作用,从宏观上看,主要研究整体经济如何运行。因此,结合已有文献,本文确定经济研究关键词为“经济”“预测”“货币”“汇率” “GDP”“因果推断”“政策评价” “社会”“劳动力”等。机器学习方法关键词主要包括“机器学习”“监督学习”“非监督学习”“聚类”“支持向量机”“K 近邻”“决策树”“随机森林” “朴素贝叶斯”“感知机”“神经网络”“极限学习机”等,实际检索时将上述关键词进行随机组合。


按上述规则检索并筛选后共得到67篇文章,分为“通货膨胀、货币与汇率”“GDP”“劳动力市场”“社会稳定”“政策评价”五类,且每个类别对应的文献数量见表1。可以看到,在检索得到的文献中,关于通货膨胀、货币与汇率的研究论文最多,在劳动力市场的研究方面使用机器学习方法的论文最少。表2给出了本文用到的模型名称缩写。




2.2 机器学习的应用


2.2.1 机器学习在通货膨胀、货币与汇率研究中的应用


通货膨胀描述了一种物价上涨、货币贬值的状态,主要归因于微观和宏观经济因素的变动[6],是央行颁布政策的重要依据之一。通货膨胀会对国家的经济稳定产生影响,因此定期对通货膨胀情况进行预测具有十分重要的意义。我国学者在对通货膨胀进行研究时多使用菲利普斯曲线、VAR、动态模型平均、混频抽样等方法,并结合经济变量进行影响因素分析或预测[7—9]。且经济变量多为时间序列数据,传统时间序列模型如ARIMA等也被广泛应用于CPI预测[10]。由于机器学习方法在刻画变量间的非线性关系方面的表现优于传统计量模型,因此近年来不少学者开始使用神经网络、决策树等模型对通货膨胀率进行预测。陈彦斌等(2021)[11]发现LSTM模型的预测效果明显优于BVAR模型。


同样地,Aiken(1999)[12]、Moshiri 和 Cameron(2000)[13]、Choudhary和Haider(2012)[14]、Thakur等(2016)[15]在分析美国、加拿大、印度等地区的通货膨胀率时,也发现神经网络模型的预测精度明显优于其他模型。这是因为神经网络模型更关注非线性关系和学习过程,可以快速找到复杂问题的解,且不需要满足线性假设,在对经济大数据或复杂变量进行预测时能很好地提高精度。Medeiros等(2019)[16]则指出,使用 LASSO 进行变量选择后的随机森林模型在预测美国通货膨胀时的表现要优于传统随机游走模型和自回归模型。SVR和ELM在通货膨胀预测方面也表现良好,Sermpinis等(2014)[17]构建遗传算法-支持向量机模型预测美国的通货膨胀及失业率情况,该混合模型在变量选择、参数优化及预测方面的表现均优于 RW、ARMA、MACD 等传统模型;Alfiyatin 等(2019)[18]则使用粒子群优化来解决ELM在确定初始权重上的缺点,进一步将混合模型应用于预测印度尼西亚的通货膨胀率,最终得到的误差值小于0.05。


货币政策对宏观经济的调控而言至关重要,2020 年上半年央行多次降息降准以确保市场平稳运行。文本分析方法在对货币政策的研究方面发挥了重要作用,王熙和郑梦园(2021)[19]利用文本挖掘技术构造货币政策语调指数,探究宏观经济的变动。战明华等(2018)[20]则利用基于优化的支持向量回归算法对货币、信贷和产出之间的关系进行研究,通过比较预测效果,发现信贷对产出的预测效果优于货币。当市场波动较大时,公众对避险货币的关注会增加[21]。发明于2008年的比特币旨在解决基于信任的交易模式的固有弱点,现已成为一种资产或类似商品的产品,在世界各地多个市场进行交易,具有一定的避险性能[22]。比特币占加密货币市值的48%以上,目前是加密货币市场的领导者。在已有的文献中,对比特币及其他加密货币进行预测主要考虑使用三种类型的数据:历史价格、经济变量、技术变量。价格预测主要分为方向预测和具体数值预测。在预测方法的选择方面,传统模型主要包括ARIMA、GARCH、Logistic 回归等[23,24],机器学习模型主要有 KNN、LightGBM、支持向量机、决策树、随机森林、人工神经网络、朴素贝叶斯等[23—27]。考虑到加密货币交易具有投机性质,因此使用鲁棒性更强的机器学习模型来刻画市场短期波动性效果更好。


许多经济学家认为外贸能为扩大一国潜在消费水平提供机会,对外开放程度的增加使得对外贸易对国内经济稳定和增长的影响加深[28]。货币汇率受供求关系影响不断变化,而汇率预测在经济金融和管理决策过程中扮演着重要角色,因此在宏观经济条件不确定的情况下,长期汇率预测对政策制定和决策都至关重要[29]。对汇率进行预测用到的方法有传统统计模型、机器学习模型以及混合模型等,使用的数据频率包括日、周、月度、季度,预测分为方向预测以及数值预测。在检索到的有关汇率预测的文章中,美元与其他货币之间的汇率研究占比94%,这与美国在全球贸易中占重要地位有关。传统统计模型如 ARIMA、GARCH等的汇率预测表现不如机器学习模型[22,26,30,31],神经网络模型在汇率预测中的应用同样广泛且模型精度较高[28,30—32],考虑除汇率历史数据外的经济因素和技术因素等的模型预测效果更好[22],利用推特数据进行情感分析、基于经济新闻事件进行文本分析等方法能够显著提高模型精度[28,33]。Sun 等(2020)[26]使用基于聚类的非线性集成学习模型去预测汇率,Das等(2020)[34]利用Jaya优化技术构建 ELM-Jaya 预测模型,Chen 等(2021)[22]、Waheeb 和Ghazali(2019)[35]与Jubert等(2018)[36]在机器学习模型的基础上加入遗传算法进行优化,所构建的混合模型预测效果更优。


2.2.2 机器学习在GDP研究中的应用


在所有的宏观经济变量中,国内生产总值(GDP)是最重要的指标之一,它反映了一国经济发展的整体状况。GDP数据的发布需要经过复杂的计算,从基本数据获取到最终数据发布存在一定延迟,这对政策制定者而言非常不利[37]。因此,如何利用已有信息对未来经济发展做出准确预测也是各界学者研究的重点。GDP的测度主要分为季度和年度数据预测,属于低频数据。通常对低频数据进行分析采用的都是线性模型,所需要估计的参数不多,不需要大量观测数据,但经济时间序列存在一定的非线性特征,传统线性模型忽略了该部分影响,使得最终预测结果准确度不高。Yoon(2021)[37]利用GDP季度数据,构建了梯度提升模型和随机森林模型对领先两个季度的年度增长情况做出预测,并结合交叉验证和超参数调整来提升模型的精度。同样使用随机森林、决策树模型进行经济预测的还有 Soybilgen 和Yazgan(2021)[38]、Gawthorpe(2021)[6]。支持向量机和神经网络模型在经济预测方面的应用也比较广泛,Jena 等(2021)[39]在COVID-19疫情的背景下,使用多层人工神经网络模型对美国、墨西哥、德国等8个国家的季度GDP进行预测;Jahn(2020)[40]构造人工神经网络模型对24个工业化经济体的GDP增长率进行分析;Su和Shang(2013)[41]提出一种基于小波核的原始双支持向量机算法对安徽省的经济指标进行预测;杨炘和陈展辉(2002)[42]利 用BP神经网络模型对中国外债规模进行了仿真实验;Karanikic等(2017)[43]则在对欧盟28个国家的GDP增长率进行分析时发现,极限学习机模型的精度高于ANN和遗传规划模型(GP);李佳等(2020)[44]为提高预测精度,构建独立循环神经网络模型进行 GDP 预测,发现模型预测效果优于 SVR、BP 神经网络以及 ARIMA 等,且多变量预测也会在一定程度上提升模型性能。


迁移学习对存在缺失的 GDP 预测表现良好,2019 年Kumar和Muhuri提出一种基于迁移学习的预测方法[45],利用二氧化碳排放数据对战乱国家的人均GDP数据进行预测,实验结果优于广义回归神经网络、极限学习机和支持向量回归结果;2021年Kumar等再次提出多元无监督迁移学习方法[46],扩大原始数据集,并使用孤立森林算法对异常值进行检测和消除,以建立一个稳健的GDP预测模型。


了解经济活动的未来动向对政策制定者而言十分关键,因为从政策颁布到效果显现往往存在一定滞后,如果可以提前预测经济衰退情况,则有利于政府部门及时提出应对措施,稳定经济。Kiani(2011)[47]利用人工神经网络模型对独立国家联合体选定成员的经济衰退进行预测,在模型中纳入了国债利率、长期债券利率、货币供应量和GDP增长率等宏观经济变量,并使用遗传算法进行参数优化,最终得到可提前1~10个季度预测衰退的变量。Gogas等 (2015)[48]则构建SVM模型研究了收益率曲线对美国经济衰退的影响,模型精度要高于标准Logit和Probit模型。


2.2.3 机器学习在劳动力市场研究中的应用


失业率在衡量一国发展状况方面发挥着重要作用,过高的失业率会对社会稳定、经济发展等产生负面影响。西班牙的失业率在欧盟排名第二,因此 Luna-Romera 等 (2019)[49]使用 K-means 和具有平均链接的层次聚类两种聚类分析方法对西班牙的劳动力市场进行匹配分析,从地理和职业两方面了解经济危机时期与经济复苏时期劳动力的就业选择。K-means算法中的集群数k是通过内部和外部验证指数来确定的;层次聚类中的集群数k则经过了两个阶段的选择。研究发现,经济危机使西班牙的劳动力市场发生变动,流动性增强的同时仍存在稳定集群。西班牙劳动力市场存在分割,存在同质的工人群体,因此能够通 过 聚 类 分 析 来 研 究 劳 动 力 市 场 变 化 。徐 正 丽 等(2021)[50]利用网络爬虫技术以及 K-means 等方法对人工智能岗位的需求进行分析,将招聘网站上的文字信息量化处理,用需求矩阵表示出不同岗位的技能要求,直观展示出劳动力市场对人才的需求情况。


劳动生产率通常指生产出最终产品所需要的工时与计划工时的比值,是对资源利用效率的度量。劳动生产率的变化对经济有着重大影响,但对劳动生产率进行影响因素分析仍存在一定挑战,如何从众多可能因素中选择出有实际影响的因素,并利用有限数据建模分析是关键问题。相较于传统统计模型,神经网络模型能很好地描述输入变量与输出变量之间的复杂非线性关系,因此Golnaraghi 等 (2019)[51]考虑天气、全体工作人员和实际项目三个方面因素,构建多种神经网络模型对加拿大蒙特利尔市的建筑项目进行了生产率预测,并对不同影响因素的重要性进行排名。所选择的GRNN、BNN、RBFNN和自适应神经模糊推理系统(ANFIS)的效果均优于传统统计模型,并且BNN表现最好。


2.2.4 机器学习在社会稳定研究中的应用


家庭经济状况主要表现为家庭总收入和家庭金融管理[52],当每月支出超过家庭总收入时,家庭福祉会受到影响。Othman 等(2020)[52]构建机器学习模型对马来西亚的家庭超支情况进行了研究,在选择的五种机器学习算法中,决策树表现最好,结果表明可以从收入、所在州、所属种族、家庭成员数量等方面改善家庭超支情况,进而提升马来西亚家庭幸福指数。


Hong等(2018)[53]在对纽约市无家可归人口进行分析时,构建Logistic模型对一个无家可归者家庭退出后重新进入收容所系统或成为长期逗留者的可能性进行预测,找出影响预测结果的主要因素,并使用K-means聚类对该群体进行类别划分,这一研究为纽约市政府和非营利组织的管理工作提供了参考。许诺和唐锡晋(2020)[54]利用条件随机场模型挖掘百度热搜新闻词中的潜在信息,对社会风险事件进行标注,有助于相关部门及时进行干预,保证社会稳定。


大数据时代,各个行业在日常运营过程中都会产生大量数据,因此可以通过大数据技术对行业问题进行分析,挖掘数据中的潜在信息。建筑业在国民经济增长中占据重要地位,保障住房是稳定社会民生的关键,Mu 等 (2014)[55]使用公开数据集对波士顿郊区房价进行分析,构 建 SVM、最小二乘支持向量机(LSSVM)和偏最小二乘(PLS)回归模型对房价进行预测,结果显示机器学习模型能够很好地处理非线性问题,快速找到最优解并实现最佳预测。


2.2.5 机器学习在政策评价研究中的应用


对政策效果进行评价需要将政策实施前后的发展情况进行对比,学者通常会构建计量模型进行效应评估,但机器学习方法同样可以应用于政策评价。在基于偏好的分类中,朴素贝叶斯是常用的方法之一,在模型输入很少的情况下也能得到优于其他方法的鲁棒结果,并且能很好地描述输入属性和划分类别之间的非线性关系。Polyzos等(2020)[56]研究了英国脱欧在英国和欧盟的幸福成本,使用朴素贝叶斯分类器提取个体的幸福偏好,并利用多层前馈神经网络得到每个家庭的动态幸福函数,进一步将结果应用于模拟系统以量化分析英国脱欧的福利成本。实验表明,英国脱欧对英国和欧盟社会幸福感的长期影响更为显著,弱势群体受到的影响会更大。英国宣布脱离欧盟的时间还较短,运用机器学习方法能够充分利用当前已有信息,对事件可能导致的结果做出预判,为政策制定者提供参考,也能让民众意识到自身选择会对今后产生的影响。高华川和白仲林(2019)[57]运用时变LASSO方法分析英国“脱欧公投”对英镑汇率的因果效应,将英国作为接受政策干预的处理组,将日本、加拿大等21个国家或地区作为对照组,得到时变权重系数,通过比较英镑与合成英镑的美元汇率得到脱欧公投对英镑汇率的政策效果。该方法估计的准确性相较于传统反事实估计提高了20%~30%。


Solea 等(2018)[58]将无监督和监督机器学习方法应用于新兴经济体的分析,对下一个可能出现的新兴国家做出预测。先使用线性主成分分析和非线性主成分分析方法对不同国家进行类别划分,然后运用核切片逆回归算法对新兴经济体进行预测,结果与高盛发布的基本重合。该研究表明机器学习方法在预测全球经济发展趋势方面表现良好,可以作为经济学家和决策分析者提前获取信息的有用工具。利用监督学习方法进行文本分析可以对政策效果进行量化。


在对因果效应的识别方面,常用的方法有双重差分法、合成控制法、匹配法、断点回归等[59—61],Wager和Athey(2018)[62]将机器学习方法引入因果推断领域,使用非参数因果森林估计异质性效应影响,在模拟实验中的表现良好,未来可以将理论进一步推广至实证研究。


方法对比和模型评价准则


3.1 机器学习方法的优缺点


在对经济问题进行分析时,根据研究对象和目的的不同,往往需要选择不同的机器学习方法,表3给出了常见的8种机器学习方法优缺点的对比。SVM、K近邻、决策树、随机森林、朴素贝叶斯、感知机、XGBoost 和神经网络都可用于分类问题,其中,SVM、随机森林和神经网络模型的预测精度较高,决策树和感知机的预测精度一般。SVM通过寻找一个超平面来实现对样本的分割,但并不能很好地处理多分类问题;K近邻和随机森林可以进行多分类,但都存在效率低的问题。决策树和朴素贝叶斯都使用简单、容易实现,但前者存在过拟合风险,后者对输入数据的表达形式敏感。在对经济指标的预测中,随机森林和神经网络往往可以取得更好的结果,但两者内部运行都属于“黑箱”,无法人为控制,因此模型的可解释性一般。XGBoost可以学习多个分类器,在训练速度、模型精度和防止过拟合方面都表现良好,但会占用较多内存。在无监督学习中,聚类是最常用的方法之一,在样本具有显著类别特征时效果很好,但K-means聚类的结果依赖初始聚类中心的选择。SVM、K近邻、决策树和神经网络也可用于回归预测。由于不同机器学习方法的内在原理不同,因此各自都有不同的优缺点,在实际分析中,可以根据研究对象与目的选择最合适的模型。



机器学习方法能够很好地提高模型预测性能,在大量训练之后得到最优模型,但由于中间计算过程属于“黑 箱”,无法对变量之间的关系进行直观描述,因此模型的可解释性较弱,即在对汇率进行预测时,能够得到精度较高的预测效果,但无法解释纳入模型的各因素对汇率的具体影响程度。同时,在训练数据不足的情况下,机器学习模型很容易出现过拟合的情况,所得模型的泛化能力较差,此时可以考虑数据扩增或方法集成。


3.2 机器学习模型的评价


在对模型预测效果的评价方面,不同学者选取的评价指标存在差异,主要有 MSE、RMSE、MAPE、R2、AUC 值和精度等,具体含义及计算公式如表4所示。



其中,yt 代表真实值,ŷt 代表预测值,yˉt 表示数据均值,(xi,yi) 表示点坐标。DA指标主要用于评价预测序列未来变化方向,取值越大越好。PICP和PINAW是进行区间预测时会用到的评价指标,前者越大说明预测区间包含的实际值越多,而后者越小说明模型预测的精度越高,因此需要平衡两个指标。除此之外,在对预测模型进行比较时,还会用到PT检验和DM检验[63]、MSC(模型可信集)检验[22,31]、 t检验[27]等,以判断不同模型的预测性能是否存在差异。


不同模型针对不同数据的预测效果也存在差异,因此在实证分析中,需要通过比较相关指标的取值来选择最优模型。比如,Pabuccu 等(2020)[27]在预测比特币价格波动时,对比了SVM、ANN、NB、RF模型的预测效果,使用连续数据的模型对比如表5所示,可以看到,随机森林模型在预测误差和准确度方面都表现更好。Chen等(2020)[24]则对比了 LR、LDA、分位数回归(QDA)、SVM、RF、XGB 和LSTM 在预测比特币日交易价格方面的表现,结果如表 6所示,根据四个评价指标值可以发现,LSTM模型的精度明显高于其他模型。



结束语


机器学习方法可以刻画数据的非线性特征,突破了传统线性模型的局限,因此往往能够得到预测精度较高的模型。目前,机器学习方法在经济领域的应用更多体现在处理不同类型数据、变量选择、预测经济变量等方面,也可以用于完成政策效应评估中的反事实估计。在处理非平稳和非线性时间序列时,机器学习模型的表现优于传统统计模型,预测性能也优于RW[63]。同时,无监督学习方法如聚类,有助于从无序数据中找出集群和规律。文本处理技术则为经济指标构建、政策信息分析等提供了新思路。

参考文献:


[1] Fang B, Zhang P. Big Data in Finance [M].New York: Springer,2016.

[2] 周志华.机器学习[M].北京:清华大学出版社,2016.

[3] 李航.统计学习方法[M].北京:清华大学出版社,2012.

[4] Sugiyama M. Introduction to Statistical Machine Learning [M].San Francisco: Morgan Kaufmann,2015.

[5][美]曼昆.经济学原理[M].梁小民,梁砾,译.北京:北京大学出版社,2015.

[6]Gawthorpe K. Random Forest as a Model for Czech Forecasting [J].Prague Economic Papers,2021,30(3).

[7]郑挺国,王霞,苏娜.通货膨胀实时预测及菲利普斯曲线的适用性[J].经济研究,2012,47(3).

[8]张明玖,潘辉.中国通货膨胀、货币供应与经济增长关系[J].统计与决策,2020,(17).

[9]冀胜锋,张迪.模型比较视角下的产出缺口与通货膨胀关系研究[J].统计与决策,2021,(6).

[10]郭晓峰.基于ARIMA模型的中国CPI走势预测分析[J].统计与决策,2012,(11).

[11]陈彦斌,刘玲君,陈小亮.中国通货膨胀率预测——基于LSTM模型与BVAR模型的对比分析[J].财经问题研究,2021,(6).

[12]Aiken M. Using a Neural Network to Forecast Inflation [J].Industrial Management & Data Systems,1999,(99).

[13]Moshiri S, Cameron N. Neural Network Versus Econometric Models in Forecasting Inflation [J].Journal of Forecasting,2000,19(3).

[14]Choudhary M A, Haider A. Neural Network Models for Inflation Forecasting: An Appraisal [J].Applied Economics,2012,44(20).

[15]Thakur G S M, Bhattacharyya R, Mondal S S. Artificial Neural Network Based Model for Forecasting of Inflation in India [J].Fuzzy Information and Engineering,2016,8(1).

[16]Medeiros M C, Vasconcelos G F R, Veiga Á, et al. Forecasting Inflation in a Data-rich Environment: The Benefits of Machine Learning Methods [J].Journal of Business & Economic Statistics,2019,39(1).

[17]Sermpinis G, Stasinakis C, Theofilatos K, et al. Inflation and Unemployment Forecasting With Genetic Support Vector Regression [J].Journal of Forecasting,2014,33(6).

[18]Alfiyatin A N, Rizki A M, Mahmudy W F, et al. Extreme Learning Machine and Particle Swarm Optimization for Inflation Forecasting [J].International Journal of Advanced Computer Science and Applications,2019,10(4).

[19]王熙,郑梦圆.中国货币政策冲击的信息效应与“价格之谜”——基于文本分析的研究[J].山东大学学报(哲学社会科学版),2021, (5).

[20]战明华,刘志媛,许月丽,等.货币与信贷:谁更精确地预测了产出?——基于机器学习算法的比较研究 [J].金融论坛,2018,23(6).

[21]丁剑平,吴洋,吴小伟.什么造就了避险货币?——基于机器学习方法的分析[J].上海经济研究,2020,(12).

[22]Chen W, Xu H, Jia L, et al. Machine Learning Model for Bitcoin Exchange Rate Prediction Using Economic and Technology Determinants [J].International Journal of Forecasting,2021,37(1).

[23]Cortez K, Rodriguez-Garcia M D P, Mongrut S. Exchange Market Liquidity Prediction With the K-Nearest Neighbor Approach: Cryptovs.Fiat Currencies [J].Mathematics,2021,9(1).

[24]Chen Z, Li C, Sun W. Bitcoin Price Prediction Using Machine Learning: An Approach to Sample Dimension Engineering [J].Journal of Computational and Applied Mathematics,2020,(365).

[25]Bouri E, Gkillas K, Gupta R, et al. Forecasting Realized Volatility of Bitcoin: The Role of the Trade War [J].Computational Economics,2021,57(1).

[26]Sun S, Wang S, Wei Y, et al. A Clustering-based Nonlinear Ensemble Approach for Exchange Rates Forecasting [J].IEEE Transactions on Systems Man Cybernetics-systems,2020,50(6).

[27]Pabuccu H, Ongan S, Ongan A. Forecasting the Movements of Bitcoin Prices: An Application of Machine Learning Algorithms [J].Quantitative Finance and Economics,2020,4(4).

[28]Rowland Z, Lazaroiu G, Podhorska I. Use of Neural Networks to Accommodate Seasonal Fluctuations When Equalizing Time Series for the CZK/RMB Exchange Rate [J].Risks,2021,9(1).

[29]Gyamerah S A, Moyo E. Long-term Exchange Rate Probability Density Forecasting Using Gaussian Kernel and Quantile Random Forest [J].Complexity,2020.

[30]Pandey T N, Jagadev A K, Dehuri S, et al. A Novel Committee Machine and Reviews of Neural Network and Statistical Models for Currency Exchange Rate Prediction: An Experimental Analysis [J].Journal of King Saud University—Computer and Information Sciences,2020,32(9).

[31]Parot A, Michell K, Kristjanpoller W D. Using Artificial Neural Networks to Forecast Exchange Rate, Including VAR-VECM Residual Analysis and Prediction Linear Combination [J].Intelligent Systems in Accounting Finance & Management,2019,26(1).

[32]Qian B, Rasheed K. Foreign Exchange Market Prediction With Multiple Classifiers [J].Journal of Forecasting,2010,29(3).

[33]Semiromi H N, Lessmann S, Peters W. News Will Tell: Forecasting Foreign Exchange Rates Based on News Story Events in the Economy Calendar [J].North American Journal of Economics and Finance,2020,(52).

[34]Das S R, Mishra D, Rout M. A Hybridized ELM-jaya Forecasting Model for Currency Exchange Prediction [J].Journal of King Saud University—Computer and Information Sciences,2020,32(3).

[35]Waheeb W, Ghazali R. A New Genetically Optimized Tensor Product Functional Link Neural Network: An Application to the Daily Exchange Rate Forecasting [J].Evolutionary Intelligence,2019,12(4).

[36]Jubert A B, Ferreira N R, Horta N. Combining Support Vector Machine With Genetic Algorithms to Optimize Investments in Forex Markets With High Leverage [J].Applied Soft Computing,2018,(64).

[37]Yoon J. Forecasting of Real GDP Growth Using Machine Learning Models: Gradient Boosting and Random Forest Approach [J].Computational Economics,2021,57(1).

[38]Soybilgen B, Yazgan E. Nowcasting US GDP Using Tree-based Ensemble Models and Dynamic Factors [J].Computational Economics,2021,57(1).

[39]Jena P R, Majhi R, Kalli R, et al. Impact of COVID-19 on GDP of Major Economies: Application of the Artificial Neural Network Forecaster [J].Economic Analysis and Policy,2021,(69).

[40]Jahn M. Artificial Neural Network Regression Models in a Panel Setting: Predicting Economic Growth [J].Economic Modelling,2020,(91).

[41]Su F, Shang H. A Wavelet Kernel-based Primal Twin Support Vector Machine for Economic Development Prediction [J].Mathematical Problems in Engineering,2013.

[42]杨炘,陈展辉.用人工神经网络方法预测中国外债适度规模[J].清华大学学报(自然科学版),2002,(6).

[43]Karanikic P, Mladenovic I, Sokolov-Mladenovic S, et al. Prediction of Economic Growth by Extreme Learning Approach Based on Science and Technology Transfer [J].Quality & Quantity,2017,51(3).

[44]李佳,黄之豪,王佳慧.基于独立循环神经网络方法的GDP预测[J].统计与决策,2020,(14).

[45]Kumar S, Muhuri P K. A Novel GDP Prediction Technique Based on Transfer Learning Using CO2 Emission Dataset [J].Applied Energy,2019,(253).

[46]Kumar S, Shukla A K, Muhuri P K. Anomaly Based Novel Multi-source Unsupervised Transfer Learning Approach for Carbon Emission Centric GDP Prediction [J].Computers in Industry,2021, (126).

[47]Kiani K M. Fluctuations in Economic and Activity and Stabilization Policies in the CIS [J].Computational Economics,2011,37(2).

[48]Gogas P, Papadimitriou T, Matthaiou M, et al. Yield Curve and Recession Forecasting in a Machine Learning Framework [J].Computational Economics,2015,45(4).

[49]Luna-Romera J M, Nunez-Hernandez F, Martinez-Ballesteros M, etal. Analysis of the Evolution of the Spanish Labour Market Through Unsupervised Learning [J].IEEE Access,2019,(7).

[50]徐正丽,文博奚,谢梅英,等.基于大数据技术的AI岗位需求分析研究[J].广西科学,2021,28(3).

[51]Golnaraghi S, Zangenehmadar Z, Moselhi O, et al. Application of Artificial Neural Network(s) in Predicting Formwork Labour Productivity [J].Advances in Civil Engineering,2019.

[52]Othman Z A, Abu B A, Sani N S, et al. Household Overspending Model Amongst B40, M40 and T20 Using Classification Algorithm [J].International Journal of Advanced Computer Science and

Applications,2020,11(7).

[53]Hong B, Malik A, Lundquist J, et al. Applications of Machine Learning Methods to Predict Readmission and Length-of-stay for Homeless Families: The Case of Win Shelters in New York City [J].Journal of Technology in Human Services,2018,36(1).

[54]许诺,唐锡晋.基于百度热搜新闻词的社会风险事件 5W 提取研究[J].系统工程理论与实践,2020,40(2).

[55]Mu J, Wu F, Zhang A. Housing Value Forecasting Based on Machine Learning Methods [J].Abstract and Applied Analysis,2014.

[56]Polyzos S, Samitas A, Katsaiti M S. Who is Unhappy for Brexit? A Machine-learning, Agent-based Study on Financial Instability [J].International Review of Financial Analysis,2020,(72).

[57]高华川,白仲林.一种基于机器学习的时变面板数据政策评估方法[J].数量经济技术经济研究,2019,36(8).

[58]Solea E, Li B, Slavkovic A. Statistical Learning on Emerging Economies [J].Journal of Applied Statistics,2018,45(3).

[59]钱浩祺,龚嫣然,吴力波.更精确的因果效应识别:基于机器学习的视角[J].计量经济学报,2021,1(4).

[60]李超,求文星.基于机器学习的因果推断方法研究进展[J].统计与决策,2021,(11).

[61]韩锋.海量数据下多指标含大量缺失的因果推断[J].统计与决策,2019,(11).

[62]Wager S, Athey S. Estimation and Inference of Heterogeneous Treatment Effects Using Random Forests [J].Journal of the American Statistical Association,2018,113(523).

[63]Zhang Y, Hamori S. The Predictability of the Exchange Rate When Combining Machine Learning and Fundamental Models [J].Journal of Risk and Financial Management,2020,13(3).

作者简介

  锋(1978—),男,湖北襄阳人,教授,博士生导师,研究方向:应用统计。


张文雅(1998—),女,河南平顶山人,博士研究生,研究方向:应用统计。

END


统计与决策

CSSCI来源期刊、中文核心期刊

投  稿

请登陆本刊投稿平台http://www.tjyjc.com

订阅&合作

订阅杂志:027-87819376

-----

-----


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存