You are on page 1of 7

第 43 卷 第 1 期 江西理工大学学报 Vol.43, No.

1
2022 年 2 月 Journal of Jiangxi University of Science and Technology Feb. 2022

文章编号:2095-3046(2022)01-0059-07 DOI:10.13265/j.cnki.jxlgdxxb.2022.01.009
引文格式:朱海龙,李萍萍 . 基于岭回归和 LASSO 回归的安徽省财政收入影响因素分析 [J]. 江西理工大学学
报,2022,43(1):59-65.

基于岭回归和 LASSO 回归的安徽省财政


收入影响因素分析
朱海龙 , 李萍萍
(安徽财经大学统计与应用数学学院,安徽 蚌埠 233030 )

摘 要:基于 1988— 2019 年安徽省财政收入及相关经济指标数据,运用岭回归和 LASSO 回归方


法,探究安徽省财政收入的影响因素。 考虑到较多的自变量会造成严重的多重共线性,首先应用
岭回归及 LASSO 回归模型降低变量间共线性的影响,然后再进行变量选择,最后对两模型进行
比较分析。 结果显示:相较于岭回归模型,LASSO 回归模型更优。 第一产业增加值、城镇居民人均
可支配收入、电力消耗量和城镇单位就业人员数对财政收入有显著的正向影响;第三产业与第二
产业产值比、居民消费价格指数和城镇单位就业人员工资总额对财政收入有显著的负向影响。
关键词:岭回归;LASSO 回归;多重共线性;财政收入
中图分类号:F812 文献标志码:A

究,方法主要有:主成分分析、多元线性回归分析、
一 、引 言 logistic 回 归 、灰 色 关 联 分 析 、LASSO 回 归 、岭 回 归
和逐步回归法等。 刘荣提出通过建立逐步回归模
财政政策是地方政府进行宏观经济调控的主 型, 分析影响我国财政收入的因素, 并提出提高
要手段,而财政收入分配是财政政策的重要组成部 我国财政收入质量的政策和建议[1]。 景宏军等基于
分,通过增减财政收入调节资源的合理配置和生产 VAR 模型分析地方财政收入的动态预测和结构 [2]。
要素的流动来实现提高人民生活水平的目标。参照 赵海华认为财政收入及其影响因素呈非线性变
《基本公共服务领域中央与地方共同财政事权和支 化, 提出基于灰色 RBF 神经网络构建的财政收入
出责任划分改革方案》 对全国省份的划分方法,安 模型 [3]。 随着机器学习的发展,越来越多的学者通过
徽省的实际经济发展水平及财力状况位于第二档, 机器学习中的一些算法,弥补传统计量经济学方法
中央需要承担的比例比较大。安徽省作为中部地区 中的缺点。舒服华提出运用岭回归的方法分析影响
的经济大省,在乡村振兴、脱贫攻坚及供给侧结构 武汉市税收收入的因素, 岭回归的方法可以有效解决
性改革中担负着十分重要的作用。在减税降费的背 变量之间共线性的问题[4]。 董小刚等提出运用 LASSO
景下,安徽省的财政收支矛盾越发尖锐。 为了更有 回归、 岭回归和 Adaptive-LASSO 回归方法分析影
效地促进本地区的财政增收和改善人民的生活水 响吉林省财政收入的因素,通过对比得出 Adaptive-
平,探究影响财政收入的重要因素,有助于政策制 LASSO 回归拟合的模型较优[5]。 徐子卿选取 1995—
定者更合理地利用地方财政收入,并实施相应的政 2017 年的贵州省财政收入及其他相关变量, 通过
策举措。 Adaptive-LASSO 回归方法分析影响财政收入的主
国内学者对地方财政收入问题进行了大量研 要因素,并建立 BP 神经网络模型进行预测,预测效

收稿日期:2021-05-14
基金项目:国家自然科学基金项目(编号:71971001 );安徽财经大学科研创新基金项目(编号:ACYC20277 )
作者简介:朱海龙(1980— ),男,教授,主要从事数值分析研究。 E-mail :1091408421@qq.com
60 江西理工大学学报 2022 年 2 月
果良好[6]。 丁先文等基于岭回归讨论影响江苏省财 岭回归的解为:
政收入的因素, 研究发现与普通线性回归相比,岭 w=arg min (‖y-Xw‖22 +λ‖w‖22 )
w
回归对各参数的估计更加具有精确性[7]。
=(XTX+λI)-1XTy
地方财政收入是国家财政收入的重要组成部
岭回归是改良后的普通最小二乘估计, XTX
分, 科学合理地分析影响地方财政收入的主要因
≈0 时 , 设 想 把 一 个 正 的 常 数 矩 阵 λI (λ>0) 加 到
素, 能有效地避免预算收支规模的随意性和盲目
XTX 中, 则 XTX+λI 接近奇异的程度小于 XTX 接近
性,对宏观经济调控具有非常重要的现实意义和作
奇异的程度。 对最小二乘估计进行了改进,以达到
用。虽然地方财政收入影响问题的相关研究已经取
消除共线性影响的效果,使得模型参数的估计值更
得一定成就,但在具体的影响因素分析过程中方法
加准确。岭回归的解析表达式在数值计算上表现得
比较单一,模型可能存在过度拟合的情况,不能准
更加稳定,而且还可以避免变量之间多重共线性的
确地反映模型的适用性。 另外,在相关参数估计过
情况。
程中,使用最小二乘法会受到变量的多重共线性影
(二)LASSO 回归模型基本原理
响,往往存在方差较大的问题,达不到降低维度的
1996 年 Tibshirani [9] 提 出 了 最 小 绝 对 收 缩 和
作用,导致回归模型的精确度较差。 为了减少模型
LASSO 回 归 作 为 岭 回 归 的 替 代 方 法 ,LASSO 回 归
过度拟合和多重共线性的问题,目前学者常采用岭
不会对参数施加二次惩罚,而是对压缩回归系数的
回归和 LASSO 回归方法进行相关问题的研究。 基
绝对值进行惩罚。
于上述分析,选取安徽省的财政收入及相关变量数
LASSO 回归方法是在线性回归模型中添加 L1
据,建立岭回归和 LASSO 回归模型,探究安徽省财
正则项作为惩罚项。 LASSO 回归模型的惩罚函数
政收入的影响因素。 首先应用岭回归及 LASSO 回
压缩回归系数,将不相关变量精确收缩到零,改善
归模型降低变量间共线性的影响,然后再进行变量
了回归模型中的多重共线性问题 [10-11],定义为:
选择,最后对两模型进行比较,分析影响财政收入
n

的主要因素,并提出相关政策建议。 β=arg min ‖Y-Xβ‖22 +λΣ βj (3 )


β j = 1

公式(3)中,β 是 n 维参数向量;X 是矩阵;Y 是因变


二 、回归模型的基本原理及数据说明
量;λ 是收缩参数。 LASSO 在变量选择上利用最小
角度回归(Lars )算法,可以有效地估计解的路径 [12]。
(一)岭回归模型基本原理
Lars 算法核心思想是提出一种新的求解路径,即在
1962 年, Hoerl 首次提出岭回归,并在 1970 年
已经入选的变量中,寻找一个新的路径,使得在这
和 Kennard[8] 进一步对岭回归模型做出了详细讨论,
个路径上前进时,当前残差与已入选变量的相关系
得出的结果为:自变量间存在多重共线性,岭回归
数都是相同的,直到找出新的比当前残差相关系数
是改良后的普通最小二乘估计,通过对最小二乘估
大的变量。 LASSO 是一种 L1 范数惩罚最小二乘算
计进行了改进,以达到消除共线性影响的效果。 实
法,解决了以下优化问题:
际上,消除多重共线性的过程是一个自变量选元的
过程。 βL=arg min (Y-βX)(Y-βX)′+λ‖β‖1 (4 )
β
岭回归是一种改良的最小二乘法,实际上是在 公式 ( 4 )中 ,超 参 数 λ∈ ( 0 , ∞ )是 固 定 的 ,当 λ 的
线性回归的损失函数后加一个 L2 正则化项。 值趋于 ∞ 时,估计的系数缩小到零。 λ 越大,说明

{min‖y-Xw‖
2
2
(1 ) 惩罚力度越大, 模型中保留的变量就越少, 以至
2
s.t.‖w‖ ≤C
2 于刚开始模型中没有任何变量为显著变量。 但
公式(1)中,X 是输入的特征矩阵;y 是输出矩阵;w 是 ,随 着 λ 的 值 减 小 , 模 型 中 保 留 的 变 量 开 始 变
是模型的参数向量;C 是大于零的常数。 在公式(1) 多,回归模型中依次出现显著变量。 也就是说,相对
中加入拉格朗日乘子法,将有约束的优化问题转换 于超参数 λ,LASSO 程序可以解释为逐步回归,估计
为公式(2)的无约束的惩罚函数优化问题。 模型的参数会朝着零的方向进一步收缩[13]。 当 模 型
■ 2 2
|
|
min ‖y-Xw‖ +λ‖w‖ 2 2 中存在无关或者相关系数较小的变量时, 通过
| w
|
|
|
■ (2 ) LASSO 回 归 , 这 些 变 量 将 会 被 筛 除 , 从 而 提 高 模
|
|
|
|
|
s.t.‖w‖22 =
■ Σx2i
i 型的准确度和解释度。 许多文献给予了 LASSO 回
|
■λ>0 归在变量选择方面上的大量关注, 然而, 在实际
第 43 卷 第 1 期 朱海龙,等:基于岭回归和 LASSO 回归的安徽省财政收入影响因素分析 61
情况下,不能完全期望得到一致的变量选择和参数 徽统计年鉴 2019 》, 共计 32 个年度, 样本容量为
估计。 434 ,样本量基本充足。
(三)模型设定 (五)变量定义及描述统计
基于上述理论,设定具体的线性模型: 为研究影响安徽省财政收入的因素,将一般公
Y=Xβ+ε (5 ) 共预算收入作为被解释变量。本文在借鉴相关文献
公式(5 )中,Y 是被解释变量,即安徽省财政收入, 的基础上[4],对指标体系进行了创新改进,提出影响
为 n×1 维的列向量;X 为 n×p 阶的矩阵, 由影响财 因素分别从经济发展水平、产业结构、贸易程度、能
政收入的有关的解释变量组成;β 为 p×1 维回归系 源消耗和居民支出收入状况方面来考虑,具体指标
数;ε 为随机扰动项。 分别为地区生产总 值 (X1)、财 政 支 出 (X2)、第 一 产
(四)数据说明 业增加值(X3)、第三产 业 与 第 二 产 业 产 值 比 (X4)、
从模型的精确度和可信度从发,应该选取尽可 进出口总额(X5)、居民 消 费 价 格 指 数 (X6)、电 力 消
能多的样本。 许多指标虽有较长时间跨度的记录, 耗量(X7 )、 全 社 会 固 定 资 产 投 资 额 ( X8 )、 城 镇 单
但是前期的统计口径和后续不一致,盲目选择可能 位 就 业 人 员 数 ( X9 )、 常 住 人 口 数 ( X10 )、 城 镇 单 位
会带来较大的偏差。 基于以上想法,选取对安徽省 就 业 人 员 工 资 总 额 ( X11 )、 城 镇 居 民 人 均 可 支 配
1988 —2019 年财政收入影响较大的 14 个因素,利 收 入 ( X12 )、 城 镇 居 民 人 均 消 费 性 支 出 ( X13 ) 和 社
用岭回归和 LASSO 回归方法对可能影响财政收入 会 销 售 品 零 售 总 额 ( X14 ), 变 量 描 述 性 统 计 分 析
的因素进行分析和变量选择。 文章数据来源于《安 如 表 1 所 列。

表1 变量描述性统计表

变量 变量含义 最小值 最大值 中位数 平均数 标准偏差

Y 财政收入(万元) 435 528 31 830 000 2 476 885.5 8 713 648.22 10 522 234

X1 地区生产总值(亿元) 546.90 37 114 4 341.21 9 460.79 10 424.34

X2 财政支出(万元) 478 131 73 920 000 5 544 839 18 848 998 23 151 546

X3 第一产业增加值(亿元) 190.50 2 915.70 852.485 1 220.47 875.898 29

X4 第三产业与第二产业产值比 0.59 1.23 0.79 0.80 0.16

X5 进出口总额(万美元) 70 082 6 873 000 657 706 1 827 877.67 2 133 241.6

X6 居民消费价格指数(% ) 97.80 126.90 102.335 105.13 6.80

X7 电力消耗量(亿千瓦小时) 168.30 2 301 480.56 807.28 643.99

X8 全社会固定资产投资额(亿元) 114.39 33 758.42 1 676.97 8 237.99 10 891.59

X9 城镇单位就业人员数(万人) 470.70 1 392.10 688.80 836.80 306.90

X10 常住人口数(万人) 5 377 6 365.90 6 066.95 6 011.99 220.68

X11 城镇单位就业人员工资总额(亿元) 67.20 5 386.07 391.225 1 131.24 1 389.08

X12 城镇居民人均可支配收入(元) 1 074.70 37 540 7 144.73 12 063.96 10 915.29

X13 城镇居民人均消费性支出(元) 1 020 23 781.54 5 387.84 8 434.20 6 921.45

X14 社会销售品零售总额(亿元) 2 129 410 133 777 000 14 443 223 34 598 940 39 411 557
数据来源:《安徽统计年鉴 2019 》。

对原始数据进行标准化处理。 同时,随着时间的推
三 、实证分析 移,财政收入显著的时间趋势使得变量间存在异方
差性,为了消除异方差的影响,对财政收入数据进
(一)多重共线性检验 行对数化处理。
由于选取的 14 个变量的量纲不同, 因此需要 对所有变量进行线性回归,虽然模型拟合度为
62 江西理工大学学报 2022 年 2 月
99% ,但大多数变量没有通过显著性检验。 kappa 值 方 差 膨 胀 因 子 ( VIF )适 用 于 检 验 变 量 共 线 性
可以判断变量间是否具有严重的多重共线性。如果 的强弱, 大于 10 则说明存在严重的多重共线性。
k<100 ,说 明 共 线 程 度 比 较 小 ;如 果 100<k<1 000 , 从表 2 可知, 大部分变量存在显著的多重共线
有较强的多重共线性;k>1 000 说明存在严重的多 性 ,只 有 少 数 变 量 不 存 在 多 重 共 线 性 ,如 :第 三 产
重共线性。 经过计算,k 值等于 205.153 7 ,说明该 业与第二产业产值比 ( X4) 和居民消费价格指数
样本存在较强的多重共线性。 ( X6)。

表2 变量的多重共线性检验

变量 VIF 变量 VIF

X1 698.794 X8 2 630.614

X2 1 067.768 X9 705.517

X3 331.516 X10 18.309

X4 8.294 X11 298.972

X5 290.463 X12 4 139.968

X6 2.872 X13 1 951.180

X7 864.747 X14 2 209.870

(二)岭回归分析 息、降低精度为代价获得更加实际、可靠的回归系数
岭回归是一种专门用于共线性数据分析的有 方法。通过 R 语言中 ridge 程序包中的 linearRidge 函
偏估计回归方法, 实质上是改良的最小二乘估计 数[14]可以自动进行岭参数的选择,根据岭回归模型给
法,通过放弃最小二乘的无偏估计,以损失部分信 出的结果进行分析,结果如表 3 所列。

表3 岭回归分析结果

参数 估计值 标准化估计值 标准差 T 统计量 P值

Intercept 15.066 4 NA NA NA NA

X3 0.655 5 3.649 4 0.341 2 10.697 < 2e-16 ***

X6 -0.120 5 -0.670 8 0.240 9 2.785 0.005 35 **

X7 0.237 2 1.320 8 0.235 5 5.609 2.03e-08 ***

X9 0.370 0 2.060 1 0.318 0 6.479 9.22e-11 ***

X10 0.114 6 0.638 2 0.273 0 2.337 0.019 42 *

X11 -0.374 1 -2.083 0 0.383 8 5.427 5.73e-08 ***

X12 0.221 7 1.234 5 0.137 4 8.984 < 2e-16 ***

X13 0.400 6 2.230 6 0.223 9 9.961 < 2e-16 ***

X14 -0.241 2 -1.342 7 0.325 5 4.125 3.71e-05 ***

注 : *** 表 示 在 0.001 显 著 性 水 平 下 ; ** 表 示 在 0.01 显 著 性 水 平 下 ; * 表 示 在 0.05 显 著


性水平下。

相较于普通回归,岭回归方法中大部分的变量 (X7)、城镇单位就业人员数(X9)、常住人口数(X10)、
系数显著提高,第一产业增加值(X3)、电力消耗量 城镇居民人均可支配收入(X12)和城镇居民人均消
第 43 卷 第 1 期 朱海龙,等:基于岭回归和 LASSO 回归的安徽省财政收入影响因素分析 63
费性支出(X13)系数均提高。 约束 , 目 前 被 广 泛 应 用 于 参 数 估 计 和 变 量 选 择 ,
标准化后的岭回归方程为: 是在变量选择和参数估计过程中同时进行的正
则 化 方法。
Y =3.6494X3 -0.6708X6 +1.3208X7 +2.0601X9 +
与 岭 回 归 相 似 ,LASSO 回 归 通 过 加 入 惩 罚 项
0.6382X10+2.00830X11+1.2345X12+2.2306X13-
1.3427X14 (6 ) 将有约束的优化问题转化为无约束的惩罚函数优

经过标准化处理后, 模型中的截距项无空值, 化问题;不同的是,LASSO 回归虽然无法得到具有


因此从方程(6)可知:居民消费价格指数(X6)、城镇 解析式的解,但其回归结果有助于做出合适的特征
单位就业人员工资总额(X11)和社会销售品零售总 选择,具有一定的优越性。
额 (X14)与 安 徽 省 财 政 收 入 呈 现 负 相 关 关 系 ,居 民 文章选取常用的 Cp 统计量法进行系数选择,
消费价格指数对安徽省财政收入有负影响;第一产 运用 R 软件中 Lars 算法进行 LASSO 回归,从而得
业增加值(X3)、电力消耗 量 (X7)、城 镇 单 位 就 业 人 到相应的回归结果[15]。
员数(X9)、常住人口数(X10)、城镇居民人均可支配 Cp 统 计 量 是 用 来 衡 量 变 量 间 多 重 共 线 性 ,其
收入(X12)和城镇居民人均消费性支出(X13)与安徽 值越小,说明所选子集个数就越优 [16]。 表 4 反映了
省财政收入呈正相关,当上述变量发生变动时会引 LASSO 求解中 Cp 值的变化情况,其中 Step 表示步
起安徽省财政收入同方向变动。 数,RSS 表示残差平方和,找到使 Cp 统计量达到最
(三) LASSO 回归分析 小值的步数,输出所对应解释变量的系数,并从中
LASSO 回归是一种相对较新的方法, 其原理 筛选出系数不为零的变量。 可以看出,当变量选取
是在 RSS 最小化的计算中加入一个范数作为惩罚 到第 22 步时,Cp 值取得最小值为 12.676 。

表4 LASSO 求解中值的变化

Step Cp RSS Step Cp RSS

1 5.633 584.978 14 0.326 25.428

2 3.929 401.499 15 0.297 24.352

3 1.888 181.409 16 0.265 18.802

4 1.491 140.219 17 0.264 16.742

5 0.903 78.233 18 0.225 14.490

6 0.767 65.427 19 0.199 13.676

7 0.739 60.444 20 0.185 14.153

8 0.580 45.088 21 0.172 14.756

9 0.548 43.668 22 0.172 12.676

10 0.488 39.118 23 0.167 14.198

11 0.414 33.028 24 0.158 15.243

12 0.381 31.436 25 0.157 13.079

13 0.366 31.853 26 0.156 15.000

图1 为 LASSO 回归模型变量筛选的结果。 图 1 表 5 反映的是 LASSO 回归模型变量选择结果。


中底部横轴表示模型系数比,右侧纵轴数据表示对 LASSO 回归的表达式如方程(7)所示:
应解释变量,左侧纵轴数据表示标准化参数;虚线 Y =15.06644-2.01736X2+0.89623X3-0.13990X4-
代表变量,竖线表示惩罚值。 0.07550X6-0.42130X11+2.94624X12 (7 )
筛选变量后,筛选出 X1、X2、X3、X4、X6、X7、X8、X9、 结合方程(7)和表 5 可以看出,运用 LASSO 回
X10、X11、X12 和 X13 共 12 个变量,再进行线性回归, 归方法进行系数求解,可以有效解决模型中存在多
通 过 显著性检验的变量有:X2、X3、X4、X6、X11 和 X12。 重共线性的问题,同时,获得具有较好泛化能力的
64 江西理工大学学报 2022 年 2 月

25
X12
20

15

标准化参数
10

5
X7
0
X8
-5 X13

-10 X2
0 0.2 0.4 0.6 0.8 1.0
β
图1 LASSO 回归方法下的变量选择

表5 LASSO 的回归变量选择结果

参数 估计值 标准差 T 统计量 P值

截距项 15.066 44 0.019 77 762.162 < 2e-16 ***

X2 -2.017 36 0.364 13 -5.540 9.28e-06 ***

X3 0.896 23 0.198 70 4.511 0.000 133 ***

X4 -0.139 90 0.046 02 -3.040 0.005 485 **

X6 -0.075 50 0.025 21 -2.995 0.006 109 **

X11 -0.421 30 0.177 08 -2.379 0.025 301 *

X12 2.946 24 0.444 87 6.623 6.13e-07 ***

注: *** 表示在 0.001 显著性水平下;** 表示在 0.01 显著性水平下;* 表示在


0.05 显著性水平下。

回归模型,也对研究影响财政收入的最佳变量集给 较好。 在实际检验中,使得 AIC (最小信息准则)或


出一定的参考。 文章通过 LASSO 回归选出了 6 个 SBC (施瓦兹的贝叶斯判别 准 则 )达 到 最 小 的 模 型
影响较大的变量:财政支出(X2)、第一产业增加值 为相对最优模型,从 AIC 及 SBC 准则来看,LASSO
(X3)、第三产业与第二产 业 产 值 比 (X4)、居 民 消 费 回归模型较优。
价 格 指 数 (X6)、城 镇 单 位 就 业 人 员 工 资 总 额 (X11)
表6 模型对比分析表
和城镇居民人均可支配收入(X12)。 具有正向影响
作用的解释变量有:第一产业增加值(X3)和城镇居 模型 RMSE R2 AIC SBC

民 人 均 可 支 配 收 入 (X12),具 有 负 向 影 响 作 用 的 解 岭回归 0.124 0.984 -78.27 -114.8


释变量有:财政支出(X2)、第三产业与第二产业产 LASSO 回归 0.137 0.988 -143.2 -125.2
值比(X4)和居民消费价格指数(X6)。
(四)模型对比分析
运用岭回归模型和 LASSO 回归模型进行变量 四 、结论与建议
选择后,消除了变量间的多重共线性,通过对比模型
检验及参数检验,选择较优的模型。 表 6 为 LASSO 文章运用岭回归和 LASSO 回归方法进行变量选
回归模型和岭回归模型的对比分析。 对于表 6 的结 择,将以地区生产总值、财政支出等 14 个影响因素作
果,从均方根误差 RMSE 来看,岭回归的均方根误差 为解释变量, 财政收入作为被解释变量构建回归模
2
小, 说明岭回归较优; 但 是 从 R 拟 合 优 度 来 看 , 型。 通过模型对比分析可以看出,LASSO 回归模型相
LASSO 回归的拟合优度数值较大, 说明拟合效果 对较优,基于 LASSO 回归结果得到如下结论:
第 43 卷 第 1 期 朱海龙,等:基于岭回归和 LASSO 回归的安徽省财政收入影响因素分析 65
(1) 安徽省财政收入与城镇单位 就 业 人 员 数 发。 当地政府需要制定合理的税收政策,为产业结
及常住人口数,存在显著的正向影响。 就业人数和 构创新升级提供源源不断的动力,扶持相关产业的
常住人数的增加,使得劳动力增加,促进当地就业 孵化和成型,推进相关税收政策的改革,促进安徽
水平提高,推动当地的经济发展,进一步引起财政 省的第二产业朝着更高质量的发展。
收入的提高。常住人口数直接影响着居民的消费水 (3) 在当下以及未来的一段时间内,营造稳定
平,城镇就业人数的上升伴随着居民消费水平的提 的消费环境,使消费者可以放心消费,同时也要为
高,间接增加财政收入。 非城镇的居民设立消费场所,电商进村,快递进镇,
(2) 安徽省财政收入与第一产业产值存在正相 拓展居民消费。鼓励企业开展新兴的线上线下相结
关的关系。 安徽省位于中原地带,有富饶的水域等 合销售形式,积极引导这些企业朝着健康绿色的方
自然环境,因此农业就显得至关重要,第一产业农 向发展,从而更好地促进省内的财政增收。
业的产值越高,居民收入越高,消费水平也会随之
增长,最终导致财政收入增长。 安徽省的财政收入 参考文献:
与能源消费总量也存在着正相关的关系。能源消费 [1] 刘 荣 . 基 于 逐 步 回 归 方 法 的 国 家 财 政 收 入 的 影 响 因 素 分 析 [J].
劳动保障世界 ( 理论版 ), 2012(5):51-54.
总量越大,说明工厂等一些重工业基地越多,这些
[2] 景宏军 , 王李存 . 基于 VAR 模型的地方财政收入 的 动 态 预 测 和
企业会产生大量的税收,上缴的税收也会引起财政
—以黑龙江省为例 [J]. 财会研究 , 2015(3):5-9.
结构分析——
收入的增加。安徽省财政收入和第三产业与第二产 [3] 赵 海 华 . 基 于 灰 色 RBF 神 经 网 络 的 多 因 素 财 政 收 入 预 测 模
业产值比值存在着负相关的关系,第三产业与第二 型 [J]. 统计与决策 , 2016(13):79-81.

产业产值比值的提高会引起财政收入的减少。第三 [4] 舒服 华 . 基 于 岭 回 归 的 武 汉 市 税 收 收 入 影 响 因 素 分 析 [J]. 湖南


税务高等专科学校学报 , 2018, 31(6):44-49.
产业与第二产业比值提高, 意味着服务业发展迅
[5] 董 小 刚 , 刁 亚 静 , 李 慧 玲 , 等 . 岭 回 归 、LASSO 回 归 和 Adaptive-
速,工业发展减缓,需提高产业结构逐步优化。
LASSO 回 归 下 的 财 政 收 入 因 素 分 析 [J]. 吉 林 师 范 大 学 学 报 (自
(3) 财政 收 入 与 居 民 消 费 价 格 指 数 存 在 负 相 然科学版),2018, 39 (2 ):45-53.
关的关系。 值得注意的是,居民消费价格指数是一 [6] 徐子卿 . 贵 州 省 财 政 收 入 影 响 因 素 分 析 及 预 测 [J]. 农村经济 与
个滞后性的数据, 不仅决定消费者日常花费的增 科技 , 2019, 30(6):158-159.

减,也决定了经营者的经营成本,还影响着投资者 [7] 丁先文 , 袁红 , 马强 , 等 . 基 于 岭 回 归 的 江 苏 省 财 政 收 入 估 计 [J].


江苏理工学院学报 , 2020, 26(6):5-10.
的投资决策问题, 更对政府的宏观调控起着重大
[8] HOERL A E, KENNARD R W. Ridge regression: Biased
影响。 居民消费价格指数的持续下行,会影响消费 estimation for nonorthogonal problems[J]. Technometrics, 1970, 12(1):
水平,进而影响财政收入。 55-67.
通过上述结论,针对不同因素对安徽省财政收 [9] TIBSHIRANI R. Regression shrinkage and selection via the Lasso[J].

入的影响提出以下几点建议: Journal of the Royal Statistical Society : Series B (Statistical


Methodology), 1996, 58(1):267-288.
(1) 为吸 引 劳 动 力 ,吸 引 人 才 ,省 内 需 要 不 断
[10] TIBSHIRANI R. Regression shrinkage and selection via the lasso:
优化自身的生活环境和营商环境。在人才培养的过
a retrospective[J]. Journal of the Royal Statistical Society: Series
程中,根据新时代要求,布局新农业、新工科专业。 B (Statistical Methodology), 2011, 73(3): 273-282.
培养人才后,通过落户补贴等留住人才,促进人才 [11] 冯 海 琦 , 赵 玉 梅 , 王 琳 琳 . 山 东 省 社 会 消 费 品 零 售 额 的 影 响
作用长远发展,真正做到人才强省、高水平的创新 因 素 分 析 —基
—— 于 Lasso 回 归 模 型 [J]. 鲁 东 大 学 学 报 ( 自 然 科
学版 ), 2021, 37(4):310-314.
型省。 另外,也要切实解决发展过程中遇到的不平
[12] EFRON B, HASTIE T, JOHNSTONE I, et al. Least angle
衡不充分问题,就业人员工资和当地的财政有紧密
regression[J]. The Annals of Statistics, 2004, 32(2): 407-499.
的联系,财力紧张的同时,提高资金的指向性,确保 [13] 胡聿文 . 基于 LASSO 回归的江西省高校 R&D 投入强度的影响
财政经济运行的可持续性,保工资,保基本民生。从 因素分析 [J]. 科技和产业 , 2020, 20(5):84-88.

发展财政真正做到转向民生财政,促进人口红利走 [14] 何 晓 群 ,刘 文 卿 . 应 用 回 归 分 析 [M]. 4 版 ,北 京 :中 国 人 民 大 学


出版社,2015.
向素质红利。
[15] 吴喜之. 复杂数据统计方法:基于 R 的应用[M]. 3 版,北京:中国
(2) 加快工业化升级,结合产业结构的特点 ,
人民大学出版社,2015.
通过引进更加高端的装备和依托省内高校人才,在 [16] MALLOWS C L. Some comments on Cp[J]. Technometrics, 2000,
工业创新过程中,鼓励新型材料和新能源的创新研 42(1): 87-94.

(责任编辑:刘炜娜)

You might also like