─基于逐步残差正系数线性回归方法
马敏娜
(税务学院:长春)
目前,技术创新已成为社会经济发展的重要因素。特别是在竞争日趋激烈的市场经济中愈来愈显著,正确评价技术创新在社会经济生活中的作用和地位,进一步发挥各部门、行业的科技优势和潜力已成为政府和公众所关心的一个重要问题。
技术创新对企业经济增长有重要作用。但在企业资金投入有限的情况下,在技术创新方面的投入一定要有重点、分层次使效益最大化。工业企业技术创新的产出或效益,如工业增加值、销售收入、利润、人均报酬、劳动生产率、知识产权、出口创汇等,会受到技术创新投入如从业人员、创新人员、创新经费、R&D经费支出、开发经费、新产品试制经费、技术引进、消化吸收经费等的影响。对投入与产出的分析主要是估算那些投入因素对产出或效益指标存在着影响及影响程度,以确定技术创新投入的重点和方向。
一、理论依据
1912年著名美籍奥地利经济学家熊彼特(J.A.Schmpeter),首先提出技术创新的概念并解释:创新是生产函数或供应函数的变化,或者把生产要素和生产条件的“新组合”引入生产体系。技术创新包括产品创新、工艺创新和组织管理创新,因为三者均可导致生产函数和供应函数的变化。
1999年8月20日《中共中央国务院关于加强技术创新发展高科技实现产业化的决定》对我国的技术创新也给予明确界定:技术创新是指企业应用创新的知识和新技术、新工艺,采用新的生产方式和经营管理模式,提高产品质量,开发生产新产品,提供新的服务,占据市场并实现市场价值。
本项研究同意上述观点,认为技术创新包含采用新的生产方式和经营模式的技术创新,技术创新比技术进步更强调企业的主体地位和技术的市场价值。
二、计算方法的选择
本文主要使用了逐步残差正系数线性回归方法。一般来说,回归分析方法就可以提供建立变量间相关关系的数学表达式(模型),而且还能帮助我们如何判别表达式的有效性以及如何利用它达到分析的目的。根据创新技术投入与产出指标多的特点,我们考虑用多元逐步回归方法,它提供了按自变量对因变量作用程度的大小来决定某些自变量能否引入回归方程的方法。在逐步回归中,每计算一步都要用自变量的“贡献系数”来比较、选择自变量,并用F检验判断是否引入或剔除。但在研究过程中,发现各自变量与因变量均呈现正相关关系,用通常的多元线性回归方法,所建立的回归方程系数,有的是负数,从而使建立的方程与常理相悖,失去应用价值。为解决这个问题我们研究并使用了逐步残差正系数线性回归方法,建立各产出与全部投入指标的正系数线性回归模型,做法如下:
Y=(Y1,…,Yn)T为n个单位的某一个产出指标值向量,n为科技活动组(如院校、研究与开发机构等)内单位总数,
为n个单位G个变量的指标矩阵,即
![]()
![]()
![]()
![]()
![]()
![]()
, , ,
第1步,先在X1,…,XG中选取一个与Y正相关且相关系数最大并显著的因子,设为X1即
从而得到回归系数的样本估计为
,![]()
回归方程为:
相应的残差向量为:
设已进行了m-1步计算,建立了由X1,X2,…,Xm-1组成的正系数线性回归方程:
![]()
第2步,先计算回归方程对样本的残差向量
以Ym-1代替Y,以Xm,…,XG代替X1,…,XG重复第一步的计算,在
![]()
Xm,…,XG中选出一个与Ym-1正相关且相关系数最大的并显著的因子,不妨设为Xm,选取变量Xm进入回归方程,得到第m步的回归方程,即有
![]()
其中
逐步计算到与残差向量有最大相关系数的因子与残差向量相关系数不显著为止。最后,进行统计检验,可求出回归方程的残差平方和S2以及复相关系数R,计算方法与一般线性回归的计算方法相同。
三、技术创新投入与产出指标的确定
按照建立统计指标体系科学性、全面性、系统性、有效性的原则,本文以吉林省大、中型工业企业研究对象,选取了13个技术创新产出指标,16个投入指标如下表所示。
表1 吉林省2004年工业企业技术创新产出(或效益)与投入指标
|
指标 |
技术创新产出(或效益)指标 |
指标 |
技术创新投入指标 |
|
Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y9 Y10 Y11 Y12 Y13 |
工业总产值/从业人员数 产品销售收入/从业人员数 利税总额/从业人员数 从业人员劳动报酬/从业人员数 新产品产值/从业人员数 新产品销售收入/从业人员数 新产品销售利润/从业人员数 专利申请数/科技活动人员数 专利拥有数/科技活动人员数 产品销售利润/产品销售收入 新产品销售利润/新产品销售收入 产品销售利润/工业总产值 新产品销售利润/新产品产值 |
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X16 |
工程技术人员数/从业人员数 科技活动人员数/从业人员数 固定资产原值/从业人员数 高中级职称人员数/科技活动人员数 R&D人员数/科技活动人员数 企业自筹资金/科技活动经费筹集额 来自政府部门资金/科技活动经费筹集额 R&D支出/产品销售收入 新产品开发支出/产品销售收入 技术改造经费支出/产品销售收入 技术引进经费支出/产品销售收入 消化吸收经费支出/产品销售收入 购买国内技术经费支出/产品销售收入 新产品工程及试生产支出/产品销售收入 培训支出/产品销售收入 新产品试销费用/产品销售收入 |
四、计算分析
(一)需要说明的问题
1.统计量的选择。我们选择Pearson积距相关系数,公式如下:

其中:
、
分别表示
、
的均值。
、
分别表示
、
的第
个观测值。
2.数据的选择。我们在计算每两个变量之间的相关系数时,仅根据这两个变量的数据进行计算,若以共同部分计算,会导致参与计算的数据过少,使计算结果变得不可靠。
3.缺失值的处理。为了充分利用所取得的数据,我们选择Exclude case pair wise的缺失值处理项。该项仅剔除正在参与计算的两个变量值是缺失值的观测量。这样,有可能在计算出的相关系数的矩阵中,相关系数是根据不同数量的观测量计算出来的,充分利用了所提供的数据信息。
4.数据采用标准。在计算过程中,为保证可比性,我们采用原始数据均为比例数据。
5.显著性水平的确定。我们在确定显著性水平时,以双尾概率为准,且检验的概率值设置为0.05(即α=5%);当通过检验指标不存在或者不多时,可以考虑检验概率值为0.10(即α=10%)的情况。
(二)计算分析
按照前面所述的逐步残差正系数线性回归的步骤,使用Spss和Excel软件得出吉林省大、中型企业总体技术创新投入与产出的相关矩阵,建立模型分析如下:
1.首先建立初始模型如下:
![]()
,
,![]()
利用残差进行又一次的正系数回归,发现ε1与X15有最大正相关系数0.662,且相关性显著,显著值为0.005。
![]()
,
,
,![]()
再一次利用上步的残差ε2对自变量X进行正相关检验,发现已没有显著的正相关系数,对上述模型进行合并,得到:
![]()
从上述模型可以看出,培训支出占产品销售收入比重(X15)以及从业人员人均固定资产原值(X3)这两个指标对从业人员人均工业总产值(Y1)有较大影响。重复上述方法得到:
2.
,
,
结论:从业人员人均固定资产原值(X3)对从业人员人均产品销售收入(Y2)有较大影响。
3.
,
,![]()
从业人员中工程师人数比例(X1)对从业人员人均利税(Y3)有较大影响。
4.
,
,![]()
从业人员人均固定资产原值(X3)、从业人员中科技活动人员比例(X2)对从业人员人均劳动报酬(Y4)有较大影响。
5.
,
,![]()
从业人员人均固定资产原值(X3)、培训支出占产品销售收入比(X15)对从业人员人均新产品产值(Y5)有较大影响。
6.
,
,
从业人员人均固定资产原值(X3)、培训支出占产品销售收入比(X15)两个指标对从业人员人均新产品销售收入(Y6)有较大影响。
7.
,
,![]()
从业人员人均固定资产原值(X3)、培训支出占产品销售收入比(X15)、技术引进经费支出占产品销售收入比(X11)对从业人员人均新产品销售利润(Y7)有较大影响。
8.
![]()
![]()
,
,
,
从业人员人均固定资产原值(X3)对科技活动人员人均专利申请数(Y8)有较大影响。
9.科技活动人员人均专利拥有数(Y9)与科技投入在10%水平下,无显著正相关系数存在。
10.
,
,![]()
消化吸收经费支出占产品销售收入比(X12)对产品销售利润率(Y10)有较大影响。
11.
,
,![]()
技术引进经费支出占产品销售收入比(X11)、新产品开发支出占产品销售收入比(X9)对新产品销售利润率(Y11)有较大影响。
12.
,
,![]()
购买国内技术经费支出占产品销售收入比(X13)、培训支出占产品销售收入比(X15)对工业总产值利润率(Y12)有较大影响。
13.
,
,![]()
技术引进经费支出占产品销售收入比(X11)、新产品开发支出占产品销售收入比(X9)对新产品产值利润率(Y13)有较大影响。
五、结论
1.从吉林省大中型工业企业的总体上说,上述模型确定了2004年每个影响技术创新产出(效益)量的创新投入因素,这为政府和管理部门提供了制定政策和措施的依据。若某个产出(效益)量受多个因素的影响,则可以通过模型比较各个因素的影响程度。例如从Y12的模型表达式,我们可以看到,影响销售利润在工业总产值比重的投入因素有X13购买国内技术经费支出占产品销售收入比和X15(培训支出占产品销售收入的比重)。通过对模型各项变量的系数比,影响程度从大到小依次是X15、X14。。
2.如果原始模型中,找出影响产出量1个或2个主要投入变量后,可以放宽原始模型的检验标准,对初始模型的残差继续进行逐步回归,可以求出次要的影响因素。
参考文献:
[1]《计量经济学》孙敬水 清华大学出版社 2004年9月
[2]《吉林省技术创新对经济增长贡献分析研究报告》马敏娜2005年12月