实事求是的分析方法(兼对在经济学中滥用数学工具的批判)

11/14/2014 posted in 理论视野

本文是《这个国家会好吗：中国崛起的经济学分析》写作时的方法论基础。在实际写作过程中，我是最先完成此文，然后再写作剩余的部分。它也是我在从事其它方面的学习和研究中的基本方法论。

————————————

西方主流经济学所倡导的实证经济学分析方法，试图建立一种完全客观的经济理论，即强调任何一种经济理论的结论都必须是可证伪的，然后用实际情况来对该结论进行检验。如果结论与实际情况相符，那么它就暂时可以被接受；如果不相符合，那么它就应该被拒绝。为了保证这种检验的客观性和准确性，数学工具被广泛使用，因为数学被认为是一种非常精确且不包含价值判断的分析工具，它的推理过程和得到的结论也非常清晰而容易被证实或证伪，这样就可以为解决经济学上的各种争论提供一个公允的判断标准（弗里德曼，1953）。在这种方法论的指导下，能否运用数学模型来分析经济关系逐渐成为判断一项研究学术价值的重要依据，而且其所使用的数学工具也呈现出越来越复杂的趋势，出现了没有使用复杂数学工具的经济学论文，就很难在国际一流的经济学杂志上发表的情况（林毅夫，2005）。

这种看似非常客观的方法论隐藏着一些内在的逻辑矛盾。在研究经济现象的时候，数学上的精确和实际情况不仅不能完全统一，而且在很多情况下是相互矛盾的。客观事实存在着诸多维度，大部分不是以数字形式呈现的，在将一个非数字形式的因素符号化变成一个数字变量的同时，将丢失很多重要的信息，同时增加很多错误的信息。

一

我们以经济学上非常著名的索洛增长模型为例。这个模型非常成功，但其实际意义值得怀疑。我们不用去构造一个复杂的数学模型也可以知道：在一个劳动力成本很低的欠发达国家，加大投资创造就业岗位可以推动经济增长。就这个关系而言，索洛模型没有告诉我们任何新东西，反而丢掉了很多有价值的东西。

投资、劳动力和经济增长之间的具体关系的模型“结构”和“参数”不是什么新东西，因为种关系的具体形式在每个国家都不会一样。也就是不管构造出什么样的模型，精确的计算出什么样的参数，都没有办法在实践中重复第二次。投资和劳动力的结合能对经济增长发挥什么样的作用，投资数量和劳动力数量并非最重要的因素，至少有两个因素比它们重要的多：第一，这个欠发达国家政治经济社会方面的制度及其宗教文化传统等等方面的因素；第二，投资和劳动力的非数量因素，比如这个投资是投入到自然资源的开采中去，还是带来了先进的技术与管理经验用于非资源性产业；大量的劳动力是像中国的农民工一样吃苦耐劳、遵纪守法、省吃俭用，还是好逸恶劳、喜欢闹事、有多少钱花多少钱，等等。

但索洛模型之所以这样成功，被写入几乎所有的和经济增长有关的经济学教材，是因为它选择了两个可以量化的因数：劳动力的数量和资本的数量。这两个变量是完全可以用数据在表达的，因此也就最好进行模型的构造、计算和验证。可以说，在选择了这两个变量之后，不用去看什么推理过程就可以知道：最后一定能构造出一个能通过所谓“实证检验”的模型出来。

其间的道理很简单：任意给出三组随机数据X/Y/Z，不管它们之间实际上有没有内在关系，运用数学工具，我们一定能够“拟合”出来一个方程Y=f(X,Z)。只要这三组数据的数量足够大，那么也就能保证这个方程的“拟合程度”很高。

投资、劳动力和经济增长之间肯定是有关系的，但这种关系的确定无疑并不主要存在于这三个变量之间。如果不对经济增长的主体——国家的具体情况有非常详细的了解，只研究则三个变量之间的数学关系是没有意义的。这个国家的政局是否稳定？保障契约得到实行的法律成本有多高？社会对经济增长带来的贫富差距有多大的承受力？劳动力受教育的程度如何，忍受大强度的枯燥的简单劳动的能力如何？……由于这些问题的存在，使得任何通过“实证检验”得到的增长模型都没有任何意义：它既不能解释经济增长也不能指导经济增长，只是一个数学游戏。

以下的辩护是毫无道理的：“这是一个普遍的结论，并不一定适合每个国家的具体情况”——从模型的出发点来看，由于忽略了最重要的一些因素，它在一开始就注定了不可能适应任何一个国家的具体情况。

总而言之，数学模型的广泛使用，造成了这样一个后果：经济学家认为自己可以用数学研究清楚任何他们想研究的问题。比如发展经济学：西方发达国家的经济学家，不用对一个发展中国家的真实情况有深入的了解，只需要远程搜集一大堆数据，运用手中的数学工具，鼓捣出一个能够通过实证检验的模型，那么他就可以声称该模型可以理解甚至指导发展中国家的经济发展了。

实际上，正是数学限制了经济学家的思维空间：他们只能研究那些能用数字表达的对象，而不管这个对象对实际的经济增长有无真正重要的意义。如果存在这样一种情况：对经济增长起决定作用的是一个难以量化的因素，同时有那么两三个对经济增长只有很小的影响但是很容易量化的因素，那么他们就会“假设”主要的因素不存在或者是保持不变的外生变量，而把可以量化的因素进行符号化，构建模型，然后运用计量经济学计算出可以通过检验的模型参数，于是就大功告成了。

索洛模型就是这样一个“成功”的典范。后来虽然有很多务实的经济学家试图从更为真实的角度研究经济增长，但是由于他们的研究仍然建立在现在这个已经僵化的经济学方法论的基础上——以建立完美的数学模型并通过实证检验为判断研究是否成功的标准——这些努力最终都失败了。比如内生增长理论，不管怎样完善，大家发现它的解释经济增长的能力（实际上就是接受数据检验的能力）都比不上索洛模型。照理说，索洛模型这样简单，还符合的不错，那么如果要构造一个考虑更多因素的模型，必须要比索洛模型更好的符合实际情况（实际上就是具有更高的数学上的“拟合程度”）才说的过去。

但是，这是一个方法论的陷阱：由于数学方法天然的更加适合分析哪些本来就是以数字形式存在的变量，因此考虑了非数字形式的变量的数学模型，在精确程度上不太可能战胜只分析劳动力的数量和资本数量的数学模型。

要研究非数字形式的经济因素，就应该用非数学模型来进行实事求是的研究。但这样的研究由于不符合主流经济学的研究范式，很难得到发表的渠道。一个理论从提出到完善，需要无数学者长时间的共同努力。没有了这样的渠道，这一类新理论就无法得到广泛的关注和讨论，也就无从积累和完善。简单来说，就是片面强调数学工具的这种方法论，将很多重要的创新淹没于萌芽状态，消灭了对实际情况进行有意义的深入研究的可能。

二

在研究经济现象的时候，“精确”和“正确”不仅不能完全统一，而且在很多情况下是相互矛盾的。在我们将一个非数字形式的因素符号化变成一个数字变量的同时，将丢失很多重要的信息，同时增加很多错误的信息。

比如我们说：一个人的幸福程度，跟他所拥有的财富成正比，跟他的欲望成反比。这句话是比较正确的，虽然和实际情况并不完全符合，但差的不太远。如果我们把幸福程度、财富和欲望符号化，变成数学变量来进行分析，设幸福程度为因变量H，财富和欲望为自变量F和D，并将这种关系表达为H=F/D。

这样一精确，问题立即出现了：文字上所表达的正比、反比关系是非常模糊的，不能进行进一步计算。而F/D则是非常精确的，那么，也就可以进行数学推导：2H= 2F/D，也就：“如果一个人的欲望不变，财富增加一倍，那么他的幸福程度将增加一倍”。这样的结论就已经离实际情况非常远了。因为财富和幸福程度之间不一定是线性的正比关系（甚至可以说肯定不是线性的正比关系）。所以把本段的第一句话所表达的关系变成数学公式以后，在精确的同时也就把事物之间的关系的范围极大的缩小了，立即产生巨大的偏差。

然而这还不够，如果H=F/D的话，我们还可以说H^2=F^2/D^2。这在数学上是完全没问题的，但如果用文字来表达其真实含义：幸福的平方等于财富的平方除以欲望的平方。这就非常荒谬了。欲望的平方是什么东西呢？

我们来详细的分析一下：

“平方”其实是一种数学关系的表达，它是从基础的数学关系1+1=2推导出来的。人类先定义十进制，然后定义加法，当3+3+3=9的时候，为了简化表达，就再定义乘法3×3=9，这里其中一个3是表达的基数概念，另外一个3表达的是“3的个数”。于是，同一个数据，在这个表达式中也就有了不同的维度。当我们说“欲望的两倍”的时候，“欲望”是一个基数概念，两倍中的“2”表达是欲望这个基数的个数，相当于“欲望+欲望”，这还可以勉强被理解为有实际意义。但当用平方表达的时候，“欲望的平方”，其中“欲望”这个量既要充当基数，还要代表个数，也就是“欲望个欲望相乘”。这里被量化了的欲望作为基数可以，代表个数就不行了。但对数字进行平方运算在数学上又是完全没有问题的。所以我们把“欲望”量化的同时，一方面消灭了欲望的非数字化的内容，另一方面又赋予了它一些新的数字上的意义，同时在两个维度上犯了错误，相当于“错误的平方”。

现代数学工具早就已经超越了“平方”所能达到的复杂程度，但无论它怎么复杂，其实都是从最基本的1+1=2这样的数量关系推导出来的。当我们用一些复杂的数学工具来对经济变量进行运算的时候，越是复杂的运算，也就同时会赋予这些经济变量越多的在实际上并不存在的数学意义。同时，由于最初的精确的定义必然损失一些真实的信息，每往前推导一步，都会加大这种偏差，运算的过程越复杂，最后推导出来的结果也就必然偏离真实情况越远。

当我们说“一个人欲望越大，幸福感越弱；财富增加，幸福感也会增加”的时候，这句话可以说是对事实的合理概括。当我们用H=F/D来表达这种关系的时候，虽然偏差增加了，但还可以给人以简洁和直观的印象，不算错的太离谱。当我们带入数据进行计算，得到一些参数的时候，就已经向错误的方向大大的迈进了，在让人一头雾水的同时偏离事实更远。当我们运用高级的数学工具，得到H^2=F^2/D^2这种公式或者更加复杂的公式的时候，真实的意义已经所剩无几，数学意义取代了客观事实，我们同时把问题变得不真实和难以理解。

必须强调，这种问题是数学内部无法解决的。数学工具的谬误，无法依靠运用更为高级的数学来解决。实际情况只能是越高级越荒谬：因为数学中的“高级”就意味这用更少的符号来代表更多的数字关系。

数学工具的滥用，使得经济学家的思考经济问题的思维模式被严重的扭曲了。我们观察经济问题首先应该思考的是：这个因素的真实内涵是什么？它在以什么样的方式影响着经济变化？带着这样的思考，去调查研究实际情况，才可能得到有意义的结论。

但对崇尚数学工具的人而言，他们首先不是关心经济运行的真实情况是怎样的，而是首先思考：这个因素是可以量化的吗，如果它本身不是数据，是不是可以用什么办法来把它变成数据？

这样，如果他们发现某个因素很难被量化，会故意的忽略它，或者不惜牺牲大量的真实信息而强行的把这个因素变成一堆数字。实际上，在将数学工具的运用和数字检验作为判断经济研究成果是否有价值的西方经济学界，未经数学化的研究成果就很难得到发表，即使研究了也不会有什么影响力。所以对于难以用数字表达的因素，研究者们就学会了干脆不去研究甚至不去思考。这就形成了一个恶性循环，创新消失了，只剩下一堆无意义的数学公式，经济思维的僵化也就不可避免了。

张五常在《经济解释》里面谈到对概念的清晰定义的时候，说了这样一段很有趣的话：

“高斯提出了一个人所共知，但在此以前没有人曾明显地提出来的哲理。在千方百计地试行理解庇古（A.C.Pigo）的经济分析但总不明其所指之后，高斯写道：‘模糊不清的思想，是永远不能清楚证明是错了的。’

是的，概念或分析模糊不清，不可能清楚地错，所以也不可能清楚地被事实推翻了。要有被事实推翻的可能性，一个先决条件是：理论的本身要首先清楚地显示，它有错的可能性。‘下雨有云’可能错（但从来没有错）；‘春天开花’可能错（也从来未曾错过）。但假若我们不清楚什么是云，怎样才算是春天，对或错又从何说起呢？

在经济学上，模糊不清的概念多的是，所以无法以事实验证的理论——不可能清楚地被事实推翻的——层出不穷。最有名的模糊不清的理论，是马克思的《资本论》。例如“剩余价值”究竟是什么？一些学者说是租值，一些说是利息，一些说是利润，另有一些说是完全没有这样的一回事。说来说去都不清楚。马克思本人说‘剩余价值’是资本家付工资后所余下来的，但其他生产成本还没有被全部减除，又怎可以说是剥削工人之所得呢？其他在《资本论》中的概念，如‘上层建筑’之类，也是模糊不清的。”[1]

之所以说它“有趣”，是因为他在指责别人定义或分析模糊不清的时候，对“模糊不清”这个概念也定义得相当的模糊不清。

到底什么叫“模糊不清”呢？我们有可能绝对清楚的定义一个概念吗？

答案是：我们永无可能绝对清晰地定义一个概念，所以任何概念都必然是模糊不清的。对于“模糊不清”这个概念的界定，只能做程度上的判断，而无法做一分为二的判决。实际上，对模糊不清的概念和分析过程的纠正，正是经济学进步的重要方式。如果我们在一开始就把所有的概念都定义得绝对精确，那么创新就会停止，经济学也没有办法取得进步了。对本身就不清楚的研究对象，强行将其界定得非常清楚的后果就是让概念的界定偏离了其真实的状况。

“下雨有云”可以被证明是错的：只要有一天天上没有云的时候突然下起雨来就可以了。实际上，人类在认识世界的最初阶段，第一次试图研究下雨的规律的时候，只能得出这种模糊的判断。而这种判断本身就是人类知识的巨大进步。在此基础之上，人们再分析：什么样的云会带来降雨，什么样的云不会带来降雨。然后再产生抽象的气象理论，一步一步的前进。如果这个粗糙的认识在一开始就被指责为“模糊不清”而不被接受，那么人类对天气现象的认识也就没有了不断进步的起点。

在前面那一段引文的相邻部分，张五常还对凯恩斯的《通论》做了对马克思差不多的批判，认为其概念和思路非常混乱。作为宏观经济学这门学科的奠基人，凯恩斯怎么能在一开始就把他所想要研究的对象完全的界定清楚呢？后来萨缪尔森在《通论》的基础上进一步完善宏观经济学的理论体系，将很多凯恩斯没说清楚的问题说清楚了。这正是经济学这门学科不断进步的一种基本路径。再说，如果凯恩斯在一开始就要求自己把概念彻底界定清楚，不然就不研究经济问题，他能写得出《通论》来吗？

张五常虽然对马克思的“剩余价值”不以为然，认为主要是概念界定不清所致。但他自己却在另外的文章里面大发牢骚：作为最早把“合约”作为一个重要的经济学概念提出来的经济学家以及这方面的权威，他认为现在的很多研究合约问题的经济学者偏离了方向，根本就没搞清楚合约的真正含义就胡说一气[2]。这么看来，我们是不是也可以指责这是张五常咎由自取，一开始就把合约的概念定义得“模糊不清”，才导致了这种他所认为的偏差呢？

其实不管是马克思的剩余价值还是张五常的合约，我们都不能苛求他们绝对正确或绝对精确。就算张五常当时定义得再精确，也不可能把合约这个概念在所有维度上都界定清楚。后来的学者从各个方面根据自己的见解重新理解这个概念，并展开争论，正是推动合约问题研究的一种重要方式。至于是不是“幼稚”或者“偏离正轨”，那就另当别论了。但如果合约真的成了一个绝对精确的概念，那么对合约问题的研究恐怕也就很难深入了。

在面对模糊不清的概念的时候，实证主义经济学家解决问题的方法是众所周知的：数字化。也就是说在进行研究之前先把所有的概念都变成数学符号，然后用数学工具进行推理。虽然数字化也并非绝对清楚，但这至少是人类所能使用的最精确的分析工具了。这样的话，概念界定清楚了，分析过程也很清楚了，然后拿数据一验证，就可以解决经济学上的各种争论了。

真的是这样吗？

要理解这个问题，我们先来看哲学史上一个很著名的故事。就是大哲学家维特根斯坦的哲学观念的前后转变。

在西方哲学的历史上，在形而上学方面的争论一直是个很核心的问题，它总是在努力思考：世界的本质是什么？讨论一千多年，出现了无数的流派和大哲学家，也没能把这个问题搞清楚。后来大家发现，这种争吵很多都是由于彼此的使用的概念和分析工具有问题。既然在基本概念和分析方法上都没有达成一致，那么后面讨论起来就缺乏共同基础了。于是很多人就开始对概念和分析方法来进行清晰的界定：既然哲学讨论的工具是语言和逻辑，那么就就应该先把语言和逻辑搞清楚。

跟现在的经济学实证分析方法一样，这个学派界定过来界定过去，最后终于落到了把语言和逻辑变成数学符号然后进行数理推论上来了。这是一个必然的结果：数学工具是人类所能掌握的最精确的工具，要想把一切界定清楚，只能用它。最后到了维特根斯坦这里，终于达到了集大成的程度。维特根斯坦是逻辑哲学大师勃兰特·罗素的学生，他在《逻辑哲学论》中用七个命题精确的对形而上学设计的核心概念进行了界定和推理，在使用了一堆逻辑表达式之后，他最后说了一句“对于说不清楚的，我们必须保持沉默”。也就是说，在维特根斯坦看来，凡是能说清楚的都被他说清楚了，凡是没说清楚的，就都没有意义。

在完成《逻辑哲学论》以后，他觉得哲学问题已经被彻底说完了，无话可说了。于是放弃哲学研究，跑到乡下去当小学老师。

逻辑哲学论者号称自己彻底的解决了形而上学的基本命题：他们从语法结构出发，研究概念非常清楚、论证过程十分严密，似乎无懈可击。可是论证过来论证过去，说形而上学对世界的本质的关心完全是由于语法问题造成的，只要把语法规范了，形而上学的问题就不再是问题了。不管这种说法如何精确，它肯定是跑题了：人类对世界的本质、人生的意义的思考，绝不可能是出于语法错误。

维特根斯坦在当了几年小学老师以后，终于发现问题出在什么地方：原来日常语言所能表达的内容是如此丰富，不仅语法不能用数学结构来加以规范，概念不能以数学符号来进行代替，而且语言本身还要配合这人的表情、动作，以及当时的具体环境、人与人之间的了解程度等等来进行表达和交流。人类除了会进行逻辑思考以外，还会有不受逻辑控制的想象力、有感情、有痛苦、有爱憎……所有这些东西都是模糊不清而难以精确界定的，但它所包含的内容远远超过了精确而规范的数理逻辑。

这其实也就是如我们前面所说：对于社会生活和人类思想方面的概念，其本身并非数字，一经数字化精确界定，立即出现巨大的偏差，会损失丰富的重要的信息；再进行数学推导，由于数学中所蕴含的关系有很多并非社会生活和人类思想所真实具有，这些偏差就会随着数学工具的运用被不断放大，离现实越来越远。所使用的数学工具越复杂，离开现实的速度也就越快，最终只能得到一个很精确但是毫无意义的结论。

逻辑哲学论对逻辑学的进步具有重要意义，但对哲学的“贡献”，恐怕只是把哲学变成了一门彻底没有意义的学问。一些大哲学家比如亚里士多德、黑格尔、康德等人的著作虽然晦涩难懂，但只要用心看懂了，总会给人以思想上的巨大启迪。而逻辑哲学论者的著作，在剥离了一切他们认为不规范的内容以后，只剩下一堆没有意义的逻辑表达式和语法分析。它们并不以启迪思想为目的，而已消灭思想为己任。当把一切都变得精确了之后，存在的意义和自由思想就消失了。

我们还可以举一个更通俗的故事来理解这个问题：有一年的春节联欢晚会有个小品，说是一个老兵给新兵剃平头。这个老兵并不会剪头，拿着剪刀只想推平。可是怎么推也推不平，总是一边高一边低，推来推去，最后只好把所有的头发都剪掉，变成一个大光头——这下彻底推平了。

逻辑哲学论者，大概就像一个蹩脚的剃头匠，不懂得人类之所以要剃头不是为了实现“推平”这个形式，而是为了美观或者别的一些非形式的目的。这里存在一个“精确”和“正确”的矛盾：要把头发剃成“平头”，但又很难绝对保证每一根头发都一样“平”。逻辑哲学家们不管这些，他们只想把头发推平——也就是想一劳永逸的解决所有问题，消灭所有争议。在把一切问题都加以符号化以后，各种喋喋不休的争论终于完全被排除到哲学的研究范围以外——这个世界清静了。哲学也就被剃成了一个大光头，什么也没有剩下了。

随着数学在经济学中的滥用，越来越多的经济学家开始认同只有用严谨的数学表达出来的经济关系才算是严肃的经济学研究，只有通过复杂的计量检验的模型才有价值，此外还有很多细节上的规范，总之就是把经济学变成一门完全清楚的、科学的学科。当他们做到这一点之后，大家也都惊奇的发现：经济学也被剃成了一个大光头，和人类的现实生活完全脱离，除了数学，已经没有什么意义的东西剩下了。

维特根斯坦复出以后，声称自己以前的研究犯了严重错误，再重新写作了《哲学研究》一书，用日常的语言表达自己的哲学思想[3]。逻辑哲学这个流派，在发展到极致以后，迅速式微。

对于张五常所引用的那句高斯的话：“模糊不清的思想，是永远不能清楚证明是错了的。”我们可以这样予以辩驳：在研究关于人和社会的问题的时候，模糊不清的思想，可以通过被指出模糊在哪里而被证明是错的并加以改进。而绝对不模糊的思想，如果被证明是对的，也没法知道它对在哪里；如果被证明错了，也没法知道它错在哪里，因为它论证的前提和推理依据都是不现实的。“要求绝对清楚”这个原则，本身就与它所研究的对象的特征不符。

俗话说的好：你永远无法叫醒一个装睡的人。既然在一开始就故意犯错，那就谁也拿它没办法。

为什么这么说呢？

首先看一个最简单的例子：1+1=2。这个命题本身是绝对正确和绝对清楚的，不可以被证伪的。因为我们先定义了10进制，再来进行加减。在10进制中，2这个符号的定义就是1+1。所以说，1+1=2是因为我们首先把2定义为了1+1。

再往前看，“所有天鹅都是白的”这句话看起来是可以被证伪的——只要发现黑天鹅就行了。但它之所以能被证伪恰恰是我们对天鹅的定义不是非常清楚。也就是说：就算对天鹅的界定在其它方面是清楚的，但至少在颜色这个维度没有对天鹅的概念进行清楚的界定。如果我们先将天鹅的颜色进行清楚的界定：只有白的才是天鹅。那么“所有天鹅都是白的”就没法被证伪了。于是，理论研究者就从理论上取得了胜利，而再也无需劳神费力的去寻找黑天鹅了，因为即使找到了也不能算是天鹅。在概念彻底界定清楚以后，争论消失了，人类在颜色这个维度上对天鹅的认识也就到头了。

再回头来看我们对索洛模型的批评：它讨论投资、劳动力与国家经济增长的关系的时候，只关注资本、劳动力、经济增长的数量化的属性（也就是多少美金、多少人、GDP产值），算是把概念彻底界定清楚了，而丢掉了其它重要的非数量属性，最后得到的公式其实是不可证伪的。由于该模型在一开始就把对经济发展最重要的因素排除在外，那么这些“外生变量”的变化最多只能影响模型参数，而不能推翻该模型。如前所述，用一堆数据总能回归出一个能通过数字检验的模型出来。换而言之，这个模型就是为了通过计量检验而生的，而不是为了解释和解决实际问题而生的。通过了实证检验就算是成功了，而是否符合经济运行的实际情况则无关紧要[4]。

说到这里，我们已经明白的表达了一种观念：数字和事实是两回事。数学检验和实践检验是不能划等号的。当一些赞成实证主义的经济学者振振有词的声称：经济模型一定要经过实证检验，才能暂时的被接受，一旦被事实证明是错误的，那么它就被推翻了。这段话听起来非常客观公正，其实已经混淆了事实和数字之间的关系：数字是反应实际情况的一种形式，它只在形式上很精确，实际不一定精确，甚至不一定正确。将数量检验当成实践检验，属于典型的“概念模糊不清”。

检验的工具，应该比被检验的对象更加准确，这样的检验才有意义，我想这是我们说“检验”这两个字时候的应有之义。

然而大部分经济数据都只是统计上的近似，它们的与现实经济情况的误差将会随着每一次运算而被放大。

比如，某年美国总统选举的电话调查显示A候选人当选的概率是65%，B候选人当选的概率是35%。这个数据看起来很精确，其实已经相当的模糊了，跟现实情况肯定存在很大的差距。然后，A候选人主张实行某种积极刺激经济增长的政策，而B候选人主张实行某种中性的经济政策。根据经验研究，如果执行刺激经济增长的政策，则可望推动经济多增加1%，而如果实行中性政策，则可望增长0.5%。我们也知道，这个经验研究的结果也是相当模糊的。如果有人把这两件事情结合起来，预测说明年经济增速增加1%的可能性是65%，而增长0.5%的可能性是35%，那么这个结论的误差就相当惊人了。

实际上，我们的各种经济统计数据，都存在着巨大的误差，不仅有统计学上的误差，还有人为因素的影响（比如粗心调查员的记录错误等）。在对待这些数据的时候，必须十分小心，它们本身或许还可以作为事实来加以接受。如果进行加减乘除，其误差就会不断被放大。计算步骤每多一步，误差就会增加一些。而且，就像我们在前面所说的，这种误差不是数学的发展可以解决的，越是高级的数学，就意味着用一步计算来代替许许多多简单的加减乘除的计算，只会让误差放大的更快。对于到底经过多少步骤，这种误差才大得不可接受，我们不能确定。但可以确定的是：越复杂的计算越不靠谱。运用高级的计量工具，对这些数据进行计算，然后用来对数学模型进行检验，能靠得住吗？

从统计学的角度来说，这无非是一个概率问题。虽然我们不能完全确定，但总的来说，正确的模型通过实证检验的概率会大于错误的模型。

就某一个具体的模型而言，可能会是这样。但就整个经济学来说，则完全不会是这样。由于统计检验的小概率事件的出现是不可控的，所以也就始终存在着淘汰正确的数学模型的可能，并存在这接受错误模型的可能。在经济活动中，正确的解释只能有一个，而错误的解释有无穷多个（或者说——模糊一点但更正确一点——正确解释的集合占所有可能解释的集合的比例是极低的甚至是无穷小）。如果淘汰正确的解释和接受错误解释的概率均为5%，而对某一事件的解释，正确的模型是1个，同时还有很多人提出了100个错误的模型，大家都来接受实证检验。那么，最后正确的模型被接受的概率是多少呢？是95%。而这些错误的解释中至少有一个被接受的概率是多少呢？是99.4%。

在真实的经济学研究中，利用统计模型淘汰正确解释的概率毫无疑问远远超过5%，而在学派林立的经济学界，对同一个问题的不同解释恐怕远远不止100个。在这样的情况下，我们怎么能认为用一堆统计数字来检验一个数学模型的方法，能最终让经济学变成“科学”呢？反过来说，在这种方法成为经济学的核心研究方法的情况下，我们怎么能不认为经济学将不可避免的变成一门“伪科学”呢？

三

这个时候我们就得反思：为什么这种方法在自然科学领域就行得通而在社会科学就行不通呢？

因为自然科学可以在实验室里面对一个理论进行多次的重复实验，而经济学的理论大部分没有办法进行低成本的重复实验。弗里德曼在他的《实证经济学方法论》里面认为对以往数据的搜集可以近似的看成是重复实验。这个观点是非常非常非常荒谬的。

首先，过去的统计学者不可能知道未来的经济学家需要什么样的数据，现在的统计学者也不可能知道未来的经济学家需要什么样的数据。经济理论的创新，必然要提出新的概念或者运用新的分析方法或者得出新的结论，这些东西不可能被提前预知并加以统计。数据产生的同时，对于如何得到数据的大部分信息都会消失掉（我们可以得到CPI的数据，但无法知道物价调查员和被调查对象之间谈话的详细内容，这里面包含了我们现在对CPI界定范围之外的其它维度的信息，这些维度是现在的经济学研究所不需要或者认为不重要的，而未来的经济学家可能会发现这些维度起着极为重要的作用）。

其次，主要的经济数据都是经济社会系统中产生的结果，受到整个经济社会系统无数不可知和不可控的因素的影响。物理学家可以在实验室里面按照新理论的要求设计新的实验来获得想要的数据，获得尽可能不受干扰的数据，而经济学家则没有这样的实验室。经济统计数据和实验室里面得到的数据完全不是一个概念。

第三，弗里德曼认为只要能够预言某个现象会产生，而它确实产生了，就算这个理论成功了。我们先不说弗里德曼所说的“现象”其实是在说“数据”——这个偷换概念的把戏前面早已批判过了。单就“预言”来说，自然科学的预言是可以重复不断的“预言”的。比如重力加速度这个公式，我们可以预言一个物体从100米的高处调到地方要花多少时间。这个预言可以重复不断的试，每次都能预言成功。而经济学的预言，能预言对一次就算很厉害了，所以很多根本没有学习过经济学的人，都可以在金融危机过后声称：“我早就预测到金融危机会发生了。”我们能认为这个人的预测方法就是可以接受的吗？每天打开电视都会有一堆股评家在推荐股票，他们总会有人蒙对上涨的股票，但好像很少有人连续不断的预测正确。经济学莫非就要靠这样成为科学吗？如果重力加速度这个公式，成功预言了第一次落体的时间，但第二次却差了很多，或者说前三次对了，后面都没预测对，这个物理公式有可能被接受吗？

弗里德曼的这种观点，中间不知道混淆了多少基本概念。“可重复”和“不可重复”是一个定性的判断，其实包含了三个必须（至少是近似的）定量回答的问题：重复实验的可能性有多大？重复实验的成本是可以接受的吗？重复实验的近似程度是多少？不理清楚这三个问题，讨论可不可以重复实验是没有意义的。

经济学理论并非是完全不可以重复实验的。但大部分实验的成本极高，使得它们不可能有很多机会被实践检验，而且即使进行了实践检验，由于实践中的结果只能作为经济社会系统的整体产出加以观察，这种结果对理论进行检验的可靠性也并不是很高。

弗里德曼作为世界著名的经济学家，他的理论获得了不少进行实践检验的机会。其中与中国关系最密切的是上个世纪八十年代末期，刚刚获得诺贝尔经济学家的弗里德曼访问中国，会见了中央和省级诸多高级领导。在这个过程中，弗里德曼努力推销他的经济观点。这种推销是否起到了直接的效果很难说。但在弗里德曼访华结束后不久，中国就开始进行著名的“价格闯关”改革，试图一次性全方位的放开各个领域的价格管制，以建立完善的价格机制。这个改革的目标和方法都和弗里德曼所推销的观点基本一致[5]。最后的结果是物价飞涨、经济失控，并由此导致了严重的政治危机，是迄今为止中国改革开放所遭遇过的最严重的挫折。这样巨大的成本，和物理学家在实验室里面做实验的成本，完全不可同日而语。

经济学理论的实践对象是由人所组成的经济社会，其重复实验的成本高的惊人，任何一个成熟的政治家，都不会轻易的将一种新理论付诸实践。一旦错了，整个社会和政治家本人的利益，都会遭受巨大损失，这就决定了经济理论被重复实验的可能性非常的小。

按照支持实证主义的经济学家的貌似客观公正而且非常谦虚的观点，一切理论都只能是“暂时”被接受，一旦被实践所证明是错的，就不能被接受了。可弗里德曼的理论（或者说弗里德曼所支持的理论）在中国的实践完全失败以后，弗里德曼本人仍然是当之无愧的经济学泰斗，这些理论还是继续大行其道，完全没有“被证伪”。不仅中国的实践，后来俄罗斯改革的“休克疗法”造成了更大的灾难，这些理论还是没有被证伪。这是为什么？

如前所述，这些理论其实是不可证伪的。由于经济实验所得到的结果只能是经济社会系统的整体产出，所以就为理论的自我辩解提供了无限的空间。在中国没有成功，在俄国也没有成功，它都可以找到借口为自己辩解，是由于这个制度或者那个文化等原因造成了该理论没有发挥应有的效果，但并不影响理论的“科学性”。总而言之，实证主义的实质就是：一个理论只要在数学上被证实过，那么它就不能被实践所证伪了。实在和数字都不能完全对上号，那么改变几个参数就可以了。总之，只要它运用的数学工具没出什么纰漏，它就是绝对正确，跟1+1=2一样，是不能被推翻的。经济学上的实证主义方法，是一种在理论上不可证伪的伪科学。

我们在这里所说的“经济学上的实证主义方法”，是指那种强调数学推理和数学检验在经济学研究中具有决定性意义的方法论。弗里德曼的《实证经济学方法论》中所提倡的那种方法只是其比较极端的一种类型。此文所提倡的“前提不相关”理论，由于过于荒谬，在真正的经济学研究中已经被基本抛弃。目前主流的方法论是对此加以改进的：强调核心假设或者说主要假设应该尽可能的符合实际。这种修订是非常必要的。但是，它并未在实质上改变将数学推理和数学检验作为经济研究的核心地位的方法论，因而也就不可能从根本上否定弗里德曼的实证经济学方法论。

首先，仍然强调数学推理，那么就不可避免的为了将研究对象符号化而牺牲前提的真实性；其次，结果的检验仍然比前提的真实性更为重要。这样，“符号化”是一个直观的强制性标准，数学检验也是一个精确直观的硬指标，而“主要假设真实”只是一个没有实际约束力的模糊不清的要求。这样，弗里德曼的“前提不相关”理论实际上并没有被推翻，只是多穿了一件“接近真实”的外套罢了。这也是为什么大家都觉得“前提不相关”理论很荒谬，但是批判过来批判过去，弗里德曼的实证主义仍然能够屹立不倒的主要原因。

由于人类对客观世界的认识总是存在着偏差，只要我们进行抽象理论的研究，就不可能要求所有前提都完全符合现实。这样，要求前提完全为真是不合实际的，因此由任何前提推理出来的理论都必须独立于前提接受检验。在这个层面上说，弗里德曼的“前提不相关”理论其实是非常实事求是的。

但是，如前所述，前提与现实的偏差有大有小，并不是大小无所谓；推理的过程所反映的因果关系有真有假，并不是只要数学上正确就OK；结果的检验也总是模棱两可，并不能保证绝对的证实和证伪。在这种情况下，把判断一个理论可否被接受的所有权重都压到结果检验上，是错误的。

实际上，结果检验的重要性，应该由三个因素决定。也就是我们前面提出的三个重复实验的问题：重复实验的可能性有多大？重复实验的成本是可以接受的吗？重复实验的近似程度是多少？

在自然科学中，物理学家可以说：“我的假设前提真假无所谓，重力加速度中的G的存在是上帝安排的也好，是自然存在的也好，或者根本不存在，只是一种统计学上的暂时的近似也好。但我的加速度公式每次都能准确预测重物从一定距离上掉下来的时间，所以这个公式可以被接受。”这种说法没问题，因为这个实验是可以不断的低成本重复的，可以在一个把外部变量控制得很好的环境（比如真空实验室排除空气影响，或者至少往下扔铁球的时候没有刮大风等等）中反复实验。

但经济学家不能这样说。大部分原因前面已经阐述过了，但还有一个很重要的原因没有提到：

物理学家的前提真假无所谓，是因为人类的对自然世界的认识只能从表面现象入手，逐步深入，不可能知道超越人类认识极限的“真实情况”，也无法探求世界变化的终极的“因果关系”，只能“猜测”，然后用实验来检验。但经济学研究的对象是人，人和树叶、铁球、原子这些东西有一个本质的不同：人和经济学家是同一个物种，彼此之间可以互相了解。通过对自我的反思和与他人的沟通，我们可以知道什么是“真”什么是“假”，也就是经济学研究的基本对象其真实的内核是可知的。

这样我们就可以批驳弗里德曼《实证经济学方法论》当中所举的两个例子的荒谬之处了：

第一个例子说是研究树叶的趋光性。弗里德曼认为，我们可以假设树叶里面有一种“意识”存在，就是喜欢朝着光生长；也可以提出别的假设比如叶绿素与阳光当中紫外线的关系等等。只要我们能得出一个公式，能够很好的预测树叶趋光的特点就行了。这里例子勉强说得过去：如果人类没有办法证明叶绿素等其它树叶内部的基础组织的存在及其机理的话，我们就只能猜测和假设，然后用实践检验。

我倒可以举一个更加真实一点的例子。在量子力学的发展历史上，对量子行为规律的解释曾经同时出现过两个不同的公式，一个是薛定谔公式、一个是海森堡公式。薛定谔公式是用经典数学形式来表达的，而海森堡公式则是用矩阵表达式在表达的。这两个公式在预测量子运动规律方面完全等效，都和实验结果符合的非常好。但它们的前提却截然相反：前者是建立在量子是连续性的假设上的，而后者则建立在量子是非连续性的假设的基础之上的。那么量子到底是具有连续性还是非连续性呢？在这两个公式提出来的时候，这个问题根本没法知道。所以我们只能说，只要它们总是能符合实验结果，那么这两个公式就都是可以接受的。

但是，弗里德曼所举的第二个例子就有问题了。他说对于台球运动员来说，假设他们是出于熟练和经验把球打进，还是假设他们按照一组函数计算出球的运动轨迹，都是无所谓的，只要能准确的预测击球结果就可以了。我们知道，台球运动员不是树叶：他们会开口说话。我想应该不会有台球运动员会承认自己击球的时候脑子里面在紧张的求解一道函数题。这个问题只要我们稍微了解一点点台球知识，自己拿一根球杆趴下去试一下就可以知道真伪了。这个时候，由于我们已经明白无误的知道了真和假，再故意假设台球运动员在解函数就不行了。因为即使在物理学中，如果有更精确的办法观察并证明量子不具有连续性，那么薛定谔公式即使和实验数据符合得非常好，也不能被接受。怎么到了经济学这里，连这个也不承认了呢？

其实要真的让实证经济学家去研究台球运动，他们很有可能真的搞出一组没有多少人能看懂的函数出来，然后用一堆数据声称这是科学。因为函数是一个比经验更容易精确定义的对象，在面对真相与精确程度矛盾的时候，实证经济学家似乎总喜欢选择精确而非真实。

而且，经济学研究不能只追求现象的拟合。如果一个理论很成功，那么它就会对实践产生影响。如果我们认为假设运动员在解函数的理论非常“科学”，那么在实践的时候就应该把台球运动员拉到大学课堂里面先学习一年半载的函数理论，考试合格了再来打台球。我们对这样的培训方法一点也不用感到惊讶——这种方法最多也就废掉一批有天赋的台球运动员的前途而已，而实证主义研究出来的“科学”理论，不顾实际情况而胡乱加以运用，给社会经济带来的破坏，远甚于此。

尽管弗里德曼在那篇长文中花了很大的篇幅来论证说，这种不切实际的假设推出来的结论只是为了方便的解释某一些现象，而一旦超出了一定的范围，就不能乱用。还举了两个例子说明完全竞争模型的预测能力，一个可以解释，一个不能解释。但这种说法非常模糊不清和缺乏可行性。完全竞争模型到底可以解释哪些现象？在什么范围以外就不能适用？说到底，他就是在说：和该理论预测的结果相符的现象就是该理论能够解释的，不符合的就是不能解释的。

这种说法一点也没有冤枉弗里德曼，因为他本人在实际运用他自己的理论的时候，就压根没注意假设前提是不是与实际情况符合，毫不客气的拿着他那一套理论在给中国提意见。实际上，如果一个理论不要求前提和推理过程符合实际，只追求结果的可检验性，我们怎么可能在知道结果之前分清楚它在什么情况下能用，什么情况下不能用呢？

四

我在博士生一年级的时候选修了陈**老师的经济模型这堂课。陈老师在课堂上谈到经济模式的时候说，经济模型的一般公式Y=F(X)+e，最重要的其实不在于F(X)的具体表达形式，而在于这个模型的假设和后面的那个残差e。是假设决定了F(X)的表达形式，而e则代表了这个模型无法解释的内容。“假设”是模型建立者的创造性思维的体现，而e则为后来的创造预留了空间。至于F(X)的推导，则只需要运用成熟的数学工具就可以完成了，不存在经济学上的创新。简而言之：经济学家管两头，数学家或者计量经济学家管中间。或者说，数学家或计量经济学家负责提供工具，经济学家负责拿来研究经济问题。

这段分析很有意思，听起来很有道理，对我启发颇深。但现在想来，这种说法大有问题。它有一个隐含的前提：经济学的概念都可以或者应该用Y=f(x)+e来表示。也即在进行假设或创新的时候，需要把思维变成数学符号。而经济关系也都只能用数学公式来加以表达。所以它表面上在说经济学家管两头，数学家或计量经济学家管中间，其实这只是一层外套，其实质仍然是：数学家既管中间，还管两头。因为中间这个管道能够通过的东西已经给你限定死了，不符合管道口径的东西就进不来，也出不去。

杀死一只鸡，并不需要把它放到锅里从头到尾全部炖烂，只要掐住它的脖子就足以做到了。

弗里德曼在《实证经济学分析方法》的最后谈到这种分析方法与创新的关系时说：

“实证经济学的进步不仅需要既有假说的检验和完善，而且还有赖于新假说的创立。对于后者我们尚缺乏能上的了台面的论述。假说的创立是集结灵感、直觉与发明的创造性活动，其核心要点在于从熟识材料中发掘新意。这一过程必须归由心理学讨论，而不应列入逻辑的范畴；只能在自传与传记中加以研究，而并非科学方法的专著中所能讨论的……”

这段话和维特根斯坦在《逻辑哲学论》中的最后一句话“对于说不清楚的，我们必须保持沉默”非常神似，不仅意思差不多，而且都放在了全文的最后，看起来把疑问都切除清楚了，其实给自己的理论留下了一条致命的尾巴。弗里德曼虽然没有说要对创新保持沉默，但还是一刀就将对创新的研究从科学方法中切除了出去，我们不妨给这种论调起个名字，叫做“弗里德曼剃刀”，专门负责为了追求表达的精确性而把创新思维和实际意义从社会科学中剔除出去。

在弗里德曼看来，自己是在讨论科学问题，而创新则是另外一个问题。实证经济学将可以说清楚的已经被说清楚了，而创新则应该被归到另一个不相干的部分去研究。其实分析方法和思想创新绝非互相割裂的两个部分，它们是一体的。弗里德曼在认为对创新的研究乏善可陈的同时，并没有意识到：自己所提倡的实证经济学分析方法，就是对创新最大的限制。

在这种分析方法中，数学检验被看得高于一切。为了迎合这种检验，在分析之前，概念被要求界定非常清楚，要用数学符号来表达，而是否符合现实则被放到次要的位置；推理要求用数学工具来进行，是否代表了真实的因果关系则被放到了次要的地位。

这样，经济学者的创新思维，就被限定在了数学工具所能表达和推理的范围之内。如前所述，真正的创新在一开始一定是模糊不清的，有一个不断深入的过程。真正重要的新思想从提出到完善，可能需要很多人甚至很多代人的努力才能完成。它在最初必然非常粗糙。要求一个人凭借其天才完成从提出新观点，到把研究对象彻底搞清楚，然后从数学上定义新概念，最后构建数学模型的全过程，几乎就不可能[6]。于是，原创性的思维被扼杀在了摇篮里——它们根本找不到发表并产生影响力的渠道。进而言之，如果一个经济学者要想自己的文章被发表，他最好根本就不要去思考这一类的东西，以免坏了自己的前途。没有了原创性的思维作为起点，后续的展开也就无从谈起。于是，经济学者只能在已经被研究得很成熟的领域内细抠一些数据，抠来抠去，最后只能比拼谁的数学玩的更复杂更精巧。

林毅夫在和他的学生讨论经济学分析方法的时候说：

“理论模型无非是帮助我们了解社会经济现象的工具，既然是工具，只要能达到目的应该是越简单越好。”“在八十年代数理经济学达到最高峰时，当时十个数理模型用得最好、最闪耀的年轻经济学家，到了九十年代发表的文章都只用很简单的数学。”

从这些话及其上下文来看，林毅夫对于经济学中数学工具的滥用也是不以为然的。但他还是说：

“我想最早在应用数学时无非是希望使经济学的理论更严谨一些，但是现在确实出现了不用数学就很难在好的经济学杂志上发表文章，就很难进入主流经济学界的情形……对于同学们来说，我认为数学是加入经济学家俱乐部的门票……你们要掌握数学工具，这样才较容易在一流的经济学刊物上发表文章，被国外一流的经济学家接受。不过，当你们过了门槛，成了一位有影响的经济学家的时候，就不能让数学来限制你们的思维。[7]”

这段话说的何其轻巧！为了发表文章，学习一些明知没有意义的东西——明知不对而故意迎合，首先态度就不对。而且数学不是说学会就能学会的，需要耗费很多年的心血才能运用自如。且不说这是多么巨大的浪费，一个人在这样学好了复杂的数学工具，成了一个有影响的经济学家之后，他的思维模式就那么容易转变么？一个人那么容易放弃自己所赖以功成名就的基础么？维特根斯坦的转变在人类思想史上实属凤毛麟角。对大部分人来说，恐怕真实的情况是到时候不仅要让数学限制自己的思维，还要拿去限制别人的思维。

林毅夫对数学在经济学中的滥用提出了自己的分析：

“产生这种现象，我认为有这几方面的原因：一方面是经济研究主要集中在最发达的市场经济国家，这些国家社会经济相对成熟、稳定，新的经济现象不多……第二方面，数学也是一个门槛。要想成为美国一所著名大学的教授，必须在最好的杂志上发表文章，好的杂志必须有个挑选文章的标准，一般在没有很多新的问题可以讨论时，就只能用数学的严谨和艰难作为挑选的标准，所以数学就变成一个经济学家俱乐部的门槛。”

这两个原因其实是一个，主要还是说发达国家经济社会相对成熟，没有什么可研究的新的经济现象了。这个问题需要从两个方面分析：一方面，林毅夫说的是客观事实；另一方面，作为经济学者，提不出新的思想来推动经济社会的变革和进步，也可以说是造成“经济社会稳定”（说的不好听就是僵化）的一个因素。这是一个相互影响的关系。就算前一个方面起了主要作用，后一个方面的影响很小，经济学者总是难辞其咎。西方思想史上认为学者有当“牛虻”的传统，就是要像个蚊子一样叮咬这个社会，让它感觉到疼痛难忍以保持警醒，进而保证社会的活力。在雅典民主制度的繁荣时期，苏格拉底就一直坚持对社会的各种弊病提出深刻的批评，最后无法见容于当时的社会而被判处死刑。现代发达国家的经济学者再怎么鼓吹新思想也不用担心面临刑事处罚，却自满于社会的繁荣，不努力于改革社会，以比拼数学技巧来取得崇高的社会地位，以研究和要求别人研究极细微的事物为能事，这无疑是一种集体的堕落[8]。

所以说，经济社会稳定是原因，但不能成为借口。中国的经济学者要研究中国的情况，推动中国社会的进步，保持活力而不走向僵化，就不能为了赢得国外主流的承认而与之同流。

五

至此，我们对实证主义的经济分析方法的批判已经基本完成，接下来的问题是：如果不承认这种分析方法，我们应该建立或者提倡一种什么样的分析方法？

对比我们在前面提到的自然科学的研究与经济学研究的主要差异，可以给回答这个问题提供启发：

自然科学研究的对象是一个从外到内逐步深入的过程，在这个过程中，自然科学家始终无法知道其中为“真”的内核是什么，也无法知道现象之间的真实的因果关系是什么。但是，自然科学可以通过低成本的多次重复实验来对理论的预测进行检验。

经济学家所面对的情况正好相反。经济学研究的对象是人，经济学家可以通过反照自身和与他人沟通知道其中为“真”的内核。经济现象之间，也存在着真实的可知的因果关系。但是，由于重复实验的成本太高，重复实验的结果也很模糊，存在多种解释的可能，经济学家通过预测结果来检验理论的机会很少，也很不可靠。

在这种情况下，用研究自然科学的方法论来指导经济学的研究，无疑是十分荒谬的。正确的方法应该是：自然科学强调预测结果的检验，而经济学则强调前提和推理过程的真实性。或者说，自然科学对预测结果的精确性和可检验性要求很高，而对假设前提和推理过程符合真实情况的要求就低一些；经济学对预测结果的精确性和可检验性没有办法要求很高，因此就要把主要关注点放到对前提和推理过程的真实性上来。

这里并不是说经济理论不需要接受检验，而是强调一个“证明力权重”的概念。一个理论可以分为三个部分：前提、推理过程、结论。由于人类认识的局限，研究的前提和被研究的对象之间一定存在偏差，推理过程和真实的因果关系也一定存在偏差，对结论的检验也一定存在偏差，无法绝对的证实和证伪。因此，这三个部分没有一个部分可以拒绝接受检验，也即不存在只要其中一个或两个部分通过检验，另外的部分就无需被检验的理论。而且，即使这三个部分都被认为可以接受，这个理论也只是模糊的被接受了而已。

因此，一个理论能否被接受，该理论所研究的对象的特点将决定了它的前提、推理过程、结论的真实性的程度上的要求不一样，或者说占据了不同的“证明力权重”。如果一个理论的前提可以保证非常正确，推理过程也很正确，那么结论的检验就可以比较宽松一些；如果一个理论的前提偏离事实很远，推理过程也和真实的因果关系差的比较大，那么对结论的检验就必须非常严格。自然科学可以保证严格的结果检验，对前提和推理过程的要求就可以放松；经济学保证不了严格的结果检验，但更容易保证前提和推理过程的真实性，那么就应该注重这两个方面。

这里说的“推理过程的正确性”并不是指数学上的正确，而是指它和真实的因果关系的符合程度。一般来说，合格的自然科学家和经济学家都不应该在基本的逻辑和数学计算上出错，这也不是本文要解决的问题。数学关系既不自然界真实的因果关系，也不是社会中真实的因果关系，只是人类思维规律的一种体现。数学计算没有出错，不代表推理过程正确。

研究社会现象之间的因果关系，首先就要回答：生活在社会上的人是用什么来产生“关系”的？大部分情况下，人类是通过语言来交流的，人类自身也主要用语言进行思考。这个时候，语言而非数学符号和数学公式才是最适合于研究经济现象和分析现象之间因果关系的工具。

人类的思维和行为都存在着模糊性，数学工具表达的虽然精确但是范围很狭窄，而语言虽然相对模糊但同时能表达的范围更宽，其模糊性可以更好的“拟合”人类的思维和行动。因此，语言及其语法逻辑可以“带着模糊性进行模糊而正确的推理”，而数学工具必然在消除模糊性的同时进行精确但错误的推理。

我们可以说：语言、逻辑、数学这三个工具，存在这模糊性和表达的宽度之间的不同程度的组合。数学模糊性最小，但表达的范围最窄；语言的模糊性最大，但表达的范围最宽——经过规范的学术用语准确性提高了，同时也牺牲了一部分表达宽度；逻辑则介于二者之间。在研究不同类型的对象的时候，应该根据实际情况不同程度的使用这三种工具。如果是要描写人类的感情、勇气、信仰这样一类非理性的东西，用日常的语言表达最好——最模糊但最贴切；研究人类的理性行为包括经济选择，用规范性语言和逻辑最好；研究天体运行、树木生长这样完全客观的自然现象，用最精确的数学最好。当然，这只是一种模糊的界定，实际情况是三者都要用。物理学家也要用文字串联论文，也要用一些逻辑推理，但数学工具无疑是核心；日常生活中，语言交流最重要，但数学工具也有用——亲兄弟明算账的事情并不罕见。

经济学不可能离开数学，不仅如此，还应该提倡用数据说话，提倡深入调查获得第一手的数据资料，但必须注意两点：

第一，数据本身不能说明一切，背后一定要有真实的经济关系做支持；

第二，对取得的数据不能没有限度的计算和推导，不能用数学工具代替对真实的经济关系的思考和分析。

在面对一些规范语言和逻辑表达不清的概念的时候，一些很不严谨的日常生活的用语也不应该被拒绝——只要它们能很好的帮助我们认识和理解真实的经济现象即可。而这一切——只要人类整体上在经济选择中表现出理性——也不能改变规范语言和逻辑推理作为经济学核心研究方法的地位。数学工具，只能在经济研究中处于辅助性的位置。

根据被研究的对象的特点采用与之最相符的研究工具，而不是拿着最复杂的工具去生套被研究的对象，这才是研究经济现象所应该具有的实事求是的态度。

针对数学工具在经济学中被滥用的现状，我们必须提出以下明白无误的限制：

（1）数学符号的定义、模型推理的过程以及最终模型所代表的经济学含义，必须用语言完整的表达出来，达到即使没有数学模型也可以使研究者的观念能够被完全理解的程度，这是保证理论的前提和推理过程符合现实和真实的因果关系的基本要求；

（2）如果以上要求不能满足，那么使用数学模型的研究者就必须证明：该模型的预测结果可以低成本的进行多次重复实验以接受检验。如果这种重复实验可以在条件可控的环境中进行，那么对重复实验的次数的要求可以降低；如果这种重复实验只能是社会实验，那么就必须证明可以进行数量非常大的重复实验以排除系统干扰[9]。模型的推理过程越复杂，使用的数学工具越高级，这种要求就越严格；

（3）如果以上两点均无法满足，那么该理论就存在结构上不可证伪的缺陷，或者说论证不足，不能被接受[10]。

这三点要求的意思很明白：经济学的理论要么在前提和推理上非常可靠，要么在结果检验上非常可靠，它不能在提出前提和进行推理的时候按照自然科学的标准要求自己，在接受检验的时候又按社会科学的较低标准要求自己。在电脑和统计软件非常普及的时代，这种严格的限定非常必要。电脑只会进行计算，而不会负责判断计算过程有没有意义、是否代表真实的经济关系。它极快的计算速度和超强的拟合数据的能力足以让经济学研究者迷失方向[11]。

反之，对于使用规范性语言和逻辑为核心分析方法的经济学理论，由于其使用的工具能更好反应被研究对象的真实思考和反应真实的因果关系，同时也使理论的前提和推理过程能够非常明白的独立接受事实的检验，其前提和推理过程的“证明力权重”就更高一些，那么对结果的检验的要求就可以相对较低。

简而言之，对于这种分析方法的要求可以概括为：第一、前提、推理过程和结论都应该尽可能的符合真实情况，也即尽可能的实事求是；第二，要有创新，要研究新现象，或者提出新观点新思路。

要让前提尽可能的符合实际情况，就要求经济学家在研究经济现象的时候尽可能的深入实际全面了解与这种经济现象相关的所有信息，既包括数字形式的信息也包括非数字形式的信息，而不是关起门来玩数据解方程；要让推理过程尽可能的符合实际情况，就要求经济学家在思考问题的时候尽可能的从被研究对象的角度思考问题：如果要研究中国的经济情况，就要尽可能了解中国人的思维方式从中国人的角度来思考和分析，而不是不管三七二十一拿着数学工具就往上套。

在此基础上，理论的预测结果也应该尽可能与实际相符合。由于重复实验的难度很大，所以结果的检验只要基本符合实际情况即可。在前提和推理过程可信度很高的情况下，只要它能真的预测正确一次两次，那么我们就可以说这个经济理论取得了很大的成功，因为它的预测是建立在真实的基础之上的，而不是靠猜出来的。

随着时间的推移和地点的变化，理论的前提和因果关系将会发生变化，这时一个曾经预测成功过的理论就会和实际情况产生偏差。经济学者继续从新的实际情况出发，对前人的理论的前提和因果关系进行纠正，产生新的理论，提出新的预测接受实践检验。经济学就这样不断取得进步。

这就是我们所提倡的实事求是的分析方法。

六

当我们在描述实事求是的分析方法内涵的时候，可能会遭受这样的诘问：“尽可能接近真实”是什么意思？这是一个模糊不清和缺乏可操作性的标准，如果没有对它进行明确的界定，这个标准岂不是等于虚设？

这个问题是一把典型的“弗里德曼剃刀”，其隐含逻辑就是不精确的概念就没有意义。须知，没有明确的界定和没有界定不能划等号。“尽可能接近真实”对于任何一个接受过高等教育的经济学研究者而言，都是极易理解和非常明白的。他们按照这个标准去研究经济现象，写出来的文章拿去给这个领域的专家评价，专家们对其研究是否做到了“尽可能接近真实”可以做出判断，一些介入这个经济现象中的人也可以判断研究者的论述是否符合他们所了解的实际情况。所以它在定义上看似模糊不清，但一旦落到具体问题上，就会立即变得清楚起来而且很容易操作。相反，一旦我们试图把它界定得极为清楚，比如“与事实的符合程度最少达到95%”，只会导致更大的偏差。因为事实不仅包括数字，还有很多其它维度的信息，而语言中的“符合”这个词所能表达的维度是很多的，能够尽可能的与事实相符。一旦变成了95%这个概念，那么事实的其它维度将立即被清除出去，只剩下数字这个维度。最后落到实践上，学者的研究要满足这个标准，就只能去研究数学。

为了彻底澄清这个问题，我们来看一个故事。禅宗公案《碧云录》第一卷第四则讲了我国唐朝著名的禅师德山宣鉴开悟的故事：

德山和尚对佛经的研究非常深入细致，认为佛经上说的都是真理，修行的各种规范也都不可更改。他听说禅宗主张通过“不立文字，直指人心”来领悟佛法，觉得完全是离经叛道。于是背上他的《金刚经疏钞》到禅宗重地龙潭去挑战，号称要捣毁其巢穴。

半路途中，他向一个老婆婆买点心吃。老婆婆见他背着《金刚经》，便问道：“《金刚经》中说：过去之心不可得，现在知心不可得，未来之心不可得。请问你要点哪个心？”德山不能回答。

这里老婆婆是在和德山玩文字游戏。佛经中所说的“心”和作为食物的点心的“心”，在形式上是同一个字，而内涵却完全不同。如果纠结于文字的形式而不问其实质，那么这个矛盾就无法解开。

等德山到了龙潭，他进门就问：“久闻龙潭的大名，我今天到了这里，怎么龙也不见，潭也不见？”

此时，德山的角色发生了转变。他把自己放到了老婆婆的位置，开始拿文字游戏来诘问别人。龙潭只是一个地名，非要拆成“龙”字和“潭”字来深究其意思，也是为了追求形式的正确而歪曲其真实内涵。

龙潭和尚对此的回答很简单：“子已亲到龙潭（你已经到龙潭了）。”也就是说：龙潭是个名词，用它来指代某个地方。现在你人都已经到这里了，难道这个名词的形式比你亲自站在这个地方更真实吗？

德山无法辩驳，只能放下来之前的傲气，跟随龙潭和尚学习。

有一天，德山和龙潭和尚讨论佛法直到深夜，出门时天已经黑尽了。龙潭和尚就给他一根蜡烛，就在德山端着蜡烛走出门的时候，龙潭和尚突然一口气把蜡烛吹灭，德山眼前一片漆黑……

第二天，德山就在佛堂上把他背的《金刚经疏钞》给烧了，皈依禅宗。

在蜡烛熄灭的一瞬间，德山所领悟到的是：只有外在的光熄灭以后，内在的光才会显现出来。死抠佛经上记载的文字和规范，内心的感悟和思考就不能自由的展开，也就远离了佛学的真谛[12]。

这就是我们前面为什么说实证主义经济学的“主要假设尽可能真实”的要求只是一件没有意义的“外套”。因为数学工具的使用和数学检验这种外在的规范是“硬指标”，而“尽可能真实”是模糊不清的“软约束”，一旦把外在东西当成衡量标准以后，内在的真实就无法得到显现。所以实事求是的分析方法和实证主义分析方法中的“尽可能真实”的区别不在于有没有要求真实，而在于在这个要求前面，有没有进一步要求对真实本身进行数学上的精确界定。一旦我们把外在的约束去掉，什么叫做“主要的”、什么叫做“尽可能真实”自然就会显现出来。经济学者在研究问题的时候，自然就会将研究的重点放在对真实情况的分析上去，努力分析问题的实质，提出新的有意义的见解。而如果在主张真实的同时又要求真实必须以数学的形式表达出来，否则就不能算数，那么真实性就会逐渐的被这外在的规范所消解。

对于经济思想的创新，也是一样。这一点已经在前文反复论证了，不再敷述。总之，经济研究的真实性和创造性，与对数学工具的过分倚重存在着根本性的冲突，这是由经济学的研究对象决定的。或许有少量文献或者说有一些天才能够做到二者的统一，但在方法论和认识论的层面上，我们只能选择其中一个。对数学工具的经济学意义的过分强调，一定会阻碍经济学的创新，并将经济学变成一门脱离实际的学科；只要认为经济学的研究应该符合真实的经济运行，在经济学研究中倡导有意义的创新，就必须反对在经济研究中滥用数学工具，强调语言和逻辑作为经济学核心研究工具的地位。如果有一天经济学家不把人当人了，而当成草木走兽这样一类没有创造力而且无法与之交流的物种，那么这种根本性的冲突才会消失。当然还有一种情况，那就是经济学家不把自己当人，而是类似于神一样高高在上的东西，用一种无需证明的真理指导人类的经济活动，那么这种根本冲突也会消失。

七

在本文的最后一部分，我们必须重申经济学作为一门实践科学的基本性质以及其对中国经济和经济理论发展的意义。

不管从学以致用还是学以致知的角度来看，经济学的研究都应该强调真实性并努力促进它所研究的对象——人类经济活动的不断进步。经济学可以为政策制定者制定经济政策提供理论支持，也可以通过使其理念深入人心来从整体上改进社会经济活动。总之，经济学是一门实践科学，它不能成为一小部分人自娱自乐的理论。经济理论整体上的进步或是僵化，都会对社会的发展产生重要的影响。而采用什么样的方法论来指导经济研究，则在很大程度上决定了经济理论的发展方向。

中国改革开放三十多年来，不管是经济理论的研究还是经济政策的制定，整体上都是本着实事求是的理念来展开和深入的，既反对改革开放以前那种僵化保守的方式，也没有盲目学习发达国家的经济理论和政策。整个过程看起来和任何一种完整的思想体系都不尽相符，到现在为止也没有什么很系统的理论来对它进行很好的解释，在而有点像是一个大杂烩。其实，贯穿始终的主线就是实事求是：一切从实际出发来研究问题和解决问题。实事求是，就是支撑中国经济改革最重要的方法论。

目前来看，改革开放以前的那种僵化保守的思维模式已经不太可能复兴。但在学习发达国家经济理论的过程中，对其方法论的盲目崇拜正在给中国的经济理论研究造成危害。这个判断不包含任何意识形态的考虑，而是从经济学的基本性质层面进行的考量。

以林毅夫这样的中国乃至世界范围内都享有极高声誉的经济学家，在面对此类问题的时候，也只能徒叹奈何，认为就算数学工具不应该被滥用，也应该先努力迎合主流经济学的要求，取得话语权再说。

类似的现象其实已经非常普遍，只是很少能够像林毅夫的这些话一样能够在公开出版的文献中找到证据而已。本文作者多次在聆听一些国内著名经济学家讲座介绍其前沿研究成果的时候听到类似的话：“这个问题结论已经出来了，但还等我的几个博士把模型搞出来，就可以公开发表了。”这些经济学家都在各自领域为中国经济改革作出过很重要的贡献，这也是他们功成名就的基础。他们中也许很多人也和林毅夫一样，数学水平并不是很高，对数学工具的滥用不以为然，但却不得不屈从这个大趋势：他们从实事求是的角度研究问题，得出明白的结论，却还是要把“模型搞出来”才敢拿出来公开发表。至于很多经济学博士硕士的论文，就更不必说，往往是创新不创新无所谓，如果没有数学模型就会担心在评审的时候通不过。

作者认为以上现象的普遍存在不需要进行“实证”，因为它已经是中国现在的经济学研究者可以普遍感觉到的一个问题了。它表明：中国的经济学者在方法论上底气不足。

对于这种现象，如果我们不能在方法论的层面给予坚决的回应，那么它就不可能被扭转。中国的经济理论研究，就将不可避免的走向僵化、走向脱离实际。

林毅夫在他的《经济学研究方法》中说：

“回顾一下五六十年代主流的发展经济学，日本和亚洲四小龙所采取的经济政策被认为是不对的，但是它们的经济发展成功了，那些按主流的发展经济学理论来制定政策的国家，经济发展的绩效却很差。另一个现象是苏联、东欧和中国从计划经济体制向市场体制的转型，九十年代初整个国际主流经济学术界的看法是苏联和东欧的休克疗法会比较成功，而中国采取的渐进式的双轨制改革是最糟糕的，多数经济学家认为计划体制不如市场体制，而双轨制的体制不如计划体制。十多年的时间过去了，回过头来看，按照当时认为比较正确的方法来改革的国家，经济绩效很差，而被认为采用了最差的方式来改革的中国，经济却取得了持续的增长，这说明现有的主流经济学理论有相当大的问题。”

林毅夫所说的现象是客观的历史事实，也明确指出现有的主流经济学理论有大问题——就算不是林毅夫这样的经济权威说的，我们也不难从历史事实中得出这个结论。但这个“大问题”是什么，他始终没有说出来。从本文的分析来看，现有的主流经济学最大的问题应该就出在方法论。因为发达国家主流经济学这么庞大的一套理论系统，经过无数学者反复研究和论证，如果方法论没有出大问题，它不太可能在整体上存在大问题。中国改革开放以来并没有出现一个很系统的经济理论来指导经济政策的制定，其成功之处也并不在于建立了正确的经济理论，而是实事求是的方法论的成功。两相对比，可以作为对本文的理论分析的一个事实证明。

林毅夫大胆预测说：“世界经济学的研究中心将会随着中国经济在全世界经济中地位的提高而逐渐转移到中国来，我们将会迎来世界的经济学大师辈出于中国的时代的到来。”但实际情况是，二战以来的日本、韩国等很多国家和地区都出现了经济长期快速增长的“经济奇迹”，成功进入发达国家的行列。在这个过程中，这些国家并没有产生出改变主流经济学发展方向的经济理论和经济学大师。

中国的经济学发展，如果不在方法论的层面与发达国家的主流经济学一较高下，那么也就永远只能产生二流的经济学理论。总之就是人家掌握普遍真理，我们研究具体案例。这一仗一定要打，不打不行。这不是出于非理性的民族主义热情，而是如果不打或者打输了，我们的经济理论就会跟发达国家的主流经济学一样，变成一套完全脱离实际的东西，到时候不用再出现一个“弗里德曼”千里迢迢的来给中国提建议，我们自己就会把自己带向错误的道路。

在改革开放的初期，中国经济总体来说处于需要“补课”的阶段，学习了很多西方的理论来帮助我们探索经济改革的方向。随着中国经济的发展，越来越多的新问题需要我们完全重新探索，这个时候方法论的问题就显得更加重要。不管本文的内容是不是正确，这个方向的研究都是具有极为重要的意义和需要认真面对的。

注释

[1] 张五常，经济解释，第一卷第一张第五节“模糊不清与互相矛盾”，P17。网络PDF版本。

[2] 张五常，对经济学的发展失望，载《随意集》，张五常著。社会科学文献出版社，2001年8月1日第一版。P55-63.

[3] 这本书是维特根斯坦去世后出版的，他的思想转变是一个过程，本文在这里只做了简化的描述。维特根斯坦最终也没有走出语言哲学的范围，他始终认为哲学是一个语言问题，只是他后来对语言的理解变得更为宽泛而已。

[4]尽管在形式上，这种方法论还是要求研究者用语言表达一下数学模型的含义，但这早已经变成了糊弄小孩的把戏，只需要用语言轻描淡写的说几句似是而非的解释就算过关了，而不是对整个推理过程做完整的文字解释。

[5] 张五常在回忆他陪同弗里德曼访华的过程中，记录了弗里德曼所打的一个比喻：要斩掉老鼠的尾巴，不要一寸一寸的斩掉，为了减少痛苦，要一次性的全部斩掉。见张五常，中国的经济制度，P148，中信出版社，2009年第一版。

[6] 这句话似乎隐含了一种观点：经济学的思想发展到完全成熟将会最终变成数学模型。作者本人完全不赞成这种观点，毫无这方面的隐藏含义。数学关系和经济关系永远无法划等号。这段话只是在说如果按照实证经济学的要求来做，将会怎样，并未承认他们的做法在整体上是正确的。

[7] 林毅夫，经济学方法论，北京大学出版社。

[8] 这种指责仅针对整体趋势而言。发达国家的经济学发展还远未到达完全僵化而不能进步的程度，也并非所有的经济学家都将数学奉为圭臬，但这种趋势的力量已远非少数的个人能够抗拒。比如林毅夫虽然提到有一批数学工具运用得极好的经济学家发生了转变，但不影响大势。

[9] 这里强调的是可进行多次重复实验的可行性，而非巨大的样本数量。用一个国家的数据计算出来的索洛模型，和用数十个国家的更庞大的数据计算出来的索洛模型，都是同样没有意义的，因为它们都无法在实践中低成本的多次重复操作以接受检验。

[10] 这并不会将高级的数学工具完全排除出社会科学研究。一些研究人类在不同条件下的行为模式的理论，可以通过大量的受控实验来获得数据。一些金融分析理论，其研究对象大部分是以数字的形式存在的，在金融市场上也可以反复实验。在这些领域，复杂的数学工具的使用就可以被接受。但金融理论的运用也会受到人类行为的模糊和非理性的限制，于是很多数学模型会在一贯表现良好的时候突然彻底失灵，轻则公司破产，重则金融风暴，这种事例很多，不必详细说明。

[11]我们也不必担心这种限定会让经济学的发展落后于信息时代。电脑不仅是计算工具，它可以有很多的用途。就计算能力而言，十年前甚至更落后的电脑就足以满足大部分需要了；而最新的通讯技术比如视频会议可以让世界各国的经济学家及时分享新想法和讨论最新的经济现象，这对经济学的促进可能比更快的计算速度更重要。各种网络三维游戏对电脑硬件能力的要求更高，经济学家显然不能为了让手中的电脑充分发挥能力而去玩网络游戏。这跟数学工具一样，不能因为数学家发明了那么多复杂的数学工具，我们就要争取全都用到经济学上来。总之，数字计算只是信息技术的一个维度而且全部。信息技术的发展应该逐步满足人类的实际需求，而不是让经济学放弃正确的研究方法去迎合计算能力的提高。在这个问题上，我们目前已经在偏离正轨的道路上走出很远了。

[12] 尽管我们在这里用禅宗的故事举例，但并无任何神秘主义或玄学上的暗示，只是借用了禅宗的故事来阐明我们的方法论和认识论。在社会科学中，强调人内心的真实感受并无任何神秘倾向，反倒是不顾人的真实思维方式把认识的可靠性寄托在数学工具上，其对于抽象理性的过分依赖更接近于宗教中对神性的盲目信仰。

作者：李晓鹏

« 信用恐慌：起源与对策

《走向新社会主义》第三章：工作、时间和计算机 »

实事求是的分析方法(兼对在经济学中滥用数学工具的批判)

一

二

三

四

五

六

七

注释

少年中国评论

Categories