上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
实证经济学的方法论∗
Milton Friedman
(芝加哥大学)
在凯恩斯的名著《政治经济学的范围与方法》一
书
关于书的成语关于读书的排比句社区图书漂流公约怎么写关于读书的小报汉书pdf
中,约翰. 梅纳德·凯恩斯对实证科
学及规范科学作了区分。他认为:“一门实证科学……是关于什么是这一类问
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
的系统的知
识体系;而一门规范科学(或称为管理科学)……是关于什么应该是这一类问题的标准的系
统的知识体系……;是一门艺术……是为达到某一特定目标而设立的原则体系”;他指出:
“这二者之间的混淆带有很大的普遍性,并成为很多殆害大分之谬误的根源”;他还强调了
“创立一门准确无误的政治经济学的实证科学的重要性。” 本文将主要对某些方法论问题加
以阐述,这些问题产生于人们为创立凯恩斯所倡导的“准确无误的实证科学”所作的努力,
其中特别涉及的是,如何确定某一被提出的假说或理论,是否应被暂时地接受为“关于什么
是这一类问题的系统的知识体系”的一部分。但是,凯恩斯所悲叹的这种混淆仍然如此之普
遍,并极大地妨害了人们对经济学可以是——而且部分地确实是——一门实证科学的认可。
所以,我们最好在本文的开头先论述一下实证经济学与规范经济学之间的关系。
一、实证经济学与规范经济学之间的关系
在某种程度上,实证经济学与规范经济学之间的混淆是不可避免的。在几乎每一个人看
来,经济学所研究的问题与其自身是极为攸关的,而且是困于他们自己的经历与能力的范围
之内;这一现象便是不断的广泛的分歧的根源,并成了频繁立法的契机。那些自许为“专家”
的人们意见迟异,而且我们很难保证他们都是毫无偏见的。无论如何,在那些事关重大的问
题上,即使这些“专家”们几乎一口同声而且毫无偏见,我们也很难完全不加考虑地接受他
们的观点。实证经济学的结论似乎是,而且确实是与重要的规范问题密切相关的,是与应该
做什么及如何取得某一既定目标等问题密切相关的。门外汉与专家一样,都在无一避免地试
图改造实证结论以适应为他们所极力坚持的规范性的先入之见,并当这些实证结论的规范性
含义——或所谓的这些实证结论的规范性含义——不合他们的口味时就否定这些实证结论。
从原则上说,实证经济学是独立于任何特别的伦理观念或规范判断的。正如凯恩斯所说,
它要解决的是“什么是”,而不是“什么应该是”一类的问题。它的任务是提供一套一般化
∗原载: "The Methodology of Positive Economics"In Essays In Positive Economics(Chicago: Univ. of Chicago
Press, 1966), pp. 3-16, 30-43.
Milton Friedman:实证经济学的方法论
体系,这个一般化体系可以被用来对环境发生变化所产生的影响作以正确的预测。这一体系
的运行状况可以通过它所取得的预测与实际情况相比的精确度、覆盖率及一致性等指标来加
以考察。简而言之,实证经济学是,或者说可以是一门“客观的”科学,这里“客观”一词
的含义完全等同于任一自然科学上的定义。当然,经济学所涉及的是人与人之间的关系,而
且调查研究者本身就是被调查研究的事物的一部分。与自然科学相比,调查研究者与被调查
研究的事物之间更具有本质上的联系。上述事实在使社会科学家得到了一系列自然科学家无
法得到的数据的同时,也使社会科学家在实现客观性的目标上遇到了特有的困难,但是在我
看来,这些都不是这两类科学之间的根本差异之所在。
另一方面,规范经济学及经济学的技术也不可能独立于实证经济学。任何政策结论都不
可避免地要基于对采取某一种而不是另外一种行动将产生的影响所作的预测,而预测则必须
明确或不明确地基于实证经济学。当然。在政策结论与实证经济结论之间并不存在着—一对
应的关系;如果有的话,那么则不必另外再创立一门规范经济学了。两个不同的个体可能在
对某一个别立法的结果问题上意见一致。但其中的一个可能认为这些结果有利于平衡,进而
拥护这项立法;而另外一个却可能认为这些结果是不合意的,进而反对这项立法。
然而,我对这样一种看法提出疑义:这种看法认为,在目前的西方世界,特别是美国,
在毫无偏见的公民之间所存在的有关经济政策的分歧,主要地来源于人们对所采取的行动将
带来的经济影响的不同预测。而这些分歧从原则上说是可以通过实证经济学的发展而予以消
除的。持这种看法的人不认为人们关于经济政策的分歧是来源于人们在基本的行为准则方面
的根本性分歧,来源于人们在最终可能出现的矛盾双方问题上的分歧。一个明显的而且并非
不重要的事例就是最低工资限制问题。尽管在形式上存在着对这一立法的褒贬纷争,但人们
在为所有的人争取到一个“生存工资”这一政策目标上却形成了根本一致的意见。而且“生
存工资”这一含义模糊的概念在这一类问题的讨论中得到了广泛的运用。人们的意见分歧主
要产生于人们在预测方面的隐含的或明确的分歧。这一预测涉及的是最低工资限制这一特殊
手段在实现目标中的功效问题。该项立法的支持者们认为(即预测),法定的最低工资通过
提高那些工资收入在最低工资线之下的劳动者的收入,及提高那些工资收入在最低工资线之
上的劳动者的收入,进而消除了贫困。而且与此同时并不存在完全失业人数增加及就业条件
因该立法的实行而恶化一类的消极作用。而该项立法的反对者们认为(即预测),法定的最
低工资通过失业人数的增加及就业条件的恶化而加重了贫困现象。而且这一消极作用不仅抵
消了该项立法给在业者工资收入所带来的有益影响,市且还可能使之状况更加恶化。人们在
该项立法的经济影响问题上的看法一致,并不能使人们在该项立法的合意性问题上看法一
致。这是因为仍然存在着人们在该项立法的政治或社会影响等问题上的分歧。但是,在目标
一致的情况下,人们一定会经过漫长的道路而趋于一致的。
人们在工会的适当作用及地位的问题上的各种不同意见,及人们对直接的价格与工资控
制的合意性及关税的合意性等问题的各种不同看法,都是以实证分析中的一些密切关税的分
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
歧为依据的。人们对所谓的规模经济的重要性的不同预测,在很大程度上说明了人们在工业
部门中政府的全面控制的合意性及必要性,甚至在社会主义(而不是私人企业)的合意性及
必要性等问题上的不同看法。而且关于这一方面问题的事例举不胜举。当然,我的这一主张
——即在西方社会中人们在经济政策问题上的主要分歧具有如上所述的性质——其本身就
是一种“实证”阐述,它的正确与否还有待于经验证据的检验。
如果这一主张是合理的,那么它意味着。人们在“正确的”经济政策问题上的一致意见
较少地取决于规范经济学的进步,而更多地是取决于这样一种实证经济学的发展:它所得出
的结论不仅而且值得受到广泛的赞同。它还意味着:对实证经济学与规范经济学加以严格的
区分的主要原因就在于这样一种贡献,即这一区分促进了人们在政策问题上的意见一致。
二、实证经济学
实证科学的终极目的就是要发展这样一种“理论”或”假说”,使之能够对尚未观察
到的现象作出合理的、有意义的(而不是老生常谈的)预测。总体说来,这样一种理论是一
个由两种元素构成的复杂的混合体。部分地说,它是一种‘语言”,旨在促进“系统的、有
组织的推论方法”。部分地说,它是一系列假说的综合体,旨在从纷繁复杂的现实中抽象出
事物的本质特征。
作为一种语言,理论不具有任何实质性的内容;它是一系列同义反复的词语的综合体。
它的作用在于为经验材料的组织及对经验材料的理解提供文牍服务;而且用以检验这一服务
质量的标准也是那些适合于文牍体系的标准。对这些事物的种类所下的定义清楚而准确吗?
对这些事物种类的划分穷尽了吗?我们知道每一单个项目都应归于哪一类吗?或者,在这其
中是否存在着相当的似是而非现象呢?人们对大标题及次标题体系的划分是否已达到这样
的完备程度,从而使我们能够迅速地找到我们所要的条目呢?还是由于混乱不清而使得我们
不得不一处一处地加以涉猎呢?我们将要研究的条目是否都已编排到一起了呢?条目的编
排系统是否已避免了交叉重复呢?
对上述这些问题的回答部分地取决于逻辑上的考虑,部分地取决于事实上的考虑。标准
的逻辑准则本身可以说明某一特殊语言是否是完全的及连续的,即这一语言中的命题是“正
确的”还是“错误的”。事实上的证据本身可以说明“逻辑编排系统”的种类能否在实际中
找到有意义的对应物,即在分析具体问题中的某一特殊种类时,这些条目划分是否能起到一
定的作用。“供给”与“需求”这一简单的事例既说明了这一点也说明了前面所谈到的一系
列逻辑分析问题。作为经济理论这种语言的构成要素,供给与需求是两大主要类别,影响产
品的相对价格的因素及影响生产的因素都被划到这两大类别中来。这种二分法的实用性取决
于“它在经验资料方面的高度概括性,即如果我们把任一问题中影响需求的力量与影响供给
的力量分别开列出来的话,那么我们将会得到这样两类资料:它们之间很少有哪些项目是共
同的。”现在,这样一种概括对于象消费品终极市场一样的市场来说是合理的。在这一类市
Milton Friedman:实证经济学的方法论
场中,可以被看作是需求产品的经济单位与可以被看作是供给产品的经济单位之间存在着明
确的、严格的区分。很少存在这样的混乱现象:从某一方面看来,某一特殊因素应被划归影
响供给的项目之类,而从另一方面看来,又应被划归影响需求的项目之类。而且也很少有必
要考虑两个类别之间的交叉效应(即交叉重复)。在这类问题中,在标题“供给”与_“需
求”下对有关因素进行编排所需要采取的步骤既简单又明了,从而极大地简化了我们所面临
的问题,而且这种简单明了的方法还防止了在其它情况下可能出现的差错。但是,这种概括
并不是在任何情况下都是合理的。例如,在一个主要是投机性的市场中,对于价格的每日波
动来说,这一概括就是不合理的。例如,一则关于增加超额利润税的谣传,对于股票市场来
说,是应当看作是主要对今天的公司股票供给发生影响的因素呢,还是应当看作是主要对今
天的公司股票需求发生影响的因素呢?在类似的情况下,几乎对于每一因素来说,将其划归
“供给”标题之下的理由大约与将其划归“需求”标题之下的理由一样多。这些概念仍然可
以使用而且不可能是毫无意义的;它们仍然是“正确的”,但与在第一个例子中的情况相比
它们的用处则明显地要小得多,这是因为它们没有有意义的实证对应物。
作为一种实证假说体系,理论应该通过其对它意在加以“解释”的那一类现象的预测能
力来检验。唯有实际证据才能
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
明该理论是“正确的”还是“错误的”。或者更为准确地说,
唯有实际证据才能表明该理论是被作为合理因素而暂时地得到“接受”呢,还是遭到了“拒
绝”。正如我下面将更为详细地阐述的那样,对某一假说的合理性的唯一有关的检验,是将
其预测与实际情况所作的比较。郊果该假说的预测(“频繁地”或比来自于另一假说的预测
更为经常地)与实践相抵触,那么该假说则遭到了否定;如果该假说的预测没有与实践相抵
触,那么它则为人们所认可;如果该假说业已多次成功地避免了可能出现的抵触现象,那么
它则具有极大的可信赖程度。实际证据永远也不可能“证实”某一假说的正确性,它只能通
过无法将该假说驳倒来显示该假说的正确性。当我们说到某一假说已经在实践中得到了确认
时(并不十分准确),我们通常所指的就是这个意思。
为了避免误解,可能有必要明确一下:我们用来检验某一假说的合理性的“预测”,并
不一定非得是对尚未发生的现象所作的预测,也就是说,不一定非得是对将来事件的预见。
它可以是对业已发生了的现象所作的预测,但前提条件是对这一现象所作的观察尚未进行,
或者是虽然对这一现象的观察业已作出。但进行预测的人尚不知晓。例如,在其它一些情况
已知的情况下,某一假说预测在 1906 年将会有某些情况发生。如果对这一时期的史料记载
所作的研究表明,在 1906 年某些情况确实发生了,那么该预测则得到了实践的确认。反之,
如果研究表明在 1906 年某些情况并没有发生,那么该预测则与实际情况发生了抵触。
从这种意义上讲,某一假说的合理性本身并不足以作为对其它假说进行取舍的标准。人
们可以观察到的事实在数量上必然是十分有限的,但可能的假说却是无限的。如果存在某一
种假说与可得证据相一致,那么一定还有无数的假设也与这一可得证据相一致。例如,假设
对某一特殊消费品所征收的一种特别货物税,导致了价格的上涨,其上涨幅度完全等同于税
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
收的数量。这与竞争情况下稳定的需求曲线、水平的且稳定的供给曲线是一致的;但它也与
竞争情况下需求曲线或供给曲线发生必要的相应移动后的斜率为正或为负的供给曲线相一
致:它也与垄断情况下常边际成本及稳定的需求曲线相一致,只是为了取得上述结果要求后
者具有某一特定的形状;等等,等等,无穷无尽。这一假说所适应的另外一种证据可以起到
剔除上述某些可能情况的作用;但它绝不可能把这些可能性削减为一种,而独自地与这一有
限的证据相一致。对那些与可得证据同等一致的假说所进行的选择,在某种程度上是任意的。
虽然我们一致同意这样的观点:对选择所进行的考虑应以“简洁性”与“成效性”为出发点,
但这二条标准的本身就意味着否定完全的有目的的简化。一理论越是“简单明了”,在某一
既定领域内对现象进行预测所需要的初始知识也就越少;一理论越是“富有成效”,它对现
象所作的预测也就越精确,而且该理论进行预测所依据的范围也就越大,同时,为了进一步
研究的需要,它所要加以说明的东西也就越多。逻辑上的完整性与一致性虽然也与评判的标
准有关,但只起一个辅助作用;二者的作用在于确保该假说能够正确地阐明宗旨,而且做到
使每一个研究该假说的人的理解都准确无误——在这里,它们与统计计算中对数字精确度的
检验所起的作用是一样的。
不过,我们对社会科学中某一特殊预测所作的检验,很少能够通过这样一种实践来进行:
这种实践是经过专门设计的,意在消除被认为是最重要的干扰因素。通常,我们不得不依赖
于偶然发生的“实际情况”所提供的证据来进行我们的检验、在我看来,社会科学中无法进
行所谓的”有所控制”的实验,这并不能反映社会科学与自然科学之间的根本区别。这既是
因为“无法控制”的实验并非为社会科学所特有(自然科学中的天文学就是一例),又是因
为有控制的实验与无控制的实验之间的差异充其量不过是一个程度上的差异。没有哪一种实
验是可以完全控制的,同时每一种实验中又都存在着部分的控制,这是因为某些干扰因素在
整个实验过程中应保持相对的稳定.
实践所提供的证据是大量的,而且常常是确定性的,犹如经过了设计的实验一般。所以,
无法指导实际情况并不是通过预测的成功来检验假设的根本性障碍。但如此得到的证据在解
释上却要比前种情况困难得多。它常常是复杂的,而且总是间接的和不完全的。对这种证据
的收集常常是困难的,而且对这些证据的解释通常需要进行细致入微的分析工作,同时还涉
及到一系列的推理判断,而这些很少能够真正做到把握事物的真谛。“具有决定性意义”的
实验所带来的大量的直接证据与经济学之无缘,的确妨碍了检验假说工作的顺利进行。但与
这一情况在取得合理的结论,及在由可得证据所证明了的结论上取得一致意见等方面所带来
的巨大困难相比,前一种妨碍则显得微不足道了。它使得人们对失败的假说的摒除工作进展
缓慢且困难重重。这些失败的假说很少永远告别经济舞台,相反却总是一再出现。
当然,这些方面的问题并不是整齐划一的。有时,实践所提供的证据与有控制的实验所
能提供的证据几乎一样地直接、大量与确定。也许,最明显的重要例证要数通货膨胀问题。
这种通货膨胀证据是服务于这样一种假说的:在一个较短的时期里,货币数量的大量增加必
Milton Friedman:实证经济学的方法论
然伴随着价格的大幅度上升。这里,这方面的证据是大量的,且为对这些证据加以解释所需
要的推理判断较少。然而,尽管存在着大量的价格大幅度上涨的事例,但这些事例与货币存
量的大量增加之间的本质上的—一对应关系,及在其它相关的情况下的变异程度等,决定了
每一次新的通货膨胀体验都必将带来激烈的争论,而且这种争论不仅仅是来源于非职业经济
学家的人民大众。反对原假说的观点认为:货币存量的增加或者是来源于由其它因素所导致
的价格上涨的偶然性影响,或者是价格上涨的一个完全偶然且不必要的附带物。
检验大量的经济假说的困难性所造成的一种影响就是:它使得我们的检验工作退回到纯
粹的正统或繁琐分析中去。正如我们业已阐述的那样,繁琐重复在经济学及其它科学中,作
为一种专门的语言或“分析编排体系”而占有极为重要的地位。此外,同样是同义反复的正
统逻辑学与数学又成了这些问题的重要工具:检验判断推理的正确性;发现假说的深刻含义;
确定是否一系列被假定为不同的假说的确不可能是等价的,或者在它们之间存在着差异等。
但是,如果一经济理论想保能够预测未来,而不仅仅是描绘行动的结果,那么仅作为一
个同义重复的体系是远远不够的。同样,如果一经济理论想要有别于模糊数学时,那么仅作
为一个同义重复的体系也是远远不够的。而且如我们前面所提到的那样,这些同义反复的实
用性本身还将最终地取决于关于将某一棘手的实际问题划归某一种类的那些假说的可接受
性。
通过预测而对经济假说加以检验所具有的困难造成了另一个更为深刻的影响,那就是它
使人们对经验证据在理论著作中的作用产生了误解。在下述两个虽联系紧密但并不相同的阶
段中,经验证据起到了至关重要的作用:一是构造假说的阶段,二是检验假说的合理性的阶
段。完整且详尽的经验资料,作为我们将通过假说而予以概括
总结
初级经济法重点总结下载党员个人总结TXt高中句型全总结.doc高中句型全总结.doc理论力学知识点总结pdf
或“加以解释”的实际现
象的代表,除在提出新假说时所具有的重大作用外,还被用来验证一假说确实说明了它旨在
说明的问题——即该假说对某一现象所作的阐述并不与人们业已观察到的实际情况相矛盾。
在某一假说与人们掌握的实际资料相一致的情况下,人们对该假说所作的进一步检验,是要
将那些事先并不知道然而却可以从实践中观察到的新因素从假说中剔除出去,同时还要对这
些被剔除的因素加以检验,以了解这些因素与其它的经验证据之间的背离情况。为了使后一
种检验同前一种检验密切相关,那些被剔除的因素必须与该假说旨在说明的问题同属一类现
象;而且对这些被剔除的因素所作的限定必须足够地准确,从而使得人们所作的观察能够证
明这些因素是不正确的。
构造假说与检验其合理性这两个阶段之间的相互联系可以从两个方面表现出来。第一,
在某种程度上可以这样说:进入每一阶段的那些特定的因素,是由资料的收集及某一特定的
调查者的知识水平所决定的一个偶然现象。被用来检验某一假说的内涵的那些因素可能同样
适当地属于被用来构造假说的那些原始资料,反之亦然。第二,创立一假说的过程从来都不
是从零开始的。所谓的最初阶段本身也总是要涉及到对一系列早些时候提出的、以实际观察
为依据的假说所进行的比较。这些假说的涵义之间的相互矛盾,成了促进人们构造新假说或
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
修改原有假说的始动力。所以,这两个在方法上截然不同的阶段,在实际进程中又总是相辅
相成、互为前提的。
人们对这一简洁明了的过程所产生的误解,主要在于下面这一表述:“该假说是为解释
这一类现象而提出的。”社会科学中,对这一类现象的新证据的获得十分困难,而且对这些
新证据与该假说的含义之间的一致性的判断也十分困难,这些情况使得社会科学试图作出这
样的假设:其它的、更为可得的证据与该假说的合理性是同样相关的。这就等于说假定假说
不仅具有“含义”,而且还具有”“假设”;这些“假设”与“现实”之间的一致性是检验该
假说的合理性的标准——这一标准或者不同于通过含义所进行的检验,或者是对通过含义所
进行的检验的一种补充。这一为人们所广泛持有的观点不仅是根本错误的,而且还成了更多
的缪误产生的根源。它不仅没有为不合理的假说向合理的假说的转化提供捷径,相反却混淆
了是非,造成了人们对经验证据在经济理论中的重要性的误解,使得人们为促进实证经济学
的发展所作的智睿的探索迷失了方向,而且阻碍了实证经济学中人们在试验性的假说上一致
意见的取得。
即使在一理论可以被说成是具有“假设”的限度内,即使在这些‘假设”的”真实性”
可以独立于预测的合理性而接受检验的限度内,该理论的重要性与它的“假设”的“真实性”
之间的相互关系,也完全不同于我们前面所批评的那种观点所提出的内容,甚至几乎是后者
的反面。那些真正重要且伟大的假说所具有的“假设”,是对现实的一种粗略的、不十分精
确的、描述性的表述.而且,一般说来,某一理论越是杰出,那么它的“假设”(在上述意
义上)就越是超脱现实。这其中的原因是非常简单的。如果一假说能够通过极为有限的资料
而进行大量的“阐述”,即如果一假说能够从它旨在解释的那一现象周围的大量复杂且详尽
的情况中,抽象出共同且关键的因素,并能保证仅在这些有限资料的基础上作出合理的预测,
那么,这一假说就是意义重大的。所以,为了意义重大,一个假说在其假设方面必须运用一
些描述性的技巧;既然该假说的伟大成功将证明其它许多的有关情况与该假说旨在阐明的现
象是毫不相关的,那么该假说也就不必考虑并说明这些情况。
为了使这一点不那么难于理解,我们所要问的另一个与一理论的“假设”有关的问题,
不是这些假设是否在描述上是“现实主义的”,因为它们从来就不是,而是这些设想对于我
们已有的目标来说,是否是一个足够好的近似物。而对这一问题的回答唯有道过考察该理论
是否应验,即该理论是否取得了足够精确的预测水平来进行。这样,这两种原假设为独立的
检验方法合二为一。
垄断的与不完全的竞争理论,就是在经济理论中忽视上述主张的一个例子。被说成是构
成新古典经济理论的基础的“完全竞争”或“完全垄断”假设,是现实生活的一幅虚假的图
象这样一种观点,明确地促进了垄断与不完全竞争分析的发展,而且也大致地说明了该分析
得到广泛的接受与赞同的原因。而这一观点本身,几乎全部地以这些假设的这种直接可见的
不精确性为基础,而不是以从新古典经济理论中导出的预测的任何得到认可的矛盾点为基础
Milton Friedman:实证经济学的方法论
的。许多年以前,《美国经济评论》对边际分析问题所进行的长篇累牍的讨论,是另一个虽
不如前一个例子重要,但比前者更为明确的例子。争论双方的文章,在很大程度上都忽略了
在我看来似乎是关键性的问题——即边际分析原理与实践经验的一致性问题,而注重于商人
是否确实地通过考察代表边际成本与边际收益的表格、或曲线、或多变量函数,来制定他们
的决策这样一个几乎毫不相关的问题。也许这两个例子及它们所业已揭示的其它许多事例,
可以对所涉及的方法论原则问题的讨论起到判别作用,而且通过这两个例子所说明的问题也
许要比其它似乎是适当的方法所能说明的问题要广泛得多.
三、可以通过一假说的假设的真实性来检验该假说吗?
我们先从自由落体法则这样一个简单的自然事例开始来进行我们的讨论。在真空中,一
落体的加速度是一个常数——g,在地球上是每平方秒大约 32 呎——而且落体的加速度与该
物体的形状、投掷方法等因素无关,这一假说已得到了人们的广泛接受。这就等于说一落体
在任一特定的时间范围内所下落的距离可以用 S=1/2 gt2这一公式来算出。这里, S 是该
落体下落的距离,单位是呎,t 是物体下落的时间,单位是秒。将这一公式应用到一个从楼
顶下抛的实心球上,就等于说这样抛下的那个球的运行情况就如用它在真空中被抛下时的运
行情况。通过这一假说的假设来对其进行检验,可能意味着对实际气压进行测量,并确定它
是否接近于零。在海平面上,气压大约是每平方时 15 磅。为了使这一气压差别被判定为可
忽略不计的,15 是否是足够趋近于零的呢?因为这一实心球从楼顶降落到地面实际所需的
时间与这一公式所给出的时间非常接近,所以很明显,这一 15 之差足够趋近于零。然而,
假定现在抛下的是一根羽毛而不是一个实心球。那么这一公式所得出的结果则是非常之不精
确的.很明显,对于一根羽毛(而不是对于一个实心球)来说,每平方时 15 磅完全不同于
零。或者,我们再假定这一公式的应用对象是从 3 万呎高的飞机上抛下的一个球。在这一高
度,气压绝对地小于每平方吋 15 磅。然而,从 3 万呎降到 2 万呎(在这一点上的气压仍然
大大小于海平面上的水平)所用的实际时间却完全不同于上述公式所预测的时间——大大地
高于实心球从楼顶落到地面所需的时间。按照上述公式,该球的速度应为 gt,而且还应该
稳定地增长。事实上,一个从 3 万呎降落的球是在它碰到地面以前达到它的最高速度的。而
且上述公式的其它含义也都与此类同。
为了使气压差别能够被判定为是可以忽略不计的,15 是否足够地趋近千零这一初始问
题本身就是明显地愚不可及的。每平方吋 15 磅等价于每平方呎 2160 磅,也等价于每平方吋
0.0075 吨。如果没有一些外在的比较标准,则不存在对这些数字评判大小的依据。而这唯
一相关的比较标准就是在一系列既定的情况下,该公式可以应用或不可以应用的气压水平。
但这又在另一个层次上带来了同样的问题。“可以应用或不可以应用”的含义是什么?即使
我们可以消除测量上的误差,但物体降落的实际测得时间与公式计算所得的时间,很少(如
果曾经有过的话)完全相等。为了能够判定自由落体理论之“不可以应用”,这二者之间的
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
差异必须要多大呢?下面将是进行比较的两条重要的外在标准。一个是与该理论进行比较、
且在所有其它方面与该理论是同等地可接受的另一理论所能达到的精确度。另一个是这样一
种标准,它只有在存在着某一业已为人们所知道的、具有更好的预测水平,然而其预测成本
较高的理论的前提下,才会存在。而且更高的精确度所带来的效益(这取决于人们的使用目
的),一定能够弥补取得这一精确度所需要的成本。
这一例子既证明了通过一理论的假设来检验该理论的不可能性,也证明了“某一理论
的假设”这一概念的模糊性。S=1/2 gt2这一公式对于真空中的落体来说是正确的,而且可
以通过对这一类物体的运行情况的分析而推导出来。所以,可以这样阐述:在多种情况下,
在实际大气中降落的物体,其运行情况如同在真空中所进行的降落。如果用我们经济学中最
常用的话来表述,那么上述文字立刻会被表述成:这一公式假设存在着一个真空。然而很明
显上述表述并没有作任何诸如此类的假设。上述表述的真正意思是:在许多情况下,气压的
存在,物体的形状,投掷物体者的姓名,投掷物体所采用的方法及许多其它的附加条件,对
于该物体在一定时间内所下降的距离并无可估计的影响。我们完全可以对该假说重新进行表
述,从而完全不再提及真空因素:在许多情况下,一物体在一给定的时间内所下降的距离由
公式 s=1/2 gt2给出。如果我们撇开该公式的历史不谈,撇开与之相联的其它自然科学理论
不谈,那么说该公式假设存在着一个真空还有意义吗?就我所知,还可能存在着其它的假设
体系,而能够取得这同样的公式。这一公式之所以被接受是因为它与现实相符,而不是因为
我们生活在一个大致的真空里——不管这种大致的真空指的是什么。
与这一假说相联系的一个重要的问题,是要限定该公式可以应用的条件,或者更为准确
地说,是要限定在各种情况下该公式预测的总的误差范围。的确,正如上述对该假说的重新
表述中所蓄含的那样,这样的限定与该假说并不是截然不同的两件事。限定本身就是该假说
的一个重要组成部分,而且它是这样一个组成部分:随着实践的不断增加,它是特别有可能
被修改与扩展的部分。
在落体这一特殊情况中,还存在着另一虽仍不完善但更为一般化的理论。这一理论主要
来自于人们为解释前一种简单理论中存在的误差而进行的探索;而且在这一理论中,人们可
以对某些可能存在的干扰因素的影响加以衡量;而且在这一理论中,前一种简单理论只是作
为一种特例而存在。然而,这一更为一般化的理论并不总是能够得到应用。这是因为,它所
取得的精确度的增加可能不能弥补使用这一理论所带来的成本的增加。所以,在何种情况下
前一种较简单的理论可以“充分完善地”反映现实,这仍然是一个事关重要的问题。气压是
限定该理论可应用的情况的那些变量中的一个,但只是其中之一;物体的形状,使达到的速
度,及其它变量也都是与限定有关的。对气压以外的这些变量加以阐述的方法之一,就是将
这些变量视为决定对真空“假设”的某种背离是否是事关重大的。例如,每平方吋 15 磅的
气压对于一支羽毛来说是截然不同于零的;但对于从一高度不大的地方下抛的实心球来说,
却是可以视为趋近于零的,这些都是物体的形状所带来的差别。然而,这样的表述绝然区别
Milton Friedman:实证经济学的方法论
于下面这种不同的表述:该理论不能应用于羽毛落体,因为该理论的假设是错误的。然而它
们之间的相互关系却完全是另一种情况:对于羽毛来说,这些假设是错误的,原因在于该理
论不能应用于羽毛落体。这一点需要引起大家的重视。这是因为,在限定某一理论可以成立
的条件的过程中,“假设”的完全正确的运用通常错误地被理解为假设可以被用来确定某一
理论可以成立的条件,而且,这一误解成了理论可以通过其假设而进行检验这一观点的主要
根源。
下面我们再来看另一个例子。这一次是一个臆造的事例,旨在使之成为社会科学中的许
多假说的同类物。让我们来考虑一下一棵树上叶子的密度。我提出的假说是:这些叶子的位
置是这样确定的:在其周围的叶子位置一定的条件下,每一片叶子都好象有意地使它所能得
到的阳光数量最大化;每一片叶子都好象知晓决定在不同的位置上可得阳光数量的自然法
则,并且能够迅速地(或曰即刻地)由任一位置移到任一其它合意的且尚未被占据的位置。
现在,该假说的某些更为明确的含义明显地与实际情况相一致:例如,一般来说,树南侧的
叶子密于树北侧的叶子,但如本假说所意含的那样,在山的北坡,或当树的南侧为其它东西
所遮盖的情况下,树的南北两侧叶子密度的差异就不会那么明显。或完全不是原来的那种情
况。就我们所知,叶子不能“有计划地行事”,或者说不能有意识地“追求”什么,它们没
有进过学校并学会为计算“最佳”位置所必需的科学或数学的有关法则,难道我们可以据此
认为该假说是不可接受的或曰不合理的吗?很明显,该假说的这些与事实相矛盾的情况中,
没有一个是至关重要的。这里所涉及的现象不在“该假说旨在阐述的那一类现象”的范围之
内。该假说并没有宣称叶子可以做到上述事情,它只是认为:这些叶子的密度是同一的,就
犹如它们可以做上述事情一般.尽管该根说的“假设”中存在着明显的非现实性,但由于该
假说的含义与实际观察的一致性,使得该假说具有极大的合理性。我们倾向于在下述意义上
“阐述”该假说的合理性:由于阳光促进了叶子的生长,所以,在阳光较多的地方叶子将生
长得更加茂密,或者说将有更多的假定存在的叶子能够得以生存下来。所以,完全被动地将
这一假说应用到更为广泛的情况中去所得到的这一结果,与通过将某些特定环境附加其上所
得到的结果是完全相同的。这后一种说法比前面造的那一种假说更为引人入胜,这不是因为
后一种假说的“假设”更具“现实性”,而且因为后一种假说的“假设”本身就是一个更为
一般化的理论的一部分。这种更为一般化的理论所能应用的现象种类更为广大,而且在这一
更为一般化的理论中,一棵树上叶子的具体位置不过是该理论的一个特例。这一更为一般化
的理论有着更多的可能招致异议的含义,但由于该理论可适用的范围更为广泛从而使得这些
含义避开了可能发生的任何抵触。这样一来,叶子生长的直接证据为来自于这一更为一般化
的理论所适用的其它现象的间接证据所加强。
我们所臆造的这一假说大致说来是正确的,也就是说,仅对于某些现象来说,该假说关
于叶子密度的预测达到了“足够的”精确水平。我不知道这某些现象是什么,也不知道如何
去定义它们。然而,有一点似乎是明确的,那就是:在这一例子中,该理论的这些“假设”
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
并不属于该理论的假设范围:也就是说,树的种类,土地的性质等都是可能影响到该理论的
合理性所存在的范围的变量种类,而叶子进行复杂的数学计算,或从一个位置移到另一个位
置的可能性问题,却与该理论合理性的范围限制无关。一个与人类行为有关的例子大致类似
于我们刚才所举的那个例子。这个例子我与萨维奇已在别处引用过。现在,让我们来考虑一
下一位台球行家对击球情况进行预测的问题。下述假设似乎并非毫无道理:绝妙的预测通常
都是通过这样的假说来取得。这种假说认为,这位台球行家的击球活动就犹如他知晓将会给
出最佳运行方向的那个复杂的数学公式一般。而且这一数学公式可以通过眼睛对角度的观
察,并确定该球所在的位置等而精确地进行计算。这位台球行家通过该公式而进行闪电般的
计算。然后使球按该公式所指定的方向运行。我们对这一假说的信赖并不是基于这样一种观
点:台球手(即使是台球行家)可以而且确实经历过前面所描述过的过程;相反,我们对该
假说的信赖是缘于这样一种观点:除非这些台球手可以通过这样或那样的方法而取得与上述
过程同样的结果,否则的话,他们事实上就不是台球行家。
由这些例子进而引申出下面这个经济原说,这似乎是很容易做到的。这一经济假说认为,
在许多情况下,单个企业常常是如此行事,犹如他们在有计划地使其预期成果(通常,如果
理解有误的话,则称之为‘利润”)最大化,而且掌握着为成功地实现这一目的所必需的全
部数据资料;也就是说,犹如他们知晓相关的成本与需求函数,可以通过他们所掌握的所有
情况来计算边际成本与边际收益,并使得他们所采取的每一个行动都恰到好处地符合边际成
本与边际收益相等的原则。当然,现在的商人实际上并不完全按照经济数学家所发现的方便
途径来解这一联立方程体系。只不过他们这样做的可能性比叶子或台球手明确地完成复杂的
数学计算,或落体决定创造一个真空的可能性要大一些。如果台球手被问到他是如何确定击
球方向的,那么他可能回答说他“恰好算了出来”,但此外他还要摩擦一下兔后腿来证实一
下。而如果一位商人被问到他是如何决策的,那么他可能回答说他是以平均成本来定价的,
而且当市场情况发生了变化时,当然也会出现一些微小的偏差。这一表述与前一个表述几乎
是同样有帮助的,但它们之中没有一个与对有关假说所进行的检验有联系。
人们对上述成果最大化假说的信赖是由一非同寻常的特征证据所证明的。在某种程度
上,这一证据与关于台球手行为的假说中所引证的证据是非常相似的——也就是说,除非商
人可以通过这种或那种方法而使其行为近似于与成果最大化相一致的行为,否则,他们似乎
不可能长久地维持他们的生意。这里不管明显地、直接地决定商业行为的因素是什么——习
惯性的反应,随机性的机遇,或难于归类的一些东西——其结果都是一样的。不论什么时候,
只要这一决定因素碰巧导致了与合理的、有实际根据的成果最大化相符合的行为,则生意使
会兴隆,并进而需求资源以扩大经营;反之,只要这一决定因素不能带来与合理的、有实际
根据的成果最大化相符合的行为,则生意将会亏损,且只有从外部引入新资源才能维持存在。
这样一来,“自然选择”过程促进了该假说合理化的实现,或者说在自然选择既定的情况下,
人们对该假说恰当地概括了生存条件这一判定,成了人们接受该假说的主要依据。
Milton Friedman:实证经济学的方法论
该成果最大化假说的另一更为重要的证据,来自于该假说在特殊问题中的无数次应用,
及在这多次应用中,该假说的含义与实际情况并没有发生抵触这一事实。然而,如果要让这
一证据提供佐证那是极为困难的。这是因为它散落在无数的商业便函中、文章中,及专题著
作中,而这一切主要地是与特殊的具体问题相联系,而与对该假说的检验并不相关。然而,
在很长时期内人们对该假说的持续使用与接受,及未能创立一种逻辑严密、自圆其说的假说
来取而代之并得到广泛的接受这一情况,间接地有力地证明了该假说的存在价值。任一假说
的证据都总是由人们试图证明它与实际情况相抵触而遭到的多次失败所组成。只要该假说仍
在继续使用,那么这一证据就会继续增加。而且,由于该证据的特殊性质,让该证据提供完
全充分的证明是十分困难的。这已开始变成某一科学的传统及传说的一部分,后者反映在人
们持有假说的坚定性方面,而不是反映在教科书中对那些未能证明该假说与实际情况相抵触
的事例所进行的罗列上面。
四、理论“假设”的重要性与作用
到现在为止。我们对一理论的‘假设”的重要性问题所作的结论几乎全都是否定的:我
们已经证明了一理论是不能用其“假设”的“真实性”来加以检验的,而且,一理论的“假
设”这一概念充满了可疑之点。但是,如果这就是问题的全部,那么我们将很难对这一概念
的广泛应用作出解释。同时我们也很难说明这样一种较强的倾向:我们每个人都常常身不由
已地谈到一理论的假设,并对各种理论的假设加以比较。有烟就有火。
在方法论当中(如同在实证科学中一样),作出否定性的结论通常要比作出肯定性的结
论更有把握。所以,与前面的评述相比,我对下面这些有关“假设”的重要性及作用的评述
的把握性较小。就我所能认识到的,一理论的“假设”具有三种虽则紧密相连但却完全不同
的实证作用:(1)它们是对一理论进行描述或表述的一种简便形式;(2)它们有时会促进通
过假说的含义而对假说所作的间接检验;而且(3)如我们前面已经提到过的,它们有时是
对一理论预期的合理性的存在条件加以限定的方便途径。前两个方面还需要作进一步的讨
论。
1.“假设”在表达一种理论中的作用
叶子的例子证明了假说的第一个作用。不采用叶子力图使它们所得到的阳光最大化这一
说法,我们同样可以在没有任何明显的假设的情况下来表述这一假说。我们的表述是以预测
叶子的密度所须遵循的一系列原则的形式来进行的:如果一棵树生长在一处平地上,且没有
别的树木或其它物体来阻挡阳光的照射,那么,这棵树上叶子的密度将是如何如何。……相
反,如果一棵树是生长在山的北坡,且位于由同样树木所形成的森林的中央,那么,这棵树
上叶子的密度将是如何如何……等等。很明显,与叶子力求使它们所能得到的阳光最大化这
种表述相比,刚才的那一种表述远不是这一假说的简便形式。事实上,由于前一种较简便的
表述既指出了如何确定对本问题来说是非常重要的环境特点,又指出了如何对它们的影响加
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
以评价,所以,前一种表述是对上述一系列原则的简单概括——即使这一原则系列被扩展到
无穷大。前一种表述更为精悍而又不失全面。
更广泛地说,一假说或理论通常都含有这样的断言:某些力量(言外之意就是别的力量
不是这样)对于某一特定种类的现象来说是重要的;并通常对它所断言的重要力量的行为方
式加以限定。我们可以把这一假说看作是由两部分组成的:第一部分是一个概念性的世界,
或者说是一个与“现实世界”相比较为简单的抽象模型。这一世界只包含该假说认为是重要
的各种力量。第二部分是一系列原则。这些原则定义了这样一类现象——它们使得上述模型
得以成为“现实世界”的一个适当的代表,同时,这些原则还对模型中的变量或实体与可观
测的现象之间的对应关系作了限定。
从本质上看,这两个部分是截然不同的。模型是抽象的、完整的,它是一种“代数学”
或“逻辑学”。在检验模型的一致性与完整性,探究模型的含义方面,数学与正统的逻辑学
回归它们的老本行。在模型当中,“大概”、“可能”、或“近似于”这一类东西根本没有存在
的余地,而且也不起任何作用。对于真空来说,气压是零,而不是“较小”;对于竞争性市
场上的产品生产者来说,需求曲线是水平的(斜率为零),而不是“几乎是水平的。”
另一方面,使用模型的原则却又不可能是抽象的和完整的。它们必然是具体的,从而也
就必然是不完整的。这是因为,不论人们如何定义“现实世界”,完整性只有在概念性的世
界里才会存在,而不可能存在于”现实世界”中。模型是“在太阳之下不存在任何新的东西”
这一只有部分真实性的欺人表述的逻辑体现;然而,在应用模型的原则中却不能忽略具有同
等重要性的另一个只有部分真实性的欺人表述:“历史永远不会重新开始。”当一理论是一明
显地更为一般的理论的一部分时(如落体这一例子中的真空理论一样),在相当程度上,我
们可以把模型的应用原则明确地、系统地阐述出来。尽管这时的阐述仍不完整,但却是最容
易进行的。为了使一科学尽可能地具有“客观性”。我们的目标应当是尽其所能地对这些原
则作以明确、系统的阐述。并不断地扩大可以进行如此阐述的现象范围。但是,不论在这一
努力上面我们取得了多么大的成功,总是不可避免地要在实行这些原则时出现新的问题。每
一种情况都有其独特之处.而这是那些明文规定的原则所不能—一囊括的。对这些特殊情况
加以判断,并对这些特殊情况是否应影响到可观测现象与模型中的实体之间的对应关系加以
判断,这需要具备这样一种能力:这种能力不能靠别人的传授来获得。它只能通过实践并置
身于一种“正确的”科学氛围中来掌握,而不能机械照搬。正是在这一点上,出现了业余爱
好者与专职人员之间的分水岭,这对所有的科学来说都是一样的。也正是在这一点上,体现
了怪诞者与科学家之间的微妙差异。 下面这个简单的例子可能会有助于弄清这一点。欧
几里得几何学是一个抽象的模型。从逻辑上看它是完整的和一致的。模型中的实体(或称变
量)都经过了严格的定义。如一条直线的定义不是一个其长度要比其宽度或深度“大得多”
的几何图形,而是一个其宽度与深度为零的图形。它同时也是非常“非现实主义的。”在“现
实”中不存在如欧几里得之点、之线、或之面一样的东西。让我们将欧几里得这一抽象模型
Milton Friedman:实证经济学的方法论
应用到我们用粉笔在黑板上所作的一个记号上面。这一记号是与欧几里得之线,还是与欧几
里得之面,还是与欧几里得之体相一致呢?很明显,如果这一记号正在被用来表示(比如说)
一条需求曲线,那么它完全与一直线相一致。但是,如果这一记号正在被用来为(比如说)
地图上的国家着色,那么它就不能与直线相一致了,这是因为那将意味着该地图永远也不会
具有颜色。为了实现这一目的,这同一记号必须与面相一致。但是,对于粉笔的生产者来说,
它却不能与面相一致,因为如果是这样的话,那么粉笔将永远也用不完。出于这种考虑,这
同一记号必须与体相一致。在这一简单例子中,上面所提到的那些判断将取得广泛的一致意
见。然而,似乎很明确,虽然我们可以对指导这些判断的一般性原则作一系统的阐述,但这
些原则永远也不会真正作到包罗万象,囊括每一种可能出现的情况。它们并不具有欧几里得
几何学本身所具有的自圆其说、自成体系的特点.
我认为,在谈到一理论的“至关重要的假设”时,我们是在试图对这一抽象模型的关键
因素加以阐述。通常,可以用许多不同的方法来对这一模型加以完整的描述。也就是说,存
在着许多不同的“基本原理”体系;作为一个整体,它们既包含了模型的內容又为模型的内
容所包含。从逻辑学的角度上看它们是等价的:从某一角度来说可以视为一模型的公理或曰
基本原理的东西。从另一角度来说也可以视为一模型的定理。反之亦然.被称为是至关重要
的那些特定的“假设”是以下述因素为依据选择出来的:这些‘假设”在阐述模型方面的简
洁性或经济性,直观的合理性,及提出假设的能力等.如果仅仅从含义上来看,也就是与人
们判断或应用模型有关的那些原则的一部分。
2.“假设”作为理论的间接检验标准所起的作用
在任一假说的表述中通常存在着这样一种情况:用来阐述该假说的那些论段中,哪一些
与假设有关,哪一些与含义有关似乎是泾渭分明的。然而,这二者之间的区别却难以准确定
义。我认为,这不是由这类假说本身的特点所决定的,而是由该类假说将被用于的对象的特
征所决定的。如果确实是这样,那么要想使对这些论述的划分易于进行,就必须确保该假说
旨在服务的目的的明确性。在一抽象模型中定理和公理之间互换的可能性,意味着在与这一
抽象模型相对应的那个独立的假说中,也存在着“含义”与“假设”之间互换的可能性。但
这并不是说任一含义都可以与任一假设互换,而是说那种可以包含其它论述的论述体系可能
不止一个。
例如,让我们来看一下寡头行为理论中的一特殊主张,如果我们假定:(1)企业通过各
种方法来使其成果最大化,甚至不惜获得或扩大垄断力量。这将意味着,(2)当对某一“产
品”的需求存在着地区性的不稳定,运输费用极高,公开的价格协议不合法,且该种产品的
生产者为数极少时,他们将会试图建立基点定价体系。由于我们已将市场行为预测接受为本
分析的目的,所以我们将论述(1)视作该理论的假设,而将论述(2)视作该理论的内容。
如果我们发现(2)中所描述的情况通常与基点定价法结合在一起,那么我们将认为假设(1)
是可以接受的;反之亦然。现在让我们将该分析的目的改为:按照谢尔曼反托拉斯法对控制
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
贸易同盟的禁止,确定哪些情况应予上诉。如果我们现在假定:(3)基点定价方法是在(2)
中所限定的条件下蓄意产生的一种手段,以利于协同一致.那么这将意味着,(4)参加墓点
定价的企业参与了“控制贸易同盟”。先前作为假设的东西现在变成了内容;同样,先前作
为内容的东西现在变成了假设。现在,如果我们发现企业参与了基点定价,那么我们将现假
设(3)为合理的。当一企业参与基点定价时,通常还会存在其它的证据,如书信、便函等.这
些材料将被法庭视为“控制贸易同盟”的证据。
假定该像说服务于第一种目的,即预测市场行为。很清楚,这并不等于说该假说将服务
于第二种目的,即预测是否存在足够的证据来证实“控制贸易同盟”的存在,从而确定法院
所应采取的行动。反之,如果该假设服务于第二个目的,这同样不等于说它将服务于第一个
目的。然而,在缺乏其它证据的情况下,该假设服务于一种目的所取得的成功(在解释一类
现象方面所取得的成功),与该假说服务于另一种目的所可能取得的成功相比(即在解释另
一类现象方面所取得的成功),前者将给我们带来更大的信心。要想具体说明前者所证实的
把握性比后者到底大多少,将更为困难。这是因为这取决于我们对这二类现象之间相互联系
的紧密程度的判断;而这本身又将通过复杂的途径而取决于某些同种的间接证据——即在通
过单纯的理论现象进行解释时我们所具有的在其它方面的经历。而这些单纯的理论现象在某
种程度上又是同样纷呈复杂的。
为了更进一步地阐述这一观点,我们可以通过那些被称作一假说的假设的东西,来取得
一些间接证据。这些间接证据是关于一假说的可接受性的。上述结论仅在如下意义上才能成
立:假设本身可以被视作等同于该假说的含义。因为这样一来,假设与现实的一致性就可以
被视作等同于人们在试图证明某些含义与现实相抵触时所遭到的失败。或者说上述结论仅在
如下意义上才能成立:这些假设可能使人们想起该假说中另外一些易受偶然的实际观察所影
响的含义。之所以说这一证据是间接的,是因为这些假设或该假说的各种含义所指的那一类
现象,通常不同于该假说旨在说明的那一类现象。的确,如我们前面所讲的那样,这一点似
乎是我们在确定哪些论述应冠之以“假设”,而哪些论断应冠之以“含义”时所依据的主要
标准。这一间接证据所具有的重要性,取决于