科学吧 关注:318,089贴子:1,513,927
  • 13回复贴,共1

迪昂-纽拉特-奎因问题

取消只看楼主收藏回复

首先问题的起源和科学划界有关系:
http://zh.wikipedia.org/zh/%E6%9D%9C%E6%81%92-%E7%BA%BD%E6%8B%89%E7%89%B9-%E8%92%AF%E5%9B%A0
英文好的看这里:
http://en.wikipedia.org/wiki/Duhem-Quine_thesis
迪昂奎因理论(也叫做迪昂奎因问题)就是:“不可能实证检验一条孤立的科学假说”,因为实验检验一条或多条假说需要背景假设(也叫做辅助假设或辅助假说)。问题是假说自身无法完成预测。相反,依赖背景假设所产生的预测,通常需要假设其他几个假说都是正确的;例如,必须假设实验设计是准确的。例如,要证伪地球是运动的,人们做实验每次小鸟离开树枝都没有被甩到天空中。(原文如此,但我想我可以举个更好的例子,每次房子倒塌就检查到钢筋腐蚀,有一次微弱的地震,房子塌了,也看见某些腐蚀的钢筋,这也一定是因为钢筋腐蚀塌的而不是因为地震——这种经验性推断)。我们不再接受地球没有运动的理论是因为我们有更好的物理解释。
虽然一组假设(即假设和它的背景假设)整体可以被经验世界实验证明是错误的,但是迪昂–奎因理论认为不可能从一组假说中孤立出单一假设来证伪。因此科学家们面临的困境的一种解决方案是,当我们有合理的理由来接受背景假设为真(如通过科学证据)我们会非决定性的理性相信如果实验结果失败那么理论不成立。
自然科学特别是其基本学科:物理,主要的命题都是全称命题(包括用函数形式、微积分形式或博弈论模型等表达的命题)如F=ma;而社会科学恰好相反,除了经济学有相当丰富的形式模型(formal model)为代表的全称命题外,绝大部分社会科学都是概率形式的命题(即统计模型或其变体),用文字表达即是“某个类属越具备A特征……,则越倾向于出现C结果”等类似形式的命题。所以,在自然科学哲学领域发展起来的证伪主义方法论能否移用于社会科学,我们还需要做更仔细的讨论。
事实上,波普尔已经指出证伪只适用于“全称命题”,因为从逻辑上讲,只有“全称命题”才具备“单个反例证伪”(如对乌鸦命题只需要一个反例就可以证伪)的可能性,而“或然性命题”则不可以,具个最简单例子;发现一只白色的乌鸦我们就可以说证伪了“一切乌鸦皆黑”这个命题,而发现一个富人不投票给共和党我们并不能证伪“80%的富人投票给共和党”这个事实,或者“美国人越富有,越倾向于投票给共和党”这个规律,或者“个人经济条件影响政治选择”这个更具一般性的命题,因为这些命题并不排除也有富人不投票给共和党这一事实。波普尔甚至已经指出:“概率陈述就是不可证伪的。概率假说并不排除任何可观察的东西;概率陈述不可能同一个单称陈述发生矛盾,或被它反驳;它们也不可能被任何有限数目的单称陈述所反驳;因此也就不会被任何有限数目的观察所反驳”(波普尔, 1986)。波普尔这番表述,已经非常明确指出全称陈述(全称命题)和概率陈述(或然性命题)在证伪方面的根本差异。所以,“波普尔在他的科学方法论理论中引入‘可证伪性’来取代‘可证实性’,是因为科学理论命题在逻辑上的全称性质以及全称命题的涵盖范围的无限性质所使然。


1楼2013-07-02 22:16回复
    这个表反映了无限统计命题的不可证伪的情况。
    统计学有很多无限统计命题,但统计学是科学无误。
    ——————————有限命题———————————————— 无限命题
    全称命题——可证实,可单个反例证伪——————————不可证实,可单个反例证伪
    统计命题——可证实,可严格证伪和概率证伪—————————不可证实,不可证伪


    3楼2013-07-02 22:48
    回复
      对于演绎主义和证伪主义方法论的推崇者,经济学的理论建构采用的是给定初始条件的演绎推理,对这一方法论的早期而精确的阐述(也许在方法论意义上至今没有被超越)来自于穆勒的《政治经济学的定义及其方法》一文,穆勒把这种方法称为“先验方法”或“演绎方法”。“演绎法中采用的是古典逻辑,那么,如果逻辑正确,给定假定是正确的,结论也被认为是确定无疑的”(Hands, 1990),也即“理论假说思想或核心一旦确定,其后的推理过程则完全是一种逻辑推理过程”(陈璋,1998)。
      可以想想欧几里德几何,在四条公理基础上得到一个理论大厦,某种意义上,当四条公理确定的时候,所有的定理都可以自动地被证明了,需要的只是学者们的发现,但是每条定理的发现都是不容易的,尽管只是一个纯粹的逻辑推理过程。就如同爱因斯坦的相对论证伪了牛顿运动理论,但牛顿运动理论还是大有用武之地(只是范围被更严格地限定了)。


      4楼2013-07-02 22:57
      回复
        波普尔提出证伪主义来取代证实主义。简略说就是“P1→TT→EE→P2”,即“问题→试探性理论→排错→新的问题”。从逻辑形式上看,波普尔的这个模式同实证主义的演绎性的覆盖律模式几乎是一样的:全称命题(一般规律)H与单个命题(背景知识或先行条件)C的合取演绎出某个预言(经验现象的描述)E,即(H∧C)→E,用一阶谓词逻辑的形式则可写作(对全部的X)(FX→GX)∧Fa→Ga。
        但二者对这个模式的理解和应用却存在极大的差异。实证主义者期望Ga与经验相吻合,虽然((H∧C)→E)∧E)→H不是重言式,但E总能给予H以某种概率的支持,也就是说,H具有概率真。波普尔的证伪主义推崇判决性实验,期望Ga与经验不相吻合,如果C为真,((H∧C)→E)∧E→H是一个重言式,H的证伪具有必然性。表现在进步观上,波普尔得出的结论是E不断证伪H,科学知识的进步就象生物进化一样,“不断推翻一种科学理论、由另一种更好的或更合乎要求的理论取而代之”


        5楼2013-07-02 23:16
        回复
          波普尔的证伪主义将证伪当作检验的唯一方面,造成了内在的致命缺陷。按照上述逻辑模式,设想C中包含着理论(或先前的假说)是合情合理的。要想证伪H,必须假设C为逻辑真,这与证伪主义有冲突,按证伪主义的一贯立场,C中的理论也可能被证伪。但如果假设C的逻辑真存有疑问,E假又不能必然推出H假。拿波普尔认为的典型的伪科学占星术为例,或者由于背景知识的不确定而不能被证伪,或者可以象炼金术、燃素说一样被证伪,但它又具有了科学的地位。因此,波普尔的证伪主义并没有解决科学与伪科学的划界问题。


          6楼2013-07-02 23:19
          收起回复
            波普尔《科学发现的逻辑》,第八章 概率:
            在这一章,我将只讨论事件的概率以及它引起的问题。这些问题的产生同博奕论和物理学的概率定律有关。我将什么可称之为假说的概率问题——例如一个经常受到检验的假说是否比一个很少受到检验的假说更可几等问题——留到第79至85节在“验证”题目下进行讨论。
              与概率论有关的观念在现代物理学中起着决定性的作用。然而我们仍然缺乏一个满意的、前后一致的概率定义;也就是说,我们仍然缺乏一个满意的概率计算的公理系统。概率和经验之间的关系也仍然需要澄清。在研究这个问题时,我们将发现对我的方法论观点几乎不能克服的反对意见最初是什么。因为虽然概率陈述在经验科学中起着如此重要的作用,可是结果它们却在原则上不受严格证伪的影响。然而,这块绊脚石将成为检验我的理论,以便查明它有什么价值的试金石。
              因此我们面临两项任务。第一项任务是为概率计算提供新的基础。我将试图通过把概率论发展为频率理论做到这一点,沿着Richard von Mises所遵循的路线,但不用他称之为的“收敛公理”(或“极限公理”),而使用有点削弱了的“随机公理”。第二项任务是阐明概率和经验之间的关系。这是指解决我所说的概率陈述的可判定性问题。
              我希望这些研究将有助于减轻目前的不满意的情况,物理学家在这种情况下大量使用概率,而未能前后一致地说明他们所说的“概率”是什么。


            8楼2013-07-08 14:07
            回复
              49.机遇理论的基本问题
                概率理论的最重要应用是用于我们可称之为“似相遇的”(chance-like)或“随机的”事件,或偶发事件。它们的特征是一种特殊的不可计算性,这使得人们经过许多次不成功的尝试后倾向于相信,一切已知的理性预测方法用于这些事件必定失败。可以说,我们感觉到除了先知以外没有一个科学家能够预测它们。然而正是这种不可计算性使我们得出这样的结论:概率的计算能够应用于这些事件。
                如果我们接受主观理论,那么从不可计算性达到可计算性(即达到某种计算的可应用性)这个有点悖论性质的结论,确实不再具有悖论性质了。但是这种避免悖论的方法是极不令人满意的。因为它包含着这样的观点:概率计算与经验科学的所有其他方法相反,不是一种计算预测的方法。按照主观理论,它不过是一种使我们已知的东西或者更确切地说,使我们未知的东西实行逻辑变换的方法;因为正是在我们缺乏知识时我们实行这些变换。这种观念确实使悖论消解,但它不能解释被解释为频率陈述的无知陈述如何能够在经验上受到检验和得到验证。然而这正好是我们的问题。我们如何能够解释这个事实:我们可从不可计算性——即从无知——中作出能够解释为经验频率陈述的结论,并且尔后我们发现它们在实践中得到光辉的验证呢?
                甚至频率理论直到现在还不能对这个问题——我将称之为机遇理论的基本问题——提供一个令人满意的解答。在第67节将表明这个问题与“收敛公理”有联系,后者是目前形式的这个理论的一个组成部分。但是在这个公理消除后,在频率理论框架内找到一个令人满意的解决办法是可能的。通过分析这样一些假定就会找到这种解答,这些假定使我们能够从单个偶发事件不规则序列推论到它们频率的规则性或稳定性。
                50.von Mises 的频率理论
                为概率计算的所有主要定理提供基础的频率理论首先由Richard von Mises提出的。他的基本思想如下。
                概率计算是似机遇的或随机的事件或偶发事件序列,即例如连续掷骰子那种重复性事件序列的理论。借助两个公理条件把这些序列定义为“似机遇的”或“随机的”:收敛公理(或极限公理),和随机公理。如果一个事件序列满足这两个条件,von Mises就称它为一个“集合”(collective)。
                大体上说,一个集会就是一个事件或偶发事件的序列,它在原则上可以无限地延续下去;例如掷骰子序列。假设骰子是破坏不了的。在这些事件中,每一个都有一定的特性和性质;例如可以掷个5,因而具有性质5。如果我们选取直到序列某一元素以前已出现的所有具有性质5的掷骰子次数,除以直到那个元素以前掷骰子的总数(即序列中它的基数),那么我们就获得直到那个元素以前的5的相对频率。如果我们确定了直到这个序列每个元素以前5的相对频率,我们就用这种方法获得一个新的序列——5的相对频率序列。这种频率序列不同于它与之相应的原先的事件序列,后者可称为“事件序列”或“性质序列”。
                我选取我们称之为“二择一”(alternative)作为一个集合的简单例子。我们用这个词指假定只有两种性质的事件序列——例如掷一个钱币猜正反面的序列。一种性质(正面)用“1”表示,另一种性质(反面)用“0”来表示。于是事件序列(或性质序列)可用下式表示:
                (A)01100011101010……
                与这种“二择一”相应——或更精确地说,与这种二择一的性质“1”相关——的是下列“相对频率序列”,或“频率序列”:
                ……
                收敛公理(或“极限公理”)假定,随着事件序列越来越长。频率序列将趋向一个确定的极限值。von Mises使用这个公理是因为我们必须弄清楚我们能够借以工作的某个固定的频率值(即使实际的频率值有一些波动)。在任何集合中至少有两种性质;如果我们得到与某个集合所有性质相应的频率极限值,那么我们就得到集合的“分布”。
                随机公理或有时称之为“排除赌博系统原理”(the principle of the excluded gambling system),是打算用来为序列的似机遇性质提供数学表现。显然,如果掷硬币的序列有规律性,比方说在每三次掷正面后就出现反面相当有规律,那么一个赌徒就会用某种赌博系统来改善他的运气。随机公理就一切集合假定,不存在能够成功地应用于这种集合的赌博系统。它假定,不管我们可以选取何种赌博系统以选择认为有利的掷猜(tosses),我们将发现,如果赌博有足够长的时间继续下去,认为有利的掷猜序列中的相对频率接近的极限值与所有掷猜序列的极限值是一样的。因此存在着一种赌徒能借以改善他运气的赌博系统的序列不是von Mises意义上的集合。
                对于von Mises来说,概率是“集合中相对频率极限度”的另一个术语。所以概率概念仅应用于事件序列;从Keynes等人的观点看来,这样的限定大概是完全不能接受的。对于批评他的解释太窄的人,von Mises的回答是强调科学的使用概率(例如在物理学中)与一般的使用概率之间的不同。他指出要求定义恰当的科学术语非要在一切方面去适应不确切的、前科学的用法是个错误。
                按照von Mises的意见,概率计算的任务只不过在于此:从具有某些给定“初始分布”(initial distributions)的某些给定“初始集合”(initial collectives)推论出具有“导出分布”(derived distributions)的“导出集合”(derived collectives);简言之,根据给定的概率计算出那些没有给定的概率。
                von Mises把他的理论的独特特点概括为四点:集合概念先于概率概念;定义概率概念为相对频率的极限值;提出随机公理;以及规定概率计算的任务。


              10楼2013-07-08 14:15
              回复
                51.新的概率理论计划
                  von Mises提出的两条公理或公设以定义集合概念曾遇到强烈的批评——我认为这个批评不是没有道理的。特别是反对把收政公理和随机公理结合起来,理由是不允许把极限或收敛的数学概念应用于按照定义(即由于随机公理)必定不服从任何数学规则或定律的序列。因为数学极限值不过是决定序列的数学规则或定律的特有性质。数学极限值不过是这种数学规则或定律的一种性质,如果任意选定一个接近于零的分数,序列中都有一个元素,使得在它之后的所有元素与某个一定的值的差小于这个分数——于是这个值称为它们的极限值。
                  为了对付这些反对意见,有人建议不要把收敛公理和随机公理结合起来,仅假定收敛,即被限值的存在。至于随机公理,建议或者全然放弃它(Kamke),或者用较弱的要求代替它(Reichenbach)。这些意见的前提是认为引起麻烦的是随机公理。
                  与这些观点相对照,我倾向于责怪收敛公理不亚于责怪随机公理。因此我认为有两项任务要做:改进随机公理——主要是一个数学问题;以及完全消除收敛公理——认识论家特别关心的一个问题(参阅第66节)。
                  下面我首先讨论数学问题,然后讨论认识论问题。
                  这两项任务中的第一项,即数学理论的重建,其主要目的是从一个修改了的随机公理推导出Bernoulli定理——第一个“大数定律”;修改为实现这个目的所需,不要求更多。更确切地说,我的目的是推导出二项式公式(Binomial Formula,有时称为“Newton公式”),我称为“第三式”。因为能用通常的方法从这个公式中获得Bernoulli定理和概率论的其他极限定理。
                  我的计划是首先制定一个有穷类(finite class)的频率理论,并且尽量在这个框架内发展这个理论——即直至推导出(“第一”)二项式。这个有穷类频率理论原来是类理论(thetheory of classes)一个十分基本的部分。它之得到发展只是为了获得讨论随机公理的基础。
                  接着我将通过引入收敛公理的老方法进而到无穷序列,即能够无限延续的事件序列,因为我们需要它来讨论随机公理。在推导出和考察Bernoulli定理之后,我将考虑如何能消除收敛公理,以及哪一类公理系统我们应该作为结果保留下来。
                  在数学推导的过程中,我将使用三个不同的频率符号:F”示有穷类的相对频率;F’示无穷频率-序列相对频率的极限值;最后F示客观额率,即在“不规则”或“随机”或“似机遇”序列中的相对频率。
                  52.有穷类内的相对频率
                  让我们考虑一类α的有穷数目的偶发事件,例如昨天用这粒特定的骰子掷猜这类偶发事件。设这类α为非空类(non-empty),可以说它起着参考系的作用,将称之为(有穷的)参考类(reference-class)。属于α的元素数目,即它的基数,用“N(α)”表示,读作“α数”。另一类β,可以是有穷的,也可以不是有穷的。我们称β为性质类(property-class)。例如它可以是所有掷5的类,或(如我们将要说的)所有具有性质5的掷猜类。
                  属于α又属于β的那些元素类,例如昨天用这粒特定的骰子掷并有性质5的掷类被称为α和β的乘积类(product-class),用“α·β”表示,读作“α和β”。由于α·β是α的子类,它至多能含有有穷的元素数(它可以是空类)。α·β中的元素数用“N(α·β)”表示。
                  当我们用N表示(有穷)的元素数时,用F”示相对频率。例如,“在有穷参考类α内性质β的相对频率”写作“αF”(β)”,可读作“β的α频率”。我们现在能定义
                  (定义1)αF”(β)=N(α·β)/N(α)
                  根据我们的例子这意味着:“昨天用这骰子掷时出现5的相对频率,按照定义等于昨天用这骰子掷5的数被昨天用这骰子掷的总数来除所得的商。”
                  从这个颇为平凡的定义中,能够十分容易地推导出有穷类中频率计算的定理(更具体地说,一般乘法定理;加法定理;以及除法定理,即Bayes规则)。在这种频率计算的定理中,以及在一般的概率计算中,其特征是基数(N数)从不在其中出现,出现的是相对频率,即比值,或F数。N数仅发生在一些基本定理的证明中,这些基本定理是直接从这个定义中演绎出来的;但N数并不发生在定理自身中。
                  在这里用一个十分简单的例子来说明对此应作如何理解。让我们用“”(读作“β的补数”或简单地读作:“非β”)来表示不属于β的一切元素类。于是我们可写出:
                  αF”(β)+αF”()=1
                  虽然这个定理仅包含F数,它的证明要利用N数。因为这定理认定义(1)中得出,借助于来自断言N(α·β)十N(α·β)=N(α)的类的计算的一个简单定理。


                11楼2013-07-08 14:19
                回复
                  53.选择、独立、无影响、无关
                    在能够用有穷类相对频率作的运算中,选择(selection)的运算对以下所述有特殊重要性。
                    设给定一个有穷参考类α,例如一只匣子中的钮扣类,以及两个性质类,β(比方说,红钮扣)和γ(比方说,大钮扣)。我们现在可把乘积类α·β看作一个新的参考类,并提出α·βF”(γ)值的问题,即在新的参考类内γ的频率的问题。新的参考类α·β可称为“从α中选择β元素的结果”或“按照性质β从α中选择”;因为我们可以想到它是通过从α中选择那些具有性质β(红)的一切元素(钮扣)。
                    γ发生在新的参考类α·β中的频率与发生在原先的参考类α中的频率相同,这恰恰是可能的;即
                    α·βF”(γ)=αF”(γ)是正确的。在这种情况下,我们(遵循Hausdorff)说性质β和γ“在参考类a内是相互独立的”。独立关系是三项关系,在性质β和γ上是对称的。如果两种性质α和β在参考类α内是(相互)独立的,我们也可说性质γ在α内不受β元素的选择的影响;也许可说参考类α,就性质γ而言,不受按照性质β所作的选择的影响。
                    β和γ在α内相互独立或不受影响也可——按照主观理论的观点——解释如下:如果我们被告知类α的某一特定元素具有性质β,那么这个信息是无关的,如果β和γ在α内是相互独立的话;也就是对于这个元素是否也有性质γ这个问题是无关的。如果另一方面我们知道,γ更经常(或不那么经常)发生在子类α·β(已根据β从α中选择出来)中,那么某个元素有性质β的信息对于这个元素是否也有性质γ的问题便是有关的了。
                    54.有穷序列、顺序选择和邻域选择
                    设有穷参考类α的元素是编了号的(例如盒子中的每一个钮扣都写上一个数目),并且把它们按照序数排列成序列。在这种序列中我们可以区分出两类具有特殊重要性的选择,即按照元素的序数进行选择,或简称顺序选择,以及按照它的邻域进行选择。
                    顺序选择是根据依赖于元素序数的性质β从序列α中进行选择,元素的选择必须根据序数决定。例如β可以是性质偶数(even),因此我们从a中选择的一切元素,其序数是偶数。因此选择出来的元素形成一个所选子序列(selected sub-sequence)。如果性质γ独立于根据β的顺序选择,那么我们也可说,顺序选择对γ而言是独立的;或者我们也可说序列α就γ而言,不受β元素的选择的影响。
                    邻域选择之有可能是由于这个事实:在把元素排列为编号序列时,某些邻域关系就形成了。这使我们例如有可能选择那些其直接先行者具有性质γ的所有成员;或者比方说,选择那些其第一和第一个先行者,或其第一个后续者具有性质Y的所有成员,如此等等。
                    因此如果我们有一个事件序列——比方说掷钱币猜正反面——,我们就必须区分两类性质:如“正面”或“反面”那样一些的主要性质,这些性质属于与其在序列中位置无关的每一个元素;以及如“偶数”或“反面的后续者”等那样一些次要性质,这些性质是一个元素由于它在序列中的地位而获得的。
                    具有两个主要性质的序列称为“二择一”。正如von Mises业已表明的(如果我们小心仔细),有可能把概率论的基本点发展为二择一理论,而不牺牲普遍性。用“1”和“0”表示二择一的两种主要性质,每一种二择一可表示为许多1和0的序列。
                    一种二择一的结构可以是有规律的,或者它也可能是多少不规则的。下面我将更周密地研究某些有穷二择一的这种规律性或不规则性。


                  12楼2013-07-08 14:28
                  回复
                    55.有穷序列的n-自由度
                      让我们以有穷二择一α为例,它由一个个1和0组成,有规律地排列如下:
                      (α)1100110011001100……在这种二择一中,我们有均等的分布,即1和0的相对频率是均等的。如果我们用“F”(1)”示性质1的相对频率,用“F”(0)”示性质0的相对频率,我们可写:
                      (1)αF”(1)=αF”(0)=1/2
                      现在我们从α中选择(在α序列内)具有直接接在1后面的邻域性质的所有项。如果我们用“β”表示这种性质,我们可称为所选子序列“α·β“。它有这样的结构:
                      (α·β)1010101010……
                      这个序列又是具有均等分布的一种二择一。而且,1和0的相对频率都没有变化;即
                      (2)α·βF”(1)=αF”(1);α·βF”(0)=αF”(0)
                      用第53节采用的术语,我们可以说二择一α的主要性质不受根据性质β作的选择的影响;简言之,α不受根据β作的选择的影响。
                      由于α的每一个元素或具有性质β(即是1的后续者)或是0的后续者,我们可用“”表示后一性质。如果我们现在选择具有性质的元素,我们得到这样的二择一:
                      (α·)01010101010……
                      这个序列离均等分布稍有偏差,因为它的始末都是0(因为均等分布a本身以“0’0”结尾)。如果a有2000个元素,那么α·将有500个0,只有499个1。这些离均等分布(或其他分布)的偏差只是因第一个元素或最后一个元素而引起的,可通过使序列足够长而使这些离差变得如我们喜欢的那么小。由于这个理由在下面我们将置这些偏差于不顾;尤其是我们研究的是无穷序列,在那里这些离差就消失了。因此,我们说,二择一α·β有均等的分布,并且二择一α不受有性质的元素的选择的影响。结果,α,或更确切地说,α的主要性质的相对频率都不受根据β和根据作的选择的影响;所以我们可以说,α都不受根据直接先行者的性质所作的每一种选择的影响。
                      显然,这种无影响是由于二择一α结构的某些方面所致;这些方面可把α与其他二择一区分开来。例如,二择一α.β和α.并非不受根据先行者的性质所作的选择的影响。
                      现在我们可以研究二择一α,看看它是否也不受其他选择,尤其是根据一对先行者的性质所作的选择的影响。例如,我们可从α中选择那些是一对1,1的后续者的所有元素。并且我们马上看到α并非不受四种可能的对即1,1;1,0;01;0,0中任何一对后续者的选择的影响。在这些情况下,得到的子序列都没有均等分布;反之,它们全都由不间断的块(blocks,或“反复”iterations)组成,即只由1,或只由0组成。
                      α不受根据单个先行者作的选择的影响,但是并非不受根据成对先行者的选择的影响,这个事实可用主观理论的观点表述如下。关于α中任何元素一个先行者性质的信息,对于这个元素的性质问题是无关的。另一方面,关于元素的成对先行者的性质的信息则是高度有关的;因为给定α据以建立的定律,它使我们能够预测所讨论的元素的性质:关于元素成对先行者性质的信息,可以说给我们提供演绎出预测所需的初始条件。(a据以建立的定律要求一对性质作为初始条件;因此就这些性质而言,它是“二维的”。详细说明一种性质仅是在成为复合时作为初始条件不充分时才是“无关的”。参阅第38节。)
                      我没有忘记因果性——原因和结果——概念与预测的演绎的关系是多么密切,同时我要利用下列术语。以前作出的关于二择一α的断言:“α不受根据单个先行者作的选择的影响”,我现在用下列说法来表示:“α不受单个先行者任何后效的约束”,或简言之,“α的自由度为1(1-free)”。不像以前那么说α“不受(或受)根据成对先行者所作的选择的影响”,我现在说:“a不受(或受)成对先行者后效的约束”,或简言之,“α的自由度是(不是)2”。
                      用自由度为1的二择一作为我们的原型,我们现在能够容易地建立也具有均等分布的其他序列,这些序列不仅不受一个先行者的后效约束,即(像α一样)自由度为1,而且还不受一对先行者后效的约束,即自由度为2;此后,我们可以继续达到自由度为3等等的序列。这样把我们引导到对下述是基本的一般概念。这就是不受直至某个数n的一切先行者后效约束的自由度概念;或者如我们将要说的,n-自白度概念。更精确地说,我们称一个序列“自由度为n”,当且仅当它的主要性质的相对频率是“n重无影响”,即不受根据单个先行者和根据成对先行者和根据三个一组的先行者……和根据n个一组先行者作的选择的影响。
                      自由度为1的二择一α可以用重复任何倍数的生成周期(generating period)。
                      (A)1100……
                      来建立。同样我们获得具有均等分布的自由度为2的二择一,如果我们把
                      (B)10111000……
                      作为它的生成周期,自由度为3的二择一从生成周期
                      (C)1011000011110100……
                      中获得,而自由度为4的二择一从生成周期
                      (D)01100011101010010000010111110011……
                      中获得。将会看到:面临一个不规则序列的直觉印象随它n自由度的数n的增长而越强烈。
                      具有均等分布的一个具n自由度的二择一的生成周期必须包含至少2n+1个元素,作为例子给定的周期,当然可以开始于不同的位置;(C)例如可从它的第四个元素开始,于是我们获得的不是(C),而是
                      (C’)1000011110100101……
                      有使序列的n-自由度不变的其他变换。为每一个数目n建立n-自由度序列生成周期的方法则在别处描述。
                      如果我们把下一生成周期的最初的n个元素加在一个自由度为n的二择一上,于是我们得到一个长度为2[n+1]+n的序列。除了其他性质外,这个序列还有以下的性质:n+1个0和1的每一种排列,即每一个可能的n+1个组,至少在其中发生过一次。


                    13楼2013-07-08 14:35
                    回复
                      57 无穷序列 频率的假说性估计
                        把为n-自由度有穷序列获得的结果推广到用生成周期(参阅第55节)定义的n-自由度无穷序列是十分容易的。起着参考类(我们的相对频率与此有关)作用的一个无穷的元素序列可称为“参考序列”。它多少与von Mises意义上的“集合”相对应。
                        n-自由度的概念以相对频率的概念为前提;因为n-自由度的定义要求不受影响——不受根据一定的先行者所作的选择的影响——的是一种性质在其中发生的相对频率。在我们讨论有穷序列的定理中,我将暂时使用(直到第64节)相对频率极限值(用F’表示)概念代替有穷类的相对频率(F”)。只要我们把自己限于根据某个数学规则建立的参考序列,这个概念的使用就不会发生问题。对于这些序列我们总可以确定相应的相对频率序列是否是收敛的。相对频率极限值概念只是在没有数学规则只有经验规则(与例如钱卜序列有关的)的序列的情况下才会引起麻烦;因为在这些情况下,极限值概念是未定义的(参阅第51节)。
                        建立序列的数学规则的一个例子如下:“序列α的第n个元素应该是0,当且仅当n可被4除”。它定义的无穷二择一是
                        (α)11101110……
                        其相对频率的极限值αF’(1)=3/4;αF’(0)=1/4。借助数学规则用这种方法定义的序列我简称为“数学序列”。
                        与之相对照,建立经验序列的规则是例如“序列α的第n个元素将是0,当且仅当硬币c的第n次掷猜出现反面时”。但是经验规则不一定总是定义随机性质的序列。例如,我应该把下列规则称为经验规则:“序列的第n个元素将是1,当且仅当第n秒(从某个零时算起)时,发现摆p摆到这标记的左方时”。
                        这个例子表明有时——例如根据与摆有关的一些假说和测量——可用数学规则代替经验规则。用这种方法我们会找到一个数学序列,它以按我们的目的也许使我们满意,也许不能使我们满意的精确度接近于我们的经验序列。有可能(我们的例子可用来建立这种可能)获得一个其各种频率接近于那些经验序列的频率,在我们目前的情况下具有特殊的意义。
                        我把序列分为数学序列和经验序列时,我利用的是“内包”上的差别,不是“外延”上的差别。因为如果用“外延”方法,即用一个接一个地列举其元素的方法使我们得一个序列--因此我们就只能知道它的一个有穷的片段,一个有穷的节段,不管它有多长——,那么就不可能根据这个节段的性质确定其一部分的序列是学序列还是经验序列。仅当给定一个建构规则——即“内包”规则—一时,我们就能判定一个序列是否是数学的还是经验数的。由于我们希望借极限值(相对频率)概念之助处理我们的无穷序列,我们必须把我们的研究限于数学序列,实际上就是限于相应的相对频率序列是收敛的那些数学序列。这种限制等于引入收敛公理。(与这公理有关的问题到第63-66节再讨论,因为与“大数定律”一起讨论它们比较方便。)
                        因此我们将只谈数学序列。然而我们将只谈那些数学序列:我们期望或推测它们就频率而言接近于具有似机遇或随机性质的经验序列,因为它们是我们的主要兴趣所在。但是期望或推测一个数学序列,就频率而言它接近于经验序列,不过是提出一个假说——一个关于经验序列频率的假说。
                        我们对经验随机序列的频率的估计是假说这一事实,对我们用以计算这些频率的方法没有任何影响。显然,在有穷类方面,它对我们如何获得我们的计算由此开始的频率,丝毫没有关系。这些频率可借实际计算获得,或根据一条数学规则,或根据某种假说获得。或者我们简直可以虚构一些频率。在计算频率时我们接受某些频率作为给定的,并从中推导出其他频率。
                        无穷序列中的概率估计同样如此。因此关于我们频率估计的来源问题不是一个频率计算问题;然而这并不是说把这个问题从我们关于概率论问题的讨论中排除出去。
                        在无穷经验序列的情况中,我们能区分出我们假说性频率估计的两种主要“来源”——就是说两种方法,我们用这两种方法就可估计出频率。一是基于“均等-机遇假说”(equal chance hypothesis),(或等概率假说equi-probability hypothesis)的估计,另一是基于统计结果的外推(extrapolation of statisticalfndings)。
                        我用“均筹-机遇假说”,是指这样一种假说,它断言各种主要性质的概率是均等的:它是断言均等分布的假说。均等-机遇假说常常基于对称性的考虑。最典型的例子是掷骰子时均等频率的推测,其根据是立方体六面的对称性和几何等值。
                        至于基于统计学外推的频率假说,死亡率的估计提供一个很好的例子。在这里关于死亡率的统计资料是用经验查明的,并且根据过去的趋势将继续足十分接近稳定的,或者它们不会有很大变化——至少在最近时期内——的假说从已知事例,即从已用经验加以分类和计算的偶发事件外推到未知事例。
                        具有归纳主义倾向的人容易忽视这些估计的假说性质,他们会把假说性估计,即基于统计外推的频率预测同它们的经验“来源”之——过去的偶发事件和偶发事件序列的分类与实际计算混为一谈。往往提出这样的主张;我们从已加以分类和计算的过去的偶发事件(如死亡统计)中“推导出”概率估计——即频率预测。但是从逻辑观点看,这个主张并没有得到证明。我们根本没有作什么逻辑推导。我们已经做的是提出一个不可证实的假说,这个假说在逻辑上是永远得不到证明的,这个假说就是推测频率仍将稳定不变,因此允许外推。甚至均等-机遇假说也被一些相信归纳逻辑的人认为是“经验上可推导的”,或“经验上可说明的”,他们认为这些假说基于统计经验,即基于经验上观察到的频率。然而就我来说,我相信,我们在作出这种假说性估计时,往往单独爱关于对称意义的想法以及类似的考虑的引导。我看不出有任何理由为什么这些推测应该只是由于积累大量归纳观察而产生的。然而,我并不赋于我们估计的起源或“来源”这些问题以很大意义(参阅第2节)。我认为,更重要的是对这个事实要十分清晰,即频率的一切预测性估计,包括我们从统计外推中得到的频率——当然还有所有与无穷经验序列有关的频率——总是纯粹的推测,因为它总是超出我们有权根据观察肯定的任何东西。
                        我对均等-机遇假说和统计外推的区分与“先验”和“后验”概率的经典区分是完全符合的。但是由于这些术语是用于如此多的不同意义。而且由于这些术语因哲学上的联想而被严重玷污,最好还是避免用它们。
                        我在下面考察随机公理时,将试图寻找逼近随机经验序列的数学序列;这就是说我将考察频率假说。
                        58 随机公理的考察
                        顺序选择(即按位置选择)的概念和邻域选择的概念均已在第55节中引入和说明。我现在将借助这些概念检查vonMises的随机公理——排除赌博系统原理——以希望找到一个能代替这个公理的较弱的要求。在von Mises的理论中,这个公理是他的集合概念的定义的一部分:他要求一个集合中频率的极限一定要对任何种类的系统选择(systematic Selection)不敏感(他指出,赌博系统总是可被认为是一种系统选择。)。
                        对这个公理提出的大多数批评集中于它的表述的相对不重要的和表面的方面。这与下列事实有关,即在各种可能的选择中,会有这样的选择:比方说选择那些接近5的掷;显然在这种选择内,5的频率会与在原先序列内5的频率迥然不同。这就是为什么von Mises在他的随机公理表述中谈到他所说的“选择”或“选取”是“独立于”掷的“结果”,因而不用所选元素的性质去定义。但是只要指出我们可以根本不用成问题的措词来表述von Mises的随机公理,就可以完全答复针对这种表述的许多非难。因为例如我们可以表述如下:在一个集合中频率的极限一定都不受顺序选择和邻域选择的影响,而且也不受可用作赌博系统的这两种选择方法的所有组合的影响。
                        上述困难随这个表述而消失。然而其他困难仍保留。因此也许不可能证明,借助如此强的随机公理定义的一个集合概念,不是自相矛盾的;换言之,不可能证明“集合”的类不是空的。(Kamke曾强调证明这一点的必要)至少,建构某个集合的例子,并用这种方式说明集合的存在,这似乎是不可能的。这是因为满足一定条件的某一无穷序列的例子只可能由数学规则来提供。但是对于von Mises意义上的集合,根据定义不可能有这种规则,因为能够把任何规则都用作一种赌博系统或选择系统。如果所有可能的赌博系统都被排除,这种批评确实是无法驳斥的。
                        然而也可提出另外的异议来反对排除所有赌博系统的概念:它的要求实在太多了。如果我们要使某个陈述系统公理化——在这个场合是概率计算定理,尤其是特殊的乘法定理或Bernoulli定理——,那么所选的公理不仅应该对系统定理的推导是充分的,而且也是(如果我们能这样推导出定理)必要的。然而可以表明排除所有选择系统对Bernoulli定理及其系统定理是不必要的。要求排除特殊类的邻域选择是十分充分的:它是以要求序列应该不受根据任意选取的n个一组的先行者所作的选择的影响;也就是说,它应该有n个自由度,不受每个n的后效的约束,或简言之,它应该是“绝对自由的。”
                        所以我建议用不那么严格的“绝对自由”的要求(对每一个n有n-自由度的意义上)来代替von Mises的排除赌博系统原理,并且相应地把似机遇的数学序列定义为满足这个要求的序列。其主要优点是不排除所有赌博系统,因此有可能提供建构在我们的意义上“绝对自由的”序列的数学规则,从而有可能建构实例。因此也就满足了上面讨论的Kamke的异议。因为我们现在能够证明似机遇数学序列的概念不是空的,所以是前后一致。
                        也许有点奇怪:我们应该试图借助必须符合最严格规则的数学序列来勾划机遇序列极不规则的特点。von Mises的随机公理起初似乎使我们的直觉更为满意。一个机遇序列必定是完全不规则的,因此只要我们继续努力试图通过把这个序列延伸得足够长来证伪这个推测的话,任何推测的规则性一定会在序列的后面部分遇到失败,知道这一点是颇为令人满意的。但是这个直觉的论证也有利于我的建议。因为如果机遇序列是不规则的,那么,不容置疑,它们就不会是某种特殊类型的规则序列。而我们的“绝对自由”要求不过是排除一种特殊类型的规则序列,尽管是一种重要的类型。
                        它是一种重要的类型这一点可以从这个事实中看出,即根据我们的要求不言而喻地排除下述三种典型的赌博系统(参阅下一节)。首先我们排除“正态的”或“纯粹的”邻域选择,在其中我们根据邻域的某种恒定的特征进行选择。其次,我们排除“正态的”顺序选择,这种选择选取的元素,它们的间距是恒定的,例如标号为是k,n+k,2n+k……等等的元素;最后,我们排除这两种类型选择的许多组合(例如一切第n个元素的选择,假如它的邻域具有某种具体的恒定特征)。所有这些选择的独特性质是,它们与序列的绝对的第一元素无关;如果原先的序列从另一个(相应的)元素开始标号,它们就可产生同样的所选的子序列。因此被我的要求排除的赌博系统是那些无需知道序列的第一元素而可使用的赌博系统。被排除的系统总涉及某些(线性)变换。它们是简单的赌博系统。(参阅第43节)。我的要求不予排除的只是涉及诸元素与绝对的(初始的)元素间有绝对距离的赌博系统。
                        对一切n有自由度n——“绝对自由”——的要求也与我们大多数自觉地或不自觉地认为对机遇序列也适用的东西完全一致;例如一粒骰子下一次掷的结果不依赖以前几次掷的结果(掷以前摇摇骰子的做法就是想要保证这种“独立性”)。


                      15楼2013-07-08 14:44
                      回复
                         62.Bernoulli定理和概率陈述的解释
                          我们刚刚看到,用言语表述的Bernoulli定理中“概率”一词出现了两次。
                          频率理论家在两种情况下根据它的定义翻译这个词没有困难:他能对Bernoulli定理和大数定律提供一个清楚的解释。主观理论的拥护者也能以它的逻辑形式做到这一点吗?
                          想把“概率”定义为“理性信仰程度”的主观理论家,当他把“……的概率如我们希望的那样逼近1”这些话解释为“……几乎是确定无疑的”时,他前后完全一致,并且有权这样做。但是当他继续说:“……相对频率与它最可几的值p 的离差小于一定量……”,或用Keynes的话说,“事件出现的比例与最可几的比例p的离散小于一定量……”时,他只不过模糊了他的那些困难。这听起来似乎蛮有道理,至少乍一听来是这样。但是如果在这里我们也把“可几的”(有时省略)一词,用主观理论的意义加以翻译,那么整个问题变成这样:“相对频率与理性信仰程度p值的离差小于一定量几乎是确定无疑的,”我认为这是十足的废话。因为相对频率只能与相对频率作比较,只能与相对频率有离差或没有离差。很清楚,在演绎Bernoulli定理之后,把一个不同于演绎之前给予p的意义给予它是不允许的。
                          因此我们看到主观理论不能用统计学的大数定律来解释Bernoulli定理。统计定律的推导只有在频率理论的框架内才有可能。如果我们从严格的主观理论出发,将永远达不到统计陈述——即使努力填补同Bernoulli定理之间的鸿沟也不能达到。
                          


                        17楼2013-07-08 14:53
                        回复
                          65.可判定性问题
                            无论我们可给概率概念下什么定义,或我们选择什么样的公理表述:只要二项式公式在系统内是可推导出来的,概率陈述就是不可证伪的。概率假说并不排除任何可观察的东
                          西;概率陈述不可能同一个基础陈述发生矛盾,或被它反驳;它们也不可能被任何有限数目的基础陈述所反驳;因此也就不会被任何有限数目的观察所反驳。
                            让我们假定我们已对某个二择一α提出某个均等机遇假说;例如我们已估计到用一块硬币作掷猜出现“1”和“0”的频率是均等的,因此αF(1)-αF(0)=1/2;再让我们
                          假定我们在经验上发现无例外地一次又一次出现“1”:于是我们无疑会在实际上放弃我们的估计,认为它已被证伪。但在逻辑的意义上不可能有证伪问题。因为我们可以肯定观察
                          的只是一个有限的掷猜序列。并且虽然根据二项式公式,碰巧出现与1/2的离差很大的十分长的有限节段的频率是极小的,然而它必定总仍然是大于0。因此具有甚至最大离差的有
                          限节段十分罕见的出现决不可能反驳这个估计。实际上,我们必定会期望它出现:这是我们估计的一个推断。任何这种节段可计算的罕见性将是证伪概率估计的一种手段,这种希
                          望证明是要落空的,因为甚至一个长的、离差大的节段的频率出现,也总可以说不过是一个更长、离差更大的节段的一次出现。因此不存在在外延方面给定的事件序列,所以不存
                          在能够证伪概率陈述的有限的几个一组的基础陈述。
                            只有一个无穷的事件序列——根据某项规则在内包上加以定义的——能反驳一个概率估计。但是鉴于第38节阐述的考虑(参阅第43节),这就是说,概率假说是不可证伪的,
                          因为它们的维(dimension)是无限的。所以我们实际上应把它们描述为经验上没有信息的、没有经验内容的。
                            然而面对物理学利用从概率假说性估计那里得到的预测所取得的成功,任何这种观点显然是不能接受的。(这里所用的论据同早些时候用来反对主观理论把概率解释为重言的
                          论据是一样的。)许多这些估计的科学意义不亚于其他任何物理学假说(例如,不下于某一决定论性质的假说)。并且物理学家常常很能判定他是否可暂时接受某种特定的概率假
                          说为“经验上得到确证的”,或他是否应该把它作为“实践上被证伪的”而加以摈弃,即对于预测设有用处。十分明显,这种“实践上被证伪”只能通过方法论上的判定才能获得
                          ,以把高度不可几的事件认作被排除的——被禁止的。但是根据什么理由可认为它们如此呢?我们应从什么地方获得这种思路?这种“高度不可几性”从哪里开始?
                            由于从纯逻辑观点看,概率陈述不可能被证伪这个事实是不可能有什么疑问的,我们在经验上使用它们这个同样不容置疑的事实似乎必定是对我关于方法(我的划界标准决定
                          性地依赖于它)的基本思想的致命打击。然而我将通过果敢地应用这些思想来试图回答我已提出的问题——什么是可判定性问题。但是要做到这一点,我将首先不得不分析概率陈
                          述的逻辑形式,既考虑到它们之间逻辑上的相互关系,又考虑到它们与基础陈述所处的逻辑关系。
                            66.概率陈述的逻辑形式
                            概率估计不是可证伪的。当然,它们也不是可证实的。同样理由这也适用于其他假说,因为看到任何实验结果,不管多么多和多么有利,最后总能确定“正”的相对频率是1/2
                          ,并且将总是1/2。
                            因此概率陈述和基础陈述不可能相互矛盾,也不可能彼此蕴含。然而由此得出结论说概率陈述和基础陈述之间没有任何逻辑关系,那就错了。并且同样不能认为虽然在这两类
                          陈述之间有逻辑关系(因为观察序列同频率陈述显然或多或少是接近一致的),这些关系的分析迫使我们引入一种突破经典逻辑的特殊概率逻辑。与这些观点相反,我认为这些关
                          系完全能够用可推演性和矛盾的“经典”逻辑关系来分析。
                            从概率陈述的非可证伪性和非可证实性可以推论出,它们没有可证伪的推断,它们本身不可能是可证实陈述的推断。但是相反的可能性并未排除。因为它可以是(α)它们有
                          单向可证实推断〔纯粹存在推断,或有推断(there-is-conse-quences)〕或(b)它们本身是单向可证伪全称陈述[所有-陈述(all—statements)]的推断。
                            可能性(b)对于弄清概率陈述和基础陈述之间的逻辑关系鲜有帮助:一个非可证伪陈述,即一个说得很少的陈述能够属于可证伪的、因而说得更多的陈述的推断类,这是非常
                          明显的。
                            对我们意义更大的是可能性(α),它无论如何不是没有意义的,并且事实上结果证明对我们分析概率陈述和基础陈述之间关系是基本的。因为我们发现能够从每一个概率陈
                          述中演绎出无限类的存在陈述,但反之不然。(因此概率陈述断言的比任何这些存在陈述断言的更多。)例如,设p是对某一二择一假说性估计的概率(并设0≠p≠1);那么我们
                          能从这个估计中演绎出例如1和0都将出现在这序列的存在推断。(当然也还有许多远不是那么简单的例子——例如,会出现与p的离差仅为一非常小的量的节段。)
                            但是我们从这个估计中能演绎出的多得多;例如“一遍又一遍地”出现一个具有性质“1”的元素和具有性质“0’的另一个元素;那就是说,在任何元素x之后,在序列中会出
                          现一个具有性质“1”的元素y,并且也出现一个具有性质“0”的元素x。这种形式的陈述(“对于每一个x有y具有可观察的、或外延上可检验的性质B”)既是不可证伪的——因为
                          它没有可证伪的推断——又是不可证实的——由于使之成为假说性的“所有”或“对于每一个”。虽然如此,它能够得到更好地或不那么好地“确证”——指我们可以证实它的许
                          多或很少存在推断,或者不能证实它的存在推断;因此它与基础陈述处于似是概率陈述特有的关系中。上述形式的陈述可称为“全称化的存在陈述”或(全称化的)“存在假说”

                            我的主张是,概率估计对基础陈述的关系,以及这些估计或多或少得到很好“确证”的可能性,考虑到这一事实就能理解:存在假说在逻辑上可从所有概率估计中演绎出来。
                          这对概率陈述本身是否可有存在假说的问题是有启发的。
                            一切(假说性的)概率估计蕴含着这样的推测:所说的经验序列几乎是似机遇和随机的。这就是说,它蕴含着概率计算公理的(近似的)可应用性,以及真理性。所以,我们
                          的问题就是这些公理是否代表我所说的“存在假说”的问题。
                            如果我们检查一下第64节中提出的两个要求,那么我们发现随机性要求实际上具有存在假说的形式。另一方面,惟一性要求则没有这种形式;它不可能有这种形式,因为这种
                          形式的陈述“只有一个……(There is only one……)”必然具有全称陈述的形式。(可译为“至多一个……”或“所有……是同一的”。)
                            在这里我的论点是,正是概率估计的(可称之为的)“存在成份”,因而正是随机性的要求,概率估计和基础陈述之间才建立起一种逻辑关系。因此,惟一性的要求,作为全
                          称陈述,没有任何外延的推断(extensional consequences)。具有所要求性质的p的值存在这一点确定能够在外延上得到“确证”——虽然只是暂时地;但是只存在一个这样的值
                          这一点则不能。这后一个全称的陈述可能在外延上有意义,仅当基础陈述能够同它发生矛盾时;这就是说,仅当基础陈述能够肯定存在的值不止这一个时。由于它们不能够(因为
                          我们记得不可证伪性与二项式有密切关系)做到这一点,惟一性的要求必然在外延上是没有意义的。
                            这就是为什么如果我们从系统中消去惟一性要求,概率估计和基础陈述以及前者的分级“可确证性”之的分级之间所有的逻辑关系不受影响的缘故。在这样做时,我们能够给
                          予系统以纯粹存在假说的形式。但是我们因此不得不放弃概率估计的惟一性,并且因而(就惟一性而言)获得某种不同于通常概率计算的东西。
                            所以惟一性的要求显然不是多余的。那么它的逻辑功能是什么?
                            虽然随机性要求有助于确立概率陈述和基础陈述之间的某种关系,惟一性要求调节着各种概率陈述本身之间的关系。没有惟一性要求,作为存在假说的某些陈述,可以从其他
                          陈述中推导出来,但是它们决不可能彼此矛盾。只有惟一性的要求才保证,概率陈述能彼此矛盾;因为根据这个要求它们获得其成分为一个全称陈述和一个存在假说的合取形式;
                          并且这种形式的陈述能够彼此处于同样基本的逻辑关系中(同义、可推导性、相容性和不相容性),正如任何理论——例如一个可证伪的理论——的“正常的”全称陈述那样。
                            如果我们现在考虑收敛公理,那么我们发现,在它具有一种不可证伪的全称陈述的形式这一点上它类似惟一性要求。但是收敛公理要求的比惟一性要求的更多。然而这种附加
                          要求也不可能有任何外延上的意义;此外,它没有逻辑或形式的意义,而只有内包上的意义:它要求排除所有没有频率极限的用内包定义的(即数学的)序列。但是从应用观点看
                          ,这种排除证明甚至在内包上也没有意义,因为在应用概率论中我们当然不涉及数学序列本身,而只涉及经验序列的假说性估计。所以排除没有频率极限的序列,只能用来告诫我
                          们不要把那些经验序列着作为似机遇或随机的,对于那些经验序列我们假定它们没有频率极限。但是对这种告诫,我们能够采取何种可能的行动?鉴于这种告诫,我们应该容许或
                          避免哪类关于经验序列可能收敛或发散的考虑或推测,保证收敛标准同发散标准一样可应用于这些序列?一旦摆脱了收敛公理,所有这些尴尬的问题也就消失了。
                            因此我们的逻辑分析使系统各部分的要求的形式和功能都一目了然,并且表明反对随机性公理和支持惟一性要求的理由是什么。同时可判定性问题似乎变得越来越重要。并且
                          虽然我们不一定称我们的要求(或公理)“无意义”,看来我们被迫把它们描述为非经验的。但是概率陈述的这种描述——不管我们用什么话来表达它——是否同我们研究的主要
                          思想相矛盾呢?


                          19楼2013-07-08 15:06
                          回复
                             由于Bernoulli分布的数学特点,物理学家的回答是有道理的:对每一个n,确定ε和△p之间的函数关系是可能的。对这个函数作一检查就可表明,对于一切(“大的”)n都
                            存在一个表示特征的△p值,使得在这个值的邻域,完全不受ε的变化的影响。这种无影响性随n的增加而增加。如果我们取我们在极端大数现象情况下应该期望的一个数量级的n,
                            那么在它的特征值的领域△p完全不受ε的变化的影响,以致即使ε的数量级改变,△p也几乎根本没有变化。现在物理学家将把很小的值附加于规定得更明确的△p界限上。并且在
                            研究所限的典型的大数现象的情况下,我们记得,能够使△p与精确度为±φ(取决于我们的测量技术)的间距相对应;并且这个间距没有明确的界限,只有我在第37节所说的“缩
                            聚界限”(condensation bound)。所以当△p在它的特征值(我们能够确定这个值)的领域的无影响性至少有如此之大,甚至ε数量级的改变引起的△p值仅在±φ的缩聚界限内
                            涨落时,我们才称n是大的。(如果n→∞,则△P变得完全不受影响)。但是如果是如此,我们就无需再操心ε的精确测定:即使我们没有精确地说出必须把什么看作是“小的”,
                            决定置小的ε于不顾也就够了。这等于是决定利用上述不受ε的变化的影响的△p的特征值。
                              必须把极度不可几性置于不顾的规则(只有根据上述才成为十分明确的一条规则)与要求科学的客观性是一致的。因为对我们的规则的明显反对显然是,最大的不可几性始终
                            是一种概率,不管这种概率有多么小,因此甚至最不可几的过程——即我们建议置之不顾的过程——终有一天会发生。但是这个反对意见可通过恢复可复制的物理效应概念来予以
                            解决,这个概念与客观性概念有密切联系(参阅第8节)。我不否认不可几事件会发生的可能性。例如我并不断言在小量气体中的分子在一短暂时间内不会自发地聚集成为这容量的
                            一部分,或者在大量气体中压力的自发涨落永远不会发生。我断言的是,这些偶发事件不是物理效应,因为根据它们的极度不可几性,它们不能随意复制。即使一个物理学家碰巧
                            观察到这种过程,他也完全不可能去复制它,因此永远不能判定在这种情况下实际发生了什么,他是否有可能犯了一次观察上的错误。然而,如果我们发现一些可复制的离差,这
                            些离差不同于按上述方式从概率估计中演绎出的宏观效应,那么我们必须假定概率估计已被证伪。
                              这些考虑可帮助我们理解Eddington的下述看法,他区别了两类物理定律:“某些事情永远不会在物理世界中发生,因为它们是不可能的;另一些则因为它们也是不可几的。禁
                            止前者的定律是一级定律;禁止后者的是二级定律”。虽然这种表述也许并不能摆脱批评(我宁愿不去对极度不可几的事情是否发生作出不可检验的断言),但它与物理学家对概
                            率论的应用完全一致。
                              可应用概率论的其他场合,如统计涨落,或似机遇个别事件的统计,可还原为我们一直在讨论的场合,即可精确测定的宏观效应场合。我理解的统计涨落就是Brown运动那样的
                            现象。在这里测量精确度的间距(±o)小于对效应起促进作用的微观事件数n特有的间距△p;因而可期望不同于p的可测定离差是高度不可几的。发生这些离差这一事实是可检验
                            的,因为涨落本身成为一种可复制效应;并且我以前的论证可应用于这种效应:涨落超过某一大小(超过某个间距△p),根据我的方法论要求,必定不是可复制的,朝同一方向涨
                            落的长序列也是如此,如此等等。相应的论证也会适用于似机遇个别事件的统计。
                              我现在总结我的关于可判定性问题的论证。
                              我们的问题:概率假说——我们已看到它们是不可证伪的——如何能在经验科学中起自然律的作用?我们的回答是:概率陈述,就它们是不可证伪的而言,是形而上学的和没
                            有经验意义的;就利用它们作为经验陈述而言,利用它们作可证伪的陈述。
                              但是这种回答提出了另一个问题:概率陈述——是不可证伪的——可用作可证伪陈述,怎么可能呢?(它们能如此使用这个事实是毋庸置疑的:物理学家知道得十分清楚,什
                            么时候认为概率假定已被证伪。)我们发现这个问题有两个方面。一方面,我们必须根据其逻辑形式使利用概率陈述的可能性成为可理解的,另一方面,我们必须分析支配它们用
                            作可证伪陈述的原则。
                              根据第66节,公认的基础陈述可以多少令人满意地与某种所提出的概率估计一致;它们可更好或稍差一些代表概率序列的一个典型节段。这为某种方法论规则的应用提供了机
                            会,例如要求基础陈述和概率估计之间的一致应该符合某种最低限度标准这一规则。因此规则可引出某种任意的思路,并且规定只有适当代表性的节段(或适当“公平的样本”)
                            才得以“允许”,而不典型的或没有代表性的节段是被禁止的。
                              对这种意见作更仔细的分析向我们表明,什么被允许和什么被禁止之间的分界线的划定并不一定像起初想象的那样任意。尤其是无需“宽容地”划定这条分界线。因为有可能
                            用这种方式形成这条规则,使什么被允许和什么被禁止之间的分界线,正如其他定律的情况一样,由我们的测量能达到的精确度来决定。
                              我们根据划界标准提出的方法论规则,不禁止不典型节段的出现;它也不禁止离差(当然,对于概率序列是不典型的)的重复出现。这条规则禁止的是系统离差的出现可预测
                            和可复制,例如朝特定方向的离差,或肯定是不典型的节段的出现。因此它要求的不单是粗略的一致,而是对于可复制和可检验的一切,简言之,对于所有的可复制效应可能是最
                            佳的一致。
                              69.定律和机遇
                              人们有时听说,行星的运动服从严格的定律,而一粒骰子的掷下是碰运气,或受机遇支配。我认为区别在于这个事实:迄今我们已能成功地预测行星的运动,但还不能预测掷
                            骰子的个别结果。
                              为了演绎出预见,人们需要定律和初始条件;如果没有合适的定律或不能确定初始条件,科学的预见方法就垮台。掷骰子时我们所缺乏的显然是初始条件的充分知识。有了初
                            始条件的足够精确的测定,也就有可能在这种情况下作出预见;但是选定正确掷骰子的规则(摇摇骰子盒)是为了防止我们测量初始条件。游戏规则以及确定某一随机序列的各种
                            事件必将发生的那些条件的其他规则,我称之为“框架条件”。它们由这样一些要求组成,如骰子应该是“纯的”(由同质物质组成),应该把它们好好地摇摇等等。
                              有一些其他情况,预见是不成功的。也许迄今还不可能提出合适的定律;也许发现一个定律的所有尝试都已失败,并且所有的预见也被证伪。在这些情况下我们可能对究竟是
                            否会找到一个满意的定律已失望。(但是大概我们不会放弃尝试,除非问题已使我们不大感兴趣——例如如果我们满足于频率预测,就是这种情况。)然而,无论如何,我们不能
                            定论地说,在某个特定的领域没有定律。(这是证实不可能性的一个结果。)这就是说,我的观点使机遇概念成为主观的。当我们的知识不足以作出预见时我就说“机遇”;正如
                            掷骰子时,我们说“机遇”,因为我们对初始条件没有知识。(可以设想,仪器设备精良的物理学家,能观测其他人预测不到的一次掷骰子的结果。)
                              与这种主观观点相反,人们有时支持一种客观的观点。就这种观点利用事件本身是指决定的还是不决定的这种形而上学观念而言,我将不在这里对这种观点作进一步的考察(
                            参阅第71和78节)。如果我们的预见获得成功,我们可以谈到“定律”;否则我们对定律或不规则性的存在或不存在不可能有任何知识。
                              也许比这个形而上学观念更值得考虑的是下面的观点。可以说,当我们的概率估计得到验证时,我们遇到客观意义上的“机遇”;正如当我们遇到因果规律性时一样。   蕴涵在这观点中的机遇定义可能不全是无用的,但是应该有力强调,如此定义的概念并不与定律概念相对立:正是由于这个理由我称概念序列是似机遇的。一般地说,一个实
                            验结果的序列是似机遇的,如果定义序列的框架条件不同于初始条件的话;当在同一框架条件下进行的个别实验,在不同的初始条件下进行时,就会产生不同的结果。其元素根本
                            不可预测的似机遇序列是否存在,我不知道。我们甚至不能从某个序列是似机遇的这个事实,推论出它的元素是不可预测的,还是或者推论出它们“由于”在主观的知识不足意义
                            上的“机遇”所致;我们尤其不能从这个事实推论出定律不存在的“客观”事实。
                              不仅不可能从序列的似机遇性质中推论出任何与定律一致的东西,或者在另一方面与个别事件一致的东西;甚至不可能从概率估计的验证推论出序列本身是完全不规则的。因
                            为我们知道似机遇序列是存在的,这些序列是根据数学规则建构的。一个序列具有Bernoulli分布这个事实不是不存在定律的征候,与“根据定义”不存在定律完全不是一回事。我
                            们在概率预测成功中看到的不过是在序列结构中不存在简单定律的征候(参阅第43和48节)——与构成序列的事件相反。不受后效约束的假定相当于这样的假说:这种简单的定律
                            是不可发现的,这个假定得到验证,但这就是一切。


                            21楼2013-07-08 15:28
                            回复