今天看啥  ›  专栏  ›  高黑

“方差”漫谈 -- 科学究竟是什么(转)

高黑  · 简书  ·  · 2018-02-15 06:06

本文转载自豆瓣《科学究竟是什么》(查尔莫斯)的读书笔记,特此声明。

作者:松而不垮

时间:2013-01-06



(一)

如果用一个二维向量(x , y)中的 x 表示手臂上毛的长度,而 y表示体重的话,随便找100个人和100只猴子,分别用向量(x , y)表示他们,再投影到一个平面坐标系上,200个点一定分成两堆——“人”一堆,“猴子”一堆。

这没什么奇怪的。

相似地,我们还可以用另一个二维向量(a , b),其中的 a 表示尾巴的长度,而 b表示嘴的宽度。找100匹马和100头驴,分别测量出它们对应a , b部位的长度,并把所有的(a , b)点投影到平面坐标系上。我们会看到,200个点似乎只有一堆。

我们能说这200只动物是同一种么?

不能,因为如果再加上一个c,表示耳朵的长度,以一个三维向量(a , b , c)来表示这200只动物,把得到的点投影到一个三维空间中,则又会大致分成两堆——“马”一堆,“驴”一堆。

综上我们可以想象:选择恰当数量和特点的“属性标签”,我们可以将一组未知的事物,抽象投影成n维空间中的若干堆点,每一堆就代表着一个类别。

但这里是有问题的。

回到马和驴的例子。

假设此时除了“人”的概念以外,还没有“马”和“驴”的概念。那么,当一群人看到了这样两种动物,并经过类似前述“取属性指标并投影分堆”的思考过程,他们只能意识到这样一个事实:它们是两种不同的“东西”。

然后呢?

人的反应应该是为两堆“东西”分别取一个名字,其目的在于“区分”(对于初级的概念来说并非是“诠释”)它们。而且,这用于区分名字背后,也同时意味着“一套判断标准”——即以后再看见相似的“东西”,就叫它“马”或“驴”。

但是后来问题出现了:因为马和驴不老实,于是世界上出现了一种(后来被叫做“骡子”的)“新东西”。但大部分可怜的人们此时并不知道——“新东西”其实是马和驴的产物,而且它既不是马也不是驴。

有人家的“新东西”长得更像马,主人就叫它“马”;有人家的“新东西”长得更像驴,主人就叫它“驴”。

天下太平。

但是后来,人们终于发现了马和驴的奸情,以及“新东西”不仅跟马还有驴长得不像不说,最关键的是它不能繁殖!

天下大乱!

它果然是一个“新东西”!就叫“骡子”吧!

从此天下重新太平。

可是问题并没有到此为止。

从骡子被发现的过程看,最关键的一步莫过于“发现了马和驴的奸情”以及“发现骡子跟马、驴的根本区别——不能繁殖”。

因此,在这一步前,所谓的“天下太平”只是表面,内里隐藏着问题:

      1、其实“新东西”和马表面看起来是有所不同的,只是这种不同还没有达到——像它不能繁殖那样——“不能忍的程度”,那么,多大程度的差别才是“不能忍”的呢?

      2、再进一步问:“一匹马”和其他马在长相上也存在差别,我们为什么不说“这匹马”和其他马不是同一物种?或者,现在所说的“马”中,会不会有天被分成若干个新物种?甚至,“所有马都各自是一个物种”?

      3、再进一步问:“马”这个名字——或者说一个被创造的、本不存在的概念——到底意味着什么?“马”这个名字所“能表达的”、“想表达却不能表达的”东西,都是什么?为什么会这样?

针对以上几个问题,要给出一个能自圆其说的解释,恐怕不得不直面这样一个问题:语言的边界在哪儿?

(二)

针对第1、2个问题。

语言最重要的作用是交流,而交流的前提是有一套“基本共同”的概念来保证“交流的效率”。

 “基本共同”的意思是:对于某个概念——可以是“马”或其他——我知道它代表的是什么,你知道它代表的是什么,我知道你知道它代表的东西和我知道它代表的东西“大概”相同,你知道我知道它代表的东西和你知道它代表的东西“大概”相同。这个循环可以无限地进行下去。

而两个“大概”的标准,就是能够保证交流具有“足够的效率”——即面对一个“马”的概念,我们自己知道,也知道彼此知道,它并不指代着“驴”或“骡子”。至于它所指代的“马”,是一匹大眼睛还是小眼睛的马,它的尾巴和鬃毛有多长,什么颜色等等问题都不重要——因为那不影响“交流的效率”。当我们需要更高的效率时,我们会给“马”加上限定词,比如“白”——当然,那又需要我们对“白”有着“基本共同”的定义。

综上,“交流的效率”决定着“不能忍的程度”。

针对第3个问题。

回想开篇由两种“东西”经“取属性指标并投影分堆”得到的“散点图”,因为我们只需要保证一个“交流的效率”——并不、也没必要去要求更多——针对“散点图上一组成堆的样本点”所给的“名字”,可以理解为一个“均值”的概念,这是“名字”所能表达的。而与“均值”相伴的是“方差”——以一种不可解读的方式蕴含着所有个体特征的信息、离散程度——这是语言所不能表达的。

 “方差”虽然不能被语言表达,但它的大小决定着均值——即“名字”——的代表性,或者说稳定性。当方差过大,保证“交流效率”的“基本共同”——或者说“大概”——的条件就不满足了,代表“均值”的名字也就失去了它的意义。

事实上,如果我们把“属性标签”找得越恰当,散点图上堆与堆之间的距离越远,各堆内部的“方差”也就越小,“均值”的代表性也就越强——即我们对“两个名字有差别”的信念也就越强,“交流效率”也就越高。

均值和方差总是相伴而生的,正如“名实之辩”——“名是绝对的,实是相对的”——语言并不能表达出所有,但这可能也正是语言的魅力所在吧。

从说话人“连续的感觉A”,到说出的“离散的语言”,再到听话人依自己经验储备解析出的“连续的感觉B”,好像一个“模拟——数字——模拟”的过程。

但这里似乎不存在一个能让“语言信号”完全还原的采样频率吧?因为“方差”的存在,“实”的相对,一说即错。

不过也没什么难过的,这事儿佛早就曰了,“不可说”。

(三)

凭借一系列“在一定程度上达到共识”的概念,语言保证了我们彼此之间可以拥有“达到一定效率”的交流:描述眼前具体的世界,以及表达内心的感受。

但是,单纯的“描述”远不能满足人的欲望,我们还要“解释和预测”世界的变化,亦即透过现象,找到“规律”。方法之一便是科学。

然而,形成“科学”的概念并不是一件容易的事。

查尔莫斯曾用一本书《科学究竟是什么》来阐述他的理解,但也未能给出一个明确的答案。这既是受限于离散的语言的表达瓶颈,也在于所谓“科学体系”的建立过程,免不了包含“不科学”的成分。

为了形成一个基本的,尽可能不影响交流的共识,本文中探讨的“科学”指的是:一套以“解释和预测”世界为目的,具有注重逻辑、尊重事实等特点的方法体系。

关于科学,一个为人关心,但事实上并非最关键的问题是:科学是对的吗?

把一个杯子举到高处,松手,它会掉下来。换成苹果、篮球等等也是一样。

面对这样一组现象,要以科学的方法来“解释并预测”,需要有两个前提:第一,现象既是主观的,但也要是得到共识而客观化了的,我说“杯子落下”,你也要承认“杯子落下”而不是“杯子上升”——有着最基本的对现象的相同描述,才可以进一步探讨问题;第二,承认杯子落下,苹果、篮球等等也落下,这组现象背后是“有规律”的,这也才有用科学寻找“规律”来解释的意义,而且,“规律”并非一事一议,而是有一定普遍性的,“科学”所寻找的正是这样一种具有一定普遍性的“规律”。

那么我们接下来想这样一个问题:假如,我已经用100样东西做了100次“下落实验”,这时,当我拿起第101样东西继续这个实验时,它还会再次下落吗?

[1]“当然会,之前的例子已经说明了这个问题。”

[2]“我们无法肯定地说出会不会,我们只能假设它会。”

这两种“寻找规律的方法”在科学史上分别被称为“归纳主义”和“否证主义”。

归纳主义认为:“规律”,是可以通过经验的积累归纳出来的。掌握了规律之后,我们便“可以”以“概率1”来解释和预测“一系列现象”——而非某单一现象——的发生、发展。

这一说法虽然很直观,但也很快受到了质疑:

[1] 经验的“样本量”取多大才算够大?

[2] 对于无法观察的现象,比如电场、磁场的存在,如何归纳出规律来解释?

[3] 如果归纳是科学建立的正确方式,那归纳法本身如何用归纳的方法自证呢?

除此之外,一个有趣的故事也直指“归纳主义”的痛处:一只农场中的火鸡,每次它一听到铃声就有人来喂食,但感恩节那天,听到铃声来吃食的它却被主人抓去杀掉了。

与“归纳主义”相反,“否证主义”认为:我们并不能以“概率1”解释和预测任何事的发生,恰恰相反,所有“规律”的概率都应当是0,而我们只能为解释或预测给出一种“假设”。所谓“规律”,或称“科学理论”,其最重要的特征就是:“可否证”。因此,科学的建立,则正是在不断的“假设——校验——推倒——重新假设”的循环往复中进行的。不论我们怎么努力,那个规律的概率依然是0。

在《科学究竟是什么》一书“否证主义”一章中,有一段精彩的论述:

“科学始于问题,这些问题和世界或宇宙的某些方面的活动解释联系在一起。科学家提出可否证的假说作为问题的解答。随后,对猜想性假说进行批判和检验。其中有些假说很快被淘汰,其他的则被证明是更成功的。这些假说必然会经历更为严格的批判和检验。当一个成功经受住了广泛的严格检验的假说终于被否证时,一个渴望与业已解决的问题大相径庭的新问题出现了。这个新问题要求人们发明新的假说,随之进行新的批判和检验。这样的过程会无限期地继续下去……永远也不能说一个理论是正确的,无论它经受住了多少严格的检验,但如若当前的一个理论能够经受住否证了对它以前的理论的检验,那么,从这种意义上有希望说,这个理论比那些理论更优越……否证主义的科学进步观是:科学进步就是一个从问题到推理性假说,再到对它们的批判和最终否证、由此再到新问题的过程。”

否证主义虽然在逻辑上很严谨,但实际运用却并没有那么简单。

比如,针对“杯子落下”的实验,我们提出一个假设:“手持物体在高处并松开后,物体会落下。”但当我们拿氢气球来做这个实验时,气球没有落下反而上升。从否证主义的角度讲,这个现象推倒了之前的假设。

但事实是否如此呢?会不会是因为今天天气的原因?或者是手持的时间不够长?甚至是因为实验者今天穿了一双黄色的袜子?

否证主义者当然可以说这些条件与实验无关,并不妨碍推倒之前的假设。可是,这个“无关”的论断也应当是一条“规律”,又该怎么证明呢?它的概率难道不应该是0么?

这是否证主义者难以解释的。

这个例子是要说明:科学体系的建立是复杂的。一方面,“规律”可以针对某事给出解释和预测,另一方面,针对不同情境A、B的“规律a”和“规律b”之间又有着联系,共同形成一个系统。而要建立起这样一个系统,我们总要赋予一些“规律”以“概率为1”的地位,让其他规律在它们身上得以依靠和衍生。

因此,在否证主义之后,科学哲学领域又产生了“范式(Paradigm)”“共同纲领(Research Programes)”的理论。它们虽有不同,但大体上都是指出:“某些最基本的‘规律’——或者说‘假设’——是不容否证的,它们必须被赋以‘概率为1’的地位。”

这些最基本的“假设”又被称作“公理”,是不容置疑的科学的基础。

但是,倘若科学要建立在一系列不容置疑的“假设”之上,它和宗教、神话等其他用来解释和预测世界现象的方法,还有什么本质的区别呢?

(四)

我想,对于这个问题,一种合适的说法是:确实没有什么本质的区别,可表面上的区别就不重要了么?

恰恰相反,表面上的区别才是最重要的。正如开篇所说,“科学是对的吗?”这个问题,虽然为人们所关心,但它并非最关键的。

事实上,最关键的问题是:相比于其他解释和预测的方法,它是否有效。

因为我们的目的是“解释和预测这个世界”。

那么,“科学”与“宗教、神话”神话之间,表面但真正关键的区别是什么?

简言之:方差的大小。

就像我们没法给一匹匹有形的马下一个绝对准确的定义,涵盖所有马的信息,只能给出一个“均值意义的名” 来保证交流的效率一样,“科学”以及“宗教、神话”则是通过自己的理论,将一个个具体的“样本点”拟合为一条“与均值意义类似”的曲线,并称之为“规律”。只不过前者“方差”更小(R-Square更接近于1),而后者方差更大(R-Square更接近于0)。

然而,又因为“现象不能解释现象”,提炼“规律”必须借助抽象的概念和理论。但是,世界是具体的,“规律中的方差”也因此而永远不可能完全消失(R-Square永远不能等于1),哪怕是测量一张桌子的长度,也永远不能得到一个绝对准确的值。

或者换一种表述,从微观的角度说得更直白一点:在具体的情景中,“规律”——无论是通过“科学”还是通过“宗教、神话”得到的——并不能给我们一个绝对准确的解释和预测。

这在本质上归因于人类有限的感知能力:一方面,智力不够,无法从经历过的情境中提炼出足够准确的“规律”;另一方面——更重要的是——我们无法经历到全部的情境,我们只能用样本来估计总体,而不能穷尽总体,因为与大自然相比,人类的历史永远是短暂的,对一个人来说则更是如此。

但是,即便这样,规律仍然可以有“好坏之分”。那就是根据“科学”与“宗教、神话”间随便表面但真正关键的区别——“方差”的大小——来判断。或者说,通过“解释的效果”来判断。

总结下上文所有的内容,可以得到以下几点:

[1] 科学、宗教和神话,都是帮助我们解释和预测世界现象的方法,对于认知和表达能力都十分有限的人类来说,它们之间并没有什么本质的区别。科学的建立中也有“不科学”的成分。

[2] 科学、宗教和神话,虽然本质上没有区别,但表面上有区别,且是比本质上区别更重要的。因为它直接决定我们能在多大程度上达到最初的目的:解释和预测这个世界。

[3] 对于除了“我存在”外一无所知的人类来说,任何所谓的结论本质上都是假设,而假设的“对错”并不重要,重要的是“是否有效”——即用它来解释“具体的现象”时,“方差”是否足够小。

[4] 世界是具体的,掌握“规律”——或者说“科学理论”——的意义,本就不在于给任何一个情境中的问题找到一个完美的解释和预测,而在于可以给我们一个“参考标准”,让我们根据具体情况来改变“理论”中的条件,并进而得到具体的解释和预测:理论并不能给我们真相,但能提高我们得到真相的概率。越是好的理论,解释力越强,“参考标准”约接近现实中具体的情境,给我们带来的得到真相的概率也越大。

对于可怜的人来说,我们并不能认清什么是真的,我们只能选择自己相信什么是真的。科学是途径之一,本质上亦是一种信仰。

信仰科学就不能信仰宗教了么?

我觉得并不是这样,如同“君子喻于义,小人喻于利”所没有表达的另一面,君子并非只“喻于义”,他也是“喻于利”的,只不过当义和利发生冲突的时候,他会选择义而放弃利。

至于科学和宗教(广义上与科学相对的一种解释和预测世界的方法),我想对我们而言更重要的是:在一个具体的情境中,尽力分清科学(真)与宗教(善)所针对的不同问题,选择更合适的方式来指引自己。





原文地址:访问原文地址
快照地址: 访问文章快照