看啥推荐读物

专栏名称: 高黑

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

“方差”漫谈 -- 科学究竟是什么（转）

高黑 · 简书 · · 2018-02-15 06:06

本文转载自豆瓣《科学究竟是什么》（查尔莫斯）的读书笔记，特此声明。

作者：松而不垮

时间：2013-01-06

（一）

如果用一个二维向量（x , y）中的 x 表示手臂上毛的长度，而 y表示体重的话，随便找100个人和100只猴子，分别用向量（x , y）表示他们，再投影到一个平面坐标系上，200个点一定分成两堆——“人”一堆，“猴子”一堆。

这没什么奇怪的。

相似地，我们还可以用另一个二维向量（a , b），其中的 a 表示尾巴的长度，而 b表示嘴的宽度。找100匹马和100头驴，分别测量出它们对应a , b部位的长度，并把所有的（a , b）点投影到平面坐标系上。我们会看到，200个点似乎只有一堆。

我们能说这200只动物是同一种么？

不能，因为如果再加上一个c，表示耳朵的长度，以一个三维向量（a , b , c）来表示这200只动物，把得到的点投影到一个三维空间中，则又会大致分成两堆——“马”一堆，“驴”一堆。

综上我们可以想象：选择恰当数量和特点的“属性标签”，我们可以将一组未知的事物，抽象投影成n维空间中的若干堆点，每一堆就代表着一个类别。

但这里是有问题的。

回到马和驴的例子。

假设此时除了“人”的概念以外，还没有“马”和“驴”的概念。那么，当一群人看到了这样两种动物，并经过类似前述“取属性指标并投影分堆”的思考过程，他们只能意识到这样一个事实：它们是两种不同的“东西”。

然后呢？

人的反应应该是为两堆“东西”分别取一个名字，其目的在于“区分”（对于初级的概念来说并非是“诠释”）它们。而且，这用于区分名字背后，也同时意味着“一套判断标准”——即以后再看见相似的“东西”，就叫它“马”或“驴”。

但是后来问题出现了：因为马和驴不老实，于是世界上出现了一种（后来被叫做“骡子”的）“新东西”。但大部分可怜的人们此时并不知道——“新东西”其实是马和驴的产物，而且它既不是马也不是驴。

有人家的“新东西”长得更像马，主人就叫它“马”；有人家的“新东西”长得更像驴，主人就叫它“驴”。

天下太平。

但是后来，人们终于发现了马和驴的奸情，以及“新东西”不仅跟马还有驴长得不像不说，最关键的是它不能繁殖！

天下大乱！

它果然是一个“新东西”！就叫“骡子”吧！

从此天下重新太平。

可是问题并没有到此为止。

从骡子被发现的过程看，最关键的一步莫过于“发现了马和驴的奸情”以及“发现骡子跟马、驴的根本区别——不能繁殖”。

因此，在这一步前，所谓的“天下太平”只是表面，内里隐藏着问题：

1、其实“新东西”和马表面看起来是有所不同的，只是这种不同还没有达到——像它不能繁殖那样——“不能忍的程度”，那么，多大程度的差别才是“不能忍”的呢？

2、再进一步问：“一匹马”和其他马在长相上也存在差别，我们为什么不说“这匹马”和其他马不是同一物种？或者，现在所说的“马”中，会不会有天被分成若干个新物种？甚至，“所有马都各自是一个物种”？

3、再进一步问：“马”这个名字——或者说一个被创造的、本不存在的概念——到底意味着什么？“马”这个名字所“能表达的”、“想表达却不能表达的”东西，都是什么？为什么会这样？

针对以上几个问题，要给出一个能自圆其说的解释，恐怕不得不直面这样一个问题：语言的边界在哪儿？

（二）

针对第1、2个问题。

语言最重要的作用是交流，而交流的前提是有一套“基本共同”的概念来保证“交流的效率”。

“基本共同”的意思是：对于某个概念——可以是“马”或其他——我知道它代表的是什么，你知道它代表的是什么，我知道你知道它代表的东西和我知道它代表的东西“大概”相同，你知道我知道它代表的东西和你知道它代表的东西“大概”相同。这个循环可以无限地进行下去。

而两个“大概”的标准，就是能够保证交流具有“足够的效率”——即面对一个“马”的概念，我们自己知道，也知道彼此知道，它并不指代着“驴”或“骡子”。至于它所指代的“马”，是一匹大眼睛还是小眼睛的马，它的尾巴和鬃毛有多长，什么颜色等等问题都不重要——因为那不影响“交流的效率”。当我们需要更高的效率时，我们会给“马”加上限定词，比如“白”——当然，那又需要我们对“白”有着“基本共同”的定义。

综上，“交流的效率”决定着“不能忍的程度”。

针对第3个问题。

回想开篇由两种“东西”经“取属性指标并投影分堆”得到的“散点图”，因为我们只需要保证一个“交流的效率”——并不、也没必要去要求更多——针对“散点图上一组成堆的样本点”所给的“名字”，可以理解为一个“均值”的概念，这是“名字”所能表达的。而与“均值”相伴的是“方差”——以一种不可解读的方式蕴含着所有个体特征的信息、离散程度——这是语言所不能表达的。

“方差”虽然不能被语言表达，但它的大小决定着均值——即“名字”——的代表性，或者说稳定性。当方差过大，保证“交流效率”的“基本共同”——或者说“大概”——的条件就不满足了，代表“均值”的名字也就失去了它的意义。

事实上，如果我们把“属性标签”找得越恰当，散点图上堆与堆之间的距离越远，各堆内部的“方差”也就越小，“均值”的代表性也就越强——即我们对“两个名字有差别”的信念也就越强，“交流效率”也就越高。

均值和方差总是相伴而生的，正如“名实之辩”——“名是绝对的，实是相对的”——语言并不能表达出所有，但这可能也正是语言的魅力所在吧。

从说话人“连续的感觉A”，到说出的“离散的语言”，再到听话人依自己经验储备解析出的“连续的感觉B”，好像一个“模拟——数字——模拟”的过程。

但这里似乎不存在一个能让“语言信号”完全还原的采样频率吧？因为“方差”的存在，“实”的相对，一说即错。

不过也没什么难过的，这事儿佛早就曰了，“不可说”。

（三）

凭借一系列“在一定程度上达到共识”的概念，语言保证了我们彼此之间可以拥有“达到一定效率”的交流：描述眼前具体的世界，以及表达内心的感受。

但是，单纯的“描述”远不能满足人的欲望，我们还要“解释和预测”世界的变化，亦即透过现象，找到“规律”。方法之一便是科学。

然而，形成“科学”的概念并不是一件容易的事。

查尔莫斯曾用一本书《科学究竟是什么》来阐述他的理解，但也未能给出一个明确的答案。这既是受限于离散的语言的表达瓶颈，也在于所谓“科学体系”的建立过程，免不了包含“不科学”的成分。

为了形成一个基本的，尽可能不影响交流的共识，本文中探讨的“科学”指的是：一套以“解释和预测”世界为目的，具有注重逻辑、尊重事实等特点的方法体系。

关于科学，一个为人关心，但事实上并非最关键的问题是：科学是对的吗？

把一个杯子举到高处，松手，它会掉下来。换成苹果、篮球等等也是一样。

面对这样一组现象，要以科学的方法来“解释并预测”，需要有两个前提：第一，现象既是主观的，但也要是得到共识而客观化了的，我说“杯子落下”，你也要承认“杯子落下”而不是“杯子上升”——有着最基本的对现象的相同描述，才可以进一步探讨问题；第二，承认杯子落下，苹果、篮球等等也落下，这组现象背后是“有规律”的，这也才有用科学寻找“规律”来解释的意义，而且，“规律”并非一事一议，而是有一定普遍性的，“科学”所寻找的正是这样一种具有一定普遍性的“规律”。

那么我们接下来想这样一个问题：假如，我已经用100样东西做了100次“下落实验”，这时，当我拿起第101样东西继续这个实验时，它还会再次下落吗？

[1]“当然会，之前的例子已经说明了这个问题。”

[2]“我们无法肯定地说出会不会，我们只能假设它会。”

这两种“寻找规律的方法”在科学史上分别被称为“归纳主义”和“否证主义”。

归纳主义认为：“规律”，是可以通过经验的积累归纳出来的。掌握了规律之后，我们便“可以”以“概率1”来解释和预测“一系列现象”——而非某单一现象——的发生、发展。

这一说法虽然很直观，但也很快受到了质疑：

[1] 经验的“样本量”取多大才算够大？

[2] 对于无法观察的现象，比如电场、磁场的存在，如何归纳出规律来解释？

[3] 如果归纳是科学建立的正确方式，那归纳法本身如何用归纳的方法自证呢？

除此之外，一个有趣的故事也直指“归纳主义”的痛处：一只农场中的火鸡，每次它一听到铃声就有人来喂食，但感恩节那天，听到铃声来吃食的它却被主人抓去杀掉了。

与“归纳主义”相反，“否证主义”认为：我们并不能以“概率1”解释和预测任何事的发生，恰恰相反，所有“规律”的概率都应当是0，而我们只能为解释或预测给出一种“假设”。所谓“规律”，或称“科学理论”，其最重要的特征就是：“可否证”。因此，科学的建立，则正是在不断的“假设——校验——推倒——重新假设”的循环往复中进行的。不论我们怎么努力，那个规律的概率依然是0。

在《科学究竟是什么》一书“否证主义”一章中，有一段精彩的论述：

“科学始于问题，这些问题和世界或宇宙的某些方面的活动解释联系在一起。科学家提出可否证的假说作为问题的解答。随后，对猜想性假说进行批判和检验。其中有些假说很快被淘汰，其他的则被证明是更成功的。这些假说必然会经历更为严格的批判和检验。当一个成功经受住了广泛的严格检验的假说终于被否证时，一个渴望与业已解决的问题大相径庭的新问题出现了。这个新问题要求人们发明新的假说，随之进行新的批判和检验。这样的过程会无限期地继续下去……永远也不能说一个理论是正确的，无论它经受住了多少严格的检验，但如若当前的一个理论能够经受住否证了对它以前的理论的检验，那么，从这种意义上有希望说，这个理论比那些理论更优越……否证主义的科学进步观是：科学进步就是一个从问题到推理性假说，再到对它们的批判和最终否证、由此再到新问题的过程。”

否证主义虽然在逻辑上很严谨，但实际运用却并没有那么简单。

比如，针对“杯子落下”的实验，我们提出一个假设：“手持物体在高处并松开后，物体会落下。”但当我们拿氢气球来做这个实验时，气球没有落下反而上升。从否证主义的角度讲，这个现象推倒了之前的假设。

但事实是否如此呢？会不会是因为今天天气的原因？或者是手持的时间不够长？甚至是因为实验者今天穿了一双黄色的袜子？

否证主义者当然可以说这些条件与实验无关，并不妨碍推倒之前的假设。可是，这个“无关”的论断也应当是一条“规律”，又该怎么证明呢？它的概率难道不应该是0么？

这是否证主义者难以解释的。

这个例子是要说明：科学体系的建立是复杂的。一方面，“规律”可以针对某事给出解释和预测，另一方面，针对不同情境A、B的“规律a”和“规律b”之间又有着联系，共同形成一个系统。而要建立起这样一个系统，我们总要赋予一些“规律”以“概率为1”的地位，让其他规律在它们身上得以依靠和衍生。

因此，在否证主义之后，科学哲学领域又产生了“范式(Paradigm)”“共同纲领(Research Programes)”的理论。它们虽有不同，但大体上都是指出：“某些最基本的‘规律’——或者说‘假设’——是不容否证的，它们必须被赋以‘概率为1’的地位。”

这些最基本的“假设”又被称作“公理”，是不容置疑的科学的基础。

但是，倘若科学要建立在一系列不容置疑的“假设”之上，它和宗教、神话等其他用来解释和预测世界现象的方法，还有什么本质的区别呢？

（四）

我想，对于这个问题，一种合适的说法是：确实没有什么本质的区别，可表面上的区别就不重要了么？

恰恰相反，表面上的区别才是最重要的。正如开篇所说，“科学是对的吗？”这个问题，虽然为人们所关心，但它并非最关键的。

事实上，最关键的问题是：相比于其他解释和预测的方法，它是否有效。

因为我们的目的是“解释和预测这个世界”。

那么，“科学”与“宗教、神话”神话之间，表面但真正关键的区别是什么？

简言之：方差的大小。

就像我们没法给一匹匹有形的马下一个绝对准确的定义，涵盖所有马的信息，只能给出一个“均值意义的名” 来保证交流的效率一样，“科学”以及“宗教、神话”则是通过自己的理论，将一个个具体的“样本点”拟合为一条“与均值意义类似”的曲线，并称之为“规律”。只不过前者“方差”更小（R-Square更接近于1），而后者方差更大（R-Square更接近于0）。

然而，又因为“现象不能解释现象”，提炼“规律”必须借助抽象的概念和理论。但是，世界是具体的，“规律中的方差”也因此而永远不可能完全消失（R-Square永远不能等于1），哪怕是测量一张桌子的长度，也永远不能得到一个绝对准确的值。

或者换一种表述，从微观的角度说得更直白一点：在具体的情景中，“规律”——无论是通过“科学”还是通过“宗教、神话”得到的——并不能给我们一个绝对准确的解释和预测。

这在本质上归因于人类有限的感知能力：一方面，智力不够，无法从经历过的情境中提炼出足够准确的“规律”；另一方面——更重要的是——我们无法经历到全部的情境，我们只能用样本来估计总体，而不能穷尽总体，因为与大自然相比，人类的历史永远是短暂的，对一个人来说则更是如此。

但是，即便这样，规律仍然可以有“好坏之分”。那就是根据“科学”与“宗教、神话”间随便表面但真正关键的区别——“方差”的大小——来判断。或者说，通过“解释的效果”来判断。

总结下上文所有的内容，可以得到以下几点：

[1] 科学、宗教和神话，都是帮助我们解释和预测世界现象的方法，对于认知和表达能力都十分有限的人类来说，它们之间并没有什么本质的区别。科学的建立中也有“不科学”的成分。

[2] 科学、宗教和神话，虽然本质上没有区别，但表面上有区别，且是比本质上区别更重要的。因为它直接决定我们能在多大程度上达到最初的目的：解释和预测这个世界。

[3] 对于除了“我存在”外一无所知的人类来说，任何所谓的结论本质上都是假设，而假设的“对错”并不重要，重要的是“是否有效”——即用它来解释“具体的现象”时，“方差”是否足够小。

[4] 世界是具体的，掌握“规律”——或者说“科学理论”——的意义，本就不在于给任何一个情境中的问题找到一个完美的解释和预测，而在于可以给我们一个“参考标准”，让我们根据具体情况来改变“理论”中的条件，并进而得到具体的解释和预测：理论并不能给我们真相，但能提高我们得到真相的概率。越是好的理论，解释力越强，“参考标准”约接近现实中具体的情境，给我们带来的得到真相的概率也越大。

对于可怜的人来说，我们并不能认清什么是真的，我们只能选择自己相信什么是真的。科学是途径之一，本质上亦是一种信仰。

信仰科学就不能信仰宗教了么？

我觉得并不是这样，如同“君子喻于义，小人喻于利”所没有表达的另一面，君子并非只“喻于义”，他也是“喻于利”的，只不过当义和利发生冲突的时候，他会选择义而放弃利。

至于科学和宗教（广义上与科学相对的一种解释和预测世界的方法），我想对我们而言更重要的是：在一个具体的情境中，尽力分清科学（真）与宗教（善）所针对的不同问题，选择更合适的方式来指引自己。

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博