重新发现算术里的秘密

演示文档下载

本文源自给 AHA 的一次讲座和在混沌巡洋舰群聊中我的发言。

现在计算科学正在一次深刻革命过程的早期。以深度学习为代表,人们对智能的探索,是打开了计算科学的另一个分支。

计算科学的现有的庞大分支,起源于对希尔伯特第十问题的研究;起源于1930年代的三个探索,当时建立了可计算性的概念;而后很多物理实现和后继概念是建立在冯诺依曼架构基础之上的,建立在程序、数据、控制这样的概念上。

仔细考虑图灵当时在起点的工作,其实他有深刻的考虑智能的问题。现今深度学习为代表的思路,从概念上讲,其实已经突破了冯诺依曼架构,它是从数据里自动学出来程序的思路。这一支与上一支分离的点足够深,它一定能开出不一样的花朵,长成不一样的大树。可学习性有可能是这一支的一个重要核心问题。 从两支分叉的地方再往下走,会看到计算、学习、智能、复杂、涌现是联系在一起的,是逻辑的与物理的交融地带。

很多可计算发展出来的技术,都是去解决一个“浮出水面”的问题,需要在一个清晰的边界内来处理。可实际上智能有一种能力,从混沌中,画出界限,把一侧的事情厘清。这种能力,是基于对意义的追寻。

语言之意义的问题,更多涉及到跨代际的文化上,这个话题,不是讨论智能体个体的对一个刺激做出的意义的反馈,而是考虑文化中有些部分是被数学限定的。举例子来说。我们知道甲骨文中很多人名、地名都无法有效解读了,很多字的解读也众说纷纭;古代典籍的情况要好一些,但也有许多句读都不一致的解读。但是,另一方面,我们看到对数字的解读是非常稳定的,这个是可以问为什么的。这个就同我们造一台计算机或者计算器是类似的,你怎么知道你造的计算器符合你的预期?人类代际的知识传递,也是这个问题。

所以,我想说的是,某种意义上,意义是一个幻觉,因为它依赖一个不断变化的上下文;某种意义上,它不是幻觉,它至少有坚固的内核非常稳定,甚至包括内核之外的很大一部分在千年的尺度上也是稳定的。最稳定的内核具有的特点是这些概念可以自举(self-bootstrap)。以数和命题逻辑为例,它们都是可以自举的形式系统。自举的意思是,我可以构造一个满足系统(数或者逻辑)形式上要求的例子(模型),来实现这个系统,从而给出一个坚实的意义基础。自举同时也在说,我在实现的时候,只利用系统(数或者逻辑)自身的符号体系,无需引入更多的外部资源。

一致且完备,那么语言和世界就是等同的。一致性和完全性是讨论语言和世界的关系。我们有一个形式系统(语言) A,有一些模型(世界) B。如果模型 B 里的事物在形式系统 A 里都成立,我们说模型(世界)和形式系统(语言)是一致的;另一方面,如果形式系统(语言) A 里的句子在模型(世界) B 里都成立,我们说形式系统(语言)和模型(世界)是完备的。