知识波动观的数学表达(四)

因为是一个正在发生的思考过程,可能会有很多不周全的地方,所以也在不断做着修正、澄清。这一节,让我们澄清颗粒的概念,并做一些直观的想象训练。

关于颗粒:颗粒不是“词”,它更像是概念,比如“宇宙学”、“常数”是两个词,但“宇宙学常数”是不是词,某些情况下,不是那么确定的对和错。那么为什么不用“概念”来表述呢?因为,我想去寻求一种几何化的理论—波动—来描述知识的发生、生长、延续的过程,“颗粒”可以提供一种形状的感觉。

下面让我们去直观的想象“颗粒化”是怎么一个过程。

简单说,是一个涌现中的聚类过程。我们在思考、交流的过程里,反复不停的抵达同一种局面,我们的思维会把这种反复出现的局面理解为一个事物,或者说颗粒。颗粒一旦确立了自己的存在,就会逐渐在使用中把自己的范围也圈定出来。

“颗粒化”与命名

颗粒的命名具有任意性,仅仅是一个交流过程中的助记符号。虽然有任意性,但不是说不可以有命名的方法,只是方法的选择是约定俗成的。比如,数学定理的命名,多以发现者的名字来命名;但有些特别的数学定理,也会有反映自己特点的名字。

有意思的是,命名会变化。如果颗粒出现的非常频繁,可能就会有简称出现;原本是译名,后来被更容易接受的义译代替。所以波动的实际情况会影响命名的形态。

颗粒的范围

不少情况下,颗粒的范围不是一下子就圈定好的,而是逐渐生长出来的。比如,在罗巴切夫斯基等人意识到非欧几何可能性的时候,对于非欧几何有什么并不清楚,经过努力逐渐把非欧几何弄清楚了;后来又扩展出黎曼几何,等等。

知识波动观的数学表达(三)

为了表达一词多义的现象,我们必须要放弃一一对应,并采用语义函数 S 的反函数—命名函数。因为命名 Naming 的 N 容易和自然数集混淆,我们重新改换一下符号和定义,有:

颗粒空间(花体的 G)$$mathfrak{G}$$

波动空间(花体的 V)$$mathfrak{V}=N o (mathfrak{G} o R)$$

命名函数(希腊字母的 N)$$
u: mathfrak{V} o mathfrak{G} $$

再稍微解释一下 $mathfrak{V}$,定义里的 $mathfrak{G} o R$ 是一个分布,不妨记作 $d$,则有:

$$ sum_{g in mathfrak{G}} d(g) = 1$$

我们记所有满足上式的分布构成一个分布空间 $mathfrak{D}$。一个分布,其实就是一个窗口里的一小段文本;而一个波动,我们可以理解为一个长文本段落上滑动着的小窗口。波动其实就是分布的序列。

思考到这里,我产生了一些疑惑。是否每一个波动都被命名呢?显然不是,只有反复出现的波动才有价值被命名。那么,下面两个式子应该是哪个对呢?

$$
u: mathfrak{V} o mathfrak{G} $$

还是

$$
u: 2^mathfrak{V} o mathfrak{G} $$

第二个式子恰当的表达了某一些波动被命名为一个颗粒。

如果选择如下一种解释,第一个式子也是说的通的。我们考察的是定义完好的词典,它们相对静态的呈现了一些有定义的词汇颗粒。这里的波动并不是任何场合下词汇颗粒在思维中的呈现,而仅仅是在词典里的呈现。

而第二个式子则可以解释为,词汇颗粒在思维中的波动呈现了很多很多次,其中的某些近似的波动形态反复出现,我们给它名了一个名字。

一个是静态的,另一个可能能够指向动态过程,都有必要去考察。

知识波动观的数学表达(二)

至此,我们有了一个最粗略的框架 (G, thumb V, salve S) 来刻画波动的知识颗粒;我们可以描述颗粒震动的幅度或者频率,但除此以外,这个框架无法给我们更多的信息,因为颗粒彼此之间是孤立的。

现实的人类思维,概念之间是有丰富的关系的;凭借这个关系网络,人们可以进行缜密的理性思维或者产生复杂的审美体验。那么对应到这个模型,我们必须要给 G 赋予一些更加丰富的结构,然后考察这些结构会在 V 和 S 上诱导出什么?反过来 S 的一一对应,又会给 G 施加一定的限制。

从常识出发,我觉得下面三种结构最为重要:

  • 拓扑结构:表达词义的远近,如“朱”与“红”是相近的;
  • 序结构:表达概念的类属层次,如“唐太宗”是“男性”的;
  • 集合代数:可用于表达“唐太宗”属于“男性”和“皇位”的交集这样的描述。

我们知道 Google 的 word2vec 模型有很优美的正则性,其实正则性就是集合代数的一种表现; word2vec 模型也有拓扑结构,可是却看不到概念层次的序结构。

所以,这三种结构会和框架 (G,V,S) 相容吗?这是一个有必要考察的问题。

另一个问题是 S 是一一对应和实际情况不符,一词多义的情况很常见。从简化的角度讲,框架 (G,V,S) 可以接受,但在实际计算之前,必须要解决一词多义。

框架 (G,V,S) 描述的事情非常像编字典,那么是不是这个思路会把我们引导到一个像 WordNet + Word2Vec 的工具上呢?

知识波动观的数学表达(一)

显示数学公式请安装Chrome浏览器的以下插件: math-anywhere

这几日在地铁回家的路上,一直在思考如何才能把我前不久讨论过的知识的波动观更加数学化的表达出来。这种波动观有两个要点:

  • 知识颗粒的反复重现是一种波动现象
  • 反复出现的一种振动模式,可以颗粒化下来,从而成为一种新的知识颗粒

如果我们以考察语言来入手,知识颗粒就体现为词汇;波动就是类似句子、段落一类的结构,它是随着句子、段落进展而展开的一种波动。

那么怎样的数学框架可以用来描述上述思路呢?我们已经看到:

  • 知识颗粒构成的基底空间 G
  • 知识颗粒的波动空间 V

那么共振并颗粒化下来怎么表达呢?这是一个创造过程,我没有想的非常清楚。但是可以有一个简化的数学表达:

  • 一对一的语义函数 $$S: G o V$$
  • S 的反函数就是一个概念的命名过程

基底空间 G 会有可列多的元素,我们可以赋予 G 更多的结构,比如可以考虑把 G 做成 Hilbert 空间上的单位球面 $$S^infty$$

波动空间 V 可以再表达得更清楚一些,它体现为颗粒振动频率的变化,因此有:

$$V: N o (G o N) $$

上式里 N 是自然数集合,第一个 N 是文本前进时的标号,第二个 N 是频度。

综上所述,知识的波动观,体现为如下一种数学结构:

$$(G, link V, cialis S)$$

这种表达是直接的,如此粗略刻画出来也不困难。但真正困难的是,如何进一步细化,并且让模型可以从最终的语料里解算出来。如果这一步能做出来,那么我们可以做更多的实证性质的考察。

生命度、热度、对学习和探讨的增强

最近一直在想一个问题:一个概念的生命力取决于它内在的意涵在整个知识体系里的地位;而我们分析概念在参引网络里的引用情况,得到的应该是类似热度一样的指标。这两个指标有相关性,但是内在的含义是不一样的。我猜测从几十年的时间跨度上分析,社会网络里的传播就变成短波因素,而里程碑论文的变化是长波,更多是取决于知识体系自身。不知道这个理解对不对。
昨天晚上刚巧看了Youtube上的一段视频:
Big Data and the Rise of Augmented Intelligence
在这个演讲里来自 Quid 公司的 Sean Gourley 展示不少有意思的东西。
一个有意思的例子,他展示了一个随着时间变化的文档聚集的概略图,一些关键词从零星的状态逐渐成长为一些聚落的中心。这种聚拢的速度,就是一个领域热度的上升速度。另一个例子是他展示了一个文章聚落里一些概念间的关系图。
我觉得这个工具可以快速的给出某种整体的概括,可是它却无法让人立刻知道每个节点的在网络里意涵。说到这里,我想把话题转向人机关系。
我理解的 Augmented Intelligence ,是把人和机器同等看待的,人和机器是伙伴关系。我们往往强调机器而忽视了人的因素。机器是快速的,但总是太廉价;人是慢速的,但却会有见解。
其实,文章聚落里的概念关系图,是可以作为人学习的入手点之一的。人可以对概念关系图的节点和边做人为的评注。通过这个过程,人学习到了真正的知识,而不是仅仅一个图式。这些评注,又可以成为机器下一步学习的输入。
这是我所说的对学习的增强。那么对探索的增强,则是利用机器增强我们对一个问题解空间的搜索。把我们目前不知道的,但可能的有价值的已经存在的知识簇,和目前问题的探究联系起来。这里说的探索,而是指一个团体和他们机器伙伴一起进行的探索。

 

群体智能增强

互联网的发展让我们有机会探索新的协作形式,在2000年前后Blog、Wiki、社会性书签、社交网络等等一系列现象涌现而出,人们为此发明了一个新的词汇—群体智能。然而本文要论述的是,群体智能并非一个恰当的词汇来描述这些现象,更确切的术语应当是“群体智能增强”。群体智能增强,从工具层面上,论述人类作为一个群体如何放大他们的认知和行为能力。


考察历史上群体智能增强的案例,我们能观察到两个基本机制:

智能外化机制:人类将他们的智能外化成为环境的一部分,这里的环境既包括硬的实物环境,也包括诸如符号、约定、习惯、知识、制度等软的环境。

群体协作机制:多个个体通过群体协作完成任务,而且这些任务是独立个体无法、很难完成,或者只能低效的完成。

这两个机制往往不是独立作用,而是共同出现,举例来说:

语言:群体的智能外化为语言符号,而且只有群体都掌握和运用这些语言符号,这种语言才有意义。

计数法:弱的计数能力是许多动物都具备的,然而人类发明了计数法,它极大的增强了人类的计数的能力,同时它自身协调有效,被运用在很多场合,成为文明的一个基础。也因为它的协调有效,使得使用者察觉不出它创立之初的艰难。

货币:分工协作和专业化是群体协作的体现,但人类文明演化出了货币,把交换过程的某些方面抽象并外化为货币。货币极大的增强了人类的协作能力,比如,一辆汽车的零件成千上万,是由分散在各地的工厂合作完成的。

上面的例子,都发生在人类历史的早期。而今天互联网的发展,能给我们什么样的启示呢?

2000年前的互联网,基本上可以理解为,人类把自身基本的计算和通讯能力外化为互联的计算机网络。外化可以理解为是将“我”变为“它”。而2000年后的互联网如此强大,已经开始把个人身份、社会互动都嵌入其中,所以或许可以体现为一种内化作用,即将“它”变为“我”。

所以,我们实际上看到三种机制:智能外化、环境内化、群体协作。


除了这三种机制是否还有缺失呢?这里的“我-它”关系,让我们联想到Ken Wilber 的 Quadrants 理论图式。

Ken Wilber’s Quadrants

很容易看到下面的术语对应关系:

我 -> 它:智能外化

它 -> 我:环境内化

我 -> 我们:智能外化、协作机制

如果从这个图式的角度来看,或许我们还要做更多厘清概念的工作和更多的思考。

颗粒化、共振和生命度

最近和一些朋友探讨到CAS的模块、知识交换过程的颗粒化,但没有展开讨论;我这两天有些新的想法,是和共振有关,说远一点就是克里斯托弗·亚历山大说的生命度。我在这里把这些想法更清楚的表达一下。

生命现象、社会现象是一种波动,每种物体都有它潜在的、看不见的节律。物体的振动节律会在某些方面影响周围的事物,当相互作用的两者节律合拍时,会发生共振。生命度是说这种物体它的节律和周围事物所能够形成共振的强度;这里的强度,不单指“潜在的空间”上振动的强度,也指时间上这种共振持续的长度。这里的共振就是一种颗粒。换句话说,颗粒化过程的主要方面就是共振的过程。

下面举例来说明上面的想法,并揭示这个现象在各个层次上的普遍性。先让我们从我熟悉的 Wiki 谈起。 Wiki 作为一种超文本内容建站工具可以被用在许多方面—技术社群文档工具、公司内部文档工具、百科全书……然而在这些用途里,最具影响力的还是用在百科全书上。为什么会这样?

每一个文本作为人类活动的产物,都是一个振动的节点;当它们没有互联时,只是独立的振动。在超文本发明之前,文本的互联关系比较弱,相互的振动影响也小。超文本的发明使得文本可以建立强互联,振动彼此影响很大。 回到上面的问题—为什么Wiki技术在百科全书领域最具影响?因为 Wiki 使用事物的名字作为链接,但名字短时,非常容易让 Wiki 页互联;名字长时,互联变得非常困难。因为 Wiki 工具的这个特点,使得它在短名字的这些领域具有最强的共振强度。而人类知识交流系统的演化,这些短名字的领域就是公共知识领域,也就是传统工具里的百科全书和新时代的维基百科。用另外一个说法,就是人类知识系统和互联网工具发生了一种共振,这个共振颗粒化的角度看就是 Wiki 和 Wikipedia。 然而可以继续深究的是下一个层次的现象—名字的长短,即语言现象。我不去再仔细展开了,大家可以想见。

还可以举个很基础的例子,就是数和数系。在 ishango bone 里的结绳记事的方法只是在不断地刻痕,并没有数的概念。而后来的数这种认知的颗粒,恰好就是刻痕或者结纽的某种模式的反复振动;同时颗粒的组合就构成了数系。所以,振动其实在很基础的知识层面里就出现了。 有趣的是颗粒组合的层次性或者说波动维度的层次。

在讨论 Wiki 页面互联时,我们是使用名字来讨论的,即是名字的某种振动;然后仔细看名字,它是字的组合,即它是字的某种振动;而字又是更底层现象的一种共振。就是说,一些共振模式长期存在,这些模式间的变化构成了一种新的层次上的振动。

量子力学、弦论都是一种很彻底的波动的世界观,但我显然没有野心去构造一种什么世界观,我仅仅关心和人类智能有关的这一小部分。 庄子在几千年前就有人籁、地籁和天籁的讨论,某种程度上,我现在的想法只是他的牙慧了。

思考范式的转变

计算技术、认知科学、脑科学等等领域的发展,总让我们觉得下面几十年,会有一场深刻的思考方式的转变……

纽约时报:“奥巴马政府正在规划一项为期10年的科学研究,检查人脑的活动,并绘制一张全面的人脑活动图,希望能在大脑研究领域做出类似人类基因组计划(Human Genome Project)为遗传学所做的贡献。”  美国的人脑地图计划 – cn.nytimes.com – Readability readability.com

加拿大滑铁卢大学的神经科学家和软件工程师称,他们构建出了目前最大的人类大脑模拟系统—Spaun。它不仅有获取视觉信号的电子眼和可以作出相应反应的机械臂,它还能通过基础的智商测验。它拥有250万只虚拟神经元,可以执行8项不同的任务。
Spaun:最逼真的人工大脑 – www.guokr.com – Readability readability.com

更有意思的是计算技术和生物技术的相互渗透,比如下面这个有意思的科技发展给人所展现出来的可能性就非常丰富—用计算机模拟生命现象。
人类离”补完”生命还有多远? – www.guokr.com – Readability readability.com

这些科学和技术的前沿,或许离我们已经很近了。作为工程师的我们,有必要加强对认知科学和脑科学的学习了。

群体智慧的共鸣

微博上人们相互呼应,新鲜想法诞生、传播、生长、发散、汇聚。围绕有生命力的想法,实践者联系起来产生实践活动,渐渐成长出人际圈和知识域。当后来者进入这圈子和领域时,需要一个引领的途径,实践者从想法中理出脚手架供人攀爬,有些脚手架存在几个世代甚至几千年了。它们是活的,是引领我们的路途。

汪丁丁观点修订版:宽带写作是宽带技术提供的创作方式,强调大规模的信息集结和带来的创作。大规模的集结或整合,绝非单纯的数量积累,而要求深度思考。思考越深入,集结规模就越可宽广。宽带写作的理想形态是在集结了整个网络上与主题相关的信息之后,在由此而达的思考的深度和广度上,实行语言创造。

知识的集结、实践者团体的连接变得越来越容易,这是一个正在发生的过程;但语言的创造依然艰难,学习的过程不能被取代;碎片化的方式并不一定适合所有的领域,学习还是需要付出努力才能掌握前人留下的“脚手架”。

Christopher Alexander 在《俄勒冈实验》提出六个原则:有机秩序、参与、分片式发展、模式、诊断和协调。我个人理解,这六个原则中有机秩序是一个总纲,而参与、分片式发展、模式、诊断和协调是一些方法。他希望创造出一种机制,可以让建筑和社区共同的缓慢生长,整个过程是自底向上的、自发的。

作为从技术社区来的读者,我对设计模式的理解是一些解决问题的最佳实践的总结,焦点在问题解决上。读罢《俄勒冈实验》,我才理解这个想法很偏狭。Christopher Alexander是从社区如何自我组织解决规划问题的角度提出模式的。在他视野里,模式是总结交流社区本地经验的一种方法,服务于社区的自我生长。

好多年来不同领域的实践和思考,最近逐步汇聚,尽管微博客未必是最佳的工具,我想还是实验一下,如何在社交网络上去实践知识的创新,不只是发散传播,还要汇聚、收敛、演进,不只是个人的,还是群体智慧的共鸣。