东风汽车百度百科知识的品质
回顾历史,我们会发现,当前学科之间的区别,主要是发展阶段的区别,而不是研究对象的区别。每一个学科,都经历了类似数据机制原理的发展过程。知识链,原本是描述数据压缩程度的逻辑链条,不仅在各学科的发展史上重现,也在任意一个“时代横截面”上呈现:当一个学科已经在讨论和机制时,另外一个学科还在忙于整理和描述数据。
一只青蛙可以看做一个能量加工工厂,一条食物链可以看做是一系列工厂构成的能量加工链。I=input, A=assimilation, R=respiration, NU=not utilized, P=production, B=biomass.
更重要的是,两次世界大战前,产品链是独占式的,一个国家的产品链底层(殖民地),绝不允许另一个国家染指。深加工,高附加值产品的贸易主要在主国之间进行,这样才能主国获得财富。
也就是说,世界产品网络虽然比其在殖民地时代的版本更复杂了,但依然存在着链状结构。发展中国家输出原料或者粗加工产品,例如钢材和纺织品;发达国家进口原料并进行加工,输出高附加值产品,例如汽车和时装。发达国家整体上占据生态位高层的,发展中国家整体占据生态位底层的,后者向前者输送财富。
在新经济系统中,从国家的角度,殖民地时代国家之间在经济上依附关系形成的一条条分散的“食物链”(例如马来西亚英国,墨西哥西班牙)被联结在一起,变成全球化的国家贸易网络。从产品的角度,殖民地时代分散的一条条产品链(例如马来西亚输送往英国加工的橡胶,墨西哥输送往西班牙加工的咖啡),变成了一个紧密联系的产品网络。新系统中,国家崛起不是通过战争,而是依靠对内技术积累和产业升级,对外投资和贸易等手段提升自己的生态位。
AAAS根据NSF数据给出的基础研究投资比例
Bogdan State等人根据LinkedIn数据统计的人才跨国流动
互联网作为技术变革带来了社会科学的数据爆炸性增长,随之出现的,就是从数据的理论进展需求。2009年David Lazer等人在Science上发表文章,Nature也在2012年发表另一篇文章。这两文章都提出了“计算社会科学”(computational social science)的概念。
回到食物链的比喻里理解争夺殖民地的世界大战,就是入侵无法接受来自食物链底层的能量流,就必然与原有的食物链顶端的动物产生冲突(“一山不容二虎”),以改变原有的食物链结构。
能量有品质,为了争夺高品质的能量,占据食物链的高层生态位,之间展开;产品有价值,为了生产高附加值的产品,占据产品链的高层生态位,国家之间展开激烈角逐。那么,抽象,却对人类社会发展至关重要的信息,本身是否也有“价值”或者“品质”呢?
二战以后美国主导形成的新经济体系中,贸易是的,生产却不是的。考虑一个网络,节点是产品,连边是产品之间的相似性。它根据世界产品出口数据计算,反映的是生产并出口一类产品时,同时生产另外一类产品的可能性。越相似的产品,这个数值越大。例如橡胶和咖啡之间的相似性,就比橡胶和火箭发动机之间的相似性大得多。在这个网络上,国家的产业升级,也就是国家在产品网络内的移动。研究人员根据真实数据发现,在二战后的半个世纪中,国家的移动像是寸步难行的乌龟,而不像纵情跳跃的猴子。这与我们的直觉是相符的:卖橡胶的国家也许也可以同时卖卖咖啡,但要想突然间开始卖发火箭动机,常困难的。
根据Battelle研究所的报告,中国的人才投入还有进一步提升的空间。比起美日,科研投入占P的比重还比较低,另外,由于大量的科研投入都被用于购买仪器设备,而不是发放人员薪酬,即使与相同科研投入占P比例的国家相比,培养的科研人员的数量也非常少。所以,在加大科研投入的比例,以及提升科研投入的效率方面,还有待加强。
如果说工业时代国家之间是在争夺原材料和能源,那么信息时代国家间就是在争夺“算力”。人们发现,在对数据的深加工上,算法的竞争力超过了硬件竞争力,拥有更多人才的国家,算力就更强大。因此国家之间的人才流动,成为理解和预测国家兴衰的重要指标。
Bogdan State等人根据LinkedIn数据统计的人才跨国流动
人类科学发展史,版权归本博文(《知识的品质》)作者
这里做一点有趣的延伸。人类的各种活动都要消耗能量,因此我们通常说的“生活的品质”与所拥有能量的品质是密切相关的。例如烟煤,顾名思义,在燃烧过程中会形成大量杂质。使用烟煤取暖,是导致中国北方冬天出现雾霾的重要原因之一。这个现象背后的原因是中国为了能源安全,90%的能源自主供给。因此,我们大量使用自主开采的低质煤炭,污染了,降低了居民生活的品质。想象一下,如果中国坐拥沙特阿拉伯那样丰富的石油资源,可能会长得像迪拜那样,居民也比较容易过上高品质的生活了。
例如,在过去十年的建设中,国家投入巨资研发的国产大飞机计划发展缓慢。虽然2015年已经可以交付订单,但大飞机的各个部件拥有自主创新的技术非常少,国内外订单背后更几乎都是中国国有资本。这是因为传统工业的发展技术壁垒很大,很难实现跨越式发展。与此对比,同样经过十年,深圳的大疆科技已经占据世界消费级无人机近七成市场份额,拥有大量专利。也是经过十年,中国的淘宝,腾讯,百度等互联网公司迅速崛起,在数据吞吐量和算法效率上成为可以与美国互联网巨头抗衡的力量。近年来我们更是了包括集智俱乐部的天气在内的一大批以对人工神经网络等前沿机器学习技术的研发和应用为核心竞争力的移动互联网创业者的崛起。可以认为,对大规模互联网数据的深度加工和处理的能力,将成为国家竞争力的重要指标。这也是为什么中国在2015年工作报告中推出“互联网+”政策的原因之一。
在这种形势下,像海外殖民地比较少的工业国家要崛起,势必要通过战争,抢夺更多殖民地,以占据类似英法等国的生态位。而由于殖民地和主国之间的密切关系,一旦主国之间爆发战争,殖民地也被波及,自然演化为世界大战。
2010年后,中国制造业发展速度超出了国内市场的消费能力,产能开始过剩,情况类似一战时工业飞速发展的。在这种情况下,要保持持续增长,必然要抢夺产品链的高生态位,把其他国家和地区作为底层节点,当做原料产地和市场,这就是所谓的“中国崛起”。与当年的不同的是,在新经济系统中,中国可以不通过战争夺取殖民地,而是通过投资,贸易和外交的手段培育原料产地和市场。这就是所谓的“和平崛起”。
数据(data)(law)机制(mechanics)原理(principle)四个知识层级
为什么二战以后不再爆发新的世界战争?因为美国主导推行了新的经济生态系统。新系统中不存在主国对殖民地的独占式关系,所有国家作为个体,通过贸易协议(例如关贸总协定和后来的WTO),根据自己国家的比较优势进行生产,贸易。从食物链的角度,就是不再划分范围,所有的高层集体共享底层的能量输送。
要理解“学科大战”,我们需要稍微追究一下人类科学的发展史:
然而,目前的这些网络动力学机制,往往都是为了解释单一模式或者,例如Watts的随机重连用于解释小世界,Barabasi的无标度用于解释无标度,张江的随机几何图用于解释连边超速增长。这些模型,彼此并不包容。因此与牛顿创造的经典动力学相比,普适性还差得比较远。而在这些模型基础上的一些几何化尝试,例如使用双曲空间作为网络演化的背景,把优先链接这种复杂的动力学,转变为新的几何结构上的简单动力的Papadopoulos等人的双曲模型,离爱因斯坦的时空几何模型差得就更远了。
Nature文章,Computational social science: the links中的插图,左图是Facebook网络,右图是城市居民电话通信网络。
美国党在国内次贷危机后,为社会稳定,把大量资源用于社会保障体系建设以及安抚少数裔族群,海外军事预算不得不缩减。在此背景下,为了重返亚太,部署在中东的军事力量大幅缩水,结果导致叙利亚和伊拉克出现真空,产生新的极端伊斯兰ISIS。
尽管中国尽量低调地采取非战争的手段来崛起,仍然引起了在原来体系中占据高生态位的国家,例如美国的和抵制。以为“一带一”计划在金融上铺的“亚洲基础设施投资银行”(亚投行)为例,它采取商业银行的形式,以实际工程项目为单位进行融资和经营,将影响力输出的可能性降到了最低,并且欢迎原有的产品链高生态位国家适度(小比例投资)参与,以免引起国际秩序的动荡。但是亚投行计划仍然遭到了美日的抵制。不仅如此,美国还试图构建TPP等将中国排除在外的新经济体系。
我们认为,现在学科之间的关系,有点类似二战前的世界局势。每个学科内部存在的产品链条,就像主国与殖民地的关系,但是输送的不是产品,而是数据。以生物学为例,最基础的部分是对实验数据的搜集,同时有另外的子学科,如生物统计学或者生物信息学,负责讨论如何对实验数据进行加工,提升“产品附加值”。有趣的是,做实验和分析数据的研究人员之间工作强度和薪水也存在差距,类似于殖民地与主国居民的生活水平之差距。主国对殖民地的独占(数据解释),以及主国之间的贸易(理论引用),也都在学科比喻里存在对应。
食物链(food chain)由英国动物学家查尔斯艾尔顿于1927年首次提出。因其易懂又深刻,一经提出,立即成为最广为的科学概念之一。能量在食物链中沿着植物食草动物食肉动物的链条层层传递,一部分耗散到,一部分以生物大(例如蛋白质、核酸、糖类)的形式被储存在生物体中。生物体中的能量传递遵循两条热力学定律:第一条定律要求能量守恒,不能在食物链中被产生或者消灭;第二条定律要求能量在食者捕食者之间传递的过程中,必然要有耗散,即有一部分能量的品质下降。
2016美国总统在即,无论哪个党的候选人上台,对中国遏止的政策肯定不会变化。虽然中国不是通过战争方式崛起,但中国对“一带一”覆盖范围必须有武力以及针对美国进行反遏制的能力。抗日战争70年军演中展示的针对美国航母的东风21D反舰弹道导弹,服役中的辽宁号航母,以及在建的至少一艘新航母都是为反遏务的。阿拉伯海亚丁湾追击索马里海盗,利比亚武装撤侨等活动可以看做是军事力量输送的演练。刚刚成为中国经济特区的巴基斯坦的瓜达尔港有可能成为中国在印度洋的重要军事。
什么是能量的品质呢?高品质能量可以高效地(在低耗散的情况下)为低品质能量,反过来却不行。例如电能可以轻易地为机械能(电动马达),热能(热得快),电磁辐射能()等各种其他形式的能量,所以它是高品质的。反过来,热能基本上很难以高效的方式为电能,所以其品质要比电能低。
从产品链条的角度,主国国家位于高级生态位,殖民地位于低级生态位,后者对前者进行财富输送。以一战前的英国为例,英国以全球四分之一的殖民地土地,供养着全球0.2%的帝国人口。这怎么能不让其他国家,特别是像这样刚刚崛起的工业化新,所羡慕觊觎?
如果把看做“能量工厂”,食物链可以看做一系列工厂构成的加工链,其中的能量流量(quantity)不断减少,品质(quality)不断上升。
在军事和外交上,奥巴马提出了“重返亚太”的主张,即从中东撤军,把更大的海外军事力量用于遏止中国。2015年美军在“航行”主张下,派Lassen号舰驶入渚碧礁及美济礁12海里内,否定中国在南海人造岛的权益。目的之一就是为了挑战中国在亚太区的影响力,降低“一带一”范围内国家对中国的信心,中国界产品链中上位。
展示的中国东风系列导弹射程覆盖范围
Battelle研究所报告给出的科学研发比例及科学家人数
从全球人才流动来说,过去二十年,美国与东亚,特别是中国之间的人才争夺,是全世界人才流动格局的重要特征之一。根据LinkedIn全球数亿用户的教育和就业数据,过去二十年,流向美国的专业性人才先增后减,流向东亚的人才先减后增,其他地区的人才流动变化相对较小。
在伽利略,第谷,开普勒,牛顿这些人的开拓性努力之前,星星的运动,看起来一点都不比人类行为简单。两千四百年前,亚里斯多德使用同样的方法研究运动与诗歌结构,柏拉图把几何和城邦混为一谈。但是经过长期演化,物理学已经走完了“抽象的阶梯”,有着成熟的知识链生产线,可以对观测数据以数学模型进行高效压缩。而社会科学还停留在“前科学”阶段。充满像占星术一样暧昧不清,貌似深刻实则难以证伪的预言(例如经济学),或者是像博物学一样以分类和命名为主的研究方法(例如比较学)。这些都说明社会科学还处在知识链的底层,对数据缺乏有效同时又精确的压缩的方法。处在这种状况下的,落后的社会科学,在学科大战中被其他学科“殖民”,就像落后生态系统中的低级被入侵的高级捕食一样,是丝毫不奇怪的。
对于各学科内部的知识链条/抽象阶梯,还可以有不少有趣讨论,在此不做展开。接下来我们关注更大的问题:在知识链条上,是否也存在对高层生态位的竞争?如果是的话,竞争主体是什么?当前局势如何,未来会怎样?
给织物染色的胭脂虫
以用于给织物染色的胭脂虫(Cactus Moth)为例,其在南美的原产地是西班牙殖民地,英国只能试着在自己的殖民地培育。1788年在引入了胭脂虫的食物南美掌后,胭脂虫没有培育成功,掌却大量繁殖,引发生态灾难。直到一百多年后(1926)才从南美重新引入掌蛾成功消除。当然,也有成功的殖民地迁移例子,例如1888年左右英国从中美洲引入东南亚进行大规模种植的橡胶。这种努力,都是在抢占不成的情况下,复制产品链底层节点的尝试。
如果说,一国所拥有的能量品质与居民生活品质之间的关系还不那么直接,那么产品附加值与居民生活品质就有比较直接对应了。我们甚至可以简单地说,一国的财富,是由它界产品链上所占据的决定的。从这个角度理解,人类历史上世界范围内的大规模战争,包括英法七年战争(1756-1763),一战(1914-1918),二战(1939-1945),都是国家之间为了争夺在产品链上更高的爆发的冲突。
Bloomberg根据美国数据绘制的美力部署,可以看出东欧,中东,东亚和中南美,是重点地区。
2012年王雄博士在集智俱乐部做了一个,谈到了物理规律的四重境界,2015年王在南京的集智年会上,做了纪念广义一百年的,再次介绍了这个科学理论的层级结构。我们对之进行微小的变动,以古老的天文物理学和近十多年来兴起的复杂网络科学为例,来解释科学理论的数据(data)(law)机制(mechanics)原理(principle)四个抽象层级。
东亚也是美国的重点地区,但中国在美国忙于中东反恐时赢得了宝贵的发展时间。中国推行城镇化建设,以此催生大量的房地产,道,以及各项基础设施需求,同时以市场换技术的方式吸收外来技术(例如高铁),对制造业进行升级,成为美国长期重点战略遏制对象中唯一崛起的国家。2012年中国制造业规模占据全球五分之一,超越美国[3]。
近几年,人们常常说“大数据时代”,在大数据的浪潮下,学科的人才培养和就业形势的改变也是急剧变化。这个变化的本质,其实就是学科和学科之间的“世界大战”。战争的目的,是为了抢夺殖民地,即其他学科的数据。这就是为什么我们看到计算机和物理似乎正在“入侵”社会科学,生物学,地理学等学科。
仍然将落后的社会科学与成熟的物理学比较。欧洲粒子对撞机每天产生42TB新数据,哈勃空间望远镜每天获得17GB新数据。但是没有人为此感到惊讶。人们真正惊讶的是,像谷歌这样的互联网公司每天新增的用户数据可以达到PB级。因为就在十年前,研究人类行为的主流方式还是控制实验和抽样调查,这样产生的数据在MB级以下。从MB到PB,这是十亿倍的差距。
我们认为是有的,这就是知识链。我们还可以给它起一个更直观的名字,叫做“抽象的阶梯”(abstraction ladder)。这个词,语言学家早川一荣也使用过,但在这里我们的用法略有不同。
在沙子硅锭晶圆芯片CPU
产品链的视角不仅帮助我们理解历史,也帮助我们看清当前世界政局:中国为什么要“崛起”?中国为什么可以“和平崛起”?中国将通过何种方式“和平崛起”?美国为什么要“重返亚太”?为什么近几年中东恐怖,出现ISIS这样的组织?这些问题都与全球产品链的结构调整有关。
我们发现,每一个学科的进化中,最关键的阶段就是从数据这个第一次飞跃。这个飞跃的出现,与该学科数据采集技术的性突破和数据量的爆发性增长密不可分。现在大家热衷讨论的“大数据”,很多时候指的就是“与人类行为有关的大数据”。因为在其他一些发展较为成熟的学科领域,早就过了数据爆发性增长的阶段,没有人会因为数据规模而特别吃惊。
到2008年后,全球范围内前往美国留学的人员开始反弹,但受次贷危机等因素影响,在美国就业的人数持续低迷,形成了一个剪刀差。美国等于在给世界,尤其是东亚培养人才。这个过程中,美国优先留住了有博士学位的STEM(科学、技术、工程与数学)人才。这些人,也是最能对国家“算力”最有贡献的人才。
亚利桑那州立大学的博士后研究者吴令飞博士,Arizona State University ASU-SFI联合复杂系统研究中心博士后,集智科学家,集智核心,研究方向:注意力动力学,在线社区与知识生产。吴令飞博士毕业于城市大学与学…
与天文物理相比,在过去的十多年中,复杂网络科学发展要快得多,已经经历了数据机制的阶段。最有名的例子自然是Barabasi的优先链接“机制”对幂律度分布这个“”的预测,以及Watts的随机重连”机制“对小世界这个“模式”的预测。这里我们稍微区分一下模式(pattern)与(law)。后者的定义比前者更严格,只要在观察数据里稳定重复出现的就可以叫模式(例如真实网络的高聚类系数),但要可以使用简洁方程精确表达的才可以称为(例如真实网络的幂律度分布)。其实除了这两个模式,还有其他的模式,例如网络演化过程中节点数量和连边数量之间的超线性标度关系,张江在2015年提出了一个简洁有趣的机制,“随机几何图”,来解释节点和连边的标度律。
C.A. Hidalgo等人根据世界贸易绘制的产品空间图
我们拿当前发展最完备的物理学,和发展最不完备的社会科学进行对比。人们常常误以为“社会科学”是研究人类系统,所以应该和物理学等学科有本质不同,因为人类行为很“复杂”。其实这是一种很受时代局限的狭隘看法。
The Wall Street Journal给出的“一带一”地图
在这个背景下,中国提出了“一带一”的策略来作为和平崛起的手段。“一带”是“丝绸之经济带”的缩写,指的是从中国西部出发,途经西亚内陆国家和莫斯科,通向欧洲的陆;“一”是“21世纪海上丝绸之”的缩写,主要包括从中东经过东南亚直到中国东部的航。这个策略的目的,一方面能源和原料的国际线安全,另一方面是为了把已经过剩的制造业产能,如钢材和水泥,向中亚和东南亚国家(2015年9月成功中标的印尼高铁项目就是一个成功的例子)。这两个方面,分别对应着中国制造业对产品的“新陈代谢”(流入和流出),都是为了继续在产品链中向顶端移动所做的经营。
关于计算社会科学,有两个:1)计算社会科学是现有社会科学的一个子领域;2)计算社会科学的任务是使用大规模人类行为的数据验证传统社会科学的理论。但这些从知识链的角度都可以被消除。
从数据中我们还发现,在2010年以后新一轮基础研究增长中,最快的是数学/计算机科学。我们认为这一轮的增长主力是计算机对其他学科,在数据的搜集和初加工方面的“入侵”导致的。可以预期,下一个十年,其他学科,特别是生物学,地理学,社会科学等,面临着物理和数学/计算机科学的全面殖民。
一个湖泊的食物链。由右而左:藻类、蚤状钩虾、鲌鱼、鲈鱼、白斑狗鱼、鱼鹰。本图出自Wikipedia食物链词条。
以天文物理为例,第谷对数据的总结是第一个层级。有了第谷的数据积累,才可能有开普勒的运行椭圆。等到牛顿提出动力学机制,才能解释和预测椭圆,双曲,或者抛物线等各类运动,把天上的星星和地上的苹果的运动联系到一起。而直到爱因斯坦提出了相对性原理,我们才更深刻地理解,原来引力是一种“”,其物理实质是时空弯曲的曲率,是几何结构的一种测度。沿着这个抽象的阶梯往上,从经验世界走到纯粹的世界,人类花了将近两百五十年。
流向美国的人才开始大幅减少的转折点大概在2000年左右。这个时候正是在美国遭受911后,开始把全球战略遏止的重点投向中东的时间点。这也是中国和东亚发展的黄金十年。
比较完物理学和社会科学后,我们以各个学科基础研究的投入来比较和预测学科之间的优胜劣汰。从美国科学进步协会(AAAS)根据美国自然科学基金统计数据数据给出的基础研究投资比例来看,过去四十年中发展最快的是生命科学,工程与物理。其中生命工程先扬后抑,工程与物理则持续上升。在1995年左右,在整个社会对生物技术的乐观估计下,生物学领域开始获得了大量来自美国国家健康中心(NIH)和市场资本的资金支持,开始迅速发展(这也是“21世纪是生物世纪”说法开始流行的时期)。但是经过了十年的发展后,和市场都发现对生物技术投资带来的回报并不如期望,从2005后,对生物领域的投资开始逐渐减少。我们认为,这是生物学在经历了数据的爆炸性增长后,长期无法完成数据的跨越所造成的。
New York Times 记者 Otto Tolischus所拍摄1939德军入侵波兰
泥炭褐煤烟煤无烟煤,品质越高似乎也越美。
首先,计算社会科学不是一个子领域,而是社会科学在知识链上层级爬升的新阶段。 就好像实验生物学生物学信息生物学的演化。现在已经比较少有“信息生物学”的提法,不是因为它不流行,而是因为太流行了,已经成为共识。不借助算法进行数据分析的生物实验室越来越少,“信息生物学”提法的历史也自然就宣告结束。类似地,等到算法根据和大规模数据成为研究人类行为的常识,“计算社会科学”的提法就没有太大意义了。
其次,计算社会科学的任务,不是去验证“人际关系弱链接的强作用”之类的传统社会学理论,而是提出和解释可以用方程描述的人类行为的普适性,实现从从数据的理论进展需求。望远镜刚刚发明时,也有人试图搜集运动数据来给占星术背书,但这种逆历史潮流而动,在知识链上不升反降的思,注定是意义不大的。
和大自然的食物链类似的情况,也存在在人类的社会经济活动之中。我们可以将产品的附加值与能量的品质做一粗糙对应。在沙子硅锭晶圆芯片CPU的制造过程中,人类劳动不断凝结到产品之中,产品的附加值也越来越高。以货币来表达,就是产品的价格越来越高。
太阳能,是我们在地球上最容易获取的能量,不过也是品质最低的能量。我们星球上以各种形式储存着来自太阳的能量,如风能,水能等等。但品质最高的,还是通过生物体加工后存储起来的部分。通过植物的光合作用,太阳能为化学能,通过植物食草动物食肉动物的链条,化学能不断耗散同时也被不断富集(压缩)。
这个压缩过程甚至在生物体死亡后还可以继续进行。如果植物在分解之前就被埋在地底,它会经历泥炭褐煤烟煤无烟煤的转变。这个过程越往后,对形成时间以及的温度和压力要求越高,能量的压缩率(每单位体积所蕴含的化学能)也越高。如果动物或者微生物在分解之前就被埋在地底,经历比煤更高的温度和压力,就会变成比煤能量压缩率更高的石油。
贸易而生产不的一个最核心的原因是,产品是流通的,但知识却不是流通的。占据食物链顶端的国家,例如美国,为了维持自己的优势地位,必须制造困难,使得底层的国家无法轻易地进行产业升级。技术,局部战争,武器禁运,这些方法都被用于将底层国家锁死在自己的上。一些缺乏战略的小国,例如日本和新加坡利用自己的地缘优势(“间于齐楚”),迅速实现了产业的升级。但是被美国重点的对象,特别是东欧,中东和中南美,一直被按死在底层。这些国家迄今为止,经济的主要支柱还是能源、矿产和原料的输出。
Bogdan State等人根据LinkedIn数据统计的美国人才流失
学科大战,对国际格局也产生了新的影响。国家间,也将从争夺产品链的高层生态位,装变为争夺知识链的高层生态位。实际上,产品链和知识链是相关的,高附加值的产品,往往也就凝结着更多的知识。然而在不同产业里,由于知识和人才的全球流通速度不一样,落后国家对发达国家的追赶难度是不一样的。实现产业升级的最佳方法,不是复制他国成熟的产品链,而是直接将资源投入新的产品中去,在知识流动性大的行业直接占据知识链的高层。
其实所谓抽象的阶梯,就是对数据进行信息压缩。在知识链上越高层的科学理论,就越简洁,深刻,优美。将爱因斯坦方程与第谷的观星日志对比,好比无烟煤之与泥炭,电脑芯片之与沙子。同时,就像能量品质一样,高品质的知识可以低损耗地成低品质的知识(数据),而反过来却非常困难,需要人脑消耗注意力进行加工,同时还会产生大量的损耗。
人类行为数据规模正在赶观测数据规模