汉字限制了中国人的科学抽象能力
简读:在科学抽象思维中,除了“第一级符号替代”之外,还有“第二级符号替代”。“第一级符号替代”指的是用一个词汇来概括现实世界的一类事物现象,例如“狗”可以替代各种品种的同类动物,这是从现实世界到语言词汇的过程。而“第二级符号替代”则是从语言表达到科学概括的过程,比如可以用一个字母“a”代表一个变量,指示各种各样可用自然数称数的对象,比如狗、人、车、文章等。这种第二级替代对科学公式的建立至关重要,是推演和证明的关键,也是科学系统赖以建立的工具。简而言之,第一级符号替代是将具体事物抽象为语言词汇,第二级符号替代则是将语言词汇进一步抽象为科学符号和变量,用于科学公式和理论的构建。
汉语采用的是汉字这种书写符号系统,它制约着汉民族的科学抽象,致使思维一直停留在直观的层次上,难以把发现上升为科学理论。
人们在进行科学抽象思维时离不开书写符号。与罗马字母相比,汉字有一个不便之处,只能做“第一级符号替代”,而不利于“第二级符号替代”。
所谓“第一级符号替代”,就是用一个词汇来概括现实世界的一类事物现象,比如“狗”可以替代各种品种的同类动物,这就是从现实世界到语言词汇。
相应地,“第二级替代”则是从语言表达到科学概括,比如可以用一个字母“a”代表一个变量,指示各种各样可用自然数称数的对象,比如狗、人、车、文章等。
第二级替代对科学公式的建立至关重要,这是推演和证明的关键,也是科学系统赖以建立的工具。世界的科学技术史表明,没有这些字母符号,任何科学系统都难以建立起来。
除了少数的连绵词,如“蝴蝶”、“仿佛”等,绝大多数的汉字都是形、音、义三位一体的,拿任何一个汉字来表达,都摆脱不了它原来意义的干扰和制约。
因此,这对科学抽象思维十分不利,即使有些天才发现了抽象的科学公式,用汉字表达起来也显得十分笨拙,既不容易做进一步的推演,也难以让别人清楚明白其科学普遍性。勾股定理就是一个很好的例证,只要简单对比下面的罗马字母公式表达和汉语古文表述,就会明白符号表达的重要性。
a² + b² = c²
勾广三,股修四,径隅五。(《周髀算经》)
严格地说,上述商高这个发现还不算严格意义上的定律,因为他还拘泥于“三”、“四”、“五”这几个具体的数字,尚缺乏数学概括性。没办法呀,也许商高心里清楚,可是汉字书写系统没有给他提供便利的表达工具,因此不能把科学发现说清楚啊!就一个平方符号“x²”,就用了三个不同的汉字“广”、“修”和“偶”来表达,学生能不迷糊吗?后人知道他在说什么吗?结果,中国人虽然有天才的发现,却没有发展出任何系统的数学。
纵观中国科学技术史,不乏有闪光的思想,但是始终都停留在直观应用的层次上,没有上升为系统的科学。造成这种现象的因素很多,其中原因之一是受汉字这种书写系统的制约,无法上升为科学抽象。
再让我们以著名的“曹冲称象”的故事来说明汉字对科学抽象的影响。“曹冲称象”见于《三国志·魏书》,中国邮政还为此专门发行了纪念邮票,故事编入小学课本。这个故事家喻户晓,妇孺皆知,是一则优秀的益智故事,但是也暴露了中国科学发展中的一个缺陷。先看其原文:
曹冲生五六岁,智意所及,有若成人之智。时孙权曾致巨象,太祖欲知其斤重,访之群下,咸莫能出其理。冲曰:“置象大船之上,而刻其水痕所至,称物以载之,则校可知矣。”太祖悦,即施行焉。
五六岁的曹冲是不是有这么高超的智慧并不重要,重要的是起码在陈寿写《三国志》的时代人们已经意识到了浮力定律的运用。但是这还是一种直觉的观察:同样重量的物体置于船上,船吃水的深度相同,它还不是科学定律,因为没有被抽象化和普遍化,尚不清楚背后的原理,尔后也没有形成流体力学这样的系统科学。
要形成科学规律,还必须弄清楚液体的物理属性,即浮力及其产生的原因;更重要的是要知道如何计算浮力:把物体浸在一种液体中时,所排开的液体体积等于物体所浸入的体积;维持浮体的浮力,跟浮体所排开的液体的重量相等。这就是阿基米德浮力定律,它可以用精确的数学公式加以表达。
当然,我们不能苛责一个五、六岁的儿童为什么没有独立发现浮力定律。然而,当时在场的曹操及其他官员只是觉得曹冲聪明,也想不清楚其中的道理。曹操虽然是一位杰出的文学家和军事家,也不能把儿子的天才发现用公式表达出来。最值得人们反思的是,在过去近两千年的历史上,后人都忙着称赞曹冲的聪慧,而没有人对这个问题再做进一步深入探究,一个伟大的物理学定律就这样与中国人擦肩而过。中国传统上普遍缺乏一种数学的思维习惯,没有意识把对象量化和形式化,找出其间的数量关系和逻辑关系,结果致使很多发现一直停留在直觉观察层次上。
即使现代的很多有识之士,包括陈寅恪这样的大学者,都还是忙着争论曹冲称象这则典故的真伪。然而,真也罢,假也罢,弄清这些有多大的意义呢?要知道,第一个发现者是不是曹冲并没有什么关系,关键是中国人在那时已经有了这个蕴含着科学规律的实际运用。值得今人认真思考的是,在过去几千年里竟没有人再进一步把曹冲称象的原理上升为一条科学规律。那么,是什么因素制约了人们对科学规律的探讨?很值得人们去反思。
中国传统中的数学思维或者逻辑推理,一直停留在第一符号层次上,也就是用日常语言替代直观的形象,所以虽然有闪光之点,但是很难概括为一条定律,更难发展成一个科学系统。这样就不大容易找到普遍的规律,也很难进行逻辑推演。
数学语言则是第二层级的符号替代,比如用X、Y替代所有的变量,而且数学运算和数学关系则需要一套特殊的符号,比如“+”表示“相加”,“≥”表示“大于等于”,如此等等。如果没有这些符号,单靠自然语言,不仅表达十分笨拙,而且很多公式定理甚至都无法说清楚,更无法进行推演的。
我们不妨可以做一个实验,下面是一个在数学上不算复杂的泰勒公式,请用自然语言说给另外一个尚不知道这个公式的人,看你能不能说清楚,再看对方能不能听明白,结果肯定是令人沮丧的。通过这个实验就可以明白字母符号对科学思想表达的重要性。
然而话又说回来,汉语选择汉字这种书写系统并不是偶然的,而是有其深刻理据的,有什么样的语言就会有什么样的书写系统。汉语的音节结构简单,同音词特别多,比如跟“一”发音相同的就有成百上千个字词,这么多字词如果用拼音字母写出来就一模一样,如此会导致读者很多时候无法辨认到底是什么意思,这样就会大大减缓阅读速度,也会妨碍理解的准确性。印欧语言选择拉丁字母或者罗马字母,也是由它们的语音、词汇和语法特点决定的,它们的词汇大多是多音节的,而且常常用一个音素来表达一种语法范畴,比如用“s”表示名词的单复数,因此用拼音文字记录这种语言最为便利。
很多人分不清楚汉语和汉字的区别,常常把两者混为一谈。有些人说汉语难学,实际上是指汉字难写。实际上,语言本质上是一种听觉系统,文字则是把这种听觉系统转换成视觉符号。文字是语言的外在载体,并不是每种语言不可或缺的部分。从甲骨文算起,有汉字记录的历史只有三四千年,然而在此之前汉语早已经存在了。世界上有6000余种语言,然而绝大部分还没有自己的文字系统,还有相当一部分语言是借用其他语言的书写系统的。书写系统借用现象很常见,比如以前日语、韩语、越南语等都是借用汉字书写系统,现在除了日语还保留着汉字书写系统,韩语和越南语都已改用了其他书写系统。
有没有书写系统对一个民族的文明至关重要,而采用什么样的书写系统对一个民族科技的发展方向起着决定作用。如果没有书写系统,思想只在个人的大脑里转悠,既难以深入思考,更无法成系统,也无法准确传递给别人,自然也就难以发展传承下去。靠口耳相传的思想是很难流传久远的。中华民族有上下五千年文明,汉字所扮演的角色是必不可少的。
我们必须认识到汉字不利于第二层级符号替代,所以中华文明主要表现在文史哲方面,就是直觉思维的领域,无法建起抽象的、严谨的科学系统。
作者简介:石毓智,男,1963年10月生,河南洛阳人,斯坦福大学博士、湖南师范大学特聘教授、新加坡国立大学终身教职(Associate Professor with Tenure)。
青仙按:我就是玩语言的,语言的最高是诗,诗的最高是普遍和变化,这里我已经有了。科学公式非定性和量化的我y也都有了。
AI,一个新时代
024年11月8日英伟达市值
AI改变芯片市场
11月1日,标普道琼斯指数公司公布,将英伟达纳入道琼斯工业平均指数,取代道指目前的芯片业成分股英特尔。这次调整标志着人工智能和高性能计算的重要性日益增强。英伟达作为AI GPU的领先供应商,能够吸引更多投资者关注新兴技术,传统的半导体公司则面临较大压力,尤其是在数据处理、AI模型训练等高增长领域。
当然,这样的调整更说明AI正在引导市场投资风向。
上周巨头业绩后,各家投行陆续上调了明年整体资本开支。大摩从2700亿美金上调到3000亿美金。3000亿美金,作为对比先后完成6次登月的阿波罗登月计划共花费239.15亿美元;3000亿美金的数字可以在2023年非洲国家GDP排名中位列第4,仅低于埃及(3939亿美元)、南非(3777亿美元)、尼日利亚(3749亿美元)。
在人们感慨英伟达时代来临的时候,或许应该意识到AI时代真的来了。
AI成就了英伟达,AI时代并不会只属于英伟达。凯文凯利在《5000天后的世界》中预测:在未来的50年里,AI将成为可以与自动化和产业革命相提并论的,不,应该是影响更为深远的趋势。
一个新时代,将会由一个新玩家建造。
控制系统最高境界就是不控制,随意 !
计算机核心就是控制器。
控制系统最高境界就是不控制,随意[捂脸]专业娃讲的:自适应,实时优化,中石化还都没搞明白[捂脸]那帮人让本诗人指导,早搞出来了,那不是数学,那是诗!
中国社会的控制思路看【左传】,开篇就是兵法,老装孙子!就是现在政府的思路:放管服。这就是人有的是手段收拾你,不怕你蹦跶!先放开,跑,跑出来的收,敢嘚瑟的,再管,看你服不服!从没的早跑,跑的晚的不是他们的都被收拾了。
所以中国有成语,不要先出头!
想象的突发
论逆境
人们希望得到顺境的好处, 但却会赞赏逆境的好处。” Bma 派的一句高明的话。无可香认, 如果奇迹是对自然的控制的话,那 rerum secundarum optabilia; adversarum irabilia )这是塞内加仿斯多葛 么奇迹也就多出现于逆境之中 。然而他还有一句更为高明的话(这 2 向话出自一位异教徒之口, 是过于高明了):”在一个人的身上既有 人的脆弱又有神的安全感, 那就是真正的伟大。 “( Vere magnum habere fragilitatem hominis, securitatem hominis, securitatem Dei. ) 是一句诗的话, 那就会更好, 因为诗歌更允许有想象的突发。而且诗 人们确实是在忙于想象的突发, 因为事实上, 在古代诗人的那种奇怪 的虚构中所描绘出来的, 就是想象的突发, 而那种想象的突发又似乎 并非设有神秘之处 ; 不仅如此, 那种想象的突发还多少接近于基督 徒的状态:”赫拉克勒斯, 当他前去解救普罗米修斯的时候”( 普罗米 修斯是人性的象征),”他是坐在一个瓦罐里渡过了大海”, 这栩栩如 生地描述了基督的决心, 基督坐着血肉之躯构成的脆弱的小船, 渡过
塞内加和斯多葛派, 见(论死亡)的注释。 2 意即: 如果奇迹意味着对自然的控制的话, 那么奇迹也就最多地出现于当人们 控制了他们的天性之时。换言之、 所谓奇迹, 即超越自然, 而在人来说, 身处逆境之 时, 能控制自己的”自然” 亦即天性, 也就出现了奇迹。 赫拉克勒斯( Hercules ) 是希腊和罗马神话中的大力神, 以完成 12 项英雄业绒 闻名。普罗米修斯( Pomeheus)是希腊神话中的人物, 因盜取天火予人而触怒主神宙 斯, 被罚锁于高加索山崖上, 遭神塵拆磨, 后被赫拉克勒斯所救。”神秘之处”, 也就是 言外之意,即: 赫拉克勒斯坐着瓦罐去解救普罗米修斯, 就等于基督坐着血肉之躯构 成的脆弱的船去救赎人类。
AI的革命性突破
《硅谷101》:Jonathan你对人工智能有自己的定义,能和大家分享一下吗?特别是为什么数据如此重要?
Jonathan:人工智能的历史从1950年代达特茅斯会议就开始了,包括agent(智能体)、自然语言处理、机器学习、神经网络等多个分支。但我定义的产业化人工智能是从2012年开始的,核心就是深度学习。
2012年之前,所有计算机科学包括传统人工智能都依赖人写算法,有句话叫“人工智能有多智能主要看有多少人”。就像我从小开始就写代码,所有事情都要靠程序员一行行敲代码。但2012年AlexNet出现后,把机器学习和神经网络结合成了深度学习,不再依赖手写代码,而是通过大量数据训练。
——这在很早就出现了。我之前说这是“东北乱炖”与鸡块炖粉条!
这形成了”AI三要素”:算法(AlexNet)、数据(李飞飞的ImageNet)和算力(吴恩达和GPU)。这三个要素结合产生了革命性突破,出现了一个“黑盒”模型,效果反而比人工编写的“白盒”模型更好,只是可解释性差一些。
到了2020年GPT-3出现后,第一次把人类积累的电子书、维基百科、Reddit、知乎等所有内容作为训练数据,效果超越了传统自然语言处理的所有成果。现在语言模型完全是数据定义的,这就是为什么在AI时代,你创业第一天就必须考虑数据。但关键是,“有用的数据”这个定义是动态的。比如Transformer出现前,很多数据都用不上,但现在它能处理这些语言数据,产生出超越传统自然语言处理的模型。
《硅谷101》:Keith你觉得什么样的数据是有用的?
Keith:要从人工智能的本质来看,它是要模拟人类行为。人在网上做的就是读和写两件事:读是获取信息,比如听我们的播客,看视频;写是基于信息采取行动,比如交易股票或者点击按钮。
但对机器来说,获取数据很困难,因为互联网本来是为人设计的。每个网站都有自己的护城河,需要API或者写爬虫脚本才能获取数据,这是最脏最累的活,没人愿意干,而且永远做不完。这导致很多做垂直领域的应用公司,它们的数据都差不多,没有特别之处。