老友聊天录7第一性原理深度学习及其
邵青老师年8月5日,推荐了Facebook、MIT等联合发表页手稿:用「第一性原理」解释DNN,作者是Facebook、普林斯顿大学和MIT的三位AI研究人员,预印本书稿的名字是《ThePrinciplesofDeepLearningTheory:AnEffectiveTheoryApproachtoUnderstandingNeuralNetworks(深度学习理论的原理:理解神经网络的一种有效理论方法)》。这部书稿的原文,可参考文末链接。
==(8月5日)我一直以为,“文字”与“语言”都应该是私有制的副产品。因为要记录财产归属,所以要有符号(后来的文字?),为着符号的统一表达,于是才有语言的必要。
邵兄好!
先讨论您此前发的“文字和语言都应该是私有制的副产品”这一观点。
这个说法从文字考古的发展中,可以一定程度予以证实。比如两河流域文明的泥板文字,解读后发现绝大多数是两类:一类是“战功簿”,另一类就是“财产簿”。特别符木、滚筒印章,表明权属记录和鉴证。
但是有一个问题:就是这些都是可见的文字、符号记录,不超过1万年。如果算上彻底毁损、灭失,也顶多上溯到数万年。与这些刻写符号相比,可能在缺少符号文字之前,还存在相当长的时期,是纯语音形式的语言。
前两年商务印书馆重印了一套15册语言学大师经典(有萨丕尔、洪堡、布龙菲尔德、索绪尔、赫尔德、托马塞洛等名家经典),这是我特别想静心研读的系列著作。先跟您报告下粗略翻阅的一点心得:
1、年前的语言学家,侧重“语言起源论”。基本两个流派(延续柏拉图的“名实”两派):一个是认为语言是“名实相符(analogists)”的过程,这个流派概括出各种自然拟声的语言起源假说;另一派是“名由人定派(anomalists)”,认为语言的表征与其意义之间具有不规则、人为的根本特征。后世的语言学各流派,大致都是这两个观点不同视角的组合。
多年前,赫尔德在《论语言的起源》里开篇就说“当人还是动物的时候,就有了语言”。然而,年语言学的“溯源分析”,逐渐围绕英国人威廉.琼斯的“印欧语系”的概念,将语言逐渐整理成一棵繁茂的“语言演化之树”;萨丕尔、索绪尔之后,语言的研究逐渐转向社会、文化功能,虽然他们也看重语音,但总体上倾向于认为:感叹词并不重要(萨丕尔);语音和符号之间的对应关系是任意的(索绪尔)。此后的语言结构学派,更是致力于发现“内生的语法”(乔姆斯基,洛特曼)。
这种研究趋向,有两个重要的点:一个是认为拼音文字是“声音和符号合一”的语言,“语言是一个任意的语音符号的系统,社会集团依靠它进行协作”(布洛赫);一个依然会兼顾语言起源的研究(比如体态手势语言、听觉语言和视觉语言的区别与联系),但更看重语言演化中“意义”的留存。(托马塞洛)
这两个趋向,内含一个共同的假设,就是“拼音语言优于象形文字”(加拿大多伦多学派)。近几十年认知语言学对这一假设不断强化,目的就是进一步夯实抽象语法、思想语言内核存在的合理性,并将这种合理性奠基于语言演化的进程中。
2、包含语音、符号、表情、手势、体态等的广义的语言范畴,在芒福德看来,有一个重要的纽带,就是无符号阶段和有符号阶段所共有的“礼制”。这一礼制是原始宗教性的,充满祭祀、禁忌、亲情、神秘的色彩,是人类数万年生存交往活动的积淀。
在芒福德的这个思想启发下,我觉得早期语言的作用,如果说划分“势力范围”,进而划分“权利边界”的,是“天人、神人”关系,其次才是人人关系(这涉及私有产权的概念了)。
从这个意义上说,作为私有制的副产品的语言和文字,已经是很晚近(比如以万年为尺度)的事情了。在“动物性存在的人类”中,语言的形态与功能,我觉得还没有突破年前语言学家的各种假设。但是,您刚才发的“第一性原理”的文章,又有新的意蕴。
3、语言完成抽象化转化之后(标志之一是出现元音符号),对语法结构的
转载请注明:http://www.abuoumao.com/hyfw/1925.html