汉语语言学

看了一些和汉语的语言学相关的书,之前读过不少语言学相关的书,不过汉语相关的相对少,印象里也只有两年前读的郑子宁的两本。对于自己的母语还是要有更多的了解才是。

汉语的本质和历史

高本汉写于八十年前的汉语研究著作,面向的是学习汉语的外国学生。作为以汉语为母语的人读毕也受益匪浅。

第一部分是引言。我们通常认为外国人学习中文最难的是汉字字形,但是高本汉有不同的观点:

外国学生在学习汉语时最头疼的不是汉字的字形,而是汉语里没有清楚的标记帮助他们分辨词性以及词在句中的作用

二 文字

许多欧洲人想象,使得学习中国的语言和文学变得极端困难的乃是汉字的字形,但事实绝非如此。认字不易,的确要花时间去学,但这还不算困难,困难将出现在另一方面

三 音韵

语言学和心理学的联系。

结合对各语系中音变现象的考察,我们越来越接近于建立一个普通演化语音学的系统,建立音变的普遍规律,如颚化、唇化、同化,等等。这些规律在各种语言中都出现过,而这也是普通心理学的一个重要组成部分。很明显,如果能构拟出汉字在上古、中古和近古的音读,并能搞清楚这个大语种在过去约三千年间的语音史,那我们就大大地充实了作为普通心理学一个分支的普通演化语言学的内容。

我们看到了结合古代的《切韵》和现代方言来构拟大批汉字的声母是怎样成为可能的——《切韵》归入这几类的字事实上有几百个

四 语法

距离七十年代Lakoff提出隐喻还有三十多年,但是在这里高本汉已经把隐喻的内涵讲得七七八八了。每个国家都有自己的隐喻方式,而这是需要积累的。

中国人常常使用与我们不同的修辞手段,简单说,就是使用别样的比喻。众所周知,我们所有人在各自的语言中都大量地使用比喻,尽管我们太习惯于比喻,以至不再认为这是修辞手段了

英国人说My thoughts go back to my dead father[我的思想回到我死去的父亲那里=我回想已故的父亲],而中国人则说“我追想亡父”,即“我的思想追上了已故的父亲”。我们是用完全相反的方式想象这件事的,我们回想以前的时候,我们认为是回去,而中国人则设想父亲是在他们之前先走了,子女要用思想追赶他、赶上他

然后他讲到了汉语的黏着/孤立性质。如果没有上下文是无法确认词语的词性和意思的。比如汉语并没有时态语态的变化,而拉丁语系通过词尾变化来体现阴性阳性时态语态。日语则是属于比较特别的一类。

汉语语法事实上非常贫乏,它主要是规定词在句中的位置,再加上一批语法助词的作用。所有在我们的语法中称为变格和变位的情况,以及构词的原则,在汉语中几乎都看不到。汉语不用像各种词根或词尾变化那样的特殊标记来表明所要求的词类、名词的数和格、动词的时态和语态,这使汉语变得异乎寻常地简洁

主要的难点根本不是汉字的形体,而是汉语的孤立语性质。

在没有屈折手段的语言里,主语常常是不言而喻的,因而人们不知道句中出现的是“我”、“你”、“他”、“我们”,还是“他们”,人们也不知道动词是用作过去时态、现在时态,还是将来时态,等等

但是高本汉在这里丢出了一个重磅炸弹——他指出上古汉语其实是屈折语。当然他也指出屈折并不代表语言进步,相反,英语正走向屈折的反面。

全世界各地的一大批野蛮原始部落中,都存在一些语法特别复杂的语言。没有屈折和派生手段绝不能表明语言是原始的,而只能表明语言是进步的

印欧诸语言也在向与此完全相反的方向发展,它们一个接一个地失掉了屈折和派生手段,就是说,在类型上变得和汉语越来越相似。瑞典语比德语的屈折系统简单,而德语又比拉丁语和希腊语的屈折系统简单。沿简化和废弃语法指示手段的方向走得最远的是英语   

现代汉语最重要的特征是其孤立语性质,即没有道地的词形屈折,没有从一个共同词根构成几个新词的词语派生,没有用不同的形态来表示不同词类的语法差别——所有这些我们都称之为“孤立语性质”,这并不是汉语的早期原始特征。我们看到,上古汉语所具有的某些特征清楚地表明原始汉语完全是另一个样子。我们看到,上古汉语在人称代词中仍然有典型的屈折变格,在某些动词中还有个别时态变化的蛛丝马迹,但我们没有篇幅来着手讨论这个错综复杂的问题了。所以,具有真正术语含义的、道地的屈折手段在原始汉语中肯定存在,只不过我们还不能依据古代典籍来断定这种屈折系统在史前语言中究竟延伸到多古

五 训诂

训诂学我理解是一种释经学,它的终点不是语言而是经,但是训诂学对于汉语语言学的发展起到了重要的作用。

我们这里因而就有了一组把人比作羊的隐喻:没有角的大人=幼稚的成年人,有角的少年=早熟的年轻人

在《诗经》里有一个著名的比喻,把有钱有势而无所事事的高级贵族比作看上去能引起人们奇妙联想却没有任何实际用处的星座。

语法六讲

沈家煊的一些关于汉语语法的讲座合集,关于隐喻理论的拓展和应用我感觉读了受益匪浅。虽然作者本人我先前不熟悉,但是作为一个高中时有翻字典爱好的人来说,文中提到的吕叔湘是和王力并列的我心中的汉语语言研究的代表人物。

让我最震撼的还是关于“言·知·行”三个域的划分和结合,主要在第四讲里讨论的。

第一讲 汉语语法研究摆脱印欧语的眼光

1949年以来,在汉语语法研究方面有过三次重大问题的讨论:一是汉语词类问题的讨论;二是汉语主语宾语问题的讨论;三是汉语单句复句问题的讨论。

我们对于汉语不同于印欧语的特点已经取得哪些认识

第一,汉语里语素的地位不亚于词的地位

二,汉语里语素和词、词和词组的界限不清

三,汉语动词做主宾语的时候没有“名词化”。 语词类跟句法成分之间不存在简单的一一对应关系。

第四,汉语词组和句子是一套结构规则


一、重叠是汉语最重要的形态,一种不同于印欧语的形态手段,双音化也是一种形态手段。

最近看到报道,十大最佳“洋泾浜英语”评选的结果,荣登榜首的是这样一条:Good good study, day day up.好好学习,天天向上。

汉语的实际是名动之别并不像想象的那么重要。《现代汉语词典》到第5版才开始标注词性。

把名词、动词、形容词归为一个大类叫“大名词”,有利于说明汉语的一个重要事实,名、动、形三者重叠后通通变为摹状词语。

二、印欧语是“名动分立”,汉语是“名动包含”。

汉语的“名词”也有两个意思,一个意思包含动词,一个意思不包含动词

三、汉语的语法和用法分不大开,讲汉语语法离开用法就没有多少语法可讲。

朱先生将汉语里的无主句归纳为五类:

(1)打闪了。轮到你请客了。(根本安不上主语)

(2)热得我满头大汗。(陈述对象不在主语位置上)

(3)学而时习之,不亦说乎?(陈述对象泛指)

(4)打算写本书。哪天回来的?(陈述对象是言者自己或听者)

(5)怎么样?还不错。(陈述对象可以从语境推知)

四、汉语构词法以复合为主、派生为辅,汉语的造句法也更多地采用复合的手段。

英语sweetness就是一个派生词,知道根词sweet的意义,又知道词缀-ness的意义,也就知道了sweetness的意义

复合构词,构成词的意义大多是不透明的,例如“甘苦”,知道“甘”的意思也知道“苦”的意思,不一定知道“甘苦”的意思,“甘苦”作为一个整体,它的意义不能完全靠它的组成成分推导出来。要突出这种整体性,这样的复合可以叫做“整合”。

Don’t write anything you can phone, don’t phone anything you can talk face to face, don’t talk anything you can smile, don’t smile anything you can wink and don’t wink anything you can nod.(Earl Long )

董桥先生把它翻译成:

能够在电话里谈的事情千万不要写在白纸上;当面能谈的事情千万不要在电话里说;轻轻一笑能带过去的就千万别唠叨;眨眨眼睛示意一下既然行了,那就不要微笑;点头可以了事的则不必使眼色。

五、汉语语句的“主观性(subjectivity)”强,“移情”的成分多 

六、英语看重“是”,汉语看重“有 (There be/have vs 是/有)

哲学界还有不少人谈到,西方哲学是围绕being而进入形而上学的思辨,而中国先秦名家则是通过对“有”的反思而进入形而上学的思辨

第三讲 为什么说汉语的动词也是名词?——语法研究的破和立

语法研究的是语言的规则,但是汉语的规则很难像英语一样描述清楚。

简单原则”也叫“奥卡姆剃刀原则”,对于同一件事情,一种解释依靠的假设多,一种解释依靠的假设少,那就应该相信那个假设少的

J.劳尔斯在1955年最先提出,人类活动的规则可以区分为两类:“实现性规则”和“构成性规则”。

实现性规则:使正常的活动得以实现,如交通规则。

构成性规则:创造或构成活动本身,如球赛规则。

第四讲 说,还是不说?——虚词研究的一个重要问题

感谢伊芙·斯维策,她为我们的虚词研究提供了一个“三个认知域”的框架,我觉得可以用三个简单的汉字来翻译,就是“行、知、言”,分别叫行域、知域、言域

按照奥斯汀的“言有所为”理论,说话和做事一样都是“行为”,做和不做不一样,说和不说当然也不一样。说了就有“语力”和“语效”,不说就没有“语力”和“语效”。“语力”一词是翻译illocutionary force。

有时候说的语力是间接的,是一种“言外之意”,虽然字面上没有,但是可以按照格赖斯的会话的“合作原则”推导出来。“言外之意”虽然容易推导出来,但是只要没有直接说出来就可以不承认它,这叫做言外之意的“可取消性”

这部分,回想自己的经历 还有作品B 这似乎给我的很多执着和困惑提供了一个解答。之前写《追忆》摘抄的时候也引用过的一句卡森也提供了相似的说法,syntax只在言域,但是映射在知域显得苍白,更别说在触碰不及的行域。

Your absence from the syntax of my life is not a fact to be changed by written words. And it is the single fact that makes a difference to the lover, the fact that you and I are not one.

有些话之所以无法说出口,是因为深知说出来了也没有用(效力)。虽然是心照不宣的想法,但是只有说出口的动作能完成知域到言域的跨越,最后到行域——一种真正的解脱,一种真正的closure。这件事情的可怕就在于它的不可逆转、不可取消,一旦说出口就意味着为所有的心绪赋予形态,而这个形态可能如玻璃般易碎而不堪一击。

这两个多月我一直在想作品B续集会是怎样的结局,但是可能要再多等几个月了。原作品的结局对于我来说已经是完美的了,但是如果一定要把房间里的大象解决,要一个真正的结局,那逃不过这一步——从知域到言域到行域的跨越。这是目前我的知识里能想到的最好的方式。

事实上,我最近也经历了一个很大的人生转折——我终于决定不在硕士毕业后读博,并且和导师表明了这个想法。这个想法一开始只是存在于我的脑海,然后我把这些零散的感想组织成笔记本里的文字,最后变成一次会议、一次沟通、一封邮件,现在我放弃了Qualifying Exams——那一天我的飞机从纽约起飞。于是完成了从言域到行域的跨越。


下面这个关于“而且”表递进的用法倒是挺有趣的,要是出在中考语文里肯定让很多人混淆。

这房价不仅中收入层买不起,而且高收入层也买不起呢。

这房价不仅高收入层买不起,而且中收入层也买不起呢。

很多人说后一句不符合形式逻辑的递进关系,是个病句。其实它不是什么病句,在当下注重民生的语境里它是可以说的,而且很适合这么说,它表达的意思是:你口口声声说“高收入层买不起”,我不仅说“高收入层买不起”,而且还说“中收入层买不起”,因为从民生出发“中收入层买不起”比“高收入层买不起”更值得关注,说“中收入层买不起”比说“高收入层买不起”更重要,说什么跟你想强调什么有关系。所以后一句如果成立实际是两种重要性不同的“说法”之间形成递进关系,是“而且”一词的言域用法。

还有一个情态动词的例子:

语法中最能说明“行、知、言”这三个域的是情态动词,以“能”字为例:

1)小王能 说法语。       [行域]

2)我能 骗你吗?        [知域]

3)小王,能 把笔记借我一阅!  [言域]

1)是说小王有说法语的能力,能力跟行为直接相关,这个“能1 ”属于行域。2)不是问我有没有能力骗你,而是问你认为我有没有可能骗你,是根据知识对行为的可能性做出推断,这个“能2 ”属于知域。3)既不是问你有没有能力出借笔记,也不是对你借笔记给我的可能性的推断,而是请求你把笔记借给我,这里“能”字可以换成“请”字。这个“能3 ”的功用是表示这句话是个请求的“言语行为”,属于言域


三域混杂的结果之一就是实义动词虚化,作者举了几个例子:

现代汉语的“了”(le)由实义动词“了”(liǎo)虚化而来,一般说动词后的“了”表示动作的“完成”或“实现”,句末的“了”是“肯定事态出现了变化”或“出现了新的事态”。但是请看下面这些句子里句末的“了”字

还有一个“不过”的例子。

不过”的功能由限制事物的范围变为限制话语的范围,也就由副词变成了连词,这种演变符合虚词进一步虚化的一般倾向,类似的演变也出现在英语的only上,例如:

He is only a child.(他还不过是个孩子。)

→I should like to go, only that I’m not feeling well.(我想去,不过我不太舒服。)

第五讲 “语法隐喻”和“隐喻语法”

我的老朋友隐喻又出场了。

隐喻两个相似 概念之间的“投射”——沉舟和千帆的关系相似于旧事物和新事物的关系,转喻是两个相关 概念之间的“过渡”——帆和船的关系具有部分和整体的相关性。还有,隐喻主要是一种理解的手段,转喻主要是一种指代的手段。隐喻的源概念要具体——沉舟和千帆比旧事物和新事物形象具体,转喻的源概念要显著——帆是帆船最显著的部分,海面上远远望去看到的是一片片的帆。

一个关于情态动词的例子。这样的整理让我想到了学日语的时候的对まとめる 的解释,其实就是一种“把散落的东西集合在一起”这样的概念在不同领域的延申义。这样的一种思考方式对于我学习文言文和日语都大有裨益,不过没想到看上去更加直观的英语也可以应用这种理解方式。

May I ask a question?

He may be a spy.

前一个may表示“允许”,后一个may表示“或许”,从“允许”到“或许”就是一个概念隐喻,因为这两个概念具有相似性,都具有“克服阻力”这个结构框架:

允许:对方的某种行动的阻力被克服

或许:言者做出某种结论的阻力被克服


边界理论在卡森作品里也有提到过。  

无界事物的内部是同质的,有界事物的内部是异质的

认知上“有界”和“无界”的对立也会在语言结构中有所反映,特别是在名词、动词和形容词三大实词类上都有相似的体现。

事物在空间上有“有界”和“无界”的对立,动作在时间上有“有界”和“无界”的对立,性状在程度或量上有“有界”和“无界”的对立


这些句式整体意义的形成跟心理上“完形”的形成原理相同,都受四条原则的支配

  • 按照“顺序原则”,如果B在A之后,C在B之后,那么A、B、C是一个序列,而不是一个无序列。在空间域是一个序列,在时间域和其他的概念域也是一个序列

  • 按照“包容原则”,如果B包容在A之内,那么A就不可能包容在B之内

  • 按照“相邻原则”,相邻的两个成分倾向于组成一个单位,例如上面图里的平行线,我们看到的是四对平行线而不是八条平行线

  • 数量原则”不需要多做解释,认识数量上的多和少是人的基本认知能力之一


模块化——或者简单来说“拆大为小”是一种常用的研究手段,但是对于语言这样的复杂系统,似乎并不完全适用。

过去我们习惯于把句法、语义、语用看成三个独立的、依次进入的模块,句法处理完毕后进入语义解释的模块进行处理,最后进入语用解释的模块处理。这样的做法忽视了这三个模块之间的并行关系,缺乏概括性。其实还是把三个模块看成三个层面好,句法层面最抽象,语用层面最具体,语义层面介于二者之间,三个层面具有隐喻性的投射关系,有一个贯穿其中的量级模型能对三个层面上出现的平行现象做出统一的概括的说明。

我们对语法结构可以做到充分的解释,但是只能做到不完全的预测。语言研究不可能做到完全的预测,这是语言学这门科学的研究对象的性质所决定的,凡是复杂和开放的系统都无法做到完全的预测。语言是一个复杂系统、开放系统,是许许多多方面和因素互相作用和综合的结果,这样的系统不可能真正达到均衡的状态,它总是处在不断展开、不断转变之中。如果这个系统真的达到了均衡状态或稳定状态而不被打破,它就变成了一个死的系统。跟气象科学、进化科学、地质学和天文学一样,语言学虽然不能做到完全的预测,但是仍然不失为一门科学。

最近以gpt为代表的生成式AI火爆。作为黑箱模型,这类AI不能说真正“理解”语言的内容,但是却可以生成。让我想到了反应动力学课上教授说许多模型其实也没有那么多合理的解释,只不过是强行套用而已。在强大的算力面前,似乎我们可以把一切送进黑箱,包括语言。但是对于我自己来说,这似乎不是一个很明智的做法,是一种捷径没错,但是溯源工作仍然有意义。

第六讲 为什么研究语言中的整合现象?

人们感知整体(完形)往往比感知组成部分来得容易。两个成分相距越远,它们之间的差异就越显著,判断起来就越快。大脑具有一种神经机制,能把这些不同种类的信号在视觉上整合为一个单一的、连贯的物体意象,这种整合在神经科学中有个名称叫做“binding”

通过整合而产生的意义叫做“浮现意义”(emergent meaning),浮现意义是创新意义,整合是创新的源泉,日常生活中这样的例子很多很多。例如“回溯推理”(abduction)。这是一种既不同于演绎推理也不同于归纳推理的推理方式。


压缩隐退是整合过程中的两种重要方式。

先说概念的整合必须有概念的压缩(conceptual compression),各种压缩都可以概括为“距离压缩”,包括时空距离和心理距离
  
50年代那个长辫子姑娘是我现在那个剪短发的妹妹。
电影中那个长辫子姑娘是我那个剪短发的妹妹。
张三相信那个长辫子姑娘是我那个剪短发的妹妹。
这三句都是糅合型整合,第一句的两个概念域,一个是“50年代域”,一个是“现在域”,两个域之间有时间距离;第二句的两个概念域,一个是“电影域”(角色),一个是“生活域”(演员),两个域之间有空间距离;第三句的两个概念域,一个是“信念域”,一个是“现实域”,两个域之间有心理距离。这三种距离都在概念整合中被压缩,“长辫子姑娘”和“剪短发的妹妹”于是被等同起来。
  
隐退(conceptual recession)。隐退是相对“突显”而言的,“一隐一显”才形成一个整体
  
兄弟“兄和弟” 兄.弟“他是我兄弟”
多少“多和少” 多.少“每月有多少收入?”
东西“东和西” 东.西“这是个什么东西?”

语言形式的压缩和隐退主要有三种方式:一是由重读变轻读,二是由长大变短小,三是由自由变黏着