
第二章 计量文体学相关重要统计学概念
计量文体学的所有工作都是建立在对作家、作品文体特征的量化基础上的。我们知道,作家的写作风格和写作特点直接表现为其对语言形式的选择。文体选择说认为,作家在写作的时候一直不断地在进行语言的选择,这种选择是靠作家的直觉进行的;没有选择就没有文体(刘世生等,2006)。所谓语言的选择就是作家喜欢使用什么样的表达方式、不喜欢选择什么样的词汇,在其写作过程中是有取舍的,而且这种取舍是作家在写作时不自觉地进行的。这种不自觉的、贯穿作家整个写作过程的对语言形式的取舍形成其区别于其他作家的独特的写作风格。所以说,作家的写作特征和风格首先表现为其独特的语言表达。
作家独特的语言表达有时是非常宏观的,而且可以让读者在阅读过程中很强烈地感受到其与其他作家的不同。比如有些作家特别喜欢用某些词,这些词几乎成了其作品的标志,以至于读者一读到这些文字就马上知道作家是哪一位。然而,一个作家区别于他人的独特的语言表达更多地表现在细微的地方,是微观的。而这些微观的特点,读者很难从宏观的角度进行把握。由于这些微观的特点是作者的写作习惯的流露,有时甚至连作家自己也不能够自觉。这种微观的、独特的写作特点虽然读者很难察觉,但是却真实存在,而且可能成为鉴别作家的重要证据。比如,我们在写作过程中对一些虚词的使用往往是因人而异的,特别是在一些可用可不用的地方,有的人喜欢用,有的人则很少用,这样就产生了不同作家在这些用词用字上的差别。这种习惯往往体现在用词的多少上,而不是体现在用与不用上。用和不用的差别通常很容易觉察,但是多与少的差别,一般凭直感就不容易进行判断。利用同一语言表达出现次数多少的差别进行作家写作风格、作品文体的研究就需要对语言形式进行统计,并且在统计数据的基础上利用统计学的理论、方法进行分析。这一章对计量文体学中常用的统计学概念和理论进行介绍。