《三重门》手稿中的笔误类型分析 -- @xmwz2012

 计算机科学鼻祖图灵把语言交流能力做为人工智能的终极目标,可见语言交流是人脑的最高级功能。在语言交流过程中,大脑时刻进行着大量的信息处理,最终把头脑中的思想通过语音或者文字形象表现出来。大脑的思维和输出的语言文字是同步的,大脑对语言输出过程的实时监控,确保我们的用词用句是合理和准确的。但是大脑并不能做到100%的准确,所以才有了口头交流的口误和写作过程中的笔误。
 
作家的文学功底、写作习惯和状态都会对笔误的频率和类型有影响。但是,在写作状态下,即大脑思维和文字同步的情况下,有些笔误类型,如同音别字(同音类)和形似别字(形似类)出现的频率要远远高于既不同音,也不形似的别字类型(反常类)。其中,不能形成有含义的词或者词组的反常类别字,比如把夸奖写成夸进,就更少见了。这是由于人类大脑基于读音、字形、和语义方面的特征识别字-词,当二个字的音、形和义相同或者接近是,人脑就容易把他们混淆起来,在写作过程中形成笔误。所以,在写作状态下,同音、形似类的笔误要远高于反常类的笔误,这个规律不受作家的文学功底、写作习惯和状态的影响。
 
 人类的语言和文字并不总是和大脑的思维同步,比如很多小学生在抄写课文的时候,大脑的思维并没有和他们所抄写的文字同步,大脑对词语的识别就会精度下降,反常类的笔误就会随之增多。所以,抄写本中同音、形似类的笔误并不会远高于反常类的笔误,这一点相信检查过自己孩子作业本的家长都会有所体会。根据小学生抄写时的认真程度,反常类笔误甚至可能高于同音、形似类的笔误。通过分析手稿的错误类型分布,我们有可能判断出一个手稿是创造稿还是誊写稿。
 
下面我们来看看《三重门》手稿中的错误类型。我根据@神算小鹤公布的《三重门》手稿笔误进行了如下分类统计,分类列表见附录:
 
 
从以上数据我们可以看出,《三重门》手稿的反常类笔误不但没有远小于同音类或者形似类,反而超过了这同音、形似类,甚至超过了同音和形似类的总和,说明《三重门》手稿不符和写作状态下的笔误类型分布,更符合抄写状态下的笔误类型分布。
结论:《三重门》手稿中的反常类笔误分布过高,更符合抄写过程产生的笔误类型分布,韩寒出版的《三重门》手稿应该是誊写稿而不是创作稿。
 
 
附录:《三重门》笔误分类列表:
 
(1)【同音类】--- 79
据多(居多),问题(问提),书藉(书籍),描准(瞄准)X2,扉红(绯红),一幅(一副),对(兑),恣色(姿色),不乱之舌(不烂之舌),留露(流露),振灾(赈灾),写到(写道),接到(接道),博斗(搏斗),决对(绝对),遥言(谣言),民义(名义),油烟酱醋(油盐酱醋),希奇(稀奇),光年记(光年计),在那头(在哪头),点播(点拨),夸讲(夸奖),祝兴(助兴),为邃(未遂),报道(报到)X2,试验楼(实验楼),篇篇(偏偏),凶像(凶相),沿续(延续),未扑先知(未卜先知),那带(那袋),会去(回去),苍促(仓促),重竖(重树),像这次(想这次),一婉(一碗),战势(战事),追辑(追缉),向(像),国民(国名),百蜜一疏(百密一疏),形势(形式),竖立(树立),纠出来(揪出来),脚根(脚跟),这么(怎么),背窝(被窝),说话吐(说话土),历害(厉害),不在(不再),这摊水(这滩水),失亲(思亲),冰摊(冰滩),倒脢(倒霉),播(拨),秘码(密码),一但(一旦),纸章(纸张)X2,被了前面(背了前面),年势已高(年事已高),探名(探明),仕气(士气),镇镜(镇静),赠恨(憎恨),涨进(长进),初通(粗通),精彩分程(精彩纷呈),其状X残(其状X惨),理直气足(理直气壮),慧X画涂(彗X画涂),薪近火传(薪尽火传),皇帝昏昭(皇帝昏诏),我独醒(我独清),满目沧桑(满脸沧桑),出人头地(投地)
 
(2)【形似类】 --- 36
拖问(施问),干山(千山),效游(郊游)X3,发懒(发嫩),有轶(有秩),阵年(陈年),例队(列队),一撒为二(一撕为二),拿到将(拿到奖),伦落入(沦落人),细看一篇(细看一遍),好几篇(好几遍),糟践(遭践),扒在(趴在),你给(给你),娇敖(骄傲),效县(郊县),效区(郊区)X2,渴酒(喝酒),稳稳约约(隐隐约约),裁客(载客),构(勾)X2,限不得(恨不得),乘乖地(乖乖地),选选超过(远远超过),幽黙(幽默),双体日(双休日),单体(单休),撒的粉碎(撕的粉碎),稳私(隐私),乘公(秉公),《准南子》(《淮南子》)
 
(3)【反常类】--- 115
城实(城市),金傁梅奖(金酸梅奖),胸月禁(胸襟),残遭(惨遭),其是(其实),自作主动(自作主张),领居(邻居),椅椅(桌椅),四两拔干片(四两拨千斤),难道像(难得像),适到好处(恰到好处),转声(转身),硬头发(硬着头皮),跳都来不及(逃都来不及),搬兵不动(按兵不动),吃相多了(吃香多了),硬着头发(硬着头皮),李敖(李X),雷X(累X),破着头发(硬着头皮),冷饭(冷饮),失身(失声),化了这么多钱(花了这么多钱),过度过用(作用),莫科科(莫斯科),到是(到时),主要(主意),伸级(升级),萨德萨(范德萨),隐憋(隐蔽),相信(相近),钓掉(钓到),这信(这封),夸进(夸奖),更加灵感(灵敏),清去(清白),光钱(光线),梯梯(楼梯),小镇下无敌(上无敌),英势(英姿),吓了一逃(吓了一跳),战是(战时),淆旅重叠(肴X重叠),伸后(伸舌),眼开(眼看),弊不住(憋不住),弊死(憋死),多县重点(够县重点),这此(这次),臂斗(劈头),内部(内容),如今(如此),依照(依旧),中蜂(中峰),后面一顿(后面一句),旁在一旁(站在一旁),可许(兴许),多吹(边吹),玩笑是(玩笑时),摄像方(摄像师),攀岸(攀岩),悟然悟出(突然悟出),一眼温暖(一股温暖),嘲讽一般(嘲讽一番),真实(其实),一眼绯红(一脸绯红),拍手称慢(拍手称快),通学生(走读生),口水慢(口水快),刘拜(刘邦),翻(播),回来是(回来时),精神面容(精神面貌),怎得(急得),残遭(惨遭),政教出(政教处),《篇锥篇》(《管锥编》)。胆勇(胆敢),都偷(都修),倍倍受瞩目(备受瞩目),众生不哗(众生大哗),录名(慕名),说一说完(话一说完),动动仪(地动仪),觅协(妥协),一脸为脸(一脸为难),层出不层(层出不穷),一个下晚(一个下午),精野无理(粗野无理),开以(可以),何置挂齿(何足挂齿),不歪于吧(不至于吧),拖威(施威),枪死(枪毙),windo(Windows),冷声(冷身),更残(更惨),雨果尝(雨果堂),这么这了(这么长时间了),不吃道(不知道),手脚笨掘(手脚笨拙),功亏一贯(功亏一篑),请敬标准(请假标准),柳扬顿挫(抑扬顿挫),没意记错(没有记错),置之身坏(置之身外),打水是(打水时),觉定(决定),腆腼(腼腆),糊模(模糊),表秒(秒表),赏欣(欣赏),眼睛(睛眼),听是(是听),监考二个(二个监考),你给(给你)
 
(4)【义混类】 -- 16
女朋友(男朋友),高中毕业(初中毕业),伙伴(伙计),据信(据说),跳高类(组),脚与身体(腿与身体),胜利(斗志),上课(上床),要(不要),抹到(抹掉),他(她),年月(个月),只要(只好),同学(同事),算不算(还不算),拔出来(爬出来),
 
(5)【名称类】 -- 10
梁天诚(梁子君),老k(飞哥),宋雄(余雄)X3,余雄(宋世平),余世平(宋世平)X2,宋世雄(余雄),高鄂(高鹗),《我的理想我的心》(《他的理想他的心》)
 
(6)【漏字类】 -- 55
面包(面包车),马德(马德堡)X 3,浓重的空(浓重的夜空),掉来(掉下来),这个脑子(这个人脑子),洗水(洗发水),人(骂人),史(历史),幸(荣幸),向来不起(向来看不起),缕(覼缕),望不边(望不到边),十围之(十则围之),翻(推翻),竟(毕竟),家教师(家庭教师),欲坠(摇摇欲坠),堂之(堂而皇之),淡泊利(淡泊名利),里个人(里有个人),不能(不能用),,势姿(姿势),第一会议(第一会议室),体事业(体育事业),不听出声(听不见出声),醒了大众(震醒了大众),点睡(早点睡),一步要(一步要抵),密秘(秘密),寝(寝室),宿(宿舍),洗脚的(洗脚的毛巾),质(素质),训练劳(训练疲劳),钱校(钱校长)X2,夏盛(盛夏),洲(欧洲),不能(不能把话),如状(如命状),年的(年代的),来不记(来不及记),这个(这个人),才两期(才两星期),续说(继续说),激不已(激动不已),考了格(考了及格),掉来(掉下来),津津味(津津有味),省略到(省略到掉),凿几洞(凿几个洞),才能(才把),不得快(不住的快)
 
(7)【助词类】--- 74 (来自@中财尚超)
 

分类: 

参与评分: 

平均评分: 5 (1个评价)

添加新评论

简单文本编辑

  • 自动将网址与电子邮件地址转变为链接。
  • 自动断行和分段。
Type the characters you see in this picture. (使用语音验证)
填入上图所示的数字或者单词;如果你看不清,点击保存按钮,系统会为您重新生成您新的图片。不区分大小写。