| 网站首页 | 范文 | 演讲致词 | 汇报体会 | 总结报告 | 公文方案 | 领导讲话 | 党建工会 | 论文 | 文档 | 
您现在的位置: 范文大全网 >> 论文 >> 今日更新 >> 正文 用户登录 新用户注册
语料库语言学与壮语语料库的建设           
语料库语言学与壮语语料库的建设
  其次,以书面语料为主,其他形式的语料为辅。壮语书面语常见于壮语出版物,如《三月三》期刊和一些壮语教材。口语则应以武鸣壮语为准,主要搜集该地区的壮语语音材料。
  再次,要注意语体、文体差别。语言的语音、词汇、语法、修辞在不同的语体、文体中会有不同的表现,因而在建库时可以根据一定的语体或文体构建不同的语料库,这样才便于发现语言运用的规律性问题。从现在的一些研究看,一些学者开始注意到运用不同语体的文献进行以语料库语言学理论为基本指导思想的汉语言研究,这是一个可喜的变化。如果可以,我们也可以根据一定的语体或文体构建不同的壮语语料库,如壮语方言语料库,壮语新闻用语语料库等。

中国论文联盟*编辑。

最后,壮语的各方言语料库要求能统筹兼顾,最后能够嫁接在一起方便使用。建设壮语方言语料库,“小作坊”式的语料库容易造成重复建设,浪费大量的人力、物力和财力,也不利于语料库的建设和使用。壮语方言语料库应该是一种公益性的成果,应成为语言工作者无偿献给社会的公共财产。不仅语言工作者可以方便使用,社会各界、中外语言学习者都可以从中受益。这样,语料库才能够发挥其应有的作用,收到深远的社会效益。
  2.壮语语料库的附码标注
  语料标注可实现语料机读化,可提高语料的利用价值。标注就是对语料库中的原始语料进行加工,把各种表示语言特征的附码标注在相应的语言成分上,以便于计算机的识读。语料库的附码标注要遵循一定的原则,有可参考的标注模式。
  (1)壮语语料库可遵循的附码标注原则
  英国著名语言学家Leech是当今语料库语言学的代表人物之一,他(1993)认为语料的标注应该遵循以下几个基本原则。
  第一,标注附码可删除,可恢复到原始语料。语料的标注总是带有一定的目的性,语料库用于不同目的,可能就需要采取不同的标注方法。可删除标注附码的语料若用于其他用途时,可重新进行标注。
  第二,标注可以单独抽出,另外储存。这一原则实际上与第一条原则基本一致,目的是让语料库中语料的标注能够最大限度地增强语料使用的灵活性。
  第三,语料的最终使用者应该清楚标注的原则和附码的意义。
  第四,在语料的使用和说明文件中,应说明标注者和标注所使用的方法。
  第五,应

上一页  [1] [2] [3] [4] [5] [6] [7] 下一页

  • 上一个论文:

  • 下一个论文:
  • 推荐文章
    关于地方高校数字图书馆区域