注册 登录 进入教材巡展
#

出版时间:2015年5月

出版社:中国社会科学出版社

以下为《术语学与术语信息处理》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 中国社会科学出版社
  • 9787516160916
  • 57100
  • 2015年5月
  • 未分类
  • 未分类
  • H083
内容简介

  信息时代对术语学研究提出新的要求,张榕著的《术语学与术语信息处理》从知识发现的视角对术语界定进行论证;提出面向大规模文本的术语定义的抽取、术语定义的领域聚类以及术语识别的方法。

目录

第一章 引论


 第一节 本研究提出的背景


  一 术语定义自动抽取的必要性


  二 术语定义的聚类的意义


  三 术语识别的意义


 第二节 国内外研究现状


  一 术语定义抽取的研究现状


  二 句子聚类的国内外研究


  三 术语识别的研究现状


 第三节 术语学介绍


  一 什么是术语学


  二 术语学的发展简介


  三 术语学的主要流派


  四 我国的术语学研究


  五 术语数据库


  六 术语概念的唯一性与术语定义的多样性


  七 术语与普通词语


  八 术语的跨语言借用


  九 新术语与旧术语在定义出现概率上的区别


  十 术语的语缀


  十一 一些基本概念


 第四节 术语与术语定义的界定


  一 术语的界定


  二 术语定义的界定


第二章 术语定义的抽取研究


 第一节 候选术语定义的规则匹配


  一 文本下载


  二 文本的预处理


  三 文本的分词


  四 候选术语定义的模板匹配


 第二节 基于统计方法的术语定义抽取


  一 词语的定义隶属度


  二 句子的定义隶属度


  三 句子的定义隶属度实验结果


 第三节 向量空间距离计算


  一 向量空间模型介绍


  二 向量空间模型的引用


  三 向量空间模型实验结果示例


 第四节 隶属度计算和向量空间模型的结合


 第五节 术语定义抽取系统结构与实验结果


 第六节 实验结果评价


  一 网络文本结构的多样性因素


  二 语言表达形式的多样性因素


  三 分词的因素


  四 网络文本的可靠性因素


  五 搜索引擎准确率的因素


  六 算法的因素


 第七节 术语定义形式的多样性


  一 传统意义上的定义形式


  二 下定义的要求


  三 术语定义形式的多样性


 第八节 本章小结


第三章 术语定义的聚类研究


 第一节 术语定义聚类的必要性


 第二节 聚类综述


  一 聚类与聚类分析


  二 分类与聚类


  三 硬聚类和软聚类


  四 层级聚类与诽:层级聚类


 第三节 本研究采用的聚类方法


  一 聚类步骤


  二 相似度的界定和属性的选取


  三 《知网》介绍


 第四节 术语定义的领域聚类


  一 句子相似度计算


  二 词语的相似度计算


  三 术语定义领域聚类的停用词表的建立


  四 聚类特征的选取


 第五节 术语定义聚类的结果及分析


  一 领域聚类的判定复杂性


  二 聚类相似度阈值的设定


  三 《知网》知识库在领域聚类中的优点与局限性


  四 聚类结果的错误分析


第四章 术语自动识别研究


 第一节 术语缺乏位置信息


 第二节 术语的抽取


  一 术语的语言学特征


  二 术语的粗抽取


  三 术语边界的确定


  四 术语的词性过滤


  五 术语词性序列的统计


 第三节 候选术语的统计特征


  一 术语的用词长度特征


  二 候选术语的长度与词频计算


  三 候选术语的最后得分


 第四节 过滤词表的构建


  一 术语识别过滤词表构建的必要性


  二 过滤词表的构建


 第五节 术语识别系统结构与实验结果


 第六节 实验结果分析


  一 定义匹配模板的局限性


  二 句子定义隶属度过低


  三 其他情况


 第七节 本章小结


第五章 结束语


附录


 附录一 《人民日报》用词与术语定义用词对比


 附录二 词语的定义隶属度


 附录三 术语定义抽取的分步骤结果示例


 附录四 术语的词性序列


 附录五 术语抽取结果


 附录六 术语定义聚类的部分结果


 附录七 术语定义聚类程序示例


参考文献


致谢