基于词性信息的汉语时间语词消歧算法
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP391

基金项目:

国家自然科学基金


Statistical Approach Based on POS for Chinese Time Word Disambiguity
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    切分歧义是影响汉语自动分词系统精度的一个重要因素.时间语词包括指明事件发生确定时间位置的时点时间词和指明动作或状态持续一段时间的时段时间词.基于现代汉语语料库加工规范,特定类型的时间语词存在切分歧义及考察时间语词的语用,提出了基于时间语词上下文词性信息的统计语言模型和基于极大似然原理的消解这类歧义的算法,其开放测试正确率约为90%.

    Abstract:

    Segmentation Ambiguity is an important factor influencing accuracy of Chinese auto-segmentation system. Time words include expressions both indicating exact time positions and those scattering in a treriod of time. On the foundations of modern Chinese corpus processing principles and certain type time word segmentation ambiguity, this paper proposes problem, a statistical language model and corresponding approach based on maximum likelihood to solve the ambiguous and it reaches a 90% accuracy which shows the effectiveness of the algorithm.

    参考文献
    相似文献
    引证文献
引用本文

代建英,何中市.基于词性信息的汉语时间语词消歧算法[J].重庆大学学报,2005,28(9):53-56.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2005-02-24
  • 最后修改日期:2005-02-24
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
文章二维码