来源:《语言文字应用》1997年第01期  作者:黄居仁,陈克健,陈凤仪,魏文真,张丽丽
选择字号

《资讯处理用中文分词规范》设计理念及规范内容

收藏本文  分享

《资讯处理用中文分词规范》有下列两个突破:(1)提出分级的观念及确立信、达、雅三级的标准。最容易达到的信级订为基本资料交换的标准;技术上较难,但自动分词程式仍可达到的达级作自动翻译、资讯检索等自然语言处理的标准;至于最需要人工分词才能达到的雅级则视为电脑处理、理解中文之最高目标。(2)把分词规范分成不变核心(分词单位定义及基本原则),以及可变准则(辅助原则)。在确定分词规范架构后,只要定时更新基本词库或特殊领域的专门词库,便可维持分词规范的不变性(本文共计9页)......[继续阅读本文]

下载阅读本文订阅本刊

图书推荐

    相关文章推荐

    看看这些杂志对你有没有帮助...

    更多杂志>>