您的位置:杂志 > 《福建电脑》 > 2015年 > 第05期
来源:《福建电脑》2015年第05期  作者:李春雨;
选择字号

通过对机构名称简化从而进行程序去重的方法

收藏本文  分享

相同机构不同人填写时,机构名称经常会出现不一致,会对数据的统计以及后续分析指数造成较大偏差,为了减少偏差研究开发了去重处理方法。在拥有相应常见机构名称基本部件词表和机构称呼词及简称对照词表后,尝试通过程序对中文机构名称识别过程中发现机构名的组成部件序列模式与文献中描述的序列模式并不完全一致。采用新的序列方式来制作简称。通过末尾层简称、末尾层全称、全简称、全称四种模式同时与地区结合判断的方法去重。(本文共计3页)......[继续阅读本文]

下载阅读本文订阅本刊

图书推荐

    相关文章推荐

    看看这些杂志对你有没有帮助...

    更多杂志>>