基于两位一体的中文电子病历命名实体识别
摘要:
命名实体识别是信息抽取中的一项重要任务.在医疗研究领域,从电子病历中自动识别命名实体形成结构化的文本为医疗决策提供数据支持,已经成为重要的研究课题.分词和实体识别分步进行容易造成下层错误向上累加传递且不能充分利用融合信息.针对这一问题,本文提出一种两位一体字标注方法,该方法将识别过程看做是序列的字标注过程,采用条件随机场模型经过标注实现病历的命名实体识别.实验结果表明,两位一体字标注方法在命名实体识别中性能得到很大的提升.
-
doi:
-
关键词:
命名实体识别
信息抽取
两位一体
字标注
条件随机场
-
Keyword:
Named entity recognition
Information extraction
Binity
Character_based tagging
Conditions random field model
-
作者:
郁小玲
张铁山
吴彤
方明哲
黄建一
胡长军
-
Author:
Yu Xiaoling
Zhang Tieshan
Wu Tong
Fang Mingzhe
Huang Jianyi
Hu Changjun
-
作者单位:
-
刊名:
中国卫生信息管理杂志
-
Journal:
-
年,卷(期):
-
所属期刊栏目:
-
基金项目
-
在线出版日期:
-
页码: