基于双向循环神经网络与CRF模型下的NER研究开题报告
2020-02-18 18:26:33
1. 研究目的与意义(文献综述)
1.1 研究目的及意义
命名实体识别(named entities recognition, ner)是自然语言处理(natural language processing, nlp)的一个基础任务,其目的是识别语料中人名、地名、组织机构名等命名实体,在所有涉及nlp的人工智能研究中——譬如智能客服——都是一个必须首先攻克的任务。由于这些命名实体数量不断增加,通常不可能在词典中穷尽列出,且其构成方法具有各自的一些规律性,因而,通常把对这些词的识别从词汇形态处理(如汉语切分)任务中独立处理,称为命名实体识别。
2. 研究的基本内容与方案
评判一个命名实体是否被正确识别包括两个方面:
(1)实体的边界是否正确;
(2)实体的类型是否标注正确。
3. 研究计划与安排
第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。
第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。
4. 参考文献(12篇以上)
[1]张海楠, 伍大勇, 刘悦,等. 基于深度神经网络的中文命名实体识别[j]. 中文信息学报, 2017, 31(4):28-35.
[2]王红斌, 沈强, 线岩团. 融合迁移学习的中文命名实体识别[j]. 小型微型计算机系统, 2017, 38(2):346-351.
[3]朱丹浩, 杨蕾, 王东波. 基于深度学习的中文机构名识别研究——一种汉字级别的循环神经网络方法[j]. 数据分析与知识发现, 2017, 32(12): 36-43.