基于双向循环神经网络与CRF模型下的NER研究任务书
2020-02-18 15:30:37
1. 毕业设计(论文)主要内容:
近年来,基于神经网络的深度学习方法在自然语言处理领域已经取得了不少进展。作为NLP领域的基础任务—命名实体识别也不例外,神经网络结构在NER中也取得了不错的效果。命名实体识别(Named Entity Recognition,NER)就是从一段自然语言文本中找出相关实体,并标注出其位置以及类型。本课题拟设计一个双向循环神经网络与CRF模型完成NER研究,该模型继承了深度学习方法的优点,无需大量人工特征,在一些并没有被标注的数据领域,可以参考用迁移学习和半监督学习,这里可以参考最新的双向神经网络(Bi-RNN)语言模型进行训练,在精度上也有了相应的提升。
2. 毕业设计(论文)主要任务及要求
(1)查阅相关文献资料15篇以上(其中近5年外文文献不少于3篇)。
(2)完成开题报告及任务书。
(3)使用卷积神经网络与crf模型相结合的cnn-crf模型进行命名实体识别(ner)。
3. 毕业设计(论文)完成任务的计划与安排
(1)第1-4周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。
(2)第5-6周:熟悉掌握基本理论,完成英文资料的翻译,熟悉相关工具软件的使用。
(3)第7-9周:实现双向循环神经网络与crf模型。
4. 主要参考文献
[1] lample g, ballesteros m,subramanian s, et al. neural architectures for named entity recognition[j].2016.
[2] santos c n d, guimaratilde;es v.boosting named entity recognition with neural character embeddings[j]. computerscience, 2015.
[3] peters m e , ammar w ,bhagavatula c , et al. semi-supervised sequence tagging with bidirectionallanguage models[j]. 2017.