相似案件智能检索方法研究开题报告
2020-02-18 19:33:13
1. 研究目的与意义(文献综述)
1.1目的及意义
在网络的海量空间中,法律信息资源占有重要的一席之地。各种法律文书,如诉状,协议,判决书等,是经济活动,审判工作,诉讼行为中不可缺少的文本,有其固定的格式。大部分的律师,尤其是诉讼律师,都会在办理实际案例的过程中,通过检索裁判文书来为自己当下办理的案件提供办案思路。然而,案例检索是一项繁杂,系统而且往往非常耗时的工作,要在数以千万计的裁判文书中找到真正想要了解的内容,并非一件容易的事情。因此,如何在保持精度的情况下快速检索相似法律文书,获取对应判决,是一项值得探讨的问题。
文档相似度计算是法律案例检索的一个重要环节,旨在比较文档对的相似程度。对文档相似度计算的研究可以应用到很多自然语言处理任务中,例如信息检索,机器翻译,自动问答,复述问题以及对话系统等。在一定程度上,这些自然语言处理任务都可以抽象为文档相似度计算问题。例如,信息检索可以归结为查询项与数据库中文档的相似度计算问题。
2. 研究的基本内容与方案
2.1基本内容
(1)使用相似度计算策略来计算短文本在每种策略下的相似度值,然后通过相似度融合策略融合在各种相似度策略下的相似度值,接着对这些值进行排序得到top-k 的列表,最后根据需要对这些列表进行筛选选取需要的k 个法律文书。
(2)采用传统的文本相似度计算策略和融合深度学习的法律文书的相似度计算策略,在要求保持较高精度的模式下,选取具有最高精度的相似度计算模型,此通用框架能较好的结合各类相似度计算策略以及考虑整体的高精度。
(3)对于一个待检索法律文书及获取的top-k相似法律文书,计算裁决相似度,对于相似法律文书,若裁决得分低于阈值,进行预警。
2.2目标
3. 研究计划与安排
(1)2019/1/14—2019/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;
(2)2019/3/1—2019/4/30:系统架构、程序设计与开发、系统测试与完善;
(3)2019/5/1—2019/5/25:撰写及修改毕业论文;
4. 参考文献(12篇以上)
[1]. li l, zhou j, guy, et al. similar legal case retrieval based on improved siamese network[j].beijing da xue xue bao, 2019, 55(1): 84-90.
[2]. he h, gimpel k,lin j. multi-perspective sentence similarity modeling with convolutional neuralnetworks[c]//proceedings of the 2015 conference on empirical methods in naturallanguage processing. 2015: 1576-1586.
[3]. ying-long ma. asemantic driven approach base on graph long short-term memory model forlearning and classification of judicial documents[j]. journal of computerapplications, 0, (): 0-0.