登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 物联网工程 > 正文

密文全文检索系统设计与实现毕业论文

 2021-03-23 21:58:17  

摘 要

信息化时代人类越来越重视数据交换与信息交流的安全性与隐私性,人们通常将文档加密以保护文档的机密性。在企业文档管理、云存储及隐私邮件等场景中,如何在保护信息和文档安全的同时快速有效的检索加密数据,已成为国内外学者的研究热点。本文在现有的明文全文检索的基础上,对密文索引的构造、索引相关分的处理、检索陷门的构造及检索结果的排序进行了一定研究,具体研究内容如下:

1)本文对倒排索引结构进行了研究,倒排索引直接用于密文检索会存在一系列安全问题,需要针对密文全文检索安全要求进行改造。本文去掉倒排索引中词频与逆文档频率等容易暴露密文内容的敏感信息,引入相关分来反映关键词与文档的相关程度,并对密文相关分采用Paillier算法加密,防止针对相关分的统计攻击。

2)密文索引中的关键词加密后失去语义性,给密文检索带来困难,为了提高密文索引检索效率,本文在密文倒排索引上建立hash表,利用散列值实现检索关键词的快速定位,提高密文索引检索效率。此外,本文在客户端通过散列值构造关键词查询陷门,并通过引入随机关键词掩藏查询关键词的词频,从而避免根据关键字频率猜测用户查询的内容,有效的保护用户查询隐私。

3)用户的检索结果需要根据相关性排序,将最相关的文档发给用户。本文的密文全文检索方法,相关分排序的主要计算工作由服务器完成,充分利用服务器的计算资源优势,减轻客户端计算负担,有利于资源受限的移动设备实现对密文文档的全文检索。

基于上述研究,本文实现了基于hash函数的密文全文检索原型系统。该系统部署在Tomcat服务器上,可以实现密文索引构建、随机关键词查询陷门生成、检索结果排序功能。通过实验测试,系统稳定性良好,检索效率较高。

关键词:倒排索引;相关分;查询陷门;排序检索

Abstract

In the information age, human beings pay more and more attention to the security and privacy of data exchange. People usually encrypt documents to achieve the purpose of protecting documents’ privacy. In the enterprise documents management, cloud storage and privacy mail and other scenes , it has become a hot topic of domestic and foreign scholars that how to protect the security of information and document at the same time retrieve encrypted data quickly and effectively. On the basis of the existing full-text retrieval, this paper studies the construction of ciphertext index, the processing of index relevance score, the construction of search trapdoors and the sorting of search results. The specific research contents are as follows:

1) In this paper, the inverted index structure is studied. There are a series of security problems if the inverted index is just used for the retrieval of ciphertext. In this paper, we delete sensitive information about the content of ciphertext in the inverted index and the frequency of the reverse document, and introduce the relevance score to reflect the degree of correlation between the keyword and the document, and use the Paillier algorithm to encrypt the ciphertext to resist statistical attack.

2) The keywords in the index of ciphertext lose the semantics after encryption, which brings difficulties to the retrieval of ciphertext. In order to improve the efficiency of index retrieval of ciphertext, this paper builds a hash table on the index of ciphertext, and uses the hash value to realize the fast positioning of the query keywords and improve the efficiency of index retrieval of ciphertext. In addition, this paper constructs the keywords in the client through the hash value, and the word frequency of the query keywords is hidesd by introducing the random keywords, so as to avoid guessing the content of the user query according to the keyword frequency and effectively protect the user query privacy.

3) The users’ query results need to be sorted according to relevance so as to ensure users get the most relevant documents. In this paper, the main calculation work of the relevant sub-sorting is done by the server.it can make full use of the server's computing resources while reducing the burden on the client, which facilitates full-text retrieval of ciphertext documents on resource-constrained mobile devices.

Based on the above research, this paper realizes the full-text retrieval system of ciphertext based on hash function. The system is deployed on the Tomcat server, which can implement index construction of ciphertext, query trapdoor generation based on random keyword and retrieval result sorting function. Through the experimental test, the system stability is good, the retrieval efficiency is higher.

Keywords: Inverted Index; Relevance Score; Query Trapdoor;Ranked Retrieval

目 录

第1章 绪论 1

1.1 研究背景及意义 1

1.2 国内外研究现状 1

1.3 研究内容 2

1.4 论文章节安排 3

第2章 密文倒排索引构建 4

2.1 明文倒排索引 4

2.2 明文倒排索引安全问题及改进 6

2.2.1 明文倒排索引存在的问题 6

2.2.2 明文倒排索改进 6

2.3 密文倒排索引构建 6

2.3.1 密文相关分 7

2.3.2 密文倒排索引 8

2.3.3 基于hash函数的密文安全索引 10

第3章 密文索引检索 12

3.1 基于随机关键词的安全陷门 12

3.2 密文索引检索 13

3.3 检索结果排序 14

第4章 原型系统设计与实现 16

4.1 实验环境 16

4.2 系统设计与实现 16

4.2.1 系统功能模块设计 17

4.2.2 系统功能模块实现 20

4.3 系统测试 24

4.3.1 查询陷门安全性能分析 24

4.3.2 检索效率测试 26

第5章 总结与展望 28

5.1 论文及开发总结 28

5.2 未来展望 28

参考文献 30

致谢 31

第1章 绪论

1.1 研究背景及意义

随着信息数字化的步伐不断迈进,人们对信息交流的需求不断扩大,对信息或文档的检索效率和信息安全提出了更高的要求。而这类需求在实际生活场景中处处可见:在企业信息管理中,既要求企业内部人员获得一致的信息和文档,又要求文档信息不会泄露给外部人员;在云存储系统中,既要求保证用户快速检索到需要的文档,又要求保证文档信息不会泄露给云存储服务器;在邮件系统中,既要求实现用户快速查找到指定邮件,又要求邮件信息不会泄露给邮件服务器。这类“双重”需求正是人们对信息检索效率性与安全性的诉求,而在实际运用中,这种诉求往往未能完全如愿。

以云存储为例,云存储在给用户提供便利服务的同时,也存在不可避免的弊端,客户的文件会部分甚至全部的暴露给并不能完全信任的云服务器,并且极有可能造成用户数据的泄露,从而很难保证用户文件及信息的安全性。为了保证文档与信息的安全性,用户一般不会直接将文档放在服务器端存储,而是先通过本地数据加密,然后再把加密后的文档与信息上传到服务器,这种方法在一定程度上保证了数据的安全性。但是随着用户存储在服务器上的加密数据逐渐增多,密文文档的检索与定位就变为一个棘手的问题,加密后的文档失去语义性,用户为了获得需要的文档,不得不将全部文档下载后再本地解密检索,这无疑是繁琐且效率低下的方法。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图