登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 软件工程 > 正文

基于GCN的人脸聚类方法研究毕业论文

 2021-10-24 15:40:19  

摘 要

本论文基于已有算法的基础上进行算法的复现,同时实现传统的聚类算法来与之进行对比。运用深度学习,图卷积网络来实现算法,运用人脸识别,数据清理等技术来进行效果的对比,在试验中分析模型中的参数,结构对效率的影响。本论文算法一种利用上下文信息构建局部结构,并且具有可拓展性的方法,通过构建局部结构来解决聚类问题中各点之间连接的可能性问题。利用常用的标准人脸数据集,通过在该算法和传统聚类上应用,比对表现出基于图卷积网络的聚类方法的领先性,体现在算法对数据集的特征分布没有要求。通过对两种基于GCN的聚类算法进行比对,也可以发现,图卷积在聚类问题上的不同应用方法。最后作者还利用算法中单粒子簇的出现,将其应用到数据清洗上更加体现了算法的实用性,在探索中发现算法可以扩展到多数据源的版本,同时能够提高聚类的精度

关键词:人脸聚类;图卷积神经网络;数据清洗;人脸识别

Abstract

This paper is based on the existing algorithm to reproduce the algorithm, and compared with other related clustering algorithms. It uses deep learning, graph convolution network to realize the algorithm, uses face recognition, data cleaning and other technologies to compare the effect, and analyzes the influence of parameters and structure in the model on efficiency in the experiment. In this paper, the algorithm uses the context information to build a local structure, and has the expansibility. By building a local structure, we can solve the possibility of the connection between the points in the clustering problem. Using the common standard face data set, through the application of the algorithm and the traditional clustering, the comparison shows that the clustering method based on the graph convolution network is leading, which shows that the algorithm does not require the feature distribution of the data set. By comparing two clustering algorithms based on GCN, we can also find that convolutional neural network has different ideas and solutions in dealing with clustering problems. At last, the author uses the appearance of single particle cluster in the algorithm to apply it to data cleaning, which shows the practicability of the algorithm. In the exploration, it is found that the algorithm can be extended to the version of multiple data sources, and at the same time, it can improve the accuracy of clustering.

Key Words: Face Clustering; Graph Convolution Neural Network; Data Cleaning; Face Recognition

目 录

摘要 3

Abstract 4

1 绪论 3

1.1 目的及意义 3

1.2 研究现状 4

1.2.1人脸检测技术 4

1.2.2人脸聚类技术 4

1.3.1 研究内容 5

1.3.2 技术方案 6

2 实验数据准备 7

2.1 人脸表示模型 7

2.2 训练数据集选择 7

2.3 数据预处理 8

3 基于GCN的人脸聚类算法 8

3.1 基于GCN构建IPS的人脸聚类算法 8

3.1.1算法概述 8

3.1.2 构建局部结构IPS 9

3.1.3 基于GCN的卷积操作 10

3.1.4 获得聚类 11

3.1.5 参数设定 11

3.2 基于GCN-DGCN-S的人脸聚类算法 11

3.2.1 算法概述 11

3.2.2 关联图生成 12

3.2.3 候选簇的生成 12

3.2.4 GCN-D的构建 13

3.2.5 噪声点处理 14

4 实现结果 15

4.1 聚类效果展示 15

4.2 基于IPS的算法与常用聚类算法对比 15

4.3 基于GCN的聚类算法比较 16

4.4 基于GCN人脸聚类方法的应用 16

5 总结与展望 17

6 致谢 18

7 参考文献 18

1 绪论

1.1 目的及意义

社会和科技技术的高速化发展,让人们逐渐对高智能化,高安全化有了更大的需求。正是因为人们对智能化的追求促进了研究员对相关技术探索研究的动力。其中人脸识别在这条科学的探索路上越来越展示出其重要性。人脸识别技术的发展之快让其被应用于社会中的很多方面。例如,利用城市安保中的摄像头采集人脸影像资料来进行罪犯的搜寻、家用防盗门利用人脸来进行识别是否为可进入的人员等等。这些高精度的应用对数据集的规模以及注释程度有着较高的要求。

人脸识别所需要的数据集越来越大,人工注释的成本也会随之增长,所以我们该如何在大规模数据集的条件下还尽可能的降低注释成本,同时还要实现高精度的人脸识别是一个必须面对和解决的问题。现如今通过网络可以获得大规模的人脸图像数据,但是不论是对于公司还是个人,对每一张照片都进行注释后再加以应用肯定是不现实的。因此利用无标记的人脸数据进行训练成为了一个必然的趋势和选择,可以说监督学习正在逐步向无监督学习方向发展。有一种方法提供了解决思路,伪标签(Pseudo-Labelling)。它其本质可以理解为使用已经标注了的数据去训练模型然后再反过来利用模型去预测没有标注的数据集是属于哪一类。其本质上是一种半监督学习,并不能做到无监督学习。所以这种方法确实可以解决一些标注成本上的问题,但是仍然有一些问题出现在其中使其没有达到我们所期望的那样。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图