Andriod平台语音搜索和相关服务功能的开发毕业论文

2021-04-05 18:53:41

摘要

21世纪是人工智能的时代，随着移动终端设备的普及以及语音技术的成熟，语音助手的出现重塑了人机交互的方式。相比于传统的触摸点击控制交互方式用户可以使用语音与直接与机器打交道，效率大有提升。不同于冷冰冰的机器，以深度学习为支撑的语音助手还可以与用户展开智能问答不失为生活中的好帮手。

课题主要针对残疾人群来进行Android平台语音交互方案设计开发，考虑到残疾人群（主要是视障人群）的特殊性语音指令简单，操作简便好上手，系统基于科大讯飞语音服务平台通过讯飞语音云进行语音识别，将用户语音指令识别转换为文字再由任务调度模块对语音进行场景判断匹配完成相关操作，再根据具体业务的要求使用语音合成对业务进行播报。

论文依照软件开发的流程，从语音助手需求分析到系统设计以及软件业务功能模块的实现方法和各个模块之间的任务调度到最后的软件调试进行了详细的阐述，同时也对于当下的语音技术进行了简略的分析。

经过多次测试该语音系统在安卓机器上运行流畅，语音识别准确，功能多样化，智能问答趣味性高，具有较强的可用性。

关键词：语音助手；安卓开发；讯飞云平台；残障人士

Abstract

The 21st century is an era of artificial intelligence. With the popularity of mobile terminal devices and the maturity of voice technology, the emergence of voice assistants has reshaped the way of human-computer interaction. Compared with the traditional touch-click control interaction mode, users can use voice and directly interact with the machine, which greatly improves the efficiency. Unlike the cold-blooded machine, the voice assistant supported by deep learning can also be used as a good helper in life.

The project focuses on the design and development of the Android platform voice interaction scheme for the disabled group. Considering the special voice command of the disabled group (mainly the visually impaired people) is simple and easy to operate, the system is based on the voice broadcast platform of the University of Science and Technology. The cloud performs voice recognition, converts the user voice command recognition into text, and then the task scheduling module performs the scene judgment and matching on the voice to complete the related operations, and then uses the voice synthesis to broadcast the service according to the requirements of the specific service.

According to the software development process, the paper elaborates from the voice assistant requirement analysis to the system design and the implementation method of the software business function module and the task scheduling between the modules to the final software debugging, and also carries out the current voice technology.

After many tests, the voice system runs smoothly on the Android machine, the voice recognition is accurate, the functions are diversified, the intelligent question and answer is highly interesting, and the usability is strong.

Key Words： Voice Assistant; Android Development; Xunfei Cloud Platform; People with Disabilities

第1章绪论

1.1课题研究背景意义

1.2课题国内外研究现状

1.3论文研究内容

第2章系统需求分析及技术简介

2.1需求分析

2.2语音技术简介

2.2.1语音识别技术

2.2.2语音合成技术

第3章系统设计

3.1 系统数据流图

3.2系统功能模块

3.3系统流程设计

3.3.1拨打电话

3.3.2发送短信

3.3.3打开手机应用

3.3.4网页搜索

3.3.5智能问答

3.4界面设计

3.4.1主界面设计

3.4.2帮助界面设计

第4章系统实现和测试

4.1讯飞两个模块算法设计与实现

4.1.1语音语义理解模块设计与实现

4.1.2语音合成模块设计与实现

4.2主要功能算法设计与实现

4.2.1拨打电话功能的设计与实现

4.2.2发送短信功能的设计与实现

4.2.3打开应用功能的设计与实现

4.2.4网页搜索功能的设计与实现

4.2.5百科问答功能的设计与实现

4.2.6聊天功能的设计与实现

4.3系统测试

第5章总结

参考文献

致谢

第1章绪论

1.1课题研究背景意义

随着电子产品的普及和计算机科学的发展手机已经成为了大众必不可少的工具。人工智能在互联网产业高度发达的背景下逐渐进入了我们的日常生活，受到科技水平的限制当个人电脑刚被发明的时候用户往往只能通过键盘使用命令行来与电脑进行交互，随着施乐的图形化界面和屏幕二维定位操作输入技术的成熟衍生了鼠标键盘交互模式这种模式延续至今广为应用，2007年前后的手机已经完全超越通讯工具的范畴而变成了个人智能终端设备触控交互模式大大提高了终端设备的易用性，现如今我们已经可以用语音代替触控与机器交互谷歌的GoogleNow、苹果的siri、微软的cortana等已经取得了商业上的成功，新的人机交互模型正在构建，借助语音技术信息的输入输出突破了实体屏幕的限制，延伸了我们的不够完美的躯体。截至2015年全球73.3亿人口约有3600万人失明（粗患病率为0.48%），超2.16亿人有中、重度视力障碍（粗患病率为2.95%）^[1]。残障人士属于社会弱势群体，融入信息社会有一定的困难，我们应当在产品研发中充分考虑到他们的需求使用科技成果让他们也进入信息化生活，达到信息无障碍。信息无障碍是指任何人 ( 无论健全人士还是残障人士、年轻人还是老年人) 在任何情况下都能平等、方便、无障碍地获取和利用信息）的程度^[2]。突破生理上的限制，自由便捷的享用科技成果。随着语音技术的成熟比如语音合成，语音识别技术，用户可以利用它们直接和机器交互就像和人打交道一样直接、自然。从用户使用场景出发，改善安卓语音助手的功能设计，提高其易用性，充分关注残疾人的使用需求，增强它们的自主能力，将原本处于信息化边缘的他们带入社会的主流当中来。在我们的日常生活中以及不久将来的物联网时代，语音作为人类获取信息以及表达信息最自然、便捷的方式之一，使用频率也会越来越高，传统的交互已经无法满足人们现代化的需求。

1.2课题国内外研究现状

语音识别技术以及智能化技术，是语音助手中的主要应用技术。语音识别技术诞生于20世纪50年代，识别对象词汇量较少，且词汇量相对孤立分散，通常利用匹配关键词的方法来完成较为简单的命令操作。主要标志是ATamp;T贝尔实验室开发的名叫Audrey的语音识别系统^[3] 。在20世纪80年代，语音识别和自然语言处理技术取得了很大进展，研究智能语音技术从传统的标准模板匹配技术改为统计基于模型的技术。Shortlie提出MYCIN系统就应用了此技术^[4] 。基于知识库的专家研究系统可以完成自然语言的理解以及回复生成任务。20世纪90年代到21世纪初期智能语音技术由研究走向实用并投入产业化。以IBM推出的ViaVoice为重要标志，此后智能语音的重点已转向为识别装置中的自然语言处理部分。2011年，由IBM公司构建的智能问答系统Watson在问答比赛中获胜超过了人类冠军选手^[5] 。以苹果siri的发布为首个引爆点，亚马逊 Alexa 、Google Assistant、微软 Cortana等智能语音产品相继问世占领各自的市场，并纷纷扩张进军移动互联网行业。同时较大的国内互联网公司也积极规划语音市场，以BAT为代表的国内互联网巨头当前主流的语音助手都支持语音识别、语义分析、自然语音合成和语音合成等功能语音识别率都超过 90%^[6]。用户的语音习惯各有不同，无论是语音语调还是用语习惯，然而目前的语音识别系统构成大多类似个性识别识别率不足。讯飞云导入了很多地方方言语音语料库，做到了个性化识别识别，识别准确度也有一定提升。

1.3论文研究内容

您需要先支付 80元 才能查看全部内容！立即支付

注册

找回密码