Andriod平台语音搜索和相关服务功能的开发开题报告
2020-02-20 07:17:42
1. 研究目的与意义(文献综述)
随着电子产品的普及和计算机科学的发展手机已经成为了大众必不可少的工具。截至2015年全球73.3亿人口约有3600万人失明(粗患病率为0.48%),超2.16亿人有中、重度视力障碍(粗患病率为2.95%)(1)残障人士属于社会弱势群体,融入信息社会有一定的困难,我们应当在产品研发中充分考虑到他们的需求利用科技手段提升残障人士的信息无障碍(信息无障碍是指任何人 ( 无论健全人士还是残障人士、年轻人还是老年人) 在任何情况下都能平等、方便、无障碍地获取和利用信息)的程度(2)使其突破生理局限,自由便捷的享用科技成果。语音识别以及语音合成等技术的出现可以使人们与机器之间的沟通像人与人沟通一样简单。安卓语音助手的产品设计和改善,蕴含了对残疾人的关爱,提高了他们生活自立的能力,使他们从社会的边缘地带回归到主流社会中来。
2011 年 10 月“Siri”随着ios新版本发布问世。语音助手这一概念第一次展现在大众面前继而引爆了语音交互技术的热潮,截至 2013 年一季度,语音交互功能已经逐渐成为智能手机的标配。百度、搜狗、360 等各大互联网巨头也纷纷推出自己的语音类应用。2012年,一大波中文语音助手相继发布 比如讯飞语点、智能360和虫洞语音助手。2014年微软发布了Cortana,并在7月底推出了中文版,Cortana带来了Proactive的概念,也更加人性化,更加智能,持续的更新也提供了更多的实用功能,给语音助手带来的新的活力。
2. 研究的基本内容与方案
主要内容为:进行app需求分析,原型图设计,开发app并集成科大讯飞msc(mobile speech client,移动语音终端)android版sdk,进行调试。
科大讯飞mscandroid版sdk集成了语音听写、语音识别、语音合成、语义理解、语音评测等功能,利用科大讯飞提供的语音sdk,可以进行语音唤醒手机,语音快捷启动app,朗读文本信息等功能。
语音唤醒指的是:通过辨别输入的音频中特定的词语(如“小飞”),返回被唤醒结果,应用通过回调的结果,进行下一步的处理,如点亮屏幕,或唤醒后立刻进行命令识别,与用户进行语音交互。唤醒资源中含有一个或多个资源,只要命中其中一个,即可唤醒。
语音快捷启动app指的是:利用音识别技术(auto speech recognize, 简称asr),把人的自然语言音频数据转换成文本数据,再对文本数据进行语义理解,然后根据理解的结果去执行相应的功能。如用户说出“发短信给张三说明天去打球”,先把用户说的话翻译成文本数据,再对文本数据进行理解,最后可以得出要做的事情是发短信,发送对象是张三,发送内容为明天去打球,理解完成后就去调用相应的应用(短信)来实现用户的语音命令。
朗读文本信息指的是将将文字信息转化为可听的声音信息,让机器像人一样开口说话。如收到短信后直接朗读出短信内容。
2.2研究目标
此app的核心功能为识别用户的语音指令,去执行用户的语音指令,部分残疾用户或者普通用户在不方便用手对app进行操作时,通过语音唤醒,语音命令来实现对手机的一些基本操作,如点亮屏幕看时间,调高、调低音量,打开浏览器搜索,设置闹钟等。在一定程度上解放了用户的双手,更加符合现代人的需求。
2.3研究拟采用的技术方案及措施
采用android studio作为app开发工具,使用科大讯飞提供的mscandroid版sdk进行语音处理。涉及的部分技术如下
(1)使用axure进行原型图设计
(2)使用android studio 3.2.0作为app开发工具
(3)使用在线的讯飞sdk作为语音识别工具,以获取更好的效果
(4)使用相对布局,线性布局,网格布局等来设计用户界面
(5)使用真机进行调试
3. 研究计划与安排
前三周完成开题报告
十二周前完成系统原型设计与实现
在十四周前完成系统测试与修改
4. 参考文献(12篇以上)
[ 1]张蕊·全球25年间失明者增17.6%,[512].医师报,2017-8-10(6)
[ 2]赵英, 傅沛蕾. 我国信息无障碍研究现状及发展态势分析[j]. 情报探索, 2015(5).
[ 3]韩国《朝鲜日报》. 韩国:每年专为残疾人开发一批数字化产品[j]. 中国残疾人, 2014(2).
[ 4]李慧. 基于讯飞语音的安卓手机应用开发步骤的研究[j]. 无线互联科技, 2015(14):123-124.
[5] 王秀景,语音识别技术研究与实现[d].硕士学位论文,岛:山东科技大学,201 1.05,7-8