登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 计算机类 > 计算机科学与技术 > 正文

Android平台语音服务功能的开发开题报告

 2020-04-19 21:08:16  

1. 研究目的与意义(文献综述)

1.1国内外现状

语音作为交流与通信最为简单与便捷的方式之一,一直以来便是一个重要的研究领域。关于语音识别技术的研究最早起源于上世纪50年代,由贝尔实验室研究,此时的研究只是对简单的孤立词进行识别。直至上世纪80年代,随着隐马尔科夫模型(hmm)以及ngram语言模型的应用,语音识别转向大量词汇的连续语音识别,诸如李开复基于gmm-hmm的语音识别框架研发的sphinx系统。辛顿(hinton)于2006年提出深度置信网络(dbn)后,基于dnn-hmm的语音识别系统得到发展。而关于语音合成的研究已经有将近两百年的历史,早期的研究主要是采用参数合成方法,主要有holmes的并联共振峰合成器(1973)和klatt的串/并联共振峰合成器(1980)。八十年代末期至今,基音同步叠加(psola)方法得到了提出(1990),使得合成的语音的自然度和音色得到了大大提高。九十年代初,基于psola技术的法语、德语、英语、日语等语种的文语转换系统都已经研制成功。最近几年,人们逐渐将注意力转向数据库的方向。我国的关于语音合成方面的研究起步比较晚,但也经历了共振峰合成、lpc合成至应用psola技术的过程,语音合成技术得到了很大的发展。在自然交互家平台方面,我国已取得了突破性进展,2010年,科大讯飞发布了首个同时集成语音合成、语音搜索、语音听写等能力的语音交互平台——“讯飞语音云”;2011年,又增加了个性化语音识别功能,可对口音和专有词汇进行训练;2012年,将dnn技术应用于语音云平台,引入了自然语音理解和声纹识别等扩展能力;2013年,在手机终端实现了离线语音听写;2014年,发布高抗噪识别和方言识别。讯飞也开放了其语音接口,“讯飞语音云”的提出为开发者提供了一个更开放的语音功能开发平台,为未来智能语音提供了无限可能,增添了无限精彩。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

2.1研究(设计)的基本内容、目标

有视觉障碍和其他功能障碍的人,在使用手机时会很困难。在手机上开发语音服务功能能够极大地方便具有功能障碍的人群。同时,为了提高手机的实用性,方便人们对手机的操作,简化人机交互方式,需要在手机上进行语音服务功能的开发。本项目以语音合成和语音识别技术为基础,使用android的开发平台与环境,采用支持android平台的语音处理系统(例如讯飞语音云),目标是支持andriod平台上的语音服务,完成android平台下的语音服务功能开发。主要的语音服务功能有:1)语音拨号和语音控制接听电话;2)语音收发短信;3)语音控制搜索、播放音乐;4)语音控制搜索网页,播放网页内容(例如新闻等);5)借助语音输入法,通过聊天工具与他人聊天。由于研究设计的系统主要面向的人群是具有视觉障碍和其他功能障碍的特殊人群,不能通过识别手机上的内容来操作手机,只能通过语音,故系统需要完成当用户通过语音向手机发号指令时,手机完成用户需要完成的动作的功能。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

(1)1月16日到3月5日:查询参考文献,完成技术方面学习,完成外文翻译、撰写开题报告。

(2)3月6日到4月30日:熟悉开发语言和开发平台,进行系统分析与设计,搭建系统框架,完成系统的实现,进行系统测试与完善。

(3)5月1日到5月25日:撰写和修改毕业论文,整理排版毕业论文和答辩相关资料。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1]高弋坤.科大讯飞:移动互联网进入语音时代[j].通信世界,2010(42):34-34.

[2]安徽科大讯飞信息科技股份有限公司.讯飞语音改变移动生活[j].计算机与信息技术,2011,19(10):69-70.

[3]佚名.科大讯飞新一代“语音云”开启“语时代”[j].电视技术,2012,36(08):21-21.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图