音频智能分段标注系统设计与实现开题报告
2022-01-09 21:54:43
全文总字数:3717字
1. 研究目的与意义及国内外研究现状
1. 选题的目的
英语听力训练是提高学生听力水平的有效方法,然而操作听力播放的教师往往有着一些苦恼。对于错误率极高的听力题目,教师需要反复将该题目的听力原文播放,单纯地通过拖拽进度条,往往不能一蹴而就地落点到正确的音频位置。这样的情况不管是对教师还是学生都有着不友好的体验。本选课设计针对一般广播音频包括英语听力进行智能自动切分和标注,不需要人工手动调节播放进度条,可以自由地选择一个模块进行播放,从而方便相关人员更有效率的使用。
2. 选题的意义
2. 研究的基本内容
本系统主要研究重点在于:对音频分割过程中边缘检测方法的研究。通俗地讲就是如何准确地对发音和停顿静音片段的区分以及标注。
除此之外,研究内容还包括:
(1) 音频个性化的自定义标注的实现。例如教师对于错误率高的听力原文片段,在已有的标注的基础上,添加自定义的标注“易错”等;
3. 实施方案、进度安排及预期效果
名称 | 时间 | 内容 | 预期效果 |
第一阶段 | 即日起 至 2018年2月20日 | 查阅并学习参考文献,设计实现出一个良好的音频分割算法。 | 实现一个良好的音频分割算法,并且实际分割效果可观。 |
第二阶段 | 2018年2月21日 至 2018年 3月20日 | 运用设计的算法开发出一个运行于本地的桌面软件,并进行功能丰富。 | 成功开发出一个桌面软件雏形,包括系统基础功能。 |
第三阶段 | 2018年3月21日 至 2018年4月20日 | 完善系统设计并按要求完成论文的编写。 | 完善系统设计,顺利完成论文,准备答辩。 |
4. 参考文献
[1] cheng s, wang h. a sequentialmetric-based audio segmentation method via the bayesian information criterion.in: proceedings of eurospeech, geneva switzerland,2003,945~948
[2] gish h, schmidt n. text-independentspeaker identification. ieee signal processing agazine,1994,11(4):18~32
[3] siegler m, jain u, rajb et al.automatic segmentation, classification and clustering of broadcast news. in: proceeding of darpa speechrecognition workshop, chantilly, usa,1997,67~72