一、汉语普通话语音的分形特性及其盒维数的统计分析(论文文献综述)
高进涛[1](2012)在《基于相图的语音干扰效果评估测度技术研究》文中认为由于语音信号受到通信干扰设备的干扰,科学地对其受扰程度进行准确评估是通信对抗领域的一项重要课题,寻求一种评估干扰效果的理想方法是迫切需要探讨和解决的问题。对语音信号受干扰程度的客观评判是研究的发展趋势。基于相图的语音干扰效果评估测度是一种基于输出的客观语音受扰评价方法,其在工作过程中直接基于输出进行受扰程度的评判,能够有效的提高试验效率,保证任务的顺利进行。本文对语音信号的特征进行了分析,阐述了语音信号的工作原理、物理定义及时域处理算法步骤,主要论述了语音信号的主观、客观音质评价方法的原理及其主要应用;说明了混沌理论及其常用处理方法;并对云模型、云理论的基本概念及其算法作了简要介绍。相空间重构是混沌动力学系统常用的一种研究方法,对于未知的复杂系统,在不知系统特征变量的基础上,根据嵌入理论,利用简单的时间序列输出,在相空间构建系统的特征结构,并对系统做进一步的分析。基于相图的语音干扰测度技术直接利用通信终端语音特征参数进行干扰效果评估,使用过程中不需要进行输入输出同步,可直接对通信情况进行现场评估,也可进行事后评估,使用方便灵活,实时性强,适用范围广,可以满足对干扰效果评估的要求。本项目采用状态空间重构的基本思想,具体分析了语音信号的混沌特性,以嵌入维数为尺度进行向量空间的截取,建立用于干扰效果分析的语音二维相空间点结构图。分析语音信号在不同干扰强度和不同干扰条件下的相图结构变化规律,用语音信号的相图结构变化来描述受扰程度,建立了语音信号的相图结构和干扰强度的对应关系,总结变化规律,并提取具有代表性的参数对语音受扰程度进行表征。对语音信号进行预处理,剔除存在粗大误差的数据值,并对受扰语音进行了统计分析和试验数据处理,归纳总结了在试验中的应用情况。整个项目达到了研究要求和预期的效果。
王振华,杨翠容,武薇,范影乐[2](2008)在《根据语音分形维和基音周期的说话人性别识别研究》文中研究说明根据语音特征实现说话人性别的自动识别,在音频处理与分析中具有重要的应用意义。为了克服语音常规线性参数在刻画说话人性别特征上的不足,本文使用了分形维等非线性参数作为特征空间的有效补偿。首先利用提升算法实现基音周期的提取;然后提取语音的分形维数;最后根据Takens定理,对分形维进行了重构,采用求近似熵的方法得到分形维复杂度。将基音周期、分形维数以及分形维复杂度构成三维向量,进行说话人的性别识别。实验证明,通过非线性参数的介入,与仅使用基音周期等传统线性特征的识别方法相比,识别系统的准确率和稳定性得到有效提高,因此为说话人性别识别提供了一个新的思路。
潘欣裕[3](2007)在《汉语耳语音特征分析与应用研究》文中研究说明耳语音是一种有别于正常语音的发音模式,是一种单一发音类型,声门前部(韧带)完全靠拢,后部(杓状软骨)有一个宽三角裂隙,气流通过开放区产生摩擦噪声,形成耳语音。由此可以确定耳语音的主要特点是发音时音量低且声带完全不振动,即没有基频。耳语发音方式在生活中有着广泛的应用,例如在公共场合利用手机通信时,为了不影响他人并且保障通话内容的保密性,常常使用耳语音。耳语在一些专业领域同样有着重要的应用意义,例如语音学家用耳语音研究语音感知问题、无喉病人的语音恢复问题、公安和法院可通过耳语音分析来辨别说话人身份等等。由于耳语音的发音特性以及周边环境的影响,语音质量必然下降,清晰度可懂度较差。所以研究一种方法将耳语音转换成正常语音,必然可以推广耳语音的应用范畴,由此本文的工作就是围绕着耳语音转换的前端处理问题而展开的。本文的研究工作主要有三大部分,耳语音的端点检测、声韵分割和声调感知。耳语音端点检测的正确率是后续所有工作的保障,本文根据耳语音的混沌湍流特性以及其本征模态函数(Intrinsic Mode Function, IMF)的能量,分别提出了基于分形方法和基于经验模态分解(Empirical Mode Decomposition, EMD)拟合特征的端点检测方法,均取得了很好的效果。由于汉语作为一种声调语言,说话人的语义和情感都是通过语音的声调韵律体现出来,故要进行耳语音——正常语音的转换,必须在韵母段添加基频,因此必须在检测出有声段后,分离出声韵母。本文根据耳语的特殊发音现象,提出改进EMD算法来定位嗓音起始时刻(Voice Onset Time, VOT);并依据耳语音声韵母的不同频谱分布,分别提出基于小波分解后的近似与细节能量比(Detail-Approximation Energy Ratio, DAER)和IMF瞬时频率方法的声韵母分离。在获得韵母段后,根据人的听觉掩蔽效应,首次提出了耳语音声调的新载体——扩散Bark谱能量比例拟合曲线,并获得了较高的声调识别率78%,为下一步耳语音的转换提供了重要的信息。这些工作不但为耳语音——正常语音的转换提供了必要的参数,同时也为在数字信号处理领域的人的发音方式及人耳的感知特征作了进一步的研究。
武薇,范影乐,庞全[4](2007)在《基于广义维数距离的语音端点检测方法》文中认为为能够准确有效地对含噪声语音信号进行起止位置的端点检测,该文提出了一种基于广义维数距离的端点检测方法。首先利用覆盖法求取广义维数得到该语音信号的三维特征向量,包括容量维数、信息维数、关联维数;然后计算信号的维数特征距离;最后根据特征距离对语音信号类别进行决策分类。实验结果表明,与仅使用单一维数特征检测语音起止端点相比,该文所提出的方法具有较好的鲁棒性,对混杂有不同噪声、不同信噪比的语音信号都能有较好的检测结果,尤其适用于低信噪比的语音端点检测。
闫润强[5](2006)在《语音信号动力学特性递归分析》文中认为近年来,随着语音信号非线性动力学特性研究的深入以及非线性动力学理论的进一步发展,应用非线性方法分析和处理语音信号成为研究的热点。然而,在应用非线性方法分析语音信号过程中,特别是计算语音音素的非线性表征量(如相关维数和最大Lyapunov指数)精细定量描述语音特征时,语音信号的非平稳特性和音素采样点不足这两个因素制约了这些方法的应用,使得计算结果往往波动很大,造成了解释上的误差。因此,研究针对非平稳语音信号的新的时间序列分析技术和新的特征参数提取手段成为本文的目的。首先,论文介绍了利用非线性动力学方法对语音信号进行理论性的定性和定量分析。根据音素的发声机理,讨论了浊音的声门振荡模式、清音的湍流声源模式和交互作用模式这三种不同的非线性模式。在研究语音的状态空间重构中,采用邻接误差法和平均互信息法统计得到语音音素序列重构相空间嵌入维数和延迟时间,为非线性分析方法分析连续语音提供了必要条件。通过对语音音素信号相关维数和最大Lyapunov指数的计算,表明了语音信号的混沌动力学特性。同时,计算结果较大的波动性表明这两种非线性参数只能用作反映语音非线性特征的表征量,而不能用作精细特征分析。然后,论文综述了针对短时非平稳的时间序列分析技术的研究现状,讨论了递归图和定量递归分析技术的应用研究。在递归图分析中,详细介绍了递归图的宏观模式和微观模式及其所表达的潜在的动力学含义。讨论了定量递归分析中的各种不同参量所衡量的动力学递归特性。通过从非平稳的时间序列分析、两时间序列相关性分析和噪声对定量递归分析的影响三个领域进行的研究讨论,说明了递归图和定量递归分析技术分析短时非稳态时间序列的有效性。随后,将递归图和定量递归分析技术引入语音信号处理领域。通过二维递归图观察不同模式的语音信号内部动力学机理的递归现象,使用递归量化参数定量的揭示了语音信号的递归特性。在音素递归图分析中,将语音非线性特征的表现模式和递归图的宏观模式联系起来:浊音的声门振荡模式对应于周期模式递归图,清音的湍流声源模式对应于均态模式递归图。由于爆破音闭塞段和释放段动力学性能的剧
孟照国[6](2005)在《普通话培训与测试的信息化研究》文中研究说明普通话是我国进行日常交流使用的官方语言,它的推广普及对于我国经济文化的发展具有深远的影响。普通话培训与测试是普通话推广的一个重要手段,对普通话的普及起着重要的推动作用。 本课题结合我校普通话培训与测试计算机管理立项展开。 本课题主要对普通话培训与测试工作的信息化进行了理论方面的研究探讨,在建立普通话培训测试信息化流程方面提出了自己的见解:即通过建立网站,开发软件系统来完成培训测试由人工向计算机信息处理方向的转化。 全文共分为以下几部分: 首先,通过调研,对我国普通话培训与测试的现状有了一定的了解,结合数据库、数据处理、网络知识及我国普通话培训与测试的有关规定提出了信息化的初步构想。 其次,通过对普通话培训与测试整个工作流程的深入了解,初步建立了普通话培训与测试的信息化框架:建立主管机构与工作站点两级管理的模式,通过网络建设与后台数据库管理实现语音信息及其他管理信息的有机融合。论文结合相关国家法规对普通话培训与测试工作进行了分析,着重分析了整个流程转化为网络及计算机处理的可能性,并对已有研究成果的理论和方法进行了比较。 然后,论文根据普通话培训与测试的信息化框架,建立了相应的工作模式,给出了信息管理的思想:建立管理机构与测试站两级管理模式,通过运用现代计算机信息处理和网络信息化处理技术建立网络连接,实现从普通话报名、培训、测试、成绩复核,到证书发放、成绩发布、证书审核等一系列工作的快捷准确的服务,高效率高质量地完成普通话培训与测试工作任务。并对其中部分具体情况的解决方案给出了说明。 最后,在对普通话培训与测试进行理论研究的基础上对普通话培训与测试形
丁昊[7](2005)在《汉语连续数目字语音识别的研究》文中提出连续数目字语音识别是当今语音识别领域的一个重要研究方向。本文简述了汉语数目字语音识别的发展与现状,分析了汉语数目字语音识别的困难所在,对连续数目字语音识别方法进行了研究。选取语音识别系统的特征参数时,对LPC 倒谱参数和MFCC 参数进行了比较,选择能够反映人的听觉对语音感知特性的MFCC 参数作为语音的特征参数,同时考虑到特征参数各维分量对于识别性能的贡献,对各维分量进行了加权处理。实验证明,基于MFCC 的特征参数比LPC 倒谱参数具有更佳的抗噪性。本文还讨论了在语音信号的声学处理环节提高语音识别鲁棒性的问题和方法。利用语音声学信号的频谱分析来寻找连续语音信号帧的分割点,再结合音素分割方法,成功的提高了分割精度。实验表明mel 标度频谱法比传统的以信号的短时能量,过零率等简单特征作为判决特征参数的语音端点检测方法更适合语音的分割。实验结果表明,这种算法对于清音和噪声,以及元音和辅音的区分都有很好的识别性能。系统采用VQ/HMM 模型作为语音识别的声学模型。对搜索算法,识别算法进行了研究,通过对隐马尔柯夫模型输入语音时间序列的矢量量化,有针对性的对搜索算法进行了简化。从而使汉语连续数目字语音识别的系统设计与实现的难度得到了降低。实验结果证明:①系统识别速度快,对于硬件的要求低。能在PC 机上实现处理。②对于平稳的孤立语音,该方法有较高的识别率。③对于连续数目字语音识别,系统的性能并没有急剧下降。
李轶[8](2003)在《说话人识别系统研究》文中进行了进一步梳理以前往往采用线性的方法如频谱分析来分析语音信号,而这些线性方法只适用于平稳的、一致的、平衡的线性的时间序列,对于非平稳、不一致、非平衡的非线性的语音时间序列,这些传统的线性方法就往往丢掉了许多蕴涵本质的重要信息。语音信号证明是非线性的混沌的,本文在此基础上提出了一种能够有效反映语音信号非线性特征的处理方法,并由此提出一种能够反映说话人个人特性的KC复杂性特征,作为说话人识别系统的一种新的特征,经实验证明这种特征是简洁合理并且是有效的。我们认为,复杂性分析方法能够用于说话人识别特征分析,具有很宽广的应用前景,这是很有前途的研究课题。 本文基于传统的LPC倒谱特征和KC复杂性特征建立了一个说话人确认系统,采用了YOHO speaker verification数据库,Enroll阶段:采用138说话人4个session每个session有10个语音样本数据,Verify阶段:采用138说话人10个session每个session有4个语音样本数据,训练模板和测试该说话人确认系统,取得了较好的说话人确认效果。 实验数据分析证明:因为传统的基于线性理论基础上的传统的说话人识别特征提取方法(例如:LPC倒谱特征),与基于非线性理论基础上的KC复杂性特征基本无相关性,因此这两类特征如能相互结合,有着良好的互补特性,能够大幅度的提高系统性能。这说明新提出的说话人的KC复杂性特征即使不能单独应用于说话人识别系统,也能够成为一个非常有用的传统线性特征的有效辅助特征。
陈国,胡修林,张蕴玉,朱耀庭[9](2000)在《汉语普通话语音的分形特性及其盒维数的统计分析》文中研究指明本文应用分形理论来研究汉语普通话语音的分形特性.通过计算和统计分析汉语男女声21种声母和38种的母语音信号时域波形的分形盒维数,得到了汉语语在信号分形维数在维数空间上的分布规律.实验结果表明,汉语语音信号具有分形标度不变性,分形维数能够反映语音信号时域波形的复杂程度.
二、汉语普通话语音的分形特性及其盒维数的统计分析(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、汉语普通话语音的分形特性及其盒维数的统计分析(论文提纲范文)
(1)基于相图的语音干扰效果评估测度技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文的主要内容 |
1.4 论文结构 |
第二章 语音信号的特征分析 |
2.1 语音信号的时域和频域特征 |
2.2 语音信号的语谱图 |
2.3 语音信号时域处理方法 |
2.3.1 短时能量及短时平均幅度 |
2.3.2 短时过零率 |
2.3.3 短时相关参数 |
2.3.4 短时平均幅度差 |
2.4 语音信号频域分析方法 |
2.4.1 滤波器组法 |
2.4.2 傅立叶频谱分析法 |
2.4.3 功率谱分析法 |
2.4.4 倒谱分析法 |
第三章 语音音质评价方法 |
3.1 语音信号主观音质评价方法 |
3.1.1 诊断押韵测试法(DRT) |
3.1.2 诊断性满意度测量法(DAM) |
3.1.3 平均意见得分法(MOS) |
3.2 语音信号客观评价方法 |
3.2.1 分段信噪比(SNRseg)测度 |
3.2.2 线性预测倒谱(LPC)失真测度 |
3.2.3 巴克(Bark)谱失真测度 |
3.2.4 Mel 倒谱系数失真测度 |
第四章 混沌理论及语音的相图结构表示 |
4.1 混沌理论 |
4.1.1 混沌理论概况 |
4.1.2 混沌理论常用处理方法 |
4.2 语音信号的相图结构 |
4.2.1 语音信号的相图维数 |
4.2.2 语音信号的相图构造 |
4.2.3 不同受扰情况下语音相图结构的变化 |
4.2.4 语音信号相图特征表示 |
4.3 本章小结 |
第五章 基于相图的语音干扰效果评估测度 |
5.1 试验数据处理方法 |
5.1.1 粗大误差的判别与剔除 |
5.1.2 最小二乘法 |
5.2 受扰语音文件的主观评测 |
5.2.1 参加主观评价的人员标准 |
5.2.2 主观评测实验 |
5.2.3 测试与结果统计 |
5.3 语音信号预处理 |
5.3.1 信号去偏及时域归一化 |
5.3.2 无音段及全干扰段的判断 |
5.4 受扰语音文件特征参数统计验证 |
5.4.1 平均位移参数统计 |
5.4.2 基于云的离散度参数 |
5.4.3 相图时间延迟参数统计 |
5.4.4 试验数据处理 |
5.5 本章小结 |
第六章 总结 |
6.1 论文工作总结 |
6.2 工作展望 |
致谢 |
参考文献 |
(2)根据语音分形维和基音周期的说话人性别识别研究(论文提纲范文)
1 引 言 |
2 基本原理 |
2.1 基音周期检测 |
2.2 分形维数 |
2.3 分形维复杂度 |
3 实验结果及分析 |
3.1 实验样本及实验方法 |
3.2 三维特征实验结果分析 |
3.3 三维特征与其它特征方法在说话人识别系统中的应用比较 |
4 结 论 |
(3)汉语耳语音特征分析与应用研究(论文提纲范文)
中文摘要 |
Abstract |
第一章 绪论 |
1.1 耳语音研究的背景及意义 |
1.2 耳语音研究的现状 |
1.3 本文的主要工作及创新 |
1.4 论文结构安排 |
第二章 耳语音的特点 |
2.1 耳语音的发音特点 |
2.2 耳语音的声学特点 |
2.3 耳语音的听觉感知特点 |
2.4 小结 |
第三章 耳语音的端点检测 |
3.1 引言 |
3.2 分形理论在耳语音端点检测中的应用 |
3.2.1 分形理论基本思想 |
3.2.2 语音的空气动力学原理与分形 |
3.2.3 分形维数测度 |
3.2.4 分形算法在耳语音处理中的应用 |
3.3 经验模态分解(EMD)在耳语音处理中的应用 |
3.3.1 经验模态分解简介 |
3.3.2 EMD 拟合特征应用于耳语音端点检测算法 |
3.4 耳语音端点检测算法比较及实验结果分析 |
3.4.1 零能积算法简介 |
3.4.2 短时谱能熵函数算法简介 |
3.4.3 实验结果比对分析 |
第四章 耳语音的声韵分离 |
4.1 引言 |
4.2 耳语音声韵母过零率分析 |
4.3 小波分析在耳语音处理中的应用 |
4.3.1 小波分析理论简介 |
4.3.2 离散小波变换的汉语耳语音声韵分割应用 |
4.4 基于修正EMD 分解的VOT 检测 |
4.4.1 嗓音起始时间(VOT)简介 |
4.4.2 修正EMD 分解的VOT 检测应用 |
4.5 IMF 自适应瞬时频率估计的耳语声韵分割应用 |
4.5.1 自适应陷波器理论简介及改进 |
4.5.2 耳语音IMF 的瞬频特征及声韵分割 |
4.6 实验结果比较与分析 |
4.6.1 基于熵函数的耳语音声韵分割简介 |
4.6.2 实验结果统计与分析 |
第五章 耳语音的声调感知研究 |
5.1 引言 |
5.2 辨听实验 |
5.2.1 人对于耳语音声调的主观辨听实验 |
5.2.2 人对于无语音信息的耳语音感知实验 |
5.3 汉语耳语音的声调识别 |
5.3.1 模型选择 |
5.3.2 特征选择 |
5.3.3 识别结果及分析 |
5.4 耳语音声调信息载体研究 |
5.4.1 人的听觉感知特性 |
5.4.2 听觉掩蔽特性 |
5.4.3 掩蔽阈值计算 |
5.4.4 临界带扩散拟合曲线的声调轨迹研究 |
5.5 汉语耳语音声调模型 |
5.6 本章小结 |
第六章 结论与展望 |
6.1 论文总结 |
6.2 今后研究展望 |
参考文献 |
攻读硕士学位期间公开发表的论文 |
致谢 |
详细摘要 |
(4)基于广义维数距离的语音端点检测方法(论文提纲范文)
1 引言 |
2 基本算法原理 |
2.1 广义维数 |
2.2 特征距离 |
2.2.1 一般距离 |
2.2.2 明氏 (Minkowski) 距离 |
2.2.3 兰氏 (Lance) 距离 |
3 实验结果 |
4 结束语 |
(5)语音信号动力学特性递归分析(论文提纲范文)
第一章 绪论 |
1.1 课题的研究背景 |
1.2 递归图和定量递归分析技术研究现状 |
1.3 论文的目的、主要研究内容及贡献 |
1.4 论文的结构安排 |
1.5 论文的创新点 |
第二章 语音信号的非线性动力学特性分析 |
2.1 非线性动力学理论与非线性时间序列分析技术 |
2.1.1 非线性动力系统 |
2.1.2 重构相空间和时间延迟嵌入理论 |
2.1.3 非线性时间序列的定量描述 |
2.1.4 相关维数和Lyapunov 指数的数值计算方法 |
2.2 语音信号的非线性动力学特性分析 |
2.2.1 语音信号产生过程的非线性 |
2.2.2 语音的相空间重构 |
2.2.3 语音的相关维数 |
2.2.4 语音的最大Lyapunov 指数 |
2.2.5 非线性语音信号处理的应用研究 |
2.3 本章结论 |
第三章 递归图和定量递归分析技术 |
3.1 递归图(RP) |
3.1.1 递归图中表现出的宏观模式 |
3.1.2 递归图中表现出的微观模式 |
3.1.3 构造递归图的参数选择 |
3.2 定量递归分析(RQA) |
3.3 递归图和定量递归分析技术的应用研究 |
3.3.1 非平稳时间序列分析 |
3.3.2 两时间序列相关性分析 |
3.3.3 噪声对定量递归分析的影响 |
3.4 本章结论 |
第四章 语音信号的递归特性分析 |
4.1 构造递归图参数的确定 |
4.2 音素的递归图 |
4.3 音素的定量递归分析 |
4.4 二音素的递归图分析 |
4.5 噪声对语音递归图的影响 |
4.6 本章结论 |
第五章 递归趋势分析在语音自动切分中的应用 |
5.1 语音自动切分技术的发展现状 |
5.1.1 手工音素边界定位的符合度 |
5.1.2 基于HMM 模型的语音自动切分系统 |
5.1.3 基于DTW 语音自动切分方法 |
5.1.4 其它基于声学特征参数的语音自动切分方法 |
5.1.5 小结 |
5.2 利用递归趋势切分语音 |
5.3 基于HMM 模型的连续语音切分精度的提高 |
5.3.1 HMM模型在切分应用中的内在缺陷及一些改进措施分析 |
5.3.2 应用依时递归趋势分析调整音素切分边界 |
5.3.3 测试数据库 |
5.3.4 切分结果及其分析 |
5.4本 本章结论 |
第六章 基于信号递归度分析的语音端点检测 |
6.1 噪声环境下语音端点检测技术 |
6.1.1 基于短时能量的方法 |
6.1.2 基于倒谱距离测度的方法 |
6.1.3 基于自相关相似距离的方法 |
6.1.4 基于语音波形短时网格分形维数的方法 |
6.1.5 基于HMM 模型的方法 |
6.1.6 各类方法比较总结 |
6.2基 基于信号递归度分析的语音端点检测 |
6.2.1 信号递归度 |
6.2.2 临界距离的选择 |
6.2.3 判别流程 |
6.2.4 测试数据 |
6.2.5 对比方法 |
6.2.6 测试结果分析 |
6.2.7 缺点分析 |
6.3 本章结论 |
第七章 定量递归分析在语音清浊音判决中的应用 |
7.1 汉语普通话语音音素递归特性分析 |
7.1.1 递归参数的选择 |
7.1.2 音素递归图分析 |
7.1.3 定量递归分析 |
7.2清 清浊音判决的实现和性能分析 |
7.2.1 清浊音递归特性统计 |
7.2.2 判决方法流程 |
7.2.3 判决结果分析 |
7.2.4 缺点分析 |
7.3 本章结论 |
第八章 总结和展望 |
8.1 本文的研究总结 |
8.1.1 递归趋势分析在语音自动切分中的应用 |
8.1.2 基于信号递归度分析的语音端点检测 |
8.1.3 定量递归分析在语音清浊音判决中的应用 |
8.2 本课题研究展望 |
附录 A TIMIT 音素表 |
附录 B HTK环境配置参数及HMM模型拓扑结构原型设置 |
B.1 HTK 环境配置参数 |
B.2 HMM 拓扑结构 |
参考文献 |
致谢 |
攻读博士期间发表和完成的学术论文 |
学位论文出版授权书 |
(6)普通话培训与测试的信息化研究(论文提纲范文)
绪论 |
第一章 技术基础 |
1.1 数据库系统概述 |
1.1.1 数据库系统基础知识 |
1.1.1.1 数据管理进展 |
1.1.1.2 数据库系统的组成 |
1.1.2 数据库体系结构 |
1.1.3 数据库系统特点 |
1.1.4 数据库设计 |
1.1.4.1 数据库设计概述 |
1.1.4.2 数据库设计步骤 |
1.1.5 数据库需求分析 |
1.1.6 概念结构设计 |
1.1.7 物理设计 |
1.1.8 数据库实施 |
1.1.9 数据库系统管理和维护 |
1.2 客户/服务器开发技术 |
1.3 Web数据库技术 |
1.3.1 Web数据库概述 |
1.3.2 Web数据库访问方法 |
1.4 普通话培训测试管理规定 |
1.4.1 普通话水平测试等级标准 |
1.4.2 普通话水平测试管理规定 |
1.4.3 普通话水平测试规程 |
第二章 普通话培训测试信息系统设计方案 |
2.1 概述 |
2.1.1 引言 |
2.1.2 课题背景 |
2.1.3 需求分析 |
2.1.3.1 普通话培训测试趋势 |
2.1.3.2 目前普通话培训测试管理现状 |
2.1.3.3 培训测试管理软件的优势 |
2.1.4 设计思路 |
2.2 设计原则 |
2.3 总体架构 |
2.4 系统设计方案 |
2.4.1 测试点管理 |
2.4.1.1 添加、删除测试站 |
2.4.1.2 测试站管理权限设置 |
2.4.1.3 统计分析和查询 |
2.4.2 试题库管理 |
2.4.2.1 新增、删除试题 |
2.4.2.2 试题下发 |
2.4.2.3 统计分析和查询 |
2.4.3 测试员管理 |
2.4.3.1 测试员登记、注销 |
2.4.3.2 测试员评分纪录 |
2.4.4 测试评分系统 |
2.4.4.1 测试评分安排 |
2.4.4.2 测试评分 |
2.4.4.3 评分审核 |
2.4.4.4 试卷打包和发放 |
2.4.5 考试成绩管理 |
2.4.5.1 考试结果管理 |
2.4.5.2 考试结果分析和指导 |
2.4.5.3 考试成绩通知 |
2.4.5.4 考试成绩查询 |
2.4.6 证书管理 |
2.4.6.1 电子证书管理 |
2.4.6.2 证书打印 |
2.4.6.3 证书查询 |
2.4.7 考生管理 |
2.4.7.1 网上报名 |
2.4.7.2 测试站报名 |
2.4.7.3 统计分析和查询 |
2.4.8 考试管理 |
2.4.8.1 考试安排 |
2.4.8.2 下发考试安排 |
2.4.8.3 发放准考证 |
2.4.9 系统管理 |
2.4.10 测试考试系统 |
2.4.10.1 考试过程 |
2.4.10.2 考试结果上传 |
2.5 系统性能指标 |
2.6 部署方案 |
2.6.1 测试中心端 |
2.6.2 测试点配置 |
第三章 普通话培训测试系统实施方案 |
3.1 系统总体布局 |
3.1.1 网络建设 |
3.1.2 软件系统建设 |
3.1.2.1 工作过程 |
3.1.2.2 程序设计主要特点: |
第四章 总结 |
参考文献 |
致谢 |
攻读硕士学位期间发表的学术论文目录 |
(7)汉语连续数目字语音识别的研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 语音识别的概况 |
1.2 汉语数目字语音识别的现状 |
1.3 语音识别系统的基本构成和工作原理 |
1.4 本章小结 |
2 语音信号分析 |
2.1 特征参数的选择 |
2.2 语音增强 |
2.3 实验与讨论 |
2.4 本章小结 |
3 语音端点 |
3.1 语音端点的检测 |
3.2 语音端点分割算法 |
3.3 实验结果和分析 |
3.4 本章小结 |
4 VQ/HMM 模型 |
4.1 矢量量化的原理 |
4.2 聚类算法研究 |
4.3 倒谱系数的矢量量化 |
4.4 隐马尔柯夫模型的原理及其定义 |
4.5 隐马尔柯夫模型的三个基本问题 |
4.6 实际中的问题 |
4.7 基于连续词模型的语音识别算法 |
4.8 实验与讨论 |
4.9 本章小结 |
5 汉语数目字串识别系统的构成 |
5.1 语音识别原理和识别系统的组成 |
5.2 实验结果和分析 |
5.3 论文工作总结 |
致谢 |
参考文献 |
附录1 攻读学位期间发表论文目录 |
(8)说话人识别系统研究(论文提纲范文)
中文摘要 |
英文摘要 |
第一章 绪论 |
1.1 语音识别与说话人识别研究状况 |
1.1.1 语音识别的研究与进展 |
1.1.2 说话人识别的研究与进展 |
1.2 说话人识别基本概念 |
1.2.1 基本概念 |
1.2.2 说话人语音基础 |
1.2.3 说话人识别的技术基础 |
1.3 说话人识别技术存在的问题 |
1.4 说话人识别的应用前景 |
1.5 本文的主要工作 |
第二章 说话人识别中的特征提取 |
2.1 基音周期 |
2.1.1 基音检测预处理 |
2.1.2 相关法基音检测算法 |
2.1.3 基音检测的后处理 |
2.2 共振峰 |
2.3 倒谱系数 |
2.3.1 语音信号产生模型 |
2.3.2 LPC倒谱 |
2.4 美尔倒谱系数 |
2.5 不同参量结合特征 |
2.6 特征参量有效性评价 |
2.6.1 Fisher比:用于标量参数的特征评价 |
2.6.2 采用系统性能来评价参量有效性 |
第三章 语音信号的复杂性特征分析 |
3.1 语音信号的非线性特征研究 |
3.1.1 语音信号产生混沌机制 |
3.1.2 语音信号的相空间重构和Lyapunov指数 |
3.1.3 分形维数 |
3.2 复杂性 |
3.2.1 复杂性概念 |
3.2.2 语音信号Kolmogorov复杂性特征提取算法 |
3.2.3 KC复杂性特征有效性 |
第四章 说话人确认系统设计 |
4.1 引言 |
4.2 特征提取 |
4.2.1 LPC倒谱系数特征提取 |
4.2.2 复杂性特征提取 |
4.3 模式匹配 |
4.4 语音数据库 |
4.4.1 英文数据库 |
4.4.2 中文数据库 |
4.5 说话人确认系统实现 |
4.5.1 说话人确认中的确认阈值 |
4.5.2 说话人确认系统组成 |
4.6 系统评价方法 |
第五章 课题总结与展望 |
5.1 实验数据分析 |
5.2 结论 |
5.3 课题展望 |
参考文献 |
致谢 |
作者在研究生期间发表的论文 |
附录一 |
四、汉语普通话语音的分形特性及其盒维数的统计分析(论文参考文献)
- [1]基于相图的语音干扰效果评估测度技术研究[D]. 高进涛. 电子科技大学, 2012(06)
- [2]根据语音分形维和基音周期的说话人性别识别研究[J]. 王振华,杨翠容,武薇,范影乐. 生物医学工程学杂志, 2008(04)
- [3]汉语耳语音特征分析与应用研究[D]. 潘欣裕. 苏州大学, 2007(04)
- [4]基于广义维数距离的语音端点检测方法[J]. 武薇,范影乐,庞全. 电子与信息学报, 2007(02)
- [5]语音信号动力学特性递归分析[D]. 闫润强. 上海交通大学, 2006(02)
- [6]普通话培训与测试的信息化研究[D]. 孟照国. 青岛科技大学, 2005(06)
- [7]汉语连续数目字语音识别的研究[D]. 丁昊. 华中科技大学, 2005(05)
- [8]说话人识别系统研究[D]. 李轶. 浙江大学, 2003(03)
- [9]汉语普通话语音的分形特性及其盒维数的统计分析[J]. 陈国,胡修林,张蕴玉,朱耀庭. 信号处理, 2000(04)