一、一种基于ACELP的4.8kbit/s语音声码器(论文文献综述)
项慨[1](2016)在《移动音频编码丢帧隐藏技术研究》文中研究指明随着移动互联网的快速发展,移动终端上各类型语音、音乐等音频应用需求不断增强。然而,无线移动网络的信道环境复杂多变,导致移动接收端所获得的数据容易出现误码失真,语音传输质量不高、音频通信服务质量较差。现有移动音频的丢帧隐藏技术研究主要面向随机少量语音或音频丢帧的应用场景,无法有效应对突发大量连续丢帧的应用场景。针对上述问题,本论文开展相关研究。本论文在充分研究现有移动音频编码标准AMR-WB+和AVS-P10的基础上,深入讨论移动音频编码的丢帧隐藏技术方法,针对主流的ACELP编码器和TCX编码器,提出了新的满足移动网络高恢复效率、低延时的音频丢帧隐藏方法,使得编码端不添加额外的纠错信息到传输码流中,且解码端不增加延时。主要研究内容和成果概括如下:1.提出了ACELP编码器的自适应丢帧隐藏方法基音周期和ISF参数都是基于ACELP编码的音频编码的重要参数,现有的AVS-P10标准中的语音编码器的丢帧隐藏方法主要是对一些单帧或间断少量丢帧情况下的处理效果较好,而在随机连续丢帧的情况下,丢帧处理延迟较高且语音恢复质量效果欠佳。针对该问题,论文提出了一种自适应的丢帧隐藏方法A-PLC,旨在根据单帧丢失还是多帧连续丢失进行判定,并自动、相适应的采用不同的丢帧隐藏方法,用于恢复丢失帧的基音周期和ISF参数。实验通过与AVS-P10标准中原有方法相对比,其结果表明:A-PLC客观测试PESQ平均得分有约0.13分的提升,主观听力测试的平均CMOS得分提高约0.04分,运算处理时间降低了约10%的时间。2.提出了基于HMM的ACELP编码器丢帧隐藏方法当前主流的语音编解码器对丢失帧的参数恢复方法,主要是基于丢失帧前后正确参数信息进行替换或线性预测来估计丢失的参数值,即只关注了语音信号的局部特征,而忽略了从整体上把握语音信号的全局特征,因而在出现突发大量丢帧的情况下,这些方法恢复的语音信号的听觉感知失真较大。针对该问题,论文提出了基于HMM的丢帧隐藏方法H-PLC,通过分析语音信号在更大范围的上下文关系的统计学变化来选择合适的丢帧隐藏策略。利用连续HMM把每帧语音信号的编码参数向量作为观察值,一个语音参数向量的序列看作HMM产生的连续概率密度函数,在解码器通过HMM跟踪语音参数观察值的变化时,决定每一时刻的最可能的信号状态。当包丢失时,基于HMM的恢复方法使用状态和密度函数信息,计算丢失帧参数的估计值。实验结果表明:H-PLC相比AVS-P10标准的语音编码器原有方法,客观语音测试PESQ平均分提高约0.33分,主观语音测试MOS平均分能够提高约0.32分。3.提出了基于增益控制的TCX编码器丢帧隐藏方法现有变换域丢帧隐藏方法多数采用增益因子来控制谱系数幅度的恢复,这种方法无法有效反映谱系数在不同帧间幅度变化的情况,从而造成恢复的音频信号失真较大。针对该问题,论文提出了一种基于增益控制的丢帧隐藏方法Gain-C,采用线谱频率系数距离用于表征滤波器稳定性,在此基础上,建立稳定性因子和增益控制因子的线性变换关系,从而控制丢失帧谱系数幅度恢复。实验结果表明:在变换码激励模式下,Gain-C与AMR-WB+标准方法相比,恢复的音频信号的平均加权信噪比约有0.05dB的提高,MUSHRA听音测试平均分约有1.5分的提高。论文中提出的移动音频丢帧隐藏方法可直接编码后嵌入到移动音频解码器丢帧隐藏处理部分。相关研究结果表明:提出的移动音频丢帧隐藏方法在丢帧恢复质量和效率方面优于当前主流移动音频编码标准AMR-WB+和AVS-P10中所采用的方法。
李晓明[2](2014)在《语音与音频信号的通用编码方法研究》文中指出随着网络通信、移动通信和多媒体技术的快速发展,不同网络、系统和服务平台之间的相互融合已经成为一种必然。在这一趋势下,通信与娱乐之间已不再具有明显的界限,人们已经不满足于单一的语音通信需求,更希望享受兼容语音与音频的通信服务所带来的愉悦。但是,传统语音与音频编码由于算法模型的限制,无法同时对语音、音频及其混合信号取得理想的编码效果,从而限制了移动多媒体技术的进一步发展。基于此背景,运动图像专家组(Moving Picture Expert Group, MPEG)提出了构建语音与音频通用编码器的倡议。尝试利用统一的编码模型,实现对语音、音频及其混合信号的通用编码,以克服传统语音和音频编码器仅适合处理单一类型信号的弊端。因此,该倡议一经提出就成为语音频编码研究的热点问题,目前多家研究机构均参与了对通用编码算法的研究。针对这一问题,本文对现有语音和音频编码技术展开深入研究,从语音和音频信号共有的谐波特征出发,提出了两种通用编码框架,并最终在24kbps和32kbps码率下实现了对宽带语音和音频信号的通用编码。本文的主要成果体现为如下几个方面:1.本文基于信号特征成分分离的思想,通过发掘语音和音频信号共有的谐波特性来搭建通用编码框架。该框架抛开现有通用编码技术基于类型判别和选择的编码机制,利用统一模型对输入信号进行分析,通过保持量化前后信号概率密度分布的一致性实现通用编码,有效地解决了现有通用编码器过分依赖信号类型判别和对混合信号量化机制选择不合理等缺点和不足;2.本文将经验模态分解算法(Empirical Mode Decomposition, EMD)引入语音与音频编码领域,基于输入信号本征模态函数的感知重要性和周期性特征,利用EMD分解的自适应滤波特性,提出了一种基于信号特征的谐波分离算法,通过提取输入信号的谐波成分,提高了正弦模型参数估计的准确性;3.提出了一种基于谐波分离的正弦参数通用编码算法,该算法采用混合编码的方式对输入信号的不同特征成分进行分别编码,以发挥参数编码和变换编码的不同优势,从而达到系统的整体最优。对于谐波成分,本文采用基于感知梯度加权的匹配追踪算法进行正弦参数建模和多分辨率量化编码;对于非谐波成分,本文提出了一种基于RE8格的抖动格型矢量量化方法,使得量化噪声表现为独立于原始信号的高斯白噪声,从而提升了合成信号的主观感知质量;4.为了提升所提正弦参数通用编码算法对语音信号的编码质量,本文将基频同步分析技术与功率谱保持量化相结合,提出了一种基于基频同步的语音量化方法。该算法利用输入信号的基频信息,将输入信号规整为具有固定周期的规整信号,并对规整后的周期信号进行稀疏变换,通过能量集中的方式实现对浊音语音调制变换系数的稀疏化,从而提升了编码器对语音信号的压缩效率;5.在原有基频同步分析算法基础上,提出了一种基于能量加权归一化互相关的自适应分析窗长判决方法,使其能够实现对语音、音频及其混合信号的统一分析,并与概率分布保持量化技术相结合,搭建了一种基于概率分布保持的语音与音频通用编码算法,该算法以变换域编码为基础,通过保持编码前后信号间概率分布特征的一致性,实现了对语音和音频信号的通用编码。最终测试表明,所提算法对宽带语音和音频信号的编码质量,均优于AMR-WB和ITU-T G.722.1编码标准。
孟利[3](2013)在《多种语音业务处理平台的设计与实现》文中研究说明随着通信网络的快速发展,各种语音编码技术也不断向前推进,以满足不同通信网络的应用需求。但各通信网络中使用的语音编码技术和接口类型各有所异,实现网间话音互通则变得很困难。因此需要研制一种媒体网关设备,来解决这-问题。多种语音业务处理平台研制项目是针对各通信网间使用的语音编码、通信接口不同、无法实现话音互通而设立的。它可接入多种专用或通用通信网,进行不同语音编码间的转换,实现话音互通和电话会议。本文分析了多种语音业务处理平台的工作原理和技术体制,结合通信网络系统需求,明确了系统组成、功能划分和系统的技术指标,提出了一种集中式处理语音业务的设计方案,实现了集语音编码转换和多种通信接口为一体的应用模式,包括了G.729A、CVSD、PCM、AMR-NB编码转换,电话会议,E1接口、A接口、K接口、二线模拟中继接口和模拟用户接口的接入。经过平台的自测试、网间话音互通测试,以及网间会议呼叫测试,结果表明本方案解决了使用不同语音编码的各通信网间话音互通问题,并实现了电话会议功能。
董少杰[4](2012)在《基于DSP的通用语音编解码器的设计与实现》文中提出语音信号的编解码是现代通信系统的重要组成部分,也是目前研究的热门课题,而通用语音编解码器由于其通用性和灵活性也越来越得到重视,其研究也取得很大的发展。DSP技术是21世纪运用最广泛的技术之一,掌握DSP的开发和应用显得越来越重要。本文主要针对通信工程专业的相关理论课中的话音信号处理部分和现代通信实验系统的信源编解码部分的需求,设计并实现了一种基于DSP的通用语音信号编解码器实验模块,该实验模块对语音编解码理论知识的理解、深入学习、技术实现以及研究都具有很好的促进作用。本文在语音编解码理论知识的基础上,查阅了相关文献资料,对课程中的四种常用语音信号处理方法进行了归纳和整理,对它们的压缩编码方法进行了对比,在掌握各语音编码关键技术和DSP技术的基础上,设计并实现了通用语音编解码实验模块,并在该模块上分别实现了G.711、DM、G.721、CVSD算法。为方便学生的学习和理解,硬件电路采用模块化和开放接口设计,使整个编解码的硬件电路思路符合理论课程讲述的语音信号处理流程,在关键信号处设置测试环和测试冒便于观察比较。在软件设计上采用结构和模块化的设计思想,使信号处理的流程清晰,程序设计简练,方便学生参与。语音编解码实验模块的硬件电路分五个部分,分别为滤波放大、数模与模数变换、信号处理、接口、控制和管理。学生通过这五个部分可以掌握目前主流技术,滤波器、A/D与D/A变换器、DSP、FPGA、单片机和PC机软件编程,为学生提供了多方面的学习和实践环境。在软件设计上采用结构设计的方法,即将程序分成算法程序、系统程序和控制程序三部分。目的是实现动态和持续的程序设计,方便学生对程序的修改和扩展。在这种设计结构下,每个部分负责不同的功能,根据用户界面的操作完成对程序数据的更新,同时数据的改变通过用户界面显示出来。程序的模块化设计是根据完成的任务不同将程序分成不同的函数或子程序,每个函数或子程序都提供函数名、接口和参数,学生根据功能、接口和参数完成功能或算法的编程,从而实现软件任务的分解,方便不同层次和不同学习阶段的学生实验。本文在完成设计的基础上,根据语音编解码原理给出了几个语音信号处理的实验项目,对算法进行了仿真,并对系统的功能和性能进行了测试,结果表明达到了设计要求。
张永杰[5](2012)在《基于DSP的G.729语音编解码算法的研究与实现》文中进行了进一步梳理当前,伴随通信用户的与日俱增及现代通信技术的日新月异,高频带利用率和高通信质量已经成为现代通信领域所追求的两大主要目标。低成本且有着较高通信质量和较低比特率的语音编解码器是人们实现这两大目标的一种工具或手段。语音编码的特点就是在特定的码率约束下,恢复出尽量好的重构语音信号,且实现尽可能小的编解码时延和折中的运算复杂度。为满足人们对通信的这种需要,ITU(International Telecommunications Union,国际电信联盟)在1996年发布了G.729协议(G.729标准),该协议采用的是基于共轭结构——代数码激励线性预测(CS-ACELP)技术,是一种比特率为8kbit/s的语音编码标准,有着延时小,重构的语音质量好等优点。目前该协议应用前景很广,已涉及个人移动通信、多媒体数字网络通信、IP电话、移动卫星通信、综合业务数字通信(ISDN)等领域。同时,该协议也是ITU向全球电信部门强烈推荐的语音编解码标准之一,但由于其较高的算法复杂度,实时性仍是当前的主要应用障碍。本课题主要研究的是基于DSP平台实时实现G.729编解码算法。数字信号处理器(DSP)具有着高速的计算处理能力,在信息处理领域具有广泛的应用。基于实时性和数据大小和精度及成本的考虑,处理芯片选用的是美国德州仪器公司(TI)生产的高性能定点DSP——TMS320VC5402。在课题中首先介绍了与G.729编解码的算法原理相关的技术,然后对算法本身,即共轭结构——代数码激励线性预测算法,通过源代码进行剖析其具体实现过程。其次对国际电信联盟同时发布的G.729标准的源代码进行分析,对源码进行移植前的去串行化操作,达到16:1的压缩比例。接着详细介绍了实现G.729编解码器的硬件平台、语音采集芯片与主处理芯片间的接口及配置,并讲述了基于已搭建硬件平台的软件设计。最后根据DSP的特性,结合G.729编解码算法的特点,提出一系列优化方法,主要从四个层面进行优化:编译器级优化、算法级优化、C语言级优化和汇编级优化,并给出优化后在DSP平台下实时实现的结果。
牟欣雯[6](2011)在《基于ACELP编码模型的音频误码掩盖算法研究》文中指出本文根据目前数字音频的主要发展趋势,对音频通信差错控制中的误码掩盖算法进行了研究。在阅读了大量的国内外文献的前提下,研究基于ACELP编码模型的自适应多速率宽带(AMR-WB)语音编码方案,并在该编码方案的基础上,在解码端尝试几种恢复重要编码参数的音频误码掩盖方法。通过进行大量的仿真对比实验,综合比较实验结果和算法延迟,最后提出了一种基于ACELP编码模型的音频误码掩盖算法。该算法首先对编码器进行了简单地修改,将自适应码本贡献限制方法嵌入到编码器中,用来加快丢帧后合成语音质量的恢复速度。该方法虽然在无语音帧丢失的情况下会造成合成语音质量的略微下降,且这种微小的音质降低在听觉感受上是察觉不出明显变化的,但对丢帧之后的合成语音质量的提高却起到了很大的帮助作用。在解码器中,首先对丢失帧两侧有效语音帧的类型进行判断并确定丢失语音帧的声音类型,声音类型分为浊音、清音、浊音向清音的过渡和清音向浊音的过渡等。然后分别采用两个不同的数学模型来恢复ACELP编码模型参数:采用拉格朗日插值多项式逼近方法来重建导抗谱对(ISP)参数或线谱频率(LSF)参数;采用线性预测模型来恢复基音周期参数和固定随机码本增益参数。对丢失语音帧参数的恢复是按照顺序一帧一帧独立进行的。本文算法对编码参数的恢复不仅仅依赖于过去有效语音帧的参数信息,同时还利用了未来有效语音帧的参数信息。与传统的只利用过去语音帧信息进行误码掩盖的方法相比,本文算法能够更加准确而高效地重建丢失语音帧的编码参数ISP、基音周期和码本增益。本文将上述三种方法在ITU-T AMR-WB标准编解码器上进行了仿真实现,并与ITU-T G.729编码标准中的音频误码掩盖算法进行性能比较。本文对仿真实验数据分别从时域波形图、频域语谱图、客观评价标准PESQMOS值以及客观不同等级ODG值等几个方面进行详尽地对比分析与讨论。结果表明,与G.729误码掩盖算法相比,本文提出的算法能够更快地抑制误码在自适应码本中的扩散速度,更好地消除丢失语音帧对合成语音质量造成的不利影响。不论从主观听觉测试角度分析,还是从实验得出的客观数据方面讨论,本文提出的误码掩盖算法在各种丢帧率(1%-10%)下都表现出了优于G.729误码掩盖算法的恢复效果。经计算发现,本文算法得到的PESQMOS值较之G.729算法平均提高了0.0750,ODG值平均提高了0.116。本文算法主要是针对ACELP编码模型而提出的一种误码掩盖算法,因此其可以很容易地移植到其他任何一个以ACELP类编码模型为基础的标准编解码器上。本文推荐的算法不会增加额外的码流信息,不会引入较长的时间延迟(最多不超过20 ms时延),方法简单易于实现,并且与标准编解码器完全兼容,不会增加过多的算法复杂度。由于本文算法具有高逼真、低延迟和低算法复杂度等特点,使其能够在未来的消费电子领域得到广泛地应用。
何心莹[7](2011)在《基于DSP的语音编解码系统研究》文中研究表明语音信号处理是现代通信研究的重要内容之一,语音压缩编码作为其关键技术,如今得到了极大的发展。因此对语音编码相关知识的深入学习、理解和研究,具有重要的意义。本文通过查阅相关文献,对当前主要的语音编码算法进行对比与分析,在深入研究语音编码关键技术的基础上,着重对G.729算法的原理进行了分析研究。由于该算法在低速率语音编码中具有一定的代表性,本文采用G.729算法作为核心编码算法。针对其算法特点,系统采用DSP芯片作为核心处理器,设计出一款通用性及可扩展性强、具有模块化特性的语音编解码硬件平台,并在此平台上进行了软件部分的模块化设计。针对G.729算法标准源码代码效率低、执行时间长的不足,本文着重从算法精简、代码优化等方面对源代码进行了优化。优化后的算法在保证了高质量语音输出的同时,提高了编码效率,实现了对语音信号的实时处理。鉴于以上特点,本系统除了作为语音编解码器使用外,更适合用于语音信号处理的实验教学,为学生学习和实践提供软硬件平台。本文最后对系统进行了性能测试与分析,分析结果表明,该语音编解码系统指标满足设计要求,系统运行稳定。
刘金慧[8](2009)在《SVAC音频编码器的研究与实现》文中指出视频监控系统在社会治安防控体系建设中占有重要地位。目前已有的音视频编解码标准,都是针对广播电视和大众娱乐方面的应用,在安全防范领域直接采用具有一定的不适应性,国内国际都没有专门针对安防视频监控应用的音视频编解码标准,因此,制定符合安防视频监控应用需要的、具有我国自主知识产权的音视频编解码标准对社会治安防控体系的建设具有重要的意义。因此2007年开始,我国国家有关部门组织有关专家,概括了安全监控的特殊需求,研究安全防范视频监控数字音视频编解码标准—SVAC。SVAC音频编码标准—安全防范视频监控数字音视频音频编解码,是一项专门针对安防监控领域音频监控的编解码标准,目前还在研究制定阶段。SVAC标准可以解决目前视频监控系统中音视频编解码标准不统一和在视频监控领域采用广电标准而无法满足安全防范中特殊需求的问题,也可以摆脱国外相关标准目前存在的各种专利陷阱,更有利于国内视频监控市场的良性、健康发展。本文对SVAC音频编码器进行了研究,主要工作如下:首先简要介绍了音视频监控的发展和音频编码的现状;其次论述了SVAC的关键技术,如ACELP、TCX等;然后详细阐述了SVAC编码器的结构框架和编解码原理;接着针对现有版本的SVAC缺少丢帧错帧的处理能力,结合SVAC编码器的编码特点,添加了丢/错帧隐藏技术;最后,对SVAC编码器的编码质量、抗噪能力等性能以及添加的丢帧错帧隐藏模块的性能做了主客观测评。
贾懋珅,鲍长春,李锐[9](2009)在《8~64kbit/s超宽带嵌入式语音频编码方法》文中研究指明基于国际电信联盟标准化组织(ITU-T)编码标准G.729.1和改进的调制叠接变换(MLT,modulated lapped transform)编码技术,提出了一种码率在864kbit/s的超宽带嵌入式变速率语音与音频编码方法,其中,832kbit/s码率的码流由G.729.1编码算法生成,编码信号为07kHz频段的信息;36、40和48kbit/s码率层及56、64kbit/s码率层码流由MLT变换编码方式生成,编码信号分别为714kHz频段的信息和G.729.1编码残差的MDCT信息。客观和主观听力测试表明本编码器的性能达到了ITU-T提出的参考指标要求。
孔繁文[10](2007)在《AVS-M音频编解码算法的研究及其在DSP平台上的实现》文中研究表明目前,我国在音频电子消费产品领域已经具备较强的产业基础,但是由于没有掌握核心专利技术,相关企业长期受制于国外持有标准、专利与技术的企业和组织,专利纠纷成为众多相关企业所面临的普遍问题,大大制约了它们的发展。因此,制定拥有自主知识产权的相关标准变得更加必要与迫切。AVS-M音频就是我国正在制定的拥有自主知识产权的音频压缩与传输标准,其借鉴了3GPP音频标准AMR-WB+的基本框架,旨在为迅速发展的无线网络与手机等移动设备提供音频编解码、系统、版权保护和文件格式等方面的规范和标准。该标准成功制定将解决目前我国音频产业所面临的高专利费用等棘手问题,为我国音频电子消费产品产业的发展提供更广阔的空间。本课题研究了AVS-M音频编解码算法,并在TMS320C6713开发板上实现了AVS-M音频解码器。课题首先研究了AMR-WB+的基本技术框架和核心算法模块,并在此基础上详细分析了AVS-M音频的关键技术。然后,在VC平台下调试了AVS-M音频参考代码(2007年4月11日更新版本),并将其解码器移植至CCS仿真平台。经过存储开销与执行效率的优化,最终在C6713开发板上实现了每秒钟解码89超帧立体声信号(48kHz采样)。主客观测试表明,AVS-M音频算法与AMR-WB+性能相当。本课题的研究工作对以后AVS-M音频标准的推广及应用实现具有一定的意义。
二、一种基于ACELP的4.8kbit/s语音声码器(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一种基于ACELP的4.8kbit/s语音声码器(论文提纲范文)
(1)移动音频编码丢帧隐藏技术研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 论文主要工作 |
1.4 论文章节安排 |
2 移动音频编码技术 |
2.1 移动音频编解码标准 |
2.1.1 EAAC+标准简介 |
2.1.2 AMR-WB+标准简介 |
2.1.3 G.729.1标准简介 |
2.1.4 AVS-P10标准简介 |
2.2 AVS-P10标准编解码技术 |
2.2.1 编解码框架 |
2.2.2 主要编码模块与关键技术 |
2.2.3 技术特色与优势 |
2.3 本章小结 |
3 移动音频丢帧隐藏技术概述 |
3.1 基于发送端的丢帧隐藏技术 |
3.1.1 前向纠错技术 |
3.1.2 交织技术 |
3.1.3 重传技术 |
3.2 基于接收端的丢帧隐藏技术 |
3.2.1 基于插入的方法 |
3.2.2 基于插值的方法 |
3.2.3 基于重建的方法 |
3.3 移动语音通信抗丢包技术 |
3.3.1 抗丢包鲁棒性的语音编码算法 |
3.3.2 多描述语音编码 |
3.4 本章小结 |
4 ACELP编码器的自适应丢帧隐藏方法 |
4.1 主流移动语音频编解码器的丢帧隐藏技术概述 |
4.1.1 AMR-WB+标准的语音编解码器丢帧隐藏 |
4.1.2 AVS-P10标准的语音编解码器丢帧隐藏 |
4.1.3 G.729.1标准的语音编解器丢帧隐藏 |
4.2 自适应丢帧隐藏方法 |
4.2.1 自适应丢帧隐藏机制 |
4.2.2 实验验证与分析 |
4.3 本章小结 |
5 基于HMM的丢帧隐藏方法 |
5.1 HMM模型原理 |
5.2 利用HMM模型进行参数估值 |
5.3 实验验证与分析 |
5.4 本章小结 |
6 TCX编码器的增益控制丢帧隐藏方法 |
6.1 AMR-WB+标准的TCX编码器丢帧隐藏方法 |
6.1.1 TCX-256模式丢帧隐藏过程 |
6.1.2 TCX-1024模式丢帧隐藏过程 |
6.2 基于增益控制的TCX编码器丢帧隐藏方法 |
6.3 实验验证与分析 |
6.4 本章小结 |
7 总结与展望 |
7.1 本文创新点 |
7.2 研究展望 |
参考文献 |
攻读博士学位期间的科研工作情况 |
致谢 |
(2)语音与音频信号的通用编码方法研究(论文提纲范文)
摘要 |
Abstract |
图例 |
表例 |
第1章 绪论 |
1.1 课题研究背景及意义 |
1.2 语音与音频编码概述 |
1.2.1 语音编码的发展 |
1.2.2 音频编码的发展 |
1.2.3 语音频编码的未来发展方向 |
1.3 语音与音频通用编码技术及标准化现状 |
1.3.1 自适应变换熵编码 |
1.3.2 变换预测编码 |
1.3.3 MPEG 通用语音与音频编码算法 |
1.3.4 基于单声道谐波源分离模式的通用编码算法 |
1.4 存在的问题 |
1.5 本文的主要研究内容 |
1.6 本文的组织安排 |
第2章 语音与音频信号的自适应谐波分离算法 |
2.1 引言 |
2.2 经验模态分解(EMD)算法原理 |
2.2.1 基于瞬时频率的复杂信号分解 |
2.2.2 本征模态函数 IMF |
2.3 基于 EMD 的谐波分离算法 |
2.3.1 语音/音频信号的 EMD 分解 |
2.3.2 基于 EMD 分解的自适应滤波 |
2.3.3 感知能量加权谐波提取算法 |
2.4 实验结果与分析 |
2.5 本章结论 |
第3章 基于谐波分离的正弦参数通用编码方法 |
3.1 引言 |
3.2 正弦参数编码概述 |
3.3 正弦参数通用编码框架 |
3.4 谐波成分的正弦参数编码 |
3.4.1 匹配追踪算法 |
3.4.2 基于复指数函数字典的正弦参数提取 |
3.4.3 基于感知梯度的加权匹配追踪 |
3.4.4 正弦参数的多分辨率分析 |
3.5 非谐波成分的抖动矢量量化 |
3.5.1 量化残差的调制叠接变换 |
3.5.2 RE8格型矢量量化 |
3.5.3 抖动量化的基本原理 |
3.5.4 MLT 系数的抖动格型矢量量化 |
3.6 码流结构 |
3.7 解码操作 |
3.8 编码质量评测 |
3.9 本章小结 |
第4章 基于基频同步分析的功率谱保持量化 |
4.0 引言 |
4.1 基频同步分析量化方法框架 |
4.2 信号规整 |
4.2.1 基频规整原理 |
4.2.2 基音检测 |
4.2.3 构建规整函数 |
4.2.4 语音与音频信号的规整 |
4.3 规整信号的二阶变换 |
4.3.1 基频同步变换 |
4.3.2 调制变换 |
4.4 调制变换系数的功率谱保持量化 |
4.4.1 PSD-PQ 基本原理 |
4.4.2 调制变换系数功率谱模型估计 |
4.5 算法仿真与评测 |
4.6 本章小结 |
第5章 基于概率分布保持的语音频通用编码方法 |
5.1 引言 |
5.2 概率分布保持通用编码框架 |
5.3 谐波成分的稀疏变换编码 |
5.3.1 自适应窗长判决算法 |
5.3.2 调制变换系数的量化 |
5.4 残差信号的分布保持量化 |
5.4.1 分布保持量化原理 |
5.4.2 残差信号的广义高斯模型参数估计 |
5.4.3 MLT 系数的分布保持量化 |
5.5 码流结构与系统解码 |
5.6 编码质量评测 |
5.7 本章小结 |
第6章 全文总结与展望 |
6.1 论文工作总结 |
6.2 论文的主要创新点 |
6.3 工作展望 |
参考文献 |
攻读博士学位期间取得的科研成果 |
攻读博士学位期间参加的科研项目和获奖情况 |
致谢 |
(3)多种语音业务处理平台的设计与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 引言 |
1.2 研究背景和意义 |
1.3 国内外现状 |
1.4 论文的主要工作和章节安排 |
第二章 基本工作原理 |
2.1 数字语音编码技术 |
2.1.1 G.729语音编码 |
2.1.2 AMR-NB语音编码 |
2.1.3 CVSD语音编码 |
2.2 电话会议技术 |
2.3 回波抵消技术 |
2.4 本章小结 |
第三章 设备总体架构 |
3.1 设备需求 |
3.2 总体框架 |
3.3 设备组成 |
3.4 设备的功能 |
3.4.1 业务接口单元功能 |
3.4.2 语音编解码单元功能 |
3.4.3 供电单元 |
3.5 设备的基本工作过程 |
3.6 本章小结 |
第四章 设备设计与实现 |
4.1 业务接口单元的设计与实现 |
4.1.1 业务接口单元工作流程 |
4.1.2 业务接口单元组成 |
4.2 语音编解码单元的设计与实现 |
4.2.1 语音编解码单元工作流程 |
4.2.2 语音编解码单元组成 |
4.3 语音编解码设计 |
4.3.1 G.729A编解码模块设计 |
4.3.2 AMR-NB编解码模块设计 |
4.3.3 CVSD编解码模块设计 |
4.4 编码资源动态配置 |
4.5 供电单元设计 |
4.6 机箱结构设计 |
4.7 本章小结 |
第五章 测试与验证 |
5.1 概述 |
5.2 设备自测试 |
5.2.1 语音编解码测试 |
5.2.2 会议功能测试 |
5.2.3 E1接口环回测试 |
5.2.4 A接口环回测试 |
5.2.5 K接口环回测试 |
5.3 设备整机功能测试 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 全文总结 |
6.2 未来展望 |
致谢 |
参考文献 |
(4)基于DSP的通用语音编解码器的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 引言 |
1.2 课题的背景和意义 |
1.2.1 语音编码技术发展 |
1.2.2 数字信号处理器概述 |
1.2.3 移动通信系统中的语音编码技术 |
1.3 论文研究的目的及主要内容 |
第二章 语音编码原理及通用语音编码器设计 |
2.1 概述 |
2.2 常用语音编码原理 |
2.2.1 PCM编码原理 |
2.2.2 DM编码原理 |
2.2.3 G.721编码原理 |
2.2.4 CVSD编码原理 |
2.3 编码器设计原理 |
2.4 解码器设计原理 |
2.5 通用语音编码器结构设计 |
2.5.1 功能要求 |
2.5.2 系统硬件结构设计 |
2.6 本章小结 |
第三章 通用语音编解码系统的硬件电路设计 |
3.1 概述 |
3.2 数字信号处理电路设计 |
3.2.1 DSP最小系统电路配置 |
3.2.2 通用编译码系统电源设计 |
3.2.3 扩展存储器与接口设计 |
3.2.4 扩展数字接口设计 |
3.3 音频接口电路设计 |
3.4 USB对VC5416的接口电路设计 |
3.5 MCU对VC5416的控制电路设计 |
3.6 本章小结 |
第四章 通用语音编解码系统的软件设计 |
4.1 概述 |
4.2 DSP程序设计 |
4.3 音频信号采集程序设计 |
4.3.1 音频接口驱动程序设计 |
4.3.2 MCBSP与DMA配置设计 |
4.4 数字接口与CPLD扩展程序设计 |
4.4.1 语音码流的数字接口设计 |
4.4.2 CPLD扩展设计 |
4.5 四种语音编解码程序设计 |
4.5.1 G.711编解码程序设计 |
4.5.2 DM编解码程序设计 |
4.5.3 ADPCM编解码程序设计 |
4.5.4 CVSD编解码程序设计 |
4.6 Bootloader中的FLASH烧写程序设计 |
4.7 单片机控制程序与上位机程序设计 |
4.7.1 单片机控制程序设计 |
4.7.2 VB实现的上位机程序设计 |
4.8 本章小结 |
第五章 软硬件仿真、调试及性能分析 |
5.1 概述 |
5.2 硬件调试 |
5.3 性能测试及分析 |
5.3.1 仿真测试及分析 |
5.3.2 实际测试及分析 |
5.4 本章小结 |
第六章 结论与展望 |
参考文献 |
致谢 |
攻读学位期间发表的论文目录 |
作者和导师简介 |
硕士研究生学位论文答辩委员会决议书 |
(5)基于DSP的G.729语音编解码算法的研究与实现(论文提纲范文)
摘要 |
Abstract |
目录 |
第1章 绪论 |
1.1 概述 |
1.2 现代语音编码技术 |
1.3 语音编码标准 |
1.4 本课题研究的意义 |
1.5 本论文的主要研究内容及结构 |
第2章 G.729 所涉及的相关技术 |
2.1 语音信号的数字化和预处理 |
2.2 语音信号的数字模型 |
2.3 线性预测分析 |
2.4 矢量量化技术 |
2.5 码激励线性预测编码 |
2.6 本章小结 |
第3章 G.729 协议及代码分析 |
3.1 G.729 概述 |
3.2 编码器原理 |
3.3 解码器原理 |
3.4 G.729 源代码分析 |
3.4.1 通用运算程序模块 |
3.4.2 编码器专用程序模块 |
3.4.3 解码器专用程序模块 |
3.4.4 其他文件部分 |
3.5 去串行化操作 |
3.6 本章小结 |
第4章 基于 DSP 的 G.729 算法实现的系统设计 |
4.1 处理芯片的选取 |
4.2 硬件平台设计 |
4.2.1 硬件平台的总体设计 |
4.2.2 系统的硬件组成 |
4.2.3 扩展外部存储器 |
4.2.4 TLV320AIC23 芯片及接口介绍 |
4.2.5 电源模块 |
4.2.6 功率放大模块 |
4.3 软件设计 |
4.4 本章小结 |
第5章 基于 DSP 的算法优化研究与实现 |
5.1 编译器级优化方案 |
5.2 C 语言级优化 |
5.3 汇编级优化 |
5.4 算法级优化 |
5.4.1 G.729 固定码书结构及搜索 |
5.4.2 几种快速码书搜索算法 |
5.5 实验结果及分析 |
5.6 本章小结 |
第6章 总结与展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文 |
(6)基于ACELP编码模型的音频误码掩盖算法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 引言 |
1.2 本文研究的主要内容和研究目的 |
1.3 研究方法 |
1.4 论文的结构安排 |
第2章 音频误码掩盖技术 |
2.1 音频误码掩盖技术研究现状 |
2.2 基于发送端的音频误码掩盖方法 |
2.3 基于接收端的音频误码掩盖方法 |
2.3.1 基于插入的方法(Insertion-based Repair) |
2.3.2 基于插值的方法(Interpolation-based Repair) |
2.3.3 基于重构的方法(Regeneration-based Repair) |
2.4 本章小结 |
第3章音频压缩编码 |
3.1 音频数据的信息冗余 |
3.1.1 时域冗余 |
3.1.2 频域冗余 |
3.1.3 听觉冗余 |
3.2 音频压缩编码的分类 |
3.2.1 波形编码 |
3.2.2 参数编码 |
3.2.3 混合编码 |
3.2.4 感知编码 |
3.3 代数码激励线性预测编码(ACELP) |
3.3.1 ACELP 编码原理 |
3.3.2 ACELP 解码原理 |
3.4 评价准则 |
3.4.1 主观评价准则 |
3.4.2 客观评价准则 |
3.5 本章小结 |
第4章 基于AMR-WB 编解码器的音频误码掩盖算法 |
4.1 自适应多速率宽带编码(AMR-WB) |
4.1.1 AMR-WB 编码器原理 |
4.1.2 AMR-WB 解码器原理 |
4.2 G.729 音频误码掩盖算法 |
4.3 基于AMR-WB 编解码器的音频误码掩盖算法实现 |
4.3.1 算法总体设计思想 |
4.3.2 编码器自适应码本贡献限制方法 |
4.3.3 解码器音频误码掩盖算法 |
4.4 本章小结 |
第5章 仿真实验与结果分析 |
5.1 仿真实验条件 |
5.2 声音帧检测 (Voiced Frame) |
5.3 算法延迟 |
5.4 仿真实验结果的对比与分析 |
5.4.1 语音男声序列es02.wav 的仿真结果及分析 |
5.4.2 语音女声序列es03.wav 的仿真结果及分析 |
5.4.3 歌曲序列es01.wav 的仿真结果及分析 |
5.4.4 有音乐背景的语音序列se02.wav 的仿真结果及分析 |
5.4.5 测试语音序列和音乐序列的ODG 值对比 |
5.5 仿真实验的总结 |
5.6 小结 |
第6章 总结与展望 |
6.1 全文总结 |
6.2 研究展望 |
参考文献 |
作者简介及在学期间所取得的科研成果 |
致谢 |
(7)基于DSP的语音编解码系统研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 引言 |
1.2 课题的背景和意义 |
1.2.1 语音编码技术概述及发展 |
1.2.2 数字信号处理器(DSP)概述 |
1.2.3 移动通信系统中的语音编码技术 |
1.3 论文研究的目的及主要内容 |
第二章 语音编码原理及系统整体设计 |
2.1 语音信号模型 |
2.2 语音编码关键技术 |
2.2.1 线性预测分析 |
2.2.2 矢量量化 |
2.2.3 码激励线性预测编码 |
2.3 G.729编码器原理分析 |
2.4 G.729解码器原理分析 |
2.5 系统整体结构设计 |
2.5.1 系统设计要求 |
2.5.2 系统整体框图 |
2.6 本章小结 |
第三章 系统的硬件设计 |
3.1 硬件电路整体结构 |
3.2 DSP核心模块电路设计 |
3.2.1 DSP核心芯片电路配置 |
3.2.2 电源模块设计 |
3.2.3 外围存储器与CPLD模块设计 |
3.3 音频接口模块电路设计 |
3.3.1 多通道缓冲串口McBSP简介 |
3.3.2 音频芯片TLV320AIC23简介 |
3.3.3 VC5416与AIC23接口设计 |
3.4 本章小结 |
第四章 系统的软件设计 |
4.1 软件整体结构设计 |
4.2 音频接口模块 |
4.3 数字接口模块 |
4.4 CPLD控制模块 |
4.5 语音处理模块 |
4.5.1 语音编码部分 |
4.5.2 语音解码部分 |
4.6 本章小结 |
第五章 G.729算法优化 |
5.1 代码的移植 |
5.2 算法精简 |
5.2.1 自适应码本搜索 |
5.2.2 固定码本搜索 |
5.2.3 增益量化 |
5.2.4 LSP量化 |
5.3 代码优化 |
5.4 本章小结 |
第六章 系统测试及性能分析 |
6.1 测试环境 |
6.2 算法复杂度分析 |
6.3 语音质量分析 |
6.4 本章小结 |
第七章 结论与展望 |
参考文献 |
致谢 |
攻读学位期间发表的论文目录 |
作者和导师简介 |
附录 |
(8)SVAC音频编码器的研究与实现(论文提纲范文)
摘要 |
Abstract |
1绪论 |
1.1 引言 |
1.2 音频编码压缩技术概述 |
1.2.1 ITU-T音频编码标准 |
1.2.2 MPEG音频编码标准 |
1.2.3 Dolby音频编码标准 |
1.3 音频质量的评价方法 |
1.4 本文的工作 |
2 SVAC音频编码的关键技术 |
2.1 语音信号的线性预测分析 |
2.1.1 线性预测分析原理 |
2.1.2 反射系数 |
2.1.3 倒谱系数 |
2.1.4 线谱对 |
2.2 语音信号的矢量量化 |
2.2.1 矢量量化的基本原理 |
2.2.2 矢量量化的失真测度 |
2.2.3 分裂矢量量化 |
2.3 感知加权技术 |
2.4 代数码激励线性预测分析技术 |
2.5 VAD检测 |
3 SVAC音频编码算法研究 |
3.1 SVAC音频编解码概述 |
3.2 SVAC音频编码原理 |
3.2.1 输入信号预处理 |
3.2.2 混合ACELP/TCX编码 |
3.2.3 单声道高频编码(BWE) |
3.2.4 识别特征参数编码 |
3.3 SVAC音频解码原理 |
3.3.1 单声道低频合成 |
3.3.2 单声道高频合成 |
3.3.3 输出信号生成 |
3.3.4 识别特征参数的解码 |
3.4 SVAC音频标准的制定进程 |
4 SVAC编码差错帧隐藏方法 |
4.1 差错帧隐藏 |
4.2 模式判别 |
4.3 ACELP差错帧隐藏方法 |
4.3.1 谱包络恢复(ISP参数的恢复) |
4.3.2 自适应码本的恢复 |
4.3.3 自适应码本增益(长时预测系数)的恢复 |
4.3.4 固定码本的恢复 |
4.3.5 固定码本增益的恢复 |
4.4 TCX模式差错帧隐藏方法 |
4.4.1 TCX丢失帧的处理 |
4.4.2 TCX错帧的处理 |
5 性能测评 |
5.1 SVAC编码器质量测评 |
5.2 SVAC帧差错隐藏性能测评 |
结论 |
参考文献 |
攻读硕士学位期间发表学术论文情况 |
致谢 |
(10)AVS-M音频编解码算法的研究及其在DSP平台上的实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 数字音频编码技术发展概况 |
1.2 常见商用数字音频编码系统 |
1.3 本论文的任务与结构 |
第二章 AMR-WB+音频编解码算法研究 |
2.1 AMR-WB+音频标准简介 |
2.2 AMR-WB+标准的框架 |
2.2.1 编码器 |
2.2.2 解码器 |
2.3 AMR-WB+标准的核心算法模块 |
2.3.1 低带核心编码ACELP/TCX技术 |
2.3.2 BWE |
2.3.3 立体声编码 |
2.3.4 坏帧的隐藏 |
2.4 AMR-WB+与其他标准的性能对比 |
第三章 AVS-M音频编解码算法研究与跟踪 |
3.1 AVS-M音频编码技术特点 |
3.2 AVS-M音频标准框架 |
3.3 AVS-M音频编解码算法跟踪 |
3.3.1 导谱频率系数ISF矢量量化 |
3.3.2 感知加权 |
3.3.3 自适应码本激励搜索 |
3.3.4 代数码书搜索 |
3.3.5 频域参数立体声编解码 |
3.3.6 ISF参数的帧错误隐藏 |
3.3.7 基音延迟参数的帧错误隐藏 |
3.3.8 数字采样滤波器[28] |
3.4 AVS-M音频标准的制定进度 |
3.5 AVS-M音频标准的应用前景 |
第四章 AVS-M音频解码器的实现与优化 |
4.1 TM5320C6713 硬件平台简介[30] |
4.1.1 TM5320C6713 的结构 |
4.1.2 TM5320C6713 的中央处理单元 |
4.1.3 TM5320C6713 的存储器 |
4.1.4 TM5320C6713 的片内外设 |
4.2 AVS-M音频解码器的移植 |
4.2.1 VC平台下调试AVS-M音频参考代码 |
4.2.2 移植AVS-M音频解码器至CCS软件仿真平台 |
4.3 AVS-M音频解码器的优化 |
4.3.1 代码长度的优化 |
4.3.2 CCS编译器优化 |
4.3.3 存储空间的优化 |
4.3.4 其它方面的优化 |
4.3.5 小结 |
第五章 AVS-M音频编解码算法性能评估 |
5.1 客观测试项 |
5.2 主观测试项 |
5.3 结论 |
第六章 结束语 |
参考文献 |
发表论文和科研情况说明 |
致谢 |
四、一种基于ACELP的4.8kbit/s语音声码器(论文参考文献)
- [1]移动音频编码丢帧隐藏技术研究[D]. 项慨. 武汉大学, 2016(01)
- [2]语音与音频信号的通用编码方法研究[D]. 李晓明. 北京工业大学, 2014(03)
- [3]多种语音业务处理平台的设计与实现[D]. 孟利. 西安电子科技大学, 2013(02)
- [4]基于DSP的通用语音编解码器的设计与实现[D]. 董少杰. 北京化工大学, 2012(12)
- [5]基于DSP的G.729语音编解码算法的研究与实现[D]. 张永杰. 湖北工业大学, 2012(01)
- [6]基于ACELP编码模型的音频误码掩盖算法研究[D]. 牟欣雯. 吉林大学, 2011(09)
- [7]基于DSP的语音编解码系统研究[D]. 何心莹. 北京化工大学, 2011(05)
- [8]SVAC音频编码器的研究与实现[D]. 刘金慧. 大连理工大学, 2009(07)
- [9]8~64kbit/s超宽带嵌入式语音频编码方法[J]. 贾懋珅,鲍长春,李锐. 通信学报, 2009(05)
- [10]AVS-M音频编解码算法的研究及其在DSP平台上的实现[D]. 孔繁文. 天津大学, 2007(04)