论文部分内容阅读
计算机、网络以及多媒体技术的发展带动了越来越多的多媒体通信应用的快速发展,如视频会议、远程教学和视频点播等。音频通信是多媒体通信中的一项关键目标,在音频业务中占有重要地位。本文的研究工作基于"NetTalk视频会议系统”的研制,论文就多种编码技术和自适应技术进行了研究、分析和探讨。
影响音频通信的因素主要有编码质量和网络传输。
在音频通信系统中,用于传输的数据主要有电话质量的标准语音信号和高保真立体声的流媒体音频信号。目前,传输语音信号提供聊天功能的音频通信系统,多采用单一的编码技术;传输高保真立体声流媒体信号提供在线点播功能的音频通信系统,多采用流媒体文件传输或先传输媒体流、后根据其格式自适应解码、回放的方式。
由于不同编码方式的复杂度、传输和适用条件不同,为了得到更好的网络服务和音频质量,本文在对多种音频编码技术进行详细比较的基础上,提出了音频编码自适应策略。其中包括基于需求的自适应策略、基于标准语音的自适应策略和基于高保真音频流的自适应策略。基于需求的自适应策略是指根据用户需求选择语音编码或高保真流媒体编码的自适应策略;基于标准语音的自适应策略是指根据网络状况调整语音编码方式的自适应策略;基于高保真音频流的自适应策略是指将流媒体数据进行音频分离、格式归一、最优压缩以提高其统一性、可靠性和兼容性的自适应策略。
由于因特网是为了传输数据而设计的,并不适合传输连续的媒体数据流,不可避免地会出现网络拥塞,引起抖动和分组丢包。对此问题,本文采用了一些可行的拥塞控制方法和自适应技术。
结合现有的自适应传输控制方案,论文设计实现了一个基于多种编码技术的自适应音频通信系统的原型系统。
在设计与实现中由于采用了当前先进的混音技术和自适应回放技术,使系统获得了良好的服务质量。