nDSP:发烧级软件音频处理平台外文翻译资料
2021-12-22 22:38:08
英语原文共 6 页
nDSP:发烧级软件音频处理平台
摘要
本文提出了一个称为nDSP的平台,用于互连模块化的不同软件音频信号处理效果。 新平台专注于使系统CPU完成所有处理,其质量高于使用硬件DSP实现的处理。定义平台内部模块的软件表示,使其状态可以从外部控制,因此允许自调整滤波器的设计。该设计旨在进一步利用低成本发烧级扬声器系统中的软件音频信号处理,充分利用新的个人计算机硬件产品。
1.介绍
有关个人计算机发展的当前趋势不再是更高的CPU频率。然而,目前的趋势集中在能源效率,安静性和并行性[1]。
主流多核CPU的最新进展是推出了第一款六核CPU,即Intel I7 890,在3.33GHz时只有130W TDP,如果相应降低频率和电压可以更低[2]。当考虑实时软件处理(视频或音频)时,这种增加CPU核心数量的趋势是一种非常受欢迎的方法。四核CPU现在非常便宜,随着技术的发展,我们肯定会在未来看到每个CPU的主机价格更高的内核。
计算机的能源效率仅略高于产品价格。但收益是巨大的:降低电费,降低头部耗散,最重要的是:安静。
PC的一些发展趋向于家庭影院系统,其中最重要的质量特征是外观,安静和远程控制能力。为了满足这些要求,开发了一系列特殊的PC:HTPC。这些PC真的看起来像DVD播放器或功率放大器,能够包含大量的输入源,如DVD,蓝光,收音机,电视,高清电视,互联网广播/电视,音频处理和编辑,视频处理和编辑[3] 。通常,HTPC是“一体化”解决方案。最近,HTPC案例变得非常实惠,CPU和PSU变得高效节能,组件产生的热量更少,因此构建专用HTPC不再是问题。
用于PC的消费类音频组件在硬件中获得了显着的质量更新,更好的DAC,更好的运算放大器(OA)用于过滤数字转换器(DAC)输出,所有这些都没有主流消费产品的显着价格上涨。许多消费类声卡都有发烧级DAC,包括华硕Xonar D2,Azurentech XFi Prelude 7.1 [4]。虽然这些声卡具有消费市场所需的许多功能(如Dolby Digital Live,DTS Interactive等),但它们还可以在驱动程序中禁用任何DSP处理(软件或硬件),以便该卡也可用于音乐制作。这种能力非常令人感兴趣,因为它允许从PC上的音频应用程序进行完美的回放。
关于发烧音响系统的当前方法通常非常昂贵。另外,它们在音频信号路径中需要几个装置,例如放大器,均衡器和前置放大器,它们可以是独立的单元。
专业音频系统(舞台/音乐会设备)通常体积非常大,价格昂贵,并且大量使用DSP来解决不同的问题(扬声器线性度,扬声器箱的舞台位置,回声消除等)。这些设备通常不用于家庭音频系统,但某些特性在家庭环境中可能非常有用,本文考虑了这些特性。
本文重点介绍一种新平台的硬件实现和软件设计,该平台称为nDSP,专用于互连模块化的不同软件音频信号处理效果。nDSP可以完全降低声卡或音频处理设备上安装的硬件DSP对音频质量的依赖性。在这方面,处理的责任从DSP芯片转移到系统的多核CPU。新平台面向消费者和发烧友市场。该解决方案提供的音响发烧友质量与消费类音频系统的成本相当。
我们这里提出的原始方法是建立在过去几年HTPC机器的发展,主流PC多核处理器市场的快速增长,为消费者市场设计的有声卡的高保真级组件的可用性以及使用的可能性我们的硬件发烧友系统架构在[5]中提出。软件架构可以轻松地从最低成本的音频系统到最高质量的发烧级音响系统,以及实时专业系统(用于音乐会,俱乐部,演播室设备,音频制作等)。
2.当前音频处理解决方案分析
当涉及发烧友和专业音频系统时,音频信号软件处理通常在硬件DSP芯片上完成。 该处理负责杜比数字效果,信号滤波和均衡,实时效果,房间均衡等.DSP微码被加载到系统的RAM中并由DSP实时执行。 这种解决方案的好处在于它可以实时运行并且响应速度足够快,可以用于音乐制作。
软件处理通常在用于消费者音频系统的主CPU上的软件中完成。 该处理在内核模式下实现,并且必须足够快以便实时执行,因此获得低质量。通常这种解决方案适用于PC主板的板载声卡或低价声卡,包括Creative Audigy SE [6]。
A. kX项目音频驱动程序
kX Project音频驱动程序是为许多Creative Soundcards(如SoundBlaster Live!,Audigy1,Audigy2或EMU0404 [6,7])中的EMU DSP芯片10k1或10k2开发的独立驱动程序。 Creative的着名主流声卡因此转变为有用的音乐制作设备。
这个驱动程序背后的主要思想是有一个DSP编辑器(kX DSP),允许用户手动添加或删除声卡的DSP中的过滤器或效果,并具有从模块的任何输出到另一个模块的任何输入的任何路由(物理声卡的输入和输出由专用模块提供。
该解决方案的优点是:
bull;信号路由和配置最大化,允许将任意数量的效果或滤波器加载到DSP和每个模块的通道级路由(仅受硬件DSP资源限制)。
bull;每个模块都可以单独配置,并允许调低到最低级别。
bull;它可以实现过滤器的teal-time操作和配置更新。
bull;它确保整体处理的快速响应,非常适合专业音频创建(ASIO兼容性)。
该解决方案的缺点是:
bull;效果/滤波器的数量仅限于DSP功能。对于E-mu 10k1,DSP资源很低,如果需要许多处理阶段,那么它可能不适合所有DSP。 E-mu 10k2的可用资源大约是其前身的四倍。
bull;所有滤波器/效果都与DSP固定为48 KHz的内部采样率绑定。
bull;处理具有固定的32位整数精度。
具有针对2x3路扬声器系统配置的音频处理的kX DSP用户界面如图1所示。该配置使用大约35%的DSP处理能力;进一步添加新的滤波器将降低剩余的DSP功率。
由于EMU10k2具有整数精度,因此需要使用增益滤波器以在任何低音或高度增强之前降低增益。 否则可能发生信号削波,因此会引起数字引起的丢失。
图1.用于测试的kX DSP配置
B.专业DSP器件
专业DSP设备是用于管理和优化扬声器系统的专业单元。他们的主要用途是舞台和音乐厅。这种设备的一个例子是Dynacord DSP 260,它是当前顶级的音乐会DSP设备[8]。
这些装置设计用于非常恶劣的条件下,并提供非常好的音质。
他们的主要优点是:
bull;它们表现出良好的音频处理质量。
bull;路由清晰但相对固定。它不允许任何相同滤波器类型的数字实例,并且它不具有像移位器或混响那样的实时效果。
bull;可以将过滤器的参数配置为尽可能低的级别。
bull;启用了过滤器和配置更新的实时操作。
bull;它们确保非常快速的响应,使它们非常适合音乐会。
专业DSP设备的缺点是:
bull;它们确保固定的处理精度(DSP260的32位浮点数[8])。
bull;他们确保固定处理采样率(DSP260为48KHz [8])。
bull;硬件很贵。
bull;尺寸固定安装在标准19“机架中。
忽略高价,这些设备在家庭应用中不易使用。他们需要合格的个人来配置它们,并且它们无法重新配置以匹配播放的音频节目。
C.声卡驱动程序中的DSP软件
通常,基于声卡驱动程序中使用的DSP软件的解决方案仅用于低成本的声卡或板载音频。
多年前,当PC具有单核CPU时,绝对需要降低音质,以便有效地使用CPU而不会降低整个系统的速度。 然后甚至不可能实时解码CPU上的1080p高清视频流,从而提高音频处理的质量是不可能的。
今天的声卡驱动程序也出现了同样的趋势,虽然CPU处理能力大幅提高,但音频处理质量没有相应提高,而且保持不变。
基于声卡驱动程序中使用的DSP软件的解决方案的优点是:
bull;价格便宜。
bull;可以轻松配置,因为界面不会暴露任何专业参数。
bull;可以使用新的驱动程序版本轻松更新。
bull;用户无需了解声音校正或电子设备,即可调整设备参数。
基于声卡驱动程序中使用的DSP软件的解决方案的缺点是:
bull;确保处理质量极低。
bull;用户无法配置专业调谐参数(如斜率,Q,频率)。 即使在UI中显示频率,实际频率也可能不同。
bull;大多数驱动程序响应速度不足以满足ASIO延迟要求。
3.硬件架构和实施
这背后的主要思想是可以将PC声卡直接连接到放大器。 这是一种确保音频信号直接传输到放大器级的方法,而不需要进一步改变,因为耦合电容器并且进一步降低了硬件系统的成本(非常好的电容器是昂贵的)。
图2.提出的新发烧友实验设置
略微修改的硬件架构如图2所示。它与[5]中提出的不同之处在于它是作为立体声3路音频系统实现的,而低音扬声器放大器是AB类。
扬声器选自专业的扬声器系列,使频率响应与低功率要求相匹配。选择的扬声器来自Beyma [9,10,11]:
bull;SM-110N低音单元,400 Hz低通[9],
bull;6MI90中频,交叉频率:400Hz和6KHz [10],
bull;CP12N高频,高通频率为6 KHz [11]。
扬声器6MI90和CP12N安装在同一外壳上,而低音扬声器SM110N安装在密封的50升外壳上。
图3.内置8个LM3886模块功率放大器
该驱动放大器采用美国国家半导体公司的LM3886T IC制造,采用8个精心设计的模块,以避免接地/信号回路。电源线的两端通过大型电解电容进一步过滤电源线,并使用大截面实心导线为模块供电(每个电源线4 mm2,4个模块)。
两对模块被桥接以驱动低音扬声器(因为效率较低,它需要两倍的功率来适应中置扬声器)。
内置的功率放大器如图3所示。所有扬声器电缆的横截面积为2.5 mm2,它们与Speakon插座连接,实现从功率放大器输出到扬声器端子的完美电气传输。
每个模块放大器的原理图如图4所示。原始数据表[12]有一些修改:我们在输出到扬声器之前添加了Boucherot单元,保护LR电路,我们移除了音频路径中的任何电容器。
这背后的主要思想是可以将PC声卡直接连接到放大器。这是一种确保音频信号直接传输到放大器级的方法,而不需要进一步改变,因为耦合电容器并且进一步降低了硬件系统的成本(非常好的电容器是昂贵的)。
图4.放大器模块原理图
修改了消费者音频声卡(SoundBlaster Audigy 2),以便根据以下几点提高模拟音频质量:
bull;更换所有过滤OA(来自三个ST 4558C和一个JRC 4556,更好的是National Semiconductor LM4562)[13,14],
bull;从AO输出中移除所有屏蔽晶体管(证明这些晶体管正在改变音频信号),
bull;可以移除所有耦合电容(在前后立体声输出中找到8个电解电容),或者用更好的非极性电容(中心,低音炮的输出)改变现有的耦合电容。
在上述过程中,我们发现在移除屏蔽晶体管后,我们必须手动将输出桥接到输出插座,因为信号已经物理断开。另一个问题是移除耦合电容器。在此之后,我们必须手动平衡每个通道的输入,以便在过滤OA的输出上,我们将DC尽可能接近0V。对于两个通道,我们使用560欧姆电阻,一个使用690Omega;电阻,一个可以直接连接。对于左侧2个通道,我们惊奇地发现那些由于某种原因没有差异地喂给OA。这些通道也表现出高输出噪声,尽管DAC不对此负责,因为该卡使用Cirrus Logic的八通道输出DAC:CS4382 [15]。修改的结果如图5所示。
图5.消费者Audigy2声卡修改
4.软件架构
将任何模拟信号校正从模拟信号转换为数字信号的想法非常具有成本效益。此外,利用未使用的内核对系统CPU执行处理将创建将音频处理质量方式推向任何DSP硬件功能的可能性。
在设计软件DSP平台的软件架构时,我们考虑了不同的功能:
bull;每个滤波器/效果都是模块化的,应在UI中以通道级别进行路由(类似于kX DSP UI)。
bull;在不同的采样率下,框架内可能存在不同的音频信号路径,因此中频或低频可以更有效地处理CPU。
bull;高级用户应该能够配置和控制低级参数,截止频率,斜率,Q等参数,以及过滤窗口大小和窗口函数等处理质量。
bull;除了由合格人员使用的高级UI之外,应用程序应该能够允许将某些参数配置和控制为另一个简单的UI版本,并且可以由不合格的人员使用,并且可以从高级UI编写脚本。
bull;应该能够从外部源(例如应用程序和输入信号)重新调整某些内部模块参数。
所提出的软件架构如图6所示.AB类功率放大器可以连接到声卡输出而无需任何耦合电容,这进一步增强了器件之间的信号传输,其中电容器阻抗和充电放电周期不会以任何方式改变音频信号。
A.音频信号的软件模型
nDSP平台最强大的功能是可以设计复杂的自动调整滤波器,通过控制时域和不同采样率的信号。
图6. nDSP软件架构
每个信号路径由以下参数定义:
bull;SignalDataStream:连接模块将接收的信号的实际样本。
bull;SampleRate:信号的采样率
bull;延迟:信号数据相对于原始信号的延迟。
信号路径的延迟参数是最重要的参数,因为如果nDSP针对非实时操作,它允许非常复杂的信号处理。
有些软件媒体播放器允许将视频帧同步到音频输出插件。这种类型的媒体播放器的一个例子是Winamp [16],也是我们在下一章测试中使用的应用程序。当前
资料编号:[3895]