评估空间音频-第1部分 - 评估标准与挑战

在 Ceva,我们以前曾详细讨论过空间音频,发布过一篇博文专门讨论什么是空间音频,还有一篇博文专门讨论头部追踪对个人空间音频解决方案重要性。

我们先快速回顾以下,“空间音频”是一个广泛的术语,描述一系列音频播放技术,它的主要目标是让我们在听声音时,能像在现实生活中一样体验三维音效。使用标准立体声配置时(耳机、入耳式耳机、两个扬声器等),我们只能从左右两个方向听到声音不同,与之相比,使用空间音频技术时,我们会感觉声音来自四面八方,让我们沉浸其中。

是什么让特定的音频产品系统具有“空间感”?

目前,行业内对“空间音频”的定义仍不明确。在业界,专家们普遍认为,任何能让我们在三维空间中听到声音的播放系统都可以被称为“空间音频”,这里的三维指的是左/右、前/后和上/下(也就是声音的角度、距离和高度)。

例如,7.1声道的环绕声扬声器系统包含七个在水平面上环绕您放置的扬声器,外加一个重低音扬声器。虽然这种配置让我们能够从不同的角度和距离听到声音,但它并不能提供高度感。而7.1.4配置则在此基础上增加了四个安装在头顶的扬声器。

以下是7.1.4扬声器配置的示意图,说明如果您坐在沙发上,可以听到来自您周围和头顶的声音。

我们的扬声器配置如下:

1- 前排左侧 | 2- 前排右侧 | 3- 中置 | 4- 低音炮 | 5- 侧环绕左侧 | 6- 侧环绕右侧 | 7- 后环绕左侧 | 8- 后环绕右侧 | 9- 前排左上方 | 10- 前排右上方 | 11- 后排左上方 | 12- 后排右上方

7.1.4是大多数混音工程师在制作电影、电视和沉浸式音乐时采用的标准。通过消费级真正无线立体声(TWS)耳塞和耳机(如我们的Ceva RealSpace®解决方案)提供的空间音频,我们正在努力重现这种沉浸感,即坐在沙发上聆听来自周围和上方扬声器的声音的感觉。

Dolby Atmos和IAMF(由三星和谷歌主导的新开放标准)将所有这些声道结合起来,并在混音中添加音频对象,您可以将特定的声音以音频对象的形式放置在听众周围三维空间的某个特定位置。

如今,从5.1.2、5.1.4、7.1.2、7.1.4扬声器系统,到Dolby Atmos,甚至是通过耳机或耳塞的头部追踪立体声,体验空间音频的方式灵活多样,为听众提供了多种可能性和机会,涵盖了不同的价位。

评估空间音频是一项挑战

然而,这种多样的空间音频配置意味着人们消费的空间音频内容和消费方式也各不相同。空间音频内容可以是音乐、电影、电视节目、视频游戏或虚拟现实,它们可以存在于各种文件格式和声道配置中,需要不同的编解码器、编码器和解码器、软件和硬件。

这种差异性和统一标准的缺失,使得空间音频解决方案的评估变得比想象中更加复杂。很大程度上,这取决于内容本身以及其消费方式。将在7.1.4环绕声扬声器阵列中观看电影的体验与通过AirPods聆听头戴式双耳音乐的体验进行比较,就像是在比较苹果和橙子,是完全不同的两件事。

在测量和评估空间音频解决方案时,还有一个更明显的问题:

空间音频是一种主观的心理声学现象,实际感受因人而异,而且与听众的生理特征密切相关。每个人的耳朵都是独特的,不仅帮助我们听到声音,还在塑造我们对声音的感知方面发挥着重要作用。在声音进入我们耳朵时,不仅外耳形状,头部和身体的形状(每个人的参数都是独一无二的)也会影响声音的色彩。因此,我们的听觉系统和独特的个人聆听体验会根据我们自身特定的解剖结构来精细调整。

上述任何参数或其关系的微小变化,都可能对听觉体验的准确性和真实感产生显著影响。

因此,行业内缺乏一个既定的基准、标准或方法来比较空间音频解决方案。

大多数人在首次接触被宣传为空间音频体验的产品时,往往希望能感受到某种“惊艳效果”。然而,值得注意的是,有多种方法可以欺骗大脑,使其认为某些东西“听起来更好”。比如,响度。经验丰富的音频工程师在评估他们的信号处理是否对音频信号产生了积极效果时,通常会进行音量匹配。这意味着他们会调整音频的音量,以确保在比较不同效果时,音量是相同的。即使是这些训练有素、拥有多年经验的专家也知道,仅仅因为声音更响亮,就容易误以为它听起来更好。

同样,我们可以说,大多数人会觉得低音增强后的音乐听起来更令人愉悦。强劲而混音良好的低音带来的那种心潮澎湃的震动感,常常让我们觉得很舒服。但是,如果您要评估空间音频体验,就必须确保人们不会仅仅因为声音变大了或低音增强了,就认为这种听觉体验更好。

考虑到这些因素,我们开始探讨哪些关键参数能够全面体现空间音频的听觉体验。我们想要试着找出“惊艳效果”的来源。

(来源:Ceva)

主观与客观评估

我们的研究得出了一个复杂的结论:空间音频的本质是主观的,取决于每个人独特的感知能力和生理特征。因此,总结空间音频听觉体验的参数可以是主观的、客观的,或两者兼具。

当佩戴耳机或真无线立体声(TWS)耳机时,对于声音听起来离头部有多远,每个人感知的距离都不相同。这种感觉完全依赖于每个听者个人的主观体验。另一方面,能够渲染的最大声源通道数或头部追踪延迟等,都是客观的、可测量的参数。这些参数依赖于所使用的系统及其硬件。

一定存在一种系统的方法来评估和比较产品,清晰地展示每个产品的优缺点。如果您是一个对空间音频感兴趣的新用户,想通过谷歌搜索“我怎么知道一个空间音频体验是否良好?”时,您可能会发现很难找到一个明确的答案,而找到一个与您所关注的具体设备配置和平台相关的答案就更困难了。

我们希望提供一份指南,帮助任何人评估空间音频解决方案及其体验。我们的目标是开发一个行业首创的、结构化且可重复的框架,以便系统地评估空间音频。

针对安卓手机及其真无线立体声(TWS)蓝牙耳机,我们进行了竞争分析,对多款产品及其空间音频系统进行了分析和评估,然后进行了相互比较。

这些音频产品系统试着通过头戴式立体声蓝牙耳塞创建一个虚拟房间,其目的为您营造沉浸式聆听体验,感觉声音就像从您周围的虚拟扬声器发出的一样。

我们将这种特定形式的空间音频体验分解为八个参数,归纳为两个大类——空间感和头部追踪。每个产品都以系统化和可重复的方式进行评估。 不过,我们认为这八个参数可以适用于大多数空间音频使用场景。接下来,让我们看看这八个参数。

空间化参数

外部化程度

声音听起来离头部有多远?是几厘米以外还是几米开外?这是一个主观参数。

房间特性与预设

空间化后,虚拟房间的声音和感觉如何?它感觉像是一个小而不太活跃的房间,例如书房?还是像一个大型且回响的房间,例如大教堂?是否有多个房间预设可供选择?这是一个客观参数,而预设本身是一个客观组件。

最大渲染声道数

系统可以渲染多少个不同的虚拟扬声器作为声音的来源位置?例如,对于一个7.1.4音频文件,能否在适当的虚拟位置准确渲染所有12个声道的音频?这是一个客观参数。

单声道与立体声渲染

如果内容是简单的单声道(1声道)或立体声(2声道),例如Spotify流媒体上的立体声音乐,系统能否将其空间化?如果可以,内容应该从感觉在左右耳之间,变为感觉像是来自前面的两个扬声器。有些系统只对多声道内容进行空间化处理,单声道和立体声则不做任何改变。这是一个客观参数。

瑕疵

在您周围的虚拟空间中,有没有注意到任何特定的异常或意外行为?例如,如果声音从特定角度或位置传来时出现失真。这是一个综合参数,既可以是主观参数,也可以是客观参数;既可以是感知的,也可以是测量的。

头部跟踪参数

延迟

头部运动的变化需要多长时间才能被识别,并通过音色或位置的变化反映出来?原始头部跟踪是一个客观参数,但在某些系统上,带有预测功能的头部追踪也可以是一个主观参数。

自由度

系统是否跟踪头部在多个旋转轴(偏航、俯仰、滚转)上的运动?这是一个客观参数。

瑕疵

在跟踪头部运动时,您有没有注意到任何特定的异常或意外行为?例如,当您抬头直视时,声音也开始偏向一侧,或突然从一只耳朵附近跳到另一只耳朵附近。这也是一个综合参数,既可以是主观参数,也可以是客观参数;既可以是感知的,也可以是测量的。

空间音频是一种复杂的心理声学效应,因此很难对解决方案进行评估和比较。大家也看到了,空间音频系统性能的影响因素有很多,有些是客观的,有些是主观的,还有一些是两者的结合。然而,Ceva坚定地相信,通过这种结构化的方法,可以使问题变得更清晰,并且能够确保评估结果的一致性。综上所述,我们已经细分了在任何空间音频解决方案中需要关注的关键因素,希望这能帮助您,对如何评估空间音频及其中的挑战有了更好的理解。

在接下来的第2部分中,我们将深入探讨如何以结构化和可重复的方式评估和测量这八个参数。

如果您想了解更多信息,或为您的产品评估RealSpace空间音频,请联系我们


夕夕海 » 评估空间音频-第1部分 - 评估标准与挑战

发表回复