1 月 18 日,法国电信提交了一份针对 Opus 的 IPR 公开披露,引用了一项非免版税条款下的专利。这引发了一个关键问题——这会对 Opus 产生什么影响?仔细评估表明,这不会对 Opus 规范 产生任何影响。
摘要
仔细阅读 FT 专利揭示了
- FT 专利不涵盖 Opus 参考实现,因为索赔的关键限制不存在;
- 该专利针对编码器,因此它不会影响 Opus 规范,Opus 规范只包含解码器的符合性测试,
- 通过一个简单的更改,我们可以使非侵权变得更加明显。
让我们进一步扩展这些要点。如果你不想听关于专利索赔的内容,你应该现在停止阅读这篇文章。
细节
IETF IPR 公开披露是专利持有者采取的一种安全措施:它们可以防止不洁之手论据或默示许可授权。但是,由于 IETF 在这些披露中需要具体专利号,因此我们可以分析索赔。相关专利是 EP0743634B1,以及相应的美国和其他相关的外国专利:“在采用短期感知加权滤波器的分析合成语音编码器中自适应噪声掩蔽电平的方法”。它只有一个独立的索赔,索赔 1。所有其他索赔都是基于索赔 1 的“从属索赔”。如果 Opus 没有侵犯索赔 1,它就不能侵犯任何其他索赔。
FT 专利不涵盖 Opus
要确定侵权,必须在一个实现中存在索赔的所有要素。索赔 1 的关键要素在 Opus 参考实现中不存在,包括但不限于
- 带宽扩展 系数的使用方式。在索赔 1 中,两个参数 γ1 和 γ2 用于通过“最小化由语音信号和合成信号之差的滤波产生的误差信号的能量”来塑造有损压缩添加的量化噪声。Opus 不会这样做。相反,Opus 编码器使用单个参数
BWExp2
来塑造噪声,并使用不同的参数BWExp1
来塑造输入信号,还对滤波后的输入应用额外的增益以匹配原始信号的音量。 - 优化标准。Opus 不计算“语音信号和合成信号之间的差异”。我们想要编码与原始语音不同的信号,因此我们不将编码的信号与原始语音进行比较。这实际上是 Opus 的主要创新之一:这是 SILK 层不需要像许多其他编解码器那样进行后滤波的原因。
因此,Opus 不执行索赔中的步骤,根据定义无法侵犯 FT 专利。当然,这不是法律意见,但并不需要律师才能弄清楚这一点。虽然我们不知道 FT 为何披露了这项专利,但我们欢迎有机会评估这些披露,并消除任何真实或感知到的障碍。这是 IETF 过程的好处之一。
FT 专利无法威胁规范
FT 专利涵盖感知噪声加权,它是特定于编码器的。索赔是关于“语音信号和合成信号之间的差异”,而解码器 - 根据定义 - 无法访问输入语音信号。
Opus 规范只要求解码器具有特定的行为,而编码器在很大程度上没有规定。即使法国电信继续对 Opus 宣称其专利,我们也可以在编码器中进行任何更改以避免他们提出的任何理论。没有任何已部署的系统出现故障。Opus 标准没有受到威胁。我们可以有把握地说,仅凭这一点,FT 专利就不会妨碍 Opus。
如果需要,我们始终可以使事情更安全
虽然我们认为 Opus 编码器从未侵犯过这项专利,但我们很快意识到,即使不分析复杂的 DSP 滤波器,也有一种简单的方法可以让非侵权变得显而易见。
这可以通过对 silk/float/noise_shape_analysis_FLP.c 中的代码进行简单更改 (补丁文件) 来实现(可以在定点版本中进行等效更改)。
原始代码
strength = FIND_PITCH_WHITE_NOISE_FRACTION * psEncCtrl->predGain; BWExp1 = BWExp2 = BANDWIDTH_EXPANSION / ( 1.0f + strength * strength ); delta = LOW_RATE_BANDWIDTH_EXPANSION_DELTA * ( 1.0f - 0.75f * psEncCtrl->coding_quality ); BWExp1 -= delta; BWExp2 += delta;
新代码
BWExp1 = BWExp2 = BANDWIDTH_EXPANSION; delta = LOW_RATE_BANDWIDTH_EXPANSION_DELTA * ( 1.0f - 0.75f * psEncCtrl->coding_quality ); BWExp1 -= delta; BWExp2 += delta;
是的,只有两行代码改变了。这使得滤波器参数仅取决于编码器的比特率,这显然不是索赔 1 所要求的“在线性预测分析步骤中获得的频谱参数”。以下是原始编码器和修改后的编码器(使用 PESQ)之间的质量比较。正如您所见,差异非常小,不足为虑。
关于 Jean-Marc Valin
Jean-Marc Valin 拥有舍布鲁克大学的电气工程学士、硕士和博士学位。他是 Speex 编解码器的主要作者,也是 Opus 编解码器的主要作者之一。他的专业领域包括语音和音频编码、语音识别、回声消除和其他音频相关主题。他现在受雇于 Mozilla,致力于下一代多媒体编解码器。
关于 Timothy B. Terriberry
Timothy B. Terriberry 是 Xiph.Org 基金会的长期志愿者,致力于 Theora、Vorbis、CELT 和 Opus 等编解码器。自 2008 年以来,他一直为 Mozilla 的媒体支持做出贡献,并自 2010 年以来一直从事 WebRTC 的开发工作。
更多由 Timothy B. Terriberry 撰写的文章…
关于 Greg Maxwell
自 1999 年以来,Greg 一直与 Xiph.Org 基金会合作开发不受限制的多媒体编解码器,目前正在 Mozilla 工作,致力于下一代免版税视频编码标准。
关于 Robert Nyman [荣誉编辑]
Mozilla Hacks 的技术布道者和编辑。发表有关 HTML5、JavaScript 和开放网络的演讲和博客文章。Robert 是 HTML5 和开放网络的坚定支持者,自 1999 年以来一直在瑞典和纽约市从事网络前端开发工作。他还在 http://robertnyman.com 上定期发布博客文章,喜欢旅行和结识新朋友。
7 条评论