音频文章
-
在 Firefox 中使用 AudioWorklet 实现高性能 Web 音频
本周早些时候,Audio Worklets 在 Firefox 76 版本中发布。我们已经准备好开始弥合 Web 音频和原生之间的差距。开发人员现在可以利用
AudioWorklet
来编写任意音频处理代码。这项令人兴奋的新功能为新兴的 Web 体验(如 3D 游戏、VR 和音乐制作)提高了标准。 -
DeepSpeech 0.6:Mozilla 的语音转文本引擎变得快速、精简且无处不在
Mozilla 的机器学习团队继续致力于 DeepSpeech,这是一种自动语音识别 (ASR) 引擎,旨在使语音识别技术和训练模型对开发人员开放。在本篇关于最新改进的概述中,我们将展示 DeepSpeech 如何通过启用客户端、低延迟和隐私保护的语音识别功能来改变您的应用程序。了解如何参与。
-
使用 LPCNet 实现实时 1.6 kb/s 宽带神经声码器
这是对 LPCNet 项目的更新,LPCNet 是 Mozilla 新兴技术团队开发的一种高效神经语音合成器。LPCNet 结合了信号处理和深度学习,以提高神经语音合成的效率。我们最近的工作将 LPCNet 变成了一种非常低比特率的神经语音编解码器,它实际上可以在当前硬件甚至手机上使用。
-
Firefox 66 将阻止自动播放的音频和视频
未经请求的声音可能会让 Web 用户感到分心和沮丧。因此,我们正在改变 Firefox 处理播放有声媒体的方式,我们希望确保 Web 开发人员了解此新的音频自动播放阻止默认设置。随着 Firefox 66 的发布,现在在 Firefox Beta/Developer Edition 中,浏览器将阻止可听的音频和视频,并且仅当用户启动音频时,才允许站点通过
HTMLMediaElement
API 播放音频或视频。 -
LPCNet:DSP 加速的神经语音合成
LPCNet 是 Mozilla 新兴技术团队的一个新项目——一种高效的神经语音合成器,与一些前身相比,其复杂度降低了。神经语音合成模型已经证明了令人印象深刻的语音合成质量,但它们的计算复杂性使得它们难以实时使用,尤其是在手机上。我们的 LPCNet 解决方案结合了深度学习和数字信号处理 (DSP) 技术。
-
介绍 Opus 1.3
Opus 是一种完全开放的免版税音频编解码器,可用于所有音频应用,从音乐流式传输和存储到高质量视频会议和 VoIP。此 1.3 版本为语音和音乐压缩、双耳声支持等带来了质量改进。
-
RNNoise:使用深度学习进行噪声抑制
Mozilla Research RRNoise 项目展示了如何将深度学习应用于噪声抑制。它结合了经典的信号处理和深度学习,但它很小并且很快。你可以帮助!了解如何将您的噪声捐赠给科学。
-
Opus 音频编解码器 1.2 版发布
Opus 音频编解码器刚刚随着 1.2 版的发布而获得了又一次重大升级,带来了许多语音和音乐质量改进,尤其是在低比特率下。
-
Web 音频中的新功能
Web 音频 API 仍在开发中,这意味着正在添加新的方法和属性,重命名、重新排列或简单地删除!在本文中,我们将看看自 2015 年初次更新以来发生了什么,包括 Web 音频规范和 Firefox 的实现。所有演示都在 Firefox 中运行……
-
使用 MediaRecorder 在浏览器中录制几乎所有内容
MediaRecorder API 允许您录制媒体流,即动态图像和音频。这些录制的結果可以是例如 OGG 文件,例如您用来听音乐的文件。在浏览器方面,我们可以通过多种方式获取流。让我们从您可能熟悉的某些内容开始:我们将获得一个流……