语音文章

DeepSpeech 0.6：Mozilla 的语音到文本引擎变得快速、精简且无处不在

Mozilla 的机器学习团队继续致力于 DeepSpeech，这是一个自动语音识别 (ASR) 引擎，旨在使语音识别技术和训练模型对开发者开放。在本篇关于近期改进的概述中，我们将展示 DeepSpeech 如何通过启用客户端、低延迟和隐私保护的语音识别功能来改变您的应用程序。了解如何参与。

发布于 2019 年 12 月 5 日
使用 LPCNet 实现 1.6 kb/s 的实时宽带神经声码器

这是对 LPCNet 项目的更新，LPCNet 是来自 Mozilla 新兴技术小组的高效神经语音合成器。LPCNet 结合了信号处理和深度学习来提高神经语音合成的效率。我们最近的工作将 LPCNet 变成了一种非常低比特率的神经语音编解码器，它实际上可以在当前的硬件甚至手机上使用。

发布于 2019 年 3 月 29 日
LPCNet：DSP 加速的神经语音合成

LPCNet 是 Mozilla 新兴技术小组的一个新项目——一种高效的神经语音合成器，与一些前身相比，其复杂性降低了。神经语音合成模型已经展示了令人印象深刻的语音合成质量，但其计算复杂性使得它们难以实时使用，尤其是在手机上。我们使用 LPCNet 的解决方案结合了深度学习和数字信号处理 (DSP) 技术。

发布于 2018 年 11 月 20 日