语音文章
-
DeepSpeech 0.6:Mozilla 的语音到文本引擎变得快速、精简且无处不在
Mozilla 的机器学习团队继续致力于 DeepSpeech,这是一个自动语音识别 (ASR) 引擎,旨在使语音识别技术和训练模型对开发者开放。在本篇关于近期改进的概述中,我们将展示 DeepSpeech 如何通过启用客户端、低延迟和隐私保护的语音识别功能来改变您的应用程序。了解如何参与。
-
使用 LPCNet 实现 1.6 kb/s 的实时宽带神经声码器
这是对 LPCNet 项目的更新,LPCNet 是来自 Mozilla 新兴技术小组的高效神经语音合成器。LPCNet 结合了信号处理和深度学习来提高神经语音合成的效率。我们最近的工作将 LPCNet 变成了一种非常低比特率的神经语音编解码器,它实际上可以在当前的硬件甚至手机上使用。
-
LPCNet:DSP 加速的神经语音合成
LPCNet 是 Mozilla 新兴技术小组的一个新项目——一种高效的神经语音合成器,与一些前身相比,其复杂性降低了。神经语音合成模型已经展示了令人印象深刻的语音合成质量,但其计算复杂性使得它们难以实时使用,尤其是在手机上。我们使用 LPCNet 的解决方案结合了深度学习和数字信号处理 (DSP) 技术。