Stay Hungry, Stay Young. 👋
– Marshall Liu
最近要说最热最火的话题,那一定是 AI,而其中 AI 应用场景 AI Coding 也是发展迅速,大有替代程序员的势头。最近几个月一直在使用 AI Coding,心态上经历了最初的「完了,失业要提前了」,到「稳了,还能苟几年」。下面就分享一些使用上的感受,以及面对 AI Coding 这股后浪,这个号后面的一些规划。 ...
在深度学习语音降噪模型的部署过程中,选择合适的推理引擎至关重要。ONNX Runtime(ORT)作为微软开源的跨平台推理引擎,在性能、兼容性和易用性方面表现出色,已成为许多生产环境的首选。本文将介绍为什么选择ORT,ORT的核心概念和使用流程,以及在使用ORT进行语音降噪推理时需要注意的关键事项,特别是针对时序模型(如GRU/LSTM)的隐状态管理。 ...
语音增强算法评估指南 如今语音增强算法已成为智能设备、视频会议和助听器等应用的核心,它能从嘈杂环境中“拯救”清晰的语音信号,但如何判断一个算法的好坏?这就是评估的意义所在。今天,我们来聊聊语音增强算法的评估体系,通过一个国际挑战赛作为切入点,带你一步步了解关键指标和计算方法。无论你是初学者还是从业者,这篇文章都能帮你理清思路。 ...
WebRTC中的Wiener滤波降噪算法 引言 在实时语音通信系统中,背景噪声的抑制对于提升通话清晰度至关重要。Google 的 WebRTC 项目在其开源语音引擎中实现了高质量的语音降噪模块,其中 Wiener 滤波器作为核心组成部分,结合语音概率估计、多特征建模、噪声谱跟踪等模块构建了一个高度实用的增强框架。 ...
WebRTC的语音降噪算法中实现了一个频点维度的语音概率估计器SpeechProbabilityEstimator,本质是一个多特征融合的线性分类器。统计计算以下三种特征, ...